Pour s'inscrire à la liste de distribution rdf-linked-data -> https://listes.unige.ch/sympa/info/rdf-linked-data
Prochaines rencontres : le 1er mardi de chaque mois
Rencontres passées :
20 septembre 2024
Présentateurs : Kerfalla Cisse et Antonio Dantas.
Voir la présentation en PDF
Voir la présentation en vidéo
Titre : GraphRAG avec neo4j et ontotext graphdb
Résumé : Création d'un agent conversationnel basé sur un LLM avec RAG.
GraphRAG est une extension du modèle RAG (Retrieval-Augmented Generation). Tandis que RAG combine des modèles de récupération d'informations et de génération de texte pour produire des réponses basées sur des documents pertinents, GraphRAG intègre des données structurées sous forme de graphes (comme les bases de connaissances RDF). Cela permet de générer des réponses plus précises et contextuelles en exploitant non seulement les textes récupérés, mais aussi les relations explicites entre les données dans un graphe, améliorant ainsi la précision et la pertinence des réponses.
Bio :
Kerfalla Cisse : étudiant en master au CUI en systèmes et services numériques - orientation : ingénierie des connaissances. Linked in : https://www.linkedin.com/in/kerfalla-cisse/
Antonio Dantas : étudiant en master au CUI en systèmes et services numériques - orientation : ingénierie des connaissances.Linked in : https://www.linkedin.com/in/antonio-d-9597aa194/
7 mai 2024
Invité : Fabian Cretton
Sujet : Discussion informelle et partage d'expériences.
Bio : Fabian Cretton est adjoint scientifique à la HES-SO Valais-Wallis, Institut d'Informatique (II). Il a obtenu son diplôme d'informaticien de gestion à l'école d'informatique de Sierre en 1992, diplôme avec mention et différents prix dont le prix d'algorithme. Développeur sénior, il a acquis son expérience dans le développement de solutions logicielles (de bureau, back-end et Web Services, applications Web) et systèmes d'informations. Depuis 2004 il s'est spécialisé dans les technologies liées au Web Sémantique, Linked Data et Web des données.
https://www.hevs.ch/fr/collaborateurs/cretton-1615
Voir les liens partagés pendant la rencontre
6 février 2024
Présentateur : Kerfalla Cisse
Sujet : Présentation d'un travail de bachelor portant sur la réalisation d'un agent conversationnel intelligent exploitant un graphe de connaissances sur les restaurants suisses et permettant de l'interroger, de le compléter, de l'adapter, de lui appliquer des requêtes fédérées avec des référentiels standard et par conséquent, d’élargir ses connaissances à travers les questions posées et d’affiner les conversations avec les utilisateurs. Il exploite les données en provenance de Geonames, Dbpedia et OpenStreetMap.
Bio (profil linkedin : https://www.linkedin.com/in/kerfalla-cisse/)
5 décembre 2023
Présentateur : Nicola Carboni
Thème : La modélisation et l'analyse des expositions d'art historique, sujet d’un travail en cours.
7 novembre 2023
Présentateur : Gilles Falquet
Sujet : Présentations et échanges sur RDF 1.2 (anciennement RDF-star)
4 avril 2023
Présentateurs : Arnaud Gaudinat et Christophe Lebrun, HES-SO - HEG Genève
Titre : Présentation du projet FairChain, une base de connaissance interopérable sur le domaine de la blockchain basée sur le moteur Wikibase de Wikidata
Abstract :
La blockchain est une technologie relativement complexe, multiple et en développement continue que certains qualifient de révolutionnaire ou disruptive pour la société. Naturellement transparente en tant que chaîne publique, elle est dans les faits difficilement accessible. Les ressources la décrivant sont disparates, peu à jour, et il n’existe pas d’uniformisation. Ce projet propose d’offrir une base de connaissance qui permettra d’uniformiser et de comparer les différentes chaînes pour mieux les comprendre.
Nous avons déployé une solution basée sur Wikibase, le moteur de Wikidata et avons commencé à développer quelques cas d'usages. À terme le projet a aussi pour ambition de combiner cette base de connaissance avec de l’information on-chain, dynamique par nature. Nous donnerons un aperçu de la problématique et de la solution développée, agrémenté des quelques premières démonstrations en avant-première et discuterons des perspectives.
7 février 2023
Présentatrice : Dr. Catherine Hayes
Bio : Dr. Catherine Hayes works in the Proteome Informatics Group (PIG) of SIB, under the direction of Dr. Frederique Lisacek, as a senior biocurator and bioinformatician. Her main tasks are biocuration of glycoprotein data into the GlyConnect resource, and development and maintenance of their GlySTreeM resource (triple store of glycan molecules).
Titre : Glycan-protein interaction motifs: A semantic based annotation method
Abstract :
Motivation: We have previously designed and implemented a tree-based ontology to represent glycan structures
with the aim of searching these structures with a glyco-driven syntax. This resulted in creating the GlySTreeM
knowledge-base as a linchpin of the structural matching procedure and we now introduce a query language, called
GlycoQL, for the actual implementation of a glycan structure search.
Results: The methodology is described and illustrated with a use-case focused on Severe Acute Respiratory
Syndrome Coronavirus 2 (SARS-CoV-2) spike protein glycosylation. We show how to enhance site annotation with
federated queries involving UniProt and GlyConnect, our glycoprotein database.
Availability and implementation: https://glyconnect.expasy.org/glycoql/.
https://academic.oup.com/bioinformatics/article/38/Supplement_2/ii162/6702012?login=true
6 décembre 2022
Présentateur : Christophe Gaudet-Blavignac, Médecin en charge de la sémantique, Service des Sciences de l’Information Médicale, Hôpitaux Universitaires de Genève
Titre : La sémantique au service de la réutilisation des données cliniques
Abstract :
Les données sont partout et ne cessent de s’accumuler, y-compris dans les hôpitaux. Plus la digitalisation progresse, plus les données sont nombreuses et hétérogènes. Si les défis techniques liés au stockage ou à l’accessibilité de ces données ont trouvé des solutions techniques, le défi du sens des données est encore loin d’être trivial et fait partie des freins majeurs à la réutilisation des données cliniques. Depuis plus de dix ans, le service des Sciences de l’Information Médicale développe une stratégie pour répondre à ces besoins. Cette stratégie fortement axée sur la sémantique passe par l’encodage de toutes les données cliniques dans un standard international permettant une représentation granulaire de la connaissance ainsi que des recherches intelligentes basées sur le sens et non plus sur la structure des données.
4 octobre 2022
Présentation de Ashley Caselli : voir la présentation
Title:
Semantic Regulation Compliance Checking: A real-world scenario involving urban underground data.
Short Abstract:
I will discuss about the development of a semantic-based automated regulation compliance checking system (CCS)
• What a CCS is
• Why a CCS is important
• How a CCS can benefit from RDF
Finally, I will show a prototype using urban underground data of the Geneva canton and regulations that apply on those.
7 décembre 2021
Présentation de Jan Melichar :
- Fedora - voir la présentation
Présentation de Cédric Viaccoz
- Scénario complet : depuis les données en format xyz chez un chercheur jusqu'à leur publication en RDF dans Fedora + triple store
- Intégration de Fedora avec le serveur d’images IIIF
vendredi 23 avril 2021
Thème : « RDF Knowledge Graph in Astronomy : our practical experience ».
Volodymyr Savchenko à présenté en anglais ce sujet dont vous trouverez l’abstract en pièce jointe. Une discussion a suivi la présentation.
12 février 2020
Présentation de Topbraid Composer par l'équipe de Gilles Falquet.
28 juin 2019
- Les outils de visualisation de graphes
- Exercice : création d'une ontologie pour les réunions du groupe et intégration avec Concrete5
15 février 2019
Présentation de Pablo Iriarte :
- Du nommage à la localisation : URIs, compact URIs (CURIEs), URLs, URNs, IRIs, Schemas et namespaces
- La quête de la pérennité actionnable : DOI, Handle, ARK, PURL, N2T, Perma.cc Links, Robust Links (Memento project), etc.
- La question de la gouvernance : Registres, archives et systèmes de résolution (Crossref, Identifiers.org, N2T.net (Name-to-Thing), Internet Archive,Perma.cc, etc.)
20 novembre 2018
Présentation de Sahar Aljalbout :
- Contextualisation des triplets RDF : comment ajouter aux triplets des informations de validité temporelle, spatiale ou autre? Présentation et comparaison des différentes techniques existantes.
13 septembre 2018
Un premier cas d'étude concret : la publication des données "manuscrits de Saussure" sur la plateforme Fedora/RDF de la DISTIC
- Présentation de Gilles Falquet sur les données et l'ontologie "Saussure" développées au CUI
- Présentation de Jan Melichar sur la plateforme DISTIC