Accueil - Groupe d'intérêt RDF/Linked Data

Pour s'inscrire à la liste de distribution rdf-linked-data -> https://listes.unige.ch/sympa/info/rdf-linked-data

Prochaines rencontres : à venir, en principe le 1er mardi de chaque mois

Rencontres passées :

26 novembre 2024

Présentatrice : Ana-Claudia Sima

Voir la présentation en vidéo

Titre : Meaningful data in the era of Large Language Models: the role of Semantics in enabling novel scientific data exploration tools

Résumé :

Large Language Models have enabled significant improvements across a wide range of Natural Language Processing tasks, making them the interface of choice for many novel data exploration systems. However, LLMs also have known shortcomings, including hallucinations and cut-off dates. In this talk, I will present the important role of Knowledge Graphs in complementing LLMs with accurate and up-to-date information. The SIB Swiss Institute of Bioinformatics has a long-standing expertise in curating and maintaining high-quality, interoperable knowledge graphs across diverse bioinformatics disciplines. I will discuss how LLMs provide today an important opportunity to democratize access to these scientific data for a wider audience of researchers, if used appropriately. Finally, I will demonstrate a concrete application leveraging LLMs for Knowledge Graph Question Answering.

Bio :

Dr. Ana Claudia Sima co-leads the Knowledge Representation Unit at SIB, with the mission of improving scientific data exchange and reuse in Switzerland and worldwide, particularly in Bioinformatics. She holds a Ph.D. in Semantic Search over Heterogeneous Bioinformatics Databases and has recently published several articles in the area of Knowledge Graph exploration via Large Language Models, exploring their role in generating structured queries over scientific data. The Knowledge Representation Unit is currently active in several Swiss and EU projects around democratizing data access to scientific knowledge graphs, as well as part of key future developments within the European Open Science Cloud (EOSC).

20 septembre 2024

Présentateurs : Kerfalla Cisse et Antonio Dantas.

Voir la présentation en PDF

Voir la présentation en vidéo

Titre : GraphRAG avec neo4j et ontotext graphdb

Résumé : Création d'un agent conversationnel basé sur un LLM avec RAG.

GraphRAG est une extension du modèle RAG (Retrieval-Augmented Generation). Tandis que RAG combine des modèles de récupération d'informations et de génération de texte pour produire des réponses basées sur des documents pertinents, GraphRAG intègre des données structurées sous forme de graphes (comme les bases de connaissances RDF). Cela permet de générer des réponses plus précises et contextuelles en exploitant non seulement les textes récupérés, mais aussi les relations explicites entre les données dans un graphe, améliorant ainsi la précision et la pertinence des réponses.

Bio :

Kerfalla Cisse : étudiant en master au CUI en systèmes et services numériques - orientation : ingénierie des connaissances. Linked in : https://www.linkedin.com/in/kerfalla-cisse/

Antonio Dantas : étudiant en master au CUI en systèmes et services numériques - orientation : ingénierie des connaissances.Linked in : https://www.linkedin.com/in/antonio-d-9597aa194/

7 mai 2024

Invité : Fabian Cretton

Sujet : Discussion informelle et partage d'expériences.

Bio : Fabian Cretton est adjoint scientifique à la HES-SO Valais-Wallis, Institut d'Informatique (II). Il a obtenu son diplôme d'informaticien de gestion à l'école d'informatique de Sierre en 1992, diplôme avec mention et différents prix dont le prix d'algorithme. Développeur sénior, il a acquis son expérience dans le développement de solutions logicielles (de bureau, back-end et Web Services, applications Web) et systèmes d'informations. Depuis 2004 il s'est spécialisé dans les technologies liées au Web Sémantique, Linked Data et Web des données.

https://www.hevs.ch/fr/collaborateurs/cretton-1615

Voir les liens partagés pendant la rencontre

6 février 2024

Présentateur : Kerfalla Cisse

Sujet : Présentation d'un travail de bachelor portant sur la réalisation d'un agent conversationnel intelligent exploitant un graphe de connaissances sur les restaurants suisses et permettant de l'interroger, de le compléter, de l'adapter, de lui appliquer des requêtes fédérées avec des référentiels standard et par conséquent, d’élargir ses connaissances à travers les questions posées et d’affiner les conversations avec les utilisateurs. Il exploite les données en provenance de Geonames, Dbpedia et OpenStreetMap.

Bio (profil linkedin : https://www.linkedin.com/in/kerfalla-cisse/)

5 décembre 2023

Présentateur : Nicola Carboni

Thème : La modélisation et l'analyse des expositions d'art historique, sujet d’un travail en cours.

7 novembre 2023

Présentateur : Gilles Falquet

Sujet : Présentations et échanges sur RDF 1.2 (anciennement RDF-star)

4 avril 2023

Présentateurs : Arnaud Gaudinat et Christophe Lebrun, HES-SO - HEG Genève

Titre : Présentation du projet FairChain, une base de connaissance interopérable sur le domaine de la blockchain basée sur le moteur Wikibase de Wikidata

Abstract :

La blockchain est une technologie relativement complexe, multiple et en développement continue que certains qualifient de révolutionnaire ou disruptive pour la société. Naturellement transparente en tant que chaîne publique, elle est dans les faits difficilement accessible. Les ressources la décrivant sont disparates, peu à jour, et il n’existe pas d’uniformisation. Ce projet propose d’offrir une base de connaissance qui permettra d’uniformiser et de comparer les différentes chaînes pour mieux les comprendre.

Nous avons déployé une solution basée sur Wikibase, le moteur de Wikidata et avons commencé à développer quelques cas d'usages. À terme le projet a aussi pour ambition de combiner cette base de connaissance avec de l’information on-chain, dynamique par nature. Nous donnerons un aperçu de la problématique et de la solution développée, agrémenté des quelques premières démonstrations en avant-première et discuterons des perspectives.

7 février 2023

Présentatrice : Dr. Catherine Hayes

Bio : Dr. Catherine Hayes works in the Proteome Informatics Group (PIG) of SIB, under the direction of Dr. Frederique Lisacek, as a senior biocurator and bioinformatician. Her main tasks are biocuration of glycoprotein data into the GlyConnect resource, and development and maintenance of their GlySTreeM resource (triple store of glycan molecules).

Titre : Glycan-protein interaction motifs: A semantic based annotation method

Abstract :
Motivation: We have previously designed and implemented a tree-based ontology to represent glycan structures
with the aim of searching these structures with a glyco-driven syntax. This resulted in creating the GlySTreeM
knowledge-base as a linchpin of the structural matching procedure and we now introduce a query language, called
GlycoQL, for the actual implementation of a glycan structure search.
Results: The methodology is described and illustrated with a use-case focused on Severe Acute Respiratory
Syndrome Coronavirus 2 (SARS-CoV-2) spike protein glycosylation. We show how to enhance site annotation with
federated queries involving UniProt and GlyConnect, our glycoprotein database.
Availability and implementation: https://glyconnect.expasy.org/glycoql/.
https://academic.oup.com/bioinformatics/article/38/Supplement_2/ii162/6702012?login=true

6 décembre 2022

Présentateur : Christophe Gaudet-Blavignac, Médecin en charge de la sémantique, Service des Sciences de l’Information Médicale, Hôpitaux Universitaires de Genève

Titre : La sémantique au service de la réutilisation des données cliniques

Abstract :
Les données sont partout et ne cessent de s’accumuler, y-compris dans les hôpitaux. Plus la digitalisation progresse, plus les données sont nombreuses et hétérogènes. Si les défis techniques liés au stockage ou à l’accessibilité de ces données ont trouvé des solutions techniques, le défi du sens des données est encore loin d’être trivial et fait partie des freins majeurs à la réutilisation des données cliniques. Depuis plus de dix ans, le service des Sciences de l’Information Médicale développe une stratégie pour répondre à ces besoins. Cette stratégie fortement axée sur la sémantique passe par l’encodage de toutes les données cliniques dans un standard international permettant une représentation granulaire de la connaissance ainsi que des recherches intelligentes basées sur le sens et non plus sur la structure des données.

4 octobre 2022

Présentation de Ashley Caselli : voir la présentation

Title:

Semantic Regulation Compliance Checking: A real-world scenario involving urban underground data.

Short Abstract:

I will discuss about the development of a semantic-based automated regulation compliance checking system (CCS)

• What a CCS is

• Why a CCS is important

• How a CCS can benefit from RDF

Finally, I will show a prototype using urban underground data of the Geneva canton and regulations that apply on those.

7 décembre 2021

Présentation de Jan Melichar :

Fedora - voir la présentation

Présentation de Cédric Viaccoz

Scénario complet : depuis les données en format xyz chez un chercheur jusqu'à leur publication en RDF dans Fedora + triple store
Intégration de Fedora avec le serveur d’images IIIF

vendredi 23 avril 2021

Thème : « RDF Knowledge Graph in Astronomy : our practical experience ».

Volodymyr Savchenko à présenté en anglais ce sujet dont vous trouverez l’abstract en pièce jointe. Une discussion a suivi la présentation.

Voir l'abstract

Voir la présentation

12 février 2020

Présentation de Topbraid Composer par l'équipe de Gilles Falquet.

28 juin 2019

Les outils de visualisation de graphes
Exercice : création d'une ontologie pour les réunions du groupe et intégration avec Concrete5

15 février 2019

Présentation de Pablo Iriarte :

Du nommage à la localisation : URIs, compact URIs (CURIEs), URLs, URNs, IRIs, Schemas et namespaces
La quête de la pérennité actionnable : DOI, Handle, ARK, PURL, N2T, Perma.cc Links, Robust Links (Memento project), etc.
La question de la gouvernance : Registres, archives et systèmes de résolution (Crossref, Identifiers.org, N2T.net (Name-to-Thing), Internet Archive,Perma.cc, etc.)

20 novembre 2018

Présentation de Sahar Aljalbout :

Contextualisation des triplets RDF : comment ajouter aux triplets des informations de validité temporelle, spatiale ou autre? Présentation et comparaison des différentes techniques existantes.

13 septembre 2018

Un premier cas d'étude concret : la publication des données "manuscrits de Saussure" sur la plateforme Fedora/RDF de la DISTIC

Présentation de Gilles Falquet sur les données et l'ontologie "Saussure" développées au CUI
Présentation de Jan Melichar sur la plateforme DISTIC