CELLULE R&D

Groupe d'intérêt RDF/Linked Data

Le groupe d'intérêt RDF (Resource Description Framework) Linked Data (Web des données), actif depuis 2018, est composé d'un groupe de travail transversal au sein de l'UNIGE. Il organise des rencontres mensuelles sur différents thèmes liés au RDF/Linked Data, coordonnées par des membres de la DiSTIC.

Vous trouverez ci-dessous les dernières rencontres du groupe
avec leur présentateur/trice, titre et descriptif.

 

9 avril 2025

Présentateur : Joël Cori

> Étudiant en deuxième année de Master en Systèmes et Services Numériques, Joël Cori se spécialise dans l'ingénierie des connaissances. Son parcours lui permet d’acquérir des compétences en structuration et gestion de l’information. En plus de l’informatique, il est passionné par l’aviation et s’intéresse aux avancées technologiques dans ce domaine.
 

Titre : "NGSI-LD et ses applications"

Résumé : NGSI-LD (Next Generation Service Interface - Linked Data) est une spécification normalisée par l'ETSI (European Telecommunications Standards Institute) qui fournit une interface pour la gestion des données contextuelles en temps réel. Cette présentation explorera les concepts fondamentaux de NGSI-LD, son fonctionnement et ses fonctionnalités clés. Nous examinerons ensuite la synergie puissante entre NGSI-LD et les jumeaux numériques. Une démonstration concrète illustrera l'application de NGSI-LD dans un scénario de jumeau numérique, offrant un petit aperçu des avantages et du potentiel de cette technologie.

La présentation sera suivie d’une discussion.

26 novembre 2024

Présentatrice : Ana-Claudia Sima.

> Dr. Ana Claudia Sima co-leads the Knowledge Representation Unit at SIB, with the mission of improving scientific data exchange and reuse in Switzerland and worldwide, particularly in Bioinformatics.
 

Titre : "Meaningful data in the era of Large Language Models: the role of Semantics in enabling novel scientific data exploration tools"

Résumé : Large Language Models have enabled significant improvements across a wide range of Natural Language Processing tasks, making them the interface of choice for many novel data exploration systems. However, LLMs also have known shortcomings, including hallucinations and cut-off dates. In this talk, I will present the important role of Knowledge Graphs in complementing LLMs with accurate and up-to-date information. The SIB Swiss Institute of Bioinformatics has a long-standing expertise in curating and maintaining high-quality, interoperable knowledge graphs across diverse bioinformatics disciplines. I will discuss how LLMs provide today an important opportunity to democratize access to these scientific data for a wider audience of researchers, if used appropriately. Finally, I will demonstrate a concrete application leveraging LLMs for Knowledge Graph Question Answering.

  • Voir la présentation en vidéo

 

20 septembre 2024

Présentateurs : Kerfalla Cisse et Antonio Dantas

"GraphRAG avec neo4j et ontotext graphdb"

GraphRAG est une extension du modèle RAG (Retrieval-Augmented Generation). Tandis que RAG combine des modèles de récupération d'informations et de génération de texte pour produire des réponses basées sur des documents pertinents, GraphRAG intègre des données structurées sous forme de graphes (comme les bases de connaissances RDF). Cela permet de générer des réponses plus précises et contextuelles en exploitant non seulement les textes récupérés, mais aussi les relations explicites entre les données dans un graphe, améliorant ainsi la précision et la pertinence des réponses.

  • Voir la présentation en PDF
  • Voir la présentation en vidéo

 

6 février 2024

Présentateur : Kerfalla Cisse

Sujet : Présentation d'un travail de bachelor portant sur la réalisation d'un agent conversationnel intelligent exploitant un graphe de connaissances sur les restaurants suisses et permettant de l'interroger, de le compléter, de l'adapter, de lui appliquer des requêtes fédérées avec des référentiels standard et par conséquent, d’élargir ses connaissances à travers les questions posées et d’affiner les conversations avec les utilisateurs. Il exploite les données en provenance de Geonames, Dbpedia et OpenStreetMap.

5 décembre 2023

Présentateur : Nicola Carboni

Thème : La modélisation et l'analyse des expositions d'art historique, sujet d’un travail en cours.
 

7 novembre 2023

Présentateur : Gilles Falquet

Sujet : Présentations et échanges sur RDF 1.2 (anciennement RDF-star)
 

4 avril 2023

Présentateurs : Arnaud Gaudinat et Christophe Lebrun, HES-SO - HEG Genève

Titre : Présentation du projet FairChain, une base de connaissance interopérable sur le domaine de la blockchain basée sur le moteur Wikibase de Wikidata

La blockchain est une technologie relativement complexe, multiple et en développement continue que certains qualifient de révolutionnaire ou disruptive pour la société. Naturellement transparente en tant que chaîne publique, elle est dans les faits difficilement accessible. Les ressources la décrivant sont disparates, peu à jour, et il n’existe pas d’uniformisation. Ce projet propose d’offrir une base de connaissance qui permettra d’uniformiser et de comparer les différentes chaînes pour mieux les comprendre.

Nous avons déployé une solution basée sur Wikibase, le moteur de Wikidata et avons commencé à développer quelques cas d'usages. À terme le projet a aussi pour ambition de combiner cette base de connaissance avec de l’information on-chain, dynamique par nature.  Nous donnerons un aperçu de la problématique et de la solution développée, agrémenté des quelques premières démonstrations en avant-première et discuterons des perspectives.
 

7 février 2023

Présentatrice : Dr. Catherine Hayes

Dr. Catherine Hayes works in the Proteome Informatics Group (PIG) of SIB, under the direction of Dr. Frederique Lisacek, as a senior biocurator and bioinformatician. Her main tasks are biocuration of glycoprotein data into the GlyConnect resource, and development and maintenance of their GlySTreeM resource (triple store of glycan molecules). 

Titre : Glycan-protein interaction motifs: A semantic based annotation method

Abstract/Motivation: We have previously designed and implemented a tree-based ontology to represent glycan structures with the aim of searching these structures with a glyco-driven syntax. This resulted in creating the GlySTreeM knowledge-base as a linchpin of the structural matching procedure and we now introduce a query language, called GlycoQL, for the actual implementation of a glycan structure search.

Results: The methodology is described and illustrated with a use-case focused on Severe Acute Respiratory Syndrome Coronavirus 2 (SARS-CoV-2) spike protein glycosylation. We show how to enhance site annotation with federated queries involving UniProt and GlyConnect, our glycoprotein database.
> Availability and implementation.