Entretien

LA PAROLE À… PIERRETTE BOUILLON

Pierrette_1.jpg

Pierrette Bouillon est professeure à la Faculté de traduction et d’interprétation (FTI) depuis 2007 et directrice du Département de Traitement informatique multilingue (TIM). Vice-doyenne de la FTI pendant de nombreuses années, elle en est aujourd’hui la doyenne. Très active dans la recherche, la professeure Bouillon a participé à de nombreux projets, suisses et européens, dans le domaine de la traduction automatique, notamment en lien avec son utilisation au service du bien social. Dans ce cadre, elle a co-dirigé avec les Hôpitaux universitaires de Genève (HUG) le projet BabelDr et travaille depuis 2021 sur un projet dérivé de BabelDr : PROPICTO. C’est de ce projet qu’elle a accepté de nous parler plus longuement aujourd’hui.

See this interview in English


Pouvez-vous nous présenter brièvement BabelDr ?

Lancé en 2017, le projet BabelDr est le fruit d’une collaboration entre le Département TIM de la FTI et l’Unité d’urgences ambulatoires des HUG. La faculté travaille depuis de nombreuses années à plusieurs projets dans le domaine de l’accessibilité, notamment dans le contexte de la communication médicale. Aux HUG, 52 % des patientes et patients sont de nationalité étrangère et 12 % ne parlent pas du tout le français. Pour pallier ce problème, nous avons créé BabelDr, un logiciel de traduction médicale, qui traduit un ensemble de phrases fixes vers une dizaine de langues, dont le tigrigna (une des langues officielles de l’Étythrée), l’arabe, l’espagnol ou encore le farsi. Ce système a aussi été adapté aux personnes malentendantes avec une version qui traduit vers des vidéos en langue des signes. La particularité de BabelDr est qu’il permet de poser une question librement à l’oral et le système propose la phrase pré-traduite humainement la plus proche, garantissant ainsi la fiabilité de la traduction. Le logiciel est toujours utilisé aux HUG dans le service des urgences, quand d’autres solutions ne sont pas disponibles. Un grand nombre d’études ont montré que, dans ce contexte, les systèmes d’interprétation automatique ne sont pas les plus adaptés. Ce projet nous a permis de collecter des corpus et de mener plusieurs études sur la communication médicale, l’évaluation de la perception de la traduction automatique dans ce contexte et la comparaison de différentes méthodes pour cette tâche.

Qu’en est-il de PROPICTO ?

Lancé en 2021, PROPICTO (PROjection de la parole vers des PICTOgrammes) est né d’une collaboration entre le Département TIM de la FTI et le Groupe d’Étude en Traduction Automatique / Traitement Automatisé des Langues et de la Parole (GETALP) du Laboratoire d’Informatique de Grenoble. Projet franco-suisse d’une durée de quatre ans, il est financé par le Fonds national suisse de la recherche scientifique (FNS) et l’Agence nationale de la recherche française (ANF). Il vise à créer des systèmes de traduction de la parole vers des pictogrammes avec le français comme langue d’entrée. Il s’agit d’améliorer l’accès à la communication des patientes et patients non francophones et des personnes souffrant de troubles cognitifs. L’outil s’adresse également aux personnes âgées qui peinent à s’exprimer et aux personnes illettrées.

Il répond ainsi à de nombreux besoins sociétaux dans le domaine du handicap (communiquer avec des personnes ayant des problèmes cognitifs) et dans le contexte médical (communiquer avec des patientes et patients qui ne parlent pas la même langue que le personnel soignant). Il répond aussi aux exigences légales en vigueur en Suisse (loi fédérale sur l’élimination des inégalités frappant les personnes handicapées de 2002, ainsi que Convention de l’ONU relative aux droits des personnes handicapées, ratifiée par la Suisse en 2014) et en France (loi du 2 janvier 2002, renforcée par la loi du 11 février 2005).

Quel est son but ?

Les dispositifs de communication alternative et augmentée (CAA) jouent un rôle important auprès des personnes en situation de handicap. La CAA utilise des signes, des tableaux de communication avec des symboles et des dispositifs informatiques permettant à une personne de transcrire précisément son message. Cependant, l’utilisation de ces technologies peut être difficile et leur apprentissage fastidieux. Pour surmonter ce problème, le projet part de l’hypothèse que les systèmes de traduction de la parole vers des pictogrammes peuvent être utiles aux personnes se servant de la CAA. Le pictogramme est un signe graphique schématique très souvent utilisé dans le domaine de la CAA car il améliore la compréhension des messages véhiculés.

Dans le domaine médical, et plus particulièrement dans le contexte des urgences, il est crucial de supprimer les barrières à la communication. En effet, les difficultés qui risquent d’en découler peuvent compromettre la qualité des soins, la santé et la sécurité de la personne traitée. PROPICTO propose donc d’explorer les solutions issues de la traduction automatique (TA) qui peuvent être envisagées en tant qu’instruments de CAA permettant d’améliorer les échanges entre le corps médical et les patientes et patients.

Quelle méthode avez-vous employée ?

Le développement d’un outil de ce type nécessite des recherches approfondies dans plusieurs domaines du traitement de la langue et de la parole (TALP) : la reconnaissance vocale, la simplification automatique, la désambiguïsation ou l’extraction des concepts à représenter en pictogrammes, et la traduction en pictogrammes.

Le premier module consiste en un système de reconnaissance de la parole : à partir d’un segment audio enregistré, le module génère la transcription associée en texte. Le deuxième module simplifie le texte donné et extrait les concepts à représenter en pictogrammes. Enfin, la sortie simplifiée et désambiguïsée sera le point d’entrée pour la génération de pictogrammes.

Le dernier défi sera de mettre en place un système bout-en-bout qui, à partir de la parole, proposera une traduction automatique en pictogrammes. Nous avons expérimenté plusieurs approches possibles et créé des démonstrateurs dans différents domaines, généraux et spécialisés. Le système PictoDr, spécialement conçu pour le dialogue médical, utilise des techniques neuronales pour extraire les concepts médicaux représentés avec l’ontologie UMLS, et produit à partir de là les pictogrammes correspondants.

avez-vous pris des médicaments contre la fièvre ?

À quels défis avez-vous dû faire face ?

Le projet a dû faire face à trois problèmes majeurs : la difficulté de représenter les pictogrammes médicaux, le manque de pictogrammes libres de droit, surtout dans le domaine médical, et la carence de corpus parallèles qui lient les phrases aux pictogrammes correspondants et sont nécessaires pour entraîner les modèles de traduction.

Quels sont les résultats attendus ?

Courant 2024, nous commencerons les évaluations avec les groupes cibles. PROPICTO mettra à la disposition de la communauté scientifique l’ensemble des ressources créées, notamment les corpus de questions traduites en pictogrammes, la base de données liant pictogrammes et leur signification sémantique et les différentes applications de traduction vers les pictogrammes. Les publications, les ressources et les applications sont disponibles sur le site du projet .