Reconnaissance vocale
Même si l’essentiel des travaux du département TIM de la FTI a toujours été axé sur la traduction automatique, ce département porte également un fort intérêt aux technologies vocales. De manière logique, tout a commencé par la traduction parole-parole : l’équipe TIM a débuté dans ce domaine avec le projet Spoken Language Translator (SLT, 1993-1999). Ce projet collaboratif, mené par SRI International et Telia Research (Suède), a donné lieu à l’un des premiers systèmes de grande ampleur pour la traduction de la parole. Le département TIM de la FTI (anciennement ISSCO) y a été chargé du traitement de la langue française.
Les projets MEDSLT et CALL-SLT
Ensuite, de nombreuses idées développées dans le cadre du projet SLT ont été réutilisées pour construire le système multilingue de traduction de la parole MedSLT spécialisé dans le domaine médical. Ce projet financé par le FNS a été réalisé de 2003 à 2008. Il a abouti à un système prototype capable de traduire les questions posées par un médecin lors d’un examen médical supportant le français, l’anglais, le japonais, l’espagnol, l’arabe et le catalan, et disposant de lexiques de 500 à 10 000 mots.
Regulus, la plateforme de logiciels libres sur laquelle s’appuie MedSLT, contient un ensemble d’outils généralistes permettant de construire des systèmes vocaux linguistiques utilisant des vocabulaires de taille moyenne. Elle a depuis été utilisée pour construire plusieurs autres applications, dont la plus importante, CALL-SLT, s’inspire des ressources élaborées dans le cadre de MedSLT pour créer une plateforme multilingue d’apprentissage des langues assisté par ordinateur, dans laquelle la pratique interactive de conversations entre l’ordinateur et l’apprenant s’appuie sur la reconnaissance vocale. La première phase du projet, également financée par le FNS, a débuté en 2009 ; et une deuxième étape, commencée en 2014, se poursuivra jusqu’en 2017. Les travaux portent principalement sur le français, l’anglais et l’allemand.
- Des versions d'essai de CALL-SLT sont disponibles en ligne.
La plateforme Regulus a également été utilisée par des équipes extérieures au département TIM de la FTI, notamment par le Centre de recherche Ames de la NASA, pour construire Clarissa, un assistant expérimental pour les astronautes devenu en juillet 2005 le premier système vocal à voyager dans l’espace. La plateforme Regulus est décrite dans un ouvrage publié en 2006 par CSLI Press.
Publications principales
- Putting Linguistics into Speech Recognition, Rayner M., Hockey B.A. and Bouillon P., in: CSLI, Stanford, 2006.
- The Spoken Language Translator, Rayner M., Carter D., Bouillon P., Digalakis V.and Wirén M. (eds), CUP:Cambridge, 2000.
- Pour une interlangue utile en traduction automatique de la parole dans des domaines limités , Bouillon P., Rayner M., Gerlach J., Estrella P., in: TAL (Traitement Automatique des Langues), Volume 52:1, 2011.
- Une grammaire partagée multi-tâche pour le traitement de la parole : application aux langues romanes , Bouillon P., Rayner M., Novellas Vall B., Starlander M., Santaholma M., Nakao Y. and Chatzichrisafis N., in: TAL (Traitement Automatique des Langues), Volume 47, 3/2006, Hermes and Lavoisier, 2007.
Vous pouvez aussi consulter une liste complète des publications sur la reconnaissance vocale.