Paris, le samedi 17 décembre 2016 – L’élaboration de machines capables de reconstituer la voix humaine est un objet de recherche depuis plus de deux siècles. Une "speaking machine" avait ainsi été mise au point par Wolfgang von Kempelen en 1791. Aujourd’hui, les travaux se concentrent sur l'élaboration de logiciels permettant de retranscrire la parole à partir de signaux non vocaux. Les chercheurs du BrainTech Laboratory (Inserm) et de l’équipe CRISSP ont franchi une étape importante. Ils ont en effet mis au point un synthétiseur vocable capable de « reconstituer la parole d’une personne articulant "silencieusement", c'est-à-dire bougeant sa langue, ses lèvres, sa mâchoire, mais ne vocalisant pas » explique un communiqué des institutions.

Du cerveau à la machine

Depuis plusieurs années, les chercheurs de ces laboratoires perfectionnent un algorithme d’apprentissage automatique (dit de « type réseau de neurones profond ») dont l’objectif est de « décoder les mouvements articulatoire à l’aide de capteurs posés sur la langue, les lèvres et la mâchoire et les convertir en temps réel en une parole de synthèse ». La dernière version de cet algorithme, présenté dans les colonnes de PLOS Computational Biology, permet une synthèse vocale immédiate par « n’importe quel locuteur après une courte période de calibration du système ». Le dispositif se caractérise également par l’absence de restriction du vocabulaire, ce qui fait défaut aux systèmes actuels de « lecture labiale automatique ».

Si ces résultats sont très encourageants, les chercheurs français souhaitent poursuivre leurs travaux pour mettre au point un dispositif plus ambitieux encore : une interface cerveau/machine capable de retranscrire de façon immédiate la parole à partir cette fois des signaux électriques du cerveau.

Léa Crébat