EchoSpeech, des lunettes (très) intelligentes
« Dis, Siri » : tout le monde, ou presque, connaît cet assistant intelligent, qui permet de donner des ordres à son smartphone avec sa voix. Ruidong Zhang, un chercheur de l’université de Cornell (New York), vient lui d’inventer le « cousin » de Siri. Les lunettes EchoSpeech sont en effet capables de lire sur les lèvres de celui qui les porte, et de transmettre ses propos à un smartphone. Explications.
© Echospeech
EchoSpeech. C’est le nom de ces lunettes. À première vue, elles semblent classiques : une monture rectangulaire, cerclée de noir. À première vue seulement. Elles cachent en réalité des microphones et haut-parleurs miniaturisés. Il suffit à la personne qui les porte de chuchoter, ou même de bouger les lèvres sans émettre le moindre son, pour que les lunettes transmettent des « ordres » à des appareils électroniques : passer un morceau de musique, saisir un mot de passe sans toucher le téléphone, dessiner sans clavier sur son ordinateur…
Comment ça marche ? Les lunettes envoient des ondes vers le visage de l’utilisateur lorsque celui-ci prononce des mots (en chuchotant, ou de manière totalement inaudible, juste en bougeant les lèvres). Elles récupèrent ensuite les échos renvoyés, qui sont analysés par une intelligence artificielle (IA), qui en déduit les mots prononcés. Une étude réalisée avec 12 participants a montré une efficacité proche de 95%.
Dans un concert ou une bibliothèque
Selon le chercheur, ces lunettes pourraient être utilisées dans un environnement très bruyant, comme un concert, pour transmettre, en bougeant les lèvres, un ordre à leur smartphone. Ou, à l’inverse, dans des lieux très calmes, à l’image d’une bibliothèque, où il est mal vu de parler fort, ou dans un open space, pour ne pas gêner ses collègues. Cette technologie fonctionne en reconnaissant les mouvements des lèvres, et non en amplifiant le son d’un chuchotement. L’appareil a besoin de quelques minutes seulement de « répétitions » avant d’être opérationnel, l’utilisateur devant répéter plusieurs mots pour que la technologie puisse reconnaître les mouvements de son visage.
Les geeks trouveront probablement mille et une applications à ce nouvel outil. Il en est une qui pourrait être fort utile aux personnes souffrant de troubles de la parole. Ces lunettes pourraient en effet leur permettre de dicter un texte à un synthétiseur vocal, qui prononcerait à son tour les mots à voix haute. Pour que ce prototype soit mis sur le marché, son concepteur devra d’abord trouver un financement. Affaire à suivre…