Des lunettes équipées d'Intelligence Artificielle peuvent lire le langage silencieux.

AI-EQUIPPED EYEGLASSES CAN READ SILENT SPEECH

Des chercheurs de Cornell University ont développé un nouveau dispositif qui permet une reconnaissance continue de la parole silencieuse à l’aide de simples lunettes. L’interface de reconnaissance de la parole silencieuse, appelée EchoSpeech, fonctionne grâce à une intelligence artificielle et à un capteur acoustique incorporé dans les lunettes. Les lunettes ont été conçues pour être faciles à utiliser avec un apprentissage de l’utilisateur en quelques minutes seulement.

EFFECTUER DES COMMANDES SANS VOIX

Les utilisateurs peuvent facilement effectuer jusqu’à 31 commandes plus complexes en mouvant leurs lèvres pour produire une suite de mots. Le dispositif fonctionne presque parfaitement, avec une précision de l’ordre de 95 %. L’interface pourrait être utilisée pour communiquer avec d’autres personnes via un smartphone, où la parole est difficile, comme dans un environnement bruyant ou calme.

AVANTAGES DU SYTÈME ECHOSPEECH

Outre la capacité de communiquer en silence, les lunettes EchoSpeech pourraient être utilisées en conjonction avec un stylet pour une utilisation à des fins de conception. Les utilisateurs pourraient alors éliminer le besoin d’un clavier et d’une souris. Le professeur d’information sciences à l’université de Cornell, M. Cheng Zhang, travaillant sur le projet, a déclaré que le dispositif possédait des avantages significatifs. Il est petit, peu onéreux, peu gourmand en énergie et respectueux de la vie privée. Le système pourrait constituer une solution de communication alternative pour ceux qui ont perdu leur voix. Il pourrait également être utilisé pour une variété d’applications médicales ainsi que pour les personnes atteintes de troubles de la parole.

COMPARAISON AVEC LES AUTRES DISPOSITIFS

La plupart des technologies de reconnaissance de parole silencieuse sont limitées à un ensemble prédéterminé de commandes et nécessitent que l’utilisateur porte une caméra ou des capteurs qui ne sont ni pratiques ni réalisables, a déclaré M. Zhang. En outre, les caméras intégrées posent des problèmes de confidentialité pour les utilisateurs ainsi que pour les personnes avec qui ils interagissent. En revanche, la technologie d’EchoSpeech ne nécessite pas de caméras incorporées, mais utilise uniquement des capteurs acoustiques pour capturer les mouvements de la bouche et du visage.

FACILITÉ D’UTILISATION ET DE SÉCURITÉ

L’utilisation de capteurs acoustiques permet également de réduire la consommation d’énergie, ce qui améliore la durée de vie de la batterie de dix heures, contre seulement une demi-heure avec une caméra. Les données audio sont également plus faciles à traiter en utilisant moins de bande passante, ce qui permet de les transmettre à un smartphone via Bluetooth en temps réel, tout en garantissant la vie privée de l’utilisateur.

PERSPECTIVES D’AVENIR

EchoSpeech est le dernier ajout à une série de dispositifs portables, tels que le casque EarIO, développé par la même équipe. Le professeur Zhang a déclaré que l’utilisation de verres intelligents serait un élément important pour comprendre les activités humaines dans des situations quotidiennes. Le laboratoire est maintenant en train de travailler sur des applications pour suivre les mouvements du visage, des yeux et du corps.

EchoSpeech sera présenté à la conférence de l’Association for Computing Machinery Conference on Human Factors in Computing Systems (CHI) ce mois-ci à Hambourg, en Allemagne. Les chercheurs du projet travaillent actuellement à la commercialisation de cette technologie, grâce en partie à Ignite: Cornell Research Lab, un organisme de financement.

Sources : CNET, The New York Times