Cela vous intéressera aussi
[EN VIDÉO] Interview : pourquoi construire des robots humanoïdes ? L’androïde est sans doute le type de robot le plus complexe sur le plan mécanique. Futura-Sciences a interrogé Jean-Claude Heudin, directeur du laboratoire de recherche de l’IIM (Institut de l’internet et du multimédia) afin de comprendre pourquoi il incarne le pinacle de la robotique.
Énoncer la commande vocale « J’ai faim » à un robot pour qu’il rapporte quelque chose à manger, cela pourrait sembler presque normal ou du moins faisable en 2022. Et pourtant, lorsque l’on sait que le robot en question n’a jamais été programmé pour comprendre ce qu’il faut faire pour répondre à cette requête, cela reste très impressionnant.
Ce robot domestique, issu des laboratoires de Google et conçu par Fei Xia, un chercheur de la firme, vient de faire la démonstration de ses capacités. Le robot est doté d’une Intelligence artificielle qui lui permet de transformer une phrase qu’il ne connait pas en une suite d’événements physiques. Pour y parvenir, le robot va rechercher un maximum d’informations sur le Web, afin de savoir ce qu’il faut faire selon la phrase énoncée. Le robot peut donc saisir toutes les subtilités et complexités du langage selon Google.
Cela veut dire qu’il n’y a pas besoin d’enrichir le robot avec de nombreuses commandes vocales, comme c’est le cas avec les assistants virtuels comme Alexa, Siri ou l’assistant Google. Ainsi, le chercheur a montré que, lorsque l’on renversait un liquide, le robot réagissait en apportant une éponge alors qu’il ne l’avait jamais fait avant ni même appris à le faire.
Excited to share our work on LLMs + robotics. The robot acts as the language model’s “hands and eyes”, achieving 100+ long horizon mobile manipulation tasks specified by natural language. https://t.co/UcnnbWGChR
— Fei Xia (@xf1280) April 5, 2022
Un puissant moteur linguistique
Pour comprendre et agir, le robot s’appuie sur le modèle de langage le plus puissant de chez Google. Il porte le nom de PaLM et absorbe de gigantesques quantités de textes provenant d’ouvrages ou du Web en utilisant le générateur de texte OpenAI GPT-3. C’est de cette façon qu’il peut enrichir ses compétences linguistiques et réagir correctement à une phrase. PaLM est également capable d’expliquer en langage naturel comment il parvient à une réponse précise face à une question.
Côté matériel, l’architecture du robot, c’est-à-dire une colonne roulante dotée d’un bras articulé avec une pince, provient d’Everyday Robots, une filiale de Google planchant sur un robot majordome.
Même si ce robot intégrant une version de PaLM boostée, est prometteur, il ne faut pas oublier que les IA, même performantes restituent ce qu’elles ingurgitent sur le Web. C’est ainsi que le chatbot de Meta s’est retrouvé à répondre de façon raciste avec des tendances complotistes après quelques semaines d’activité.
—
OFFRE SPÉCIALE : abonnez-vous à notre média pour une durée de 3 mois et recevez le Mag Futura en cadeau !*
*Offre valable pour toute nouvelle souscription de 3 mois à l’offre “Je participe à la vie de Futura” sur Patreon.
—
Intéressé par ce que vous venez de lire ?