Le prochain grand chatbot fonctionnera à la vitesse de l’éclair sur votre ordinateur portable, sans nécessiter de connexion Internet. C’est du moins la vision récemment exposée par le PDG d’Intel, Pat Gelsinger, lors du sommet Intel Innovation 2023 de l’entreprise. Entouré de démonstrations sur scène, Gelsinger a annoncé l’arrivée des “PC AI” conçus pour accélérer toutes leurs tâches croissantes d’IA uniquement sur le matériel disponible sous les doigts de l’utilisateur.
Cette nouvelle tendance n’est pas unique à Intel. Tous les grands noms de la technologie grand public, d’Apple à Qualcomm, se précipitent pour optimiser leur matériel et leur logiciel afin de faire fonctionner l’intelligence artificielle “au bord” – c’est-à-dire sur du matériel local, et non sur des serveurs cloud distants. L’objectif ? Une IA personnalisée et privée, si transparente que vous pourriez oublier qu’il s’agit d’une “IA”.
Cependant, la promesse selon laquelle l’IA révolutionnerait bientôt tous les aspects de nos vies a commencé à montrer des signes de faiblesse. Le cloud occupait une place centrale pour l’IA, mais pour combien de temps encore?
En 2023, l’IA dans le cloud a connu un essor. Le PDG de Microsoft, Satya Nadella, a annoncé un investissement de 10 milliards de dollars dans OpenAI, créateur de ChatGPT et DALL-E. Pendant ce temps, Google a lancé son propre chatbot, Bard, en mars; Amazon a annoncé un investissement de 4 milliards de dollars dans Anthropic, créateur de l’assistant concurrent ChatGPT Claude, en septembre.
Et pourtant, malgré ces avancées, les modèles IA les plus performants s’appuient fortement sur des centres de données remplis de matériel IA coûteux, que les utilisateurs doivent accéder via une connexion Internet fiable. Cependant, ces modèles peuvent parfois être lents à répondre ou à générer du contenu. Ils peuvent aussi souffrir de problèmes de confidentialité et de sécurité.
Le professeur Oliver Lemon, spécialiste de l’informatique à l’Université Heriot-Watt, à Édimbourg, a fait face à ce problème. Il a dû choisir un modèle IA plus petit et localisé pour un programme de robotique appelé Spring. En fin de compte, cela a permis à l’IA de fonctionner plus rapidement et d’améliorer la confidentialité des données.
Le besoin croissant de l’inférence locale a également mis en avant des applications telles que Rewind, un assistant IA personnalisé qui fonctionne sur votre ordinateur pour retrouver des informations supprimées ou cachées. En gérant à la fois la formation et l’inférence localement, cette application a ouvert la voie à une nouvelle ère pour l’IA décentralisée et respectueuse de la vie privée.
Les progrès dans ce domaine sont prometteurs et offrent de nouvelles perspectives passionnantes pour l’avenir de l’IA. Toutefois, tout en mettant en lumière ses avantages, il est essentiel de rester conscient des enjeux de sécurité et de confidentialité.