Le xAI d’Elon Musk travaille à rendre Grok multimodal.

NOUVELLES FONCTIONNALITÉS DANS LE CHATBOT GROK DE xAI

Le développeur Elon Musk et sa société xAI travaillent actuellement sur l’ajout d’entrées multimodales à leur chatbot Grok, comme le révèlent des documents publics destinés aux développeurs. Cette mise à jour permettra aux utilisateurs de télécharger des photos dans Grok et de recevoir des réponses basées sur du texte.

SCRIPT PYTHON POUR xAI SDK

Les documents développeur incluent un script Python d’exemple qui montre comment les développeurs peuvent utiliser la bibliothèque de développement logiciel xAI pour générer une réponse basée à la fois sur du texte et des images. Ce script lit un fichier image, met en place une demande de texte et utilise le SDK x.AI pour générer une réponse.

GROK: UNE MISE À JOUR IMPORTANTE

Grok, qui a été lancé par xAI en novembre 2023 et est accessible aux utilisateurs abonnés à l’abonnement X Premium Plus, bénéficie de cette importante mise à jour. La dernière version, Grok 1.5 en mars, offrait des capacités de raisonnement améliorées.

APPRENTISSAGE ET ENTRAÎNEMENT DE GROK

Le modèle de Grok est entraîné "sur une variété de données textuelles provenant de sources publiquement disponibles sur Internet jusqu’au T3 2023 et des ensembles de données examinés et organisés par des examinateurs humains", selon un article de blog de X. Le blog ajoute que Grok-1 n’a pas été formé sur les données de X (y compris les publications X publiquement disponibles). Cependant, Grok possède une "connaissance en temps réel du monde", y compris les publications sur X.

CONCURRENCE DANS LE DOMAINE DE L’IA

Fondé par Elon Musk en mars 2023, xAI est relativement nouveau dans le domaine de l’IA et est en retard par rapport à des concurrents tels que ChatGPT de OpenAI. Cependant, selon un article de blog de xAI, leur modèle Grok 1.5 se rapproche de GPT-4 sur divers critères, allant des problèmes de compétition du primaire au secondaire. Il est important de noter que les critères pour les grands modèles linguistiques sont souvent critiqués car les modèles peuvent performer bien sur les critères s’ils font partie des données d’entraînement. C’est un peu comme mémoriser les réponses aux tests, plutôt que d’apprendre réellement le matériel.

L’AVENIR DES CHATBOTS MULTIMODAUX

Les chatbots conversationnels multimodaux semblent être la prochaine frontière de l’IA, avec de multiples avancées annoncées lors de Google I/O et OpenAI lançant GPT-4o. Le manque de capacités multimodales de Grok l’a mis en retard par rapport à la concurrence, mais plus maintenant.

Sources:

What do you think?

Written by Mathieu

Leave a Reply

Your email address will not be published. Required fields are marked *

Microsoft renforce l’explorateur de fichiers avec le contrôle de version et la compression 7z

IGN acquiert Eurogamer, Rock Paper Shotgun et d’autres sites web