Grok-1.5V représente la première génération du modèle d’intelligence artificielle multimodale de la compagnie.

Tl;dr xAI, concurrent d’OpenAI, a dévoilé Grok-1.5V, capable de traiter des informations visuelles.

Il peut traduire des schémas en code Python, raconter une histoire à partir d’un dessin, expliquer un mème.

Il a été introduit peu après la sortie du Grok-1.5, amélioré en mathématiques et programmation.

xAI a également publié un set de données benchmark, le RealWorldQA.

xAI lance Grok-1.5V, un nouveau modèle d’intelligence artificielle

Créée par Elon Musk, la société xAI, en concurrence directe avec OpenAI, vient de présenter son premier modèle multimodal d’intelligence artificielle de première génération, le Grok-1.5V. Contrairement aux modèles traditionnels, ce dernier peut traiter aussi bien du texte que des documents complexes tels que des diagrammes, des graphiques ou encore des photographies.

Une IA polyvalente

Selon le communiqué de l’entreprise, Grok-1.5V a une grande variété d’applications possibles. Par exemple, il peut “traduire un organigramme en code Python”, écrire une histoire sur la base d’un dessin ou même expliquer “un mème qui vous échappe”. Construit pour démontrer que même une technologie complexe peut être facile à utiliser, Grok-1.5V peut vous aider à comprendre n’importe quel contenu visuel qui heureusement est de plus en plus courant avec l’essor d’Internet.

Une innovation rapide d’xAI

Ce nouveau modèle survient quelques semaines seulement après le lancement du Grok-1.5 par xAI. Ce dernier a été spécifiquement conçu pour exceller en mathématiques et en programmation, tout en étant capable de traiter des contextes plus longs, ce qui lui permet de consulter davantage de sources pour mieux comprendre certaines requêtes. xAI a annoncé que ses premiers testeurs et utilisateurs existants pourront bientôt bénéficier des capacités du Grok-1.5V, même si aucun calendrier précis n’a été communiqué pour son déploiement.

Redéfinir les normes de l’intelligence artificielle

En parallèle de la présentation du Grok-1.5V, xAI a également mis à disposition un nouvel ensemble de données de référence, appelé RealWorldQA. Composé de 700 images, ce dernier “vient avec des questions et des réponses facilement vérifiables” et permet d’évaluer les performances des modèles d’intelligence artificielle. Lors de tests comparatifs, la technologie de xAI aurait obtenu le score le plus élevé face à ses concurrents, comme le GPT-4V d’OpenAI ou le Gemini Pro 1.5 de Google. Une performance remarquable qui confirme la place dominante de xAI dans le secteur de l’IA.