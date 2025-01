Avec Janus Pro, DeepSeek défie les performances des modèles d'OpenAI et établit de nouveaux standards dans la création d'images par IA.

Un modèle puissant et polyvalent

Janus Pro fait partie d’une nouvelle famille de modèles développée par DeepSeek, disponible en téléchargement sur la plateforme Hugging Face. Avec des tailles variant entre 1 et 7 milliards de paramètres, ces modèles sont conçus pour analyser et créer des images. Les paramètres, qui reflètent la capacité du modèle à résoudre des problèmes, sont au cœur de l’architecture de Janus Pro. En règle générale, plus un modèle contient de paramètres, plus il est performant. Le plus grand modèle, Janus Pro 7B, se distingue par sa capacité à rivaliser avec des modèles puissants comme DALL-E 3, tout en restant relativement compact.

Une licence flexible et une performance remarquable

Le modèle Janus Pro est distribué sous la licence MIT, ce qui permet une utilisation commerciale sans restriction. Cette approche est une aubaine pour les développeurs et les entreprises cherchant à intégrer ces modèles dans des projets commerciaux. Sur des benchmarks d’évaluation de l’IA comme GenEval et DPG-Bench, le modèle Janus Pro 7B surpasse non seulement DALL-E 3, mais aussi des modèles comme PixArt-alpha et Stable Diffusion XL. Bien que la résolution maximale des images générées par ces modèles soit limitée à 384 x 384 pixels, leurs performances restent impressionnantes compte tenu de leur taille modeste.

Une architecture innovante pour des résultats concrets

DeepSeek présente Janus Pro comme un cadre autoregressif novateur, capable de créer et d’analyser des images de manière fluide. Cette flexibilité en fait un modèle polyvalent, applicable à une large gamme de tâches multimodales. La simplicité de son architecture permet à Janus Pro d’être à la fois performant et adaptable, en surpassant certains modèles unifiés existants tout en égalant ou dépassant la performance de modèles spécifiques à des tâches précises. Selon DeepSeek, Janus Pro représente une avancée significative vers des modèles multimodaux unifiés de nouvelle génération.

Une émergence marquante sur la scène internationale

DeepSeek, bien que relativement discret jusque-là, a fait une entrée fracassante dans l’arène internationale avec l’ascension de son application chatbot en tête des classements de l’App Store d’Apple. Financé par la société de gestion quantitative High-Flyer Capital Management, ce laboratoire d’IA attire de plus en plus l’attention des analystes et des technophiles, notamment sur la question de la compétitivité des États-Unis dans la course à l’IA. Les modèles de langage de DeepSeek, optimisés pour une consommation de calcul efficace, soulèvent des interrogations sur l’avenir de l’IA et des besoins en puces d’IA à l’échelle mondiale.