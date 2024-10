Découvrez Mochi-1, le dernier modèle de vidéo IA gratuit et open-source.

Genmo dévoile Mochi-1, son modèle de génération vidéo

Dans une ère où l’IA générative est en pleine effervescence, Genmo fait une entrée remarquée avec son modèle de génération vidéo, baptisé Mochi-1. Cette entreprise innovante apporte une approche différente sur le champ de bataille de la vidéo générative.

Un modèle open-source sous licence Apache 2.0

Le modèle Mochi-1 est présenté comme une « prévisualisation de recherche ». Le grand avantage de ce modèle est qu’il est sous licence Apache 2.0, ce qui le rend open-source. Cela signifie qu’il est libre d’accès, peut être démonté et remonté à volonté. L’aspect open-source de Mochi-1 permettra également sa disponibilité sur toutes les plateformes d’IA générative habituelles à l’avenir. Il pourrait même être exécuté un jour sur un bon PC de jeu.

Une attention particulière portée à la motion

Pourquoi préférer le modèle de Genmo à d’autres actuellement disponibles sur le marché ? La réponse est simple : la motion. Paras Jain, PDG de Genmo, explique que la motion est un indicateur clé lors de l’évaluation des modèles. « Je pense que pendant très longtemps, la seule vidéo inintéressante est celle qui ne bouge pas. Et j’avais l’impression que beaucoup de vidéos d’IA souffraient de cet ‘effet photo en direct' », explique-t-il. « Je pense que nos modèles historiques avaient cela, c’était ainsi que la technologie devait évoluer. Mais les vidéos sur la motion étaient l’investissement le plus important que nous avons fait, avant tout. »

Un modèle optimisé pour une meilleure compréhension de la physique

Cette première version est un modèle de diffusion de transformateur de 10 milliards de paramètres qui utilise une nouvelle approche asynchrone pour offrir plus de puissance dans un petit format. Jain a déclaré qu’ils ont formé Mochi-1 exclusivement sur la vidéo, plutôt que sur l’approche mixte vidéo, image et texte plus traditionnelle. Cela lui a donné une meilleure compréhension de la physique.

Genmo espère que Mochi-1 peut offrir la meilleure génération de vidéos open-source de sa catégorie. Actuellement, les vidéos sont limitées à 480p dans le cadre de la nouvelle prévisualisation de recherche lancée aujourd’hui. Genmo a également mis l’accent sur l’adhérence aux instructions et la reconnaissance.