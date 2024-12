Google a lancé Whisk, un générateur d'images basé sur l'intelligence artificielle, dans le but de créer des visuels stylisés à partir de photos ou illustrations existantes.

Tl;dr Whisk est un générateur d’images basé sur l’intelligence artificielle qui transforme des visuels existants en nouvelles créations.

L’outil propose une interface simple avec des styles prédéfinis et permet une exploration rapide d’idées visuelles.

Le mode avancé de Whisk utilise des descriptions générées par l’IA, mais reste limité dans ses résultats pour le moment.

Une introduction simple et accessible

Whisk est un projet Google Labs qui permet aux utilisateurs de créer des images en utilisant une image existante comme point de départ. L’outil ne vise pas à créer une réplique exacte de l’image de départ, mais plutôt à capturer son « essence », ce qui le rend plus adapté à des visualisations rapides ou à des idées créatives. En ouvrant Whisk, les utilisateurs sont accueillis par une interface minimaliste, avec quelques options de personnalisation. Cela permet de se concentrer sur l’essentiel : une interface simple, rapide et intuitive, idéale pour des explorations visuelles.

Des styles prédéfinis pour stimuler la création

L’outil propose trois styles prédéfinis pour commencer : « sticker », « enamel pin » et « plushie ». Ces choix semblent délibérés, offrant des visuels aux contours plus nets, idéaux pour des représentations simples et stylisées. Ces trois styles permettent de visualiser rapidement des concepts sans se soucier des détails complexes. Par exemple, l’image générée d’un « Wilford Brimley plushie » illustre parfaitement comment Whisk fonctionne dans son cadre actuel : un rendu visuel rapide, mais pas une reproduction exacte de l’image de départ.

L’éditeur avancé pour plus de contrôle

Whisk inclut également un mode « avancé » où les utilisateurs peuvent partir de zéro, choisir des catégories comme le sujet, la scène et le style, et affiner les détails avec du texte. Cependant, ce mode n’a pas encore donné des résultats tout à fait satisfaisants dans sa version actuelle. Par exemple, lorsqu’un utilisateur demande une image d’une scène spécifique, l’outil peut générer un résultat qui semble vaguement lié à la demande, mais avec des détails inattendus ou incohérents. Ce décalage montre les limitations de l’outil, qui ne produit pas encore de contenu prêt pour la production.

Une technologie puissante mais limitée

Le fonctionnement de Whisk repose sur deux modèles d’IA de Google : Gemini, qui génère une description détaillée de l’image d’origine, et Imagen 3, l’outil qui génère l’image basée sur cette description. Cela explique pourquoi les images générées peuvent différer considérablement de l’image d’origine. Google précise que l’outil ne se contente pas de reproduire l’apparence exacte de l’image source, mais en tire quelques caractéristiques clés. Par exemple, la hauteur, le poids ou même la couleur de la peau peuvent changer, ce qui peut être une limitation pour certains utilisateurs. Pour l’instant, Whisk est disponible uniquement aux États-Unis, mais il pourrait se développer à l’international à l’avenir.