L’IA de Microsoft transforme vos photos en vidéos réalistes de discussion et de chant
Les créateurs reconnaissent que leur invention peut être détournée de son usage initial.
Tl;dr
- Microsoft Research Asia dévoile l’outil expérimental VASA-1.
- Il crée un visage parlant réaliste à partir d’image fixe et fichier audio.
- Potentiellement mal utilisé pour créer des deepfakes, l’accès public est limité.
- VASA-1 pourrait améliorer l’équité éducative et l’accessibilité à la communication.
VASA-1 : une innovation bluffante
Le bras asiatique de Microsoft Research a levé le voile sur une invention qui s’avère aussi fascinante qu’inquiétante : VASA-1. Cet outil d’intelligence artificielle expérimental, capable de prendre une image fixe d’une personne ou sa représentation artistique, et un enregistrement audio pour créer en temps réel un visage parlant d’un réalisme à couper le souffle.
Comment fonctionne VASA-1 ?
VASA-1 génère des expressions faciales et des mouvements de tête pour une image fixe existante, de même que les mouvements appropriés des lèvres pour correspondre à un discours ou à une chanson. Si les mouvements des lèvres et de la tête peuvent parfois sembler un tantinet robotiques, il reste évident que cette technologie pourrait être détournée pour créer rapidement et facilement des deepfakes très réalistes.
Polémique autour de la « deepfake »
Face à ces perspectives, l’équipe responsable de VASA-1 reste prudente. Elle a choisi de ne pas rendre public « une démo en ligne, API, produit, détails d’implémentation supplémentaires, ou toute offre liée » tant qu’elle n’a pas obtenu d’assurance que leur technologie « serait utilisée de manière responsable et en conformité avec la réglementation appropriée ». Ils s’abstiennent néanmoins de préciser s’ils prévoient d’implémenter des mesures de garantie pour empêcher des acteurs malveillants de les utiliser à des fins nuisibles.
Des perspectives prometteuses malgré tout
Les chercheurs restent toutefois optimistes quant à leur invention. Selon eux, l’outil pourrait favoriser l’équité éducative, améliorer l’accessibilité pour ceux qui ont des difficultés de communication, voire offrir de la compagnie et du soutien thérapeutique à ceux qui en ont besoin. Une véritable avancée qui viendrait offrir un accès privilégié à des avatars pouvant communiquer pour leur propriétaire.
En fin de compte, même si le potentiel d’abus est indéniable, il est difficile de ne pas admirer l’innovation et le potentiel de VASA-1.