Microsoft a dévoilé une intelligence artificielle qui permet de créer une vidéo à partir d’une photographie.
“La première vidéo générée par l’IA qui semble super réelle.” Dans https://twitter.com/bindureddy/status/1780737428715950460 partagé sur
Des vidéos « hyper réalistes »
Cette IA, baptisée VASA-1, utilise une photo prise en mode portrait avec un son mettant en vedette la voix du cobaye, pour produire une vidéo « hyper réaliste », qui permet une synchronisation précise des lèvres, des animations faciales réalistes et des mouvements naturels de la tête.
Le résultat, visible ci-dessous, est particulièrement bluffant : « C’est incroyable, étant donné que la vidéo générée par l’IA a l’air si réelle », déclare le responsable.
Mais comme elle le souligne, cette vidéo n’est qu’un exemple donné dans un environnement compartimenté pour maximiser les résultats. Il s’agit pourtant d’une belle prouesse pour Microsoft, qui continue de dépenser des milliards chaque année, notamment avec OpenAI, pour se positionner comme un acteur incontournable dans le domaine de l’intelligence artificielle.
Pour le moment, VASA-1 reste assez limité, notamment parce qu’il ne peut générer des vidéos qu’en 512×512 mégapixels, et en 40 images par seconde. Cependant, à l’avenir, cette IA pourrait améliorer significativement la création d’avatars réalistes, par exemple dans les jeux vidéo, mais aussi dans le cadre d’outils pédagogiques. Cependant, il n’est pas possible à ce stade de créer un corps entier, et les cheveux ne sont pas non plus animés.
Toutes les démos distribuées par Microsoft sont visibles sur le blog officiel du projet. On y voit des personnes bien réelles, mais aussi des peintures ou des concepts qui prennent vie avec une diversité ethnique importante.
Pour le moment, cette IA n’est pas accessible au grand public.