Les développeurs de jeux vidéo devraient-ils commencer à s’inquiéter ? Google Deepmind a levé le voile mercredi sur Genie 2, un outil capable de créer des environnements 3D jouables à partir d’une simple image (générée par une IA à partir d’une description textuelle). “Genie 2 est un modèle mondial, ce qui signifie qu’il peut simuler des mondes virtuels, y compris les conséquences de toute action (par exemple sauter, nager, etc.)”, explique la filiale Alphabet (maison mère de Google) spécialisée dans l’IA en montrant différents exemples. de création sur son site.
« Il a été formé sur un ensemble de données vidéo à grande échelle et, comme d’autres modèles génératifs, il démontre diverses capacités émergentes à grande échelle, telles que les interactions d’objets, l’animation de personnages complexes, la physique et la capacité à modéliser et donc prédire le comportement d’autres agents d’IA. “, ajoute Google Deepmind. Le monde 3D interactif généré peut ensuite être joué par un humain, à l’aide d’un clavier et d’une souris, ou par un agent d’IA, dans le but d’entraîner des robots et de créer des systèmes d’IA plus efficaces.
« Les jeux jouent un rôle clé dans le monde de la recherche sur l’intelligence artificielle (IA). Leur nature engageante, leur combinaison unique de défis et leurs progrès mesurables en font des environnements idéaux pour tester et faire progresser en toute sécurité les capacités de l’IA », explique la société basée au Royaume-Uni. Comme il le montre, il a réussi à intégrer et faire évoluer son agent SIMA dans les mondes générés par Genie 2.
Actuellement, Genie 2, qui concurrence notamment la solution de la start-up World Labs, ne peut générer que des mondes interactifs d’une durée d’une minute, mais ceux-ci parviennent à maintenir une cohérence de la scène.