IL « Le couteau suisse du son ». C’est ainsi que Nvidia présente sa dernière innovation dans le domaine de l’intelligence artificielle. Fugattoabréviation de Foundational Generative Audio Transformer Opus 1, ne se contente pas de générer de la musique ou d’éditer des voix comme ses concurrents. Cette IA polyvalente peut créer pratiquement tous les sons imaginables, du plus simple au plus complexe, avec une simple commande textuelle..
Un studio de production dans votre poche
“Ce truc est fou”s’enthousiasme Ido Zmishlany, producteur multi-platine et co-fondateur de One Take Audio. Pour ce professionnel chevronné, la possibilité de créer instantanément de nouveaux sons en studio ouvre de nouvelles perspectives créatives. Fugatto vous permet de prototyper rapidement des idées musicales, d’ajouter ou de supprimer des instruments d’une chanson existante, ou même de modifier l’accent et l’émotion d’une voix.
L’histoire de la musique est étroitement liée au progrès technologique. « La guitare électrique a donné naissance au rock and roll. Quand le sampler est apparu, le hip-hop est né »se souvient Zmishlany. « Avec l’intelligence artificielle, nous écrivons le prochain chapitre de la musique. Nous avons un nouvel outil, un nouvel outil pour faire de la musique. »
Une intelligence artificielle qui comprend le son comme un humain
Rafael Valle, responsable de la recherche audio appliquée chez Nvidia et l’un des architectes du projet, explique : “Nous voulions créer un modèle qui comprenne et génère des sons comme ceux des humains”. Cette approche nous a permis de développer des capacités uniques. Par exemple, Fugatto peut faire aboyer une trompette ou miauler un saxophone.
Plus impressionnant encore, le modèle peut générer des paysages sonores qui évoluent au fil du temps. Il peut reproduire le bruit d’un orage traversant une zone, avec des coups de tonnerre qui s’intensifient puis s’estompent progressivement au loin. Le système permet également de créer de nouvelles transitions, comme un orage qui se calme pour laisser place au chant des oiseaux à l’aube.
Une technologie accessible et polyvalente
Formé sur des millions d’échantillons audio, Fugatto utilise 2,5 milliards de paramètres et nécessite l’utilisation de 32 GPU NVIDIA H100. Son développement a mobilisé une équipe internationale de chercheurs depuis plus d’un an, renforçant ses capacités multilingues.
Les applications potentielles dépassent largement le cadre musical. Les outils d’apprentissage des langues pourront personnaliser leur contenu avec la voix choisie par l’utilisateur. Les développeurs de jeux pourront générer des sons dynamiques qui s’adaptent aux actions du joueur. Les applications seront évidemment infinies.
- Nvidia lance Fugatto, une intelligence artificielle capable de créer ou de modifier n’importe quel son à partir d’un texte
- Le modèle peut combiner des instructions complexes pour générer des sons nouveaux et évolutifs
- Les applications Fugatto apporteront la musique dans le futur
???? Pour ne manquer aucune actualité de Presse-citron, suivez-nous sur Google News et WhatsApp.
Related News :