En février dernier, OpenAI a dévoilé son premier modèle texte-vidéo, Sora, qui est depuis en avant-première. La société a annoncé le 9 décembre le déploiement de Sora Turbo, une version plus rapide, sur sora.com. Il est disponible sans frais supplémentaires pour les abonnés ChatGPT Plus et Pro dans tous les pays où ChatGPT est disponible, à l’exception de l’UE, du Royaume-Uni et de la Suisse où il faudra attendre encore quelques mois.
La nouvelle version, Sora Turbo, partage les caractéristiques techniques de Sora présentée en février dernier, mais offre une vitesse de génération considérablement améliorée, réduisant ainsi le - nécessaire pour produire un contenu réaliste de haute qualité à partir de descriptions textuelles. Les utilisateurs peuvent créer des vidéos d’une durée maximale de 20 secondes, idéales pour les réseaux sociaux ou le marketing.
Avec des capacités de résolution allant jusqu’à 1080p dans différents formats (panoramique, vertical ou carré), il offre une flexibilité qui séduira aussi bien les créateurs amateurs que les professionnels.
Une interface intuitive pour une création précise
Pour simplifier l’expérience utilisateur, OpenAI a conçu une interface dédiée à Sora, incluant un outil de storyboard qui permet de définir précisément chaque élément de la vidéo. Les flux récents en vedette mettent en valeur les créations de la communauté, inspirant les utilisateurs tout en démontrant le potentiel du modèle.
Sora prend également en charge l’utilisation d’actifs personnalisés : les utilisateurs peuvent combiner du texte, des images et des vidéos existants pour étendre ou remixer leurs créations. Cette modularité renforce l’attrait de la plateforme pour une large gamme d’applications.
Les limites de SORA
La version initiale avait parfois du mal à modéliser la physique complexe, la causalité, les détails spatiaux et temporels et les interactions entre objets et personnages. Bien que réduit, Sora Turbo rencontre ces mêmes problèmes, les mouvements manquent parfois de naturel.
Si le modèle peut encore être amélioré, son déploiement marque une étape clé pour OpenAI. Vous pouvez découvrir le flux de vidéos générés ici.
Déploiement responsable
Des méthodes de sécurité conçues pour DALL-E 3 garantissant le respect des politiques d’utilisation, telles que l’interdiction de la violence, des contenus haineux ou de la divulgation d’informations personnelles, ont été appliquées à Sora. OpenAI a ajouté d’autres mesures pour plus de sécurité et de transparence :
- Toutes les vidéos incluent des métadonnées C2PA pour garantir la traçabilité ;
- Les filigranes visibles par défaut assurent la transparence quant à leur origine ;
- Un outil de vérification interne permet d’identifier le contenu de Sora.
Les deepfakes à caractère sexuel ou les contenus illégaux sont bloqués par l’entreprise, qui a également volontairement restreint les fonctionnalités liées aux visages humains afin d’éviter d’éventuels détournements et abus.
Disponibilité et modèles d’abonnement
Sora est disponible exclusivement pour les abonnés ChatGPT Plus et Pro.
Les premiers ont la capacité de générer jusqu’à 50 vidéos de 5 secondes de 480p à 720p chaque mois. Pour les utilisateurs ayant des besoins plus élevés, l’abonnement Pro leur permet de produire 500 vidéos, de durée plus longue (20 secondes) et de résolution plus élevée (jusqu’à 1080p).
OpenAI prévoit également de proposer des tarifs adaptés à différents types d’utilisateurs, rendant la technologie accessible aussi bien aux créateurs individuels qu’aux grandes entreprises. Ces offres devraient être disponibles dès début 2025.