Du 5 au 18 décembre, OpenAI organise 12 jours d’annonces et de démos. De nouveaux modèles d’IA et des fonctionnalités innovantes sont attendus.
Sur le principe du calendrier prévisionnel, OpenAI a prévu une flopée de nouveautés et de démonstrations du 5 au 18 décembre. Le JDN vous dévoile jour après jour toutes les annonces à retenir.
D8 : ChatGPT Search s’améliore encore et arrive en mode vocal
Lancé il y a deux mois pour les abonnés payants, ChatGPT Search permet à l’IA de rechercher sur Internet pour fournir des réponses à jour. Trois améliorations majeures sont annoncées : une recherche plus rapide et optimisée pour les mobiles avec une nouvelle expérience cartographique, l’intégration de la recherche dans le mode vocal avancé et un déploiement mondial sur toutes les plateformes.
Les utilisateurs payants et gratuits peuvent désormais effectuer des recherches conversationnelles naturelles, accéder au contenu multimédia de manière native (images, vidéos) et utiliser ChatGPT comme moteur de recherche par défaut dans leur navigateur. OpenAI a déjà annoncé que D9 serait dédié aux développeurs avec un « mini dev day » qui promet son lot de nouveautés passionnantes.
D7 : OpenAI introduit des projets dans ChatGPT
A J7 de son Shipmas, OpenAI introduit une nouvelle fonctionnalité, très attendue, dans ChatGPT : projets. Cette nouvelle fonction permet aux utilisateurs de créer des espaces dédiés à leurs différents projets, où ils peuvent télécharger des fichiers, définir des invites personnalisées et regrouper toutes les conversations liées à un même sujet. L’intégration est complète avec les fonctionnalités existantes telles que la recherche et le mode Canvas. Les utilisateurs peuvent également opter pour une utilisation plus simple comme système de dossiers pour organiser leurs discussions.
L’outil a déjà fait ses preuves en interne, notamment pour gérer des projets personnels comme l’entretien de la maison ou le développement web. Déployée aujourd’hui pour les abonnés, hors Europe, Plus, Pro et Teams, la fonctionnalité sera progressivement étendue aux utilisateurs gratuits, avant d’atteindre les versions Entreprise et Education début 2025. Une mise à jour qui devrait considérablement améliorer l’expérience utilisateur en apportant enfin une solution à la gestion parfois chaotique des conversations dans ChatGPT.
J6 : ChatGPT passe à l’heure du pôle Nord
Au sixième jour de ses annonces, OpenAI adopte un ton résolument festif en dévoilant une expérience vocale unique avec le Père Noël. Tous les utilisateurs de ChatGPT peuvent désormais converser directement avec le célèbre personnage en utilisant le mode vocal. Accessible via une simple icône en forme de flocon de neige dans l’interface, cette nouvelle voix permet des échanges variés, de la vie au pôle Nord au partage de listes de cadeaux, en passant par des histoires réconfortantes sur les rennes. Les utilisateurs peuvent même créer des messages vocaux personnalisés du Père Noël.
Une fonctionnalité temporaire, qui ne sera pas enregistrée dans l’historique des conversations. Le tout est accompagné d’un guide complet d’utilisation des outils OpenAI pour les fêtes : de l’aide à la planification des cadeaux avec DALL-E aux conseils culinaires en mode vocal, en passant par la création de jeux familiaux personnalisés. Une belle démarche de communication. Enfin OpenAI annonce également l’arrivée de la vision live dans son Voice Mode. Partage d’écran ou de caméra, l’utilisateur peut choisir le flux qu’il partage en direct avec l’IA.
J5 : Apple Intelligence arrive progressivement
Pour son cinquième jour, OpenAI fait le point sur son partenariat précédemment annoncé avec Apple Intelligence (IA générative sur les appareils Apple), qui commence à se concrétiser. L’intégration de ChatGPT au cœur de l’écosystème Apple se met progressivement en place, avec une première phase sur macOS pour les utilisateurs disposant de la dernière version du système d’exploitation. L’assistant peut désormais se souvenir du contexte des processus en cours, offrant ainsi une expérience plus cohérente.
Pour les utilisateurs iOS au sein de l’UE, il faudra attendre avril 2024 pour bénéficier de ces fonctionnalités. La démonstration a notamment mis en avant la création de playlists personnalisées – même si l’ouverture directe dans l’application Musique n’est pas encore opérationnelle – ainsi que la future intégration avec le bouton caméra de l’iPhone 16 pour un accès direct à ChatGPT Vision.
J4 : Le mode Canvas s’agrandit et devient plus intelligent
Pour le quatrième jour de son « Shipmas », OpenAI se transforme radicalement toile mode fils en un véritable assistant de développement automatisé. La fonctionnalité, désormais disponible pour les utilisateurs payants et gratuits, n’est plus seulement une interface visuelle : elle devient un environnement de développement complet où l’IA peut rechercher des données, générer du code, l’exécuter et visualiser les résultats directement dans la console.
Canvas se positionne désormais comme un co-pilote de développement capable d’accompagner les développeurs et les data scientists tout au long de leur workflow. OpenAI étend également cette fonctionnalité aux GPT personnalisés. Une mise à jour qui va encore plus loin vers une automatisation intelligente des tâches de développement et d’analyse des données.
D3 : Sora disponible pour les utilisateurs de ChatGPT Plus et Pro
OpenAI déploie son très attendu Générateur vidéo Sister AIdix mois après son annonce initiale (Lire notre article Génération vidéo : 10 mois après son annonce, Sora d’OpenAI est (enfin) là). Le service est disponible pour les abonnés ChatGPT Plus et Pro aux États-Unis, avec une nouvelle interface dédiée et un modèle Turbo plus rapide. Les utilisateurs peuvent générer des vidéos jusqu’à 20 secondes dans différentes résolutions (480p pour Plus, 1080p pour Pro) à partir de texte, d’images ou de vidéos existantes.
La technologie excelle dans les mouvements de caméra et la cohérence des scènes, malgré certaines limitations liées à la physique des objets. OpenAI met l’accent sur la sécurité avec des filtres anti-deepfake, un filigrane C2PA systématique et des restrictions sur l’imitation des styles d’artistes. Face à une demande massive, OpenAI limite actuellement l’accès au modèle.
D2 : l’arrivée de la mise au point des renforts pour les développeurs
Pour sa deuxième journée d’annonces, OpenAI cible les entreprises avec une innovation majeure : le réglage fin du renforcement (RFT). La technique permet aux développeurs d’adapter les modèles OpenAI à des tâches complexes en utilisant leurs propres ensembles de données et critères d’évaluation. La technologie, qui sera accessible via une API en version alpha début 2025, cible particulièrement les domaines du droit, de la santé, de la finance et de l’ingénierie. L’objectif est d’obtenir des modèles experts capables de fournir des réponses très précises dans des domaines spécialisés où existent des réponses objectivement correctes.
J1 : un nouvel abonnement et la version finale de o1
Pour le premier jour, OpenAI frappe fort et présente la version finale de o1son modèle de raisonnement. Cette version finale, qui succède à o1-preview lancée en septembre dernier, marque une avancée significative en termes de performances dans les benchmarks. Le modèle, disponible dans la version payante de ChatGPT, atteint désormais un taux de réussite de 78 % sur les problèmes mathématiques compétitifs de l’AIME 2024, et atteint le 89e percentile sur les défis de programmation Codeforces.
Dans la foulée, l’entreprise dévoile ChatGPT Proune nouvelle offre mensuelle de 200 $ destinée aux professionnels et chercheurs ayant besoin d’une puissance de calcul accrue. L’abonnement donne accès à l’ensemble de l’écosystème OpenAI (o1, o1-mini, GPT-4o, Advanced Voice) et introduit le « mode pro » d’o1, une version optimisée mobilisant davantage de ressources informatiques pour les tâches les plus complexes.