Le créateur de chat GPT OpenAI a annoncé mardi qu’il retardait d’un mois le lancement de sa fonctionnalité « Mode vocal », qui sera lancée en juillet, en raison de problèmes techniques.
La société avait initialement prévu de proposer cette expérience de chat vocal réaliste à un petit groupe d’utilisateurs de ChatGPT Plus fin juin, mais a déclaré qu’elle la reportait car elle avait besoin de temps pour atteindre son niveau de lancement.
« Par exemple, nous améliorons la capacité du modèle à détecter et rejeter certains contenus. Nous travaillons également à améliorer l’expérience utilisateur et à préparer notre infrastructure à s’adapter à des millions d’utilisateurs tout en maintenant des réponses en temps réel », a déclaré OpenAI dans un article sur la plateforme de médias sociaux X.
La fonctionnalité sera d’abord proposée à un petit groupe d’utilisateurs pour recueillir des commentaires, puis sera mise à la disposition de tous les utilisateurs Plus à l’automne, sous réserve de contrôles de sécurité et de fiabilité, a indiqué la société.
OpenAI travaille également au déploiement de nouvelles fonctionnalités de vidéo et de partage d’écran.
En mai, il a annoncé le lancement d’un nouveau modèle d’IA appelé GPT-4o, capable de conversations vocales réalistes et d’interagir avec du texte et des images, sa dernière initiative pour rester en tête dans la course à la domination des technologies d’IA émergentes.
Les nouvelles capacités audio permettront aux utilisateurs de parler à ChatGPT et d’obtenir des réponses en temps réel sans délai, ainsi que d’interrompre ChatGPT pendant qu’il parle – deux caractéristiques des conversations réalistes que les assistants vocaux IA ont trouvé difficiles. (Reportage de Juby Babu au Mexique ; édité par Pooja Desai)