La révolution vocale de ChatGPT : soyez patients, elle arrive… lentement

La révolution vocale de ChatGPT : soyez patients, elle arrive… lentement
La révolution vocale de ChatGPT : soyez patients, elle arrive… lentement

Pensiez-vous que vous seriez bientôt capable de converser avec ChatGPT comme un humain ? Il faudra attendre encore un peu. OpenAI vient d’annoncer un retard dans ses nouvelles fonctionnalités vocales.

Source : Unsplash

Dans une mise à jour printanière, OpenAI a livré les nouveautés de ChatGPT avec son modèle GPT-4o. Au programme, de nouvelles fonctionnalités linguistiques et un assistant vocal amélioré réservé dans un premier temps aux abonnés.

S’abonner

C’est sur Discord qu’OpenAI dévoile son calendrier de changements. Nous sommes actuellement dans une phase alpha des nouvelles fonctionnalités linguistiques. Elles auraient dû être disponibles fin juin, finalement, il faudra attendre fin juillet.

Pourquoi ce report ? OpenAI avance deux raisons principales. Premièrement, les développeurs travaillent toujours pour garantir que le modèle reconnaît le contenu auquel il ne devrait pas répondre. Il s’agit évidemment d’éviter les dérapages et les réponses inappropriées, un enjeu crucial pour l’IA conversationnelle.

Reste ensuite la question de l’infrastructure. Passer du texte à la voix en temps réel pour des millions d’utilisateurs n’est pas une mince affaire. OpenAI a besoin de temps pour préparer ses serveurs à ce déluge de demandes vocales.

OpenAI ne change pas sa stratégie globale : un déploiement progressif. D’abord un petit groupe d’utilisateurs de ChatGPT Plus fin juin (reporté à fin juillet), puis une extension progressive. L’objectif est que tous les abonnés Plus puissent utiliser la fonction vocale d’ici l’automne.

Un assistant plus humain

Outre ces améliorations linguistiques, OpenAI travaille également sur ses fonctionnalités de partage d’écran et de vidéo. L’assistant peut capturer et analyser le contenu de votre écran ou les enregistrements de votre caméra.

En pratique, Microsoft, qui travaille en partenariat avec OpenAI, a révélé en 2024 comment l’assistant CoPilot basé sur GPT-4o était capable de prodiguer des conseils à un joueur de Minecraft pour construire son build. Avec ces améliorations, ChatGPT devient un interlocuteur de plus en plus humain jusqu’à se rapprocher de son temps de réaction, à savoir 320 millisecondes, là où il lui fallait en moyenne quelques secondes pour calculer une réponse. À cette vitesse, le chatbot pourrait également combiner un ensemble de réactions pour paraître surpris ou sarcastique lors des requêtes.

Pour l’instant, ces annonces et présentations, aussi impressionnantes soient-elles, n’ont été faites que dans le cadre de manifestations. Reste à savoir comment ces fonctionnalités seront utilisées au quotidien et dans quelle mesure elles resteront pertinentes face à des milliers de requêtes simultanées.


Saviez-vous? Google Actualités vous permet de choisir vos médias. Ne manquez pas Frandroid et Numerama.

 
For Latest Updates Follow us on Google News
 

PREV All for Content, le salon à ne pas manquer pour développer votre stratégie de brand content – ​​.
NEXT les changements ne seraient pas seulement intérieurs – .