Bientôt, vous pourrez découvrir la fonctionnalité de caméra en direct sur ChatGPT. Voici tout ce que nous savons sur cette nouvelle version très attendue.
Tl;dr
- OpenAI prépare le déploiement de son IA visuelle.
- La fonctionnalité « Live Camera » serait intégrée à ChatGPT.
- Nous attendons des nouvelles de l’avancée du projet.
OpenAI : technologie de reconnaissance visuelle en phase de test
Six mois se sont écoulés depuis la première démonstration de l’IA visuelle par OpenAI. Il est capable d’identifier presque tout, y compris de résoudre des équations mathématiques. Aujourd’hui, nous nous rapprochons enfin de la possibilité de mettre en ligne.
ChatGPT gagne de nouvelles fonctionnalités
Des références aux fonctionnalités vidéo « Live Camera » ont été repérées dans le code de la dernière version bêta de ChatGPT. Ce qui signifie que l’application OpenAI pourrait ajouter des « yeux » à son mode vocal avancé déjà impressionnant. Les informations trouvées dans le code de la version 1.2024.317 révèlent des fonctionnalités telles que « fonctionnalité de caméra en direct », « traitement en temps réel », « intégration du mode vocal » et « capacités de reconnaissance visuelle ».
De nouvelles perspectives avec la « Live Camera »
Cela pourrait vous permettre d’ouvrir la webcam pendant que vous parlez en mode vocal avancé, afin qu’elle puisse donner un retour en direct sur ce qu’elle peut voir devant vous. C’est similaire au projet Astra de Google avec des analyses visuelles en temps réel. Les fonctionnalités trouvées dans la version bêta de l’application Android ChatGPT suggèrent que la fonctionnalité Live Camera pourrait arriver dans une version bêta de ChatGPT dans un avenir proche.
Des manifestations prometteuses
Lors des démonstrations de mai lors de la mise à jour de printemps d’OpenAI, des fonctionnalités vidéo ont pu reconnaître un chien, ses actions avec une balle et bien plus encore, tout en mémorisant des informations clés comme le nom du chien. Une autre démo montrait quelqu’un utilisant la fonction « Live Camera » de ChatGPT lors d’une visite de Londres, pour lui permettre d’indiquer les détails de différents lieux et points de repère.
Bien que le déploiement vocal avancé soit désormais accessible à tous, y compris sur le Web, les choses sont restées calmes concernant la fonctionnalité « Live Camera » depuis l’annonce. Mais nous restons optimiste et nous avons hâte de voir les prochains développements de cette technologie prometteuse.