Conseils et commentaires d’experts en matière de découverte audio IA.
Voix de synthèse, chatbot conversationnel…, nous avons tous déjà été utilisateurs de solutions technologiques utilisant l’audio et la reconnaissance vocale. Mais une nouvelle dimension s’accélère avec l’IA audio concernant aussi bien les grandes entreprises dans le mode de communication avec leurs salariés, que les médias traditionnels dans l’expérience proposée à leurs lecteurs.
A l’occasion de la dernière Winter Edition organisée par BigBoss nous avons rencontré la société ETX Majelan, une société spécialisée dans l’IA audio qui allie contenu et technologie pour accompagner les entreprises dans leur transformation audio (podcasts/voix de synthèse), à travers la création, l’orchestration et la diffusion de contenu audio intelligent.
Retour sur ce que nous avons découvert dans la révolution de ces usages…
Les entreprises disposent d’un très grand volume de documents écrits
Le constat étant qu’il est relativement difficile d’impliquer tous vos collaborateurs dans la consultation d’une offre de contenus parfois pléthorique, surtout lorsqu’il s’agit de grandes organisations avec des salariés dispersés à travers le pays voire à l’international. En effet, l’enjeu est de pouvoir optimiser l’engagement des personnes en leur proposant des contenus personnalisés à consommer en déplacement en fonction de leurs besoins, de leur profil et en leur apportant une proposition de valeur hybride permettant à la fois un développement personnel et professionnel. .
Dans une période de désengagement, l’IA audio permet de mieux travailler et de gagner en efficacité, en consommant des contenus parlés retranscrits grâce à la voix synthétique et au clonage de voix. Avec un flux interactif, chaque utilisateur bénéficie de l’usage d’une navigation conversationnelle, lui permettant ainsi de s’informer tout en continuant à faire autre chose et surtout sans que cela se traduise par la notion de « patron radio » mais bien par des choix ultra-personnalisés, associés avec un contenu propriétaire produit par ETX Majelan.
Si l’expérience devait se résumer en une phrase Cécilia Gabizon, VP contenu et IA chez ETX Majelan, n’hésiterait pas à dire : « C’est le bon contenu au bon moment ! ».
Preuve par exemple avec 17 minutes de contenus audio consultés en moyenne par jour et par personne, ce qui en fait le premier canal de consultation parmi tous ceux activés par les entreprises.
40% de la presse est mise en audio par ETX Majelan
Il en va de même pour les éditeurs de presse et de contenus écrits qui doivent innover et se transformer grâce aux technologies et à l’IA dans l’expérience de consommation de leurs contenus pour les lecteurs. Que ce soit avec l’application Majelan Pro d’ETX Majelan ou grâce à l’intégration d’un widget au sein du site de l’éditeur, tous les utilisateurs peuvent consulter des articles écrits retranscrits en audio avec synthèse vocale grâce à un lecteur lisant l’article grâce à une voix de synthèse.
L’audio IA est donc véritablement une révolution pour la communication et la consommation de contenus.
Clonage vocal pour une expérience encore plus incarnée et personnalisée
L’enjeu est avant tout éthique dans la construction du modèle juridique du clonage des voix avec notamment un objectif important évoqué par Cécilia Gabizon : « Comment rémunérer les voix clonées ? puisqu’il y a des droits identitaires liés à la voix à valoriser.
La technologie de clonage vocal permet un résultat de haute qualité, permettant des jeux de bouche et une diversité de tonalités à partir d’un même locuteur.
La voix du chef d’entreprise peut par exemple être reproduite pour renforcer le lien et l’incarnation avec les utilisateurs. Deux méthodes : le clonage instantané qui permet d’obtenir des extraits courts tandis qu’un champ plus large avec une vraie granularité nécessite un déplacement en studio avec un ensemble de données de phrases pour recréer toute l’identité de l’empreinte vocale.
Un clone vocal avec IA audio peut également parler dans toutes les langues, ce qui renforce la proximité et les liens avec les individus pour les organisations à l’échelle internationale.
Concernant les médias, il existe une réelle volonté de cloner la voix de leurs journalistes pour s’adresser directement aux lecteurs dans la retranscription audio de leurs articles de presse.
Écouter plus que lire est donc le changement de paradigme de cette révolution technologique !