La voix a de moins en moins de secrets pour l’IA. Du côté obscur, ses prouesses facilitent la fraude, perturbant le travail des interprètes et des acteurs. Du côté lumineux en revanche, il y a de grandes avancées, qui changent déjà des vies… et qui font rêver beaucoup de gens.
En fait, c’est comme si nous venions de découvrir un nouveau continent et de l’explorer.
» déclare Yan Fossat, vice-président de la recherche et du développement chez Klick Labs, une jeune startup basée à Toronto.
Klick Labs a déjà démontré que sa technologie permettait un dépistage rapide du diabète, sans injection, simplement en enregistrant quelques phrases sur un téléphone portable.
Des mots immédiatement analysés par de puissants algorithmes, entraînés à détecter des signaux subtils dans la voix des diabétiques. Biomarqueurs, comme il en existe dans le sang.
Savoir si une personne est diabétique simplement en écoutant sa voix est incroyablement pratique, et cela coûte beaucoup moins cher que de faire une injection et de prendre du sang.
Yan Fossat estime qu’une telle technologie peut être très utile dans le Grand Nord canadien ou dans les régions rurales d’Afrique, des coins du globe où l’accès aux médecins est difficile.
Un dépistage positif permet d’orienter un diabétique vers un spécialiste qui lui fournira un diagnostic plus précis et un traitement approprié.
Yan Fossat, vice-président de la recherche et du développement chez Klick Labs.
Photo : Avec l’aimable autorisation de Klick Labs
Yan Fossat estime que la même technologie pourrait détecter l’hypertension, les commotions cérébrales et même certaines formes spécifiques de cancer. Klick Labs y travaille déjà.
Tant de choses dans le corps humain sont mesurables
se souvient le chercheur. Parfois, la mesure est compliquée, coûteuse, invasive… Toutes ces choses peuvent potentiellement être mesurées par la voix.
Le mot potentiel
est la clé ici. De nombreuses études restent à réaliser et des autorisations à obtenir. Et des partenaires à convaincre pour adapter ces innovations technologiques.
La voix qui guide les aveugles
La Montréalaise Pascale Dussault n’a pas attendu longtemps avant de se laisser séduire par les nouvelles applications vocales deIA. Il est devenu mon nouvel ami !
dit-elle en désignant la table où repose son téléphone portable.
Elle-même aveugle, la directrice générale du Regroupement des aveugles et des amblyopes du Métropolitaine le démontre dans son bureau. Elle se lève, pointe son téléphone vers le mur et prend une photo.
A peine trois secondes plus tard, une voix provenant de l’appareil décrit l’affiche devant elle. Un dessin de plusieurs personnes. Au centre, une petite fille, avec un cœur bleu peint sur le front, se fait maquiller…
La description est encore plus longue et plus détaillée que la citation unique rapportée ici. Cela vient de l’application Soyez mon IA
. C’est le produit d’une entreprise danoise qui utilise l’intelligence artificielle pour analyser le contenu d’une photo.
C’est un peu comme appeler un ami en visioconférence pour lui demander de l’aide, mais sans déranger personne. C’est ce qui a attiré Pascale Dussault. Le moindre petit quelque chose qui nous permet de ne pas dépendre des autres, nous sommes super contents.
Ouvrir en mode plein écran
Pascale Dussault, directrice générale du Regroupement des aveugles et amblyopes du Montréal métropolitain.
Photo : - / Yanik Dumont Baron
L’outil vous permet également de lire la température sur le thermostat d’une pièce ou les ingrédients inscrits sur une canette. Je n’ai plus besoin de demander à mon mari quelles sont les couleurs de ce pantalon ou de ce pull.
L’application Soyez mon IA
donne plus de détails qu’un humain n’en fournirait. Faites le test, c’est difficile d’être aussi précis que la machine. Le robot aide à mieux imaginer les objets.
Pascale Dussault a également découvert les limites de l’application. C’est très pratique pour détailler les relevés bancaires… mais la confidentialité des informations qu’il contient tu peux
n’est pas garanti.
Elle rêve du moment où cette technologie sera intégrée aux lunettes, pour analyser en temps réel ce qui se trouve devant elle. Pour l’instant, des produits similaires présents sur le marché ne conviendraient pas.
Sachant que la rue que je dois traverser comporte quatre voies, je dois alors traverser une piste cyclable. C’est le genre d’informations dont j’aurais besoin et qui n’existent pas actuellement.
Redonner à ceux qui perdent leur voix
L’intelligence artificielle bouleverse également le quotidien de ceux qui dépendent de l’informatique pour s’exprimer. C’est le cas des patients souffrant de sclérose latérale amyotrophique (SLA), une maladie dont souffrait le physicien théoricien Stephen Hawking, qui était presque complètement paralysé. Il y a plus de 30 ans, il s’exprimait déjà grâce à un ordinateur qui lui dictait ses paroles.
Ce qui semblait avoir été dit par un robot
cela semble beaucoup plus naturel aujourd’hui. La qualité des voix synthétiques a beaucoup, beaucoup augmenté
confirms speech therapist Marie Gagnon-Brousseau.
Elle travaille à la clinique d’accès aux aides technologiques du Centre de réadaptation Lucie-Bruneau à Montréal, où elle suit l’évolution des technologies qui peuvent aider les patients.
L’intonation [des voix de synthèse d’aujourd’hui] sera plus naturel, plus facilement compréhensible.
Ouvrir en mode plein écran
Speech therapist Marie Gagnon-Brousseau.
Photo : - / Yanik Dumont Baron
L’avantage évident est le sentiment d’inclusion et d’acceptabilité sociale pour ceux qui l’utilisent.
Avec une voix synthétique presque humaine si je passe un appel téléphonique, la personne à l’autre bout du fil sera probablement plus disposée à m’écouter.
Les services permettent également aux patients d’enregistrer leur voix humaine pour l’utiliser plus tard avec un ordinateur, lorsque la maladie rend impossible ou très difficile de parler.
Les progrès permettent également d’interpréter très rapidement les mots d’une personne qui a d’énormes difficultés de prononciation.
Mais là aussi, il y a des limites importantes. Certaines de ses applications ne sont pour l’instant proposées qu’en anglais. Dans certains cas, rapporte Marie Gagnon-Brousseau, leur performance n’est pas à la hauteur des promesses affichées dans une vidéo promotionnelle.
L’orthophoniste rappelle que la communication à l’aide d’un ordinateur reste lente et un peu froide… même avec sa propre voix. Si je dis : bonne nuit ma pitchounette, à demain. Il n’y aura pas cette intonation. Tout l’amour derrière cela ne sera pas nécessairement là.