Ils aident leur frère à utiliser sa voix grâce à l’IA

Ils aident leur frère à utiliser sa voix grâce à l’IA
Ils aident leur frère à utiliser sa voix grâce à l’IA

Un homme d’Ottawa et son frère ont créé un programmeIA pour aider leur frère atteint de paralysie cérébrale à se connecter au monde.

Sur sa chaîne YouTube, Anand Munje interviewe des entrepreneurs, des universitaires et des artistes. Il communique avec eux malgré une paralysie cérébrale qui l’empêche de parler. Un miracle rendu possible grâce au logiciel développé par ses frères Arun et Amit Munje : Aihearu.

Ce logiciel, qui se prononce je t’entends en français, transforme les paroles d’Anand en texte à l’écran pendant son émission Le monde d’Anand (Le monde d’Anand).

Les frères ont intégré Aihearu dans le système de vidéoconférence Zoom et trois points apparaissent sur l’écran pendant que le logiciel traite la voix d’Anand et l’affiche sous forme de texte.

Anand Munje parle en utilisant l’interface Aihearu intégrée à Zoom.

Photo : capture d’écran Zoom

Parler aux gens avec ma propre voix sans l’aide d’Amit est nouveau pour moi, raconte Anand dans l’épisode où il interrogeait ses frères. Amit servait souvent d’interprète pour Anand.

Pour sa chaîne, Anand prépare et répète ses questions. Cela lui permet d’affiner le vocabulaire utilisé par le logiciel pour interpréter sa voix.

Radio-Canada Nouvelles a rencontré Arun chez lui à Kanata, à l’ouest d’Ottawa, pour une entrevue vidéo avec Anand en Inde.

Contrairement à la manière Radio-Canada mène habituellement ses interviews, Anand a reçu quelques questions environ un jour à l’avance afin qu’il puisse préparer ses réponses de la même manière qu’il le fait pour son émission.

Le meilleur, c’est que l’application peut reconnaître ma voixa-t-il déclaré dans l’une des réponses préparées.

J’espère que l’application pourra être utilisée par des millions de personnes souffrant de troubles de la parole. J’aimerais que d’autres puissent parler de manière indépendante.

Une citation de Anand Munje

Nous avons également essayé le mode ouvert pour répondre à certaines questions qui n’avaient pas été posées à l’avance.

Je suis très nerveuxa avoué Anand via le logiciel en mode ouvert. C’est la première fois que j’utilise le mode ouvert.

Arun, qui travaillait auparavant dans une entreprise de téléconférence et a fondé Aihearu en tant que projet parallèle, a expliqué que le mode ouvert tente de faire correspondre les mots d’Anand avec un ensemble massif de données de mots.

C’est un vocabulaire complètement ouvert. C’est pourquoi il peut y avoir plus d’erreursexplique Arun. Le logiciel ne connaît pas le contexte de ce dont nous parlons.

Le mode ouvert a commis quelques erreurs lors de l’entretien et Arun a dû interpréter une partie de la conversation, signe qu’il y a encore du travail à faire. Par exemple, heures “, “texte”: “il est 22 heures “}}”>il est 22h devenu c’est un poème. Anand avoue qu’il lui est parfois difficile de gérer le vocabulaire du logiciel.

Mais même si les conversations longues et spontanées peuvent poser problème, Anand est capable d’utiliser le logiciel pour des activités quotidiennes comme la gestion des appareils domestiques intelligents.

Selon Arun, l’intelligence artificielle permet de construire et d’affiner plus rapidement le modèle qui reconnaît le discours d’Anand, plutôt que d’avoir à le faire. entrer manuellement ses modèles vocaux dans le programme.

Il explique que la première motivation était d’aider son frère à s’exprimer, mais il espère qu’Aihearu pourra aider d’autres personnes qui ont des troubles de la parole ou même un accent trop fort.

Nous avons demandé à Anand de l’utiliser pour avoir une expérience directe de tous les problèmes et de la manière de les surmonter.dit Arun.

Menez une vie plus épanouie

Selon Claire Daviesprofesseur agrégé à l’Université Reineles personnes souffrant de troubles de la parole ont besoin de plus d’options pour pouvoir s’exprimer individuellement et s’intégrer dans la société.

Plus il y en a, plus nous pouvons permettre à d’autres personnes d’interagir avec des personnes souffrant de troubles de la parole.a réagi Mme. Daviesqui dirige le laboratoire de construction et de conception de technologies d’assistance à l’Université Reine. Cela peut leur permettre d’obtenir un emploi, d’interagir dans des environnements sociaux, de travailler avec des collègues et de mener une vie plus épanouie.

>>>>

Ouvrir en mode plein écran

Claire Davies, professeure agrégée à l’Université Queen’s, affirme que les personnes ayant des troubles de la parole ont besoin de plus d’options pour pouvoir s’exprimer.

Photo : avec l’aimable autorisation de Claire Davies

Selon Mme. Daviesle fait que la technologie soit issue de l’expérience vécue par sa famille et de sa compréhension de la façon dont Anand s’exprime est particulièrement précieux.

Ils savent mieux que quiconque comment interpréter ces informations, permettant ainsi au logiciel d’apprendre plus efficacement ce qui est réellement dit.

Elle a ajouté que leur travail pourrait également bénéficier à d’autres utilisateurs.

En mode ouvert, Anand a pu répondre à une question sur ce qu’il pense du travail acharné de ses frères.

Je suis très reconnaissant et très fier de mes frèresdit-il via l’application.

Arun fut momentanément surpris que le logiciel produise ce résultat.

Je suis moi-même impressionné quand je vois qu’il capture des phrases en mode ouvert, car il n’est alimenté par rien.

Il dit qu’ils testent actuellement le logiciel Aihearu avec une poignée d’autres personnes souffrant de troubles de la parole par l’intermédiaire d’une association caritative, mais que chaque utilisation devait être configurée manuellement.

La prochaine étape serait de le rendre facilement utilisable par quiconque pourrait le télécharger et l’utiliser.

Avec les informations de Matthieu Kupfer de Radio-Canada Nouvelles

 
For Latest Updates Follow us on Google News
 

PREV Plus que quelques jours pour profiter de l’offre unique sur cette télé intelligente Samsung chez Électro Dépôt
NEXT Le pilote Nvidia GeForce Game Ready 555.99 arrive avec la prise en charge de Pax Dei, Still Wakes The Deep et Elden Ring Shadow of the Erdtree