Google Translate parlera le breton, l’occitan et plus de 100 autres nouvelles langues

Google Translate parlera le breton, l’occitan et plus de 100 autres nouvelles langues
Google Translate parlera le breton, l’occitan et plus de 100 autres nouvelles langues

Le célèbre outil de traduction, qui propose déjà 133 langues, va en ajouter 110, dont les langues régionales.

Un polyglotte extraordinaire. Google Translate a ajouté 110 langues à son répertoire ce jeudi, à l’occasion de sa plus grande “super ajout jamais réalisé”. dont le breton et l’occitan. « Ces nouvelles langues représentent plus de 614 millions de locuteurs, ouvrant la voie à des traductions pour environ 8 % de la population mondiale »se félicite le géant américain de la Tech.

Parmi les options ajoutées figurent les langues régionales, dont le breton et l’occitan. Le cantonais, le tamazight, le romani, le wolof, le panjabi et le q’eqchi’ sont également intégrés. « Certaines sont des langues majeures dans le monde, avec plus de 100 millions de locuteurs. D’autres sont parlés par de petites communautés autochtones, et quelques-uns n’ont presque aucun locuteur natif mais font des efforts de revitalisation.a déclaré la société dans un article de blog. Des langues telles que le pendjabi, la langue la plus parlée au Pakistan, et l’afar, une langue parlée à Djibouti, en Érythrée et en Éthiopie, sont disponibles.

« Le projet a duré quatre ans » raconte à nos confrères de Ouest France Isaac Caswell, ingénieur logiciel pour Google Translate. « Cette mise à jour est la plus importante de l’histoire de Google Translate et s’étend à de nombreuses autres langues non nationales et langues marginalisées. Elle inclut également plus de langues créoles que jamais auparavant, notamment le créole seychellois dérivé du français et le créole mauricien.

De nouvelles langues ont été choisies « sur la base d’une combinaison des demandes reçues, du nombre d’intervenants et de la quantité de données disponibles pour les modèles de formation » dit Isaac Caswell. Catalysé par le modèle linguistique PaLM2, base de son IA générative Gemini, Google a utilisé l’intelligence artificielle pour entraîner son outil de traduction. « Nous avons consulté des linguistes, des experts, des traducteurs et des locuteurs natifs. Ils ont évalué la qualité du modèle et fourni des traductions. »ajoute l’expert.

Revendications et initiatives bretonnes

En février dernier, un collectif breton militait pour l’intégration du dialecte breton dans Google Translate. Une étape «essentiel pour que le Breton et la Bretagne comptent dans le monde» a expliqué David Lesvenan, président du fonds de dotation numérique Bretagne. L’Office public de la langue bretonne avait également mis en place un dictionnaire historique et une base de données toponymiques. Ces outils visent à imposer la langue bretonne dans la sphère numérique avec plus de 60 000 mots traduits.

Lire aussiPublicité : Google visé par une procédure judiciaire d’un montant de 13,6 milliards de livres au Royaume-Uni

Après avoir ajouté 24 nouvelles langues en 2022 avec la technologie Zero-shot, qui permet à un modèle d’apprentissage de traduire une langue sans s’appuyer sur des exemples et donc de mieux personnaliser le rendu, Google a lancé un plan, baptisé l’initiative des mille langues. Objectif : « créer des modèles d’IA qui prendront en charge les 1000 langues les plus parlées au monde ».

 
For Latest Updates Follow us on Google News
 

PREV Notre test de jeu ultraportable avec l’Asus Rog Zephyrus G14
NEXT Le breton et l’occitan enfin à l’honneur