110 nouvelles langues dont plusieurs africaines intègrent ‘Google Traduction’

Afriquinfos Editeur 649 Vues
3 Min de Lecture

Accra (© 2024 Afriquinfos)- Depuis le 27 juin 2024, Google a mis à jour son logiciel de traduction en ligne «Google Traduction». Dans cette nouvelle mouture, la technologie intègre 110 nouvelles langues dont 31 qui viennent d’Afrique. A l’instar de l’amazight (berbère), de l’afar, du wolof, du dioula ou encore le baoulé.

Le géant américain Google vient de prendre en compte 200 millions de locuteurs africains avec la mise à jour de son logiciel de traduction «Google Traduction». Ce sont en effet 31 idiomes issus du continent sur les 110 nouvelles langues qui ont été intégrées par la technologie. Désormais, des langues comme le Dioula, le Wolof, le Baoulé, le Berbère sont aisément traductibles via ‘Google Traduction’. Ces langues vont rejoindre la quinzaine de langues africaines déjà prises en compte par le logiciel (Twi, Bambara, Yoruba etc.).

Pour parvenir à ce résultat, les équipes du géant de la Silicon Valley ont, dans un premier temps, identifié toutes les sources écrites disponibles. Elles ont ensuite travaillé avec des linguistes de plusieurs Facultés comme l’Université du Ghana, et des ONG pour emmagasiner des données sur toutes les langues ciblées. Ces éléments ont été employés pour entraîner l’IA de Google, un modèle d’apprentissage baptisé ‘PaLM2’ déjà éprouvé avec près de 400 langues. «L’intelligence artificielle est comme un enfant, résume Abdoulaye Diack, responsable du programme d’IA chez Google à Accra. Plus le modèle reçoit de données, plus il apprend, et meilleur est le résultat», précise-t-il.

Son équipe compte aussi développer un système de reconnaissance et de synthèse vocales pour les langues récemment ajoutées, comme il en existe déjà pour les précédentes, afin qu’un téléphone soit capable de répéter instantanément une phrase française en baoulé. Une option particulièrement utile pour les locuteurs analphabètes. A moyen terme, Google envisage d’intégrer un millier de langues priorisées selon plusieurs critères: le nombre de locuteurs, la faisabilité du projet en fonction de l’abondance de ressources écrites, mais aussi l’appétence de la communauté concernée.

S. B.