Les intelligences artificielles (IA) sont aujourd’hui capables de « s‘exprimer » dans les principales langues du monde. Mais il leur reste des progrès à faire quand il s’agit du breton – sans même parler du gallo. Et c’est un vrai problème.
Les IA font désormais partie de notre quotidien. Elles mettent en forme nos notes, génèrent des sous-titres et créent des sites Internet ex nihilo. Les entreprises s’en emparent pour rester compétitives. Dans cette révolution, les plus avantagés sont logiquement ceux dont la langue est facilement comprise par les IA. Et pour que ce soit le cas, il faut que des textes écrits dans cette langue soient massivement présents en ligne. Les locuteurs d’une langue minoritaire sont condamnés à rater le train – ou à changer de vocabulaire.
Circonstance aggravante
Un exemple ? Il n’existe pas de reconnaissance vocale des SMS en breton. Donc « les brittophones habitués à échanger entre eux en breton passent massivement au français chaque fois qu’ils peuvent échanger en SMS dictables. Circonstance aggravante, cela touche en premier les plus jeunes générations », alerte Mélanie Jouitteau, chercheuse bretonne au CNRS.
Une solution consisterait à nourrir les IA avec un maximum de documents en breton. Malheureusement, on manque encore d’outils permettant de transformer les textes scannés en données lisibles par la machine.
L’IA remplace le corbeau par une belette jaune
ChatGPT, célèbre IA génératrice de textes, se targue pourtant d’être capable de s’exprimer dans la langue d’Anjela Duval. Si on lui demande de traduire une certaine fable de La Fontaine, le résultat est compréhensible… Jusqu’à ce qu’on s’aperçoive que le corbeau et son fromage sont remplacés par une « belette jaune ». Peut-être car cet animal est souvent associé au renard dans les chansons ? En gallo, c’est encore pire : l’IA invente des mots qui relèvent plutôt de l’argot de Paris.
La Région est consciente de ce fossé grandissant. En décembre, le Conseil économique, social et environnemental régional (Ceser) a rendu un avis reconnaissant comme « indispensable que la langue bretonne puisse bénéficier des progrès de l’intelligence artificielle » notamment pour « produire et diffuser des applications originales spécialement destinées à la langue bretonne ».
Ce n’est pas le seul domaine dans lequel la machine doit s’améliorer pour prendre en compte les spécificités régionales. Les IA génératrices d’images souffrent des biais de leurs créateurs – majoritairement américains. Elles produisent de somptueuses photos de hamburgers mais, lorsqu’on leur demande une galette-saucisse, elles dessinent une pizza. Elles ignorent à quoi ressemblent les costumes traditionnels, les créatures folkloriques et même le fest-noz, pourtant reconnu par l’Unesco. On a demandé à une IA grand public de fabriquer la photo d’un « robot brandissant le drapeau breton ». Le résultat, qui illustre cet article, montre le chemin qu’il lui reste à parcourir.
Cet article, qui traite du thème « Ille-et-Vilaine numérique », vous est délibérément offert par web-ille-et-vilaine.com. La raison d’être de web-ille-et-vilaine.com est de parler de Ille-et-Vilaine numérique dans la transparence la plus générale en vous procurant la visibilité de tout ce qui est publié sur ce sujet sur le web La chronique a été générée de la manière la plus honnête que possible. S’il advenait que vous projetez d’apporter quelques notes concernant le domaine de « Ille-et-Vilaine numérique » vous avez la possibilité de d’échanger avec notre rédaction. Dans peu de temps, on mettra en ligne d’autres informations pertinentes autour du sujet « Ille-et-Vilaine numérique ». Ainsi, consultez régulièrement notre site.