Ydych chi'n siarad Cymraeg ? Crédit :Golden Sikorka/Shutterstock
Les technologies pionnières pour la maison intelligente et les assistants vocaux ne le font pas, comme règle, parler gallois - bien que le gouvernement gallois vise maintenant à changer cela grâce à son plan d'action pour la technologie de la langue galloise. Mais leur objectif est-il réalisable, Est-ce nécessaire, et comment faire ?
Les outils vocaux d'IA (comme les Pixelbuds de Google) dépendent fortement de l'utilisation de grands ensembles de données pour apprendre une langue, sa prononciation, grammaire et sémantique. La capacité ou la qualité des outils résultants est principalement limitée par la quantité de données disponibles (et leur « qualité »). Cela signifie que, en théorie du moins, les outils d'une langue minoritaire comme le gallois ne peuvent pas devenir aussi performants que ceux d'une langue dominante.
Les langues avec des quantités limitées de bonnes données de formation disponibles sont appelées langues « à faibles ressources ». Par rapport à l'anglais, Les ressources galloises sont rares, mais il y a plusieurs milliers de langues avec moins de locuteurs, et très probablement des ressources beaucoup plus pauvres, que le gallois.
Heureusement, de bonnes recherches sont en cours sur une technique d'apprentissage automatique appelée « apprentissage par transfert ». Cela permet aux systèmes d'apprendre en utilisant un ensemble de données et d'appliquer ensuite ces connaissances à un autre. En Chine, il est utilisé pour la reconnaissance automatique de la parole (ASR) du tibétain, qui n'a pratiquement pas de données disponibles pour la formation. Le système ASR a appris le chinois - qui est linguistiquement très différent du tibétain - et a ensuite été recyclé ou affiné pour "comprendre" le tibétain. Il y a en fait beaucoup de points communs entre de nombreuses langues – mots partagés ou empruntés et modèles de prononciation – qui aident ce type de technique.
Recyclage de l'IA en gallois
Il n'y a donc aucune raison pour que les systèmes d'IA ne puissent pas être produits pour converser en gallois ou dans d'autres langues minoritaires. Mais y a-t-il une raison pour laquelle cela devrait ? Toute la technologie vocale, les maisons intelligentes et les systèmes d'interaction vocale utilisés aujourd'hui sont les produits de la recherche commerciale. Pour le dire franchement, ils existent soit pour gagner de l'argent à partir de vos données, pour vous vendre plus de biens et services, ou pour influencer votre réflexion. Aucune de ces IA n'existe pour le bien public.
Créer un système qui fonctionne bien avec le gallois n'est peut-être pas aussi facile que de tout concevoir en anglais. Avec la technologie actuelle, des experts en IA vocale seront nécessaires (et nous sommes chers). Il y aura un besoin de matériel de formation et de test en gallois, et les testeurs gallois doivent être impliqués. Les dangers de ne pas impliquer les locuteurs gallois dans le processus de traduction ont été amplement démontrés dans le passé, quand une réponse par e-mail d'absence du bureau s'est retrouvée sur un panneau de signalisation
Sauf s'il existe un argument économique suffisamment solide, ne vous attendez pas à ce que les grandes entreprises se précipitent pour produire du gallois, Systèmes vocaux gaélique ou cornique. Même le géant de la technologie Samsung n'a pas encore réussi à produire une version anglophone britannique de son assistant Bixby (les anglophones internationaux doivent lui parler avec de faux accents américains pour que cela fonctionne). Même la version en anglais américain a été retardée en raison d'un manque de ressources.
Et tant que les locuteurs gallois sont heureux d'utiliser les systèmes d'IA en anglais, il n'y a peut-être pas d'argument économique - à moins que le gouvernement gallois décide de payer pour que cela se produise, ce qu'elle n'a pas encore fait (le plan d'action est un "engagement" à ce stade).
L'IA à la rescousse
La technologie progresse et des techniques telles que l'apprentissage par transfert deviennent de plus en plus performantes chaque jour. Cela a permis d'actualiser les recherches antérieures sur l'adaptation linguistique et de les étendre au développement de techniques d'apprentissage en profondeur multilingues. Pendant ce temps, l'utilisation croissante d'autres types de technologies numériques par les locuteurs gallois a amélioré la collecte de ressources dans la langue, tout comme la télévision et la radio galloises. Ces avancées signifient que le coût de la localisation des systèmes pour le gallois (et d'autres langues minoritaires) diminue.
La recherche sur les algorithmes d'apprentissage de type cérébral pourrait bien détenir la clé ici. Il s'agit d'une technologie qui peut continuellement apprendre pendant l'utilisation, tout comme les humains apprennent à parler une nouvelle langue. Il est différent de la plupart des systèmes d'IA actuels qui sont formés en laboratoire, avant d'être lâché dans la nature - à quelques exceptions près certains, comme Tay de Microsoft, remarquables par leurs échecs spectaculaires. Les futurs systèmes pourront progressivement acquérir des compétences dans une seconde langue simplement en faisant en sorte que les utilisateurs introduisent progressivement de plus en plus cette langue dans leurs interactions quotidiennes. Plutôt que de financer la recherche sur l'IA du discours gallois, le gouvernement gallois pourrait bien faire mieux en soutenant la recherche sur ce nouveau type de technologie d'apprentissage adaptatif.
Parce que tous les systèmes d'IA de la parole actuels gèrent la parole de manière centralisée (cela ne se fait pas dans l'appareil, mais dans une batterie de serveurs distante), ces systèmes pourraient recueillir des données auprès de centaines d'utilisateurs dans le monde (ou partout au Pays de Galles) pour apprendre rapidement. Ainsi, le message aux locuteurs gallois aujourd'hui est peut-être de ne pas acheter ce Google Home ou Amazon Alexa en anglais si vous voulez que Google ou Amazon produise un système qui fonctionne en gallois. Mais si vous en avez un, au fur et à mesure que son logiciel évolue au cours des prochaines années, essayez de lui parler gallois autant que possible. Cela pourrait vous surprendre, vous et Siaradwch â chi yn Gymraeg.
Cet article est republié à partir de The Conversation sous une licence Creative Commons. Lire l'article original.