L'apprentissage automatique utilisant l'intelligence artificielle a amélioré la traduction informatique au cours de la dernière décennie, mais les articles scientifiques utilisant un jargon spécialisé restent un défi pour la traduction automatique. Néanmoins, les scientifiques devraient donner la priorité à la traduction d'articles dans plusieurs langues afin de fournir un paysage équitable aux scientifiques en herbe du monde entier, affirment les chercheurs de l'UC Berkeley. Crédit :Valeria Ramírez-Castañeda, UC Berkeley
Alors qu'il était encore au lycée, Xinyi Liu a travaillé brièvement dans un laboratoire de l'Université Beihang à Pékin et a été surpris de voir des chercheurs chinois utiliser régulièrement Google Traduction pour générer le premier brouillon d'articles scientifiques en anglais. La traduction est indispensable si les scientifiques veulent soumettre des articles à des revues de haut niveau, presque toutes en anglais.
"Il était normal que les post-doctorants utilisent simplement Google Traduction pour d'abord tout traduire, puis pour le modifier et le peaufiner. Mais après la première traduction, tout l'article n'avait plus de sens", a déclaré Liu, un jeune étudiant à l'Université de Californie. , Berkeley, qui se spécialise en biologie moléculaire et cellulaire. "Littéralement, tous les mots, tous les termes ont été collés ensemble juste au hasard."
Il devait y avoir un meilleur moyen, pensa-t-elle.
Alors l'année dernière, lorsqu'elle a vu un nouveau séminaire donné par Rebecca Tarvin sur l'élimination des barrières linguistiques en sciences, elle s'est inscrite.
Cette classe, qui sera enseignée à l'UC Berkeley pour la troisième fois au printemps 2023, était un ballon d'essai pour Tarvin, professeur adjoint de biologie intégrative. Avec un intérêt renouvelé à l'échelle du campus pour la diversité, l'équité et l'inclusion, elle et des groupes de travail au sein de son département ont pensé que la classe pourrait aider l'UC Berkeley à résoudre un problème scientifique de longue date :l'anglais, la langue dominante de la science, est un obstacle majeur à scientifiques dont la langue maternelle n'est pas l'anglais.
Les étudiants et les scientifiques étrangers ne sont pas les seuls à être désavantagés lorsque la science est communiquée principalement en anglais. Il en va de même pour de nombreux étudiants nés aux États-Unis. À l'automne 2020, environ 40% des étudiants de première année à l'UC Berkeley étaient des étudiants de première génération, et dans le système à 10 campus de l'Université de Californie, 39% des étudiants de première génération ont grandi avec une langue autre que l'anglais comme première langue.
"Beaucoup de nos étudiants de Californie ont grandi en traduisant pour leurs parents", a déclaré Tarvin. "La traduction fait partie de leur vie depuis leur plus jeune âge."
Pour Tarvin, le cours - Breaking Language Barriers in Evolution and Ecology - était une "opportunité à la fois d'enseigner aux étudiants des compétences en littératie en traduction et d'encourager les étudiants à être des activistes dans ce domaine de changement structurel. Et en fait, j'ai vu un réception très positive de ce type d'activisme de la part des étudiants, car ils semblent tous convenir qu'il est très important de surmonter les barrières linguistiques après avoir suivi le cours."
La classe a conduit Tarvin et certains étudiants diplômés de l'UC Berkeley, ainsi que des collaborateurs au Canada, en Israël et en Hongrie, à rédiger un article scientifique évaluant de nouveaux outils de traduction automatique pouvant être utilisés par des personnes du monde entier pour rendre leurs articles scientifiques accessibles aux non-anglophones. . L'article est paru en ligne ce mois-ci dans la revue BioScience . Les traductions en espagnol, français, portugais et hongrois, les langues des co-auteurs, sont également en ligne.
"L'idée ici est que nous essayons de donner aux gens les outils et la motivation nécessaires pour traduire leurs propres recherches scientifiques", a déclaré Tarvin. "La science n'a pas besoin d'être basée sur une seule langue. Et il y a beaucoup d'avantages supplémentaires qui découlent de l'intégration d'approches multilingues dans chaque phase de la science. Par exemple, publier dans plusieurs langues profitera à la société en raison d'une meilleure communication scientifique."
"La langue peut être un obstacle, ainsi qu'un outil fantastique, pour rassembler les gens", a souligné Emma Steigerwald, qui est la première auteure de l'article et une étudiante diplômée de l'UC Berkeley en sciences, politiques et gestion de l'environnement. "C'est un obstacle que nous pouvons surmonter en utilisant cette nouvelle technologie. Nous expliquons la technologie et comment elle peut être mise en œuvre et les choses dont nous devons être conscients lorsque nous utilisons la technologie, et toutes les façons merveilleuses et positives que la communication scientifique peut être transformé en utilisant cette nouvelle technologie."
Vers un réseau scientifique multilingue
Jusqu'à récemment, la traduction informatique était la cible de blagues. Les gens ont partagé des exemples amusants d'erreurs de traduction, semblant souvent dénigrer des langues autres que l'anglais et, par implication, d'autres cultures.
Mais l'apprentissage automatique, ou intelligence artificielle, a considérablement amélioré la précision des traductions dans la mesure où les touristes utilisent des services Internet tels que Google Traduction pour communiquer avec les habitants des pays qu'ils visitent.
Mais pour les textes qui contiennent beaucoup de jargon (en grande partie scientifique, mais également dans de nombreux autres domaines universitaires), Google Traduction est terriblement inadéquat.
"La qualité de la traduction n'est pas pour une revue", a déclaré Ixchel Gonzalez Ramirez, l'un des mentors des étudiants diplômés pour le cours. "Souvent, les gens doivent payer pour faire traduire leur travail par un traducteur professionnel, et cela coûte très cher."
Le nouvel article met en lumière certains des nombreux services, pour la plupart gratuits, qui peuvent convertir l'écriture scientifique anglaise dans d'autres langues. Outre la plate-forme Google Translate bien connue, il s'agit notamment de DeepL, qui utilise des réseaux de neurones et prétend être beaucoup plus précis que ses concurrents lors de la traduction de l'anglais vers le chinois, le japonais, les langues romanes ou l'allemand, et vice versa ; Baidu Translate, un service de la société Internet chinoise Baidu qui se concentrait initialement sur la traduction entre l'anglais et le chinois; Naver Pagago, un traducteur multilingue créé par une société en Corée du Sud; et Yandex.Translate, qui utilise la traduction automatique statistique et se concentre principalement sur le russe et l'anglais.
"La traduction devient de plus en plus à la portée de n'importe qui. Que vous soyez un expert ou non, et que vous soyez même bilingue ou non, la capacité de traduire est tellement accélérée par tant de technologies dont nous disposons aujourd'hui", dit Steigerwald. "Et alors, comment pouvons-nous intégrer cela dans notre flux de travail en tant que scientifiques, et comment cela change-t-il les attentes qui entourent la communication scientifique ?"
El aprendizaje automatizado que usa tecnologías de inteligencia artificial ha mejorado la traducción en computador en la última década. Sin embargo, los artículos científicos que emplean terminología especializada siendo un reto para la traducción automática. Non obstante, la comunidad científica debería dar prioridad a la traducción de artículos en varios idiomas para ofrecer un panorama equitativo a los científicos y las científicas en formación de todo el mundo, afirman los investigadores de la UC Berkeley. Crédit :Valeria Ramírez-Castañeda, UC Berkeley
L'anglais est la lingua franca de la science
L'intérêt de Tarvin pour la traduction est né de l'une de ses étudiantes diplômées, Valeria Ramírez Castañeda, qui a publié en 2020 un article décrivant les coûts encourus par ses collègues doctorants colombiens qui souhaitaient publier ou interagir avec des collègues dans un monde dominé par l'anglais.
En tant que biologiste de l'évolution intéressée par la façon dont certains animaux en sont venus à utiliser du poison, Tarvin a décidé de concentrer son nouveau séminaire sur la traduction d'articles dans les domaines de l'évolution et de l'écologie, bien que les étudiants qui se sont inscrits aient finalement tracé leurs propres cours. Elle a particulièrement recherché des étudiants, comme Liu, et des mentors, comme Gonzalez Ramirez, qui sont bilingues ou multilingues.
"Tout le monde dans la classe a eu une sorte de relation familiale avec la langue", a déclaré Tarvin.
Tarvin a également demandé à Mairi-Louise McLaughlin, professeur de français et de linguistique à l'UC Berkeley et experte en traduction journalistique et littéraire, de parler à la classe de la façon dont les professionnels abordent la traduction et comment la traduction affecte le sens. Ce sujet a touché les étudiants lorsqu'ils se sont essayés à la traduction de résumés scientifiques et parfois d'articles entiers.
Ruoming Cui, un étudiant en deuxième année qui a suivi le cours au printemps 2022, a choisi Baidu pour traduire des résumés scientifiques. Elle a immédiatement découvert que les phrases longues et complexes de l'anglais et l'utilisation de plusieurs mots pour décrire un concept semblaient redondantes lorsqu'elles étaient traduites en chinois.
"Nous ne faisons généralement pas cela en chinois car cela rend chaque phrase très longue et c'est très fastidieux", a-t-elle déclaré.
Liu a ajouté que sans un polissage considérable, de nombreuses traductions anglaises sont brouillées, a-t-elle déclaré.
"J'ai entendu dire que même si votre résultat est incroyable, si vous écrivez un article déroutant à cause de la traduction, les gens seront ennuyés parce qu'ils ne peuvent pas comprendre ce que vous faites", a déclaré Liu. "Et cela affectera grandement la façon dont les gens valideront la recherche ou même s'ils la liront. Je pense que c'est un gros obstacle dans le monde scientifique."
Steigerwald, Tarvin et leurs co-auteurs ont également réalisé que la rédaction d'articles scientifiques dans un anglais plus simple (ce que les non-scientifiques encouragent depuis longtemps) profite aussi bien aux anglophones qu'aux non-anglophones.
"Si votre langue maternelle n'est pas l'anglais et que vous essayez simplement de lire la version anglaise de l'article, cela semblera beaucoup moins ambigu et beaucoup plus lisible lorsque l'auteur aura utilisé un langage clair", a déclaré Steigerwald. "Mais aussi, ce qui est très important, lorsque vous allez traduire ce morceau de texte, les outils d'apprentissage automatique auront beaucoup plus de facilité à traduire quelque chose qui est écrit en langage clair. Donc, c'est une sorte de pérennité de votre écriture, donc que si quelqu'un veut le traduire dans un million de langues, il lui sera beaucoup plus facile de le faire s'il est écrit de cette façon."
Il reste des obstacles à la traduction généralisée des articles scientifiques, y compris où les rendre disponibles et comment gérer les droits d'auteur. La plupart des revues n'acceptent même pas les articles qui ne sont pas en anglais, et peu autorisent explicitement la copublication d'articles avec une traduction. Tarvin a constaté que peu de revues ont des politiques sur les traductions, et en raison des restrictions générales du droit d'auteur, de nombreux éditeurs facturent des frais exorbitants pour publier une traduction en ligne après la publication.
"Il est assez étonnant de voir combien de revues ne vous permettent pas de publier librement des traductions après publication, et combien peu ont un support de plate-forme où vous pourriez avoir même juste un résumé dans une deuxième ou troisième langue", a déclaré Tarvin. "Je pense qu'un obstacle majeur à cela réside dans les plates-formes Web ; pas seulement les règles de publication et de droit d'auteur, mais également la fonctionnalité de la plate-forme."
Avec le séminaire Breaking Barriers et maintenant le BioScience papier, Tarvin et ses collègues espèrent changer progressivement la norme en science pour traduire par défaut les articles dans d'autres langues, en particulier la langue du pays où la recherche a été effectuée et les langues des co-auteurs.
Et plus il y a de traductions, plus il y a de matériel pour entraîner les systèmes de traduction automatique à faire un meilleur travail, augmentant progressivement la qualité de la traduction scientifique.
"Dans mon laboratoire, nous traduisons une grande partie de nos recherches, et maintenant, les gens du laboratoire d'Emma le font aussi", a-t-elle déclaré. "Je pense que le fait de partager notre attitude positive à cet égard et la façon dont cela peut faire une différence pour les gens a influencé un groupe restreint, mais croissant, de personnes qui commencent à intégrer la traduction dans leur flux de travail scientifique."
Co-auteurs supplémentaires de la BioScience l'article comprend les doctorantes Valeria Ramírez-Castañeda et Débora Brandt de l'UC Berkeley; András Báldi de l'Institut d'écologie et de botanique du Centre de recherche écologique de Vácrátót, Hongrie; la boursière postdoctorale Julie Teresa Shapiro de l'Université Ben Gourion du Néguev à Be'er Sheva, Israël; et Lynne Bowker, professeur de traduction et d'interprétation à l'Université d'Ottawa au Canada. Facebook dévoile un traducteur d'apprentissage automatique pour 100 langues