• Home
  • Chimie
  • Astronomie
  • Énergie
  • La nature
  • Biologie
  • Physique
  • Électronique
  • Une classe dans toutes les langues

    Les progrès des technologies de la communication ont eu un impact majeur dans toutes sortes d'industries, mais peut-être pas plus grand que dans l'éducation. Maintenant, n'importe qui dans le monde peut écouter en direct une conférence d'un lauréat du prix Nobel ou gagner des crédits dans les universités les plus réputées via un accès Internet. Cependant, les informations que l'on peut obtenir en regardant et en écoutant en ligne sont perdues si le public ne comprend pas la langue du conférencier. Pour résoudre ce problème, scientifiques de l'Institut des sciences et technologies de Nara (NAIST), Japon, a présenté une solution avec un nouvel apprentissage automatique lors de la 240e réunion du Groupe d'intérêt spécial sur le traitement automatique du langage naturel, Société de traitement de l'information du Japon (IPSJ SIG-NL).

    Les systèmes de traduction automatique ont rendu remarquablement simple la demande d'itinéraire dans un pays étranger. Parfois, les systèmes peuvent faire des erreurs amusantes et innocentes, mais globalement, ils parviennent à une communication cohérente, au moins pour les échanges courts seulement une phrase ou deux longues. Dans le cas d'une présentation pouvant dépasser une heure, comme une conférence universitaire, ils sont beaucoup moins robustes.

    « NAIST compte 20 % d'étudiants étrangers et, alors que le nombre de cours d'anglais augmente, les options de ces étudiants sont limitées par leur capacité de japonais, " explique le professeur NAIST Satoshi Nakamura, qui a dirigé l'étude.

    Le groupe de recherche de Nakamura a acquis 46,5 heures de vidéos de conférences archivées de NAIST avec leurs transcriptions et traductions en anglais, et a développé un système basé sur l'apprentissage en profondeur pour transcrire le discours de conférence japonais et le traduire ensuite en anglais. En regardant les vidéos, les utilisateurs voient des sous-titres en japonais et en anglais qui correspondent au discours du conférencier.

    On pourrait s'attendre à ce que le résultat idéal soit des traductions simultanées qui pourraient être réalisées avec des présentations en direct. Cependant, les traductions en direct limitent le temps de traitement et donc la précision. "Parce que nous mettons des vidéos sous-titrées dans les archives, nous avons trouvé de meilleures traductions en créant des sous-titres avec un temps de traitement plus long, " il dit.

    Les images d'archives utilisées pour l'évaluation consistaient en des cours de robotique, traitement de la parole et génie logiciel. De façon intéressante, le taux d'erreur de mots dans la reconnaissance vocale était corrélé à la disfluence dans le discours des conférenciers. Un autre facteur des différents taux d'erreur était le temps de parole sans pause. Le corpus utilisé pour la formation était encore insuffisant et devrait être davantage développé pour de nouvelles améliorations.

    "Le Japon veut augmenter le nombre d'étudiants internationaux et NAIST a une excellente occasion d'être un leader dans cette entreprise. Notre projet n'améliorera pas seulement la traduction automatique, il apportera également des esprits brillants au pays, " il a continué.


    © Science https://fr.scienceaq.com