Inscription endommagée :un décret concernant l'Acropole d'Athènes (485/4 avant notre ère). IG I 3 4B. (CC BY-SA 3.0, WikiMédia)
L'apprentissage en profondeur peut aider les chercheurs à restaurer les textes grecs anciens. Spécifiquement, des chercheurs de l'Université d'Oxford (Thea Sommerschield et le professeur Jonathan Prag) et DeepMind (Yannis Assael) ont construit Pythia, entraîner un réseau de neurones pour deviner les mots ou les caractères manquants des inscriptions grecques.
Il s'agissait de surfaces comprenant de la pierre, céramique et métal. Ils avaient entre 1500 et 2600 ans. Nouveau scientifique a rapporté que l'IA a battu des humains pour déchiffrer des tablettes endommagées.
"Dans un test en tête-à-tête, où l'IA a tenté de combler les lacunes dans 2949 inscriptions endommagées, les experts humains ont fait 30 pour cent d'erreurs de plus que l'IA. Alors que les experts ont mis 2 heures pour traiter 50 inscriptions, Pythia a donné ses suppositions pour l'ensemble de la cohorte en quelques secondes."
Commençant, les auteurs savaient que la restauration de texte était une tâche fastidieuse, même pour les épigraphistes experts. Ils se sont attachés à évaluer la difficulté de la tâche de restauration à accomplir – et ainsi à juger de l'impact de notre travail – avec l'aide de deux doctorants ayant une expertise épigraphique. Les chercheurs ont été autorisés à utiliser l'ensemble d'entraînement pour rechercher des « parallèles ».
.
Gege Li a écrit vendredi dans Nouveau scientifique . L'IA semble être meilleure que les humains pour combler les mots manquants, mais ce n'est pas une compétition entre l'équipe A et l'équipe B. Plutôt, la technique de l'IA, dit Li, "peut être plus utile en tant qu'outil collaboratif, où les chercheurs l'utilisent pour affiner les options."
De nombreuses inscriptions anciennes se sont érodées ou endommagées au cours des siècles. Les auteurs ont déclaré que "seule une petite minorité des inscriptions survivantes sont entièrement lisibles et complètes".
Avec des segments de texte perdus, comment essayer de combler les blancs des mots manquants ? Comme Li l'a dit, cela signifierait regarder le reste de l'inscription et regarder d'autres textes similaires.
Envisager Nouveau scientifique rapport sur ce que l'IA, surnommé Pythie, a pu faire :(1) Pythia a appris à reconnaître des modèles dans 35, 000 reliques, avec plus de 3 millions de mots. (2) Les modèles qu'il reprend incluent le contexte dans lequel différents mots apparaissent, la grammaire, ainsi que la forme et la disposition des inscriptions.
L'accomplissement est reflété dans le titre de leur article qui est maintenant sur arXiv :« Restaurer un texte ancien à l'aide de l'apprentissage en profondeur :une étude de cas sur l'épigraphie grecque.
Pour aider l'épigraphiste, La Pythie ne donne pas seulement au savant une seule prédiction. Plutôt, il renvoie plusieurs prédictions ainsi que le niveau de confiance pour chaque résultat.
"Spécifiquement, nous fournissons un ensemble des 20 meilleures prédictions décodées à l'aide de la recherche de faisceau." Avec 20 suggestions pour combler le vide, c'est à la personne de choisir la meilleure. « Tout dépend de la façon dont nous pouvons aider les experts, " dit Assael. Certes, leur position est que la Pythie peut servir de méthode d'assistance en épigraphie numérique.
Encylopaedia Brittanica :L'épigraphie est « l'étude de la matière écrite enregistrée sur un matériau dur ou durable. Les auteurs ont également fourni une définition. Ils ont déclaré que « l'épigraphie est l'étude de documents, 'les inscriptions', écrit sur une surface durable (pierre, céramique, métal) par des particuliers, groupes et institutions du passé.
L'équipe a parlé du potentiel futur de la Pythie, et ils ont souligné que c'est la combinaison de l'apprentissage automatique et de l'épigraphie qui a le potentiel d'avoir un impact significatif sur l'étude des cultures textuelles inscrites.
"Par l'open source PYTHIA, et le pipeline de traitement de PHI-ML, nous espérons aider les recherches futures et inspirer d'autres travaux interdisciplinaires."
Pourquoi leurs recherches sont importantes :Pythie, ils ont écrit, est "le premier modèle de restauration de texte ancien qui récupère les caractères manquants d'une entrée de texte endommagée à l'aide de réseaux de neurones profonds". Les auteurs pensent que la Pythie « établit l'état de l'art en matière de restauration de textes anciens ».
Le site de la Faculté des lettres classiques de l'Université d'Oxford a également commenté les points forts de Pythia. "L'architecture fonctionne à la fois au niveau des caractères et des mots, ainsi traiter efficacement les informations contextuelles à long terme, et traiter efficacement les représentations de mots incomplètes. Cela le rend applicable à toutes les disciplines traitant des textes anciens (philologie, papyrologie, codicologie) et s'applique à toute langue (ancienne ou moderne)."
La Faculté des lettres classiques de l'Université d'Oxford a déclaré qu'un cahier Python en ligne, Pythie, et le pipeline de traitement de PHI-ML ont été open source sur GitHub.
Avec des origines à Londres en 2010, DeepMind, pendant ce temps, est à la pointe de la recherche en intelligence artificielle.
© 2019 Réseau Science X