• Home
  • Chimie
  • Astronomie
  • Énergie
  • La nature
  • Biologie
  • Physique
  • Électronique
  •  Science >> Science >  >> Autres
    Un chercheur utilise l’apprentissage automatique pour numériser des textes anciens de la civilisation de l’Indus
    Une série de sceaux de l'Indus d'Iravatham Mahadevan, un érudit et auteur qui étudie l'écriture de l'Indus depuis des décennies. Crédit :Institut de technologie de Floride

    La civilisation de la vallée de l’Indus est considérée comme l’une des trois premières civilisations de l’histoire du monde, avec la Mésopotamie et l’Égypte. Plus grande géographiquement que ces deux-là, telle qu'elle s'est développée à partir de 3300 avant notre ère dans ce qui est aujourd'hui le Pakistan et l'Inde, la civilisation de l'Indus se vantait de poids et de mesures uniformes, d'artisans qualifiés, d'un système d'échanges et de commerce aux multiples facettes et de plus de 500 symboles et signes de communication.



    Mais une question contrarie les chercheurs depuis des décennies et a entravé les tentatives d’en apprendre davantage sur cette civilisation :ces caractères étaient-ils un langage ou s’apparentaient-ils davantage à des pictogrammes ? Même si certains experts commencent à traduire l'écriture de droite à gauche trouvée dans les inscriptions de l'Indus, il n'y a guère d'accord.

    "C'est une controverse qui n'est pas encore réglée", a déclaré Debasis Mitra, professeur d'informatique désormais connecté à cette quête grâce à une subvention inédite qui lui a été accordée par le National Endowment for the Humanities :"La numérisation et l'archivage des écritures anciennes ( ASDA) des artefacts de la vallée de l'Indus utilisant le Deep Learning."

    Deva Atturu, étudiant diplômé et assistant, qui défendra sa thèse de maîtrise en avril, aide Mitra à mener la recherche financée par la subvention. Ce mois-ci, lui et Mitra ont assisté virtuellement à la Conférence d'archéologie sud-asiatique 2024 de l'Université de Chicago, où Atturu a présenté son travail.

    Les écrits qu'ils étudient peuvent être une série de symboles comme l'équivalent de signes de dollars et d'images de transactions commerciales, ou ces symboles peuvent être des graphèmes, des lettres individuelles ou des groupes de lettres qui représentent les sons de la parole.

    "Les deux parties ont des arguments très solides", a déclaré Mitra.

    Il ne cherche pas à résoudre le débat mais à responsabiliser ceux qui le feront en développant un algorithme d'apprentissage automatique permettant d'identifier et de numériser l'écriture ancienne de la civilisation de l'Indus. Il existe un manque de données numérisées auquel Mitra espère remédier.

    Le processus utilise un système de reconnaissance automatisée d'écritures (ASR) pour extraire des séquences codées de graphèmes à partir d'un ensemble de données de plus de 1 000 photographies de phoques de l'Indus. Grâce à des réseaux de neurones artificiels à deux étages, l'ASR a atteint 88 % de réussite dans la détection des graphèmes.

    Pourtant, le processus a été difficile. L’apprentissage automatique est souvent renforcé par la saisie d’énormes quantités de données pour entraîner le système. Toutefois, dans ce cas, il n’y a pas beaucoup de données à saisir. Et les données disponibles peuvent parfois être « bruyantes » ou déformées.

    "Je travaille sur l'imagerie médicale et certains des défis sont similaires", a déclaré Mitra.

    Mitra applique différents éléments d'apprentissage automatique au projet pour essayer de générer de nouvelles données ou voir si une autre approche pourrait mieux fonctionner. Et il se retrouve également à des conférences qui ne sont généralement pas prévues pour les informaticiens, comme la conférence annuelle de l'Asie du Sud de l'année dernière organisée par l'Université du Wisconsin à Milwaukee, où il a présenté ce projet d'apprentissage automatique.

    Leur participation le maintient en contact avec des archéologues qui peuvent lui fournir davantage de données. "Je vais à ces conférences et j'essaie de leur parler", a-t-il déclaré.

    Il fait également appel à des étudiants de l’Institut indien de statistique de son Inde natale. Ensemble, ils progressent. Ils peuvent numériser certains motifs et graphèmes et, selon la quantité de données, même créer un script. Faire cela et l'introduire dans une base de données est l'objectif de la subvention initiale.

    La prochaine phase ? Créez un système qui permet aux archéologues sur le terrain de prendre une photo sur smartphone d'un texte ou de symboles et de l'acheminer vers la base de données pour numérisation.

    Le fait que ces efforts visent à éclairer et à mieux comprendre l'une des grandes civilisations de l'histoire de son pays est une motivation supplémentaire pour Mitra.

    "Cela fait partie de mon histoire, donc il y a une motivation supplémentaire pour cela. Et évidemment, je vois que les étudiants indiens sont très intéressés pour la même raison", a-t-il déclaré. "Mais l'une des premières percées a été réalisée par quelques étudiants américains qui s'intéressaient beaucoup à l'Inde, et certains d'entre eux ont déclaré avoir visité l'Inde par la suite."

    Fourni par le Florida Institute of Technology




    © Science https://fr.scienceaq.com