Les linguistes prédisent les mots inconnus en utilisant la comparaison des langues

Carte indiquant les emplacements géographiques des locuteurs de huit langues kho-bwa occidentales. Crédit :Liste Johann-Mattis

Pendant longtemps, les linguistes historiques ont utilisé la méthode comparative pour reconstruire les états antérieurs des langues qui ne sont pas attestés dans les sources écrites. La méthode consiste en une comparaison détaillée des mots dans les langues descendantes apparentées et permet aux linguistes de déduire l'ancienne prononciation de mots qui n'ont jamais été enregistrés sous aucune forme de manière très détaillée. Que la méthode peut également être utilisée pour déduire comment un mot non documenté dans une certaine langue sonnerait, à condition qu'au moins quelques informations sur cette langue, ainsi que des informations sur les langues connexes sont disponibles, est connu depuis longtemps, mais jusqu'à présent jamais explicitement testé.

Deux chercheurs de l'Université SOAS de Londres et du Max Planck Institute for the Science of Human History ont récemment publié un article dans la célèbre revue internationale de linguistique historique, diachronique . Dans l'article, ils décrivent les résultats d'une expérience dans laquelle ils ont appliqué la méthode comparative traditionnelle pour prédire explicitement la prononciation des mots dans huit variétés linguistiques kho-bwa occidentales parlées en Inde. Appartenant à la famille trans-himalayenne (également connue sous le nom de famille linguistique sino-tibétaine et tibéto-birmane), ces variétés n'ont pas encore été décrites en détail et de nombreux mots n'avaient pas encore été documentés sur le terrain. Les chercheurs ont commencé leur expérience avec un ensemble de données étymologiques existantes de variétés de Kho-Bwa occidentales qui ont été collectées lors de travaux de terrain dans l'État indien d'Arunachal Pradesh entre 2012 et 2017. Dans l'ensemble de données, les auteurs ont observé de multiples lacunes dans lesquelles les formes de mots pour certains concepts manquaient.

« Lors de travaux sur le terrain, il est inévitable que vous manquiez certains mots. C'est un peu ennuyeux quand on constate qu'après, mais dans ce cas, nous avons réalisé que c'était l'occasion idéale de tester le fonctionnement réel des méthodes de reconstruction linguistique, " dit Tim Bodt, premier auteur de l'étude.

Les chercheurs ont mis en place un flux de travail assisté par ordinateur pour prédire les formes de mots manquantes. Les méthodes classiques sont traditionnellement appliquées manuellement, mais les nouvelles solutions informatiques ont aidé les chercheurs à augmenter l'efficacité et la fiabilité du processus, et tous les résultats ont ensuite été vérifiés et affinés manuellement. Pour augmenter la transparence et la validité de l'expérience, ils ont ensuite enregistré leurs prédictions en ligne.

« L'enregistrement est extrêmement important dans de nombreux domaines scientifiques car il garantit que les chercheurs adhèrent aux bonnes pratiques scientifiques, mais pour autant que nous le sachions, cela n'a jamais été fait en linguistique historique, " dit Johann-Mattis List, qui a effectué les analyses informatiques de l'étude.

"En enregistrant nos pronostics en ligne, nous nous sommes assurés de ne plus pouvoir modifier nos prévisions au vu des résultats que nous avons obtenus lors de notre processus de vérification ultérieur, " Bodt, ajoute.

Avec des prédictions en main, Bodt s'est ensuite rendu en Inde pour vérifier les mots prédits avec des locuteurs natifs des langues occidentales Kho-Bwa. Après avoir demandé aux consultants en langues locales participants de fournir leurs mots pour les concepts à l'étude, les auteurs ont comparé ces mots attestés avec leurs prédictions antérieures. Sur la base de la proportion de sons correctement prédits par forme de mot, les prédictions étaient correctes dans 76% des cas, ce qui est remarquable étant donné la quantité limitée d'informations qui ont été utilisées pour prédire les formes des mots. De plus, les chercheurs ont pu identifier plusieurs raisons pour lesquelles certaines prédictions ne correspondaient pas aux formes attestées réelles dans les langues.

"Plus nous en savons sur une famille linguistique en général, mieux nous pourrons prédire les formes de mots inconnues. Tout cela est possible, parce que les langues changent leurs systèmes sonores d'une manière étonnamment régulière, " dit List. " Malgré le fait que l'on sache si peu sur les langues occidentales Kho-Bwa et leur histoire linguistique, nous avons pu montrer à travers notre expérience que des changements sonores réguliers entraînent des formes de mots prévisibles. À son tour, notre expérience a grandement amélioré notre compréhension des langues occidentales Kho-Bwa et de leur histoire linguistique. »

En plus de donner un exemple concret de la puissance de la méthodologie de la linguistique historique et de la valeur de leur expérience pour les études linguistiques, les auteurs identifient certains avantages supplémentaires de la prédiction des mots dans la recherche linguistique.

« La prédiction des mots augmente la transparence et l'efficacité de nos recherches et de notre travail sur le terrain. Ceci est crucial compte tenu de la perte rapide du langage et du financement limité du travail linguistique descriptif. De plus, elle a aussi un aspect pédagogique puisqu'elle incite les locuteurs à réfléchir sur leur propre héritage linguistique, " dit Bodt.

Les chercheurs espèrent que les résultats de leur expérience révolutionnaire encourageront d'autres travailleurs de terrain linguistiques, linguistes descriptifs, et les linguistes historiques à emboîter le pas, et faire un usage plus explicite et conscient de la régularité des changements sonores et des prédictions des formes de mots.

Des chercheurs rapportent la découverte d'anciennes fosses de kumara

Une politique climatique progressiste peut réduire l'extrême pauvreté :étude

Autres