Les manuscrits illustrés montrent des changements du vieil anglais (Beowulf) au moyen anglais (Trinity Homilies, Chaucer) à l'anglais du début de l'époque moderne (le premier folio de Shakespeare). Des chercheurs de l'Université de Pennsylvanie ont analysé l'évolution de l'anglais à l'aide de vastes collections de textes numérisés couvrant le XIIe au XXIe siècle, montrant que de nombreux changements de langage peuvent être attribués au hasard seul. Crédit :(c) Mitchell Newberry 2017
Lisez quelques lignes de Chaucer ou de Shakespeare et vous aurez une idée de l'évolution de la langue anglaise au cours du dernier millénaire. Les linguistes cataloguent ces changements et s'efforcent de discerner pourquoi ils se sont produits. Pendant ce temps, les biologistes évolutionnistes ont fait quelque chose de similaire avec les êtres vivants, explorer comment et pourquoi certains gènes ont changé au fil des générations.
Dans une nouvelle étude publiée dans La nature , des chercheurs de ces deux domaines académiques ont uni leurs forces à l'Université de Pennsylvanie pour résoudre un problème essentiel de l'évolution des langues :déterminer si les changements de langue se produisent par hasard ou par une force sélective.
En examinant d'importantes collections de textes annotés datant du XIIe au XXIe siècle, les chercheurs ont découvert que certains changements linguistiques étaient guidés par des pressions analogues à la sélection naturelle - sociale, facteurs cognitifs et autres, tandis que d'autres semblent s'être produits purement par hasard.
"Les linguistes supposent généralement que lorsqu'un changement se produit dans une langue, il doit y avoir eu une force directionnelle qui l'a causé, " dit Josué Plotkin, professeur de biologie à la Penn's School of Arts and Sciences et auteur principal de l'article. « Alors que nous proposons que les langues peuvent également changer par le seul hasard. Un individu entend une variante d'un mot par opposition à une autre et est alors plus susceptible de l'utiliser lui-même. Des événements aléatoires comme celui-ci peuvent s'accumuler pour produire un changement substantiel au fil des générations. Avant de débattre des forces psychologiques ou sociales qui ont fait changer une langue, nous devons d'abord nous demander s'il y avait vraiment de la force."
"L'un des grands linguistes américains, Léonard Bloomfield, dit que vous ne pouvez jamais voir un changement de langue, que le changement est invisible, " dit Robin Clark, co-auteur et professeur de linguistique à Penn Arts and Sciences. "Mais maintenant, en raison de la disponibilité de ces grands corpus de textes, on peut vraiment le voir, en détail microscopique, et commencer à comprendre les détails de la façon dont le changement s'est produit."
Plotkin et Clark se sont joints aux auteurs principaux Christopher A. Ahern, un doctorat étudiant au département de linguistique, et Mitchell G. Newberry, un doctorat étudiante au département de biologie, sur le travail.
Tout comme les analyses génomiques nécessitent des quantités massives de données pour voir les signes qu'un gène ou un autre a augmenté en fréquence au fil du temps en réponse à une pression sélective, cette analyse linguistique nécessitait une grande base de données de textes écrits au cours des siècles pour déterminer le rôle de la sélection dans l'évolution de la langue. Ces corpus sont le résultat de générations de travail, une grande partie par les linguistes de Penn, pour analyser des textes écrits et annoter des parties du discours.
Les chercheurs ont choisi trois changements de langue anglaise bien caractérisés pour évaluer les signes de sélection.
Un changement est la régularisation des verbes au passé. En utilisant le Corpus of Historical American English, composé de plus de 100, 000 textes allant de 1810 à 2009 qui ont été analysés et numérisés - une base de données qui comprend plus de 400 millions de mots - l'équipe a recherché des verbes où les formes régulières et irrégulières du passé étaient présentes, par exemple, « plongé » et « colombe » ou « marié » et « marié ».
Ils ont identifié 36 de ces verbes. En utilisant une technique analytique que Plotkin et ses collègues avaient développée pour détecter la sélection naturelle dans les populations microbiennes, ils ont étudié la fréquence changeante des différentes formes verbales au fil du temps pour conclure si l'on était devenu dominant en raison de forces sélectives ou en raison du hasard.
Pour six de ces verbes, l'équipe a trouvé des preuves de sélection. Dans quatre de ces cas, la sélection a favorisé la forme irrégulière du passé.
« Il existe une vaste littérature et beaucoup de mythologie sur la régularisation et l'irrégularité des verbes, " Clark a dit, "Et beaucoup de gens ont affirmé que la tendance est à la régularisation. Mais ce que nous avons trouvé était assez différent."
En effet, l'analyse a mis en évidence des cas particuliers où il semble que des forces sélectives soient à l'origine de l'irrégularité. Par exemple, alors qu'un nageur il y a 200 ans aurait pu "plonger", aujourd'hui, nous dirions qu'ils « ont plongé ». L'évolution vers l'utilisation de cette forme irrégulière a coïncidé avec l'invention des voitures et l'augmentation concomitante de l'utilisation du verbe irrégulier rimant « conduire »/« conduire ».
L'utilisation de "quitté" au lieu de "quitté, " est un autre exemple qui coïncide avec une augmentation globale de l'utilisation des rimes irrégulières " hit " et " split ". Pendant ce temps, " split " a pris un nouveau sens depuis 1900 :partir.
"Si vous avez un voisinage phonétique avec beaucoup de verbes irréguliers qui riment, il agit comme une force gravitationnelle et rend plus probable que le passé d'autres verbes qui riment s'irrégularité, " dit Clark.
Malgré la découverte de la sélection agissant sur certains verbes, "la grande majorité des verbes que nous avons analysés ne montrent aucune preuve de sélection, " a déclaré Plotkin.
L'équipe a identifié un schéma :le hasard affecte davantage les mots rares que les mots courants. Lorsque les verbes rarement utilisés ont changé, ce remplacement était plus probablement dû au hasard. Mais quand les verbes les plus courants ont changé de forme, la sélection était plus susceptible d'être un facteur déterminant le remplacement.
Les auteurs ont également observé un rôle du hasard dans le changement grammatical. Le périphrastique "faire, " tel qu'utilisé dans, « Est-ce qu'ils disent ? » ou "Ils ne disent pas, " n'existait pas il y a 800 ans. Dans les années 1400, ces sentiments auraient été exprimés comme, « Dites-vous ? » ou "Ils disent non."
En utilisant le Penn Parsed Corpora of Historical English, qui comprend 7 millions de mots syntaxiquement analysés à partir de 1, 220 textes en anglais britannique, les chercheurs ont découvert que l'utilisation du périphrase "do" a émergé en deux étapes, d'abord dans les questions ("Ne disent-ils pas?") vers les années 1500, puis environ 200 ans plus tard dans des déclarations impératives et déclaratives (« Ils ne disent pas. »).
Alors que la plupart des linguistes ont supposé qu'une telle caractéristique grammaticale distinctive doit avoir été poussée à la domination par une certaine pression sélective, l'analyse de l'équipe Penn remet en question cette hypothèse. Ils ont découvert que la première étape de l'utilisation périphrastique croissante du « faire » est cohérente avec le hasard. Seul le deuxième étage semble avoir été entraîné par une pression sélective.
"Il paraît que, une fois que 'do' a été introduit dans des phrases interrogatives, il a dérivé de manière aléatoire vers une fréquence de plus en plus élevée au fil du temps, " dit Plotkine. " Alors, une fois qu'il est devenu dominant dans le contexte de la question, il a été sélectionné dans d'autres contextes, l'impératif et le déclaratif, probablement pour des raisons de cohérence grammaticale ou de facilité cognitive."
Les chercheurs ont également confirmé des hypothèses de longue date sur la sélection opérant pour changer la forme de la négation verbale, comme "Ic ne secge" changé en "I ne seye pas" puis en "Je dis non, " de l'anglais ancien au début de l'anglais moderne. Le soutien précédent de cette hypothèse reposait sur une comparaison entre plusieurs langues, alors que l'équipe Penn a établi le même résultat sur la base des données de l'anglais uniquement.
L'équipe de recherche poursuit sa collaboration, avec des plans pour explorer les forces à l'œuvre dans les caractéristiques linguistiques telles que le nommage des bébés ainsi que l'évolution du langage parlé.
Comme le voient les auteurs, il est tout à fait naturel que les domaines des sciences sociales comme la linguistique échangent de plus en plus de connaissances et de techniques avec des domaines comme les statistiques et la biologie.
"A un biologiste évolutionniste, " dit Newberry, « il est important que la langue soit maintenue grâce à un processus de copie de la langue ; les gens apprennent la langue en copiant d'autres personnes. Cette copie introduit une variation infime, et ces variantes se propagent. Chaque changement est l'occasion d'un taux de copie différent, qui est la base de l'évolution telle que nous la connaissons."
"Pour pouvoir voir ce genre de détail microscopique dans l'évolution sociale, c'est une grosse affaire, c'est quelque chose dans lequel nous pouvons mordre à pleines dents, " a déclaré Clark. " En examinant les analogies entre les sciences sociales et la biologie, ce travail tend vers une unification entre les deux domaines. Je pense que les deux côtés ont tout à gagner."