• Home
  • Chimie
  • Astronomie
  • Énergie
  • La nature
  • Biologie
  • Physique
  • Électronique
  •  science >> Science >  >> Autres
    L'analyse de milliards de mots Twitter révèle comment l'anglais américain se développe

    Crédit :CC0 Domaine public

    Les linguistes et les géographes ont analysé 8,9 milliards de mots contenus dans les 980 millions de Tweets publiés aux États-Unis entre 2013 et 2014 pour identifier les régions d'où proviennent les nouveaux mots.

    Dirigé par le professeur Jack Grieve, du Centre for Corpus Research de l'Université de Birmingham, les chercheurs ont utilisé une technologie informatique avancée pour analyser les Tweets géocodés qui ont révélé la longitude et la latitude précises de l'utilisateur au moment de la publication.

    Ils ont suivi l'origine de 54 nouveaux mots émergents en anglais américain. Par exemple, ils ont trouvé que le mot 'baeless', qui signifie 'être célibataire', originaire du Grand Sud, tandis que le mot « mutuelles », qui est l'abréviation de « amis communs », originaire de la côte ouest.

    Les données géocodées de Twitter leur ont permis de créer des cartes pour ces 54 mots, montrant comment les phrases s'étaient propagées à travers le pays au fil du temps.

    Appliquer des techniques informatiques modernes à l'étude de la variation et du changement du langage, l'équipe a identifié que le développement de nouveaux mots en anglais américain moderne était centré sur cinq régions :la côte ouest, Le nord-est, le milieu de l'Atlantique, le sud profond, et la côte du Golfe.

    Le professeur Grieve a commenté :« C'est la première fois qu'un échantillon aussi important de mots émergents ou de tout type d'innovation linguistique est cartographié dans une langue. Twitter n'est qu'une variété de langage, mais étant donné que presque tous ces mots sont utilisés dans le langage courant, nous pensons que nos résultats reflètent la diffusion générale des mots en anglais américain.

    "Notre étude fournit un cadre pour les recherches futures en montrant comment l'origine et la propagation des mots émergents peuvent être mesurées et cartographiées. La linguistique passe d'une science sociale à une science des données, où les linguistes analysent de plus en plus des quantités massives de langage naturel récolté en ligne.

    "Cela nous permet de poursuivre de nouvelles questions de recherche qu'il aurait été impossible d'étudier il y a quelques années à peine. Nous pouvons analyser dans les moindres détails comment la langue change sur de courtes périodes de temps et comprendre les processus par lesquels les langues évoluent - l'un des questions les plus difficiles en science.

    Les découvertes des chercheurs remettent également en question les théories existantes sur la propagation de nouveaux mots. Ils montrent que les nouveaux mots ne se propagent pas simplement sans contrainte à partir de leur source, ils ne se répandent pas non plus d'une grande ville à l'autre, comme prédit par les théories développées précédemment pour la propagation de nouveaux mots, connus sous le nom de modèles « vague » et « gravité ».

    Au lieu, l'étude a révélé que la propagation de nouveaux mots est limitée par des modèles culturels. De nouveaux mots ont tendance à se répandre au sein des régions culturelles, avant d'atteindre le reste des États-Unis. Il a également révélé que l'anglais afro-américain était une source majeure d'innovation lexicale sur Twitter américain.

    Le professeur Grieve parle des recherches de l'équipe lors de la conférence New Ways of Analyzing Variation (NWAV) qui s'est tenue à l'Université de New York du 18 au 21 octobre. Il se concentrera sur la façon dont ces mots se sont propagés uniquement à New York au cours de la période en question, ainsi que l'animation d'un atelier sur la « sociolinguistique computationnelle ».


    © Science https://fr.scienceaq.com