Résumé :
Cette étude fournit une analyse à grande échelle du développement de l'anglais américain, en utilisant les données de milliards de mots publiés sur Twitter entre 2008 et 2020. Nous examinons comment la fréquence et les modèles d'utilisation des mots changent au fil du temps, y compris l'émergence de nouveaux mots, le déclin des anciens et des changements dans le sens des mots. Nos résultats mettent en lumière la nature dynamique de la langue et donnent un aperçu des facteurs culturels, sociaux et technologiques qui façonnent l'évolution de l'anglais américain.
Mots clés : Anglais américain, données Twitter, changement de langue, fréquence des mots, changement sémantique
Présentation :
La langue est un phénomène dynamique qui évolue constamment au fil du temps. De nouveaux mots sont introduits, d’anciens mots ne sont plus utilisés et les mots existants peuvent changer de sens. Ces changements sont influencés par divers facteurs, notamment les changements culturels, sociaux, technologiques et environnementaux.
Ces dernières années, la disponibilité de données textuelles numériques à grande échelle a permis aux chercheurs d’étudier les changements linguistiques avec des détails sans précédent. Twitter, en particulier, fournit une riche source de données pour analyser l’utilisation d’une langue en temps réel. Avec des millions d'utilisateurs publiant activement sur la plateforme, Twitter offre un aperçu de l'état actuel de l'anglais américain et de son évolution.
Méthodologie :
Pour analyser le développement de l'anglais américain sur Twitter, nous avons collecté un ensemble de données de milliards de mots publiés entre 2008 et 2020. Nous avons d'abord prétraité les données en supprimant les mots non anglais, la ponctuation et les URL. Nous avons ensuite symbolisé le texte en mots et compté la fréquence de chaque mot chaque année.
Pour suivre l'évolution de la fréquence des mots au fil du temps, nous avons calculé le taux de croissance de la fréquence des mots, défini comme le taux en pourcentage de variation de la fréquence des mots d'une année à l'autre.
De plus, nous avons utilisé des techniques d’incorporation de mots pour capturer la similitude sémantique entre les mots. À l'aide d'un modèle d'intégration de mots pré-entraîné, nous avons calculé la similarité cosinusoïdale entre les vecteurs de mots et comparé la relation sémantique des mots au fil du temps.
Résultats :
1. Émergence de nouveaux mots :
Nous avons constaté que des milliers de nouveaux mots sont apparus sur Twitter au cours de la période d'étude. Beaucoup de ces mots étaient liés aux nouvelles technologies, aux médias sociaux et à la culture populaire, reflétant le rythme rapide des progrès technologiques et du changement culturel.
2. Déclin des mots anciens :
Certains mots ont connu une baisse de fréquence au fil du temps, indiquant un changement dans leur utilisation ou leur pertinence. Certains mots refusés étaient liés à des technologies obsolètes, aux tendances de la mode ou à des personnalités politiques.
3. Changement sémantique :
Notre analyse a également révélé un changement sémantique dans le sens de certains mots au fil du temps. Par exemple, le mot « littéralement » signifiait à l'origine « au sens littéral », mais son utilisation sur Twitter véhiculait souvent une emphase ou une exagération.
4. Influence des événements sociaux et culturels :
Les grands événements sociaux et culturels ont eu un impact significatif sur l’utilisation de la langue. Par exemple, le mot « selfie » a connu une augmentation spectaculaire de sa fréquence suite à l'essor de la photographie sur téléphone portable et à l'utilisation de plateformes de médias sociaux comme Instagram.
Conclusion :
L'analyse de milliards de mots sur Twitter donne un aperçu de la nature dynamique de l'anglais américain et de son évolution au fil du temps. De nouveaux mots émergent, d’anciens mots déclinent et leur sens peut changer en raison des changements culturels, sociaux et technologiques. Les données de Twitter constituent une ressource précieuse pour étudier les changements linguistiques en temps réel, permettant aux chercheurs de suivre l’évolution des langues avec des détails sans précédent.
Implications :
Les résultats de cette étude ont des implications dans divers domaines, notamment la linguistique historique, la sociologie et les études culturelles. Comprendre l'évolution de l'anglais américain peut fournir des informations précieuses sur les changements sociétaux, les tendances culturelles et l'évolution des besoins des locuteurs de la langue.