• Home
  • Chimie
  • Astronomie
  • Énergie
  • La nature
  • Biologie
  • Physique
  • Électronique
  •  science >> Science >  >> Autres
    Explorer l'utilisation de mots extensibles dans les médias sociaux

    L'arbre du rire. Cet arbre d'orthographe pour les versions étirées du mot « ha » montre de nombreuses façons différentes dont ces mots sont orthographiés lorsqu'ils sont étirés. Les motifs de l'arbre représentent l'orthographe des mots, avec le 'h' initial à la racine, et les lettres suivantes se ramifiant à droite pour un "a" et à gauche pour un "h". Les chemins plus épais représentent des motifs plus dominants, avec de nombreux mots s'arrêtant à un nœud interne après quelques branchements. Quelques-uns des motifs les plus longs atteignant un nœud terminal sont annotés d'étoiles. Le graphique en médaillon montre à quelle fréquence différentes versions étirées de « ha » sont basées sur la durée de leur étirement. Quelques points sont annotés avec des exemples de versions étirées de cette longueur, mais le point représente toutes les versions étirées de cette longueur. Les points pour un nombre pair de caractères ont tendance à être plus élevés en raison de la tendance à parfaitement alterner « h » et « a » comme dans « hahaha... ». Crédit :Gray et al, 2020

    Une enquête sur les messages Twitter révèle de nouvelles idées et de nouveaux outils pour étudier comment les gens utilisent des mots étirés, comme "duuuuude, " "heyyyyy, " ou "noooooooo." Tyler Gray et ses collègues de l'Université du Vermont à Burlington présentent ces résultats dans la revue en libre accès PLOS UN le 27 mai, 2020.

    En langage parlé et écrit, les mots étirés peuvent modifier le sens d'un mot. Par exemple, "suuuuure" peut impliquer du sarcasme, tandis que "yeeessss" peut indiquer l'excitation. Les mots étirés sont rares dans l'écriture formelle, mais l'essor des médias sociaux a ouvert de nouvelles opportunités pour les étudier.

    Gray et ses collègues ont maintenant terminé l'étude la plus complète à ce jour sur les mots « extensibles » dans les médias sociaux. Ils ont développé un nouveau, stratégie plus approfondie pour identifier les mots étirés dans les tweets et l'a utilisée pour analyser un ensemble de données sélectionné au hasard d'environ 10 pour cent de tous les tweets générés entre septembre 2008 et décembre 2016, soit un total d'environ 100 milliards de tweets.

    Les chercheurs ont identifié des milliers de mots « extensibles » dans les tweets, y compris « ha » (par exemple, "hahaha" ou "haaahaha"), « génial » (par exemple, "awesssssommmmmeeeeee") et "but) (par exemple, ggggoooooaaaaallllll).

    Ils ont également identifié deux moyens clés de mesurer les caractéristiques des mots extensibles :l'équilibre et l'étirement. L'équilibre fait référence au degré auquel différentes lettres ont tendance à être répétées. Par exemple, "ha" a un degré d'équilibre élevé car lorsqu'il est étiré, le "h" et le "a" ont tendance à être répétés à peu près également. "Objectif" est moins équilibré, avec "o" répété plus que toute autre lettre du mot.

    L'étirement fait référence à la durée pendant laquelle un mot a tendance à être étiré. Par exemple, les mots courts ou les sons comme « ha » ont un degré élevé d'étirement parce que les gens les répètent souvent plusieurs fois (par exemple, "hahahahahahahaha"). Pendant ce temps, les mots réguliers comme "infini" ont un étirement plus faible, souvent avec une seule lettre répétée :"infinityyyy".

    Pour cette analyse, les chercheurs ont développé divers outils et méthodes qui pourraient être utilisés dans de futures recherches sur les mots extensibles, telles que les enquêtes sur les fautes de frappe et les fautes d'orthographe. Les outils pourraient également être appliqués pour améliorer le traitement du langage naturel, moteurs de recherche, et filtres anti-spam

    Les auteurs ajoutent :« Nous avons pu collecter et compter de manière exhaustive des mots étirés tels que« gooooooaaaalll » et « hahahaha », et les cartographier à travers les deux dimensions de l'élasticité globale et de l'équilibre de l'étirement, tout en développant de nouveaux outils qui faciliteront également leur étude linguistique continue, et dans d'autres domaines, comme le traitement du langage, augmenter les dictionnaires, améliorer les moteurs de recherche, analyser la construction de séquences, et plus."


    © Science https://fr.scienceaq.com