Crédit :CC0 Domaine Public
Une équipe d'informaticiens de l'USC Viterbi School of Engineering a entrepris de développer de nouveaux outils pour automatiser et organiser les données des sciences sociales. Qu'ont-ils utilisé comme ensembles de données ? Posts Twitter des capitales côtières, New York et Los Angeles.
Les chercheurs ont découvert qu'ils pouvaient identifier des tweets similaires qui n'ont pas de hashtags en utilisant le traitement du langage naturel et des réseaux de neurones pour créer des grappes de tweets similaires. "Il utilise l'IA pour créer une carte de tweets similaires, " dit Mayank Kejriwal, un professeur assistant de recherche au département d'ingénierie industrielle et des systèmes de l'USC, et directeur de recherche à l'USC Information Sciences Institute, qui est un expert en graphes de connaissances.
Le nouvel outil prend les tweets et les convertit en un vecteur mathématique à l'aide d'un réseau de neurones, vous permettant de voir si deux points sont similaires l'un à l'autre. Ainsi, vous pouvez voir des groupes de messages connexes. Par exemple, l'IA est capable de dire si des tweets tels que "Se prélasser sur la plage, penser à ma vie" et "Aujourd'hui c'est surfer, bain de soleil et pleine conscience" sont très similaires, même s'ils n'ont presque aucun mot en commun.
En comparant les Angelenos aux New-Yorkais, ils ont trouvé des publications intéressantes sur les tendances.
Non. Angelenos n'a pas plus parlé du 405 que les NYers n'ont parlé du MENSONGE. Et aucun des deux groupes n'a parlé de l'immobilier comme d'un sujet majeur.
Le top des tweets à LA ? Autour du thème des « emplois ».
On a souvent l'impression que LA est vaine. New York et New York figurent dans le top cinq des sujets sur lesquels les New-Yorkais tweetent.
Qu'en est-il de l'art ? L'art semble dominer la conversation à Los Angeles plus qu'à New York. Mais diviser par la population, et le New-Yorkais moyen s'avère plus artistique.
Contrairement à la perception populaire, en ligne, Angelenos avait tendance à parler de soins de santé et non de bien-être.
New York, l'échantillon de données révèle, peut en effet, être « La ville qui ne dort jamais », comme disent les chercheurs que ses habitants s'animent la nuit. mais Angelenos, crois le ou non, ont une plus grande gueule - ils publient plus sur les réseaux sociaux. Pendant les heures d'ouverture, Les Angelenos ont tendance à publier entre 30 et 60 % de tweets de plus que les New-Yorkais. Après 20h, il n'y a pas de différence entre les deux.
À LA et à New York, les zones à revenus plus élevés tweetent plus.
L'ensemble de données a été récupéré à partir d'octobre 2016. La recherche a été documentée dans le Journal des sciences sociales computationnelles.
"Des études comme celle-ci nous permettent de comprendre les nuances de la vie quotidienne du 21e siècle. Nous vivons dans une telle indignation, culture axée sur les célébrités aujourd'hui qu'il est facile d'oublier que la plupart d'entre nous se concentrent uniquement sur nos activités :manger, faire la navette, travail, se plaindre. Nous en documentons plus sur les réseaux sociaux que nous ne le pensons. Cette technologie nous permet de lire l'histoire de notre société telle qu'elle s'écrit, juste devant nos yeux, " dit Kejriwal.