Un nouvel algorithme d'apprentissage automatique peut prédire l'âge et le sexe à partir de votre profil Twitter uniquement. Crédit :Shutterstock
Un nouvel outil « d'inférence démographique » développé par des universitaires peut faire des prédictions basées uniquement sur les informations contenues dans le profil des médias sociaux d'une personne (c'est-à-dire le nom d'écran, Biographie, photo de profil, et nom). L'outil, qui fonctionne en 32 langues, pourrait ouvrir la voie à la prise en compte des opinions exprimées sur les réseaux sociaux dans les méthodes d'enquête populaires.
Chercheurs de l'Université d'Oxford, Université du Michigan, Université du Massachusetts, GESIS – Institut Leibniz des sciences sociales, l'Institut Max Planck, et l'Université de Stanford ont développé une méthode pour déduire des informations sur un propriétaire de compte de réseau social sur la base des informations divulguées dans les informations de leur profil Twitter.
Un nouveau système d'apprentissage automatique, dévoilé lors de la conférence Web à San Francisco cette semaine, a appris les modèles associés à différents âges, genres, et entre les organisations et les individus à partir d'un ensemble de données de plus de quatre millions de comptes Twitter en 32 langues. Ces informations ont ensuite été combinées avec des emplacements estimés et repondérées par rapport aux données du recensement pour produire des estimations plus précises de la population en 1, 101 régions statistiques à travers l'UE.
Cela pourrait ouvrir la voie à une compréhension plus représentative des points de vue des personnes sur les principaux problèmes et sujets de société, en fonction de ce qu'ils publient sur les réseaux sociaux et attribués à des emplacements géographiques et à des groupes démographiques spécifiques.
Dr Scott Hale, Chercheur principal, Institut Internet d'Oxford, L'Université d'Oxford a déclaré : « Malgré la fourniture de nombreux points de données, Les médias sociaux ont longtemps été un outil peu fiable pour comprendre quels problèmes sont les plus importants pour une population plus large, étant donné la façon dont les gens choisissent eux-mêmes d'utiliser une seule plate-forme.
"Cette première étude du genre effectue des prédictions démographiques sur le propriétaire d'un compte de réseau social en se basant uniquement sur les informations de profil du compte dans 32 langues, puis repondère l'échantillon en ligne pour qu'il ressemble davantage à une population hors ligne.
"Nous voyons cela comme une étape importante vers l'utilisation des médias sociaux pour obtenir une image plus précise des problèmes et des sujets qui intéressent le plus le public et comprendre quels points de vue des groupes sont sur ou sous-représentés."
Ces informations et données qui sous-tendent cette recherche ont été mises à disposition dans une bibliothèque open source et vous pouvez tester l'outil d'inférence sur www.euagendas.org/m3demo