Équilibrer la vie privée avec des informations détaillées. Crédit :Dawn Hudson/Shutterstock.com
Les réponses des sites de médias sociaux au scandale Facebook-Cambridge Analytica et aux nouvelles réglementations européennes sur la confidentialité ont donné aux utilisateurs beaucoup plus de contrôle sur qui peut accéder à leurs données, et à quelles fins. Tome, en tant qu'utilisateur des réseaux sociaux, ce sont des développements positifs :C'est effrayant de penser à ce que ces plateformes pourraient faire avec les trésors de données disponibles sur moi. Mais en tant que chercheur, les restrictions accrues sur le partage des données m'inquiètent.
Je fais partie des nombreux universitaires qui dépendent des données des médias sociaux pour mieux comprendre les actions des gens. Dans l'urgence de protéger la vie privée des individus, Je crains qu'une victime involontaire puisse être une connaissance de la nature humaine. Mon travail le plus récent, par exemple, analyse les sentiments que les gens expriment sur Twitter pour expliquer pourquoi le marché boursier fluctue autant au cours d'une même journée. Il existe des applications bien au-delà de la finance. D'autres chercheurs ont étudié la satisfaction des usagers des transports en commun, le fonctionnement des systèmes d'alerte d'urgence lors de catastrophes naturelles et la manière dont les interactions en ligne influencent le désir des gens de mener des modes de vie sains.
Cela pose un dilemme - pas seulement pour moi personnellement, mais pour la société dans son ensemble. La plupart des gens ne veulent pas que les plateformes de médias sociaux partagent ou vendent leurs informations personnelles, sauf autorisation expresse de l'utilisateur individuel. Mais en tant que membres d'une société collective, il est utile de comprendre les forces sociales à l'œuvre qui influencent la vie quotidienne et les tendances à long terme. Avant les crises récentes, Facebook et d'autres sociétés avaient déjà rendu difficile l'utilisation de leurs données par des chercheurs légitimes, notamment en rendant plus difficile et plus coûteux le téléchargement et l'accès aux données à des fins d'analyse. La pression renouvelée du public pour la confidentialité signifie qu'il est susceptible de devenir encore plus difficile.
Utiliser les données des médias sociaux dans la recherche
Il est certainement alarmant d'envisager la possibilité que des personnes ou des entreprises analysent mes données et trouvent des moyens de m'influencer pour prendre des décisions que je ne prendrais pas autrement – ou qui vont même à l'encontre de mes propres intérêts. Je n'ai qu'à penser au nombre de fois où j'ai vu une publicité télévisée pour une pizza lors d'un événement sportif et j'ai commandé une pizza.
C'est le but du marketing, bien sûr, mais les médias sociaux sont différents parce que les informations me concernent spécifiquement. Et l'utilisation de ces informations peut affecter bien plus que la nourriture que j'achète, comme pour qui je vote. Cependant, en tant que chercheur en finance, Je reconnais également que les mêmes données peuvent être utilisées pour nous aider à comprendre des comportements collectifs impossibles à expliquer autrement.
Certaines de mes recherches, par exemple, explore les tendances à court terme des cours des actions. Les experts financiers ont constaté qu'à long terme, les cours des actions d'une entreprise sont déterminés par la valeur future de l'entreprise. Pourtant, au cours d'une seule journée, les cours des actions peuvent varier considérablement. De nombreux chercheurs en finance et analystes financiers vous diront que ces mouvements sont du bruit dénué de sens, des informations apparemment aléatoires sur les entreprises influençant la perception des investisseurs et faisant varier constamment les cours des actions.
Mais en analysant les données des médias sociaux, Je peux réellement comprendre ce qu'est ce bruit, d'où cela vient et ce que cela signifie. Par exemple, ce que les gens écrivent sur Twitter à propos du nouvel iPhone affectera le cours de l'action d'Apple, parfois en quelques minutes, mais même au fil des jours. La vitesse de l'effet dépend de l'importance ou de l'importance de la personne qui envoie le tweet, ainsi que la rapidité avec laquelle les autres – y compris les médias – retiennent le message.
Les résultats de mes recherches peuvent aider les investisseurs à affiner quand et comment ils entrent sur le marché. Si, par exemple, les utilisateurs de médias sociaux pensent que le dernier iPhone ne sera pas aussi bon que prévu, les investisseurs pourraient retarder leur investissement dans les actions Apple. Cela pourrait les libérer pour investir dans autre chose avec un meilleur buzz, dans l'espoir de rendements plus élevés.
Anonymisation des données
Il est vrai – et inquiétant – que certaines personnes vraisemblablement contraires à l'éthique ont essayé d'utiliser les données des médias sociaux à leur propre avantage. Mais les données ne sont pas le problème réel, et couper l'accès des chercheurs aux données n'est pas la solution. Cela priverait également la société des avantages de l'analyse des médias sociaux.
Heureusement, il existe un moyen de résoudre ce dilemme. L'anonymisation des données peut préserver la vie privée des personnes, tout en donnant aux chercheurs l'accès à des données collectives qui peuvent fournir des informations importantes.
Il existe même un modèle solide pour trouver cet équilibre de manière efficace :le U.S. Census Bureau. Depuis des décennies, cet organisme gouvernemental a collecté des données extrêmement personnelles auprès des ménages de tout le pays :âge, statut d'emploi, niveaux de revenus, Numéros de sécurité sociale et affiliations politiques. Les résultats qu'elle publie sont très riches, mais aussi non traçable à un individu.
Il est souvent techniquement possible d'inverser les protections d'anonymat sur les données, en utilisant plusieurs éléments d'information anonymisés pour identifier la personne à laquelle ils se rapportent tous. Le Census Bureau prend des mesures pour empêcher cela.
Par exemple, lorsque les membres du public accèdent aux données du recensement, le Census Bureau restreint les informations susceptibles d'identifier des personnes spécifiques, comme déclarer qu'il n'y a qu'une seule personne dans une communauté avec un niveau de revenu particulièrement élevé ou faible.
Pour les chercheurs, le processus est quelque peu différent, mais offre des protections importantes à la fois en droit et en pratique. Les universitaires doivent passer le processus de vérification du Census Bureau pour s'assurer qu'ils sont légitimes, et doivent suivre une formation sur ce qu'ils peuvent et ne peuvent pas faire avec les données. Les sanctions en cas de violation des règles comprennent non seulement l'interdiction d'utiliser les données du recensement à l'avenir, mais aussi des amendes civiles et même des poursuites pénales.
Même à ce moment là, ce que les chercheurs obtiennent vient sans nom ni numéro de sécurité sociale. Au lieu, le Census Bureau utilise ce qu'il appelle des « clés d'identification protégées, " un nombre aléatoire qui remplace les données qui permettraient aux chercheurs d'identifier des individus.
Les données de chaque personne sont étiquetées avec sa propre clé d'identification, permettant aux chercheurs de relier des informations de différents types. Par exemple, un chercheur souhaitant savoir combien de temps il faut pour obtenir un diplôme universitaire pourrait suivre les niveaux d'éducation des individus au fil du temps, grâce aux clés d'identification.
Les plateformes de médias sociaux pourraient mettre en œuvre un processus d'anonymisation similaire au lieu d'augmenter les obstacles – et les coûts – pour accéder à leurs données. Ils pourraient attribuer des numéros d'identification aux utilisateurs au lieu de partager leurs identités réelles, et pourrait accepter les réglementations gouvernementales définissant qui pourrait avoir accès à quelles données, y compris de véritables sanctions en cas de violation des règles. Ensuite, les chercheurs pourraient découvrir les informations offertes par l'utilisation des médias sociaux, tout comme ils le font avec les données du recensement, sans menacer la vie privée des gens.
Cet article a été initialement publié sur The Conversation. Lire l'article original.