Un nouvel outil d'IA créé pour aider à identifier certains types de toxicomanie sur la base des publications Facebook d'un jeune sans-abri pourrait fournir aux refuges pour sans-abri des informations vitales à intégrer dans le plan de gestion de cas de chaque individu. Crédit :CC0 Domaine public
Il semble que Noël arrive tôt cette année pour les chercheurs en sciences sociales.
C'est parce que, quelques mois seulement après que le professeur de l'Université Albert J. Weatherhead III, Gary King, ait écrit un article universitaire sur un système qui permettrait aux chercheurs d'accéder aux énormes trésors de données détenus par Facebook et d'autres sociétés privées, il est sur le point de devenir une réalité.
Avec son collaborateur Nathaniel Persily à Stanford, King a créé une organisation appelée Social Science One qui dirigera l'effort d'identification des données à l'intérieur de Facebook, le préparer pour les chercheurs, et financer de nombreux chercheurs pour analyser les données.
L'organisation fait aujourd'hui le premier de ce que King dit sera de nombreux ensembles de données disponibles pour la recherche - un trésor énorme de plus d'un demi-billion de chiffres qui comprend chaque lien sur lequel les utilisateurs de Facebook ont cliqué au cours de la dernière année, y compris les types de personnes qui ont cliqué, sur quoi ils ont cliqué, et des indicateurs permettant de savoir si les liens ont été jugés intentionnellement faux.
"En tant que sociologues, notre objectif est de comprendre et de résoudre les plus grands défis qui affectent la société humaine, " dit King. " Il y a vingt ans, presque toutes les données dans le monde pour relever ces défis ont été créées par ceux d'entre nous dans l'académie, par les gouvernements et qui nous sont donnés, ou par des sociétés privées et nous est vendu, " a-t-il dit. " Mais le problème est que même si nous avons plus de données que jamais auparavant, nous avons une plus petite fraction des données que le monde crée. La plupart des données qui seraient utiles pour les sciences sociales sont désormais enfermées dans des entreprises privées. Social Science One est un mécanisme important pour débloquer ces données pour les chercheurs en sciences sociales. »
Et la quantité de données auxquelles ils auront accès est presque au-delà de l'imagination.
"Les données auxquelles nous allons donner accès sont extraordinaires - en quantité, elles peuvent rivaliser avec la quantité totale de données qui existent actuellement dans les sciences sociales."
« Cette commission a le potentiel d'ouvrir un nouveau chapitre de la recherche en sciences sociales, et dans l'acquisition globale des connaissances, dans lequel les organisations qui possèdent des informations d'une importance critique sur les personnes et les institutions, comme les plateformes de médias sociaux, et les chercheurs professionnels pourront collaborer plus efficacement pour résoudre certains des problèmes les plus difficiles auxquels notre société est confrontée, " a déclaré Matthieu Baum, Marvin Kalb, professeur de communications mondiales à la Harvard Kennedy School, et membre de la commission Social Science One.
Décrit par King et Persily dans un document de travail en avril, le cadre qui sous-tend Social Science One se compose de deux parties.
La première, il a dit, est une commission d'éminents universitaires du monde entier qui travaillera avec les responsables de Facebook pour identifier les ensembles de données potentiels qu'ils mettront à la disposition des chercheurs grâce à un processus dans lequel les propositions d'étude sont soumises et évaluées par des pairs. Une fois les idées d'étude approuvées, les chercheurs ont accès aux données ainsi qu'à des subventions pour soutenir leur travail fournies par sept fondations caritatives. Les fondations couvrent toute la gamme idéologique mais leur argent est mis en commun, et toutes les décisions seront prises par des universitaires, et ainsi aucun point de vue ne peut dominer. Et les chercheurs extérieurs auront une liberté académique totale sans avoir à donner à Facebook des droits d'approbation de prépublication.
« L'élément clé du processus est que la commission, en tant que tiers de confiance, peut examiner les propositions et décider que certaines ne seront pas financées, même si elles sont scientifiquement appropriées, pour des raisons inconnues du public, comme s'ils touchaient à un litige qui n'a pas été rendu public, " a-t-il poursuivi. " Et si Facebook renonce à cet accord et ne met pas à disposition les données demandées par Social Science One, nous sommes obligés de le signaler au public. Ce système est donc incitatif pour le public, pour la compagnie, et pour la communauté des sciences sociales. Nous pensons qu'il s'agit essentiellement d'un travail de science politique, où nous avons élaboré une constitution qui fonctionne pour tous les partis."
Social Science One est en cours d'incubation à l'Institut des sciences sociales quantitatives de Harvard, que le roi dirige. Au cours des années, IQSS a repris ce type d'activité à plusieurs reprises. Il a régulièrement incubé et filé des groupes de recherche à but non lucratif et des entreprises à but lucratif, ainsi que des centres, programmes, et des projets de recherche désormais hébergés à l'IQSS, ailleurs à Harvard, et dans d'autres établissements.
Aussi excitant que cela puisse être pour les chercheurs d'avoir accès à la banque de données de Facebook, l'utilisation et la mauvaise utilisation des données de Facebook ont fait la une des journaux du monde entier ces derniers mois, quelque chose que King et ses collègues ont développé des procédures à éviter. Ils ont intégré des garanties dans leurs procédures, la première est simple :les chercheurs ne recevront pas de données Facebook, ils y auront seulement accès.
"Aucun universitaire ne recevra de données, comme avant, " King a dit. " Au lieu de cela, nous mettrons l'accès aux données à la disposition des universitaires afin que la vie privée individuelle soit toujours préservée."
En outre, l'organisation prévoit d'utiliser un concept mathématique connu sous le nom de « vie privée différentielle, " pour s'assurer que les données mises à disposition ne peuvent pas être retracées jusqu'aux utilisateurs individuels. " Nous avons certains des plus grands experts au monde qui étudient ce concept ici à Harvard, dont Cynthia Dwork, le Gordon McKay Professor of Computer Science à la Harvard John A. Paulson School of Engineering &Applied Sciences, et Salil Vadhan, le professeur Vicky Joseph d'informatique et de mathématiques appliquées, tous deux membres de la commission, " King a dit. " L'idée est que vous pouvez prendre un ensemble de données et ajouter des types spéciaux de bruit aléatoire pour rendre impossible l'identification d'une seule personne, mais quand vous l'agrégez, cela ne modifie pas les tendances globales que vous souhaitez examiner."
Mais de loin la mesure de sécurité la plus forte, Le roi a dit, est lié au système qui permet aux universitaires d'accéder aux données. « Lorsque les universitaires accèdent aux données, chaque caractère qu'ils tapent sera enregistré et audité, " dit-il. " Donc s'ils tapent la lettre 'k, ' nous saurons qu'ils ont tapé cette lettre. Il n'y a donc aucune possibilité qu'ils copient ou abusent des données. Cela signifie que nous passons d'un modèle de responsabilité individuelle, qui a le chercheur violant les règles comme un seul point d'échec, à une responsabilité collective, où personne ne peut violer la vie privée sans que tout le monde le sache et puisse l'arrêter."
Finalement, Le roi a dit, L'objectif de Social Science One est de développer des moyens pour Facebook - et éventuellement d'autres entreprises - de mettre leurs vastes magasins de données à la disposition des chercheurs dans l'espoir de trouver des solutions aux problèmes sociaux qui continuent de tourmenter l'humanité.
"Facebook a des données très informatives sur deux milliards de personnes, " dit King. " C'est un privilège incroyable, et avec le privilège vient une responsabilité considérable. Il est logique que Facebook utilise également une partie de ces informations et de ce pouvoir pour aider le public et contribuer au bien social. »
C'est une idée qui n'est pas sans précédent, dit le roi.
Au cours des décennies, plusieurs grandes entreprises ont construit de grandes divisions de recherche - peut-être plus particulièrement avec la création de Bell Labs par AT&T et Microsoft Research chez Microsoft - qui ont permis aux scientifiques d'explorer des sujets aussi variés que la théorie de l'information au développement de lasers et au développement de transistors.
Avec la publication du premier ensemble de données aujourd'hui, King et ses collègues espèrent poursuivre cette tradition, mais d'une manière spécialement conçue pour les entreprises liées aux sciences sociales.
"Ce n'est que notre premier ensemble de données, nous en avons beaucoup d'autres qui viendront après cela, et nous avons des financements de sept généreuses fondations, et nous espérons donc commencer à mettre rapidement les chercheurs sur pied, " King a déclaré. "Nous espérons également étendre cette collaboration au-delà de Facebook et nous associer également à d'autres sociétés."
"Les découvertes que nous faisons à l'aide de ces ensembles de données ne vont pas interrompre les activités de ces entreprises, mais ils pourraient aider à résoudre certains des défis qui affectent la société humaine, " King a dit. " Et s'il y a un moyen de le faire, qui ne voudrait pas contribuer à cette mission ? »