Le big data pourrait non seulement profiter aux grandes entreprises, mais aussi fournir des connaissances sur la santé d'une société, par exemple. Crédit :Pxhere/876718, sous licence CC0
Les mégadonnées ont donné aux scientifiques – et aux entreprises – un trésor de nouvelles informations à analyser, comprendre et prévoir le comportement humain, mais cela soulève également une série de questions sur la confidentialité et la propriété.
Nos sociétés de smartphones sont inondées de nouveaux services, qui nous voit donner des données d'une manière que nous considérons rarement, avec des implications en matière de confidentialité qui font écho bien au-delà d'un léger appui sur le bouton « Accepter ». Alors, comment pouvons-nous nous assurer que la révolution des données profite à la fois aux individus et à la société dans laquelle nous vivons ?
Fosca Giannotti, coordinateur du projet SoBigData, un écosystème ouvert pour les « découvertes scientifiques sensibles à l'éthique, " voit le besoin d'alternatives qui permettent d'éviter la concentration des mégadonnées entre quelques mains.
Big Data, qu'elle définit comme « les traces numériques massives des activités humaines, capturés au fur et à mesure que nos activités sont médiatisées par les services informatiques, " comporte à la fois des risques et des avantages.
"(Les gens) sont fascinés par l'utilisation de nouveaux services, donnant ainsi nos données à ces derniers, ce qui signifie qu'il existe de nombreuses nouvelles opportunités pour les scientifiques d'étudier le comportement humain, " expliqua Giannotti. " De l'autre côté, ces données vont aux entreprises, et il y a le risque que les données soient centralisées dans des silos de plus en plus grands, par ex. avec Google, créant ainsi un déséquilibre entre ces propriétaires et les individus."
Questions nouvelles
Giannotti, directeur de recherche à l'Institut des sciences et technologies de l'information "Alessandro Faedo' à Pise, Italie, dit que l'ouverture de l'accès aux mégadonnées à des fins d'analyse par des non-spécialistes peut les aider à être utilisées pour le bien de la société, par exemple, en examinant des sujets comme la recherche médicale, transports en commun et épidémies.
"De nombreux chercheurs démontrent comment les données de mobilité humaine comme celles des téléphones portables peuvent être utilisées pour indiquer la santé d'un pays. Ou, dans le débat de société, nous pouvons mieux comprendre ce qui s'est passé en analysant l'utilisation des médias sociaux pendant le Brexit, regarder de fausses nouvelles ou détecter des bots, " dit Giannotti.
"Notre environnement virtuel aidera les non-experts à créer de telles expériences."
SoBigData, abréviation de Social Mining &Big Data Ecosystem, est un environnement de recherche virtuel sécurisé qui permet aux chercheurs, économistes, décideurs, et les innovateurs à poser de nouvelles questions sur les mégadonnées, « pour libérer pleinement la puissance de l'analyse des mégadonnées pour tous. »
L'infrastructure offre un accès aux installations sous la forme d'énormes ensembles de données, bibliothèques d'algorithmes, et des boîtes à outils de données prêtes à l'emploi fournies par 12 instituts de recherche européens expérimentés dans l'analyse des mégadonnées.
Intimité
Mais la focalisation du projet sur l'éthique a une autre forme.
Il s'appuie sur l'expertise des scientifiques des données pour aider à transformer les questions de recherche en processus d'analyse des mégadonnées basés sur le concept de « vie privée dès la conception », posant les questions juridiques et éthiques appropriées qu'un scientifique des données doit se poser dès le départ. début. Et ça arrive juste à temps.
Fin mai verra la mise en place du Règlement Général sur la Protection des Données (RGPD), une nouvelle loi européenne qui a été créée pour régir la protection des données personnelles en Europe.
L'idée du RGPD est de donner aux gens un plus grand contrôle de leurs données, en leur permettant de savoir quelles données les organisations détiennent à leur sujet et comment elles sont utilisées, tout en facilitant la modification des autorisations.
Un domaine qui sera fortement touché par les changements que cela entraînera est le secteur biomédical. L'une des raisons pour lesquelles le travail d'un projet appelé My Health My Data (MHMD) pourrait s'avérer très utile.
Coordinateur MHMD Professeur Edwin Morley-Fletcher, président du cabinet de conseil en e-santé Lynkeus, dit que l'objectif est de concevoir un réseau qui donne aux gens le plein contrôle de leurs données personnelles de santé.
Le projet, qui devrait se terminer l'année prochaine, compléterait les systèmes de données hospitaliers par une interface d'informations biomédicales ouverte permettant aux hôpitaux, des chercheurs, et les entreprises à utiliser des données dépersonnalisées pour la recherche ouverte, tout en laissant le patient gérer son compte de données personnelles à partir d'un appareil électronique.
"Avec le RGPD qui arrive, chaque fois que vous traitez des données ré-identifiables, la vie privée des personnes concernées doit être fortement garantie, " dit-il. " Normalement, tous les hôpitaux ont des données systématisées qui peuvent être retracées jusqu'aux patients, ce qui implique un fort besoin d'avoir le consentement direct du patient, et la capacité à une traçabilité complète de celui-ci, pour savoir ce qui se passe avec les données."
Chaîne de blocs
C'est pourquoi les porteurs de projets de MHMD ont décidé de réaliser un projet distribué, réseau peer-to-peer basé sur la blockchain, qui est essentiellement un système de grand livre numérique décentralisé. Il crée une couche de gestion sécurisée pour les données cryptées et anonymisées, l'ouvrir à un usage partagé tout en garantissant l'intimité du patient.
De plus, la possibilité de « contrats intelligents » dans certains types de blockchain signifie que les patients peuvent définir et mettre à jour les conditions de consentement contrôlant l'utilisation de leurs données, avec ces contrats dictant automatiquement comment les données peuvent être consultées ou réutilisées dans n'importe quelle circonstance donnée.
"C'est un aspect de l'autonomisation, la démocratisation des données en quelque sorte, " a déclaré le professeur Morley-Fletcher.
"L'objectif est de le rendre aussi fluide que possible, sans bureaucratie, afin que les responsables du traitement des données hospitalières et les individus puissent prendre des décisions claires sur ce qui se passe avec les données."
Les approches du MHMD et de SoBigData s'alignent sur la vision de l'Europe d'un référentiel en ligne partagé rendant toutes les données de la recherche financée publiquement accessibles à tous :le European Open Science Cloud.
L'événement European Open Science Cloud de fin 2017 à Bruxelles a clairement indiqué que l'UE souhaitait que ce nuage scientifique devienne une réalité d'ici 2020, et environ 272 millions d'euros du budget d'Horizon 2020 pour 2018-2020 sont déjà affectés à sa mise en œuvre.