Les services de tests ADN permettent aux gens de mieux connaître leur patrimoine. Les gens peuvent également utiliser les résultats de leurs tests génétiques pour se connecter à des parents potentiels dans leurs arbres généalogiques en utilisant des sites tiers, comme GEDmatch, où ils peuvent comparer leurs séquences d'ADN à d'autres dans la base de données. Crédit : Marco Verch/Flickr
Services de tests ADN comme 23andMe, Ancestry.com et MyHeritage permettent aux gens de mieux connaître leur héritage ethnique et leur constitution génétique. Les gens peuvent également utiliser les résultats des tests génétiques pour se connecter à des parents potentiels en utilisant des sites tiers, comme GEDmatch, où ils peuvent comparer leurs séquences d'ADN à d'autres dans la base de données qui ont téléchargé les résultats des tests.
Mais une fin moins heureuse est également possible. Des chercheurs de l'Université de Washington ont découvert que GEDmatch est vulnérable à plusieurs types de risques de sécurité. Un adversaire ne peut utiliser qu'un petit nombre de comparaisons pour extraire les marqueurs génétiques sensibles de quelqu'un. Un utilisateur malveillant pourrait également construire un faux profil génétique pour se faire passer pour un parent de quelqu'un.
L'équipe a publié ses résultats le 29 octobre. Les chercheurs ont également fait accepter cette recherche au Symposium sur la sécurité des réseaux et des systèmes distribués et présenteront ces résultats en février à San Diego.
"Les gens pensent que les données génétiques sont personnelles - et elles le sont. Cela fait littéralement partie de leur identité physique, " a déclaré l'auteur principal Peter Ney, chercheur postdoctoral à la UW Paul G. Allen School of Computer Science &Engineering. "Cela rend la confidentialité des données génétiques particulièrement importante. Vous pouvez changer votre numéro de carte de crédit mais vous ne pouvez pas changer votre ADN."
L'utilisation courante des résultats des tests génétiques pour la généalogie est un phénomène relativement récent. Les avantages initiaux peuvent avoir masqué certains risques sous-jacents, disent les chercheurs.
"Quand nous avons une nouvelle technologie, qu'il s'agisse d'automobiles intelligentes ou d'appareils médicaux, nous, en tant que société, commençons par « Qu'est-ce que cela peut faire pour nous ? » Ensuite, nous commençons à l'examiner d'un point de vue contradictoire, " a déclaré le co-auteur Tadayoshi Kohno, professeur à l'école Allen. « Ici, nous examinons ce système et nous demandons : « Quels sont les problèmes de confidentialité associés au partage de données génétiques en ligne ? » »
Les chercheurs de l'UW ont découvert qu'un adversaire ne peut utiliser qu'un petit nombre de comparaisons sur GEDmatch pour extraire des marqueurs génétiques sensibles pour quelqu'un et construire un faux profil génétique pour se faire passer pour un parent de quelqu'un. Voici un aperçu du pedigree génétique de deux parents avec deux enfants. Puis un autre enfant (rouge) prétend faussement être apparenté au père. Crédit :Rebecca Gourley/Université de Washington
Pour rechercher des problèmes de sécurité, l'équipe a créé un compte de recherche sur GEDmatch. Les chercheurs ont téléchargé des profils génétiques expérimentaux qu'ils ont créés en mélangeant et en faisant correspondre des données génétiques provenant de plusieurs bases de données de profils anonymes. GEDmatch a attribué à ces profils un identifiant que les utilisateurs peuvent utiliser pour effectuer des comparaisons individuelles avec leurs propres profils.
Pour les comparaisons individuelles, GEDmatch produit des graphiques avec des informations sur la correspondance entre les deux profils. Un graphique est une barre pour chacun des 22 chromosomes non sexuels. Chaque barre change de longueur en fonction de la similitude des deux profils pour ce chromosome. Une barre plus longue montre qu'il y a plus de régions correspondantes, tandis qu'une série de barres plus courtes signifie qu'il existe de courtes régions de similitude entrecoupées de zones différentes.
L'équipe voulait savoir si un adversaire pouvait utiliser cette barre pour découvrir une séquence d'ADN spécifique dans une région du profil d'une cible, comme si la cible a ou non une mutation qui les rend sensibles à une maladie. Pour cette recherche, l'équipe a conçu quatre « profils d'extraction » qu'elle a pu utiliser pour des comparaisons individuelles avec un profil cible qu'elle a créé. Selon que la barre est restée en un seul morceau, indiquant que le profil d'extraction et la cible correspondaient, ou s'il était divisé en deux barres, indiquant aucune correspondance, l'équipe a pu déduire la séquence spécifique de la cible pour cette région.
"Les informations génétiques sont corrélées à des conditions médicales et potentiellement à d'autres traits profondément personnels, " a déclaré le co-auteur Luis Ceze, professeur à l'école Allen. "Même à l'ère du partage excessif d'informations, c'est très probablement le genre d'informations que l'on ne veut pas partager pour des raisons juridiques, raisons médicales et de santé mentale. Mais à mesure que de plus en plus d'informations génétiques passent au numérique, les risques augmentent."
Ensuite, les chercheurs se sont demandé si un adversaire pouvait utiliser une technique similaire pour acquérir l'intégralité du profil d'une cible. L'équipe s'est concentrée sur un autre graphique GEDmatch qui décrit à quel point les profils correspondent en montrant une ligne de pixels colorés qui indiquent dans quelle mesure chaque segment d'ADN de la requête correspond à la cible :vert pour une correspondance complète, jaune pour une demi-correspondance - lorsqu'un brin d'ADN correspond mais pas l'autre - et rouge pour aucune correspondance.
Ensuite, l'équipe a joué à un jeu de 20 questions :ils ont créé 20 profils d'extraction qu'ils ont utilisés pour des comparaisons individuelles sur un profil cible qu'ils ont créé. En fonction de la façon dont les couleurs des pixels ont changé, ils ont pu extraire des informations sur la séquence cible. Pour cinq profils de test, les chercheurs ont extrait environ 92% des séquences uniques d'un test avec une précision d'environ 98%.
Pour les comparaisons individuelles, GEDmatch produit une barre pour chacun des 22 chromosomes non sexuels qui change de longueur en fonction de la similitude des deux profils pour ce chromosome. Voici un exemple de ce graphique. Une barre plus longue montre qu'il y a plus de régions correspondantes (en haut), tandis qu'une série de barres plus courtes signifie qu'il existe de courtes régions de similitude entrecoupées de zones différentes (en bas). Crédit :Rebecca Gourley/Université de Washington
"Donc en gros, tout ce que l'adversaire a à faire est de télécharger ces 20 profils, puis de faire 20 comparaisons individuelles avec la cible, " Ney a dit. " Ils pourraient écrire un programme qui fait automatiquement ces comparaisons, télécharge les données et renvoie le résultat. Cela prendrait 10 secondes."
Une fois le profil de quelqu'un exposé, l'adversaire peut utiliser ces informations pour créer un profil pour un faux parent. L'équipe a testé cela en créant un faux enfant pour l'un de leurs profils expérimentaux. Parce que les enfants reçoivent la moitié de leur ADN de chaque parent, le profil du faux enfant avait leurs séquences d'ADN correspondant à moitié au profil du parent. Lorsque les chercheurs ont effectué une comparaison individuelle des deux profils, GEDmatch a estimé une relation parent-enfant.
Un adversaire pourrait générer n'importe quelle fausse relation qu'il souhaitait en changeant la fraction d'ADN partagé, dit l'équipe.
« Si les utilisateurs de GEDmatch ont des inquiétudes quant à la confidentialité de leurs données génétiques, ils ont la possibilité de le supprimer du site, " Ney a dit. " Le choix de partager des données est une décision personnelle, et les utilisateurs doivent être conscients qu'il peut y avoir un certain risque chaque fois qu'ils partagent des données. La sécurité est un problème difficile pour les sociétés Internet de tous les secteurs. »
Avant de publier leurs résultats, les chercheurs ont partagé leurs découvertes avec GEDMatch, qui s'est efforcé de résoudre ces problèmes, selon l'équipe GEDmatch. Les chercheurs de l'UW ne sont pas affiliés à GEDmatch, cependant, et ne peut pas commenter les détails des correctifs.
"Nous commençons seulement à gratter la surface, " a déclaré Kohno. " Ces découvertes sont si fondamentales que les gens pourraient déjà le faire et nous ne le savons pas. La chose responsable pour nous est de divulguer nos résultats afin que nous puissions engager une communauté de scientifiques et de décideurs dans une discussion sur la façon d'atténuer ce problème. »