Crédit :CC0 Domaine public
La séquence d'ADN de chacun est unique. Mais pour ceux qui souhaitent préserver leur intimité génétique, ce n'est peut-être pas assez unique.
Une nouvelle étude soutient que plus de la moitié des Américains pourraient être identifiés par leur nom si tout ce que vous deviez commencer était un échantillon de leur ADN et quelques faits de base, tels que l'endroit où ils vivent et leur âge.
Ce ne serait pas simple, et ce ne serait pas bon marché. Mais le fait que cela soit devenu faisable nous obligera tous à repenser le sens de la vie privée à l'ère de l'ADN, ont dit les experts.
Il y a peu de temps à perdre. Les chercheurs à l'origine de la nouvelle étude disent qu'une fois que 3 millions d'Américains ont téléchargé leurs génomes sur des sites Web publics de généalogie, presque tout le monde aux États-Unis serait identifiable par son ADN seul et quelques indices supplémentaires.
Plus d'un million d'Américains ont déjà publié leurs informations génétiques, et des dizaines d'autres le font chaque jour.
"Les gens se demandent combien de temps il faudra avant de pouvoir utiliser l'ADN pour détecter à peu près n'importe qui, " dit Ruth Dickover, directeur du programme de médecine légale à l'Université de Californie, Davis qui n'a pas participé à l'étude. "Les auteurs disent que cela ne prendra pas si longtemps."
Cette nouvelle réalité représente la convergence de deux tendances de longue date.
L'un d'eux est l'essor des tests génétiques destinés directement aux consommateurs. Des entreprises comme Ancestry.com et 23andMe peuvent séquencer l'ADN de n'importe qui pour environ 100 $. Tout ce que vous avez à faire est de fournir un échantillon de salive et de l'envoyer par la poste.
L'autre élément essentiel est la prolifération des bases de données généalogiques consultables publiquement comme GEDmatch. N'importe qui peut télécharger un génome complet sur ces sites et des ordinateurs puissants le traiteront, à la recherche d'étendues de séquences d'ADN correspondantes qui peuvent être utilisées pour construire un arbre généalogique.
Pour tester la montée en puissance de ces sites, des chercheurs dirigés par l'informaticien de l'Université de Columbia, Yaniv Erlich, ont cherché à savoir s'ils pouvaient trouver le nom d'une personne. son identité – si tout ce qu'ils avaient à faire était un morceau de son ADN et une petite quantité d'informations biographiques.
Ils ont commencé avec une séquence d'ADN complète d'une personne dont les informations génétiques ont été publiées anonymement dans le cadre d'une étude scientifique indépendante. (Ils avaient en fait identifié cette femme dans une étude précédente, mais pour les besoins de ce travail, ils prétendaient qu'ils ne savaient pas qui elle était.)
Erlich et ses collaborateurs ont téléchargé son code génétique sur GEDmatch et ont effectué une recherche pour voir si elle avait des relations sur le site. Ils en ont trouvé deux :un dans le Dakota du Nord et un dans le Wyoming.
Les chercheurs pouvaient dire qu'ils étaient tous liés car ils partageaient un certain nombre de polymorphismes nucléotidiques uniques, ou SNP. Ce sont des lettres simples à des endroits spécifiques parmi les quelque 3 milliards de A, Cs, Ts et Gs qui composent le génome humain.
Plus les gens partagent de SNP, plus ils sont étroitement liés.
En comparant l'ADN des trois parents, L'équipe d'Erlich a pu trouver un couple ancestral commun qui était les arrière-grands-parents de la femme de l'Utah.
Prochain, les chercheurs ont parcouru des sites Web généalogiques et d'autres sources à la recherche d'autres descendants de ce couple d'il y a longtemps. Ils ont trouvé 10 enfants et des centaines de petits-enfants et arrière-petits-enfants.
Puis ils ont commencé à abattre leur énorme liste de descendants. Ils ont éliminé tous les hommes de l'échantillon, puis ceux qui n'étaient pas en vie lorsque l'ADN de la femme de l'Utah a été séquencé. Les auteurs savaient aussi que leur sujet était marié et combien d'enfants elle avait, ce qui les a aidés à se concentrer sur leur cible.
Après une longue journée de travail minutieux, les chercheurs ont pu nommer correctement le propriétaire de l'échantillon d'ADN.
Les auteurs ont déclaré que le même processus fonctionnerait pour environ 60% des Américains d'origine européenne, qui sont les personnes les plus susceptibles d'utiliser les sites Web généalogiques, dit Erlich. Bien que les chances de réussite soient moindres pour les personnes d'autres milieux, on s'attendrait toujours à ce qu'il fonctionne pour plus de la moitié de tous les Américains, ils ont dit.
Pour arriver à cette conclusion, les chercheurs ont analysé une base de données différente composée de 1,28 million d'individus anonymes dont l'ADN a été séquencé par MyHeritage, une entreprise de tests ADN et d'histoire familiale où Erlich est le directeur scientifique.
Si vous pouvez trouver le cousin au troisième degré d'une personne dans une base de données généalogique, alors vous devriez être en mesure d'identifier la personne avec une quantité raisonnable de détectives, dit Erlich. L'équipe a donc vérifié combien de parents de l'ordre d'un cousin au troisième degré ou plus proche ils pouvaient trouver pour chaque individu dans leur ensemble de données.
Ils en ont trouvé beaucoup :60 % des 1,28 million de personnes étaient jumelées à un parent qui était au moins aussi proche qu'un troisième cousin, et 15 pour cent avaient un parent qui était au moins aussi proche qu'un cousin germain.
Les résultats ont été publiés jeudi dans le journal Science .
Jusque là, Joseph James DeAngelo, 72 ans, est la personne la plus célèbre à avoir été identifiée de cette façon. Vous le connaissez peut-être mieux en tant que présumé tueur de Golden State, inculpé de 13 chefs de meurtre et de 13 chefs de tentative d'enlèvement.
Lorsque les forces de l'ordre ont utilisé une base de données ADN accessible au public pour attraper DeAngelo en avril, ce n'était que la deuxième fois dans l'histoire de la résolution de crimes que la stratégie était mise en œuvre avec succès.
Depuis, au moins 13 autres criminels présumés ont été identifiés de la même manière.
"La résolution de l'affaire Golden State Killer a ouvert cette méthode comme une possibilité et d'autres laboratoires criminels en profitent, " Dickover a déclaré. " De toute évidence, une tendance a commencé. "
Les particuliers profitent également de la technologie. Les adoptés ont trouvé des parents biologiques et des frères et sœurs, et d'autres ont trouvé des cousins éloignés qui peuvent jeter un nouvel éclairage sur les origines et l'héritage d'une famille.
Mais comme nous sommes de plus en plus nombreux à télécharger de l'ADN dans des bases de données consultables publiquement, les implications peuvent être effrayantes.
"Quand la police a attrapé le Golden State Killer, ce fut un très bon jour pour l'humanité, " a déclaré Erlich. " Le problème est que la même stratégie peut être utilisée à mauvais escient. "
Pensez aux gouvernements étrangers utilisant cette technique pour traquer les citoyens américains, il a dit. Ou des manifestants et des militants poursuivis de cette manière.
Erlich et ses co-auteurs ont proposé une stratégie d'atténuation qui rendrait plus difficile le téléchargement d'une séquence d'ADN inconnue dans une base de données généalogique et la recherche d'une correspondance.
Ils suggèrent que les sociétés de test ADN directes aux consommateurs mettent un code spécial sur les fichiers de données brutes qu'elles envoient à leurs clients. Les sites de généalogie pourraient alors accepter de permettre aux gens de télécharger des séquences d'ADN uniquement s'ils ont un code valide. Cela garantirait que les gens pourraient effectuer des recherches liées uniquement à leur propre ADN.
Un tel système n'empêcherait pas les forces de l'ordre d'utiliser des bases de données généalogiques pour rechercher des suspects, dit Erlich.
Le but ultime est de permettre aux gens d'utiliser leur ADN pour en savoir plus sur leur propre famille sans sacrifier leur vie privée, dit Erlich.
Rien que cette année, son cousin adoptif a trouvé une sœur biologique qui vit à l'autre bout du monde, il a dit.
"C'est pourquoi nous avons cette technique, " il a dit.
©2018 Los Angeles Times
Distribué par Tribune Content Agency, LLC.