Gamze Gursoy, Doctorat., Université de Yale. Crédit :Gamze Gursoy
Sur la base d'une analyse des fuites de données et des opportunités pour empêcher l'utilisation abusive potentielle des informations génétiques, les chercheurs ont développé un nouveau format de fichier pour les données de génomique fonctionnelle qui permet le partage de données tout en protégeant les informations personnelles des participants à la recherche. Les résultats ont été présentés lors de la réunion annuelle 2018 de l'American Society of Human Genetics (ASHG) à San Diego, Californie.
La génomique fonctionnelle est l'étude du fonctionnement du génome dans le corps, comme la façon dont les gènes sont régulés, sont exprimés en protéines, et interagissent avec les protéines pour affecter les fonctions cellulaires dans la maladie et la santé. Gamze Gursoy, Doctorat., associé de recherche postdoctoral au programme de biologie computationnelle et de bioinformatique de l'Université de Yale, et ses collègues ont entrepris d'identifier les faiblesses des fichiers et processus de données génomiques fonctionnels actuels et de trouver des solutions pratiques.
« Comme la technologie de la génomique fonctionnelle est encore en émergence, les données résultant de cette recherche n'ont pas été bien étudiées par les chercheurs en protection de la vie privée, " a déclaré le Dr Gursoy. Des analyses antérieures ont montré que dans certains cas, il est possible de retracer les données génomiques fonctionnelles dépersonnalisées jusqu'au participant individuel, un concept connu sous le nom de fuite de données. Grâce à une série de tests au cours des dernières années, Le Dr Gursoy et ses collègues ont mesuré la quantité d'informations sur les variantes divulguées dans les expériences d'expression génique et de génomique fonctionnelle impliquant différents types de données, et la mesure dans laquelle ces informations pourraient être mises en correspondance avec des individus.
"Tout comme les données génétiques, ces données proviennent d'individus réels, et nous voulions faire prendre conscience qu'il pouvait y avoir des fuites. À la fois, nous voulons démocratiser l'accès aux données et éviter les obstacles bureaucratiques, " dit-elle. Pour atteindre cet objectif, les chercheurs ont développé des moyens de mesurer les fuites à partir de données génomiques fonctionnelles brutes et un format de fichier pour réduire les fuites de manière ciblée.
Notamment, le format qu'ils ont développé est facilement superposé aux types de fichiers de données génétiques déjà couramment utilisés, telles que la cartographie d'alignement de séquences et la cartographie d'alignement binaire. Le Dr Gursoy espère que sa facilité d'utilisation encouragera davantage de chercheurs à rendre leurs découvertes disponibles via les canaux appropriés.
"Nous voulons équilibrer la confidentialité des participants avec le flux d'informations scientifiques, " a déclaré le Dr Gursoy. " Si les chercheurs restreignent complètement leurs données, la découverte scientifique s'arrête."
Le Dr Gursoy travaille maintenant avec les référentiels de données existants, comme ENCODE. Elle a souligné que la protection de la vie privée est un effort continu qui ne s'arrête pas à ce seul format de fichier ; il s'agit aussi d'éduquer le public.
"La confidentialité génomique est très unique, " a déclaré le Dr Gursoy. " Les données génétiques peuvent être utilisées pour établir un lien entre les personnes et leur état de santé dans certaines bases de données. Bien qu'il existe des lois comme la loi sur la non-discrimination en matière d'information génétique, les gens ne savent pas que les compagnies d'assurance ne peuvent pas utiliser vos informations génétiques pour refuser une couverture."
Le Dr Gursoy espère que ce type de fichier sera adopté plus largement, conduisant à plus de collaboration sur le terrain et à moins d'obstacles à la reproduction de la recherche. Elle continue de travailler sur des méthodes pour fournir des données de recherche en temps opportun tout en assurant la sécurité des informations.