• Home
  • Chimie
  • Astronomie
  • Énergie
  • La nature
  • Biologie
  • Physique
  • Électronique
  •  science >> Science >  >> Biologie
    Logiciels de métagénomique de référence de compétition internationale

    Mihai Pop, professeur d'informatique à l'Université du Maryland avec une nomination conjointe à l'Institut d'études informatiques avancées de l'Université du Maryland. Crédit :John T. Consoli, Université du Maryland

    Des communautés de bactéries vivent partout :à l'intérieur de notre corps, sur notre corps et tout autour de nous. L'intestin humain contient à lui seul des centaines d'espèces de bactéries qui aident à digérer les aliments et à fournir des nutriments, mais peut aussi nous rendre malade. Pour en savoir plus sur ces groupes de bactéries et leur impact sur nos vies, les scientifiques doivent les étudier. Mais cette tâche pose des défis, car l'introduction de la bactérie en laboratoire est soit impossible, soit perturberait les processus biologiques que les scientifiques souhaitent étudier.

    Pour contourner ces difficultés, les scientifiques se sont tournés vers le domaine de la métagénomique. En métagénomique, les chercheurs utilisent des algorithmes pour reconstituer l'ADN d'un échantillon environnemental afin de déterminer le type et le rôle des bactéries présentes. Contrairement aux domaines établis comme la chimie, où les chercheurs évaluent leurs résultats par rapport à un ensemble de normes connues, la métagénomique est un domaine relativement jeune qui manque de telles références.

    Mihai Pop, professeur d'informatique à l'Université du Maryland avec une nomination conjointe à l'Institut d'études informatiques avancées de l'Université du Maryland, a récemment aidé à juger un défi international appelé l'évaluation critique de l'interprétation du métagénome (CAMI), qui a comparé les logiciels de métagénomique. Les résultats ont été publiés dans la revue Méthodes naturelles le 2 octobre, 2017.

    "Il n'y a pas un seul algorithme dont nous puissions dire qu'il est le meilleur en tout, " dit Pop, qui est également co-directeur du Center for Health-related Informatics and Bioimaging de l'UMD. "Ce que nous avons découvert, c'est qu'un outil fait mieux dans un contexte, mais un autre fait mieux dans un autre contexte. Il est important que les chercheurs sachent qu'ils doivent choisir un logiciel en fonction des questions spécifiques auxquelles ils essaient de répondre."

    Les résultats de l'étude n'étaient pas surprenants pour Pop, en raison des nombreux défis auxquels sont confrontés les développeurs de logiciels de métagénomique. D'abord, L'analyse de l'ADN est un défi en métagénomique car l'ADN récupéré provient souvent du terrain, pas un environnement de laboratoire étroitement contrôlé. En outre, L'ADN de nombreux organismes - dont certains peuvent ne pas avoir de génomes connus - se mélangent dans un échantillon, rendant difficile le montage correct, ou assembler, génomes individuels. De plus, L'ADN se dégrade dans les environnements difficiles.

    "J'aime penser à la métagénomique comme à un nouveau type de microscope, " dit Pop. " Autrefois, vous utiliseriez un microscope pour étudier les bactéries. Maintenant, nous avons un microscope beaucoup plus puissant, qui est le séquençage de l'ADN couplé à des algorithmes avancés. La métagénomique promet de nous aider à comprendre ce que font les bactéries dans le monde. Mais nous devons d'abord régler ce microscope."

    Le chef de CAMI a invité Pop pour aider à évaluer les soumissions des participants au défi en raison de son expertise dans l'assemblage du génome et du métagénome. En 2009, Pop a aidé à publier Bowtie, l'un des progiciels les plus couramment utilisés pour l'assemblage de génomes. Plus récemment, il a collaboré avec la faculté de médecine de l'Université du Maryland pour analyser des centaines de milliers de séquences de gènes dans le cadre de la plus grande, l'étude la plus complète sur les maladies diarrhéiques infantiles jamais menée dans les pays en développement.

    "Nous avons découvert du nouveau, bactéries inconnues qui causent des maladies diarrhéiques, et nous avons également trouvé des interactions entre les bactéries qui pourraient aggraver ou améliorer la maladie, " a déclaré Pop. "Je pense que c'est l'un des projets les plus percutants que j'ai réalisés en utilisant la métagénomique."

    Pour la compétition, Les chercheurs du CAMI ont combiné environ 700 génomes microbiens et 600 génomes viraux avec d'autres sources d'ADN et ont simulé comment une telle collection d'ADN pourrait apparaître sur le terrain. La tâche des participants était de reconstruire et d'analyser les génomes du pool d'ADN simulé.

    Les chercheurs de CAMI ont noté les soumissions des participants dans trois domaines :dans quelle mesure ils ont assemblé les génomes fragmentés; à quel point ils ont "mis à la poubelle, " ou organisé, Fragments d'ADN en groupes apparentés pour déterminer les familles d'organismes dans le mélange ; et à quel point ils ont "profilé, " ou reconstitué, l'identité et l'abondance relative des organismes présents dans le mélange. Pop a fourni des métriques et des logiciels pour évaluer les génomes assemblés soumis.

    Dix-neuf équipes ont soumis 215 entrées en utilisant six assembleurs de génomes, neuf binners et 10 profileurs pour relever ce défi.

    Les résultats ont montré que pour l'assemblage, les algorithmes qui ont reconstitué un génome en utilisant différentes longueurs de fragments d'ADN plus petits ont surpassé ceux qui ont utilisé des fragments d'ADN d'une longueur fixe. Cependant, aucun assembleur n'a bien réussi à séparer les différents, des génomes pourtant similaires.

    Pour la tâche de binning, les chercheurs ont trouvé des compromis dans la précision avec laquelle les logiciels ont identifié le groupe auquel appartenait un fragment d'ADN particulier, par rapport au nombre de fragments d'ADN que le logiciel a attribués à des groupes. Ce résultat suggère que les chercheurs doivent choisir leur logiciel de regroupement en fonction de l'importance de la précision ou de la couverture. En outre, les performances de tous les algorithmes de binning diminuaient lorsque les échantillons incluaient plusieurs génomes apparentés.

    Dans le profilage, le logiciel a soit mieux récupéré l'abondance relative des bactéries dans l'échantillon, soit mieux détecté les organismes, même à de très faibles quantités. Cependant, ces derniers algorithmes identifiaient plus souvent le mauvais organisme.

    Aller de l'avant, Pop a déclaré que le groupe CAMI continuerait à relever de nouveaux défis avec différents ensembles de données et de nouvelles évaluations visant des aspects plus spécifiques des performances des logiciels. Pop est ravi de voir les scientifiques utiliser les références pour répondre aux questions de recherche en laboratoire et en clinique.

    "Le domaine de la métagénomique a besoin de normes pour s'assurer que les résultats sont corrects, bien validé et suivre les bonnes pratiques, " dit Pop. " Par exemple, si un médecin va organiser une intervention basée sur les résultats d'un logiciel métagénomique, il est essentiel que ces résultats soient corrects. Notre travail fournit une feuille de route pour choisir le logiciel approprié."


    © Science https://fr.scienceaq.com