Crédit :Université de Californie - San Diego
Dans le numéro de mai de Biologie computationnelle PLOS , des scientifiques de l'UC San Diego et de l'Université de Notre Dame rapportent une étude qui pourrait ouvrir le champ à l'identification des protéines à base de nanopores – et éventuellement au profilage protéomique d'un grand nombre de protéines dans des mélanges complexes de différents types de molécules.
Selon le professeur d'informatique et d'ingénierie de l'UC San Diego, Pavel Pevzner, auteur principal sur le papier, la nouvelle approche identifie les protéines en analysant les signaux électriques distincts produits lorsque les molécules traversent un nanopore (qui agit comme un tamis). En théorie, dit Pevzner, les nanopores pourraient permettre aux chercheurs de caractériser un grand nombre de protéines dans des mélanges complexes.
Alors que les nanopores fonctionnent extrêmement bien dans l'analyse de molécules individuelles, ils sont moins efficaces lorsqu'on essaie de caractériser un grand nombre de protéines dans des mélanges complexes. Par conséquent, l'approche actuellement privilégiée pour le criblage de mélanges complexes consiste à utiliser d'autres techniques, notamment la spectrométrie de masse. (Pevzner et les professeurs d'informatique Vineet Bafna et Nuno Bandeira sont les principaux chercheurs du Center for Computational Mass Spectrometry de l'UC San Diego, financé par le NIH.)
Pas plus tard qu'en 2016, Les principaux développeurs de nanopores étaient pessimistes quant à la possibilité d'appliquer les nanopores au profilage de protéines à grande échelle à court terme. "Nous ne sommes même pas près de le faire pour le moment, " Le co-fondateur d'Oxford Nanopore, Hagan Bayley, a déclaré à GenomeWeb, ajoutant qu'il "ne dirait pas que c'est un objectif impossible, mais c'est un peu exagéré."
Pevzner de l'UC San Diego, cependant, croit qu'une percée est à portée de main. "La clé est d'utiliser l'apprentissage automatique pour analyser les informations générées par les protéines lorsqu'elles se déplacent à travers un nanopore, " a déclaré Pevzner. " En appliquant des techniques d'apprentissage automatique, nous avons pu identifier des signaux distincts qui pourraient conduire à une analyse à grande échelle des protéines des nanopores."
Dans une interview avec GenomeWeb, Pevzner dit que, tôt, les obstacles semblaient insurmontables. « Les données étaient si bruyantes que nous avons presque pensé que nous devrions abandonner, " a-t-il expliqué. " Je travaille depuis près de 10 ans maintenant sur la spectrométrie de masse descendante, et en comparaison avec l'identification des protéines par spectrométrie de masse descendante, qui est maintenant presque une zone mature, il semblait qu'il n'y avait aucun espoir que les nanopores puissent produire un signal comparable."
Puis, lorsque les chercheurs ont appliqué un outil d'analyse de forêt aléatoire de l'apprentissage automatique au problème, tout a changé. Rappelé Mikhaïl Kolmogorov, un étudiant diplômé du laboratoire de Pevzner :« Tout d'un coup, la structure du signal a émergé.
Comme indiqué dans le document PLOS, les chercheurs soutiennent que « la technologie actuelle est déjà suffisante pour faire correspondre les nanospectres avec de petites bases de données de protéines, par exemple., identification des protéines dans les protéomes bactériens."