Une protéine avec des régions désordonnées indiquées en rouge et numérotées. Les régions désordonnées sont beaucoup plus flexibles que le bleu, régions structurées. Crédit :Université du Commonwealth de Virginie
Les protéines sont les éléments constitutifs de la vie et des agents biologiques. Ce sont des moteurs de croissance et de développement et de propagation de virus et de bactéries, et ont des rôles clés dans les voies de la maladie et pratiquement toutes les fonctions cellulaires. À mesure que les scientifiques acquièrent des connaissances sur les protéines, les mécanismes derrière les mystères biologiques sont révélés.
Pour aider à faire la lumière sur le fonctionnement des protéines, Lukasz Kurgan, chercheur à l'Université du Commonwealth de Virginie, Doctorat., vice-président du département d'informatique de l'École d'ingénieurs, a développé une série de programmes bioinformatiques pour aider les biologistes à mieux comprendre les fonctions des protéines intrinsèquement désordonnées. Ce groupe de protéines n'a pas de structure fixe, ce qui signifie qu'ils sont totalement ou partiellement flexibles et amorphes.
Au cours des dernières décennies, les scientifiques ont séquencé 85 millions de protéines uniques, structurés et non structurés, mais je ne sais toujours pas ce que font la grande majorité de ces protéines. Au fur et à mesure que de nouvelles protéines sont découvertes, des programmes informatiques plus sophistiqués doivent être développés pour aider à déterminer leurs fonctions.
« Nous avons sélectionné manuellement mais comprenons moins de 1 % de ces protéines, et en ce moment il y a plus de 80 millions à résoudre, " dit Kurgan, un professeur et data scientist doté de Qimonda. "Un programme peut résoudre ces protéines plus rapidement qu'un seul humain et peut aider les chercheurs à accélérer la génération d'hypothèses."
Résoudre l'énigme
Déterminer la fonction d'une protéine devient encore plus difficile lorsqu'une protéine est complètement ou partiellement désordonnée. Lorsqu'une protéine a une structure définie, les chercheurs utilisent des connaissances antérieures et des programmes bioinformatiques pour déchiffrer d'abord cette structure, qui aide alors à déterminer la fonction. Si la protéine est désordonnée, les biologistes se tournent vers les programmes construits par Kurgan et d'autres informaticiens qui utilisent des modèles prédictifs pour générer des hypothèses réalisables sur la fonction de la protéine.
Depuis 2008, Kurgan a développé quatre programmes à cet effet. Ce printemps, son équipe a reçu 500 $, 000 bourses de la National Science Foundation pour développer des programmes ultérieurs. Jusque là, Les programmes de Kurgan ont plus de 7, 000 utilisateurs de plus de 1, 300 villes dans 96 pays.
Kurgan a également développé six programmes qui déterminent si une protéine est désordonnée ou non. En 2012, son programme MFDp a été classé troisième sur 28 participants à l'expérience mondiale semestrielle CASP10, qui évalue l'efficacité des prédicteurs informatiques et humains du trouble intrinsèque. En 2014, Le laboratoire de Kurgan a publié DisoRDPbind, le premier programme à prédire de multiples fonctions de protéines intrinsèquement désordonnées.
Les programmes de Kurgan utilisent des collections existantes de données sur des protéines dont les fonctions ont été déterminées pour construire des modèles prédictifs afin de cartographier les fonctions de protéines intrinsèquement désordonnées inconnues.
"Les détails ne sont pas faciles. Construire ces modèles demande un peu d'art, théorie et expérience, " dit Kurgan.
De nouvelles idées pour le désordre
C'est un fait communément admis parmi les scientifiques que les protéines désordonnées, similaires à leurs homologues structurés, ont des fonctions essentielles. Cette affirmation a d'abord été accueillie avec incrédulité, comme c'est initialement commun avec de nombreuses découvertes scientifiques.
« Il y a environ 30 ans, lorsque des protéines désordonnées ont été découvertes, il y avait beaucoup de négateurs. Certaines personnes ont dit que ce n'est que du bruit dans les structures des protéines, " dit Kurgan. " Maintenant, le désordre en tant que mécanisme de la biologie est un fait admis. Juste parce qu'une protéine n'a pas de structure définie, ne veut pas dire que c'est inutile. Cela fonctionne juste d'une manière différente."
Maintenant, déchiffrer le trouble est un effort de collaboration dans la communauté scientifique, et divers programmes de plusieurs entités se réunissent pour fournir différentes approches pour déterminer les fonctions des protéines désordonnées. Kurgan a travaillé avec des chercheurs de l'Université de Floride du Sud, Université de l'Indiana, et les universités de Tianjin et Nankai en Chine, sur une étude qui a utilisé ses programmes pour découvrir l'incidence du trouble intrinsèque dans près de 1, 000 espèces de tous les règnes de la vie. Plusieurs autres études collaboratives se sont concentrées sur les rôles fonctionnels des troubles intrinsèques dans le VIH, Virus de l'hépatite C et de la dengue.
"Collectif, nous pouvons repousser les limites de ce qui est fait, " a déclaré Kurgan. " Ce n'est pas basé sur les efforts d'un chercheur ou d'un groupe spécifique. Collectivement, nous nous entraidons."