Crédit :CC0 Domaine public
Deux informaticiens de la Freie Universität Berlin modifient la façon dont les grandes protéines sont modélisées à l'intérieur des ordinateurs en combinant l'apprentissage automatique, un domaine de l'intelligence artificielle, avec la physique statistique. Les résultats ont été publiés dans Actes de l'Académie nationale des sciences .
"Bien que les molécules biologiques telles que les protéines soient trop petites pour être vues à l'œil nu, ils sont constitués d'un grand nombre d'atomes, " dit le Dr Simon Olsson, Boursier Alexander von Humboldt et auteur principal de l'étude. "Cela rend techniquement difficile de les étudier dans la mesure nécessaire pour comprendre comment ils fonctionnent." Comprendre le fonctionnement des protéines est essentiel pour plusieurs applications biomédicales et biotechnologiques, y compris l'amélioration de la sécurité alimentaire mondiale, la protection des cultures et la lutte contre la montée des pathogènes multi-résistants.
Dans leur article, les auteurs décrivent une procédure pour surmonter les défis techniques de la simulation de grandes protéines. L'idée clé est de réaliser que les protéines sont comme les réseaux sociaux. Dr Frank Noé, professeur à la Freie Universität Berlin, dit, "Les protéines sont connues pour être composées de plusieurs blocs de construction plus petits - la bonne composition de ceux-ci conduit à l'émergence de fonctions biologiques telles que nous les connaissons."
Traditionnellement, les protéines sont considérées comme un tout lorsqu'elles sont simulées à l'intérieur d'un ordinateur, car c'est ainsi qu'ils sont observés dans l'expérience. Cependant, leurs blocs de construction sont de petits commutateurs moléculaires, dont chacun peut changer spontanément entre plusieurs états. Comprendre ce comportement de commutation est important pour comprendre comment la fonction émerge, et donc, également important pour les applications.
"Le problème est vraiment qu'on ne pourra jamais simuler toutes les configurations possibles de ces interrupteurs, ", dit le Dr Simon Olsson. "Ils sont tout simplement trop nombreux, ils croissent exponentiellement vite. Disons qu'un commutateur a deux états, deux commutateurs peuvent être dans quatre réglages, trois interrupteurs sur huit. Une fois que vous avez 200 commutateurs, le nombre de paramètres est égal au nombre d'atomes dans l'univers connu."
Reformuler les simulations pour utiliser les blocs de construction locaux et apprendre comment ils sont couplés rompt cette échelle défavorable et rend possible des simulations de grandes protéines. Cet apprentissage se fait avec des méthodes d'intelligence artificielle (IA) moderne. Simon Olsson explique, « Bien qu'il semble plus compliqué de modéliser de nombreux blocs de construction plutôt qu'un seul état de configuration, il s'avère que nous pouvons utiliser les idées de l'IA pour que les ordinateurs apprennent un « réseau social » des éléments constitutifs et l'utilisent pour comprendre leur comportement. »
Connaître ce réseau social des briques protéiques s'avère avoir plusieurs avantages. Le Dr Frank Noé explique, "Déterminer ce réseau ne nous oblige pas à voir toutes les configurations possibles du système moléculaire, pourtant, une fois que nous avons le réseau, nous pouvons les caractériser!" Le réseau social des protéines distille l'essentiel sur le fonctionnement des protéines, et fait ainsi des progrès significatifs vers la réduction de l'empreinte informatique déterminant la fonction des protéines.