Crédit :CC0 Domaine public
Les chercheurs ont développé un processus qui pourrait réduire considérablement le travail impliqué dans la conception informatique des protéines, selon une étude en Actes de l'Académie nationale des sciences .
La technique utilise des modèles structurels 3D pour projeter comment de nouvelles combinaisons de blocs moléculaires pourraient fonctionner ensemble pour obtenir l'effet souhaité.
L'avancement, qui se concentre sur un nombre relativement petit de sous-structures protéiques plutôt que sur le nombre infini de combinaisons au niveau atomique, pourrait faciliter le développement de nouveaux médicaments et matériaux.
"Lorsque vous concevez un bâtiment, vous n'avez pas nécessairement besoin de comprendre comment les grains de sable interagissent les uns avec les autres dans une brique, " a déclaré Gevorg Grigoryan, professeur agrégé d'informatique à Dartmouth et chercheur principal sur l'étude. "Parce que vous savez ce qu'est une brique et quelles sont ses propriétés, vous pouvez plutôt vous concentrer sur la façon dont les briques s'assemblent pour former la forme souhaitée. C'est la même approche que nous adoptons. Nous nous concentrons uniquement sur les sous-structures protéiques dont nous savons qu'elles fonctionnent. »
Les protéines sont le cheval de bataille du monde naturel. Les protéines nous aident à ressentir le monde qui nous entoure, digérer les aliments et former les défenses naturelles de l'organisme.
Pendant des années, les chercheurs se sont concentrés sur la création de protéines personnalisées qui peuvent être utiles dans le corps humain. Par exemple, des protéines personnalisées peuvent être utilisées pour développer des médicaments thérapeutiques pour lutter contre la maladie. Cependant, alors que de nombreux produits thérapeutiques comme l'insuline sont produits à partir de protéines naturelles, le domaine n'a pas avancé pour permettre le développement à grande échelle de protéines synthétiques.
Parmi les obstacles au développement de protéines synthétiques se trouve le nombre écrasant de combinaisons d'acides aminés possibles. Le tri des combinaisons pour en trouver une qui serait utile dans un scénario donné est un processus long et gourmand en ressources.
Les chercheurs qui développent de nouveaux médicaments se concentrent actuellement sur la façon dont des atomes spécifiques interagissent. Cette approche nécessite que les laboratoires créent de grandes bibliothèques de variantes pour en trouver une qui achèvera la tâche spécifiée. Bien que cela puisse produire des résultats utiles, les chercheurs ont trouvé difficile de construire des modèles atomiques qui ont des niveaux élevés de précision.
"Le nombre de séquences est pratiquement infini. Cela complique vraiment le processus de recherche d'une combinaison correcte pour répondre à un besoin thérapeutique spécifique, " dit Jianfu Zhou, un doctorat étudiant à Dartmouth qui a co-écrit le document de recherche.
Pour développer une approche optimisée de la conception de protéines, l'équipe de recherche a scanné une base de données des modèles 3D de 150, 000 protéines connues. L'équipe a découvert qu'un petit nombre de motifs structurels se reproduisaient fréquemment dans les protéines, et qu'une grande partie de la diversité de la structure des protéines provient de la façon dont ces éléments constitutifs sont combinés.
Cette découverte fondamentale a conduit l'équipe à émettre l'hypothèse qu'au lieu de modéliser les protéines comme des réseaux complexes d'atomes en interaction, ils peuvent à la place les représenter beaucoup plus simplement comme des groupements d'un ensemble limité de blocs de construction structurels.
Avec la nouvelle méthode, les nouvelles structures protéiques peuvent être plus facilement jugées par rapport aux modèles établis. L'approche permet aux chercheurs d'expérimenter facilement des conceptions plus créatives en leur offrant la possibilité de les comparer à une bibliothèque de structures connues.
"Cette technique élimine le défi d'obtenir la physique absolument juste à l'échelle atomique, faisant potentiellement de la conception informatique des protéines un processus beaucoup plus robuste. Nos découvertes devraient ouvrir grand les portes de l'apprentissage automatique dans la conception de protéines, " dit Grigorian.
Le nouveau processus se concentre sur les plus gros blocs d'atomes qui se produisent dans les protéines, appelés motifs tertiaires, pour concevoir des protéines fonctionnelles. Il s'agit d'arrangements structurels récurrents, similaires à une arche ou à une colonne dans un bâtiment, qui peuvent être appliqués à la conception de nouvelles protéines sans tenir compte de leur composition au niveau atomique.
Étant donné que les structures ne se rejoignent que de certaines manières, les chercheurs n'auraient plus besoin de faire des conjectures au niveau atomique. Les chercheurs se concentrent uniquement sur les blocs qui s'emboîtent, en ignorant les structures qui ne formeraient pas une protéine fonctionnelle.
Selon le document de recherche, les résultats « affirment fortement que la banque de données sur les protéines est désormais suffisamment grande pour permettre la conception de protéines en utilisant uniquement des exemples de motifs structuraux provenant de protéines non apparentées ».
En appliquant la nouvelle technique, l'équipe de recherche espère éliminer la redondance de la redécouverte des principes physiques dans la structure des protéines en s'appuyant simplement sur ces principes en premier lieu.