Crédit :domaine public CC0
Au cours des dernières décennies, très peu de nouveaux antibiotiques ont été développés, en grande partie parce que les méthodes actuelles de dépistage de médicaments potentiels sont extrêmement coûteuses et chronophages. Une nouvelle stratégie prometteuse consiste à utiliser des modèles informatiques, qui offrent un moyen potentiellement plus rapide et moins cher d'identifier de nouveaux médicaments.
Une nouvelle étude du MIT révèle le potentiel et les limites d'une telle approche informatique. À l'aide de structures protéiques générées par un programme d'intelligence artificielle appelé AlphaFold, les chercheurs ont exploré si les modèles existants pouvaient prédire avec précision les interactions entre les protéines bactériennes et les composés antibactériens. Si tel est le cas, les chercheurs pourraient alors commencer à utiliser ce type de modélisation pour effectuer des criblages à grande échelle de nouveaux composés ciblant des protéines auparavant non ciblées. Cela permettrait le développement d'antibiotiques dotés de mécanismes d'action sans précédent, une tâche essentielle pour faire face à la crise de la résistance aux antibiotiques.
Cependant, les chercheurs, dirigés par James Collins, professeur Termeer d'ingénierie médicale et de sciences à l'Institut d'ingénierie et de sciences médicales (IMES) et au Département d'ingénierie biologique du MIT, ont constaté que ces modèles existants ne fonctionnaient pas bien à cette fin. En fait, leurs prédictions n'ont guère mieux fonctionné que le hasard.
"Des percées telles qu'AlphaFold élargissent les possibilités d'efforts de découverte de médicaments in silico, mais ces développements doivent être associés à des avancées supplémentaires dans d'autres aspects de la modélisation qui font partie des efforts de découverte de médicaments", a déclaré Collins. "Notre étude témoigne à la fois des capacités actuelles et des limites actuelles des plates-formes informatiques pour la découverte de médicaments."
Dans leur nouvelle étude, les chercheurs ont pu améliorer les performances de ces types de modèles, connus sous le nom de simulations d'amarrage moléculaire, en appliquant des techniques d'apprentissage automatique pour affiner les résultats. Cependant, d'autres améliorations seront nécessaires pour tirer pleinement parti des structures protéiques fournies par AlphaFold, selon les chercheurs.
Collins est l'auteur principal de l'étude, qui paraît aujourd'hui dans la revue Molecular Systems Biology . Les post-doctorants du MIT Felix Wong et Aarti Krishnan sont les principaux auteurs de l'article.
Interactions moléculaires
La nouvelle étude fait partie d'un effort récemment lancé par le laboratoire de Collins appelé Antibiotics-AI Project, qui a pour objectif d'utiliser l'intelligence artificielle pour découvrir et concevoir de nouveaux antibiotiques.
AlphaFold, un logiciel d'IA développé par DeepMind et Google, a prédit avec précision les structures des protéines à partir de leurs séquences d'acides aminés. Cette technologie a suscité l'enthousiasme des chercheurs à la recherche de nouveaux antibiotiques, qui espèrent pouvoir utiliser les structures AlphaFold pour trouver des médicaments qui se lient à des protéines bactériennes spécifiques.
Pour tester la faisabilité de cette stratégie, Collins et ses étudiants ont décidé d'étudier les interactions de 296 protéines essentielles d'E. coli avec 218 composés antibactériens, y compris des antibiotiques tels que les tétracyclines.
Les chercheurs ont analysé comment ces composés interagissent avec les protéines d'E. coli à l'aide de simulations d'amarrage moléculaire, qui prédisent la force de liaison de deux molécules en fonction de leurs formes et de leurs propriétés physiques.
Ce type de simulation a été utilisé avec succès dans des études qui criblent un grand nombre de composés contre une cible protéique unique, afin d'identifier les composés qui se lient le mieux. Mais dans ce cas, où les chercheurs essayaient de cribler de nombreux composés contre de nombreuses cibles potentielles, les prédictions se sont avérées beaucoup moins précises.
En comparant les prédictions produites par le modèle avec les interactions réelles pour 12 protéines essentielles, obtenues à partir d'expériences en laboratoire, les chercheurs ont découvert que le modèle avait des taux de faux positifs similaires aux taux de vrais positifs. Cela suggère que le modèle n'a pas été en mesure d'identifier de manière cohérente les véritables interactions entre les médicaments existants et leurs cibles.
En utilisant une mesure souvent utilisée pour évaluer les modèles informatiques, connue sous le nom d'auROC, les chercheurs ont également constaté des performances médiocres. "En utilisant ces simulations d'amarrage moléculaire standard, nous avons obtenu une valeur auROC d'environ 0,5, ce qui signifie essentiellement que vous ne faites pas mieux que si vous deviniez au hasard", déclare Collins.
Les chercheurs ont trouvé des résultats similaires lorsqu'ils ont utilisé cette approche de modélisation avec des structures protéiques déterminées expérimentalement, au lieu des structures prédites par AlphaFold.
"AlphaFold semble faire à peu près aussi bien que les structures déterminées expérimentalement, mais nous devons faire un meilleur travail avec les modèles d'amarrage moléculaire si nous voulons utiliser AlphaFold efficacement et largement dans la découverte de médicaments", déclare Collins.
Meilleures prédictions
L'une des raisons possibles des mauvaises performances du modèle est que les structures protéiques introduites dans le modèle sont statiques, alors que dans les systèmes biologiques, les protéines sont flexibles et changent souvent de configuration.
Pour essayer d'améliorer le taux de réussite de leur approche de modélisation, les chercheurs ont exécuté les prédictions sur quatre modèles d'apprentissage automatique supplémentaires. Ces modèles sont formés sur des données qui décrivent comment les protéines et d'autres molécules interagissent les unes avec les autres, ce qui leur permet d'incorporer plus d'informations dans les prédictions.
"Les modèles d'apprentissage automatique apprennent non seulement les formes, mais aussi les propriétés chimiques et physiques des interactions connues, puis utilisent ces informations pour réévaluer les prédictions d'amarrage", explique Wong. "Nous avons constaté que si vous deviez filtrer les interactions à l'aide de ces modèles supplémentaires, vous pouvez obtenir un rapport plus élevé de vrais positifs et de faux positifs."
Cependant, des améliorations supplémentaires sont encore nécessaires avant que ce type de modélisation puisse être utilisé pour identifier avec succès de nouveaux médicaments, selon les chercheurs. Une façon d'y parvenir serait de former les modèles sur plus de données, y compris les propriétés biophysiques et biochimiques des protéines et leurs différentes conformations, et comment ces caractéristiques influencent leur liaison avec des composés médicamenteux potentiels.
Avec de nouvelles avancées, les scientifiques pourraient être en mesure d'exploiter la puissance des structures protéiques générées par l'IA pour découvrir non seulement de nouveaux antibiotiques, mais également des médicaments pour traiter diverses maladies, y compris le cancer, a déclaré Collins. "Nous sommes optimistes qu'avec l'amélioration des approches de modélisation et l'expansion de la puissance de calcul, ces techniques deviendront de plus en plus importantes dans la découverte de médicaments", dit-il. "Cependant, nous avons encore un long chemin à parcourir pour atteindre le plein potentiel de la découverte de médicaments in silico." Les chercheurs identifient de nouveaux médicaments à l'aide de prédictions d'apprentissage en profondeur interprétables