Crédit :CC0 Domaine public
Les chercheurs ont conçu un algorithme d'apprentissage automatique pour la découverte de médicaments qui s'est avéré deux fois plus efficace que la norme de l'industrie, ce qui pourrait accélérer le processus de développement de nouveaux traitements contre la maladie.
Les chercheurs, dirigé par l'Université de Cambridge, ont utilisé leur algorithme pour identifier quatre nouvelles molécules qui activent une protéine considérée comme pertinente pour les symptômes de la maladie d'Alzheimer et de la schizophrénie. Les résultats sont publiés dans le journal PNAS .
Un problème clé dans la découverte de médicaments est de prédire si une molécule activera un processus physiologique particulier. Il est possible de construire un modèle statistique en recherchant des modèles chimiques partagés entre les molécules connues pour activer ce processus, mais les données pour construire ces modèles sont limitées car les expériences sont coûteuses et on ne sait pas quels modèles chimiques sont statistiquement significatifs.
"L'apprentissage automatique a fait des progrès significatifs dans des domaines tels que la vision par ordinateur où les données sont abondantes, " a déclaré le Dr Alpha Lee du laboratoire Cavendish de Cambridge, et l'auteur principal de l'étude. « La prochaine frontière est constituée par les applications scientifiques telles que la découverte de médicaments, où la quantité de données est relativement limitée, mais nous avons des connaissances physiques sur le problème, et la question devient de savoir comment marier les données avec la chimie et la physique fondamentales."
L'algorithme développé par Lee et ses collègues, en collaboration avec la société biopharmaceutique Pfizer, utilise les mathématiques pour séparer les modèles chimiques pharmacologiquement pertinents de ceux qui ne le sont pas.
Surtout, l'algorithme regarde à la fois les molécules connues pour être actives et les molécules connues pour être inactives, et apprend à reconnaître quelles parties des molécules sont importantes pour l'action des médicaments et quelles parties ne le sont pas. Un principe mathématique connu sous le nom de théorie des matrices aléatoires donne des prédictions sur les propriétés statistiques d'un ensemble de données aléatoire et bruyant, qui est ensuite comparé aux statistiques des caractéristiques chimiques des molécules actives/inactives pour distiller quels modèles chimiques sont vraiment importants pour la liaison par opposition à l'apparition simplement par hasard.
Cette méthodologie permet aux chercheurs de rechercher des modèles chimiques importants non seulement à partir de molécules actives, mais aussi de molécules inactives, c'est-à-dire les expériences ratées peuvent maintenant être exploitées avec cette technique.
Les chercheurs ont construit un modèle à partir de 222 molécules actives, et ont pu cribler par ordinateur six millions de molécules supplémentaires. De là, les chercheurs ont acheté et sélectionné les 100 molécules les plus pertinentes. De ces, ils ont identifié quatre nouvelles molécules qui activent le récepteur CHRM1, une protéine qui peut être pertinente pour la maladie d'Alzheimer et la schizophrénie.
"La capacité de repêcher quatre molécules actives sur six millions, c'est comme trouver une aiguille dans une botte de foin, " a déclaré Lee. " Une comparaison directe montre que notre algorithme est deux fois plus efficace que la norme de l'industrie. "
La fabrication de molécules organiques complexes est un défi important en chimie, et les médicaments potentiels abondent dans l'espace des molécules encore infaisables. Les chercheurs de Cambridge développent actuellement des algorithmes qui prédisent des façons de synthétiser des molécules organiques complexes, ainsi que d'étendre la méthodologie d'apprentissage automatique à la découverte de matériaux.
La recherche a été financée par le programme Winton pour la physique de la durabilité.