• Home
  • Chimie
  • Astronomie
  • Énergie
  • La nature
  • Biologie
  • Physique
  • Électronique
  •  science >> Science >  >> Chimie
    Le système de notation permet aux scientifiques de communiquer plus facilement les polymères

    Dans BigSMILES, les fragments polymères sont représentés par une liste d'unités répétitives entourées d'accolades. Les structures chimiques des unités répétitives sont codées en utilisant la syntaxe SMILES normale, mais avec des descripteurs de liaison supplémentaires qui spécifient comment les différentes unités répétitives sont connectées pour former des polymères. Cette conception simple de la syntaxe permettrait le codage de macromolécules sur un large éventail de chimies. Crédit :Tzyy-Shyang Lin

    Avoir un compact, pourtant robuste, Un identifiant ou un système de représentation basé sur la structure pour les structures moléculaires est un facteur clé permettant un partage et une diffusion efficaces des résultats au sein de la communauté des chercheurs. De tels systèmes jettent également les bases essentielles de l'apprentissage automatique et d'autres recherches basées sur les données. Alors que des progrès substantiels ont été réalisés pour les petites molécules, la communauté des polymères a eu du mal à trouver un système de représentation efficace.

    Pour les petites molécules, le postulat de base est que chaque espèce chimique distincte correspond à une structure chimique bien définie. Cela ne vaut pas pour les polymères. Les polymères sont des molécules intrinsèquement stochastiques qui sont souvent des ensembles avec une distribution de structures chimiques. Cette difficulté limite l'applicabilité de toutes les représentations déterministes développées pour les petites molécules. Dans un article publié le 12 septembre dans ACS Science centrale , chercheurs du MIT, Université de Duke, et Northwestern University rapportent un nouveau système de représentation capable de gérer la nature stochastique des polymères, appelé BigSMILES.

    "BigSMILES relève un défi important dans la représentation numérique des polymères, " explique Connor Coley Ph.D. '19, co-auteur de l'article. « Les polymères sont presque toujours des ensembles de structures chimiques multiples, généré par des processus stochastiques, nous ne pouvons donc pas utiliser les mêmes stratégies pour écrire leurs structures que pour les petites molécules."

    Les co-auteurs sont Coley; professeur agrégé de génie chimique Bradley D. Olsen au MIT; Warren K. Lewis Professeur de génie chimique Klavs F. Jensen au MIT; professeur adjoint de chimie Julia A. Kalow à l'Université Northwestern; professeur agrégé de chimie Jeremiah A. Johnson au MIT; William T. Miller Professeur de chimie Stephen L. Craig à l'Université Duke; étudiant diplômé Eliot Woods à l'Université Northwestern; l'étudiant diplômé Zi Wang à l'Université Duke; l'étudiant diplômé Wencong Wang au MIT; l'étudiante diplômée Haley K. Beech au MIT; chercheur invité Hidenobu Mochigase au MIT; et l'étudiant diplômé Tzyy-Shyang Lin au MIT.

    Il existe plusieurs notations de ligne pour communiquer la structure moléculaire, avec le système d'entrée de ligne à entrée moléculaire simplifiée (SMILES) étant le plus populaire. SMILES est généralement considéré comme la variante la plus lisible par l'homme, avec de loin le support logiciel le plus large. En pratique, SMILES fournit un ensemble simple de représentations qui conviennent comme étiquettes pour les données chimiques et comme identifiant compact à mémoire pour l'échange de données entre chercheurs. En tant que système basé sur du texte, SMILES est également un complément naturel à de nombreux algorithmes d'apprentissage automatique basés sur du texte. Ces caractéristiques ont fait de SMILES un outil parfait pour traduire les connaissances en chimie sous une forme conviviale pour les machines, et il a été appliqué avec succès pour la prédiction de propriétés de petites molécules et la planification de synthèse assistée par ordinateur.

    Polymères, cependant, ont résisté à la description par ce langage et d'autres langages structurels. En effet, la plupart des langages structurels tels que SMILES ont été conçus pour décrire des molécules ou des fragments chimiques qui sont des graphes atomistiques bien définis. Les polymères étant des molécules stochastiques, ils n'ont pas de représentations SMILES uniques. Cette absence d'une convention de dénomination ou d'identification unifiée pour les matériaux polymères est l'un des principaux obstacles qui ralentissent le développement du domaine de l'informatique des polymères. Tout en faisant œuvre de pionnier dans le domaine de l'informatique des polymères, comme le Polymer Genome Project, ont démontré l'utilité des extensions SMILES en informatique des polymères, le développement rapide de la nouvelle chimie et le développement rapide de l'informatique des matériaux et de la recherche axée sur les données rendent important le besoin d'une convention de dénomination universellement applicable pour les polymères.

    « L'apprentissage automatique offre une énorme opportunité d'accélérer le développement et la découverte de produits chimiques, " dit Lin He, directeur adjoint par intérim de la division de chimie de la National Science Foundation (NSF). "Cet outil élargi pour étiqueter les structures, spécifiquement conçu pour relever les défis uniques inhérents aux polymères, améliore considérablement la recherche des données structurelles chimiques, et nous rapproche un peu plus de l'exploitation de la révolution des données."

    Les chercheurs ont créé une nouvelle construction basée sur la structure en complément de la représentation SMILES très réussie qui peut traiter la nature aléatoire des matériaux polymères. Les polymères étant des molécules de masse molaire élevée, cette construction est nommée BigSMILES. Dans BigSMILES, les fragments polymères sont représentés par une liste d'unités répétitives entourées d'accolades. Les structures chimiques des unités répétitives sont codées en utilisant la syntaxe SMILES normale, mais avec des descripteurs de liaison supplémentaires qui spécifient comment les différentes unités répétitives sont connectées pour former des polymères. Cette conception simple de la syntaxe permettrait le codage de macromolécules sur un large éventail de chimies différentes, y compris homopolymère, copolymères statistiques et copolymères à blocs, et une variété de connectivité moléculaire, allant des polymères linéaires aux polymères cycliques et même aux polymères ramifiés. Comme dans SOURIRE, Les représentations BigSMILES sont compactes, chaînes de texte autonomes.

    "La standardisation de la représentation numérique des structures polymères avec BigSMILES encouragera le partage et l'agrégation des données polymères, améliorer la qualité du modèle dans le temps et renforcer les bénéfices de son utilisation, " dit Jason Clark, le leader des matériaux dans l'innovation ouverte pour les produits chimiques et les matériaux renouvelables à Braskem, qui n'était pas associé à la recherche. "BigSMILES est une contribution significative au domaine en ce sens qu'il répond au besoin d'un système flexible pour représenter numériquement des structures polymères complexes."

    Clark ajoute, « Les défis auxquels est confrontée l'industrie du plastique dans le contexte de l'économie circulaire commencent par la source des matières premières et se poursuivent tout au long de la gestion de la fin de vie. Relever ces défis nécessite la conception innovante de matériaux à base de polymères, qui a traditionnellement souffert de longs cycles de développement. Les progrès de l'intelligence artificielle et de l'apprentissage automatique se sont révélés prometteurs pour accélérer le cycle de développement d'applications utilisant des alliages métalliques et de petites molécules organiques, motivant l'industrie des plastiques à rechercher une approche parallèle." Les représentations numériques BigSMILES facilitent l'évaluation des relations structure-performance par l'application de méthodes de science des données, il dit, accélérer à terme la convergence vers les structures ou compositions polymères qui contribueront à permettre l'économie circulaire.

    "Une multitude de structures polymères complexes peuvent être construites grâce à la composition de trois nouveaux opérateurs de base et de symboles SMILES originaux, " dit Olsen, "Des domaines entiers de la chimie, la science des matériaux, et ingénierie, y compris la science des polymères, biomatériaux, chimie des matériaux, et une grande partie de la biochimie, sont basées sur des macromolécules qui ont des structures stochastiques. Cela peut fondamentalement être considéré comme un nouveau langage pour écrire la structure de grosses molécules. »

    "L'une des choses qui m'enthousiasme est de savoir comment la saisie des données pourrait éventuellement être directement liée aux méthodes de synthèse utilisées pour fabriquer un polymère particulier, " dit Craig, "À cause de ça, il est possible de capturer et de traiter plus d'informations sur les molécules que ce qui est généralement disponible à partir des caractérisations standard. Si cela peut être fait, il permettra toutes sortes de découvertes."

    Cette histoire est republiée avec l'aimable autorisation de MIT News (web.mit.edu/newsoffice/), un site populaire qui couvre l'actualité de la recherche du MIT, innovation et enseignement.




    © Science https://fr.scienceaq.com