Crédit :Université d'État de l'Oregon
Les cages nanométriques peuvent jouer un rôle important dans la réduction de la consommation d'énergie dans la science et l'industrie, et la recherche en apprentissage automatique à l'Oregon State University vise à accélérer le déploiement de ces molécules remarquables.
Les molécules de cage organique poreuse étudiées à l'OSU sont capables de capturer sélectivement des molécules de gaz, permettant potentiellement d'énormes économies d'énergie dans la myriade de séparations de gaz réalisées dans le secteur chimique.
"Ces solides moléculaires poreux sont comme des éponges qui absorbent les gaz avec discernement, " dit Cory Simon, professeur adjoint de génie chimique et auteur correspondant d'une étude publiée dans ACS Science centrale .
Ensemble, la séparation et la purification des mélanges chimiques sont responsables de plus de 10 % de la consommation énergétique mondiale.
Les molécules de cage poreuse ont des cavités nanométriques intrinsèques à leur structure, et les molécules de gaz sont attirées et piégées dans ces cavités par adsorption.
"Mais chaque cage adsorbe certains gaz plus facilement que d'autres, et cette propriété rend potentiellement les cages utiles pour séparer les mélanges gazeux de manière plus économe en énergie, " dit Simon.
Cependant, il y a des milliers de ces molécules cages qui pourraient être synthétisées - même pour en fabriquer une et tester ses propriétés prend des mois en laboratoire - et des centaines de séparations chimiques différentes sont nécessaires dans l'industrie; d'où la nécessité d'une approche informatique pour trier les possibilités et trouver la meilleure molécule pour le travail à accomplir.
Simon a exploité l'idée que la forme d'une cavité donnée est responsable des molécules de gaz qu'elle attire le plus facilement.
Simon et les étudiants Arni Sturluson, Melanie Huynh et Arthur York ont utilisé une méthode d'apprentissage automatique « non supervisée » pour catégoriser et regrouper les molécules de cage en fonction de la forme de leur cavité et, Donc, propriétés d'adsorption.
Non supervisé signifie que l'ordinateur a appris seul les relations forme/propriété; il n'a reçu aucune étiquette pour l'instruire.
"Il suffit de montrer les données à l'algorithme, et il trouve automatiquement des modèles (structure) dans les données, " dit Simon.
Les chercheurs ont utilisé un ensemble de données d'entraînement de 74 molécules de cage organique poreuse synthétisées expérimentalement qui ont chacune été numérisées par ordinateur, résultant en une image 3-D de "porosité" de chacun similaire à une image générée par un scanner.
« Sur la base de ces images 3D, nous nous sommes inspirés d'un algorithme de reconnaissance faciale, visages propres, regrouper des cages avec des cavités de forme similaire, " dit-il. " En utilisant la décomposition en valeur singulière, nous avons codé les images 3D des cages dans des vecteurs de dimension inférieure."
Simon explique le processus en utilisant l'analogie des visages des gens.
"Imaginez que vous ayez été obligé de cartographier le visage de tout le monde sur un point dans un nuage de points en deux dimensions tout en préservant autant d'informations que possible sur les visages, " dit-il. " Ainsi, chaque visage est décrit par seulement deux chiffres, et les visages d'apparence similaire sont regroupés à proximité dans le nuage de points. Essentiellement, la décomposition en valeur singulière a effectué cet encodage, mais pour les molécules en cage poreuses."
La recherche a démontré que l'encodage appris capture les caractéristiques saillantes des cavités des cages poreuses et peut prédire les propriétés des cages liées à la forme de la cavité.
"Nos méthodes pourraient être appliquées pour apprendre des représentations latentes de cavités au sein d'autres classes de matériaux poreux et de formes de molécules en général, " dit Simon.