Crédit :Pixabay/CC0 domaine public
Les ordinateurs sont capables de traiter rapidement des images 2D depuis un certain temps. Votre téléphone portable peut prendre des photos numériques et les manipuler de plusieurs manières. Beaucoup plus difficile, cependant, traite une image en trois dimensions, et le faire en temps opportun. Les mathématiques sont plus complexes, et calculant ces chiffres, même sur un supercalculateur, prend du temps.
C'est le défi qu'un groupe de scientifiques du laboratoire national d'Argonne du département américain de l'Énergie (DOE) s'efforce de relever. L'intelligence artificielle s'est imposée comme une solution polyvalente aux problèmes posés par le traitement des mégadonnées. Pour les scientifiques qui utilisent la source avancée de photons (APS), une installation d'utilisateurs du DOE Office of Science à Argonne, traiter des images 3D, c'est peut-être la clé pour rendre les données radiographiques visibles, formes compréhensibles à un rythme beaucoup plus rapide. Une percée dans ce domaine pourrait avoir des implications pour l'astronomie, la microscopie électronique et d'autres domaines de la science dépendant de grandes quantités de données 3D.
"Afin de tirer pleinement parti de ce dont l'APS mis à niveau sera capable, nous devons réinventer l'analyse des données. Nos méthodes actuelles ne suffisent pas à suivre le rythme. L'apprentissage automatique peut exploiter pleinement et aller au-delà de ce qui est actuellement possible, " dit Mathew Cherukara du Laboratoire National d'Argonne
L'équipe de recherche, qui comprend des scientifiques de trois divisions d'Argonne, a développé un nouveau cadre de calcul appelé 3D-CDI-NN, et a montré qu'il peut créer des visualisations 3D à partir des données collectées à l'APS des centaines de fois plus rapidement que les méthodes traditionnelles. Les recherches de l'équipe ont été publiées dans Examens de physique appliquée , une publication de l'Institut américain de physique.
CDI signifie imagerie par diffraction cohérente, une technique de rayons X qui consiste à faire rebondir des faisceaux de rayons X ultra-lumineux sur des échantillons. Ces faisceaux lumineux seront ensuite collectés par des détecteurs sous forme de données, et il faut un certain effort de calcul pour transformer ces données en images. Une partie du défi, explique Mathew Cherukara, responsable du groupe Computational X-ray Science de la division X-ray Science (XSD) d'Argonne, est que les détecteurs ne capturent qu'une partie des informations des faisceaux.
Mais il y a des informations importantes contenues dans les données manquantes, et les scientifiques comptent sur les ordinateurs pour remplir ces informations. Comme le note Cherukara, alors que cela prend un certain temps à faire en 2D, cela prend encore plus de temps à faire avec des images 3D. La solution, alors, est d'entraîner une intelligence artificielle à reconnaître les objets et les changements microscopiques qu'ils subissent directement à partir des données brutes, sans avoir à remplir les informations manquantes.
Pour faire ça, l'équipe a commencé avec des données de rayons X simulées pour entraîner le réseau neuronal. Le NN dans le titre du framework, un réseau de neurones est une série d'algorithmes qui peuvent apprendre à un ordinateur à prédire les résultats en fonction des données qu'il reçoit. Henri Chan, l'auteur principal de l'article et chercheur postdoctoral au Centre des matériaux à l'échelle nanométrique (CNM), une installation d'utilisateurs du DOE Office of Science à Argonne, dirigé cette partie des travaux.
"Nous avons utilisé des simulations informatiques pour créer des cristaux de différentes formes et tailles, et nous les avons convertis en images et modèles de diffraction pour que le réseau de neurones puisse apprendre, " a déclaré Chan. "La facilité de générer rapidement de nombreux cristaux réalistes pour l'entraînement est l'avantage des simulations."
Ce travail a été réalisé à l'aide des ressources de l'unité de traitement graphique du Laboratoire commun d'évaluation des systèmes d'Argonne, qui déploie des bancs d'essai de pointe pour permettre la recherche sur les plateformes et les capacités émergentes de calcul haute performance.
Une fois le réseau formé, dit Stephan Hruszkewycz, physicien et chef de groupe à la Division Science des Matériaux d'Argonne, cela peut être assez proche de la bonne réponse, assez rapidement. Cependant, il y a encore de la place pour le raffinement, le framework 3D-CDI-NN inclut donc un processus pour amener le réseau jusqu'au bout. Hruszkewycz, avec Saugat Kandel, étudiant diplômé de la Northwestern University, travaillé sur cet aspect du projet, ce qui réduit le besoin d'étapes itératives chronophages.
"La Division des sciences des matériaux se soucie de la diffraction cohérente parce que vous pouvez voir les matériaux à des échelles de quelques nanomètres, environ 100, 000 fois plus petit que la largeur d'un cheveu humain - avec des rayons X qui pénètrent dans les environnements, " a déclaré Hruszkewycz. " Cet article est une démonstration de ces méthodes avancées, et il facilite grandement le processus d'imagerie. Nous voulons savoir ce qu'est un matériau, et comment il évolue au fil du temps, et cela nous aidera à en faire de meilleures photos au fur et à mesure que nous prendrons des mesures."
Comme dernière étape, La capacité de 3D-CDI-NN à remplir les informations manquantes et à proposer une visualisation 3D a été testée sur des données de rayons X réelles de minuscules particules d'or, collectées à la ligne 34-ID-C de l'APS. Le résultat est une méthode de calcul des centaines de fois plus rapide sur les données simulées, et presque aussi vite sur des données APS réelles. Les tests ont également montré que le réseau peut reconstruire des images avec moins de données qu'il n'en faut habituellement pour compenser les informations non captées par les détecteurs.
La prochaine étape de cette recherche, selon Chan, est d'intégrer le réseau dans le workflow de l'APS, afin qu'il apprenne des données au fur et à mesure qu'il est pris. Si le réseau apprend à partir des données de la ligne de lumière, il a dit, il s'améliorera continuellement.
Pour cette équipe, il y a aussi un élément temporel dans cette recherche. Comme Cherukara le souligne, une mise à niveau massive de l'APS est en cours, et la quantité de données générées maintenant augmentera de façon exponentielle une fois le projet terminé. L'APS amélioré générera des faisceaux de rayons X jusqu'à 500 fois plus lumineux, et la cohérence du faisceau - la caractéristique de la lumière qui lui permet de diffracter d'une manière qui code plus d'informations sur l'échantillon - sera considérablement augmentée.
Cela signifie que même s'il faut maintenant deux à trois minutes pour rassembler des données d'imagerie de diffraction cohérentes à partir d'un échantillon et obtenir une image, la partie collecte de données de ce processus sera bientôt jusqu'à 500 fois plus rapide. Le processus de conversion de ces données en une image utilisable doit également être des centaines de fois plus rapide qu'il ne l'est actuellement.
"Afin de tirer pleinement parti de ce dont l'APS mis à niveau sera capable, nous devons réinventer l'analyse des données, " Cherukara a déclaré. "Nos méthodes actuelles ne suffisent pas à suivre. L'apprentissage automatique peut tirer pleinement parti de ce qui est actuellement possible et aller au-delà de ce qui est actuellement possible."
En plus de Chan, Cherukara et Hruszkewycz, les auteurs de l'article incluent Subramanian Sankaranarayanan et Ross Harder, tous deux d'Argonne; Youssef Nashed du Laboratoire national des accélérateurs SLAC ; et Saugat Kandel de l'Université Northwestern.