Les projets visant à unir les capacités de deux installations technologiques de pointe promettent d’inaugurer une nouvelle ère de biologie structurale dynamique. Grâce à l'initiative d'infrastructure de recherche intégrée, ou IRI, du DOE, les installations compléteront leurs technologies respectives dans la poursuite de la science, même si elles sont distantes de près de 2 500 miles.
La source de lumière cohérente Linac, ou LCLS, située au laboratoire national des accélérateurs SLAC du DOE en Californie, révèle la dynamique structurelle des atomes et des molécules grâce à des instantanés de rayons X délivrés par un accélérateur linéaire à des échelles de temps ultrarapides.
Avec le lancement l'année dernière de la mise à niveau LCLS-II, le nombre maximum de ses instantanés passera de 120 impulsions par seconde à 1 million d'impulsions par seconde, fournissant ainsi un nouvel outil puissant pour l'investigation scientifique. Cela signifie également que les chercheurs produiront des quantités beaucoup plus importantes de données à analyser.
Frontier, le supercalculateur scientifique le plus puissant au monde, a été lancé en 2022 au laboratoire national d'Oak Ridge du DOE, dans le Tennessee. En tant que premier système de classe exascale, capable d'effectuer un quintillion ou plus de calculs par seconde, il exécute des simulations d'une échelle et d'une résolution sans précédent.
Dans le cadre de l'IRI, une équipe de l'ORNL et du SLAC est en train d'établir un portail de données qui permettra à Frontier de traiter les résultats des expériences menées par LCLS-II. Les scientifiques et les utilisateurs du LCLS exploiteront la puissance de calcul d'ORNL pour étudier leurs données, effectuer des simulations et éclairer plus rapidement leurs expériences en cours, le tout dans un cadre transparent.
Les développeurs derrière ce flux de travail synergique visent à en faire une feuille de route pour les futures collaborations scientifiques dans les installations du DOE, et ils décrivent ce flux de travail dans un article publié dans Current Opinion in Structural Biology. . Les auteurs comprennent les chercheurs Sandra Mous, Fred Poitevin et Mark Hunter du SLAC, ainsi que Dilip Asthagiri et Tom Beck de l'ORNL.
"Il s'agit véritablement d'une période passionnante de croissance rapide simultanée des installations expérimentales telles que LCLS-II et du calcul exascale avec Frontier. Notre article résume les récents progrès expérimentaux et de simulation dans les études au niveau atomique de la dynamique biomoléculaire et présente une vision pour l'intégration de ces développements, " a déclaré Beck, chef de section de l'engagement scientifique au Centre national des sciences informatiques du DOE à l'ORNL.
La collaboration a germé grâce à des discussions entre Beck et Hunter sur la mission commune de leurs laboratoires de s'attaquer aux « grandes » sciences et sur la manière de mettre en commun leurs ressources.
"Nous avons ces incroyables supercalculateurs qui seront mis en ligne, à commencer par l'ORNL, et le nouvel accélérateur linéaire supraconducteur à fréquence d'impulsion élevée du LCLS sera transformateur en termes de type de données que nous pourrons collecter. Il est difficile de capturer ces données, mais maintenant nous disposons d'une informatique à une échelle qui peut en assurer le suivi.
"Si vous associez ces deux éléments, la vision que nous essayons de montrer est que cette combinaison va être transformatrice pour les biosciences et d'autres sciences à l'avenir", a déclaré Hunter, scientifique principal au LCLS et chef de son département des sciences biologiques.
Lorsque le LCLS original a commencé ses opérations en 2009, il présentait une technologie révolutionnaire pour étudier les arrangements atomiques de molécules telles que les protéines ou les acides nucléiques :les lasers à électrons libres à rayons X, ou XFEL. Par rapport aux méthodes précédentes utilisant des sources de lumière synchrotron, les XFEL augmentent considérablement la luminosité, ce qui signifie que davantage de photons à rayons X sont utilisés pour sonder l'échantillon.
De plus, ces rayons X sont envoyés sous forme d'impulsions lumineuses laser qui ne durent que quelques dizaines de femtosecondes, ce qui est beaucoup plus compressé dans le temps par rapport aux autres sources lumineuses.
Bien que les rayons X fournissent la résolution spatiale nécessaire pour comprendre où se trouvent les atomes dans l’espace, ils sont également des rayonnements ionisants et sont donc intrinsèquement dommageables aux structures mêmes que les scientifiques tentent de comprendre. Plus l'exposition est longue, plus l'échantillon est endommagé.
"Historiquement, toutes ces déterminations de structure étaient une course. Pouvez-vous obtenir les informations dont vous avez besoin avec une résolution spatiale suffisamment élevée pour en donner un sens avant de dégrader cet échantillon avec les rayons X au point où il n'est plus représentatif ? " » dit Hunter.
"LCLS a fait apparaître tous les rayons X plus rapidement que la molécule ne peut y réagir, et ainsi la course entre la collecte d'informations et l'endommagement de la structure a été interrompue :l'échantillon ne peut pas être endommagé dans le temps qu'un seul LCLS le pouls arrive."
Grâce à la capacité du LCLS-II à prendre rapidement beaucoup plus de clichés radiographiques d'un échantillon, il peut être capable de capturer des événements rares qui autrement pourraient être inobservables.
"Il existe des états de courte durée très importants en biologie, que malheureusement nous ne captons pas toujours à l'heure actuelle en raison de leur durée de vie limitée", a déclaré Mous, scientifique associé au SLAC et auteur principal de l'article de l'équipe.
"Mais avec LCLS-II, nous pourrions vraiment être en mesure de prendre beaucoup plus d'instantanés, ce qui nous permettrait d'observer ces événements rares et d'avoir une bien meilleure compréhension de la dynamique et du mécanisme des biomolécules."
Dans une expérience typique, le LCLS original pouvait transmettre 120 impulsions de rayons X par seconde à des échantillons, générant ainsi environ 120 images par seconde, soit 1 à 10 Go de données d'image par seconde, le tout géré par l'infrastructure informatique interne du SLAC. .
Grâce aux capacités étendues du nouvel accélérateur linéaire supraconducteur, il peut potentiellement envoyer 1 million d'impulsions de rayons X par seconde à des échantillons, créant ainsi jusqu'à 1 téraoctet de données d'image par seconde.
"C'est au moins 1 000 fois ce que nous faisons aujourd'hui, donc avec la quantité de données que nous sommes habitués à traiter au cours de la semaine, nous devons désormais le faire en une heure. Et nous ne pouvons plus le faire localement. Il y aura Il y aura des rafales où nous devrons envoyer les données quelque part où nous pourrons réellement les étudier, sinon nous les perdrons", a déclaré Poitevin, scientifique de la division Systèmes de données du LCLS.
Poitevin dirige le développement des outils informatiques pour l'infrastructure de données du LCLS, y compris l'interface de programmation d'applications pour le nouveau portail de données, dont les tests ont commencé plus tôt cette année sur le supercalculateur de génération précédente de l'ORNL, Summit.
Summit et Frontier sont tous deux gérés par Oak Ridge Leadership Computing Facility, qui est une installation utilisateur du DOE Office of Science située à ORNL. Le projet s'est vu attribuer du temps de calcul sur Summit via le programme SummitPLUS du DOE, qui prolonge le fonctionnement du supercalculateur jusqu'en octobre 2024 avec 108 projets couvrant toute la gamme de la recherche scientifique.
"Grâce aux capacités de taux de répétition élevées du nouvel accélérateur linéaire, les expériences se déroulent désormais à un rythme beaucoup plus rapide. Nous devons intégrer des commentaires qui seront utiles aux utilisateurs, et nous ne pouvons pas nous permettre d'attendre une semaine. car l'expérience risque de ne durer que quelques jours", a déclaré Poitevin.
"Nous devons boucler la boucle entre l'analyse et le contrôle de l'expérience. Comment pouvons-nous diffuser les résultats de notre analyse à travers le pays, puis rapporter les informations nécessaires juste à temps pour prendre les bonnes décisions ?"
C'est le point central du nouveau flux de travail dans lequel Asthagiri et Beck, scientifiques biomédicaux seniors, interviennent. Asthagiri, qui fait partie du groupe Informatique avancée pour les sciences de la vie et l'ingénierie de l'ORNL, se spécialise dans les simulations biomoléculaires.
La puissance de calcul de Frontier lui permettra de développer des méthodes de calcul avec les données LCLS-II qui permettront de renvoyer rapidement des informations opportunes aux scientifiques du SLAC.
"La correspondance quasi-univoque entre les expériences XFEL et les simulations de dynamique moléculaire ouvre des possibilités intéressantes", a déclaré Asthagiri.
"Par exemple, les simulations fournissent des informations sur la réponse des macromolécules à des conditions externes variables, et cela peut être sondé dans les expériences. De même, essayer de capturer les états conformationnels observés expérimentalement peut éclairer les modèles de simulation."
LCLS-II est actuellement en cours de mise en service, mais Hunter estime que les recherches biologiques de l'instrument s'intensifieront dans environ trois ans, et l'équipe utilisera entre-temps le portail de données vers ORNL pour plusieurs projets.
Grâce à la capacité considérablement améliorée du LCLS-II à capturer une gamme de mouvements moléculaires et à l'analyse des données de Frontier, Hunter est confiant dans l'impact du projet sur la science. Par exemple, acquérir une nouvelle compréhension de la dynamique structurelle des protéines pourrait accélérer le développement de cibles médicamenteuses ou conduire à l'identification de molécules associées à une maladie qui pourraient être traitées avec un médicament particulier.
"Cela peut ouvrir une toute nouvelle façon d'essayer de concevoir des produits thérapeutiques. Chaque instant différent d'une biomolécule pourrait être médicamentable indépendamment si vous compreniez à quoi ressemble cette molécule ou si vous saviez ce qu'elle fait", a déclaré Hunter.
"Ou si vous optiez pour la biologie synthétique ou les applications bio-industrielles, peut-être que comprendre certaines parties des fluctuations de ces molécules pourrait vous aider à concevoir un meilleur catalyseur."
Réaliser de telles avancées scientifiques nécessite une intégration étroite entre les installations spécialisées, et Hunter attribue la cohésion des équipes à l'IRI.
"Nous avons besoin du soutien de l'IRI pour que cela se réalise, car de telles collaborations ne fonctionneront pas si toutes les installations parlent une langue différente. Et je pense que ce que l'IRI apporte, c'est ce langage commun que nous devons construire", a-t-il déclaré.
Plus d'informations : Sandra Mous et al, La biologie structurale à l'ère des lasers à électrons libres à rayons X et de l'informatique exascale, Opinion actuelle en biologie structurale (2024). DOI :10.1016/j.sbi.2024.102808
Fourni par le Laboratoire national d'Oak Ridge