Crédit :Laboratoire national d'Oak Ridge
Alors que les architectures GPU sont devenues la norme pour le calcul scientifique, les équipes d'application ont dû moderniser leurs codes scientifiques pour qu'ils fonctionnent sur de nouveaux systèmes. Même les équipes dont les codes ont été repensés pour les GPU doivent continuellement les adapter aux nouvelles architectures.
Evan Schneider de l'Université de Princeton, bien que, a commencé à développer son code pour les GPU dès le départ. En 2012, Schneider a relevé le défi de trouver comment résoudre d'énormes problèmes d'astrophysique à l'aide de clusters GPU. Ce qui a commencé sur les petits clusters à l'Université d'Arizona avec son directeur de thèse, Brant Robertson, actuellement professeur agrégé à l'Université de Californie, Santa Cruz - a finalement été exécuté sur le supercalculateur Cray XK7 Titan, maintenant mis hors service, à l'Oak Ridge Leadership Computing Facility (OLCF), une installation d'utilisateurs du bureau des sciences du département américain de l'Énergie (DOE) située au laboratoire national d'Oak Ridge du DOE. Le code—appelé Cholla, ou Hydrodynamique computationnelle sur architectures (parallèles) - est maintenant l'un des premiers codes en cours de réécriture pour Frontier, un système exascale qui sera déployé à l'OLCF en 2021.
"Avec Frontière, il va y avoir tellement plus de puissance disponible sur les GPU, " a déclaré Schneider. " Cela n'a vraiment plus de sens de faire presque n'importe quoi sur les processeurs, donc une grande partie de ce sur quoi nous travaillons consiste à faire fonctionner certains de nos modules de physique supplémentaires sur les GPU. »
Le code est l'un des huit du Center for Accelerated Application Readiness (CAAR), un effort pour préparer des applications scientifiques pour Frontier. Cholla est utilisé pour simuler des systèmes physiques impliqués dans l'évolution des galaxies, c'est ainsi que les galaxies de l'univers changent avec le temps. Les galaxies sont constituées non seulement d'étoiles mais aussi de poussières et de gaz qui interagissent pour influencer cette évolution. L'objectif de l'équipe est d'exécuter une simulation de la Voie lactée qui intègre toute la physique des gaz se produisant, en plus de toutes les étoiles.
« Nous avons besoin de modèles à haute résolution car nous voulons vraiment suivre le gaz dans toutes ses différentes phases :chaud, froid, chaud, vitesse élevée, etc, " a déclaré Schneider. "Nous voulons comprendre la physique des gaz à l'origine de la formation des étoiles et pourquoi les galaxies cessent de former des étoiles. Pour tirer parti des données d'observation dont nous disposons déjà, nous devons faire une simulation extrêmement large. »
Cholla est actuellement compatible avec le langage de programmation CUDA de NVIDIA pour fonctionner sur le système IBM AC922 Summit de l'OLCF, qui comprend les GPU NVIDIA Tesla V100. Maintenant, Schneider et son équipe, avec la liaison CAAR Reuben Budiardja dans le groupe de calcul scientifique de l'OLCF et des représentants d'AMD et de Cray, utilisent l'interface de calcul hétérogène pour la portabilité (HIP) pour faire exactement ce que son nom l'indique :traduire certaines parties du code pour qu'elles soient portables pour l'architecture Frontier, qui comprendra l'architecture Shasta de Cray et l'interconnexion Slingshot ainsi que les processeurs AMD EPYC et les GPU AMD Radeon Instinct. Ce processus de traduction permet aux utilisateurs tels que Schneider de s'adapter aux nouvelles architectures GPU comme Frontier.
Étudiant diplômé de Schneider, Orlando Warren de l'Université de Pittsburgh, où Schneider a récemment accepté un poste de professeur assistant, a déjà réécrit une grande partie de la partie GPU du code pour qu'elle soit compatible avec HIP. Prochain, l'équipe va réécrire les morceaux de Cholla actuellement en cours d'exécution sur les CPU, afin que ceux-ci puissent également fonctionner sur des GPU.
Robertson travaille avec son étudiant diplômé, Bruno Villasenor, qui ajoute des pièces substantielles à Cholla, y compris les calculs nécessaires pour résoudre la gravité dans la simulation géante de la Voie lactée de l'équipe. Schneider coordonne l'effort de refonte du code et d'ajout de ce qu'elle appelle des « cloches et des sifflets » pour affiner davantage les simulations nécessaires pour comprendre la formation des étoiles.
Avec Frontière, l'équipe pense pouvoir simuler la formation d'étoiles avec une haute résolution.
"À l'heure actuelle, nous aimerions identifier comment le gaz quitte la galaxie et y retourne et comment cela affecte le processus de formation des étoiles dans la Voie lactée. La résolution plus élevée que nous pouvons obtenir, mieux nous pourrons comprendre les processus physiques du gaz, et cela finit par affecter de nombreux problèmes différents en astrophysique."
La dernière étape, Schneider a dit, s'assure que le nouveau code fonctionne lorsqu'il est transféré vers des milliers de GPU plutôt que de s'exécuter sur quelques-uns, une tâche qui nécessite un système informatique haute performance à grande échelle comme Summit. L'équipe effectuera des tests à grande échelle sur Summit avant de s'exécuter sur le système Frontier lors de son déploiement l'année prochaine.