Jiali Wang et Rao Kotamarthi, avec Prasanna Balaprakash, étaient co-auteurs du développement du modèle géoscientifique axé sur la couche limite planétaire. Crédit :Laboratoire National d'Argonne
Lorsque vous consultez les prévisions météo le matin, les résultats que vous voyez sont plus que probablement déterminés par le modèle de recherche et de prévision météorologique (WRF), un modèle complet qui simule l'évolution de nombreux aspects du monde physique qui nous entoure.
"Il décrit tout ce que vous voyez à l'extérieur de votre fenêtre, " a déclaré Jiali Wang, un scientifique de l'environnement au Laboratoire national d'Argonne du Département de l'énergie des États-Unis (DOE), "des nuages, au rayonnement solaire, de la neige à la végétation, même la façon dont les gratte-ciel perturbent le vent."
Les innombrables caractéristiques et causes du temps et du climat sont couplées, communiquer les uns avec les autres. Les scientifiques doivent encore décrire complètement ces relations complexes avec des équations unifiées. Au lieu, ils rapprochent les équations à l'aide d'une méthode appelée paramétrisation dans laquelle ils modélisent les relations à une échelle supérieure à celle des phénomènes réels.
Bien que les paramétrisations simplifient la physique d'une manière qui permet aux modèles de produire des résultats relativement précis dans un délai raisonnable, ils sont encore coûteux en temps de calcul. Des scientifiques de l'environnement et des informaticiens d'Argonne collaborent pour utiliser des réseaux de neurones profonds, un type d'apprentissage automatique, remplacer les paramétrisations de certains schémas physiques dans le modèle WRF, réduisant considérablement le temps de simulation.
"Avec des modèles moins chers, nous pouvons réaliser des simulations à plus haute résolution pour prédire comment les changements à court et à long terme des régimes météorologiques affectent l'échelle locale, " dit Wang, « même jusqu'aux quartiers ou aux infrastructures critiques spécifiques ».
Dans une étude récente, les scientifiques se sont concentrés sur la couche limite planétaire (PBL), ou la partie la plus basse de l'atmosphère. Le PBL est la couche atmosphérique que l'activité humaine affecte le plus, et il ne s'étend qu'à quelques centaines de mètres au-dessus de la surface de la Terre. La dynamique dans cette couche, comme la vitesse du vent, profils de température et d'humidité, sont essentiels pour déterminer de nombreux processus physiques dans le reste de l'atmosphère et sur Terre.
Le PBL est un élément crucial du modèle WRF, mais c'est aussi l'un des moins coûteux en calcul. Cela en fait un excellent banc d'essai pour étudier comment des composants plus complexes pourraient être améliorés de la même manière par des réseaux de neurones d'apprentissage en profondeur.
"Nous avons utilisé 20 ans de données générées par ordinateur à partir du modèle WRF pour former les réseaux de neurones et deux ans de données pour évaluer s'ils pouvaient fournir une alternative précise aux paramétrisations basées sur la physique, " dit Prasanna Balaprakash, informaticien et récipiendaire du DOE Early Career Award dans la division Mathématiques et Informatique d'Argonne et l'Argonne Leadership Computing Facility (ALCF), une installation utilisateur du DOE Office of Science.
Balaprakash a développé le réseau de neurones et l'a entraîné à apprendre une relation abstraite entre les entrées et les sorties en l'alimentant de plus de 10, 000 points de données (8 par jour) à partir de deux emplacements, un au Kansas et un en Alaska. Le résultat a été un algorithme qui, selon les scientifiques, pourrait remplacer la paramétrisation PBL dans le modèle WRF.
Les scientifiques ont démontré qu'un réseau de neurones profonds qui prend en compte une partie de la structure sous-jacente de la relation entre les variables d'entrée et de sortie peut simuler avec succès les vitesses du vent, température et vapeur d'eau au cours du temps. Les résultats montrent également qu'un réseau de neurones entraîné à partir d'un emplacement peut prédire le comportement à travers des emplacements voisins avec des corrélations supérieures à 90 % par rapport aux données de test.
« La collaboration entre les climatologues et les informaticiens a été cruciale pour les résultats que nous avons obtenus, " a déclaré Rao Kotamarthi, scientifique en chef et chef du département des sciences de l'atmosphère et de la recherche climatique à la division des sciences de l'environnement d'Argonne. "L'intégration de notre connaissance du domaine rend l'algorithme beaucoup plus prédictif."
Les algorithmes, appelés réseaux de neurones sensibles au domaine, qui prennent en compte les relations connues peuvent non seulement prédire les données environnementales avec plus de précision, mais ils nécessitent également l'apprentissage de beaucoup moins de données que les algorithmes qui ne prennent pas en compte l'expertise du domaine.
Tout projet de machine learning nécessite une grande quantité de données de haute qualité, et les données ne manquaient pas pour cette étude. Moyens de calcul intensif à l'ALCF et au Centre national de calcul scientifique de la recherche énergétique, une installation utilisateur du DOE Office of Science au Lawrence Berkeley National Laboratory, contribué à la production de plus de 300 ans (700 téraoctets) de données décrivant le passé, le temps et le climat présents et futurs en Amérique du Nord.
"Cette base de données est unique à la science du climat à Argonne, " dit Wang, "et nous l'utilisons pour mener d'autres études sur l'apprentissage en profondeur et déterminer comment il peut s'appliquer aux modèles climatiques."
L'objectif ultime des scientifiques est de remplacer toutes les paramétrisations coûteuses du modèle WRF par des réseaux de neurones d'apprentissage en profondeur pour permettre une simulation plus rapide et à plus haute résolution.
Actuellement, l'équipe travaille à émuler la paramétrisation du rayonnement solaire à ondes longues et à ondes courtes, deux parties du modèle WRF qui prennent ensemble près de 40 % du temps de calcul de la physique dans les simulations.
Les résultats de l'étude ont été publiés dans un article intitulé "Fast domain-aware neural network emulation of a planetary border layer parameterization in a digital weather forecast model" le 10 octobre à Développement de modèles géoscientifiques 12, 4261-4274, 2019.