Le processus de prévision météorologique. Crédit :Li Haochen.
La prévision météorologique est un problème typique de couplage de données volumineuses avec des modèles de processus physiques, selon le professeur Pingwen Zhang, un académicien de l'Académie chinoise des sciences, Directeur du Laboratoire national d'ingénierie pour l'analyse des mégadonnées et les technologies d'application, Directeur du Center for Computational Science &Engineering, Université de Pékin. Le professeur Zhang est l'auteur correspondant d'une étude en collaboration avec l'Université de Pékin et l'Institut de physique atmosphérique, Académie chinoise des sciences.
En général, la prévision météorologique est une pratique largement réussie dans les géosciences et, de nos jours, elle est indissociable de la prévision numérique du temps (NWP). Cependant, parce que les sorties de la prévision numérique du temps et des observations contiennent des erreurs systématiques différentes, une « consultation météorologique » est un élément indispensable du processus visant à améliorer encore la précision des prévisions.
"En réalité, le modèle physique basé sur la théorie et l'apprentissage automatique basé sur les données sont des outils complémentaires. En combinant ces deux approches, un système intelligent de consultation météorologique peut être construit pour assister le processus manuel actuel de consultation météorologique, " explique le professeur Zhang. " L'un des défis liés à cela est de créer une ingénierie de caractéristiques appropriée pour les deux types d'informations afin d'exploiter pleinement les données. "
Pour résoudre ces problèmes, Le professeur Zhang et son équipe ont proposé la méthode "model output machine learning" (MOML) pour simuler la consultation météorologique, et cette recherche a récemment été publiée dans Avancées des sciences de l'atmosphère .
MOML est une méthode de post-traitement basée sur l'apprentissage automatique, qui compare les prévisions de la prévision numérique du temps aux observations via une fonction de régression. Pour tester la nouvelle approche des prévisions de température du réseau, la température de l'air en surface de 2 m dans la région de Pékin a été utilisée. La méthode MOML, avec différentes fonctionnalités d'ingénierie, a été comparée à la méthode de prévision du modèle ECMWF et à la méthode des statistiques de sortie de modèle modifiées (MOS). MOML a montré de meilleures performances numériques que le modèle ECMWF et MOS, surtout pour l'hiver; la précision lors de l'utilisation de MOML a augmenté de 27,91 % et 15,52 % respectivement.
Les données de consultation météo sont uniques, et comprennent principalement des informations contenues à la fois dans les données du modèle de prévision numérique du temps et dans les données d'observation. Ils ont des structures de données et des fonctionnalités différentes, ce qui fait de l'ingénierie des fonctionnalités une tâche compliquée. La qualité de l'ingénierie des fonctionnalités affecte directement le résultat final. Le groupe de Zhang a proposé plusieurs schémas d'ingénierie de caractéristiques à la suite d'expériences numériques approfondies. Ces schémas assurent l'efficacité des calculs et ont été utilisés pour la première fois dans des études météorologiques. Le Pr Zhang précise que la méthode MOML permet aux données d'observation de participer directement au calcul, et utilise à la fois les informations à haute et basse fréquence des données pour rendre les résultats des prévisions plus précis. La méthode MOML proposée dans cette étude pourrait être appliquée à la prévision du temps lors des prochains Jeux olympiques d'hiver de 2022, nous espérons fournir plus précis, des services de prévisions météorologiques intelligents et efficaces pour cet événement international.
L'apprentissage automatique et l'apprentissage profond offrent divers outils pour les prévisions météorologiques à l'ère du big data, mais il y a aussi de nombreux défis dans les applications pratiques.
« Incorporer des données de prévisions météorologiques et des modèles couplés dans un cadre informatique hybride pour explorer et étudier la structure et les caractéristiques des données d'observation et de prévision numérique du temps constitue une direction de recherche future importante. et proposer des algorithmes de machine learning basés sur les données adaptés à la prévision météorologique, " conclut le Pr Zhang.