Huang Huang (à gauche) et Ying Sun ont développé une méthode pour visualiser les propriétés de covariance spatio-temporelle d'un ensemble de données, qui aidera à donner un sens aux données environnementales. Crédit :KAUST
La prévision du climat et du temps repose sur des modèles statistiques qui peuvent saisir la variabilité à un endroit au fil du temps ainsi que la relation avec d'autres emplacements géographiques. Parfois, les conditions futures à un endroit peuvent être prédites à partir des conditions actuelles à un autre endroit, alors que dans d'autres cas, il peut ne pas y avoir une telle corrélation. L'hypothèse selon laquelle deux sites sont « covariants » d'une manière ou d'une autre peut avoir de profondes implications pour l'exactitude du modèle statistique, Le choix de la covariance spatio-temporelle est donc crucial.
Ying Sun et son étudiant Huang Huang de KAUST ont maintenant développé une méthode pour visualiser les propriétés de covariance spatio-temporelle d'un ensemble de données, simplifiant grandement une étape de modélisation importante qui exigeait auparavant une analyse exploratoire minutieuse des données.
"Nous proposons un moyen simple et pratique de visualiser les propriétés de la structure de covariance dans les données, qui aidera les praticiens à choisir des modèles statistiques appropriés pour les covariances, " dit Sun. "En particulier, cette méthode est utile pour les données observées éparses dans l'espace et denses dans le temps, ce qui est souvent le cas pour les observations des stations météorologiques par exemple."
Sun et Huang ont considéré deux types clés de covariance-symétrie et de séparabilité. La symétrie implique que les processus spatio-temporels sont réversibles dans le temps, tandis que la séparabilité indique que la corrélation dans le temps n'interagit pas avec celle dans l'espace.
"En supposant une covariance entièrement symétrique ou séparable conduit à un modèle beaucoup plus simple et donc des calculs rapides, " dit Sun. " Cependant, cette hypothèse du modèle peut être violée dans de nombreuses applications réelles, conduisant à une estimation et une prédiction moins précises. »
Huang et Sun ont utilisé une approche d'analyse de données fonctionnelles pour construire des fonctions de test à partir des covariances dans les données de séries chronologiques entre les paires d'emplacements. Ces fonctions de test résument efficacement les propriétés de séparabilité ou de symétrie et peuvent être affichées sous forme de boîtes à moustaches qui montrent le degré de non-séparabilité ou d'asymétrie.
"Nous avons appliqué cette approche aux observations météorologiques et aux données météorologiques simulées de certains modèles climatiques couramment utilisés, " dit Huang. " Dans les exemples rapportés pour une zone d'étude dans l'océan Atlantique Nord, cette méthode a montré que la vitesse du vent et la température de surface ont des structures de covariance différentes selon les saisons."
La visualisation peut être calculée relativement rapidement pour une poignée de stations de surveillance, et les chercheurs notent que l'efficacité de calcul peut être améliorée pour un plus grand nombre de stations en divisant le problème en sous-régions. Néanmoins, la méthode fournit un outil précieux qui aidera grandement les praticiens.