Crédit : Institut de technologie de Géorgie
Les mégadonnées et l'exploration de données ont fourni plusieurs percées dans des domaines tels que l'informatique de la santé, villes intelligentes et marketing. Les mêmes techniques, cependant, n'ont pas fourni de conclusions clés cohérentes pour le changement climatique.
Il y a quelques raisons pour lesquelles. Le principal est que les précédents travaux d'exploration de données en science du climat, et notamment dans l'analyse des téléconnexions climatiques, s'est appuyé sur des méthodes qui offrent des réponses "oui ou non" plutôt simplistes.
"Ce n'est pas si simple dans le climat, " a déclaré Annalisa Bracco, professeur à la Georgia Tech School of Earth and Atmospheric Sciences. "Même des connexions faibles entre des régions très différentes du globe peuvent résulter d'un phénomène physique sous-jacent. Imposer des seuils et rejeter des connexions faibles arrêterait tout. Au lieu de cela, l'expertise d'un climatologue est l'étape clé pour trouver des points communs entre des ensembles de données ou des domaines très différents afin d'explorer leur robustesse. »
Et avec des millions de points de données répartis dans le monde entier, Bracco a déclaré que les modèles actuels reposent trop sur l'expertise humaine pour donner un sens à la sortie. Elle et ses collègues voulaient développer une méthodologie qui dépend davantage de données réelles que de l'interprétation d'un chercheur.
C'est pourquoi l'équipe de Georgia Tech a développé une nouvelle méthode d'extraction de données à partir d'ensembles de données climatiques qui est plus autonome que les outils traditionnels. La méthodologie fait ressortir les points communs des ensembles de données sans autant d'expertise de la part de l'utilisateur, permettant aux scientifiques de faire confiance aux données et d'obtenir des résultats plus robustes et transparents.
La méthodologie est open source et actuellement disponible pour les scientifiques du monde entier. Les chercheurs de Georgia Tech l'utilisent déjà pour explorer les données de température de surface de la mer et de champ de nuages, deux aspects qui affectent profondément le climat de la planète.
« Il y a tellement de facteurs :les données cloud, aérosols et champs de vent, par exemple, qui interagissent pour générer le climat et conduire le changement climatique, " dit Athanasios Nenes, un autre professeur de climat du Collège des sciences sur le projet. "Selon l'aspect du modèle sur lequel vous vous concentrez, ils peuvent reproduire efficacement les caractéristiques climatiques, voire pas du tout. Parfois, il est très difficile de dire si un modèle est vraiment meilleur qu'un autre ou s'il prédit le climat pour les bonnes raisons."
Nenes dit que la méthodologie Georgia Tech examine tout d'une manière plus robuste, briser le goulot d'étranglement qui est typique des autres algorithmes d'évaluation et d'analyse de modèle. La méthodologie, il dit, peut être utilisé pour des observations, et les scientifiques n'ont pas besoin de savoir quoi que ce soit sur le code informatique et les modèles.
"La méthodologie réduit la complexité de millions de points de données à l'essentiel - parfois aussi peu que 10 régions qui interagissent les unes avec les autres, " a déclaré Nenes. "Nous avons besoin d'outils qui réduisent la complexité des sorties de modèles pour mieux les comprendre et évaluer s'ils fournissent les bons résultats pour les bonnes raisons."
Pour développer la méthodologie, les climatologues se sont associés à Constantine Dovrolis et à d'autres scientifiques des données du Georgia Tech's College of Computing. Dovrolis a déclaré qu'il était passionnant d'appliquer la pensée algorithmique et informatique à des problèmes qui affectent tout le monde de manière majeure, comme le réchauffement climatique."
« La science du climat est une discipline « louve de données » avec de nombreuses questions intellectuellement intéressantes qui peuvent bénéficier de la modélisation informatique et de la prédiction, " dit Dovrolis, professeur à l'École d'informatique, "Les collaborations interdisciplinaires sont difficiles au début - chaque discipline a son propre langage, l'approche et la culture de recherche préférées, mais elles peuvent être très gratifiantes à la fin."
Le papier, "Faire progresser la science du climat avec la découverte de connaissances grâce à l'exploration de données, " est publié dans Science du climat et de l'atmosphère .