Un nuage d'orage s'approche du campus de l'État de l'Iowa. Crédit :Bill Gallus
Bill Gallus est connu pour chasser une ou deux tempêtes estivales. Mais il n'avait pas à s'en prendre à celui-ci.
Le 17 juillet, 2019, un orage s'est approché du campus de l'Iowa State University. Gallus, professeur de sciences géologiques et atmosphériques, s'est dirigé vers le toit au-dessus de son bureau dans le bâtiment de l'agronomie. Et il n'a pas oublié un appareil photo.
L'une de ses photos montre un nuage de plate-forme marquant la limite des vents violents d'orage. La ligne distincte du nuage coupe la photo en deux, meugler, tranchant et imposant, pas de peluche ici. L'Osborn Drive, habituellement très fréquenté, à l'extérieur de son bureau est presque vide :quelques personnes dans la rue sont tournées vers le nord-nord-ouest, lorgnant la tempête.
"La douceur et la faible élévation d'un nuage de plateau en font un spectacle impressionnant à observer, " Gallus a écrit dans une description de la photo. " Il se forme lorsque l'air froid se déplaçant rapidement dans un orage se propage, soulevant rapidement l'air chaud et humide au-dessus."
Nous avons tous vu des dizaines d'orages. Et le National Weather Service conserve consciencieusement des enregistrements de chacun et classe leur force dans sa base de données Storm Reports. Pour qu'un orage soit marqué "grave, " par exemple, il doit produire une tornade, grêle de plus de 1 pouce de diamètre ou vents de plus de 58 mph.
Mais la plupart des orages ne grondent pas sur les instruments à vent. Les météorologues ont donc fait des estimations du vent basées sur les dommages causés par les tempêtes, tels que des arbres abattus, toits emportés ou hangars renversés. Et la plupart du temps, lorsque ce genre de dommages causés par le vent a été signalé, les orages étaient simplement classés comme violents, sans mesures réelles à l'appui de la désignation.
C'est un problème pour les chercheurs tels que Gallus qui ont besoin de bonnes données pour les aider à développer de meilleurs moyens de prédire les graves, orages localisés.
Un gros problème de données
Lorsque Gallus a entendu des collègues du campus du groupe de recherche Theoretical and Applied Data Science de l'Iowa State parler de l'apprentissage automatique, il pensait que les capacités d'analyse des données de la technologie pourraient l'aider à étudier et à analyser la base de données Storm Reports. Peut-être que les ordinateurs pourraient trouver des relations ou des connexions dans les rapports qui pourraient conduire à de nouveaux outils de prévision ?
Bien, pas si vite, ont déclaré des scientifiques de la National Oceanic and Atmospheric Administration (NOAA).
La base de données existante sur les orages violents maintenue par les Centres nationaux d'information sur l'environnement ne serait pas d'une grande utilité pour Gallus ou d'autres chercheurs à la recherche de données sur le vent. Les rapports de vent n'étaient pas fiables. Les rapports devaient être nettoyés avant de pouvoir être utiles pour des études de vents sévères.
C'est donc ce que Gallus et une équipe de data scientists de l'Iowa State vont faire. Soutenu par un programme de trois ans, 650 $, 000 bourse NOAA, ils utiliseront des ordinateurs et des outils d'apprentissage automatique pour parcourir les rapports et identifier la probabilité que chacun d'eux décrive réellement un orage avec des vents violents.
Ce n'est pas une mince tâche - Gallus a déclaré que les scientifiques commenceraient par 12 ans de rapports d'orages violents. C'est environ 180, 000 d'entre eux.
"Et 90 pour cent de ces 180, 000 rapports contiennent des estimations de vent, " Gallus a dit. " Ils ne sont pas basés sur les données de la station météo. La majorité d'entre eux disent des arbres ou des branches vers le bas - quelqu'un a appelé et a dit, "Mon arbre a explosé.""
Le tri de ces rapports soulève toutes sortes de défis pour les chercheurs de données, dit Eric Weber, un collaborateur du projet et professeur de mathématiques de l'État de l'Iowa.
D'abord, il a dit que les rapports sont pleins de données collectées par des personnes, pas par des instruments précis et sophistiqués. Les rapports contiennent également des éléments naturels, langage courant. Il y a des idiomes, des tournures de phrases et même des fautes de frappe qui doivent être analysées par le logiciel d'apprentissage automatique.
Et deuxieme, les orages sont très complexes. Il existe de nombreuses variables :température de l'air ascendant, condensation, pluie, la foudre et plus - qui doivent être collectées, quantifiés et analysés pour comprendre les tempêtes.
Weber, qui décrit l'apprentissage automatique comme un réseau de neurones artificiels qui "établit des connexions en fonction des informations dont il dispose", a déclaré que le logiciel informatique peut gérer d'énormes quantités de données de tempête qui submergeraient des équipes de personnes.
Les logiciels d'apprentissage automatique le font également d'une manière très non humaine.
« Quand nous examinons les données, nous essayons de comprendre les données en tant qu'êtres humains, " Weber a déclaré. "Nous apportons nos perceptions et nos préjugés. L'une des principales raisons pour lesquelles l'apprentissage automatique est utilisé avec tant de succès maintenant est qu'il n'apporte pas de notions préconçues à son analyse des données.
"Il peut trouver des relations potentielles que les humains ne peuvent pas en raison de leurs idées préconçues."
Vers une meilleure prévision
Au fur et à mesure que les ordinateurs progressent avec les rapports de tempête, Gallus a déclaré qu'il fournirait des mises à jour et des démonstrations lors de la conférence annuelle de la NOAA, Banc d'essai de conditions météorologiques dangereuses d'une durée de plusieurs semaines à Norman, Oklahoma. Les bancs d'essai se déroulent pendant la saison des tornades de mai et sont l'occasion pour les chercheurs et les prévisionnistes d'utiliser les dernières idées de prédiction, outils et technologies.
Gallus espère montrer les progrès de l'étude des vents orageux. Il recueillera des commentaires et des suggestions. Et tout cela pourrait éventuellement conduire à un nouvel outil de prévision qui prédit la probabilité qu'un orage produise des vents violents.
"Le principal besoin de la NOAA en ce moment est de nettoyer la base de données pour une meilleure recherche, " a déclaré Gallus. " Mais nous avons réalisé que si ce projet va bien avec l'apprentissage automatique, nous avons pu voir comment cela pourrait fonctionner comme outil de prédiction."