• Home
  • Chimie
  • Astronomie
  • Énergie
  • La nature
  • Biologie
  • Physique
  • Électronique
  •  Science >> Science >  >> La nature
    Un ensemble de données d'IA ouvre de nouvelles voies vers la détection des tornades
    Chaque échantillon de l'ensemble de données TorNet comprend six types d'images radar, représentant différents produits de données radar. Les images présentées ici sont deux de ces produits, notamment le facteur de réflectivité et la vitesse radiale d'un exemple de tornade dans l'ensemble de données. Crédit :Massachusetts Institute of Technology

    Le retour du printemps dans l’hémisphère Nord marque le début de la saison des tornades. L’entonnoir tordu de poussière et de débris d’une tornade semble être un spectacle sans équivoque. Mais cette vue peut être masquée par le radar, l’outil des météorologues. Il est difficile de savoir exactement quand une tornade s'est formée, ni même pourquoi.



    Un nouvel ensemble de données pourrait contenir des réponses. Il contient les retours radar de milliers de tornades qui ont frappé les États-Unis au cours des 10 dernières années. Les tempêtes qui ont engendré des tornades sont flanquées d’autres tempêtes violentes, certaines dans des conditions presque identiques, qui n’ont jamais eu lieu. Les chercheurs du MIT Lincoln Laboratory qui ont organisé l’ensemble de données, appelé TorNet, l’ont maintenant publié en open source. Ils espèrent permettre des percées dans la détection de l'un des phénomènes naturels les plus mystérieux et les plus violents.

    "De nombreux progrès reposent sur des ensembles de données de référence facilement disponibles. Nous espérons que TorNet jettera les bases d'algorithmes d'apprentissage automatique permettant à la fois de détecter et de prédire les tornades", déclare Mark Veillette, co-chercheur principal du projet avec James Kurdzo. Les deux chercheurs travaillent au sein du groupe des systèmes de contrôle du trafic aérien.

    Parallèlement à l'ensemble de données, l'équipe publie des modèles formés sur celui-ci. Les modèles sont prometteurs quant à la capacité de l’apprentissage automatique à détecter une tornade. S'appuyer sur ces travaux pourrait ouvrir de nouvelles frontières aux prévisionnistes, en les aidant à fournir des alertes plus précises susceptibles de sauver des vies.

    Une incertitude tourbillonnante

    Environ 1 200 tornades se produisent chaque année aux États-Unis, causant des millions, voire des milliards de dollars de dégâts économiques et faisant en moyenne 71 morts. L'année dernière, une tornade d'une durée inhabituellement longue a tué 17 personnes et en a blessé au moins 165 autres le long d'un chemin de 59 milles dans le Mississippi.

    Pourtant, les tornades sont notoirement difficiles à prévoir car les scientifiques n’ont pas une idée claire de la raison pour laquelle elles se forment. "Nous pouvons voir deux tempêtes qui semblent identiques, l'une produira une tornade et l'autre non. Nous ne le comprenons pas entièrement", dit Kurdzo.

    Les ingrédients de base d'une tornade sont des orages dont l'instabilité est causée par une montée rapide de l'air chaud et un cisaillement du vent qui provoque une rotation. Le radar météorologique est le principal outil utilisé pour surveiller ces conditions. Mais les tornades sont trop basses pour être détectées, même lorsqu'elles sont modérément proches du radar. À mesure que le faisceau radar avec un angle d'inclinaison donné s'éloigne de l'antenne, il s'élève au-dessus du sol et voit principalement les reflets de la pluie et de la grêle transportés par le « mésocyclone », le large courant ascendant rotatif de la tempête. Un mésocyclone ne produit pas toujours une tornade.

    Avec cette vision limitée, les prévisionnistes doivent décider d’émettre ou non un avertissement de tornade. Ils péchent souvent par excès de prudence. En conséquence, le taux de fausses alarmes pour les avertissements de tornade est supérieur à 70 %.

    "Cela peut conduire au syndrome du garçon qui criait au loup", dit Kurdzo.

    Ces dernières années, les chercheurs se sont tournés vers l’apprentissage automatique pour mieux détecter et prédire les tornades. Cependant, les ensembles de données brutes et les modèles n’ont pas toujours été accessibles à la communauté au sens large, ce qui freine les progrès. TorNet comble cette lacune.

    L'ensemble de données contient plus de 200 000 images radar, dont 13 587 représentent des tornades. Le reste des images ne sont pas des tornades, prises à partir de tempêtes appartenant à l'une des deux catégories suivantes :tempêtes violentes sélectionnées au hasard ou tempêtes de fausse alarme (celles qui ont conduit un prévisionniste à émettre un avertissement mais qui n'ont pas produit de tornade).

    Chaque échantillon d'une tempête ou d'une tornade comprend deux ensembles de six images radar. Les deux ensembles correspondent à des angles de balayage radar différents. Les six images représentent différents produits de données radar, tels que la réflectivité (montrant l'intensité des précipitations) ou la vitesse radiale (indiquant si les vents se rapprochent ou s'éloignent du radar).

    Un défi lors de la conservation de l'ensemble de données consistait d'abord à trouver des tornades. Dans le corpus des données radar météorologiques, les tornades sont des événements extrêmement rares. L’équipe a ensuite dû équilibrer ces échantillons de tornade avec des échantillons difficiles non-tornades. Si l'ensemble de données était trop simple, par exemple en comparant les tornades aux tempêtes de neige, un algorithme entraîné sur les données surclasserait probablement les tempêtes comme tornades.

    "Ce qui est beau dans un véritable ensemble de données de référence, c'est que nous travaillons tous avec les mêmes données, avec le même niveau de difficulté, et que nous pouvons comparer les résultats", explique Veillette. "Cela rend également la météorologie plus accessible aux data scientists, et vice versa. Il devient plus facile pour ces deux parties de travailler sur un problème commun."

    Les deux chercheurs représentent les progrès qui peuvent découler d’une collaboration croisée. Veillette est un mathématicien et développeur d’algorithmes fasciné depuis longtemps par les tornades. Kurdzo est météorologue de formation et expert en traitement du signal. À ses études supérieures, il a chassé les tornades avec des radars mobiles sur mesure, collectant des données à analyser de nouvelles manières.

    "Cet ensemble de données signifie également qu'un étudiant diplômé n'a pas besoin de passer un an ou deux à créer un ensemble de données. Il peut se lancer directement dans ses recherches", explique Kurdzo.

    À la recherche de réponses grâce au deep learning

    À l’aide de l’ensemble de données, les chercheurs ont développé des modèles d’intelligence artificielle (IA) de base. Ils étaient particulièrement désireux d’appliquer le deep learning, une forme d’apprentissage automatique qui excelle dans le traitement des données visuelles. À lui seul, l’apprentissage profond peut extraire des caractéristiques (observations clés qu’un algorithme utilise pour prendre une décision) à partir d’images provenant d’un ensemble de données. D'autres approches d'apprentissage automatique nécessitent que les humains étiquetent d'abord manuellement les fonctionnalités.

    "Nous voulions voir si l'apprentissage profond pouvait redécouvrir ce que les gens recherchent normalement dans les tornades et même identifier de nouvelles choses qui ne sont généralement pas recherchées par les prévisionnistes", explique Veillette.

    Les résultats sont prometteurs. Leur modèle d'apprentissage en profondeur a fonctionné de manière similaire ou meilleure que tous les algorithmes de détection de tornades connus dans la littérature. L'algorithme entraîné a correctement classé 50 % des tornades EF-1 les plus faibles et plus de 85 % des tornades classées EF-2 ou plus, qui constituent les occurrences les plus dévastatrices et les plus coûteuses de ces tempêtes.

    Ils ont également évalué deux autres types de modèles d’apprentissage automatique et un modèle traditionnel à comparer. Le code source et les paramètres de tous ces modèles sont disponibles gratuitement. Les modèles et l'ensemble de données sont également décrits dans un article soumis à une revue de l'American Mogenic Society (AMS). Veillette a présenté ces travaux lors du congrès annuel de l'AMS en janvier.

    "La principale raison pour laquelle nous diffusons nos modèles est que la communauté puisse les améliorer et réaliser d'autres grandes choses", explique Kurdzo. "La meilleure solution pourrait être un modèle d'apprentissage profond, ou quelqu'un pourrait découvrir qu'un modèle d'apprentissage non profond est en fait meilleur."

    TorNet pourrait également être utile dans la communauté météorologique pour d'autres utilisations, comme pour mener des études de cas à grande échelle sur les tempêtes. Il pourrait également être complété par d’autres sources de données, comme des images satellite ou des cartes d’éclairs. La fusion de plusieurs types de données pourrait améliorer la précision des modèles d'apprentissage automatique.

    Prendre des mesures en vue des opérations

    En plus de détecter les tornades, Kurdzo espère que les modèles pourraient aider à comprendre pourquoi elles se forment.

    "En tant que scientifiques, nous observons tous ces précurseurs des tornades :une augmentation de la rotation à basse altitude, un écho en crochet dans les données de réflectivité, un pied de phase différentielle spécifique (KDP) et des arcs de réflectivité différentielle (ZDR). Mais comment peuvent-ils tous aller ensemble ? Et y a-t-il des manifestations physiques que nous ignorons ? » demande-t-il.

    Trouver ces réponses pourrait être possible avec une IA explicable. L’IA explicable fait référence aux méthodes qui permettent à un modèle de fournir son raisonnement, dans un format compréhensible pour les humains, sur les raisons pour lesquelles il a pris une certaine décision. Dans ce cas, ces explications pourraient révéler des processus physiques qui se produisent avant les tornades. Ces connaissances pourraient aider les prévisionnistes et les modèles à reconnaître les signes plus tôt.

    "Aucune de ces technologies n'est jamais destinée à remplacer un prévisionniste. Mais peut-être qu'un jour elle pourrait guider les yeux des prévisionnistes dans des situations complexes et donner un avertissement visuel à une zone où l'on prévoit une activité tornadique", a déclaré Kurdzo.

    Une telle assistance pourrait être particulièrement utile à mesure que la technologie radar s’améliore et que les futurs réseaux pourraient devenir plus denses. Les taux de rafraîchissement des données dans un réseau radar de nouvelle génération devraient passer de toutes les cinq minutes à environ une minute, peut-être plus rapidement que les prévisionnistes ne peuvent interpréter les nouvelles informations. Parce que l’apprentissage profond peut traiter rapidement d’énormes quantités de données, il pourrait être bien adapté pour surveiller les retours radar en temps réel, aux côtés des humains. Les tornades peuvent se former et disparaître en quelques minutes.

    Mais le chemin vers un algorithme opérationnel est un long chemin, surtout dans les situations critiques pour la sécurité, explique Veillette. "Je pense que la communauté des prévisionnistes est encore, et c'est compréhensible, sceptique quant à l'apprentissage automatique. Une façon d'établir la confiance et la transparence est de disposer d'ensembles de données de référence publics comme celui-ci. C'est une première étape."

    L’équipe espère que les prochaines étapes seront franchies par des chercheurs du monde entier inspirés par l’ensemble de données et motivés à construire leurs propres algorithmes. Ces algorithmes seront à leur tour envoyés dans des bancs d'essai, où ils seront éventuellement présentés aux prévisionnistes, pour lancer un processus de transition vers les opérations.

    En fin de compte, le chemin pourrait revenir à la confiance.

    "En utilisant ces outils, nous ne recevrons peut-être jamais une alerte de tornade de plus de 10 à 15 minutes. Mais si nous pouvions réduire le taux de fausses alarmes, nous pourrions commencer à améliorer la perception du public", déclare Kurdzo. "Les gens vont utiliser ces avertissements pour prendre les mesures dont ils ont besoin pour sauver leur vie."

    Fourni par le Massachusetts Institute of Technology

    Cette histoire est republiée avec l'aimable autorisation de MIT News (web.mit.edu/newsoffice/), un site populaire qui couvre l'actualité de la recherche, de l'innovation et de l'enseignement du MIT.




    © Science https://fr.scienceaq.com