• Home
  • Chimie
  • Astronomie
  • Énergie
  • La nature
  • Biologie
  • Physique
  • Électronique
  •  science >> Science >  >> Astronomie
    Comment le scientifique a appliqué l'algorithme de recommandation pour anticiper les heures d'arrivée des CME

    En haut :De gauche à droite, instantanés de l'événement CME survenu le 16 août 2006 16 : 30 UT. Crédit :SOHO LASCO C2. En bas :De gauche à droite, instantanés de l'événement CME survenu le 7 avril 1997 14 : 27 UT. Source :Espace :science et technologie

    Les éjections de masse coronale (EMC) sont des événements solaires éruptifs. Ils sont souvent associés aux éruptions solaires et aux filaments. Les CME peuvent provoquer des événements météorologiques spatiaux tels que des tempêtes géomagnétiques, des tempêtes d'électrons à haute énergie, une injection de plasma chaud, des tempêtes ionosphériques et une densité accrue dans la haute atmosphère.

    Les grands événements CME peuvent avoir un impact sur les communications, les systèmes de navigation, les activités aéronautiques et même les réseaux électriques. Pour éviter les dommages potentiels et la perte d'actifs, il est nécessaire de prévoir avec précision l'arrivée des CME en deux parties. Le CME va-t-il "toucher" ou "rater" la terre ? Si la prédiction est "hit", alors la question suivante est quelle est l'heure d'arrivée prévue du CME ?

    Dans un article de recherche récemment publié dans Space :Science &Technology , Yurong Shi du Centre national des sciences spatiales de l'Académie chinoise des sciences, a appliqué l'algorithme de recommandation, qui pourrait être utilisé pour recommander l'événement CME historique similaire aux prévisionnistes, pour anticiper l'heure d'arrivée des CME et a prouvé que l'algorithme de recommandation et la régression logistique pouvaient agir ensemble pour fournir aux prévisionnistes une option pour améliorer les résultats de la prédiction.

    Dans un premier temps, les données et la méthodologie ont été préparées. L'auteur a sélectionné des échantillons parmi un total de 30 321 événements CME qui ont été collectés à partir du catalogue SOHO / LASCO CME, de 1996 à 2020. Le suréchantillonnage a été utilisé pour résoudre les données déséquilibrées et a obtenu 181 échantillons positifs (CME qui ont atteint la terre) et 3486 échantillons négatifs (CME qui n'ont pas atteint la terre).

    En outre, 8 paramètres caractéristiques sont rassemblés par la sélection des paramètres caractéristiques, y compris la largeur angulaire, l'angle de position centrale (CPA), l'angle de position de mesure (MPA), la vitesse linéaire, la vitesse initiale, la vitesse finale, la vitesse à 20 rayons solaires, la masse. Un ensemble de données sans dimension complet et unifié des 8 paramètres caractéristiques a été mis en place et prêt à faciliter le développement du modèle de prédiction. De plus, pour rechercher l'événement historique le plus similaire à l'événement CME spécifié, les auteurs adoptent deux distances couramment utilisées dans l'apprentissage automatique et l'intelligence artificielle informatique :la distance cosinus et la distance euclidienne qui se sont toutes deux révélées performantes au cours de l'expérience.

    Ensuite, l'expérience, un essai contrôlé, a été conçue. La première étape est l'échantillonnage des données. Au total, 3 667 échantillons comprenant 8 paramètres caractéristiques sont divisés au hasard en deux sous-groupes égaux. L'un (1 833 échantillons) est destiné à la musculation et l'autre (1 834 échantillons) est destiné au test de recommandation ultérieur. Au cours de l'étape d'entraînement aux poids, l'auteur a utilisé 1 466 échantillons d'entraînement servant d'ensemble d'entraînement pour entraîner les poids en suivant à la fois la procédure de régression logistique et l'algorithme de recommandation, tandis que le reste (367 échantillons) l'ensemble de validation.

    En bref, un total de 6 expériences sont menées pour former des poids, et par conséquent, 6 ensembles de coefficients de poids sont obtenus avec 4 de l'algorithme de régression logistique et 2 de l'algorithme de recommandation. Deux cadres de régression logistique ont été adoptés à des fins de comparaison. L'une était la fonction logit fournie dans le module statsmodels basé sur Python et appelée "sm.logit". L'autre également basé sur Python était le classificateur LogisticRegression fourni dans la bibliothèque scikit-learn (sklearn) et appelé "sk.LR".

    En comparant tous les modèles, le modèle sm.logit a obtenu les meilleurs résultats à la fois dans l'ensemble de validation et dans l'ensemble de test. Il était approprié de choisir les poids de sm.logit comme poids optimaux dans l'étape suivante de ce travail particulier. Par ailleurs, on constate que l'utilisation des algorithmes de recommandation pour entraîner les poids des paramètres caractéristiques était très chronophage, mais il était plus facile d'obtenir les poids par régression logistique. Par conséquent, une nouvelle tentative a consisté à appliquer les poids obtenus par la régression logistique à l'algorithme de recommandation. La faisabilité d'une telle opération a été testée lors de la phase finale, phase de test de recommandation.

    En résumé, l'auteur a d'abord calculé les poids des paramètres caractéristiques des CME sur la base de la régression logistique, puis les a introduits dans l'algorithme de recommandation pour fournir les événements historiques les plus similaires comme référence pour la prévision de l'efficacité des CME. On peut constater que dans chaque score de compétence, le modèle appliquant les poids de la régression logistique à l'algorithme de recommandation était meilleur que celui utilisant l'algorithme de recommandation seul, de sorte que ce modèle hybride était réalisable. Un tel traitement évitait de former les poids de recommandation pour économiser du temps et des ressources informatiques.

    À l'heure actuelle, l'application de l'algorithme de recommandation à la prédiction des CME est très rare dans la littérature. L'auteur a prouvé qu'une fois que le modèle de régression logistique confirme l'efficacité d'un CME, l'algorithme de recommandation peut être utilisé pour recommander des événements historiques similaires. Recommander des événements historiques similaires comme référence vivante pour les prévisionnistes est une grande amélioration du service de prévision, contrairement à la prévision binaire "oui" ou "non" fournie par le modèle de régression logistique uniquement. Les prévisionnistes de la météo spatiale peuvent être en mesure d'utiliser cette méthode pour effectuer une analyse comparative. + Explorer plus loin

    Une nouvelle approche pour la prédiction des pannes logicielles à l'aide de la sélection de fonctionnalités




    © Science https://fr.scienceaq.com