Crédit :CC0 Domaine public
Lors de la réunion d'automne de l'AGU, la réunion internationale prééminente des sciences de la Terre et de l'espace, les chercheurs ont dévoilé la plus grande base de données au monde de données de fréquence extrêmement basse (ELF)/très basse fréquence (VLF). La base de données en accès libre est nommée WALDO, qui signifie Archives mondiales des données et observations à basse fréquence. Les chercheurs pourront accéder à près de 1 000 téraoctets (To) de données pour poursuivre les efforts scientifiques dans des domaines tels que la météo spatiale, télédétection ionosphérique, prévision des tremblements de terre, et la prospection souterraine. Les effets de la météo spatiale peuvent produire n'importe quoi, des belles aurores dans le ciel nocturne aux effets destructeurs sur les réseaux électriques et les satellites, les scientifiques et les ingénieurs sont donc motivés pour les comprendre et finalement les prédire.
Le travail visant à préserver des centaines de téraoctets de mesures d'ondes électromagnétiques ELF/VLF et à les ouvrir aux chercheurs du monde entier est un projet conjoint de l'Université de Stanford, Georgia Institute of Technology et l'Université du Colorado Denver avec le soutien de la National Science Foundation et du ministère de la Défense.
"C'est excitant que nous ayons sauvegardé ces données toutes ces années car c'est maintenant le moment où elles deviennent plus précieuses avec les progrès de la puissance de calcul, Algorithmes Big Data et intelligence artificielle, " a déclaré Mark Golkowski, Doctorat., professeur de génie électrique, Collège d'ingénieurs, Conception et informatique, CU Denver.
Golkowski et Morris Cohen, Doctorat., professeur agrégé à l'École d'ingénierie électrique et informatique de Georgia Tech a lancé le projet WALDO comme l'aboutissement d'un héritage qui a commencé à Stanford après la Seconde Guerre mondiale. Le professeur Robert Helliwell a été le pionnier du domaine et de l'utilisation de grandes antennes pour capturer des ondes radio à basse fréquence dans des endroits éloignés comme l'Antarctique et l'Alaska afin d'étudier la physique complexe de l'espace proche de la Terre. Helliwell à Stanford a finalement passé le flambeau au professeur Umran Inan, qui a servi de conseiller à Golkowski et Cohen lorsqu'ils étaient étudiants dans son programme de recherche.
« S'il y a une chose que notre conseiller nous a inculquée, c'était le caractère sacré des observations scientifiques de haute qualité et l'importance de les préserver. " dit Golkowski. " Malheureusement, ce genre de travail d'archives est souvent mis en veilleuse et ce n'est que plus tard que les gens disent, « si seulement nous avions des données d'il y a 10 ans, nous saurions s'il s'agissait d'une anomalie ou non. Perdre des données, c'est comme brûler la bibliothèque d'Alexandrie. Quand c'est parti, c'est parti."
Pendant des années, les chercheurs ont transféré des données de bandes magnétiques vers des CD vers des DVD, car la technologie avancée et les méthodes de stockage obsolètes menaçaient les données. L'avènement du stockage en nuage massif a l'avantage supplémentaire de rendre les données accessibles aux chercheurs du monde entier.
Grâce aux efforts de Golkowski et Cohen et de leurs étudiants, près de 80, 000 DVD de données sont téléchargés sur le cloud. Au moment de la rencontre, 200 To de données sont téléchargées, avec encore 800 To à parcourir.
Alors que la plupart des données datent des 20 dernières années, certains enregistrements datent des années 1970 et 1980.
WALDO sera aussi un référentiel vivant, capturer les données en cours collectées par Georgia Tech et l'Université du Colorado à Denver. Par exemple, les données recueillies lors de la grande éclipse solaire américaine de 2017 seront accessibles au public.
"Les enregistrements capturent un instantané de l'atmosphère et de l'environnement spatial en évolution rapide de la Terre, c'est pourquoi l'effort pour maintenir les données dont nous disposons déjà est crucial pour les recherches futures. "Cela m'a montré l'effort nécessaire en tant que civilisation pour ne pas perdre le passé, " dit Cohen. " S'il ne fait aucun doute que les données sur WALDO sont un enregistrement du passé de la planète et peuvent informer sur son présent, toute personne ayant de l'expérience dans l'analyse de données sait qu'il faut souvent passer au peigne fin beaucoup de bruits et d'observations ternes pour trouver le joyau qui fera progresser les connaissances. »
"Ce fut l'inspiration pour le nom 'WALDO' basé sur le personnage de dessin animé pour enfants se cachant toujours parmi les masses dans son pull caractéristique, " dit Golkowski.
Golkowski et Cohen espèrent que l'ouverture de la base de données inspirera de nouvelles découvertes et de nouvelles utilisations des ensembles de données. L'amélioration constante de la puissance de calcul et des algorithmes de données jouera sans aucun doute un rôle.
« Nous avons une idée des inconnues connues. Mais qui sait qui de nombreuses inconnues inconnues existent encore. En rendant ces données publiques, notre espoir est que d'autres chercheurs utilisent ces ensembles de données d'une manière que nous n'avons pas encore imaginée, " dit Cohen, qui a appliqué les données WALDO et a découvert que les signaux à 60 Hz et ses harmoniques (le bruit gênant provenant des réseaux électriques) peuvent être utilisés comme diagnostic pour les réseaux électriques et les systèmes de cybersécurité.
Au CU Denver, Golkowski a utilisé les observations ELF de la foudre pour diagnostiquer la haute basse atmosphère, ce qui pourrait éventuellement améliorer les systèmes de communication.
"Finalement!", a plaisanté Cohen, « nous avons une réponse à la question `Où est WALDO ? »