Crédit :CC0 Domaine public
Deux nouveaux algorithmes pourraient aider les systèmes d'alerte précoce aux tremblements de terre à vous faire gagner quelques secondes supplémentaires, couverture, et tenez bon avant que le sol ne commence à trembler.
Informaticiens de l'Université de Californie, Riverside a développé deux algorithmes qui amélioreront la surveillance des tremblements de terre et aideront les agriculteurs à protéger leurs cultures contre les insectes dangereux, ou surveiller la santé des poulets et autres animaux. Les algorithmes détectent rapidement des modèles dans d'énormes ensembles de données, avec moins de puissance de calcul et un coût moindre, que d'autres méthodes et ont été utilisés pour améliorer la détection des tremblements de terre, surveiller l'insecte vecteur Psylle asiatique des agrumes, et évaluer le comportement alimentaire des poulets.
Big Data, gros problèmes
Capteurs, tels que les capteurs sismiques, qui enregistrent automatiquement les événements qui se produisent à plusieurs reprises sur une période de temps, avoir un problème. Ils rassemblent tellement de données qu'il est difficile de repérer des modèles. L'analyse des séries temporelles remédie à ce problème en recherchant d'autres exemples d'une séquence d'échantillons dans un ensemble de données, utilisant généralement des unités de traitement graphique, ou GPU. Mais pour les très grands ensembles de données, cela devient peu pratique car cela nécessite trop de GPU, ce qui augmente le coût.
Zachary Zimmerman, doctorant en informatique au Marlan and Rosemary Bourns College of Engineering, construit sur un algorithme précédemment développé par le co-auteur et professeur d'informatique Eamonn Keogh pour gérer des ensembles de données extrêmement volumineux et l'a exécuté sur 40 GPU hébergés sur le cloud Amazon Web Services.
L'algorithme, appelé SCAMP, trié près de deux ans d'enregistrements sismiques de la faille de Parkfield en Californie, un segment de la faille de San Andreas situé près de la ville de Parkfield, en seulement 10 heures, à un coût raisonnable d'environ 300 $, et découvert 16 fois plus de tremblements de terre qu'on ne le savait auparavant.
"Il est difficile de trop insister sur l'évolutivité de cet algorithme, " a déclaré Keogh. " Pour le démontrer, nous avons fait un quintillion — c'est 1 suivi de 18 zéros — des comparaisons par paires d'extraits de données sismiques. Rien d'autre dans la littérature ne se situe à moins d'un dixième de pour cent de cette taille."
Identifier les tremblements de terre n'est pas toujours facile
"Le problème le plus fondamental en sismologie est l'identification des tremblements de terre. Il y a eu un certain nombre d'améliorations méthodologiques par les sismologues appliquant des stratégies de l'informatique pour rechercher des modèles similaires, " a déclaré le co-auteur Gareth Funning, professeur agrégé de sismologie. "La grande avancée ici est que l'ensemble de données que vous pouvez gérer est bien, bien plus gros. Lorsque nous examinions les données sismiques, nous pensions que nous faisions bien de tout comparer dans une fenêtre de temps de deux mois. »
D'autres méthodes de détection de tremblement de terre nécessitent que l'algorithme trouve des séquences qui correspondent à un tremblement de terre connu. La méthode UC Riverside compare plutôt tout dans un temps donné et peut ainsi identifier des tremblements de terre qui ne correspondent pas nécessairement à un modèle donné.
Par exemple, leur analyse des données de Parkfield a découvert subtil, tremblements de terre à basse fréquence sous la faille de San Andreas. Séquences de ces tremblements de terre, également connu sous le nom de tremblements non volcaniques, accompagner en profondeur, mouvements lents des plaques tectoniques.
Des rafales de tremblements de terre à basse fréquence ont parfois précédé des tremblements de terre massifs, comme celui du Japon il y a 10 ans. Une meilleure détection des tremblements de terre à basse fréquence pourrait aider à améliorer les prévisions des plus gros tremblements de terre et aussi aider les scientifiques à mieux surveiller les mouvements des plaques tectoniques.
Des tremblements de terre aux poulets et aux insectes nuisibles
L'algorithme SCAMP peut également détecter les parasites agricoles nuisibles. Keogh a attaché des capteurs qui ont enregistré les mouvements des insectes alors qu'ils aspiraient le jus des feuilles et ont utilisé l'algorithme pour identifier le psylle asiatique des agrumes, l'insecte responsable des ravages des cultures d'agrumes en propageant la bactérie qui cause le Huanglongbing, ou la maladie du verdissement des agrumes. Il a également utilisé l'algorithme pour analyser un ensemble de données provenant d'accéléromètres, qui mesurent différents types de mouvements, attaché aux poulets sur une période de plusieurs jours. SCAMP a ensuite identifié des modèles spécifiques liés à l'alimentation et à d'autres comportements.
SCAMP a une limitation, toutefois.
"SCAMP exige que vous disposiez de l'intégralité de la série chronologique avant de rechercher. En cas d'extraction de données sismologiques historiques, nous avons ça. Ou dans une étude scientifique, nous pouvons faire tourner le poulet pendant 10 heures et analyser les données après coup, " a déclaré le co-auteur Philip Brisk, professeur agrégé d'informatique et directeur de doctorat de Zimmerman. "Mais avec le streaming de données directement depuis le capteur, nous ne voulons pas attendre 10 heures. Nous voulons pouvoir dire que quelque chose se passe maintenant."
Détection plus rapide des tremblements de terre en temps réel
Zimmerman a utilisé le milliard de points de données, appelé profil matriciel, généré par l'analyse par SCAMP des données de faille de Parkfield pour entraîner un algorithme qu'il a appelé LAMP. LAMP compare les données de streaming aux exemples qu'il a vus auparavant pour sélectionner les données les plus pertinentes lorsqu'elles sortent du capteur.
"Avoir le profil matriciel à votre disposition au niveau du capteur signifie que vous pouvez immédiatement savoir ce qui est important et ce qui ne l'est pas. Vous pouvez faire toutes vos vérifications en temps réel parce que vous ne faites que parcourir les bits importants, " a déclaré Zimmerman.
La capacité d'interpréter plus rapidement les données sismiques pourrait améliorer les systèmes d'alerte aux tremblements de terre qui existent déjà.
"Avec l'alerte précoce aux tremblements de terre, vous essayez de détecter des choses dans les stations de surveillance, puis de transmettre les informations à un système central qui évalue s'il s'agit ou non d'un gros tremblement de terre, " a déclaré Funning. " Une configuration comme celle-ci pourrait potentiellement effectuer une grande partie de ce travail de discrimination avant qu'elle ne soit transmise au système. Vous pourriez gagner du temps sur le calcul requis pour déterminer qu'un événement dommageable est en cours, acheter aux gens quelques secondes supplémentaires à laisser tomber, couverture, et tiens bon."
"Quelques secondes, c'est énorme dans l'alerte précoce aux tremblements de terre, " il ajouta.
Le papier sur SCAMP, "Profil de matrice XIV :mise à l'échelle de la découverte de motifs de séries temporelles avec des GPU pour briser un quintillion de comparaisons par paires par jour et au-delà, " a été présenté au Symposium ACM sur le Cloud Computing du 20 au 23 novembre, 2019 à Santa Cruz. Les auteurs sont Zachary Zimmerman, Kaveh Kamgar, Nader Shakibay Senobari, Brian Critiques, Gareth Funning, Philip Brisk et Eamonn Keogh.
Le papier sur LAMP, "Profil matriciel XVIII :Exploitation de séries chronologiques face à des flux rapides à l'aide d'un profil matriciel approximatif appris, " a été présenté à la conférence internationale IEEE 2019 sur l'exploration de données qui s'est tenue à Pékin plus tôt en novembre. Les auteurs sont Zachary Zimmerman, Nader Shakibay Senobari, Gareth Funning, Evangelos Papalexakis, Samet Oymak, Philippe Brisk, et Eamonn Keogh.