SeismoGen, une technique d'apprentissage automatique développée au Laboratoire, est capable de générer des formes d'ondes sismiques synthétiques de haute qualité. La technique pourrait économiser des efforts d'étiquetage manuels fastidieux et intensifs et aider à améliorer la détection des tremblements de terre. Crédit :Laboratoire national de Los Alamos
Un nouveau modèle d'apprentissage automatique qui génère des formes d'ondes sismiques réalistes réduira le travail manuel et améliorera la détection des tremblements de terre, selon une étude publiée récemment dans Terre solide JGR .
"Pour vérifier l'efficacité de notre modèle génératif, nous l'avons appliqué aux données de champs sismiques collectées en Oklahoma, " a déclaré Youzuo Lin, un informaticien du groupe de géophysique du Laboratoire national de Los Alamos et chercheur principal du projet. « À travers une séquence de tests et de benchmarks qualitatifs et quantitatifs, nous avons vu que notre modèle peut générer des formes d'onde synthétiques de haute qualité et améliorer les algorithmes de détection de tremblement de terre basés sur l'apprentissage automatique."
La détection rapide et précise des tremblements de terre peut être une tâche difficile. La détection visuelle effectuée par des personnes a longtemps été considérée comme l'étalon-or, mais nécessite un travail manuel intensif qui s'adapte mal à de grands ensembles de données. Dans les années récentes, les méthodes de détection automatique basées sur l'apprentissage automatique ont amélioré la précision et l'efficacité de la collecte de données ; cependant, la précision de ces méthodes repose sur l'accès à une grande quantité de données de haute qualité, données d'entraînement étiquetées, souvent des dizaines de milliers d'enregistrements ou plus.
Pour résoudre ce dilemme des données, l'équipe de recherche a développé SeismoGen basé sur un réseau accusatoire génératif (GAN), qui est un type de modèle génératif profond qui peut générer des échantillons synthétiques de haute qualité dans plusieurs domaines. En d'autres termes, les modèles génératifs profonds entraînent les machines à faire des choses et à créer de nouvelles données qui pourraient passer pour réelles.
Une fois formé, le modèle SeismoGen est capable de produire des formes d'onde sismiques réalistes de plusieurs étiquettes. Lorsqu'il est appliqué à de vrais ensembles de données sismiques de la Terre en Oklahoma, l'équipe a constaté que l'augmentation des données à partir des formes d'onde synthétiques générées par SeismoGen pourrait être utilisée pour améliorer les algorithmes de détection des tremblements de terre dans les cas où seules de petites quantités de données d'apprentissage étiquetées sont disponibles.