Ein neuronaler Encoder für die Vorhersage der Erdbebenrate
Wissenschaftliche Berichte Band 13, Artikelnummer: 12350 (2023) Diesen Artikel zitieren
765 Zugriffe
3 Altmetrisch
Details zu den Metriken
Die Vorhersage des Zeitpunkts von Erdbeben ist seit langem eine Herausforderung. Darüber hinaus wird immer noch diskutiert, wie dieses Problem sinnvoll formuliert oder die Vorhersagekraft verschiedener Modelle verglichen werden kann. Hier entwickeln wir einen vielseitigen neuronalen Encoder für Erdbebenkataloge und wenden ihn auf das grundlegende Problem der Vorhersage der Erdbebenrate im Rahmen des räumlich-zeitlichen Punktprozesses an. Das epidemische Nachbebensequenzmodell (ETAS) lernt effektiv eine kleine Anzahl von Parametern, um die angenommenen Funktionsformen für die räumlichen und zeitlichen Korrelationen von Erdbebensequenzen einzuschränken (z. B. Omori-Utsu-Gesetz). Hier stellen wir erlernte räumliche und zeitliche Einbettungen für Punktprozess-Erdbebenvorhersagemodelle vor, die komplexe Korrelationsstrukturen erfassen. Wir demonstrieren die Allgemeingültigkeit dieser neuronalen Darstellung im Vergleich zum ETAS-Modell mithilfe von Zugtest-Datenaufteilungen und wie sie die Einbeziehung zusätzlicher geophysikalischer Informationen ermöglicht. Bei Ratenvorhersageaufgaben zeigt das verallgemeinerte Modell eine Verbesserung des Informationsgewinns pro Erdbeben um \(>4\%) und das gleichzeitige Lernen anisotroper räumlicher Strukturen analog zu Verwerfungsspuren. Das trainierte Netzwerk kann auch zur Durchführung kurzfristiger Vorhersageaufgaben verwendet werden, was zu einer ähnlichen Verbesserung bei gleichzeitiger Reduzierung der Laufzeit um das Tausendfache führt.
Bei der Anwendung von maschinellem Lernen (ML) für die Analyse seismologischer Daten wurden in jüngster Zeit erhebliche Fortschritte erzielt, die durch neue Ansätze zur Klassifizierung und Charakterisierung seismischer Wellenformen1,2, automatische Phasenauswahl3, Identifizierung von Erdbeben geringer Stärke4 und Katalog-Declustering5 hervorgehoben werden. 6. Bei der Entwicklung von Erdbebenkatalogen haben ML-Ansätze die Anzahl der erkannten Ereignisse um das Zehnfache erhöht4 und werden möglicherweise die Reisezeitabhängigkeit der Erdbebenfrühwarnung von der Geschwindigkeit seismischer Wellen auf die Lichtgeschwindigkeit reduzieren7.
Bei der Modellierung von Erdbebensequenzen haben maschinelle Lerntechniken jedoch nur begrenzte Fortschritte im Hinblick auf die Ermöglichung verbesserter Charakterisierungen von Seismizitätsmustern erzielt8,9. Die spezifische Aufgabe, den Zeitpunkt künftiger seismischer Ereignisse vorherzusagen, ist sowohl als grundlegende wissenschaftliche Fragestellung als auch für die angewandte Gefahrenanalyse eine seit langem bestehende und grundlegende Herausforderung. Während die seismische Aktivität in einigen Fällen relativ konsistente zeitliche10 oder räumliche Muster11 aufweist, ist es nach wie vor schwierig, Zeit, Ort und Ausmaß der Seismizität quantitativ vorherzusagen12.
Der modernste Ansatz für dieses Problem in der statistischen Seismologie besteht darin, Erdbebensequenzen als räumlich-zeitlichen Punktprozess darzustellen13,14,15. Bei diesem Ansatz hat das Modell die Aufgabe, die momentane Häufigkeit des Auftretens von Erdbeben oberhalb einer bestimmten Stärke \(\lambda (x, y, t \mid H_{t-})\) vorherzusagen, wobei x, y räumliche Koordinaten sind ( Längen- und Breitengrad oder projizierte Kartenkoordinaten) und t ist die Zeit. \(H_{t-}\) repräsentiert alle Informationen, die dem Modell vor dem Zeitpunkt t zur Verfügung standen. Die zeitabhängige Funktion \(\lambda\) ist die quantitative Darstellung der Intensität der seismischen Aktivität, die sowohl die Epochen des Vorbebens16,17 als auch des Nachbebens18 charakterisiert und als Grundlage für die Bewertung der seismischen Gefährdung dient19.
Das Epidemic-Type Aftershock Sequence (ETAS)-Modell13,20 ist das am häufigsten verwendete Modell dieser Art und stellt \(\lambda\) als einen selbsterregenden Verzweigungsprozess dar, der eine „Hintergrundrate“ der Seismizität und eine Antwortfunktion annimmt, f , deren spezifische Form so gewählt ist, dass die aus dem Modell generierten Langzeitstatistiken synthetischer Erdbebenkataloge die beiden weithin beobachteten phänomenologischen Verteilungen der Seismizität reproduzieren: (1) das Omori-Utsu-Gesetz des Nachbebenratenabfalls und (2) das Gutenberg- Richterverteilung der Ereignisgrößen. Es gibt einige beliebte Optionen für die Antwortfunktion21,22,23,24, die die Form \(f = \mu (x,y)+ T(t-t_i)S(x-x_i, y-y_i) haben ; M_i)\). Hier wird \(\mu\) als zeitunabhängige „Hintergrundrate“ bezeichnet, T ist ein zeitlicher Kernel mit einem Potenzgesetzzerfall, der mit Omoris Gesetz übereinstimmt, und S ist ein räumlich zerfallender Kernel22,25. \(x_i, y_i\) und \(t_i\) sind der hypozentrale Ort bzw. die Auftrittszeit des Erdbebens.
Das ETAS-Modell wurde als effektive Darstellung von Erdbebenratenänderungen19,26,27,28 verwendet. Seine Anwendbarkeit wurde jedoch durch mehrere Faktoren eingeschränkt. Erstens ist das Finden optimaler ETAS-Parameter eine anspruchsvolle Optimierungsaufgabe, da mit der raumabhängigen Hintergrundseismizitätsrate breite Minima verbunden sind und eine Reihe verschiedener Parameter für die Antwortfunktion ähnliche Log-Likelihood-Werte erzeugen können29,30,31,32 ,33. Zweitens haben die klassischen vorgegebenen Formen von f eine begrenzte Aussagekraft und beschränken den ETAS-Ansatz auf die Berücksichtigung der Hypozentren, Zeiten und Stärken vergangener Erdbeben mittlerer bis großer Stärke. Zusätzliche relevante Daten, darunter Seismizität kleiner Stärke, tektonische Struktur, Verwerfungsorte und Erdbebenherdmechanismen, werden normalerweise nicht modelliert, obwohl einige Versuche unternommen wurden, sie einzubeziehen19,21,34,35.
Eine Skizze der Modellarchitektur mit Informationen bis zum Zeitpunkt t.
Hier schlagen wir das neuronale Encoder-Decoder-Modell FERN (Forecasting Earthquake Rates with Neural Networks) vor, um über die ETAS-Einschränkungen hinaus zu verallgemeinern. Konzeptionell wird die Eingabe von einem neuronalen Netzwerk codiert, um eine latente Darstellung des tektonischen Zustands zu erzeugen, die dann an ein Decodernetzwerk weitergeleitet wird (Abb. 1). Dieses Design hat zwei spezifische Vorteile: Erstens ermöglicht es natürlich die Einbindung unterschiedlicher Datenquellen und -modalitäten, die mit quellenspezifischen Encodern dem Modell hinzugefügt werden können. Zweitens kann derselbe codierte Zustand als Eingabe für mehrere Vorhersageköpfe („Decoder“) verwendet werden, die für verschiedene Vorhersageaufgaben verwendet werden können.
Dieser Ansatz entspricht der Leistung des hochmodernen ETAS-Modells bei der Geschwindigkeitsvorhersage, wenn es mit identischen Datensätzen trainiert wird, und weist darauf hin, dass das FERN-Modell eine höhere Genauigkeit aufweist, wenn es mit Erdbeben versorgt wird, deren Stärke kleiner als der Vollständigkeitsschwellenwert des Katalogs ist. Wir zeigen auch, wie die trainierten Encoder zur Lösung eines anderen Vorhersageproblems verwendet werden können, einer kurzfristigen Vorhersage der Anzahl von Ereignissen in einem 24-Stunden-Zeitraum. Bei dieser Aufgabe übertrifft das FERN-Modell das ETAS-Modell und erfordert gleichzeitig 4–5 Größenordnungen weniger Rechenzeit. Wir liefern keine Unsicherheitsschätzungen, die entweder auf der Ausbreitung von Datenfehlern oder auf variierenden Modellarchitekturen basieren.
Wir verwenden drei Encoder (Abb. 1), um verschiedene Aspekte der Seismizitätsmuster zu erfassen. Der aktuelle Erdbeben-Encoder ist eine direkte Verallgemeinerung der ETAS-Antwortfunktion f und ersetzt die vom Menschen entwickelte Funktionsform von f durch ein allgemeineres neuronales Netzwerk. Es soll kurzfristige seismische Aktivitäten erfassen. Der Langzeitseismizitätsencoder lernt langfristige räumlich-zeitliche seismische Muster, indem er Erdbebenereignisse in unterschiedlichen Zeitspannen zählt, die von Minuten bis zu Jahren reichen. Schließlich lernt der Standort-Encoder, analog zur Hintergrundseismizitätsrate im ETAS-Modell, standortspezifische Informationen. Einzelheiten zu den Encoder-Architekturen finden Sie im Abschnitt „Methoden“ weiter unten. Der Quellcode ist unter 36 verfügbar.
Hier wenden wir das FERN-Modell auf die beobachtete Seismizität der Region der größeren japanischen Inseln an, die in den letzten 30 Jahren aufgezeichnet wurde. Der Untersuchungsbereich wird in ein Gitter aus quadratischen Zellen der Dimension \(0,25^{\circ } \times 0,25^{\circ }\) diskretisiert. Die Eingabe in das Modell ist ein Katalog von Erdbeben, einschließlich des Hypozentrums, der Stärke und des Zeitpunkts jedes Ereignisses sowie der geografischen Lage der gerasterten Zellzentren. Diese Informationen werden durch drei neuronale Encoder geleitet, um eine latente Darstellung der seismischen Geschichte zu erzeugen. Der codierte Verlauf wird dann durch einen neuronalen Decoder geleitet, um die Vorhersageaufgabe auszuführen.
Die drei Untersuchungsregionen im Norden Japans. Erdbeben größer als \(M_w=5\), die während des Untersuchungszeitraums aufgetreten sind, werden aufgezeichnet. Karten, hier und in Abb. 4, wurden mit den Python-Paketen pygmt37 und matplotlib38 generiert.
Wir wenden das FERN-Modell an, um die seismische Aktivität in drei Unterregionen in der Nähe der japanischen Subduktionszone zu untersuchen (Abb. 2). Unter Verwendung von Hypozentrumsdaten aus dem JMA-Erdbebenkatalog39 wird das Netzwerk in jeder Region separat trainiert, wobei strikte zeitliche Aufteilungen der Daten durch Zugvalidierungstests mit einem Trainingszeitraum von 1979 bis 1995 und einem Validierungszeitraum von 1996 bis 2003 erfolgen. Um die optimalen Netzwerkparameter zu ermitteln, wird eine Hyperparametersuche durchgeführt. Schließlich wird das leistungsstärkste Modell sowohl im Trainings- als auch im Validierungszeitraum trainiert und im Katalog der Jahre 2004–2011 (Testzeitraum) bewertet. Die Auswertung erfolgt über ein feineres Gitter, \(0,05^{\circ } \times 0,05^{\circ }\), um eine bessere Schätzung der Modellleistung zu erhalten. Numerische Tests haben gezeigt, dass eine weitere Verbesserung der Auflösung unsere Schätzung der Log-Likelihood nicht verbessert. Alle unten aufgeführten Metriken beziehen sich auf die Leistung des FERN-Modells während eines Testzeitraums, der vor dem großen Tohoku-oki-Erdbeben im März 2011 endet. Gleichzeitig trainieren wir auch ein ETAS-Modell26,40,41,42 im gleichen zeitlichen und räumlichen Bereich Fenster. Die durchschnittlichen Seismizitätsraten in den drei Zeiträumen sind für jede Region in Tabelle I des Zusatzmaterials angegeben.
Als ersten Schritt trainieren wir das FERN-Modell, um die momentane Seismizitätsrate \(\lambda (x,y,t \mid H_{t-})\) vorherzusagen, die auch die Ausgabe des ETAS-Modells ist. Das Netzwerk ist darauf trainiert, die Log-Likelihood des beobachteten Katalogs zu optimieren, \({\mathscr {L}} = \sum _i \log \lambda _i-\iiint \lambda (x,y,t)dx\,dy\ ,dt\)13,15 wobei \(\lambda _i = \lambda (x_i, y_i, t_i \mid H_{t_i-})\) die vorhergesagte Rate am räumlich-zeitlichen Ort des i-ten Erdbebens ist und die Summe ist Übernommen werden alle Erdbeben in der Untersuchungsregion über einem bestimmten Magnitudengrenzwert \(M_c\), von dem wir annehmen, dass er der geschätzten Vollständigkeitsmagnitude des Katalogs entspricht.
Wir stellen fest, dass FERN in allen drei Untersuchungsregionen einen mit dem von ETAS vergleichbaren Log-Likelihood-Score aufweist (Tabelle 1). Da FERN die Einbeziehung zusätzlicher Informationen ohne Änderung der Modellarchitektur ermöglicht, können wir potenzielle seismische Vorläuferaktivitäten von Erdbeben mit einer Stärke unter \(M_c\) direkt einbeziehen, indem wir diese kleineren Ereignisse nur als Merkmale, aber nicht als Beschriftungen verwenden. Das heißt, die Erdbeben geringer Stärke werden als Eingabe in das Modell einbezogen, ändern aber nichts an der Berechnung von \({\mathscr {L}}\). Dies ermöglicht einen ordnungsgemäßen statistischen Vergleich des Modells einschließlich kleinerer Ereignisse (FERN+) mit ETAS und mit FERN, da alle diese Modelle denselben statistischen Raum beschreiben, nämlich die Seismizität oberhalb von \(M_c\). Die Hinzufügung von Seismizität kleinerer Stärke verbessert den Informationsgewinn pro Erdbeben in allen getesteten Regionen um 4–12 % im Vergleich zu ETAS und FERN, die nur große Erdbeben betreffen (Tabelle 1). Dies entspricht durchschnittlich \(\sim 0,1\) Informationsbits pro Erdbeben.
Als zweiten Test trainieren wir das FERN-Modell, um eine kurzfristige seismische Vorhersage durchzuführen. Unter Verwendung derselben Encoder, die für die Durchführung von Ratenvorhersagen trainiert wurden, und ohne ihre Gewichtungen zu aktualisieren, trainieren wir nun einen anderen Decoder, der eine kurzfristige Vorhersage für die Anzahl der Erdbeben der Stärke \(>M_c\) durchführt, die in jedem räumlichen \( 0,5^{\circ } \times 0,5^{\circ }\) Zelle. Konkret handelt es sich bei den Merkmalen in jedem Trainingsbeispiel um die Erdbeben, die bis zum Zeitpunkt t aufgetreten sind, und die Bezeichnung für jede Zelle ist die Anzahl der Erdbeben, die in ihr in den 24 Stunden nach dem Zeitpunkt t aufgetreten sind. Im Gegensatz zur Ratenvorhersage handelt es sich hierbei um ein standardmäßiges (überwachtes) Regressionsproblem, dessen Metriken leicht interpretierbar sind. Für das Training der Decoder folgen wir der gleichen strengen Zug-Validierungs-Test-Aufteilung wie oben (die Encoder werden nicht neu trainiert) und vergleichen die Modellergebnisse mit Katalogen, die aus dem trainierten ETAS-Modell generiert wurden. Wir folgen dem Standardprotokoll26, 100.000 Kataloge von ETAS für jeden Tag zu generieren und die durchschnittliche Anzahl von Erdbeben in jeder Zelle zu berechnen. Die Ergebnisse sind in Tabelle 2 dargestellt.
Wir vergleichen die Modellleistung mithilfe der Receiver Operating Characteristic Analysis (ROC), die durch Schwellenwertberechnung der Modellausgabe und Zählen der Rate der True-Positive-Rate (TPR) und der False-Positive-Rate (FPR)-Vorhersage erhalten wird (TPR bedeutet hier, dass mindestens ein Erdbeben innerhalb eines Gitters aufgetreten ist). Zelle während eines Zielzeitintervalls). Beispielsweise liefert ETAS in Region C bei einem FPR von 20 % einen TPR von 80 %, während FERN+ einen TPR von 90 % anzeigt. Für Region B werden ähnliche Ergebnisse erzielt, während in Region A alle Modelle eine ähnliche Leistung zeigen.
Dies gilt auch für andere statistische Tests, wie in Tafel (b) von Abb. 3 dargestellt. Darin vergleichen wir den Wahrscheinlichkeitswert der beobachteten Seismizität im Testzeitraum („L-Test“) unter der Annahme der Anzahl der Erdbeben in jedem Die Zelle folgt einer Poisson-Verteilung, und der Wahrscheinlichkeitswert beim Vergleich nur der räumlichen Verteilung von Erdbeben über den Testzeitraum („S-Test“) finden Sie im Zusatzmaterial für weitere Informationen. Wir stellen fest, dass die Durchführung einer Kurzzeitvorhersage mit FERN (oder FERN+) nur einen einzigen Vorwärtsdurchlauf des trainierten Netzwerks erfordert, während eine ETAS-Vorhersage die Durchführung einer großen Anzahl von Simulationen erfordert, um Katalogstatistiken zu sammeln26. Damit sorgt FERN+ für eine mehr als 1000-fache Laufzeitverbesserung.
ROC-Kurven für verschiedene Modelle in Region C. Regionen A und B zeigen qualitativ ähnliche Ergebnisse.
Es ist zu beachten, dass die Leistung aller Modelle, sowohl maschinell erlernte als auch ETAS-Modelle, je nach geografischer Region und Zeitfenster variiert43, wie wir auch hier sehen. Es zeigt sich beispielsweise, dass der Informationsgewinn von FERN+ gegenüber ETAS in Region A relativ gering ist. Im Allgemeinen ist es schwierig zu interpretieren, warum das neuronale Modell in einer Region gut und in anderen weniger gut funktioniert. Wir gehen jedoch davon aus, dass die Ursache in diesem Fall in der Änderung der Seismizitätsstatistik zwischen den Trainings- und Validierungsperioden liegt, auf denen die Modelle basieren trainiert und kalibriert wurden, sowie der Testzeitraum, für den die Metriken gemeldet werden. Tabelle I des Zusatzmaterials enthält Einzelheiten zu diesen Statistiken. Es zeigt, dass Region A im Testzeitraum viel mehr \(M_w\ge 7\) Erdbeben aufweist (0,88 Ereignisse/Jahr) als im Zug+Validierungszeitraum (0,2/Jahr). Eine derart dramatische Veränderung tritt in den Regionen B und C nicht auf. Solche Auswirkungen könnten durch kontinuierliches Training des Modells („pseudo-prospektives Testen“) oder durch das parallele Training eines Modells in mehreren Regionen abgemildert werden. Es ist jedoch erwähnenswert, dass das neuronale Modell auch in Region A vergleichbare Metriken wie ETAS erreicht.
Im Gegensatz zu ETAS können die Parameter des neuronalen Modells nicht trivial interpretiert werden, was bei neuronalen Modellen üblich ist44. Wir können jedoch mit dem FERN-Modell experimentieren, um die Frage zu beantworten: Wie ändert sich die vorhergesagte Seismizitätsrate \(\lambda (x,y,t)\) als Reaktion auf ein einzelnes Erdbeben? Die Antwort, die das ETAS-Modell auf diese Grundfrage gibt, lautet per Definition: f. Um diese Frage mit dem FERN-Modell zu beantworten, haben wir dem Ereigniskatalog ein synthetisches Erdbeben zu einem beliebigen Zeitpunkt und an einem beliebigen Ort in Region A hinzugefügt (vgl. Abb. 2). In Abb. 4 stellen wir den Unterschied zwischen der Modellvorhersage für \(\lambda (x,y,t)\) 1 Stunde nach diesem synthetischen Erdbeben und seiner Vorhersage, wenn dieses Erdbeben nicht auftritt, sowohl für ETAS als auch für FERN dar.
Wir stellen fest, dass die Reaktion von FERN eine komplexe und anisotrope räumliche Struktur aufweist, mit einer erhöhten Reaktion entlang der Verwerfungsspur. Wir stellen fest, dass der Ort der Verwerfungslinie nicht als Merkmal in das Modell einbezogen wurde und dass das FERN-Modell lernt, dass die erhöhte seismische Aktivität weder isotrop noch räumlich homogen ist, was natürlich ein bekanntes Merkmal der Seismizität ist45,46, 47,48,49. Es ist auch zu erkennen, dass die Ausgabe des Standortkodierers ähnliche räumliche Muster wie die Muster der seismischen Aktivität aufweist, wie kürzlich gezeigt wurde50. In ähnlicher Weise stellen wir fest, dass die zeitliche Abhängigkeit des von FERN erlernten Geschwindigkeitsanstiegs ein Potenzgesetz ist, das jedoch langsamer abfällt als die ETAS-Vorhersage, weniger stark von der Größe abhängt und die Größenabhängigkeit nicht homogen, sondern vielmehr räumlich abhängig ist ( Ergänzungsmaterial).
Blick ins Innere des Modells. (a,b) Der von ETAS und FERN vorhergesagte Geschwindigkeitsunterschied zu einem einzelnen Erdbeben. Wir haben dem Katalog ein synthetisches Erdbeben bei \(144^{\circ }, 40^{\circ }\) (markiert mit einem gelben Stern) zum Zeitpunkt \(t=10.10.2010\) um Mitternacht hinzugefügt und das berechnet Differenz zwischen der von den Modellen mit und ohne synthetischem Erdbeben vorhergesagten Rate, 1 Stunde nach dem Ereignis. Die dargestellte Region ist Region A und die Verwerfungslinie ist rot dargestellt. (c) Die Aktivierung eines der latenten Neuronen in der Ausgabe des Standortkodierers für jede räumliche Zelle (andere Neuronen zeigen qualitativ ähnliche Muster). Es ist ersichtlich, dass dieses Muster gut mit der Gesamtzahl der Erdbeben in der Zelle korreliert, wie in (d) dargestellt. Wir können uns die Ausgabe des Standortencoders als eine Verallgemeinerung der Hintergrundrate \(\mu\) des ETAS-Modells vorstellen, die in (e) dargestellt ist.
Wir präsentieren eine neuronale Architektur zur Vorhersage der Erdbebenrate, die den Punktprozessansatz übernimmt, aber die angenommenen Funktionsformen des ETAS-Modells durch erlernte Einbettungen ersetzt. Unsere Methode zeigt vergleichbare oder überlegene Testmetriken (ohne Unsicherheitsanalyse), und die latente Darstellung der seismischen Geschichte, die von den neuronalen Encodern generiert wurde, die für die Durchführung von Geschwindigkeitsvorhersagen trainiert wurden, kann mit geringem Zusatzaufwand problemlos auch für verwandte Aufgaben verwendet werden. Dies weckt die Hoffnung, dass solche Modelle auch bei anderen Aufgaben nützlich sein könnten, beispielsweise bei der Größenvorhersage oder der Gefahrenbewertung.
Hier beschreiben wir die wichtigsten Designoptionen des FERN-Modells. Ausführliche Informationen finden Sie im Zusatzmaterial.
Aktuelle Erdbeben (ETAS-ähnlich): Dieses Encodermodell ist eine direkte Verallgemeinerung des Summenterms in der Definition von ETAS. Das heißt, seine Ausgabe ist die Summe einer Funktion, die auf katalogisierte Daten jedes Erdbebens in der (jüngsten) Vergangenheit angewendet wird. Die Funktion ist wie folgt aufgebaut: Der Katalog stellt 5 Zahlen bereit, die jedes Erdbeben beschreiben, indiziert durch i: den Zeitpunkt des Ereignisses \(t_i\), seinen epizentralen Ort \(x_i, y_i\), die Tiefe \(d_i\ ) und Momentengröße \(M_i\). Wir verwenden UTM-Koordinaten für x, y. Darüber hinaus hat das Modell Zugriff auf die raumzeitlichen Parameter der Zelle x, y, t. Für jedes Erdbeben und jede Zelle berechnen wir eine Liste von k Merkmalen \(F^1(t,x,y,t_i,x_i,y_i,d_i,M_i)\dots F^k(t,x,y,t_i,x_i, y_i,d_i,M_i)\). Diese Funktionsfunktionen sind von ETAS inspiriert und durch physikalische Überlegungen eingeschränkt. Einige Beispiele für Merkmalsfunktionen sind die Stärke des Erdbebens, \(F_1 = e^{M_i}\); der Kehrwert der seit dem Erdbeben verstrichenen Zeit, \(F^2 = 1 / (t - t_j)\); der Kehrwert der Distanz zum Epizentrum des Erdbebens, \(F^3= 1 / \sqrt{(x - x_j)^2 + (y - y_j)^2}\) usw. Die vollständige Liste der Feature-Funktionen ist in der Tabelle aufgeführt III des Zusatzmaterials. Der Merkmalsvektor \(\left( F^1_i,\dots ,F^k_i\right)\) wird dann durch ein mehrschichtiges Perzeptron44 geleitet, dessen Ausgabe eine latente Darstellung der Erdbebenmerkmale ist. Diese Darstellung wird dann über die vergangenen N Erdbeben summiert, wie die Summe, die \(\lambda\) im ETAS-Modell definiert. Der Encoder ist gegenüber Permutationen von Katalogzeilen eindeutig invariant. Einfach ausgedrückt ahmt dieser Encoder im Wesentlichen die Struktur des zeitabhängigen Teils eines ETAS-Modells nach und ersetzt lediglich die Funktion f durch ein neuronales Netzwerk, wodurch eine viel größere Familie von Funktionen parametrisiert werden kann.
Langfristige Seismizität: Das Ziel dieses Encoders besteht darin, lang- und kurzfristige Seismizität am Punkt (x, y) zum Zeitpunkt t zu erfassen. Die Funktionen für dieses Modell sind wie folgt aufgebaut. Für jeden solchen Punkt berechnen wir n(T, d, M), das ist die Anzahl der Erdbeben mit einer Stärke größer als M, die höchstens T Sekunden vor t in einem epizentrischen Abstand kleiner als d von (x, y) auftraten. Zur Vereinfachung der Implementierung verwenden wir den Abstand \(L_1\), aber diese Wahl hat vernachlässigbare Auswirkungen auf die Ergebnisse. Die Parameter T, d, M werden einer vordefinierten Liste entnommen. Die Werte von T und d sind logarithmisch verteilt, sodass sowohl sehr lange Historien als auch aktuelle Aktivitäten erfasst werden können. Dadurch entsteht ein Merkmalsvektor \((n_1, \dots , n_k)\) pro räumlichem Ort. Nach einer Gewichtungsverteilungsstrategie ähnlich der des jüngsten Erdbeben-Encoders verwenden wir dann ein mehrschichtiges Perzeptron, um eine Funktion g(n, T, d, M) zu parametrisieren, die auf alle räumlichen Orte angewendet wird. Einzelheiten zur Implementierung finden Sie im Zusatzmaterial. Unsere Experimente haben gezeigt, dass die Verwendung einer solchen Gewichtsverteilung, also das Erlernen einer einzelnen Funktion g, deutlich bessere Ergebnisse liefert als das Erlernen eines allgemeineren Modells, das das einzelne \(n_i\) als Eingabe verwendet.
Standort: Dieser Encoder soll lokale Eigenschaften für jede räumliche Zelle erfassen. Die Modellausgabe ist ein 16-dimensionaler Vektor, der die Identität der Zelle darstellt. In Abb. 4 ist zu sehen, dass die Kodierung gut mit der Seismizität korreliert. Der Encoder ist als One-Hot-Encoder44 implementiert (wobei jede Zelle als eine andere Klasse behandelt wird), gefolgt von einer einzelnen vollständig verbundenen Schicht.
Um den Verlust zu berechnen,
Wir verwenden die von Omi vorgeschlagene Methode. et. al53. Die gesamte Zugperiode ist in Intervalle unterteilt, die zu den Zeitpunkten \(\{t_i\}\) beginnen und enden, in denen Erdbeben aufgetreten sind. Jedes Trainingsbeispiel entspricht einem solchen Intervall \([t_i, t_{i+1}]\). Für jedes Intervall wird der Katalog aller Erdbeben, die vor \(t_i\) aufgetreten sind, an die verschiedenen Encoder übergeben. Die Ausgabe der Encoder, die latente Darstellung von \(H_{t-}\), wird dann an einen Decoder übergeben, der \(\int _{t_i}^{t_{i+1}}\lambda dt\) ausgibt. für jede Zelle. Für diese Berechnung wird \(\Delta t_i=t_{i+1}-t_{i}\) als Eingabe an den Decoder geliefert (siehe Abb. 1). Der zweite Term in Gl. (1) wird dann durch Summieren der Modellausgabe über alle Beispiele ausgewertet, und der erste Term wird durch automatische Differenzierung erhalten, was in neuronalen Netzen rechnerisch kostengünstig ist.
Die während der aktuellen Studie generierten und/oder analysierten Datensätze sind im Erdbebenkatalog der Japan Meterological Agency (JMA) verfügbar, https://www.data.jma.go.jp/svd/eqev/data/bulletin/index_e.html.
van den Ende, MP & Ampuero, J.-P. Automatisierte Charakterisierung seismischer Quellen mithilfe neuronaler Deep-Graph-Netzwerke. Geophys. Res. Lette. 47, e2020GL088690 (2020).
ADS Google Scholar
Zhang, X. et al. Ein datengesteuertes Framework zur automatisierten Erkennung von flugzeuggenerierten Signalen in seismischen Array-Daten mithilfe maschinellen Lernens. Seismol. Soc. Bin. 93, 226–240 (2022).
Google Scholar
Mousavi, SM, Ellsworth, WL, Zhu, W., Chuang, LY & Beroza, GC Erdbebentransformator – Ein aufmerksames Deep-Learning-Modell für die gleichzeitige Erdbebenerkennung und Phasenauswahl. Nat. Komm. 11, 1–12 (2020).
Artikel Google Scholar
Ross, ZE, Trugman, DT, Hauksson, E. & Shearer, PM Auf der Suche nach versteckten Erdbeben in Südkalifornien. Wissenschaft 364, 767–771 (2019).
Artikel ADS CAS PubMed Google Scholar
Bergen, KJ, Johnson, PA, de Hoop, MV & Beroza, GC Maschinelles Lernen für datengesteuerte Entdeckungen in der Geowissenschaft der festen Erde. Wissenschaft 363, eaau0323 (2019).
Artikel PubMed Google Scholar
Kong, Q. et al. Maschinelles Lernen in der Seismologie: Daten in Erkenntnisse verwandeln. Seismol. Res. Lette. 90, 3–14 (2019).
Artikel Google Scholar
Licciardi, A., Bletery, Q., Rouet-Leduc, B., Ampuero, J.-P. & Juhel, K. Sofortige Verfolgung des Erdbebenwachstums mit Elastogravitationssignalen. Natur 606, 1–6 (2022).
Artikel Google Scholar
Mignan, A. & Broccardo, M. Anwendungen neuronaler Netze in der Erdbebenvorhersage (1994–2019): Metaanalytische und statistische Erkenntnisse zu ihren Grenzen. Seismol. Res. Lette. 91, 2330–2342 (2020).
Artikel Google Scholar
Mancini, S. et al. Zur Verwendung hochauflösender und Deep-Learning-seismischer Kataloge für kurzfristige Erdbebenvorhersagen: Mögliche Vorteile und aktuelle Einschränkungen. J. Geophys. Res. Solid Earth 127(11), e2022JB025202 (2022).
Artikel ADS CAS PubMed PubMed Central Google Scholar
Berryman, KR et al. An einer isolierten Plattengrenzstörung kommt es regelmäßig zu schweren Erdbeben. Science 336, 1690–1693 (2012).
Artikel ADS CAS PubMed Google Scholar
Uchida, N. & Bürgmann, R. Wiederholte Erdbeben. Annu. Rev. Planet Erde. Wissenschaft. 47, 305–332 (2019).
Artikel ADS CAS Google Scholar
Geller, RJ Erdbebenvorhersage: Eine kritische Rezension. Geophys. J. Int. 131, 425–450 (1997).
Artikel ADS Google Scholar
Vere-Jones, D. Erdbebenvorhersage – Die Sicht eines Statistikers. J. Phys. Erde 26, 129–146 (1978).
Artikel Google Scholar
Ogata, Y. Seismizitätsanalyse durch Punktprozessmodellierung: Eine Übersicht. In Seismicity Patterns, Their Statistical Significance and Physical Meaning 471–507 (1999).
Rasmussen, JG Skript zur Vorlesung: Zeitliche Punktprozesse und die bedingte Intensitätsfunktion. (2018) arXiv-Vorabdruck arXiv:1806.00221.
Mignan, A. Seismizität, Vorläufer großer Erdbeben, vereint in einem Stressakkumulationsrahmen. Geophys. Res. Lette. 39, L21308 (2012).
Artikel ADS Google Scholar
Trugman, DT & Ross, ZE Allgegenwärtige Vorbebenaktivität in ganz Südkalifornien. Geophys. Res. Lette. 46(15), 8772–8781 (2019).
Artikel ADS Google Scholar
Utsu, T. et al. Der 100. Jahrestag der Omori-Formel für ein Zerfallsgesetz der Nachbebenaktivität. J. Phys. Erde 43, 1–33.
Artikel Google Scholar
Field, EH et al. Ein räumlich-zeitliches Clustermodell für die dritte einheitliche Erdbebenvorhersage in Kalifornien (UCERF3-ETAS): Auf dem Weg zu einer operativen Erdbebenvorhersage. Stier. Seismol. Soc. Bin. 107, 1049–1081 (2017).
Artikel Google Scholar
Ogata, Y. Statistische Modelle für Erdbebenereignisse und Restanalyse für Punktprozesse. Marmelade. Stat. Assoc. 83, 9–27 (1988).
Artikel Google Scholar
Kumazawa, T. & Ogata, Y. Instationäre ETAS-Modelle für nicht standardmäßige Erdbeben. Ann. Appl. Stat. 8, 1825–1852 (2014).
Artikel MathSciNet MATH Google Scholar
Ogata, Y. & Zhuang, J. Raumzeit-ETAS-Modelle und eine verbesserte Erweiterung. Tektonophysik 413, 13–23 (2006).
Artikel ADS Google Scholar
Segou, M., Parsons, T. & Ellsworth, W. Vergleichende Bewertung physikbasierter und statistischer Vorhersagen in Nordkalifornien. J. Geophys. Res. Solid Earth 118, 6219–6240 (2013).
Artikel ADS Google Scholar
Kovchegov, Y., Zaliapin, I. & Ben-Zion, Y. Invarianter Galton-Watson-Verzweigungsprozess für das Auftreten von Erdbeben. Geophys. J. Int. 231, 567–583 (2022).
Artikel ADS Google Scholar
Werner, MJ, Helmstetter, A., Jackson, DD & Kagan, YY Hochauflösende langfristige und kurzfristige Erdbebenvorhersagen für Kalifornien. Stier. Seismol. Soc. Bin. 101, 1630–1648 (2011).
Artikel Google Scholar
Zhuang, J. Erdbebenvorhersagen für den nächsten Tag für die Region Japan, generiert durch das Etas-Modell. Earth Planets Space 63, 207–216 (2011).
Artikel ADS Google Scholar
Llenos, AL & Michael, AJ Ensembles von ETAS-Modellen ermöglichen eine optimale operative Erdbebenvorhersage bei Schwärmen: Erkenntnisse aus dem San Ramon, Kalifornien 2015 SwarmEnsembles von ETAS-Modellen ermöglichen eine optimale operative Erdbebenvorhersage bei Schwärmen. Stier. Seismol. Soc. Bin. 109, 2145–2158 (2019).
Artikel Google Scholar
Milner, KR, Field, EH, Savran, WH, Page, MT & Jordan, TH Operative Erdbebenvorhersage während der Erdbebensequenz 2019 in Ridgecrest, Kalifornien, mit dem Modell ucerf3-etas. Seismol. Res. Lette. 91, 1567–1578 (2020).
Artikel Google Scholar
Veen, A. & Schoenberg, FP Schätzung von Raum-Zeit-Verzweigungsprozessmodellen in der Seismologie unter Verwendung eines EM-Algorithmus. Marmelade. Stat. Assoc. 103, 614–624 (2008).
Artikel MathSciNet CAS MATH Google Scholar
Zhuang, J., Ogata, Y. & Wang, T. Datenvollständigkeit der Kumamoto-Erdbebensequenz im JMA-Katalog und ihr Einfluss auf die Schätzung der ETAS-Parameter. Earth Planets Space 69, 1–12 (2017).
Artikel ADS Google Scholar
Seif, S., Mignan, A., Zechar, JD, Werner, MJ & Wiemer, S. Schätzung von ETAS: Die Auswirkungen von Kürzungen, fehlenden Daten und Modellannahmen. J. Geophys. Res. Solid Earth 122, 449–469 (2017).
Artikel ADS Google Scholar
Schoenberg, FP, Chu, A. & Veen, A. Über die Beziehung zwischen unteren Schwellenwerten und der Verzerrung bei Parameterschätzungen für epidemische Nachbebensequenzen. J. Geophys. Res. 115(B4), B04309 (2010).
ADS Google Scholar
Harte, DS Modellparameterschätzungsverzerrung, die durch die Begrenzung der Erdbebenstärke hervorgerufen wird. Geophys. J. Int. 204, 1266–1287 (2016).
Artikel ADS Google Scholar
Mizrahi, L., Nandan, S. & Wiemer, S. Berücksichtigung der Datenunvollständigkeit für eine bessere Erdbebenvorhersage. J. Geophys. Res. Solid Earth 126, e2021JB022379 (2021).
Artikel ADS Google Scholar
Adelfio, G. & Chiodi, M. Einbeziehung von Kovariaten in einen Raum-Zeit-Punktprozess mit Anwendung auf Seismizität. Stat. Methoden Appl. 30, 947–971 (2020).
Artikel MathSciNet MATH Google Scholar
Zlydenko, O. et al. https://github.com/google-research/google-research/tree/master/earthquakes_fern.
Uieda, L. et al. PyGMT: Eine Python-Schnittstelle für die Generic Mapping Tools (2023). https://doi.org/10.5281/zenodo.7772533.
Hunter, JD Matplotlib: Eine 2D-Grafikumgebung. Berechnen. Wissenschafts-Ing. 9, 90–95 (2007).
Artikel Google Scholar
Japanische Meteorologische Agentur. Das seismologische Bulletin Japans. https://www.data.jma.go.jp/svd/eqev/data/bulletin/index_e.html.
Zhuang, J., Ogata, Y. & Vere-Jones, D. Stochastische Auflösung von Erdbebenereignissen in der Raumzeit. Marmelade. Stat. Assoc. 97, 369–380 (2002).
Artikel MathSciNet MATH Google Scholar
Zhuang, J., Ogata, Y. & Vere-Jones, D. Analyse von Erdbebenclustermerkmalen mithilfe stochastischer Rekonstruktion. J. Geophys. Res. Feste Erde 109(B5), B05301 (2004).
Artikel ADS Google Scholar
Zhuang, J. Restanalyse zweiter Ordnung raumzeitlicher Punktprozesse und Anwendungen in der Modellbewertung. JR-Stat. Soc. Ser. B-Stat. Methodol. 68, 635–653 (2006).
Artikel MathSciNet MATH Google Scholar
Bayona, JA et al. Sind regional kalibrierte Seismizitätsmodelle aussagekräftiger als globale Modelle? Einblicke aus Kalifornien, Neuseeland und Italien. Seismische Rec. 3, 86–95 (2023).
Artikel Google Scholar
Murphy, KP Maschinelles Lernen: Eine probabilistische Perspektive (MIT Press, 2012).
MATH Google Scholar
Parsons, T., Stein, RS, Simpson, RW & Reasenberg, PA Spannungsempfindlichkeit der Verwerfungsseismizität: Ein Vergleich zwischen begrenzt versetzten Schrägverwerfungen und großen Streikschlupfverwerfungen. J. Geophys. Res. Solid Earth 104, 20183–20202 (1999).
Artikel Google Scholar
Toda, S., Stein, RS, Reasenberg, PA, Dieterich, JH & Yoshida, A. Belastung, übertragen durch den Schock von 1995 mit MW = 6,9 Kobe, Japan: Auswirkung auf Nachbeben und zukünftige Erdbebenwahrscheinlichkeiten. J. Geophys. Res. Solid Earth 103, 24543–24565 (1998).
Artikel Google Scholar
King, GC, Stein, RS & Lin, J. Statische Spannungsänderungen und die Auslösung von Erdbeben. Stier. Seismol. Soc. Bin. 84, 935–953 (1994).
Google Scholar
Yabe, S. & Ide, S. Warum treten Nachbeben im Bruchgebiet eines großen Erdbebens auf? Geophys. Res. Lette. 45, 4780–4787 (2018).
Artikel ADS Google Scholar
Ross, ZE, Ben-Zion, Y. & Zaliapin, I. Geometrische Eigenschaften der Seismizität in Kalifornien. Geophys. J. Int. 231, 493–504 (2022).
Artikel ADS Google Scholar
Page, MT & van der Elst, NJ Nachbeben treten bevorzugt in zuvor aktiven Gebieten auf. Seismische Rec. 2, 100–106 (2022).
Artikel Google Scholar
Zechar, JD et al. Die Kooperation zur Untersuchung der Erdbebenvorhersagbarkeit aus der Perspektive der rechnergestützten Erdbebenwissenschaft. Zustimmung. Berechnen. Üben. Exp. 22, 1836–1847 (2010).
Artikel Google Scholar
Jordanien, TH Erdbebenvorhersagbarkeit, Stein für Stein. Seismol. Res. Lette. 77, 3–6 (2006).
Artikel Google Scholar
Omi, T. et al. Implementierung eines Echtzeitsystems zur automatischen Nachbebenvorhersage in Japan. Seismol. Res. Lette. 90, 242–250 (2019).
Artikel Google Scholar
Referenzen herunterladen
Diese Studie wurde von der Israel Science Foundation finanziert (Grant Nr. 1907/22).
Google Research, Tel Aviv, Israel
Oleg Zlydenko, Gal Elidan, Avinatan Hassidim, Doron Kukliansky, Yossi Matias, Alexandra Molchanov, Sella Nevo und Yohai Bar-Sinai
Google Research, Cambridge, MA, USA
Brendan Meade
Abteilung für Erd- und Planetenwissenschaften, Harvard University, Cambridge, MA, USA
Brendan Meade
Abteilung für Physik der kondensierten Materie, Universität Tel Aviv, Tel Aviv, Israel
Yohai Bar-Sinai
Sie können diesen Autor auch in PubMed Google Scholar suchen
Sie können diesen Autor auch in PubMed Google Scholar suchen
Sie können diesen Autor auch in PubMed Google Scholar suchen
Sie können diesen Autor auch in PubMed Google Scholar suchen
Sie können diesen Autor auch in PubMed Google Scholar suchen
Sie können diesen Autor auch in PubMed Google Scholar suchen
Sie können diesen Autor auch in PubMed Google Scholar suchen
Sie können diesen Autor auch in PubMed Google Scholar suchen
Sie können diesen Autor auch in PubMed Google Scholar suchen
Von YBS, OZ, SN, BM, GE, AH und YM konzipierte Forschung. OZ, YBS, DK, SN und AM führten Untersuchungen durch. OZ, BM und YBS haben das Manuskript geschrieben. Alle Autoren haben das Manuskript überprüft.
Korrespondenz mit Yohai Bar-Sinai.
Die Autoren geben an, dass keine Interessenkonflikte bestehen.
Springer Nature bleibt neutral hinsichtlich der Zuständigkeitsansprüche in veröffentlichten Karten und institutionellen Zugehörigkeiten.
Open Access Dieser Artikel ist unter einer Creative Commons Attribution 4.0 International License lizenziert, die die Nutzung, Weitergabe, Anpassung, Verbreitung und Reproduktion in jedem Medium oder Format erlaubt, sofern Sie den/die ursprünglichen Autor(en) und die Quelle angemessen angeben. Geben Sie einen Link zur Creative Commons-Lizenz an und geben Sie an, ob Änderungen vorgenommen wurden. Die Bilder oder anderes Material Dritter in diesem Artikel sind in der Creative-Commons-Lizenz des Artikels enthalten, sofern in der Quellenangabe für das Material nichts anderes angegeben ist. Wenn Material nicht in der Creative-Commons-Lizenz des Artikels enthalten ist und Ihre beabsichtigte Nutzung nicht durch gesetzliche Vorschriften zulässig ist oder über die zulässige Nutzung hinausgeht, müssen Sie die Genehmigung direkt vom Urheberrechtsinhaber einholen. Um eine Kopie dieser Lizenz anzuzeigen, besuchen Sie http://creativecommons.org/licenses/by/4.0/.
Nachdrucke und Genehmigungen
Zlydenko, O., Elidan, G., Hassidim, A. et al. Ein neuronaler Encoder für die Vorhersage der Erdbebenrate. Sci Rep 13, 12350 (2023). https://doi.org/10.1038/s41598-023-38033-9
Zitat herunterladen
Eingegangen: 17. Januar 2023
Angenommen: 01. Juli 2023
Veröffentlicht: 31. Juli 2023
DOI: https://doi.org/10.1038/s41598-023-38033-9
Jeder, mit dem Sie den folgenden Link teilen, kann diesen Inhalt lesen:
Leider ist für diesen Artikel derzeit kein Link zum Teilen verfügbar.
Bereitgestellt von der Content-Sharing-Initiative Springer Nature SharedIt
Durch das Absenden eines Kommentars erklären Sie sich damit einverstanden, unsere Nutzungsbedingungen und Community-Richtlinien einzuhalten. Wenn Sie etwas als missbräuchlich empfinden oder etwas nicht unseren Bedingungen oder Richtlinien entspricht, kennzeichnen Sie es bitte als unangemessen.