2. April 2020

Maschinelle Lernverfahren als innovative Form der Klimamodellevaluierung

Maschinelles Lernen (ML), einer der wichtigen Ansätze der künstlichen Intelligenz (KI) und bereits erfolgreich in vielen wissenschaftlichen Disziplinen angewandt, hat ein großes Potenzial, auch die Erdsystemwissenschaften weiter voranzubringen. Gemeinsam mit der Gruppe Klimainformatik am DLR Institut für Datenwissenschaften (DLR-DW) und mit den Partnern des kürzlich verliehenen European Research Council (ERC) Synergy Grants “Understanding and Modelling the Earth System with Machine Learning (USMILE)” - dem Max Planck Institut für Biogeochemie in Jena, der Universität Valencia und der Columbia University New York - entwickelt das DLR-IPA KI-Methoden für die Erdsystemforschung.

Hochentwickelte Computermodelle des Erdklimas projizieren wie sich der Klimawandel auf regionale Trends wie Stärke der Niederschläge auswirken wird, und sind damit ein wichtiges Instrument um die Arbeit von Entscheidungsträgern in Regierungen, staatlicher Planung und Unternehmen zu unterstützen. Eine Vielzahl solcher Modelle wird derzeit in mehr als 40 Forschungszentren weltweit entwickelt und nimmt am "Coupled Model Intercomparison Project Phase 6 (CMIP6)" des Weltklimaforschungsprogramms teil, das derzeit vom DLR-IPA geleitet wird [1]. Eine neue Studie, die in "Nature Communications" unter der Leitung des Imperial College London in Zusammenarbeit mit dem DLR-DW und dem DLR-IPA veröffentlicht wurde, hat einen neuen Ansatz zur Klimamodellevaluation mit Hilfe von ML-Techniken entwickelt [2].

Dieser neue Ansatz - Kausale Modellevaluation genannt - stützt sich auf kürzlich entwickelte kausale Inferenz-Algorithmen [3]. Die Methode erlaubt es, einen digitalen 'Fingerabdruck' von jedem Klimamodell zu erstellen, wobei jeder Fingerabdruck kausale Zusammenhänge charakterisiert, durch die verschiedene Weltregionen innerhalb eines gegebenen Modells miteinander gekoppelt sind. Diese Kopplungsmechanismen wiederum sind als wichtige treibende Kräfte für regionale Witterungsbedingungen bekannt.

Illustration des Modellvergleichs anhand kausaler Fingerabdrücke. Jeder Klimadatensatz wird erst mathematisch in 50 lokalisierte Hauptkomponenten (Klimavariationen) zerlegt. Algorithmen der kausalen Inferenz werden dann auf die Zeitserien diese Komponenten angewendet um herauszufinden wie diese Komponenten zeitlich miteinander interagieren. Jeder Pfeil zeigt einen signifikant positiven oder negativen Einfluss einer Komponente auf eine andere an und charakterisiert damit eine spezifische Kopplung im Klimasystem zwischen verschiedenen Regionen. Die Zeitskala dieser Kopplung ist durch kleine Zahlen über den Pfeilen angedeutet, wobei eine Einheit einer Verzögerung von 3 Tagen entspricht. Die Farben der 50 Komponentenknoten im Netzwerk zeigen den Grad der Autokorrelation (Auto-MCI) jeder Komponente mit sich selbst an. Die Farben der Pfeile zeigen die Stärke der kausalen Einflüsse einer Klimakomponente auf die jeweils andere im Netzwerk an (Cross-MCI). Durch den systematischen Vergleich von Netzwerken die entweder von Erdbeobachtungen (Observationen) oder von Datensätzen verschiedener Modellsysteme rekonstruiert werden, kann festgestellt werden welche Modelle am besten die realen Klimainteraktionen wiederspiegeln. (Grafik: [2] )

Ein wichtiges Merkmal dieser Methode ist, dass sie auch auf Messungen des realen Klimasystems angewendet werden kann. Durch den Vergleich dieses wahren Fingerabdrucks mit den modellierten Fingerabdrücken konnten die Autoren ableiten, wie gut jedes Modell die Realität erfasst. Bemerkenswert dabei ist, dass jene Modelle die besser die kausalen Netzwerke von Beobachtungsdaten reproduzieren auch bei der Modellierung von Niederschlagsmustern über Afrika, Amerika, China, Europa oder Indien besser abschneiden. Was wahrscheinlich noch wichtiger ist: wenn man die Modelle danach einstuft wie gut sie die realen kausalen Netzwerke reproduzieren, führt dies auch zu einem klareren Bild hinsichtlich des erwarteten Niveaus der Niederschlagsveränderungen über Land im 21. Jahrhundert.

Beispiel für die Resultate eines Netzwerkvergleichs. Für den Vergleich von Netzwerken können Metriken definiert werden die wiederspiegeln wie gut zwei Netzwerke übereinstimmen. Hier wird dafür die sogenannte F1-Metrik verwendet, die zwischen 0 (keine Übereinstimmung) und 1 (vollständige Übereinstimmung) variiert. Durch den Vergleich von vielen verschiedenen Netzwerken basierend auf einer Reihe von Modellsimulationen werden somit Streudiagramme wie das hier dargestellte erhalten. Je nach Definition können dabei verschiedene Netzwerke als das Referenzsystem angenommen werden; in diesem Fall die des britischen HadGEM2-ES-Model. Interessanterweise können auf diese Weise auch Modellabhängigkeiten (Interpendenzen) festgestellt werden, wie zum Beispiel zwischen den britischen (HadGEM2-ES, HadGEM2-CC) und den australischen Modellen (ACCESS1-0, ACCESS1-3), welche in der Tat ursprünglich in ihrer Entwicklung an die des heutigen britischen Modells gekoppelt waren. Solche Übereinstimmungen halfen den Forschern festzustellen, dass die ML-Technik in der Tat physikalisch sinnvolle Ähnlichkeiten zwischen Netzwerken detektieren kann. Schwarze Kreuze in der Grafik (rot für die Referenz selbst) kennzeichnen die durchschnittlichen F1-Messwerte jedes Modells, wenn es mit den Netzwerken des HadGEM2-ES Referenzmodells verglichen wird. Die grau gestrichelte Linie markiert den durchschnittlichen F1-Wert als Mittel über alle Netzwerkvergleiche für diesen Fall mit HadGEM2-ES als Referenz. (Grafik: [2] )

"Unsere Arbeit zeigt, dass moderne datenwissenschaftliche Ansätze für die Klimawissenschaft sehr nützlich sein können. Das Klimasystem mit all seinen Teilprozessen ist hochkomplex. Wir zeigen hier - fast schon entgegen unserer natürlichen Intuition -  dass wir diese Komplexität auch zu unserem Vorteil nutzen können: nur durch die Kombination von Systemkomplexität und der Anwendung von kausalen Inferenzmethoden war es möglich neue objektive Leistungsmetriken zu definieren, die uns dann auch mit den wissenschaftlichen Kernfragestellungen weiterhalfen. Im Gegensatz dazu stellten wir fest, dass einfachere Methoden zur Messung der Modellleistung genau dies eben nicht in der gleichen Form ermöglichen", erklärt Dr. Nowack. "Dieser neue Ansatz bietet einen neuartigen und objektiven Weg für die prozessorientierte Evaluation der Modelle mit Beobachtungen und für die Identifizierung von Interdependenzen im CMIP-Ensemble", sagt Prof. Eyring, Vorsitzender des CMIP-Panels und DLR-IPA-Koautorin der Studie.

"Die Studie ist auch aus methodischer Sicht hochinteressant. Kausale Inferenzmethoden sind in der Klimawissenschaft besonders vielversprechend, da wir oft daran interessiert sind, Ursache-Wirkungs-Beziehungen abzuleiten, sodass unser Ansatz auch unser Verständnis des Klimasystems beschleunigen könnte", sagt Dr. Runge vom DLR-DW.

Die Ergebnisse dieser Studie sind auch vielversprechend hinsichtlich genauerer Prognosen des Klimawandels, die für die Planung und Investitionen zum Schutz von Leben und Lebensgrundlagen in einer Welt des Klimawandels erforderlich sind. Dr. Nowack sagt: "Unsere Ergebnisse deuten an, dass wir neue datengestützte Wege entwickeln können, um die Modellierung des regionalen Klimawandels zu verbessern. Ich sehe große Chancen in der Nutzung von Ansätzen der künstlichen Intelligenz um zukünftige Veränderungen bei den schlimmsten Extremereignissen wie Dürren und Überschwemmungen zu untersuchen.“

Links