Datenanalyse und -intelligenz

Hauptziel der Abteilung Datenanalyse und Intelligenz ist es, Wissen aus Daten zu generieren und ein tieferes Verständnis für komplexe Datensätze und die damit in Verbindung stehenden Prozesse zu entwickeln. Wir entwickeln datengetriebene Ansätze, um Erkenntnisse zu gewinnen und fundierte Entscheidungen zu treffen - ein Konzept, das wir als "Knowledge from Data" bezeichnen.

Die Abteilung verfügt über ein umfassendes Portfolio innovativer datenanalytischer Methoden, aus dem Spektrum des maschinellen Lernens, der künstlichen Intelligenz, kausaler Inferenz, und Verfahren zur Integration von physikalischem Wissen und Prozessverständnis. Von der Entwicklung innovativer Algorithmen bis hin zur Integration von Domänenwissen streben wir danach, das volle Potenzial der Daten zu erschließen. Um unsere Ziele effektiv zu verfolgen, ist die Abteilung in drei Gruppen unterteilt: Maschinelles Lernen, Kausale Inferenz und Prozesswissenintegrierende Datenexploration. In der Abteilung arbeiten wir kontinuierlich daran, unsere Methoden weiterzuentwickeln und auf neue Domänen anzupassen.

Maschinelles Lernen

Die Hauptaufgabe der Gruppe Maschinelles Lernen (MLE) besteht darin, die Einführung und Integration von maschinellen Lernmethoden sowohl in DLR-internen als auch externen Anwendungen zu fördern und weiterzuentwickeln. MLE bietet umfassende Unterstützung bei der Implementierung dieser Technologien und treibt die Entwicklung von Methoden voran, die speziell auf reale Einsatzszenarien aus Luft- und Raumfahrt, sowie Verkehr zugeschnitten sind. Dabei konzentriert sich MLE auf die Entwicklung und Implementierung von Strategien, die den effektiven Einsatz von maschinellen Lernmethoden ermöglichen. Diese werden in enger Zusammenarbeit mit Fachexperten aus verschiedenen Anwendungsbereichen des DLR erarbeitet, um den spezifischen Anforderungen in den gegebenen Anwendungen gerecht zu werden.
Ein wesentlicher Fokus unserer Forschung liegt auf der praktischen Anwendbarkeit verschiedener Aspekte des maschinellen Lernens. Zu den Kernthemen zählen die Anomaliedetektion vor allem in sequentiellen Daten, die Erklärbarkeit von Modellen und deren Vorhersagen, die Quantifizierung von Unsicherheiten sowie die Robustheit von Modellen gegenüber Änderungen in den Eingabedaten.

Wir beschäftigen uns intensiv mit der Anomaliedetektion in Zeitreihendaten, um die dortigen Systeme durch Betrachtung von z.B. Sensordaten zu überwachen. Wenn unnormales oder unerwartetes Verhalten erkannt wird, können Anwender ggfs. eingreifen, um z.B. Systemausfällen vorzubeugen oder Wartungsbedarf aufzuzeigen. Innerhalb der EDEN Next Gen und EDEN Next Gen Phase II Projekte übernehmen wir z. Bsp. wichtige Aufgaben bei der Detektion und Kategorisierung von Anomalien in Telemetriedaten von Bioregenerativen Lebenserhaltungssystemen, welche für das Leben von Astronautinnen und Astronauten in Habitaten im Weltraum notwendig sind. Weiterhin forschen wir im Bereich Sensor-KI, die spezifische Anforderungen an die Robustheit der Methoden und die Hardwareressourcen beinhaltet. Hierbei stehen insbesondere Methoden zur Quantifizierung von Unsicherheiten und zur Verbesserung der Erklärbarkeit von Modellen und Vorhersagen im Vordergrund. Damit tragen wir aktiv zur Weiterentwicklung und Anpassung von maschinellen Lernmethoden bei, um sie leistungsfähiger und relevanter für praktische DLR-Anwendungen zu machen, mit dem Ziel, erfolgreiche Transferleistungen zu generieren.

Prozesswissenintegrierende Datenexploration

Die Gruppe Prozess- und wissensbasierte Datenexploration hat die Vision, eine Brücke zwischen Prozesswissen und Datenanalyse zu schaffen, um datengesteuerte Entscheidungsfindung zu fördern. Ihre Methoden umfassen die nahtlose Integration von Domänen- und Prozesskenntnissen in die Datenexploration, insbesondere durch die Analyse von Zeitreihendaten, die Integration physikalischer Modelle und die Entwicklung von Bildmustererkennungsverfahren. Diese Ansätze ermöglichen es, praxisrelevante Erkenntnisse mit direktem Mehrwert für Branchen wie Luftfahrt, Raumfahrt und Energie zu gewinnen. 

Als Methoden nutzt die Gruppe die datengetriebene Zerlegung von Zeitreihen in unterschiedlichen Frequenzspektren zur Erkennung von zyklischen Mustern und Trends und anschließender Charakterisierung von Einzelsignalkomponenten. Darüber hinaus widmet sich die Gruppe der Integration physikalischer Modelle in die Datenanalyse, um eine holistische und präzise Interpretation von komplexen Systemen zu ermöglichen, wie z.B. der Schallausbreitung unter dem Einfluss inhomogener Strömungen im Projekt VIRLWINT. Unsere Forschungsarbeit umfasst auch innovative und übertragbare Bildmustererkennungsverfahren, u.a. zur Identifizierung und Charakterisierung von ionosphärischen Anomalien in SAR-Daten im Vorhaben PLASMA. Wir entwickeln anspruchsvolle Algorithmen für die Auswertung von Punktwolkendaten und die wissensbasierte Ableitung komplexer, praxisrelevanter Parameter, u.a. aus UAV-Daten, für Transferprojekte in der Forstwirtschaft (SHADOW), im Bereich Permafrost (UCEA) und Deichmonitoring (RESIKOAST).

Die Gruppe setzt auf evidenzbasierte Methoden, um das Verständnis von Prozessen kontinuierlich zu erweitern. Zusätzlich zielt sie darauf ab, die Kompetenzen aller Stakeholder zu bündeln, um Trends im Forschungs- und Entwicklungsbedarf frühzeitig zu identifizieren und innovative Technologien erfolgreich zu implementieren. Die Gruppe beschäftigt sich deshalb auch mit Methoden der proaktiven Akzeptanzforschung, um die Akzeptanz ihrer Lösungen zu steigern, indem sie die Teilhabe aller Beteiligten sicherstellt und die Human Factors berücksichtigt, wie in den Projekten VIRLWINT und THOR.

Kausale Inferenz

Das Ziel der Arbeitsgruppe Kausale Inferenz ist es, zu einem datengetriebenen Verständnis komplexer dynamischer Prozesse beizutragen. Zu diesem Zweck entwickelt die Gruppe Theorie, Methoden und Software im Bereich kausale Inferenz für Anwendungen im DLR und darüber hinaus. Hierbei bezeichnet kausale Inferenz ein aktives Forschungsfeld an der Schnittstelle von Statistik und maschinellem Lernen, welches Verfahren und Algorithmen zur datenbasierten Ableitung und Analyse von Ursache-Wirkungs-Zusammenhängen entwickelt. Somit geht kausale Inferenz über die Analyse bloßer statistischer Abhängigkeiten hinaus. In Verbindung mit maschinellem Lernen hat kausale Inferenz außerdem das Potential, die Robustheit und Generalisierbarkeit der gelernten Modelle zu erhöhen.

In ihrer Forschungs- und Entwicklungsarbeit verfolgt die Arbeitsgruppe einen anwendungsgetriebenen Ansatz. Dies bedeutet, erstens, eine enge Zusammenarbeit mit den jeweiligen DomänenexpertInnen bei der Konzeption und Durchführung von Anwendungen für kausale Inferenz. Zweitens identifizieren wird die in diesen Anwendungen auftretenden Herausforderungen und adressieren diese Herausforderungen durch gezielte Weiterentwicklungen unseres Methodenportfolios. Ein spezieller Fokus der Gruppe liegt auf Zeitreihendaten.

Unsere Methoden finden Anwendung in verschiedenen Bereichen des DLR und darüber hinaus. Beispiele sind die Analyse von Kausalzusammenhängen im Bereich Weltraumwetter im Rahmen des Vorhabens PLASMA, die Analyse möglicher Ursachen extremer Wetterereignisse im Rahmen des EU-geförderten Drittmittelprojekts XAIDA, in welchem wir ursächliche Faktoren für Extremereignisse untersuchen, sowie die Erklärung von Anomalien im Rahmen des Projekts CausalAnomalies mit breit gestreuten Anwendungen innerhalb des DLR, z.B. im Bereich unbemannte Fluggeräte und Verkehrsinfrastruktur.

Im Bereich Quantum Computing kombiniert die Gruppe quantenmaschinelles Lernen mit High Performance Computing zum Beispiel im Projekt QCoKaIn.

Projekte der Abteilung Datenanalyse und -intelligenz

laden

Kontakt

apl. Prof. Dr. Christian Thiel

komm. Abteilungsleiter
Institut für Datenwissenschaften
Datenanalyse und -intelligenz
Mälzerstraße 5, 07745 Jena