Ontology-based Data Integration and eXploration

ODIX

Credit:

.

Ein großer Teil des im DLR vorhandenen Wissens liegt in Form verschiedenster technischer Dokumente vor. Dies reicht von Protokollen diverser (Groß-)Anlagen bis zu Datenblättern und anderen Texten. Diese Dokumente richten sich allerdings vorrangig an Menschen und entziehen sich dadurch oftmals einer automatisierten Verarbeitung. Gerade im Hinblick auf die wachsende Menge und zunehmende Heterogenität der Datensätze verhindert dies eine effektive und effiziente Nutzung bereits generierten Wissens für aktuelle und zukünftige Forschungsthemen.

Ziel von ODIX ist es, Methoden zu entwickeln, die das in Dokumenten sowie anderen Quellen (bspw. Messreihen, Prozessdaten) enthaltene Wissen derart aufbereiten, dass es sowohl einer direkten Verwertung in KI-Anwendungen zugeführt als auch durch Menschen umfassend exploriert und analysiert werden kann. Hierzu werden zunächst faktische Informationen aus den Dokumenten extrahiert und mittels semantischer Konzepte annotiert, was auch die Schaffung von geeigneten automatisierten Schnittstellen für die Extrahierung beinhaltet. Der sich daraus ergebende Knowledge Graph wird zusammen mit anderen erhobenen Daten im Datenmanagementsystem shepard vorgehalten und mit diesen verknüpft. Auf dieser Basis werden schließlich Interfaces sowohl für die menschliche wie auch automatisierte Nutzung dieses nun strukturierten Wissens entwickelt. Abgeschlossen wird das Projekt mit einer Demonstration des entwickelten Prototypen. Hierzu werden Beispiele aus den domänenspezifischen Instituten geliefert und die Performance der Software bewertet. Weitere Dokumentenarten, Datentypen und insbesondere auch Explorationsmöglichkeiten können Bestandteil zukünftiger Projekte sein.

Mit den in ODIX entwickelten Methoden und Werkzeugen wird ein entscheidender Beitrag zur Erschließung und Nutzbarmachung eines enormen Datenschatzes am DLR geleistet. Durch die erfolgte semantische Annotation der vorhandenen Datenbestände werden diese nicht nur unmittelbar für die beteiligten Partner zugänglich, sondern auch im Einklang mit den FAIR-Prinzipien für Anwendungen in weiteren Bereichen erschlossen.