2021-2021

shepard - storage for heterogeneous product and research data (Speicher für heterogene Produkt- und Forschungsdaten)

Geleitet durch die Vision der nahtlosen digitalen Integration unterschiedlichster Prozessketten wird am Zentrum für Leichtbauproduktionstechnologie in Augsburg das System shepard (storage for heterogeneous product and research data) entwickelt. Ein Schwerpunkt ist dabei die disziplinübergreifende Nutzbarmachung aller erzeugten Daten u.a. für KI-Methoden zur Datenanalyse oder zur kontextualisierten Datenkuration.   
Shepard ist ein skalierbares System zur hochflexiblen automatisierten Speicherung und Verknüpfung heterogener Daten (u.a. Messwerte, Simulationsergebnisse, CAD-Daten) und Metadaten (z.B. Provenienz, semantische Einordnung) entlang unterschiedlichster realer und digitaler Prozessketten. Es soll allen Mitarbeitenden einen einfachen und nachhaltigen Weg zur Ablage, zum Abruf, zur Analyse und zum Teilen von Forschungsdaten für eine übergreifende Zusammenarbeit bieten und stellt so die Basis für ein durchgängiges Forschungsdatenmanagement vom Versuch bis zur Publikation dar.


Durch die Entwicklung und den prototypischen Einsatz zur strukturierten Erfassung von Experimenten in unterschiedlichsten Disziplinen (von virtuellen Simulationsworkflows, über Produktionstechnik bis zu Flugexperimenten oder einer Laserfreistrahlstrecke) kann das System bereits sehr viele Domänen im Kontext der Forschung, insb. der Forschungsfelder des DLR abdecken.Einfache Anbindungsmöglichkeiten über standardisierte Schnittstellen ermöglichen die automatisierte Erfassung von Daten inkl. Annotation mit Metainformationen. Diese Schnittstellen werden auch zur Auswertung genutzt und bilden die Grundlage zur Anbindung beliebiger KI-Frameworks. Basisfunktionen von Shepard lassen sich über das Web-Interface komfortabel nutzen. Komplexere Anwendungen lassen sich über die bereitgestellte REST-API anbinden.
Die Basisarchitektur von shepard umfasst die Verknüpfung unterschiedlicher bestehender Datenbanken zur optimierten Speicherung und Verknüpfung stark heterogener Datensätze. Durch den konsequenten Einsatz von Open Source Technologien wird hierbei ein Vendor Lock-in vermieden und ein kostenfreier Betrieb des Systems ermöglicht. Trotzdem verfügen viele Bestandteile auch über entsprechende Enterprise-Licensing Modelle, um eine Skalierbarkeit langfristig zu garantieren.
Zukünftig werden die bestehenden Funktionen durch komplexere Suchabfragen über Inhalte, verbesserte Visualisierungen sowie durch die Anbindung interner und externer Tools erweitert.  Shepard wurde mit Verwendung der Apache 2.0 Lizenz auf Gitlab unter https://gitlab.com/dlr-shepard veröffentlicht. Eine aktive Beteiligung externer Interessenten oder Contributoren wird hierbei ausdrücklich begrüßt.
Dieses Vorgehen eröffnet eine breite Community für detailliertes Feedback und kontinuierliche Weiterentwicklung und leistet zugleich einen Beitrag zur digitalen Transformation der Wissenschaft.

Weiterführende Informationen & Links

Kontakt

Tobias Haase

Deutsches Zentrum für Luft- und Raumfahrt (DLR)
Institut für Bauweisen und Strukturtechnologie
Pfaffenwaldring 38-40, 70569 Stuttgart

Florian Krebs

Universität Augsburg
Am Technologiezentrum 4, 86159 Augsburg