AICloud: Entwicklung eines KI-basierten virtuellen Sensors mit Hilfe einer Cloud Computing-Plattform

Im Rahmen des AICloud-Projekts forscht das DLR-Institut SR zusammen mit der EFS TechHub GmbH an innovativen KI-basierten Sensor-Algorithmen unter Verwendung einer Cloud-Plattform. Ziel des Projekts ist die Implementierung einer Cloud-Umgebung, die als  SDK/AICloud bezeichnet wird, in der die Datenverarbeitung und das rechenintensive Training künstlicher neuronaler Netze durchgeführt werden können. Als Showcase wird ein virtueller Sensor für einen PKW implementiert. Er ersetzt einen realen Hardwaresensor durch die Synthese eines trainierten, d.h. datenbasierten Softwaresensors unter Verwendung von Messdaten aus realen Sensoren und KI-Methoden.

Virtueller Sensor von AFM

Das Forschungsfahrzeug AI-For-Mobility (AFM) des DLR dient als Testplattform. Die vertikale Radkraft, d.h. die Kraft zwischen einem Reifen und einer Aufstandsfläche, wird als die Größe ausgewählt, die vom virtuellen Sensor geschätzt werden soll. Die Kenntnis dieser Kraft ist für Fahrdynamikkontrollsysteme sowohl für das manuelle als auch für das automatisierte Fahren unerlässlich. Diese physikalische Größe kann von einem realen Sensor nicht mit vertretbarem Aufwand gemessen werden. Ihre Schätzung ist eine anspruchsvolle Aufgabe, die hier mit Hilfe eines trainierten rekurrenten neuronalen Netzes (RNN) angegangen wird. Das fertig trainierte RNN-Netzwerk kann dann wieder in das AFM geladen werden, wo es als virtueller Sensor zur Schätzung der vertikalen Radkraft verwendet werden kann.

Um Trainingsdaten zu generieren, wird das AFM auf einem sogenannten Vier-Pfosten-Prüfstand vermessen. Hier wird das Fahrzeug auf vier hydraulisch angetriebene Pfosten gestellt, von denen jeder so gesteuert wird, dass er vordefinierten Positionssignalen folgt. So stimulieren die Pfosten unter den vier Rädern die vertikale Bewegung des Fahrzeugs. Auf diese Weise kann das Fahren auf genau definierten Straßenprofilen reproduzierbar simuliert werden, wobei die dynamischen Radlasten durch Kraftzellensensoren gemessen werden.

RNN Training

Für die Implementierung der rekurrenten neuronalen Netze wird das weit verbreitete TensorFlow Framework mit seiner Keras-Bibliothek verwendet. Dabei handelt es sich um eine Open-Source-Bibliothek für Deep Learning in der Programmiersprache Python. Mit Keras ist es möglich, die meisten der derzeit verwendeten Deep Learning-Architekturen zu implementieren. Die RNNs, die für den virtuellen Radlastsensor verwendet werden, sowie ihre Long Short-Term Memory (LSTM) und Gated Recurrent Units (GRU) Architekturen sind in Keras implementiert. Ein RNN verfügt über zahlreiche Freiheitsgrade oder Hyperparameter, die das Modell spezifizieren und im Designprozess berücksichtigt werden müssen. Dazu gehören unter anderem die folgenden Parameter (siehe Abbildung unten):

  • Lernrate
  • Maximale Anzahl von Trainings
  • Epochen
  • Anzahl der Zellen
  • Trainingssequenz
  • Länge
  • Stapelgröße
  • Dropout-Rate

RNN training must be performed for each hyperparameter set to subsequently evaluate the performance of the respective model. Due to the rapidly increasing computational capacities required for this, hyperparameter optimization is efficiently performed in a high-performance cloud environment. The AICloud platform presented in more detail below is used for this purpose. The following figure shows the interactive OpenSearch dashboards visualization of the grid search results over the hyperparameter space of the RNN trainings. Each line represents a training configuration of the grid with associated validation metric (the mean absolute error, and the percentage fit). The best configuration is highlighted in red.

Das RNN-Training muss für jeden Hyperparametersatz durchgeführt werden, um anschließend die Leistung des jeweiligen Modells zu bewerten. Aufgrund der dafür erforderlichen, schnell wachsenden Rechenkapazitäten wird die Hyperparameter-Optimierung effizient in einer leistungsstarken Cloud-Umgebung durchgeführt. Zu diesem Zweck wird die unten näher vorgestellte AICloud-Plattform verwendet. Die folgende Abbildung zeigt die interaktive OpenSearch Dashboard-Visualisierung der Grid-Suchergebnisse über den Hyperparameter-Raum der RNN-Trainings. Jede Linie stellt eine Trainingskonfiguration des Gitters mit zugehöriger Validierungsmetrik (mittlerer absoluter Fehler und prozentuale Anpassung) dar. Die beste Konfiguration ist in rot hervorgehoben.

Ergebnisse

Die aus der Hyperparameter-Optimierung ermittelte RNN-Architektur kann verwendet werden, um gute Schätzergebnisse für den gesamten Testdatensatz zu erhalten. Die folgende Abbildung zeigt ein Beispiel für den Vergleich zwischen dem geschätzten Wert des gelernten virtuellen Sensors und der wahren vertikalen Radkraft, die auf dem Vier-Pfosten-Prüfstand gemessen wurde. Offensichtlich kann die hochdynamische Radlast sehr gut und ohne signifikante Phasenverzögerung geschätzt werden.

Die Verwaltung und Analyse der großen Menge an Daten, die mit dem AFM gemessen werden, stellt einige allgemeine Herausforderungen dar. Um diese Herausforderungen zu bewältigen, wie die Daten

  • hochgeladen und gespeichert
  • Recherchiert
  • Verarbeitet und analysiert
  • Visualisiert
  • Zusammengearbeitet
  • Aufbewahrt in einer rechtskonformen Weise

haben wir eine universelle, cloudbasierte Datenverwaltungsplattform entwickelt, auf der das Training und die Auswertung des virtuellen Radlastsensors stattfinden. Die Daten werden in der Cloud zusammen mit Metadaten gespeichert, die dem Benutzer eine einfache Durchsuchbarkeit und Zuordenbarkeit ermöglichen.

Daten Management Platform

Im Rahmen dieses Projekts wurde der Superb Data Kraken (auch bekannt als SDK), eine allgemeine, multifunktionale Datenverwaltungsplattform, entworfen und entwickelt, die auf bestehenden Open-Source-Lösungen basiert, wo dies möglich ist, und ansonsten auf maßgeschneiderte Lösungen. Sie bietet ein vielseitiges und reichhaltiges Angebot an Tools, mit denen Sie die häufigsten Aufgaben der Datenverwaltung problemlos bewältigen können. Sie bietet alle notwendigen Funktionen, einschließlich Daten- und Metadatenspeicherung, Datenverarbeitung, Suchfunktionen über Sensordaten, Metadaten und Trainingsdaten sowie eine Data-Science-Umgebung und Visualisierungstools für Test-, Trainings- und Metadaten. In der gesamten Plattform ist die Verwaltung von Benutzerrechten und die Trennung von Daten zwischen verschiedenen Anwendungsfällen gewährleistet.

Daten-Management-Platform

Die Kernkomponenten des Projekts wurden unter der Apache 2.0 Lizenz veröffentlicht und sind auf GitHub zu finden.

Bis heute nutzen bereits mehrere Anwendungsfälle und Projekte die vielseitige SDK-Plattform auf einer täglichen Basis, von Industriesektoren über Automobil, Verkehr bis hin zur Werbung. Darunter ist das AICloud-Projekt ein wichtiges Vorzeigeprojekt, da es Big Data mit maschinellem Lernen kombiniert. In diesem Zusammenhang,

  1. Es wurde ein Metadatenmodell entwickelt, das die Eingabe beschreibender Metadaten standardisiert, um eine präzise Suche, Datenabfrage und Visualisierung der mit dem AFM-Fahrzeug aufgezeichneten Sensordaten zu ermöglichen.
  2. Es wurde ein Arbeitsablauf eingerichtet, um die Metadaten mit Analyseergebnissen aus den Daten anzureichern.
  3. Das Training des virtuellen Sensors mit Hyperparameter-Tuning wurde innerhalb der Data-Science-Umgebung der Plattform durchgeführt, wobei Cloud-Computing-Ressourcen für eine erhebliche Beschleunigung genutzt wurden.
  4. Der virtuelle Sensor wurde anschließend in der Cloud bereitgestellt und seine Vorhersagen wurden anhand der Messung der Radlast validiert

Diese Arbeit wurde vom Bayerischen Staatsministerium für Wirtschaft, Landesentwicklung und Energie gefördert (StMWi, Projekt AlCloud: Datenmanagementsystem am Beispiel virtueller Sensoren, Förderkennzeichen DlK0150/02).