Interaktives inkrementelles Lernen verallgemeinerbarer Fähigkeiten mit lokaler Trajektorienmodulation
Interaktives inkrementelles Lernen verallgemeinerbarer Fähigkeiten mit lokaler Trajektorienmodulation
Dieses Video zeigt unser RA-L Paper "Interactive incremental learning of generalizable skills with local trajectory modulation" von Markus Knauer, Alin Albu-Schäffer, Freek Stulp und João Silvério.
Bitte besuchen Sie auch unser GitHub: https://github.com/DLR-RM/interactive-incremental-learning
Zusammenfassung: Das Problem der Generalisierung beim Lernen aus Demonstrationen (LfD) hat in den letzten Jahren viel Aufmerksamkeit erhalten, insbesondere im Zusammenhang mit Bewegungsprimitiven, wo eine Reihe von Ansätzen entstanden ist. In jüngster Zeit haben zwei wichtige Ansätze Anerkennung gefunden. Der eine nutzt Durchgangspunkte, um Fähigkeiten lokal anzupassen, indem er demonstrierte Trajektorien moduliert, der andere stützt sich auf sogenannte aufgabenparametrisierte Modelle, die Bewegungen in Bezug auf verschiedene Koordinatensysteme kodieren und ein Produkt von Wahrscheinlichkeiten für die Generalisierung verwenden. Während die erstgenannten Modelle gut für präzise, lokale Modulationen geeignet sind, zielen die letzteren darauf ab, über große Regionen des Arbeitsbereichs zu verallgemeinern und umfassen oft mehrere Objekte. Der Qualität der Generalisierung durch die gleichzeitige Nutzung beider Ansätze wurde bisher wenig Aufmerksamkeit geschenkt. In dieser Arbeit schlagen wir einen interaktiven Rahmen für das Imitationslernen vor, der gleichzeitig lokale und globale Modulationen der Trajektorienverteilungen nutzt. Aufbauend auf dem Kernelized Movement Primitives (KMP) Framework führen wir neuartige Mechanismen für die Modulation von Fähigkeiten durch direktes menschliches Korrektur-Feedback ein. Unser Ansatz nutzt insbesondere das Konzept der Durchgangspunkte, um inkrementell und interaktiv 1) die Modellgenauigkeit lokal zu verbessern, 2) während der Ausführung der Aufgabe neue Objekte hinzuzufügen und 3) die Fertigkeit auf Regionen auszudehnen, für die keine Demonstrationen vorgesehen waren. Wir evaluieren unsere Methode anhand einer Aufgabe zum Laden eines Lagerrings mit einem drehmomentgesteuerten 7-DoF-Roboter des DLR SARA.
Credit: DLR (CC BY-NC-ND 3.0)
Länge: 00:04:59