Die Automatenschule

Hubschrauberroboter können komplexe Tricks erlernen, in dem sie Vorführungen genau analysieren.

In Pocket speichern vorlesen Druckansicht 1 Kommentar lesen
Lesezeit: 6 Min.
Von
  • Rachel Kremen

Das händische Programmieren von Robotern ist ein zeit- wie arbeitsaufwändiger Prozess. Wissenschaftler aus dem Forschungsgebiet glauben, dass ein neuartiger Trainingsansatz deutlich viel versprechender sein könnte: Dabei wird dem Automaten der von ihm erwartete Ablauf zunächst mehrfach demonstriert und er berechnet dann einen für sich idealen Weg. Forscher in den USA haben nun ein System entwickelt, mit dem sich Hubschrauberroboter auf diese Art trainieren lassen. Mit dem Ansatz konnten sie das kleine Fluggerät in weniger als 30 Minuten dazu bewegen, ein kompliziertes Luftmanöver durchzuführen.

Für sehr einfache Luftmanöver können Forscher spezifische Kommandos programmieren, die sich daran orientieren, wie ein menschlicher Pilot die Steuerung durchführen würde. Soll es jedoch fliegende Akrobatik sein, beispielsweise das Fliegen auf dem Rücken, benötigen Roboter einen robusteren und besser anpassbaren Prozess. Eine Windböe oder eine kleine Veränderung der Startposition kann den Flugplan völlig durcheinander bringen. "Es reicht nicht, einfach die gleichen Sequenzen abzuspielen, wie man sie von einem menschlichen Piloten kennt", sagt Pieter Abbeel, der an dem Projekt arbeitete, während er an der Stanford University seine Doktorarbeit schrieb. Der Lehrlingsansatz funktioniere besser: Der Roboter könne dann Veränderungen im Flug vornehmen, weil er nicht an eine spezifische Serie von Kommandos gebunden sei. Dies könnte autonomen Hubschraubern helfen, mit realen Herausforderungen fertig zu werden, beispielsweise mit dem Landen auf unebenem Gelände oder kurzfristigen Veränderungen bei den Wetterbedingungen. Ergebnis wäre ein stets stabilerer Flug.

Das Training beginnt mit der Demonstration eines neuen Tricks durch einen Menschen, der dabei einen ferngesteuerten Hubschrauber verwendet. Bei der Wiederholung des Manövers drückt ein Forscher jeweils einen Knopf, um die Anfangs- und Endzeiten jedes Versuches zu markieren. Der Experte muss jeden Trick ungefähr zehn Mal durchführen, damit auch subtile Veränderungen einberechnet werden können und der ideale Pfad ermittelbar wird. Die Software verzerrt dabei vorsichtig das Timing jedes Clips, um die Versuche vergleichen zu können. Kleine Fehlsignale, sprich: menschliches Rauschen, werden ebenfalls eliminiert. Endergebnis ist ein hochgenaues aerodynamisches Modell des Tricks, das der autonome Roboter als Zielführung verwenden kann.

Einmal in der Luft, überträgt der Hubschrauberroboter Informationen aus seinen Sensoren an einen Rechner am Boden. "Wir platzieren eine Anzahl von Instrumenten in dem Heli – Beschleunigungsmesser, Kreisel und einen Magnetkompass, um Flugposition und Ausrichtung zu bestimmen", sagt Andrew Ng, Computerwissenschaftler an der Stanford University, der ebenfalls an dem Projekt gearbeitet hat. "Diese Instrumentendaten werden an einen Desktop-PC gesendet, der die passenden Kontrollkommandos errechnet." Diese Kommandos werden dann drahtlos 20 Mal in der Sekunde an den Hubschrauber geschickt. Videokameras am Boden helfen dabei, ihn nicht aus den Augen zu verlieren.

Mit jedem Versuch lernt der Roboter, wie er den Trick perfektionieren kann. "Das erste Mal geht vielleicht eine Drehung zu weit. Aus diesem Wissen seiner Eigendynamik lernt er dann, sich anzupassen und die Bewegung später korrekt auszuführen", sagt Ng.

Bei einer Demonstration an der Stanford University nutzte ein autonomer Roboter diesen Ansatz zum Durchführen mehrerer komplizierter Tricks, darunter Loopings mit Pirouetten und ein Rückwärts-Manöver namens "Hurrikan". Das Team konnte sogar einen besonders schwierigen Stunt zeigen, bei dem der Helikopter wie ein umgedrehtes Pendel schwingt. Ein solcher Trick wäre mit "Hardcoding", also der strikten Eingabe von Befehlen, unmöglich gewesen. Das zeige die Fortschritte, die man gemacht habe, heißt es im Team. "Wir können den Hubschrauber nun deutlich härter fliegen lassen und mehr Leistung abfragen", sagt Abbeel, der inzwischen am Institut für Elektrotechnik und Computerwissenschaften der University of California in Berkeley arbeitet.

Eric Feron, Professor für Luft- und Raumfahrtforschung am Georgia Institute of Technologie, kennt das Projekt und ist beeindruckt von den Leistungen, die die Trainingsmethode ermöglichte. Auch die Methodik weise in die richtige Richtung. "Als ich Anfang 2000 an einem ähnlichen Projekt gearbeitet habe, musste der Mensch noch ständig eingreifen, um dem Online-Kontrollsystem beizubringen, was es tun musste, um die Manöver zu wiederholen. Wir mussten die Rechner von Hand programmieren." Das Stanford-Projekt steigere die Effizienz ungemein und reduziere die Lernphase auf nur noch eine halbe Stunde. "Bei uns dauerte es am Ende des Projektes für ein neues Manöver einen ganzen Tag."

Abbeel räumt allerdings ein, dass trotz der bereits erreichten Verlässlichkeit der Technik noch Raum für Verbesserungen sei. Sicherheit bleibe ein wichtiges Thema, wenn ein solcher Roboter über bewohntes Gebiet fliege. Die Maschinen müssen mindestens so gut fliegen wie ein menschlicher Experte und zwar selbst bei komplizierten Manövern. Ein einfaches Hin und Zurück bei Anwendungen wie Rettungsmissionen reiche nicht. "Ich stelle mir eine Zukunft vor, in der man ein Dutzend autonomer Hubschrauber losschicken kann, um Überlebende eines Schiffsunglücks auf dem Ozean zu finden." Dies würde Personalprobleme ausgleichen (nicht viele Piloten sind für solche Jobs qualifiziert) und die Chancen, Überlebende zu finden, deutlich erhöhen.

Das Lernsystem könnte auch bei anderen Robotern verwendet werden, etwa solchen, die im Haushalt helfen oder in Fabriken laufen. "Auch eine sehr genaue Kontrolle von Autos, Motorrädern, Starrflüglern und sogar Schiffen wäre denkbar", sagt Ng.

In Zukunft soll das System noch flexibler werden. "Wenn wir Menschen lernen, gibt es viele Dinge, die den Prozess beschleunigen, die nicht nur mit Demonstrationen zu tun haben. Ein Profipilot würde seinem Schüler weitere Hinweise geben, etwa in Form von Sprache und Worten auf Papier." Idealerweise müsste auch ein Roboter solche Tipps aufnehmen können, meint Ng. (bsc)