Google: KI hält Stratosphärenballons in festem Gebiet

Google verwendet Reinforcement Learning, um Stratosphärenballons stationär zu halten.

In Pocket speichern vorlesen Druckansicht 19 Kommentare lesen

Stratosphärenballon von Loon.

(Bild: Loon)

Lesezeit: 4 Min.

Wissenschaftler von Google Research und dem aus Google ausgegliederten Unternehmen Loon haben eine KI mittels Reinforcement Learning darauf trainiert, einen Stratosphärenballon autonom in einem festen Gebiet zu halten. Die KI lässt den Ballon steigen oder sinken, so dass er Höhenwinde verschiedener Richtungen nutzen kann, um einen Radius von 50 Kilometer um seinen Referenzpunkt möglichst nicht zu verlassen.

Loon ist aus dem Experimentierlabors Google X hervorgegangen. Das Unternehmen versorgt Regionen mit schwacher Netzabdeckung über Stratosphärenballons mit Internet-Zugängen. Die neue Steuerung ist effizienter als die alte, von Hand optimierte Methode. Technische Einzelheiten der Methode beschreiben Marc Bellemare und seine Kollegen jetzt in der Fachzeitschrift Nature.

Die Ballons nutzen solargetriebene Pumpen, um Luft aufzunehmen oder abzulassen, und so zu steigen, oder zu sinken. Da die Winde in der Stratosphäre recht stetig wehen, lassen sich die Ballons damit recht zuverlässig steuern: Entfernt sich ein Ballon zu weit von seinem Referenzpunkt, sucht der Controller auf der Basis von meteorologischen Daten und Windvorhersagen nach einer Höhe, in der ein geeigneter Wind weht. Der bisher verwendete Algorithmus "Station Seeker" ging dabei recht konservativ zu Werke. Er bevorzugte Winde, die in einem möglichst kleinen Winkel zum anvisierten Ziel und mit möglichst geringer Geschwindigkeit bliesen.

Diese Strategie ist energetisch allerdings nicht immer optimal. Die Google-Forscher wollten daher testen, ob Reinforcement Learning geeignet wäre, das Problem besser zu lösen. Dabei spielt der Algorithmus eine große Zahl verschiedener Aktionen in einer Simulation durch, um so zu lernen, welche Strategie zum größtmöglichen Erfolg führt. Die Methode ist in letzter Zeit vor allem bei Computerspielen mit großem Erfolg angewandt worden. Im Unterschied zu Game-Szenarien verfügt die KI bei diesem Problem jedoch nur über begrenzte und fehlerbehaftete Daten. Diese Lücken füllten Bellemare und Kollegen durch Hinzufügen von zufällig erzeugtem Rauschen zu den Winddaten.

Das so trainierte neuronale Netz war tatsächlich in der Lage, die Aufgabe besser zu meistern als der bisher verwendete Algorithmus: Der Ballon blieb rund 55 Prozent der Zeit in einem Radius von 50 Kilometer um den Referenzpunkt, während Station Seeker es auf nur 40 Prozent der Zeit brachte. Das liest sich zunächst nicht sonderlich beeindruckend. In absoluten Zahlen verbrachte der Ballon jedoch innerhalb von 24 Stunden immerhin rund 3,5 Stunden mehr im Zielbereich.

Zudem liegt die Latte bei diesem Problem ziemlich hoch. Denn die Beschränkung durch die Navigationsmethode und die unvollständigen Informationen über das Windsystem führen dazu, dass die Forscher eine obere Grenze von 68 Prozent der Zeit innerhalb des 50 Kilometer-Radius berechneten. Mehr, so schreiben sie, ließe sich "auch mit perfektem Wissen über das Windsystem" nicht erreichen, da es Situationen gebe, in denen die vorherrschenden Winde eine Lösung einfach unmöglich machen würden. Bei unvollständigen Informationen über die Winde kommen die Forscher auf eine obere Grenze von 55 Prozent. Weil mehr Informationen also die Steuerung verbessern würden, sammeln die Ballons zukünftig während des Fluges Daten. Das neuronale Netz im Laufe des Betriebes weiter lernen zu lassen, würde jedoch wenig bringen, schreibt Bellemare, weil es bereits "Millionen von Flügen in der Simulation" hinter sich habe.

Die Methode ließe sich nicht allein auf Ballons zur Vernetzung anwenden, schreiben die Forscher. Höhenballons, die an einer Stelle bleiben, könnten auch für eine Vielzahl anderer Aufgaben wie zum Beispiel Umweltmessungen oder die Beobachtung von Waldbränden verwendet werden. "Die Hauptanwendung für Loon ist die Bereitstellung von Konnektivität für unterversorgte Bevölkerungsgruppen", schreibt Bellemare. Die Möglichkeit, schnell einen Controller für andere Zwecke zu trainieren, eröffnet dem Team jedoch eine Reihe von Möglichkeiten, die es nun verfolgen kann. (wst)