Böse Roboter

Forscher an der Schweizer EPFL haben in einem Experiment gezeigt, dass Automaten mit simplen Regeln lernen können, sich gegenzeitig zu betrügen, um im evolutionären Wettstreit nach vorne zu kommen.

vorlesen Druckansicht
Lesezeit: 3 Min.

Eigentlich sehen die "Terminatoren" ganz harmlos aus: Fußballgroße Halbkugeln vollgepackt mit Elektronik und einer Rundum-Kamera, Lichtsignalgebern, diversen Sensoren und am Boden dann der Antriebsteil. Doch die kleinen Roboter haben eine durchaus martialisch klingende Aufgabe: Sie sollen um Papierscheiben kämpfen, die von ihren Herrchen und Frauchen, Wissenschaftlern am Labor für Intelligente Systeme der Eidgenössischen Technischen Hochschule in Lausanne (EPFL), als "Nahrung" gekennzeichnet wurden.

Das ganze Experiment erfolgte nach evolutionären Prinzipien: Derjenige Automat, der die Papierscheiben als erste fand und "verteidigte", also neben ihr blieb, bekam die meisten Punkte. Abzüge gab es hingegen dafür, sich an eine Stelle im Raum zu begeben, die die Forscher als "Gift" kennzeichneten.

Runde um Runde wurden dann diejenigen Roboter aussortiert, die sich eher schlecht geschlagen hatten, während derjenige selbstlernende Algorithmus, der besonders gut funktionierte, angereichert um einige "Mutationen", um den Zufallsfaktor zu erhöhen, an die nächste Generation weitergegeben wurde. Als Kommunikation der Roboter untereinander dienten die Lichtsignalgeber, sie sollten dabei helfen, kooperatives Verhalten zu ermöglichen.

Intern bauten die Forscher dazu eine Art Minigehirn auf, bestehend aus elf Nervenzellen, die an den Sensoren hingen, drei weitere sorgten fĂĽr Steuerung und Lichtsignal. 33 Verbindungen, Synapsen gleich, wurden untereinander aufgebaut, die wiederum ĂĽber jeweils ein einzelnes 8 Bit groĂźes "Gen" kontrolliert wurden. So ergab sich ein 264 Bit groĂźes Genom, das sich vererben lieĂź.

Beim offenen Experimentieren stellten die EPFL-Forscher Sara Mitri, Dario Floreano, beides Ingenieure und Laurent Keller, Verhaltensbiologe, deren Studie kürzlich im Journal PNAS erschien, schnell interessante Arbeitsmuster der Automaten fest. Die Roboter lernen nicht nur, den Lichtern derjenigen Kollegen zu folgen, die bereits die Papierscheiben entdeckt hatten. Sondern sie begannen, die anderen zu "belügen". Der Grund: Der Platz reichte nie für alle aus, die Futterstelle zu erreichen. Weswegen es evolutionäre Vorteile gab, die anderen Roboter zu betuppen: Die Automaten lernten, ihre eigenen Signale auf ein Mindestmaß zu reduzieren, was den anderen dann nicht mehr ermöglichte, ihre Position festzustellen.

Mitri und ihre Kollegen sahen unterschiedliche Signalmuster entstehen und wieder verschwinden. Anfangs blinkten die Roboter zufällig, danach enthielt die "Sprache" mehr und mehr Informationen, je besser die Jagd nach dem Futter funktionierte. In der 50. Generation zeigte sich, dass die erfolgreichsten Roboter auch die betrügerischsten waren: Jene nämlich, die am allerwenigsten blinkten, wenn sie sich in der Nähe des Futters befanden.

Das Forscherteam glaubt, dass die am Experiment mit Robotern gewonnenen Erkenntnisse künftig auch zur Untersuchung realer Vorgänge in der Natur genutzt werden können. "Wir können künftig ohne Gefahr von Verfälschungen die Evolution von Signalen erforschen", schreiben die Forscher. Der Grad an Realismus durch die evolutionären Robotersysteme sei inzwischen groß. (bsc)