Selbstlernender Algorithmus beherrscht Rubik's Cube

Forscher an der University of California haben eine Software entwickelt, die sich selbst beibringt, den Zauberwürfel zu knacken.

In Pocket speichern vorlesen Druckansicht 44 Kommentare lesen
Selbstlernender Algorithmus beherrscht Rubik's Cube
Lesezeit: 2 Min.

Zum schnellen Lösen des Zauberwürfels alias Rubik's Cube gibt es schon seit vielen Jahren Algorithmen. Nun haben Forscher erstmals ein Deep-Learning-System gezeigt, das sich selbst die Lösung des Spielzeugs beibringen konnte, berichtet Technology Review in seiner Online-Ausgabe ("Maschine knackt den Zauberwürfel").

Mehr Infos

Stephen McAleer und seine Kollegen von der University of California in Irvine haben hierzu einen neuen Ansatz gefunden. Ihre neue Deep-Learning-Technik nennt sich "autodidaktische Iteration". Sie kann sich selbst Ansätze entwickeln, den Zauberwürfel zu lösen, ohne dass der Mensch helfen muss. Der Trick dabei ist, dass das Team eine Methode gefunden hat, wie sich die Maschine ihr eigenes Belohnungssystem schaffen kann. Aus der Position eines ungelösten Würfels muss die Maschine dazu entscheiden, ob ein spezifischer Schritt eine Verbesserung der bestehenden Konfiguration ist. Dazu muss sich der Schritt evaluieren lassen.

Die autodidaktische Iteration tut dies, indem sie von einem gelösten Würfel ausgeht und dann schrittweise zurückgeht, um zu schauen, ob es eine Konfiguration gibt, die ähnlich ist wie der vorgeschlagene Schritt. Der Prozess ist nicht perfekt, doch Deep Learning hilft dem System dabei, herauszufinden, welche Schritte grundsätzlich besser sind als andere.

Nach dem Training nutzt das Netzwerk dann einen Standardsuchbaum um die besten Schritte für jede Konfiguration des Würfels zu finden. Im Ergebnis kommt es zu einem Algorithmus, der erstaunlich gut funktioniert. "Er kann jeden zufällig eingestellten Würfel zu 100 Prozent lösen und erreicht dabei eine mittlere Schrittzahl von 30", so die Forscher. Das ist genauso viel oder weniger als bei menschlichen Rubik's-Experten.

Mehr dazu bei Technology Review Online:

(bsc)