Verstärkendes Lernen: Roboter-Drummer ZRob lernt besseres Schlagzeugspiel
Der Roboter-Drummer ZRob will besser Schlagzeug spielen können als andere Musikroboter. Mittels flexiblem "Handgelenk" findet er einen eigenen Stil.

Mehrere ZRobs sind an einem Schlagzeug installiert.
(Bild: Mojtaba Karbasi)
Ein Wissenschaftsteam des Center for Interdisciplinary Studies in Rythm, Time and Motion der University of Oslo hat einen Drum-Roboter mit der Bezeichnung ZRob entwickelt, der über ein flexibles "Handgelenk" verfügt, das ähnlich wie ein menschliches Handgelenk die Drumsticks lockerer führen kann. Der Roboter-Drummer kann sich beim Spielen des Schlagzeugs selbst zuhören und nutzt verstärkendes Lernen (Reinforcement Learning – RL), um sein Spiel zu verbessern.
Besonders groß ist der Drum-Roboter nicht. Er besteht im Wesentlichen aus einem 3D-gedruckten Gehäuse, der einen 48-Volt-Gleichstrommotor beherbergt und einen Arm mit zwei Freiheitsgraden ansteuert. An ihm ist eine flexibel, an zwei Federn aufgehängte Halterung für einen Drumstick befestigt, wie aus der Studie "Embodied intelligence for drumming; a reinforcement learning approach to drumming robots" hervorgeht, die in Frontiers in Robotics and AI erschienen ist. Die Federung soll den Roboterarm die nötige Flexibilität geben, die ein menschliches Handgelenk hat und für das Schlagzeugspiel notwendig ist.
KI-Update abonnieren
Werktägliches Update zu den wichtigsten KI-Entwicklungen, freitags immer mit Deep Dive.​
E-Mail-Adresse
Ausführliche Informationen zum Versandverfahren und zu Ihren Widerrufsmöglichkeiten erhalten Sie in unserer Datenschutzerklärung.
Die Forscher argumentieren, dass Menschen häufig ihre eigenen Körper über Bewegungen dazu nutzen, um dem Spiel eines Instruments einen besonderen Ausdruck zu verleihen. Ähnliches haben die Wissenschaftler auch bei ZRob im Sinn. Indem sie dem Roboter eine flexible Aufhängung des Drumsticks verpassen, wird er anpassungsfähiger. Der Austausch der Federn durch solche unterschiedlicher Härte kann so das Schlagzeugspiel und den Klang beeinflussen. Der Roboterkörper trägt dadurch quasi zum Spielverhalten bei.
Spieloptimierung durch verstärkendes Lernen
Angesteuert wird ZRob auf unterster Ebene von einem Arduino-Mikrocomputer. Er wird mit MIDI-Daten gefüttert, die das Schlagzeugspiel grundlegend vorgeben. Um das Spiel des Roboters zu optimieren, setzen die Forscher auf verstärkendes Lernen. Die akustischen Informationen des Schlagzeugspiels werden dabei über ein Mikrofon erfasst, über RL wird die Künstliche Intelligenz (KI) trainiert und so das Schlagzeugspiel verbessert.
Der RL-Algorithmus basiert auf der Deep-Deterministic-Policy-Gradient-Methode (DDPG). Der Roboter wird dabei mit einer Kombination aus intrinsischen und extrinsischen Belohnungen trainiert, statt nur auf extrinsische Belohnungen zu setzen. Die intrinsischen Belohnungen führen dazu, dass neue rhythmische Muster entstehen können, die extrinsischen Belohnungen führen dagegen zu vorhersehbaren Mustern, die mit den MIDI-Daten identisch sind.
Die Wissenschaftler glauben allerdings nicht daran, dass diese Art von Robotermusik Menschen auf die gleiche Weise berühren kann wie von Menschen gemachte Musik. ZRob könne jedoch neue Arten von Rhythmen erzeugen und ein Schlagzeug deutlich schneller spielen als ein Mensch. Bislang werden mehrere ZRobs benötigt, um ein Drum-Set spielen zu können.
(olb)