Meta veröffentlicht KI-gesteuerten Musikgenerator als Open Source

Meta stellt quelloffenen KI-gesteuerten Musikgenerator vor. Die Ergebnisse sind beachtlich; menschliche Musiker aber müssen sich (noch) keine Sorgen machen.

In Pocket speichern vorlesen Druckansicht 11 Kommentare lesen

(Bild: Michael Vi/Shutterstock.com)

Lesezeit: 3 Min.
Von
  • Andreas Knobloch

Im Wettstreit mit Google und anderen Tech-Konzernen hat Meta seinen eigenen KI-gesteuerten Musikgenerator veröffentlicht – und stellt ihn im Gegensatz zu Google als Open Source zur Verfügung. Das berichtet das Nacherichtenportal TechCrunch am Montag.

Das MusicGen genannte Tool von Meta kann aus einer Textbeschreibung (z.B. "Ein treibender Popsong aus den 80ern mit schweren Drums und Synthesizerflächen im Hintergrund") in etwa 12 Sekunden ein Audio erstellen. MusicGen könne optional auch mit einem Referenz-Audio "gesteuert" werden, z.B. mit einem vorhandenen Song. In diesem Fall versucht es, sowohl der Beschreibung als auch der Melodie zu folgen, schreibt TechCrunch.

Laut Meta wurde MusicGen mit 20.000 Stunden Musik trainiert, darunter 10.000 "hochwertige" lizenzierte Musiktitel und 390.000 reine Instrumententitel von ShutterStock und Pond5, einer großen Stock-Media-Bibliothek. Den zum Trainieren des Modells verwendeten Code hat Meta nicht zur Verfügung gestellt, aber es hat bereits trainierte Modelle veröffentlicht, die jeder mit der richtigen Hardware – vor allem einer GPU mit etwa 16 GB Speicher – ausführen kann, so TechCrunch weiter.

TechCrunch-Autor Kyle Wiggers gibt MusicGen die Note "Gut", hält das Programm aber für "sicherlich nicht gut genug, um menschliche Musiker arbeitslos zu machen". Die Songs seien einigermaßen melodisch, zumindest für einfache Aufforderungen wie "Ambient Chiptunes Music", und gleichwertig, wenn nicht sogar etwas besser, als die Ergebnisse des Google-KI-Musikgenerators MusicLM, meint Wiggers. "Aber sie werden keine Preise gewinnen", so sein Urteil. Klangbeispiele liefert er auf der Seite gleich mit.

Er habe ich mit beiden Tools versucht, ein Klavierstück im Stil von George Gershwin zu erzeugen, schreibt Wiggers. Aber während Google in die öffentliche Version von MusicLM einen Filter eingebaut hat, der Aufforderungen blockiert, die bestimmte Künstler erwähnen, um Urheberrechtsprobleme zu vermeiden, hat MusicGen keinen solchen Filter. Doch die Ergebnisse für "Background piano music in the style of Gershwin" von Metas KI-gesteuerten Musikgenerator "ließen etwas zu wünschen übrig".

Während generative Musik immer besser wird, müssen wichtige ethische und rechtliche Fragen erst noch geklärt werden. KI wie MusicGen "lernt" von bestehender Musik, um ähnliche Effekte zu erzeugen, eine Tatsache, mit der nicht alle Künstler – oder Nutzer generativer KI – einverstanden sind, schreibt Wiggers.

Derzeit laufen mehrere Gerichtsprozesse, die sich wahrscheinlich auf die musikgenerierende KI auswirken werden, darunter ein Prozess, der die Rechte von Künstlern betrifft, deren Werke ohne ihr Wissen oder ihre Zustimmung zum Training von KI-Systemen verwendet werden. Zu klären ist zudem, ob "gefälschte" Musik die Urheberrechte von Künstlern, Labels und anderen Rechteinhabern verletzt.

Meta hat erklärt, dass die gesamte Musik, auf die MusicGen trainiert wurde, "durch rechtliche Vereinbarungen mit den Rechteinhabern abgedeckt ist", einschließlich einer Vereinbarung mit Shutterstock.

Bisher liefern KI-Programme wie eben MusicGen, Riffusion oder MusicLM, das Google Ende Januar erstmals vorgestellt hat, vor allem gebrauchsfertige Hintergrundmusik. Doch das könnte sich in absehbarer Zeit ändern. KI-Forscher arbeiten an Algorithmen mit größerem Repertoire und besserem Musikverständnis. Schon bald könnte es vielleicht den ersten KI-generierten Hit geben.

(akn)