Google Gemini kann jetzt KI-Musik generieren - in 30-Sekunden-Happen
Nutzer können nun mit Gemini KI-Musik kreieren. Die Tracks entstehen auf Basis von Textanweisungen, Bildern oder Videos. Google will Urheberrechte beachten.
(Bild: whiteMocca/Shutterstock.com)
Googles KI-Modell Gemini erlaubt den Nutzern ab sofort auch die Erstellung von Musik per generativer Künstlicher Intelligenz (AGI). Die 30 Sekunden langen Tracks werden anhand textlicher Vorgaben des Anwenders generiert, die KI kann aber auch Musik auf Basis von Bildern oder Videos komponieren, inklusive Gesang. Die produzierten Musikstücke sind mit einem unhörbaren Wasserzeichen versehen, um sie als KI-generiert zu kennzeichnen. Google verspricht, Urheberrechte einzuhalten.
Für die Produktion der KI-Musik nutzt der Konzern Google Deepminds neues generatives Musikmodell „Lyria“, jetzt in der dritten Version. Google arbeitet daran seit 2023 und hatte es 2024 auf der Google I/O neben anderen KI-Modellen angekündigt. Trotzdem befindet sich die Funktion in Gemini laut Google noch im Beta-Status. Sie steht allen volljährigen Nutzern Geminis in den Sprachen Englisch, Deutsch, Spanisch, Französisch, Hindi, Japanisch, Koreanisch und Portugiesisch zur Verfügung.
Texte, Bilder und Videos zur Inspiration
Die Musikgenerierung erfolgt per textlicher Vorgabe, wobei keine Liedtexte notwendig sind. Lyria 3 kann die Lieder selbst komponieren. Nutzer sollten eine Musikrichtung vorgeben, aber Angaben zu Gesang, Stimmlage oder Tempo sind optional, schreibt Google. Ein Beispiel des Konzerns: „Erstelle einen schnellen (120 BPM) Soul-Funk-Track mit einer warmen, weiblichen Sopran-Stimme.“ Aber auch ungenaue Angaben sind möglich und resultieren in einem akzeptablen Track, etwa: „Trance-Musik aus den 90ern, die langsam beginnt, aber erhebend wirkt.“
(Bild: Google)
Daneben kann Gemini Bilder und Videos für die Musikgenerierung verwenden, wenn der Nutzer sie zum KI-Modell hochlädt. Das soll Lyria 3 entsprechend inspirieren und der KI eine Stimmung vorgeben: „Verwende diese Fotos, um einen Track über meinen Hund bei einer Wanderung im Wald zu erstellen.“ Passend zum Musikstück erstellt Gemini automatisch auch eine Grafik als Cover-Art. Diese wird vom ebenfalls in Gemini integrierten KI-Bildgenerator Nano Banana produziert.
YouTube-Hintergrundmusik mit Wasserzeichen
Google nutzt Lyria 3 nun auch innerhalb YouTubes. Content-Creator können ihre „Shorts“ darüber mit passender Hintergrundmusik unterlegen. Diese Funktion namens „Dream Track“ war bislang nur als Experiment in den USA verfügbar, kann jetzt aber auch in anderen Ländern genutzt werden. Das gehört zu Googles Strategie, Content-Creator auf YouTube mit KI zu unterstützen.
Videos by heise
Während KI-generierte Bilder und Videos optisch auffällig mit Markierungen versehen werden können, um sie als KI-generiert zu markieren, bleibt dies bei Musik versteckt. Der Konzern verspricht allerdings, dass auch die von Lyria 3 sowohl in Gemini als auch innerhalb YouTubes erstellten Tracks mit Googles Wasserzeichen SynthID für KI-Inhalte versehen werden. Dies ist zwar beim Hören nicht zu erkennen, lässt sich aber mithilfe Geminis verifizieren.
Urheberrechte wohl beachtet
Google betont, dass die Generierung von KI-Musik keine Urheberrechte verletzt und keine Künstler nachahmen soll. Bestehende Musikstücke würden lediglich als Inspiration verwendet. „Unser Training für Lyria 3 ist so konzipiert, dass Musik verwendet wird, deren Verwendung YouTube und Google gemäß unseren Nutzungsbedingungen, Partnervereinbarungen und geltendem Recht berechtigt ist“, erklärte Google gegenüber Bloomberg. Vor Geminis Musikausgabe sollen Filter die Tracks zudem „gegen bestehende Inhalte prüfen“.
Empfohlener redaktioneller Inhalt
Mit Ihrer Zustimmung wird hier ein externes YouTube-Video (Google Ireland Limited) geladen.
Ich bin damit einverstanden, dass mir externe Inhalte angezeigt werden. Damit können personenbezogene Daten an Drittplattformen (Google Ireland Limited) übermittelt werden. Mehr dazu in unserer Datenschutzerklärung.
Die Generierung von KI-Musik steht auch Gemini-Nutzern ohne zahlungspflichtiges Abonnement zur Verfügung. In diesem Fall beschränkt Google dies allerdings auf 10 Tracks pro Tag. Abonnenten von Google AI Plus, Pro oder Ultra dürfen sich dagegen 20, 50 oder sogar 100 Musikstücke pro Tag erstellen lassen.
(fds)