Maschinelles Lernen: Neuronale Netze generieren Inhalte

Generative Adversarial Networks sind neuronale Netze, die Texte, Videos oder Musik erzeugen. Sie taugen zum Restaurieren alter Filme, aber auch zum Verfälschen.

Artikel verschenken
In Pocket speichern vorlesen Druckansicht 2 Kommentare lesen
Lesezeit: 14 Min.
Von
  • Gerhard Völkl
Inhaltsverzeichnis

Wenn man einen kurzen Blick auf das Landschaftsbild in der ersten Abbildung wirft, fällt einem im ersten Moment nichts Bestimmtes auf. Das Foto könnte irgendwo in Deutschland aufgenommen worden sein. Ein Blick auf die Details, etwa die Baumstämme oder den Lichteinfall, erzeugt das Gefühl, dass irgendetwas hier nicht stimmt.

Die Lösung: Diese Landschaft gibt es nicht. Das Bild wurde von einem Programm (GauGAN) generiert. Möglich macht das eine Idee, die Ian Goodfellow 2014 hatte. Er ging mit einem Kollegen in einen Pub und beide diskutierten über eine der größten Herausforderungen beim Deep Learning: die Menge an Beispielen, die ein neuronales Netz zum Lernen braucht. Bei der Bilderkennung sind Tausende von Bildern notwendig. Diese muss sich vorher ein Mensch ansehen und beschreiben, was darauf zu sehen ist (Labeling), damit später der Lernprozess weiß, ob das Ergebnis des neuronalen Netzes richtig oder falsch ist.

Der Kollege von Ian Goodfellow wollte nicht bloß Bildinhalte analysieren, sondern vollständig neue Bilder erzeugen. Nach längerer Diskussion kam Ian Goodfellow auf eine Frage: Wenn es mit einem neuronalen Netz und vielen vorbereiteten Daten nicht geht, warum versucht man es nicht mit zwei neuronalen Netzen? Diese treten dann wie in einem Spiel gegeneinander an. Das eine Netz erzeugt die Bilder und das zweite beurteilt, ob diese echt oder generiert sind. Durch den Lernprozess wird jedes der Netze in seiner jeweiligen Tätigkeit immer besser, ohne irgendwelche Daten mit Beschreibungen (Labels) zu brauchen.