Duell der KIs

Ein neues Verfahren versetzt Computer in die Lage, aus dem Nichts realistisch wirkende Fotos oder Videos zu erzeugen. Ian Goodfellow hat es erfunden – und kämpft seitdem gegen die dunkle Seite seiner Entdeckung.

In Pocket speichern vorlesen Druckansicht
Duell der KIs

(Bild: Ian Goodfellow)

Lesezeit: 9 Min.
Von
  • Martin Giles
Inhaltsverzeichnis

Die Idee entstand am Kneipentisch: Eigentlich wollte Ian Goodfellow 2014 mit einem Doktoranden-Kollegen dessen Abschluss feiern. Doch am Tisch der jungen Forscher bei Les 3 Brasseurs, einem beliebten Treffpunkt in Montreal, wurde nicht nur getrunken, sondern auch über fachliche Probleme diskutiert. Ein paar Freunde baten Goodfellow um Hilfe bei einem schwierigen Projekt, an dem sie gerade arbeiteten: einen Computer dazu zu bringen, eigenständig und ohne Vorlagen Fotos zu generieren.

Im Prinzip ließ sich dieses Problem durch ein neuronales Netz lösen. Doch die Ergebnisse der bis dahin gebräuchlichen "generativen Modelle" waren häufig nicht gut: Die Bilder eines Gesichts waren tendenziell unscharf oder wiesen grobe Fehler wie etwa fehlende Ohren auf. Beim Bier kam ihm jedoch eine Idee. Wie wäre es, wenn man das Problem durch zwei neuronale Netze lösen würde, die gewissermaßen gegeneinander antreten? Seine Freunde waren skeptisch.

Als Goodfellow nach Hause kam, schlief seine Freundin längst. Doch er beschloss, seine Idee gleich zu testen, setzte sich an den Computer und programmierte bis in die frühen Morgenstunden. Die Software funktionierte sofort.

Der Informatiker Ian Goodfellow hat neuronale Netzwerke dazu gebracht, so etwas wie Fantasie zu entwickeln.

Was Goodfellow in jener Nacht erfand, wird heute als GAN bezeichnet, kurz für "Generative Adversarial Network". Die Technik hat für enorme Aufregung auf dem Gebiet des Maschinenlernens gesorgt, denn die Fähigkeit, uns viele unterschiedliche Szenarien vorzustellen, ist ein wichtiger Teil von dem, was uns zu Menschen macht. Und wenn zukünftige Technikhistoriker in die Vergangenheit blicken, dürften sie GANs als bedeutenden Schritt bei der Entwicklung von Maschinen mit menschenähnlichem Bewusstsein betrachten. Yann LeCun, der oberste KI-Wissenschaftler von Facebook, bezeichnet GANs jedenfalls als "die coolste Idee bei Deep Learning in den letzten 20 Jahren". Für Andrew Ng, ein weiterer KI-Visionär und ehemaliger Chefwissenschaftler bei Baidu in China, sind GANs "ein bedeutender und grundlegender Fortschritt", der eine wachsende globale Gemeinschaft von Forschern inspiriert.

Die Magie von GANs liegt in der Art, wie die zwei konkurrierenden neuronalen Netze gegeneinander arbeiten. Sie bilden gewissermaßen den Wettlauf zwischen einem Kunstfälscher und einem Kunstdetektiv ab: Beide versuchen in mehreren Runden, schlauer als der jeweils andere zu sein. Beide Netze werden mit derselben Datensammlung trainiert. Das erste, genannt Generator, hat die Aufgabe, künstliche Outputs wie Fotos oder Handschriften zu erzeugen, die so realistisch sind wie möglich. Das zweite, der Diskriminator, vergleicht das Ergebnis mit echten Bildern aus der Trainingssammlung und versucht, Originale und Fälschungen zu unterscheiden. Auf der Basis dieser Ergebnisse passt der Generator seine Parameter für das Erzeugen neuer Bilder an. Und so geht es weiter, bis der Diskriminator nicht mehr erkennen kann, was echt ist und was gefälscht.

Noch ist die "Vorstellungskraft" von GANs begrenzt. So generiert ein GAN, nachdem es mit einer Reihe von Hundefotos trainiert wurde, zwar ein überzeugendes Bild eines Hundes, der zum Beispiel ein anderes Fellmuster hat. Ein vollkommen neues Tier aber kann es sich nicht ausdenken. Zudem hat die Qualität des Trainingsmaterials großen Einfluss auf die Ergebnisse. Sehr deutlich zeigte sich das bei einem GAN, das Bilder von Katzen mit willkürlich eingestreuten Buchstaben produzierte: Weil in den Trainingsdaten Katzen-Memes aus dem Internet enthalten waren, hatte sich die Maschine selbst beigebracht, dass Worte ein Bestandteil von dem sein müssten, was sie als Katze ansah.

Zudem sind GANs "launisch", sagt Pedro Domingos von der University of Washington, der seit Langem zu maschinellem Lernen forscht. Wenn sich der Diskriminator zu leicht in die Irre führen lasse, werde der Output des Generators nicht realistisch. Und die Kalibrierung der zwei rivalisierenden Netze könne schwierig sein, was erklärt, dass GANs manchmal bizarre Ergebnisse wie Tiere mit zwei Köpfen ausspucken. Doch diese Herausforderungen können Forscher nicht abschrecken. Seit Goodfellow und einige Kollegen im Jahr 2014 die erste Studie über seine Entdeckung publizierten, wurden Hunderte von Fachaufsätzen zum Thema GAN geschrieben. Goodfellow ist inzwischen Wissenschaftler im Team von Google Brain am Hauptsitz des Unternehmens in Mountain View in Kalifornien. Als ich ihn vor Kurzem dort traf, schien er immer noch überrascht von seinem Superstar-Status zu sein, den er als "etwas surreal" bezeichnete. Ein Fan der Technologie hat sogar eine Website namens "GAN Zoo" erstellt, auf der er dokumentiert, welche unterschiedlichen Versionen davon entwickelt werden.