Künstliche Intelligenz: Bilderfälschen für alle

Mithilfe von künstlicher Intelligenz wird es immer einfacher, Bilder und Videos zu manipulieren. Das berichtet Technology Review in seiner aktuellen Ausgabe.

In Pocket speichern vorlesen Druckansicht 47 Kommentare lesen
Fälschen für alle

Ein falsches Lächeln.

Lesezeit: 3 Min.

Das goldene Zeitalter der Fake-News hat gerade erst begonnen. Denn Neuronale Netze machen das Fälschen von Bildern zukünftig noch einfacher – und das ohne verräterische Spuren zu hinterlassen. Der Twitter-Account @smilevector beispielsweise präsentiert Fotos und kurze Videoschnipsel, die mehr oder weniger prominente Menschen zeigen. Sie schauen ernst oder lächelnd in die Kamera. All diese Bilder sind jedoch Fälschungen. Erzeugt im Computer – im Dienst der Wissenschaft.

Die Software, die Leinwandhelden genauso überzeugend zum Lächeln bringt wie längst verstorbene illustre Persönlichkeiten auf historischen Ölbildern, ist das Produkt von Tom White von der University of Wellington: ein künstliches neuronales Netz, das auf Knopfdruck komplette Resultate liefert, ohne dass der Fälscher mühsam Pixel für Pixel, Bildregion für Bildregion retuschieren muss.

Die neue April-Ausgabe

Sogenannte generative neuronale Netze erzeugen im Computer ein komplett neues Bild, das in sich völlig stimmig ist. Smilevector kopiert nicht einfach nur einen lächelnden Mund über die entsprechende Bildregion. Das Programm stellt vielmehr sämtliche Gesichtsmuskeln, die sich während des Lächelns verändern, korrekt dar, produziert weiche Übergänge sowie konsistente Farb- und Beleuchtungsverhältnisse.

Im ersten Schritt wird das neuronale Netz mit vielen Beispielbildern von Gesichtern trainiert. Dabei lernt es selbstständig, welche Merkmale wichtig sind, um ähnliche Gesichter in einer Masse von Beispieldaten zu finden – also etwa das Gesicht einer jungen Frau oder eines alten Mannes. Das neuronale Netz destilliert die dafür nötigen Merkmale heraus und reduziert jedes Bild auf eine Liste von maximal 200 Zahlenwerten. White und Kollegen sprechen davon, dass das Bild durch einen Vektor mit 200 Dimensionen in einem "Latent Space" beschrieben wird. In diesem "verborgenen Raum" sind die Bildeigenschaften zwar gespeichert, aber nicht sichtbar. "Das Schöne ist nun, dass dieser Latenzraum stark strukturiert ist", erklärt White. Zieht man bei vielen Beispielgesichtern die Vektoren eines ernsten Gesichtes von dem eines lächelnden Gesichtes ab, erhält man einen durchschnittlichen "Lächel-Vektor". Der kann zu einem beliebigen neuen Gesichtsvektor addiert werden, dann lächelt dieses Gesicht.

Andrew Brock von der University of Edinburgh geht mit seinem "Neural Photo Editor" noch einen Schritt weiter: Die Software, die auf den ersten Blick aussieht wie ein einfaches Zeichenprogramm aus der Computer-Frühzeit, kann den Hautton oder die Gesichtsform eines Porträtfotos ändern, die Haarfarbe oder -länge anpassen und einen Bart ergänzen oder entfernen – ebenfalls durch Manipulationen im Latenzraum des Bildes. Grundsätzlich funktioniere das Verfahren nicht nur für Gesichter, sondern auch für Landschaften oder Fotos von Innenräumen, erklärt Brock. Bei beliebigen Fotos sei es allerdings noch nicht sehr zuverlässig. Wenn man das neuronale Netz aber darauf trainiere, nicht nur Bilder zu liefern, die den Vorstellungen des Users entsprechen, sondern auch möglichst wenig als Fälschung erkannt zu werden, könnte es in Zukunft "sehr herausfordernd" werden, Bildmanipulationen zu entdecken. (Wolfgang Stieler) / (bsc)