Bilderkennung: Wovon träumen neuronale Netze?

Forscher bei Google haben visualisiert, wie neuronale Netze zur Bilderkennung arbeiten. Dabei sind faszinierende Bilder entstanden.

198

Wenn neuronale Netze "träumen" ...

(Bild: Google Research)

19.06.2015, 16:17 Uhr

Lesezeit: 3 Min.

Von

Dr. Oliver Diedrich

Künstliche neuronale Netze sind eine bewährte Technik zur Klassifikation von Bildern. Sie bestehen aus einer Eingabeschicht, der die Bilder präsentiert werden, einer Ausgabeschicht, die die Entscheidung des Netzes bekannt gibt, und typischerweise zehn bis 30 Zwischenschichten, die das Bild verarbeiten.

Wie neuronale Netze die Welt sehen (10 Bilder)

Ein auf Bananen trainiertes neuronales Netz erkennt auch in Rauschen – eine Banane.
(Bild: Google Research)

Diese neuronalen Netze werden auf ihre Aufgabe trainiert: Ihnen werden solange Bilder mit den Objekten präsentiert, die sie später erkennen sollen, bis die Trainingsbilder ebenso wie neues Material mit hoher Sicherheit erkannt werden. Die spannende Frage ist: Wie arbeitet ein trainiertes Netz und erkennt, dass auf dem einen Bild eine Maus und auf dem anderen ein Elefant abgebildet ist?

Wenn neuronale Netze träumen — Was das neuronale Netz für typisch Banane hält.

(Bild: Google Research)

Was man weiß, ist, dass sich künstliche visuelle Netze ähnlich wie biologische visuelle Systeme organisieren: Die verschiedenen Schichten extrahieren zunehmend komplexere Merkmale aus den Bildern. Die untersten Ebenen suchen nach Ecken und Kanten, in den mittleren Schichten geht es um Formen und Umrisse einzelner Bildelemente, die obersten Schichten schließlich setzen diese Komponenten zu einer Gesamtinterpretation zusammen.

Netz auf den Kopf gestellt

In ihrem Bemühen, die Arbeitsweise solcher neuronalen Netze besser zu verstehen, haben die Google-Forscher die Netze sozusagen auf den Kopf gestellt: Ausgehend von dem Ergebnis ("Banane") und einem Bild mit Rauschen ließen sie das neuronale Netz ein passendes Bild erstellen. Dieses Bild zeigt, was für das Netz das Wesen einer Banane ausmacht.

Schon dabei erlebten die Forscher Überraschungen. Die Bilder von Hanteln beispielsweise, die ein auf Hantelbilder trainiertes neuronales Netz generierte, zeigten neben Hantel-artigen Objekten immer auch Teile eines Arms. Offenbar hatten die meisten Trainingsbilder Hanteln samt Arm gezeigt, sodass zur Hantel-Repräsentation des Netzes der Arm dazugehört – offensichtlich ein Fehler beim Training.

Ein anderer Ansatz besteht darin, dem Netz ein Bild zu zeigen und die einzelnen Schichten des neuronalen Netzes das verstärken zu lassen, was sie in dem Bild "sehen". Die unteren Ebenen beispielsweise produzieren dann Striche oder ornamentartige Muster, weil sie vor allem Kanten und deren Richtung extrahieren.

Wolken als Tiere

Was neuronale Netze in Wolken erkennen ...

(Bild: Google Research)

Auf höheren Ebenen geht es um ganze Objekte: In einem Wolkenbild entdeckt ein auf Tiere trainiertes Netz dann tierartige Figuren – interessanterweise auch als Mischungen aus verschiedenen Tieren, die das Netz unterscheiden kann. Das lässt Rückschlüsse auf das Ausmaß an Abstraktion auf der betrachteten Ebene zu.

Aber was passiert, wenn das neuronale Netz in einer Rückkopplung immer wieder mit den selbst generierten Bildern gefüttert wird, ausgehend von Rauschen? Letztlich, so die Forscher, ist dann zu erfahren, welche Objekte das neuronale Netz kennt – wovon es "träumt", gewissermaßen, wenn es keinen gezielten Input erhält.

Die Google-Forscher haben eine große Sammlung der dabei entstandenen Bilder veröffentlicht. Ihre Methode, neuronalen Netzen Bilder zu entlocken, schreiben sie, könnte auch ein spannendes Werkzeug für Künstler werden – und womöglich ein bisschen helfen, kreative Prozesse besser zu verstehen. (odi)