Neuronale Netze einfach erklärt

Seite 5: Spezial-Layer

Inhaltsverzeichnis

Für Bilderkennungsaufgaben gibt es noch eine besondere Art von neuronalen Netzen: Convolutionale Neuronale Netze (CNN). Diese Art hat eine spezielle Struktur, die sich als besonders vorteilhaft bei der Verarbeitung von Bilddaten erwiesen hat. Konvolutionale Operationen oder auch Faltung genannt sind eng mit der klassischen Bildverarbeitung verbunden und daher gedanklich auch recht gut zugänglich. Wer in einem Bildbearbeitungsprogramm schon mal einen Weichzeichner oder auch einen Kantenfindungsalgorithmus angewendet hat, verwendet genau solche Operationen.

Faltung (Convolution) hebt lokale Eigenschaften eines Bildbereichs und seiner Umgebung hervor, so dass sich Muster (z.B. eine Kante) leichter erkennen und durch neuronalen Netze besser verarbeiten lassen. Beispielsweise kann man auf diese Weise aus dem Bild einer 7-Segment LCD-Anzeige 7 Kanten herausfiltern.

Bild 4, Faltung: Auf Ausschnitte eines Bildes wird ein Faltungsoperator angewendet. In der Folge entsteht ein neues Bild mit einer Kante, einem Feature.

Bildlich gesprochen entspricht die Faltung bei der Bildverarbeitung der Multiplikation eines Bildausschnitts mit einer Matrix. Die Matrix schiebt man man zeilen- und spaltenweise über das Bild und multipliziert und summiert die Pixel. Die Matrix wird auch Faltungsoperator oder Filterkern (engl. Kernel) genannt (Bild 4).

Im Beispiel in Abbildung 5 entspricht dieser einer 3x3-Matrix. Das Ergebnis kann man ebenfalls als Bild darstellen. Wenn man sich den Operator genauer ansieht, so erkennt man, dass der Mittelwert über alle Einträge eine 0 ergibt. Das bedeutet, dass er in einem homogenen Bildbereich eine 0 als Ergebnis liefert.

Läuft der Operator jedoch über eine Kante im Bild, so gibt sich dort ein von 0 verschiedener Wert. Man erkennt im Ergebnis sehr deutlich die Kante vom schwarzen in den weißen Bildbereich, alle anderen Bereiche liefern eine 0. Dieser Filter erkennt also Kanten im Bild. Je nach Koeffizienten (im Filterkernel) lassen sich bestimmte Eigenschaften oder auch Features im Bild hervorheben. Daher wird das Ergebnis auch als Feature Map bezeichnet.