Computer erkennt Kreativität in Gemälden

Die Bedeutung eines Kunstwerks zu beurteilen, ist normalerweise Aufgabe von gut ausgebildeten menschlichen Experten. Zwei Forscher haben jetzt Computer darauf angesetzt – mit bemerkenswertem Erfolg.

In Pocket speichern vorlesen Druckansicht
Lesezeit: 5 Min.
Von
  • TR Online

Die Bedeutung eines Kunstwerks zu beurteilen, ist normalerweise Aufgabe von gut ausgebildeten menschlichen Experten. Zwei Forscher haben jetzt Computer darauf angesetzt – mit bemerkenswertem Erfolg.

In der Kunstgeschichte finden sich immer wieder Bilder, die sich deutlich von allem unterscheiden, was es vorher gab, und dann großen Einfluss auf spätere Werke hatten. Beispiele für solche besonderen Werke sind Madonna und Kind mit einem Granatapfel von Leonardo da Vinci aus dem Jahr 1469, Christus am Kreuz von Goya aus dem Jahr 1780 oder Heuschober in Chailly bei Sonnenaufgang von Monet aus dem Jahr 1865. Andere, die mehr Ähnlichkeit mit früheren Gemälden zeigen, gelten als weniger kreativ.

Zu unterscheiden, was wirklich kreativ ist und was nicht, ist die Aufgabe von Kunsthistorikern – und sie ist nicht eben einfach. Mindestens erfordert sie ein enzyklopädisches Wissen über Kunstgeschichte. Mit dieser Kenntnis kann der Historiker dann nach neuen Merkmalen suchen und sie in späteren Werken wiederentdecken, um den Einfluss des Originals zu belegen.

62.000 Gemälde als Basis

Das ist schon für einen Menschen nicht leicht, und dass ein Computer es schaffen könnte, wäre bis vor kurzem noch undenkbar gewesen. Jetzt aber berichten Ahmed Elgammal und Babak Saleh von der Rutgers University in New Jersey in einem Fachaufsatz, sie hätten ein System entwickelt, das genau dazu in der Lage ist. Damit untersuchten die beiden Forscher eine Datenbank mit etwa 62.000 Bildern von Kunstwerken. Die Ergebnisse, so schreiben sie, ähnelten in vielen Fällen den Urteilen von menschlichen Experten.

Grundlage für diesen Erfolg waren Fortschritte in mehreren Bereichen. Erstens gab es in den letzten Jahren mehrere Durchbrüche beim maschinellen Sehen. Bilder werden dabei anhand ihrer visuellen Konzepte, der so genannten Klasseme, klassifiziert. Bei diesen kann es sich um einfache Merkmale wie Farbe oder Textur handeln, ebenso um einfache Objekte wie ein Haus, eine Kirche, ein Heuhaufen oder auch um Schwierigeres wie die Aktivität des Gehens, einen toten Körper oder Ähnliches.

Mit diesem Ansatz kann ein Algorithmus für maschinelles Sehen ein Bild analysieren und eine Liste von Klassemen für seine Beschreibung erstellen (im aktuellen Fall gibt es bis zu 2.559 unterschiedliche Klasseme). Diese Liste ist wie ein Vektor, der das Bild definiert, und lässt sich für Vergleiche mit anderen, auf dieselbe Weise analysierten Bildern nutzen.

Große Datenbanken als Trainingsfeld

Der zweite nötige Fortschritt war das Aufkommen von riesigen Online-Kunstdatenbanken. Das ist bedeutend, weil Algorithmen für maschinelles Sehen zum Training große Datenbanken brauchen. Elgammal und Saleh nutzten dafür zwei Datenbanken. Eine davon stammt von der Website Wikiart und enthält Bilder und Anmerkungen zu 62.000 Kunstwerken aus unterschiedlichen Zeiten. Drittens brauchten die beiden Forscher eine Theorie, um festzustellen, welche Gemälde im Vergleich zu den übrigen die originellsten waren und wie sie spätere Werke beeinflusst haben.

Diesem Problem näherten sie sich mit der Netzwerkforschung: Sie behandelten die Kunstgeschichte als ein Netzwerk, bei dem jedes Gemälde Verbindungen zu späteren ähnlichen Werken hat und seinerseits mit ähnlichen Gemälden der Vergangenheit verbunden ist.

Zur Bestimmung des Kreativitätsgrades analysierten Elgammal und Saleh den Zeitpunkt, wann bestimmte Muster von Klassemen zum ersten Mal erschienen und wie sich sich später verbreiteten. „Wir zeigen, dass sich das Problem auf eine Variante von Netzwerkzentralitätsproblemen reduzieren lässt, die effizient zu lösen ist“, schreiben sie dazu in ihrem Fachaufsatz.

Erstmals auf Kreativität angewandt

Mit anderen Worten: Die kreativsten Gemälde zu finden, ist ähnlich wie die Suche nach der einflussreichsten Person in einem sozialen Netz, nach der wichtigsten Station im U-Bahn-System einer Stadt oder nach besonders ansteckenden Personen bei einer Krankheit. Solche Probleme sind in den vergangenen Jahren zum Standard in der Netzwerkforschung geworden. Elgammal und Saleh haben die Technik jetzt zum ersten Mal auf Kreativität angewandt.

Die Ergebnisse der algorithmischen Analyse sind interessant. Die Abbildung oben zeigt auf der X-Achse nach dem Entstehungsdatum sortierte Kunstwerke, die Y-Achse steht für die Kreativitätsbewertung durch den Algorithmus.

Mehrere berühmte Bilder stechen als besonders neu und einflussreich heraus, etwa Christus am Kreuz von Goya, Heuschober in Chailly bei Sonnenaufgang und Der Schrei von Edvard Munch. Andere Kunstwerke fallen durch eher wenig Kreativität auf, etwa die Rodin-Skulptur La Danaide aus dem Jahr 1889 oder die Kohlezeichnung Albrecht Dürers seiner Mutter Barbara von 1514.

Übereinstimmungen mit Kunsthistorikern

Viele Kunsthistoriker würden sich diesen Bewertungen anschließen: „In den meisten Fällen hebt der Algorithmus Kunstwerke heraus, die auch von Kunsthistorikern als besonders innovativ und einflussreich beschrieben werden“, schreiben die Forscher.

Ein wichtiger Punkt dabei ist, dass ihre Ergebnisse vollkommen automatisiert entstanden. Sie basieren ausschließlich auf dem Netzwerk der Verbindungen zwischen Gemälden, die vom Algorithmus entdeckt werden. Es gibt also keine Vorgaben, von denen die Bewertung geleitet würde.

Solches Data Mining könnte großen Einfluss auf die Art und Weise haben, wie Kunsthistoriker Gemälde beurteilen. Die Möglichkeit, die gesamte Kunstgeschichte auf diese Weise darzustellen, dürfte verändern, wie über Kunst gedacht und diskutiert wird. Und der Ansatz ist nicht einmal auf Gemälde beschränkt: Wie Elgammal ud Saleh erklären, ließe sich damit auch Kreativität bei Literatur, Bildhauerei und sogar in der Wissenschaft messen.

()