Machine Learning: Googles NIMA kann die Qualität von Bildern bewerten
Googles neuronales Netz NIMA kann Bilder nach Qualität und Ästhetik bewerten und schneidet dabei in ersten Testergebnissen ähnlich wie menschliche Bewerter ab. Ideen zum Einsatz zur automatischen Bildbewertung und -erkennung stehen bereits im Raum.
- Björn Bohn
Google stellt mit NIMA (Neural Image Assessment) ein künstliches neuronales Netz vor, das in der Lage ist, Bilder auf ihre Qualität und Ästhetik hin zu überprüfen und zu bewerten. In Tests von Google analysierte NIMA unter anderem Bilder der Datenbank AVA (Aesthetic Visual Analysis) auf ihre (subjektive) Ästhetik hin und erzielte dort Ergebnisse, die nahezu identisch mit dem Durchschnittswert menschlicher Bewertungen liegen. Außerdem ist NIMA in der Lage, die Qualität von Bildern im TID203-Test-Set zu unterscheiden und unscharfe Bilder und Verzerrungen entsprechend niedriger zu bewerten
Hilfe bei der Suche nach dem besten Bild
Auch wenn es noch keine konkreten Praxisanwendungen von NIMA gibt, sind laut Google unterschiedliche Anwendungen denkbar. So wäre es beispielsweise möglich, das NIMA die qualitativ hochwertigste Version eines Fotos für einen Benutzer findet. Die GIF-Plattform Gfycat kündigte bereits ein ähnliches Vorhaben an und möchte ihren Nutzern mithilfe von KI qualitativ hochwertigere GIFs anbieten können.
Die von NIMA ermittelten Ergebnisse dienten außerdem als Grundlage für eine automatische Bildbearbeitung, die zu einem höheren Ergebnis bei der Bewertung führt. Durch Anpassungen von Kontrast und Helligkeit können die Bilder automatisch so optimiert werden, dass sie ein höheres Ergebnis im Test erzielen.
Netz für die Analyse von Bildern
Genauer handelt es sich bei NIMA um ein Convolutional Neural Network (CNN oder ConvNet), also ein künstliches neurales Netz, das speziell für das Erkennen von Objekten und Bildern konzipiert ist. Einer der wichtigsten Indikatoren für die Fähigkeiten eines CNN ist die ImageNet-Challenge, in der künstliche Intelligenzen verschiedene Bilder und Videos analysieren und Objekte darin erkennen müssen. (bbo)