c't 7/2022
S. 128
Test & Beratung
Bildskalierung mit KI
Bild: Rudolf A. Blaha

Maschinelle Bilderrätsel

Fotoauflösung erhöhen mithilfe künstlicher Intelligenz

Bildskalierung ist geradezu prädestiniert für maschinelles Lernen. Wo traditionelle Algorithmen nie vollends überzeugen konnten, verspricht künstliche Intelligenz, Detailinformationen glaubhaft zu rekonstruieren. Wir haben getestet, wie gut die Skalieralgorithmen in Web-Apps und Bildbearbeitungsprogrammen dieses Versprechen einlösen.

Von André Kramer

Die meisten Kameras lösen 24 Megapixel auf; Smartphonekameras meist nur 8 Megapixel. Was tun, wenn die Bildauflösung für großformatigen Druck nicht ausreicht und neu fotografieren keine Option ist? In US-Krimiserien mag es genügen, wenn jemand „Enhance“ kommandiert, damit aus der verschwommenen Reflexion eines Hinterkopfs ein gestochen scharfes Verbrecherporträt entsteht. In der Realität konnten auch komplexe Skalieralgorithmen nie vollends überzeugen.

Der Einsatz von künstlicher Intelligenz verspricht blühende Pixellandschaften. Etliche Anbieter verkaufen Upscaling auf Grundlage maschinellen Lernens. Im Test treten zunächst eine gute Handvoll Webdienste gegeneinander an. Alle bieten zwei-, drei- oder vierfache Skalierung. Bezahlt wird pro Bild.

Einige Desktop-Programme enthalten bereits KI-Skalierer. Aufgrund unterschiedlicher Ansätze sind sie aber nur bedingt mit den Webdiensten vergleichbar. Topaz Gigapixel AI ist der einzige Stand-alone-Skalierer. Für die übrigen Kandidaten wird sich kaum ein Kunde nur wegen dieser Funktion allein entscheiden; was sie leisten, ist dennoch interessant: das Grafikpaket CorelDraw Graphics Suite 2021, die Mac-Bildbearbeitung Pixelmator Pro und das Zweiergespann Photoshop und Lightroom.

Die richtige Portion Pixel

Für die Druckausgabe in 60 × 40 Zentimeter mit 300 ppi (Pixel pro Zoll) muss ein Foto eine native Auflösung von etwa 34 Megapixeln haben (7086 × 4724 plus etwas Schnitttoleranz). Die Kantenlänge eines 12-Megapixel Fotos (4032 × 3024) muss dafür nahezu verdoppelt werden.

Auflösung in 300 ppi nimmt man am besten bei einem Betrachtungsabstand von etwa 25 Zentimetern wahr, also in Büchern und Zeitschriften. Für größere Entfernungen bräuchte man die Stäbchen-und-Zapfen-Dichte eines Adlerauges, um die Details noch erfassen zu können. Großformatige Bilder kann man also auch geringer aufgelöst drucken, wenn diese nur aus einiger Entfernung zu sehen sind, beispielsweise aus dem Auto. Besucher von Museen und Galerien unterschreiten gerne den Betrachtungsabstand, bei dem man das vollständige Bild im Blickfeld hat. Beim Studieren von Details aus nächster Nähe ist wiederum eine Auflösung von 300 ppi wünschenswert.

Bikubisch, Lanczos & Co.

Bildbearbeitungsprogramme bieten seit Jahrzehnten mehrere Methoden an, um Bilder zu skalieren, beispielsweise Pixelwiederholung, bilineare und bikubische Interpolation oder Verfahren mit Namen wie Lanczos. Letzteres geht auf den ungarischen Mathematiker Kornél Lánczos zurück (sprich: Lantsosch).

Für Pixelgrafiken wie in klassischen Videospielen wählt man Pixelwiederholung (nächster Nachbar, nearest neighbor). Dieses einfachste aller Verfahren wiederholt lediglich Nachbarpixel. Die Pixel werden dadurch schlicht größer, behalten ihre Farben, scharfen Kanten und Blockstruktur, bilden aber Treppchen.

Bilineare oder bikubische Berechnung eignet sich eher für Fotos und Videos. Bei bilinearer Berechnung interpoliert der Algorithmus die Farbwerte des gesuchten Pixels aus den vier in horizontaler und vertikaler Richtung nächstgelegenen Punkten, berücksichtigt also 2 × 2 Pixel. Die bikubische Interpolation agiert auf einem 4 × 4-Raster, interpoliert dazwischen aber nicht linear, sondern mittels einer kubischen Funktion. Bikubische Berechnung führt zu weniger Artefakten als bilineare. Bei beiden zahlt man den Preis, dass scharfe Kanten verloren gehen und Farben an Übergängen verfälschen; beide vermeiden aber auch Pixeltreppchen.

Das Lanczos-Verfahren ist aufgrund seiner Effizienz recht beliebt und daher in vielen Programmen zu finden von Gimp über IrfanView bis hin zu XnView. Gegenüber bilinearer Berechnung erzielt es sichtbar bessere Ergebnisse. Daneben gibt es weitere Verfahren, die nach Mathematikern benannt sind, beispielsweise Hermite, Bell oder Mitchell. Allen gemeinsam ist, dass sie mehr oder weniger gut Strukturen reproduzieren, allerdings keine Details erkennen und nur begrenzt rekonstruieren können und somit in der Regel auch JPEG-Artefakte mitvergrößern.

Kommentieren