Digikam 7.0: Gesichtserkennung kommt auf den Hund

Die freie Fotoverwaltung Digikam erhält in Version 7.0 eine neue Gesichtserkennung, die auch Portraits von Menschen und Tieren unterscheidet.

In Pocket speichern vorlesen Druckansicht 49 Kommentare lesen
Digikam 7.0: Gesichtserkennung kommt auf den Hund

(Bild: David Wolski)

Lesezeit: 5 Min.
Von
  • David Wolski
Inhaltsverzeichnis

Digikam ist eine datenbankgestützte Bildverwaltung für anspruchsvolle Anwender, die damit Ordnung in sehr große Bildersammlungen bringen können und das Bildmaterial durch die Auswertung von Meta-Tags gut durchsuchbar machen. Vor einigen Tagen haben die Digikam-Entwickler Version 7.0 der Fotoverwaltung im Quellcode veröffentlicht, sich mit der offiziellen Vorstellung und den Release Notes aber noch Zeit gelassen.

Während dieser Verzögerung ging es darum, nachträglich aufgetretene Probleme beim Bauen der verschiedenen Binärpakete zu beheben. Denn Digikam ist nach fast 20 Jahren Entwicklung nicht mehr nur ein Aushängeschild der KDE-Arbeitsumgebung unter Linux, sondern liegt auch als Port für Windows und Mac OS X vor. Für Linux-Systeme gibt es Digikam 7.0 ab sofort auch als Flatpak.

Die Entwickler haben die Quellcode-Verwaltung wie die anderen zentralen KDE-Projekte komplett von diversen Einzeltools wie Phabricator und Bugzilla nach Gitlab umgezogen. Digikam ist die erste Version der Fotoverwaltung, die auf der KDE-Projektwebseite bei Gitlab liegt. Für KDE und seine engen Unterprojekte wurden die zuvor verwendeten, diversen Einzeltools reichlich umständlich und Gitlab fasst nun Vieles zusammen. Der Umzug KDEs und seiner Applikationen war einige Monate in Vorbereitung und wurde von Gitlab nach Abschluss mit einer Zusammenfassung der Aktivitäten gefeiert.

Für die Digikam-Entwickler stellt der Umfang des Digikam-Quellcodes auf Gitlab noch einige Hürden auf. Laut Gilles Caulier, einem der Hauptentwickler des Projekts, kann die Gitlab-Instanz des KDE-Teams bei der CI aktuell noch Schwierigkeiten bei dem Kompilieren machen. Ist das Program gelöst, soll die neue Entwicklungspipeline auch auf Continuous Delivery ausgedehnt werden und schneller fertige Digikam-Builds liefern.

Die wichtigste Neuerung, die sich bereits zur ersten Beta im letzten Dezember als Highlight dieser Version abzeichnete, ist eine neue Gesichtserkennung. Schon seit Digikam 2.0 enthielt die Fotoverwaltung Algorithmen zur Erkennung und zum automatischem Taggen von Personen in Bildern. Die Algorithmen basierten auf "Cascade Classifiers" von Intels Bibliothek OpenCV, blieben bis zur aktuellen Version 7.0 weitgehend unverändert und ließen in ihrer Präzision zu wünschen übrig: Rund 80 Prozent Erkennungsrate holten die Digikam-Entwickler aus OpenCV heraus. Was nach einer beeindruckend hohen Rate klingt, ist für den Alltag zu wenig, wie das Anwender-Feedback im Bugtracker zeigte.

Digikam 7.0: Gesichtserkennung kommt auf den Hund (9 Bilder)

Die neue Gesichtserkennung von DNN OpenCV in Aktion: Digikam 7.0.0 erkennt Porträts von Personen, aber auch Tieren selbstständig und schlägt dann die manuelle Kategorisierung dieses Bildmaterials nach Namen vor. Weitere Durchläufe beziehen dann diese Muster mit ein.
(Bild: David Wolski)

Im Rahmen des "Google Summer of Code" begann Digikam ab 2017 damit, zusammen mit Studenten die Gesichtserkennung über neuronale Netze und der C++-Bibliothek Dlib zu verbessern. Diese Methode brachte eine höhere Erkennungsrate, war aber zu langsam: Rund 8 Sekunden dauerte die Erkennung von Gesichtern in Bildern zu 112 mal 92 Pixeln, schrieben die Entwickler. In einem neuen Projekt zum Google Summer of Code 2019 gelang dann der Durchbruch mit dem Deep-Neural-Network-Modul der neueren OpenCV-Bibliothek. Diese Methode ist nun in Digikam 7.0 enthalten und liefert laut Release Notes eine Erkennungsrate von 97 Prozent bei einer akzeptablen Geschwindigkeit dank Multithreading.

Ein weiterer Vorteil ist, dass die neue Erkennung sich nicht auf menschliche Gesichter festlegt. Das vortrainierte Erkennungs-Modell in Digikam 7.0 erkennt auch die Portraits von Haustieren, beispielsweise Hunden. In einem Video von der KDE-Veranstaltung "Akademy 2019" erläutert der Entwickler der neuen Erkennung weitere Details des Deep-Learning-Models und die weiteren Pläne für diese Digikam-Komponente.

Empfohlener redaktioneller Inhalt

Mit Ihrer Zustimmmung wird hier ein externes YouTube-Video (Google Ireland Limited) geladen.

Ich bin damit einverstanden, dass mir externe Inhalte angezeigt werden. Damit können personenbezogene Daten an Drittplattformen (Google Ireland Limited) übermittelt werden. Mehr dazu in unserer Datenschutzerklärung.

Die Gesichtserkennung verlangt, so wie bisher, zunächst die manuelle Definition von Personen in einem Foto mittels Tags. Anschliessend vergleicht OpenCV die bereits erkannten, nicht zugeordneten Gesichter mit den bereits getaggten Personen. Die dann neu erkannten Gesichter in neu hinzugefügten Fotos werden den Anwendern in einer Vorschauansicht schliesslich zur Bestätigung vorgelegt. Der Workflow ist also halb-automatisch. Die neue Methode funktioniert schon ab dem ersten, mit Tag versehenem Gesicht, wird aber mit mehreren bestätigten Tags zu Personen immer genauer.

Die zweite große Portion an Neuerungen in Digikam 7.0 ist die erweiterte Unterstützung für herstellerspezifische RAW-Formate. Zwar tritt die Bildverwaltung nicht gegen RAW-Entwicklungstools wie RawTherapee oder Darktable an, will aber zumindest das Sichten von neuen Aufnahmen erleichtern und erlaubt auch schnelle Korrekturen wie Weißabgleich. Die Arbeit zum Decodieren der RAW-Daten überlässt Digikam der Bibliothek libraw 2.0, die 40 neue RAW-Formate unterstützt. Mit von der Partie ist das CR3-Fomat von Canon, welches erstmals von der spiegellosen Canon EOS 50 genutzt wurde, die im März 2018 auf den Markt kam. Auch mit dem Bildformat der Sony Alpha 7R4, das bis zu 61 Megapixel geht, kann Digikam nun umgehen.

Weitere Formate von Leica, FujiFilm, Hasselblad, Olympus, Panasonic, GoPro und des Drohnenherstellers DJI listen die Release Notes der Beta auf. Insgesamt enthält Digikam 7.0 damit Unterstützung für rund 1100 RAW-Formate.

(tiw)