Google veröffentlicht eine Bildergalerie zum Trainieren neuronaler Netze

OpenImages ist eine Sammlung von 9 Millionen URLs zu Bildern, die unter der Creative-Commons-Lizenz stehen und mit Anmerkungen versehen sind. Mit ihnen können Entwickler künstlicher neuronaler Netze ihre Systeme trainieren.

In Pocket speichern vorlesen Druckansicht 5 Kommentare lesen
Google bringt offene Bildersammlung zum Trainieren neuronaler Netze
Lesezeit: 2 Min.
Von
  • Rainald Menge-Sonnentag

Google hat zusammen mit den Universitäten Carnegie Mellon und Cornell eine große Sammlung von URLs zu Bildern als OpenImages veröffentlicht. Freilich sind über die Suchmaschine deutlich mehr Bilder verfügbar, aber das Projekt hat Besonderheiten: Die Bilder stehen allesamt unter der Creative-Commons-Lizenz CC BY 2.0, die das Kopieren und Verändern auch für die kommerzielle Verwendung erlaubt. Außerdem existieren zu jedem Bild Beschreibungen, die ebenfalls als Creative Commons unter CC BY 4.0 lizenziert sind.

OpenImages soll vor allem dem Training künstlicher neuronaler Netze im Bereich der Bildanalyse dienen und Entwicklern eine bessere Basis bieten als Sammlungen wie ImageNet, COCO und Yahoo! Flickr Creatie Commons 100M. Die Bildtitel umfassen 6000 Kategorien. In einem zu Googles Cloud Vision API ähnlichen Modell wurden jedem Bild im Schnitt acht Labels zugeordnet. Anschließend haben menschliche Betrachter die Datensätze nach falschen Beschreibungen durchsucht.

Die Zuordnung der passenden Bezeichnungen übernahm eine Software, und die Ergebnisse wurden von menschlichen Gegenlesern korrigiert.

Die Bildersammlung ist laut dem Google-Blog umfangreich genug, um ein Deep Neural Network zur Bildanalyse ohne weitere Vorbereitung komplett zu trainieren. OpenImages ist damit ein weiterer Schritt Googles, Werkzeuge und Inhalte für den Bereich maschinelles Lernen als Open Source freizugeben. Zuletzt hatte der Internetriese mit "Show and Tell" im September ein quelloffenes TensorFlow-Modul zur Bildbeschreibung veröffentlicht.

Weitere Details stehen in einem Blogbeitrag. Die Datensammlung ist als CSV-Datei auf GitHub verfügbar. Dort findet sich auch eine detaillierte Beschreibung der Formatierung sowie Statistiken zur Datenqualität. (rme)