Facebook veröffentlicht Open-Source-Bibliotheken zur Bildanalyse
Die Bibliotheken DeepMask und SharpMask helfen beim Erkennen der Umrisse von Objekten innerhalb von Bildern. MultiPath dient der Identifizierung der gefundenen Segmente.
Nach und nach gibt Facebook Software im Bereich maschinelles Lernen als Open Source frei. Nach der Veröffentlichung des Torch-Frameworks Torchnet im Juni folgen nun drei Bibliotheken, die der Identifizierung einzelner Objekte innerhalb von Bildern dienen. DeepMask, SharpMask und MultiPathNet verwenden die quelloffene Bibliothek Torch als Basis, die zahlreiche Algorithmen für Deep Learning bietet.
KĂĽnstliche Neuronale Netze zur Segmentierung
Im ersten Schritt der Analyse unterteilt DeepMask das Bild in Segmente mithilfe binärer Klassifikationsalgorithmen. Wie der Name vermuten lässt, kommen dabei Deep Neural Networks (tiefe künstliche Neuronale Netze) zum Einsatz. Die erstellten Masken umreißen die Objekte, haben aber noch recht unscharfe Grenzen. Die Umrisse versucht SharpMask im zweiten Schritt zu schärfen.
Das Ergebnis ist eine Reihe von Segmenten, die aber noch keinen Aufschluss über die tatsächlichen Objekte geben. Daher kommt im dritten Schritt MultiPathNet zum Einsatz, das ebenfalls auf künstliche neuronale Netze setzt. Die Bibliothek untersucht die Objekte auf unterschiedlichen Ebenen und im Kontext des restlichen Bildes. Gleichzeitig sortiert der Algorithmus Segmente heraus, die DeepMask erkannt hat, MultiPathNet aber für nicht relevant erachtet.
Wettbewerb der groĂźen Internetunternehmen
Im Bereich des maschinellen Lernens zur Bildanalyse wetteifern die großen Unternehmen seit geraumer Zeit. Zu Facebooks namhaften Konkurrenten gehören Googles Cloud Vision, Microsofts Cognitive Services (vormals Projekt Oxford) und IBMs Watson API.
Weitere Details zu Facebooks Biblitoheken stehen im Blogbeitrag. DeepMask und SharpMask liegen in einem gemeinsamen GitHub-Repository, MultiPathNet in einem separaten. FĂĽr alle Bibliotheken gilt die BSD-Lizenz. (rme)