Facebook veröffentlicht Open-Source-Bibliotheken zur Bildanalyse

Die Bibliotheken DeepMask und SharpMask helfen beim Erkennen der Umrisse von Objekten innerhalb von Bildern. MultiPath dient der Identifizierung der gefundenen Segmente.

 –  12 Kommentare
Facebook veröffentlicht Open-Source-Bibliotheken zur Bildanalyse
Anzeige

Nach und nach gibt Facebook Software im Bereich maschinelles Lernen als Open Source frei. Nach der Veröffentlichung des Torch-Frameworks Torchnet im Juni folgen nun drei Bibliotheken, die der Identifizierung einzelner Objekte innerhalb von Bildern dienen. DeepMask, SharpMask und MultiPathNet verwenden die quelloffene Bibliothek Torch als Basis, die zahlreiche Algorithmen für Deep Learning bietet.

Im ersten Schritt der Analyse unterteilt DeepMask das Bild in Segmente mithilfe binärer Klassifikationsalgorithmen. Wie der Name vermuten lässt, kommen dabei Deep Neural Networks (tiefe künstliche Neuronale Netze) zum Einsatz. Die erstellten Masken umreißen die Objekte, haben aber noch recht unscharfe Grenzen. Die Umrisse versucht SharpMask im zweiten Schritt zu schärfen.

Anzeige

Das Ergebnis ist eine Reihe von Segmenten, die aber noch keinen Aufschluss über die tatsächlichen Objekte geben. Daher kommt im dritten Schritt MultiPathNet zum Einsatz, das ebenfalls auf künstliche neuronale Netze setzt. Die Bibliothek untersucht die Objekte auf unterschiedlichen Ebenen und im Kontext des restlichen Bildes. Gleichzeitig sortiert der Algorithmus Segmente heraus, die DeepMask erkannt hat, MultiPathNet aber für nicht relevant erachtet.

Das Ergebnis der Bildanalyse bei den von Facebook asugewählten Beispielen ist recht aussagekräftig (Bild: Facebook)

Im Bereich des maschinellen Lernens zur Bildanalyse wetteifern die großen Unternehmen seit geraumer Zeit. Zu Facebooks namhaften Konkurrenten gehören Googles Cloud Vision, Microsofts Cognitive Services (vormals Projekt Oxford) und IBMs Watson API.

Weitere Details zu Facebooks Biblitoheken stehen im Blogbeitrag. DeepMask und SharpMask liegen in einem gemeinsamen GitHub-Repository, MultiPathNet in einem separaten. Für alle Bibliotheken gilt die BSD-Lizenz. (rme)

Anzeige