Machine Learning: Facebook veröffentlicht ein (weiteres) Tool zur Objekterkennung

Das Open-Source-Projekt Detectron soll besonders der Forschung im Bereich der Objekterkennung dienen. Die in Python verfasste Software baut auf Caffe2 und ergänzt das Portfolio der APIs und Open-Source-Projekte für die Bildanalyse.

 –  7 Kommentare
Machine Learning: Facebook veröffentlicht ein weiteres Tool zur Bildanalyse
Anzeige

Facebooks KI-Forschungsteam hat das Open-Source-Projekt Detectron veröffentlicht. Facebook AI Research (FAIR) betont, dass das Projekt vor allem der Forschung im Bereich Bilderkennung dient. Die Arbeiten daran begannen laut einem Blogbeitrag bereits im Juli 2016. Damals befand sich jedoch das ebenfalls von Facebook initiierte Deep-Learning-Framework Caffe2, auf das Detectron aufbaut, noch im frühen Alpha-Stadium. Einige Monate nach der öffentlichen Freigabe des Frameworks auf der hauseigenen Entwicklerkonferenz f8 kündigte das soziale Netz im August 2018 an, Caffe2 verstärkt einzusetzen.

In dem Zeitraum ist laut dem Blogbeitrag auch die Codebasis von Detectron deutlich gereift. Das FAIR-Team hat es seitdem bereits in einigen Projekten verwendet, unter anderem in Mask R-CNN (Regional Convolutional Neural Networks) zum Segmentieren von Objektmasken und in Focal Loss for Dense Object Detection, das sich vor allem dem Ungleichgewicht der Schärfe für Objekte im Vorder- beziehungsweise Hintergrund eines Bilds widmet.

Anzeige
Ein Analysebeispiel von Mask R-CNN (Bild: Facebook)

Auch wenn der Schwerpunkt des Detectron-Projekts erklärtermaßen auf der Forschung liegt, nutzen einige Facebook-Teams die Plattform zum Trainieren von Anwendungen, unter anderem für Augmented Reality. Die trainierten Modelle lassen sich anschließend mit der Caffe2-Laufzeitumgebung verwenden.

Gerade im Bereich der Bildanalyse existieren bereits zahlreiche APIs und Open-Source-Projekte. Facebook hat im August 2018 die Bibliotheken DeepMask, SharpMask und Multipath zur Objekterkennung und -identifizierung veröffentlicht, die auf die Machine-Learning-Bibliothek Torch aufbauen. Google hat im Juni 2017 eine API zur Objekterkennung als Open-Source-Projekt veröffentlicht, die auf TensorFlow setzt. Bereits im September 2016 hatte der Internetriese ein ebenfalls auf TensorFlow aufbauendes Modul zur Bildbeschreibung auf GitHub veröffentlicht.

Weitere Details zu Detectron lassen sich dem Blogbeitrag entnehmen. Detectron steht unter der Apache-2-Lizenz quelloffen auf GitHub zur Verfügung. Dort finden sich auch Installationshinweise und eine Einstiegshilfe in das Projekt. (rme)

Anzeige