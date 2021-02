Die meisten Bilderkennungssysteme werden mit riesigen Datenbanken trainiert, die Millionen von Fotos alltäglicher Objekte beinhalten. Sie werden von Menschen getaggt, seien es nun Aufnahmen von Schlangen, Milchshakes, Autos oder Schuhen. So lernt ein KI-System nach und nach, Objekte voneinander zu unterscheiden.

Nun haben japanische Forscher zeigen können, dass sich solche Systeme genauso gut auch mit computergenerierten Fraktalen trainieren lassen, um Alltagsgegenstände zu erkennen. Die Idee mag zunächst seltsam klingen, doch sie könnte große Früchte tragen. Bei der automatisierten Herstellung von Trainingsdaten handelt es sich um einen interessanten Trend innerhalb des maschinellen Lernens. Mit einer schier unerschöpflichen Menge an synthetischen Bildern zu arbeiten und eben nicht mehr mit Fotos, die aus dem Internet stammen, könnte viele Probleme mit existierenden, handgetaggten Datasets hinfällig machen.

Hangetaggte Datasets: Aufwändig und voreingenommen

In der Pretraining-Phase lernt ein KI-System grundlegende Fähigkeiten, bevor es mit spezifischen Daten trainiert wird. Oftmals werden existierende Modelle verwendet, damit diese Phase nicht komplett wiederholt werden muss. Stattdessen erfolgt eine Detailanpassung, etwa zur Erkennung von Bildern im medizinisch diagnostischen Umfeld.

Das Pretraining erfolgt dafür mit einer Datenbank, die Alltagsgegenstände enthält – etwa ImageNet mit mehr als 14 Millionen Fotos. Im Anschluss kommt bei der Feinabstimmung eine kleinere Datenbank mit medizinischen Bildern zum Zuge – das Training geht dann solange, bis das Modell – für den Menschen oft sogar unsichtbare – unauffällige Anzeichen einer Krankheit erkennt.

Das Problem ist, dass die manuelle Zusammensetzung eines Datasets wie ImageNet enorm viel Zeit und Anstrengung erfordert. Diese Bilder werden in der Regel von schlecht bezahlten Crowdworkern zugeordnet. Die Datensätze könnten zudem sexistische oder rassistische Tags beinhalten, sodass dem Modell kaum merklich Vorurteile untergejubelt werden. Und es ist gut möglich, dass Bilder von Personen verwendet werden, die gar nicht dazu eingewilligt haben. Dass Voreingenommenheit oft schon im Pretraining entsteht, ist belegt.

"FractalDB": Was können Fraktale?

Fraktale sind natürliche Formen. Sie kommen überall vor: in Bäumen und Blumen, Wolken und Wellen. Das machte das Team von Japans National Institute of Advanced Industrial Science and Technology (AIST), dem Tokyo Institute of Technology und der Tokyo Denki University neugierig: Könnten diese Muster dazu verwendet werden, automatisierten Systemen die Grundsätze der Bilderkennung beizubringen? Auf diese Weise könnte man auf Fotos und reale Objekte verzichten. So entstand FractalDB, eine Datenbank mit einer gigantischen Menge an computergenerierten Fraktalen.

Manche ähneln Blättern, andere Schneeflocken oder dem Gehäuse einer Schnecke. Jeder Gruppe mit ähnlichen Mustern wurde automatisch eine Bezeichnung zugewiesen. Die Forscher nutzten FractalDB als Basis, um ein Convolutional Neural Network vorzutrainieren, ein Deep-Learning-Modell, das üblicherweise in Bilderkennungssystemen verwendet wird, bevor die Lerneinheit mit einem Set tatsächlicher Bilder vervollständigt wurde.

Im Ergebnis schnitt das auf diese Weise trainierte Modell genauso gut ab wie die anderen, die mit anerkannten Datasets wie ImageNet oder Places und dessen 2,5 Millionen Freiluft-Fotos trainiert wurden.

Abstrakte Muster können ein Problem sein

Anh Nguyen von der Auburn University in Alabama, selbst nicht beteiligt an der Studie, ist allerdings noch nicht davon überzeugt, dass FractalDB Verfahren wie ImageNet das Wasser reichen kann. In seiner Forschung beschäftigt er sich damit, wie abstrakte Muster Bilderkennungssysteme in die Irre führen können. "Es gibt eine Verbindung zwischen dieser Arbeit und Beispielen, die zeigen, wie Maschinen getäuscht werden können", sagt er und würde gern zunächst im Detail untersuchen, wie dieser neue Ansatz funktioniert.

Die japanischen Forscher hingegen glauben, dass computergenerierte Datensätze wie FractalDB nach einigen Optimierungen die bestehenden Datenbanken ersetzen könnten ohne Systeme zu verwirren.

In der Studie wurde das KI-System auch mit anderen abstrakten Bildern trainiert, unter anderem welchen, die mit Perlin Noise hergestellt wurden, das spezielle Fantasiemuster kreiert, sowie Bézierkurven, parametrisch modellierte Kurven, wie sie in Computergrafiken verwendet werden. Doch Fraktale erzielten die besten Ergebnisse. "Fraktale Geometrie ist etwas, das im Hintergrundwissen über die Welt existiert", sagt Hauptautor Hirokatsu Kataoka am AIST.

(bsc)