05.03.07
Infotech | KI & Robotik

Bilderkennung biologisch

Von Duncan Graham-Rowe

  1 2 >> | 5225 Zeichen

Druck | Leserbrief | Weitermailen | Heft bestellen | Forum (1 Kommentare)

Hirnforscher am Center for Biological and Computational Learning des MIT haben ein Computermodell entwickelt, das sich am Sehvermögen des Menschen orientiert. Es soll auch dann noch Objekte korrekt erkennen und zuordnen können, wenn eine Bildsequenz viele verschiedene Einzelteile besitzt – beispielsweise eine Straßenszene.

Derart von der Biologie inspirierte Bilderkennungssysteme könnten sich beispielsweise gut für Überwachungskameras eignen – oder für smarte Sensoren, die Autofahrer warnen, bevor diese mit anderen Fahrzeugen, Gegenständen oder Fußgängern zusammenstoßen. "Außerdem planen wir, die Technik für Bildsuchmaschinen zu verwenden", erklärt der Neurowissenschaftler Thomas Serre aus dem MIT-Team.

Natürliche Bilderkennungssysteme, namentlich das menschliche Sehzentrum, interessieren die Forscher schon seit Langem. Man wolle sie vor allem deshalb nachbauen, weil sie im Gegensatz zu heutiger Computertechnik so gut funktionierten, erklärt David Hogg, der sich an der Leeds University in Großbritannien mit dem Thema beschäftigt. Das MIT-Projekt sei daher ein "sehr erfolgreiches Beispiel", wie man sich von der Biologie inspirieren lassen könne.

Es ist nach wie vor enorm schwer, Rechnern die Einordnung von Objekten beizubringen – wesentlich schwerer, als man in den Anfangstagen dieses Forschungsgebietes angenommen hatte. Einerseits, so Serre, würden ein Muster oder eine mathematische Darstellung eines Objektes gebraucht, damit der Rechner es erkennt. Erst dann kann er es von anderen Objekten unterscheiden. Die Darstellung im Rechner muss jedoch flexibel genug sein, um die verschiedensten Arten eines Objektes (beispielsweise mehrere Autotypen) erkennen zu können – egal wie "anders" es ist und von welchem Winkel, welcher Position und unter welchen Lichtverhältnissen es aufgenommen wurde.

"Es muss eben möglich sein, ein Objekt im Blickfeld zu identifizieren, egal wo genau es sich befindet und wie groß es ist", sagt Serre. Setze man dabei jedoch nur auf die Analyse heller und dunkler Pixel, lägen zwei Porträts verschiedener Personen näher beieinander als Aufnahmen der gleichen Person, die aus mehreren Winkeln geschossen wurden.

Die erfolgreichste Methode, dieses und andere Probleme zu umgehen, ist daher ein lernender Algorithmus, den man mit zahlreichen Bildern trainieren kann. Ermittelt wird dabei, welche Bestandteile all diesen Aufnahmen gemeinsam ist – vier Räder, die auf einer Straße ausgerichtet sind, wären dann beispielsweise ein Auto. Serre und sein Team-Kollege Tomaso Poggio glauben, dass das Gehirn des Menschen ähnlich vorgeht, aber sich verschiedener Ebenen bedient. Die erste Ebene erkennt die einfacheren Eigenschaften eines Objektes (z. B. die Kanten), während höher liegende Ebenen schließlich zusammenarbeiten, um einen Gesamteindruck eines Objektes zu formen.

  1 2 >> | 5225 Zeichen

Druck | Leserbrief | Weitermailen | Heft bestellen | Forum (1 Kommentare)