Überhöhte Hoffnungen an Deep Learning im autonomen Fahren

Klartext: Der Frosch, der Auto fährt

Bei Comma.ai kann man sich an einem Open-Source-Projekt zum autonomen Fahren beteiligen. Das ist cool. Gründer George Hotz prahlt gern: "We are going to win autonomous cars." Das ist weniger cool. Ich verbreite etwas Ernüchterung

Lesezeit: 4 Min.
In Pocket speichern
Druckansicht Kommentare lesen 197 Beiträge
8 Bilder
Von
Inhaltsverzeichnis

Im Maschinenlernen zeigen unsere Streams täglich eine große Schere. Einerseits können Forscher offenbar automatische Schwulometer bauen, die jede menschliche Einschätzung weit übertreffen. Gruselig. Andererseits fallen die humanoiden Roboter bei der Darpa Robotics Challenge beim Aussteigen aus dem Auto auf ihren blechernen Hintern und brauchen 10 Minuten, um eine unverriegelte Tür zu öffnen. Tragikomisch.

Für eine Hintergrundartikel-Recherche schaue ich mir gerade die Fortschritte in der Technik künstlicher neuronaler Netze an, die meist unter "Deep Learning" zusammengefasst werden. Als ich das Thema neuronale Netze um die Jahrtausendwende nachschlug, waren viele Dinge einfach nicht sinnvoll machbar, die heute selbstverständlich geworden sind. Wenn ich Dinge wie HBOs hotdog/nohotdog oder Adrian Rosebrocks davon inspirierten Weihnachtsmanndetektor sehe, kann ich zudem sehr gut verstehen, warum viele Hoffnungsvolle der festen Überzeugung sind, dass allgemeine KI-Systeme nur noch eine Frage der Zeit sind, und man vielleicht gar nicht so tolle Hardware braucht. HBOs Hotdog-Dings läuft lokal auf dem Smartphone, Rosebrocks Netz in 30 Hz (also 30 fps Echtzeiterkennung) auf einem Raspberry Pi 3.

Eine Ampel ist kein Weihnachtsmann

Wir müssen aber sehen, dass diese Anwendungen eine extrem enge Fragestellung bearbeiten. Ist dieses Bild ein Hotdog/Weihnachtsmann (Ja/Nein)? Die gemachten Fehler sind ebenfalls egal, da es um nichts geht außer den Spaß beziehungsweise das Maschinenlernenlernen. Warum läuft der Weihnachtsmanndetektor so schnell auf so kleiner Hardware? Weil er jedes Frame auf die 28x28 Pixel knautscht, die traditionell zur Darstellung einzelner Buchstaben im Maschinenlernen verwendet werden. Weil er nur eine einzige Frage beantworten muss. Das alles schaut im Auto ganz anders aus.

Autofahren liegt näher am Darpa-Challenger, der die Tür nicht aufkriegt als an der Hotdog-Spaß-App, weil ein im Kontext Straßenverkehr allgemein gültiges Verhalten abstrahiert werden muss. Der Roboter soll an der Ampel halten, weil es eine Ampel ist und nicht, weil er genau diese Ampel auswendig gelernt hat. Dazu kommt, dass die Hauptleistung vor jeder Situationseinschätzung sowieso für visuelle Mustererkennung draufgeht. Dazu kommen die Sicherheitsanforderungen. Ein Automat, der Autotempi fährt, muss strengen Anforderungen der Ausfallsicherheit entsprechen (Google: "ASIL-D"). Die kostet Ressourcen. Das einfachste Beispiel ist Lockstepping: Prozessorkerne arbeiten im Gleichschritt dieselbe Aufgabenfolge ab, damit eventuelle Fehler sofort auffallen. Die parallel laufenden Kerne stehen damit nicht mehr als Nutzleistung zur Verfügung. Und wenn in einer Art verkürzter Kernfusionskonstante die Avantgardisten immer von einer Serienreife autonomer Autos "nächstes Jahr" sprechen, frage ich mich, ob man nicht doch ein bisschen mehr braucht als Mobilprozessoren.

Der KI-Forscher Ian Goodfellow schrieb in seinem Buch über Deep Learning, es sei ja kein Wunder, dass die frühen künstlichen neuronalen Netze kaum etwas konnten: Sie hatten weniger Neuronen als ein Bandwurm. Selbst die größeren aktuell funktionalen Netze auf großen Rechenzentrums-Clustern bewegen sich in der Größenordnung von Fröschen, wenn wir die in der Praxis ja doch recht unterschiedlich funktionierenden Systeme in Bezug setzen wollen. Faszinierende Tiere! Wussten Sie, dass Froschhirne Quaklaute zählen? Aber ich möchte die abgewandelte Flugzeugautomatisierungsfrage stellen: Würden Sie einen elektronischen Frosch Ihr Auto fahren lassen? Ihr Kind? Vielleicht bis wahrscheinlich muss es im komplexen Stadtverkehr doch etwas sein, das wesentlich ausgefuchster klassifizieren kann als "quak-quak-quak-quak? Ok, du bist der Vater meiner tausend Kinder!".