KI-Algorithmus kann aus geparkten Autos auf die politische Haltung schließen

Straße in San Francisco. Bild: Google Street View

Mit Maschinensehen und -lernen können aus Google-Street-Views-Bildern demografische und sozioökonomische Merkmale der Bewohner von Stadtbezirken abgeleitet werden

Wissenschaftler konnten zeigen, dass man keine Erhebungen, Volkszählungen oder Befragungen mehr machen muss, um demografische Fakten zu eruieren. Ein Team von Computerwissenschaftlern vom Artificial Intelligence Laboratory an der Stanford University hat nun vorgeführt, wie sich aus Bildern von Google Street Views für Orte, Stadtteile und Straßen ableiten lassen soll, welches Einkommen und welchen Bildungsgrad die dort lebenden Menschen haben, welcher Ethnie sie angehören und wie sie wählen. Die Studie ist in den Proceedings of the National Academy of Sciences erschienen.

Anzeige

Alles hängt für die Wissenschaftler von den Autos ab, die Aufschluss über die Menschen geben sollen. Ist die Zahl der Limousinen in einer Stadt höher als die der Pick-ups, sollen die Menschen mit einer Wahrscheinlich von 88 Prozent für Demokraten stimmen, umgekehrt sollen sie mit einer Wahrscheinlichkeit von 82 Prozent für Republikaner stimmen.

Man müsse so keine teuren Umfragen wie den American Community Survey (ACS) durchführen, der jährlich 250 Millionen US-Dollar kostet und für den ausgewählte Bürger ausführlich befragt werden. Das sei nicht nur teuer und aufwändig, sondern es würden oft Jahre zwischen der Erhebung der Daten und der Veröffentlichung der Auswertungen vergehen. Daher werde eine automatische Datenanalyse praktischer, billiger und schneller, wenn digitale Bilder allgegenwärtig werden und sich die Technik des Maschinensehens weiter verbessert.

Die Wissenschaftler gehen davon aus, dass die Massenauswertung der Daten, die in dem Fall durch Kameras, aber auch durch Kommunikationsnetzwerke oder Soziale Netzwerke gesammelt werden, nicht nur legitim und im Interesse des Staates bzw. der Bürokratie ist, sondern eben Computermethoden es ermöglichen, demografische Trends "mit vielen Einzelheiten, in Echtzeit und zu einem Bruchteil der Kosten" zu analysieren. Das würde uns einem Überwachungsstaat noch näherbringen, zumal wenn Daten, die von verschiedenen Konzernen gesammelt, zusammengefügt werden.

Für ihre Studie, die "öffentlich verfügbare Bilder mit Maschinenlernen verbindet, wurden 50 Millionen Bilder, die von Google-Street-Views-Autos in den Straßen und Stadtvierteln von 200 Städten aufgenommen wurden, ausgewertet. Obgleich auf den Bildern nur das Äußere der Häuser, die Landschaft und die auf den Straßen befindlichen Autos abgebildet werden, können, so die Wissenschaftler, daraus demografische Variablen "mit hoher räumlicher Auflösung und reduzierter Zeitverzögerung" abgeschätzt werden, wobei allerdings die Google-Street-Views-Bilder unterschiedlich aktuell sind. Dazu kommt, dass viele Fahrzeuge in Garagen geparkt werden, also gar nicht sichtbar sind.

Die Wissenschaftler setzen voraus, dass Autos zu den "am meisten personalisierten Ausdruckformen der amerikanischen Kultur" gehören. Über 90 Prozent der Haushalte besitzen ein Auto, das bedingt durch verschiedene demografische Faktoren ausgewählt wurde: persönliche Präferenzen, Bedürfnisse des Haushalts und ökonomische Gegebenheiten. Man könne zusätzlich den Abstand zwischen Häusern, die Zahl der Stockwerke und die Art der Begrünung einbeziehen. Sie gehen davon aus, dass mit autonomen Fahrzeugen die Häufigkeit der Aufnahmen steigen wird, allerdings wird sich damit vermutlich auch die Nutzung der Fahrzeuge verändern, es werden nicht mehr so viele Fahrzeuge gekauft werden.

Mit Maschinensehen und Deep Learning mit einem Neuronalen Netzwerk (Convolutional Neural Networks) konnten nicht nur die Fahrzeuge, sondern auch deren Eigenschaften (Marke, Modell, Baujahr) durch maschinelles Lernen aufgrund von Expertenklassifizierungen identifiziert werden, wobei auch geringfügige Unterschiede erfasst wurden, die angeblich ungeübte Menschen nicht ausmachen könnten. Das entwickelte System kann 2657 Kategorien in 0,2 Sekunden pro Auto analysieren. Die korrekte Identifizierungsrate lag bei 95% für PKWs, 83% für Vans, 91% für Minivans. 86% für SUVs und 82% für Pickups. Die Musterung der 50 Millionen Bilder dauerte 2 Wochen.

Aus den klassifizierten Autos in jedem Viertel leiteten die Wissenschaftler demografische, sozioökonomische und politische Eigenschaften der Anwohner ab. Gezählt wurden nicht nur die einzelnen Fahrzeuge, sondern auch die Fahrzeugtypen, die Kaufpreise, der Benzinverbrauch und die Fahrzeugdichte. Um Erkenntnisse über die Bewohner abzuleiten, wurde Deep Learning mit Daten des American Community Survey und der Präsidentschaftswahl trainiert, um durch positive und negative Assoziationen zu bestimmten Autotypen ethnische Herkunft, Ausbildung, Einkommen und politische Haltung abzuschätzen. Asiaten würden beispielsweise vorwiegend Hondas und Toyotas fahren, Chrysler, Buick und Oldsmobil seien mit afroamerikanischen Vierteln verbunden, Weiße lieben hingegen Pickups, Volkswagen und Aston Martins. Wo Demokraten gewählt werden, überwiegen Limousinen, Pickups weisen auf republikanische Wähler hin.

Anzeige

Verglichen mit den Daten des American Community Survey und der Präsidentschaftswahl 2008 würden die Schätzungen, die aus den Autos in einem Viertel abgeleitet wurden, mit diesen gut übereinstimmen, allerdings wurde das System mit ACS-Daten gefüttert, auch wenn diese nicht direkt für die Schätzungen verwendet wurden. Die Schätzungen über den Bildungsstand fielen am schlechtesten aus. Man könne, so die Wissenschaftler, mit der von ihnen entwickelten Methode aktuelle demografische Informationen für viele amerikanische Städte automatisch auf Bezirks- und Zip-Code-Ebene erheben.

Das ist zunächst einmal etwas unheimlich, auch wenn nicht einzelne Menschen klassifiziert werden, schließlich werden so Stadtbezirke abgestuft nach bestimmten Kategorien der Mehrzahl ihrer Bewohner. Das könnte der Diskriminierung oder der Privilegierung von Menschen nach ihren Wohnorten dienen, die Miet- und Immobilienpreise beeinflussen und die Unterschiede zwischen Stadtvierteln und -bezirken weiter vertiefen, zumal wenn man beispielsweise nicht die Kriminalitätsstatistik einbezieht. Politiker werden solche Ergebnisse weiter nutzen, um die Wahlbezirke zu ihren Gunsten zu gestalten (Gerrymandering).

Die Wissenschaftler wollen freilich nur Positives in ihrem Ansatz sehen: "Das kann uns helfen zu verstehen, wie unsere Gesellschaft funktioniert, welche Dinge die Menschen brauchen und wie wir das Leben verbessern können. Es gibt ein großes Potential, die Technik des Maschinensehens auf konstruktive und gute Weise zu nutzen", sagt etwa Fei-Fei Li, die Direktorin des Stanford Artificial Intelligence Lab und des Stanford Vision Lab. (Florian Rötzer)

Anzeige