Menü
Technology Review

Neuronales Netz von Google übertrifft Menschen bei der Ortsbestimmung von Fotos

Um herauszufinden, wo ein Foto aufgenommen wurde, hilft normalerweise breites Wissen über die Welt. Noch besser allerdings lässt sich diese Aufgabe mit großen Datenmengen zum Üben meistern, wie Google-Forscher jetzt gezeigt haben.

Von
vorlesen Drucken Kommentare lesen 129 Beiträge
Neuronales Netz übertrifft Menschen bei der Ortsbestimmung von Fotos

Spezialisten für maschinelles Sehen bei Google haben ein tiefes neuronales Netz programmiert, das treffsicherer als Menschen herausfinden kann, wo ein bestimmtes Bild aufgenommen wurde. Von 50 Spielrunden bei Geoguessr entschied das PlaNet genannte System 28 für sich, und der Median seines Fehlers bei der Ortsbestimmung lag bei 1131,7 Kilometern gegenüber 2320,75 Kilometern bei den Menschen. Das berichtet Technology Review online in "Neuronales Netz mit 'übermenschlichen' Fähigkeiten".

Menschen nutzen für die Ortsbestimmung auf ihrem Allgemeinwissen beruhende Hinweise wie Schilder, Vegetation oder Architekturstile, mit denen Computer nicht arbeiten können. Stattdessen unterteilten die Google-Forscher die Welt zunächst in 26.000 Quadrate unterschiedlicher Größe, die sich nach der Zahl der im jeweiligen Gebiet aufgenommenen Fotos richtete. Für große Städte, in denen häufig fotografiert wird, ist das Netz also enger als für abgelegenere Regionen, aus denen weniger Fotos kommen. Anschließend wurde das neuronale Netz anhand von 91 Millionen mit Geodaten versehenen Fotos trainiert.

Um die Genauigkeit ihres Systems zu testen, fütterten die Forscher es dann mit 2,3 Millionen Flickr-Bilder, die Geodaten enthielten. Die Ergebnisse sind bemerkenswert. "PlaNet ist in der Lage, 3,6 Prozent der Bilder straßengenau und 10,1 Prozent stadtgenau zu lokalisieren", schreiben sie. In 28,4 Prozent der Fälle fand das System das Land der Aufnahme heraus und bei 48,0 Prozent den Kontinent. Anders als bei anderen Ansätzen funktionierte dies zudem mit relativ wenig Speicher, nämlich 377 Megabyte.

Mehr dazu bei Technology Review online:

(sma)