Facebook verbessert Bildbeschreibungen für Menschen mit Seh-Beeinträchtigung

Um seine Bilderkennung zu verbessern, ließ Facebook eine KI aus Instagram-Fotos und Hashtags lernen. Davon sollen auch Sehbeeinträchtigte profitieren.

Lesezeit: 1 Min.
In Pocket speichern
vorlesen Druckansicht Kommentare lesen 3 Beiträge

(Bild: sitthiphong/Shutterstock.com)

Von
  • Tanja Dieckmann

Das soziale Netzwerk Facebook hat eine KI mit Milliarden von öffentlichen Instagram-Fotos und den dazugehörigen Hashtags gefüttert. Daraus habe die KI gelernt, in den Bildern etwa zehnmal mehr Konzepte automatisiert zu erkennen, als sie es zuvor konnte, erklärte Facebook. Durch die verbesserte Bilderkennung könnten Menschen mit Seh-Beeinträchtigung nun mehr Informationen über Bilder erhalten.

Auch über die räumliche Position und die relative Größe von Elementen in einem Foto könnten so automatisiert Aussagen getroffen werden, führte Facebook aus. So ließe sich zum Beispiel erkennen, welche Personen im Fokus eines Bildes stehen und welche verteilt am Rand stehen.

Facebook-User, die als Alternative zur grafischen Ausgabe eine Screenreader-Software verwenden, könnten sich nun die automatisch generierten Informationen über Fotos vorlesen lassen. Dabei beschränkt sich Facebook zunächst auf die Informationen, die die KI für wesentlich hält. Der Benutzer solle aber auf Wunsch detailliertere Informationen zum Bild bekommen: Zum Beispiel darüber, wie viele Elemente die KI in dem Bild erkannt hat, in welchem Teil des Bildes sich welche Elemente befinden und in welche Kategorien die einzelnen Elemente fallen (zum Beispiel Menschen oder Aktivitäten).

Bevor Facebook seine KI aus Instagram-Bildern und den dazugehörigen Hashtags hat lernen lassen, wurden neuronale Netzwerke mit Bildern trainiert, die von Menschen extra dafür ausgezeichnet wurden. Das habe einen großen Zeit- und Arbeitsaufwand bedeutet, der sich mit der Verwendung von durch Hashtags markierten Fotos einsparen ließe. In den Lernprozess gingen nach dem Blogbeitrag Facebooks Fotos aus allen Regionen der Welt ein und Hashtags wurden in viele verschiedene Sprachen übersetzt. So könnten nun mehr Konzepte, zum Beispiel Aktivitäten, Sehenswürdigkeiten, verschiedene Typen von Nahrungsmitteln und Selfies, erkannt werden.

(tdi)