Wie unternehmensweite Datenstrategien zu erfolgreichen KI-Projekten führen

Erfolgreiche KI-Anwendungen benötigen eine hohe Datenqualität, die wiederum setzt eine klare Datenstrategie voraus. So entwickeln Unternehmen eine solche.

Lesezeit: 15 Min.
In Pocket speichern
vorlesen Druckansicht Kommentare lesen
Von
  • Martin Szugat
Inhaltsverzeichnis

Künstliche Intelligenz (KI) ist ein großes Versprechen – besonders in Zeiten von Corona. In der neuen VUKA-Welt, die geprägt ist von Volatilität, Unsicherheit, Komplexität und Ambivalenz, soll KI die verloren gegangene Sicherheit, Vorhersagbarkeit und Eindeutigkeit wiederbringen. KI soll das veränderte Konsumentenverhalten vorhersagen, also heute schon wissen, was wir morgen kaufen werden. KI soll helfen, gebrochene Lieferketten zu reparieren, indem sie Angebot und Nachfrage exakt prognostiziert. Und sie soll Covid-19 erkennen können – auf Röntgenaufnahmen, auf CT-Scans oder gar in Audioaufnahmen, wenn Betroffene nur atmen oder husten. Doch was ist aus vielen hoffnungsvoll gestarteten KI-Projekten geworden?

Nichts. Zumindest nicht aus den 62 medizinischen KI-Projekten, die in einer Studie in Nature Machine Intelligence evaluiert wurden. Keine der untersuchten Lösungen hatte es bis zum Ende der Studie in die klinische Anwendung geschafft. Die Gründe hierfür waren laut den Autoren "methodische Mängel und/oder zugrunde liegende Verzerrungen" in den Daten – auch als Bias bekannt.

Mehr zum Thema Machine Learning

Ein Beispiel für einen solchen Bias beschreibt einer der Autoren der Studie in Technology Review. Um eine KI zur Covid-19-Diagnose zu trainieren, wurden Datensätze aus mehreren Datenquellen kombiniert. Als Trainingsdaten für Nicht-Covid-Fälle nutzten viele KI-Entwickler unwissentlich einen Datensatz von Röntgenaufnahmen des Brustkorbs ausschließlich von Kindern. Die KI lernte so, anhand von Röntgenaufnahmen Kinder zu erkennen – statt Covid-19. Dass dieser Bias in den Daten nicht beim Testen der KI erkannt wurde, liegt an handwerklichen Fehlern und an der Art und Weise, wie maschinelles Lernen funktioniert.