Warum 500 Millionen Menschen in China mit dieser KI sprechen

Seit es iFlytek gibt, kommunizieren viele Chinesen mit ihren Computern – und die verstehen sie sogar.

Lesezeit: 2 Min.
In Pocket speichern
vorlesen Druckansicht Kommentare lesen
Von

Wenn Gang Xu, ein 46-jähriger Pekinger, mit seinem kanadischen Mieter über Mietzahlungen oder Stromrechnungen kommunizieren muss, öffnet er eine App namens "iFlytek Input", tippt auf das Mikrofonsymbol und fängt an zu sprechen. Die Software wandelt seine chinesischen Sätze in englischen Text um und sendet sie an den Mieter – und umgekehrt. So entwickelt sich eine nahtlose Konversation. In China nutzen mehr als 500 Millionen Menschen diese App, um solche Sprachbarrieren zu überwinden – auch zu Sprechern anderer chinesischer Dialekte.

Oder um Textnachrichten während der Fahrt zu versenden. Gerichte transkribieren mit der iFlytek-Technologie lange Verhandlungen, Callcenter generieren automatisierte Antworten, und der Taxidienst Didi übermittelt damit Aufträge an seine Fahrer.

iFlytek ist ein chinesisches KI-Unternehmen, das Deep Learning bei Spracherkennung, Sprachverarbeitung, maschineller Übersetzung und Data Mining anwendet. Es ist derzeit rund zwölf Milliarden Dollar wert und hat eine Tochtergesellschaft in den USA gegründet, um in andere Sprachen zu expandieren. Die kostenlose App sammelt seit ihrer Einführung im Jahr 2010 Sprachdaten und macht die Anwendungen damit immer intelligenter. Über eine offene Plattform stellt iFlytek das gesammelte Wissen mehr als 400000 Entwicklern aus allen Branchen zur Verfügung.

Damit ändert sich in vielen Branchen die Art und Weise, wie Unternehmen mit ihren Kunden umgehen. Im August brachte iFlytek etwa einen Sprachassistenten für Autofahrer auf den Markt. Um sie nicht abzulenken, gibt es weder Bildschirm noch Tasten. Ist das Smartphone des Fahrers mit dem Internet verbunden, kann die App per Sprachbefehl Anrufe tätigen, Musik abspielen, navigieren oder nach Restaurants suchen. Später, wenn sich die Fahrer an die Sprachschnittstelle gewöhnt haben, könnte der Assistent beispielsweise auch Unterhaltungsangebote empfehlen, statt immer nur passiv Anfragen zu bearbeiten. So entstehen ganz neue Geschäftsmodelle.

Im Anhui Provincial Hospital zeigt sich bereits, wie Sprachtechnologie die Arbeit verändert. In der Lobby begrüßen zehn mit iFlytek-Technolo- gie ausgestattete Roboter die Besucher und entlasten damit die Empfangs-mitarbeiter. Die Patienten können den digitalen Assistenten sagen, was ihnen fehlt, und bekommen dann mitgeteilt, in welcher Abteilung ihnen geholfen werden kann. Auf Grundlage der seit Juni gesammelten Daten kamen die Bots auf eine Trefferquote von 84 Prozent. Auch die Ärzte verwenden dort eine mobile App von iFlytek, um Vitalparameter, eingenommene Medikamente und andere Patienteninformationen zu diktieren. Die App wandelt dann alles in schriftliche Aufzeichnungen um. Zum Einloggen nutzt sie die Stimme als fälschungssicheres Erkennungsmerkmal.

Eine wirklich fehlerlose Sprachverarbeitung bleibt jedoch eine ungeheure Herausforderung. Als Xu beispielsweise seinen Mieter fragen wollte, wann er von der Arbeit nach Hause kommt, um den Mietvertrag zu unterschreiben, machte die App daraus: "Wann gehen Sie heute zur Arbeit?" Das Missverständnis rührt daher, dass die KI zwar eine riesige Datenmenge nach einer passenden Antwort durchsuchen kann. Allerdings versteht sie nicht, was ihre eigene Antwort bedeutet. iFlyteks Antwort darauf ist bisher, so viele Daten wie möglich zu sammeln. Es wird spannend, wie weit sie damit kommen. (bsc)