Sprache für das Internet der Dinge

Das Start-up Wit.ai nutzt Crowdsourcing, um Spracherkennungsalgorithmen zu trainieren. So sollen Smartphones, Haushaltselektronik und sogar Drohnen aufs Wort gehorchen.

Lesezeit: 4 Min.
In Pocket speichern
vorlesen Druckansicht Kommentare lesen 1 Beitrag
Von
  • Rachel Metz

Das Start-up Wit.ai nutzt Crowdsourcing, um Spracherkennungsalgorithmen zu trainieren. So sollen Smartphones, Haushaltselektronik und sogar Drohnen aufs Wort gehorchen.

Wohl jeder von uns hat schon mal mit einem störrischen Haushaltsgerät geschimpft. Das US-amerikanische Start-up Wit.ai hat eine Cloud-Software entwickelt, mit der wir künftig Toaster oder Wecker steuern können. Die Technik ist vor allem für bildschirmlose Geräte sinnvoll.

Einfache Kommandos wie "Wecke mich morgen um sechs!" werden möglich. Der Befehl wird an die Witai-Server gesendet, analysiert und als strukturiertes Kommando zurück ans Gerät geschickt. Apple, Google und Amazon bieten ähnliche Dienste bereits an, aber für kleine Hersteller sind sie zu teuer. Noch reagiert die Plattform jedoch recht langsam und versteht bislang eigentlich nur Englisch.

Die Wit.ai-Routinen lassen sich in jede Art von Software einbinden – wie hier in eine sprachgesteuerte Karte.

(Bild: Wit.ai)

Grundlegendes Ziel von Wit.ai ist es, in absehbarer Zeit ein selbstlernendes System zu schaffen, das durch die Nutzer selbst verbessert wird. Die Wit.ai-Technik erlaubt auch, Sprachkommandos entgegenzunehmen, die nicht einmal ganz genau sein müssen, da das System Satz- und Bedeutungszusammenhänge versteht. Demnächst soll die Softwareplattform auch besser in anderen Sprachen wie Deutsch, Französisch, Spanisch, Italienisch und Schwedisch werden.

Wit.ai-Mitbegründer und Chef Alex Lebrun hofft, dass "jeder von der Technik" des Start-ups profitieren werde. Er denkt schon seit längerem über Spracherkennungsverfahren nach. So gründete und leitete er unter anderem VirtuOz, eine Firma, die über einen längeren Zeitraum an Siri-artigen Systemen für Kunden wie das Online-Auktionshaus eBay oder den Telekommunikationsriesen AT&T arbeitete. VirtuOz wurde 2012 vom Spracherkennungsspezialisten Nuance gekauft und operiert inzwischen unter dem Namen Nina Web.

Der Wit.ai-Code ist kompatibel zu zahlreichen Geräten, etwa dem iPhone von Apple.

(Bild: dpa, Christoph Dernbach)

Nick Mostowich, Student an der University of Waterloo im kanadischen Ontario, gehört zu den Entwicklern, die Wit.ai bereits einsetzen. Bei einem "Hackathon" im September, der an der Hochschule durchgeführt wurde, nutzten er und ein Team aus Mitstudierenden die Technik dazu, um einem Toaster und einem Mikrowellenofen Sprachkommandos beizubringen.

Es sei dabei möglich gewesen, schnell eine Reihe von Kommandos und Bedienzielen zu definieren, die sich dann mit einer Rezeptliste auf einem Cloud-Server kombinieren ließen. Nutzer konnten dann beispielsweise sagen, dass sie ein bisschen Speck erwärmen wollten – und die Mikrowelle schaltete gleich auf die richtige Leistungsstufe und Garzeit.

Auch Heimautomatisierungssysteme sind steuerbar.

(Bild: Philips)

Trotz solcher schneller Erfolge und positivem Feedback aus der Entwicklergemeinde müssen Wit.ai und Lebrun aber noch einige Probleme und Herausforderungen meistern, bis die Technik wirklich für alle Anwendungsfälle marktreif ist. Ähnlich wie Siri, Google Now und andere Konkurrenten, deren Haupttechnik auf Cloud-Server ausgelagert wurde, würde Wit.ai auch nicht ohne Internet-Verbindung funktionieren. Und es gibt noch immer Gelegenheiten, insbesondere im mobilen Betrieb, bei denen man der Nutzer ohne Netzversorgung ist – und die Spracherkennung würde dann plötzlich versagen.

Was die Erweiterung der Sprachunterstützung anbetrifft, hofft Lebrun auf zusätzliche Daten, die auch wieder Entwickler und Benutzer in das System einspeisen sollen. Geplant ist, dass Entwickler Wit.ai online einsetzen, die Spracherkennung weiter trainieren und die so erhaltenen Verbesserungen dann an andere Entwickler (und deren User) weiterreichen.

Denkbar ist auch, dass ein Grundwortschatz mitsamt wichtiger Kommandos in Form von herunterladbaren Dateien zur Verfügung gestellt wird. Dann könnte man diese auf ein Smartphone oder Tablet spielen, damit die Sprachsteuerung auch offline zumindest in Grundzügen funktioniert. Neue Befehle und per Crowdsourcing erhaltene Verbesserungen ließen sich dann einspielen, sobald wieder eine ausreichende Netzversorgung zur Verfügung steht. Damit hätte Wit.ai Siri, Google Now und Co. etwas voraus. (bsc)