3D und Big Data

Microsoft TechFest 2013

Trends & News | News

Beim jährlich stattfindenden TechFest führen Microsofts Forschungsabteilungen den Kollegen, Partnern und einigen Journalisten vor, wie die nahe Zukunft aussehen könnte.

Rick Rashid ist der Chef von 850 promovierten Wissenschaftlern und rund 1000 Gastforschern, die gerade an ihrem Doktor arbeiten. Der Leiter von Microsoft Research (MSR) zeigte sich im Gespräch mit c’t selbstbewusst: „Die meisten anderen machen fortgeschrittene Produktentwicklung. Wir definieren den Stand der Technik in den Computerwissenschaften.“ Rashids Leute sind an 13 Standorten weltweit tätig – von Bangalore in Indien über Redmond in den USA bis zu den Advanced Technology Labs Europe in Aachen.

Seine Mitarbeiter sucht Rashid hauptsächlich an Unis und kaum bei anderen Technikfirmen. Zwar stellen die rund 850 fest angestellten Forscher von MSR weniger als ein Prozent aller Mitarbeiter von Microsoft, sie bringen aber ein Viertel aller Patente der Firma hervor. Dabei handle es sich in der Regel um die grundlegenden und damit wichtigeren Patente, betont Rashid.

Hinter der Forschung steht der Transfer der Technologien in konkrete Produkte erst an zweiter Stelle. Deren Entwickler sind nicht Teil von MSR, holen sich dort aber Ideen und greifen auf Erfahrungen der Forschungsabteilung zurück. Auch ohne vorgezeichneten Transfer-Pfad scheint das System zu funktionieren: In fast jedem Microsoft-Produkt stecken Forschungsergebnisse aus dem eigenen Haus.

Manche Entwicklungen gibt es frei im Netz zum Herunterladen, etwa das Kinect for Windows Developer Toolkit. Andere werden kommerziell an Dritte lizenziert, zum Beispiel die bei MSR entwickelte Technik für die Analyse von Straßenverkehrsströmen, aus der sich mit Hilfe maschineller Lernverfahren Staus vorhersagen lassen (siehe c’t-Link). Die Firma Inrix, gegründet von ehemaligen Microsoft-Mitarbeitern, nutzt das Verfahren für Navigationslösungen und um Verkehrsplaner zu unterstützen.

Raumeindruck

Eine der berühmtesten Ideen von Microsoft Research ist jene Sensorenphalanx, die als Kinect bekannt wurde. Seit ihrer Marktreife im November 2010 wurden mehr als 24 Millionen Stück verkauft, die meisten als Steuerung für die Xbox 360. Mit der Kinect hat Microsoft jedoch mehr vor als spielen: Die Sensoren eignen sich auch für den Einsatz als 3D-Scanner. Das hauseigene Projekt dafür heißt KinectFusion und ist in der gerade veröffentlichten Version 1.7 des Kinect Toolkit enthalten. Dabei werden über projizierte Infrarotlichtmuster 3D-Daten von Objekten gewonnen.

Das soll gut genug funktionieren, um chirurgische Eingriffe zu unterstützen. Beim TechFest wurde eine Machbarkeitsstudie mit einem handelsüblichen Tablet gezeigt, an das eine Kinect-Leiste mit Klebeband befestigt war. Damit soll vom bereits betäubten Patienten im Handumdrehen ein 3D-Bild erzeugt werden, anstatt ihn auf dem Operationstisch aufwendig zu vermessen. Anschließend passt das Tablet vorhandene 3D-Daten, etwa aus einer Magnetresonanztomografie, in das Modell ein. So soll der Chirurg live sehen, ob er seine Werkzeuge richtig ansetzt.

Die Kinect kann auch genutzt werden, um die Position und die Bewegungen einer Person vor einem sehr großen Display zu bestimmen. Bedienoberflächen und Darstellungen auf Bildschirmen im Format zwischen normaler Schultafel und über 10 Meter Bildschirmdiagonale müssen auf die Position des Anwenders reagieren, etwa indem sie in seiner Nähe dynamisch mehr Details einblenden als in entfernten Bereichen. Auch die Menüs und Werkzeuge sollten nicht mehr am Rand kleben, sondern immer in Griffweite sein.

Microsoft geht davon aus, dass die Preise für solch große Bildschirme in absehbarer Zeit auf einen Bruchteil sinken werden. Eine Rolle bei der Interaktion mit großen Displays sollen auch Windows Phones spielen, etwa als Fernbedienung. Dateien könnten mit einer Fingerbewegung vom Handy auf den großen Schirm geschnippt und Notizen virtuell an die Display-Wand geheftet werden.

An interaktiven Schreibtischen wird ebenfalls gearbeitet, mit einem Bildschirm als Tischplatte. Wirklich neu ist diese Idee nicht, Microsoft selbst hat mit seinen zwei Generationen von Multitouch-Tischen namens Surface bereits ähnliche Produkte auf den Markt gebracht, die sich im Team per Touch bedienen lassen und die auch darauf abgelegte Gegenstände per QR-Code erkennen.

Big Data

Der Verarbeitung und Darstellung großer Datenmengen in Echtzeit widmeten sich weitere Demonstrationen auf dem TechFest. So könnten Windows Phones als Partywanzen kurze Tonaufnahmen in Clubs und Discos machen und an einen Server schicken. Der errechnet daraus, wie viele Personen vor Ort sind und welche Musik gespielt wird. Das Ergebnis sind Echtzeit-Metadaten über die Stimmung in diversen Tanzschuppen.

Ein anderes Team erforscht, wie sich eine bestimmte Nachricht oder ein Link im sozialen Web verbreitet, etwa auf Twitter. Besonders von Interesse sind dabei Informationen, die sich viral ausbreiten – wer „infiziert“ wird, verbreitet sie bei seinen sozialen Kontakten im Netz. Dabei zeigt sich, dass nicht jedes virale Ereignis große Personenkreise erreicht; umgekehrt braucht es nicht unbedingt virale Methoden, um eine Information gezielt weithin bekannt zu machen.

In Aachen wird gemeinsam mit Kollegen aus Cambridge ein System entwickelt, das Produktionsprozesse beobachtet und dabei selbst lernt, anhand der Sensordaten Fehlproduktionen zu erkennen – und zwar in Echtzeit. Das könnte Fabriken viel Zeit und Geld sparen. Bisher kommen für solche Zwecke für den jeweiligen Kunden maßgefertigte Systeme zum Einsatz, doch MSR strebt nach einer Software von der Stange auf Basis von Infer.NET, dem hauseigenen Framework für maschinelles Lernen. Ein Prototyp läuft bereits bei Infineon und konnte die Ausfallrate bei der Herstellung von Computerchips von 15 auf 2 Prozent senken.

Bereits in Office 2013 enthaltene Funktionen wie Flash Fill oder die Erkennung von Daten-Ausreißern sind ebenfalls bei MSR ersonnen wurden. Nun stellt das „Data Explorer Preview Plug-in“ dem Excel-Anwender automatisch aufbereitete Datenquellen zur Verfügung (Download siehe c’t-Link). Über das Plug-in kann man die Daten aus 200 Millionen Tabellen aus dem Internet aus einem Verzeichnis auswählen und direkt in Excel weiterbearbeiten. Man braucht keine Suchmaschine mehr zu bemühen und muss idealerweise nichts mehr umformatieren. Je nach Inhalt eines Excel-Dokuments könnte der Data Explorer sogar selbst passende Daten vorschlagen.

Selbstlernend

Besondere Aufmerksamkeit genießen bei Microsoft selbstlernende Systeme, die zum Teil sogar ganz ohne Bedienschnittstelle auskommen. Im Gebäude 99 auf dem Redmond-Campus verrichtet ein Kinect-inspiriertes System einen von Star Trek bekannten Dienst: Es beobachtet das Verhalten von Personen und erkennt mit sehr hoher Genauigkeit, ob jemand den Aufzug benutzen möchte. Der wird dann gerufen, bevor die Person den Knopf drückt. Wer hingegen nur im Eingangsbereich herumsteht, auf jemanden wartet oder sich unterhält, der bringt den virtuellen Liftboy nicht auf Trab.

Nach längerer Stagnation soll es auch wieder bei der Spracherkennung Fortschritte geben – wie die aber genau erzielt wurden, war beim TechFest nicht zu erfahren.

Auch an der Ausgabe von Sprache feilen die Microsoft-Forscher – ihre Technik kann inzwischen personalisierte künstliche Stimmen sprechen lassen. Sie klingen zwar noch etwas emotionslos, ahmen aber die Diktion eines individuellen Menschen nach. Mit der dazwischengeschalteten Übersetzungssoftware von Bing konnte Rashid Ende 2012 ein chinesisches Publikum begeistern: Seine englischen Sätze erklangen mit geringer Verzögerung auf Mandarin, und zwar mit seiner eigenen Stimme (Video siehe c’t-Link). Manche Chinesen sollen dabei vor Rührung geweint haben – das erzählt man sich zumindest in Redmond. (pek)

Artikel kostenlos herunterladen

weiterführende Links

Anzeige
Anzeige