c't 21/2019
S. 26
Hintergrund
KI zum Anfassen: Ausprobieren
Aufmacherbild

Klicken, herumspielen, staunen

KI mit dem Browser ausprobieren

Machine Learning ist schon an erstaunlich vielen Stellen im Einsatz. Am beeindruckendsten lässt sich das Potenzial der Technik erfahren, wenn sie kreativ wird und Bilder malt, Texte verfasst oder Musik komponiert.

Man muss sich immer wieder vergegenwärtigen, wieviele Anwendungen Machine Learning in welch kurzer Zeit substanziell verbessert oder komplett neu ermöglicht hat, denn beim Einsatz der Technik üben sich viele Unternehmen in Understatement. Siri erkennt gesprochene Sprache und Facebook erkennt Gesichter, ohne dass Apple und Co. groß auf die dahinterliegende Technik hinweisen würden. Kann der Anwender bei diesen Beispielen noch konkret nachvollziehen, dass eine neue, ziemliche mächtige Technik am Werk ist, arbeitet Machine Learning an anderen Stellen völlig unsichtbar als Infrastrukturangebot im Hintergrund. Ridesharing-Anbieter wie Uber oder Lyft etwa steuern ihre Flotte durch KI-Systeme. Netflix berechnet seine Empfehlungen aus den Nutzungshistorien des einzelnen Anwenders und denen der gesamten Nutzerschaft.

Ausgerechnet der Uralt-Dienst E-Mail war einer der Vorreiter für den Siegeszug von lernenden Verfahren auf dem Desktop. Ältere Semester werden sich noch erinnern, dass man vor ein paar Jahren „intelligente“ Spam-Filter noch von Hand trainieren musste, indem man ihnen explizit beibrachte, welche E-Mail Spam ist und welche nicht. Auch heute noch sortieren lernende Spam-Filter Werbemails aus, allerdings in aller Regel unsichtbar beim Provider, oft ohne dass der Anwender eingreifen muss.

KI erobert sehr schnell neue, auch kritische Lebensbereiche. So kann man bei Robo-Tradern seine Ersparnisse von Software-Robotern verwalten lassen. Der Weg zu einem „Doktor KI“ ist zwar noch weit. Mit der Smartphone-App Ada erhält man aber schon einen ersten Eindruck. Die App hilft beim Einordnen gesundheitlicher Symptome. Bei einzelnen Aufgaben haben sich KI-Anwendungen zudem bereits als zuverlässiger gezeigt als spezialisierte Ärzte, etwa bei der Diagnose bestimmter Krebsformen. Beim Predictive Policing schließlich steuert eine KI, wo die Polizei verstärkt Streife fährt.

Die Liste ließe sich beliebig mit Beispielen aus den verschiedensten Bereichen erweitern. In diesem Heft auf Seite 84 finden Sie zum Beispiel eine KI-gesteuerte Zahnbürste. Wir beschränken uns in der Folge auf eine Auswahl von Beispielen aus kreativen Feldern, weil sie am besten erlebbar machen, was KI alles kann. Zudem lassen sich viele der Beispiele im Browser ausprobieren.

Erkennen und klassifizieren

Die Königsdisziplin des Deep Learning ist die Mustererkennung. Und dafür gibt es reichlich Beispiele im Netz, mit denen Jedermann experimentieren kann. Für How old do I look? etwa hat Microsoft ein neuronales Netz darauf programmiert, zu schätzen, wie alt Personen auf Bildern sein mögen (alle Links siehe ct.de/yze3). Sie können die Anwendung mit vorgegebenen Fotos ausprobieren oder ein eigenes hochladen. Die Ergebnisse sind nicht immer perfekt, aber es macht Spaß, sich mit Freunden schätzen zu lassen.

KI kann nicht nur das Alter veranschlagen, sondern auch Emotionen erkennen. Auch dafür gibt es eine Demo-Website von Microsoft. Die KI liefert zu einem hochgeladenen Bild einen kompletten Datensatz zurück, aus dem sich unter anderem ablesen lässt, welche Haarfarbe und welches Geschlecht das System erkannt hat.

Zusätzlich gibt die KI für die Emotionen anger (Zorn), contempt (Verachtung), disgust (Ekel), fear (Angst), happiness (Freude), neutral, sadness (Traurigkeit) und surprise (Überraschtheit) einen Wert zwischen 0 und 1 aus, die einer Einschätzung entsprechen, wieviel von der jeweiligen Emotion zu sehen ist: Ein Wert nahe Null bedeutet wenig, ein Wert nahe 1 viel. Auch die Emotionserkennung können Sie mit eigenen Bildern ausprobieren.

Bei IBM Watson könne Sie sogar einen allgemeinen Erkenner auf Ihre Bilder loslassen. Er versucht zum Beispiel zu bestimmen, was eine abgebildete Person macht, ob das Bild draußen oder drinnen aufgenommen wurde und um was für eine Gegend oder einen Raum es sich handeln könnte. Eine Peperonipizza erkannte er in unseren Experimenten nicht nur allgemein als Pizza, sondern nannte auch den genauen Typ.

Von Gekritzel bis Van Gogh

Bei Googles Quick, Draw! testet man spielerisch die Erkennungsleistung eines neuronalen Netzwerks – und trainiert es zugleich. Der Besucher erhält die Aufgabe, mit der Maus nacheinander sechs kleine Skizzen von Objekten anzufertigen, die die Website zufällig vorgibt. Nur jeweils 20 Sekunden Zeit erhält er dafür.

Die KI versucht dabei, zu erraten, was das Gekritzel sein soll. Ist sie sich hinreichend sicher, bricht sie auch schon vor den zwanzig Sekunden ab. Nebenbei füllt der Besucher mit diesem Spiel die öffentlich zugängliche weltweit größte Datenbank für Zeichnungen.

Aus ein paar mit der Maus hindilletierten Punkten, Linien und Flächen zaubert Adobes KI Gaugan annähernd fotorealistische Landschaften.

KI kann auch selber malen [1]. Das lässt sich bei deepart.io oder Dreamscope ausprobieren. Mit einer Technik namens Stiltransfer übertragen diese Sites die grafische Machart eines Bildes auf ein anderes. So lässt sich zum Beispiel einem beliebigen Portrait oder Landschaftsbild ein Look geben, als sei es von Vincent Van Gogh gemalt worden. Stiltransfer ist mittlerweile schon im Mainstream angekommen: Es gibt etliche Apps für iOS und Android.

Auf die Spitze bei der Kreativität treibt es derzeit Nvidia. Der Grafikkartenhersteller hat sein neuronales Netz Gaugan darauf trainiert, aus sehr groben Skizzen annähernd fotorealistische Landschaften zu generieren. In einem interaktiven Editor malt der Besucher nur die groben Umrisse einer Landschaft – nach einem Klick kreiert Gaugan sie in Fotoqualität.

Die kreativen Fähigkeiten von KI haben auch eine potenziell gefährliche Seite. Die zeigt sich auf der Website, die Which Face is real fragt, also „Welches Gesicht ist echt?“ Zwei vermeintliche Fotos von Gesichtern stellt es zur Wahl, von denen eines einen echten Menschen zeigt. Das andere dagegen gibt es nicht in der Realität.

Ein neuronales Netzwerk hat es geschaffen: Ein bemerkenswertes Beispiel für die Kunstfertigkeit maschinellen Lernens, denn es ist für den Besucher wirklich nicht immer einfach, das falsche Gesicht zu identifizieren. Gleichzeitig soll die Website Besucher auch für die Missbrauchsmöglichkeiten von KI sensibilisieren und zeigen, wie einfach damit gefälschte Identitäten erzeugt werden können.

Fälschen lassen sich nicht nur statische Bilder. Wer Fake News verbreiten will, kann mittlerweile per KI Politikern in Ton und Bewegtbild falsche Aussagen in den Mund legen – Deep Fake werden solche fabrizierten Videodateien genannt. Die Ergebnisse sind für Unbedarfte oft nicht erkennbar. Glücklicherweise gibt es (noch) keinen einfach zu bedienenden Editor für Deep Fakes. Unter ct.de/yze3 finden Sie aber eine Auswahl von Beispielvideos, die eindrucksvoll zeigen, wie gut sich mit Deep Fakes Videos fälschen lassen.

Textmaschinen

Einige KI-Anwendungen können sehr gut texten. Etliche Medien veröffentlichen zum Beispiel automatisch generierte Artikel, die sich von denen eines Redakteurs nicht mehr unterscheiden lassen – etwa bei Wettervorhersagen, Börsennotizen und bei Sportberichten.

Davon kann man sich zum Beispiel bei Retresco einen Eindruck verschaffen. Der Anbieter stellt Textgeneratoren für verschiedene Websites bereit. Auf seiner Homepage demonstriert er die Möglichkeiten am Beispiel von Fußball-Spielberichten für die erste Liga. Haben Sie sich einen Spielbericht anfertigen lassen, probieren Sie den Button „Neu generieren“ aus: Das Programm spuckt zum selben Spiel eine völlig neue Zusammenfassung aus.

Mensch oder Maschine: Das ist die Frage bei Bot or not. Die Website präsentiert ein Gedicht und die Aufgabe für den Besucher lautet, zu erraten, ob das Werk von einem Menschen oder einer Software verfasst wurde. Der KI-Ingenieur Adam King hat mit Talk to Transformer eine KI veröffentlicht, die mehrere Absätze lange englischsprachige Artikel generiert, wenn man ihr ein oder zwei Sätze vorgibt.

Wie von einem Menschen geschriebene Fußball-Spielberichte: kein Problem für eine KI.

Musikmacher

Zum 334. Geburtstag des Komponisten Johann Sebastian Bach am 21. März 2019 hat sich Google ein ganz besonderes Doodle einfallen lassen. Mit dieser auch heute noch abrufbaren interaktiven Anwendung namens Zu Ehren von Johann Sebastian Bach „komponieren“ Besucher Melodien im Stile des Meisters. Sie geben dabei die Noten für eine Stimme vor. Die Anwendung harmonisiert sie mit weiteren Stimmen im Stile Bachs. Dazu wurde die Anwendung mit mehr als 300 Werken trainiert.

Für ein weiteres Experiment, The Infinite Drum Machine, hat Google einen Drum Sequencer aus tausenden von Alltagsgeräuschen gebaut. Diese Geräusche sind in einer riesigen zweidimensionalen Punktewolke angeordnet, aus der sich der Musiker bedient. Als Besonderheit kommt dabei nicht wie bei fast allen anderen aktuellen KI-Anwendungen Deep Learning zum Einsatz; die Matrix ist statt dessen mit der Methode „t-Distributed Stochastic Neighbor Embedding (t-SNE)“ nach akustischer Ähnlichkeit sortiert. Ein anderes sehr witziges Experiment, Giorgio Cam, versucht, Objekte mit der PC-Kamera zu erkennen und macht daraus dann Musik mit Schnipseln aus Giorgio Moroders Werken.

Der Algorithmus von Mubert, einer für Android und iOS verfügbaren App, erzeugt endlose Musik-Streams bestimmter Genres wie House oder Ambient oder für bestimmte Gelegenheiten (work, study, etc.). Der Player auf der Website hat zwar einen im Vergleich zur App eingeschränkten Funktionsumfang, gibt aber einen guten Eindruck von Muberts Potenzial.

KI spielt heute auch bei den Musik-Profis eine immer wichtigere Rolle. So können KI-Filter auf Knopfdruck ein Schlagzeug aus einem Gesamtmix entfernen. Mit Yamahas Software-Synthesizer Vocaloid kann man sogar künstlichen Gesang erzeugen, bei dem man Stimme, Text, Melodie und Betonung beliebig anpassen kann [2]. Mittlerweile gibt es etliche Stücke, bei deren Entstehung KI eine Rolle gespielt hat. Kostproben gefällig? Unsere Kollegin Jennifer Lepies aus der Redaktion der Technology Review hat eine Reihe von Tracks und Alben zusammengestellt.

Mit Googles Doodle zum Geburtstag von Johann Sebastian gibt der Nutzer nur die (schwarzen) Noten für die erste Stimme vor; die restlichen drei stammen aus einer KI.

Spiele und mehr

Schach, Go, Super Mario, Dota 2, StarCraft 2, Quake 3, zuletzt sogar Poker: Bei vielen Brett- und Computerspielen brillieren KI-Anwendungen und stechen menschliche Gegner aus. Das hat auch damit zu tun, dass Spiele oft ein sehr kleines, überschaubares Regelwerk haben, das sich Spiele-KIs mitunter nur durch Beobachtung selbst beibringen konnten. Ausprobieren lassen sich die meisten der siegreichen KI-Anwendungen nicht. Allerdings gibt es etliche Videos der jeweiligen Siege, siehe ct.de/yze3.

Sollten Sie von den hier vorgestellten Beispielen noch nicht genug haben: Schauen Sie auf den Websites der großen Tech-Unternehmen um. Alleine bei Google finden Sie Dutzende weitere Experimente. (jo@ct.de)

Kommentieren