Menü

Google lässt Roboter spielerisch neue Fähigkeiten lernen

Forscher von Google und der Uni Berkeley haben ein Verfahren entwickelt, mit dem Robotermodelle spielerisch Bewegungsabläufe ausprobieren und dadurch neue Fähigkeiten entwickeln, die ihre Konstrukteure nicht geplant haben.

Google-Android-Roboter

Ein Robotermodell probiert sich an neuen Bewegungsabläufen.

(Bild: Google Brain / UC Berkeley)

Ingenieure bringen Robotern mittlerweile verblüffende Dinge bei – vom galanten Türenoffnen für Kollegen bis hin zum Springen über Hindernisse, vorwärts wie rückwärts. Wissenschaftler beim Google-Brain-Projekt und an der UC Berkeley haben nun eine Methode vorgestellt, Robotermodelle ohne konkretes Ziel quasi spielerisch neue Fähigkeiten entwickeln zu lassen. Ihr Vorgehen stellen die Mitarbeiter in ihrer Arbeit "Diversity is all you need" vor (auch als PDF-Datei), wie TechRepublic berichtet.

Die vier Forscher ließen simulierte Robotermodelle (einen Vierbeiner, eine Ameise, einen Hüpfer sowie Pendel und Auto) neue Bewegungsmuster wie Gehen, Springen oder variables Beschleunigen ausprobieren, ohne ihnen ein bestimmtes Ziel vorzugeben, das Verhalten zu überwachen oder durch Belohnungen zu bestärken. Dabei kamen diese Modelle zu ähnlichen Ergebnisse wie andere simulierte Roboter, denen ein Ziel vorgegeben war.

Anzeige

So lernte das vierbeinige Wesen ("half cheetah", eigentlich ein Gepard) etwa durch diverse Versuche vorwärts und rückwärts zu laufen, sich auf dem Hinterteil sitzend fortzubewegen oder mit der Nase voran über den Boden zu robben. Die Ameise wiederum lernte unter anderem, durch Springen von der Stelle zu kommen.

Auf ihrer Projektseite zeigen die Forscher zahlreiche animierte Bilder, auf denen die Bewegungsexperimente der Robotermodelle zu sehen sind. Die Auswertung ergab dann, welche davon als nützliche Fähigkeit weiter erlernt werden sollten.

Beim Reinforcement Learning (etwa: bestärkendes Lernen), einer speziellen Disziplin des maschinellen Lernens, versucht man einen Agenten durch Anreize – etwa Belohnungen – in Richtung eines Zieles zu lenken. Die Besonderheit des Google-Projekts liegt darin, dass die Agenten ohne Belohnungen selbstständig lernten und dadurch neue Fähigkeiten entwickelten, die sich im Ergebnis kaum von denen der per Belohnung angeleiteten Agenten unterschieden.

Die Entdeckung des Projekts ist bedeutsam, weil das Erlernen einer neuen Fähigkeit ohne Vorgabe und Bestärkung einem System innerhalb des maschinellen Lernens neue Handkungsspielräume eröffnet. Ein Agent kann sich dadurch spontan neuen Aufgaben widmen, die seine Erbauer vorab nicht wissen oder sich vorstellen müssen.

(tiw)
Anzeige