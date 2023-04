Inhaltsverzeichnis KI in Python: Mit neuronalen Netzen ein selbstlernendes System entwickeln Die CartPole-Umgebung Reinforcement Learning mit neuronalen Netzen Neuronales Netz mit Keras implementieren Neuronale Netze trainieren Q-Targets approximieren Exploration Die Trainingsschleife

Eine Künstliche Intelligenz (KI) wie ChatGPT nutzt neuronale Netze, um selbstständig auf eine Eingabe eine möglichst passende Antwort zu finden. Aber wie genau funktioniert so ein neuronales Netz? Und wie kann ein Nutzer es einsetzen, um ein eigenes selbstlernendes System zu entwickeln? In diesem Artikel erklären wir ausführlich die Konzepte von Deep-Q-Learning, bei dem man ein neuronales Netz einsetzt.

Wir zeigen, wie Deep-Q-Learning anhand des CartPole-Problems funktioniert: Die KI soll einen virtuellen Stab auf einem Karren balancieren und dabei in jeder Situation möglichst die optimale Aktion ausführen, damit der Stab nicht umfällt. Dabei erklären wir verschiedene Aspekte neuronaler Netze und wie man sie beim Deep-Q-Learning einsetzt. Außerdem beschreiben wir feste Q-Targets und Replay Buffer.

So sieht das CartPole-Problem aus: Ein Stab balanciert auf einem Wagen, den die KI steuern kann. Nun darf der Stab nicht umfallen.

Deep-Q-Learning ist dabei nicht nur für KI-Entwickler interessant, sondern auch für jeden, der verstehen möchte, wie Maschinen durch Trial-and-Error selbstlernende Systeme entwickeln können, die in der Lage sind, komplexe Aufgaben zu bewältigen. Da wir mit diesem Artikel tief in die Materie einsteigen, setzen wir Grundkenntnisse in Python und Machine Learning voraus. Wer noch eine kurze Auffrischung braucht, findet in unserem Einstiegsartikel zum Q-Learning einen einfachen Zugang zum Thema und die Erklärungen für viele der hier verwendeten Fachbegriffe.