Aktionenlernen mit Selbstorganisierenden Karten und Reinforcement Learning

Flentge, Felix

Aktionenlernen mit Selbstorganisierenden Karten und Reinforcement Learning

Files

890.pdf (1.94 MB)

Date issued

2005

Authors

Flentge, Felix

License

InC-1.0
https://rightsstatements.org/vocab/InC/1.0/

Item

Dissertation

Open Access

Abstract

Die vorliegende Arbeit beschäftigt sich mit der Entwicklung eines Funktionsapproximators und dessen Verwendung in Verfahren zum Lernen von diskreten und kontinuierlichen Aktionen: 1. Ein allgemeiner Funktionsapproximator – Locally Weighted Interpolating Growing Neural Gas (LWIGNG) – wird auf Basis eines Wachsenden Neuralen Gases (GNG) entwickelt. Die topologische Nachbarschaft in der Neuronenstruktur wird verwendet, um zwischen benachbarten Neuronen zu interpolieren und durch lokale Gewichtung die Approximation zu berechnen. Die Leistungsfähigkeit des Ansatzes, insbesondere in Hinsicht auf sich verändernde Zielfunktionen und sich verändernde Eingabeverteilungen, wird in verschiedenen Experimenten unter Beweis gestellt. 2. Zum Lernen diskreter Aktionen wird das LWIGNG-Verfahren mit Q-Learning zur Q-LWIGNG-Methode verbunden. Dafür muss der zugrunde liegende GNG-Algorithmus abgeändert werden, da die Eingabedaten beim Aktionenlernen eine bestimmte Reihenfolge haben. Q-LWIGNG erzielt sehr gute Ergebnisse beim Stabbalance- und beim Mountain-Car-Problem und gute Ergebnisse beim Acrobot-Problem. 3. Zum Lernen kontinuierlicher Aktionen wird ein REINFORCE-Algorithmus mit LWIGNG zur ReinforceGNG-Methode verbunden. Dabei wird eine Actor-Critic-Architektur eingesetzt, um aus zeitverzögerten Belohnungen zu lernen. LWIGNG approximiert sowohl die Zustands-Wertefunktion als auch die Politik, die in Form von situationsabhängigen Parametern einer Normalverteilung repräsentiert wird. ReinforceGNG wird erfolgreich zum Lernen von Bewegungen für einen simulierten 2-rädrigen Roboter eingesetzt, der einen rollenden Ball unter bestimmten Bedingungen abfangen soll.

DOI

http://doi.org/10.25358/openscience-1942

URI

https://openscience.ub.uni-mainz.de/handle/20.500.12030/1944

Collections

JGU-Hochschulschriften

Full item page

Aktionenlernen mit Selbstorganisierenden Karten und Reinforcement Learning

Files

Date issued

Authors

Editors

Journal Title

Journal ISSN

Volume Title

Publisher

License

Abstract

DOI

Description

Keywords

Citation

URI

Relationships

Collections