Entscheiden und Lernen in einer unbekannten Umwelt

In diesem Kapitel wird beschrieben, wie der Agent ein unbekanntes Umweltsystem, in das er gesetzt wurde erkunden kann. Dabei entdeckt er Zustände mit Belohnungen und muss zum einen die Pfade zu diesen Zielen optimieren („Performanz verbessern“), zum ander

  • PDF / 9,333,783 Bytes
  • 184 Pages / 476.22 x 680.315 pts Page_size
  • 91 Downloads / 199 Views

DOWNLOAD

REPORT


Reinforcement Learning Aktuelle Ansätze verstehen – mit Beispielen in Java und Greenfoot

Reinforcement Learning

Uwe Lorenz

Reinforcement Learning Aktuelle Ansätze verstehen – mit Beispielen in Java und Greenfoot

Dipl. Inf. Uwe Lorenz Neckargemünd, Baden-Württemberg Deutschland

ISBN 978-3-662-61650-5 ISBN 978-3-662-61651-2  (eBook) https://doi.org/10.1007/978-3-662-61651-2 Die Deutsche Nationalbibliothek verzeichnet diese Publikation in der Deutschen Nationalbibliografie; detaillierte bibliografische Daten sind im Internet über http://dnb.d-nb.de abrufbar. © Springer-Verlag GmbH Deutschland, ein Teil von Springer Nature 2020 Das Werk einschließlich aller seiner Teile ist urheberrechtlich geschützt. Jede Verwertung, die nicht ausdrücklich vom Urheberrechtsgesetz zugelassen ist, bedarf der vorherigen Zustimmung des Verlags. Das gilt insbesondere für Vervielfältigungen, Bearbeitungen, Übersetzungen, Mikroverfilmungen und die Einspeicherung und Verarbeitung in elektronischen Systemen. Die Wiedergabe von allgemein beschreibenden Bezeichnungen, Marken, Unternehmensnamen etc. in diesem Werk bedeutet nicht, dass diese frei durch jedermann benutzt werden dürfen. Die Berechtigung zur Benutzung unterliegt, auch ohne gesonderten Hinweis hierzu, den Regeln des Markenrechts. Die Rechte des jeweiligen Zeicheninhabers sind zu beachten. Der Verlag, die Autoren und die Herausgeber gehen davon aus, dass die Angaben und Informationen in diesem Werk zum Zeitpunkt der Veröffentlichung vollständig und korrekt sind. Weder der Verlag, noch die Autoren oder die Herausgeber übernehmen, ausdrücklich oder implizit, Gewähr für den Inhalt des Werkes, etwaige Fehler oder Äußerungen. Der Verlag bleibt im Hinblick auf geografische Zuordnungen und Gebietsbezeichnungen in veröffentlichten Karten und Institutionsadressen neutral. Planung: Martin Börger Springer Vieweg ist ein Imprint der eingetragenen Gesellschaft Springer-Verlag GmbH, DE und ist ein Teil von Springer Nature. Die Anschrift der Gesellschaft ist: Heidelberger Platz 3, 14197 Berlin, Germany

Vorwort

„Man muss die Dinge so einfach wie möglich machen. Aber nicht einfacher.“ (A.Einstein).

Ziel des Buches ist es, nicht nur eine lose Auflistung gängiger Ansätze des „Reinforcement Learnings“ zu liefern, sondern auch einen inhaltlich zusammenhängenden Überblick über dieses faszinierende Gebiet der künstlichen Intelligenz zu geben. Gleichzeitig sollen die Konzepte einem möglichst großen Leserkreis aufgeschlossen und z. B. auch Impulse für den Schulunterricht ermöglicht werden. Dieser scheinbare Widerspruch löst sich auf, wenn es gelingt, einen umfassenden Grundriss zu zeichnen, der zwar die wesentlichen Ideen beinhaltet, dabei aber von komplexeren „Real-World“-Anwendungen absieht. Jeder Lehrer weiß, dass eine vereinfachte Darstellung nicht falsch ist, wenn sie innere Konsistenz und Zweckmäßigkeit aufweist. Im Sinne der „Spirale des Begreifens“, kann ein solcher Grundriss als natürlicher Ausgangspunkt für tiefere Einsichten, weitere Untersuchungen und praktische Anwendungen -auch mit Ho