Optimal entscheiden in einer bekannten Umwelt
In diesem Abschnitt wird beschrieben, wie eine optimale Handlungsstrategie für eine Umwelt mit einer endlichen Anzahl von Zuständen und Aktionsmöglichkeiten berechnet werden kann. Sie lernen den Unterschied zwischen einer off-Policy und einer on-Policy Be
- PDF / 9,333,783 Bytes
- 184 Pages / 476.22 x 680.315 pts Page_size
- 9 Downloads / 183 Views
Reinforcement Learning Aktuelle Ansätze verstehen – mit Beispielen in Java und Greenfoot
Reinforcement Learning
Uwe Lorenz
Reinforcement Learning Aktuelle Ansätze verstehen – mit Beispielen in Java und Greenfoot
Dipl. Inf. Uwe Lorenz Neckargemünd, Baden-Württemberg Deutschland
ISBN 978-3-662-61650-5 ISBN 978-3-662-61651-2 (eBook) https://doi.org/10.1007/978-3-662-61651-2 Die Deutsche Nationalbibliothek verzeichnet diese Publikation in der Deutschen Nationalbibliografie; detaillierte bibliografische Daten sind im Internet über http://dnb.d-nb.de abrufbar. © Springer-Verlag GmbH Deutschland, ein Teil von Springer Nature 2020 Das Werk einschließlich aller seiner Teile ist urheberrechtlich geschützt. Jede Verwertung, die nicht ausdrücklich vom Urheberrechtsgesetz zugelassen ist, bedarf der vorherigen Zustimmung des Verlags. Das gilt insbesondere für Vervielfältigungen, Bearbeitungen, Übersetzungen, Mikroverfilmungen und die Einspeicherung und Verarbeitung in elektronischen Systemen. Die Wiedergabe von allgemein beschreibenden Bezeichnungen, Marken, Unternehmensnamen etc. in diesem Werk bedeutet nicht, dass diese frei durch jedermann benutzt werden dürfen. Die Berechtigung zur Benutzung unterliegt, auch ohne gesonderten Hinweis hierzu, den Regeln des Markenrechts. Die Rechte des jeweiligen Zeicheninhabers sind zu beachten. Der Verlag, die Autoren und die Herausgeber gehen davon aus, dass die Angaben und Informationen in diesem Werk zum Zeitpunkt der Veröffentlichung vollständig und korrekt sind. Weder der Verlag, noch die Autoren oder die Herausgeber übernehmen, ausdrücklich oder implizit, Gewähr für den Inhalt des Werkes, etwaige Fehler oder Äußerungen. Der Verlag bleibt im Hinblick auf geografische Zuordnungen und Gebietsbezeichnungen in veröffentlichten Karten und Institutionsadressen neutral. Planung: Martin Börger Springer Vieweg ist ein Imprint der eingetragenen Gesellschaft Springer-Verlag GmbH, DE und ist ein Teil von Springer Nature. Die Anschrift der Gesellschaft ist: Heidelberger Platz 3, 14197 Berlin, Germany
Vorwort
„Man muss die Dinge so einfach wie möglich machen. Aber nicht einfacher.“ (A.Einstein).
Ziel des Buches ist es, nicht nur eine lose Auflistung gängiger Ansätze des „Reinforcement Learnings“ zu liefern, sondern auch einen inhaltlich zusammenhängenden Überblick über dieses faszinierende Gebiet der künstlichen Intelligenz zu geben. Gleichzeitig sollen die Konzepte einem möglichst großen Leserkreis aufgeschlossen und z. B. auch Impulse für den Schulunterricht ermöglicht werden. Dieser scheinbare Widerspruch löst sich auf, wenn es gelingt, einen umfassenden Grundriss zu zeichnen, der zwar die wesentlichen Ideen beinhaltet, dabei aber von komplexeren „Real-World“-Anwendungen absieht. Jeder Lehrer weiß, dass eine vereinfachte Darstellung nicht falsch ist, wenn sie innere Konsistenz und Zweckmäßigkeit aufweist. Im Sinne der „Spirale des Begreifens“, kann ein solcher Grundriss als natürlicher Ausgangspunkt für tiefere Einsichten, weitere Untersuchungen und praktische Anwendungen -auch mit Ho
Data Loading...