Optimal entscheiden in einer bekannten Umwelt

In diesem Abschnitt wird beschrieben, wie eine optimale Handlungsstrategie für eine Umwelt mit einer endlichen Anzahl von Zuständen und Aktionsmöglichkeiten berechnet werden kann. Sie lernen den Unterschied zwischen einer off-Policy und einer on-Policy Be

PDF / 9,333,783 Bytes
184 Pages / 476.22 x 680.315 pts Page_size
9 Downloads / 307 Views

DOWNLOAD

REPORT

Reinforcement Learning Aktuelle Ansätze verstehen – mit Beispielen in Java und Greenfoot

Reinforcement Learning

Uwe Lorenz

Reinforcement Learning Aktuelle Ansätze verstehen – mit Beispielen in Java und Greenfoot

Dipl. Inf. Uwe Lorenz Neckargemünd, Baden-Württemberg Deutschland

ISBN 978-3-662-61650-5 ISBN 978-3-662-61651-2 (eBook) https://doi.org/10.1007/978-3-662-61651-2 Die Deutsche Nationalbibliothek verzeichnet diese Publikation in der Deutschen Nationalbibliografie; detaillierte bibliografische Daten sind im Internet über http://dnb.d-nb.de abrufbar. © Springer-Verlag GmbH Deutschland, ein Teil von Springer Nature 2020 Das Werk einschließlich aller seiner Teile ist urheberrechtlich geschützt. Jede Verwertung, die nicht ausdrücklich vom Urheberrechtsgesetz zugelassen ist, bedarf der vorherigen Zustimmung des Verlags. Das gilt insbesondere für Vervielfältigungen, Bearbeitungen, Übersetzungen, Mikroverfilmungen und die Einspeicherung und Verarbeitung in elektronischen Systemen. Die Wiedergabe von allgemein beschreibenden Bezeichnungen, Marken, Unternehmensnamen etc. in diesem Werk bedeutet nicht, dass diese frei durch jedermann benutzt werden dürfen. Die Berechtigung zur Benutzung unterliegt, auch ohne gesonderten Hinweis hierzu, den Regeln des Markenrechts. Die Rechte des jeweiligen Zeicheninhabers sind zu beachten. Der Verlag, die Autoren und die Herausgeber gehen davon aus, dass die Angaben und Informationen in diesem Werk zum Zeitpunkt der Veröffentlichung vollständig und korrekt sind. Weder der Verlag, noch die Autoren oder die Herausgeber übernehmen, ausdrücklich oder implizit, Gewähr für den Inhalt des Werkes, etwaige Fehler oder Äußerungen. Der Verlag bleibt im Hinblick auf geografische Zuordnungen und Gebietsbezeichnungen in veröffentlichten Karten und Institutionsadressen neutral. Planung: Martin Börger Springer Vieweg ist ein Imprint der eingetragenen Gesellschaft Springer-Verlag GmbH, DE und ist ein Teil von Springer Nature. Die Anschrift der Gesellschaft ist: Heidelberger Platz 3, 14197 Berlin, Germany

Vorwort

„Man muss die Dinge so einfach wie möglich machen. Aber nicht einfacher.“ (A.Einstein).

Ziel des Buches ist es, nicht nur eine lose Auflistung gängiger Ansätze des „Reinforcement Learnings“ zu liefern, sondern auch einen inhaltlich zusammenhängenden Überblick über dieses faszinierende Gebiet der künstlichen Intelligenz zu geben. Gleichzeitig sollen die Konzepte einem möglichst großen Leserkreis aufgeschlossen und z. B. auch Impulse für den Schulunterricht ermöglicht werden. Dieser scheinbare Widerspruch löst sich auf, wenn es gelingt, einen umfassenden Grundriss zu zeichnen, der zwar die wesentlichen Ideen beinhaltet, dabei aber von komplexeren „Real-World“-Anwendungen absieht. Jeder Lehrer weiß, dass eine vereinfachte Darstellung nicht falsch ist, wenn sie innere Konsistenz und Zweckmäßigkeit aufweist. Im Sinne der „Spirale des Begreifens“, kann ein solcher Grundriss als natürlicher Ausgangspunkt für tiefere Einsichten, weitere Untersuchungen und praktische Anwendungen -auch mit Ho

Data Loading...

Optimal entscheiden in einer bekannten Umwelt

Recommend Documents

Entscheiden und Lernen in einer unbekannten Umwelt

Entscheiden

ENTSCHEIDEN

Umwelt

Umwelt

Entscheiden

UMWELT

Entscheiden bei Unsicherheit

Chemie in Technik und Umwelt

Sicherheit und Umwelt

Umwelt- und Klimapolitik

Simulieren und Entscheiden Entscheidungsmodellierung, Modellierungse