Datenstruktur und Notation
Man gehe von einem binären Klassifikationsproblem y i ϵ {0,1} aus, bei welchem dem Nutzer ein Lerndatensatz vom Umfang n L zur Verfügung steht. Die Klassenzuordnung aller Beobachtungen des Lerndatensatzes werden als bekannt vorausgesetzt. Zusätzlich exist
- PDF / 1,854,269 Bytes
- 242 Pages / 419.52 x 595.2 pts Page_size
- 27 Downloads / 176 Views
Mit „BestMasters“ zeichnet Springer die besten Masterarbeiten aus, die an renommierten Hochschulen in Deutschland, Österreich und der Schweiz entstanden sind. Die mit Höchstnote ausgezeichneten Arbeiten wurden durch Gutachter zur Veröffentlichung empfohlen und behandeln aktuelle Themen aus unterschiedlichen Fachgebieten der Naturwissenschaften, Psychologie, Technik und Wirtschaftswissenschaften. Die Reihe wendet sich an Praktiker und Wissenschaftler gleichermaßen und soll insbesondere auch Nachwuchswissenschaftlern Orientierung geben.
Dominik Koch
Verbesserung von Klassifikationsverfahren Informationsgehalt der k-Nächsten-Nachbarn nutzen
Dominik Koch München, Deutschland
BestMasters ISBN 978-3-658-11475-6 ISBN 978-3-658-11476-3 (eBook) DOI 10.1007/978-3-658-11476-3 Die Deutsche Nationalbibliothek verzeichnet diese Publikation in der Deutschen Nationalbibliogra¿e; detaillierte bibliogra¿sche Daten sind im Internet über http://dnb.d-nb.de abrufbar. Springer Spektrum © Springer Fachmedien Wiesbaden 2016 Das Werk einschließlich aller seiner Teile ist urheberrechtlich geschützt. Jede Verwertung, die nicht ausdrücklich vom Urheberrechtsgesetz zugelassen ist, bedarf der vorherigen Zustimmung des Verlags. Das gilt insbesondere für Vervielfältigungen, Bearbeitungen, Übersetzungen, Mikrover¿lmungen und die Einspeicherung und Verarbeitung in elektronischen Systemen. Die Wiedergabe von Gebrauchsnamen, Handelsnamen, Warenbezeichnungen usw. in diesem Werk berechtigt auch ohne besondere Kennzeichnung nicht zu der Annahme, dass solche Namen im Sinne der Warenzeichen- und Markenschutz-Gesetzgebung als frei zu betrachten wären und daher von jedermann benutzt werden dürften. Der Verlag, die Autoren und die Herausgeber gehen davon aus, dass die Angaben und Informationen in diesem Werk zum Zeitpunkt der Veröffentlichung vollständig und korrekt sind. Weder der Verlag noch die Autoren oder die Herausgeber übernehmen, ausdrücklich oder implizit, Gewähr für den Inhalt des Werkes, etwaige Fehler oder Äußerungen. Gedruckt auf säurefreiem und chlorfrei gebleichtem Papier Springer Fachmedien Wiesbaden ist Teil der Fachverlagsgruppe Springer Science+Business Media (www.springer.com)
Vorwort
Das von Fix und Hodges entwickelte k-N¨achste Nachbarn Verfahren ist eines der simpelsten und zugleich intuitivsten Klassifikationsverfahren. Nichtsdestotrotz ist es in den meisten F¨allen in der Lage, ziemlich gute Klassifikationsergebnisse zu liefern. Diesen Informationsgehalt der N¨achsten Nachbarn kann man sich zu Nutze machen, um bereits etablierte Verfahren zu verbessern. In diesem Buch werden die Auswirkungen der N¨achsten Nachbarn auf den Boosting-Ansatz, Lasso und Random Forest in Bezug auf bin¨are Klassifikationsprobleme behandelt. Die Informationen, die in den N¨achsten Nachbarn enthalten sind, werden den Klassifikationsverfahren zus¨atzlich zu den noch vorhandenen Kovariablen, in Form von Summen, zur Verf¨ugung gestellt. Durch diese Modifikation ist es m¨oglich, eine Verbesserung der Klassifikationsg¨ute zu erzielen. M¨unchen, im Dezember 201
Data Loading...