Die Anwendung von Machine Learning zur Gewinnung von Erkenntnissen aus Dokumentenstapeln
„Document Understanding“ ist das tiefe Verständnis eines Textes. Im Kern geht es um die Konvertierung von unstrukturierten Daten in Informationen und für Unternehmen gleichermaßen um die die Einhaltung von Governance- und Compliance-Richtlinien. Zum Einsa
- PDF / 701,594 Bytes
- 21 Pages / 476.22 x 680.315 pts Page_size
- 81 Downloads / 199 Views
15
Stefan Ebener
Inhaltsverzeichnis 15.1 Kompakte Einführung – Eine Dokumentenverarbeitung ist kein Dokumentenverständnis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15.2 Machine Learning als Schlüsselkomponente der modernen Erkenntnisgewinnung aus Dokumentenstapeln. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15.2.1 Regelbasierende Systeme im Vergleich zu Machine Learning . . . . . . . . . . . . . . 15.2.2 Transfer Learning als Grundlage der agilen Modellentwicklung . . . . . . . . . . . . 15.2.3 Begutachtung verschiedener Methoden zum Dokumentenverständnis. . . . . . . . 15.3 Workflow zur Gewinnung von Erkenntnissen aus Dokumentenstapeln . . . . . . . . . . . . . . 15.4 Fazit und Ausblick. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Literatur. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
276 277 278 279 281 285 289 291
Zusammenfassung
„Document Understanding“ ist das tiefe Verständnis eines Textes. Im Kern geht es um die Konvertierung von unstrukturierten Daten in Informationen und für Unternehmen gleichermaßen um die die Einhaltung von Governance- und Compliance-Richtlinien. Zum Einsatz kommt zumeist eine Sammlung von verschiedenen Methoden, zu denen unter anderem die Document Classification oder auch die Entity Extraction gehören. Viele Ansätze beruhen auf regelbasierten Systemen respektive auf statistischen Verfahren.
S. Ebener (*) FOM Hochschule, Köln, Deutschland E-Mail: [email protected] © Springer Fachmedien Wiesbaden GmbH, ein Teil von Springer Nature 2020 R. Buchkremer et al. (Hrsg.), Künstliche Intelligenz in Wirtschaft & Gesellschaft, FOM-Edition, https://doi.org/10.1007/978-3-658-29550-9_15
275
276
S. Ebener
Der Einsatz von Machine Learning zur massenhaften Erschließung unstrukturierter Dokumente eröffnet neue Wege, um unter anderem Beziehungen zwischen Dokumenten sichtbar zu machen. ML ermöglicht Vorhersagen zur Dokumentenklassifizierung oder etwa die Extraktion von Wissen aus Textpassagen, Grafiken oder Feldern jenseits einfacher Mustererkennung. ML stellt Möglichkeiten einer semantischen Suche über Dokumente hinweg zur Verfügung und legt den Grundstein für erweiterte Analysen beispielsweise der Anomalieerkennung.
15.1 Kompakte Einführung – Eine Dokumentenverarbeitung ist kein Dokumentenverständnis Eine Dokumentenerfassung und Dokumentenverarbeitung gehört heute zu jeder modernen Unternehmung, um geschäftsrelevante Unterlagen sicher, transparent und vor allem automatisch zu verarbeiten. Noch vor wenigen Jahren lag der Fokus vieler dieser Systeme auf einer strukturierten Ablage und der Archivierung. Sogenannte Dokumentenmanagementsysteme (DMS) waren weit verbreitet und hatten das Hauptaugenmerk darauf, wie Datensätze gespeichert, zusammengestellt, nachverfolgt und verwaltet werde
Data Loading...