Linguistische Datenverarbeitung Ein Lehrbuch

  • PDF / 19,962,003 Bytes
  • 199 Pages / 430.87 x 649.13 pts Page_size
  • 24 Downloads / 209 Views

DOWNLOAD

REPORT


Winfiied Lenders· Gerd WilIee

Linguistische I>atenverarbeitung Ein Lehrbuch

Westdeutscher Verlag

CIP-Kurztitelaufnahme der Deutschen Bibliothek Lenders, Winfried. Linguistische Datenverarbeitung: e. Lehrbuch I Winfried Lenders; Gerd Willee. - Opladen: Westdeutscher Verlag, 1986.

NE: Willee, Gerd:

Die Drucklegung erfolgte mit Unterstiitzung des Instituts fiir Angewandte Mathematik und des SFB 72 an der Universitiit Bonn

Aile Rechte vorbehalten © 1986 Westdeutscher Verlag GmbH, Opladen Das Werk einschlieBlich a1ler seiner Teile ist urheberrechtlich geschUtzt. Jede Verwertung auBerhalb der engen Grenzen des Urheberrechtsgesetzes ist ohne Zustimmung des Verlags unzuliissig und strafbar. Das gilt insbesondere fUr Vervie1fiiltigungen, Obersetzungen, Mikroverfilmungen und die Einspeicherung und Verarbeitung in elektronischen Systemen. Umschlaggestaltung: Horst Dieter BUrkle, Darmstadt ISBN-13: 978-3-531-11745-4 001: 10.1007/978-3-322-87622-5

e-ISBN-13: 978-3-322-87622-5

INHALT

o.

Einleitung

1.

Kommunikationstechnologie und Sprache 1.1 Die Rolle der natiirlichen Sprache in der vermittelten Kommunikation 1.2 Darstellungsformen von Sprache und Text 1.3 Informationserschlie6ung 1.4 Maschinelle Sprachiibersetzung (MU) 1.4.1 Die heutige Bedeutung der MU 1.4.2 Hauptprobleme der MU 1.4.3 Ablauf maschineller Ubersetzungsprozesse 1.5 Natiirlichsprachliche Kommunikation mit Computern

2.

3.

Linguistische Grundlagen 2.1 Linguistik - eine empirische Wissenschaft 2.1.1 Der Korpusgedanke 2.1.2 Prozeduren 2.2 LDV als explizite Beschreibung von Sprache 2.2.1 Das Problem der sprachlichen Einheit 2.2.2 Strukturbeschreibung 2.3 Sprache und Wissen Verarbeitungstechniken 3.1 Algorithmen 3.1.1 Begriffs bestimmung 3.1.2 Darstellungsformen von Algorithmen 3.2 Sprachliche Zeichen und Codes 3.2.1 Erkennen von Sprache allgemein 3.2.2 Erkennen von Sprache durch Computer 3.2.3 Schriftsysteme 3.2.4 Bina.rcodes 3.2.5 Optische Datenerfassung durch Computer 3.3 Sortieren 3.4 Suchen und Abbilden

9

13 13 17 19 22 22 22 23 28 31 31 31 33 35 36

43 47 51 51 51 52 57 57 58 59 59 62 63

64

5

3.5 Isolierung von sprachlichen Einheiten 3.5.1 Ebene der Grapheme 3.5.2 Ebene der Morpheme 3.5.3

Ebene der Satze und Satzteile

3.5.4 Ebene der Silben 3.6 Darstellung von Information: Listen, Baume, Netze 3.6.1 Einfache Listen

4.

66 66

67 70 71 73 73

3.6.2 3.6.3

Strukturierte Listen und Baume

74

Netze

76

3.6.4

Darstellung und Verarbeitung von Listen

78

Typische Algorithmen

81

4.1 Texterfassung und -segmentierung 4.1.1 Zum Begriff der Kodierung

81 81

4.1.2 4.1.3

Kodierungssysteme Verarbeitung von Kodierungen

82 85

4.1.4

Segmentierung

86

4.2 Register, Index, Konkordanz 4.2.1 Wortformenregister 4.2.2

Index und Konkordanz

Problematik ausschlie8lich wortformenbasierter Register und Indizes 4.3 Morphologische Analyse 4.3.1 Kombination und Dekombination

88

90 90

4.2.3

4.3.2

Lemmatisierung 4.3.2.1 Voraussetzungen

4.3.2.2 Verfahren 4.4 Deskriptive Grammatiken

5. 6

93 94 95 97 97 98 100

4.4.1

Allgemeine Grundlagen

100

4.4.2