Morphologie. bersicht. Ziel. Grundbegriffe Vollformen-Lexikon Morphologische Analyse mit DCGs

Ähnliche Dokumente
Motivation. Morphologie und Buchstabenbäume. Vollformen-Lexikon. Morphologie als "Wortgrammatik"

Parsing-Repetition. bersicht. Ziel

Die vorgestellten Chart-Parser haben bei bestimmten Grammatiken Probleme die Symbole der Grammatik dÿrfen nicht unterspezifiziert sein

Shift-Reduce-Parsing: Ein einfaches Bottom-Up-Verfahren Keller Shift- und Reduce-Schritte Vorgehen des Parsers Implementation in Prolog Probleme

Top-Down-Parsing: DCGs

Computerlinguistik I

Chart-Parsing. bersicht. Ziel. Motivation: Bisher vorgestellte Verfahren sind nicht effizient Grundidee des Chart-Parsing Datenstruktur

Korrekturprogramme. Von Emine Senol & Gihan S. El Hosami

Vertiefung der Grundlagen der Computerlinguistik. Semesterüberblick und Einführung zur Dependenz. Robert Zangenfeind

Sprachenhierarchie. bersicht. Zweck. Begriffe Hierarchie verschiedener Formalismen (unvollstšndig) Wo liegen die natÿrlichen Sprachen?

Ivana Daskalovska. Willkommen zur Übung Einführung in die Computerlinguistik. Morphologie. Sarah Bosch,

Einführung in die Computerlinguistik: Morphologie und Automaten I

Computerlinguistische Grundlagen. Jürgen Hermes Wintersemester 18/19 Sprachliche Informationsverarbeitung Institut für Linguistik Universität zu Köln

Vorlesung Morphologie Flexion

KASUS NUMERUS GENUS DEKLIN. MUSTER/PARA. -en Gen (Sg) Schw 10 / 26

SelektionsbeschrŠnkungen Ð 1

Lösungen zum Aufgabenblatt 4 Syntax natürlicher Sprachen

Minimalistische Morphologie

Lösungen zum Aufgabenblatt 4 Computerlinguistische Anwendungen

Lemmatisierung und Stemming in Suchmaschinen

Lemmatisierung und Stemming in Suchmaschinen

Einführung in die Computerlinguistik Morphologie (morphembasiert mit Transduktoren)

Computerlinguistische Grundlagen. Jürgen Hermes Wintersemester 17/18 Sprachliche Informationsverarbeitung Institut für Linguistik Universität zu Köln

Einführung in die Computerlinguistik Morphologie (1): morphembasierte Morphologie mit Transduktoren

Einführung in die Computerlinguistik. Morphologie II

Einführung in die Computerlinguistik Morphologie (1): morphembasierte Morphologie mit Transduktoren

Grammatiktheorie: Merkmale, Merkmalstrukturen, Unifikation, Unifikationsgrammatiken

Eine Erweiterung der kontextfreien Grammatiken: PATR-II

Künstliche Intelligenz

Einführung in die Computerlinguistik Morphologie (morphembasiert mit Transduktoren)


Programmiertechniken in der Computerlinguistik II

Einführung in unifikationsbasierte Grammatikformalismen

Lösungen zum Aufgabenblatt 3 Syntax natürlicher Sprachen

Einführung in die Computerlinguistik

Kontrolle. bersicht. Ziel. Alle Lšsungen fÿr ein Ziel erhalten. Negation Disjunktion SuchbŠume stutzen: Cut

Nikolaus Schpak-Dolt. Einführung in die Morphologie des Spanischen

Arbeitsweise des vorgestellten Tokenizers verstehen nicht: Auswendiglernen dieses Prolog-Programms. Wissen, dass das Problem nicht ganz trivial ist

Natürlichsprachliche Systeme I Materialien zur Vorlesung

Einführung in die Linguistik. Morphologie: Lösung

Centrum für Informations- und Sprachverarbeitung Uni München Repetitorium ZP Sommersemester 09. Morphologie. Alla Shashkina

Einführung in die französische Morphologie

Morphologie. 1. Flexion und Derivation 2. Analyse mittels lexikalischer Regeln

Semantik und Pragmatik

Merkmalstrukturen. bersicht. Ziel. Beispiele fÿr Merkmalstrukturen Koreferenz, Unifikation Sinn und Zweck Merkmalstrukturen in Prolog: GULP.

Grammatik des Standarddeutschen. Michael Schecker

R. Montague: ÈEnglish as a Formal LanguageÇ Vortrag von Sascha Brawer á 18. Januar 1995

Finite-State-Morphologie in XLE. Grammatikentwicklung, SS 2010

Parsing-EinfŸhrung Ð 1

1. Der Begriff Informatik 2. Syntax und Semantik von Programmiersprachen - 1 -

1. Der Begriff Informatik 2. Syntax und Semantik von Programmiersprachen - 1 -

Tutorium Prolog für Linguisten 12

Tokenisierung und Lemmatisierung in Suchmaschinen

Einführung in die Computerlinguistik

Lösungen zum Aufgabenblatt 9 Symbolisches Programmieren

Lexikoneinträge. Aufbau und Erstellung eines Lexikoneintrages

Ausgewählte Techniken der Maschinellen Übersetzung. Susanne J. Jekat ZHW Subject: MTZH

Tokenizer. Motivation. Zweck und Funktion eines Tokenizers. Ein einfacher Tokenizer. : These are words. [these, are, words,'.'] These are words.

FLP 1. Beispiele Vater, Mutter, Messer 2. Tag, Bach, Hand, Brot, Floß, Fluss 3. Leib, Wald, Kind, Haus 4. Lappen, Faden, Mädchen, Eltern 6

Einführung in die Computerlinguistik

(2) Die für Schüler schwer nachvollziehbare Aufgabenstellung des vergangenen Schuljahres aus dem Schulbuch, die die Lehrer damals ausgewählt hatten,

Grundkurs Linguistik Wintersemester 2014/15. Morphologie. Jens Fleischhauer & Anja Latrouite

Einführung in die französische Morphologie

Wortbildung und Wortbildungswandel

Probeklausur Syntax-Übung MA Linguistik

Grundlagen der Theoretischen Informatik

13. Übungsblatt

Vorwort Vorwort zur 3. Auflage

Syntax und Parsing. OS Einblicke in die Computerlinguistik. Philipp Rabe, 13IN-M

Die Erklärung für den Kontrast zwischen (1) und (2) liegt darin, dass das Relativpronomen auf die dritte Person festgelegt ist.

Morphologie II Gross, L 11, 12 Kessel/Reimann, S

Kasusmarkierung starker Nomen im Deutschen

Digitale Bearbeitung der textuellen Daten

Morphologie: Was bisher geschah. Morphologie IV. Morphologie. Überblick. Derivation

Valenz: Komplemente vs. Argumente

Grundkurs Linguistik - Morphologie

Seminar Ib Wort, Name, Begriff, Terminus Sommersemester Morphologie. Walther v.hahn. v.hahn Universität Hamburg

EinfŸhrung Ð 1. bersicht. Aufbau des Kurses Organisatorisches. Warum gerade Prolog? Ein erstes Prolog-Programm. bungsaufgaben Folienkopien

Status quo. Wortbildungslehre, Formenlehre. Wortbildung. Wortbildung(slehre)

Probeklausur: Einführung in die formale Grammatiktheorie

Paradigmen-lose, Halb-paradigmatische & Hybride Theorien von M

Lateinische Morphologie: Anleitung

Einführung in die germanistische Linguistik

Inhalt EINFÜHRUNG. 1. Einführung I Einführung II...26

WDG Analyse und Transformation (WAT)

Hinweise zur flexionsmorphologischen Glossierung

Morphologische Merkmale. Merkmale Merkmale in der Linguistik Merkmale in der Morpholgie Morphologische Typologie Morphologische Modelle

Alphabet, formale Sprache

Objektorientierte Programmierung. Kapitel 3: Syntaxdiagramme

Inhalt EINFÜHRUNG. 1. Einführung I l. 2. Einführung II 26 XVII. Tabellenübersicht Schreibkonventionen Abkürzungen Zeichenerklärung

le errnarusnsc e 2., aktualisierte Auflage

8. Flexion. Roland Schäfer. Wintersemester 2018/ Dezember Deutsche und niederländische Philologie Freie Universität Berlin

Deutsch Grammatik Sekundarstufe 1 Die 5 Wortarten

4. 4. Algorithmen und Datenstrukturen in deskriptiven Programmiersprachen

Kanditatenkolloqium Syntax - AG

Terminus Sprache, Phonologie und Grammatik

Transkript:

Morphologie bersicht Ziel Grundbegriffe Vollformen-Lexikon Morphologische Analyse mit DCGs Trennen in Stamm und Endung Flexionsklassen Schnittstelle zwischen Syntax und Semantik Verstehen des Problems In der Lage sein, eine DCG mit einfacher Morphologiebehandlung zu schreiben Morphologie Ð 1

Grundbegriffe Womit befasst sich die Morphologie? ÈAufbau der WšrterÇ bessere Definitionen Lexika und LehrbŸcher der Linguistik Derivation vs. Komposition Derivation Frucht FrŸchte, fruchten, fruchtbar, unfruchtbar, Unfruchtbarkeit, É Gott Gottes, Gštter, Gšttin, Gšttinnen, vergšttern, Gottheit, É Komposition Unfruchtbarkeit + Fugen-s + Gott = Unfruchtbarkeitsgott Unfruchtbarkeitsgšttinen + Verehrung = Unfruchtbarkeitsgšttinenverehrung Unfruchtbarkeitsgšttinenverehrung + Fugen-s + Zeremonienmeister = Unfruchtbarkeitsgšttinenverehrungszeremonienmeister Morphologie Ð 2

Vollformen-Lexikon n(nom, sg) --> [kind]. n(gen, sg) --> [kindes]. n(dat, sg) --> [kind]. n(dat, sg) --> [kinde]. n(akk, sg) --> [kind]. n(nom, pl) --> [kinder]. n(gen, pl) --> [kinder]. n(dat, pl) --> [kindern]. n(akk, pl) --> [kinder]. Flexionsformen von ÈKindÇ n(nom, sg) --> [lied]. n(gen, sg) --> [liedes]. n(dat, sg) --> [lied]. n(dat, sg) --> [liede]. n(akk, sg) --> [lied]. n(nom, pl) --> [lieder]. n(gen, pl) --> [lieder]. n(dat, pl) --> [liedern]. n(akk, pl) --> [lieder]. Flexionsformen von ÈLiedÇ Vollformen-Lexikon in einer Definit-Klausel-Grammatik Regeln fÿr ÈPrŠterminalsymboleÇ, Wšrter zwischen [ und ] der Einfachheit halber befassen wir uns hier nicht mit Gross- und Kleinschreibung Morphologie Ð 3

Vollformen-Lexikon: Probleme Flexion mit Vollformen-Lexikon ist aufwendig fÿr Englisch (da flexionsarme Sprache): noch halbwegs praktikabel fÿr Deutsch: Substantive: Kasus Numerus = 8 Formen Adjektive, Verben: mehr Formen Finnische Verben: ~12Õ000 Formen Morphologie Ð 4

Vollformen-Lexikon: Probleme Gibt es Ÿberhaupt endlich viele Wšrter? Komposition kann beliebig (?) komplex werden: der UnfruchtbarkeitsgšttinenverehrungszeremonienmeisterausbildungskommissionsprŠsidentensesselbezug der erste, É, viermillioneneinhunderttausendundzweite, viermillioneneinhunderttausendunddritte, É Schluck das WŠhrend-der-Vorstellung-in-der-Nase-Bohren ist untersagt Morphologie Ð 5

LšsungsansŠtze Grammatiken fÿr Wšrter Auflisten von Wort-Bestandteilen (Stammformen, Endungen) Regeln zur Verbindung dieser Bestandteile Festhalten dieser Regeln als Kontextfreie Grammatiken, DCGs, É die Formalismen vieler Syntaxtheorien (z.b. HPSG) werden auch zur Modellierung morphologischer PhŠnomene verwendet Nachfolgend vorgestellt: Miniatur-Beispiel mit DCGs Weitere AnsŠtze Endliche Automaten, Zwei-Ebenen-Morphologie, É Empfehlenswert: Martin Volks Kurs ÈLexikonaufbau und MorphologieanalyseverfahrenÇ, Di 16 Ð 18 Uhr Morphologie Ð 6

Morphologie mit DCGs Grundidee Satzgrammatik = Wšrter + Kompositionsregeln Wortgrammatik = Buchstaben + Kompositionsregeln ebenfalls denkbar wšre eine Wortgrammatik, welche die VerknŸpfung von Morphemen beschreibt dann mÿsste ein vorgelagerter Prozess die Buchstabenfolge in Morpheme zerlegen Morphologie Ð 7

ASCII-Codes in Prolog Eine beliebige Zeichenkette, zwischen zwei " eingeschlossen, wird als Liste der ASCII-Codes dargestellt.?- Kette = "Hallo Du". Kette = [72,97,108,108,111,32,68,117]. 32 Leerschlag 68 D 72 H 97 a 108 l 111 o 117 u Vgl. Lektion ÈEin-/AusgabeÇ im Wintersemester Morphologie Ð 8

Trennen von Stamm und Endung n_morph(kas, Num) --> n_stamm, n_endung(kas, Num). VerknŸpfungsregel n_stamm --> "kind". n_stamm --> "lied". n_stamm --> "bild". NominalstŠmme n_endung(nom, sg) --> "". n_endung(gen, sg) --> "es". n_endung(dat, sg) --> "". n_endung(dat, sg) --> "e". n_endung(akk, sg) --> "". n_endung(nom, pl) --> "er". n_endung(gen, pl) --> "er". n_endung(dat, pl) --> "ern". n_endung(akk, pl) --> "er". Nominalendungen Morphologie Ð 9

Flexionsklassen Unterschiedliche Wšrter haben unterschiedliche Flexionsklassen. n(nom, sg) --> [kind]. n(gen, sg) --> [kindes]. n(dat, sg) --> [kind]. n(dat, sg) --> [kinde]. n(akk, sg) --> [kind]. n(nom, pl) --> [kinder]. n(gen, pl) --> [kinder]. n(dat, pl) --> [kindern]. n(akk, pl) --> [kinder]. Flexionsformen von ÈKindÇ n(nom, sg) --> [brot]. n(gen, sg) --> [brotes]. n(dat, sg) --> [brot]. n(dat, sg) --> [brote]. n(akk, sg) --> [brot]. n(nom, pl) --> [brote]. n(gen, pl) --> [brote]. n(dat, pl) --> [broten]. n(akk, pl) --> [brote]. Flexionsformen von ÈBrotÇ Morphologie Ð 10

Flexionsklassen n_morph(kas, Num) --> n_stamm(klasse), n_endung(klasse, Kas, Num). VerknŸpfungsregel n_stamm(1) --> "kind". n_stamm(1) --> "lied". n_stamm(1) --> "bild". n_stamm(2) --> "brot". NominalstŠmme n_endung(1, nom, sg) --> "". n_endung(1, gen, sg) --> "es". n_endung(1, dat, sg) --> "". n_endung(1, dat, sg) --> "e". n_endung(1, akk, sg) --> "". n_endung(1, nom, pl) --> "er". n_endung(1, gen, pl) --> "er". n_endung(1, dat, pl) --> "ern". n_endung(1, akk, pl) --> "er". Nominalendungen Klasse Nr. 1 n_endung(2, nom, sg) --> "". n_endung(2, gen, sg) --> "es". n_endung(2, dat, sg) --> "". n_endung(2, dat, sg) --> "e". n_endung(2, akk, sg) --> "". n_endung(2, nom, pl) --> "e". n_endung(2, gen, pl) --> "e". n_endung(2, dat, pl) --> "en". n_endung(2, akk, pl) --> "e". Nominalendungen Klasse Nr. 2 Morphologie Ð 11

Schnittstelle Syntax/Morphologie Schnittstelle zwischen Syntax und Morphologie Syntax: arbeitet mit Atomen Morphologie: arbeitet mit Zeichenlisten brotes "brotes" Umwandlung: name/2 das in Prolog eingebaute PrŠdikat name/2 verwandelt Atome in Listen aus ASCII-Codes (und zurÿck)?- name(brotes, Buchstaben). Buchstaben = [98,114,111,116,101,115]?- name(wort, [98,114,111,116,101,115]). Wort = brotes Morphologie Ð 12

Schnittstelle Syntax/Morphologie np(kas, Num) --> det(kas, Num), n(kas, Num). det(nom, sg) --> [das]. det(nom, pl) --> [die]. n(kas, Num) :- [Wort], { name(wort, Buchstaben), phrase(n_morph(kas, Num), Buchstaben) }. Anfragen?- phrase(np(kasus, Numerus), [die, brote]). Kasus = nom, Numerus = pl?- phrase(np(kasus, Numerus), [die, broter]). no Morphologie Ð 13 Vgl. Lektion ÈDCGsÇ im Wintersemester

Probleme, Literatur Nachteile des vorgestellten Verfahrens recht ineffizient nicht direkt zum Generieren verwendbar Anfrage?- phrase(np(nom, pl), X). fÿhrt zu Fehlermeldung Literatur Morphologie in Prolog: [Covington, 1994] Morphologie allgemein: A. Linke/M. Nussbaumer/P. R. Portmann: Studienbuch Linguistik. TŸbingen: Niemeyer, 1991. ISBN 3-484-31121-5. Seiten 55 Ð 72. Morphologie Ð 14

Aufgaben: Morphologie Programmiertechniken der Computerlinguistik 2 á Sommersemester 1999 1. Repetition Stelle sicher, dass Du verstehst, wie Prolog DCGs verarbeitet. Welchen Zweck besitzen die geschweiften Klammern in den Folien zur Vorlesung? Schlage nštigenfalls in den Unterlagen des Wintersemesters nach. 2. Komposition Definit-Klausel-Grammatiken kšnnen nicht zur in der Flexionsmorphologie eingesetzt werden, sondern auch in der Kompositionsmorphologie. Schreibe eine Grammatik fÿr Nominalkompositaformen des Deutschen. So sollen folgende Wšrter erkannt werden, ohne dass die Komposita im Lexikon aufgefÿhrt wšren: Ð wuerstchenbude Ð arbeitspause Ð pausenbrote Ð arbeitszeit Ð zeitarbeit 3. Addition FŸge eine Morphologiebehandlung zur Grammatik fÿr deutsche SŠtze aus dem letzten Aufgabenblatt hinzu.