Computerlinguistik I

Ähnliche Dokumente
FLP 1. Beispiele Vater, Mutter, Messer 2. Tag, Bach, Hand, Brot, Floß, Fluss 3. Leib, Wald, Kind, Haus 4. Lappen, Faden, Mädchen, Eltern 6

Hinweise zur flexionsmorphologischen Glossierung

Morphologie II Gross, L 11, 12 Kessel/Reimann, S

Substantiv / Artikelwort: Die Deklination

Morphologische Grundmerkmale prototypischer Adjektive: 1.) deklinierbar. 2.) freies Genus (Unterschied zu Nomen)

Das Flexionssystem des Deutschen: Allgemeines

Klausur in zwei Wochen Einführung in die Morphologie Flexion

Morphologie I. Lexikon & Wortschatz Was ist ein Wort? Wort und Wortform Flexionsmorphologie. Morphologie I 1

Wortarten Merkblatt. Veränderbare Wortarten Unveränderbare Wortarten

Tokenisierung und Lemmatisierung in Suchmaschinen

Seminar Ib Wort, Name, Begriff, Terminus Sommersemester Morphologie. Walther v.hahn. v.hahn Universität Hamburg

Morphologie. bersicht. Ziel. Grundbegriffe Vollformen-Lexikon Morphologische Analyse mit DCGs

Morphologie. 1. Flexion und Derivation 2. Analyse mittels lexikalischer Regeln

Wortarten I: Die Deklinierbaren

Flexionsmerkmale und Markiertheit

Inhaltsverzeichnis. Abkürzungen... 9 Niveaustufentests Tipps & Tricks Auf einen Blick Auf einen Blick Inhaltsverzeichnis

Flexion. Grundkurs Germanistische Linguistik (Plenum) Judith Berman Derivationsmorphem vs. Flexionsmorphem

Spezielle Themen der KI. NLP Natural Language Processing. Sprachverstehen

Grundkurs Linguistik Wintersemester 2014/15. Morphologie. Jens Fleischhauer & Anja Latrouite

Adjektiv und Adjektivgruppe

Lexikalische Morphologie. Flexionsmorphologie und lexikalische Morphologie Derivation Konversion Komposition Flexion vs.

Wortartenbestimmung nach Peter Eisenberg

Lösungen zum Aufgabenblatt 9 Symbolisches Programmieren

KAPITEL I EINLEITUNG

Gymbasis Deutsch: Grammatik Wortarten Verb: Bestimmung der infiniten Verben Lösung 1 Lösungsansätze Bestimmung der infiniten Verben

Übungsaufgaben zur Vorbereitung auf die Staatsexamensklausur Sprachwissenschaft

Einführung in die Computerlinguistik Morphologie (morphembasiert mit Transduktoren)

Wort. nicht flektierbar. flektierbar. nach Person, Numerus, Modus, Tempus, Genus verbi flektiert. nach Genus, Kasus, Numerus flektiert

Unterrichtseinheit Lektion 1

Einführung in die Computerlinguistik Morphologie (1): morphembasierte Morphologie mit Transduktoren

Kasusmarkierung starker Nomen im Deutschen

RESUMEN GRAMÁTICA ALEMANA

Lexikalische Semantik. Was ist ein Wort? Was ist in einem Wort?

Einführung in die Linguistik Butt / Eulitz / Wiemer. Morphologie II

Am Anfang war das Wort!

atttributive Adjektive das die attributiven Adjektive attributive adjectives das blaue Haus --- ist nicht relevant--

Langenscheidt Deutsch-Flip Grammatik

2 Sprachliche Einheiten

Grammatik des Standarddeutschen. Michael Schecker

Aufgabe 3 (Wortmeldung erforderlich) Nennen Sie in hierarchischer Anordnung vom Großen zum Kleinen fünf grammatische Beschreibungsebenen der Sprache.

Einführung Computerlinguistik. Morphologie I

Automatische Lexikonakquisition aus Textkorpora. Vortrag von Peter Adolphs Forschungskolloquium Korpuslinguistik 14. Juni 2006

Merkmalstrukturen. Merkmalstrukturen. Morphologische Typologie. Merkmalstrukturen - Serialisierung. (du) sagtest. (du) sangst. Kindes Kategorie Nomen

Artikelspiel erstellt von L. Schikowski M.A., Universität Göttingen, IIK e.v. Göttingen, Gruppen-/Partnerarbeit

Die Struktur eine Nominalphrase (die Kopfprojektionsknoten in Rot)

Beschreibungen zu den generierten Vollformen erzeugt.

Deutsch Grammatik Sekundarstufe 1 Die 5 Wortarten

DEUTSCH (DLL, DS, DL) Leaving Cert German. Grammatik im Schnellverfahren

Formale Methoden III - Tutorium

Morpheme, Flexionsparadigmen deutscher Nomen, Verben und Adjektive Morphologieanalyse und Lexikonaufbau (2. Vorlesung) Dozent: Gerold Schneider

Lies die Sätze und schreibe die entsprechende Zeitform in das Kästchen!

Klasse 6 Grundlage ist der Lehrgang des Buches Agite, Lektion 1-15 (Obligatorik)

Die Wortklassensysteme von Morphy (Vollständiges Klassensystem, großes und kleines Tag Set)

Deutsch für Anfänger. Carbin. Chapter 4 Accusative Case

Relativsätze, Teil I

Grammatikbingo Anleitung

Grundwissen Deutsch: Nomen. Das Nomen (lat. Substantiv) PDF wurde mit pdffactory Pro-Prüfversion erstellt.

Einführung in die Linguistik Butt & Co. Do. 12:15-13:45 Fr. 12:15-13:45

SUBSTANTIVE GENUS UND DEKLINATION

Einführung in die Sprachwissenschaft des Deutschen. Morphologie. PD Dr. Alexandra Zepter

a) bestimmter Artikel b) unbestimmter Artikel c) Nullartikel (d) "Artikelwörter"/"adjektivische Pronomen )

NOMEN PLURAL. das Blatt - die Blätter. 1.1 Umlaut von a nach ä

HPSG. Referat zu dem Thema Kongruenz im Englischen Von Anja Nerstheimer

Wortbildung: Derivation, Flexion, Komposition

Morphologie und Syntax (BA)

LEXIKALISCHE SEMANTIK II: GRAMMATISCHE BEDEUTUNG

Grammatikanalyse. Prof. Dr. John Peterson. Sprechstunde: Montags, 14:30-15:30h Raum LS10/Raum 425. Sommersemester 2015 Donnerstags, 14:15h-15:45h

Alle Menschen schaffen neue Wörter. Würden wir das nicht tun, klängen wir immer noch wie Höhlenbewohner (Ugh, ugh).

Der Konjunktiv. Regeln zur Verwendung des Konjunktivs

Einführung in die deskriptive Sprachwissenschaft I VDFO. Morphologie: Lexikon, Flexion. Morphologie1 SS 16, d Avis - 1

Zerlegen Sie die folgenden Wörter des Deutschen in ihre morphologischen Bestandteile:

Inhalt. Basisinfos Konjugieren Person/Numerus Tempora (Zeitstrahl) Das Verb: Stamm und Endung Zeiten. genus verbi: Aktiv-Passiv modus verbi

1 Das Geschlecht der Substantive

/ Schenck Grammatikgesamtüberblick / S. 1 von 16 Wortarten, Satzglieder, Zeiten, Konjunktivbildung mit Übung Grammatik


Wortbildung und Wortbildungswandel

Groß- und kleinschreibung

Einführung in die Sprachwissenschaft -Tutorium-

Morphologie. Gerrit Kentner. May 4, 2010

Der Artikel maskulin, feminin oder neutral?

Die konjunktierbare Wortart: Verben

Die Unterschiede zwischen Adjektiven und Adverbien im Deutschen Unter didaktischen Aspekte

von Lia Malia Deutschabteilung der Fakultas Bahasa dan Seni Universitas Negeri Yogyakarta-Indonesien

Morphologische Eigenschaften von Wortarten! Numerus Numeri Zahl! Beispiel: Kategorien des Substantivs! Numerus! Numerus! Numerus! Numerus!

Vollständige Liste mit Könnens-Standards zur Erstellung didaktischer Analysen

Segmentierung (Beispielanalyse)

Wortgruppenflexion: Deklination im Verbund

Verzeichnis grundlegender grammatischer Fachausdrücke Vorbemerkung*

Vorkurs Mediencode Die wichtigsten grammatikalischen Termini

Wortbildung Derivation

DGY 10: Einführung in die Linguistik Universität Athen, WiSe 2009/10 Winfried Lechner Handout #6 26.

1 Merkmale. Kongruenz

Methodologische Anmerkungen

11 Adjektive und Partizipien

Heinrich-Heine-Gymnasium

GRAMMAR REVIEW FOR STUDENTS OF GERMAN Answer the following question in English, giving examples in English and/or German as indicated.

Schuljahr 2015/16. Kollegiale und vertrauensvolle Zusammenarbeit der Lehrer

Deklinationstraining: Substantive

Singular oder Plural? Markieren Sie die Substantive (Nomina).

Transkript:

Computerlinguistik I Vorlesung im WS 2007/08 Prof. Dr. Udo Hahn Lehrstuhl für Computerlinguistik Institut für Germanistische Sprachwissenschaft Friedrich-Schiller-Universität Jena

Morphologie A writer is someone who writes, and a stinger is something that stings. But fingers don t fing, grocers don t groce, haberdashers don t haberdash, hammers don t ham, and humdingers don t humding. Richard Lederer, Crazy English 2

Morphologische Prozesse: Flexion - Deflexion Kombination von Grundformen mit Flexionsaffixen (Kasus, Numerus, Tempus usw.) Deklination Land: Land, Landes, Lande, Länder, Ländern Konjugation landen: lande, landest, landet, landeten, gelandet primär syntaktische, nur minimale semantische Information, kein Wortartwechsel 3

Morphologische Prozesse: Derivation - Dederivation Kombination von Grundformen mit Derivationsaffixen Land: landen, verlanden, anlanden, Land: Landung, Verlandung, Anlandung Land: ländlich, verländlichen, Verländlichung modifizierende semantische Information, häufig mit Wortartwechsel verbunden 4

Morphologische Prozesse: Komposition - Dekomposition Kombination von Grundformen mit Grundformen (mittels Fugeninfixen) Land: Landnahme, Landflucht, Landgang Land: Heimatland, Ausland, Bauland Land: Landesrekord, Landesverrat, Landsmann Land: Inlandsflug, Landesratspräsidentengattin starke semantische Modifikation, Wortartwechsel kein 5

Lexikon und Morphologie Vollformenlexikon morphologische Analyse ist ein Such-prozess im Lexikon. Alle Flexions-, Deri-vations- und Kompositionsvarianten sind im Lexikon mit allen grammatikalischen Informationen explizit spezifiziert. 6

Fragment eines Vollformenlexikons lande KAT: verb, NUM: sg, PERS: 1, TEMP: präs,... Landes KAT: nom, NUM: sg, KASUS: gen, GENUS: neut,... ländlicher KAT: adj, KOMP: pos, NUM: sg, KASUS: nom, GENUS: mask,... KAT: adj, KOMP: komp, NUM: _, KASUS: _, GENUS: _,... 7

Lexikon und Morphologie Vollformenlexikon morphologische Analyse ist ein Such-prozess im Lexikon. Alle Flexions-, Deri-vations- und Kompositionsvarianten sind im Lexikon mit allen grammatikalischen Informationen explizit spezifiziert. hoher Speicheraufwand sehr hoher Erstellungs- (Vollständigkeit) und Wartungsaufwand (Konsistenz) stets unvollständig: Komposita, Neologismen 8

Lexikon und Morphologie Grundformenlexikon morphologische Analyse ist ein Analyseprozess, bei dem alle Flexions-, Derivations- und Kompositionsvarianten regelgeleitet auf kanonische Einträge im Lexikon zurück geführt werden. Diverse grammatikalische Informationen werden berechnet (abhängig vom Typ der kanonischen Einträge). 9

Fragment eines Grundformenlexikons landen KAT: verb, NUM: {sg,pl}, PERS: {1,2,3}, TEMP: {präs,prät,futur}, MOD: {ind,konj}... Land KAT: nom, NUM: {sg,pl}, KASUS: {nom,gen,dat,akk}, GENUS: neut,... ländlich KAT: adj, KOMP: {pos,komp,super}, NUM: {sg,pl}, KASUS: {nom,gen,dat,akk}, GENUS: {mask,fem,neut},... 10

Verwendung eines Grundformenlexikons landen lande KAT: verb, NUM: sg, PERS: 1, TEMP: präs, MOD: ind Land Landes KAT: nom, NUM: sg, KASUS: gen, GENUS: neut ländlich ländlicher KAT: adj, KOMP: pos, NUM: sg, KASUS: nom, GENUS: mask KAT: adj, KOMP: komp, NUM:_, KASUS:_, GENUS:_ 11

Lexikon und Morphologie Grundformenlexikon morphologische Analyse ist ein Analyseprozess, bei dem alle Flexions-, Derivations- und Kompositionsvarianten regelgeleitet auf kanonische Einträge im Lexikon zurück geführt werden. Diverse grammatikalische Informationen werden berechnet (abhängig vom Typ der kanonischen Einträge). Spezifikation morphologischer Regeln Berechnungsaufwand für Analyse 12

Morphologische Analyse Lemmatisierung regelgeleitete Rückführung morphologischer Varianten auf eine kanonische Grundform im Lexikon (ohne Berücksichtigung grammatika-lischer Informationen) Wort-Parsing regelgeleitete Rückführung morphologischer Varianten auf eine kanonische Grundform im Lexikon mit simultaner Berechnung grammatika-lischer Informationen 13

Lemmatisierung vs. Wort-Parsing Eingabe Töchtern Hauses sagte Spiegelungen Lemma Tochter Haus sagen Spiegelung leichter verlängerte leicht verlängert verlängern 14

Lemmatisierung vs. Wort-Parsing Eingabe Lemma morphologische Merkmale Wort-Parse Töchtern Tochter Tochter [+N, +FEM, +PL, +DAT] Hauses Haus Haus [+N, +NEU, +SG, +GEN] sagte sagen sagen [+V, +SG, {1P,3P}, +PAST] Spiegelungen Spiegelung [Spiegel] N [ung] ds [+N, +FEM, +PL, {NOM,GEN,DAT,AKK}] leichter leicht leicht [+Adj, +POS, +MAS, +SG, +NOM] [+Adj, +KOM] verlängerte verlängert [ver] dp [[lang] Adj [er] ds ] Adj [t] ds [+Part, {MAS,FEM,NEU}, +SG, +NOM] [+Part, {FEM,NEU}, +SG, +AKK] verlängern [ver] dp [[lang] Adj [er] ds ] Adj [n] ds [+V, +SG, {1P,3P}, +PAST] 15

Flexionsmorphologie deutscher Substantive Ein flektiertes Substantiv besteht aus einer kanonischen Grundform und einer daran angehängten Endung. Grundformen mit gleichem Endungsverhalten (Flexionsparadigma) bilden eine Flexionsklasse. In einem flektierten Substantiv kann die Grundform durch Umlautung (a ä, o ö, u ü) verändert sein. 16

Morphologische Analyse Lexikon Liste von deutschen Substantiven (Nominativ-Singular) mit Flexionsparadigmen und Umlautungskodierung Lemmatisierungsalgorithmus zur lexikongestützten Deflexion 17

Flexionsklassen Singular FLS 1 2 3 4 5 6 7 8 Gen Dat Akk - - - -s - - -es -[e] - -ses -[se] - -ens -en - -en -en -en -n -n -n -n[s] -n -n Beispiele Frau, Mutter, Studentin, Hand, Kenntnis, Milch Vater, Messer, Auto, Lappen, Faden, Mädchen, See Mann, Tag, Wald, Brot, Haus, Sohn, Fluss, Floß Bus Herz Bär, Mensch, Student Riese, Gabe Buchstabe 18

Flexionsklassen Plural FLP 1 2 Nom Dat - -n -e -en Beispiele Vater, Mutter, Messer Tag, Bach, Hand, Brot, Floß, Fluss 3 -er -ern Leib, Wald, Kind, Haus 4 -se -sen Bus, Kenntnis 5 6 7 - - -s -s -n -n Lappen, Faden, Mädchen, Eltern Uhu, Bar, Echo Buchstabe, Riese, See, Gabe, Auge 8 -en -en Bär, Schmerz, Frau, Ohr, Herz, Student, Mensch 9 -nen -nen Studentin 19