Morphologie mit Endlichen Automaten

Größe: px
Ab Seite anzeigen:

Download "Morphologie mit Endlichen Automaten"

Transkript

1 Morphologie mit Endlichen Automaten Annika Scheffler, Lothar Zauner Lehrstuhl für Computerlinguistik Sommersemester 2003 HS Parsing, Dr. Karin Haenelt Gliederung Grundlagen Verknüpfung von Stamm-und Endungsautomat Evaluierung 2

2 Ziel Aufgaben Lösungsansatz 1. Grundlagen Komponenten für morphologischen Modellierung Phänomene Two-Level-Morphology 3 Ziel Ziel Analyse: Erkennung von Wortformen Zuordnung einer Grundform Erkennung einer morphotaktischen Strukturbeschreibung Generierung: Erzeugung von Wortformen zu einer gegebenen Grundform und gegebenen morphologischen Attributen 4

3 Aufgaben Aufgaben Behandlung von Item-and-Arrangement (ohne Stammveränderung) Behandlung von Item-and-Process (mit Stammveränderung) Behandlung von abweichenden Rechtschreibregeln Behandlung von Mehrdeutigkeiten 5 Lösungsansätze Modell: Two-Level-Morphology zur Behandlung von phonologischen und orthographischen Regelhaftigkeiten zur wechselseitigen Verwendung der Automaten für Analyse und Generierung Ausführung: Finite State Tranducer 6

4 Komponenten für morphologische Modellierung Transducer: Stämme Endungen Morphotaktik Regeln Systemarchitekturen: Kaskade Verknüpfung Traversionsalgorithmen: Backtracking Agenda 7 Überblick Wörter Wortformen Flexion Wortbildung Derivation Komposition 8

5 Morpheme Freie Morpheme (Stamm) Können allein stehen Gebundene Morpheme (Affixe) Können nicht allein stehen Präfixe un + endlich Suffixe ess + bar Zirkumfixe ge + lauf + en Infixe (U.S. Umgangssprache) abso + bloddy + lutely 9 Phänomene I: Flexion Änderung der grammatikalischen Funktion durch Affigierung Keine Änderung der Wortart Bildung von Paradigmen Konjugation, Deklination Item-and-Arrangement (ohne Stammveränderung) Stamm + Affix cat + s Item-and-Process (mit Stammveränderung) goose geese 10

6 Phänomene II: Derivation Bildung von neuen Wörtern Änderung der Wortart durch Affigierung (Einem freien Morph wird ein gebundenes Morph hinzugefügt) Suffix -ation Base Verb/Adjective to computerize (V) Derived Noun computerization Suffix Base Noun/Verb Derived Adjective -al computation (N) computational -ee to appoint (V) apointee -able embrace (V) embracable -er to kill (V) killer -less clue (N) clueless -ness fuzzy (A) fuzziness 11 Jurafsky, Martin: Morphology and Finite State Transducers, 2000: 64 Phänomene III: Komposition Allgemein: Das Zusammenfügen von zwei freien Morphen Wörter + Buch Ambiguitäten: Staubecken, Druckerzeugnis Stau - beckenoder Staub - ecken? Druck - erzeugnis oder Drucker - zeugnis? 12

7 Unregelmäßigkeiten für Englisch Stammänderung goose - geese; mouse - mice Null-Morphem fish, sheep Endung auf -es (-en) nach Wörtern, die auf x,s,z enden fox -fox-e-s, ox -ox-e-n 13 Einige abweichende Rechtschreibregeln Name Description of Rule Example Consonant doubling E deletion E insertion Y replacement K insertion consonant doubled before ing/ ed Silent e dropped before ing and ed e added after s, z, x, ch, sh before s y changes to ie before s, i before ed verbs ending with vowel + c add k before -ed beg/begging make/making watch/watches try/tries panic/panicked Jurafsky, Martin: Morphology and Finite-State-Transducers, page 77 14

8 Two-Level-Morphology zuerst vorgeschlagen von Koskenniemi (1983) Ziele: Erzeugung der Strukturausgabe des morphologischen Parsings direkt aus dem Erkennungsautomaten Generierung von Wortformen direkt aus der Erkennung der morphologischen Beschreibung Ansatz: Repräsentation von Wörtern als Korrespondenz zwischen lexikalischer Ebene: Konkatenation von Morphemen Oberflächenebene: Repräsentation der Schreibung des Wortes 15 Two-Level-Morphology, Teil 1 Item-and-Arrangement/Konkatenative Morphologie C A T +N +PL lexical level C A T S surface level Item-and-Process/Nicht-konkatenative Morphologie G O O S E +N +PL lexical level G E E S E # surface level 16

9 Beispiel 1 Item-and-Arrangement Σ = {c, a,t, ε, s } = {c, a, t, +N, +PL} Q = {q 0,q 1,q 2,q 3,q 4,q 5 } S = {q 0 } F = {q 5 } δ (q, i:o, q ) Übergänge in Form von Drei-Tupeln: (q 0, c:c, q 1 ) (q 1, a:a, q 2 ) (q 2, t:t, q 3 ) (q 3,ε:+N,q 4 ) (q 4, s:+pl,q 5 ) q c:c 0 q a:a q 3 ε:+n s:+pl 1 q t:t 2 q 4 q 5 17 g:g Σ = {g, e, e, s, e, ε, #} = {g, o, o, s, e, N, PL} Q = {q 0 - q 7 } S = q 0 F = q 7 δ (q,i:o,q ) o:e q 1 q 2 o:e s:s Beispiel 2 Item-and-Process e:e q 3 q 4 q 5 ε:n #:+PL q 6 Anweisungen (Übergänge): (q 0, g:g, q 1 ) (q 1, o:e, q 2 ) (q 2, o:e, q 3 ) (q 3, s:s, q 4 ) (q 4, e:e, q 5 ) (q 5, ε:+n, q 6 ) (q 6, #: +PL, q 7 ) q 0 q 7 18

10 Two-Level-Morphology, Teil 2 Zwei Einträge für das gleiche Wort C A N T O +N +Masc +Sg C A N T O C A N T A R +V +Prs +1p +Sg C A N T O 19 Beispiel 3 Ambiguitäten Backtracking Σ = {c, a, n, t, o} = {c, a, n, t, o, a, r, +N, +Msc, + Sg, +V +Prs, +1p, +Sg} Übergänge: (q0, c:c, q1) (q1, a:a, q2) (q2, n:n, q3) (q3, t:t, q4) (q4, o:o, q5),(q4,o:a,q6) (q5,e :noun,q7) (q6,e :r,q8) (q7,e :masc,q9) (q8,e :verb, q10) (q9,e :sg,q11) (q10,e :presind, q12) (q11,no arcs) (q12,e :1p,q9) o:o q 0 c:c q 1 a:a q 2 n:n q 3 t:t q 4 o:a ε:+noun ε:+masc ε:+sg q 5 q 7 q 9 q q ε:r ε:+verb 12 6 q8 q 10 ε:+pres 20 q 11 ε:+1p

11 2. Grundlagen Morphologisches Parsing Morphologisches Parsing Komponenten für einen morphologischen Parser Verknüpfung der Komponenten Systemarchitektur Kaskadierung Systemarchitektur Verknüpfung 21 Input cats cat cities geese goose merging Morphologisches Parsing Morphological Parsed Output cat +N +PL cat +N +SG city +N +PL goose +N +PL goose +N +SG merge +V +PRES-PART Jurafsky, Martin: Morphology and Finite-State-Transducers, 2000:65 22

12 Komponenten für einen morphologischen Parser Lexikon: Liste von Stämmen und Affixen, zusammen mit grundlegenden Informationen (z.b. Nomen, Verb etc.) Morphotaktik: Modell der Morphemordnung, die festlegt, welche Morphemklassen auf andere folgen können. Bsp..: In europäischen Sprachen folgt das Plural-Morphem dem Nomen Rechtschreibregeln:legen die Änderungen fest, die in einem Wort auftauchen, wenn zwei Morpheme miteinander kombiniert werden. 23 Verknüpfung der Komponenten Kaskadierung: Hintereinanderschalten von mehreren Transduktoren in Serie. Der Output des ersten ist der Input des zweiten usw.: A:B B:C C:D D:E Zur Laufzeit werden mehrere Automaten durchlaufen Integrierter Gesamtautomat: A:E Zur Laufzeit wird nur ein integrierter Automat durchlaufen Variante a) Konkatenation und Vereinigung Variante b) Komposition 24

13 Systemarchitektur Kaskadierung Input: Zeichenkette Output: Morpheme Input: Morpheme Output: Wörter 25 Systemarchitektur Konkatenation Spezifikation des Lexikons: Nominalstämme Lexikon Compiler Lexikon als FST Nominalendungen Verbstämme Lexikon Compiler Lexikon Compiler Lexikon als FST Lexikon als FST Kombination: Verkettung Vereinigung, (Sequentialisierung) Gesamt FST Verbendungen Lexikon Compiler Lexikon als FST Größenordnung: 2 GB 26

14 Intersection and Composition of Transducers LEXICON - FST LEXICON - FST compose LEXICON FST FST A FST 1... FST N intersect FST A (= FST 1 ^ FST 2 ^FST N ) Jurafsky, Martin: Morphology with Finite-State-Transducers, 2000: Verknüpfung von Stamm- und Endungsautomat Verarbeitungsvarianten: Kaskade Integrierter Gesamtautomat Variante a) Konkatenation und Vereinigung Variante b) Komposition Automaten für Konkatenation und Vereinigung Stammautomaten, Endungsautomaten Automaten für Komposition Stammautomat und Endungsautomat, Regelautomat Ergebnis: Integrierter Gesamtautomat 28

15 Komponenten: Kaskade Lexikonautomaten mit Ausgabe der Morpheme Morphotaktik-Automat, der die Ausgabe aus den Lexikonautomaten verarbeitet 29 Kaskadierung von T lex und T rule F O X E S Surface level F O X ^ S # F O X ^ S # Intermediate level F O X +N +PL Lexical level Kaskadierung: Es handelt sich um zwei in Serie geschaltete Transducer. Der Output des ersten Transducers dient dem zweiten als Input. Die Rechtschreibregel fügt ein e auf dem Surface Level ein, wenn nach der Morphemgrenze ein s folgt 30

16 Generating or Parsing with FST Lexicon and Rules Lexical f o x +N +Pl LEXICON - FST Intermediate f o x ^ s FST 1 orthographic rules FST n Surface f o x e s Jurafsky, Martin: Morphology with Finite-State-Transducers, 2000:80 31 level 1 Kaskade preterite-ed reg.-verb-stem past part. -ed level 2 w a l k w a l k reg.-verb-stem e d preterite past part. 32

17 Kaskade Beispiel: FSA Flexion irreg-past -verb-form preterite(-ed) reg-verb-stem q 0 q 1 q 3 past participle (-ed) reg -verb-stem prog (-ing) irreg-verb-stem q 2 3-sing (-s) Jurafsky, Martin: Morphology and Finite-State-Transducers, 2000 : Übersicht des integrierten Stammautomat durch Konkatenation und Vereinigung Konkatenation Vereinigung stem 1 end 1 stem 1 end 1 stem 1 end 1 stem 2 end 2 stem 2 end 2 stem 2 end 2 stem 3 end 3 stem 3 end 3 stem 3 end 3 34

18 Lex. Basic dog reg. noun 1 fox reg. noun 2 goose irreg. noun sg. geese irreg. noun pl. lex. reg. noun 1 ε sg. s pl. lex. reg. noun 2 ε sg. es pl. lex. irreg. noun sg. ε sg. lex. irreg. noun pl. ε pl. Konkatenation reg.noun 1 d o g reg.noun 2 f o x g o o s e g e e s e irreg.pl. 35 sg. ε pl. s sg. ε pl. es irreg.sg. Konkatenation Komponenten: Stammautomaten mit Referenz auf die Endungsautomaten (ergibt Bündelung von Endzuständen des Stammautomaten) Endungsautomaten, die den einzelnen Referenzen entsprechen 36

19 Stammautomaten für Konkatenation T stem11 f o x c a t T stem12 d o g g o o s e T stem13 s h e e p m o u s e g e:o e:o s e T stem14 s h e e p m i:o e:u s:c e 37 Endungsautomaten für Konkatenation T num11 T num12 T num13 T num14 e:+n #:SG ^es#:pl T num11 e:+n #:SG ^s#:pl T num12 e:+n #:SG T num13 e:+n #:PL T num14 38

20 Lexikonautomat nach Konkatenationund Vereinigung o x f e:+n ^es#:pl #:SG c a t ^s#:pl e:+n d o g #:SG g o o s e e:+n s h e e p e m o u s g e:o e:+n e:o s e s #:PL #:SG m h e e p i:o e:u s:c e 39 Komposition Beschreibung der Varianten der Flexion durch Regelautomaten Erforderliche Ergänzungen bei den Automaten für die Komposition: Zustandsübergang (q1,@:@,q1) am Ende des Stammautomaten sorgt dafür, dass bei Schnittbildung mit dem Endungsautomaten der gesamte Endungsteil Element Durchschnittsmengen wird und unter Schnittbildung erhalten bleibt Zustandsübergang (q0,other : other,q0) am Beginn derregelautomaten sorgt dafür, dass bei Schnittbildung mit dem Lexikonautomaten der gesamte Lexemteil Element der Durch-schnittsmengen wird und unter Schnittbildung erhalten bleibt 40

21 Endungsautomat für Komposition T num2 reg-noun-stem q 1 ε:+n q 4 ^s:+pl #:+SG q 0 irreg-sg-noun-stem q 2 ε:+n q 5 #:+SG q 7 irreg-pl-noun -stem ε: +N #:+PL q 3 q 6 41 Jurafsky, Martin: Morphology and Finite-State-Transducers, page 74 Stammautomat für Komposition T stem2 reg-noun-stem d o g reg-noun-stem c a t reg-noun-stem f o x irreg-sg-noun-stem g o o s * irreg-sg-noun-stem s h e e p q 0 q 1 irreg-sg-noun-stem m o u s e irreg-pl-noun-stem g o:e o:e s e irreg-pl-noun-stem s h e e p irreg-pl-noun-stem m o:i u:e s:c e Jurafsky, Morphology with Finite-State-Transducers, page 75 wildcard; steht für jedes realisierbare Paar 42

22 T rule : FST E-Insertion Regelautomat ^:ε other # other z,s,x z,s,x z,s,x ^:ε s q 5 ^:ε other: f o (q0,x:x,q1) (q1,^:ε,q2) (q2, ε:e,q3) (q3, s:s, q4) (q4, #:#,q0) other: f o (q0,x:x,q1) (q1,^:ε,q2) (q2,s:s,q5) (q5,#:#, -) rejected! s q 0 q 1 q 2 #, other z, x ε:e q 3 q 4 #, other # 43 Jurafsky, Martin: Morphology and Finite-State-Transducers, 2000 : 78 Lexikonautomat nach Komposition von Lexikon- und Regelautomat f o #:SG c a t ^s#:pl e:+n d o g #:SG g o o s e e:+n s h e e p e m o u s g e:o e:+n e:o s e s x e:+n ^es#:pl #:PL #:SG m h e e p i:o e:u s:c e 44

23 Accepting Foxes Lexical f o x +N +Pl T lex Intermediate f o x ^ s # T e-insert Surface f o x e s Jurafsky, Martin: Morphology with Finite-State-Transducers, 2000:81 45 Komposition Zwischenschritt: Veranschaulichung des Abgleichs von R und L other other x ε e s # Rule q 0 q 0 q 0 q 1 q 2 q 3 q 4 other other x ^ ε s # q 0 f o x ε ^ s # Stem l 0 l 1 l 2 l 5 l 6 f o x +N +PL l 7 ε l 8 ε l 9 Ergebnis der Komposition f o x ε ^ e s # Rule Stemq 0 l 0 q 0 l 1 q 0 l 2 q 1 l 5 q 1 l 6 q 2 l 7 q 3 l 7 f o x +N +PL ε s q 4 l 8 ε q 0 l 9 Karin Haenelt: FSA-Anwendung, Morphologie, 2003: 11 46

24 R s:s x:x z:z ^:ε ε :e # other q 0 q1 q1 q 1 q 0 - q 0 q0 q 1 q1 q1 q 1 q 2 - q 0 q0 q 2 q5 q1 q 1 q 0 q 3 q 0 q0 q 3 q q q 0 - q 5 q1 q1 q 1 q q0 Transitions- T R o L a q 0l1 q 0l2 b q 0l3 q 0l4 q 0l5 e q 0l6 q 0l7 q 1l5 l q 1l6 q 1l8 l q 3l7 q 4l8 q 0l9 e n L a:a c:c f:f o:o t:t x:x +N: ε +PL:^ε :sε :# l0 l3 l1 l1 l2 l3 l 4 l4 l5 l6 l7 l8 l9 other other other other other x:x - ε ^: ε s:s :e a:a c:c f:f o:o t:t x:x +N:ε +PL:^ ε:s - ε:# q 0l0 q0l3 q 0l1 q0l4 q 0l2 q 0l5 q 2l7 q5l8 q 3l7 q1l5 Karin Haenelt, FSA-Anwendung: Morphologie, 2003: 13 l2 q0l6 q1l6 l5 l5 q 0l7 q 2l7 l6 q1l8 q4l8 l7 q 0l9 q 0l9 l8 47 l9 Integrierter Gesamtautomat T lex o T rule f o x ε ^ e s q 0 l 0 q 0 l 1 q 0 l 2 q 1 l 5 q 1 l 6 q 2 l 7 q 3 l 7 q 4 l 8 f o x +N +PL ε ε # ε q 0 l 9 c a t ε ^ s # c q 0 l 3 q 0 l 4 a t q +N q l 0 6 +PL q l q l 0 l ε 1 8 ε Karin Haenelt, FSA-Anwendung: Morphologie, 2003: 14 48

25 Komposition von Lexikonautomat und Regelautomat: Erläuterung Aufgrund der other-kante im Regelautomaten wird zunächst jeder Nominalstamm geprüft Treffen die Bedingungen zu, wird ein e eingefügt, sonst nicht Durch die Komposition von T lex und T rule entstehen unterschiedliche Pfade für verschiedene Nominalstämme Daher müssen Kanten u.u. vervielfacht werden Evaluierung Vorteile Kaskadierung: viele, kleine Automaten verbraucht wenig Speicher größere Portabilität (Einsatzmöglichkeiten in verschiedenen Programmen) Nachteile Kaskadierung: es müssen viele Zwischenergebnisse verarbeitet werden langsamere Laufzeit Vorteile Komposition: schnelle Laufzeit - es müssen keine Zwischenschritte verarbeitet werden Nachteile Komposition: bei der Schnittmengenbildung müssen Teile vervielfacht werden erfordert viel Hauptspeicher (ca. 2GB!!) 50

26 Literatur Beesely, Kenneth R.; Karttunen, Lauri: Finite-State Morphology: Xerox Tools and Techniques, 1999 Haenelt, Karin, Endliche Automaten: Anwendungen: Morphologie. Kursfolien /kurs/folien/fsa- Morph.pdf Jurafsky, Daniel; Martin; Hames H.: Speech and Language Processing. An Introduction to Natural Language Processing, Computational Linguistics, and Speech Recognition Upper Saddle River, N.J.:Prentince Hall 2000, Kap.3 Morphology and Finite-State-Transducers, p Trommer, Jochen: Morphologie. Carstensen, Ebert, Endriss, Jekat, Klabunde, Langer, Computerlinguistik und Sprachtechnologie, Heidelberg, Berlin 2001, S. Trost, Harald: Morphology. The Oxford Handbook of Computational Linguistics, Oxford 2003, p

Morphologie mit Endlichen Automaten

Morphologie mit Endlichen Automaten Morphologie mit Endlichen Automaten Annika Scheffler, Lothar Zauner Lehrstuhl für Computerlinguistik Sommersemester 2003 HS Parsing, Dr. Karin Haenelt 7.07.2003 Gliederung Grundlagen Verknüpfung von Stamm-und

Mehr

Einführung in die Computerlinguistik

Einführung in die Computerlinguistik Einführung in die Computerlinguistik Finite State Transducers und Morphologie Laura Kallmeyer Heinrich-Heine-Universität Düsseldorf Summer 2016 1 / 18 Morphologische Grundbegriffe (1) Wort / Lexem: abstrakte

Mehr

Natürlichsprachliche Systeme I Materialien zur Vorlesung

Natürlichsprachliche Systeme I Materialien zur Vorlesung Natürlichsprachliche Systeme I Materialien zur Vorlesung D. Rösner Institut für Wissens- und Sprachverarbeitung Fakultät für Informatik Otto-von-Guericke Universität Magdeburg WS 2010/11, 19. Oktober 2010,

Mehr

Einführung in die Computerlinguistik Finite State Transducers und Morphologie

Einführung in die Computerlinguistik Finite State Transducers und Morphologie Einführung in die Compuerlinguisik Finie Sae Transducers und Morphologie Laura Heinrich-Heine-Universiä Düsseldorf Sommersemeser 2013 FST und Morphologie 1 Sommersemeser 2013 Morphologische Grundbegriffe

Mehr

Transduktoren für die Sprachverarbeitung: Komposition zweier Transduktoren. Karin Haenelt

Transduktoren für die Sprachverarbeitung: Komposition zweier Transduktoren. Karin Haenelt Transduktoren für die Sprachverarbeitung: Komposition zweier Transduktoren Karin Haenelt 28.5.2010 1 Themen Einführung Algorithmus für endlich-sequentielle Transduktoren Beispiele Beispiel 1: Erläuterung

Mehr

Einführung in die Computerlinguistik Morphologie (1): morphembasierte Morphologie mit Transduktoren

Einführung in die Computerlinguistik Morphologie (1): morphembasierte Morphologie mit Transduktoren Einführung in die Computerlinguistik Morphologie (1): morphembasierte Morphologie mit Transduktoren Dozentin: Wiebke Petersen 14.6.2010 Wiebke Petersen Einführung CL SoSe 2010 1 Morphologische Grundbegrie

Mehr

Einführung in die Computerlinguistik Morphologie (1): morphembasierte Morphologie mit Transduktoren

Einführung in die Computerlinguistik Morphologie (1): morphembasierte Morphologie mit Transduktoren Einführung in die Computerlinguistik Morphologie (1): morphembasierte Morphologie mit Transduktoren Dozentin: Wiebke Petersen 14.6.2010 Wiebke Petersen Einführung CL SoSe 2010 1 Morphologische Grundbegrie

Mehr

Einführung in die Computerlinguistik Morphologie (morphembasiert mit Transduktoren)

Einführung in die Computerlinguistik Morphologie (morphembasiert mit Transduktoren) Einführung in die Computerlinguistik Morphologie (morphembasiert mit Transduktoren) Dozentin: Wiebke Petersen 8.12.2009 Wiebke Petersen Einführung CL (WiSe 09/10) 1 Morphologische Grundbegrie Wort / Lexem:

Mehr

Einführung in die Computerlinguistik Morphologie (morphembasiert mit Transduktoren)

Einführung in die Computerlinguistik Morphologie (morphembasiert mit Transduktoren) Einführung in die Computerlinguistik Morphologie (morphembasiert mit Transduktoren) Dozentin: Wiebke Petersen 7. Foliensatz Wiebke Petersen Einführung CL 1 Morphologische Grundbegrie Wort / Lexem: abstrakte

Mehr

Finite-State-Morphologie in XLE. Grammatikentwicklung, SS 2010

Finite-State-Morphologie in XLE. Grammatikentwicklung, SS 2010 Finite-State-Morphologie in XLE Grammatikentwicklung, SS 2010 1 / 20 Worum es heute geht: Nutzen von Finite-State-Morphologien... und wie man sie in XLE einbaut 2 / 20 Lexikon in XLE Bis jetzt: so genanntes

Mehr

Computerlinguistische Grundlagen. Jürgen Hermes Wintersemester 18/19 Sprachliche Informationsverarbeitung Institut für Linguistik Universität zu Köln

Computerlinguistische Grundlagen. Jürgen Hermes Wintersemester 18/19 Sprachliche Informationsverarbeitung Institut für Linguistik Universität zu Köln Computerlinguistische Grundlagen Jürgen Hermes Wintersemester 18/19 Sprachliche Informationsverarbeitung Institut für Linguistik Universität zu Köln Morphologie Wort Morphem Allomorph Sprachtypologie anhand

Mehr

Operationen auf endlichen Akzeptoren und Transduktoren

Operationen auf endlichen Akzeptoren und Transduktoren Operationen auf endlichen Akzeptoren und Transduktoren Kursfolien Karin Haenelt Karin Haenelt 2006, Operationen auf Akzeptoren und Transduktoren, 08.07.2006 ( 1 05.04.2004) 1 Notationskonventionen L reguläre

Mehr

Operationen auf endlichen Automaten und Transduktoren

Operationen auf endlichen Automaten und Transduktoren Operationen auf endlichen Automaten und Transduktoren Kursfolien Karin Haenelt 1 Notationskonventionen L reguläre Sprache A endlicher Automat DEA deterministischer endlicher Automat NEA nichtdeterministischer

Mehr

Centrum für Informations- und Sprachverarbeitung Uni München Repetitorium ZP Sommersemester 09. Morphologie. Alla Shashkina

Centrum für Informations- und Sprachverarbeitung Uni München Repetitorium ZP Sommersemester 09. Morphologie. Alla Shashkina Morphologie Alla Shashkina Morphologie (= Formenlehre) untersucht systematische Beziehungen zwischen Wörtern und Wortformen Regeln, nach denen Wörter/Wortformen gebildet werden 2 Ziel in der Computerlinguistik

Mehr

Ivana Daskalovska. Willkommen zur Übung Einführung in die Computerlinguistik. Morphologie. Sarah Bosch,

Ivana Daskalovska. Willkommen zur Übung Einführung in die Computerlinguistik. Morphologie. Sarah Bosch, Ivana Daskalovska Willkommen zur Übung Einführung in die Computerlinguistik Morphologie Wiederholung Aufgabe 1 Was ist Morphologie, Morphem? 3 Aufgabe 1 Was ist Morphologie, Morphem? Teildisziplin der

Mehr

Transduktoren & computationelle Morphologie

Transduktoren & computationelle Morphologie Transduktoren & computationelle Morphologie Machine Language Processing Heike Zinsmeister WS 2008/09 Motivation Letzte Woche: Automaten erlauben, Wörter kompakt zu repräsentieren Wörter sind in sich komplex

Mehr

Operationen auf endlichen Akzeptoren und Transduktoren

Operationen auf endlichen Akzeptoren und Transduktoren Operationen auf endlichen Akzeptoren und Transduktoren Definitionen, Algorithmen, Erläuterungen und Beispiele - eine Übersicht Karin Haenelt, 28.5.2010 ( 1 25.04.2004) Operationen auf endlichen Akzeptoren

Mehr

Natural Language Processing

Natural Language Processing Natural Language Processing Kapitel 3: Wörter, Morphologie, Wortähnlichkeit Prof. Dr. Johannes Maucher HdM MIB Version 1.1 23. Oktober 2015 Prof. Dr. Johannes Maucher (HdM MIB) NLP Kapitel 3: Wörter, Morphologie,

Mehr

Abstrakte Operatoren für komplexe reguläre Ausdrücke. Karin Haenelt

Abstrakte Operatoren für komplexe reguläre Ausdrücke. Karin Haenelt Abstrakte Operatoren für komplexe reguläre Ausdrücke Karin Haenelt 5.7.2010 1 Themen Einführung Notationskonventionen Abstrakte Operatoren Enthaltensein Restriktion Ersetzungen Theoretische Basis des Ersetzungsoperators:

Mehr

Two-Level Morphology VERSION 1.0

Two-Level Morphology VERSION 1.0 Two-Level Morphology STEFAN LANGER, CIS UNIVERSITÄT MÜNCHEN SOMMERSEMESTER 2016 VERSION 1.0 Übersicht Flexionsmorphologie Ansätze zur Behandlung in der Sprachverarbeitung Two-level morphology Lexikon und

Mehr

Part-of-Speech-Tagging mit Transduktoren

Part-of-Speech-Tagging mit Transduktoren Ruprecht-Karls Universität Heidelberg Hauptseminar Computerlinguistik Endliche Automaten für die Sprachverarbeitung PD Dr Karin Haenelt Sommersemester 2005 Part-of-Speech-Tagging mit Transduktoren Maria

Mehr

Operationen auf endlichen Automaten und Transduktoren

Operationen auf endlichen Automaten und Transduktoren Operationen auf endlichen utomaten und Transduktoren en, lgorithmen, Erläuterungen und e - eine Übersicht Karin Haenelt, 5.4.4 Vorbemerkung... Notationskonventionen... 3 Übersicht der Operationen...3 4

Mehr

Einführung in die Computerlinguistik

Einführung in die Computerlinguistik Einführung in die Computerlinguistik Einführung Laura Kallmeyer Heinrich-Heine-Universität Düsseldorf Summer 2018 1 / 14 Anwendungen der Computerlinguistik Carstensen et al. (2010); Jurafsky and Martin

Mehr

Part-of-Speech-Tagging mit Transduktoren

Part-of-Speech-Tagging mit Transduktoren Ruprecht-Karls Universität Heidelberg Hauptseminar Computerlinguistik Endliche Automaten für die Sprachverarbeitung PD Dr. Karin Haenelt Sommersemester 2005 Part-of-Speech-Tagging mit Transduktoren Maria

Mehr

Phonetische Lexika Morphologische Analysen. Uwe D. Reichel IPSK, LMU München 9. Januar 2008

Phonetische Lexika Morphologische Analysen. Uwe D. Reichel IPSK, LMU München 9. Januar 2008 Phonetische Lexika Morphologische Analysen Uwe D. Reichel IPSK, LMU München reichelu@phonetik.uni-muenchen.de 9. Januar 2008 Inhalt Terminologie Finite-State-Methoden Schwierigkeiten der deutschen Morphologie

Mehr

Minimalistische Morphologie

Minimalistische Morphologie Minimalistische Morphologie minimalistisch: basiert auf wenigen Prinzipien befasst sich mit flektierten Wortformen und deren Rolle in der Syntax Basis-Annahmen 1. keine abstrakten Morpheme 2. maximale

Mehr

Abstrakte Operatoren für komplexe reguläre Ausdrücke

Abstrakte Operatoren für komplexe reguläre Ausdrücke Abstrakte Operatoren für komplexe reguläre Ausdrücke 1 Einführung... 1 2 Einfache Operatoren für reguläre Ausdrücke... 2 3 Abstrakte Operatoren für komplexe reguläre Ausdrücke... 4 3.1 Enthaltensein...

Mehr

Lemmatisierung und Stemming in Suchmaschinen

Lemmatisierung und Stemming in Suchmaschinen Lemmatisierung und Stemming in Suchmaschinen Hauptseminar Suchmaschinen Computerlinguistik Sommersemester 2016 Stefan Langer stefan.langer@cis.uni-muenchen.de Trefferquote (Recall) und Genauigkeit (Precision)

Mehr

Lemmatisierung und Stemming in Suchmaschinen

Lemmatisierung und Stemming in Suchmaschinen Lemmatisierung und Stemming in Suchmaschinen Hauptseminar Suchmaschinen Computerlinguistik Sommersemester 2014 Stefan Langer stefan.langer@cis.uni-muenchen.de Trefferquote (Recall) und Genauigkeit (Precision)

Mehr

Zwei-Ebenen-Morphologie

Zwei-Ebenen-Morphologie Gerold Schneider: Morphologieanalyse und Lexikonaufbau, 5. Vorlesung Seite 1 Zwei-Ebenen-Morphologie Morphologieanalyse und Lexikonaufbau (5. Vorlesung) Dozent: Gerold Schneider Übersicht Einleitung Endliche

Mehr

Endliche Automaten. Minimierung. Karin Haenelt. Karin Haenelt, 2004, FSA-Minimierung, ( )

Endliche Automaten. Minimierung. Karin Haenelt. Karin Haenelt, 2004, FSA-Minimierung, ( ) Endliche Automaten Minimierung Karin Haenelt 1 Inhalt Vorteile eines Minimalautomaten Fälle für die Minimierung Minimierungsalgorithmus für deterministische endliche Automaten (mit totaler Übergangsfunktion)

Mehr

Paradigmen-lose, Halb-paradigmatische & Hybride Theorien von M

Paradigmen-lose, Halb-paradigmatische & Hybride Theorien von M Paradigmen-lose, Halb-paradigmatische & Hybride Theorien von Morphologie Jochen Trommer jtrommer@uni-leipzig.de Universität Leipzig Institut für Linguistik Paradigmen WS 2008/2009 Morphologische Theorien

Mehr

Einführung in die Computerlinguistik: Morphologie und Automaten I

Einführung in die Computerlinguistik: Morphologie und Automaten I Einführung in die Computerlinguistik: Morphologie und Automaten I WS 2013/2014 Manfred Pinkal Morphologie Morphologie ist der Teilbereich der Linguistik, der sich mit der internen Struktur von Wörtern

Mehr

Morphologie. 1. Flexion und Derivation 2. Analyse mittels lexikalischer Regeln

Morphologie. 1. Flexion und Derivation 2. Analyse mittels lexikalischer Regeln Morphologie 1. Flexion und Derivation 2. Analyse mittels lexikalischer Regeln Morphologie Flexion Deklination Flexion der Nomina: Deklination Hund Hund-es Hund-e Hund-en (Stamm + Suffix) Mann Mann-es Männ-er

Mehr

Was ist ein Wort? Morphologie I Einf. in die Linguistik

Was ist ein Wort? Morphologie I Einf. in die Linguistik Morphologie I Einf. in die Linguistik Was ist ein Wort? Ich will Rad fahren Ich will radfahren Ich will Räder fahren *Ich will räderfahren 1 Wenn es flektiert ist, ist es ein Wort. (und wenn es keine sichtbare

Mehr

Computerlinguistik I

Computerlinguistik I Computerlinguistik I Vorlesung im WS 2007/08 Prof. Dr. Udo Hahn Lehrstuhl für Computerlinguistik Institut für Germanistische Sprachwissenschaft Friedrich-Schiller-Universität Jena Morphologie A writer

Mehr

Zweitspracherwerb und Sprachverarbeitung bei Erwachsenen. Kathleen Neubauer

Zweitspracherwerb und Sprachverarbeitung bei Erwachsenen. Kathleen Neubauer Zweitspracherwerb und Sprachverarbeitung bei Erwachsenen Kathleen Neubauer 8. Sitzung am 2.12.2009 Morphologische Sprachverarbeitung Überblick Morphologische Grundlagen Modelle morphologischer Verarbeitung

Mehr

Morphologie und Syntax

Morphologie und Syntax Morphologie und Syntax Gerhard Jäger 27. Juni 2006 1 Wortbildung: Komposition Zusammenfügen von Wörtern (bzw. Stämmen 1 ) zu neuen Wörtern ist rekursiv: Kompositum (Ergebnis eines Wortbildungsprozesses)

Mehr

Einführung in die Computerlinguistik

Einführung in die Computerlinguistik Einführung in die Computerlinguistik Statistische Grundlagen Laura Kallmeyer Heinrich-Heine-Universität Düsseldorf Summer 2016 1 / 21 Diskrete Wahrscheinlichkeitsräume (1) Carstensen et al. (2010), Abschnitt

Mehr

Korrekturprogramme. Von Emine Senol & Gihan S. El Hosami

Korrekturprogramme. Von Emine Senol & Gihan S. El Hosami Korrekturprogramme Von Emine Senol & Gihan S. El Hosami Einleitung Millionen von Texten werden mit dem Computern täglich erfasst Fehler schleichen sich ein Korrekturprogramme helfen diese zu finden zu

Mehr

Earley Parsing. Parsing - WS 2012 / 2013 Lisa Orszullok & Anika Stallmann

Earley Parsing. Parsing - WS 2012 / 2013 Lisa Orszullok & Anika Stallmann Earley Parsing Parsing - WS 2012 / 2013 Lisa Orszullok & Anika Stallmann 12.12.2012 Agenda Basics Komponenten Earley Parsing - Recognizer Earley Parsing - Parser Vor- und Nachteile Parsing WS 2012/2013

Mehr

KASUS NUMERUS GENUS DEKLIN. MUSTER/PARA. -en Gen (Sg) Schw 10 / 26

KASUS NUMERUS GENUS DEKLIN. MUSTER/PARA. -en Gen (Sg) Schw 10 / 26 Adjektiv-Schema Deutsche Nomen und Adjektive haben wesentlich mehr Paradigmen als unterschiedliche lexikalische Formen. Für die Endungsformen -en und -e ergeben sich 26 bzw. 11 Paradigmen. Eine Darstellung

Mehr

Wortbildung und Wortbildungswandel

Wortbildung und Wortbildungswandel Germanistik Kira Wieler Wortbildung und Wortbildungswandel Studienarbeit Inhaltsverzeichnis 1 Einleitung... 2 2 Wortbildung... 2 2.1 Morphologische Grundbegriffe... 2 2.2 Arten der Wortbildung... 3 2.3

Mehr

Machine Translation with Inferred Stochastic Finite-State Transducers

Machine Translation with Inferred Stochastic Finite-State Transducers Machine Translation with Inferred Stochastic Finite-State Transducers von Klaus Suttner HS: Endliche Automaten Dozentin: Karin Haenelt Seminar für Computerlinguistik Universität Heidelberg 29.06.09 Finite-state

Mehr

Distribution Dieser Begriff bezieht sich nicht nur auf morphologische Einheiten, sondern ist z.b. auch auf <Phoneme anwendbar.

Distribution Dieser Begriff bezieht sich nicht nur auf morphologische Einheiten, sondern ist z.b. auch auf <Phoneme anwendbar. Distribution Dieser Begriff bezieht sich nicht nur auf morphologische Einheiten, sondern ist z.b. auch auf

Mehr

Morphologie. Ending Khoerudin Deutschabteilung FPBS UPI

Morphologie. Ending Khoerudin Deutschabteilung FPBS UPI Morphologie Ending Khoerudin Deutschabteilung FPBS UPI Morphologie Was ist ein Wort? Morphologie ist linguistische Teildisziplin, die sich mit dem Gestalt, Flexion (Beugung) und Bildung von Wörtern beschäftigt.

Mehr

Transformation-Based Error-Driven Learning: Eine Fallstudie in Part of Speech Tagging

Transformation-Based Error-Driven Learning: Eine Fallstudie in Part of Speech Tagging Transformation-Based Error-Driven Learning: Eine Fallstudie in Part of Speech Tagging Malte Helmert 23. Februar 2000 Seminar Autonome Mobile Systeme/Machine Learning Übersicht 1. Part of Speech Tagging

Mehr

Outline. Morphologische Prozesse. Automaten. Schütze: Morphologie 2 / 17

Outline. Morphologische Prozesse. Automaten. Schütze: Morphologie 2 / 17 Outline 1 2 Schütze: Morphologie 2 / 17 (Weitere) Schütze: Morphologie 3 / 17 (Weitere) Wir können verschiedene Prozesse unterscheiden, mithilfe derer Wortformen aus elementareren Elementen wie z.b. Morphemen

Mehr

Tagger for German. Online BRILL-Tagger für das Deutsche

Tagger for German. Online BRILL-Tagger für das Deutsche Tagger for German Online BRILL-Tagger für das Deutsche Morphologie V/Ü, Anke Holler Uni Heidelberg, SS2007 Nataliya Mytyay Éva Mújdricza 19.07.2007 Designed by: Dóra Dobos Tagger for German Eric Brill

Mehr

Wortdekodierung. Vorlesungsunterlagen Speech Communication 2, SS Franz Pernkopf/Erhard Rank

Wortdekodierung. Vorlesungsunterlagen Speech Communication 2, SS Franz Pernkopf/Erhard Rank Wortdekodierung Vorlesungsunterlagen Speech Communication 2, SS 2004 Franz Pernkopf/Erhard Rank Institute of Signal Processing and Speech Communication University of Technology Graz Inffeldgasse 16c, 8010

Mehr

Morphologie: Was bisher geschah. Morphologie IV. Morphologie. Überblick. Derivation

Morphologie: Was bisher geschah. Morphologie IV. Morphologie. Überblick. Derivation Morphologie: Was bisher geschah Morphologie IV Derivation Gerrit Kentner Wortbegriff, Morphembegriff, Morphemklassifikation Derivation Komposition 18. Januar 2012 1 / 22 2 / 22 Morphologie Überblick heute:

Mehr

Reguläre Ausdrücke. Karin Haenelt

Reguläre Ausdrücke. Karin Haenelt Reguläre Ausdrücke Karin Haenelt 25.04.2010 1 Inhalt Einführung Definitionen Kleene-Theorem Schreibweisen regulärer Ausdrücke Eigenschaften regulärer Sprachen 2 Was sind reguläre Ausdrücke? Reguläre Ausdrücke

Mehr

Einführung in die französische Morphologie

Einführung in die französische Morphologie Nikolaus Schpak-Dolt Einführung in die französische Morphologie 2., neu bearbeitete Auflage Max Niemeyer Verlag Tübingen 2006 Inhalt Abkürzungen und Symbole Phomembestand XI XII Einleitung 1 l._ Gegenstandsbereich

Mehr

Übung zur Vorlesung Einführung in die Computerlinguistik und Sprachtechnologie

Übung zur Vorlesung Einführung in die Computerlinguistik und Sprachtechnologie Übung zur Vorlesung Einführung in die Computerlinguistik und Sprachtechnologie Wintersemester 2009/10, Prof. Dr. Udo Hahn, Erik Fäßler Übungsblatt 6 vom 10.12.2009 Abgabe bis 15.12.2009, 23:59 Uhr; per

Mehr

Plank, WS 03/04, EinfLing, M&S 4b 1 Morphologische Analyse:

Plank, WS 03/04, EinfLing, M&S 4b 1 Morphologische Analyse: Plank, WS 03/04, EinfLing, M&S 4b 1 Morphologische Analyse: Segmentieren in Morphe (gegebenenfalls) Zusammenfassen von Morphen als Realisierungen eines Morphems Erfassen von Allomorphie-Beziehungen (Art

Mehr

Einführung in die Computerlinguistik. Morphologie I

Einführung in die Computerlinguistik. Morphologie I Einführung in die Computerlinguistik Morphologie I Hinrich Schütze & Robert Zangenfeind Centrum für Informations- und Sprachverarbeitung, LMU München 26.10.2015 Schütze & Zangenfeind: Morphologie I 1 /

Mehr

Einführung in die Computerlinguistik Statistische Grundlagen

Einführung in die Computerlinguistik Statistische Grundlagen Diskrete Wahrscheinlichkeitsräume (1) Einführung in die Computerlinguistik Statistische Grundlagen Laura Heinrich-Heine-Universität Düsseldorf Wintersemester 2011/2012 In vielen Bereichen der CL kommt

Mehr

Syntax Morphosyntaktische Merkmale

Syntax Morphosyntaktische Merkmale Syntax Morphosyntaktische Merkmale Modul 04-006-1003 Syntax und Semantik Institut für Linguistik Universität Leipzig home.uni-leipzig.de/heck Merkmale Fragestellung: Was sind die Grundbausteine der Syntax,

Mehr

Proseminar Syntax. Diana Schackow

Proseminar Syntax. Diana Schackow Proseminar Syntax Diana Schackow 1 Fahrplan Inhalt: Analyse syntaktischer Strukturen deskriptive Perspektive, typologische Vielfalt Vergleich verschiedener theoretischer Ansätze 2 Fahrplan Voraussetzungen:

Mehr

Was ist ein Wort? Einführung in die Linguistik Butt / Eulitz / Wiemer Di. 12:15-13:45 Do.! 12:15-13:45 Fr.! 12:15-13:45

Was ist ein Wort? Einführung in die Linguistik Butt / Eulitz / Wiemer Di. 12:15-13:45 Do.! 12:15-13:45 Fr.! 12:15-13:45 Einführung in die Linguistik Butt / Eulitz / Wiemer Di. 12:15-13:45 Do.! 12:15-13:45 Fr.! 12:15-13:45 Infos etc. http://ling.uni-konstanz.de => Lehre Einführung in die Linguistik Phonetik:! Phonologie:!

Mehr

Syntax und Parsing. OS Einblicke in die Computerlinguistik. Philipp Rabe, 13IN-M

Syntax und Parsing. OS Einblicke in die Computerlinguistik. Philipp Rabe, 13IN-M OS Einblicke in die Computerlinguistik basierend auf Computerlinguistik und Sprachtechnologie, 3. Auflage, Spektrum, Heidelberg 2010 22. Mai 2014 Ausgangssituation Tokenisierung und Wortarten-Tagging vollendet

Mehr

Einführung in die Computerlinguistik Vorbesprechung

Einführung in die Computerlinguistik Vorbesprechung Einführung in die Computerlinguistik Vorbesprechung Dozentin: Wiebke Petersen Wiebke Petersen Einführung CL (Vorbesprechung) 1 Willkommen in Ihrer vermutlich ersten CL-Veranstaltung Titel: Einführung in

Mehr

Vertiefung der Grundlagen der Computerlinguistik. Semesterüberblick und Einführung zur Dependenz. Robert Zangenfeind

Vertiefung der Grundlagen der Computerlinguistik. Semesterüberblick und Einführung zur Dependenz. Robert Zangenfeind Vertiefung der Grundlagen der Computerlinguistik Semesterüberblick und Einführung zur Dependenz Robert Zangenfeind Centrum für Informations- und Sprachverarbeitung, LMU München 17.10.2017 Zangenfeind:

Mehr

Determinisierung von Transduktoren

Determinisierung von Transduktoren Determinisierung von Transduktoren Inhalt Determinisierung von Transduktoren... Beschreibung der Funktion... 2 Grundgedanken und Beispiele... 2 2. Sequentialisierung... 2 2.2 Prinzip des Algorithmus: Teilmengenkonstruktion...

Mehr

VL Morphologie Hintergrund: Eine gemeinsame Analyse von Konversion, Derivation & Komposition

VL Morphologie Hintergrund: Eine gemeinsame Analyse von Konversion, Derivation & Komposition VL Morphologie Hintergrund: Eine gemeinsame Analyse von Konversion, Derivation & Komposition Anke Lüdeling anke.luedeling@rz.hu-berlin.de Sommersemester 2008 Plan Zusammenschau und Hintergrund: Komposition,

Mehr

Einführung in die Linguistik. Morphologie: Lösung

Einführung in die Linguistik. Morphologie: Lösung Einführung in die Linguistik WS05 Morphologie: Lösung Aufgabe 1 Welche Morpheme lassen sich in den folgenden Worten identifzieren und welche Bedeutung haben sie? Unterscheiden Sie zwischen: Flexion (Präfix,

Mehr

Einführung in die französische Morphologie

Einführung in die französische Morphologie Romanistische Arbeitshefte 36 Einführung in die französische Morphologie Bearbeitet von Nikolaus Schpak-Dolt 3., aktualisierte und erweiterte Auflage 2010. Taschenbuch. XII, 174 S. Paperback ISBN 978 3

Mehr

Linguistic Insights 202. English suffixes. Stress-assignment properties, productivity, selection and combinatorial processes

Linguistic Insights 202. English suffixes. Stress-assignment properties, productivity, selection and combinatorial processes Linguistic Insights 202 English suffixes Stress-assignment properties, productivity, selection and combinatorial processes Bearbeitet von Ives Trevian 1. Auflage 2015. Taschenbuch. XVI, 471 S. Paperback

Mehr

Minimalistische Morphologie SS 2013 Barbara Stiebels Stammallormorphie

Minimalistische Morphologie SS 2013 Barbara Stiebels Stammallormorphie Minimalistische Morphologie SS 2013 Barbara Stiebels 1862013 Stammallormorphie 1 Die Daten Im Ungarischen weisen eine Reihe von Substantiven einen 2 Stamm auf, der bei bestimmten Suffixen gewählt wird

Mehr

Der VITERBI-Algorithmus

Der VITERBI-Algorithmus Der VITERBI-Algorithmus Hauptseminar Parsing Sommersemester 2002 Lehrstuhl für Computerlinguistik Universität Heidelberg Thorsten Beinhorn http://janus.cl.uni-heidelberg.de/~beinhorn 2 Inhalt Ziel des

Mehr

Zweitspracherwerb und Sprachverarbeitung bei Erwachsenen. Kathleen Neubauer

Zweitspracherwerb und Sprachverarbeitung bei Erwachsenen. Kathleen Neubauer Zweitspracherwerb und Sprachverarbeitung bei Erwachsenen Kathleen Neubauer 9. Sitzung am 9.12.2009 Morphologische Sprachverarbeitung: Flexion Überblick Flexionsverarbeitung The past-tense debate L2-processing

Mehr

Geschichte: Indische Grammatiker. Einführung in die Morphologie Geschichte, Grundbegriffe. Geschichte: Griechische Grammatiker

Geschichte: Indische Grammatiker. Einführung in die Morphologie Geschichte, Grundbegriffe. Geschichte: Griechische Grammatiker Einführung in die Morphologie Geschichte, Grundbegriffe Anke Lüdeling anke.luedeling@rz.hu-berlin.de Sommersemester 2008 Indische Grammatiker Pānini, 5. Jhd. v. Chr. Wortstruktur: Basen und Affixe Einteilung

Mehr

Englische Morphologie und Wortbildung

Englische Morphologie und Wortbildung Englische Morphologie und Wortbildung Eine Einführung von Hans-Jörg Schmid ERICH SCHMIDT VERLAG Abktirzungsverzeichnis 11 1. Einführung 13 1.1 Warum Morphologie und Wortbildung"? 13 1.2 Zielsetzung und

Mehr

Grundkurs Linguistik Wintersemester 2014/15. Morphologie. Jens Fleischhauer & Anja Latrouite

Grundkurs Linguistik Wintersemester 2014/15. Morphologie. Jens Fleischhauer & Anja Latrouite Grundkurs Linguistik Wintersemester 2014/15 Morphologie Jens Fleischhauer & Anja Latrouite Morpho-logie morpho ( Gestalt ) logos ( Lehre ); Goethe 1796 Betrachten wir aber alle Gestalten, besonders die

Mehr

Computational Models

Computational Models - University of Applied Sciences - Computational Models - CSCI 331 - Friedhelm Seutter Institut für Angewandte Informatik Part I Automata and Languages 0. Introduction, Alphabets, Strings, and Languages

Mehr

Friedrich-Alexander-Universität Professur für Computerlinguistik. Nguyen Ai Huong

Friedrich-Alexander-Universität Professur für Computerlinguistik. Nguyen Ai Huong Part-of-Speech Tagging Friedrich-Alexander-Universität Professur für Computerlinguistik Nguyen Ai Huong 15.12.2011 Part-of-speech tagging Bestimmung von Wortform (part of speech) für jedes Wort in einem

Mehr

Einführung in die Computerlinguistik

Einführung in die Computerlinguistik Einführung in die Computerlinguistik Reguläre Ausdrücke und reguläre Grammatiken Laura Kallmeyer Heinrich-Heine-Universität Düsseldorf Summer 2016 1 / 20 Regular expressions (1) Let Σ be an alphabet. The

Mehr

Überführung regulärer Ausdrücke in endliche Automaten

Überführung regulärer Ausdrücke in endliche Automaten Der Algorithmus von Thompson Karin Haenelt 9.5.2010 1 Inhalt Quelle Prinzip des Algorithmus Algorithmus Konstruktion des Automaten Basisausdrücke Vereinigung, Konkatenation, Hülle Beispiel Implementierung

Mehr

Sprachsynthese: Textnormalisierung

Sprachsynthese: Textnormalisierung Sprachsynthese: (Änderungen von F. Schiel 2016) Institut für Phonetik und Sprachverarbeitung Ludwig-Maximilians-Universität München reichelu schiel@phonetik.uni-muenchen.de 24. Oktober 2016 Inhalt = Vorverarbeitung

Mehr

Ver-Verben. Verben. Welche Rolle spielen morphologische Eigenschaften der ver-verben im Spracherwerb?

Ver-Verben. Verben. Welche Rolle spielen morphologische Eigenschaften der ver-verben im Spracherwerb? Ver-Verben Verben Welche Rolle spielen morphologische Eigenschaften der ver-verben im Spracherwerb? Gliederung Theoretischer Hintergrund Hypothese und Vorhersage Variablen Methode Durchführung Material

Mehr

Spezielle Themen der KI. NLP Natural Language Processing. Sprachverstehen

Spezielle Themen der KI. NLP Natural Language Processing. Sprachverstehen Spezielle Themen der KI NLP Natural Language Processing Sprachverstehen NLP - Verarbeitungsstufen des Sprachverstehen 2 Phonologie und Phonetik Phonologie Lautlehre oder Sprachgebilde-Lautlehre untersucht

Mehr

Einführung in die Morphologie Geschichte, Grundbegriffe. Anke Lüdeling Sommersemester 2008

Einführung in die Morphologie Geschichte, Grundbegriffe. Anke Lüdeling Sommersemester 2008 Einführung in die Morphologie Geschichte, Grundbegriffe Anke Lüdeling anke.luedeling@rz.hu-berlin.de Sommersemester 2008 Geschichte: Indische Grammatiker Pānini, 5. Jhd. v. Chr. Wortstruktur: Basen und

Mehr

Tagging mit Hidden Markov Models und Viterbi-Algorithmus

Tagging mit Hidden Markov Models und Viterbi-Algorithmus Tagging mit Hidden Markov Models und Viterbi-Algorithmus Annelen Brunner, Stephanie Schuldes, Nicola Kaiser, Olga Mordvinova HS Parsing SoSe 2003 PD Dr. Karin Haenelt Inhalt Ziel des Seminarprojekts Theorie:

Mehr

Maschinelle Übersetzung

Maschinelle Übersetzung Endliche Automaten SS 08 Seminar für Computerlinguistik Universität Heidelberg 19. Juli 2008 1 Einführung 2 Subsequentieller Transduktor 3 OSTIA 4 Übersetzungsmodelle 5 Ergebnisse 6 Unser Experiment 7

Mehr

Maschinelle morphologische Analyse für das Deutsche. Ein Überblick. Exposé zur Studienarbeit

Maschinelle morphologische Analyse für das Deutsche. Ein Überblick. Exposé zur Studienarbeit Maschinelle morphologische Analyse für das Deutsche. Ein Überblick. Exposé zur Studienarbeit Peter Adolphs, 1. Juli 2005 Zusammenfassung: Ziel meiner Studienarbeit ist es, einen Überblick über bestehende

Mehr

Sprachtechnologie als Grundlage für die maschinelle Auswertung von Texten

Sprachtechnologie als Grundlage für die maschinelle Auswertung von Texten Sprachtechnologie als Grundlage für die maschinelle Auswertung von Texten Dr-Ing Michael Piotrowski Leibniz-Institut für Europäische Geschichte @true_mxp Bamberg, 20 November 2015

Mehr

Einführung in die Computerlinguistik reguläre Sprachen und endliche Automaten

Einführung in die Computerlinguistik reguläre Sprachen und endliche Automaten Einführung in die Computerlinguistik reguläre Sprachen und endliche Automaten Dozentin: Wiebke Petersen Foliensatz 3 Wiebke Petersen Einführung CL 1 Describing formal languages by enumerating all words

Mehr

Informationsextraktion mit endlichen Automaten

Informationsextraktion mit endlichen Automaten Informationsextraktion mit endlichen Automaten HS: Information Retrieval Dozentin: Dr. Karin Haenelt Ruprecht-Karls-Universität Heidelberg Seminar für Computerlinguistik Referentinnen: Galina Sigwarth,

Mehr

Transduktoren für die Sprachverarbeitung. Karin Haenelt

Transduktoren für die Sprachverarbeitung. Karin Haenelt Transduktoren für die Sprachverarbeitung Karin Haenelt 1 Themen Einführung Äquivalenzen: Transduktoren und reguläre Relationen Transduktoren Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle

Mehr

Viterbi. Hidden Markov Models und POS Tagging mit dem Viterbi-Algorithmus. von Arndt Faulhaber und Benjamin Schlebes

Viterbi. Hidden Markov Models und POS Tagging mit dem Viterbi-Algorithmus. von Arndt Faulhaber und Benjamin Schlebes Viterbi Hidden Markov Models und POS Tagging mit dem Viterbi-Algorithmus von Arndt Faulhaber und Benjamin Schlebes Seminar: Endliche Automaten für die Sprachverarbeitung SS 2005 PD Dr. K. Haenelt 1/28

Mehr

Vorlesung Morphologie Flexion

Vorlesung Morphologie Flexion Vorlesung Morphologie 13.6. - Flexion Anke Lüdeling anke.luedeling@rz.hu-berlin.de Sommersemester 2008 Vertretung: Hagen Hirschmann Flexion Inhalte heute Flexionskategorien & Paradigmata Nomen Adjektive

Mehr

Gliederung. Informationsextraktion Materialien zur Vorlesung. Entwicklung eines regex für Firmennamen. Entwicklung eines regex für Firmennamen

Gliederung. Informationsextraktion Materialien zur Vorlesung. Entwicklung eines regex für Firmennamen. Entwicklung eines regex für Firmennamen Gliederung Informationsextraktion Materialien zur Vorlesung Beispiel: reguläre Ausdrücke für Firmennamen 1 D. Rösner Institut für Wissens- und Sprachverarbeitung Fakultät für Informatik Otto-von-Guericke

Mehr

Nikolaus Schpak-Dolt. Einführung in die Morphologie des Spanischen

Nikolaus Schpak-Dolt. Einführung in die Morphologie des Spanischen Nikolaus Schpak-Dolt Einführung in die Morphologie des Spanischen Max Niemeyer Verlag Tübingen 1999 Inhalt Abkürzungen und Symbole XI Einleitung f. 1 1. Gegenstandsbereich der Morphologie 1 2. Diachronie

Mehr

Automatische Lexikonakquisition aus Textkorpora. Vortrag von Peter Adolphs Forschungskolloquium Korpuslinguistik 14. Juni 2006

Automatische Lexikonakquisition aus Textkorpora. Vortrag von Peter Adolphs Forschungskolloquium Korpuslinguistik 14. Juni 2006 Automatische Lexikonakquisition aus Textkorpora Vortrag von Peter Adolphs Forschungskolloquium Korpuslinguistik 14. Juni 2006 Inhalt Vorüberlegungen zu meiner Diplomarbeit Thema: (semi-)automatische Akquisition

Mehr

S6 R7 G8 F5 D7 D6 D5 D4 B4 B3 B2 B1 A4 A3 A2 A1

S6 R7 G8 F5 D7 D6 D5 D4 B4 B3 B2 B1 A4 A3 A2 A1 SG 2.7 Beginn 3.BA Abd9 Abd8 Abd7 Abd6 Abd5 Abd4 Abd3 AB15 AB14 AB13AB12AB11AB10AB9 AB8 AB7 AB6 AB5 AB4 AB3 Z15 Y11 S14 R14 R13 Q13 W12 D17 D16 Z14 V12 S13 R12 Q12 D15 Z13 Z12 Z11 V11 S12 Y10 Q11 D14 V10

Mehr

Basisterminologie I: Basis, Affix, Stamm und Co. Programm. Basisterminologie I: Basis, Affix, Stamm und Co

Basisterminologie I: Basis, Affix, Stamm und Co. Programm. Basisterminologie I: Basis, Affix, Stamm und Co Programm o S. Hackmack Uni Bremen FB 10 PHONMORPH 1 Basiskonzepte der Morphologie o Lexem, Morphem & Co.: Grundbegriffe der Wortanalyse mit Exkurs über linguistische Problemfälle / Argumentation S. Hackmack

Mehr

Lateinische Morphologie: Anleitung

Lateinische Morphologie: Anleitung Im Folgenden geht es darum, eine knappe Anleitung für die morphologische Analyse einiger einfacher lateinischer Sätze zu geben. Diese folgt den Schritten, die in der ersten Einführung in die Arbeitsweise

Mehr

Computerlexikographie-Tutorium

Computerlexikographie-Tutorium Computerlexikographie-Tutorium 18.04.2008 Thema für heute: lexikalische Regeln nach Daniel Flickinger Computerlexikographie PS, Ruprecht-Karls-Universität Heidelberg, SS08 Dozentin: Claudia Kunze ~*~ Tutorin:

Mehr

13. Wörter und Morpheme

13. Wörter und Morpheme Kapitel 13: Wörter und Morpheme 225 13. Wörter und Morpheme Platz der Morphologie im Gesamtsystem Verhältnis von Sprecher, Hörer und Zeichenoberfläche Hoerer Zeichen Sprecher Kapitel 13: Wörter und Morpheme

Mehr

Einführung in die Computerlinguistik reguläre Sprachen und endliche Automaten

Einführung in die Computerlinguistik reguläre Sprachen und endliche Automaten Einführung in die Computerlinguistik reguläre Sprachen und endliche Automaten Dozentin: Wiebke Petersen May 3, 2010 Wiebke Petersen Einführung CL (SoSe2010) 1 Operationen auf Sprachen Seien L Σ und K Σ

Mehr