Morphologie mit Endlichen Automaten

Größe: px
Ab Seite anzeigen:

Download "Morphologie mit Endlichen Automaten"

Transkript

1 Morphologie mit Endlichen Automaten Annika Scheffler, Lothar Zauner Lehrstuhl für Computerlinguistik Sommersemester 2003 HS Parsing, Dr. Karin Haenelt

2 Gliederung Grundlagen Verknüpfung von Stamm-und Endungsautomat Evaluierung 2

3 1. Grundlagen Ziel Aufgaben Lösungsansatz Komponenten für morphologischen Modellierung Phänomene Two-Level-Morphology 3

4 Ziel Ziel Analyse: Erkennung von Wortformen Zuordnung einer Grundform Erkennung einer morphotaktischen Strukturbeschreibung Generierung: Erzeugung von Wortformen zu einer gegebenen Grundform und gegebenen morphologischen Attributen 4

5 Aufgaben Aufgaben Behandlung von Item-and-Arrangement (ohne Stammveränderung) Behandlung von Item-and-Process (mit Stammveränderung) Behandlung von abweichenden Rechtschreibregeln Behandlung von Mehrdeutigkeiten 5

6 Lösungsansätze Modell: Two-Level-Morphology zur Behandlung von phonologischen und orthographischen Regelhaftigkeiten zur wechselseitigen Verwendung der Automaten für Analyse und Generierung Ausführung: Finite State Tranducer 6

7 Komponenten für morphologische Modellierung Transducer: Stämme Endungen Morphotaktik Regeln Systemarchitekturen: Kaskade Verknüpfung Traversionsalgorithmen: Backtracking Agenda 7

8 Überblick Wörter Wortformen Flexion Wortbildung Derivation Komposition 8

9 Morpheme Freie Morpheme (Stamm) Können allein stehen Gebundene Morpheme (Affixe) Können nicht allein stehen Präfixe un + endlich Suffixe ess + bar Zirkumfixe ge + lauf + en Infixe (U.S. Umgangssprache) abso + bloddy + lutely 9

10 Phänomene I: Flexion Änderung der grammatikalischen Funktion durch Affigierung Keine Änderung der Wortart Bildung von Paradigmen Konjugation, Deklination Item-and-Arrangement (ohne Stammveränderung) Stamm + Affix cat + s Item-and-Process (mit Stammveränderung) goose geese 10

11 Phänomene II: Derivation Bildung von neuen Wörtern Änderung der Wortart durch Affigierung (Einem freien Morph wird ein gebundenes Morph hinzugefügt) Suffix -ation Base Verb/Adjective to computerize (V) Derived Noun computerization Suffix Base Noun/Verb Derived Adjective -al computation (N) computational -ee to appoint (V) apointee -able embrace (V) embracable -er to kill (V) killer -less clue (N) clueless -ness fuzzy (A) fuzziness 11 Jurafsky, Martin: Morphology and Finite State Transducers, 2000: 64

12 Phänomene III: Komposition Allgemein: Das Zusammenfügen von zwei freien Morphen Wörter + Buch Ambiguitäten: Staubecken, Druckerzeugnis Stau - becken oder Staub - ecken? Druck - erzeugnis oder Drucker - zeugnis? 12

13 Unregelmäßigkeiten für Englisch Stammänderung goose - geese; mouse - mice Null-Morphem fish, sheep Endung auf -es (-en) nach Wörtern, die auf x,s,z enden fox - fox-e-s, ox - ox-e-n 13

14 Einige abweichende Rechtschreibregeln Name Description of Rule Example Consonant doubling E deletion E insertion Y replacement K insertion consonant doubled before ing/ ed Silent e dropped before ing and ed e added after s, z, x, ch, sh before s y changes to ie before s, i before ed verbs ending with vowel + c add k before -ed beg/begging make/making watch/watches try/tries panic/panicked Jurafsky, Martin: Morphology and Finite-State-Transducers, page 77 14

15 Two-Level-Morphology zuerst vorgeschlagen von Koskenniemi (1983) Ziele: Erzeugung der Strukturausgabe des morphologischen Parsings direkt aus dem Erkennungsautomaten Generierung von Wortformen direkt aus der Erkennung der morphologischen Beschreibung Ansatz: Repräsentation von Wörtern als Korrespondenz zwischen lexikalischer Ebene: Konkatenation von Morphemen Oberflächenebene: Repräsentation der Schreibung des Wortes 15

16 Two-Level-Morphology, Teil 1 Item-and-Arrangement/Konkatenative Morphologie C A T +N +PL C A T S lexical level surface level Item-and-Process/Nicht-konkatenative Morphologie G O O S E +N +PL lexical level G E E S E # surface level 16

17 Beispiel 1 Item-and-Arrangement Σ = {c, a,t, ε, s } = {c, a, t, +N, +PL} Q = {q 0,q 1,q 2,q 3,q 4,q 5 } S = {q 0 } F = {q 5 } δ (q, i:o, q ) Übergänge in Form von Drei-Tupeln: (q 0, c:c, q 1 ) (q 1, a:a, q 2 ) (q 2, t:t, q 3 ) (q 3,ε:+N,q 4 ) (q 4, s:+pl,q 5 ) q 0 c:c q 1 a:a q 2 t:t q 3 ε:+n q 4 s:+pl q 5 17

18 g:g Σ = {g, e, e, s, e, ε, #} = {g, o, o, s, e, N, PL} Q = {q 0 - q 7 } S = q 0 F = q 7 δ (q,i:o,q ) q 0 q 1 o:e o:e s:s Beispiel 2 Item-and-Process e:e q 2 q 3 q 4 q 5 ε:n #:+PL q 6 q 7 Anweisungen (Übergänge): (q 0, g:g, q 1 ) (q 1, o:e, q 2 ) (q 2, o:e, q 3 ) (q 3, s:s, q 4 ) (q 4, e:e, q 5 ) (q 5, ε:+n, q 6 ) (q 6, #: +PL, q 7 ) 18

19 Two-Level-Morphology, Teil 2 Zwei Einträge für das gleiche Wort C A N T O +N +Masc +Sg C A N T O C A N T A R +V +Prs +1p +Sg C A N T O 19

20 Beispiel 3 Ambiguitäten Backtracking Σ = {c, a, n, t, o} = {c, a, n, t, o, a, r, +N, +Msc, + Sg, +V +Prs, +1p, +Sg} Übergänge: (q0, c:c, q1) (q1, a:a, q2) (q2, n:n, q3) (q3, t:t, q4) (q4, o:o, q5),(q4,o:a,q6) (q5,e :noun,q7) (q6,e :r,q8) (q7,e :masc,q9) (q8,e :verb, q10) (q9,e :sg,q11) (q10,e :presind, q12) (q11,no arcs) (q12,e :1p,q9) c:c a:a n:n t:t o:o q 0 q 1 q 2 q 3 q 4 o:a ε:+noun ε:+masc ε:+sg q 5 q 7 q 9 q q ε:r ε:+verb 12 6 q 8 q 10 ε:+pres 20 q 11 ε:+1p

21 2. Grundlagen Morphologisches Parsing Morphologisches Parsing Komponenten für einen morphologischen Parser Verknüpfung der Komponenten Systemarchitektur Kaskadierung Systemarchitektur Verknüpfung 21

22 Input cats cat cities geese goose merging Morphologisches Parsing Morphological Parsed Output cat +N +PL cat +N +SG city +N +PL goose +N +PL goose +N +SG merge +V +PRES-PART Jurafsky, Martin: Morphology and Finite-State-Transducers, 2000:65 22

23 Komponenten für einen morphologischen Parser Lexikon: Liste von Stämmen und Affixen, zusammen mit grundlegenden Informationen (z.b. Nomen, Verb etc.) Morphotaktik: Modell der Morphemordnung, die festlegt, welche Morphemklassen auf andere folgen können. Bsp..: In europäischen Sprachen folgt das Plural-Morphem dem Nomen Rechtschreibregeln: legen die Änderungen fest, die in einem Wort auftauchen, wenn zwei Morpheme miteinander kombiniert werden. 23

24 Verknüpfung der Komponenten Kaskadierung: Hintereinanderschalten von mehreren Transduktoren in Serie. Der Output des ersten ist der Input des zweiten usw.: A:B B:C C:D D:E Zur Laufzeit werden mehrere Automaten durchlaufen Integrierter Gesamtautomat: A:E Zur Laufzeit wird nur ein integrierter Automat durchlaufen Variante a) Konkatenation und Vereinigung Variante b) Komposition 24

25 Systemarchitektur Kaskadierung Input: Zeichenkette Output: Morpheme Input: Morpheme Output: Wörter 25

26 Systemarchitektur Konkatenation Spezifikation des Lexikons: Nominalstämme Lexikon Compiler Lexikon als FST Nominalendungen Verbstämme Lexikon Compiler Lexikon Compiler Lexikon als FST Lexikon als FST Kombination: Verkettung Vereinigung, (Sequentialisierung) Gesamt FST Verbendungen Lexikon Compiler Lexikon als FST Größenordnung: 2 GB 26

27 Intersection and Composition of Transducers LEXICON - FST LEXICON - FST LEXICON FST compose FST A FST 1... FST N intersect FST A (= FST 1 ^ FST 2 ^ FST N ) Jurafsky, Martin: Morphology with Finite-State-Transducers, 2000:82 27

28 2. Verknüpfung von Stamm- und Endungsautomat Verarbeitungsvarianten: Kaskade Integrierter Gesamtautomat Variante a) Konkatenation und Vereinigung Variante b) Komposition Automaten für Konkatenation und Vereinigung Stammautomaten, Endungsautomaten Automaten für Komposition Stammautomat und Endungsautomat, Regelautomat Ergebnis: Integrierter Gesamtautomat 28

29 Komponenten: Kaskade Lexikonautomaten mit Ausgabe der Morpheme Morphotaktik-Automat, der die Ausgabe aus den Lexikonautomaten verarbeitet 29

30 Kaskadierung von T lex und T rule F O X E S F O X ^ S # F O X ^ S # Surface level Intermediate level F O X +N +PL Lexical level Kaskadierung: Es handelt sich um zwei in Serie geschaltete Transducer. Der Output des ersten Transducers dient dem zweiten als Input. Die Rechtschreibregel fügt ein e auf dem Surface Level ein, wenn nach der Morphemgrenze ein s folgt 30

31 Generating or Parsing with FST Lexicon and Rules Lexical f o x +N +Pl LEXICON - FST Intermediate f o x ^ s FST 1 orthographic rules FST n Surface f o x e s Jurafsky, Martin: Morphology with Finite-State-Transducers, 2000:80 31

32 level 1 Kaskade preterite -ed reg.-verb-stem past part. -ed level 2 w a l k w a l k reg.-verb-stem e d preterite past part. 32

33 Kaskade Beispiel: FSA Flexion irreg-past-verb-form reg-verb-stem preterite (-ed) q 0 q 1 q 3 past participle (-ed) reg-verb -stem prog (-ing) irreg-verb-stem q 2 3-sing (-s) Jurafsky, Martin: Morphology and Finite-State-Transducers, 2000 : 67 33

34 Übersicht des integrierten Stammautomat durch Konkatenation und Vereinigung Konkatenation Vereinigung stem 1 end 1 stem 1 end 1 stem 1 end 1 stem 2 end 2 stem 2 end 2 stem 2 end 2 stem 3 end 3 stem 3 end 3 stem 3 end 3 34

35 Lex. Basic dog reg. noun 1 fox reg. noun 2 goose irreg. noun sg. geese irreg. noun pl. lex. reg. noun 1 ε sg. s pl. lex. reg. noun 2 ε sg. es pl. lex. irreg. noun sg. ε sg. lex. irreg. noun pl. ε pl. Konkatenation reg.noun 1 d o g reg.noun 2 f o x g o o s e g e e s e 35 sg. ε pl. s sg. ε pl. es irreg.sg. irreg.pl.

36 Konkatenation Komponenten: Stammautomaten mit Referenz auf die Endungsautomaten (ergibt Bündelung von Endzuständen des Stammautomaten) Endungsautomaten, die den einzelnen Referenzen entsprechen 36

37 Stammautomaten für Konkatenation T stem11 f o x c a t T stem12 d o g g o o s e T stem13 s h e e p m o u s e g e:o e:o s e T stem14 s h e e p m i:o e:u s:c e 37

38 Endungsautomaten für Konkatenation T num11 T num12 T num13 T num14 e:+n #:SG ^es#:pl T num11 e:+n #:SG ^s#:pl T num12 e:+n #:SG T num13 e:+n #:PL T num14 38

39 Lexikonautomat nach Konkatenation und Vereinigung f o x c a t d o g g o o s e e:+n s h e e p e m o u s g e:o e:+n e:o s e s e:+n ^es#:pl #:SG ^s#:pl e:+n #:SG #:PL #:SG m h e e p i:o e:u s:c e 39

40 Komposition Beschreibung der Varianten der Flexion durch Regelautomaten Erforderliche Ergänzungen bei den Automaten für die Komposition: Zustandsübergang am Ende des Stammautomaten sorgt dafür, dass bei Schnittbildung mit dem Endungsautomaten der gesamte Endungsteil Element Durchschnittsmengen wird und unter Schnittbildung erhalten bleibt Zustandsübergang (q0,other : other,q0) am Beginn der Regelautomaten sorgt dafür, dass bei Schnittbildung mit dem Lexikonautomaten der gesamte Lexemteil Element der Durch-schnittsmengen wird und unter Schnittbildung erhalten bleibt 40

41 Endungsautomat für Komposition T num2 reg-noun-stem q 1 ε:+n q 4 ^s:+pl #:+SG q 0 irreg-sg-noun-stem q 2 ε:+n q 5 #:+SG q 7 irreg-pl-noun-stem ε: +N #:+PL q 3 q 6 41 Jurafsky, Martin: Morphology and Finite-State-Transducers, page 74

42 Stammautomat für Komposition T stem2 reg-noun-stem d o g reg-noun-stem c a t reg-noun-stem f o x irreg-sg-noun-stem g o o s * irreg-sg-noun-stem s h e e p q 0 q 1 irreg-sg-noun-stem m o u s e irreg-pl-noun-stem g o:e o:e s e irreg-pl-noun-stem s h e e p irreg-pl-noun-stem m o:i u:e s:c e Jurafsky, Morphology with Finite-State-Transducers, page 75 wildcard; steht für jedes realisierbare Paar 42

43 T rule : FST E-Insertion Regelautomat ^:ε other # other z,s,x z,s,x z,s,x ^:ε s q 5 ^:ε other: f o (q0,x:x,q1) (q1,^:ε,q2) (q2, ε:e,q3) (q3, s:s, q4) (q4, #:#,q0) other: f o (q0,x:x,q1) (q1,^:ε,q2) (q2,s:s,q5) (q5,#:#, -) rejected! s q 0 q 1 q 2 #, other z, x ε:e q 3 q 4 #, other # 43 Jurafsky, Martin: Morphology and Finite-State-Transducers, 2000 : 78

44 Lexikonautomat nach Komposition von Lexikon- und Regelautomat f o c a t d o g g o o s e e:+n s h e e p e m o u s g e:o e:+n e:o s e s x e:+n #:SG ^s#:pl e:+n #:SG #:PL ^es#:pl #:SG m h e e p i:o e:u s:c e 44

45 Accepting Foxes Lexical f o x +N +Pl T lex Intermediate f o x ^ s # T e-insert Surface f o x e s Jurafsky, Martin: Morphology with Finite-State-Transducers, 2000:81 45

46 Komposition Zwischenschritt: Veranschaulichung des Abgleichs von R und L Rule Stem other other x e s # q 0 q 0 q 0 q 1 q 2 q 3 q 4 q 0 other other x ^ ε s # ε f o x ^ s # l 0 l 1 l 2 l 5 l 6 l 7 l 8 l 9 f o x +N +PL ε ε ε Rule Ergebnis der Komposition ε f o x ^ e s # Stemq 0 l 0 q 0 l 1 q 0 l 2 q 1 l 5 q 1 l 6 q 2 l 7 q 3 l 7 q 4 l 8 q 0 l 9 f o x +N +PL ε s ε Karin Haenelt: FSA-Anwendung, Morphologie, 2003: 11 46

47 R s:s x:x z:z ^:ε ε :e # other q 0 q 1 q 1 q 1 q 0 - q 0 q 0 q 1 q 1 q 1 q 1 q 2 - q 0 q 0 q 2 q 5 q 1 q 1 q 0 q 3 q 0 q 0 q 3 q q q 0 - q 5 q 1 q 1 q 1 q q 0 Transitions- T a q 0l1 q 0l2 b q 0l3 q 0l4 q 0l5 e q 0l6 q 0l7 q 1l5 l q 1l6 q 1l8 l q 3l7 q 4l8 q 0l9 e n L a:a c:c f:f o:o t:t x:x +N:ε +PL:^ ε :s ε :# l0 l3 l1 l1 l2 l 5 l3 l4 l5 l4 l2 l6 l 7 l5 l7 l 8 l8 l9 R o L other other other other other x:x - ε ^: s:sε :e a:a c:c f:f o:o t:t x:x +N:ε +PL:^ ε:s - ε:# q 0l0 q0l3 q0l1 q 0l4 q0l2 q 2l7 q 5l8 q3l7 q0l5 q1l5 Karin Haenelt, FSA-Anwendung: Morphologie, 2003: 13 q0l6 q1l6 q 0l7 q 2l7 l6 q 1l8 q 4l8 q0l9 q0l9 47 l9

48 Integrierter Gesamtautomat T lex o T rule f o x ε ^ e s q 0 l 0 q 0 l 1 q 0 l 2 q 1 l 5 q 1 l 6 q 2 l 7 q 3 l 7 q 4 l 8 # f o x +N +PL ε ε ε q 0 l 9 c a t ε ^ s # c q 0 l 3 q 0 l 4 a t q +N q l 0 6 +PL q l q l 0 l ε 1 8 ε Karin Haenelt, FSA-Anwendung: Morphologie, 2003: 14 48

49 Komposition von Lexikonautomat und Regelautomat: Erläuterung Aufgrund der other-kante im Regelautomaten wird zunächst jeder Nominalstamm geprüft Treffen die Bedingungen zu, wird ein e eingefügt, sonst nicht Durch die Komposition von T lex und T rule entstehen unterschiedliche Pfade für verschiedene Nominalstämme Daher müssen Kanten u.u. vervielfacht werden 49

50 Vorteile Kaskadierung: 3. Evaluierung viele, kleine Automaten verbraucht wenig Speicher größere Portabilität (Einsatzmöglichkeiten in verschiedenen Programmen) Nachteile Kaskadierung: es müssen viele Zwischenergebnisse verarbeitet werden langsamere Laufzeit Vorteile Komposition: schnelle Laufzeit - es müssen keine Zwischenschritte verarbeitet werden Nachteile Komposition: bei der Schnittmengenbildung müssen Teile vervielfacht werden erfordert viel Hauptspeicher (ca. 2GB!!) 50

51 Literatur Beesely, Kenneth R.; Karttunen, Lauri: Finite-State Morphology: Xerox Tools and Techniques, 1999 Haenelt, Karin, Endliche Automaten: Anwendungen: Morphologie. Kursfolien Morph.pdf Jurafsky, Daniel; Martin; Hames H.: Speech and Language Processing. An Introduction to Natural Language Processing, Computational Linguistics, and Speech Recognition Upper Saddle River, N.J.:Prentince Hall 2000, Kap.3 Morphology and Finite-State-Transducers, p Trommer, Jochen: Morphologie. Carstensen, Ebert, Endriss, Jekat, Klabunde, Langer, Computerlinguistik und Sprachtechnologie, Heidelberg, Berlin 2001, S. Trost, Harald: Morphology. The Oxford Handbook of Computational Linguistics, Oxford 2003, p

Einführung in die Computerlinguistik Finite State Transducers und Morphologie

Einführung in die Computerlinguistik Finite State Transducers und Morphologie Einführung in die Compuerlinguisik Finie Sae Transducers und Morphologie Laura Heinrich-Heine-Universiä Düsseldorf Sommersemeser 2013 FST und Morphologie 1 Sommersemeser 2013 Morphologische Grundbegriffe

Mehr

Einführung in die Computerlinguistik Morphologie (1): morphembasierte Morphologie mit Transduktoren

Einführung in die Computerlinguistik Morphologie (1): morphembasierte Morphologie mit Transduktoren Einführung in die Computerlinguistik Morphologie (1): morphembasierte Morphologie mit Transduktoren Dozentin: Wiebke Petersen 14.6.2010 Wiebke Petersen Einführung CL SoSe 2010 1 Morphologische Grundbegrie

Mehr

Einführung in die Computerlinguistik Morphologie (morphembasiert mit Transduktoren)

Einführung in die Computerlinguistik Morphologie (morphembasiert mit Transduktoren) Einführung in die Computerlinguistik Morphologie (morphembasiert mit Transduktoren) Dozentin: Wiebke Petersen 7. Foliensatz Wiebke Petersen Einführung CL 1 Morphologische Grundbegrie Wort / Lexem: abstrakte

Mehr

Operationen auf endlichen Automaten und Transduktoren

Operationen auf endlichen Automaten und Transduktoren Operationen auf endlichen Automaten und Transduktoren Kursfolien Karin Haenelt 1 Notationskonventionen L reguläre Sprache A endlicher Automat DEA deterministischer endlicher Automat NEA nichtdeterministischer

Mehr

Centrum für Informations- und Sprachverarbeitung Uni München Repetitorium ZP Sommersemester 09. Morphologie. Alla Shashkina

Centrum für Informations- und Sprachverarbeitung Uni München Repetitorium ZP Sommersemester 09. Morphologie. Alla Shashkina Morphologie Alla Shashkina Morphologie (= Formenlehre) untersucht systematische Beziehungen zwischen Wörtern und Wortformen Regeln, nach denen Wörter/Wortformen gebildet werden 2 Ziel in der Computerlinguistik

Mehr

Transduktoren & computationelle Morphologie

Transduktoren & computationelle Morphologie Transduktoren & computationelle Morphologie Machine Language Processing Heike Zinsmeister WS 2008/09 Motivation Letzte Woche: Automaten erlauben, Wörter kompakt zu repräsentieren Wörter sind in sich komplex

Mehr

Operationen auf endlichen Akzeptoren und Transduktoren

Operationen auf endlichen Akzeptoren und Transduktoren Operationen auf endlichen Akzeptoren und Transduktoren Definitionen, Algorithmen, Erläuterungen und Beispiele - eine Übersicht Karin Haenelt, 28.5.2010 ( 1 25.04.2004) Operationen auf endlichen Akzeptoren

Mehr

Two-Level Morphology VERSION 1.0

Two-Level Morphology VERSION 1.0 Two-Level Morphology STEFAN LANGER, CIS UNIVERSITÄT MÜNCHEN SOMMERSEMESTER 2016 VERSION 1.0 Übersicht Flexionsmorphologie Ansätze zur Behandlung in der Sprachverarbeitung Two-level morphology Lexikon und

Mehr

Operationen auf endlichen Automaten und Transduktoren

Operationen auf endlichen Automaten und Transduktoren Operationen auf endlichen utomaten und Transduktoren en, lgorithmen, Erläuterungen und e - eine Übersicht Karin Haenelt, 5.4.4 Vorbemerkung... Notationskonventionen... 3 Übersicht der Operationen...3 4

Mehr

Zwei-Ebenen-Morphologie

Zwei-Ebenen-Morphologie Gerold Schneider: Morphologieanalyse und Lexikonaufbau, 5. Vorlesung Seite 1 Zwei-Ebenen-Morphologie Morphologieanalyse und Lexikonaufbau (5. Vorlesung) Dozent: Gerold Schneider Übersicht Einleitung Endliche

Mehr

Lemmatisierung und Stemming in Suchmaschinen

Lemmatisierung und Stemming in Suchmaschinen Lemmatisierung und Stemming in Suchmaschinen Hauptseminar Suchmaschinen Computerlinguistik Sommersemester 2016 Stefan Langer stefan.langer@cis.uni-muenchen.de Trefferquote (Recall) und Genauigkeit (Precision)

Mehr

Paradigmen-lose, Halb-paradigmatische & Hybride Theorien von M

Paradigmen-lose, Halb-paradigmatische & Hybride Theorien von M Paradigmen-lose, Halb-paradigmatische & Hybride Theorien von Morphologie Jochen Trommer jtrommer@uni-leipzig.de Universität Leipzig Institut für Linguistik Paradigmen WS 2008/2009 Morphologische Theorien

Mehr

Was ist ein Wort? Morphologie I Einf. in die Linguistik

Was ist ein Wort? Morphologie I Einf. in die Linguistik Morphologie I Einf. in die Linguistik Was ist ein Wort? Ich will Rad fahren Ich will radfahren Ich will Räder fahren *Ich will räderfahren 1 Wenn es flektiert ist, ist es ein Wort. (und wenn es keine sichtbare

Mehr

Morphologie. 1. Flexion und Derivation 2. Analyse mittels lexikalischer Regeln

Morphologie. 1. Flexion und Derivation 2. Analyse mittels lexikalischer Regeln Morphologie 1. Flexion und Derivation 2. Analyse mittels lexikalischer Regeln Morphologie Flexion Deklination Flexion der Nomina: Deklination Hund Hund-es Hund-e Hund-en (Stamm + Suffix) Mann Mann-es Männ-er

Mehr

Morphologie und Syntax

Morphologie und Syntax Morphologie und Syntax Gerhard Jäger 27. Juni 2006 1 Wortbildung: Komposition Zusammenfügen von Wörtern (bzw. Stämmen 1 ) zu neuen Wörtern ist rekursiv: Kompositum (Ergebnis eines Wortbildungsprozesses)

Mehr

Morphologie. Ending Khoerudin Deutschabteilung FPBS UPI

Morphologie. Ending Khoerudin Deutschabteilung FPBS UPI Morphologie Ending Khoerudin Deutschabteilung FPBS UPI Morphologie Was ist ein Wort? Morphologie ist linguistische Teildisziplin, die sich mit dem Gestalt, Flexion (Beugung) und Bildung von Wörtern beschäftigt.

Mehr

Wortbildung und Wortbildungswandel

Wortbildung und Wortbildungswandel Germanistik Kira Wieler Wortbildung und Wortbildungswandel Studienarbeit Inhaltsverzeichnis 1 Einleitung... 2 2 Wortbildung... 2 2.1 Morphologische Grundbegriffe... 2 2.2 Arten der Wortbildung... 3 2.3

Mehr

Reguläre Ausdrücke. Karin Haenelt

Reguläre Ausdrücke. Karin Haenelt Reguläre Ausdrücke Karin Haenelt 25.04.2010 1 Inhalt Einführung Definitionen Kleene-Theorem Schreibweisen regulärer Ausdrücke Eigenschaften regulärer Sprachen 2 Was sind reguläre Ausdrücke? Reguläre Ausdrücke

Mehr

Plank, WS 03/04, EinfLing, M&S 4b 1 Morphologische Analyse:

Plank, WS 03/04, EinfLing, M&S 4b 1 Morphologische Analyse: Plank, WS 03/04, EinfLing, M&S 4b 1 Morphologische Analyse: Segmentieren in Morphe (gegebenenfalls) Zusammenfassen von Morphen als Realisierungen eines Morphems Erfassen von Allomorphie-Beziehungen (Art

Mehr

Earley Parsing. Parsing - WS 2012 / 2013 Lisa Orszullok & Anika Stallmann

Earley Parsing. Parsing - WS 2012 / 2013 Lisa Orszullok & Anika Stallmann Earley Parsing Parsing - WS 2012 / 2013 Lisa Orszullok & Anika Stallmann 12.12.2012 Agenda Basics Komponenten Earley Parsing - Recognizer Earley Parsing - Parser Vor- und Nachteile Parsing WS 2012/2013

Mehr

Machine Translation with Inferred Stochastic Finite-State Transducers

Machine Translation with Inferred Stochastic Finite-State Transducers Machine Translation with Inferred Stochastic Finite-State Transducers von Klaus Suttner HS: Endliche Automaten Dozentin: Karin Haenelt Seminar für Computerlinguistik Universität Heidelberg 29.06.09 Finite-state

Mehr

Übung zur Vorlesung Einführung in die Computerlinguistik und Sprachtechnologie

Übung zur Vorlesung Einführung in die Computerlinguistik und Sprachtechnologie Übung zur Vorlesung Einführung in die Computerlinguistik und Sprachtechnologie Wintersemester 2009/10, Prof. Dr. Udo Hahn, Erik Fäßler Übungsblatt 6 vom 10.12.2009 Abgabe bis 15.12.2009, 23:59 Uhr; per

Mehr

Was ist ein Wort? Einführung in die Linguistik Butt / Eulitz / Wiemer Di. 12:15-13:45 Do.! 12:15-13:45 Fr.! 12:15-13:45

Was ist ein Wort? Einführung in die Linguistik Butt / Eulitz / Wiemer Di. 12:15-13:45 Do.! 12:15-13:45 Fr.! 12:15-13:45 Einführung in die Linguistik Butt / Eulitz / Wiemer Di. 12:15-13:45 Do.! 12:15-13:45 Fr.! 12:15-13:45 Infos etc. http://ling.uni-konstanz.de => Lehre Einführung in die Linguistik Phonetik:! Phonologie:!

Mehr

Linguistic Insights 202. English suffixes. Stress-assignment properties, productivity, selection and combinatorial processes

Linguistic Insights 202. English suffixes. Stress-assignment properties, productivity, selection and combinatorial processes Linguistic Insights 202 English suffixes Stress-assignment properties, productivity, selection and combinatorial processes Bearbeitet von Ives Trevian 1. Auflage 2015. Taschenbuch. XVI, 471 S. Paperback

Mehr

Grundkurs Linguistik Wintersemester 2014/15. Morphologie. Jens Fleischhauer & Anja Latrouite

Grundkurs Linguistik Wintersemester 2014/15. Morphologie. Jens Fleischhauer & Anja Latrouite Grundkurs Linguistik Wintersemester 2014/15 Morphologie Jens Fleischhauer & Anja Latrouite Morpho-logie morpho ( Gestalt ) logos ( Lehre ); Goethe 1796 Betrachten wir aber alle Gestalten, besonders die

Mehr

Spezielle Themen der KI. NLP Natural Language Processing. Sprachverstehen

Spezielle Themen der KI. NLP Natural Language Processing. Sprachverstehen Spezielle Themen der KI NLP Natural Language Processing Sprachverstehen NLP - Verarbeitungsstufen des Sprachverstehen 2 Phonologie und Phonetik Phonologie Lautlehre oder Sprachgebilde-Lautlehre untersucht

Mehr

Maschinelle morphologische Analyse für das Deutsche. Ein Überblick. Exposé zur Studienarbeit

Maschinelle morphologische Analyse für das Deutsche. Ein Überblick. Exposé zur Studienarbeit Maschinelle morphologische Analyse für das Deutsche. Ein Überblick. Exposé zur Studienarbeit Peter Adolphs, 1. Juli 2005 Zusammenfassung: Ziel meiner Studienarbeit ist es, einen Überblick über bestehende

Mehr

Friedrich-Alexander-Universität Professur für Computerlinguistik. Nguyen Ai Huong

Friedrich-Alexander-Universität Professur für Computerlinguistik. Nguyen Ai Huong Part-of-Speech Tagging Friedrich-Alexander-Universität Professur für Computerlinguistik Nguyen Ai Huong 15.12.2011 Part-of-speech tagging Bestimmung von Wortform (part of speech) für jedes Wort in einem

Mehr

Sprachtechnologie als Grundlage für die maschinelle Auswertung von Texten

Sprachtechnologie als Grundlage für die maschinelle Auswertung von Texten Sprachtechnologie als Grundlage für die maschinelle Auswertung von Texten Dr-Ing Michael Piotrowski Leibniz-Institut für Europäische Geschichte @true_mxp Bamberg, 20 November 2015

Mehr

Automatische Lexikonakquisition aus Textkorpora. Vortrag von Peter Adolphs Forschungskolloquium Korpuslinguistik 14. Juni 2006

Automatische Lexikonakquisition aus Textkorpora. Vortrag von Peter Adolphs Forschungskolloquium Korpuslinguistik 14. Juni 2006 Automatische Lexikonakquisition aus Textkorpora Vortrag von Peter Adolphs Forschungskolloquium Korpuslinguistik 14. Juni 2006 Inhalt Vorüberlegungen zu meiner Diplomarbeit Thema: (semi-)automatische Akquisition

Mehr

Überführung regulärer Ausdrücke in endliche Automaten

Überführung regulärer Ausdrücke in endliche Automaten Der Algorithmus von Thompson Karin Haenelt 9.5.2010 1 Inhalt Quelle Prinzip des Algorithmus Algorithmus Konstruktion des Automaten Basisausdrücke Vereinigung, Konkatenation, Hülle Beispiel Implementierung

Mehr

Morphologie: Was bisher geschah. Morphologie IV. Morphologie. Überblick. Flexion

Morphologie: Was bisher geschah. Morphologie IV. Morphologie. Überblick. Flexion Morphologie: Was bisher geschah Morphologie IV Gerrit Kentner Wortbegriff, Morphembegriff, Morphemklassifikation Derivation Komposition 19. Dezember 2012 1 / 34 2 / 34 Morphologie Überblick heute: Wortformbildung:

Mehr

Morphologie! Zusammenfassung Phonologie! Zusammenfassung Phonetik! Neues Thema:" artikulatorische Phonetik! akustische Phonetik! auditive Phonetik!

Morphologie! Zusammenfassung Phonologie! Zusammenfassung Phonetik! Neues Thema: artikulatorische Phonetik! akustische Phonetik! auditive Phonetik! Zusammenfassung Phonetik! artikulatorische Phonetik:! Terminologie: Phon (kleinste distinktive sprachliche Einheit); Teilbereiche:! artikulatorische Phonetik! akustische Phonetik! auditive Phonetik! akustische

Mehr

Tokenisierung und Lemmatisierung in Suchmaschinen

Tokenisierung und Lemmatisierung in Suchmaschinen Tokenisierung und Lemmatisierung in Suchmaschinen Hauptseminar Suchmaschinen Computerlinguistik Sommersemester 2010 Stefan Langer stefan.langer@cis.uni-muenchen.de Übung: Tokenisierung (5 min) Was ist

Mehr

Morphologische Prozesse

Morphologische Prozesse Morphologische Prozesse Übersicht Affigierung: Präfigierung, Suffigierung, Infigierung, Transfigierung Modifikation: Ablaut, Umlaut Konversion Komposition Morphologische Prozesse Wir können verschiedene

Mehr

Alle Menschen schaffen neue Wörter. Würden wir das nicht tun, klängen wir immer noch wie Höhlenbewohner (Ugh, ugh).

Alle Menschen schaffen neue Wörter. Würden wir das nicht tun, klängen wir immer noch wie Höhlenbewohner (Ugh, ugh). Medienlinguistik A2 Protokoll von Désirée Lutz, FU1, 5. November 2003 Thema Wörter Alle Menschen schaffen neue Wörter. Würden wir das nicht tun, klängen wir immer noch wie Höhlenbewohner (Ugh, ugh). KommunikatorInnen

Mehr

Einführung in die Computerlinguistik reguläre Sprachen und endliche Automaten

Einführung in die Computerlinguistik reguläre Sprachen und endliche Automaten Einführung in die Computerlinguistik reguläre Sprachen und endliche Automaten Dozentin: Wiebke Petersen May 3, 2010 Wiebke Petersen Einführung CL (SoSe2010) 1 Operationen auf Sprachen Seien L Σ und K Σ

Mehr

Mit der Entwicklung des Internets sind endliche Automaten noch weiter in den Fokus gerückt. Dafür sind mehrere Gründe ausschlaggebend:

Mit der Entwicklung des Internets sind endliche Automaten noch weiter in den Fokus gerückt. Dafür sind mehrere Gründe ausschlaggebend: Einleitung Endliche Automaten sind das Ergebnis der Entwicklung mathematischer Modelle für verschiedene mathematische, technische und naturwissenschaftliche Anwendungsbereiche. Als Pionierarbeiten gelten

Mehr

Seminar Ib Wort, Name, Begriff, Terminus Sommersemester Morphologie. Walther v.hahn. v.hahn Universität Hamburg

Seminar Ib Wort, Name, Begriff, Terminus Sommersemester Morphologie. Walther v.hahn. v.hahn Universität Hamburg Seminar Ib Wort, Name, Begriff, Terminus Sommersemester 2006 Morphologie Walther v.hahn v.hahn Universität Hamburg 2005 1 Morphologie: Definition Definitionen: Morphologie ist die Lehre von den Klassen

Mehr

VII Typologische Unterscheidungen: analytisch synthetisch / agglutinierend - fusionierend

VII Typologische Unterscheidungen: analytisch synthetisch / agglutinierend - fusionierend Fortmann, Proseminar Morphologie / Universität Konstanz Wintersemester 2006/07 VII Typologische Unterscheidungen: analytisch synthetisch / agglutinierend - fusionierend Morphosyntaktische Kategorien haben

Mehr

Flexion bei Nomen Verbalflexion Flexion und Wortarten Repetitorium. Morphologie IV. Flexion. Gerrit Kentner. 19. Dezember / 34

Flexion bei Nomen Verbalflexion Flexion und Wortarten Repetitorium. Morphologie IV. Flexion. Gerrit Kentner. 19. Dezember / 34 Morphologie IV Flexion Gerrit Kentner 19. Dezember 2012 1 / 34 Morphologie: Was bisher geschah Wortbegriff, Morphembegriff, Morphemklassifikation Derivation Komposition 2 / 34 Morphologie heute: Wortformbildung:

Mehr

Einführung in die Computerlinguistik reguläre Sprachen und endliche Automaten

Einführung in die Computerlinguistik reguläre Sprachen und endliche Automaten Einführung in die Computerlinguistik reguläre Sprachen und endliche Automaten Dozentin: Wiebke Petersen 03.11.2009 Wiebke Petersen Einführung CL (WiSe 09/10) 1 Formal language Denition Eine formale Sprache

Mehr

Am Anfang war das Wort!

Am Anfang war das Wort! Am Anfang war das Wort! Was ist Morphologie? Der Begriff Morphologie wurde 1796 von Johann Wolfgang von Goethe in einer Tagebuchaufzeichnung für eine neue Wissenschaft geprägt,, die sich mit den Gestaltungsgesetzen

Mehr

Organisatorisches. Einführung in die Morphologie Geschichte, Grundbegriffe I. Organisatorisches: Poster. Organisatorisches: Poster

Organisatorisches. Einführung in die Morphologie Geschichte, Grundbegriffe I. Organisatorisches: Poster. Organisatorisches: Poster Organisatorisches: Poster Einführung in die Morphologie Geschichte, Grundbegriffe I Anke Lüdeling anke.luedeling@rz.hu-berlin.de Sommersemester 2005 Erstellung eines wissenschaftlichen Posters in einer

Mehr

Informationsextraktion

Informationsextraktion Informationsextraktion Bestimmte Anwendungen bei der semantischen Verarbeitung erfordern keine tiefe linguistische Analyse mit exakter Disambiguierung (= eine einzige und korrekte Lesart). Hierzu gehört

Mehr

Part of Speech Tagging. Linguistische Sicht. Carolin Deck

Part of Speech Tagging. Linguistische Sicht. Carolin Deck Part of Speech Tagging Linguistische Sicht Carolin Deck Gliederung 1. Begriffsklärung 2. Vorstellung zwei wichtiger Tagsets (STTS & PTTS) 3. Bedeutung des POS-Tagging für die Sprachwissenschaft 4. Tagzuweisung

Mehr

Morphologie Einleitung. System der deutschen Sprache Morphologie nominale Kategorie: Genus

Morphologie Einleitung. System der deutschen Sprache Morphologie nominale Kategorie: Genus System der deutschen Sprache nominale Kategorie: Genus Beat Siebenhaar Frank Liedtke Einleitung! Morphem als kleinste bedeutungstragende Einheit! als Lehre von den Morphemen! Agglutination! Flexion! Genus,

Mehr

Syntax und Morphologie. Einführungskurs 2. Vorlesung

Syntax und Morphologie. Einführungskurs 2. Vorlesung Syntax und Morphologie Einführungskurs 2. Vorlesung Grundbegriffe der Morphologie Gliederung Überblick über die traditionelle Sprachtypologie Der Wortbegriff Morpheme als Einheiten der Wortstruktur Morphemklassifikation

Mehr

WORTBILDUNG - MORPHOLOGIE

WORTBILDUNG - MORPHOLOGIE WORTBILDUNG - MORPHOLOGIE Bs: Eindringlichkeit Eindringlichkeit Eindringlich keit + Eindringlich / keit Traurig / keit Haltbar / keit Regsam / keit SUBSTANTIVE Übel / keit SUBSTANTIV bei Abtrennung von

Mehr

Wortbildung und Flexion. Ending Khoerudin Deutschabteilung FPBS UPI

Wortbildung und Flexion. Ending Khoerudin Deutschabteilung FPBS UPI Wortbildung und Flexion Ending Khoerudin Deutschabteilung FPBS UPI Wortbildung und Flexion Wie wird ein Wort gebildet? Wortbildung ist der Prozess der Bildung der Wörter, welcher der Erweiterung des Wortschatzes

Mehr

Spezielle Themen der KI. NLP Natural Language Processing Parsing

Spezielle Themen der KI. NLP Natural Language Processing Parsing Spezielle Themen der KI NLP Natural Language Processing Parsing Parsing Strategien top-down: Ausgehend von S Hypothesenbildung und Verifikation anhand der Grammatikregeln Ersetzung nicht-terminaler Symbole

Mehr

Einführung in die Computerlinguistik Statistische Grundlagen

Einführung in die Computerlinguistik Statistische Grundlagen Statistik 1 Sommer 2015 Einführung in die Computerlinguistik Statistische Grundlagen Laura Heinrich-Heine-Universität Düsseldorf Sommersemester 2015 Statistik 2 Sommer 2015 Überblick 1. Diskrete Wahrscheinlichkeitsräume

Mehr

Einführung in die allgemeine Sprachwissenschaft

Einführung in die allgemeine Sprachwissenschaft Einführung in die allgemeine Sprachwissenschaft Morphologie und Syntax (1/4) PD Dr. Tania Avgustinova Was bedeutet es, eine Sprache zu kennen? Eine Sprache dient primär der Kommunikation, also Sprachen

Mehr

Hinweise zur flexionsmorphologischen Glossierung

Hinweise zur flexionsmorphologischen Glossierung Morphologie und Lexikon SS 2006 flexionsmorphologische Glossierung 1 Hinweise zur flexionsmorphologischen Glossierung Allgemeines Die flexionsmorphologische Glossierung steht als zweite Zeile unterhalb

Mehr

Morphologie. Dazu gehört auch: Wortarten und ihre Einteilung. Morphologie ist die Lehre vom Strukturaufbau der Wörter.

Morphologie. Dazu gehört auch: Wortarten und ihre Einteilung. Morphologie ist die Lehre vom Strukturaufbau der Wörter. Wörter und ihre Teile: Morphologie Flexion Morphologie von Goethe geprägter Begriff für Form und Struktur lebender Organismen im 19. Jh. in die Sprachwissenschaft übernommen Morphologie ist die Lehre vom

Mehr

Einführung in die allgemeine Sprachwissenschaft

Einführung in die allgemeine Sprachwissenschaft Einführung in die allgemeine Sprachwissenschaft Morphologie und Syntax (1/4) PD Dr. Tania Avgustinova http://www.coli.uni-saarland.de/~tania/ws2009/genling-morphology.pdf Was bedeutet es, eine Sprache

Mehr

Harry gefangen in der Zeit Begleitmaterialien

Harry gefangen in der Zeit Begleitmaterialien Episode 011 Grammar 1. Plural forms of nouns Most nouns can be either singular or plural. The plural indicates that you're talking about several units of the same thing. Ist das Bett zu hart? Sind die

Mehr

Thomas Behr. 17. November 2011

Thomas Behr. 17. November 2011 in in Fakultät für Mathematik und Informatik Datenbanksysteme für neue Anwendungen FernUniversität in Hagen 17. November 2011 c 2011 FernUniversität in Hagen Outline in 1 2 3 4 5 6 - Was ist das? in über

Mehr

Lexikalische Programmanalyse der Scanner

Lexikalische Programmanalyse der Scanner Der Scanner führt die lexikalische Analyse des Programms durch Er sammelt (scanned) Zeichen für Zeichen und baut logisch zusammengehörige Zeichenketten (Tokens) aus diesen Zeichen Zur formalen Beschreibung

Mehr

Endliche Automaten. Grundlagen: Alphabet, Zeichenreihe, Sprache. Karin Haenelt

Endliche Automaten. Grundlagen: Alphabet, Zeichenreihe, Sprache. Karin Haenelt Endliche Automaten Grundlagen: Alphabet, Zeichenreihe, Sprache Karin Haenelt 1 Alphabet, Zeichenreihe und Sprache Alphabet unzerlegbare Einzelzeichen Verwendung: als Eingabe- und Ausgabezeichen eines endlichen

Mehr

Wortbildung Derivation

Wortbildung Derivation Wortbildung Derivation Durch Komposition setzt man bestehende Stämme zu komplexeren Stämmen zusammen Durch Derivation erzeugt man neue Wörter durch Kombination mit Affixen Das Beispiel aus der ersten Sitzung:

Mehr

NLP - Analyse des Wissensrohstoffs Text

NLP - Analyse des Wissensrohstoffs Text NLP - Analyse des Wissensrohstoffs Text Vorlesung Beginn: 8. April 2008 Dienstag 10.15 h - 11.45 h, in Raum 1607 oder 0443 Übungen Dr. Andreas Hotho Dominik Benz Beate Krause Sommersemester 2008 Beginn:

Mehr

Automaten und formale Sprachen. Lösungen zu den Übungsblättern

Automaten und formale Sprachen. Lösungen zu den Übungsblättern Automaten und formale Sprachen zu den Übungsblättern Übungsblatt Aufgabe. (Sipser, exercise.3) M = ({q, q2, q3, q4, q5}, {u, d}, δ, q3, {q3}) δ: u d q q q 2 q 2 q q 3 q 3 q 2 q 4 q 4 q 3 q 5 q 5 q 4 q

Mehr

Einführung in die Syntax und Morphologie. Vorlesung mit Übung WS 2010/2011, Computerlinguistik

Einführung in die Syntax und Morphologie. Vorlesung mit Übung WS 2010/2011, Computerlinguistik Einführung in die Syntax und Morphologie Vorlesung mit Übung WS 2010/2011, Computerlinguistik 03 Segmentierbarkeit Minimalzeichen Zeichen segmentierbar nicht segmentierbar formal segmentierbar (zwei wiederkehrende

Mehr

Computerlinguistik und Sprachtechnologie

Computerlinguistik und Sprachtechnologie Computerlinguistik und Sprachtechnologie Eine Einführung Herausgegeben von: Kai-Uwe Carstensen, Christian Ebert, Cornelia Endriss, Susanne Jekat, Ralf Klabunde und Hagen Langer Spektrum Akademischer Verlag

Mehr

Syntax und Morphologie

Syntax und Morphologie Syntax und Morphologie Einführungskurs 4. Vorlesung Ziele der morphologischen Forschung Das Ziel der morphologischen Forschung ist es, die morphologischen Muster und Operationen in den Sprachen der Welt

Mehr

Parsing mit NLTK. Parsing mit NLTK. Parsing mit NLTK. Parsing mit NLTK. Beispiel: eine kleine kontextfreie Grammatik (cf. [BKL09], Ch. 8.

Parsing mit NLTK. Parsing mit NLTK. Parsing mit NLTK. Parsing mit NLTK. Beispiel: eine kleine kontextfreie Grammatik (cf. [BKL09], Ch. 8. Gliederung Natürlichsprachliche Systeme I D. Rösner Institut für Wissens- und Sprachverarbeitung Fakultät für Informatik Otto-von-Guericke Universität Magdeburg 1 WS 2011/12, 26. Oktober 2011, c 2010-2012

Mehr

Outline Automaten FSM Synthesis FSM in VHDL FSM auf FPGA. State Machines. Marc Reichenbach und Michael Schmidt

Outline Automaten FSM Synthesis FSM in VHDL FSM auf FPGA. State Machines. Marc Reichenbach und Michael Schmidt State Machines Marc Reichenbach und Michael Schmidt Informatik 3 / Rechnerarchitektur Universität Erlangen Nürnberg 05/11 1 / 34 Gliederung Endliche Automaten Automaten Synthese FSM Beschreibung in VHDL

Mehr

und noch allerlei mehr bei nicht-nativen Wörtern, z.b. cact-i, cherub-im,...

und noch allerlei mehr bei nicht-nativen Wörtern, z.b. cact-i, cherub-im,... Plank, WS 03/04, EinfLing, M&S 4a 1 Morphologische Analyse: ALLOMORPHIE Englisch: Plural ( mehr als 1 davon ; Singular = 1 davon ) The cat-s sit on the mat /s/ The dog-s /z/ The kangaroo-s /z/ The small

Mehr

Induktive Definition

Induktive Definition Rechenregeln A B = B A A (B C) = (A B) C A (B C) = (A B) C A (B C) = A B A C (B C) A = B A C A {ε} A = A A {ε} = A (A {ε}) = A (A ) = A A A = A + A A = A + A + {ε} = A Beispiel. Real-Zahlen = {0,..., 9}

Mehr

Organisatorisches. GKC Morphologie Derivation. Derivation - Überblick. Derivation. Bedeutung von Derivationsaffixen. Derivation - Überblick

Organisatorisches. GKC Morphologie Derivation. Derivation - Überblick. Derivation. Bedeutung von Derivationsaffixen. Derivation - Überblick Organisatorisches GKC Morphologie Derivation Anke Lüdeling anke.luedeling@rz.hu-berlin.de Sommersemester 2005 Posterthema: deutsche Adjektivgradation zwischen Flexion und Derivation Literatur: Gregory

Mehr

Einführung Computerlinguistik. Morphologie I

Einführung Computerlinguistik. Morphologie I Einführung Computerlinguistik Morphologie I Hinrich Schütze & Robert Zangenfeind Centrum für Informations- und Sprachverarbeitung, LMU München 2013-10-21 1 / 62 Take-away Einleitung: Was ist Morphologie,

Mehr

Methodologische Anmerkungen

Methodologische Anmerkungen Methodologische Anmerkungen Die klassische Methode der Morphologie: Segmentieren und klassifizieren: Suche nach (minimalen) Formunterschieden, die systematisch mit (minimalen) Bedeutungsunterschieden korrelieren

Mehr

Part-of-Speech Tagging. Stephanie Schuldes

Part-of-Speech Tagging. Stephanie Schuldes Part-of-Speech Tagging Stephanie Schuldes 05.06.2003 PS Erschließen von großen Textmengen Geißler/Holler SoSe 2003 Motivation Ziel: vollständiges Parsing und Verstehen natürlicher Sprache Herantasten durch

Mehr

Einführung in die Sprachwissenschaft des Deutschen. Morphologie. PD Dr. Alexandra Zepter

Einführung in die Sprachwissenschaft des Deutschen. Morphologie. PD Dr. Alexandra Zepter Einführung in die Sprachwissenschaft des Deutschen Morphologie PD Dr. Alexandra Zepter Systemorientierte theoretische Linguistik Syntax Morphologie Phonetik/Phonologie Graphematik (Semiotik) Semantik Pragmatik:

Mehr

Morphologie II. Morphologische Grundbegriffe Typen der Wortbildung Wortstruktur Wortbildungsregeln. Morphologie II 1

Morphologie II. Morphologische Grundbegriffe Typen der Wortbildung Wortstruktur Wortbildungsregeln. Morphologie II 1 Morphologie II Morphologische Grundbegriffe Typen der Wortbildung Wortstruktur Wortbildungsregeln Morphologie II 1 Terminologie Morphem: kleinste bedeutungstragende Einheit: Haus, auf, rot. Silbe: Silben

Mehr

Transition Network Parser

Transition Network Parser Transition Grammatik als endlicher Automat oder Übergangsnetzwerk. Jedes Netzwerk repräsentiert ein Nichtterminal. Kanten repräsentieren Terminale oder Nichtterminale. Pfad durch das Netzwerk korrespondiert

Mehr

Semantische Klassifikation von Kollokationen auf Grundlage des DWDS- Wortprofils

Semantische Klassifikation von Kollokationen auf Grundlage des DWDS- Wortprofils Semantische Klassifikation von Kollokationen auf Grundlage des DWDS- Wortprofils Isabel Fuhrmann, Alexander Geyken, Lothar Lemnitzer Zentrum Sprache Berlin-Brandenburgische Akademie der Wissenschaften

Mehr

Morris Halle: The Russian Declension: An Illustration of the Theory of Distributed Morphology

Morris Halle: The Russian Declension: An Illustration of the Theory of Distributed Morphology nstitut für Linguistik HS Flexionsmorphologie Prof. Dr. Müller Referentin: Andrea Kruska 9.11.2004 Morris Halle: The Russian Declension: An llustration of the Theory of Distributed Morphology 1. Deklinationsklassen

Mehr

VL Morphologie Derivation 2. Anke Lüdeling Sommersemester 2008

VL Morphologie Derivation 2. Anke Lüdeling Sommersemester 2008 VL Morphologie Derivation 2 Anke Lüdeling anke.luedeling@rz.hu-berlin.de Sommersemester 2008 produktiv aktiv stündlich, minütlich, zweimonatlich, täglich Basis: N, gibt Zeitraum an Ergebnis: jedes N produktiv

Mehr

Die Wortbildung des Deutschen. Wortbildungsmittel

Die Wortbildung des Deutschen. Wortbildungsmittel Die Wortbildung des Deutschen Wortbildungsmittel Voraussetzungen und Ziele der Wortbildungsanalyse Bildung von Wörtern folgt best. Wortbildungstypen Bildung nach Vorbild eines bereits bekannten Wortes

Mehr

Die Morphologie (d.h. Formenlehre) untersucht die Gestalt von Wörtern, genauer den Wortaufbau einer Sprache.

Die Morphologie (d.h. Formenlehre) untersucht die Gestalt von Wörtern, genauer den Wortaufbau einer Sprache. 7. Morphologie Die Morphologie (d.h. Formenlehre) untersucht die Gestalt von Wörtern, genauer den Wortaufbau einer Sprache. 7.1. Morph, Morphem, Allomorph Die kleinste Einheit einer Sprache, die eine Bedeutung

Mehr

Automaten und Formale Sprachen ε-automaten und Minimierung

Automaten und Formale Sprachen ε-automaten und Minimierung Automaten und Formale Sprachen ε-automaten und Minimierung Ralf Möller Hamburg Univ. of Technology Literatur Gottfried Vossen, Kurt-Ulrich Witt: Grundkurs Theoretische Informatik, Vieweg Verlag 2 Danksagung

Mehr

Klausur in zwei Wochen Einführung in die Morphologie Flexion

Klausur in zwei Wochen Einführung in die Morphologie Flexion Klausur in zwei Wochen Einführung in die Morphologie Flexion Anke Lüdeling Wintersemester 2002/2003 Bitte mailen Sie mir eventuelle Fragen und Punkte, die wir noch mal üben sollen bis Mittwoch 29.01.03,

Mehr

Merkmale und Vererbung in unifikationsbasierten Lexika

Merkmale und Vererbung in unifikationsbasierten Lexika Gerold Schneider: Lexikonaufbau und Morphologieanalyseverfahren Seite 1 Merkmale und Vererbung in unifikationsbasierten Lexika Morphologieanalyse und Lexikonaufbau (14. Vorlesung) Dozent: Gerold Schneider

Mehr

Anwenundg regulärer Sprachen und endlicher Automaten

Anwenundg regulärer Sprachen und endlicher Automaten Proseminar Theoretische Informatik Dozent: Prof. Helmut Alt Anwenundg regulärer Sprachen und endlicher Automaten Madlen Thaleiser 30. Oktober 2012 Reguläre Sprachen Regulärer Ausdruck definiert über einem

Mehr

Fragestellungen in der Morphologie: Morphologie. Fragestellungen in der Morphologie: Fragestellungen in der Morphologie:

Fragestellungen in der Morphologie: Morphologie. Fragestellungen in der Morphologie: Fragestellungen in der Morphologie: Morphologie Fragestellungen in der Morphologie: < griech.!"#$%/morphé Form Gestalt + &'(")/lógos Lehre (1) Welche Arten von Wörtern gibt es?! Wortarten Fragestellungen in der Morphologie: (2) Welche Formen

Mehr

Überführung regulärer Ausdrücke in endliche Automaten

Überführung regulärer Ausdrücke in endliche Automaten Endliche Automaten Überführung regulärer Ausdrücke in endliche Automaten Karin Haenelt 1 Inhalt Anwendung: Spezifikation linguistischer Regeln Theoretische Basis: Äquivalenz regulärer Ausdrücke und endlicher

Mehr

Motivation. Morphologie und Buchstabenbäume. Vollformen-Lexikon. Morphologie als "Wortgrammatik"

Motivation. Morphologie und Buchstabenbäume. Vollformen-Lexikon. Morphologie als Wortgrammatik Morphologie und Buchstabenbäume Motivation Übersicht Vollformen Morphologie als Wortgrammatik Simple DCG als Wortgrammatik: Stämme und Endungen, Flexionsklassen Schnittstelle zwischen Syntax/Morphologie

Mehr

Deutsch und andere Sprachen im Vergleich. Dr. Ellen Schulte-Bunert

Deutsch und andere Sprachen im Vergleich. Dr. Ellen Schulte-Bunert Deutsch und andere Sprachen im Vergleich Erstsprache Entfernung zum Deutschen Sprachen aus der gleichen Sprachfamilie sind leichter zu erlernen als nicht verwandte Sprachen. Zur indo-europäischen Sprachfamilie

Mehr

Phänomene der deutschen Rechtschreibung

Phänomene der deutschen Rechtschreibung Phänomene der deutschen Rechtschreibung Systematische Auflistung aller betroffenen deutschen Wörter in Verbindung mit Fremdwörtern von Renate und Michael Andreas aa - ee - ii - oo - uu ie - i ä ei / ai

Mehr

Morphologie - Morphematik. Grundbegriffe: Morphem Wurzel Stamm Affix Morphemtypen

Morphologie - Morphematik. Grundbegriffe: Morphem Wurzel Stamm Affix Morphemtypen Morphologie - Morphematik Grundbegriffe: Morphem Wurzel Stamm Affix Morphemtypen Morpheme Das Morphem ist die grundlegende Einheit der Morphologie. Morpheme sind wie die Phoneme oder Lexeme abstrakte Einheiten,

Mehr

Automatentheorie und formale Sprachen rechtslineare Grammatiken

Automatentheorie und formale Sprachen rechtslineare Grammatiken Automatentheorie und formale Sprachen rechtslineare Grammatiken Dozentin: Wiebke Petersen 17.6.2009 Wiebke Petersen Automatentheorie und formale Sprachen - SoSe09 1 Pumping lemma for regular languages

Mehr

Infos etc. => Studium => Lehrveranstaltungen Einführung in die Linguistik

Infos etc.  => Studium => Lehrveranstaltungen Einführung in die Linguistik Einführung in die Linguistik Butt & Co. Do. 12:15-13:45 Fr. 12:15-13:45 Infos etc. http://ling.uni-konstanz.de => Studium => Lehrveranstaltungen Einführung in die Linguistik Zur Erinnerung: Kerngebiete

Mehr

Paradigmen. Jochen Trommer Paradigmen WS 2008/2009. Universität Leipzig Institut für Linguistik

Paradigmen. Jochen Trommer Paradigmen WS 2008/2009. Universität Leipzig Institut für Linguistik Was sind? Morphologische Argumente Phonologische Argukmente Jochen Trommer jtrommer@uni-leipzig.de Universität Leipzig Institut für Linguistik WS 2008/2009 Was sind? Morphologische Argumente Phonologische

Mehr

Informationsextraktion Materialien zur Vorlesung

Informationsextraktion Materialien zur Vorlesung Informationsextraktion Materialien zur Vorlesung Beispiel: reguläre Ausdrücke für Firmennamen D. Rösner Institut für Wissens- und Sprachverarbeitung Fakultät für Informatik Otto-von-Guericke Universität

Mehr

Wiederholung. Grundkurs C: Einführung in die Morphologie Geschichte, Grundbegriffe. Morphologische Produktivität. Fragen. Beispiel 1: Analogie

Wiederholung. Grundkurs C: Einführung in die Morphologie Geschichte, Grundbegriffe. Morphologische Produktivität. Fragen. Beispiel 1: Analogie Grundkurs C: Einführung in die Morphologie Geschichte, Grundbegriffe Anke Lüdeling anke.luedeling@rz.hu-berlin.de Wintersemester 2002/2003 Wiederholung Wieviele Wörter hat folgender Satz? Wenn hinter Fliegen

Mehr

Verkaufspreisliste Oktober 2015

Verkaufspreisliste Oktober 2015 Verkaufspreisliste Oktober 2015 Kollektion Cassina imaestri 006 LC6 Le Corbusier, Pierre Jeanneret, Charlotte Perriand 635 Red and Blue 637 Utrecht errit T Rietveld Kollektion Cassina icontemporanei 111

Mehr

Morphologie. Gerrit Kentner. May 4, 2010

Morphologie. Gerrit Kentner. May 4, 2010 Morphologie Gerrit Kentner May 4, 2010 Organisatorisches Kommende Woche (11.5.) vertritt mich Frau Volodina. In der übernächsten Woche (18.5.) entfällt unsere Sitzung. Was bisher geschah Überblick Sprachwissenschaft

Mehr

Morphologie. bersicht. Ziel. Grundbegriffe Vollformen-Lexikon Morphologische Analyse mit DCGs

Morphologie. bersicht. Ziel. Grundbegriffe Vollformen-Lexikon Morphologische Analyse mit DCGs Morphologie bersicht Ziel Grundbegriffe Vollformen-Lexikon Morphologische Analyse mit DCGs Trennen in Stamm und Endung Flexionsklassen Schnittstelle zwischen Syntax und Semantik Verstehen des Problems

Mehr