Natürlichsprachliche Systeme I Materialien zur Vorlesung D. Rösner Institut für Wissens- und Sprachverarbeitung Fakultät für Informatik Otto-von-Guericke Universität Magdeburg WS 2010/11, 19. Oktober 2010, c 2010, 2011 D.Rösner D. Rösner NSS I 2010/11... 1
Gliederung 1 Einleitung 2 Flexion Derivation Komposition Klitisierung D. Rösner NSS I 2010/11... 2
Motivation nicht alle englischen Wörter haben die simple Unterscheidung zwischen singular und plural durch angehängtes s Beispiele (vgl. [JM08], Ch. 3): fox foxes peccary peccaries goose geese fish fish Arten von benötigten Regeln: orthographische Regeln morphologische Regeln D. Rösner NSS I 2010/11... 3
Morphologisches Parsing Parsing... allgemein: einer Eingabe eine linguistische Struktur zuordnen vgl. [JM08], Ch. 3 D. Rösner NSS I 2010/11... 4
Morphologisches Parsing morphologisches Parsing... Zerlegung von Wörtern in sog. Beispiele: foxes zerlegen in Grundform fox und Plural-Morphem -es Eingabe (oder Oberflächenform) going zerlegen in Grundform und -ing-morphem als Parsing-Ergebnis darstellbar z.b. als VERB-go + GERUND-ing morphologisches Parsing insbesondere wichtig für Sprachen mit reichhaltiger (z.b. Deutsch, Russisch, Türkisch, Finnisch,... ) vgl. [JM08], Ch. 3 D. Rösner NSS I 2010/11... 5
Morphologisches Parsing Frage: Warum ist Ablegen aller (Oberflächen-)Formen und morphologisches Parsen durch Nachschlagen (lookup) keine wirkliche Alternative? morphologische Regeln sind produktiv Beispiel: an jedes Verb kann -ing-morphem angehängt werden für Neologismen müssen die unterschiedlichen Formen gebildet und erkannt werden können vgl. [JM08], Ch. 3 D. Rösner NSS I 2010/11... 6
... wie werden Wörter aus kleineren bedeutungstragenden Einheiten aufgebaut? Morphem... definiert als kleinste bedeutungstragende Einheit einer Sprache vgl. [JM08], Ch. 3.1 D. Rösner NSS I 2010/11... 7
Unterscheidung in Stämme Affixe Stamm trägt die Hauptbedeutung, Affixe fügen dieser Ergänzungen hinzu vgl. [JM08], Ch. 3.1 D. Rösner NSS I 2010/11... 9
Affixe weiter unterschieden in Präfixe, Suffixe, Infixe, Circumfixe vgl. [JM08], Ch. 3.1 D. Rösner NSS I 2010/11... 10
Beispiele für unterschiedliche Affixe (vgl. [JM08], Ch. 3.1) Präfix: engl. Verb unbuckle aus Stamm buckle und Präfix un- Suffix: engl. Verb runs aus Stamm run und Suffix -s Circumfix: bei einigen dt. Verben wird Partizip Perfekt durch Voranstellen von ge- und Anfügen von -t gebildet Beispiele: geliebt, gelacht,... Frage: andere Formen des Partizip Perfekt im Deutschen? D. Rösner NSS I 2010/11... 11
Beispiele für unterschiedliche Affixe (vgl. [JM08], Ch. 3.1) Infix: philippinische Sprache Tagalog: Morphem um zur Markierung des Handelnden einer Aktion wird in den Stamm, z.b. hingi (für (ent)leihen, engl. borrow), eingefügt Form dann humingi D. Rösner NSS I 2010/11... 12
Wortbildung durch morphologische Prozesse vier hauptsächliche Formen der Kombination von n zu Wörtern: Flexion (engl. inflection), Derivation, Komposition, Klitisierung (engl. cliticization) vgl. [JM08], Ch. 3.1 D. Rösner NSS I 2010/11... 14
Derivation Derivation... Kombination eines Wortstamms mit einem grammatischen Morphem führt oft zu Wort in einer anderen Wortklasse Beispiel: aus Verbstamm les und grammatischem Morphem -bar wird Adjektiv lesbar gebildet Beispiel: aus engl. Verben, die dabei oft auf -ize enden, werden mit grammatischem Morphem -ation Nomen gebildet (z.b. computerize wird zu computerization ) vgl. [JM08], Ch. 3.1.2 D. Rösner NSS I 2010/11... 15
Komposition Komposition (engl. compounding)... Verknüpfung mehrerer Wortstämme Beispiel: lighthouse im Englischen werden sog. noun compounds meist durch Aneinanderreihung mit Leerzeichen gebildet Beispiel: machine language translation D. Rösner NSS I 2010/11... 16
Komposition im Deutschen gilt bei Nominalkomposita nach gültiger Rechtschreibung die direkte Zusammenschreibung, in manchen Fällen die Zusammenschreibung mit Bindestrichen Beispiele: Kreiswehrersatzamt, aber Richard-Wagner-Allee manche Zusammenschreibung erfordert dabei ein sog. Fugenmorphem Beispiele: Börse-n-kurs, Wirtschaft-s-ministerium D. Rösner NSS I 2010/11... 17
Klitisierung Klitikon (pl. Klitika)... Einheiten, deren Status zwischen dem eines Affix und dem eines Worts liegt Klitika oft unterschieden in vorangestellte (Proklitika) und nachgestellte (Enklitika) im Englischen gibt es Klitika zu Formen von Hilfsverben Beispiel: she s für she is oder she has D. Rösner NSS I 2010/11... 18
Literatur: I Daniel Jurafsky and James H. Martin. Speech and Language Processing: An introduction to natural language processing, computational linguistics, and speech recognition. Prentice Hall, 2nd (May 26, 2008) edition, 2008. Christopher D. Manning and Hinrich Schütze. Foundations of Statistical Natural Language Processing. MIT Press, fifth printing edition, 2002. D. Rösner NSS I 2010/11... 19