Natürlichsprachliche Systeme I Materialien zur Vorlesung

Ähnliche Dokumente
Part-Of-Speech-Tagging mit Viterbi Algorithmus

Einführung in die Computerlinguistik Statistische Grundlagen

Einführung in die Computerlinguistik Überblick

Fachschaft Englisch Unterrichtsinhalte Klasse Lehrwerk/Zusatzmaterialien: Lehrbuch Green Line 1 Voraussetzungen: Inhaltliche Schwerpunkte

Leseprobe Englisch Grammatik Clever gelernt Bestell-Nr Mildenberger Verlag GmbH

Gliederung. Programmierparadigmen. Sprachmittel in SCHEME. Objekte: Motivation. Objekte in Scheme

Programmierparadigmen

ÜBERBLICK ÜBER DAS KURS-ANGEBOT

Duden Schülerhilfen. Englisch 5. Klasse Übungen zu Wortschatz und Wortlehre. Dudenverlag Mannheim Leipzig Wien Zürich

Maschinelle Sprachverarbeitung: KollokaKonen (Teil 2: Modelle von Wortsequenzen)

Morphologie (5) Wortarten (2) Part-of-Speech Tagging Stemming

Programmbeschreibungen. PIH-Software. Alexander M. Hüther. für WINDOWS & MAC-OS

LANGSOFT, Sprachlernmittel, Schweiz. DOKUMENTATION und Präsentation

Langenscheidt Englisch-Comics Grammatik

Programmieren in natürlicher Sprache: Alice-Kontrollstrukturen

Einführung in die Linguistik, Teil 4

Unterrichtsmaterialien in digitaler und in gedruckter Form. Auszug aus: Grammatik einfach praktisch - Englisch (Niveau: A1 - B2)

Einführung Computerlinguistik. Überblick

Das Online-Computerprogramm Graf Orthos Wortschatz-Training online

Die Satzstellung im Deutschen in Haupt- und Nebensa tzen (Pra sens, Perfekt, Pra teritum, Plusquamperfekt und Futur I)

Goethe. Einführung in die Computerlinguistik: Maschinelle Übersetzung. Können Computer übersetzen? Babel Fish Google

Die Betonung der Wörter

Automatische Erkennung von Figuren in deutschsprachigen Romanen

KURZÜBERSICHT SONDERTEIL

Aufgabe 1: % Schreiben Sie eine DATR-Theorie, die die Flexionsendungen deutscher % Adjektive erfasst. Benutzen Sie die gegebenen Show-Deklarationen.

Ein bisschen Werbung. Einführung in die Morphologie Einleitung, Grundbegriffe I. Morphologie. 'Morphologie' Was ist ein Wort? Was ist ein Wort?

Modulhandbuch Studiengang Master of Science Computational Linguistics Prüfungsordnung: 2011

STOCHASTISCHE GRAMMATIKMODELLE. Meine Lehrveranstaltungen für... Informatiker & Bioinformatiker & Informatikerinnen & Bioinformatikerinnen

Interlineare Morphemglossierung

Duden Schülerhilfen. Englisch 7. Klasse Übungen zu Wort- und Satzlehre und zum Textverständnis. Dudenverlag Mannheim Leipzig Wien Zürich

Parsing German Verbs (Third-Person Singular) Parsing German Verbs (Third-Person Plural)

Bildwörterbücher im Englischunterricht der Grundschule

Einführung in die Sprachwissenschaft Jan Bruners

Introduction to Computational Linguistics

VI Morphologische Exponens

Autorenvorstellung 5 Zum Gebrauch 7 Klassenzimmersprache/classroom language 8

Morphologie & Syntax

- Allgemeingültiges oder gewohnheitsmäßige Abläufe darstellen (generelles Präsens): Beispiele: Er besucht mich täglich. Eins plus eins ergibt zwei.

SEMANTISCHE INFORMATION [NPnominativ1, NPakkusativ2]

p Texte der Hörszenen: S.138

UNTERRICHTSPLAN LEKTION 11

Simple Present Einleitung

Seminar Text- und Datamining Textmining-Grundlagen Erste Schritte mit NLTK

Benutzeranleitung zur Bilddatenbank

Part-of-Speech- Tagging

GRUNDWISSEN Englisch E 1 1. bis 3. Lernjahr GRAMMATIK MÜNDLICHE AUSDRUCKSFÄHIGKEIT

Morphologie Einleitung. System der deutschen Sprache Morphologie nominale Kategorie: Genus

Linguistik für Kognitionswissenschaften

Langenscheidt e-handwörterbuch Englisch

Hochschule Hannover Fakultät III Medien, Information und Design Abteilung Information und Kommunikation

Universität Potsdam Institut für Informatik Lehrstuhl Maschinelles Lernen. NLP-Pipeline. Tobias Scheffer Thomas Vanck

Background for Hybrid Processing

Englisch-deutsch-polnisches Wörterbuch. Benutzeranleitung

EXTRAKTION UND KLASSIFIKATION VON BEWERTETEN PRODUKTFEATURES AUF WEBSEITEN

Hueber. Deutsch. Sabine Dinsel / Susanne Geiger. Verbformen. Bildung & Gebrauch

Das Verb. Die grammatischen Kategorien des Verbs

Automatisches Lernen von Regeln zur quellseitigen Umordnung

Studiengang "Lehramt an Gymnasien" Englisch Hauptfach

LOGBUCH DEUTSCH. Ich will lernen.de. Gamze Yanikgül, Sven-Olaf Miehe. Name, Vorname. Tutor. dragonboard group c h a n g e p i l o t s

1. Tag. Wie oft machen Sie das? Ich mache das jeden Tag. einmal/zweimal/dreimal die/in der Woche. (= pro Woche)

Lösung für Lehrerinnen und Lehrer Grammatik-Lapbook Teil 1: Wortarten

SPRACHNIVEU B1 IM GEMEINSAMEN EUROPÄISCHEN REFERENZRAHMEN

L E I T F A D E N. Wissenschaftliches Arbeiten im Studium der Theologie an der Universität Regensburg

Hueber Wörterbuch Deutsch als Fremdsprache Basiswissen kompakt

3. Stilkontrolle. 4. Terminologiekontrolle

a lot of, much und many

Mit der Entwicklung des Internets sind endliche Automaten noch weiter in den Fokus gerückt. Dafür sind mehrere Gründe ausschlaggebend:

Lerninhalte ALFONS Lernwelt Deutsch 5. Klasse

Einführung Computerlinguistik. Konstituentensyntax II

Inhaltsverzeichnis. Vorwort 5

Gymnasium Winsen: Schulinternes Curriculum für das Fach Englisch. Klasse 5

Seminar Textmining SS 2015 Grundlagen des Maschinellen Lernens

Lerninhalte ALFONS Lernwelt Deutsch 6. Klasse

Elementare Bildverarbeitungsoperationen

Institut für Telematik Universität zu Lübeck. Programmieren. Kapitel 0: Organisatorisches. Wintersemester 2008/2009. Prof. Dr.

Autorenunterstützung für die Maschinelle Übersetzung Melanie Siegel 1

Linkliste Englische Grammatik

Einordnung in den Europäischen Referenzrahmen: General English

Computer Vision I. Nikos Canterakis. Lehrstuhl für Mustererkennung, Universität Freiburg,

1. Jurafsky und Martin

Einführung in die Morphologie

Lektion 9: Konjugation von Verben im Präsens (conjugation of verbs in present tense)

1. Anzahl der Sprachen auf der Erde. 1.1 Probleme bei der Bestimmung der Zahl. 1.2 Das Sprachensterben. 2.1 Sprachfamilien

Vorlesung Öhlschläger: WS 2010/11 Einführung in die germanistische Sprachwissenschaft Theoretische und methodische Grundlagen

Gymnasium Rhauderfehn Schulinterner Arbeitsplan ENGLISCH Klasse 8

Aus: Hubert Truckenbrodt und Kathrin Eichler: Einführung in die moderne Sprachwissenschaft. Ms., ZAS Berlin und DFKI Saarbrücken, 2010.

Grammatiken in Prolog

Gliederung. Einführung in die Computerlinguistik: Maschinelle Übersetzung. Können Computer übersetzen? Goethe Babel Fish Google

Patrick Simianer Visualisierung regulärer Ausdrücke

Segmentierung (Beispielanalyse)

Deklination des Nomens

Fachhochschule Wiesbaden, FB Design Informatik Medien Studiengang Allgemeine Informatik Vorlesung im SS 2007

2. Methodisches Vorgehen

Visualisierung von lexikalischem Wandel im Deutschen auf Basis der Google- Books Ngram Daten

Sprachtechnologie in der Wissenschaft: Digital-Turn in evidenzbasierter Bildungsforschung und -information

Der Konjunktiv II 1. Forum Wirtschaftsdeutsch. Gebrauch Der Konjunktiv II wird u.a. verwendet

4. 4. Algorithmen und Datenstrukturen in deskriptiven Programmiersprachen

If-Sätze, Wünsche und Fragen

Tagging von Online-Blogs

Transkript:

Natürlichsprachliche Systeme I Materialien zur Vorlesung D. Rösner Institut für Wissens- und Sprachverarbeitung Fakultät für Informatik Otto-von-Guericke Universität Magdeburg WS 2010/11, 19. Oktober 2010, c 2010, 2011 D.Rösner D. Rösner NSS I 2010/11... 1

Gliederung 1 Einleitung 2 Flexion Derivation Komposition Klitisierung D. Rösner NSS I 2010/11... 2

Motivation nicht alle englischen Wörter haben die simple Unterscheidung zwischen singular und plural durch angehängtes s Beispiele (vgl. [JM08], Ch. 3): fox foxes peccary peccaries goose geese fish fish Arten von benötigten Regeln: orthographische Regeln morphologische Regeln D. Rösner NSS I 2010/11... 3

Morphologisches Parsing Parsing... allgemein: einer Eingabe eine linguistische Struktur zuordnen vgl. [JM08], Ch. 3 D. Rösner NSS I 2010/11... 4

Morphologisches Parsing morphologisches Parsing... Zerlegung von Wörtern in sog. Beispiele: foxes zerlegen in Grundform fox und Plural-Morphem -es Eingabe (oder Oberflächenform) going zerlegen in Grundform und -ing-morphem als Parsing-Ergebnis darstellbar z.b. als VERB-go + GERUND-ing morphologisches Parsing insbesondere wichtig für Sprachen mit reichhaltiger (z.b. Deutsch, Russisch, Türkisch, Finnisch,... ) vgl. [JM08], Ch. 3 D. Rösner NSS I 2010/11... 5

Morphologisches Parsing Frage: Warum ist Ablegen aller (Oberflächen-)Formen und morphologisches Parsen durch Nachschlagen (lookup) keine wirkliche Alternative? morphologische Regeln sind produktiv Beispiel: an jedes Verb kann -ing-morphem angehängt werden für Neologismen müssen die unterschiedlichen Formen gebildet und erkannt werden können vgl. [JM08], Ch. 3 D. Rösner NSS I 2010/11... 6

... wie werden Wörter aus kleineren bedeutungstragenden Einheiten aufgebaut? Morphem... definiert als kleinste bedeutungstragende Einheit einer Sprache vgl. [JM08], Ch. 3.1 D. Rösner NSS I 2010/11... 7

Unterscheidung in Stämme Affixe Stamm trägt die Hauptbedeutung, Affixe fügen dieser Ergänzungen hinzu vgl. [JM08], Ch. 3.1 D. Rösner NSS I 2010/11... 9

Affixe weiter unterschieden in Präfixe, Suffixe, Infixe, Circumfixe vgl. [JM08], Ch. 3.1 D. Rösner NSS I 2010/11... 10

Beispiele für unterschiedliche Affixe (vgl. [JM08], Ch. 3.1) Präfix: engl. Verb unbuckle aus Stamm buckle und Präfix un- Suffix: engl. Verb runs aus Stamm run und Suffix -s Circumfix: bei einigen dt. Verben wird Partizip Perfekt durch Voranstellen von ge- und Anfügen von -t gebildet Beispiele: geliebt, gelacht,... Frage: andere Formen des Partizip Perfekt im Deutschen? D. Rösner NSS I 2010/11... 11

Beispiele für unterschiedliche Affixe (vgl. [JM08], Ch. 3.1) Infix: philippinische Sprache Tagalog: Morphem um zur Markierung des Handelnden einer Aktion wird in den Stamm, z.b. hingi (für (ent)leihen, engl. borrow), eingefügt Form dann humingi D. Rösner NSS I 2010/11... 12

Wortbildung durch morphologische Prozesse vier hauptsächliche Formen der Kombination von n zu Wörtern: Flexion (engl. inflection), Derivation, Komposition, Klitisierung (engl. cliticization) vgl. [JM08], Ch. 3.1 D. Rösner NSS I 2010/11... 14

Derivation Derivation... Kombination eines Wortstamms mit einem grammatischen Morphem führt oft zu Wort in einer anderen Wortklasse Beispiel: aus Verbstamm les und grammatischem Morphem -bar wird Adjektiv lesbar gebildet Beispiel: aus engl. Verben, die dabei oft auf -ize enden, werden mit grammatischem Morphem -ation Nomen gebildet (z.b. computerize wird zu computerization ) vgl. [JM08], Ch. 3.1.2 D. Rösner NSS I 2010/11... 15

Komposition Komposition (engl. compounding)... Verknüpfung mehrerer Wortstämme Beispiel: lighthouse im Englischen werden sog. noun compounds meist durch Aneinanderreihung mit Leerzeichen gebildet Beispiel: machine language translation D. Rösner NSS I 2010/11... 16

Komposition im Deutschen gilt bei Nominalkomposita nach gültiger Rechtschreibung die direkte Zusammenschreibung, in manchen Fällen die Zusammenschreibung mit Bindestrichen Beispiele: Kreiswehrersatzamt, aber Richard-Wagner-Allee manche Zusammenschreibung erfordert dabei ein sog. Fugenmorphem Beispiele: Börse-n-kurs, Wirtschaft-s-ministerium D. Rösner NSS I 2010/11... 17

Klitisierung Klitikon (pl. Klitika)... Einheiten, deren Status zwischen dem eines Affix und dem eines Worts liegt Klitika oft unterschieden in vorangestellte (Proklitika) und nachgestellte (Enklitika) im Englischen gibt es Klitika zu Formen von Hilfsverben Beispiel: she s für she is oder she has D. Rösner NSS I 2010/11... 18

Literatur: I Daniel Jurafsky and James H. Martin. Speech and Language Processing: An introduction to natural language processing, computational linguistics, and speech recognition. Prentice Hall, 2nd (May 26, 2008) edition, 2008. Christopher D. Manning and Hinrich Schütze. Foundations of Statistical Natural Language Processing. MIT Press, fifth printing edition, 2002. D. Rösner NSS I 2010/11... 19