Natürlichsprachliche Systeme I Materialien zur Vorlesung

Größe: px
Ab Seite anzeigen:

Download "Natürlichsprachliche Systeme I Materialien zur Vorlesung"

Transkript

1 Natürlichsprachliche Systeme I Materialien zur Vorlesung D. Rösner Institut für Wissens- und Sprachverarbeitung Fakultät für Informatik Otto-von-Guericke Universität Magdeburg WS 2010/11, 19. Oktober 2010, c 2010, 2011 D.Rösner D. Rösner NSS I 2010/

2 Gliederung 1 Einleitung 2 Flexion Derivation Komposition Klitisierung D. Rösner NSS I 2010/

3 Motivation nicht alle englischen Wörter haben die simple Unterscheidung zwischen singular und plural durch angehängtes s Beispiele (vgl. [JM08], Ch. 3): fox foxes peccary peccaries goose geese fish fish Arten von benötigten Regeln: orthographische Regeln morphologische Regeln D. Rösner NSS I 2010/

4 Morphologisches Parsing Parsing... allgemein: einer Eingabe eine linguistische Struktur zuordnen vgl. [JM08], Ch. 3 D. Rösner NSS I 2010/

5 Morphologisches Parsing morphologisches Parsing... Zerlegung von Wörtern in sog. Beispiele: foxes zerlegen in Grundform fox und Plural-Morphem -es Eingabe (oder Oberflächenform) going zerlegen in Grundform und -ing-morphem als Parsing-Ergebnis darstellbar z.b. als VERB-go + GERUND-ing morphologisches Parsing insbesondere wichtig für Sprachen mit reichhaltiger (z.b. Deutsch, Russisch, Türkisch, Finnisch,... ) vgl. [JM08], Ch. 3 D. Rösner NSS I 2010/

6 Morphologisches Parsing Frage: Warum ist Ablegen aller (Oberflächen-)Formen und morphologisches Parsen durch Nachschlagen (lookup) keine wirkliche Alternative? morphologische Regeln sind produktiv Beispiel: an jedes Verb kann -ing-morphem angehängt werden für Neologismen müssen die unterschiedlichen Formen gebildet und erkannt werden können vgl. [JM08], Ch. 3 D. Rösner NSS I 2010/

7 ... wie werden Wörter aus kleineren bedeutungstragenden Einheiten aufgebaut? Morphem... definiert als kleinste bedeutungstragende Einheit einer Sprache vgl. [JM08], Ch. 3.1 D. Rösner NSS I 2010/

8 Unterscheidung in Stämme Affixe Stamm trägt die Hauptbedeutung, Affixe fügen dieser Ergänzungen hinzu vgl. [JM08], Ch. 3.1 D. Rösner NSS I 2010/

9 Affixe weiter unterschieden in Präfixe, Suffixe, Infixe, Circumfixe vgl. [JM08], Ch. 3.1 D. Rösner NSS I 2010/

10 Beispiele für unterschiedliche Affixe (vgl. [JM08], Ch. 3.1) Präfix: engl. Verb unbuckle aus Stamm buckle und Präfix un- Suffix: engl. Verb runs aus Stamm run und Suffix -s Circumfix: bei einigen dt. Verben wird Partizip Perfekt durch Voranstellen von ge- und Anfügen von -t gebildet Beispiele: geliebt, gelacht,... Frage: andere Formen des Partizip Perfekt im Deutschen? D. Rösner NSS I 2010/

11 Beispiele für unterschiedliche Affixe (vgl. [JM08], Ch. 3.1) Infix: philippinische Sprache Tagalog: Morphem um zur Markierung des Handelnden einer Aktion wird in den Stamm, z.b. hingi (für (ent)leihen, engl. borrow), eingefügt Form dann humingi D. Rösner NSS I 2010/

12 Wortbildung durch morphologische Prozesse vier hauptsächliche Formen der Kombination von n zu Wörtern: Flexion (engl. inflection), Derivation, Komposition, Klitisierung (engl. cliticization) vgl. [JM08], Ch. 3.1 D. Rösner NSS I 2010/

13 Derivation Derivation... Kombination eines Wortstamms mit einem grammatischen Morphem führt oft zu Wort in einer anderen Wortklasse Beispiel: aus Verbstamm les und grammatischem Morphem -bar wird Adjektiv lesbar gebildet Beispiel: aus engl. Verben, die dabei oft auf -ize enden, werden mit grammatischem Morphem -ation Nomen gebildet (z.b. computerize wird zu computerization ) vgl. [JM08], Ch D. Rösner NSS I 2010/

14 Komposition Komposition (engl. compounding)... Verknüpfung mehrerer Wortstämme Beispiel: lighthouse im Englischen werden sog. noun compounds meist durch Aneinanderreihung mit Leerzeichen gebildet Beispiel: machine language translation D. Rösner NSS I 2010/

15 Komposition im Deutschen gilt bei Nominalkomposita nach gültiger Rechtschreibung die direkte Zusammenschreibung, in manchen Fällen die Zusammenschreibung mit Bindestrichen Beispiele: Kreiswehrersatzamt, aber Richard-Wagner-Allee manche Zusammenschreibung erfordert dabei ein sog. Fugenmorphem Beispiele: Börse-n-kurs, Wirtschaft-s-ministerium D. Rösner NSS I 2010/

16 Klitisierung Klitikon (pl. Klitika)... Einheiten, deren Status zwischen dem eines Affix und dem eines Worts liegt Klitika oft unterschieden in vorangestellte (Proklitika) und nachgestellte (Enklitika) im Englischen gibt es Klitika zu Formen von Hilfsverben Beispiel: she s für she is oder she has D. Rösner NSS I 2010/

17 Literatur: I Daniel Jurafsky and James H. Martin. Speech and Language Processing: An introduction to natural language processing, computational linguistics, and speech recognition. Prentice Hall, 2nd (May 26, 2008) edition, Christopher D. Manning and Hinrich Schütze. Foundations of Statistical Natural Language Processing. MIT Press, fifth printing edition, D. Rösner NSS I 2010/

Part-Of-Speech-Tagging mit Viterbi Algorithmus

Part-Of-Speech-Tagging mit Viterbi Algorithmus Part-Of-Speech-Tagging mit Viterbi Algorithmus HS Endliche Automaten Inna Nickel, Julia Konstantinova 19.07.2010 1 / 21 Gliederung 1 Motivation 2 Theoretische Grundlagen Hidden Markov Model Viterbi Algorithmus

Mehr

Einführung in die Computerlinguistik Statistische Grundlagen

Einführung in die Computerlinguistik Statistische Grundlagen Statistik 1 Sommer 2015 Einführung in die Computerlinguistik Statistische Grundlagen Laura Heinrich-Heine-Universität Düsseldorf Sommersemester 2015 Statistik 2 Sommer 2015 Überblick 1. Diskrete Wahrscheinlichkeitsräume

Mehr

Einführung in die Computerlinguistik Überblick

Einführung in die Computerlinguistik Überblick Einführung in die Computerlinguistik Überblick Hinrich Schütze & Robert Zangenfeind Centrum für Informations- und Sprachverarbeitung, LMU München 2015-10-12 1 / 19 Was ist Computerlinguistik? Definition

Mehr

Fachschaft Englisch Unterrichtsinhalte Klasse Lehrwerk/Zusatzmaterialien: Lehrbuch Green Line 1 Voraussetzungen: Inhaltliche Schwerpunkte

Fachschaft Englisch Unterrichtsinhalte Klasse Lehrwerk/Zusatzmaterialien: Lehrbuch Green Line 1 Voraussetzungen: Inhaltliche Schwerpunkte Klasse 5 Generell orientiert sich der Englischunterricht in Klasse 5 am Lehrbuch Green Line 1 (Klett). Hierzu gibt es zahlreiche Zusatzmaterialien vom Klett-Verlag, u.a. für die Vorbereitung von Klassenarbeiten,

Mehr

Leseprobe Englisch Grammatik Clever gelernt Bestell-Nr. 1004-80 Mildenberger Verlag GmbH

Leseprobe Englisch Grammatik Clever gelernt Bestell-Nr. 1004-80 Mildenberger Verlag GmbH sübersicht 1 A/An (Indefinite article) Unbestimmter Artikel... 7 2 Adjectives, Comparison of adjectives Adjektive/Eigenschaftswörter, Steigerung/Vergleich... 8 3 Adverbs, Comparison of adverbs Adverbien/Umstandswörter,

Mehr

Gliederung. Programmierparadigmen. Sprachmittel in SCHEME. Objekte: Motivation. Objekte in Scheme

Gliederung. Programmierparadigmen. Sprachmittel in SCHEME. Objekte: Motivation. Objekte in Scheme Gliederung Programmierparadigmen D. Rösner Institut für Wissens- und Sprachverarbeitung Fakultät für Informatik Otto-von-Guericke Universität Magdeburg 1 Einführung Sprachmittel Sommer 2011, 20. Juni 2011,

Mehr

Programmierparadigmen

Programmierparadigmen Programmierparadigmen D. Rösner Institut für Wissens- und Sprachverarbeitung Fakultät für Informatik Otto-von-Guericke Universität Magdeburg Sommer 2011, 20. Juni 2011, c 2011 D.Rösner D. Rösner PGP 2011...

Mehr

ÜBERBLICK ÜBER DAS KURS-ANGEBOT

ÜBERBLICK ÜBER DAS KURS-ANGEBOT ÜBERBLICK ÜBER DAS KURS-ANGEBOT Alle aufgeführten Kurse sind 100 % kostenfrei und können unter http://www.unterricht.de abgerufen werden. SATZBAU & WORTSTELLUNG - WORD ORDER Aussagesätze / Affirmative

Mehr

Duden Schülerhilfen. Englisch 5. Klasse Übungen zu Wortschatz und Wortlehre. Dudenverlag Mannheim Leipzig Wien Zürich

Duden Schülerhilfen. Englisch 5. Klasse Übungen zu Wortschatz und Wortlehre. Dudenverlag Mannheim Leipzig Wien Zürich Duden Schülerhilfen Englisch 5. Klasse Übungen zu Wortschatz und Wortlehre von Alois Mayer mit Illustrationen von Detlef Surrey 2., aktualisierte Auflage Dudenverlag Mannheim Leipzig Wien Zürich Inhalt

Mehr

Maschinelle Sprachverarbeitung: KollokaKonen (Teil 2: Modelle von Wortsequenzen)

Maschinelle Sprachverarbeitung: KollokaKonen (Teil 2: Modelle von Wortsequenzen) basierend auf H Schmid snlp 4 KollokaKonen Maschinelle Sprachverarbeitung: KollokaKonen (Teil 2: Modelle von Wortsequenzen) Basierend auf Kap 3 McEnery & Wilson (2001) & H Schmid snlp Vorlesungsskript

Mehr

Morphologie (5) Wortarten (2) Part-of-Speech Tagging Stemming

Morphologie (5) Wortarten (2) Part-of-Speech Tagging Stemming Morphologie (5) Wortarten (2) Part-of-Speech Tagging Stemming Robert Zangenfeind Centrum für Informations- und Sprachverarbeitung, LMU München 24.11.2014, 9 c.t. Zangenfeind: Morphologie 1 / 18 Wdh.: Klassifizierung

Mehr

Programmbeschreibungen. PIH-Software. Alexander M. Hüther. für WINDOWS & MAC-OS

Programmbeschreibungen. PIH-Software. Alexander M. Hüther. für WINDOWS & MAC-OS Programmbeschreibungen PIH-Software für WINDOWS & MAC-OS Alexander M. Hüther Stand: November 2002 PIH-CD Teil 1 Rechnen Zahlenstrahl bis 100 Übung 1: Durch das Eingeben einer beliebigen Zahl wandert der

Mehr

LANGSOFT, Sprachlernmittel, Schweiz. DOKUMENTATION und Präsentation

LANGSOFT, Sprachlernmittel, Schweiz. DOKUMENTATION und Präsentation LANGSOFT, Sprachlernmittel, Schweiz DOKUMENTATION und Präsentation 1. Eintragung. Zuerst registriert am 27.05.1994 in Graubünden, Schweiz, Reg. No 1.350.000.133. Erneut registriert am 09.12.1996 in Graubünden,

Mehr

Langenscheidt Englisch-Comics Grammatik

Langenscheidt Englisch-Comics Grammatik Langenscheidt Comics Grammatik Langenscheidt Englisch-Comics Grammatik von Anke Williamson 1. Auflage Langenscheidt Englisch-Comics Grammatik Williamson schnell und portofrei erhältlich bei beck-shop.de

Mehr

Programmieren in natürlicher Sprache: Alice-Kontrollstrukturen

Programmieren in natürlicher Sprache: Alice-Kontrollstrukturen Programmieren in natürlicher Sprache: Alice-Kontrollstrukturen Bachelorarbeit betreut von Mathias Landhäußer Ronny Hug 20. August 2014 IPD TICHY KIT Universität des Landes Baden-Württemberg und nationales

Mehr

Einführung in die Linguistik, Teil 4

Einführung in die Linguistik, Teil 4 Einführung in die Linguistik, Teil 4 Syntax - Das Berechnen syntaktischer Strukturen beim menschlichen Sprachverstehen Markus Bader, Frans Plank, Henning Reetz, Björn Wiemer Einführung in die Linguistik,

Mehr

Unterrichtsmaterialien in digitaler und in gedruckter Form. Auszug aus: Grammatik einfach praktisch - Englisch (Niveau: A1 - B2)

Unterrichtsmaterialien in digitaler und in gedruckter Form. Auszug aus: Grammatik einfach praktisch - Englisch (Niveau: A1 - B2) Unterrichtsmaterialien in digitaler und in gedruckter Form Auszug aus: Grammatik einfach praktisch - Englisch (Niveau: A1 - B2) Das komplette Material finden Sie hier: School-Scout.de Eine moderne und

Mehr

Einführung Computerlinguistik. Überblick

Einführung Computerlinguistik. Überblick Einführung Computerlinguistik Überblick Hinrich Schütze & Robert Zangenfeind Centrum für Informations- und Sprachverarbeitung, LMU München 2013-10-14 Schütze & Zangenfeind: Überblick 1 / 30 Take-away Schütze

Mehr

Das Online-Computerprogramm Graf Orthos Wortschatz-Training online

Das Online-Computerprogramm Graf Orthos Wortschatz-Training online Kurzanleitung Wort online WORTSCHATZ-TRAINING Das Online-Computerprogramm Wortschatz-Training online Dieses Computerprogramm hat den Vorteil, dass das Kind n die Übungen mit dem Modellwortschatz ergänzen

Mehr

Die Satzstellung im Deutschen in Haupt- und Nebensa tzen (Pra sens, Perfekt, Pra teritum, Plusquamperfekt und Futur I)

Die Satzstellung im Deutschen in Haupt- und Nebensa tzen (Pra sens, Perfekt, Pra teritum, Plusquamperfekt und Futur I) Die Satzstellung im Deutschen in Haupt- und Nebensa tzen (Pra sens, Perfekt, Pra teritum, Plusquamperfekt und Futur I) 1. PRÄSENS Ich spreche Deutsch, Englisch, Französisch und Spanisch. Deutsch, Englisch,

Mehr

Goethe. Einführung in die Computerlinguistik: Maschinelle Übersetzung. Können Computer übersetzen? Babel Fish Google

Goethe. Einführung in die Computerlinguistik: Maschinelle Übersetzung. Können Computer übersetzen? Babel Fish Google Goethe Einführung in die Computerlinguistik: Maschinelle Übersetzung WS 2012/2013 Manfred Pinkal! Über allen Gipfeln ist Ruh. In allen Wipfeln spürest du kaum einen Hauch! Over all summits is rest. In

Mehr

Die Betonung der Wörter

Die Betonung der Wörter Die Betonung der Wörter I. Anmerkungen zur Notation Der Vokal der betonten Silbe wird markiert. EH]HLFKQHWHLQHQkurzen Vokal, einen langen Vokal. Bei Diphtongen (au, äu, eu, ei) spielt die Unterscheidung

Mehr

Automatische Erkennung von Figuren in deutschsprachigen Romanen

Automatische Erkennung von Figuren in deutschsprachigen Romanen Automatische Erkennung von Figuren in deutschsprachigen Romanen Jannidis, Fotis fotis.jannidis@uni-wuerzburg.de, Universität Würzburg Krug, Markus markus.krug@uni-wuerzburg.de, Universität Würzburg Reger,

Mehr

KURZÜBERSICHT SONDERTEIL

KURZÜBERSICHT SONDERTEIL 402 BERUFSKOLLEG / FACHOBERSCHULEN - Englisch - Inhalt - Kurzübersicht KURZÜBERSICHT SONDERTEIL 402 410 Inhaltsverzeichnis 411-439 Notizen 440 476 Language-Aufgaben (Vocabulary) 477-489 Notizen 490 506

Mehr

Aufgabe 1: % Schreiben Sie eine DATR-Theorie, die die Flexionsendungen deutscher % Adjektive erfasst. Benutzen Sie die gegebenen Show-Deklarationen.

Aufgabe 1: % Schreiben Sie eine DATR-Theorie, die die Flexionsendungen deutscher % Adjektive erfasst. Benutzen Sie die gegebenen Show-Deklarationen. Hausaufgabe (Abgabe: 22.12.2009): Lösen Sie bitte eine der drei folgenden Aufgaben. Hinweis: die Aufgabe 3 ist vermutlich die einfachste dieser Aufgaben. BN: Für einen BN müssen diese Woche keine Hausaufgaben

Mehr

Ein bisschen Werbung. Einführung in die Morphologie Einleitung, Grundbegriffe I. Morphologie. 'Morphologie' Was ist ein Wort? Was ist ein Wort?

Ein bisschen Werbung. Einführung in die Morphologie Einleitung, Grundbegriffe I. Morphologie. 'Morphologie' Was ist ein Wort? Was ist ein Wort? Ein bisschen Werbung Einführung in die Morphologie Einleitung, Grundbegriffe I Anke Lüdeling anke.luedeling@rz.hu-berlin.de Sommersemester 2005 "Morphology is the conceptual centre of linguistics. This

Mehr

Modulhandbuch Studiengang Master of Science Computational Linguistics Prüfungsordnung: 2011

Modulhandbuch Studiengang Master of Science Computational Linguistics Prüfungsordnung: 2011 Modulhandbuch Studiengang Master of Science Computational Linguistics Prüfungsordnung: 2011 Sommersemester 2012 Stand: 04. April 2012 Universität Stuttgart Keplerstr. 7 70174 Stuttgart Kontaktpersonen:

Mehr

STOCHASTISCHE GRAMMATIKMODELLE. Meine Lehrveranstaltungen für... Informatiker & Bioinformatiker & Informatikerinnen & Bioinformatikerinnen

STOCHASTISCHE GRAMMATIKMODELLE. Meine Lehrveranstaltungen für... Informatiker & Bioinformatiker & Informatikerinnen & Bioinformatikerinnen STOCHASTISCHE GRAMMATIKMODELLE Vorlesung im Sommersemester 2015 Prof. E.G. Schukat-Talamazzini Stand: 20. Juli 2015 Lehrbereich Informatik Intelligente Systeme Vertiefung Künstliche Intelligenz und Mustererkennung

Mehr

Interlineare Morphemglossierung

Interlineare Morphemglossierung Interlineare Morphemglossierung Das in diesem Abschnitt vorgestellte Verschriftungssystem wird im Gegensatz zu den bisher beschriebenen nicht in erster Linie benutzt, um Äußerungen gesprochener Sprache

Mehr

Duden Schülerhilfen. Englisch 7. Klasse Übungen zu Wort- und Satzlehre und zum Textverständnis. Dudenverlag Mannheim Leipzig Wien Zürich

Duden Schülerhilfen. Englisch 7. Klasse Übungen zu Wort- und Satzlehre und zum Textverständnis. Dudenverlag Mannheim Leipzig Wien Zürich Duden Schülerhilfen Englisch 7. Klasse Übungen zu Wort- und Satzlehre und zum Textverständnis von Alois Mayer und Gillian Zieger mit Illustrationen von Detlef Surrey 2., aktualisierte Auflage Dudenverlag

Mehr

Parsing German Verbs (Third-Person Singular) Parsing German Verbs (Third-Person Plural)

Parsing German Verbs (Third-Person Singular) Parsing German Verbs (Third-Person Plural) Parsing German Verbs (Third-Person Singular) [ * for indicative = subjunctive] Verb type Weak Weak (sein) Strong Strong (sein) (Present Infinitive) sagen reisen geben kommen (Perfect Infinitive) gesagt

Mehr

Bildwörterbücher im Englischunterricht der Grundschule

Bildwörterbücher im Englischunterricht der Grundschule Bildwörterbücher im EU der GS Bildwörterbücher im Englischunterricht der Grundschule Ute Wagner Universität Siegen Organisation und Aufbau von Bildwörterbüchern Theoretische Vorüberlegungen o Dimensionen

Mehr

Einführung in die Sprachwissenschaft Jan Bruners

Einführung in die Sprachwissenschaft Jan Bruners Einführung in die Sprachwissenschaft Jan Bruners Morphologie 2: Wortbildung Allgemein Im Gegensatz zur Flexion ([der] Wald, [des] Waldes, [die] Wälder) ist die Wortbildung ein prinzipiell unbeschränkter

Mehr

Introduction to Computational Linguistics

Introduction to Computational Linguistics Introduction to Computational Linguistics PD Dr. Frank Richter fr@sfs.uni-tuebingen.de. Seminar für Sprachwissenschaft Eberhard-Karls-Universität Tübingen Germany NLP Intro WS 2005/6 p.1 Incremental Linguistic

Mehr

VI Morphologische Exponens

VI Morphologische Exponens Fortmann, Proseminar Morphologie / Universität Konstanz Wintersemester 2006/07 VI Morphologische Exponens Die Bedeutung, welche durch ein Morphem einer Lautform assoziiert wird, ist nach Gehalt und Umfang

Mehr

Autorenvorstellung 5 Zum Gebrauch 7 Klassenzimmersprache/classroom language 8

Autorenvorstellung 5 Zum Gebrauch 7 Klassenzimmersprache/classroom language 8 Inhaltsverzeichnis Englisch Autorenvorstellung 5 Zum Gebrauch 7 Klassenzimmersprache/classroom language 8 Verben/verbs 10 Präsens/present simple 10 Verneinung/negation 13 Präsens (-ing-form)/present continuous

Mehr

Morphologie & Syntax

Morphologie & Syntax Morphologie & Syntax SS 2010 Wiederholungsklausur ame, Vorname Matrikelnummer 1. Morphologische Struktur (3 P.) Geben Sie die morphologische Struktur des Stamms Bundesausbildungsförderungsgesetz durch

Mehr

- Allgemeingültiges oder gewohnheitsmäßige Abläufe darstellen (generelles Präsens): Beispiele: Er besucht mich täglich. Eins plus eins ergibt zwei.

- Allgemeingültiges oder gewohnheitsmäßige Abläufe darstellen (generelles Präsens): Beispiele: Er besucht mich täglich. Eins plus eins ergibt zwei. Dr. Volker Hertel S. 1 SS 2015 Das Verb Verben sind die einzige Wortklasse, deren Elemente konjugiert werden können, d. h. in Person, Numerus, Tempus, Genus und Modus verändert werden können. Mit diesen

Mehr

SEMANTISCHE INFORMATION [NPnominativ1, NPakkusativ2]

SEMANTISCHE INFORMATION [NPnominativ1, NPakkusativ2] Lexikon und Morphologie Lexikon Vokabular, bzw. Zeichenvorrat...enthält die bedeutungstragenden Bausteine der Sprache, aus denen komplexe Strukturen mit komplexen Bedeutungen zusammengesetzt werden: Lexeme

Mehr

p Texte der Hörszenen: S.138

p Texte der Hörszenen: S.138 11 RadioD. berblick Information Compu recherchiert die Bedeutung des Namens Eulalia. Der spanische Kollege aus der Radioredaktion kennt eine Santa Eulalia, eine Heilige und Märtyrerin. Hörstrategie Die

Mehr

UNTERRICHTSPLAN LEKTION 11

UNTERRICHTSPLAN LEKTION 11 Lektion 11 Was hast du heute gemacht? UNTERRICHTSPLAN LEKTION 11 1 Sehen Sie das Foto an. Fahren Sie auch gern Fahrrad? Plenum, ggf. Partner- / Gruppenarbeit Erklären Sie zunächst anhand von Beispielen

Mehr

Simple Present Einleitung

Simple Present Einleitung Simple Present Einleitung Im Deutschen nennen wir diese Zeitform Präsens oder einfache Gegenwart. Mit dem Simple Present werden Handlungen in der Gegenwart ausgedrückt, die einmalig oder wiederholt stattfinden,

Mehr

Seminar Text- und Datamining Textmining-Grundlagen Erste Schritte mit NLTK

Seminar Text- und Datamining Textmining-Grundlagen Erste Schritte mit NLTK Seminar Text- und Datamining Textmining-Grundlagen Erste Schritte mit NLTK Martin Hacker Richard Schaller Künstliche Intelligenz Department Informatik FAU Erlangen-Nürnberg 16.05.2013 Gliederung 1 Vorverarbeitung

Mehr

Benutzeranleitung zur Bilddatenbank

Benutzeranleitung zur Bilddatenbank Benutzeranleitung zur Bilddatenbank Abb. 1: Startseite der Bilddatenbank Inhalt 1. Anmeldung Seite 2 2. Startseite Seite 2 3. Bildsuche Seite 3 4. Suchergebnisse Seite 4 5. Erweiterte Suche Seite 5 6.

Mehr

Part-of-Speech- Tagging

Part-of-Speech- Tagging Part-of-Speech- Tagging In: Einführung in die Computerlinguistik Institut für Computerlinguistik Heinrich-Heine-Universität Düsseldorf WS 2004/05 Dozentin: Wiebke Petersen Tagging Was ist das? Tag (engl.):

Mehr

GRUNDWISSEN Englisch E 1 1. bis 3. Lernjahr GRAMMATIK MÜNDLICHE AUSDRUCKSFÄHIGKEIT

GRUNDWISSEN Englisch E 1 1. bis 3. Lernjahr GRAMMATIK MÜNDLICHE AUSDRUCKSFÄHIGKEIT GRUNDWISSEN Englisch E 1 1. bis 3. Lernjahr GRAMMATIK MÜNDLICHE AUSDRUCKSFÄHIGKEIT present tense (simple, progressive), simple past; going to-future (rezeptiv) Vollverben, Hilfsverben (be, have, do, can,

Mehr

Morphologie Einleitung. System der deutschen Sprache Morphologie nominale Kategorie: Genus

Morphologie Einleitung. System der deutschen Sprache Morphologie nominale Kategorie: Genus System der deutschen Sprache nominale Kategorie: Genus Beat Siebenhaar Frank Liedtke Einleitung! Morphem als kleinste bedeutungstragende Einheit! als Lehre von den Morphemen! Agglutination! Flexion! Genus,

Mehr

Linguistik für Kognitionswissenschaften

Linguistik für Kognitionswissenschaften Linguistik für Kognitionswissenschaften Computerlinguistik: Maschinelle Übersetzung Computerlinguistik Fehlübersetzung von engl. computational linguistics - computationelle Linguistik beinhaltet im weiteren

Mehr

Langenscheidt e-handwörterbuch Englisch

Langenscheidt e-handwörterbuch Englisch Englisch-Deutsch, Deutsch-Englisch, Version 4.0, 2003, 1 CD-ROM, ISBN 3-468-90990- X, 79,00 Rezensiert von Christopher Hall, Joensuu Langenscheidts e-handwörterbuch Englisch ist der Nachfolger vom erfolgreichen

Mehr

Hochschule Hannover Fakultät III Medien, Information und Design Abteilung Information und Kommunikation

Hochschule Hannover Fakultät III Medien, Information und Design Abteilung Information und Kommunikation Hochschule Hannover Fakultät III Medien, Information und Design Abteilung Information und Kommunikation ------------------------------------------------------------------------------------- Möglichkeiten

Mehr

Universität Potsdam Institut für Informatik Lehrstuhl Maschinelles Lernen. NLP-Pipeline. Tobias Scheffer Thomas Vanck

Universität Potsdam Institut für Informatik Lehrstuhl Maschinelles Lernen. NLP-Pipeline. Tobias Scheffer Thomas Vanck Universität Potsdam Institut für Informatik Lehrstuhl Maschinelles Lernen NLP-Pipeline Tobias Scheffer Thomas Vanck NLP-Pipeline Folge von Verarbeitungsschritten für Informationsextraktion, Übersetzung,

Mehr

Background for Hybrid Processing

Background for Hybrid Processing Background for Hybrid Processing Hans Uszkoreit Foundations of LST WS 04/05 Scope Classical Areas of Computational Linguistics: computational morphology, computational syntax computational semantics computational

Mehr

Englisch-deutsch-polnisches Wörterbuch. Benutzeranleitung

Englisch-deutsch-polnisches Wörterbuch. Benutzeranleitung Der EGP230D wird mit zwei CR2032 Batterien und einer CR1220 Reservebatterie betrieben. Um einen Datenverlust zu vermeiden, tauschen Sie die Batterien so schnell wie möglich aus. Dabei dürfen die alten

Mehr

EXTRAKTION UND KLASSIFIKATION VON BEWERTETEN PRODUKTFEATURES AUF WEBSEITEN

EXTRAKTION UND KLASSIFIKATION VON BEWERTETEN PRODUKTFEATURES AUF WEBSEITEN EXTRAKTION UND KLASSIFIKATION VON BEWERTETEN PRODUKTFEATURES AUF WEBSEITEN T-SYSTEMS MULTIMEDIA SOLUTIONS GMBH, 16. FEBRUAR 2012 1. Schlüsselworte Semantic Web, Opinion Mining, Sentiment Analysis, Stimmungsanalyse,

Mehr

Hueber. Deutsch. Sabine Dinsel / Susanne Geiger. Verbformen. Bildung & Gebrauch

Hueber. Deutsch. Sabine Dinsel / Susanne Geiger. Verbformen. Bildung & Gebrauch Hueber Deutsch Sabine Dinsel / Susanne Geiger Verbformen Bilng & Gebrauch Seite 4 Vorwort 5 Orientierung: In welcher Übung d was geübt? 7 Übungen 7 A. Alltag 19 B. Mitmenschen 33 C. Lernen & Beruf 49 D.

Mehr

Das Verb. Die grammatischen Kategorien des Verbs

Das Verb. Die grammatischen Kategorien des Verbs Das Verb. Die grammatischen Kategorien des Verbs Das Verb ist eine Wortart, die eine Tätigkeit (eine Handlung), einen Vorgang oder einen Zustand ausdrückt. Das deutsche Verb hat folgende grammatische Kategorien:

Mehr

Automatisches Lernen von Regeln zur quellseitigen Umordnung

Automatisches Lernen von Regeln zur quellseitigen Umordnung Automatisches Lernen von Regeln zur quellseitigen Umordnung E I N A N S AT Z V O N D M I T R I Y G E N Z E L Duwaraka Murugadas Fortgeschrittene Methoden der statistischen maschinellen Übersetzung (Miriam

Mehr

Studiengang "Lehramt an Gymnasien" Englisch Hauptfach

Studiengang Lehramt an Gymnasien Englisch Hauptfach Studiengang "Lehramt an Gymnasien" geko/01.07.2014 Studien- und Prüfungsordnung der Albert-Ludwigs-Universität für den Studiengang Lehramt an Gymnasien vom 24.03.2011 in der Fassung der Fachspezifischen

Mehr

LOGBUCH DEUTSCH. Ich will lernen.de. Gamze Yanikgül, Sven-Olaf Miehe. Name, Vorname. Tutor. dragonboard group c h a n g e p i l o t s

LOGBUCH DEUTSCH. Ich will lernen.de. Gamze Yanikgül, Sven-Olaf Miehe. Name, Vorname. Tutor. dragonboard group c h a n g e p i l o t s Gamze Yanikgül, Sven-Olaf Miehe LOGBUCH DEUTSCH 2013 Ich will lernen.de dragonboard group c h a n g e p i l o t s Staatliche Gewerbeschule 8 Name, Vorname Tutor Gamze Yanikgül, Sven-Olaf Miehe in Kooperation

Mehr

1. Tag. Wie oft machen Sie das? Ich mache das jeden Tag. einmal/zweimal/dreimal die/in der Woche. (= pro Woche)

1. Tag. Wie oft machen Sie das? Ich mache das jeden Tag. einmal/zweimal/dreimal die/in der Woche. (= pro Woche) Deutsch 1002 (Tim Jansa) 1. Tag Wie waren Ihre/deine Ferien? Meine/die Ferien waren toll/langweilig/.... Wo waren Sie?/Wo warst du? Ich war / wir waren in... / zu Hause. Wie war es/das? Das/es war schön/ruhig/heiß/....

Mehr

Lösung für Lehrerinnen und Lehrer Grammatik-Lapbook Teil 1: Wortarten

Lösung für Lehrerinnen und Lehrer Grammatik-Lapbook Teil 1: Wortarten Lösung für Lehrerinnen und Lehrer Grammatik-Lapbook Teil 1: Wortarten Es wird zunächst eine Grundform für das Lapbook erstellt. Dabei bietet es sich an, aus Tonkarton ein Buch zu falten (siehe auch Arbeitsblatt

Mehr

SPRACHNIVEU B1 IM GEMEINSAMEN EUROPÄISCHEN REFERENZRAHMEN

SPRACHNIVEU B1 IM GEMEINSAMEN EUROPÄISCHEN REFERENZRAHMEN TITEL ORT für Fortgeschrittene (B1) Institute of Intensive English, Honolulu, Hawaii USA KURSLEITER Joel Beck DATUM 09.06.2014 20.06.2014 Kosten 1001 Four Corners 3-Richards, Jack C., & David Bohlke. Cambridge:

Mehr

L E I T F A D E N. Wissenschaftliches Arbeiten im Studium der Theologie an der Universität Regensburg

L E I T F A D E N. Wissenschaftliches Arbeiten im Studium der Theologie an der Universität Regensburg L E I T F A D E N Wissenschaftliches Arbeiten im Studium der Theologie an der Universität Regensburg Fakultät

Mehr

Hueber Wörterbuch Deutsch als Fremdsprache Basiswissen kompakt

Hueber Wörterbuch Deutsch als Fremdsprache Basiswissen kompakt Julia Ilovaiskaia, Hueber Verlag Hueber Wörterbuch Deutsch als Fremdsprache Basiswissen kompakt Es ist heute kaum umstritten, dass ein einsprachiges Wörterbuch eine große Hilfe beim Erlernen einer Fremdsprache

Mehr

3. Stilkontrolle. 4. Terminologiekontrolle

3. Stilkontrolle. 4. Terminologiekontrolle Heinz Dieter Maas Multilingualität in Mpro Im folgenden soll das System Mpro vorgestellt werden, an dem seit genau dem 20. Dezember 1992 im Institut für Angewandte Informationsforschung in Saarbrücken

Mehr

a lot of, much und many

a lot of, much und many Aufgabe 1, und In bejahten Sätzen verwendest du für die deutschen Wörter viel und viele im Englischen Bsp.: I have got CDs. We have got milk. There are cars on the street. Bei verneinten Sätzen und Fragen

Mehr

Mit der Entwicklung des Internets sind endliche Automaten noch weiter in den Fokus gerückt. Dafür sind mehrere Gründe ausschlaggebend:

Mit der Entwicklung des Internets sind endliche Automaten noch weiter in den Fokus gerückt. Dafür sind mehrere Gründe ausschlaggebend: Einleitung Endliche Automaten sind das Ergebnis der Entwicklung mathematischer Modelle für verschiedene mathematische, technische und naturwissenschaftliche Anwendungsbereiche. Als Pionierarbeiten gelten

Mehr

Lerninhalte ALFONS Lernwelt Deutsch 5. Klasse

Lerninhalte ALFONS Lernwelt Deutsch 5. Klasse Seite 1 Turmzimmer 1: Lesen und Raten 1. Rückwärts lesen, vorwärts schreiben 7. Ohrentraining 2. Rückwärts hören, vorwärts schreiben 8. Europäerinnen und Europäer 3. Fremdwortgalgen 9. Europäische Leckereien

Mehr

Einführung Computerlinguistik. Konstituentensyntax II

Einführung Computerlinguistik. Konstituentensyntax II Einführung Computerlinguistik Konstituentensyntax II Hinrich Schütze & Robert Zangenfeind Centrum für Informations- und Sprachverarbeitung, LMU München 2013-11-18 Schütze & Zangenfeind: Konstituentensyntax

Mehr

Inhaltsverzeichnis. Vorwort 5

Inhaltsverzeichnis. Vorwort 5 Inhaltsverzeichnis Vorwort 5 1* Die Artikel und Möglichkeiten der Betonung 6 2 Adjektive als Nomen; Singular und Plural 9 3 Possessivbegleiter; s-genitiv / of-genitiv 11 4* Notwendige und nicht notwendige

Mehr

Gymnasium Winsen: Schulinternes Curriculum für das Fach Englisch. Klasse 5

Gymnasium Winsen: Schulinternes Curriculum für das Fach Englisch. Klasse 5 Klasse 5 School At home Hobbies and clubs Greenwich Project Week Birthday Party Unit 6: Beach Holiday Unit 7: Animals Communication: sich begrüßen, jemanden vorstellen; Auskünfte einholen und geben; über

Mehr

Seminar Textmining SS 2015 Grundlagen des Maschinellen Lernens

Seminar Textmining SS 2015 Grundlagen des Maschinellen Lernens Seminar Textmining SS 2015 Grundlagen des Maschinellen Lernens Martin Hacker Richard Schaller Künstliche Intelligenz Department Informatik FAU Erlangen-Nürnberg 17.04.2015 Entscheidungsprobleme beim Textmining

Mehr

Lerninhalte ALFONS Lernwelt Deutsch 6. Klasse

Lerninhalte ALFONS Lernwelt Deutsch 6. Klasse Seite 1 Turmzimmer 1: Beliebte Stolpersteine 1 1. Ableitung von b, d, g 7. -ig oder -lich im Auslaut 2. ai oder ei 8. end- oder ent- 1 3. f oder v oder w 9. end- oder ent- 2 4. W oder V, w oder v 10. seid

Mehr

Elementare Bildverarbeitungsoperationen

Elementare Bildverarbeitungsoperationen 1 Elementare Bildverarbeitungsoperationen - Kantenerkennung - 1 Einführung 2 Gradientenverfahren 3 Laplace-Verfahren 4 Canny-Verfahren 5 Literatur 1 Einführung 2 1 Einführung Kantenerkennung basiert auf

Mehr

Institut für Telematik Universität zu Lübeck. Programmieren. Kapitel 0: Organisatorisches. Wintersemester 2008/2009. Prof. Dr.

Institut für Telematik Universität zu Lübeck. Programmieren. Kapitel 0: Organisatorisches. Wintersemester 2008/2009. Prof. Dr. Institut für Telematik Universität zu Lübeck Programmieren Kapitel 0: Organisatorisches Wintersemester 2008/2009 Prof. Dr. Christian Werner 1-2 Überblick Ziele Inhaltsüberblick Ablauf der Veranstaltung

Mehr

Autorenunterstützung für die Maschinelle Übersetzung Melanie Siegel 1

Autorenunterstützung für die Maschinelle Übersetzung Melanie Siegel 1 Autorenunterstützung für die Maschinelle Übersetzung Melanie Siegel 1 Zusammenfassung Der Übersetzungsprozess der Technischen Dokumentation wird zunehmend mit Maschineller Übersetzung (MÜ) unterstützt.

Mehr

Linkliste Englische Grammatik

Linkliste Englische Grammatik Linkliste Englische Grammatik So geht s: Suche in den angegebenen Themenübersichten der unten aufgeführten Webseiten (deutsche und englische) nach dem grammatischen Problem deiner Wahl, öffne den Link

Mehr

Einordnung in den Europäischen Referenzrahmen: General English

Einordnung in den Europäischen Referenzrahmen: General English ALLGEMEINSPRACHE Allgemeinsprache General English mit Zeit und Muße für die Reise Allgemeine Kurse Auffrischungskurse At your leisure Seite 13 Hooray for Holidays! Seite 17 NEXT Seite 19 English Elements

Mehr

Computer Vision I. Nikos Canterakis. Lehrstuhl für Mustererkennung, Universität Freiburg,

Computer Vision I. Nikos Canterakis. Lehrstuhl für Mustererkennung, Universität Freiburg, Nikos Canterakis Lehrstuhl für Mustererkennung, Universität Freiburg, Literatur Richard Hartle and Andrew Zisserman. Multiple View Geometr in computer vision, Cambridge Universit Press, 2 nd Ed., 23. O.D.

Mehr

1. Jurafsky und Martin

1. Jurafsky und Martin Vertiefung 1. Jurafsky und Martin Book Description (from amazon.com) This book offers a unified vision of speech and language processing, presenting state-of-the-art algorithms and techniques for both

Mehr

Einführung in die Morphologie

Einführung in die Morphologie Polysemie Einführung in die Morphologie Derivation und Semantik In diesem Kapitel diskutieren AF die Interaktion der Semantik (Lehre von der Bedeutung sprachlicher Ausdrücke) und der Morphologie, insbesondere

Mehr

Lektion 9: Konjugation von Verben im Präsens (conjugation of verbs in present tense)

Lektion 9: Konjugation von Verben im Präsens (conjugation of verbs in present tense) Lektion 9: Konjugation von Verben im Präsens (conjugation of verbs in present tense) Verben werden durch das Anhängen bestimmter Endungen konjugiert. Entscheidend sind hierbei die Person und der Numerus

Mehr

1. Anzahl der Sprachen auf der Erde. 1.1 Probleme bei der Bestimmung der Zahl. 1.2 Das Sprachensterben. 2.1 Sprachfamilien

1. Anzahl der Sprachen auf der Erde. 1.1 Probleme bei der Bestimmung der Zahl. 1.2 Das Sprachensterben. 2.1 Sprachfamilien Modul: Sprachtheorie 10. Veranstaltung Klassifikation der Sprachen Christine Römer Universität Jena Institut für germanistische Sprachwissenschaft E-Mail: Christine.Roemer@uni-jena.de http://www.personal.uni-jena.de/~xcr/v2/?start

Mehr

Vorlesung Öhlschläger: WS 2010/11 Einführung in die germanistische Sprachwissenschaft Theoretische und methodische Grundlagen

Vorlesung Öhlschläger: WS 2010/11 Einführung in die germanistische Sprachwissenschaft Theoretische und methodische Grundlagen Vorlesung Öhlschläger: WS 2010/11 Einführung in die germanistische Sprachwissenschaft Theoretische und methodische Grundlagen 6. Wortbildung 6.1 Einleitende Bemerkungen 6.2 Funktionen der Wortbildung 6.3

Mehr

Gymnasium Rhauderfehn Schulinterner Arbeitsplan ENGLISCH Klasse 8

Gymnasium Rhauderfehn Schulinterner Arbeitsplan ENGLISCH Klasse 8 Das Gymnasium Gymnasium Rhauderfehn Schulinterner Arbeitsplan ENGLISCH Klasse 8 Quellen und Vorgaben: Kerncurriculum für das Gymnasium, Jg. 5-10, 2006, Nds. KM Lehrbuch: Green Line 4, Klett Verlag Lektüre:

Mehr

Aus: Hubert Truckenbrodt und Kathrin Eichler: Einführung in die moderne Sprachwissenschaft. Ms., ZAS Berlin und DFKI Saarbrücken, 2010.

Aus: Hubert Truckenbrodt und Kathrin Eichler: Einführung in die moderne Sprachwissenschaft. Ms., ZAS Berlin und DFKI Saarbrücken, 2010. Aus: Hubert Truckenbrodt und Kathrin Eichler: Einführung in die moderne Sprachwissenschaft. Ms., ZAS Berlin und DFKI Saarbrücken, 2010. Syntax 5: Die Syntax der Verben 1 Verben im Englischen 1.1 Auxiliare,

Mehr

Grammatiken in Prolog

Grammatiken in Prolog 12. Grammatiken in Prolog 12-1 Grammatiken in Prolog Allgemeines: Gedacht zur Verarbeitung natürlicher Sprache. Dort braucht man kompliziertere Grammatiken als etwa im Compilerbau, andererseits sind die

Mehr

Gliederung. Einführung in die Computerlinguistik: Maschinelle Übersetzung. Können Computer übersetzen? Goethe Babel Fish Google

Gliederung. Einführung in die Computerlinguistik: Maschinelle Übersetzung. Können Computer übersetzen? Goethe Babel Fish Google Gliederung Einführung in die Computerlinguistik: Maschinelle Übersetzung WS 2008/2009 Manfred Pinkal! " Können Computer übersetzen?! " Was sind die Probleme?! " Was sind die möglichen Lösungen?! " Mensch-Computer-Interaktion

Mehr

Patrick Simianer Visualisierung regulärer Ausdrücke

Patrick Simianer Visualisierung regulärer Ausdrücke Patrick Simianer Visualisierung regulärer Ausdrücke Patrick Simianer 2010-06-28 Endliche Automaten HS bei Dr. Karin Haenelt Universitiät Heidelberg im Sommersemester 2010 1 Einleitung Überlegungen Protoypisches

Mehr

Segmentierung (Beispielanalyse)

Segmentierung (Beispielanalyse) Einführung in die Linguistik Butt / Eulitz / Wiemer Di. 12:15-13:45 Do.! 12:15-13:45 Fr.! 12:15-13:45 Infos etc. http://ling.uni-konstanz.de => Lehre Einführung in die Linguistik Segmentierung (Beispielanalyse)

Mehr

Deklination des Nomens

Deklination des Nomens A1 Nomen nach normalen Deklination Bei normalen Deklination ist Folgendes zu beachten: 1. Im Genetiv Singular haben maskuline und neutrale Nomen Endung (e)s. (Grundregel: es bei einsilbigen Nomen, s bei

Mehr

Fachhochschule Wiesbaden, FB Design Informatik Medien Studiengang Allgemeine Informatik Vorlesung im SS 2007

Fachhochschule Wiesbaden, FB Design Informatik Medien Studiengang Allgemeine Informatik Vorlesung im SS 2007 Softwaretechnik Fachhochschule Wiesbaden, FB Design Informatik Medien Studiengang Allgemeine Informatik Vorlesung im SS 2007 1 Ziele Die Analyse einer softwaretechnischen Problemstellung nach objektorientierten

Mehr

2. Methodisches Vorgehen

2. Methodisches Vorgehen Empiriekurs III: Grammatische Methoden WS 2001/02 Dieter Wunderlich & Birgit Gerlach 24.10.2001 2. Methodisches Vorgehen Wir sammeln einige Daten in Paradigmen. Hier ist ein Ausschnitt. Die Morpheme sind

Mehr

Visualisierung von lexikalischem Wandel im Deutschen auf Basis der Google- Books Ngram Daten

Visualisierung von lexikalischem Wandel im Deutschen auf Basis der Google- Books Ngram Daten Visualisierung von lexikalischem Wandel im Deutschen auf Basis der Google- Books Ngram Daten Arbeitspapier Zusammenfassung In diesem Arbeitspapier wird gezeigt, wie mit Hilfe der Google- Books Ngram Daten

Mehr

Sprachtechnologie in der Wissenschaft: Digital-Turn in evidenzbasierter Bildungsforschung und -information

Sprachtechnologie in der Wissenschaft: Digital-Turn in evidenzbasierter Bildungsforschung und -information Sprachtechnologie in der Wissenschaft: Digital-Turn in evidenzbasierter Bildungsforschung und -information Iryna Gurevych Sprachtechnologie-Feuerwerk: Aktuelle Anwendungsbeispiele und Zukunftsvisionen

Mehr

Der Konjunktiv II 1. Forum Wirtschaftsdeutsch. Gebrauch Der Konjunktiv II wird u.a. verwendet

Der Konjunktiv II 1. Forum Wirtschaftsdeutsch. Gebrauch Der Konjunktiv II wird u.a. verwendet Der Konjunktiv II 1 Gebrauch Der Konjunktiv II wird u.a. verwendet 1. als Höflichkeitsform (Bitte oder Aufforderung in Form einer Frage): Könnten Sie mir einmal kurz helfen? Hätten Sie heute Abend Zeit?

Mehr

4. 4. Algorithmen und Datenstrukturen in deskriptiven Programmiersprachen

4. 4. Algorithmen und Datenstrukturen in deskriptiven Programmiersprachen Kapitel Kapitel 4 Deskriptive Programmierung SS 2008 4. 4. Algorithmen und Datenstrukturen in in deskriptiven Programmiersprachen Deskriptive Programmierung 1 Sprachverarbeitung in in Prolog Prolog Prolog

Mehr

If-Sätze, Wünsche und Fragen

If-Sätze, Wünsche und Fragen Vorwort 7 Liste der verwendeten Abkürzungen 8 Darstellungen auf den Fotos 8 Zeitenfolge 1 Das Präsens/Die Gegenwart 10 2 Das Präteritum/Die Vergangenheit 18 3 Das Futur I/Die Zukunft 23 4 Das Perfekt/Die

Mehr

Tagging von Online-Blogs

Tagging von Online-Blogs Tagging von Online-Blogs Gertrud Faaß (vertreten durch Josef Ruppenhofer) STTS tagset and tagging: special corpora 24. September 2012 Faaß MODEBLOGS 1 Korpuslinguistische studentische Projekte am IwiSt

Mehr