Überblick. Linguistische Grundlagen für die maschinelle Sprachverarbeitung. Was ist Linguistik? Linguistik. Generative Linguistik

Größe: px
Ab Seite anzeigen:

Download "Überblick. Linguistische Grundlagen für die maschinelle Sprachverarbeitung. Was ist Linguistik? Linguistik. Generative Linguistik"

Transkript

1 Überblick Linguistische Grundlagen für die maschinelle Sprachverarbeitung Anke Lüdeling Institut für deutsche Sprache und Linguistik Was ist Linguistik? linguistische Beschreibungsebenen (Phonetik, Phonologie, Morphologie, Syntax, Semantik, Pragmatik) Probleme für die Sprachverarbeitung (exemplarisch) Ambiguität (Wortarten, Syntax) Unterspezifiziertheit Anbindung an Weltwissen (semantische Lesarten) Produktivität (Wortbildung) Was ist Linguistik? Linguistik beschäftigt sich mit der Beschreibung und Modellierung von Sprachdaten den zugrundeliegenden Regularitäten (Regeln, statistische Muster, Constraintmengen,...) menschlicher Sprachverarbeitung (mentale Prozesse), Spracherwerb, Sprachverwendung Entwicklung und Veränderung von Sprache Sprache als sozialem Phänomen, Kommunikation... Linguistik 19. Jhd.: Sprachvergleich (Sprachstammbäume), Beschreibung von Veränderung (Diachronie), Beginn 20. Jhd.: Strukturalismus, Entwicklung von formalen Beschreibungsmitteln, Synchronie seit Chomsky 1957 generatives Paradigma Grundgedanken Basis vieler formal unterschiedlicher Theorien (Government & Binding, Minimalismus, Head- Driven Phrase Structure Grammar, Lexical Functional Grammar,...) Generative Linguistik SprecherInnen einer Sprache können unendlich viele Ausdrücke (Wörter, Sätze) also auch solche, die sie nie vorher gehört haben produzieren und verstehen... unendlich viele Ausdrücke... Rekursion Syntax der Bezug des Bettes des Hotels des Ermittlungsteams der Ursache des Absturzes des Systems... Morphologie Superstarauswahlveranstaltungsterminabsprachedialog systemabsturzursachenermittlungsteamhotelbettbezug Konjunktion (Aufzählung) Am Sonntag fraß sie sich durch einen Apfel, zwei Bananen, drei Tomaten, vier Gurken, fünf Schokotörtchen, sechs...

2 ... unendlich viele Ausdrücke... Hinzufügen neuer Basiselemente z.b. durch Entlehnung ( , to go) oder Kreativität (Handy, unkaputtbar) semantische Prozesse systematische Polysemie: Huhn, Schwein Analogie: Riesterknochen metaphorische Erweiterungen etc. Generative Linguistik SprecherInnen einer Sprache können unendlich viele Ausdrücke (Wörter, Sätze) also auch solche, die sie nie vorher gehört haben produzieren und verstehen d.h., Untersuchungsgegenstand ist das zugrundeliegende Produktionssystem, das alle und nur die grammatischen Ausdrücke einer Sprache erzeugt Generative Linguistik es gibt Sprachzentren im menschlichen Gehirn, die Produktionssysteme für menschliche Sprachen restringieren Evidenz Universalien Spracherwerb Statistische Ansätze statistische Ansätze (also alle, die in diesem Kurs besprochen werden) beziehen sich im Gegensatz dazu auf die Regularitäten in großen Textsammlungen (Textkorpora) Ziel: Modelle, die real vorkommenden Text möglichst genau abbilden und daraus Hypothesen für ungesehene Ereignisse ableiten Überblick Was ist Linguistik? linguistische Beschreibungsebenen (Phonetik, Phonologie, Morphologie, Syntax, Semantik, Pragmatik) Probleme für die Sprachverarbeitung (exemplarisch) Ambiguität (Wortarten, Syntax) Unterspezifiziertheit Anbindung an Weltwissen (semantische Lesarten) Produktivität (Wortbildung) Linguistische Beschreibungsebenen traditionell werden (mindestens) folgende Beschreibungsebenen unterschieden Phonetik Laut Phonologie Lautsystem Morphologie Struktur von Wörtern Syntax Struktur von Phrasen & Sätzen Semantik Bedeutung Pragmatik Verwendung

3 Phonetik Produktion und Systematik von Sprachlauten Phon artikulatorische Phonetik: Laute werden anhand des Artikulationsortes und der Artikulationsart klassifiziert Phonetik Artikulationsort bilabial [b] [p] [m] alveolar [t] [d] [n] [s] [z] [l] [r]... Artikulationsart stimmhaft (Stimmlippen schwingen) vs. stimmlos [b] [p], [d] [t] nasal (Luft entweicht auch durch die Nase) vs. oral [m] [b]... SAMPA SAMPA (Speech Assessment Methods Phonetic Alphabet) übersetzt die IPA-Zeichen in 7-bit ASCII-Zeichen (internationale Konvention) SAMPA für viele Sprachen erhältlich in Text-to-Speech Systemen verwendet z. B. deutsche Plosive (Auswahl) p Pein pain b Bein bain t Teich taic d Deich daic Konsonanten, Phonologie Lautsystem einer Sprache bedeutungsunterscheidende Laute innerhalb einer Sprache Phoneme Silbenstruktur Prosodie Phonologie bedeutungsunterscheidende Laute werden durch die Bildung von Minimalpaaren gefunden Hase vs. Nase, Schal vs. Schaf [h], [n], [f], [l] sind Phoneme des Deutschen dt. /r/: [r] oder [R] oder [χ] oder... Varianten nicht bedeutungsunterscheidend es wird nur ein Phonem für /r/ angenommen Phoneminventar einer Sprache Silbenmodelle einer Sprache Prosodie/Betonungsmuster für die Silben

4 Probleme für ASR (automatic speech recognition) und TTS (text-to-speech) Segmentierung des kontinuierlichen Sprachsignals Unterschiede zwischen SprecherInnen Ambiguitäten Produktivität/unbekannte Wörter wenig Linguistik viel Statistik Morphologie Aufbau von komplexen Wörtern Haustür Haus tür lachte lach te Unabhängigkeit Un ab häng ig keit Einteilung in bedeutungs-oder funktionstragende (grammatische Funktion, z.b. 1.Pers. Sg. Präsens) Elemente - Morpheme Morphologie Morphem: Stamm: Morphem, das auch alleine stehen kann Haus, Tür, lach, rot... Affix (Präfix, Suffix): Morphem, das nicht alleine stehen kann -bar, -te, -keit, -ung, ver-, ent-, un-... (Vorsicht: Verwendung von 'Präfix' und 'Suffix' in der Linguistik unterscheidet sich von der Verwendung von 'Präfix' und 'Suffix' in der Informatik) Flexion lachte Menschen Derivation Häuschen, lesbar... Morphologie Wortbildung Konversion Schlaf N schlaf V Kurzwortbildung Automobil Auto Komposition Haustür, hellblau Morphologie nicht nur Analyse, auch Strukturbildung Struktur abhängig von Aufbauprinzipien spiegelt die Interpretation (Semantik) des komplexen Wortes Un ab häng ig keit ((Un ((ab häng) ig)) keit) Kleinkunstwerk? Morphologie in der Computerlinguistik Flexionsmorphologie zur Lemmatisierung (Rückführung auf eine Grundform Lemma) zumeist regelbasiert: Zwei-Ebenen-Morphologie (Endliche Automaten) einigermaßen gut gelöst für viele Sprachen Wortbildung Problem Produktivität (Bildung von ungesehenen Wörtern) hohe Strukturambiguität bisher keine richtig gute Lösung für's Deutsche

5 Syntax Zusammensetzung von komplexen Ausdrücken aus Wörtern Struktur abhängig von Aufbauprinzipien, beschreibt die Interpretation eines komplexen Ausdrucks Syntax Phrasen Ersetzbarkeit George Bush lässt sich nicht einschüchtern Der amerikanische Präsident lässt sich nicht einschüchtern Der Präsident der Vereinigten Staaten... Der Präsident, der von weniger als der Hälfte der amerikanischen Wähler gewählt wurde,... *Präsident lässt sich nicht einschüchtern. *amerikanische lässt sich nicht einschüchtern (* steht für 'ungrammatisch') Syntax Phrasen Ersetzbarkeit George Bush lässt sich nicht einschüchtern. Der amerikanische Präsident lässt sich nicht einschüchtern. Der Präsident der Vereinigten Staaten... Der Präsident, der von weniger als der Hälfte der amerikanischen Wähler gewählt wurde,... die blauen Sequenzen bilden Konstituenten desselben Typs, d.h., man kann sie durcheinander ersetzen, ohne dass der Satz ungrammatisch wird Syntax Phrasen solche Konstituenten werden Phrasen genannt Nominalphrase (NP) Verbalphrase (VP) Adjektivphrase (AP)... Syntax Phrasen Beispiel Nominalphrase (Ausschnitt) der Präsident der amerikanische Präsident der frühere amerik. Präsident ein Präsident der USA der Präsident der... wurde ART? (ADJ)* N (NP S)? Syntax Phrasenstrukturbäume Phrasen werden zu Bäumen (oder Graphen) zusammengesetzt Aufgabe der Syntax ist es die Art der Phrasen in einer Sprache zu finden die interne Struktur der Phrasen zu finden die Kombinationsmöglichkeiten für Phrasen zu finden

6 Syntax Regeln/Constraints syntaktische Theorien unterscheiden sich unter anderem in der formalen Kodierung ihrer Strukturbeschreibungen (kontextfreie) Regeln Constraints, Merkmalsstrukturen Kombination von beidem... aus dem TIGER-Korpus (Baumbank, deutsche Zeitungstexte) Syntax Computerlinguistik Ziel: automatisches Parsing (den Ausdrücken soll eine syntaktische Struktur zugewiesen werden) Verfahren: regelbasiert statistisch (auf Baumbank trainiert oder untrainiert) Problem: hohe strukturelle Ambiguität Überblick Was ist Linguistik? linguistische Beschreibungsebenen (Phonetik, Phonologie, Morphologie, Syntax, Semantik, Pragmatik) Probleme für die Sprachverarbeitung (exemplarisch) Ambiguität (Wortarten, Syntax) Unterspezifiziertheit Anbindung an Weltwissen (semantische Lesarten) Produktivität (Wortbildung) Probleme für die maschinelle Sprachverarbeitung alles wäre ganz einfach, wenn es endlich viele Ausdrücke (Wörter/Sätze) gäbe (oder wenigstens endlich viele Basiseinheiten) jeder Ausdruck genau eine Struktur und Interpretation hätte und diese Struktur immer lokal (ohne zusätzliche Informationen) zu bestimmen wäre Probleme für die maschinelle Sprachverarbeitung im richtigen Leben (in einer natürlichen Sprache) gibt es aber Produktivität (und Kreativität) Ambiguität Unterspezifikation und Kontextabhängigkeit

7 Ambiguität kategorielle Ambiguität: ein Ausdruck kann zu mehreren Kategorien gehören Kohl Name oder einfaches Nomen? nach 14 Jahren Kohl war die Arbeitslosigkeit auf X% gestiegen nach 14 Jahren Kohl wollten wir endlich mal wieder etwas anderes essen Ambiguität Taggen beim Taggen ordnet man (im Prinzip beliebige) linguistische Informationen (im Prinzip beliebigen) Texteinheiten zu verkürzt wird Taggen meist für Wortartzuweisung (part-of-speech, pos) verwendet Wortarttaggen tokenbasiert (meist: Token = graphemisches Wort) als Eingabe für weitere computerlinguistische Anwendungen (Parser, sem. Verarbeitung, MT,...) man möchte ambige Wortformen einschränken können schreiben Sie meinen Namen in Bild es ist also, meinen wir, ein Erfolg für alle Berliner Wortarttaggen Ergebnis: jedes Token erhält ein pos-tag was/pws halten/vvfin Sie/PPER von/appr richtig/adjd schönen/adja deutschen/adja Universitätsstädten/NN?/$ Tagset: man muss sich eine Menge von pos- Tags definieren Wortarten Wortarten können schwer definiert werden Anzahl der Wortarten wurde schon in der klassischen griechischen Grammatik diskutiert. Dionysius Thrax (100 v. Chr.): Nomen, Verb, Pronomen, Präposition, Adverb, Konjunktion, Partizip, Artikel Wortarten positionsbasierte Definitionen (Position im Satz/ relativ zu anderen Wörtern), merkmalsbasierte Definitionen (bestimmte Flexionsmerkmale, semantische Merkmale etc.) syntaktische Funktion, morphologische Eigenschaften,... sprachübergreifende Definition?

8 Taggen: Tagset Tagset: Abwägen zwischen Genauigkeit (soll z.b. die grammatische Information kodiert werden?) und Handhabbarkeit Schlafmütze/NN Schlafmütze/NN NOM SG Schlafmütze/NN GEN SG Schlafmütze/NN DAT SG Schlafmütze/NN AKK SG Ambiguität strukturelle Ambiguität: einem Ausdruck können mehrere Strukturen zugewiesen werden Morphologie [klein [Kunst Werk]] ein kleines Kunstwerk, vgl. Kleinplastik, Kleinbetrieb, Kleinwagen [[klein Kunst] Werk] ein Werk der Kleinkunst, vgl. Kleinkunstbühne, Kleinkunstförderung Ambiguität Syntax [[alte Männer] und Frauen] [alte [Männer und Frauen]] ich sah den Mann mit dem Fernrohr ich sehe ihn laufend Ambiguität kategorielle und strukturelle Ambiguität bedingen einander John saw her duck [under the table] NE V Possessivpron. N PP NE V Personalpron. V PP Ambiguität Beispiele Staubecken Arbeitsamt Kläuschen Kaffee Unionsspitze Stiefelchen Ambiguität Auflösung Desambiguierungsstrategien regelbasiert heuristisch statistisch (HMM, Kontextvektoren) Desambiguierungsstrategien beziehen sich alle auf einen lokalen Kontext entweder über Anzahl der Token definiert oder über grammatische Relationen (Vorsicht bei statistischer Auswertung: Ereignisse sind nicht unabhängig)

9 Desambiguierung - Kontextabhängigkeit Problem: viele Ambiguitäten lassen sich lokal nicht auflösen man braucht mehr Wissen! Kontext 1 Satz nach 14 Jahren Kohl Straßenraub Kontext mehrere Sätze I saw her duck under the table manchmal reicht das nicht... Verstehen Sie Englisch? If the balloons popped, the sound wouldn't be able to carry since everything would be too far away from the correct floor. A closed window would also prevent the sound from carrying, since most buildings tend to be well insulated. Since the whole operation depends on a steady flow of electricity, a break in the middle of the wire would also cause problems. Of course, the fellow could shout, but the human voice is not loud enough to carry that far. An additional problem is that a string could break on the instrument. Then there could be no accompaniment to the message. It is clear that the best situation would involve less distance. Then there would be fewer potential problems. With face to face contact, the least number of things could go wrong. (Bransford and Johnson (1973)) If the balloons popped, the sound wouldn't be able to carry since everything would be too far away from the correct floor. A closed window would also prevent the sound from carrying, since most buildings tend to be well insulated. Since the whole operation depends on a steady flow of electricity, a break in the middle of the wire would also cause problems. Of course, the fellow could shout, but the human voice is not loud enough to carry that far. An additional problem is that a string could break on the instrument. Then there could be no accompaniment to the message. It is clear that the best situation would involve less distance. Then there would be fewer potential problems. With face to face contact, the least number of things could go wrong. Produktivität: ein bisschen Lexikostatistik Wie wahrscheinlich ist es, dass man ein neues (ungesehenes) Wort findet, nachdem man eine gegebene Menge Text verarbeitet hat? das lässt sich aus der Verteilung der Wörter in dem gegebenen Text errechnen (Baayen 1992, 2001) Wortverteilung grobe Vorstellung wenn man eine endliche Menge von Wörtern hat, erwartet man, dass jedes dieser Wörter in einem genügend großen Text mehrfach auftritt wenn man eine unendliche Menge von Wörtern hat, erwartet man, dass selbst in einem sehr großen Text viele nur einmal auftreten (und viele natürlich überhaupt nicht) d.h., dass die Zahl der seltenen Wörter Hinweise über die Anzahl der Wörter gibt N = Token, V = Typen:

10 Typ/Token Verteilung erstellen alle Typen im Text zählen (setzt Definition von Typ voraus) zählen, wie oft jeder Typ vorkommt im Stuttgarter-Zeitung Korpus (36 m Token) Lemmatypen im STZ-Korpus Typ Häufigkeit Typ Häufigkeit d 3,571, , 1,848,517 Zytomegalievirus 1. 1,605,763 Zytomir 1 ein 710,719 Zytos 1 und 'and' 708,531 zytotoxische 1 in 'in' 613,876 Zywietz 1 PPER 536,174 Zyzik 1 sein 'to be' 534,056 ZZ-Top-Hit 1 " 408,708 ZZ-Top-Käfer-Nachbau 1 ZZF-Information 1 Erstellen einer Frequenzverteilung zählen, wie häufig jede Häufigkeit vorkommt (Häufigkeit von Häufigkeiten) freq freq of freq freq freq of freq 1 404, , , , , ,159 1,605, ,559 1,848, ,571,573 1 LNRE Verteilung mehr als die Hälfte aller Typen kommen nur einmal vor (hapax legomena) Evidenz dafür, dass noch lange nicht alle möglichen Wörter vorgekommen sind ähnliche Ergebnisse auch für vie größere Texte (Zipf's law, LNRE Verteilung) d.h. man kann (jedenfalls für alle praktischen Zwecke) von einer unendlich großen Anzahl von Wörtern ausgehen LNRE-Verteilung (d.h. übrigens auch, dass statistische Verfahren, die auf Normalverteilung basieren, hier nicht angewendet werden können)

11 Zusammenfassung Linguistik Ziele Beschreibungsebenen Probleme für die maschinelle Sprachverarbeitung: Ambiguität, Kontextabhängigheit & Produktivität Literatur/Referenzen Carstensen, Kai-Uwe et al. (eds) (2001) Computerlinguistik und Sprachtechnologie. Eine Einführung. Spektrum Akademischer Verlag, Heidelberg Fromkin, Victoria & Rodman, Robert ( ) An Introduction to Language. Harcourt Brace College Publishers, Fort Worth etc. Mitkov, Ruslan (ed) (2003) The Oxford Handbook of Computational Linguistics. Oxford University Press, Oxford Radford, Andrew et al. (1999) Linguistics. An Introduction. Cambridge University Press, Cambridge Literatur/Referenzen Phonetik/Phonologie Internationales Phonetisches Alphabet SAMPA Wiese, Richard (2000) The Phonology of German. Oxford University Press, Oxford. Syntax TIGER-Korpus und TIGER-Search Produktivität, Lexikostatistik Baayen, R. Harald (2001) Word Frequency Distributions. Kluwer, Dordrecht

Seminar Ib Wort, Name, Begriff, Terminus Sommersemester Morphologie. Walther v.hahn. v.hahn Universität Hamburg

Seminar Ib Wort, Name, Begriff, Terminus Sommersemester Morphologie. Walther v.hahn. v.hahn Universität Hamburg Seminar Ib Wort, Name, Begriff, Terminus Sommersemester 2006 Morphologie Walther v.hahn v.hahn Universität Hamburg 2005 1 Morphologie: Definition Definitionen: Morphologie ist die Lehre von den Klassen

Mehr

2 Sprachliche Einheiten

2 Sprachliche Einheiten 2 Sprachliche Einheiten Inhalt Semiotische Begriffe Wörter Wortbestandteile Wortzusammensetzungen Wortgruppen Text und Dialog Wort- und Satzbedeutung 2.1 Semiotische Begriffe Semiotische Begriffe Semiotik

Mehr

GK Sprachwissenschaft - Wolfgang Schulze Zusammenfassung der Sitzung vom Syntax - Eine Einführung in die Grundlagen (1)

GK Sprachwissenschaft - Wolfgang Schulze Zusammenfassung der Sitzung vom Syntax - Eine Einführung in die Grundlagen (1) Seite1 GK Sprachwissenschaft - Wolfgang Schulze Zusammenfassung der Sitzung vom 16.1.08 Syntax - Eine Einführung in die Grundlagen (1) 1. Ausgangspunkt: Wozu dient Morphologie? Mono-polare (lokale) Morphologie:

Mehr

8 Fakultät für Philologie

8 Fakultät für Philologie 8 Fakultät für Philologie 8.1 Linguistik 8.1.1 Linguistik, PO 2004 Fach Linguistik (101) Abschluss 2-Fach Bachelor (81) PO-Version 2004 Folgendes ist zurzeit in HISPOS eingerichtet: Modul-Typen: o Nachgewiesene

Mehr

Einführung Computerlinguistik. Konstituentensyntax II

Einführung Computerlinguistik. Konstituentensyntax II Einführung Computerlinguistik Konstituentensyntax II Hinrich Schütze & Robert Zangenfeind Centrum für Informations- und Sprachverarbeitung, LMU München 2013-11-18 Schütze & Zangenfeind: Konstituentensyntax

Mehr

Artikulatorische distinktive Merkmale der Konsonanten im Deutschen

Artikulatorische distinktive Merkmale der Konsonanten im Deutschen Referentinnen Ania Lamkiewicz Eva Mujdricza Computerlinguistik 1. FS Computerlinguistik 1. FS Romanistik 2. FS DaF Sprachwissenschaft 1. FS e-mail: al_smile@web.de e-mail: mujdricza@web.de Artikulatorische

Mehr

Spezielle Themen der KI. NLP Natural Language Processing. Sprachverstehen

Spezielle Themen der KI. NLP Natural Language Processing. Sprachverstehen Spezielle Themen der KI NLP Natural Language Processing Sprachverstehen NLP - Verarbeitungsstufen des Sprachverstehen 47 Phonologie und Phonetik Phonologie Lautlehre oder Sprachgebilde-Lautlehre untersucht

Mehr

Einführung in die Phonetik und Phonologie. Allgemeiner Überblick

Einführung in die Phonetik und Phonologie. Allgemeiner Überblick Einführung in die Phonetik und Phonologie Allgemeiner Überblick Phonetik und Phonologie Die beiden Bezeichnungen Phonetik und Phonologie sind aus dem griechischen Wort ϕωνþ (phōnē) abgeleitet, welches

Mehr

Ein bisschen Werbung. Einführung in die Morphologie Einleitung, Grundbegriffe I. Morphologie. 'Morphologie' Was ist ein Wort? Was ist ein Wort?

Ein bisschen Werbung. Einführung in die Morphologie Einleitung, Grundbegriffe I. Morphologie. 'Morphologie' Was ist ein Wort? Was ist ein Wort? Ein bisschen Werbung Einführung in die Morphologie Einleitung, Grundbegriffe I Anke Lüdeling anke.luedeling@rz.hu-berlin.de Sommersemester 2005 "Morphology is the conceptual centre of linguistics. This

Mehr

Tokenisierung und Lemmatisierung in Suchmaschinen

Tokenisierung und Lemmatisierung in Suchmaschinen Tokenisierung und Lemmatisierung in Suchmaschinen Hauptseminar Suchmaschinen Computerlinguistik Sommersemester 2010 Stefan Langer stefan.langer@cis.uni-muenchen.de Übung: Tokenisierung (5 min) Was ist

Mehr

Parsing mit NLTK. Parsing mit NLTK. Parsing mit NLTK. Parsing mit NLTK. Beispiel: eine kleine kontextfreie Grammatik (cf. [BKL09], Ch. 8.

Parsing mit NLTK. Parsing mit NLTK. Parsing mit NLTK. Parsing mit NLTK. Beispiel: eine kleine kontextfreie Grammatik (cf. [BKL09], Ch. 8. Gliederung Natürlichsprachliche Systeme I D. Rösner Institut für Wissens- und Sprachverarbeitung Fakultät für Informatik Otto-von-Guericke Universität Magdeburg 1 WS 2011/12, 26. Oktober 2011, c 2010-2012

Mehr

Wortbildung und Wortbildungswandel

Wortbildung und Wortbildungswandel Germanistik Kira Wieler Wortbildung und Wortbildungswandel Studienarbeit Inhaltsverzeichnis 1 Einleitung... 2 2 Wortbildung... 2 2.1 Morphologische Grundbegriffe... 2 2.2 Arten der Wortbildung... 3 2.3

Mehr

Korpusvorverarbeitung. Hauptseminar: Einführung in die Korpuslinguistik. Kodierung/Annotationsmaximen. Vorverarbeitung: erste Schritte.

Korpusvorverarbeitung. Hauptseminar: Einführung in die Korpuslinguistik. Kodierung/Annotationsmaximen. Vorverarbeitung: erste Schritte. Hauptseminar: Einführung in die Korpuslinguistik Anke Lüdeling anke.luedeling@rz.hu-berlin.de Wintersemester 2002/2003 Korpusvorverarbeitung Beispiel: DIE ZEIT aufbereitet für journalistische Zwecke, mitgeliefertes

Mehr

Programmierkurs Python II

Programmierkurs Python II Programmierkurs Python II Michaela Regneri & tefan Thater FR 4.7 Allgemeine Linguistik (Computerlinguistik) Universität des aarlandes ommersemester 2010 (Charniak, 1997) the dog biscuits N V N V the dog

Mehr

Morphologie. 1. Flexion und Derivation 2. Analyse mittels lexikalischer Regeln

Morphologie. 1. Flexion und Derivation 2. Analyse mittels lexikalischer Regeln Morphologie 1. Flexion und Derivation 2. Analyse mittels lexikalischer Regeln Morphologie Flexion Deklination Flexion der Nomina: Deklination Hund Hund-es Hund-e Hund-en (Stamm + Suffix) Mann Mann-es Männ-er

Mehr

Syntax - Das Berechnen syntaktischer Strukturen beim menschlichen Sprachverstehen (Fortsetzung)

Syntax - Das Berechnen syntaktischer Strukturen beim menschlichen Sprachverstehen (Fortsetzung) Syntax - Das Berechnen syntaktischer Strukturen beim menschlichen Sprachverstehen (Fortsetzung) Markus Bader 9. Februar 2004 Inhaltsverzeichnis 4 Übertragung ins e 1 4.3 Bewegung und Satztyp................................

Mehr

Gliederung. Das TIGER-Korpus: Annotation und Exploration. TIGER-Korpus. 1. TIGER-Korpus. entstanden im Projekt TIGER (1999 heute) beteiligte Institute

Gliederung. Das TIGER-Korpus: Annotation und Exploration. TIGER-Korpus. 1. TIGER-Korpus. entstanden im Projekt TIGER (1999 heute) beteiligte Institute Das TIGER-Korpus: Annotation und Exploration Stefanie Dipper Forschungskolloquium Korpuslinguistik, 11.11.03 Gliederung 1. TIGER-Korpus 2. Annotation 3. Visualisierung 4. Suche, Retrieval 5. Demo 6. Repräsentation

Mehr

Einführung in die Computerlinguistik

Einführung in die Computerlinguistik Einführung in die Computerlinguistik Syntax WS 2006/2007 Manfred Pinkal Einführung in die Computerlinguistik 2006/2007 M. Pinkal UdS 1 Morphologie und Syntax Gegenstand der Morphologie ist die Struktur

Mehr

Friedrich-Alexander-Universität Professur für Computerlinguistik. Nguyen Ai Huong

Friedrich-Alexander-Universität Professur für Computerlinguistik. Nguyen Ai Huong Part-of-Speech Tagging Friedrich-Alexander-Universität Professur für Computerlinguistik Nguyen Ai Huong 15.12.2011 Part-of-speech tagging Bestimmung von Wortform (part of speech) für jedes Wort in einem

Mehr

Sprachen/Grammatiken eine Wiederholung

Sprachen/Grammatiken eine Wiederholung Sprachen/Grammatiken eine Wiederholung Was sind reguläre Sprachen? Eigenschaften regulärer Sprachen Sprachen Begriffe Symbol: unzerlegbare Grundzeichen Alphabet: endliche Menge von Symbolen Zeichenreihe:

Mehr

Einführung in die Computerlinguistik Statistische Grundlagen

Einführung in die Computerlinguistik Statistische Grundlagen Statistik 1 Sommer 2015 Einführung in die Computerlinguistik Statistische Grundlagen Laura Heinrich-Heine-Universität Düsseldorf Sommersemester 2015 Statistik 2 Sommer 2015 Überblick 1. Diskrete Wahrscheinlichkeitsräume

Mehr

Einführung in die Computerlinguistik

Einführung in die Computerlinguistik Einführung in die Computerlinguistik Statistische Modellierung I WS 2010/2011 Manfred Pinkal Wortartinformation Wortartinformation ist eine wichtige Voraussetzung für die syntaktische Analyse. Woher kommt

Mehr

WORTBILDUNG - MORPHOLOGIE

WORTBILDUNG - MORPHOLOGIE WORTBILDUNG - MORPHOLOGIE Bs: Eindringlichkeit Eindringlichkeit Eindringlich keit + Eindringlich / keit Traurig / keit Haltbar / keit Regsam / keit SUBSTANTIVE Übel / keit SUBSTANTIV bei Abtrennung von

Mehr

Natürlichsprachliche Mensch-Computer Interaktion mit VoiceXML

Natürlichsprachliche Mensch-Computer Interaktion mit VoiceXML Natürlichsprachliche Mensch-Computer Interaktion mit VoiceXML 1-1 Natürlichsprachliche Mensch-Computer Interaktion mit VoiceXML Prof. Dr.-Ing. Václav Matoušek Lehrstuhl für Informatik und Rechentechnik

Mehr

Einführung in die Sprachbeschreibung

Einführung in die Sprachbeschreibung 1 Inhalt Diese Einführungsveranstaltung vermittelt Grundkenntnisse in den Kernbereichen der Linguistik Phonologie, Morphologie/Lexikon, Syntax, Semantik, Pragmatik sowie, in Zusammenhang mit der zugehörigen

Mehr

Part-of-Speech Tagging. Stephanie Schuldes

Part-of-Speech Tagging. Stephanie Schuldes Part-of-Speech Tagging Stephanie Schuldes 05.06.2003 PS Erschließen von großen Textmengen Geißler/Holler SoSe 2003 Motivation Ziel: vollständiges Parsing und Verstehen natürlicher Sprache Herantasten durch

Mehr

Am Anfang war das Wort!

Am Anfang war das Wort! Am Anfang war das Wort! Was ist Morphologie? Der Begriff Morphologie wurde 1796 von Johann Wolfgang von Goethe in einer Tagebuchaufzeichnung für eine neue Wissenschaft geprägt,, die sich mit den Gestaltungsgesetzen

Mehr

Partizip Perfekt per Zirkumfix im Deutschen?

Partizip Perfekt per Zirkumfix im Deutschen? Partizip Perfekt per Zirkumfix im Deutschen? Gereon Müller www.uni-leipzig.de/ muellerg 7. Juli 2006 Hintergrund: Ist ge... t wie in gelegt als Partizipialendung des Deutschen

Mehr

Compiler. Kapitel. Syntaktische Analyse. Kapitel 4. Folie: 1. Syntaktische Analyse. Autor: Aho et al.

Compiler. Kapitel. Syntaktische Analyse. Kapitel 4. Folie: 1. Syntaktische Analyse. Autor: Aho et al. Folie: 1 Kapitel 4 Übersicht Übersicht Syntax: Definition 4 syn-tax: the way in which words are put together to form phrases, clauses, or sentences. Webster's Dictionary Die Syntax (griechisch σύνταξις

Mehr

Kontextsensitive Sprachen

Kontextsensitive Sprachen Kontextsensitive Sprachen Standardbeispiel: {anbncn} S a b c S a A b B c c B A B b c B b b A A b a A a a Im Bereich der natürlichen Sprachen gibt es zahlreiche kontextsensitive Phänomene in der Semantik

Mehr

Wortbildung Derivation

Wortbildung Derivation Wortbildung Derivation Durch Komposition setzt man bestehende Stämme zu komplexeren Stämmen zusammen Durch Derivation erzeugt man neue Wörter durch Kombination mit Affixen Das Beispiel aus der ersten Sitzung:

Mehr

Einführung in die Computerlinguistik. Syntax I

Einführung in die Computerlinguistik. Syntax I Einführung in die Computerlinguistik Syntax I Hinrich Schütze & Robert Zangenfeind Centrum für Informations- und Sprachverarbeitung, LMU München 14.12.2015 Schütze & Zangenfeind: Syntax I 1 / 35 Take-away

Mehr

Das Flexionssystem des Deutschen: Allgemeines

Das Flexionssystem des Deutschen: Allgemeines Die Nominalflexion des Deutschen WS 2005/06 Das Flexionssystem des Deutschen 1 Das Flexionssystem des Deutschen: Allgemeines Das Deutsche als flektierende Sprache Nach der an morphologischen Kriterien

Mehr

Einführung in die Phonetik & Phonologie. Lucia D. Krisnawati

Einführung in die Phonetik & Phonologie. Lucia D. Krisnawati Einführung in die Phonetik & Phonologie Lucia D. Krisnawati Vorlesunginhalt Einleitung: Phonetik vs Phonologie Sprachliche Ebene Kommunikationsmodell Teilgebiete der Phonetik Artikulatorische Phonetik

Mehr

Parsing-EinfŸhrung Ð 1

Parsing-EinfŸhrung Ð 1 Parsing-EinfŸhrung bersicht Falsifizierbarkeit, oder: Sind Grammatiken wissenschaftlich? Grammatik, Formalismus Kontextfreie Grammatiken Ableitungen Ziel Verstehen der linguistischen Motivation Intuitives

Mehr

Earley Parsing. Parsing - WS 2012 / 2013 Lisa Orszullok & Anika Stallmann

Earley Parsing. Parsing - WS 2012 / 2013 Lisa Orszullok & Anika Stallmann Earley Parsing Parsing - WS 2012 / 2013 Lisa Orszullok & Anika Stallmann 12.12.2012 Agenda Basics Komponenten Earley Parsing - Recognizer Earley Parsing - Parser Vor- und Nachteile Parsing WS 2012/2013

Mehr

Ziele und Herausforderungen

Ziele und Herausforderungen Ziele und Herausforderungen Text soll automatisch aus einer Quellsprache in eine Zielsprache übertragen werden Dabei soll die Funktion des Textes erhalten bleiben Es werden sowohl computerlinguistische

Mehr

Künstliche Intelligenz Sprachverarbeitung mit Prolog

Künstliche Intelligenz Sprachverarbeitung mit Prolog Künstliche Intelligenz Sprachverarbeitung mit Prolog Stephan Schwiebert WS 2009/2010 Sprachliche Informationsverarbeitung Institut für Linguistik Universität zu Köln Parsing mit Prolog Grammatik Wortartenklassifikation,

Mehr

Sprachstatistik: Das Zipf sche Gesetz

Sprachstatistik: Das Zipf sche Gesetz Sprachstatistik: Das Zipf sche Gesetz Korpus-Workshop Thema Korpus-Statistik Thomas Wittig Universität Leipzig Institut für Informatik wittig@uni-leipzig.de Principle of Least Effort 2 George K. Zipf:

Mehr

Stefan Engelberg (IDS Mannheim), Workshop Corpora in Lexical Research, Bucharest, Nov. 2008 [Folie 1] DWDS-Kernkorpus / DWDS corpus analysis

Stefan Engelberg (IDS Mannheim), Workshop Corpora in Lexical Research, Bucharest, Nov. 2008 [Folie 1] DWDS-Kernkorpus / DWDS corpus analysis Content 1. Empirical linguistics 2. Text corpora and corpus linguistics 3. Concordances 4. Application I: The German progressive 5. Part-of-speech tagging 6. Fequency analysis 7. Application II: Compounds

Mehr

1. Stellen Sie die Konstituentenstruktur der folgenden Sätze als Baumdiagramme dar:

1. Stellen Sie die Konstituentenstruktur der folgenden Sätze als Baumdiagramme dar: 1. Stellen Sie die Konstituentenstruktur der folgenden Sätze als Baumdiagramme dar: 1. Die Überschwemmungen hinterließen ernorme Schäden. 2. Der amtierende Bundeskanzler verzichtet auf eine erneute Kandidatur.

Mehr

Morphologie (5) Wortarten (2) Part-of-Speech Tagging Stemming

Morphologie (5) Wortarten (2) Part-of-Speech Tagging Stemming Morphologie (5) Wortarten (2) Part-of-Speech Tagging Stemming Robert Zangenfeind Centrum für Informations- und Sprachverarbeitung, LMU München 24.11.2014, 9 c.t. Zangenfeind: Morphologie 1 / 18 Wdh.: Klassifizierung

Mehr

und noch allerlei mehr bei nicht-nativen Wörtern, z.b. cact-i, cherub-im,...

und noch allerlei mehr bei nicht-nativen Wörtern, z.b. cact-i, cherub-im,... Plank, WS 03/04, EinfLing, M&S 4a 1 Morphologische Analyse: ALLOMORPHIE Englisch: Plural ( mehr als 1 davon ; Singular = 1 davon ) The cat-s sit on the mat /s/ The dog-s /z/ The kangaroo-s /z/ The small

Mehr

Übung: Phonetische Transkription

Übung: Phonetische Transkription Institut für Phonetik, Universität des Saarlandes Übung: Phonetische Transkription 26.11.2014 Konsonanten: Laterale; "other symbols"; IPA am PC, Teil 1 (Zeichensätze, SAMPA-Einführung) Institut für Phonetik,

Mehr

Formale Sprachen und Grammatiken

Formale Sprachen und Grammatiken Formale Sprachen und Grammatiken Jede Sprache besitzt die Aspekte Semantik (Bedeutung) und Syntax (formaler Aufbau). Die zulässige und korrekte Form der Wörter und Sätze einer Sprache wird durch die Syntax

Mehr

Fersentalerisch: SVO SOV?

Fersentalerisch: SVO SOV? Linguistica tedesca- LS 44S - A.A. 07/08 - Das Fersentalerische, eine deutsche Sprachinsel in Norditalien 1 Birgit Alber, 7.4. 2008 Fersentalerisch: SVO SOV? SVO - Sprachen: Subjekt Verb Objekt SOV Sprachen:

Mehr

Einführung in die Computerlinguistik

Einführung in die Computerlinguistik Einführung in die Computerlinguistik Syntax II WS 2008/2009 Manfred Pinkal Morphologie und Syntax Gegenstand der Morphologie ist die Struktur des Wortes: der Aufbau von Wörtern aus Morphemen, den kleinsten

Mehr

Gliederung. Natürlichsprachliche Systeme I. Merkmalsbasierte Grammatiken. Merkmalsbasierte Grammatiken. Merkmalsbasierte Grammatiken mit NLTK

Gliederung. Natürlichsprachliche Systeme I. Merkmalsbasierte Grammatiken. Merkmalsbasierte Grammatiken. Merkmalsbasierte Grammatiken mit NLTK Merkmalsbasierte Merkmalsbasierte Gliederung Natürlichsprachliche Systeme I Merkmalsbasierte mit NLTK D. Rösner Institut für Wissens- und Sprachverarbeitung Fakultät für Informatik Otto-von-Guericke Universität

Mehr

Was ist ein Compiler?

Was ist ein Compiler? Was ist ein Compiler? Was ist ein Compiler und worum geht es? Wie ist ein Compiler aufgebaut? Warum beschäftigen wir uns mit Compilerbau? Wie ist die Veranstaltung organisiert? Was interessiert Sie besonders?

Mehr

Linguistik für Kognitionswissenschaften

Linguistik für Kognitionswissenschaften Linguistik für Kognitionswissenschaften Computerlinguistik: Maschinelle Übersetzung Computerlinguistik Fehlübersetzung von engl. computational linguistics - computationelle Linguistik beinhaltet im weiteren

Mehr

Einführung in die Phonetik und Phonologie

Einführung in die Phonetik und Phonologie Einführung in die Phonetik und Phonologie Sitzung 6 Phonologische Prozesse (Übungen) Spencer, Andrew (1996): Phonology (Blackwell, Oxford), Kap. 2 /p/: [b] intervokalisch [p] elsewere /p/: [b] intervokalisch

Mehr

Einführung in die Phonetik des Deutschen

Einführung in die Phonetik des Deutschen Einführung in die Phonetik des Deutschen von Klaus J. Kohler 2., neubearbeitete Auflage,«ERICH SCHMIDT VERLAG Vorwort 9 1. Phonetik als wissenschaftliche Disziplin 13 2. Normen und ihre Beschreibung...,'.

Mehr

Fragen. Was ist ein Laut? Was tun Menschen mit Lauten? Was ist eine Theorie über Laute? Wie lassen sich Laute darstellen?

Fragen. Was ist ein Laut? Was tun Menschen mit Lauten? Was ist eine Theorie über Laute? Wie lassen sich Laute darstellen? Fragen Was ist ein Laut? Was tun Menschen mit Lauten? Was ist eine Theorie über Laute? Wie lassen sich Laute darstellen? Wie lassen sich Laute darstellen? Das Internationale Phonetische Alphabet Jochen

Mehr

Inwiefern zeigen die Monophthong Vokalverschiebungen in Neuseeland Englisch Evidenzen von 'chain shifting'?

Inwiefern zeigen die Monophthong Vokalverschiebungen in Neuseeland Englisch Evidenzen von 'chain shifting'? Inwiefern zeigen die Monophthong Vokalverschiebungen in Neuseeland Englisch Evidenzen von 'chain shifting'? Jonathan Harrington: "Die phonetischen Grundlagen des Lautwandels Referent: Matthias Mahrhofer

Mehr

Jürgen Dittmann Der Spracherwerb des Kindes Verlauf und Störungen

Jürgen Dittmann Der Spracherwerb des Kindes Verlauf und Störungen Unverkäufliche Leseprobe Jürgen Dittmann Der Spracherwerb des Kindes Verlauf und Störungen 127 Seiten, Paperback ISBN: 978-3-406-48000-3 Verlag C.H.Beck ohg, München 1. Das Problem des Spracherwerbs 1.1

Mehr

"What's in the news? - or: why Angela Merkel is not significant

What's in the news? - or: why Angela Merkel is not significant "What's in the news? - or: why Angela Merkel is not significant Andrej Rosenheinrich, Dr. Bernd Eickmann Forschung und Entwicklung, Unister GmbH, Leipzig UNISTER Seite 1 Unister Holding UNISTER Seite 2

Mehr

Grammar New Inspiration 2 + 3

Grammar New Inspiration 2 + 3 Bildungsdepartement Amt für Volksschulen und Sport Abteilung Schulfragentwicklung und -betrieb Kollegiumstrasse 28 Postfach 2191 6431 Schwyz Telefon 041 819 19 11 Telefax 041 819 19 17 Grammar + 3 Verteilung

Mehr

Part of Speech Tagging. Linguistische Sicht. Carolin Deck

Part of Speech Tagging. Linguistische Sicht. Carolin Deck Part of Speech Tagging Linguistische Sicht Carolin Deck Gliederung 1. Begriffsklärung 2. Vorstellung zwei wichtiger Tagsets (STTS & PTTS) 3. Bedeutung des POS-Tagging für die Sprachwissenschaft 4. Tagzuweisung

Mehr

Kapitel 2: Formale Sprachen Gliederung. 0. Grundbegriffe 1. Endliche Automaten 2. Formale Sprachen 3. Berechnungstheorie 4. Komplexitätstheorie

Kapitel 2: Formale Sprachen Gliederung. 0. Grundbegriffe 1. Endliche Automaten 2. Formale Sprachen 3. Berechnungstheorie 4. Komplexitätstheorie Gliederung 0. Grundbegriffe 1. Endliche Automaten 2. Formale Sprachen 3. Berechnungstheorie 4. Komplexitätstheorie 2.1. 2.2. Reguläre Sprachen 2.3. Kontextfreie Sprachen 2/1, Folie 1 2015 Prof. Steffen

Mehr

LEXIKALISCHE SEMANTIK II: GRAMMATISCHE BEDEUTUNG

LEXIKALISCHE SEMANTIK II: GRAMMATISCHE BEDEUTUNG LEXIKALISCHE SEMANTIK II: GRAMMATISCHE BEDEUTUNG 1. DIE GRAMMATISCHE BEDEUTUNG VON WORTEN Neben der konzeptuellen Bedeutung haben sprachliche Ausdrücke auch eine grammatische Bedeutungskomponente, die

Mehr

Literatur (Semesterapparat "Butt - Einf. i. d. Lingustik )

Literatur (Semesterapparat Butt - Einf. i. d. Lingustik ) Literatur (Semesterapparat "Butt - Einf. i. d. Lingustik ) Gegenstand der wöchentlichen Übungsaufgaben und der Klausur werden in der Veranstaltung behandelt. Es gibt kein kursbegleitendes Lehrbuch, aber

Mehr

Reguläre Ausdrücke. Karin Haenelt

Reguläre Ausdrücke. Karin Haenelt Reguläre Ausdrücke Karin Haenelt 25.04.2010 1 Inhalt Einführung Definitionen Kleene-Theorem Schreibweisen regulärer Ausdrücke Eigenschaften regulärer Sprachen 2 Was sind reguläre Ausdrücke? Reguläre Ausdrücke

Mehr

Wesentliche Methoden der Computerlinguistik. Peter Kolb Einführung in die Computerlinguistik Sommersemester 2012

Wesentliche Methoden der Computerlinguistik. Peter Kolb Einführung in die Computerlinguistik Sommersemester 2012 Wesentliche Methoden der Computerlinguistik Einführung in die Computerlinguistik Sommersemester 2012 Übersicht Morphologie: Lexikon, morphologische Analyse Syntax: PoS-Tagging, Unifikation, Chunking, Satzparser

Mehr

Statistische Verfahren in der Computerlinguistik

Statistische Verfahren in der Computerlinguistik Statistische Verfahren in der Computerlinguistik Zweiter Teil Einführung in die Computerlinguistik Sommersemester 2009 Übersicht Statistische vs. symbolische Verfahren in der CL Statistik beschreibende

Mehr

Aufgabentypen die in der Klausur vorkommen

Aufgabentypen die in der Klausur vorkommen Aufgabentypen die in der Klausur vorkommen können 1. Nennen Sie fünf wichtige Anwendungsgebiete der Computerlinguistik. 2. Für welches der drei Anwendungsgebiete Maschinelle Übersetzung, Rechtschreibkorrektur

Mehr

3. Ontologien und Wissensbasen

3. Ontologien und Wissensbasen Ontologien Ontologien stellen mittlerweile die Basis für viele innovative wissensbasierte Systeme dar: 3. Ontologien und Wissensbasen ecommerce/elearning Knowledge Management Informationsextraktion/Data-mining

Mehr

DGA 33 Themen der Deutschen Syntax Universität Athen, WiSe Winfried Lechner Skriptum, Teil 3 K-KOMMANDO

DGA 33 Themen der Deutschen Syntax Universität Athen, WiSe Winfried Lechner Skriptum, Teil 3 K-KOMMANDO DGA Themen der Deutschen Syntax Universität Athen, WiSe 015-16 Winfried Lechner Skriptum, Teil K-KOMMANDO Dieser Abschnitt führt die syntaktische Beziehung des K-Kommandos ein. Es werden zudem Tests vorgestellt,

Mehr

Seminar Text- und Datamining Textmining-Grundlagen Erste Schritte mit NLTK

Seminar Text- und Datamining Textmining-Grundlagen Erste Schritte mit NLTK Seminar Text- und Datamining Textmining-Grundlagen Erste Schritte mit NLTK Martin Hacker Richard Schaller Künstliche Intelligenz Department Informatik FAU Erlangen-Nürnberg 08.05.2014 Gliederung 1 Vorverarbeitung

Mehr

Beschreibung des Masterstudiengangs Sprachen Europas: Strukturen und Verwendung

Beschreibung des Masterstudiengangs Sprachen Europas: Strukturen und Verwendung Beschreibung des Masterstudiengangs Sprachen Europas: Strukturen und Verwendung Der Masterstudiengang Sprachen Europas: Strukturen und Verwendung ermöglicht Absolventen und Absolventinnen mit einem philologischen

Mehr

Hinweise zur flexionsmorphologischen Glossierung

Hinweise zur flexionsmorphologischen Glossierung Morphologie und Lexikon SS 2006 flexionsmorphologische Glossierung 1 Hinweise zur flexionsmorphologischen Glossierung Allgemeines Die flexionsmorphologische Glossierung steht als zweite Zeile unterhalb

Mehr

Grammatiken und ANTLR

Grammatiken und ANTLR Grammatiken und ANTLR Zusatzfolien zu Algo Blatt 6 Author: Henry Schaefer http://www.majeeks.de/folien_blatt6.pdf Grammatik Definition: syntaktische Beschreibung einer Sprache (H.S.) Definiton Grammatik

Mehr

WAS IST DER KOMPARATIV: = The comparative

WAS IST DER KOMPARATIV: = The comparative DER KOMPATATIV VON ADJEKTIVEN UND ADVERBEN WAS IST DER KOMPARATIV: = The comparative Der Komparativ vergleicht zwei Sachen (durch ein Adjektiv oder ein Adverb) The comparative is exactly what it sounds

Mehr

Sprachwissenschaft. Bearbeitet von Patrick Brandt, Rolf-Albert Dietrich, Georg Schön

Sprachwissenschaft. Bearbeitet von Patrick Brandt, Rolf-Albert Dietrich, Georg Schön Sprachwissenschaft Bearbeitet von Patrick Brandt, Rolf-Albert Dietrich, Georg Schön überarbeitet 2006. Buch. 384 S. Hardcover ISBN 978 3 8252 8331 5 Format (B x L): 17 x 24 cm Weitere Fachgebiete > Literatur,

Mehr

Inhalt.

Inhalt. Inhalt EINLEITUNG II TEIL A - THEORETISCHE ASPEKTE 13 GRAMMATIK 13 Allgemeines 13 Die sprachlichen Ebenen 15 MORPHOLOGIE 17 Grundbegriffe der Morphologie 17 Gliederung der Morpheme 18 Basis- (Grund-) oder

Mehr

Einführung in die Linguistik, Teil 4

Einführung in die Linguistik, Teil 4 Einführung in die Linguistik, Teil 4 Syntax - Das Berechnen syntaktischer Strukturen beim menschlichen Sprachverstehen Markus Bader, Frans Plank, Henning Reetz, Björn Wiemer Einführung in die Linguistik,

Mehr

Segmentierung (Beispielanalyse)

Segmentierung (Beispielanalyse) Einführung in die Linguistik Butt / Eulitz / Wiemer Di. 12:15-13:45 Do.! 12:15-13:45 Fr.! 12:15-13:45 Infos etc. http://ling.uni-konstanz.de => Lehre Einführung in die Linguistik Segmentierung (Beispielanalyse)

Mehr

Interpreter - Gliederung

Interpreter - Gliederung Institut für Informatik Ludwig-Maximilian Universität Interpreter - Gliederung Programmiersprache Syntax Konkrete Syntax Abstrakter Syntax Baum (Abstrakte Syntax) Parser Syntaktische Struktur einer Sprache

Mehr

Morphologie - Morphematik. Grundbegriffe: Morphem Wurzel Stamm Affix Morphemtypen

Morphologie - Morphematik. Grundbegriffe: Morphem Wurzel Stamm Affix Morphemtypen Morphologie - Morphematik Grundbegriffe: Morphem Wurzel Stamm Affix Morphemtypen Morpheme Das Morphem ist die grundlegende Einheit der Morphologie. Morpheme sind wie die Phoneme oder Lexeme abstrakte Einheiten,

Mehr

SATZGLIEDER UND WORTARTEN

SATZGLIEDER UND WORTARTEN SATZGLIEDER UND WORTARTEN 1. SATZGLIEDER Was ist ein Satzglied? Ein Satzglied ist ein Bestandteil eines Satzes, welches nur als ganzes verschoben werden kann. Beispiel: Hans schreibt einen Brief an den

Mehr

Formale Sprachen und Automaten

Formale Sprachen und Automaten Formale Sprachen und Automaten Kapitel 1: Grundlagen Vorlesung an der DHBW Karlsruhe Thomas Worsch Karlsruher Institut für Technologie, Fakultät für Informatik Wintersemester 2012 Ziel Einführung der wichtigsten

Mehr

Unterrichtsmaterialien in digitaler und in gedruckter Form. Auszug aus: Vertretungsstunde Englisch 5. Klasse: Grammatik

Unterrichtsmaterialien in digitaler und in gedruckter Form. Auszug aus: Vertretungsstunde Englisch 5. Klasse: Grammatik Unterrichtsmaterialien in digitaler und in gedruckter Form Auszug aus: Vertretungsstunde Englisch 5. Klasse: Grammatik Das komplette Material finden Sie hier: School-Scout.de Pronouns I Let s talk about

Mehr

Background for Hybrid Processing

Background for Hybrid Processing Background for Hybrid Processing Hans Uszkoreit Foundations of LST WS 04/05 Scope Classical Areas of Computational Linguistics: computational morphology, computational syntax computational semantics computational

Mehr

Spracherkennung. Gliederung:

Spracherkennung. Gliederung: Spracherkennung Gliederung: - Einführung - Geschichte - Spracherkennung - Einteilungen - Aufbau und Funktion - Hidden Markov Modelle (HMM) - HMM bei der Spracherkennung - Probleme - Einsatzgebiete und

Mehr

Einführung in die Computerlinguistik Überblick

Einführung in die Computerlinguistik Überblick Einführung in die Computerlinguistik Überblick Hinrich Schütze & Robert Zangenfeind Centrum für Informations- und Sprachverarbeitung, LMU München 2015-10-12 1 / 19 Was ist Computerlinguistik? Definition

Mehr

Morphologie II. Morphologische Grundbegriffe Typen der Wortbildung Wortstruktur Wortbildungsregeln. Morphologie II 1

Morphologie II. Morphologische Grundbegriffe Typen der Wortbildung Wortstruktur Wortbildungsregeln. Morphologie II 1 Morphologie II Morphologische Grundbegriffe Typen der Wortbildung Wortstruktur Wortbildungsregeln Morphologie II 1 Terminologie Morphem: kleinste bedeutungstragende Einheit: Haus, auf, rot. Silbe: Silben

Mehr

2.2 Ereignisse und deren Wahrscheinlichkeit

2.2 Ereignisse und deren Wahrscheinlichkeit 2.2 Ereignisse und deren Wahrscheinlichkeit Literatur: [Papula Bd., Kap. II.2 und II.], [Benning, Kap. ], [Bronstein et al., Kap. 1.2.1] Def 1 [Benning] Ein Zufallsexperiment ist ein beliebig oft wiederholbarer,

Mehr

Unterrichtsmaterialien in digitaler und in gedruckter Form. Auszug aus: Alles über Wortarten - Grundlagen der deutschen Grammatik verstehen

Unterrichtsmaterialien in digitaler und in gedruckter Form. Auszug aus: Alles über Wortarten - Grundlagen der deutschen Grammatik verstehen Unterrichtsmaterialien in digitaler und in gedruckter Form Auszug aus: Alles über Wortarten - Grundlagen der deutschen Grammatik verstehen Das komplette Material finden Sie hier: Download bei School-Scout.de

Mehr

Algorithmen mit konstantem Platzbedarf: Die Klasse REG

Algorithmen mit konstantem Platzbedarf: Die Klasse REG Algorithmen mit konstantem Platzbedarf: Die Klasse REG Sommerakademie Rot an der Rot AG 1 Wieviel Platz brauchen Algorithmen wirklich? Daniel Alm Institut für Numerische Simulation Universität Bonn August

Mehr

Grammatik der deutschen Sprache

Grammatik der deutschen Sprache Grammatik der deutschen Sprache Teilnahmevoraussetzungen: Aktive Teilnahme. Klausur bestehen (besser als 4,0) Grundlage: Textgrundlage: Duden: Fit für das Bachelorstudium: Grundwissen Grammatik Kontakt:

Mehr

Information Retrieval

Information Retrieval Information Retrieval Norbert Fuhr 12. April 2010 Einführung 1 IR in Beispielen 2 Was ist IR? 3 Dimensionen des IR 4 Daten Information Wissen 5 Rahmenarchitektur für IR-Systeme IR in Beispielen IR-Aufgaben

Mehr

XDOC Extraktion, Repräsentation und Auswertung von Informationen

XDOC Extraktion, Repräsentation und Auswertung von Informationen XDOC Extraktion, Repräsentation und Auswertung von Informationen Manuela Kunze Otto-von-Guericke Universität Magdeburg Fakultät für Informatik Institut für Wissens- und Sprachverarbeitung Gliederung Ausgangspunkt

Mehr

Einführung in die englische Sprachgeschichte

Einführung in die englische Sprachgeschichte MANFRED GORLACH Einführung in die englische Sprachgeschichte 5., völlig überarbeitete Auflage Universitätsverlag C.WINTER Heidelberg Inhaltsverzeichnis Abbildungsverzeichnis Vorwort Abkürzungen xi xiii

Mehr

Überblick Wortarten (Einteilung nach Formveränderung bzw. Flexion)

Überblick Wortarten (Einteilung nach Formveränderung bzw. Flexion) Überblick Wortarten (Einteilung nach Formveränderung bzw. Flexion) Flektierbar (veränderlich) nicht flektierbar (Partikeln) konjugierbar deklinierbar komparierbar nach Person und Zahl veränderbar Beugen

Mehr

2 German sentence: write your English translation before looking at p. 3

2 German sentence: write your English translation before looking at p. 3 page Edward Martin, Institut für Anglistik, Universität Koblenz-Landau, Campus Koblenz 2 German sentence: write your English translation before looking at p. 3 3 German sentence analysed in colour coding;

Mehr

7. Klasse. Grammatik. Deutsch. Grammatik. in 15 Minuten

7. Klasse. Grammatik. Deutsch. Grammatik. in 15 Minuten Grammatik 7. Klasse Deutsch Grammatik in 15 Minuten Klasse So übst du mit diesem Buch Im Inhaltsverzeichnis findest du alle für deine Klassenstufe wichtigen Themengebiete. Du hast zwei Möglichkeiten: 1.

Mehr

Wahrnehmung und Aufmerksamkeit

Wahrnehmung und Aufmerksamkeit Wahrnehmung und Aufmerksamkeit Letzte Vorlesung im Sommersemester 2009 zum Thema Wahrnehmung 1 Haben Sie Fragen zum organisatorischen Ablauf oder zur letzten Vorlesung? 2 Literatur zur Klausur Genaue Angaben

Mehr

Teil II: Phrasen und Phrasenstruktur

Teil II: Phrasen und Phrasenstruktur Teil II: Phrasen und Phrasenstruktur Übersicht: Grammatische Funktionen Kategorien Konstituenten & Strukturbäume Konstituententest Endozentrizität 1 Einfacher Satzbau Drei allgemeine Grundfragen der Syntax:

Mehr

Grundbegriffe der Informatik

Grundbegriffe der Informatik Grundbegriffe der Informatik Einheit 8: kontextfreie Grammatiken Thomas Worsch Karlsruher Institut für Technologie, Fakultät für Informatik Wintersemester 2009/2010 1/37 Überblick Kontextfreie Grammatiken

Mehr