Administration und Motivation Mathe III

Ähnliche Dokumente
Motivation und Ressourcen Mathe III

Einleitung. Definitionen von Korpuslinguistik und das Repräsentativitätsmerkmal

NLP Eigenschaften von Text

Erstspracherwerb. Referentin: Fouad Safaa Seminar: Deutsch als Zweitsprache Seminarleitung: Frau Schulz

Einführung in die Computerlinguistik

The English Tenses Die englischen Zeitformen

Statistische Methoden

Schule mit Erfolg. Englisch Simple present adverbs time Unit Blatt What time is it? 7.50 Uhr Uhr Uhr Uhr 20.

Syntax natürlicher Sprachen

Mathematische Grundlagen III

Grammatik und Stochastik

Wortdekodierung. Vorlesungsunterlagen Speech Communication 2, SS Franz Pernkopf/Erhard Rank

Vorbesprechung Mathe III

Nativismus. Erklärungsansatz für den kindlichen Spracherwerb. Franziska Pelka & Jonas Lang

PONS DIE DREI??? FRAGEZEICHEN, ARCTIC ADVENTURE: ENGLISCH LERNEN MIT JUSTUS, PETER UND BOB

Interdisziplinäre fachdidaktische Übung: Sprache und Modelle. SS 2015: Grossmann, Jenko

Einführung in die Computerlinguistik

DAS HUMANISTISCHE MENSCHENBILD AM BEISPIEL CARL ROGERS (GERMAN EDITION) BY ANNA-MARIA SKORA

Future plans. Exercise 1: Read the text below.

Alle Aufgaben, die Lösungen zu den Aufgaben und eine Übersicht zu den Grammatiken findest du im Internet:

Semantik und Pragmatik

Schule mit Erfolg. Englisch Unit 1 bis Unit 2 Topic 2 Nr. 1.3 Blatt 1

Ein Stern in dunkler Nacht Die schoensten Weihnachtsgeschichten. Click here if your download doesn"t start automatically

Faktivität und Theory of Mind / Komplexe Syntax und Theory of mind

Einführung in die Computerlinguistik

Automatentheorie und formale Sprachen

Maschinelle Übersetzung

Ethical Banking Professional Biography and Distancing in Banking and Finance

LEHRERHANDREICHUNG MICKY MOUSE ENGLISH EDITION NR. 1/16

Psycholinguistik. p. 1/28

Grundlagen und Definitionen

Probabilistische kontextfreie Grammatiken

Einführung in die Computerlinguistik

Generative Grammatik

Einführung in die Linguistik, Teil 4

Einführung in die Linguistik, Teil 4

Einführung in die Linguistik, Teil 4

DAS ERSTE MAL UND IMMER WIEDER. ERWEITERTE SONDERAUSGABE BY LISA MOOS

The Faculty of Language: What is It, Who Has It and How Did It Evolve? Marc D. Hauser, Noam Chomsky, W. Tecumseh Fitch

Übungsblatt 23. Alle Aufgaben, die Lösungen zu den Aufgaben und eine Übersicht zu den Grammatiken findest du im Internet:

Terminus Sprache, Phonologie und Grammatik

Hintergrund: Morphologische Produktivität

Offenes Lernen 1. Klasse Your Turn 1, Unit 12: Big break 3 Name: Offenes Lernen 1: Pflichtaufgaben

Unterrichtsmaterialien in digitaler und in gedruckter Form. Auszug aus: Vertretungsstunde Englisch 6. Klasse: Grammatik

Level 2 German, 2013

Unterrichtsmaterialien in digitaler und in gedruckter Form. Auszug aus: Troubleshooter Englisch, Niveau: A1 - B2

GERMAN (Second Language)

Statistische Verfahren in der Computerlinguistik

Level 1 German, 2014

Materialien zu unseren Lehrwerken

Relevante(r) Deskriptor(en) Deskriptor 5: Kann einfachen Interviews, Berichten, Hörspielen und Sketches zu vertrauten Themen folgen.

EINFÜHRUNG IN DIE THEORETISCHE INFORMATIK 0. ORGANISATORISCHES UND ÜBERBLICK

Einführung in die Computerlinguistik

PONS DIE DREI??? FRAGEZEICHEN, ARCTIC ADVENTURE: ENGLISCH LERNEN MIT JUSTUS, PETER UND BOB

LEBEN OHNE REUE: 52 IMPULSE, DIE UNS DARAN ERINNERN, WAS WIRKLICH WICHTIG IST (GERMAN EDITION) BY BRONNIE WARE

Listening Comprehension: Talking about language learning

Video zum I Don't Want To Know

Softwareprojektpraktikum Maschinelle Übersetzung

VORANSICHT. Halloween zählt zu den beliebtesten. A spooky and special holiday Eine Lerntheke zu Halloween auf zwei Niveaus (Klassen 8/9)

Lösungsvorschlag für das Übungsblatt 4. Aufgabe 1.

Level 1 German, 2011

Computerlinguistische Grundlagen. Jürgen Hermes Wintersemester 17/18 Sprachliche Informationsverarbeitung Institut für Linguistik Universität zu Köln

Einführung Computerlinguistik. Konstituentensyntax II

Wissensrepräsentation

Wortsegmentierung. Rhythmische Segmentierung. Phonotaktische Segmentierung. Katrin Wolfswinkler, Markus Jochim,

EINFÜHRUNG IN DIE THEORETISCHE INFORMATIK 0. ORGANISATORISCHES UND ÜBERBLICK

Number of Maximal Partial Clones

Theorien des Erstspracherwerbs

Probabilistic Context Free Grammars, Part II

JOBS OF TEENAGERS CODE 250

Kontextfreie Grammatiken

1/19. Kern-Methoden zur Extraktion von Informationen. Sebastian Marius Kirsch Back Close

Prepositional Verbs mit mehreren Bedeutungen

AVS-M Name des Moduls: Sprachtypologie und Universalienforschung

Where are we now? The administration building M 3. Voransicht

Wer bin ich - und wenn ja wie viele?: Eine philosophische Reise. Click here if your download doesn"t start automatically

Handbuch der therapeutischen Seelsorge: Die Seelsorge-Praxis / Gesprächsführung in der Seelsorge (German Edition)

Im Fluss der Zeit: Gedanken beim Älterwerden (HERDER spektrum) (German Edition)

Einführung in die Computerlinguistik reguläre Sprachen und endliche Automaten

Interdisziplinäre fachdidaktische Übung: Formale Sprache Definitionen, Funktionen

Harry gefangen in der Zeit Begleitmaterialien

1.1 Was ist KI? 1.1 Was ist KI? Grundlagen der Künstlichen Intelligenz. 1.2 Menschlich handeln. 1.3 Menschlich denken. 1.

Grundlagen der Künstlichen Intelligenz

Introduction to Python. Introduction. First Steps in Python. pseudo random numbers. May 2016

English grammar BLOCK F:

Mitschrift VO Syntax des Deutschen (Hartmann)

Lehrplan für Linguistik / Allgemeine Sprachwissenschaft, Master

Elementare Wahrscheinlichkeitslehre

forty-three Write the correct names in the boxes. nose neck foot head leg ear mouth body hair eye arm face hand

Harry gefangen in der Zeit Begleitmaterialien

Grammatik: Fortune Teller

She works with a computer. Does she work with a computer? He writes s. Does he write s? It sounds right. Does it sound right?

Einführung in die Linguistik, Teil 4

Projektseminar "Texttechnologische Informationsmodellierung"

Automatentheorie und formale Sprachen reguläre Ausdrücke

GERMAN LANGUAGE Tania Hinderberger-Burton, Ph.D American University

Einführung in die Computerlinguistik Statistische Grundlagen

Willst du jemandem einen Rat oder eine Anweisung geben, dann verwendest du den Imperativ: Hier nun ein paar Beispiele:

Transkript:

Administration und Motivation Mathe III Dr. Maria Staudte Universität des Saarlandes 16. Juni 2014 Maria Staudte (UdS) Motivation Mathe III 16. Juni 2014 1 / 20

Wichtige Informationen Finden Sie hier: http://www.coli.uni-saarland.de/ masta/mathe3/mathe3.html Folien, Übungsmaterialien (Aufgabenblätter, Korpora etc.) Kontakt (Emailadresse, Büro: C7 4, Raum 3.19) Außerdem: 4+2 SWS / 9 credits für 6h Präsenz & 12h Eigenstudium Voraussetzung für Schein: mind. 50% in Übungsblättern Für Tutorien ist ein Coli-account notwendig (http : //www.coli.uni saarland.de/sg/application for userid.pdf ) Maria Staudte (UdS) Motivation Mathe III 16. Juni 2014 2 / 20

Übersicht Mo Di Do 16.6. (Maria) VL: HMMs 17.6. (Maria) Tut: UNIX 18.6. FRONLEICHNAM 23.6. (Matt) VL: Entropy 24.6. (Matt) VL: Kollokationen 26.6. (Maria) Tut: Korpora 30.6. (Matt) Tut: Entropy 01.7. (Matt) VL: InfTheory 03.7. (Maria) VL: PCFGs 07.7. Maria: VL: Bayes 08.7. (Maria) VL: Decision Trees 10.7. (Maria) Tut: PCFGs 14.7. (Maria) Tut: Bayes/DecTrees 15.7. (Studentenfragen) 17.7. Probeklausur 21.7. Besprechung 22.7. 24.7. KLAUSUR Maria Staudte (UdS) Motivation Mathe III 16. Juni 2014 3 / 20

Natürliche (menschliche) Sprache Zitat... language is a biological system, and biological systems typically are messy, intricate, the result of evolutionary tinkering, and shaped by accidental circumstances and by... conditions that hold of complex systems... (Chomsky, The minimalist program) Maria Staudte (UdS) Motivation Mathe III 16. Juni 2014 4 / 20

Natürliche (menschliche) Sprache Aus dem Verbmobil-Korpus Spontan-sprachliche Terminabsprache Deutsch-Englisch-Japanisch:... bei mir ist die Woche davor schlecht, also, die Woche nach Pfingsten, und die erste Maiwoche, also, alles andere wäre stünde zur Disposition, dann würde ich mal sagen, dass wir den ersten Termin auf Montag, den neunten Mai legen... Maria Staudte (UdS) Motivation Mathe III 16. Juni 2014 5 / 20

Kompetenz und Performanz Kompetenz Potenzielle, idealistische (angeborene) Fähigkeit zur Sprache bzw. Wissen um die Sprache Endliche Menge von Sprachregeln, die Sprecher verinnerlicht haben und die zum Verstehen und Produzieren von Sprache dienen Beschreibt die wohlgeformten Äußerungen einer Sprache Kann man nicht direkt beobachten Maria Staudte (UdS) Motivation Mathe III 16. Juni 2014 6 / 20

Kompetenz und Performanz Performanz Anwendung der zur Kompetenz gehörenden Regeln Tatsächlich vorkommende Äußerungen Zu beobachtendes Verhalten Maria Staudte (UdS) Motivation Mathe III 16. Juni 2014 7 / 20

Zwei Ansätze The Armchair Linguist He sits in a deep soft comfortable armchair, with his eyes closed and his hands clasped behind his head. Once in a while he opens his eyes, sits up abruptly shouting Wow, what a neat fact, grabs his pencil, and writes something down. Then he paces around for a few hours in the excitement of having come still closer to knowing what language is really like. (Charles Fillmore) Maria Staudte (UdS) Motivation Mathe III 16. Juni 2014 8 / 20

Zwei Ansätze The Corpus Linguist He has all the primary facts that he needs, in the form of a corpus of approximately one zillion running words, and he sees his job as that of deriving secondary facts from his primary facts. At the moment he is busy determining the relative frequencies of the eleven parts of speech as the first words of a sentence versus as the second word of a sentence. (Charles Fillmore) Maria Staudte (UdS) Motivation Mathe III 16. Juni 2014 9 / 20

Regelbasierte Modelle Modellierung durch theoretische Überlegung Gesucht werden Regeln, die alle Fälle eines Phänomens erfassen, aber nicht übergenerieren die einfach genug sind, um von einem Computer berechnet zu werden (kein Rückgriff auf Weltwissen usw.) Maria Staudte (UdS) Motivation Mathe III 16. Juni 2014 10 / 20

Regelbasierte Modelle Bsp.: Woran erkenne ich ein Adjektiv? Wir suchen ein Regelsystem, das für (möglichst) alle Adjektive wahr und für alle anderen Wörter falsch ist 1 Nächstes Wort kapitalisiert: Adj Sonst: NAdj 2 Nächstes Wort kapitalisiert und Wort kein Artikel: Adj Sonst NAdj 3 Nächstes Wort kapitalisiert und Wort kein Artikel und vorheriges Wort Artikel: Adj Sonst NAdj Maria Staudte (UdS) Motivation Mathe III 16. Juni 2014 11 / 20

Regelbasierte Modelle Bsp.: Woran erkenne ich ein Adjektiv? Wir suchen ein Regelsystem, das für (möglichst) alle Adjektive wahr und für alle anderen Wörter falsch ist 1 Nächstes Wort kapitalisiert: Adj Sonst: NAdj 2 Nächstes Wort kapitalisiert und Wort kein Artikel: Adj Sonst NAdj 3 Nächstes Wort kapitalisiert und Wort kein Artikel und vorheriges Wort Artikel: Adj Sonst NAdj Maria Staudte (UdS) Motivation Mathe III 16. Juni 2014 11 / 20

Regelbasierte Modelle Bsp.: Woran erkenne ich ein Adjektiv? Wir suchen ein Regelsystem, das für (möglichst) alle Adjektive wahr und für alle anderen Wörter falsch ist 1 Nächstes Wort kapitalisiert: Adj Sonst: NAdj 2 Nächstes Wort kapitalisiert und Wort kein Artikel: Adj Sonst NAdj 3 Nächstes Wort kapitalisiert und Wort kein Artikel und vorheriges Wort Artikel: Adj Sonst NAdj Maria Staudte (UdS) Motivation Mathe III 16. Juni 2014 11 / 20

Regelbasierte Modelle Bsp.: Woran erkenne ich ein Adjektiv? Wir suchen ein Regelsystem, das für (möglichst) alle Adjektive wahr und für alle anderen Wörter falsch ist 1 Nächstes Wort kapitalisiert: Adj Sonst: NAdj 2 Nächstes Wort kapitalisiert und Wort kein Artikel: Adj Sonst NAdj 3 Nächstes Wort kapitalisiert und Wort kein Artikel und vorheriges Wort Artikel: Adj Sonst NAdj Maria Staudte (UdS) Motivation Mathe III 16. Juni 2014 11 / 20

Regelbasierte Modelle Bsp.: Woran erkenne ich ein Adjektiv? Ich möchte Ihnen für den Bericht über den siebenten Bericht über staatliche Beihilfen in der europäischen Union danken. (European Parliament Proceedings) Es ist schwer, korrekte und vollständige Regeln zu schreiben Regel 2 ist zu liberal (möchte = Adj) Regel 3 ist zu streng (staatliche = NAdj) Das System trifft eine harte Entscheidung für jede Instanz Keine Möglichkeit, über Wahrscheinlichkeit zu sprechen Maria Staudte (UdS) Motivation Mathe III 16. Juni 2014 12 / 20

Regelbasierte Modelle Erfolgreich für Morphologie, Grammatiken (Grammatiktheorie), formale semantische Analyse Vorteile Erlaubt Modellierung komplexer Phänomene ( tiefe Analyse) Kann negative Evidenz einbeziehen (=Was nicht möglich ist) Ergebnis ist für Menschen verständlich Bietet oft eine Erklärung des Phänomens an Maria Staudte (UdS) Motivation Mathe III 16. Juni 2014 13 / 20

Regelbasierte Modelle Nachteile regelbasierter Systeme: Nicht geeignet für stetige Phänomene Können keine Präferenzen ausdrücken Häufig präskriptiv statt deskriptiv Mangel an Robustheit: Schon bei kleinen Fehlern in der Eingabe bricht die Analyse ab Objektivität? Hand-Arbeit: Hoher Aufwand Die English Resource Grammar (ERG) wird seit Mitte der 90er Jahre in mehreren großen CL-Projekten entwickelt, aber es wird noch daran gearbeitet! Maria Staudte (UdS) Motivation Mathe III 16. Juni 2014 14 / 20

Korpuslinguistik und Statistik Daten-orientierte Untersuchungen: Modellierung durch Sichtung von Beispielen Erkennung ähnlicher Muster und Regelmäßigkeiten in den Daten Vorteile Auf Grund von Daten trainiert: Weniger Handarbeit (Einsatz maschineller Lernverfahren) Bestimmung der wahrscheinlichsten Lesart Robust: Können mit fehlerhafter oder unbekannter Eingabe umgehen Modelle können Übergenerierung erlauben, um Robustheit zu erreichen Zugriff auf in den Daten implizites Weltwissen Schnelle Modellierung neuer Domänen, Sprachen, usw. Maria Staudte (UdS) Motivation Mathe III 16. Juni 2014 15 / 20

Korpuslinguistik und Statistik Einige Beispiele Lexikalische Präferenzen Wortkategorie: bank = Substantiv 85 %, Verb 15 % Bedeutung: bank (river) = 22 %, bank (money) = 78 % Syntax: realized + NP = 20 % realized + S = 65 % realized + other = 15 % Anaphern: He bezieht sich auf Englisch in 63 % der Fälle auf das Subjekt des vorigen Satzes Textanalyse: Autor X verwendet das Wort bezüglich signifikant öfter als Autor Y Maria Staudte (UdS) Motivation Mathe III 16. Juni 2014 16 / 20

Korpuslinguistik und Statistik Nachteile Flache Analyse (Engl.,,shallow ) Modelle nur approximativ richtig Schwierige Probleme können oft nicht zuverlässig modelliert werden Modelle für Menschen schwierig zu verstehen und abzuändern Rein descriptiv, keine Erklärung Abhängigkeit von den Daten Problem mit unbekannten Wörtern/Strukturen (Sparse Data) Erfolgreich für: Wortartenanalyse Automatische syntaktische Analyse Maria Staudte (UdS) Motivation Mathe III 16. Juni 2014 17 / 20

Kleine Methodengeschichte der Computerlinguistik 1950er-1980er: Theoretische Linguistik Linguistische Grundlagenarbeit (Grammatiktheorien) Weniger Fokus auf praktische Anwendung Seit 1990: Verwaltung riesiger Datenmengen wird als zentrale Aufgabe der CL erkannt Maschinelles Lernen als zentrale Methode Hoffnung: Jedes Problem lässt sich durch genügend Daten lösen (Heute zum Teil enttäuscht) Every time I fire a linguist, the performance of our speech recognition system goes up. (F. Jelinek, 1988) Maria Staudte (UdS) Motivation Mathe III 16. Juni 2014 18 / 20

Parallel mit Nativismus vs. Empirie Welche Rolle spielt Spracherfahrung beim Sprachenlernen? Nativismus: Sprache ist sehr komplex, daher muss die Fähigkeit dazu und deren Grundprinzipien beim Menschen angeboren sein (Vgl. Chomsky s Principles and Parameters: Sowohl Prinzipien als auch Parameter sind Sprachuniversalien Menschen kennen die Prinzipien von Geburt an, z. B. dass alle Sätze ein Subjekt haben, auch wenn es in manchen Sprachen overt (=sichtbar) weggelassen werden kann Spracherwerb besteht darin, die Parameter für die eigene Muttersprache zu setzen: SVO oder OVS? usw.) Empirizismus: Sprachliches Wissen erwerben Kinder ausschließlich durch das Hören der Sprache ihrer Eltern Maria Staudte (UdS) Motivation Mathe III 16. Juni 2014 19 / 20

Zusammenfassung Kompetenz und Performanz Stärken und Schwächen regelbasierter Systeme Stärken und Schwächen statistischer Systeme Unterschiede im Ansatz Parallel mit Theorien über Spracherwerb Maria Staudte (UdS) Motivation Mathe III 16. Juni 2014 20 / 20