Aufgabe. Erstellen eines kleinen Lernerkorpus exemplarisches Aufzeigen, wie Fehler sinnvoll klassifiziert und annotiert werden könnten
|
|
- Katrin Peters
- vor 6 Jahren
- Abrufe
Transkript
1 Aufgabe Erstellen eines kleinen Lernerkorpus exemplarisches Aufzeigen, wie Fehler sinnvoll klassifiziert und annotiert werden könnten Mitstreiterinnen: Elena Briskina, Julia Hantschel, Jenny Krüger, Stéphanie Sigrist, Ulrike Spieler
2 Gliederung 1. Teil: einführende Worte 2. Teil: auf dem Weg zu einem Korpusgerüst bzw. Annotationssystem: Fehleranalyse und Fehlerklassifikation 3. Teil: die Praxis
3 Was sind Lernerkorpora? Korpora, in denen Aufsätze etc. von Sprachlernern gesammelt werden
4 Wofür braucht man Lernerkorpora? zur Sprachlernforschung / Fehleranalyse: z.b. in welchem Kontext tauchen Fehler auf, Fehlerhäufigkeit, typische Lernerfehler, Interferenzen können zur Auswahl und Begründung von Lehrverfahren und zur Lehrwerkforschung beitragen
5 Lernerkorpora Fehleranalyse speist ihre Daten schon seit langem aus Korpora, einst jedoch manuell erfasste, nicht maschinenlesbare Korpora begrenzte Analyse- und Erfassungsmöglichkeiten zeitaufwändiger Quelle: Diehl 1991, 29.
6 Lernerkorpora Computergestützte Korpuslinguistik bietet weitaus mehr (Analyse)Möglichkeiten Korpus individuell einsetzbar
7 Ideales Lernerkorpus repräsentativ (in Bezug auf bestimmte Parameter, z.b. eine bestimmte Lernergruppe)
8 Ideales Lernerkorpus so homogen wie möglich: hohe, präzise Aussagekraft durch eingeschränkte Auswahl eine Textsorte ein Lernerniveau eine Lernerausgangssprache (L1) Nachteil: beschränkter Zugriff auf etwa nur ein Lernerniveau
9 Ideales Lernerkorpus Oder so heterogen wie möglich: breite Aussagekraft Nachteil: unspezifischere Aussagen ideal: Lernerkorpus, das Vorteile beider Varianten kombinieren kann
10 Ideales Lernerkorpus Lösungsmöglichkeit: ein mit allem gespeistes (dynamisches) Lernerkorpus, das durch umfassende Metainformationen (header) für sämtliche Forschungsziele geeignet ist
11 AG-Korpus auf Grund begrenzter Kapazität: small corpus (kleines Korpus, das auch Aussagekraft hat) weniger repräsentativ, mehr exemplarisch
12 AG-Korpus homogen: nur Texte von Deutschlernern heterogen: alle Textsorten, Niveaus, L1 - alles, was das Sprachenzentrum hergibt Datensammlung wird opportunistisch (was uns unter die Finger kommt, siehe oben)
13 2. Teil Auf dem Weg zu einem Korpusgerüst bzw. Annotationssystem: Fehleranalyse und Fehlerklassifikation
14 Fehleranalyse Vorgehen: Schritt 1: Identifizierung + Lokalisierung Schritt 2: Klassifizierung + Beurteilung (strukturelle vs. nicht-strukturelle Fehler)
15 Fehleranalyse Kriterien: Grammatikalität - struktureller Fehler: entspricht die Äußerung dem System? Syntax, Morphologie,... Genusfehler, Kongruenzfehler
16 Fehleranalyse Akzeptabilität - nicht-struktureller Fehler: entspricht die Äußerung der linguistischen Norm? (vgl. auch Kasper 1975) Stilfehler; Register / Ebene wird verletzt
17 Fehlerklassifikation (lt. Literatur) häufigste Fehler, die unser Korpus betrachtet: 1. Orthographie 2. Lexik 3. Präpositionen 4. Tempus des Verbs 5. Kongruenz 6. Kasusfehler 7. Morphologie 8. Wortstellung (mit Subebene) 9. Valenz des Verbs 10. Falsche Präposition beim Verb 11. Wortauslassung (mit Subebene) 12. Genus des Nomens 13. Reflexivität
18 Fehlerklassifikation: ein Beispiel Genus des Nomens Wortstellung Auslassung des Determinativs Reflexivität Kasusfehler nach Präpositionen Orthographie Morphologie
19 3. Teil die Praxis
20 Annotation - Metainformationen Im header enthalten (sofern Information vorliegt) L1 Lernerniveau (Mittelstufe etc.) Textsorte Alter, Geschlecht Bildung Erstellungszeit Aufgabenstellung / Instruktion an Lerner
21 Annotation - Ebenen Automatisch von Morphy erstellen lassen: word-ebene (Tokenisieren), pos-ebene (Taggen), lemma-ebene wichtige Ebenen, um zu überprüfen, in welchem Kontext die Lernerfehler auftauchen (Konkordanz) Ebene der Fehlerklassifikation (Taggen)» zur Erinnerung: taggen ist das Zuordnen linguistischer Informationen zu bestimmten Texteinheiten
22 Annotation - Probleme und Grenzen Nicht-strukturelle Fehler lassen sich kaum annotieren, z.b. fehlende Diskurspartikel (übrigens, also, eben,...) regionale Varietäten stilistische Unsicherheiten
23 Annotation - Probleme und Grenzen Fehlerklassifikation ist ein noch ungelöstes Problem; Literatur bietet keine Universallösung daher so theorieneutral wie möglich annotieren, damit möglichst viele Nutzer mit einem Korpus arbeiten können
24 Tagset - Probleme Ebenen wie Morphologie oder Wortauslassung zu allgemein daher eventuell Subebenen (wenn technisch möglich), z.b. Morphologie_Wortbildung größtes Problem: Es gibt kein fertiges Tagset, sondern die AG muss es selbst erstellen.
25 Tagset / Kodierung für Fehlerebene Verbstellung VS Morphologie M Orthographie O Wortstellung W Lexik L Valenz des Verbs VVA Präpositionen IN Falsche Präposition beim Verb VIN Tempus des Verbs VT Auslassung des Determinativs AD Kongruenz Subjekt-Verb KSV Genus des Nomens NG Kasusfehler nach Präpositionen KIN Reflexivität VR leer Ø
26 Die Praxis - Beispiel / Dreizehn/CD/dreizehn/ø / ein/dt/ein/ng Filmkritik/NN/Filmkritik/ø
27 Die Praxis - Beispiel [...] ø/dt/die/ad Regisseurin/NN/Regisseurin/ø Catherine/NNP/Catherine/ø Hardwicke/NNP/Hardwicke/ø erzählt/vb/erzählen/w die/dt/die/ø [...]
28 Was nu noch kommt... Guideline (Korpus-Richtlinien) erstellen tagset erstellen an CQP-Suchmaske orientieren Lernertexte weiter sammeln und digitalisieren mit Morphy tokenisieren und taggen Fehlerebene per Hand annotieren
29 Literatur BÜNNAGEL, Werner (1994). Fehlerlinguistik und computerunterstützte Fremdsprachenerwerbsforschung. Ein Beitrag zur Genuskompetenz im Spanischen. Bern, Frankfurt/M., New York: Lang. DIEHL, Erika u.a. (1991). Lernerstrategien im Fremdsprachenerwerb. Tübingen: Niemeyer. MAYR, Erich (1985). Spracherwerb und Fehleranalyse. Theorie und Empirie am Beispiel des Französischen. Bern, Frankfurt/M., New York: Lang. MUKHERJEE, Joybrato (2002). Korpuslinguistik und Englischunterricht. Eine Einführung. Bern, Frankfurt/M., New York: Lang. PUTZER, Oskar (1994). Fehleranalyse und Sprachvergleich. Ismaning: Hueber.
HANDBUCH. Lernerkorpus. Projektteilnehmerinnen:
Lernerkorpus Institut für Deutsche Sprache und Linguistik Philosophische Fakultät II Humboldt-Universität zu Berlin Fachgebiet Korpuslinguistik Juniorprofessorin Dr. Anke Lüdeling HANDBUCH Projektteilnehmerinnen:
MehrInhalt und Typen von Korpora. Welche Sprachinhalte können Korpora haben und welche Arten von Korpora gibt es
Inhalt und Typen von Korpora Welche Sprachinhalte können Korpora haben und welche Arten von Korpora gibt es Inhalt von Korpora Korpora können die verschiedensten Texte in den unterschiedlichsten Zusammensetzungen
MehrTechnik und Arbeitsablauf für FALKO
Peter Adolphs Emil Kroymann Technik und Arbeitsablauf für FALKO 1 Software 1.1 EXMARaLDA Partitur-Editor EXMARaLDA ist ein Annotationswerkzeug für linguistische Korpora. Es wurde von der Universität Hamburg
MehrOrganisatorisches. HS: Korpuslinguistische Behandlung von Phänomenen des Deutschen. Lernerkorpora als Datenquelle. Lernerkorpora als Datenquelle
HS: Korpuslinguistische Behandlung von Phänomenen des Deutschen WS 2004/2005 Anke Lüdeling anke.luedeling@rz.hu-berlin.de Organisatorisches 1. Vortrag: 15-20 Minuten + 5-10 Minuten Diskussion (gesamt 30
MehrProjektseminar "Texttechnologische Informationsmodellierung"
Projektseminar "Texttechnologische Informationsmodellierung" Ziel dieser Sitzung Nach dieser Sitzung sollten Sie: Einige standards und projekte vom Namen her kennen Einen Überblick über und einen Eindruck
MehrBlockseminar Einführung in die Korpuslinguistik Seminarleitung: Yvonne Krämer, M.A. Das Korpus. und seine Aufbereitung
Blockseminar Einführung in die Korpuslinguistik Seminarleitung: Yvonne Krämer, M.A. Das Korpus und seine Aufbereitung Bestandteile eines Korpus sind i.d.r.: Primärdaten Metadaten Annotationen Annotationen
MehrErster Tübingen-Berlin Lernerkorpus-Workshop ( ) Marc Reznicek
Erster Tübingen-Berlin Lernerkorpus-Workshop (15.-16.10.2009) & Marc Reznicek Gliederung 1) Falko Design 2) WHIG What s hard in German 3) Forschung an Falko 4) Operationalisierung der Zielhypothese Falko-Design
MehrWiederholung: Linguistische Daten. HS Korpuslinguistische Beschreibung von Phänomenen des Deutschen. Organisatorisches. Wiederholung: Korpusdaten
HS Korpuslinguistische Beschreibung von Phänomenen des Deutschen Anke Lüdeling WS 2003/2004 Wiederholung: Linguistische Daten linguistische Fragestellung (eingebettet in eine Theorie oder ein Modell) dafür
MehrDie Corpus Workbench und ihre Syntax. Blockseminar Einführung in die Korpuslinguistik Seminarleitung: Yvonne Krämer, M.A.
Die Corpus Workbench und ihre Syntax Blockseminar Einführung in die Korpuslinguistik Seminarleitung: Yvonne Krämer, M.A. Die IMS Open Corpus Workbench (CWB) Mächtige Konkordanz- und Korpusanalyse-Software
MehrElektronische Korpora in der Lehre Anwendungsbeispiele aus der theoretischen 2 und / 27der. und der Computerlinguistik
Elektronische Korpora in der Lehre Anwendungsbeispiele aus der theoretischen und der Linguistics Department Ruhr-University Bochum 18.1.2011 DSPIN-Workshop Sprachressourcen in der Lehre Erfahrungen, Einsatzszenarien,
MehrDeutsche Lernerwortarten im Falko Lernerkorpus Was Mehrebenen-POS-tags leisten können
Deutsche Lernerwortarten im Falko Lernerkorpus Was Mehrebenen-POS-tags leisten können Marc Reznicek Humboldt-Universität zu Berlin STTS- Workshop 24.9.2012 Überblick STTS in Lernerkorpora Lernerfehler
MehrKorpuslinguistik. Vorlesungsreihe»Methoden der Linguistik«(WS 2004/05) Universität Zürich, Korpuslinguistik. Jürgen Spitzmüller.
Vorlesungsreihe»Methoden der Linguistik«(WS 2004/05) Universität Zürich, 7.12.2004 1. Teil: Theorie Grundlegende theoretische Fragestellungen: Was sind überhaupt Korpora? Wozu Korpora? Was sollen Korpora
MehrWiederholung: Forschungsfragen und Korpusdaten. GK C: Einführung in die Korpuslinguistik. Wiederholung: Forschungsfragen und Korpusdaten
GK C: Einführung in die Korpuslinguistik Anke Lüdeling anke.luedeling@rz.hu-berlin.de Sommersemester 2003 Wiederholung: Forschungsfragen und Korpusdaten Korpusdaten können benutzt werden um zu entscheiden,
MehrLAUDATIO - Eine Infrastruktur zur linguistischen Analyse historischer Korpora
LAUDATIO - Eine Infrastruktur zur linguistischen Analyse historischer Korpora Carolin Odebrecht, Humboldt-Universität zu Berlin Florian Zipser, Humboldt-Universität zu Berlin, INRIA Historische Textkorpora
MehrEinführung. Stefanie Dipper Stefan Evert Heike Zinsmeister
Einführung Stefanie Dipper Stefan Evert Heike Zinsmeister München, 28.1.2011 Korpus eine Sammlung gesprochener oder geschriebener Äußerungen typischerweise digitalisiert und maschinenlesbar Ebenen eines
MehrThemen. GK C: Einführung in die Korpuslinguistik. Vorverarbeitung. Tokenisierung. Tokenisierung. Aber. Vorverarbeitung
GK C: Einführung in die Korpuslinguistik Anke Lüdeling anke.luedeling@rz.hu-berlin.de Sommersemester 2003 Themen Vorverarbeitung Tokenisieren Taggen Lemmatisieren Vorverarbeitung auf allen Vorverarbeitungsebenen
MehrSpanisch in Asien und Ozeanien
Steve Pagel SUB Hamburg A2013/7386 Spanisch in Asien und Ozeanien PETER LANG Internationaler Verlag der Wissenschaften Inhalt 1. Einleitung 15 1.1. Untersuchungsgegenstand 15 1.2. Fragestellung und Methode
MehrSeminar: Relativsätze im Spracherwerb Dozentin: Prof. Dr. Petra Schulz WS 2011/2012. Referent: Pljevaljcic Sascha Datum:
Seminar: Relativsätze im Spracherwerb Dozentin: Prof. Dr. Petra Schulz WS 2011/2012 Referent: Pljevaljcic Sascha Datum: 15.11.2011 Gliederung Bisherige RS-Forschung RS-Fehler im Spracherwerb Faktoren,
MehrLernerkorpora. HS Korpuslinguistik. Lernerkorpora. Lernerkorpora als Datenquelle. Lernerkorpora als Datenquelle. Lernerkorpora
Lernerkorpora HS Korpuslinguistik Anke Lüdeling anke.luedeling@rz.hu-berlin.de Sommersemester 2005 Motivation Aufbau Contrastive Interlanguage Analysis Error Analysis Falko Lernerkorpora "The area of linguistic
MehrWortfinales Schwa in BeMaTaC: L1 vs. L2. Simon Sauer Korpuslinguistisches Kolloquium Humboldt-Universität zu Berlin
Wortfinales Schwa in BeMaTaC: L1 vs. L2 Simon Sauer Korpuslinguistisches Kolloquium Humboldt-Universität zu Berlin 27.01.2016 Phänomen In gesprochenem Deutsch wird wortfinales Schwa oft weggelassen ich
MehrFRÜHNEUHOCHDEUTSCHE GRAMMATIK
OSKAR REICHMANN, KLAUS-PETER WEGERA (HRSG.) FRÜHNEUHOCHDEUTSCHE GRAMMATIK von ROBERT PETER EBERT, OSKAR REICHMANN, HANS-JOACHIM SOLMS UND KLAUS-PETER WEGERA MAX NIEMEYER VERLAG TÜBINGEN 1993 INHALT Verzeichnis
MehrInhalt. Vorwort 1. Bibliografische Informationen digitalisiert durch
Vorwort 1 1 Die romanischen Sprachen - Das Spanische in der Welt 3 1.1 Die Sprachen der Welt 4 1.2 Die indoeuropäischen Sprachen und andere Sprachfamilien... 7 1.3 Die romanischen Sprachen und die Gliederung(en)
MehrDas Zusammenspiel interpretativer und automatisierbarer Verfahren bei der Aufbereitung und Auswertung mündlicher Daten
Das Zusammenspiel interpretativer und automatisierbarer Verfahren bei der Aufbereitung und Auswertung mündlicher Daten Ein Fallbeispiel aus der angewandten Wissenschaftssprachforschung Cordula Meißner
MehrKookkurrenzanalyse Einführung
Einführung Kookkurenzanalyse die grundlegende Idee 1) Beobachtung: In einem Korpus tritt Wort X 1000mal auf, Wort Y 100mal, Wort Z 10mal. 2) Wahrscheinlichkeit: Die Kombination XY ist 10mal so wahrscheinlich
MehrGI-Fachgruppentreffen RE Weak-Words und ihre Auswirkung auf die Qualität von Anforderungsdokumenten. Jennifer Krisch Daimler AG
GI-Fachgruppentreffen RE Weak-Words und ihre Auswirkung auf die Qualität von Anforderungsdokumenten Jennifer Krisch Daimler AG Inhalte 1 Motivation 2 Was sind Weak-Words? 3 Vorgehen bei der Analyse 4 Evaluation
MehrKollexem-Analyse. SE: Quantitative Analyse linguistischer Variation WS 2012/13. Germanistik
Kollexem-Analyse SE: Quantitative Analyse linguistischer Variation Germanistik WS 2012/13 WS 2012/13 1 / 14 Heutige Sitzung 1 Einführung: Quantitative syntaktische Analyse am Beispiel der Kollexem-Analyse
MehrProseminar Linguistische Annotation
Proseminar Linguistische Annotation Ines Rehbein und Josef Ruppenhofer SS 2010 Ines Rehbein und Josef Ruppenhofer (SS10) Linguistische Annotation April 2010 1 / 22 Seminarplan I. Linguistische Annotation
MehrOrganisatorisches: Poster. Einführung in die Korpuslinguistik. Organisatorisches: Poster. Organisatorisches: Poster. Organisatorisches: Poster
Organisatorisches: Poster Einführung in die Korpuslinguistik Anke Lüdeling anke.luedeling@rz.hu-berlin.de Sommersemester 2005 Erstellung eines wissenschaftlichen Posters in einer Gruppe (< 4 Personen)
MehrWortstellung nominaler Elemente im Mittelfeld
HS Korpuslinguistische Beschreibung von Phänomenen des Deutschen Wortstellung nominaler Elemente im Mittelfeld Untersuchung zur Stellung nominaler Elemente im deutschen Mittelfeld - Kurzvortrag, 19.11.2003
MehrKorpuslinguistik Annis 3 -Korpussuchtool Suchen in tief annotierten Korpora
Korpuslinguistik Annis 3 -Korpussuchtool Suchen in tief annotierten Korpora Anke Lüdeling, Marc Reznicek, Amir Zeldes, Hagen Hirschmann... und anderen Mitarbeitern der HU-Korpuslinguistik Ziele Wie/Was
MehrArtikelwörter. Jason Rothe
Artikelwörter Jason Rothe Was ist das für 1 geiler Vortrag? Gliederung 1. Einleitung 2. Lehrbuchauszug 3. These 4. Stellung der Artikelwörter 5. Artikel vs. Artikelwort 6. Zuschreibung des Genus 7. Morphosyntaktische
MehrIII. Sprachliche Ebenen
III. Sprachliche Ebenen 1. Wie viele Ebenen? 2. Modelle der Struktur gesprochener ; 3. Typologie und Universalien. 1. Sprachstratifikation (Wie viele Ebenen gibt es in der?) Das Problem bei der Definition
MehrÜberblick. GK C: Einführung in die Korpuslinguistik. Fragen. Sprachwandel/Sprachvariation. Fragen. NB: Register
GK C: Einführung in die Korpuslinguistik Anke Lüdeling anke.luedeling@rz.hu-berlin.de Sommersemester 2003 Überblick Registervariation multidimensionale Analyse Register quantitative Analyse Dimensionen:
MehrGRUNDLAGEN DER GERMANISTIK. Herausgegeben von Detlef Kremer, Ulrich Schmitz, Martina Wagner-Egelhaaf und Klaus-Peter Wegera
GRUNDLAGEN DER GERMANISTIK Herausgegeben von Detlef Kremer, Ulrich Schmitz, Martina Wagner-Egelhaaf und Klaus-Peter Wegera 34 Deutsch als Fremdsprache Eine Einführung von Hans-Werner Huneke und Wolfgang
MehrKorpuslinguistik Annis 3 -Korpussuchtool Linguistische Suchen im Ridges-Korpus LAUDATIO-Workshop Hagen Hirschmann
Korpuslinguistik Annis 3 -Korpussuchtool Linguistische Suchen im Ridges-Korpus 07.10.2014 LAUDATIO-Workshop Hagen Hirschmann Was ist ANNIS? ANNIS steht für ANNotation of Information Structure http://www.sfb632.uni-potsdam.de/d1/annis/
Mehr(1) Lexikalische Semantik: Kann man systematische Polysemie kontextuell (automatisch) bestimmen?
Vorgeschlagene Themenbereiche (1) Lexikalische Semantik: Kann man systematische Polysemie kontextuell (automatisch) bestimmen? naive Definition: Homonymie: eine Zeichenkette hat zwei oder mehr Lesarten,
MehrKorpuserstellung - Themen. HS Korpuslinguistik. Was mach ich, wenn ich ein Korpus will? Referenzkorpus. Datensammlung: opportunistisch.
Korpuserstellung - Themen HS Korpuslinguistik Anke Lüdeling anke.luedeling@rz.hu-berlin.de Sommersemester 2005 feste Korpora vs. wachsende Korpora Repräsentativität (das R-Wort ) Ausgewogenheit Datenakquisition
MehrMorphologische Merkmale. Merkmale Merkmale in der Linguistik Merkmale in der Morpholgie Morphologische Typologie Morphologische Modelle
Morphologische Merkmale Merkmale Merkmale in der Linguistik Merkmale in der Morpholgie Morphologische Typologie Morphologische Modelle Merkmale Das Wort 'Merkmal' ' bedeutet im Prinzip soviel wie 'Eigenschaft'
MehrInhaltsverzeichnis 1. THEORETISCHE ASPEKTE. Bibliografische Informationen digitalisiert durch
1 Einfuhrung i 1.1 Zur Ausgangslage i 1.2 Das Zürcher Projekt >Schreibkompetenz und neue Medien
MehrAnnotation des Wittgenstein-Korpus mit Wortart-Information
Annotation des Wittgenstein-Korpus mit Wortart-Information Institut für Informations- und Sprachverarbeitung Ludwig-Maximilian-Universität München schmid@cis.uni-muenchen.de Überblick Was ist Wortart-Tagging?
Mehreinführung in die Sprachwissenschaft für romanisten
josef felixberger helmut berschin einführung in die Sprachwissenschaft für romanisten max hueber verlag Inhaltsübersicht Vorwort 11 A. Grundbegriffe 1. Die Sprache - ein Kommunikationssystem 13 1.1. Kommunikationsmodell
MehrHistorische Linguistik HS Historische Korpuslinguistik
Historische Linguistik HS Historische Korpuslinguistik Anke Lüdeling Roland Hinterhölzl WS 2003/2004 per se 'Korpuslinguistik' (man hat ja nix anderes ) 19. Jhd. Entwicklung von Methodik zur Erforschung
MehrA Topical/Local Classifier for Word Sense Idendification (TLC) Anne Schwartz
A Topical/Local Classifier for Word Sense Idendification (TLC) Anne Schwartz anne@coli.uni-sb.de A Topical/Local Classifier for Word Sense Idendification (TLC) entwickelt von: - Martin Chodorow (Dep. of
MehrVP vs.?p. N V P N? N P N V Peter kommt nach Hause...dass Peter nach Hause kommt. Syntax V 2
Syntax V Rechts- vs. Links-Köpfigkeit VL-Sätze als grundlegende Muster funktionale Kategorien IP/CP zum Nachlesen: Grewendorf/Hamm/Sternefeld: Sprachliches Wissen, S. 213-223, Kap. 7.1., 7.2 Syntax V 1
MehrStrukturelle und linguistische Annotation in historischen Textkorpora am Beispiel des Deutschen Textarchivs
Strukturelle und linguistische Annotation in historischen Textkorpora am Beispiel des Deutschen Textarchivs Susanne Haaf, Alexander Geyken, Bryan Jurish, Matthias Schulz, Christian Thomas, Frank Wiegand
MehrWiederholung: Korpuslinguistik. Einführung in die Korpuslinguistik. Vorverarbeitung: Themen. Vorverarbeitung. Vorverarbeitung.
Wiederholung: Korpuslinguistik Einführung in die Korpuslinguistik Anke Lüdeling anke.luedeling@rz.hu-berlin.de Sommersemester 2007 beschäftigt sich damit, welche linguistischen Fragen anhand (großer) Textmengen
MehrAutomatisiertes Annotieren in CATMA
Automatisiertes Annotieren in CATMA Thomas Bögel 1, Evelyn Gius 2, Marco Petris 2, Jannik Strötgen 3 1 Universität Heidelberg 2 Universität Hamburg 3 Max-Planck-Institut für Informatik jannik.stroetgen@mpi-inf.mpg.de
MehrEinleitung. Definitionen von Korpuslinguistik und das Repräsentativitätsmerkmal
Definitionen von Korpuslinguistik und das Repräsentativitätsmerkmal Einleitung 1. Einleitung 2. Definitionen von Korpuslinguistik 2.1 Entstehung 2.1.1 : korpusbasiert vs. korpusgestützt 2.1.2 Generative
MehrEinführung in die Linguistik
Karl-Dieter Bünting Einführung in die Linguistik io. Auflage Athenäum Verlag 1983 Inhaltsverzeichnis V o r w o r t z u r e r s t e n u n d z u r s i e b t e n A u f l a g e... 1 1 Grundbegriffe 13 Allgemeine
MehrWiederholung: Korpuszusammensetzung VL: Einführung in die Korpuslinguistik
Wiederholung: Korpuszusammensetzung VL: Einführung in die Korpuslinguistik Referenzkorpora vs. Monitorkorpora Homogenität vs. Heterogenität (Parameter) Ausgewogenheit Anke Lüdeling anke.luedeling@rz.hu-berlin.de
MehrCOSMAS II Corpus Search Management and Analysis System
COSMAS II Corpus Search Management and Analysis System http://www.ids-mannheim.de/cosmas2/ 13. November 2012, Jeanette Isele Seminar: Korpuslinguistik Übersicht Theoretischer Teil Was ist COSMAS II? Die
MehrOrganisatorisches. VL: Einführung in die Korpuslinguistik. Was mach ich, wenn ich ein Korpus will? Korpuserstellung - Themen
Organisatorisches VL: Einführung in die Korpuslinguistik 05.05.: Vertretung durch Maik Walter: Der Lerner als Entdecker: Über den Umgang mit Daten in der Fremdsprachvermittlung Anke Lüdeling anke.luedeling@rz.hu-berlin.de
MehrKorpus. Was ist ein Korpus?
Was ist ein Korpus? Korpus Endliche Menge von konkreten sprachlichen Äußerungen, die als empirische Grundlage für sprachwiss. Untersuchungen dienen. Stellenwert und Beschaffenheit des Korpus hängen weitgehend
MehrKorpora. Referenten Duyen Tao-Pham Nedyalko Georgiev
Korpora Referenten Duyen Tao-Pham Nedyalko Georgiev Hauptseminar: Angewandte Linguistische Datenverarbeitung (WS 11/12) Dozent: Prof. Dr. Jürgen Rolshoven Sprachliche Informationsverarbeitung Universität
MehrComputerlinguistische Grundlagen. Jürgen Hermes Sommersemester 17 Sprachliche Informationsverarbeitung Institut für Linguistik Universität zu Köln
Computerlinguistische Grundlagen Jürgen Hermes Sommersemester 17 Sprachliche Informationsverarbeitung Institut für Linguistik Universität zu Köln Computerlinguistik: Schnittstellen Computerlinguistik aus
MehrKorrespondenz. Kongruenz_Teil II. Kongruenz. Kongruenz, Rektion, Anaphorik. R 1_Beispiele. Kongruenzfehler_Richtlinie 1
Kongruenz_Teil II HS: Korpuslinguistische Bearbeitung von Phänomenen des Deutschen Dozentin: Prof. Dr. Anke Lüdeling Referenten: Heike Ewert, Stephan Klinger, Eva Lippert; Gruppe: Julia Kudrjawzewa, Wolfram
MehrErweiterung des STTS für gesprochene Sprache
Erweiterung des STTS für gesprochene Sprache Ines Rehbein, Sören Schalowski und Heike Wiese Institut für Deutsche Sprache SFB 632 Informationsstruktur Universität Potsdam STTS Workshop am IMS Stuttgart
MehrBildungstag zum Umgang mit Sprachkompetenz und Sprachdefiziten im Zweiten Bildungsweg
Bildungstag 2016 Sprache als Bildungschance und Bildungshemmnis Workshop zum Umgang mit Sprachkompetenz und Sprachdefiziten im Zweiten Bildungsweg Tages- und Abendschule Köln Stefanie Göllner und Eva Janssen
MehrSprachressourcen in der Lehre: Erfahrungen aus der historischen Korpuslinguis7k
Arbeitsstelle Computerphilologie Sprachressourcen in der Lehre: Erfahrungen aus der historischen Korpuslinguis7k Cris%na Vertan cris%na.vertan@uni hamburg.de 18.01.2011 1 Überblick Das Kontext (Lehrangebot
MehrOrganisatorisches: Plan. HS Korpuslinguistik. Was mach ich, wenn ich ein Korpus will? Korpuserstellung - Themen. Referenzkorpus.
Organisatorisches: Plan HS Korpuslinguistik Anke Lüdeling anke.luedeling@rz.hu-berlin.de Sommersemester 2007 27.04.2007 Korpusdesign 04.05.2007 Korpusvorverarbeitung 1: Tokenisieren & Lemmatisieren 11.05.2007
MehrMitschrift VO Syntax des Deutschen (Hartmann)
Mitschrift VO Syntax des Deutschen (Hartmann) ina Haslinger 7. März 2013 1 Einführung Aufgabengebiete der Syntax (6. 3.) Zur Prüfung kommt nur Stoff, der in der VO durchgenommen wurde; die Fragen werden
Mehr3.1.2 Der Beitrag von Wortarten für die Sprachbeschreibung Bisherige Forschungsarbeiten und ihre Anwendung auf das Kreolische...
Inhaltsverzeichnis 1. Mauritius und das Kreolische auf Mauritius... 13 1.1 Landeskundlicher Teil ein Vorwort... 13 1.2 Zu Geographie, Bevölkerungsgruppen und Sprachen auf Mauritius... 14 1.3 Definition:
MehrLAUDATIO - Eine Infrastruktur zur linguistischen Analyse historischer Korpora
LAUDATIO - Eine Infrastruktur zur linguistischen Analyse historischer Korpora Carolin Odebrecht, Humboldt-Universität zu Berlin Florian Zipser, Humboldt-Universität zu Berlin, INRIA Historische Textkorpora
MehrEinführung in die Grammatik der deutschen Gegenwartssprache
Karl-Ernst Sommerfeldt / Günter Starke Einführung in die Grammatik der deutschen Gegenwartssprache 3., neu bearbeitete Auflage unter Mitwirkung von Werner Hackel Max Niemeyer Verlag Tübingen 1998 Inhaltsverzeichnis
MehrLinguistische Grundlagen. Warum Tagging? Klassische Wortartenlehre Tagsets Annotation höherer Ebenen Design von Tagsets
Linguistische Grundlagen Warum Tagging? Klassische Wortartenlehre Tagsets Annotation höherer Ebenen Design von Tagsets Warum Tagging? Abfragbarkeit linguistischer Information Generalisierbarkeit von Abfragen
MehrZur lernersprachlichen Generierung referierender Ausdrücke in argumentativen Texten
Margit Breckle Heike Zinsmeister Zur lernersprachlichen Generierung referierender Ausdrücke in argumentativen Texten margit.breckle@gmx.de heike.zinsmeister@uni-konstanz.de Internationale Tagung der Deutschlehrerinnen
MehrKorpusvorverarbeitung. Hauptseminar: Einführung in die Korpuslinguistik. Kodierung/Annotationsmaximen. Vorverarbeitung: erste Schritte.
Hauptseminar: Einführung in die Korpuslinguistik Anke Lüdeling anke.luedeling@rz.hu-berlin.de Wintersemester 2002/2003 Korpusvorverarbeitung Beispiel: DIE ZEIT aufbereitet für journalistische Zwecke, mitgeliefertes
MehrDigitale Wörterbücher und Schreibassistenzsysteme
Digitale Wörterbücher und Schreibassistenzsysteme Workshop: Text als Werkstück Wege zu einer computergestützten Überarbeitung von deutschen Texten Prof. Dr. Angelika Storrer 7. Juli 2014 Prof. Dr. Angelika
MehrMehrdeutigkeiten und Kategorisierung: Probleme bei der Annotation von Lernerkorpora
Mehrdeutigkeiten und Kategorisierung: Probleme bei der Annotation von Lernerkorpora Anke Lüdeling Humboldt-Universität zu Berlin anke.luedeling@rz.hu-berlin.de Ziele Überlegungen zur Architektur von Lernerkorpora
MehrSprachnormenwandel im geschriebenen Deutsch an der Schwelle zum 21. Jahrhundert
VitDovalil Sprachnormenwandel im geschriebenen Deutsch an der Schwelle zum 21. Jahrhundert Die Entwicklung in ausgesuchten Bereichen der Grammatik PETER LANG Europäischer Verlag der Wissenschaften 0. Vorwort.
MehrBarbara Kunzmann-Müller. ^Grammatikhandbuch des Kroatischen
Heidelberser Publikationen zur Slavistik A. Linguistische Reihe Band 7 Baidur Panzer Barbara Kunzmann-Müller ^Grammatikhandbuch des Kroatischen unter Einschluß des Serbischen Neubearbeitete, zweite Auflage.
MehrNeue Funktionen in der KorpusSuchmaschine ANNIS 3.1
Neue Funktionen in der KorpusSuchmaschine ANNIS 3.1 Thomas Krause 1 Vorkenntnisse??? 2 Hands On Im Browser (möglichst Firefox oder Chrome) https://korpling.german.hu-berlin.de/annis3/ aufrufen Nachfragen!
MehrAuswahlbibliographie zum Studium der anglistischen Sprachwissenschaft
Helga Höhlein, Peter H. Marsden, Clausdirk Poliner Auswahlbibliographie zum Studium der anglistischen Sprachwissenschaft Mit Kommentaren Max Niemeyer Verlag Tübingen 1987 INHALT Seite Allgemeine Hilfsmittel.
Mehrein Wort ist nicht in 3 Jahren FAZ Hauptseminar: Einführung in die Korpuslinguistik Welche Wörter kommen nicht vor? Allerdings,...
Hauptseminar: Einführung in die Korpuslinguistik Anke Lüdeling anke.luedeling@rz.hu-berlin.de Wintersemester 2002/2003 ein Wort ist nicht in 3 Jahren FAZ kann man daraus schließen, dass es nicht mehr verwendet
Mehrder Zweitsprache Deutsch Vortrag auf dem DGFF-Kongress Inger Petersen, Universität Oldenburg
Analyse von Schreibkompetenz in der Zweitsprache Deutsch Vortrag auf dem DGFF-Kongress 2009 02.10.2009 Inger Petersen, Universität Oldenburg Gliederung 1. Das Forschungsprojekt 2. Schreibkompetenz u. Schriftlichkeit
MehrSiegfried Lamnek. Gruppendiskussion. Theorie und Praxis. 2. Auflage. Beltz Verlag Weinheim und Basel
Siegfried Lamnek Gruppendiskussion Theorie und Praxis 2. Auflage Beltz Verlag Weinheim und Basel Inhaltsverzeichnis 1 Zur Einführung 11 2 Zur Geschichte der Gruppendiskussion 18 3 Der Stellenwert der Gruppendiskussion
MehrErwerb der Satzstruktur bei Kindern mit DaM REFERENTIN: INES HADAMECK
Erwerb der Satzstruktur bei Kindern mit DaM REFERENTIN: INES HADAMECK 07.06.2011 Sprachliche Wissenssysteme Morphosyntaxerwerb = syntaktische Strukturen UND Flexionsmorphologie Gliederung: Das topologische
MehrVertiefung der Grundlagen der Computerlinguistik. Semesterüberblick und Einführung zur Dependenz. Robert Zangenfeind
Vertiefung der Grundlagen der Computerlinguistik Semesterüberblick und Einführung zur Dependenz Robert Zangenfeind Centrum für Informations- und Sprachverarbeitung, LMU München 17.10.2017 Zangenfeind:
MehrTagger for German. Online BRILL-Tagger für das Deutsche
Tagger for German Online BRILL-Tagger für das Deutsche Morphologie V/Ü, Anke Holler Uni Heidelberg, SS2007 Nataliya Mytyay Éva Mújdricza 19.07.2007 Designed by: Dóra Dobos Tagger for German Eric Brill
MehrSwantje Westpfahl & Thomas Schmidt POS für(s) FOLK
Swantje Westpfahl & Thomas Schmidt POS für(s) FOLK Problemanalyse des POS- Taggings für spontansprachliche Daten anhand des Forschungsund Lehrkorpus Gesprochenes Deutsch 2 FOLK Forschungs- und Lehrkorpus
MehrLösungsvorschlag für das Übungsblatt 8. Aufgabe1.
Lösungsvorschlag für das Übungsblatt 8. Aufgabe1. 3 Det A N VP R6 4 Any A N VP L3 5 Any intelligent N VP L4 6 Any intelligent cat VP L2 Nach den Regeln kann der Satz weiter nicht erzeugt warden, deswegen
MehrVerbstellungswandel in Nebensätzen für Schülerinnen und Schüler zugänglich gemacht
Verbstellungswandel in Nebensätzen für Schülerinnen und Schüler zugänglich gemacht Ein Vortrag von Valerie Kolodziej, Johanna Schumacher und Ann Christina Barsch S Einführung Historische Entwicklung der
MehrSprachtechnologie als Grundlage für die maschinelle Auswertung von Texten
Sprachtechnologie als Grundlage für die maschinelle Auswertung von Texten Dr-Ing Michael Piotrowski Leibniz-Institut für Europäische Geschichte @true_mxp Bamberg, 20 November 2015
MehrLAUDATIO-Repository für Anwender. Carolin Odebrecht Humboldt-Universität zu Berlin LAUDATIO-repository.org
LAUDATIO-Repository für Anwender Carolin Odebrecht Humboldt-Universität zu Berlin LAUDATIO-repository.org Arbeiten mit (historischen) Fragen, die oft gestellt werden: Korpora Wo finde ich Korpora aus dem
MehrCorporate Identity und ihre länderspezifischen Realisierungen
Tanja Emmerling Corporate Identity und ihre länderspezifischen Realisierungen Am Beispiel der italienisch-, portugiesisch- und spanischsprachigen Websites von Aventis Deutscher Universitäts-Verlag Inhaltsverzeichnis
MehrÜberblick. Hauptseminar: Einführung in die Korpuslinguistik. Wiederholung Produktivität. Wiederholung Produktivität. Fragen
Hauptseminar: Einführung in die Korpuslinguistik Anke Lüdeling anke.luedeling@rz.hu-berlin.de Wintersemester 2002/2003 Überblick Wiederholung Produktivität Registervariation multidimensionale Analyse Register
MehrGleiche Daten, unterschiedliche Erkenntnisziele?
Gleiche Daten, unterschiedliche Erkenntnisziele? Zum Potential vermeintlich widersprüchlicher Zugänge zur Textanalyse Universität Hamburg Evelyn Gius Jan Christoph Meister Janina Jacke Marco Petris Universität
MehrSie gab das Buch ihrer Schwester.
Linguistische Kriterien für kontextfreie Grammatiken Zerlegung eines Satzes in Konstituenten gemäß Austausch-, Verschiebe- und Weglaßprobe Dies ist ein Beispiel. Beschreibungsmöglichkeiten: 1. S Pron V
MehrEinführung in die Computerlinguistik. Morphologie III
Einführung in die Computerlinguistik Morphologie III Hinrich Schütze & Robert Zangenfeind Centrum für Informations- und Sprachverarbeitung, LMU München 7.12.2015 Schütze & Zangenfeind: Morphologie III
MehrKontrastive Linguistik und Übersetzung
Kontrastive Linguistik und Übersetzung WS 2014/15 29.04.2015 EINFÜHRUNG IN DIE SYNTAX Syntax Die syntaktische Analyse (von gr. syntaxis Zusammenstellung ) befasst sich mit den Regeln und Verfahren, mit
MehrZugang zur Konkordanzsuche
Zugang zur Konkordanzsuche 1.1 Zugriff Mit dem Recherchetool können Sie: - Konkordanzen (= eine Liste aller Vorkommen eines Suchwortes im Kontext) aus der Verbalspur und den Annotationen erstellen, - Metadaten
MehrDie Erklärung für den Kontrast zwischen (1) und (2) liegt darin, dass das Relativpronomen auf die dritte Person festgelegt ist.
Seminar Syntax und Morphologie Wintersemester 2007/2008 PD Dr. Ralf Vogel Ich, der ich... (1) a. Ich, der ich sechzig bin. *Ich, der sechzig bin/ist. (2) a. Er, der sechzig ist. *Er, der er sechzig ist.
MehrGrammatiken und linguistische Evidenz
Grammatiken und linguistische Evidenz SE: Quantitative Analyse linguistischer Variation Dozentin: Ines Rehbein 14.11.2012 Linguistische Variation (Ines Rehbein) WS 2012/13 1 / 28 Heutige Sitzung I. Zusammenfassung
MehrKONZEPT UND ERFORSCHUNG VON DEUTSCH-ALS-FREMDSPRA- CHE-LERNERVARIETÄTEN
Germanistische Studien X (2016) 193 204 KONZEPT UND ERFORSCHUNG VON DEUTSCH-ALS-FREMDSPRA- CHE-LERNERVARIETÄTEN Ágnes Huber 0. Einleitende Gedanken Multikulturelle Einflüsse der Globalisierung machen sich
MehrAVS-M Name des Moduls: Sprachtypologie und Universalienforschung
AVS-M 10 1. Name des Moduls: Sprachtypologie und Universalienforschung 2. Fachgebiet / Verantwortlich: Allgemeine und Vergleichende Sprachwissenschaft/ Prof. Dr. Johannes Helmbrecht 3. Inhalte des Moduls:
MehrFALKO - Ein fehlerannotiertes Lernerkorpus des Deutschen
FALKO - Ein fehlerannotiertes Lernerkorpus des Deutschen Peter Siemen, Anke Lüdeling, Frank Henrik Müller siemen@informatik.hu-berlin.de, anke.luedeling@hu-berlin.de Korpuslinguistik Institut für deutsche
MehrModellierung von linguistischen Forschungsdaten. Kolloquium Korpuslinguistik Carolin Odebrecht Humboldt-Universität zu Berlin
Modellierung von linguistischen Forschungsdaten Kolloquium Korpuslinguistik 13.11.2013 Carolin Odebrecht Humboldt-Universität zu Berlin Überblick 1. Forschungskontext 2. Forschungsfrage 3. Anwendungsbereich
Mehr