Mehrdeutigkeiten und Kategorisierung: Probleme bei der Annotation von Lernerkorpora
|
|
- Sofie Frank
- vor 7 Jahren
- Abrufe
Transkript
1 Mehrdeutigkeiten und Kategorisierung: Probleme bei der Annotation von Lernerkorpora Anke Lüdeling Humboldt-Universität zu Berlin Ziele Überlegungen zur Architektur von Lernerkorpora flache Architektur vs. Mehrebenenarchitektur gemischte Tags vs. saubere Tags Architektur von Falko Lernerdaten Intuition Elizitationstests, gezielte Erhebungen Fehlersammlungen Korpusdaten - Lernerkorpora elektronische Sammlungen von Lerneräußerungen für EFL schon weit verbreitet (ICLE, Hong Kong Corpus etc.) in DaF noch wenig eingesetzt bisher gibt es kaum frei zugängliche (fehlerannotierte) Lernerkorpora für das Deutsche über Lernerkorpora (EFL): Granger (2002, erscheint), Nesselhauf (2002), Pravec (2002), Tono (2003) über Lernerkorpora des Deutschen: Belz (2004), Weinberger (2002), ESF Korpora ( Korpusarchitektur Lernerkorpora Forschungsfragen abhängig von Design Architektur Annotation: Tagsets und Richtlinien aufwändig zu erheben und zu annotieren Architektur soll flexibel sein so dass möglichst viele Fragestellungen auf denselben Daten möglich sind verteiltes Arbeiten möglich ist Fehlerannotation technisch flache Architekturen Basistext und Annotation in derselben Datei für große L1-Korpora und die meisten Lernerkorpora bisher Tabellen modelle Baummodelle (XML, SGML) Tabellenmodelle zu jedem Token werden Tags (Wortart, Lemma etc.) angegeben oft vorher Anzahl der Tags festgelegt schnelles Indizieren und Suchen für automatisches Tagging gut geeignet 1
2 Tabellenmodelle die Erklärung für <MoArInGn> diese Phänomen ist Mo morphology, Ar article, In Inflection, Gn gender <LxPhCh> Es gibt eine veränderte Gesellschaft und Lx- lexical, Ph phrase, Ch incorrect choice (Weinberger 2002) Ausdehnung eines Fehlers kann nicht direkt kodiert werden man kann nicht beliebig viele Fehlertags vergeben, geschachtelte Fehler können nicht kodiert werden keine konkurrierenden Annotationen möglich Baummodelle I belong to two baseball <n_num crr= teams >team</n_num> (Izumi, Uchimoto & Isahara 2005) Ausdehnung eines Fehlers kann kodiert werden Probleme bei verschachtelten Fehlern (komplexe Verschachtelungskonventionen, konfligierende Hierarchien) keine konkurrierenden Annotationen möglich Fehlerannotation - inhaltlich Was ist ein Fehler? unterschiedliche Zielhypothesen Interpretationsebenen Tagsets Fehleranalyse was ist ein Fehler? Bruch einer Regel ungrammatisch Woher bekommt man die Regeln explizite Regeln vs. implizite Regeln strukturelle Fehler, müssen algorithmisch zu finden sein (?) Abweichung von einer Norm, "breaches of code" (Corder 1973) unakzeptabel, 'inappropriate' Norm erfordert Setzung verschiedene Normen (sprachliche, soziale,...) strukturelle und nichtstrukturelle Fehler, nicht unbedingt algorithmisch zu finden Fehleranalyse was ist ein Fehler? "A linguistic form,... which, in the same context would in all likelihood not be produced by the learner's native speaker counterparts." (Lennon 1991, 182) brauchbare Definition? kontrollierte Erhebungen notwendig Fehleranalyse Zielhypothese jede Fehlerannotation setzt Interpretation eine Zielhypothese voraus reconstruction of those utterances in the target language (Ellis 1994: 54) oft implizit (Weinberger 2002), manchmal explizit (Izumi, Uchimoto & Isahara 2005) Problem: oft sind mehrere Zielhypothesen möglich in flachen Architekturen nicht darstellbar 2
3 Zielhypothese Beispiele die Erklärung für dieses Phänomen ist die Erklärung für diese Phänomene ist Zielhypothese - Beispiele Der Realismus ist eine im 19. Jahrhunder, als Gegenbewegung zu klassisch-romantischen Kunstauffassung literarische Richtung, die sich bis zum Ende des Jahrhunderts international weit erstreckte. (Falko L2 1.2) Der Realismus ist eine literarische Richtung, die im 19. Jahrhundert als Gegenbewegung zur klassischromantischen Kunstauffassung gegründet wurde und sich Der Realismus ist eine im 19. Jahrhundert, als Gegenbewegung zur klassisch-romantischen Kunstauffassung gegründete literarische Richtung, die sich Tagsets unterschiedliche Fehlerexponenten generic tagset (Degneaux et al. 1996, Izumi et al. 2005) vs. spezifische Tagsets für spezifische Forschungsfragen gemischte Tagsets: Fehlerort, Fehlerart, Grund etc. in einem gemeinsamen Tag unterschiedliche (konkurrierende) Tagsets für dieselben Daten Architektur Anforderungen Fehlerexponent: Token oder Sequenz von Tokens unterschiedliche (konkurrierende) Zielhypothesen unterschiedliche (konkurrierende) Tagsets für jede Ebene Architektur: Mehrebenenmodelle entwickelt für multimodale Korpora (Sprachsignal, Transkription, Gestik etc.) 'timeline' oder Referenzebene jede Annotationsebene kann in einer unabhängigen Datei gespeichert werden, verbunden werden alle Ebenen durch Pointer auf die Referenzebene Bird & Liberman 2001, Carletta at al. 2003, Dipper et al. 2004, Wittenburg (erscheint), ANC, NITE Falko Architektur Mehrebenenmodell (EXMARaLDA) Referenzebene: transkribierter Originaltext explizite Zielhypothese(n) konkurrierende Tagsets Lüdeling et al. (2005), Falko: 3
4 Falko Design Falko (für fehlerannotiertes Lernerkorpus) Kernkorpus: (handschriftliche) Zusammenfassungen von linguistischen und literaturwissenschaftlichen Texten, kontrollierte Erhebungssituation, ca Tokens, fortgeschrittene LernerInnen (DSH Prüfung, abgeschlossenes Grundstudium der Germanistik), Kontrollkorpus von MuttersprachlerInnen, ca Tokens Annotationsebenen bisher: Wortart, Lemma, Zielhypothese, Wortstellung, Kongruenz & Rektion, Definitheit Erweiterungskorpora: Longitudinaldaten der Georgetown University, Daten der Copenhagen Business School, Daten aus Seminaren, Essays, wächst neue Genres neue Annotationsebenen Suchfunktionalität nach Ellis (1994) wird jede Fehlerannotationsebene in drei Schichten aufgeteilt Beschreibung Erklärung nach Ellis (1994) wird jede Fehlerannotationsebene in drei Schichten aufgeteilt Beschreibung Erklärung Unsicherheit nimmt zu Fehlerhypothese 1 Beschreibung 1 Erklärung 1.1. Erklärung 1.n Beschreibung m Erklärung m.1. Erklärung m.o Fehlerhypothese 2 Beispiel: Ebenen und Schichten Beispiel Um plausibel es zu begründen, erläutert er einen Beispiel. (Falko L2) ZH I - WS um plausibel x es es plausibel zu begründen, erläutert er einen ein Beispiel B - WS TAG E - WS transfer I - R B - R E -R x TAG lex 4
5 Zusammenfassung Korpusarchitektur als ein wichtiger Faktor beim Aufbau eines Spezialkorpus konkurrierende Analysen verteiltes Arbeiten Mehrebenenarchitektur Umsetzung für ein Lernerkorpus Ausblick Architektur verteiltes Arbeiten? Inter-Annotator Agreement Zielhypothese Anwendung von Tagsets Falko mehr Daten, andere Genres Arbeit am Suchinterface weitere Einzelstudien Vielen Dank! bisherige Arbeiten mit Falko-Daten Hagen Hirschmann Platzhalterphrasen bei fortgeschrittenen Lernern des Deutschen als Fremdsprache (Staatsexamensarbeit, Juli 2005) Eva Lippert Probleme von Nichtmuttersprachlern mit der Definitheit von Nominalphrasen (Magisterarbeit, Nov 2005) Vicky Oketch Einflüsse von Muttersprache und erster Fremdsprache Englisch auf den Syntaxerwerb von kenianischen Deutschlernern (Dissertation, laufend) Karin Schmidt Pronominaladverbien als Lehr- und Lerngegenstand des Deutschen als Fremdsprache (Dissertation, laufend) Maik Walter Der Gebrauch von Konnektoren in fortgeschrittenen Lernervarietäten des Deutschen als Fremdsprache (Dissertation, laufend) Walter, Maik (2006): Hier wird die Wahl schwer, aber entscheidend. Konnektorenkontraste im Deutschen. Erscheint in: Österreichisches Jahrbuch Deutsch als Fremdsprache Referenzen Belz, Judy A. (2004) Learner Corpus Analysis and the Development of Foreign Language Proficiency, In: System: An International Journal of Educational Technology and Applied Linguistics. 32.4: Degneaux, E,; Denness, S.; Granger, S. & Meunier, F. (1996) Error Tagging Manual Version 1.1. Centre for English Corpus Linguistics, Universite Catolique de Louvain Granger, Sylviane (2002) A bird's-eye view of learner corpus research, in S. Granger, J. Hung, S. Petch-Tyson (Hrsg.) Computer Learner Corpora, Second Language Acquisition and Foreign Language Teaching. John Benjamins, Amsterdam, Granger, Sylviane (erscheint) Learner corpora, in A. Lüdeling and M. Kytö (eds) Corpus Linguistics.An International Handbook (Berlin: Mouton de Gruyter). Izumi, Emi; Uchimoto, Kiyotaka & Isahara, Hitoshi (2005) Error Annotation for Corpus of Japanese Learner English. In: Proceedings of the Sixth International Workshop on Linguistically Interpreted Corpora (LINC 2005) Lüdeling, Anke; Walter, Maik; Kroymann, Emil & Adolphs, Peter (2005) Multi-level error annotation in learner corpora. In: Proceedings of corpus linguistics 2005, Birmingham. Online unter Referenzen Pravec, N. A. (2002) Survey of learner corpora. In: ICAME Journal 26, Online unter Rayson, Paul; Archer, Dawn & Smith, Nicholas (2005) VARD vs. Word: A comparison of the UCREL variant detector and modern spell chackers on English historical corpora. In: Proceedings of Corpus Linguistics 2005, Birmingham van Rooy Bertus & Schäfer Lande (2003), Automatic POS tagging of a learner corpus: the influence of learner error on tagger accuracy. In Archer, D., Rayson, P., Wilson, A. & McEnery T. (eds.) Proceedings of the Corpus Linguistics 2003 conference. UCREL, Lancaster University, Schumacher, Nicole (2005) Tempus als Lerngegenstand. Ein Modell für Deutsch als Fremdsprache und seine Anwendung für italienische Lernende. Narr, Tübingen Tono, Yukio (2003) Learner corpora: design, development, and applications. In: Pre-conference workshop on learner corpora, Corpus Linguistics 2003, Lancaster 5
Lernerkorpora. HS Korpuslinguistik. Lernerkorpora. Lernerkorpora als Datenquelle. Lernerkorpora als Datenquelle. Lernerkorpora
Lernerkorpora HS Korpuslinguistik Anke Lüdeling anke.luedeling@rz.hu-berlin.de Sommersemester 2005 Motivation Aufbau Contrastive Interlanguage Analysis Error Analysis Falko Lernerkorpora "The area of linguistic
MehrOrganisatorisches. HS: Korpuslinguistische Behandlung von Phänomenen des Deutschen. Lernerkorpora als Datenquelle. Lernerkorpora als Datenquelle
HS: Korpuslinguistische Behandlung von Phänomenen des Deutschen WS 2004/2005 Anke Lüdeling anke.luedeling@rz.hu-berlin.de Organisatorisches 1. Vortrag: 15-20 Minuten + 5-10 Minuten Diskussion (gesamt 30
MehrErster Tübingen-Berlin Lernerkorpus-Workshop ( ) Marc Reznicek
Erster Tübingen-Berlin Lernerkorpus-Workshop (15.-16.10.2009) & Marc Reznicek Gliederung 1) Falko Design 2) WHIG What s hard in German 3) Forschung an Falko 4) Operationalisierung der Zielhypothese Falko-Design
MehrKORPUSGESTEUERTE SYNTAXANALYSEN
Hagen Hirschmann hirschhx@hu-berlin.de KORPUSGESTEUERTE SYNTAXANALYSEN VON LERNERSPRACHE PRÄPOSITIONALOBJEKTE IM DAF ERWERB DGfS Jahrestagung 2013 Universität Potsdam Plan Präpositionalobjekte im DaF Daten
MehrDas Zusammenspiel von qualitativen und quantitativen Methoden in der Korpuslinguistik
Das Zusammenspiel von qualitativen und quantitativen Methoden in der Korpuslinguistik Anke Lüdeling Humboldt-Universität zu Berlin anke.luedeling@rz.hu-berlin.de 1. Einleitung Korpora werden zur Beantwortung
MehrFalko. Lernersprache und Lernerkorpora. BeMaTaC Korpusdesign und gesprochene Sprache. Marc Reznicek mit Folien des gesamten Korpuslinguistikteams
Falko Lernersprache und Lernerkorpora BeMaTaC Korpusdesign und gesprochene Sprache Marc Reznicek mit Folien des gesamten Korpuslinguistikteams Berlin, 30. MaI 2013 Übersicht Wie unterscheiden sich Lerner-
MehrFALKO - Ein fehlerannotiertes Lernerkorpus des Deutschen
FALKO - Ein fehlerannotiertes Lernerkorpus des Deutschen Peter Siemen, Anke Lüdeling, Frank Henrik Müller siemen@informatik.hu-berlin.de, anke.luedeling@hu-berlin.de Korpuslinguistik Institut für deutsche
MehrMehrdeutigkeiten und Kategorisierung: Probleme bei der Annotation von Lernerkorpora 1
Anke Lüdeling Mehrdeutigkeiten und Kategorisierung: Probleme bei der Annotation von Lernerkorpora 1 1. Einleitung Auch fortgeschrittene Lerner des Deutschen als Fremdsprache haben zuweilen Probleme bei
Mehrder Zweitsprache Deutsch Vortrag auf dem DGFF-Kongress Inger Petersen, Universität Oldenburg
Analyse von Schreibkompetenz in der Zweitsprache Deutsch Vortrag auf dem DGFF-Kongress 2009 02.10.2009 Inger Petersen, Universität Oldenburg Gliederung 1. Das Forschungsprojekt 2. Schreibkompetenz u. Schriftlichkeit
MehrHS: Korpuslinguistische Behandlung von Phänomenen des Deutschen
HS: Korpuslinguistische Behandlung von Phänomenen des Deutschen WS 2005/2006 Anke Lüdeling Maik Walter Organisatorisches Kontakt Anke Lüdeling Tel: 030-20939799 Mail: anke.luedeling@rz.hu-berlin.de Sprechstunde
MehrMultilingualität und Lernerkorpora. Victoria Anyango Oketch Anke Lüdeling
Multilingualität und Lernerkorpora Victoria Anyango Oketch victoria.anyango@googlemail.com Anke Lüdeling anke.luedeling@rz.hu-berlin.de Plan Mehrsprachigkeit Forschungsfrage Evidenz: Lernerkorpora Untersuchung
MehrEin kenianisches Lernerkorpus. Einflüsse der Muttersprachen und des Englischen auf den Spracherwerb bei kenianischen Deutschlernern
Ein kenianisches Lernerkorpus Einflüsse der Muttersprachen und des Englischen auf den Spracherwerb bei kenianischen Deutschlernern Gliederung Begriffsbestimmung Second Language Acquisition vs. Mulitilingual
MehrDeutsche Lernerwortarten im Falko Lernerkorpus Was Mehrebenen-POS-tags leisten können
Deutsche Lernerwortarten im Falko Lernerkorpus Was Mehrebenen-POS-tags leisten können Marc Reznicek Humboldt-Universität zu Berlin STTS- Workshop 24.9.2012 Überblick STTS in Lernerkorpora Lernerfehler
MehrTechnik und Arbeitsablauf für FALKO
Peter Adolphs Emil Kroymann Technik und Arbeitsablauf für FALKO 1 Software 1.1 EXMARaLDA Partitur-Editor EXMARaLDA ist ein Annotationswerkzeug für linguistische Korpora. Es wurde von der Universität Hamburg
MehrZur Korpusarchitektur der Falko-Korpora und ihrer Auswertung
Zur Korpusarchitektur der Falko-Korpora und ihrer Auswertung Hagen Hirschmann 20. 10. 2017 Universität Szeged Plan Übergreifende Richtlinien und Tendenzen zur Korpuserstellung Die verschiedenen Falko-Korpora
MehrWortfinales Schwa in BeMaTaC: L1 vs. L2. Simon Sauer Korpuslinguistisches Kolloquium Humboldt-Universität zu Berlin
Wortfinales Schwa in BeMaTaC: L1 vs. L2 Simon Sauer Korpuslinguistisches Kolloquium Humboldt-Universität zu Berlin 27.01.2016 Phänomen In gesprochenem Deutsch wird wortfinales Schwa oft weggelassen ich
MehrPlan. Korpora im Sprachunterricht. Motivation: Fremdsprachunterricht. L1-Korpora. L1-Korpora. Lernerkorpora Komplexe Verben in der Lernersprache
Plan Lernerkorpora Komplexe Verben in der Lernersprache Sommersemester 2007 Anke Lüdeling VL Korpuslinguistik Korpora in der Spracherwerbsforschung und im Fremdsprachunterricht Lernerkorpora Falko Studie:
MehrLernerkorpora: Ressourcen für die Deutsch-als-Fremdsprache-Forschung. Karin Schmidt 1
Lernerkorpora: Ressourcen für die Deutsch-als-Fremdsprache-Forschung Karin Schmidt 1 Abstract The article addresses the growing importance of corpus-based research in the field of German foreign language
MehrGliederung Stil. Gliederung. Einführung: Stil und Stilometrie. Einführung: Stil und Stilometrie II. Vergleichbarkeit
Gliederung Stil Felix Lange, Peter Palaga, Marah Pfennigsdorf, Inese Sture-Goldmann, Francesca Schmidt, Petya Silvestrova Seminar: Korpuslinguistische Bearbeitung von Phänomenen des Deutschen Dozentin:
MehrFalko. Error annotations in Falko 2.x. Marc Reznicek & Cedric Krummes
Falko Error annotations in Falko 2.x Marc Reznicek & Cedric Krummes Symposium What s Hard in German? Structural Difficulties, Research Approaches and Pedagogic Solutions Bangor University Monday and Tuesday,
MehrVariationistische Analysen von L1- und L2-Korpora
Variationistische Analysen von L1- und L2-Korpora Anke Lüdeling Humboldt-Universität zu Berlin Text als Werkstück DIPF Juli 2014 Systematische Analyse von Texten: Hermeneutik oder Wissenschaft? Wie kann
MehrLAUDATIO - Eine Infrastruktur zur linguistischen Analyse historischer Korpora
LAUDATIO - Eine Infrastruktur zur linguistischen Analyse historischer Korpora Carolin Odebrecht, Humboldt-Universität zu Berlin Florian Zipser, Humboldt-Universität zu Berlin, INRIA Historische Textkorpora
MehrEinführung. Stefanie Dipper Stefan Evert Heike Zinsmeister
Einführung Stefanie Dipper Stefan Evert Heike Zinsmeister München, 28.1.2011 Korpus eine Sammlung gesprochener oder geschriebener Äußerungen typischerweise digitalisiert und maschinenlesbar Ebenen eines
MehrWiederholung: Forschungsfragen und Korpusdaten. GK C: Einführung in die Korpuslinguistik. Wiederholung: Forschungsfragen und Korpusdaten
GK C: Einführung in die Korpuslinguistik Anke Lüdeling anke.luedeling@rz.hu-berlin.de Sommersemester 2003 Wiederholung: Forschungsfragen und Korpusdaten Korpusdaten können benutzt werden um zu entscheiden,
MehrDer Einfluss der Textvorlage
Der Einfluss der Textvorlage beim Zusammenfassen in der L2 Humboldt-Universität zu Berlin 1. Tübingen-Berliner Lernerkorpustreffen Humboldt-Universität zu Berlin 15./16.10.2009 Gliederung Die Aufgabe des
MehrElektronische Korpora in der Lehre Anwendungsbeispiele aus der theoretischen 2 und / 27der. und der Computerlinguistik
Elektronische Korpora in der Lehre Anwendungsbeispiele aus der theoretischen und der Linguistics Department Ruhr-University Bochum 18.1.2011 DSPIN-Workshop Sprachressourcen in der Lehre Erfahrungen, Einsatzszenarien,
MehrOverview. Motivation Learner text and target hypoteses correction of POS-tags parsing the target hypothesis TH1
Overview Motivation Learner text and target hypoteses correction of POS-tags parsing the target hypothesis TH1 Motivation up -to -date learner corpora allow us to investigate surface structure features
MehrÜberblick. GK C: Einführung in die Korpuslinguistik. Fragen. Sprachwandel/Sprachvariation. Fragen. NB: Register
GK C: Einführung in die Korpuslinguistik Anke Lüdeling anke.luedeling@rz.hu-berlin.de Sommersemester 2003 Überblick Registervariation multidimensionale Analyse Register quantitative Analyse Dimensionen:
MehrAufgabe. Erstellen eines kleinen Lernerkorpus exemplarisches Aufzeigen, wie Fehler sinnvoll klassifiziert und annotiert werden könnten
Aufgabe Erstellen eines kleinen Lernerkorpus exemplarisches Aufzeigen, wie Fehler sinnvoll klassifiziert und annotiert werden könnten Mitstreiterinnen: Elena Briskina, Julia Hantschel, Jenny Krüger, Stéphanie
MehrWhat s Hard in German? : Touching the Void of Over- and Underuse
What s Hard in German? : Touching the Void of Over- and Underuse funded by and Cedric Krummes a, Marc Reznicek b, Chan Jia Wei b, Hagen Hirschmann b, Thomas Krause b, Amir Zeldes b, Astrid Ensslin a, Anke
MehrZweitspracherwerbsforschung mit Lernerkorpora. Hagen Hirschmann Carl von Ossietzky Universität Oldenburg
Zweitspracherwerbsforschung mit Lernerkorpora Hagen Hirschmann 13.06.2013 Carl von Ossietzky Universität Oldenburg Plan Einführung: Korpuslinguistik als empirische Methode Die Besonderheiten von Lernerkorpora
MehrTagging von Online-Blogs
Tagging von Online-Blogs Gertrud Faaß (vertreten durch Josef Ruppenhofer) STTS tagset and tagging: special corpora 24. September 2012 Faaß MODEBLOGS 1 Korpuslinguistische studentische Projekte am IwiSt
MehrFormulaic Sequences in German Essays: Comparing L1 with L2 data
Learner Corpus Research 15-17 September 2011 Louvain-la-Neuve, Belgium Cedric Krummes Sylvia Jaworska Astrid Ensslin c.krummes@bangor.ac.uk s.jaworska@qmul.ac.uk a.ensslin@bangor.ac.uk Bangor University
MehrLernereffekte im deutschen Mittelfeld
Lernereffekte im deutschen Mittelfeld Marc Reznicek 4.1.2012 Kolloquium Korpuslinguistik Humboldt-Universität zu Berlin Überblick Variation im deutschen Mittelfeld Linearisierungsfaktoren Modellierung
MehrZielhypothesen und Lernersprache. Das Falko Lernerkorpus
Zielhypothesen und Lernersprache Das Falko Lernerkorpus Marc Reznicek 22.06.12 offene Berliner DaF Reihe Mit Folien des gesamten Korpuslinguistikteams der HU-Berlin Übersicht Fragestellungen der Lernerkorpusforschung
MehrZur lernersprachlichen Generierung referierender Ausdrücke in argumentativen Texten
Internationale Tagung der Deutschlehrerinnen und Deutschlehrer (IDT), Jena, 3. 8. August 2009 Margit Breckle, margit.breckle@gmx.de Heike Zinsmeister, heike.zinsmeister@uni-konstanz.de Zur lernersprachlichen
MehrDas Zusammenspiel interpretativer und automatisierbarer Verfahren bei der Aufbereitung und Auswertung mündlicher Daten
Das Zusammenspiel interpretativer und automatisierbarer Verfahren bei der Aufbereitung und Auswertung mündlicher Daten Ein Fallbeispiel aus der angewandten Wissenschaftssprachforschung Cordula Meißner
MehrKorpuslinguistik für Deutsch als Fremdsprache
ANKE LÜDELING & MAIK WALTER Korpuslinguistik für Deutsch als Fremdsprache Sprachvermittlung und Spracherwerbsforschung 1 1 Einleitung Die Korpuslinguistik beschäftigt sich mit dem Aufbau, der Auszeichnung
MehrFAKULTÄT FÜR SPRACH-, LITERATUR- UND
Dr. Max Mustermann Lehrstuhl Referat Kommunikation für Medieninformatik & Marketing FAKULTÄT Verwaltung FÜR SPRACH-, LITERATUR- UND Introducing PaLaFra A Project on the Creation and Analysis of an Electronic
MehrÜberblick. Hauptseminar: Einführung in die Korpuslinguistik. Wiederholung Produktivität. Wiederholung Produktivität. Fragen
Hauptseminar: Einführung in die Korpuslinguistik Anke Lüdeling anke.luedeling@rz.hu-berlin.de Wintersemester 2002/2003 Überblick Wiederholung Produktivität Registervariation multidimensionale Analyse Register
MehrLAUDATIO - Eine Infrastruktur zur linguistischen Analyse historischer Korpora
LAUDATIO - Eine Infrastruktur zur linguistischen Analyse historischer Korpora Carolin Odebrecht, Humboldt-Universität zu Berlin Florian Zipser, Humboldt-Universität zu Berlin, INRIA Historische Textkorpora
MehrZeitschriften Linguistik
Across Languages and Cultures X 2x/Jahr Akadémia Kiadó 2000- Zeitschriften Adesso 12x/Jahr Spotlight Verlag 2007- Zeitschriften AILA Review X 1x/Jahr John Benjamins 2001-1.11.233 Annual Review of Applied
MehrHumboldt-Universität zu Berlin Institut für deutsche Sprache und Linguistik Unter den Linden 6 D Berlin
Tony McEnery, Richard Xiao & Yukio Tono. 2006. Corpus-Based Language Studies. An Advanced Resource Book (Routledge Applied Linguistics). London, New York: Routledge. xx, 386 S. Amir Zeldes Humboldt-Universität
MehrZur lernersprachlichen Generierung referierender Ausdrücke in argumentativen Texten
Margit Breckle Heike Zinsmeister Zur lernersprachlichen Generierung referierender Ausdrücke in argumentativen Texten margit.breckle@gmx.de heike.zinsmeister@uni-konstanz.de Internationale Tagung der Deutschlehrerinnen
MehrOverview. Motivation Learner text and target hypoteses correction of POS-tags parsing the target hypothesis TH1
Overview Motivation Learner text and target hypoteses correction of POS-tags parsing the target hypothesis TH1 Motivation up -to -date learner corpora allow us to investigate surface structure features
Mehrein Wort ist nicht in 3 Jahren FAZ Hauptseminar: Einführung in die Korpuslinguistik Welche Wörter kommen nicht vor? Allerdings,...
Hauptseminar: Einführung in die Korpuslinguistik Anke Lüdeling anke.luedeling@rz.hu-berlin.de Wintersemester 2002/2003 ein Wort ist nicht in 3 Jahren FAZ kann man daraus schließen, dass es nicht mehr verwendet
MehrZur korpusbasierten Analyse von Pronomina in DaF- Lernertexten: Eine Pilotstudie
Lamminpää, S. & C. Rink (toim.) 2014. Demokratia, Demokrati, Democracy, Demokratie. VAKKI-symposiumi XXXIV 13. 14.2.2014. VAKKI Publications 3. Vaasa, (73 85). Zur korpusbasierten Analyse von Pronomina
MehrAutomatisiertes Annotieren in CATMA
Automatisiertes Annotieren in CATMA Thomas Bögel 1, Evelyn Gius 2, Marco Petris 2, Jannik Strötgen 3 1 Universität Heidelberg 2 Universität Hamburg 3 Max-Planck-Institut für Informatik jannik.stroetgen@mpi-inf.mpg.de
MehrGrammatik und Lernerkorpora: Eine korpusorientierte Untersuchung von Präpositionalphrasen im deutschen MERLIN-Korpus
Tassja Weber Grammatik und Lernerkorpora: Eine korpusorientierte Untersuchung von Präpositionalphrasen im deutschen MERLIN-Korpus Abstract This pilot study using the German learner corpus MERLIN aims to
MehrCoRS-O-Mat. Eine freie, webbasierte Anwendungssoftware für linguistische Forschungsdaten
CoRS-O-Mat Eine freie, webbasierte Anwendungssoftware für linguistische Forschungsdaten Ziele Bereitstellung der Forschungsdaten des Projekts CoRS zur Nachnutzung Computergestützte Weiterführung des Projekts
MehrWie flüssig sprechen fortgeschrittene deutsche Lerner des Englischen?
Wie flüssig sprechen fortgeschrittene deutsche Lerner des Englischen? Eine korpusbasierte Pilotstudie ausgewählter Performanzphänomene DGFF-Kongress 2007 Justus-Liebig-Universität Gießen Sandra.Goetz@anglistik.uni-giessen.de
MehrModifikation im Deutschen und Deutschen als Fremdsprache: eine Lernerkorpusstudie
Hagen Hirschmann hirschhx@hu-berlin.de Modifikation im Deutschen und Deutschen als Fremdsprache: eine Lernerkorpusstudie Tübingen-Berlin-Meeting Universität Tübingen 05.12.2011 Plan Modifikation Modifikation
MehrModellierung von linguistischen Forschungsdaten. Kolloquium Korpuslinguistik Carolin Odebrecht Humboldt-Universität zu Berlin
Modellierung von linguistischen Forschungsdaten Kolloquium Korpuslinguistik 13.11.2013 Carolin Odebrecht Humboldt-Universität zu Berlin Überblick 1. Forschungskontext 2. Forschungsfrage 3. Anwendungsbereich
MehrKorpuslinguistik Annis 3 -Korpussuchtool Linguistische Suchen im Ridges-Korpus LAUDATIO-Workshop Hagen Hirschmann
Korpuslinguistik Annis 3 -Korpussuchtool Linguistische Suchen im Ridges-Korpus 07.10.2014 LAUDATIO-Workshop Hagen Hirschmann Was ist ANNIS? ANNIS steht für ANNotation of Information Structure http://www.sfb632.uni-potsdam.de/d1/annis/
MehrKorpusannotation: Vom nachhaltigen Aufbereiten einer Ressource
Korpusannotation: Vom nachhaltigen Aufbereiten einer Ressource Kerstin Eckart 18. Februar 2013 Kerstin Eckart 1 / 45 Übersicht Konzepte und Beispiele Vorgehen beim Aufbereiten einer Ressource Entscheidungen
MehrProjektseminar "Texttechnologische Informationsmodellierung"
Projektseminar "Texttechnologische Informationsmodellierung" Ziel dieser Sitzung Nach dieser Sitzung sollten Sie: Einige standards und projekte vom Namen her kennen Einen Überblick über und einen Eindruck
MehrVorlesungsverzeichnis für das SS 2015
Institut für fremdsprachliche Philologien Fach Anglistik Vorlesungsverzeichnis für das SS 2015 Änderungen vorbehalten Bachelor of Education Modul 1 Einführung in die Sprachwissenschaft, Literaturwissenschaft
MehrSyntaktischer Transfer beim Erwerb einer Drittsprache anhand der Lernersituation L1 Deutsch, L2 Englisch, L3 Niederländisch
Syntaktischer Transfer beim Erwerb einer Drittsprache anhand der Lernersituation L1 Deutsch, L2 Englisch, L3 Niederländisch 52. StuTS 21.- 25.11.2012 Ausgangsüberlegung (1) *Kan ik even bellen wanner ik
MehrInhalt und Typen von Korpora. Welche Sprachinhalte können Korpora haben und welche Arten von Korpora gibt es
Inhalt und Typen von Korpora Welche Sprachinhalte können Korpora haben und welche Arten von Korpora gibt es Inhalt von Korpora Korpora können die verschiedensten Texte in den unterschiedlichsten Zusammensetzungen
MehrHerausforderungen bei der Erstellung eines L1- Lernerkorpus
Herausforderungen bei der Erstellung eines L1- Lernerkorpus Lösungsvorschläge aus dem Projekt KoKo Aivars Glaznieks, Egon Stemle, Andrea Abel, Verena Lyding Institut für Fachkommunikation und Mehrsprachigkeit,
MehrL2-Erwerb bei Erwachsenen: Phonetik - Können Erwachsene eine Fremdsprache noch so gut wie Muttersprachler sprechen lernen?
Goethe-Universität Frankfurt Institut für Psycholinguistik und Didaktik der deutschen Sprache Alterseffekte im Spracherwerb Prof. Dr. Petra Schulz Referentin: Verena Sinkel L2-Erwerb bei Erwachsenen: Phonetik
MehrVorlesungsverzeichnis für das SS 14
Institut für fremdsprachliche Philologien März 2014 Fach Anglistik Vorlesungsverzeichnis für das SS 14 Änderungen vorbehalten Modul 1 Einführung in die Sprachwissenschaft, Literaturwissenschaft und die
MehrKollexem-Analyse. SE: Quantitative Analyse linguistischer Variation WS 2012/13. Germanistik
Kollexem-Analyse SE: Quantitative Analyse linguistischer Variation Germanistik WS 2012/13 WS 2012/13 1 / 14 Heutige Sitzung 1 Einführung: Quantitative syntaktische Analyse am Beispiel der Kollexem-Analyse
MehrVerzeichnis meiner Vorträge
Dr. Senem Șahin Verzeichnis meiner Vorträge Verzeichnis meiner Vorträge Zeit Ort Veranstalter Thema 14.03.2019 Würzburg Universität Würzburg 4. Teaching English as a Foreign Language Day Pleanary Talk
MehrAG 8: Korpora und Grammatik nichtstandardisierter Sprache
AG 8: Korpora und Grammatik nichtstandardisierter Sprache Christiane Pankow Universität Göteborg Christiane.pankow@tyska.gu.se Anke Lüdeling Humboldt-Universität zu Berlin anke.luedeling@rz.hu-berlin.de
MehrKarsten Hütter 3. April 2008
Exposé einer Diplomarbeit Entwicklung einer Benutzerschnittstelle für die Suche in linguistischen mehrebenen Korpora unter Betrachtung softwareergonomischer Gesichtspunkte. Karsten Hütter huetter@informatik.hu-berlin.de
MehrSpezifizierung des Gemeinsamen Europäischen Referenzrahmens für Sprachen mithilfe von korpuslinguistischen Methoden
Spezifizierung des Gemeinsamen Europäischen Referenzrahmens für Sprachen mithilfe von korpuslinguistischen Methoden Masterarbeit Kornél Kovács Erstbetreuer: Prof. Dr. Anke Lüdeling Zweitbetreuer: Prof.
MehrEine korpusbasierte Analyse von Adverbkategorien in Texten fortgeschrittener Lerner des DaF
Eine korpusbasierte Analyse von Adverbkategorien in Texten fortgeschrittener Lerner des DaF 16.10.2009 Lernerkorpustreffen Tübingen-Berlin Hagen Hirschmann Gliederung ADV-Underuse in Falko L2 Arbeitshypothesen
MehrVorlesung Morphologie Flexion
Vorlesung Morphologie 13.6. - Flexion Anke Lüdeling anke.luedeling@rz.hu-berlin.de Sommersemester 2008 Vertretung: Hagen Hirschmann Flexion Inhalte heute Flexionskategorien & Paradigmata Nomen Adjektive
MehrInformationsveranstaltung Modul 2 PO Institut für Anglistik
Informationsveranstaltung Modul 2 PO 2015 Institut für Anglistik Überblick: - Inhalte des Modul 2 PO 2015 - Modulprüfung Modul 2 Portfolio - Inhalte - Organisatorisches - Formalia - Modul 2 als Vorbereitung
MehrKontextualisierung von Sprachressourcen und -technologie in der geisteswissenschaftlichen Forschung
Kontextualisierung von Sprachressourcen und -technologie in der geisteswissenschaftlichen Forschung Christoph Draxler (München) Hannah Kermes & Elke Teich (Saarbrücken) Aufbau einer technischen Infrastruktur:
MehrKorpora im Sprachunterricht. GK C: Einführung in die Korpuslinguistik. Korpora im Sprachunterricht. Korpora im Sprachunterricht. Korpus als Material
GK C: Einführung in die Korpuslinguistik Anke Lüdeling anke.luedeling@rz.hu-berlin.de Sommersemester 2003 Korpora können genutzt werden als direkte Verwendung von Korpora im Unterricht Suchen, Entdecken
MehrDomain-Independent Support for Computer- Based Education of Argumentation Skills
Domain-Independent Support for Computer- Based Education of Argumentation Skills Institut für Informatik - Research Group Human-Centered Information Systems St. Andreasberg, 08.03.2011 Argumentationsfertigkeiten
MehrVeranstaltungen im SS 2010
Veranstaltungen im SS 2010 Der obligatorische Diagnostic Language Test für alle Studienanfänger findet statt am: Donnerstag, 25.03.2010, 14-16 Uhr in der Aula (HF) Die Zuordnung der Veranstaltungen zu
Mehr1. Einführung in das Thema 2. Fehler Definition und Beispiele 3. Leistungsmessung Ideen und. Beispiele. 4. Fragen & Diskussion 5.
1. Einführung in das Thema 2. Fehler Definition und Beispiele 3. Leistungsmessung Ideen und Beispiele 4. Fragen & Diskussion 5. Feedback Fehlerkorrektu r & Leistungsmessung Text- & Wortschatzarbeit Grundlagen:
MehrHintergrund: Morphologische Produktivität
Hintergrund: Morphologische Produktivität Anke Lüdeling anke.luedeling@rz.hu-berlin.de einige Folien sind in Zusammenarbeit mit Stefan Evert (Osnabrück) entstanden Exkurs: Korpus & Korpuszählungen viele
MehrHS: Korpuslinguistische Behandlung von Phänomenen des Deutschen
HS: Korpuslinguistische Behandlung von Phänomenen des Deutschen WS 2005/2006 Anke Lüdeling with a lot of help from Stefan Evert & Marco Baroni Kontrastive Analyse (CIA) (quantitativer) Vergleich von zwei
MehrInternational Journal of Language Academy
ISSN: 2342-0251 DOI Number: http://dx.doi.org/10.18033/ijla.3534 Volume 5/1 Spring 2017 p. 325/336 KORPUSLINGUISTISCHE ANALYSE DER FEHLERTYPEN BEI DER VERWENDUNG VON PRÄPOSITION+ARTIKEL+NOMEN BEI DaF-
Mehr2015 (mit S. Götz). Learner Corpora in Language Testing and Assessment (Studies in Corpus Linguistics, Band 70). Amsterdam: Benjamins.
Publikationsliste 01.04.2015 eigenständige Monographien 2009. Information Highlighting in Advanced Learner English. The Syntax-Pragmatics Interface in Second Language Acquisition (Pragmatics and Beyond
MehrForschungs- und Jahresbericht 2007
Frau Dr. Jörg-U. Keßler Seite 1 Frau Dr. Jörg-U. Keßler Institut für Anglistik und Amerikanistik Zur Person Raum: H2.132 Telefon: 05251-60-3583 E-Mail: joerg.kessler@upb.de Homepage: http://www.uni-paderborn.de/fakultaeten/kw/instituteeinrichtungen/institut-fuer-anglistik-undamerikanistik/personal/kessler/
MehrEinleitung. Definitionen von Korpuslinguistik und das Repräsentativitätsmerkmal
Definitionen von Korpuslinguistik und das Repräsentativitätsmerkmal Einleitung 1. Einleitung 2. Definitionen von Korpuslinguistik 2.1 Entstehung 2.1.1 : korpusbasiert vs. korpusgestützt 2.1.2 Generative
MehrZeitschrift für Interkulturellen Fremdsprachenunterricht
Zeitschrift für Interkulturellen Fremdsprachenunterricht Sprachkorpora im Phonetikunterricht Ulrike Gut Studium der Anglistik und Psychologie in Mannheim und Cambridge (GB), Promotion in Mannheim und Habilitation
MehrWissensmanagement, Kompetenzmanagement und Modelltheorie
Bernhard Mayr Wissensmanagement, Kompetenzmanagement und Modelltheorie Ein Integrationsansatz zum erfolgreichen Transfer von Expertise in betrieblichen Abläufen Diplomica Verlag GmbH 1 EINLEITUNG UND MOTIVATION
MehrSammelbände und Zeitschriftensonderhefte als (Mit-)Herausgeber
Publikationsliste 03.09.2018 eigenständige Monographien 2009. Information Highlighting in Advanced Learner English. The Syntax-Pragmatics Interface in Second Language Acquisition (Pragmatics and Beyond
MehrMitte Links Satzfunktionen im Lernermittelfeld. Marc Reznicek Kobalt- Workshop , Växjö (Schweden)
Mitte Links Satzfunktionen im Lernermittelfeld Marc Reznicek Kobalt- Workshop 11.10.2012, Växjö (Schweden) Übersicht Hintergrund Mittelfeld & Wortstellung Betrachtungsebene Methode topologische Felder
MehrNěmecký jazyk a literatura
Masarykova univerzita v Brně Filozofická fakulta Ústav germanistiky, nordistiky a nederlandistiky Německý jazyk a literatura Ohne dass, ohne zu-sätze - eine Untersuchung an Hand eines Korpus Magisterská
MehrGrammatiken und linguistische Evidenz
Grammatiken und linguistische Evidenz SE: Quantitative Analyse linguistischer Variation Dozentin: Ines Rehbein 14.11.2012 Linguistische Variation (Ines Rehbein) WS 2012/13 1 / 28 Heutige Sitzung I. Zusammenfassung
MehrLAUDATIO-Repository für Anwender. Carolin Odebrecht Humboldt-Universität zu Berlin LAUDATIO-repository.org
LAUDATIO-Repository für Anwender Carolin Odebrecht Humboldt-Universität zu Berlin LAUDATIO-repository.org Arbeiten mit (historischen) Fragen, die oft gestellt werden: Korpora Wo finde ich Korpora aus dem
MehrVocational Education and Training (VET) in Switzerland and Schaffhausen
Presentation at Information Event February 18, 2015 Karin Baumer, Office for Vocational Education and Training Vocational Education and Training (VET) in Switzerland and Schaffhausen Seite 1 Commercial
MehrKorpus. Was ist ein Korpus?
Was ist ein Korpus? Korpus Endliche Menge von konkreten sprachlichen Äußerungen, die als empirische Grundlage für sprachwiss. Untersuchungen dienen. Stellenwert und Beschaffenheit des Korpus hängen weitgehend
MehrTECHNISCH-ABSTRAKTE METADATEN FÜR DIE SUCHE NACH HISTORISCHEN KORPORA
Korpuslinguistik Humboldt-Universität zu Berlin TECHNISCH-ABSTRAKTE METADATEN FÜR DIE SUCHE NACH HISTORISCHEN KORPORA 05102015 1 Ich suche historische Texte, die in Fraktur gedruckt sind! Motivation Ich
MehrSwantje Westpfahl & Thomas Schmidt POS für(s) FOLK
Swantje Westpfahl & Thomas Schmidt POS für(s) FOLK Problemanalyse des POS- Taggings für spontansprachliche Daten anhand des Forschungsund Lehrkorpus Gesprochenes Deutsch 2 FOLK Forschungs- und Lehrkorpus
MehrLösungsvorschlag für das Übungsblatt 8. Aufgabe1.
Lösungsvorschlag für das Übungsblatt 8. Aufgabe1. 3 Det A N VP R6 4 Any A N VP L3 5 Any intelligent N VP L4 6 Any intelligent cat VP L2 Nach den Regeln kann der Satz weiter nicht erzeugt warden, deswegen
MehrMetadaten für Lernerkorpora:
Metadaten für Lernerkorpora: Typen Architektur Abfragemöglichkeiten glichkeiten, am Beispiel des -Korpus Annette Schaupp,, Ulrich Heid Universität t Stuttgart, IMS-CL Elisa Corino Università degli Studi
MehrKorpora in der Zweitspracherwerbsforschung: Sieben Probleme aus korpuslinguistischer Sicht. Juliana Goschler & Anatol Stefanowitsch
Korpora in der Zweitspracherwerbsforschung: Sieben Probleme aus korpuslinguistischer Sicht Juliana Goschler & Anatol Stefanowitsch Um allgemeingültige Aussagen über interimsprachliche Varietäten und Zweitsprach
MehrErkennung und Visualisierung attribuierter Phrasen in Poetiken
Erkennung und Visualisierung attribuierter Phrasen in Poetiken Andreas Müller (1) Markus John (2) Steffen Koch (2) Thomas Ertl (2) Jonas Kuhn (1) (1), Universität Stuttgart (2) Institut für Visualisierung
MehrMasterarbeit. Verbvalenz und Rektion im Bereich Deutsch als Fremdsprache. Eine korpusgestützte Analyse zweier Verbgruppen
TU Dortmund Fakultät Kulturwissenschaften Institut für deutsche Sprache und Literatur WiSe 2013/2014 Erstprüferin: Prof. Dr. Angelika Storrer Zweitprüfer: Prof. Dr. Ludger Hoffmann Masterarbeit Verbvalenz
MehrDesign-based Research (DBR)
Design-based Research (DBR) Ein Forschungsansatz für die Tutorienarbeit? Alessandra Kenner Fortbildungszentrum Hochschullehre der FAU Agenda Ausgangslage: Quantative vs. Qualitative Forschung? Die Idee
MehrSpracherwerb im Unterricht. Was in den Köpfen von Lernern vorgeht *
Manfred Pienemann Spracherwerb im Unterricht. Was in den Köpfen von Lernern vorgeht * 1. Die praktische Bedeutung von Spracherwerbsforschung Spracherwerbsforschung und Sprachlehre gehen von zwei grundlegend
Mehr