Korpus. Was ist ein Korpus?

Größe: px
Ab Seite anzeigen:

Download "Korpus. Was ist ein Korpus?"

Transkript

1 Was ist ein Korpus? Korpus Endliche Menge von konkreten sprachlichen Äußerungen, die als empirische Grundlage für sprachwiss. Untersuchungen dienen. Stellenwert und Beschaffenheit des Korpus hängen weitgehend von den jeweils spezifischen Fragestellungen und methodischen Voraussetzungendes theoretischen Rahmens der Untersuchung ab., vergl. z.b. die Einschätzung empirischer Daten im Strukturalismus und in der generativen Transformationsgrammatik aus: H. Bußmann: Lexikon der Sprachwissenschaft Korpusgrößen - Wieviele Wörter enthält diese Folie? - Wieviele Wörter enthält eine Zeitung? - Was entspricht einer Million Wörter? - Was wird gezählt? -> Types - Tokens Unterschiedliche Aspekte - Medium - Art der Zusammenstellung - Sprache - Format 1

2 Druck/Handschrift Korpusmedien 1 - Bestimmte Texte als Grundlage: (z.b. Untersuchungen zum Sprachgebrauch in bestimmten Werken) - Auswahl von mehreren Texten (z.b. nach Autor, Zeit, Thema usw.) - Belegsammlungen auf Karteikarten o.ä. - Beispiel: Käding (1897) Auswertung eines 11 Millionen- Wort-Korpus Elektronischer Text - Satzbänder von gedruckten Werken - Nur-Text-Versionen von gedruckt erschienen Texten (Zeitung, Buch,...) - Texte, die normalerweise nur elektronisch existieren ( , Web-Seiten, Online-Hilfen,...) 2

3 Korpusmedien 2 gesprochene Sprache - als Soundfile digitalisiert bzw. analoge Aufnahmen - transkribiert - kombiniert Bilder - Bildarchive mit oder ohne Verschlagwortung Video/Film - mit/ohne Verschlagwortung gemischt 3

4 Zusammenstellung eines Korpus repräsentativ ( balanced ): - das Korpus soll hinsichtlich das gewählte Themengebiet bzw. den gewählten Sprachausschnitt möglichst gut repräsentieren. - Beispiel 1: Sprachdaten werden von möglichst unterschiedlichen Sprechern (Geschlecht, Alter, Herkunft) gesammelt, die Verteilung soll der normalen Verteilung in der Bevölkerung entsprechen. - Beispiel 2: Textdaten werden aus möglichst vielen Gebieten und Genres gesammelt, wobei die Verteilung repräsentativ sein soll. opportunistisch: - alles verfügbare Material wird ins Korpus aufgenommen (auch als Textbank bezeichnet) spezielle Korpora: - Zeitungskorpus oder auch nur Artikel aus best. Sparte - bestimmter Bereich (z.b. nur juristische Texte) - Sprachdaten von einer speziellen Gruppe (Kinder, regional,..) - Zeitausschnitt (Wendekorpus) 4

5 einsprachig mehrsprachig Sprache des Korpus - paralleles Korpus: die Texte liegen parallel in mehreren Sprachen vor - aligniertes Korpus: sich entsprechende Abschnitte/ Sätze in einem parallelen Korpus sind ausgezeichnet - Muttersprachler / Sprachlerner synchron - es wird nur der aktuelle Sprachzustand dargestellt diachron - die gesamte (oder auf best. Zeitraum beschränkte) Entwicklung der Sprache soll repräsentiert werden Sprachvarianten (isoliert bzw. kontrastiv) - z.b. britisches/ameriakanisches Englisch 5

6 Annotierung/Mark-Up von Korpora nicht ausgezeichnet - Korpus enthält keine weiteren Informationen Format-Auszeichnung - Abschnittse, Seitenumbruch - Fettdruck, Fontwechsel formale Auszeichnung - identifizierende Information wird ausgezeichnet (Autor, Titel, Verlag,...) inhaltliche/linguistische Auszeichnung - Satzende, Wortart (part of speech Tagging), syntaktische Struktur, Lesarteninformation,... - Korpora, die mit syntaktischen Strukturen annotiert sind, nennt man Treebank 6

7 Beispiele 1 (englisch) Brown-Korpus (Francis & Kucera) umfangreiches elektronisches Korpus: 1 Mio laufende Wörter - geschriebenes amerikanische Englisch aus dem Jahr versch. Texte mit ca 2000 Wörtern - repräsentativ zusammengestellt aus verschiedenen Genres (Zeitung, Reportagen, Editorials, Memoiren, relig. Texte, Science-Fiction, Krimis) - getaggte Version: 1980 (maschinell getaggt und manuell korrigiert) - SUSANNE = geparste Version des Brown-Korpus (surface and underlying structural analyses of naturalistic English) - bis heute eines der wichtigsten Standard Korpora 7

8 Beispiele 2 (englisch) Lancaster-Oslo/Bergen Corpus (LOB), als britisches Pendant zu Brown gedacht, 1 Mio. Wörter - Textauswahl entspricht Brown - getaggt - Lancaster-Leeds Treebank: Wörter von LOB manuell geparst - Lancaster Parsed Corpus: Wörter automatsich geparst London-Lund-Corpus (LLC) Wörter, transkribierte gesprochene Sprache - Sprecher unterschiedlichen Alters ( in den 60er Jahren gesammelt) British National Corpus (BNC) seit Mio Wörter, gesprochenes und geschriebenes britisches Englisch - vollständig SGML ausgezeichnet (POS) - beteiligt: versch brit. Wörterbuchverlage und Universitäten 8

9 Beispiele 3 Französisch Trésor de la Langue Française (TLF) Mio Wörter, 2000 Texte aus versch. Genres und versch. Zeiträumen (von 17 Jh. bis heute) Deutsch Korpora am IDS: - Mannheimer Korpus (8 Mio Wörter, opportunistisch) - Bonner Zeitungskorpus (3 Mio Wörter, ) - LIMAS (1,1 Mio Wörter, analog zum Brown Korpus) am CIS vorhanden: - mehrere Gigabyte Textmaterial - teilweise lemmatisiert und SGML-ausgezeichnet - teilweise NP-geparst - nähere Informationen kommen später 9

Inhalt und Typen von Korpora. Welche Sprachinhalte können Korpora haben und welche Arten von Korpora gibt es

Inhalt und Typen von Korpora. Welche Sprachinhalte können Korpora haben und welche Arten von Korpora gibt es Inhalt und Typen von Korpora Welche Sprachinhalte können Korpora haben und welche Arten von Korpora gibt es Inhalt von Korpora Korpora können die verschiedensten Texte in den unterschiedlichsten Zusammensetzungen

Mehr

Korpora in NLTK Vortrag im Seminar Computerlinguis6sche Textanalyse WS 2014/15 (B- GSW- 12, M- GSW- 09)

Korpora in NLTK Vortrag im Seminar Computerlinguis6sche Textanalyse WS 2014/15 (B- GSW- 12, M- GSW- 09) Korpora in NLTK Vortrag im Seminar Computerlinguis6sche Textanalyse WS 2014/15 (B- GSW- 12, M- GSW- 09) Johannes Hellrich Lehrstuhl für Computerlinguis6k Ins6tut für Germanis6sche SprachwissenschaQ Friedrich-

Mehr

Das Zusammenspiel interpretativer und automatisierbarer Verfahren bei der Aufbereitung und Auswertung mündlicher Daten

Das Zusammenspiel interpretativer und automatisierbarer Verfahren bei der Aufbereitung und Auswertung mündlicher Daten Das Zusammenspiel interpretativer und automatisierbarer Verfahren bei der Aufbereitung und Auswertung mündlicher Daten Ein Fallbeispiel aus der angewandten Wissenschaftssprachforschung Cordula Meißner

Mehr

Korpora. Referenten Duyen Tao-Pham Nedyalko Georgiev

Korpora. Referenten Duyen Tao-Pham Nedyalko Georgiev Korpora Referenten Duyen Tao-Pham Nedyalko Georgiev Hauptseminar: Angewandte Linguistische Datenverarbeitung (WS 11/12) Dozent: Prof. Dr. Jürgen Rolshoven Sprachliche Informationsverarbeitung Universität

Mehr

Stefan Engelberg (IDS Mannheim), Workshop Corpora in Lexical Research, Bucharest, Nov. 2008 [Folie 1] DWDS-Kernkorpus / DWDS corpus analysis

Stefan Engelberg (IDS Mannheim), Workshop Corpora in Lexical Research, Bucharest, Nov. 2008 [Folie 1] DWDS-Kernkorpus / DWDS corpus analysis Content 1. Empirical linguistics 2. Text corpora and corpus linguistics 3. Concordances 4. Application I: The German progressive 5. Part-of-speech tagging 6. Fequency analysis 7. Application II: Compounds

Mehr

Swantje Westpfahl & Thomas Schmidt POS für(s) FOLK

Swantje Westpfahl & Thomas Schmidt POS für(s) FOLK Swantje Westpfahl & Thomas Schmidt POS für(s) FOLK Problemanalyse des POS- Taggings für spontansprachliche Daten anhand des Forschungsund Lehrkorpus Gesprochenes Deutsch 2 FOLK Forschungs- und Lehrkorpus

Mehr

NLP Eigenschaften von Text

NLP Eigenschaften von Text NLP Eigenschaften von Text Dr. Andreas Hotho Dominik Benz Beate Krause Sommersemester 2008 Folie: 1 Übersicht Einführung Eigenschaften von Text Words I: Satzgrenzenerkennung, Tokenization, Kollokationen

Mehr

HS: Korpuslinguistische Behandlung von Phänomenen des Deutschen

HS: Korpuslinguistische Behandlung von Phänomenen des Deutschen HS: Korpuslinguistische Behandlung von Phänomenen des Deutschen WS 2005/2006 Anke Lüdeling with a lot of help from Stefan Evert & Marco Baroni Kontrastive Analyse (CIA) (quantitativer) Vergleich von zwei

Mehr

Part-of-Speech- Tagging

Part-of-Speech- Tagging Part-of-Speech- Tagging In: Einführung in die Computerlinguistik Institut für Computerlinguistik Heinrich-Heine-Universität Düsseldorf WS 2004/05 Dozentin: Wiebke Petersen Tagging Was ist das? Tag (engl.):

Mehr

Korpuslinguistik Grundlagen Korpusrecherchemethoden

Korpuslinguistik Grundlagen Korpusrecherchemethoden Methoden der Korpusanalyse Erstellung von Konkordanzen Erzeugung von Wortlisten mit Frequenzangaben Ermittlung von hochfrequenten Wortgruppen (Clusteranalyse) Berechnung von Kookkurrenzen Ermittlung von

Mehr

Inhaltsverzeichnis. Vorwort 5

Inhaltsverzeichnis. Vorwort 5 Inhaltsverzeichnis Vorwort 5 0 Einleitung 11 0.1 Ausgangspunkt und Fragestellung 11 0.2 Aufbau der Arbeit 16 Teill Theoretische Grundlagen 1 Anglizismen im Kontest von Entlehnung 21 1.1 Entlehnung 21 1.1.1

Mehr

Elementare statistische Methoden

Elementare statistische Methoden Elementare statistische Methoden Vorlesung Computerlinguistische Techniken Alexander Koller 28. November 2014 CL-Techniken: Ziele Ziel 1: Wie kann man die Struktur sprachlicher Ausdrücke berechnen? Ziel

Mehr

Verfügbare Deutsche Korpora (gesprochene und geschriebene Texte)

Verfügbare Deutsche Korpora (gesprochene und geschriebene Texte) Verfügbare Deutsche Korpora (gesprochene und geschriebene Texte) Chatkorpus von Michael Beißwenger http://www.linse.uni-due.de/tl_files/pdfs/publikationen-rezensionen/chatkorpus_beisswenger_2013.pdf Hamburg

Mehr

fsq Ein Abfragesystem für syntaktisch annotierte Baumbanken

fsq Ein Abfragesystem für syntaktisch annotierte Baumbanken fsq Ein Abfragesystem für syntaktisch annotierte Baumbanken SFB 441, Universität Tübingen Syntaktisch annotierte Baumbanken Ursprünglich: Morphosyntaktische Tags (POS) Anreicherung mit syntaktischen Informationen

Mehr

Quantitative Linguistik 2 WS 2004/05,

Quantitative Linguistik 2 WS 2004/05, Quantitative Linguistik 2 WS 2004/05, 21.10.2004 Gegenüberstellung: Linguistik und QL Exempel: Das Zipfsche Gesetz Zielsetzung der Quantitativen Linguistik Zur Methodik der Quantitativen Linguistik Jürgen

Mehr

Bachelorarbeit: Aufbau eines Sprachkorpus zur Programmierung autonomer Roboter mittels natürlicher Sprache

Bachelorarbeit: Aufbau eines Sprachkorpus zur Programmierung autonomer Roboter mittels natürlicher Sprache Bachelorarbeit: Aufbau eines Sprachkorpus zur Programmierung autonomer Roboter mittels natürlicher Sprache Zeynep Günes Betreut von Sebastian Weigelt IPD Tichy, Fakultät für Informatik KIT Universität

Mehr

1 Grundlagen zur Arbeit mit Text

1 Grundlagen zur Arbeit mit Text 2. Übung zur Vorlesung NLP Analyse des Wissensrohstoes Text im Sommersemester 2008 mit Musterlösungen Dr. Andreas Hotho, Dipl.-Inform. Dominik Benz, Wi.-Inf. Beate Krause 30. April 2008 1 Grundlagen zur

Mehr

Part of Speech Tagging. Linguistische Sicht. Carolin Deck

Part of Speech Tagging. Linguistische Sicht. Carolin Deck Part of Speech Tagging Linguistische Sicht Carolin Deck Gliederung 1. Begriffsklärung 2. Vorstellung zwei wichtiger Tagsets (STTS & PTTS) 3. Bedeutung des POS-Tagging für die Sprachwissenschaft 4. Tagzuweisung

Mehr

Korpuslinguistik Grundlagen Korpora

Korpuslinguistik Grundlagen Korpora Was ist ein Korpus? Lemnitzer, Lothar und Heike Zinsmeister. Korpuslinguistik. Eine Einführung. Tübingen: Narr, 2006. S. 7. Stefan Engelberg, Linguistische Methodenlehre, FS 2009, Uni Mannheim [Folie 1]

Mehr

Syntaktische Tendenzen der Gegenwartssprache

Syntaktische Tendenzen der Gegenwartssprache Syntaktische Tendenzen der Gegenwartssprache Anforderungen: Regelmäßige Teilnahme: max. 2 Fehlzeiten Vorbereitung auf die Sitzung: Text lesen, Fragen notieren, mitdiskutieren (!) Leitung einer Sitzung

Mehr

Das elektronische Zeitalter des Informationsangebotes Datenbanken E-journals E-books

Das elektronische Zeitalter des Informationsangebotes Datenbanken E-journals E-books Das elektronische Zeitalter des Informationsangebotes Datenbanken E-journals E-books Vor 25 Jahren musste man für die thematische Recherche nach Fachaufsätzen Bibliografien oder sogenannte Referateorgane

Mehr

Seminar. NoSQL Datenbank Technologien. Michaela Rindt - Christopher Pietsch. Richtlinien Ausarbeitung (15. November 2015)

Seminar. NoSQL Datenbank Technologien. Michaela Rindt - Christopher Pietsch. Richtlinien Ausarbeitung (15. November 2015) Seminar Datenbank Technologien Richtlinien Ausarbeitung (15. November 2015) Michaela Rindt - Christopher Pietsch Agenda 1 2 3 1 / 12 Richtlinien Ausarbeitung (15. November 2015) Teil 1 2 / 12 Richtlinien

Mehr

HPSG. Referat zu dem Thema Kongruenz im Englischen Von Anja Nerstheimer

HPSG. Referat zu dem Thema Kongruenz im Englischen Von Anja Nerstheimer HPSG Referat zu dem Thema Kongruenz im Englischen Von Anja Nerstheimer Gliederung Einleitung Kongruenz Allgemein Zwei Theorien der Kongruenz Probleme bei ableitungsbasierenden Kongruenztheorien Wie syntaktisch

Mehr

Narrative Kompetenz in der Fremdsprache Englisch

Narrative Kompetenz in der Fremdsprache Englisch Fremdsprachendidaktik inhalts- und lernerorientiert / Foreign Language Pedagogy - content- and learneroriented 27 Narrative Kompetenz in der Fremdsprache Englisch Eine empirische Studie zur Ausprägung

Mehr

Modulhandbuch Masterstudiengang Sprachwissenschaft: Deutsch, Englisch, Romanische Sprachen. Universität Siegen Philosophische Fakultät.

Modulhandbuch Masterstudiengang Sprachwissenschaft: Deutsch, Englisch, Romanische Sprachen. Universität Siegen Philosophische Fakultät. Modulhandbuch Masterstudiengang Sprachwissenschaft: Deutsch, Englisch, Romanische Sprachen Universität Siegen Philosophische Fakultät Entwurf (Stand: 10.05.2016) Inhalt SWM1 Sprachstrukturen (sprachlicher

Mehr

Kapitel 1: Einführung. Was ist Informatik? Begriff und Grundprobleme der Informatik. Abschnitt 1.1 in Küchlin/Weber: Einführung in die Informatik

Kapitel 1: Einführung. Was ist Informatik? Begriff und Grundprobleme der Informatik. Abschnitt 1.1 in Küchlin/Weber: Einführung in die Informatik Was ist Informatik? Begriff und Grundprobleme der Informatik Abschnitt 1.1 in Küchlin/Weber: Einführung in die Informatik Was ist Informatik? Informatik = computer science? Nach R. Manthey, Vorlesung Informatik

Mehr

Tagging von Online-Blogs

Tagging von Online-Blogs Tagging von Online-Blogs Gertrud Faaß (vertreten durch Josef Ruppenhofer) STTS tagset and tagging: special corpora 24. September 2012 Faaß MODEBLOGS 1 Korpuslinguistische studentische Projekte am IwiSt

Mehr

Aufbau des Experiments Reihung von Versuchsitems und Distraktoren

Aufbau des Experiments Reihung von Versuchsitems und Distraktoren Reihung von Versuchsitems und Distraktoren Reihung von Versuchsitems und Distraktoren Hinweis D1 (Verhältnis Distraktoren:Versuchsitems): Es sollten Distraktoren eingebaut werden, im Falle von Sprecherbefragungen

Mehr

Linguistische Forschungsdaten

Linguistische Forschungsdaten Linguistische Forschungsdaten Andreas Witt Institut für Deutsche Sprache (IDS), Mannheim 45 Jahre und mehr IDS, Korpora, Verfügbarkeit, rechtliche Fragen (1) 1964 Das Institut für Deutsche Sprache wird

Mehr

Tipps für die Seminararbeit - Englisch - www.bibliothek.uni-wuerzburg.de

Tipps für die Seminararbeit - Englisch - www.bibliothek.uni-wuerzburg.de Tipps für die Seminararbeit - Englisch - www.bibliothek.uni-wuerzburg.de 1 Übersicht Gute Suchbegriffe finden Bücher zum Thema finden Aufsätze zum Thema finden Internetquellen zum Thema finden 2 Gute Suchbegriffe

Mehr

Zwischen fristgerechter und verspäteter Einschulung

Zwischen fristgerechter und verspäteter Einschulung Internationale Hochschulschriften 613 Zwischen fristgerechter und verspäteter Einschulung Die Einschulungsentscheidung und ihre Bewährung aus Elternsicht Bearbeitet von Franziska Wehner 1. Auflage 2015.

Mehr

Diskurslinguistik Theorien und Methoden der transtextuellen Sprachanalyse

Diskurslinguistik Theorien und Methoden der transtextuellen Sprachanalyse Diskurslinguistik Theorien und Methoden der transtextuellen Sprachanalyse Referenten: Inka Kressdorf und Jasmin Scheurich Proseminar: Sprache und Macht WiSe 2015/16 Dozent: Dr. Alexander Lasch 03.12.2015

Mehr

Der steinige Weg zur Digitalisierung

Der steinige Weg zur Digitalisierung Wir stellen unterrichtsleitende Lehrmittel her. Dahinter liegen didaktische Konzepte, wie der Stoff als Ganzes vermittelt werden soll. Das Kundenspektrum reicht von der Schiefertafel bis zum Smartboard,

Mehr

Neuerungen Oktober 2011

Neuerungen Oktober 2011 Neuerungen Oktober 2011 Ergänzungen oder Änderungen Tippfehlerkorrekturen oder kleine Beispielkorrekturen werden hier nicht erwähnt. 1. Format AUT Autoritätsdatensätze Sonderzeichen S. 5: _ = Leerschlag

Mehr

Aufgaben aus Kegli 2 (Korpuslinguistik)

Aufgaben aus Kegli 2 (Korpuslinguistik) Aufgaben aus Kegli 2 (Korpuslinguistik) Kapitel 1 1. Überprüfen Sie mithilfe einer beliebigen Suchmaschine den Sprachgebrauch im Internet. Finden Sie die Formen wegen dem Regen bzw. wegen des Regens und

Mehr

YAGO YAGO. A semantic knowledge base. Paul Boeck. Humboldt Universität zu Berlin Institut für Informatik. Dezember 2012 1/19

YAGO YAGO. A semantic knowledge base. Paul Boeck. Humboldt Universität zu Berlin Institut für Informatik. Dezember 2012 1/19 1/19 A semantic knowledge base Paul Boeck Humboldt Universität zu Berlin Institut für Informatik Dezember 2012 2/19 Übersicht 1 Einführung 2 Das Modell Struktur Semantik 3 Das System 4 Anwendung 3/19 Einführung

Mehr

Daten Methoden Theorien Datentypen - Erhebungsverfahren

Daten Methoden Theorien Datentypen - Erhebungsverfahren Was ist der Gegenstand der Sprachwissenschaft? Zum Beispiel: Gegenstand der Sprachwissenschaft sind die kognitiv verankerten Entitäten, Strukturen und Regeln, die die Erzeugung sprachlicher Äußerungen

Mehr

Erasmus+ Sprachenförderung online Regionaltagung Erasmus+ 27. Oktober 2014 Universität Freiburg

Erasmus+ Sprachenförderung online Regionaltagung Erasmus+ 27. Oktober 2014 Universität Freiburg Erasmus+ Sprachenförderung online Regionaltagung Erasmus+ 27. Oktober 2014 Universität Freiburg Michaela Klinge Referat 602 Erasmus Mobilität Nationale Agentur für EU-Hochschulzusammenarbeit 1 Aktuelle

Mehr

Das Buch im Medienportfolio. Mediennutzungstypen unter Berücksichtigung des Buches in Deutschland, Österreich und der Schweiz

Das Buch im Medienportfolio. Mediennutzungstypen unter Berücksichtigung des Buches in Deutschland, Österreich und der Schweiz Das Buch im Medienportfolio. Mediennutzungstypen unter Berücksichtigung des Buches in Deutschland, Österreich und der Schweiz Die repräsentative Studie Das Buch im Medienportfolio, herausgegeben vom Börsenverein

Mehr

Die elektronischen Dokumentationen im Institut für Ethik und Geschichte der Medizin in Tübingen

Die elektronischen Dokumentationen im Institut für Ethik und Geschichte der Medizin in Tübingen Die elektronischen Dokumentationen im in Tübingen Im Juni 1980 beschloss der Fachverband Medizingeschichte ein zentrales Verzeichnis aller vergebenen medizinhistorischen Themen für Doktorarbeiten einzurichten.

Mehr

Das Internet als Instrument der Unternehmenskommunikation unter besonderer Berücksichtigung der Investor Relations

Das Internet als Instrument der Unternehmenskommunikation unter besonderer Berücksichtigung der Investor Relations Wirtschaft Jörn Krüger Das Internet als Instrument der Unternehmenskommunikation unter besonderer Berücksichtigung der Investor Relations Eine theoretische und empirische Analyse Diplomarbeit Bibliografische

Mehr

Friedrich-Alexander-Universität Professur für Computerlinguistik. Nguyen Ai Huong

Friedrich-Alexander-Universität Professur für Computerlinguistik. Nguyen Ai Huong Part-of-Speech Tagging Friedrich-Alexander-Universität Professur für Computerlinguistik Nguyen Ai Huong 15.12.2011 Part-of-speech tagging Bestimmung von Wortform (part of speech) für jedes Wort in einem

Mehr

MÜNDLICHKEIT UND SCHRIFTLICHKEIT IN

MÜNDLICHKEIT UND SCHRIFTLICHKEIT IN MÜNDLICHKEIT UND SCHRIFTLICHKEIT IN SPRACHTHEORETISCHER SICHT 1. EINLEITUNG Fragen zu: Koch, Peter / Oesterreicher, Wulf (1990): Gesprochene Sprache in der Romania: Französisch, Italienisch, Spanisch (=

Mehr

LAUDATIO - Eine Infrastruktur zur linguistischen Analyse historischer Korpora

LAUDATIO - Eine Infrastruktur zur linguistischen Analyse historischer Korpora LAUDATIO - Eine Infrastruktur zur linguistischen Analyse historischer Korpora Carolin Odebrecht, Humboldt-Universität zu Berlin Florian Zipser, Humboldt-Universität zu Berlin, INRIA Historische Textkorpora

Mehr

Automatisches Übersetzen von Gebärdensprache

Automatisches Übersetzen von Gebärdensprache 5. Aachener Gebärdenworkshop 2004 29.10.2004 Automatisches Übersetzen von Gebärdensprache Jan Bungeroth Human Language Technology and Pattern Recognition Lehrstuhl für Informatik VI D-52056 Aachen, Deutschland

Mehr

Kontinuität, Erosion und Innovation des Italienischen im Migrationskontext

Kontinuität, Erosion und Innovation des Italienischen im Migrationskontext Sprache - Identität - Kultur 10 Kontinuität, Erosion und Innovation des Italienischen im Migrationskontext Das Beispiel Montreal (Kanada) Bearbeitet von Kristin Reinke 1. Auflage 2011. Buch. 328 S. Hardcover

Mehr

ordnet.dk und elexiko ein Vergleich Jörg Asmussen Gesellschaft für dänische Sprache und Literatur, DSL

ordnet.dk und elexiko ein Vergleich Jörg Asmussen Gesellschaft für dänische Sprache und Literatur, DSL ordnet.dk und elexiko ein Vergleich Jörg Asmussen Gesellschaft für dänische Sprache und Literatur, DSL Inhaltsübersicht 1. Wörterbücher und Korpora der DSL 2. Das Projekt ordnet.dk 3. Vergleich elexiko

Mehr

Jan Strunk 15.04.2008

Jan Strunk 15.04.2008 Grundkurs Syntax Einführung Jan Strunk 15.04.2008 Formalia Für den Kurs besteht Anwesenheitspflicht Die Abwesenheit ist schriftlich (per Email) zu begründen. Als entschuldigte Abwesenheiten gelten nur

Mehr

Arten und Typen von Grammatiken

Arten und Typen von Grammatiken Arten und Typen von Grammatiken 19.04.2010 Helbig (2001) 2 Was ist Grammatik? 3 Begriff Grammatik bezieht sich auf drei Sachverhalte a) die der Sprache selbst inne wohnende Regeln, unabhängig von deren

Mehr

Was Kinder lesen: Kognitive Konsequenzen und pädagogische Herausforderungen. Sascha Schroeder Sascha Schroeder

Was Kinder lesen: Kognitive Konsequenzen und pädagogische Herausforderungen. Sascha Schroeder Sascha Schroeder Was Kinder lesen: Kognitive Konsequenzen und pädagogische Herausforderungen Sascha Schroeder Sascha Schroeder Max-Planck-Institut für Bildungsforschung MPRG REaD (Reading Education and Development) 6.2.2014

Mehr

Grammatik im engen Sinn: Grammatik = Syntax Von syntaxis = Zusammenordnung.

Grammatik im engen Sinn: Grammatik = Syntax Von syntaxis = Zusammenordnung. Grammatik im engen Sinn: Grammatik = Syntax Von syntaxis = Zusammenordnung. Elemente: - Morphosyntax: Flexionen mit syntaktischer Funktion (Kasus, Tempus, Genus Verbi etc.) - Distribution ( Was kann womit

Mehr

Sprachdaten sammeln und auswerten

Sprachdaten sammeln und auswerten 130 Sprachdaten sammeln und auswerten Die Korpuslinguistik am Institut für Deutsche Sprache (IDS) Von Peter Anliker 1 Im Jahr 1964, also vor fünfzig Jahren, wurde in Mannheim das Institut für Deutsche

Mehr

Korpus Beratungsgespräche (BG--)

Korpus Beratungsgespräche (BG--) 1 Institut für Deutsche Sprache, Mannheim Abteilung Pragmatik: Archiv für Gesprochenes Deutsch URL: http://agd.ids-mannheim.de 2014 IDS, Mannheim Korpus Beratungsgespräche (BG--) Korpus_Projekt_Kurzbeschreibung

Mehr

Wie mobil sind E Books?

Wie mobil sind E Books? New Services in Library and Information Science, 25.10.2010 Wie mobil sind E Books? gabi.schneider@htwchur.ch Inhalt Gegenstand: Das E Book als Datei auf verschiedenen Geräten Nicht wissenschaftlicher

Mehr

Thema: Erklär mir die Liebe (Sehnsucht und Liebe)

Thema: Erklär mir die Liebe (Sehnsucht und Liebe) Kunst, Religion, Musik Schwerpunkte: Liebeslyrik, Popsongs Dramenausschnitte Städtisches Gymnasium Eschweiler Schulcurriculum des Faches Deutsch Thema: Erklär mir die Liebe (Sehnsucht und Liebe) 1.13:

Mehr

Die Auswirkungen der englischsprachigen Hochschullehre in Deutschland auf das Deutschlernen in China

Die Auswirkungen der englischsprachigen Hochschullehre in Deutschland auf das Deutschlernen in China Duisburger Arbeiten zur Sprach- und Kulturwissenschaft 95 Die Auswirkungen der englischsprachigen Hochschullehre in Deutschland auf das Deutschlernen in China Bearbeitet von Jun He 1. Auflage 2013. Buch.

Mehr

Aussprache und Musik

Aussprache und Musik Perspektiven Deutsch als Fremdsprache 30 Aussprache und Musik Eine empirische Längsschnittstudie zum Wortakzenterwerb Bearbeitet von Kathrin Wild 1. Auflage 2015. Taschenbuch. 380 S. Paperback ISBN 978

Mehr

Hellmut Riediger Recherchieren: Grundsätze und Grundbegriffe. Online-Wörterbücher und -Lexika

Hellmut Riediger Recherchieren: Grundsätze und Grundbegriffe. Online-Wörterbücher und -Lexika Hellmut Riediger Recherchieren: Grundsätze und Grundbegriffe Online-Wörterbücher und -Lexika Zürcher Fachhochschule 1 Das Web als Nachschlagemedium Traditionell Systematisch geordnete Information: im Web

Mehr

Elektronisches Publizieren

Elektronisches Publizieren SS 2013 (Stand 04.04.2013) Wissenschaftlicher Publikationsprozess - Hintergründe Was versteht man unter? Wege zu Argumente für und gegen Herausforderungen / Konsequenzen 2 Wissenschaftlicher Publikationsprozess

Mehr

Bachelor of Arts Anglistik

Bachelor of Arts Anglistik 04-002-1101 Pflicht Einführung in die englischsprachige Literatur und Kultur 1. Semester Professuren für Britische Literaturwissenschaft und Kulturstudien Großbritanniens jedes Wintersemester Vorlesung

Mehr

Staatsexamen Lehramt an Grundschulen Englisch

Staatsexamen Lehramt an Grundschulen Englisch 04-ANG-1101 (englisch) Lehrformen Einführung in die englischsprachige Literatur und Kultur Introduction to British Literature and Cultural Studies 1. Semester Professuren für Britische Literaturwissenschaft

Mehr

1 Part-of-Speech Tagging

1 Part-of-Speech Tagging 2. Übung zur Vorlesung NLP Analyse des Wissensrohstoes Text im Sommersemester 2008 Dr. Andreas Hotho, Dipl.-Inform. Dominik Benz, Wi.-Inf. Beate Krause 28. Mai 2008 1 Part-of-Speech Tagging 1.1 Grundlagen

Mehr

Konkordanzen aus dem Bonner Frühneuhochdeutschkorpus exportieren

Konkordanzen aus dem Bonner Frühneuhochdeutschkorpus exportieren Konkordanzen aus dem Bonner Frühneuhochdeutschkorpus exportieren Das Bonner Frühneuhochdeutschkorpus (FnhdC) ist derzeit eine der besten Ressourcen, die wir zu dieser Periode der deutschen Sprachgeschichte

Mehr

Zeitung als Zeichen. Identität und Mediennutzung nationaler Minderheiten in Deutschland. Bearbeitet von Swea Starke

Zeitung als Zeichen. Identität und Mediennutzung nationaler Minderheiten in Deutschland. Bearbeitet von Swea Starke Zeitung als Zeichen Identität und Mediennutzung nationaler Minderheiten in Deutschland Bearbeitet von Swea Starke 1. Auflage 2014. Taschenbuch. XIII, 286 S. Paperback ISBN 978 3 631 65738 6 Format (B x

Mehr

Pädagogische Hochschule Heidelberg - FB II - Fach Englisch Fachinterne Meldung zur mündlichen Prüfung im Frühjahr/Herbst 20...

Pädagogische Hochschule Heidelberg - FB II - Fach Englisch Fachinterne Meldung zur mündlichen Prüfung im Frühjahr/Herbst 20... Pädagogische Hochschule Heidelberg - FB II - Fach Englisch Fachinterne Meldung zur mündlichen Prüfung im Frühjahr/Herbst 20... Name: (Zutreffendes bitte unterstreichen) E-Mail: Telefon: Studienbeginn Englisch:

Mehr

2. Einfach drauf los schreiben

2. Einfach drauf los schreiben Die 3 Gebote 1. Schreiben 2. Einfach drauf los schreiben 3. Strukturieren 1 1. Schreiben 1.1 Sofort mit dem Schreiben beginnen! Entwicklung der Hypothesen Lesen & Exzerpieren Stimulierstellung, Versuchsdurchführung

Mehr

linguistischer und literaturwissenschaftlicher Perspektive

linguistischer und literaturwissenschaftlicher Perspektive Sprachliche Eigenarten literarischer Kurzformen in linguistischer und literaturwissenschaftlicher Perspektive Stefan Engelberg & Christine Hummel Institut für Deutsche Sprache, Mannheim Universität Freiburg

Mehr

Wie Bilder «entstehen» Eigenschaften und Entwicklung [Band 1] Dieter Maurer Claudia Riboni

Wie Bilder «entstehen» Eigenschaften und Entwicklung [Band 1] Dieter Maurer Claudia Riboni Wie Bilder «entstehen» Eigenschaften und Entwicklung [Band 1] Dieter Maurer Claudia Riboni XL Wie erscheinen, «entstehen» Bilder? Welche Eigenschaften, Strukturen und Entwicklungen lassen sich in frühen

Mehr

Part-Of-Speech-Tagging mit Viterbi Algorithmus

Part-Of-Speech-Tagging mit Viterbi Algorithmus Part-Of-Speech-Tagging mit Viterbi Algorithmus HS Endliche Automaten Inna Nickel, Julia Konstantinova 19.07.2010 1 / 21 Gliederung 1 Motivation 2 Theoretische Grundlagen Hidden Markov Model Viterbi Algorithmus

Mehr

Einführung in die portugiesische Sprachwissenschaft

Einführung in die portugiesische Sprachwissenschaft Annette Endruschat Jürgen Schmidt-Radefeldt Einführung in die portugiesische Sprachwissenschaft Gunter Narr Verlag Tübingen Inhalt Vorwort 9 Abkürzungen und Abbildungsverzeichnis 12 1 Weltsprache Portugiesisch

Mehr

Scherzkommunikation unter Jugendlichen

Scherzkommunikation unter Jugendlichen Sprache - Kommunikation - Kultur 15 Scherzkommunikation unter Jugendlichen Lästern, Frotzeln und Blödeln in gemischtgeschlechtlichen Kleingruppen Bearbeitet von Diana Walther 1. Auflage 2014. Buch. 453

Mehr

GYMNASIUM HORN-BAD MEINBERG

GYMNASIUM HORN-BAD MEINBERG Gymnasium Horn-Bad Meinberg Kernlehrplan Deutsch Klasse und 10 (G8) Schuljahr 08/0 GYMNASIUM HORN-BAD MEINBERG Jgst. Unterrichtsinhalt/- gegenstand Generationenkonflikte Kurzgeschichte Lebensraum Stadt

Mehr

Lineare (Un-)Gleichungen und lineare Optimierung

Lineare (Un-)Gleichungen und lineare Optimierung Lineare (Un-)Gleichungen und lineare Optimierung Franz Pauer Institut für Mathematik Universität Innsbruck Lehrer/innen/fortbildungstag Wien 2010 9. April 2010 Eine Maximumsaufgabe Eine Firma stellt aus

Mehr

Epistemische Modalität

Epistemische Modalität Marion Krause Epistemische Modalität Zur Interaktion lexikalischer und prosodischer Marker. Dargestellt am Beispiel des Russischen und des Bosnisch-Kroatisch-Serbischen 2007 Harrassowitz Verlag Wiesbaden

Mehr

Tutorial: Automatische Textannotation mit WebLicht

Tutorial: Automatische Textannotation mit WebLicht Tutorial: Automatische Textannotation mit WebLicht Inhalt 1. Was ist WebLicht?... 1 2. WebLicht starten... 1 3. Text importieren... 2 4. Verarbeitungsketten... 2 5. Wortarten- Tagging und Lemmatisierung...

Mehr

Nutzungshinweise zu den Lemmalisten für das Teilkorpus DEU_L1_EV. September 2015 David Stoppel, Franziska Wallner

Nutzungshinweise zu den Lemmalisten für das Teilkorpus DEU_L1_EV. September 2015 David Stoppel, Franziska Wallner Nutzungshinweise zu den Lemmalisten für das Teilkorpus DEU_L1_EV September 2015 David Stoppel, Franziska Wallner Einleitung Die Lemmalisten liefern Häufigkeitsangaben für Wörter der deutschen gesprochenen

Mehr

Proseminar Linguistische Annotation

Proseminar Linguistische Annotation Proseminar Linguistische Annotation Ines Rehbein und Josef Ruppenhofer SS 2010 Ines Rehbein und Josef Ruppenhofer (SS10) Linguistische Annotation April 2010 1 / 51 Überblick über verschiedene Arten linguistischer

Mehr

Relationen zwischen Nomen und ihren Assoziationen. Michael Roth

Relationen zwischen Nomen und ihren Assoziationen. Michael Roth Relationen zwischen Nomen und ihren Assoziationen Michael Roth 2 Assoziationen sind psychologisch interessant. Wie erfolgt der Zugriff auf sie? Welche Bedeutung haben sie? erfüllen einen linguistischen

Mehr

"Deutsch heute" Sprachaufnahmen im Projekt "Variation des gesprochenen Deutsch"

Deutsch heute Sprachaufnahmen im Projekt Variation des gesprochenen Deutsch "Deutsch heute" Sprachaufnahmen im Projekt "Variation des gesprochenen Deutsch" Warum führt das IDS diese Untersuchung durch? Wie wird heute im deutschsprachigen Raum Standardsprache gesprochen? Ist die

Mehr

Empathie und historisches Lernen

Empathie und historisches Lernen Europäische Hochschulschriften / European University Studies / Publications Universitaires Européennes 1089 Empathie und historisches Lernen Eine Untersuchung zur theoretischen Begründung und Ausformung

Mehr

Psychosoziale Beratung im Kontext von pränataler Diagnostik

Psychosoziale Beratung im Kontext von pränataler Diagnostik Geisteswissenschaft Sandra Mette Psychosoziale Beratung im Kontext von pränataler Diagnostik Rolle und Aufgabe der Sozialen Arbeit Bachelorarbeit Bibliografische Information der Deutschen Nationalbibliothek:

Mehr

WebApps - Einführung (Daten)

WebApps - Einführung (Daten) WebApps - Einführung (Daten) Die Rätoromanische Chrestomathie Claes Neuefeind & Mihail Atanassov Sprachliche Informationsverarbeitung Universität zu Köln 27. Oktober 2015 Das Ra toromanische DRC/ARC/PG

Mehr

Gliederung. Das TIGER-Korpus: Annotation und Exploration. TIGER-Korpus. 1. TIGER-Korpus. entstanden im Projekt TIGER (1999 heute) beteiligte Institute

Gliederung. Das TIGER-Korpus: Annotation und Exploration. TIGER-Korpus. 1. TIGER-Korpus. entstanden im Projekt TIGER (1999 heute) beteiligte Institute Das TIGER-Korpus: Annotation und Exploration Stefanie Dipper Forschungskolloquium Korpuslinguistik, 11.11.03 Gliederung 1. TIGER-Korpus 2. Annotation 3. Visualisierung 4. Suche, Retrieval 5. Demo 6. Repräsentation

Mehr

Die Recherche nach wissenschaftlicher Literatur. Max Winter

Die Recherche nach wissenschaftlicher Literatur. Max Winter Die Recherche nach wissenschaftlicher Literatur Max Winter I. Wie finde ich geeignete Literatur? II. Wie beschaffe ich mir ausgewählte Texte? III. Beispielfall IV. Wie verwalte ich meine Literatur? I.

Mehr

Einführung in die Computerlinguistik

Einführung in die Computerlinguistik Einführung in die Computerlinguistik Statistische Modellierung I WS 2010/2011 Manfred Pinkal Wortartinformation Wortartinformation ist eine wichtige Voraussetzung für die syntaktische Analyse. Woher kommt

Mehr

Schreiben in Unterrichtswerken

Schreiben in Unterrichtswerken Europäische Hochschulschriften 1014 Schreiben in Unterrichtswerken Eine qualitative Studie über die Modellierung der Textsorte Bericht in ausgewählten Unterrichtswerken sowie den Einsatz im Unterricht

Mehr

Untersuchungsarten im quantitativen Paradigma

Untersuchungsarten im quantitativen Paradigma Untersuchungsarten im quantitativen Paradigma Erkundungsstudien / Explorationsstudien, z.b.: Erfassung der Geschlechterrollenvorstellungen von Jugendlichen Populationsbeschreibende Untersuchungen, z.b.:

Mehr

Die Aufarbeitung und Analyse der Daten in Lernerkorpora

Die Aufarbeitung und Analyse der Daten in Lernerkorpora Universität Augsburg Lehrstuhl für Romanische Sprachwissenschaft Unter besonderer Berücksichtigung des Französischen Sommersemester 2012 Proseminar: Synchronische Sprachwissenschaft: Korpuslinguistik Dozent:

Mehr

KAPITEL I EINLEITUNG

KAPITEL I EINLEITUNG KAPITEL I EINLEITUNG A. Der Hintergrund Die Sprache ist nicht nur eine Wortordnung, die die Sätze bildet. Sie ist ein Kommunikationsmittel, um Gedanken und Gefühle zu äußern. Nach der Definition von Bloch

Mehr

Übersicht über die Tests

Übersicht über die Tests Übersicht über die Tests Lexikontest Einige Hersteller machen Angaben zum Lexikonumfang ihrer Systeme. Diese Angaben sind jedoch nicht zwischen den Systemen vergleichbar, da es keine standardisierte Zählweise

Mehr

Bewerbung um die Professur für

Bewerbung um die Professur für Bewerbung um die Professur für Um die Vergleichbarkeit der einzelnen BewerberInnen zu ermöglichen, ist es wichtig, dass Ihre Unterlagen optimal für die Kommission sowie für die GutacherInnen aufbereitet

Mehr

Einsatz und Rückzug an Schulen Engagement und Disengagement bei Lehrern, Schulleitern und Schülern

Einsatz und Rückzug an Schulen Engagement und Disengagement bei Lehrern, Schulleitern und Schülern Rezension erschienen in der Zeitschrift des Bundesverbandes der Lehrerinnen und Lehrer an beruflichen Schulen: Die berufsbildende Schule, Juni 2011, S. 209-210. von StD Ernst Rutzinger, Schulleiter Einsatz

Mehr

Richtlinien und Hinweise für. Seminararbeiten

Richtlinien und Hinweise für. Seminararbeiten Richtlinien und Hinweise für Seminararbeiten Lehrstuhl für VWL (Wirtschaftspolitik, insbes. Industrieökonomik) Ökonomie der Informationsgesellschaft Prof. Dr. Peter Welzel Gliederung Die folgenden Richtlinien

Mehr

ANLAGEN- INVENTUR [ Version 2.0 ]

ANLAGEN- INVENTUR [ Version 2.0 ] ANLAGEN- INVENTUR [ Version 2.0 ] OPAL Associates Holding AG Your AutoID System Integrator PROFESSIONELLE ANLAGENINVENTUR LÖSUNG Die Anlageninventur mit Integration in SAP ist eine einfache und standardisierte

Mehr

Das Geheimnis der Kunst. Elektronische (Voll)texte für die Kunstgeschichte

Das Geheimnis der Kunst. Elektronische (Voll)texte für die Kunstgeschichte Das Geheimnis der Kunst Elektronische (Voll)texte für die Kunstgeschichte Programm Ihre Erfahrungen! Einführung verschiedene Zugänge über die Stabi: StaBiKat, DBIS, Fachbibliographien, elektronische Zeitschriftenarchive

Mehr

Wortarten und Korpus

Wortarten und Korpus Linguistik Computerlinguistik Petra Steiner Wortarten und Korpus Automatische Wortartenklassifikation durch distributionelle und quantitative Verfahren. Shaker Verlag Aachen 2004 Bibliografische Information

Mehr

Ihre Regionale Lebenshilfezeitung. Stand: Juli Herausgeber Lebenshilfe NRW, Landesverband, Orts- und Kreisvereinigungen

Ihre Regionale Lebenshilfezeitung. Stand: Juli Herausgeber Lebenshilfe NRW, Landesverband, Orts- und Kreisvereinigungen Ihre Regionale Lebenshilfezeitung Stand: Juli 2009 Herausgeber Lebenshilfe NRW, Landesverband, Orts- und Kreisvereinigungen 1 Lebenshilfe journal Wo stehen wir? - Oktober 2007 gestartet Auflage: 190.000

Mehr

Preis Auszeichnung. Baden-Württemberg. für Berichterstattung über soziale Themen Euro dotiert. Journalisten

Preis Auszeichnung. Baden-Württemberg. für Berichterstattung über soziale Themen Euro dotiert. Journalisten Baden-Württemberg Journalisten Preis 2016 Auszeichnung für Berichterstattung über soziale Themen Auszeichnung für Journalisten insgesamt mit 13.500 Euro dotiert Sonderpreis Flüchtlingsarbeit journalistenpreisdiakonie.de

Mehr

A Verlag im Internet

A Verlag im Internet Ökonomische, ökologische und soziale Funktionen von Agrotourismus für Schulkinder in Deutschland und in Polen am Beispiel der ausgewählten Regionen im Land Brandenburg/Berlin und in der Region Wielkopolska/Lubuskie

Mehr