Korpuslinguistik Grundlagen Korpora. Lyrik & Linguistik. Korpuslinguistik Grundlagen Korpora. Korpuslinguistik Grundlagen Korpora. Was ist ein Korpus?
|
|
- Daniela Falk
- vor 7 Jahren
- Abrufe
Transkript
1 Lyrik & Linguistik Was ist ein Korpus? Stefan Engelberg & Christine Hummel Institut für Deutsche Sprache, Mannheim Universität Freiburg Hauptseminar, Uni Mannheim, FS 2008 Lemnitzer, Lothar und Heike Zinsmeister. Korpuslinguistik. Eine Einführung. Tübingen: Narr, S. 7. Stefan Engelberg & Christine Hummel, Lyrik & Linguistik, FS 2008, Uni Mannheim [Folie 1] Stefan Engelberg & Christine Hummel, Lyrik & Linguistik, FS 2008, Uni Mannheim [Folie 2] Wozu? Was ist Korpuslinguistik? Lemnitzer, Lothar und Heike Zinsmeister. Korpuslinguistik. Eine Einführung. Tübingen: Narr, S. 9. werden bei verschiedenen sprachwissenschaftlichen Aufgaben verwendet: Theoretische Linguistik: von der Überprüfung von Hypothesen bis zur automatischen Ermittlung grammatischer Regularitäten. Lexikographie: Ermittlung von Worthäufigkeiten, Wendungen und typischen Verwendungskontexten, Sammlung authentischer Beispiele. Grammatikographie: Belege für grammatische Strukturen, deren Häufigkeit und Verteilung. Fremdsprachenunterricht: Analyse von Lernerfehlern, Ermittlung gebrauchshäufiger Phänomene, authentische Belege für Sprachverwendung. Übersetzung: Überprüfung von Übersetzungsstrategien in Parallelkorpora. Computerlinguistik: automatische Übersetzung, Spracherkennung, etc. Scherer, Carmen: Korpuslinguistik. Heidelberg: Winter, Stefan Engelberg & Christine Hummel, Lyrik & Linguistik, FS 2008, Uni Mannheim [Folie 3] Stefan Engelberg & Christine Hummel, Lyrik & Linguistik, FS 2008, Uni Mannheim [Folie 4] 1
2 Typen von lassen sich nach verschiedenen Kriterien typologisieren: Scherer, Carmen: Korpuslinguistik. Heidelberg: Winter, Sprachmedium: geschriebener / gesprochener Sprache Geltungsbereich: Referenzkorpora (für eine Sprache in ihrer Gesamtheit) / Spezialkorpora Sprecherkompetenz: Lernerkorpora / zum Erstspracherwerb, Korpusaufbereitung: (grammatisch) annotierte vs. nicht-annotierte Sprachstadium: historische / der Gegenwartssprache Sprachenanzahl: einsprachige / Parallelkorpora, Vergleichskorpora Einige verfügbare des Deutschen Deutsches Referenzkorpus (Institut für Deutsche Sprache): über Mio. Textwörter; Zeitungen, Belletristik, Sachtexte,, ab 1950; online verfügbar. Deutsches Korpus aus der Leipzig Corpus Collection: über 15 Mio. Textwörter; Sätze aus Zeitungen; kann downgeloadet werden. DWDS-Kernkorpus (Berlin-Brandenburgische Akademie): 100 Mio. Textwörter; Zeitungen, Belletristik, Fachtexte, gesprochene Sprache; Texte ab 1900; Grundlage für das DWDS-Wörterbuch. Historisches Korpus am IDS: 3 Mio. Textwörter (wachsend), Zeitungen, Bellestristik, Sachtexte,, Jh. TIGER-Korpus (Potsdam, Stuttgart, Saarbrücken); 0,9 Mio. Textwörter; Sätze mit grammatischen Strukturbeschreibungen. FALKO (Humboldt-Univ. Berlin): im Aufbau; fehlerannotiertes Lernerkorpus DaF. Vgl. die Übersichten in: Lemnitzer, Lothar, and Heike Zinsmeister. Korpuslinguistik. Eine Einführung. Tübingen: Narr, / Scherer, Carmen: Korpuslinguistik. Heidelberg: Winter, Stefan Engelberg & Christine Hummel, Lyrik & Linguistik, FS 2008, Uni Mannheim [Folie 5] Stefan Engelberg & Christine Hummel, Lyrik & Linguistik, FS 2008, Uni Mannheim [Folie 6] FRAGEN Welche Arten von Abweichungen in lyrischen Texten kommen vor, welche nicht? Welche Funktionen sind mit solchen Abweichungen verbunden? Welche linguistischen Konzepte sind hilfreich zur Beschreibung solcher Abweichungen? Wie können wir den typischen Sprachgebrauch in lyrischen Texten (oder in lyrischen Texten eines bestimmten Autors) ermitteln? Wie können wir den typischen Sprachgebrauch in anderen Texten ermitteln? Methoden der Korpusanalyse Erstellung von Konkordanzen Erzeugung von Wortlisten mit Frequenzangaben Ermittlung von hochfrequenten Wortgruppen (Clusteranalyse) Berechnung von Kookkurrenzen Ermittlung von Schlüsselwörtern Berechnung diachroner Verläufe des Wortgebrauchs Im Folgenden werden die wichtigsten am Beispiel des Programms AntConc dargestellt. Stefan Engelberg & Christine Hummel, Lyrik & Linguistik, FS 2008, Uni Mannheim [Folie 7] Stefan Engelberg & Christine Hummel, Lyrik & Linguistik, FS 2008, Uni Mannheim [Folie 8] 2
3 Grundlegende Funktionalitäten in vielen Korpusrecherchesystemen (III) Ermittlung von Wortgruppen (V) Berechnung von Kookkurrenzen AntConc Entwickler: Laurence Anthony, Faculty of Science and Engineering,Waseda University, Japan. Version: 3.2.1w (Windows), Release March 10th, Recherche: Offline. Software: wird lokal installiert. Zugang: freier Download des Programms. : eigene Textsammlungen (txt-dateien). Sprachen: alle (Unicode); getestet: Deutsch, Englisch, Rumänisch, Mongolisch. URL: Stefan Engelberg & Christine Hummel, Lyrik & Linguistik, FS 2008, Uni Mannheim [Folie 9] (I) Erstellung von Konkordanzen (II) Berechnung von Häufigkeiten (IV) Ermittlung von Schlüsselwörtern Stefan Engelberg & Christine Hummel, Lyrik & Linguistik, FS 2008, Uni Mannheim [Folie 10] Konkordanzen Suche: Konkordanzen zu hilft in einem Ausschnitt der Leipzig Corpus Collection (Sätze aus Zeitungen). Konkordanz Eine K. ist eine Sammlung von Kotexten eines bestimmten Schlüsselworts. Kotexte einer bestimmten Länge (von Buchstaben, Wörtern oder Sätzen) um ein Schlüsselwort herum werden aus einem Korpus extrahiert und meist mit dem Schlüsselwort im Zentrum angeordnet Lemnitzer, Lothar und Heike Zinsmeister. Korpuslinguistik. Eine Einführung. Tübingen: Narr, S. 196f. KWIC Key word in context : Einzelner Kotext zu einem Schlüsselwort; in Programmen zur Konkordanzerzeugung ist die Kotextgröße meist wählbar. Suchausdruck (hier: hilft) Sortierung (hier: alphabetisch nach Wort direkt rechts vom Suchterm) Kotext (hier: 200 Zeichen) Treffermenge (hier: 32) Stefan Engelberg & Christine Hummel, Lyrik & Linguistik, FS 2008, Uni Mannheim [Folie 11] Stefan Engelberg & Christine Hummel, Lyrik & Linguistik, FS 2008, Uni Mannheim [Folie 12] 3
4 Index als traditionelles Mittel zur Konkordanzerstellung Textwort Gedichtband Gedichtnummer Zeilennummer Ausgabe der Ergebnisse als Textdatei. Nielsen, Karsten Hvidfelt & Harald Pors (1981): Index Zur Lyrik Paul Celans. München: Fink. Stefan Engelberg & Christine Hummel, Lyrik & Linguistik, FS 2008, Uni Mannheim [Folie 13] Stefan Engelberg & Christine Hummel, Lyrik & Linguistik, FS 2008, Uni Mannheim [Folie 14] Frequenzen Lexikalische Häufigkeitsberechnungen In lexikalischen Häufigkeitsberechnungen wird die Anzahl bestimmter Wortformen, Lexeme oder auch Wortgruppen in einem Korpus berechnet. Type-Token-Ratio Mit Type-Token-Ratio wird der Quotient aus der Anzahl aller sprachlichen Einheiten eines bestimmten Typs und der Anzahl aller Vorkommen dieser Einheiten in einem gegebenen Korpus bezeichnet. Gewöhnlich wird die Type-Token-Ratio für Wortlexeme oder Wortformen berechnet. Type-Token-Ratio (Lexeme): Anzahl aller verschiedenen Lexeme / Anzahl aller Realisierungen der verschiedenen Wortformen dieser Lexeme (Anzahl aller Textwörter). Type-Token-Ratio (Wortformen): Anzahl aller verschiedenen Wortformen / Anzahl aller Realisierungen dieser Wortformen. Stefan Engelberg & Christine Hummel, Lyrik & Linguistik, FS 2008, Uni Mannheim [Folie 15] Start (kein Suchausdruck) Type-Token-Ratio (hier: : ,115) Wortliste (mit Rang und Frequenzangabe) Suche: Frequenzliste aller Wortformen und Type-Token-Ratio in einem Ausschnitt der Leipzig Corpus Collection (Sätze aus Zeitungen). Sortierung (hier: nach Frequenz) Stefan Engelberg & Christine Hummel, Lyrik & Linguistik, FS 2008, Uni Mannheim [Folie 16] 4
5 Wortgruppenanalyse Suche: Alle Cluster aus 3 Wörtern, die Tag enthalten, in einem Ausschnitt der Leipzig Corpus Collection. Cluster Als Cluster sollen hier Ketten von sprachlichen Einheiten bezeichnet werden. In er sprach vor einem großen Publikum ist spr ein Konsonantencluster aus 3 Konsonanten und sprach vor einem ein Wortcluster aus 3 Wörtern. Manche Korpusrechercheprogramme erlauben zu einem Suchwort die Ermittlung aller Cluster, in denen es vorkommt. Trigramm-Liste mit Rang und Frequenzangabe n-gramm Ein n-gramm ist eine Folge von n linguistischen Elementen gleichen Typs. (Kunze & Lemnitzer 2007: 190) Ein 5-Gramm von Wörtern ist eine Folge von 5 Wörtern. Ein n- Gramm ist also das gleiche wie ein n-cluster. Von n-grammen spricht man insbesondere, wenn es darum geht, alle n-wortcluster aus einem Korpus zu extrahieren. Suchtermposition (hier: beliebig) Suchterm (hier: Tag) Sortierung (hier: nach Häufigkeit des Clusters) Clustergröße (hier: Cluster aus 3 Wörtern) Kunze, Claudia und Lothar Lemnitzer. Computerlexikographie. Eine Einführung. Tübingen: Narr [E-Book], S Stefan Engelberg & Christine Hummel, Lyrik & Linguistik, FS 2008, Uni Mannheim [Folie 17] Frequenzbedingung (hier: mindestens 1 Token; = alle) Stefan Engelberg & Christine Hummel, Lyrik & Linguistik, FS 2008, Uni Mannheim [Folie 18] Suche: Trigramme mit mindestens 3 Token in einem Ausschnitt der Leipzig Corpus Collection. Suche: Schlüsselwörter (zum Beispiel sprachwissenschaftliche Termini in einem Korpus linguistischer Fachtexte). Trigramm-Liste mit Rang und Frequenzangabe Start (kein Suchterm; Einstellung: N-Gramm) Bestimmung von n (hier: n-gramme für n = 3) Laden eines Vergleichskorpus (hier eine Ausschnitt aus dem Ddeutschen LCC-Korpus) Sortierung (hier: nach Frequenzbedingung (hier: Häufigkeit des Trigramms) mindestens 3 Token) Stefan Engelberg & Christine Hummel, Lyrik & Linguistik, FS 2008, Uni Mannheim [Folie 19] Stefan Engelberg & Christine Hummel, Lyrik & Linguistik, FS 2008, Uni Mannheim [Folie 20] 5
6 Kookkurrenzanalyse Fachsprachliches Korpus Schlüsselwort- Funktion Ausschnitt aus der Schlüsselwortliste Kookkurrenz Als Kookkurrenz wird das gemeinsame Vorkommen zweier oder mehrerer Wörter in einem Kontext von fest definierter Größe bezeichnet. Dabei sind Kookkurrenzen dort linguistisch interessant, wo das gemeinsame Auftreten der Wörter häufiger zu beobachten ist, als bei einer Zufallsverteilung aller Wörter zu erwarten wäre. Kunze, Claudia und Lothar Lemnitzer. Computerlexikographie. Eine Einführung. Tübingen: Narr [E-Book], S. 391f. Kollokation Eine K. ist ein aus meist zwei sprachlichen Zeichen bestehender Ausdruck, in dem die beiden sprachlichen Zeichen in arbiträrer und konventionalisierter Form verbunden sind (z. B. blonde Haare, ein heikles Thema). Innerhalb der Kollokation kann man die Basis als semantisch autonomes Element (Haare, Thema) und den Kollokator (blond, heikel) als semantisch abhängiges Element unterscheiden. Kollokationen sind in gewisser Weise linguistisch interpretierte Kookkurrenzen. Engelberg, Stefan und Lothar Lemnitzer. Einführung in die Lexikographie und Wörterbuchbenutzung. Tübingen: Stauffenburg, S. 391f. Stefan Engelberg & Christine Hummel, Lyrik & Linguistik, FS 2008, Uni Mannheim [Folie 21] Stefan Engelberg & Christine Hummel, Lyrik & Linguistik, FS 2008, Uni Mannheim [Folie 22] Suche: Kookkurrenzen zu der Wortform knapp in einem Ausschnitt der Leipzig Corpus Coll. Ausgabe der Ergebnisse in eine txt-datei Suchterm (hier: knapp) Liste der Kookkurrenzpartner mit Rang und Frequenz- und Signifikanzangabe Bestimmung des Suchkontexts (hier: bis 2 Wörter nach dem Suchterm) Sortierung (hier: nach Signifikanz Frequenzbedingung (hier: der Kookkurrenz) mind. 3 Collocate-Token) Stefan Engelberg & Christine Hummel, Lyrik & Linguistik, FS 2008, Uni Mannheim [Folie 23] Beobachtungen Zahlausdrücke (Million, Milliarde, Milliarde, hundert) zeigen ein stärkeres Kookkurrenzverhalten als Zeitausdrücke (Monaten, Wochen, Jahren), zumindest auf Wortformenbasis. Die Verbindung von knapp und behauptet ist als Kollokation einzustufen; knapp hat hier nicht die Bedeutung etwas weniger als, sondern so gerade / mit Mühe und kombiniert in dieser Bedeutung nur mit ausgewählten Verben. Stefan Engelberg & Christine Hummel, Lyrik & Linguistik, FS 2008, Uni Mannheim [Folie 24] 6
7 Resumee AntConc Konkordanz zu behauptet, sortiert nach dem unmittelbaren Vorgängerwort. zu empfehlen bei kleineren (bis 20 Mio. Textwörter) gut für sortierte Konkordanzen, Wortlistenerstellung, Wortgruppenanalyse und Schlüsselwortermittlung weniger nützlich für Kookkurrenzanalyse (zu langsam; man braucht größere ) Stefan Engelberg & Christine Hummel, Lyrik & Linguistik, FS 2008, Uni Mannheim [Folie 25] Stefan Engelberg & Christine Hummel, Lyrik & Linguistik, FS 2008, Uni Mannheim [Folie 26] COSMAS II & CCDB die beste Kookkurrenzanalyse zum Deutschen große mit vielfältigen Abfragemöglichkeiten Kookkurrenzanalyse zu in der CCDB (Funktionswörter in dieser Analyse nicht berücksichtigt) COSMAS II & CCDB Developer: Institut für Deutsche Sprache (CCDB: Cyil Belica). Version: Search: online. Software: installed locally (Client) or as web interface. Access: free download of the client (registration). Corpora: corpora of the IDS. Languages: German. URL: (COSMAS II) (CCDB) Stefan Engelberg & Christine Hummel, Lyrik & Linguistik, FS 2008, Uni Mannheim [Folie 27] Primäre Kookkurrenzpartner zu (hier: Einkommen) Stärke der Verbindung zwischen den beiden Wörtern (hier: 796) Typische syntagmatische Muster, in denen die Verbindungen vorkommen, z. B. vom Einkommen Sekundäre Kookkurrenzpartner zu + Einkommen (hier: steuerpflichtigen, steuerbaren, versteuernden) Stefan Engelberg & Christine Hummel, Lyrik & Linguistik, FS 2008, Uni Mannheim [Folie 28] 7
8 Kookkurrenzanalyse zu in der CCDB Korpusrecherchesystem IV: Corpus Browser (Funktionswörter in dieser Analyse nicht berücksichtigt; nach Verbindungsstärke sortiert) Truppen (aus ) unverrichteter Dinge wieder Korpusrecherchesystem IV: Corpus Browser vom Einkommen wurden Soldaten (aus ) abgezogen wurden zwei Punkte abgezogen eine Show den Zündschlüssel die Haut Stefan Engelberg & Christine Hummel, Lyrik & Linguistik, FS 2008, Uni Mannheim [Folie 29] Stefan Engelberg & Christine Hummel, Lyrik & Linguistik, FS 2008, Uni Mannheim [Folie 30] Korpusrecherchesystem IV: Corpus Browser Korpusrecherchesystem IV: Corpus Browser aus 20 Metern Botschafter (aus ) Kapital (aus ) Gelder (aus ) Stefan Engelberg & Christine Hummel, Lyrik & Linguistik, FS 2008, Uni Mannheim [Folie 31] Stefan Engelberg & Christine Hummel, Lyrik & Linguistik, FS 2008, Uni Mannheim [Folie 32] 8
9 Korpusrecherchesystem IV: Corpus Browser von der Strafraumgrenze FRAGEN Welche Arten von Abweichungen in lyrischen Texten kommen vor, welche nicht? Welche Funktionen sind mit solchen Abweichungen verbunden? Welche linguistischen Konzepte sind hilfreich zur Beschreibung solcher Abweichungen? Wie können wir den typischen Sprachgebrauch in lyrischen Texten (oder in lyrischen Texten eines bestimmten Autors) ermitteln? Wie können wir den typischen Sprachgebrauch in anderen Texten ermitteln? Nehmen Sie an, Sie hätten als Textkorpus sämtliche Gedichte eines Autors. Wozu könnten Sie AntConc in Zusammenhang mit diesem Korpus nutzen? den Rauch lassen Stefan Engelberg & Christine Hummel, Lyrik & Linguistik, FS 2008, Uni Mannheim [Folie 33] Stefan Engelberg & Christine Hummel, Lyrik & Linguistik, FS 2008, Uni Mannheim [Folie 34] Metadaten bei den Berechnungen ignorieren: Global Settings / Tag Settings / Hide tags Metadaten (ausgezeichnet durch tags: < >) Stefan Engelberg & Christine Hummel, Lyrik & Linguistik, FS 2008, Uni Mannheim [Folie 35] Stefan Engelberg & Christine Hummel, Lyrik & Linguistik, FS 2008, Uni Mannheim [Folie 36] 9
10 Beispiel: Schlüsselwortanalyse Celan-Gedichtkorpus Beispiele: Schlüsselwortanalyse Kafka-Erzählungskorpus Stefan Engelberg & Christine Hummel, Lyrik & Linguistik, FS 2008, Uni Mannheim [Folie 37] Stefan Engelberg & Christine Hummel, Lyrik & Linguistik, FS 2008, Uni Mannheim [Folie 38] Der Abend spricht mit lindem Schmeichelwort die Gassen In Schlummer und der Süße alter Wiegenlieder, Die Dämmerung hat breit mit hüllendem Gefieder Ein Riesenvogel sich auf blaue Firste hingelassen. Nun hat das Dunkel von den Fenstern allen Glanz gerissen, Die eben noch beströmt wie veilchenfarbne Spiegel standen, Die Häuser sind im Grau, durch das die ersten Lichter branden Wie Rümpfe großer Schiffe, die im Meer die Nachtsignale hissen. In späten Himmel tauchen Türme zart und ohne Schwere, Die Ufer hütend, die im Schoß der kühlen Schatten schlafen, Nun schwimmt die Nacht auf dunkel starrender Galeere Mit schwarzem Segel lautlos in den lichtgepflügten Hafen. Stadler, Ernst: Dämmerung in der Stadt. In: Ders.: Verstreute Gedichte aus den Jahren 1910 bis Die digitale Bibliothek der deutschen Lyrik. Frankfurt am Main: Zweitausendeins. Zugang zu Korpusressourcen AntConc: Download unter Lyrikkorpora: Die Gedichtkorpora (Trakl, Stadler, Stramm, Gedichte aus der Menschheitsdämmerung) sende ich Ihnen per . Zeitungskorpus: Das deutsche Zeitungskorpus aus der Leipzig Corpus Collection können Sie sich in der Woche vom von meiner Webseite herunterladen: Webseite_Lyrik_Linguistik/Lyrik_Linguistik.html. CCDB: Die Kookkurenzdatenbank des Instituts für Deutsche Sprache ist zu erreichen unter: Bitte eine Überlassungserklärung unterschreiben! Stefan Engelberg & Christine Hummel, Lyrik & Linguistik, FS 2008, Uni Mannheim [Folie 39] Stefan Engelberg & Christine Hummel, Lyrik & Linguistik, FS 2008, Uni Mannheim [Folie 40] 10
Kurze literarische Texte in literaturwissenschaftlicher und linguistischer Perspektive. Lyrik seit den 1990er Jahren
Kurze literarische Texte in literaturwissenschaftlicher und linguistischer Perspektive Lyrik seit den 1990er Jahren Christine Hummel & Stefan Engelberg Institut für Deutsche Sprache, Mannheim Universität
MehrKorpuslinguistik Grundlagen Korpusrecherchemethoden
Methoden der Korpusanalyse Erstellung von Konkordanzen Erzeugung von Wortlisten mit Frequenzangaben Ermittlung von hochfrequenten Wortgruppen (Clusteranalyse) Berechnung von Kookkurrenzen Ermittlung von
MehrKorpuslinguistik Grundlagen Korpora
Was ist ein Korpus? Lemnitzer, Lothar und Heike Zinsmeister. Korpuslinguistik. Eine Einführung. Tübingen: Narr, 2006. S. 7. Stefan Engelberg, Linguistische Methodenlehre, FS 2009, Uni Mannheim [Folie 1]
Mehrlinguistischer und literaturwissenschaftlicher Perspektive
Sprachliche Eigenarten literarischer Kurzformen in linguistischer und literaturwissenschaftlicher Perspektive Stefan Engelberg & Christine Hummel Institut für Deutsche Sprache, Mannheim Universität Freiburg
MehrKorpuslinguistik Grundlagen Korpusrecherchemethoden
Wortgruppenanalyse Korpuslinguistik Grundlagen Cluster Als Cluster sollen hier Ketten von sprachlichen Einheiten bezeichnet werden. In er sprach vor einem großen Publikum ist spr ein Konsonantencluster
MehrEmprirische Lexikologie
Emprirische Lexikologie Stefan Engelberg Hauptseminar, Uni Mannheim, Herbst 2007 http://www.ids-mannheim.de/ll/lehre/engelberg/ Webseite_Empirische_Lexikologie/Empirische_Lexikologie.html engelberg@ids-mannheim.de
MehrKookkurrenzanalyse Einführung
Einführung Kookkurenzanalyse die grundlegende Idee 1) Beobachtung: In einem Korpus tritt Wort X 1000mal auf, Wort Y 100mal, Wort Z 10mal. 2) Wahrscheinlichkeit: Die Kombination XY ist 10mal so wahrscheinlich
MehrDaten Methoden Theorien Hypothesen
Hypothesen Die Wahrheit von wenn-dann-sätzen ergibt sich aus der Wahrheitstabelle für konditionale Verknüpfungen. wenn p, dann q p p nicht p nicht p q nicht q q nicht q WAHR FALSCH WAHR WAHR ϕ ist ein
MehrArgumentstrukturalternanzen Diathesen
Diathesen Diathesen (in einem weiten Sinn) können als regelhafte Operation auf Valenzrahmen verstanden werden, die einen Typ von Valenzrahmen Vr1 in einen Typ von Valenzrahmen Vr2 verändern. (In einem
MehrDaten Methoden Theorien Definitionen & Operationalisierungen
Definitionen Daten Methoden Theorien Definitionen & Operationalisierungen Eine Realdefinition legt fest, wie ein Ausdruck verwendet wird, indem sie die Beobachtungen, das Wissen, die Intuitionen, die wir
MehrKorpusanalyse am IDS Die Kookkurrenzanalyse
Korpusanalyse am IDS Die am IDS Zugang zur des IDS: über die Webschnittstelle von COSMAS II über den Client von COSMAS II über die Kookkurrenzdatenbank Die IDS- ist seit 1995 online zugänglich. Stefan
MehrValenz Syntaktische Valenz
Valenz Syntaktische Valenz Anm. 1: Verbunabhängige Unzulässigkeit von Valenzrahmen a. sie hat verkauft b. sie hat den Porsche verkauft c. sie hat an ihren Freund verkauft d. sie hat den Porsche an ihren
MehrKorpuslinguistik IDS-Korpora und COSMAS II
Korpuslinguistik IDS-Korpora und COSMAS II Heike Zinsmeister Korpuslinguistik 11. 11. 2011 Gliederung 1 Einleitung 2 Korpusbestand am IDS 3 Korpusrecherche mit COSMAS II 4 Referenzen Das Institut für Deutsche
MehrKookkurrenzanalyse Noch einmal: Grundlagen
Noch einmal: Grundlagen Methodologische Basis der Ermittlung sprachlicher Strukturen über kontextbestimmtes Kookkurrenzverhalten: ausreichend große Korpora statistische korpuslinguistische Methoden nachträgliche
MehrDaten Methoden Theorien Definitionen & Operationalisierungen
Operationale Verfahren Daten Methoden Theorien Definitionen & Operationalisierungen Das Überbrückungsproblem Hypothese Explizite Formulierung einer als wahr vermuteten, begründbaren Aussage über das Phänomen
MehrKorpora. Referenten Duyen Tao-Pham Nedyalko Georgiev
Korpora Referenten Duyen Tao-Pham Nedyalko Georgiev Hauptseminar: Angewandte Linguistische Datenverarbeitung (WS 11/12) Dozent: Prof. Dr. Jürgen Rolshoven Sprachliche Informationsverarbeitung Universität
MehrDaten Methoden Theorien Datentypen - Erhebungsverfahren
Was ist der Gegenstand der Sprachwissenschaft? Zum Beispiel: Gegenstand der Sprachwissenschaft sind die kognitiv verankerten Entitäten, Strukturen und Regeln, die die Erzeugung sprachlicher Äußerungen
MehrSprachstatistik: Das Zipf sche Gesetz
Sprachstatistik: Das Zipf sche Gesetz Korpus-Workshop Thema Korpus-Statistik Thomas Wittig Universität Leipzig Institut für Informatik wittig@uni-leipzig.de Principle of Least Effort 2 George K. Zipf:
MehrComputerlinguistische Grundlagen. Jürgen Hermes Sommersemester 17 Sprachliche Informationsverarbeitung Institut für Linguistik Universität zu Köln
Computerlinguistische Grundlagen Jürgen Hermes Sommersemester 17 Sprachliche Informationsverarbeitung Institut für Linguistik Universität zu Köln Computerlinguistik: Schnittstellen Computerlinguistik aus
MehrInhalt und Typen von Korpora. Welche Sprachinhalte können Korpora haben und welche Arten von Korpora gibt es
Inhalt und Typen von Korpora Welche Sprachinhalte können Korpora haben und welche Arten von Korpora gibt es Inhalt von Korpora Korpora können die verschiedensten Texte in den unterschiedlichsten Zusammensetzungen
MehrKorpusanalyse am IDS Die Korpora
Die Korpora DeReKo: Das Deutsche Referenzkorpus Die Korpora am IDS Größe: über 3,4 Milliarden Textwörter (Stand: 2008) Akquise: im Hinblick auf Umfang, Variabilität, Qualität und Aktualität; urheberrechtlich
MehrAufgaben aus Kegli 2 (Korpuslinguistik)
Aufgaben aus Kegli 2 (Korpuslinguistik) Kapitel 1 1. Überprüfen Sie mithilfe einer beliebigen Suchmaschine den Sprachgebrauch im Internet. Finden Sie die Formen wegen dem Regen bzw. wegen des Regens und
MehrKorpus. Was ist ein Korpus?
Was ist ein Korpus? Korpus Endliche Menge von konkreten sprachlichen Äußerungen, die als empirische Grundlage für sprachwiss. Untersuchungen dienen. Stellenwert und Beschaffenheit des Korpus hängen weitgehend
MehrCOSMAS II Corpus Search Management and Analysis System
COSMAS II Corpus Search Management and Analysis System http://www.ids-mannheim.de/cosmas2/ 13. November 2012, Jeanette Isele Seminar: Korpuslinguistik Übersicht Theoretischer Teil Was ist COSMAS II? Die
MehrKoGloss als korpusbasierte Methode zur Ermittlung und Beschreibung von diskurstypischen Konstruktionen
KoGloss als korpusbasierte Methode zur Ermittlung und Beschreibung von diskurstypischen Konstruktionen Eglė Kontutytė Vaiva Žeimantienė Kolloquium Deutsche Sprachwissenschaft 16.05.2012 EU-Projekt KoGloss
MehrStefan Engelberg (IDS Mannheim), Workshop Corpora in Lexical Research, Bucharest, Nov. 2008 [Folie 1] DWDS-Kernkorpus / DWDS corpus analysis
Content 1. Empirical linguistics 2. Text corpora and corpus linguistics 3. Concordances 4. Application I: The German progressive 5. Part-of-speech tagging 6. Fequency analysis 7. Application II: Compounds
MehrKorpuslinguistik. Vorlesungsreihe»Methoden der Linguistik«(WS 2004/05) Universität Zürich, Korpuslinguistik. Jürgen Spitzmüller.
Vorlesungsreihe»Methoden der Linguistik«(WS 2004/05) Universität Zürich, 7.12.2004 1. Teil: Theorie Grundlegende theoretische Fragestellungen: Was sind überhaupt Korpora? Wozu Korpora? Was sollen Korpora
MehrEinleitung. Definitionen von Korpuslinguistik und das Repräsentativitätsmerkmal
Definitionen von Korpuslinguistik und das Repräsentativitätsmerkmal Einleitung 1. Einleitung 2. Definitionen von Korpuslinguistik 2.1 Entstehung 2.1.1 : korpusbasiert vs. korpusgestützt 2.1.2 Generative
MehrDigital Humanities Recherche im DWDS und DTA
Digital Humanities Recherche im DWDS und DTA mit Booleschen Operatoren und Regulären Ausdrücken Jena Language & Information Engineering (JULIE) Lab Friedrich-Schiller-Universität Jena, Germany http://www.julielab.de
MehrSyntaktische Tendenzen der Gegenwartssprache
Syntaktische Tendenzen der Gegenwartssprache Anforderungen: Regelmäßige Teilnahme: max. 2 Fehlzeiten Vorbereitung auf die Sitzung: Text lesen, Fragen notieren, mitdiskutieren (!) Leitung einer Sitzung
MehrLexikalisch-semantische Analyse von Korpora
Lexikalisch-semantische Analyse von Korpora Lothar Lemnitzer Workshop Internetlinguistik und Korpusanalyse, Hannover, 1. Mai 2015 Inhalt Rahmen meiner Darstellung Korpora in der lexikographischen Arbeit
MehrDialogsysteme. Vortrag zum Thema n-gramm-modelle 2. Teil: Lösungsansätze für Ausfall-N-Gramme. 12. Januar 2006, Susanne O'Shaughnessy
Dialogsysteme Vortrag zum Thema n-gramm-modelle 2. Teil: Lösungsansätze für Ausfall-N-Gramme 12. Januar 2006, Susanne O'Shaughnessy Smoothing - Glättung Problem bei Standard- n-gramm-modellen: - kein Trainingskorpus
MehrEinführung. Stefanie Dipper Stefan Evert Heike Zinsmeister
Einführung Stefanie Dipper Stefan Evert Heike Zinsmeister München, 28.1.2011 Korpus eine Sammlung gesprochener oder geschriebener Äußerungen typischerweise digitalisiert und maschinenlesbar Ebenen eines
MehrSemantische Klassifikation von Kollokationen auf Grundlage des DWDS- Wortprofils
Semantische Klassifikation von Kollokationen auf Grundlage des DWDS- Wortprofils Isabel Fuhrmann, Alexander Geyken, Lothar Lemnitzer Zentrum Sprache Berlin-Brandenburgische Akademie der Wissenschaften
MehrKollaborative Konstruktionsglossare im Fachfremdsprachenlernen Deutsch, Estnisch, Lettisch, Litauisch AntConc Arbeit mit digitalen Textsammlungen
Ko[Gloss] Kollaborative Konstruktionsglossare im Fachfremdsprachenlernen Deutsch, Estnisch, Lettisch, Litauisch AntConc Arbeit mit digitalen Textsammlungen Ko[Gloss] Digitale Analyse: Sprachliche Muster
MehrDas Zusammenspiel interpretativer und automatisierbarer Verfahren bei der Aufbereitung und Auswertung mündlicher Daten
Das Zusammenspiel interpretativer und automatisierbarer Verfahren bei der Aufbereitung und Auswertung mündlicher Daten Ein Fallbeispiel aus der angewandten Wissenschaftssprachforschung Cordula Meißner
MehrSommer 2002 Stefan Langer CIS, Universität München.
Sommer 00 Stefan Langer CIS, Universität München stef@cis.uni-muenchen.de Sommersemester 00 Dozent: Stefan Langer 8. MAI 00: BLATT 1 1. Statistik und Computerlinguistik. Einige Grundbegriffe der deskriptiven
MehrKorpusanalyse am IDS Die Korpora
Die Korpora DeReKo: Das Deutsche Referenzkorpus Die Korpora am IDS Größe: über 3,4 Milliarden Textwörter (Stand: 2008) Akquise: im Hinblick auf Umfang, Variabilität, Qualität und Aktualität; urheberrechtlich
MehrNLP Eigenschaften von Text
NLP Eigenschaften von Text Dr. Andreas Hotho Dominik Benz Beate Krause Sommersemester 2008 Folie: 1 Übersicht Einführung Eigenschaften von Text Words I: Satzgrenzenerkennung, Tokenization, Kollokationen
MehrInternetsuche und Google Page-Rank - Wie wird was durch wen gefunden? Woche 2
Internetsuche und Google Page-Rank - Wie wird was durch wen gefunden? Woche 2 Magnus Knuth & Nadine Steinmetz Hasso Plattner Institute for IT-Systems Engineering University of Potsdam Internetsuche und
MehrKurfzassung Deutsch. Poier Lorenz. MMag. Wilhelm Loibl
Kurfzassung Deutsch Novelty Mining Algorithmus zur Trendsporterkennung Poier Lorenz MMag. Wilhelm Loibl Einleitung Diese Arbeit versucht ein Instrument für die Erkennung von Trends im Tourismus durch die
MehrAnalyse eines Zeitschriftenartikels, Stichwörter, Kollokationen. Zielgruppe: Studenten des 4. Semesters (Bachelor), Studiengang: Übersetzer
Emília Charfaoui, Zuzana Karabinošová Analyse eines Zeitschriftenartikels, Stichwörter, Kollokationen Unterrichtsvorschlag 1 Analyse eines Zeitschriftenartikels Zielgruppe: Studenten des 4. Semesters (Bachelor),
MehrGebrauchsorien-erte Sprachbeschreibung: Korpuslinguis-sche Analysen von (Fast-)Synonymen
Gebrauchsorien-erte Sprachbeschreibung: Korpuslinguis-sche Analysen von (Fast-)Synonymen Heike Zinsmeister Seminar Krea-ves Schreiben Universität Vilnius 25.10.2017 Online: hmps://www.korpuslab.uni-hamburg.de/lehrmaterialien/diverses.html
MehrDWDS-Kernkorpus / DWDS-Korpusanalyse
Korpusrecherchesysteme Das DWDS-Kernkorpus DWDS-Kernkorpus / DWDS-Korpusanalyse Entwickler: Berlin-Brandenburgische Akademie der Wissenschaften. Version: (keine Versionierung). Recherche: online. Software:
MehrEinführung Computerlinguistik. Allgemeines zur Linguistik
Einführung Computerlinguistik Allgemeines zur Linguistik Hinrich Schütze & Robert Zangenfeind Centrum für Informations- und Sprachverarbeitung, LMU München 2013-10-14 Schütze & Zangenfeind: Allgemeines
Mehrordnet.dk Vernetzung zwischen Wörterbuch und Korpus
ordnet.dk Vernetzung zwischen Wörterbuch und Korpus Jörg Asmussen Det Danske Sprog- og Litteraturselskab, DSL Gesellschaft für dänische Sprache und Literatur ordnet.dk Vernetzung 1. Das Projekt ordnet.dk
MehrDigitale Ressourcen und ihr Potential für korpuslinguistisch informierte Diskursanalysen
ZGL 2015; 43(2): 352 357 Linguistik im Internet Eva Gredel* u. Ruth M. Mell* Digitale Ressourcen und ihr Potential für korpuslinguistisch informierte Diskursanalysen DOI 10.1515/zgl-2015-0018 1 Digitale
MehrEinführung in die Phonetik und Phonologie. Allgemeiner Überblick
Einführung in die Phonetik und Phonologie Allgemeiner Überblick Phonetik und Phonologie Die beiden Bezeichnungen Phonetik und Phonologie sind aus dem griechischen Wort ϕωνþ (phōnē) abgeleitet, welches
MehrArgumentstrukturalternanzen Argumentstrukturalternanzen und Valenz
und Valenz Gängige Annahme: Syntaktische Strukturen werden bestimmt durch (i) allgemeine syntaktische Regeln und Prinzipien und durch (ii) idiosynkratische syntaktische Eigenschaften einzelner Lexeme (z.
MehrDynaVox Series 5 Lernprogramme
DynaVox Series 5 Lernprogramme Dieses Dokument führt durch die verschiedenen Inhalte des Ordners Lernprogramme auf der DynaVox Series 5 Kommunikationshilfe. HINWEIS Diese Inhalte sind in den InterAACt
MehrUniverzita Karlova. Filozofická fakulta. Ústav germánských studií. Diplomová práce. Bc. Jitka Křesťanová
Univerzita Karlova Filozofická fakulta Ústav germánských studií Diplomová práce Bc. Jitka Křesťanová Vergleich der Ergebnisse der Kookkurrenzdatenbank (CCDB) und der Kookkurrenzanalyse Porovnání výsledků
MehrKonzepte der Linguistik Valenz. Lyrik & Linguistik. Konzepte der Linguistik Valenz. Konzepte der Linguistik Valenz. isst. isst
Lyrik & Linguistik Stefan Engelberg & Christine Hummel stitut für Deutsche Sprache, Mannheim Universität Freiburg Hauptseminar, Uni Mannheim, FS 2008 Hier noch ein paar Grammatikalitätsurteile: (1) *Ein
MehrMusterprüfung zur DSH
Musterprüfung zur DSH Teil 3: Verstehen und Bearbeiten eines Lesetextes und wissenschaftssprachlicher Strukturen Arbeitszeit: 90 Minuten Das DWDS Christiane Fellbaum schreibt am neuen deutschen Wörterbuch
MehrKorpusanalyse am IDS Die Korpora
Die Korpora DeReKo: Das Deutsche Referenzkorpus Die Korpora am IDS Größe: über 2,2 Milliarden Textwörter (Stand: Juli 2007) Akquise: im Hinblick auf Umfang, Variabilität, Qualität und Aktualität; urheberrechtlich
MehrUTB 2642. Eine Arbeitsgemeinschaft der Verlage
UTB 2642 Eine Arbeitsgemeinschaft der Verlage Beltz Verlag Weinheim Basel Böhlau Verlag Köln Weimar Wien Wilhelm Fink Verlag München A. Francke Verlag Tübingen und Basel Paul Haupt Verlag Bern Stuttgart
MehrZugang zur Konkordanzsuche
Zugang zur Konkordanzsuche 1.1 Zugriff Mit dem Recherchetool können Sie: - Konkordanzen (= eine Liste aller Vorkommen eines Suchwortes im Kontext) aus der Verbalspur und den Annotationen erstellen, - Metadaten
MehrComputerlexikographie-Tutorium
Computerlexikographie-Tutorium 09.05.2008 Themen für heute: Teil I: Aufbau der Wörterbücher Mikrostruktur Rey-Debove Herbert Ernst Wiegand Beispiele Teil II: Mikrostrukturprogramme in Online-Lexika elexiko
MehrLDV - INFO 7. Informationsschrift der Arbeitsstelle Linguistische Datenverarbeitung 1988/89
IN S T IT U T FU R D E U T SC H E SPR A C H E LDV - INFO 7 Informationsschrift der Arbeitsstelle Linguistische Datenverarbeitung 1988/89 Redaktion: T. Brückner Herausgeber: Institut für deutsche Sprache
MehrRelationen zwischen Nomen und ihren Assoziationen. Michael Roth
Relationen zwischen Nomen und ihren Assoziationen Michael Roth 2 Assoziationen sind psychologisch interessant. Wie erfolgt der Zugriff auf sie? Welche Bedeutung haben sie? erfüllen einen linguistischen
MehrProjektseminar "Texttechnologische Informationsmodellierung"
Projektseminar "Texttechnologische Informationsmodellierung" Ziel dieser Sitzung Nach dieser Sitzung sollten Sie: Einige standards und projekte vom Namen her kennen Einen Überblick über und einen Eindruck
MehrKollokationen im Lernerwörterbuch
Kollokationen im Lernerwörterbuch Anspruch und Wirklichkeit Jupp Möhring Universität Leipzig/ Herder-Institut Vortrag zur IDT 2009 Sektion H6: Phraseologie: Linguistische, kulturkontrastive und didaktische
MehrKorpuslinguistik in der linguistischen Lehre Erfolge und Misserfolge
Korpuslinguistik in der linguistischen Lehre Erfolge und Misserfolge 18. Januar 2011 D-Spin Workshop, BBAW, Berlin Inhalt Ideen und Resultate Hoffnungen und Enttäuschungen Bedürfnisse und Probleme Ausblick
MehrLexik der gesprochenen Sprache aus der Sicht des DWDS
Lexik der gesprochenen Sprache aus der Sicht des DWDS Alexander Geyken & Lothar Lemnitzer BBAW Workshop Lexik des gesprochenen Deutsch: Forschungsstand, Erwartungen und Anforderungen an die Entwicklung
MehrBibTip. Mit besten Empfehlungen. 4. April 2012 - OCLC Informationstag 2012 in Zürich. Boris Köberle
BibTip Mit besten Empfehlungen 4. April 2012 - OCLC Informationstag 2012 in Zürich Boris Köberle Agenda Motivation Live Demo Integration Algorithmik Community Zusammenfassung Folie # 2 Agenda Motivation
MehrTechnischer Bericht. Integration der KobRA-Verfahren in die IDS-Infrastrukturen
Technischer Bericht Nr. 2016/3 (Meilenstein 4c) Integration der KobRA-Verfahren in die IDS-Infrastrukturen BMBF-Verbundprojekt: Korpus-basierte linguistische Recherche und Analyse mithilfe von Data-Mining
MehrOPUS 3.0. Frank Scholze Universitätsbibliothek Stuttgart. Tagung "Digitale Bibliothek im SWB Stuttgart, 14.12.2005
OPUS 3.0 Frank Scholze Stuttgart Tagung "Digitale Bibliothek im SWB Stuttgart, 14.12.2005 Entwicklung Projekt/Produkt der Universität Stuttgart (UB+RUS) mit enger Abstimmung zum BSZ seit Projektbeginn
MehrRingvorlesung Methoden, HS 2009. Korpuslinguistik. Stefan Engelberg ( Mannheim (Institut für Deutsche Sprache & Universität
Ringvorlesung Methoden, HS 2009 Korpuslinguistik Stefan Engelberg ( Mannheim (Institut für Deutsche Sprache & Universität Stefan Engelberg (IDS Mannheim), Mannheim, 4. November 2009 [Folie 1] 1.1 Was sind
MehrIvana Daskalovska. Willkommen zur Übung Einführung in die Computerlinguistik. Sarah Bosch,
Ivana Daskalovska Willkommen zur Übung Einführung in die Computerlinguistik Kontakt: ivana.bt.mk@gmail.com Betreff: EICL Wiederholung Aufgabe 1 Was ist Computerlinguistik? 4 Was ist Computerlinguistik?
MehrOnomasiologie, Semasiologie. Paradigmatische Wortbeziehungen. Lexikologie, FS 2012 Vilnius, den 13. März 2012
Onomasiologie, Semasiologie. Paradigmatische Wortbeziehungen Lexikologie, FS 2012 Vilnius, den 13. März 2012 Überblick Semasiologie Onomasiologie Paradigmatische Wortbeziehungen Wortfelder Wortfamilien
MehrWissenschaftliches Arbeiten
Teil 7: Argumentieren und Begründen 1 Grundregel: Spezifisch argumentieren Wissenschaftliches Arbeiten Nie mehr zeigen, als nötig oder gefragt ist. Sonst wird das Argument angreifbar und umständlich. Schwammige
MehrAnleitung zur Einrichtung des VPN-Zugangs für die Literatursuche aus dem Universitätsnetz
Anleitung zur Einrichtung des VPN-Zugangs für die Literatursuche aus dem Universitätsnetz R. Korinthenberg Studiendekanat der Med. Fakultät Albert-Ludwigs-Universität Freiburg 1) Wenn Sie noch kein Antragsformular
MehrExperteninterview Zu Erwartungen, Anforderungen und Wünschen an ein Wörterbuch des gesprochenen Deutsch
Experteninterview Zu Erwartungen, Anforderungen und Wünschen an ein Wörterbuch des gesprochenen Deutsch Beginn der Umfrage: 13.12.2017 Ende der Umfrage: 01.03.2017 Pretest-TeilnehmerInnen : 4 TeilnehmerInnen:
MehrDie Sammlung unikaler Wörter des Deutschen Aufbauprinzipien und erste Auswertungsergebnisse
Die Sammlung unikaler Wörter des Deutschen Aufbauprinzipien und erste Auswertungsergebnisse Manfred Sailer und Beata Trawiński SFB 441 Universität Tübingen {mf,trawinsk}@sfs.uni-tuebingen.de. EUROPHRAS
Mehr11. Übung Informatik II - Operatorfunktionen
Stand: 26. Juni 2015 Inhalt 1 2 3 Übersicht 1 2 3 Warum Operatoren überladen? Großteil der Operatoren (Arithmetik, Logik, Vergleiche) nur für Standarddatentypen (Zahlen, Zeiger) implementiert vergleichbare
MehrWas ist ein Korpus. Zitat aus: Carstensen et al. Computerlinguistik und Sprachtechnologie: Eine Einführung. Kap. 4.2, Textkorpora
Was ist ein Korpus Korpora sind Sammlungen linguistisch aufbereitete(r) Texte in geschriebener oder gesprochener Sprache, die elektronisch gespeichert vorliegen. Zitat aus: Carstensen et al. Computerlinguistik
MehrLexikologie der deutschen Gegenwartssprache. Herbstsemester 2011/2012 Assist. Daumantas Katinas
Lexikologie der deutschen Gegenwartssprache Herbstsemester 2011/2012 Assist. Daumantas Katinas 7.9.2011 Überblick 15 Lehrveranstaltungen Teilnahmepflicht an 10 Veranstaltungen 1 schriftliche Kontrollarbeit
MehrDie Regeln für Leichte Sprache
Die Regeln für Leichte Sprache vom Netzwerk Leichte Sprache Die Regeln für Leichte Sprache Leichte Sprache ist wichtig Das ist zum schwere Sprache: Leichte Sprache. Leichte Sprache hilft vielen Menschen.
MehrStefan Engelberg (IDS Mannheim), Workshop Corpora in Lexical Research, Bucharest, Nov. 2008 [Folie 1]
Content 1. Empirical linguistics 2. Text corpora and corpus linguistics 3. Concordances 4. Application I: The German progressive 5. Part-of-speech tagging 6. Fequency analysis 7. Application II: Compounds
MehrWort, Name, Begriff, Terminus. Schlusszusammenfassung
Wort, Name, Begriff, Terminus Schlusszusammenfassung Seminar Ib Sommersemester 2006 Walther v.hahn Das Wort als zentrale Einheit der Sprache Das Wort ist das wichtigste Element der Sprache, denn weder
MehrBachelor Modul E: Einführung in pädagogische Handlungsfelder und Grundbegriffe der Erziehungswissenschaft
Philipp Annen (M.A.) Universitätsring 15 54296 Trier Raum: B 459 Tel.: 2376 Email: annen@uni-trier.de Seminarplan Wintersemester 2015/2016, Seminar 2Std., B 461 Veranstaltung: Pädagogische Grundbegriffe
MehrSQL. Structured Query Language
SQL Structured Query Language Grundlagen zu Abfrage SQL Jede SQL-Abfrage enthält die drei Hauptbefehle: select (engl. auswählen), from (engl. von) und where (engl. wo). Mit select gibt man an, welche Spalten
MehrIch baue ein eigenes Korpus
Blockseminar Einführung in die Korpuslinguistik Seminarleitung: Yvonne Krämer, M.A. Ich baue ein eigenes Korpus Datengewinnung und aufbereitung Datengewinnung Das Untersuchungsinteresse bestimmt die benötigte
MehrAnleitung für Carcassonne-Turniere in der Brettspielwelt
Anleitung für Carcassonne-Turniere in der Brettspielwelt Diese Anleitung hilft bei der Verwendung der Brettspielwelt (BSW) bei Carcassonne Qualifikations- und Ranglistenturnieren zur Qualifikation bei
MehrDas Sichtenkonzept im DWDS- Wortinformationssystem
Das Sichtenkonzept im DWDS- Wortinformationssystem Alexander Geyken, Edmund Pohl, Lothar Lemnitzer Berlin-Brandenburgische Akademie der Wissenschaften 6. Arbeitstreffen des Forschungsnetzwerks Internetlexikographie
MehrÜberblick. GK C: Einführung in die Korpuslinguistik. Fragen. Sprachwandel/Sprachvariation. Fragen. NB: Register
GK C: Einführung in die Korpuslinguistik Anke Lüdeling anke.luedeling@rz.hu-berlin.de Sommersemester 2003 Überblick Registervariation multidimensionale Analyse Register quantitative Analyse Dimensionen:
MehrDas Design der Video-Lernspiele Eine Forschungs- und Designmethodik
Diese Website ist eine allgemein zugängliche Version meiner Doktorarbeit. dargelegt von René St-Pierre Ph.D. Doktorarbeit in studierten und angewandten Künsten Universität von Quebek in Montreal (UQAM)
MehrLinguistische Informatik
Linguistische Informatik Gerhard Heyer Universität Leipzig heyer@informatik.uni-leipzig.de Institut für Informatik Das klassische Verarbeitungsmodell Lexikon Grammatik Input: natürlichsprachlicher Satz
MehrOffice 365 On Premise oder Cloud? Stephan Krüger
Office 365 On Premise oder Cloud? Stephan Krüger Inhalt - Office 2016 Neue Features - Klassische Lizensierung - Was ist Office 365? - Business Pläne vs Enterprise Pläne - MSI Deployment und Updateverteilung
MehrHOSTED EXCHANGE MICROSOFT OUTLOOK 2016 FÜR WINDOWS Skyfillers Handbuch
HOSTED EXCHANGE MICROSOFT OUTLOOK 2016 FÜR WINDOWS Skyfillers Handbuch INHALT Outlook herunterladen und installieren... 2 Neues Outlook Profil erstellen und Postfach einrichten... 7 Exchange Postfach in
MehrMedienrecht und Persönlichkeitsrecht
Germanistik Anna Mikhaylova Medienrecht und Persönlichkeitsrecht Studienarbeit Inhaltsverzeichnis Einleitung 2 I. Fragestellungen des Medienrechts...4 1. Begriff und Einordnung des Medienrechts..4 2.
MehrZugriff vom Privatcomputer auf «Mein Intranet VSZ» (Verwaltungsnetz)
Zugriff vom Privatcomputer auf «Mein Intranet VSZ» (Verwaltungsnetz) Download Citrix-Receiver unter Microsoft Windows Anleitung für Teammitglieder Eveline Bearth Vers. 3.0 / Zürich, 22. April 2018 1 Citrix
MehrLinguistische Informatik
Linguistische Informatik Gerhard Heyer Universität Leipzig heyer@informatik.uni-leipzig.de Institut für Informatik Das klassische Verarbeitungsmodell Lexikon Grammatik Input: natürlichsprachlicher Satz
MehrLinguistische Forschungsdaten
Linguistische Forschungsdaten Andreas Witt Institut für Deutsche Sprache (IDS), Mannheim 45 Jahre und mehr IDS, Korpora, Verfügbarkeit, rechtliche Fragen (1) 1964 Das Institut für Deutsche Sprache wird
MehrVerfügbare Deutsche Korpora (gesprochene und geschriebene Texte)
Verfügbare Deutsche Korpora (gesprochene und geschriebene Texte) Chatkorpus von Michael Beißwenger http://www.linse.uni-due.de/tl_files/pdfs/publikationen-rezensionen/chatkorpus_beisswenger_2013.pdf Hamburg
MehrCorpus-based language analysis in research and teaching:
Corpus-based language analysis in research and teaching: Experiences, requirements and perspectives Angelika Storrer Corpus-based research projects Bericht zur Lage der deutschen Sprache [report on the
Mehr