Korpuslinguistik Grundlagen Korpora. Lyrik & Linguistik. Korpuslinguistik Grundlagen Korpora. Korpuslinguistik Grundlagen Korpora. Was ist ein Korpus?

Größe: px
Ab Seite anzeigen:

Download "Korpuslinguistik Grundlagen Korpora. Lyrik & Linguistik. Korpuslinguistik Grundlagen Korpora. Korpuslinguistik Grundlagen Korpora. Was ist ein Korpus?"

Transkript

1 Lyrik & Linguistik Was ist ein Korpus? Stefan Engelberg & Christine Hummel Institut für Deutsche Sprache, Mannheim Universität Freiburg Hauptseminar, Uni Mannheim, FS 2008 Lemnitzer, Lothar und Heike Zinsmeister. Korpuslinguistik. Eine Einführung. Tübingen: Narr, S. 7. Stefan Engelberg & Christine Hummel, Lyrik & Linguistik, FS 2008, Uni Mannheim [Folie 1] Stefan Engelberg & Christine Hummel, Lyrik & Linguistik, FS 2008, Uni Mannheim [Folie 2] Wozu? Was ist Korpuslinguistik? Lemnitzer, Lothar und Heike Zinsmeister. Korpuslinguistik. Eine Einführung. Tübingen: Narr, S. 9. werden bei verschiedenen sprachwissenschaftlichen Aufgaben verwendet: Theoretische Linguistik: von der Überprüfung von Hypothesen bis zur automatischen Ermittlung grammatischer Regularitäten. Lexikographie: Ermittlung von Worthäufigkeiten, Wendungen und typischen Verwendungskontexten, Sammlung authentischer Beispiele. Grammatikographie: Belege für grammatische Strukturen, deren Häufigkeit und Verteilung. Fremdsprachenunterricht: Analyse von Lernerfehlern, Ermittlung gebrauchshäufiger Phänomene, authentische Belege für Sprachverwendung. Übersetzung: Überprüfung von Übersetzungsstrategien in Parallelkorpora. Computerlinguistik: automatische Übersetzung, Spracherkennung, etc. Scherer, Carmen: Korpuslinguistik. Heidelberg: Winter, Stefan Engelberg & Christine Hummel, Lyrik & Linguistik, FS 2008, Uni Mannheim [Folie 3] Stefan Engelberg & Christine Hummel, Lyrik & Linguistik, FS 2008, Uni Mannheim [Folie 4] 1

2 Typen von lassen sich nach verschiedenen Kriterien typologisieren: Scherer, Carmen: Korpuslinguistik. Heidelberg: Winter, Sprachmedium: geschriebener / gesprochener Sprache Geltungsbereich: Referenzkorpora (für eine Sprache in ihrer Gesamtheit) / Spezialkorpora Sprecherkompetenz: Lernerkorpora / zum Erstspracherwerb, Korpusaufbereitung: (grammatisch) annotierte vs. nicht-annotierte Sprachstadium: historische / der Gegenwartssprache Sprachenanzahl: einsprachige / Parallelkorpora, Vergleichskorpora Einige verfügbare des Deutschen Deutsches Referenzkorpus (Institut für Deutsche Sprache): über Mio. Textwörter; Zeitungen, Belletristik, Sachtexte,, ab 1950; online verfügbar. Deutsches Korpus aus der Leipzig Corpus Collection: über 15 Mio. Textwörter; Sätze aus Zeitungen; kann downgeloadet werden. DWDS-Kernkorpus (Berlin-Brandenburgische Akademie): 100 Mio. Textwörter; Zeitungen, Belletristik, Fachtexte, gesprochene Sprache; Texte ab 1900; Grundlage für das DWDS-Wörterbuch. Historisches Korpus am IDS: 3 Mio. Textwörter (wachsend), Zeitungen, Bellestristik, Sachtexte,, Jh. TIGER-Korpus (Potsdam, Stuttgart, Saarbrücken); 0,9 Mio. Textwörter; Sätze mit grammatischen Strukturbeschreibungen. FALKO (Humboldt-Univ. Berlin): im Aufbau; fehlerannotiertes Lernerkorpus DaF. Vgl. die Übersichten in: Lemnitzer, Lothar, and Heike Zinsmeister. Korpuslinguistik. Eine Einführung. Tübingen: Narr, / Scherer, Carmen: Korpuslinguistik. Heidelberg: Winter, Stefan Engelberg & Christine Hummel, Lyrik & Linguistik, FS 2008, Uni Mannheim [Folie 5] Stefan Engelberg & Christine Hummel, Lyrik & Linguistik, FS 2008, Uni Mannheim [Folie 6] FRAGEN Welche Arten von Abweichungen in lyrischen Texten kommen vor, welche nicht? Welche Funktionen sind mit solchen Abweichungen verbunden? Welche linguistischen Konzepte sind hilfreich zur Beschreibung solcher Abweichungen? Wie können wir den typischen Sprachgebrauch in lyrischen Texten (oder in lyrischen Texten eines bestimmten Autors) ermitteln? Wie können wir den typischen Sprachgebrauch in anderen Texten ermitteln? Methoden der Korpusanalyse Erstellung von Konkordanzen Erzeugung von Wortlisten mit Frequenzangaben Ermittlung von hochfrequenten Wortgruppen (Clusteranalyse) Berechnung von Kookkurrenzen Ermittlung von Schlüsselwörtern Berechnung diachroner Verläufe des Wortgebrauchs Im Folgenden werden die wichtigsten am Beispiel des Programms AntConc dargestellt. Stefan Engelberg & Christine Hummel, Lyrik & Linguistik, FS 2008, Uni Mannheim [Folie 7] Stefan Engelberg & Christine Hummel, Lyrik & Linguistik, FS 2008, Uni Mannheim [Folie 8] 2

3 Grundlegende Funktionalitäten in vielen Korpusrecherchesystemen (III) Ermittlung von Wortgruppen (V) Berechnung von Kookkurrenzen AntConc Entwickler: Laurence Anthony, Faculty of Science and Engineering,Waseda University, Japan. Version: 3.2.1w (Windows), Release March 10th, Recherche: Offline. Software: wird lokal installiert. Zugang: freier Download des Programms. : eigene Textsammlungen (txt-dateien). Sprachen: alle (Unicode); getestet: Deutsch, Englisch, Rumänisch, Mongolisch. URL: Stefan Engelberg & Christine Hummel, Lyrik & Linguistik, FS 2008, Uni Mannheim [Folie 9] (I) Erstellung von Konkordanzen (II) Berechnung von Häufigkeiten (IV) Ermittlung von Schlüsselwörtern Stefan Engelberg & Christine Hummel, Lyrik & Linguistik, FS 2008, Uni Mannheim [Folie 10] Konkordanzen Suche: Konkordanzen zu hilft in einem Ausschnitt der Leipzig Corpus Collection (Sätze aus Zeitungen). Konkordanz Eine K. ist eine Sammlung von Kotexten eines bestimmten Schlüsselworts. Kotexte einer bestimmten Länge (von Buchstaben, Wörtern oder Sätzen) um ein Schlüsselwort herum werden aus einem Korpus extrahiert und meist mit dem Schlüsselwort im Zentrum angeordnet Lemnitzer, Lothar und Heike Zinsmeister. Korpuslinguistik. Eine Einführung. Tübingen: Narr, S. 196f. KWIC Key word in context : Einzelner Kotext zu einem Schlüsselwort; in Programmen zur Konkordanzerzeugung ist die Kotextgröße meist wählbar. Suchausdruck (hier: hilft) Sortierung (hier: alphabetisch nach Wort direkt rechts vom Suchterm) Kotext (hier: 200 Zeichen) Treffermenge (hier: 32) Stefan Engelberg & Christine Hummel, Lyrik & Linguistik, FS 2008, Uni Mannheim [Folie 11] Stefan Engelberg & Christine Hummel, Lyrik & Linguistik, FS 2008, Uni Mannheim [Folie 12] 3

4 Index als traditionelles Mittel zur Konkordanzerstellung Textwort Gedichtband Gedichtnummer Zeilennummer Ausgabe der Ergebnisse als Textdatei. Nielsen, Karsten Hvidfelt & Harald Pors (1981): Index Zur Lyrik Paul Celans. München: Fink. Stefan Engelberg & Christine Hummel, Lyrik & Linguistik, FS 2008, Uni Mannheim [Folie 13] Stefan Engelberg & Christine Hummel, Lyrik & Linguistik, FS 2008, Uni Mannheim [Folie 14] Frequenzen Lexikalische Häufigkeitsberechnungen In lexikalischen Häufigkeitsberechnungen wird die Anzahl bestimmter Wortformen, Lexeme oder auch Wortgruppen in einem Korpus berechnet. Type-Token-Ratio Mit Type-Token-Ratio wird der Quotient aus der Anzahl aller sprachlichen Einheiten eines bestimmten Typs und der Anzahl aller Vorkommen dieser Einheiten in einem gegebenen Korpus bezeichnet. Gewöhnlich wird die Type-Token-Ratio für Wortlexeme oder Wortformen berechnet. Type-Token-Ratio (Lexeme): Anzahl aller verschiedenen Lexeme / Anzahl aller Realisierungen der verschiedenen Wortformen dieser Lexeme (Anzahl aller Textwörter). Type-Token-Ratio (Wortformen): Anzahl aller verschiedenen Wortformen / Anzahl aller Realisierungen dieser Wortformen. Stefan Engelberg & Christine Hummel, Lyrik & Linguistik, FS 2008, Uni Mannheim [Folie 15] Start (kein Suchausdruck) Type-Token-Ratio (hier: : ,115) Wortliste (mit Rang und Frequenzangabe) Suche: Frequenzliste aller Wortformen und Type-Token-Ratio in einem Ausschnitt der Leipzig Corpus Collection (Sätze aus Zeitungen). Sortierung (hier: nach Frequenz) Stefan Engelberg & Christine Hummel, Lyrik & Linguistik, FS 2008, Uni Mannheim [Folie 16] 4

5 Wortgruppenanalyse Suche: Alle Cluster aus 3 Wörtern, die Tag enthalten, in einem Ausschnitt der Leipzig Corpus Collection. Cluster Als Cluster sollen hier Ketten von sprachlichen Einheiten bezeichnet werden. In er sprach vor einem großen Publikum ist spr ein Konsonantencluster aus 3 Konsonanten und sprach vor einem ein Wortcluster aus 3 Wörtern. Manche Korpusrechercheprogramme erlauben zu einem Suchwort die Ermittlung aller Cluster, in denen es vorkommt. Trigramm-Liste mit Rang und Frequenzangabe n-gramm Ein n-gramm ist eine Folge von n linguistischen Elementen gleichen Typs. (Kunze & Lemnitzer 2007: 190) Ein 5-Gramm von Wörtern ist eine Folge von 5 Wörtern. Ein n- Gramm ist also das gleiche wie ein n-cluster. Von n-grammen spricht man insbesondere, wenn es darum geht, alle n-wortcluster aus einem Korpus zu extrahieren. Suchtermposition (hier: beliebig) Suchterm (hier: Tag) Sortierung (hier: nach Häufigkeit des Clusters) Clustergröße (hier: Cluster aus 3 Wörtern) Kunze, Claudia und Lothar Lemnitzer. Computerlexikographie. Eine Einführung. Tübingen: Narr [E-Book], S Stefan Engelberg & Christine Hummel, Lyrik & Linguistik, FS 2008, Uni Mannheim [Folie 17] Frequenzbedingung (hier: mindestens 1 Token; = alle) Stefan Engelberg & Christine Hummel, Lyrik & Linguistik, FS 2008, Uni Mannheim [Folie 18] Suche: Trigramme mit mindestens 3 Token in einem Ausschnitt der Leipzig Corpus Collection. Suche: Schlüsselwörter (zum Beispiel sprachwissenschaftliche Termini in einem Korpus linguistischer Fachtexte). Trigramm-Liste mit Rang und Frequenzangabe Start (kein Suchterm; Einstellung: N-Gramm) Bestimmung von n (hier: n-gramme für n = 3) Laden eines Vergleichskorpus (hier eine Ausschnitt aus dem Ddeutschen LCC-Korpus) Sortierung (hier: nach Frequenzbedingung (hier: Häufigkeit des Trigramms) mindestens 3 Token) Stefan Engelberg & Christine Hummel, Lyrik & Linguistik, FS 2008, Uni Mannheim [Folie 19] Stefan Engelberg & Christine Hummel, Lyrik & Linguistik, FS 2008, Uni Mannheim [Folie 20] 5

6 Kookkurrenzanalyse Fachsprachliches Korpus Schlüsselwort- Funktion Ausschnitt aus der Schlüsselwortliste Kookkurrenz Als Kookkurrenz wird das gemeinsame Vorkommen zweier oder mehrerer Wörter in einem Kontext von fest definierter Größe bezeichnet. Dabei sind Kookkurrenzen dort linguistisch interessant, wo das gemeinsame Auftreten der Wörter häufiger zu beobachten ist, als bei einer Zufallsverteilung aller Wörter zu erwarten wäre. Kunze, Claudia und Lothar Lemnitzer. Computerlexikographie. Eine Einführung. Tübingen: Narr [E-Book], S. 391f. Kollokation Eine K. ist ein aus meist zwei sprachlichen Zeichen bestehender Ausdruck, in dem die beiden sprachlichen Zeichen in arbiträrer und konventionalisierter Form verbunden sind (z. B. blonde Haare, ein heikles Thema). Innerhalb der Kollokation kann man die Basis als semantisch autonomes Element (Haare, Thema) und den Kollokator (blond, heikel) als semantisch abhängiges Element unterscheiden. Kollokationen sind in gewisser Weise linguistisch interpretierte Kookkurrenzen. Engelberg, Stefan und Lothar Lemnitzer. Einführung in die Lexikographie und Wörterbuchbenutzung. Tübingen: Stauffenburg, S. 391f. Stefan Engelberg & Christine Hummel, Lyrik & Linguistik, FS 2008, Uni Mannheim [Folie 21] Stefan Engelberg & Christine Hummel, Lyrik & Linguistik, FS 2008, Uni Mannheim [Folie 22] Suche: Kookkurrenzen zu der Wortform knapp in einem Ausschnitt der Leipzig Corpus Coll. Ausgabe der Ergebnisse in eine txt-datei Suchterm (hier: knapp) Liste der Kookkurrenzpartner mit Rang und Frequenz- und Signifikanzangabe Bestimmung des Suchkontexts (hier: bis 2 Wörter nach dem Suchterm) Sortierung (hier: nach Signifikanz Frequenzbedingung (hier: der Kookkurrenz) mind. 3 Collocate-Token) Stefan Engelberg & Christine Hummel, Lyrik & Linguistik, FS 2008, Uni Mannheim [Folie 23] Beobachtungen Zahlausdrücke (Million, Milliarde, Milliarde, hundert) zeigen ein stärkeres Kookkurrenzverhalten als Zeitausdrücke (Monaten, Wochen, Jahren), zumindest auf Wortformenbasis. Die Verbindung von knapp und behauptet ist als Kollokation einzustufen; knapp hat hier nicht die Bedeutung etwas weniger als, sondern so gerade / mit Mühe und kombiniert in dieser Bedeutung nur mit ausgewählten Verben. Stefan Engelberg & Christine Hummel, Lyrik & Linguistik, FS 2008, Uni Mannheim [Folie 24] 6

7 Resumee AntConc Konkordanz zu behauptet, sortiert nach dem unmittelbaren Vorgängerwort. zu empfehlen bei kleineren (bis 20 Mio. Textwörter) gut für sortierte Konkordanzen, Wortlistenerstellung, Wortgruppenanalyse und Schlüsselwortermittlung weniger nützlich für Kookkurrenzanalyse (zu langsam; man braucht größere ) Stefan Engelberg & Christine Hummel, Lyrik & Linguistik, FS 2008, Uni Mannheim [Folie 25] Stefan Engelberg & Christine Hummel, Lyrik & Linguistik, FS 2008, Uni Mannheim [Folie 26] COSMAS II & CCDB die beste Kookkurrenzanalyse zum Deutschen große mit vielfältigen Abfragemöglichkeiten Kookkurrenzanalyse zu in der CCDB (Funktionswörter in dieser Analyse nicht berücksichtigt) COSMAS II & CCDB Developer: Institut für Deutsche Sprache (CCDB: Cyil Belica). Version: Search: online. Software: installed locally (Client) or as web interface. Access: free download of the client (registration). Corpora: corpora of the IDS. Languages: German. URL: (COSMAS II) (CCDB) Stefan Engelberg & Christine Hummel, Lyrik & Linguistik, FS 2008, Uni Mannheim [Folie 27] Primäre Kookkurrenzpartner zu (hier: Einkommen) Stärke der Verbindung zwischen den beiden Wörtern (hier: 796) Typische syntagmatische Muster, in denen die Verbindungen vorkommen, z. B. vom Einkommen Sekundäre Kookkurrenzpartner zu + Einkommen (hier: steuerpflichtigen, steuerbaren, versteuernden) Stefan Engelberg & Christine Hummel, Lyrik & Linguistik, FS 2008, Uni Mannheim [Folie 28] 7

8 Kookkurrenzanalyse zu in der CCDB Korpusrecherchesystem IV: Corpus Browser (Funktionswörter in dieser Analyse nicht berücksichtigt; nach Verbindungsstärke sortiert) Truppen (aus ) unverrichteter Dinge wieder Korpusrecherchesystem IV: Corpus Browser vom Einkommen wurden Soldaten (aus ) abgezogen wurden zwei Punkte abgezogen eine Show den Zündschlüssel die Haut Stefan Engelberg & Christine Hummel, Lyrik & Linguistik, FS 2008, Uni Mannheim [Folie 29] Stefan Engelberg & Christine Hummel, Lyrik & Linguistik, FS 2008, Uni Mannheim [Folie 30] Korpusrecherchesystem IV: Corpus Browser Korpusrecherchesystem IV: Corpus Browser aus 20 Metern Botschafter (aus ) Kapital (aus ) Gelder (aus ) Stefan Engelberg & Christine Hummel, Lyrik & Linguistik, FS 2008, Uni Mannheim [Folie 31] Stefan Engelberg & Christine Hummel, Lyrik & Linguistik, FS 2008, Uni Mannheim [Folie 32] 8

9 Korpusrecherchesystem IV: Corpus Browser von der Strafraumgrenze FRAGEN Welche Arten von Abweichungen in lyrischen Texten kommen vor, welche nicht? Welche Funktionen sind mit solchen Abweichungen verbunden? Welche linguistischen Konzepte sind hilfreich zur Beschreibung solcher Abweichungen? Wie können wir den typischen Sprachgebrauch in lyrischen Texten (oder in lyrischen Texten eines bestimmten Autors) ermitteln? Wie können wir den typischen Sprachgebrauch in anderen Texten ermitteln? Nehmen Sie an, Sie hätten als Textkorpus sämtliche Gedichte eines Autors. Wozu könnten Sie AntConc in Zusammenhang mit diesem Korpus nutzen? den Rauch lassen Stefan Engelberg & Christine Hummel, Lyrik & Linguistik, FS 2008, Uni Mannheim [Folie 33] Stefan Engelberg & Christine Hummel, Lyrik & Linguistik, FS 2008, Uni Mannheim [Folie 34] Metadaten bei den Berechnungen ignorieren: Global Settings / Tag Settings / Hide tags Metadaten (ausgezeichnet durch tags: < >) Stefan Engelberg & Christine Hummel, Lyrik & Linguistik, FS 2008, Uni Mannheim [Folie 35] Stefan Engelberg & Christine Hummel, Lyrik & Linguistik, FS 2008, Uni Mannheim [Folie 36] 9

10 Beispiel: Schlüsselwortanalyse Celan-Gedichtkorpus Beispiele: Schlüsselwortanalyse Kafka-Erzählungskorpus Stefan Engelberg & Christine Hummel, Lyrik & Linguistik, FS 2008, Uni Mannheim [Folie 37] Stefan Engelberg & Christine Hummel, Lyrik & Linguistik, FS 2008, Uni Mannheim [Folie 38] Der Abend spricht mit lindem Schmeichelwort die Gassen In Schlummer und der Süße alter Wiegenlieder, Die Dämmerung hat breit mit hüllendem Gefieder Ein Riesenvogel sich auf blaue Firste hingelassen. Nun hat das Dunkel von den Fenstern allen Glanz gerissen, Die eben noch beströmt wie veilchenfarbne Spiegel standen, Die Häuser sind im Grau, durch das die ersten Lichter branden Wie Rümpfe großer Schiffe, die im Meer die Nachtsignale hissen. In späten Himmel tauchen Türme zart und ohne Schwere, Die Ufer hütend, die im Schoß der kühlen Schatten schlafen, Nun schwimmt die Nacht auf dunkel starrender Galeere Mit schwarzem Segel lautlos in den lichtgepflügten Hafen. Stadler, Ernst: Dämmerung in der Stadt. In: Ders.: Verstreute Gedichte aus den Jahren 1910 bis Die digitale Bibliothek der deutschen Lyrik. Frankfurt am Main: Zweitausendeins. Zugang zu Korpusressourcen AntConc: Download unter Lyrikkorpora: Die Gedichtkorpora (Trakl, Stadler, Stramm, Gedichte aus der Menschheitsdämmerung) sende ich Ihnen per . Zeitungskorpus: Das deutsche Zeitungskorpus aus der Leipzig Corpus Collection können Sie sich in der Woche vom von meiner Webseite herunterladen: Webseite_Lyrik_Linguistik/Lyrik_Linguistik.html. CCDB: Die Kookkurenzdatenbank des Instituts für Deutsche Sprache ist zu erreichen unter: Bitte eine Überlassungserklärung unterschreiben! Stefan Engelberg & Christine Hummel, Lyrik & Linguistik, FS 2008, Uni Mannheim [Folie 39] Stefan Engelberg & Christine Hummel, Lyrik & Linguistik, FS 2008, Uni Mannheim [Folie 40] 10

Kurze literarische Texte in literaturwissenschaftlicher und linguistischer Perspektive. Lyrik seit den 1990er Jahren

Kurze literarische Texte in literaturwissenschaftlicher und linguistischer Perspektive. Lyrik seit den 1990er Jahren Kurze literarische Texte in literaturwissenschaftlicher und linguistischer Perspektive Lyrik seit den 1990er Jahren Christine Hummel & Stefan Engelberg Institut für Deutsche Sprache, Mannheim Universität

Mehr

Korpuslinguistik Grundlagen Korpusrecherchemethoden

Korpuslinguistik Grundlagen Korpusrecherchemethoden Methoden der Korpusanalyse Erstellung von Konkordanzen Erzeugung von Wortlisten mit Frequenzangaben Ermittlung von hochfrequenten Wortgruppen (Clusteranalyse) Berechnung von Kookkurrenzen Ermittlung von

Mehr

Korpuslinguistik Grundlagen Korpora

Korpuslinguistik Grundlagen Korpora Was ist ein Korpus? Lemnitzer, Lothar und Heike Zinsmeister. Korpuslinguistik. Eine Einführung. Tübingen: Narr, 2006. S. 7. Stefan Engelberg, Linguistische Methodenlehre, FS 2009, Uni Mannheim [Folie 1]

Mehr

linguistischer und literaturwissenschaftlicher Perspektive

linguistischer und literaturwissenschaftlicher Perspektive Sprachliche Eigenarten literarischer Kurzformen in linguistischer und literaturwissenschaftlicher Perspektive Stefan Engelberg & Christine Hummel Institut für Deutsche Sprache, Mannheim Universität Freiburg

Mehr

Korpuslinguistik Grundlagen Korpusrecherchemethoden

Korpuslinguistik Grundlagen Korpusrecherchemethoden Wortgruppenanalyse Korpuslinguistik Grundlagen Cluster Als Cluster sollen hier Ketten von sprachlichen Einheiten bezeichnet werden. In er sprach vor einem großen Publikum ist spr ein Konsonantencluster

Mehr

Emprirische Lexikologie

Emprirische Lexikologie Emprirische Lexikologie Stefan Engelberg Hauptseminar, Uni Mannheim, Herbst 2007 http://www.ids-mannheim.de/ll/lehre/engelberg/ Webseite_Empirische_Lexikologie/Empirische_Lexikologie.html engelberg@ids-mannheim.de

Mehr

Kookkurrenzanalyse Einführung

Kookkurrenzanalyse Einführung Einführung Kookkurenzanalyse die grundlegende Idee 1) Beobachtung: In einem Korpus tritt Wort X 1000mal auf, Wort Y 100mal, Wort Z 10mal. 2) Wahrscheinlichkeit: Die Kombination XY ist 10mal so wahrscheinlich

Mehr

Daten Methoden Theorien Hypothesen

Daten Methoden Theorien Hypothesen Hypothesen Die Wahrheit von wenn-dann-sätzen ergibt sich aus der Wahrheitstabelle für konditionale Verknüpfungen. wenn p, dann q p p nicht p nicht p q nicht q q nicht q WAHR FALSCH WAHR WAHR ϕ ist ein

Mehr

Argumentstrukturalternanzen Diathesen

Argumentstrukturalternanzen Diathesen Diathesen Diathesen (in einem weiten Sinn) können als regelhafte Operation auf Valenzrahmen verstanden werden, die einen Typ von Valenzrahmen Vr1 in einen Typ von Valenzrahmen Vr2 verändern. (In einem

Mehr

Daten Methoden Theorien Definitionen & Operationalisierungen

Daten Methoden Theorien Definitionen & Operationalisierungen Definitionen Daten Methoden Theorien Definitionen & Operationalisierungen Eine Realdefinition legt fest, wie ein Ausdruck verwendet wird, indem sie die Beobachtungen, das Wissen, die Intuitionen, die wir

Mehr

Korpusanalyse am IDS Die Kookkurrenzanalyse

Korpusanalyse am IDS Die Kookkurrenzanalyse Korpusanalyse am IDS Die am IDS Zugang zur des IDS: über die Webschnittstelle von COSMAS II über den Client von COSMAS II über die Kookkurrenzdatenbank Die IDS- ist seit 1995 online zugänglich. Stefan

Mehr

Valenz Syntaktische Valenz

Valenz Syntaktische Valenz Valenz Syntaktische Valenz Anm. 1: Verbunabhängige Unzulässigkeit von Valenzrahmen a. sie hat verkauft b. sie hat den Porsche verkauft c. sie hat an ihren Freund verkauft d. sie hat den Porsche an ihren

Mehr

Korpuslinguistik IDS-Korpora und COSMAS II

Korpuslinguistik IDS-Korpora und COSMAS II Korpuslinguistik IDS-Korpora und COSMAS II Heike Zinsmeister Korpuslinguistik 11. 11. 2011 Gliederung 1 Einleitung 2 Korpusbestand am IDS 3 Korpusrecherche mit COSMAS II 4 Referenzen Das Institut für Deutsche

Mehr

Kookkurrenzanalyse Noch einmal: Grundlagen

Kookkurrenzanalyse Noch einmal: Grundlagen Noch einmal: Grundlagen Methodologische Basis der Ermittlung sprachlicher Strukturen über kontextbestimmtes Kookkurrenzverhalten: ausreichend große Korpora statistische korpuslinguistische Methoden nachträgliche

Mehr

Daten Methoden Theorien Definitionen & Operationalisierungen

Daten Methoden Theorien Definitionen & Operationalisierungen Operationale Verfahren Daten Methoden Theorien Definitionen & Operationalisierungen Das Überbrückungsproblem Hypothese Explizite Formulierung einer als wahr vermuteten, begründbaren Aussage über das Phänomen

Mehr

Korpora. Referenten Duyen Tao-Pham Nedyalko Georgiev

Korpora. Referenten Duyen Tao-Pham Nedyalko Georgiev Korpora Referenten Duyen Tao-Pham Nedyalko Georgiev Hauptseminar: Angewandte Linguistische Datenverarbeitung (WS 11/12) Dozent: Prof. Dr. Jürgen Rolshoven Sprachliche Informationsverarbeitung Universität

Mehr

Daten Methoden Theorien Datentypen - Erhebungsverfahren

Daten Methoden Theorien Datentypen - Erhebungsverfahren Was ist der Gegenstand der Sprachwissenschaft? Zum Beispiel: Gegenstand der Sprachwissenschaft sind die kognitiv verankerten Entitäten, Strukturen und Regeln, die die Erzeugung sprachlicher Äußerungen

Mehr

Sprachstatistik: Das Zipf sche Gesetz

Sprachstatistik: Das Zipf sche Gesetz Sprachstatistik: Das Zipf sche Gesetz Korpus-Workshop Thema Korpus-Statistik Thomas Wittig Universität Leipzig Institut für Informatik wittig@uni-leipzig.de Principle of Least Effort 2 George K. Zipf:

Mehr

Computerlinguistische Grundlagen. Jürgen Hermes Sommersemester 17 Sprachliche Informationsverarbeitung Institut für Linguistik Universität zu Köln

Computerlinguistische Grundlagen. Jürgen Hermes Sommersemester 17 Sprachliche Informationsverarbeitung Institut für Linguistik Universität zu Köln Computerlinguistische Grundlagen Jürgen Hermes Sommersemester 17 Sprachliche Informationsverarbeitung Institut für Linguistik Universität zu Köln Computerlinguistik: Schnittstellen Computerlinguistik aus

Mehr

Inhalt und Typen von Korpora. Welche Sprachinhalte können Korpora haben und welche Arten von Korpora gibt es

Inhalt und Typen von Korpora. Welche Sprachinhalte können Korpora haben und welche Arten von Korpora gibt es Inhalt und Typen von Korpora Welche Sprachinhalte können Korpora haben und welche Arten von Korpora gibt es Inhalt von Korpora Korpora können die verschiedensten Texte in den unterschiedlichsten Zusammensetzungen

Mehr

Korpusanalyse am IDS Die Korpora

Korpusanalyse am IDS Die Korpora Die Korpora DeReKo: Das Deutsche Referenzkorpus Die Korpora am IDS Größe: über 3,4 Milliarden Textwörter (Stand: 2008) Akquise: im Hinblick auf Umfang, Variabilität, Qualität und Aktualität; urheberrechtlich

Mehr

Aufgaben aus Kegli 2 (Korpuslinguistik)

Aufgaben aus Kegli 2 (Korpuslinguistik) Aufgaben aus Kegli 2 (Korpuslinguistik) Kapitel 1 1. Überprüfen Sie mithilfe einer beliebigen Suchmaschine den Sprachgebrauch im Internet. Finden Sie die Formen wegen dem Regen bzw. wegen des Regens und

Mehr

Korpus. Was ist ein Korpus?

Korpus. Was ist ein Korpus? Was ist ein Korpus? Korpus Endliche Menge von konkreten sprachlichen Äußerungen, die als empirische Grundlage für sprachwiss. Untersuchungen dienen. Stellenwert und Beschaffenheit des Korpus hängen weitgehend

Mehr

COSMAS II Corpus Search Management and Analysis System

COSMAS II Corpus Search Management and Analysis System COSMAS II Corpus Search Management and Analysis System http://www.ids-mannheim.de/cosmas2/ 13. November 2012, Jeanette Isele Seminar: Korpuslinguistik Übersicht Theoretischer Teil Was ist COSMAS II? Die

Mehr

KoGloss als korpusbasierte Methode zur Ermittlung und Beschreibung von diskurstypischen Konstruktionen

KoGloss als korpusbasierte Methode zur Ermittlung und Beschreibung von diskurstypischen Konstruktionen KoGloss als korpusbasierte Methode zur Ermittlung und Beschreibung von diskurstypischen Konstruktionen Eglė Kontutytė Vaiva Žeimantienė Kolloquium Deutsche Sprachwissenschaft 16.05.2012 EU-Projekt KoGloss

Mehr

Stefan Engelberg (IDS Mannheim), Workshop Corpora in Lexical Research, Bucharest, Nov. 2008 [Folie 1] DWDS-Kernkorpus / DWDS corpus analysis

Stefan Engelberg (IDS Mannheim), Workshop Corpora in Lexical Research, Bucharest, Nov. 2008 [Folie 1] DWDS-Kernkorpus / DWDS corpus analysis Content 1. Empirical linguistics 2. Text corpora and corpus linguistics 3. Concordances 4. Application I: The German progressive 5. Part-of-speech tagging 6. Fequency analysis 7. Application II: Compounds

Mehr

Korpuslinguistik. Vorlesungsreihe»Methoden der Linguistik«(WS 2004/05) Universität Zürich, Korpuslinguistik. Jürgen Spitzmüller.

Korpuslinguistik. Vorlesungsreihe»Methoden der Linguistik«(WS 2004/05) Universität Zürich, Korpuslinguistik. Jürgen Spitzmüller. Vorlesungsreihe»Methoden der Linguistik«(WS 2004/05) Universität Zürich, 7.12.2004 1. Teil: Theorie Grundlegende theoretische Fragestellungen: Was sind überhaupt Korpora? Wozu Korpora? Was sollen Korpora

Mehr

Einleitung. Definitionen von Korpuslinguistik und das Repräsentativitätsmerkmal

Einleitung. Definitionen von Korpuslinguistik und das Repräsentativitätsmerkmal Definitionen von Korpuslinguistik und das Repräsentativitätsmerkmal Einleitung 1. Einleitung 2. Definitionen von Korpuslinguistik 2.1 Entstehung 2.1.1 : korpusbasiert vs. korpusgestützt 2.1.2 Generative

Mehr

Digital Humanities Recherche im DWDS und DTA

Digital Humanities Recherche im DWDS und DTA Digital Humanities Recherche im DWDS und DTA mit Booleschen Operatoren und Regulären Ausdrücken Jena Language & Information Engineering (JULIE) Lab Friedrich-Schiller-Universität Jena, Germany http://www.julielab.de

Mehr

Syntaktische Tendenzen der Gegenwartssprache

Syntaktische Tendenzen der Gegenwartssprache Syntaktische Tendenzen der Gegenwartssprache Anforderungen: Regelmäßige Teilnahme: max. 2 Fehlzeiten Vorbereitung auf die Sitzung: Text lesen, Fragen notieren, mitdiskutieren (!) Leitung einer Sitzung

Mehr

Lexikalisch-semantische Analyse von Korpora

Lexikalisch-semantische Analyse von Korpora Lexikalisch-semantische Analyse von Korpora Lothar Lemnitzer Workshop Internetlinguistik und Korpusanalyse, Hannover, 1. Mai 2015 Inhalt Rahmen meiner Darstellung Korpora in der lexikographischen Arbeit

Mehr

Dialogsysteme. Vortrag zum Thema n-gramm-modelle 2. Teil: Lösungsansätze für Ausfall-N-Gramme. 12. Januar 2006, Susanne O'Shaughnessy

Dialogsysteme. Vortrag zum Thema n-gramm-modelle 2. Teil: Lösungsansätze für Ausfall-N-Gramme. 12. Januar 2006, Susanne O'Shaughnessy Dialogsysteme Vortrag zum Thema n-gramm-modelle 2. Teil: Lösungsansätze für Ausfall-N-Gramme 12. Januar 2006, Susanne O'Shaughnessy Smoothing - Glättung Problem bei Standard- n-gramm-modellen: - kein Trainingskorpus

Mehr

Einführung. Stefanie Dipper Stefan Evert Heike Zinsmeister

Einführung. Stefanie Dipper Stefan Evert Heike Zinsmeister Einführung Stefanie Dipper Stefan Evert Heike Zinsmeister München, 28.1.2011 Korpus eine Sammlung gesprochener oder geschriebener Äußerungen typischerweise digitalisiert und maschinenlesbar Ebenen eines

Mehr

Semantische Klassifikation von Kollokationen auf Grundlage des DWDS- Wortprofils

Semantische Klassifikation von Kollokationen auf Grundlage des DWDS- Wortprofils Semantische Klassifikation von Kollokationen auf Grundlage des DWDS- Wortprofils Isabel Fuhrmann, Alexander Geyken, Lothar Lemnitzer Zentrum Sprache Berlin-Brandenburgische Akademie der Wissenschaften

Mehr

Kollaborative Konstruktionsglossare im Fachfremdsprachenlernen Deutsch, Estnisch, Lettisch, Litauisch AntConc Arbeit mit digitalen Textsammlungen

Kollaborative Konstruktionsglossare im Fachfremdsprachenlernen Deutsch, Estnisch, Lettisch, Litauisch AntConc Arbeit mit digitalen Textsammlungen Ko[Gloss] Kollaborative Konstruktionsglossare im Fachfremdsprachenlernen Deutsch, Estnisch, Lettisch, Litauisch AntConc Arbeit mit digitalen Textsammlungen Ko[Gloss] Digitale Analyse: Sprachliche Muster

Mehr

Das Zusammenspiel interpretativer und automatisierbarer Verfahren bei der Aufbereitung und Auswertung mündlicher Daten

Das Zusammenspiel interpretativer und automatisierbarer Verfahren bei der Aufbereitung und Auswertung mündlicher Daten Das Zusammenspiel interpretativer und automatisierbarer Verfahren bei der Aufbereitung und Auswertung mündlicher Daten Ein Fallbeispiel aus der angewandten Wissenschaftssprachforschung Cordula Meißner

Mehr

Sommer 2002 Stefan Langer CIS, Universität München.

Sommer 2002 Stefan Langer CIS, Universität München. Sommer 00 Stefan Langer CIS, Universität München stef@cis.uni-muenchen.de Sommersemester 00 Dozent: Stefan Langer 8. MAI 00: BLATT 1 1. Statistik und Computerlinguistik. Einige Grundbegriffe der deskriptiven

Mehr

Korpusanalyse am IDS Die Korpora

Korpusanalyse am IDS Die Korpora Die Korpora DeReKo: Das Deutsche Referenzkorpus Die Korpora am IDS Größe: über 3,4 Milliarden Textwörter (Stand: 2008) Akquise: im Hinblick auf Umfang, Variabilität, Qualität und Aktualität; urheberrechtlich

Mehr

NLP Eigenschaften von Text

NLP Eigenschaften von Text NLP Eigenschaften von Text Dr. Andreas Hotho Dominik Benz Beate Krause Sommersemester 2008 Folie: 1 Übersicht Einführung Eigenschaften von Text Words I: Satzgrenzenerkennung, Tokenization, Kollokationen

Mehr

Internetsuche und Google Page-Rank - Wie wird was durch wen gefunden? Woche 2

Internetsuche und Google Page-Rank - Wie wird was durch wen gefunden? Woche 2 Internetsuche und Google Page-Rank - Wie wird was durch wen gefunden? Woche 2 Magnus Knuth & Nadine Steinmetz Hasso Plattner Institute for IT-Systems Engineering University of Potsdam Internetsuche und

Mehr

Kurfzassung Deutsch. Poier Lorenz. MMag. Wilhelm Loibl

Kurfzassung Deutsch. Poier Lorenz. MMag. Wilhelm Loibl Kurfzassung Deutsch Novelty Mining Algorithmus zur Trendsporterkennung Poier Lorenz MMag. Wilhelm Loibl Einleitung Diese Arbeit versucht ein Instrument für die Erkennung von Trends im Tourismus durch die

Mehr

Analyse eines Zeitschriftenartikels, Stichwörter, Kollokationen. Zielgruppe: Studenten des 4. Semesters (Bachelor), Studiengang: Übersetzer

Analyse eines Zeitschriftenartikels, Stichwörter, Kollokationen. Zielgruppe: Studenten des 4. Semesters (Bachelor), Studiengang: Übersetzer Emília Charfaoui, Zuzana Karabinošová Analyse eines Zeitschriftenartikels, Stichwörter, Kollokationen Unterrichtsvorschlag 1 Analyse eines Zeitschriftenartikels Zielgruppe: Studenten des 4. Semesters (Bachelor),

Mehr

Gebrauchsorien-erte Sprachbeschreibung: Korpuslinguis-sche Analysen von (Fast-)Synonymen

Gebrauchsorien-erte Sprachbeschreibung: Korpuslinguis-sche Analysen von (Fast-)Synonymen Gebrauchsorien-erte Sprachbeschreibung: Korpuslinguis-sche Analysen von (Fast-)Synonymen Heike Zinsmeister Seminar Krea-ves Schreiben Universität Vilnius 25.10.2017 Online: hmps://www.korpuslab.uni-hamburg.de/lehrmaterialien/diverses.html

Mehr

DWDS-Kernkorpus / DWDS-Korpusanalyse

DWDS-Kernkorpus / DWDS-Korpusanalyse Korpusrecherchesysteme Das DWDS-Kernkorpus DWDS-Kernkorpus / DWDS-Korpusanalyse Entwickler: Berlin-Brandenburgische Akademie der Wissenschaften. Version: (keine Versionierung). Recherche: online. Software:

Mehr

Einführung Computerlinguistik. Allgemeines zur Linguistik

Einführung Computerlinguistik. Allgemeines zur Linguistik Einführung Computerlinguistik Allgemeines zur Linguistik Hinrich Schütze & Robert Zangenfeind Centrum für Informations- und Sprachverarbeitung, LMU München 2013-10-14 Schütze & Zangenfeind: Allgemeines

Mehr

ordnet.dk Vernetzung zwischen Wörterbuch und Korpus

ordnet.dk Vernetzung zwischen Wörterbuch und Korpus ordnet.dk Vernetzung zwischen Wörterbuch und Korpus Jörg Asmussen Det Danske Sprog- og Litteraturselskab, DSL Gesellschaft für dänische Sprache und Literatur ordnet.dk Vernetzung 1. Das Projekt ordnet.dk

Mehr

Digitale Ressourcen und ihr Potential für korpuslinguistisch informierte Diskursanalysen

Digitale Ressourcen und ihr Potential für korpuslinguistisch informierte Diskursanalysen ZGL 2015; 43(2): 352 357 Linguistik im Internet Eva Gredel* u. Ruth M. Mell* Digitale Ressourcen und ihr Potential für korpuslinguistisch informierte Diskursanalysen DOI 10.1515/zgl-2015-0018 1 Digitale

Mehr

Einführung in die Phonetik und Phonologie. Allgemeiner Überblick

Einführung in die Phonetik und Phonologie. Allgemeiner Überblick Einführung in die Phonetik und Phonologie Allgemeiner Überblick Phonetik und Phonologie Die beiden Bezeichnungen Phonetik und Phonologie sind aus dem griechischen Wort ϕωνþ (phōnē) abgeleitet, welches

Mehr

Argumentstrukturalternanzen Argumentstrukturalternanzen und Valenz

Argumentstrukturalternanzen Argumentstrukturalternanzen und Valenz und Valenz Gängige Annahme: Syntaktische Strukturen werden bestimmt durch (i) allgemeine syntaktische Regeln und Prinzipien und durch (ii) idiosynkratische syntaktische Eigenschaften einzelner Lexeme (z.

Mehr

DynaVox Series 5 Lernprogramme

DynaVox Series 5 Lernprogramme DynaVox Series 5 Lernprogramme Dieses Dokument führt durch die verschiedenen Inhalte des Ordners Lernprogramme auf der DynaVox Series 5 Kommunikationshilfe. HINWEIS Diese Inhalte sind in den InterAACt

Mehr

Univerzita Karlova. Filozofická fakulta. Ústav germánských studií. Diplomová práce. Bc. Jitka Křesťanová

Univerzita Karlova. Filozofická fakulta. Ústav germánských studií. Diplomová práce. Bc. Jitka Křesťanová Univerzita Karlova Filozofická fakulta Ústav germánských studií Diplomová práce Bc. Jitka Křesťanová Vergleich der Ergebnisse der Kookkurrenzdatenbank (CCDB) und der Kookkurrenzanalyse Porovnání výsledků

Mehr

Konzepte der Linguistik Valenz. Lyrik & Linguistik. Konzepte der Linguistik Valenz. Konzepte der Linguistik Valenz. isst. isst

Konzepte der Linguistik Valenz. Lyrik & Linguistik. Konzepte der Linguistik Valenz. Konzepte der Linguistik Valenz. isst. isst Lyrik & Linguistik Stefan Engelberg & Christine Hummel stitut für Deutsche Sprache, Mannheim Universität Freiburg Hauptseminar, Uni Mannheim, FS 2008 Hier noch ein paar Grammatikalitätsurteile: (1) *Ein

Mehr

Musterprüfung zur DSH

Musterprüfung zur DSH Musterprüfung zur DSH Teil 3: Verstehen und Bearbeiten eines Lesetextes und wissenschaftssprachlicher Strukturen Arbeitszeit: 90 Minuten Das DWDS Christiane Fellbaum schreibt am neuen deutschen Wörterbuch

Mehr

Korpusanalyse am IDS Die Korpora

Korpusanalyse am IDS Die Korpora Die Korpora DeReKo: Das Deutsche Referenzkorpus Die Korpora am IDS Größe: über 2,2 Milliarden Textwörter (Stand: Juli 2007) Akquise: im Hinblick auf Umfang, Variabilität, Qualität und Aktualität; urheberrechtlich

Mehr

UTB 2642. Eine Arbeitsgemeinschaft der Verlage

UTB 2642. Eine Arbeitsgemeinschaft der Verlage UTB 2642 Eine Arbeitsgemeinschaft der Verlage Beltz Verlag Weinheim Basel Böhlau Verlag Köln Weimar Wien Wilhelm Fink Verlag München A. Francke Verlag Tübingen und Basel Paul Haupt Verlag Bern Stuttgart

Mehr

Zugang zur Konkordanzsuche

Zugang zur Konkordanzsuche Zugang zur Konkordanzsuche 1.1 Zugriff Mit dem Recherchetool können Sie: - Konkordanzen (= eine Liste aller Vorkommen eines Suchwortes im Kontext) aus der Verbalspur und den Annotationen erstellen, - Metadaten

Mehr

Computerlexikographie-Tutorium

Computerlexikographie-Tutorium Computerlexikographie-Tutorium 09.05.2008 Themen für heute: Teil I: Aufbau der Wörterbücher Mikrostruktur Rey-Debove Herbert Ernst Wiegand Beispiele Teil II: Mikrostrukturprogramme in Online-Lexika elexiko

Mehr

LDV - INFO 7. Informationsschrift der Arbeitsstelle Linguistische Datenverarbeitung 1988/89

LDV - INFO 7. Informationsschrift der Arbeitsstelle Linguistische Datenverarbeitung 1988/89 IN S T IT U T FU R D E U T SC H E SPR A C H E LDV - INFO 7 Informationsschrift der Arbeitsstelle Linguistische Datenverarbeitung 1988/89 Redaktion: T. Brückner Herausgeber: Institut für deutsche Sprache

Mehr

Relationen zwischen Nomen und ihren Assoziationen. Michael Roth

Relationen zwischen Nomen und ihren Assoziationen. Michael Roth Relationen zwischen Nomen und ihren Assoziationen Michael Roth 2 Assoziationen sind psychologisch interessant. Wie erfolgt der Zugriff auf sie? Welche Bedeutung haben sie? erfüllen einen linguistischen

Mehr

Projektseminar "Texttechnologische Informationsmodellierung"

Projektseminar Texttechnologische Informationsmodellierung Projektseminar "Texttechnologische Informationsmodellierung" Ziel dieser Sitzung Nach dieser Sitzung sollten Sie: Einige standards und projekte vom Namen her kennen Einen Überblick über und einen Eindruck

Mehr

Kollokationen im Lernerwörterbuch

Kollokationen im Lernerwörterbuch Kollokationen im Lernerwörterbuch Anspruch und Wirklichkeit Jupp Möhring Universität Leipzig/ Herder-Institut Vortrag zur IDT 2009 Sektion H6: Phraseologie: Linguistische, kulturkontrastive und didaktische

Mehr

Korpuslinguistik in der linguistischen Lehre Erfolge und Misserfolge

Korpuslinguistik in der linguistischen Lehre Erfolge und Misserfolge Korpuslinguistik in der linguistischen Lehre Erfolge und Misserfolge 18. Januar 2011 D-Spin Workshop, BBAW, Berlin Inhalt Ideen und Resultate Hoffnungen und Enttäuschungen Bedürfnisse und Probleme Ausblick

Mehr

Lexik der gesprochenen Sprache aus der Sicht des DWDS

Lexik der gesprochenen Sprache aus der Sicht des DWDS Lexik der gesprochenen Sprache aus der Sicht des DWDS Alexander Geyken & Lothar Lemnitzer BBAW Workshop Lexik des gesprochenen Deutsch: Forschungsstand, Erwartungen und Anforderungen an die Entwicklung

Mehr

BibTip. Mit besten Empfehlungen. 4. April 2012 - OCLC Informationstag 2012 in Zürich. Boris Köberle

BibTip. Mit besten Empfehlungen. 4. April 2012 - OCLC Informationstag 2012 in Zürich. Boris Köberle BibTip Mit besten Empfehlungen 4. April 2012 - OCLC Informationstag 2012 in Zürich Boris Köberle Agenda Motivation Live Demo Integration Algorithmik Community Zusammenfassung Folie # 2 Agenda Motivation

Mehr

Technischer Bericht. Integration der KobRA-Verfahren in die IDS-Infrastrukturen

Technischer Bericht. Integration der KobRA-Verfahren in die IDS-Infrastrukturen Technischer Bericht Nr. 2016/3 (Meilenstein 4c) Integration der KobRA-Verfahren in die IDS-Infrastrukturen BMBF-Verbundprojekt: Korpus-basierte linguistische Recherche und Analyse mithilfe von Data-Mining

Mehr

OPUS 3.0. Frank Scholze Universitätsbibliothek Stuttgart. Tagung "Digitale Bibliothek im SWB Stuttgart, 14.12.2005

OPUS 3.0. Frank Scholze Universitätsbibliothek Stuttgart. Tagung Digitale Bibliothek im SWB Stuttgart, 14.12.2005 OPUS 3.0 Frank Scholze Stuttgart Tagung "Digitale Bibliothek im SWB Stuttgart, 14.12.2005 Entwicklung Projekt/Produkt der Universität Stuttgart (UB+RUS) mit enger Abstimmung zum BSZ seit Projektbeginn

Mehr

Ringvorlesung Methoden, HS 2009. Korpuslinguistik. Stefan Engelberg ( Mannheim (Institut für Deutsche Sprache & Universität

Ringvorlesung Methoden, HS 2009. Korpuslinguistik. Stefan Engelberg ( Mannheim (Institut für Deutsche Sprache & Universität Ringvorlesung Methoden, HS 2009 Korpuslinguistik Stefan Engelberg ( Mannheim (Institut für Deutsche Sprache & Universität Stefan Engelberg (IDS Mannheim), Mannheim, 4. November 2009 [Folie 1] 1.1 Was sind

Mehr

Ivana Daskalovska. Willkommen zur Übung Einführung in die Computerlinguistik. Sarah Bosch,

Ivana Daskalovska. Willkommen zur Übung Einführung in die Computerlinguistik. Sarah Bosch, Ivana Daskalovska Willkommen zur Übung Einführung in die Computerlinguistik Kontakt: ivana.bt.mk@gmail.com Betreff: EICL Wiederholung Aufgabe 1 Was ist Computerlinguistik? 4 Was ist Computerlinguistik?

Mehr

Onomasiologie, Semasiologie. Paradigmatische Wortbeziehungen. Lexikologie, FS 2012 Vilnius, den 13. März 2012

Onomasiologie, Semasiologie. Paradigmatische Wortbeziehungen. Lexikologie, FS 2012 Vilnius, den 13. März 2012 Onomasiologie, Semasiologie. Paradigmatische Wortbeziehungen Lexikologie, FS 2012 Vilnius, den 13. März 2012 Überblick Semasiologie Onomasiologie Paradigmatische Wortbeziehungen Wortfelder Wortfamilien

Mehr

Wissenschaftliches Arbeiten

Wissenschaftliches Arbeiten Teil 7: Argumentieren und Begründen 1 Grundregel: Spezifisch argumentieren Wissenschaftliches Arbeiten Nie mehr zeigen, als nötig oder gefragt ist. Sonst wird das Argument angreifbar und umständlich. Schwammige

Mehr

Anleitung zur Einrichtung des VPN-Zugangs für die Literatursuche aus dem Universitätsnetz

Anleitung zur Einrichtung des VPN-Zugangs für die Literatursuche aus dem Universitätsnetz Anleitung zur Einrichtung des VPN-Zugangs für die Literatursuche aus dem Universitätsnetz R. Korinthenberg Studiendekanat der Med. Fakultät Albert-Ludwigs-Universität Freiburg 1) Wenn Sie noch kein Antragsformular

Mehr

Experteninterview Zu Erwartungen, Anforderungen und Wünschen an ein Wörterbuch des gesprochenen Deutsch

Experteninterview Zu Erwartungen, Anforderungen und Wünschen an ein Wörterbuch des gesprochenen Deutsch Experteninterview Zu Erwartungen, Anforderungen und Wünschen an ein Wörterbuch des gesprochenen Deutsch Beginn der Umfrage: 13.12.2017 Ende der Umfrage: 01.03.2017 Pretest-TeilnehmerInnen : 4 TeilnehmerInnen:

Mehr

Die Sammlung unikaler Wörter des Deutschen Aufbauprinzipien und erste Auswertungsergebnisse

Die Sammlung unikaler Wörter des Deutschen Aufbauprinzipien und erste Auswertungsergebnisse Die Sammlung unikaler Wörter des Deutschen Aufbauprinzipien und erste Auswertungsergebnisse Manfred Sailer und Beata Trawiński SFB 441 Universität Tübingen {mf,trawinsk}@sfs.uni-tuebingen.de. EUROPHRAS

Mehr

11. Übung Informatik II - Operatorfunktionen

11. Übung Informatik II - Operatorfunktionen Stand: 26. Juni 2015 Inhalt 1 2 3 Übersicht 1 2 3 Warum Operatoren überladen? Großteil der Operatoren (Arithmetik, Logik, Vergleiche) nur für Standarddatentypen (Zahlen, Zeiger) implementiert vergleichbare

Mehr

Was ist ein Korpus. Zitat aus: Carstensen et al. Computerlinguistik und Sprachtechnologie: Eine Einführung. Kap. 4.2, Textkorpora

Was ist ein Korpus. Zitat aus: Carstensen et al. Computerlinguistik und Sprachtechnologie: Eine Einführung. Kap. 4.2, Textkorpora Was ist ein Korpus Korpora sind Sammlungen linguistisch aufbereitete(r) Texte in geschriebener oder gesprochener Sprache, die elektronisch gespeichert vorliegen. Zitat aus: Carstensen et al. Computerlinguistik

Mehr

Lexikologie der deutschen Gegenwartssprache. Herbstsemester 2011/2012 Assist. Daumantas Katinas

Lexikologie der deutschen Gegenwartssprache. Herbstsemester 2011/2012 Assist. Daumantas Katinas Lexikologie der deutschen Gegenwartssprache Herbstsemester 2011/2012 Assist. Daumantas Katinas 7.9.2011 Überblick 15 Lehrveranstaltungen Teilnahmepflicht an 10 Veranstaltungen 1 schriftliche Kontrollarbeit

Mehr

Die Regeln für Leichte Sprache

Die Regeln für Leichte Sprache Die Regeln für Leichte Sprache vom Netzwerk Leichte Sprache Die Regeln für Leichte Sprache Leichte Sprache ist wichtig Das ist zum schwere Sprache: Leichte Sprache. Leichte Sprache hilft vielen Menschen.

Mehr

Stefan Engelberg (IDS Mannheim), Workshop Corpora in Lexical Research, Bucharest, Nov. 2008 [Folie 1]

Stefan Engelberg (IDS Mannheim), Workshop Corpora in Lexical Research, Bucharest, Nov. 2008 [Folie 1] Content 1. Empirical linguistics 2. Text corpora and corpus linguistics 3. Concordances 4. Application I: The German progressive 5. Part-of-speech tagging 6. Fequency analysis 7. Application II: Compounds

Mehr

Wort, Name, Begriff, Terminus. Schlusszusammenfassung

Wort, Name, Begriff, Terminus. Schlusszusammenfassung Wort, Name, Begriff, Terminus Schlusszusammenfassung Seminar Ib Sommersemester 2006 Walther v.hahn Das Wort als zentrale Einheit der Sprache Das Wort ist das wichtigste Element der Sprache, denn weder

Mehr

Bachelor Modul E: Einführung in pädagogische Handlungsfelder und Grundbegriffe der Erziehungswissenschaft

Bachelor Modul E: Einführung in pädagogische Handlungsfelder und Grundbegriffe der Erziehungswissenschaft Philipp Annen (M.A.) Universitätsring 15 54296 Trier Raum: B 459 Tel.: 2376 Email: annen@uni-trier.de Seminarplan Wintersemester 2015/2016, Seminar 2Std., B 461 Veranstaltung: Pädagogische Grundbegriffe

Mehr

SQL. Structured Query Language

SQL. Structured Query Language SQL Structured Query Language Grundlagen zu Abfrage SQL Jede SQL-Abfrage enthält die drei Hauptbefehle: select (engl. auswählen), from (engl. von) und where (engl. wo). Mit select gibt man an, welche Spalten

Mehr

Ich baue ein eigenes Korpus

Ich baue ein eigenes Korpus Blockseminar Einführung in die Korpuslinguistik Seminarleitung: Yvonne Krämer, M.A. Ich baue ein eigenes Korpus Datengewinnung und aufbereitung Datengewinnung Das Untersuchungsinteresse bestimmt die benötigte

Mehr

Anleitung für Carcassonne-Turniere in der Brettspielwelt

Anleitung für Carcassonne-Turniere in der Brettspielwelt Anleitung für Carcassonne-Turniere in der Brettspielwelt Diese Anleitung hilft bei der Verwendung der Brettspielwelt (BSW) bei Carcassonne Qualifikations- und Ranglistenturnieren zur Qualifikation bei

Mehr

Das Sichtenkonzept im DWDS- Wortinformationssystem

Das Sichtenkonzept im DWDS- Wortinformationssystem Das Sichtenkonzept im DWDS- Wortinformationssystem Alexander Geyken, Edmund Pohl, Lothar Lemnitzer Berlin-Brandenburgische Akademie der Wissenschaften 6. Arbeitstreffen des Forschungsnetzwerks Internetlexikographie

Mehr

Überblick. GK C: Einführung in die Korpuslinguistik. Fragen. Sprachwandel/Sprachvariation. Fragen. NB: Register

Überblick. GK C: Einführung in die Korpuslinguistik. Fragen. Sprachwandel/Sprachvariation. Fragen. NB: Register GK C: Einführung in die Korpuslinguistik Anke Lüdeling anke.luedeling@rz.hu-berlin.de Sommersemester 2003 Überblick Registervariation multidimensionale Analyse Register quantitative Analyse Dimensionen:

Mehr

Das Design der Video-Lernspiele Eine Forschungs- und Designmethodik

Das Design der Video-Lernspiele Eine Forschungs- und Designmethodik Diese Website ist eine allgemein zugängliche Version meiner Doktorarbeit. dargelegt von René St-Pierre Ph.D. Doktorarbeit in studierten und angewandten Künsten Universität von Quebek in Montreal (UQAM)

Mehr

Linguistische Informatik

Linguistische Informatik Linguistische Informatik Gerhard Heyer Universität Leipzig heyer@informatik.uni-leipzig.de Institut für Informatik Das klassische Verarbeitungsmodell Lexikon Grammatik Input: natürlichsprachlicher Satz

Mehr

Office 365 On Premise oder Cloud? Stephan Krüger

Office 365 On Premise oder Cloud? Stephan Krüger Office 365 On Premise oder Cloud? Stephan Krüger Inhalt - Office 2016 Neue Features - Klassische Lizensierung - Was ist Office 365? - Business Pläne vs Enterprise Pläne - MSI Deployment und Updateverteilung

Mehr

HOSTED EXCHANGE MICROSOFT OUTLOOK 2016 FÜR WINDOWS Skyfillers Handbuch

HOSTED EXCHANGE MICROSOFT OUTLOOK 2016 FÜR WINDOWS Skyfillers Handbuch HOSTED EXCHANGE MICROSOFT OUTLOOK 2016 FÜR WINDOWS Skyfillers Handbuch INHALT Outlook herunterladen und installieren... 2 Neues Outlook Profil erstellen und Postfach einrichten... 7 Exchange Postfach in

Mehr

Medienrecht und Persönlichkeitsrecht

Medienrecht und Persönlichkeitsrecht Germanistik Anna Mikhaylova Medienrecht und Persönlichkeitsrecht Studienarbeit Inhaltsverzeichnis Einleitung 2 I. Fragestellungen des Medienrechts...4 1. Begriff und Einordnung des Medienrechts..4 2.

Mehr

Zugriff vom Privatcomputer auf «Mein Intranet VSZ» (Verwaltungsnetz)

Zugriff vom Privatcomputer auf «Mein Intranet VSZ» (Verwaltungsnetz) Zugriff vom Privatcomputer auf «Mein Intranet VSZ» (Verwaltungsnetz) Download Citrix-Receiver unter Microsoft Windows Anleitung für Teammitglieder Eveline Bearth Vers. 3.0 / Zürich, 22. April 2018 1 Citrix

Mehr

Linguistische Informatik

Linguistische Informatik Linguistische Informatik Gerhard Heyer Universität Leipzig heyer@informatik.uni-leipzig.de Institut für Informatik Das klassische Verarbeitungsmodell Lexikon Grammatik Input: natürlichsprachlicher Satz

Mehr

Linguistische Forschungsdaten

Linguistische Forschungsdaten Linguistische Forschungsdaten Andreas Witt Institut für Deutsche Sprache (IDS), Mannheim 45 Jahre und mehr IDS, Korpora, Verfügbarkeit, rechtliche Fragen (1) 1964 Das Institut für Deutsche Sprache wird

Mehr

Verfügbare Deutsche Korpora (gesprochene und geschriebene Texte)

Verfügbare Deutsche Korpora (gesprochene und geschriebene Texte) Verfügbare Deutsche Korpora (gesprochene und geschriebene Texte) Chatkorpus von Michael Beißwenger http://www.linse.uni-due.de/tl_files/pdfs/publikationen-rezensionen/chatkorpus_beisswenger_2013.pdf Hamburg

Mehr

Corpus-based language analysis in research and teaching:

Corpus-based language analysis in research and teaching: Corpus-based language analysis in research and teaching: Experiences, requirements and perspectives Angelika Storrer Corpus-based research projects Bericht zur Lage der deutschen Sprache [report on the

Mehr