Korpuslinguistik IDS-Korpora und COSMAS II

Größe: px
Ab Seite anzeigen:

Download "Korpuslinguistik IDS-Korpora und COSMAS II"

Transkript

1 Korpuslinguistik IDS-Korpora und COSMAS II Heike Zinsmeister Korpuslinguistik

2 Gliederung 1 Einleitung 2 Korpusbestand am IDS 3 Korpusrecherche mit COSMAS II 4 Referenzen

3 Das Institut für Deutsche Sprache (IDS) Hintergrund das IDS befindet sich in Mannheim beherbergt die größte zentrale Sammlung deutschsprachiger Korpora Beispiele korpus-basierter Arbeiten am IDS dreibändige IDS-Grammatik (Zifonun et al. 1997) Online-Referenzlexikon des Projekts Elexiko Online-Referenzgrammatik des Projekts grammis Arbeiten zu Neologismen

4 Gliederung 1 Einleitung 2 Korpusbestand am IDS 3 Korpusrecherche mit COSMAS II 4 Referenzen

5 Korpora am IDS Zwei Verwaltungsstellen geschriebene Sprache: Korpusarchiv der Arbeitsgruppe für Korpustechnologie gesprochene Sprache: Archiv für gesprochenes Wort (AGD) der Abteilung Pragmatik

6 Korpora geschriebener Sprache COSMAS II neuerdings auch DeReKo (= Deutsches Referenzkorpus) zwei Milliarden Token in 50 Korpora ca. zwei Drittel sind für wissenschaftliche Zwecke frei nutzbar Schwerpunkt liegt auf Standardsprache und Zeitungstexte nach 1945, zusätzlich Belletristik, Trivial- uns Fachliteratur 5 Korpora (7 Millionen Token) entstammen aus den Jahren

7 Korpora gesprochener Sprache AGD 50 Korpora mit mehr als 4000 Stunden Video- und Audioaufnahmen knapp drei Viertel sind für wissenschaftliche Zwecke frei nutzbar; 2 Millionen transkribierte Token umfasst unterschiedliche Varietäten des Deutschen im Inund Ausland

8 Organisation der Korpora (1) Archive Die ca. 190 COSMAS II-Korpora sind in 7 Archiven organisiert W: Archiv der geschriebenen Korpora (das größte Archiv) N: Archiv der neuakquirierten geschriebenen Korpora HIK: Archiv der historischen Korpora FNZ: Archiv der frühen Nachkriegszeit TAGGED: Archiv der morphosyntaktisch annotierten Korpora WK-PH: Archiv der phasengegliederten Korpora W-Übrig: Archiv der aussortierten geschriebenen Korpora SZ: Archiv der Süddeutschen Zeitung (nur IDS-intern nutzbar)

9 Organisation der Korpora (2) Interner Aufbau der Archive Archive bestehen aus Teilkorpora, größtenteils externe Korpora z.b. Teilkorpus des Bonner Limas-Korpus (1 Millionen Token) Teilkorpora gliedern sich in Dokumente, z.b. das taz-teilkorpus von 1997 in zwölf Dokumente. Dokumente bestehen aus einzelnen Texten, z.b. das Dokument von Juli 1997 aus Texten.

10 Aufbereitung der Korpora Abfragbare Annotation Textstruktur Lemmata Flexionsmorphologie Morphsyntax (= Wortarten), eingeschränkt

11 Gliederung 1 Einleitung 2 Korpusbestand am IDS 3 Korpusrecherche mit COSMAS II 4 Referenzen

12 Zugriff auf die Korpora mit COSMAS II Virtuelle Korpora für die Recherche fasst der Nutzer Teilkorpora, Dokumente und/oder Texte zu einem virtuellen Korpus zusammen. zusätzlichen werden vordefinierte virtuelle Korpora angeboten Virtuelles Korpus Zusammensetzung Anmerkung Zugang TAG-gesamt mm-tag lim-tag das gesamte Archiv spiegel-tag TAG-öffentlich mm-tag lim-tag der öffentliche Teil des Archivs lim-tag lim-tag LIMAS-Korpus, annotiert mm-tag m91-tag m94-tag Mannheimer Morgen, m95-tag m96-tag annotiert nichtöffentl. öffentl. öffentl. öffentl.

13 Zugriff auf die Korpora mit COSMAS II Registrierung ist nötig, aber kostenfrei und automatisiert per . Drei Zugangsarten Online: COSMAS IIweb Windows-Client: COSMAS IIwin (am komfortabelsten) Skript-basiert: COSMAS IIscript

14 Suche mit COSMAS II Suchmodus grafisch zeilenbasiert Suchinhalte Frequenzen von einzelnen Wörtern/Lemmata, Wortteilen, Wortkombinationen, Kontextbedingungen, (Wortarten) Ausgabe Frequenzen, Kollokationen (LogLikelihood Score), Konkordanz mit Kontext, Volltext (einschließlich Quellennachweis), Export nach.txt und.rtf (max Treffer)

15 Die Anfragesprache (1) Einfache Suchausdrücke Anfrage Treffer Haus Haus nur die Wortform Haus &Haus Haus, Hauses, alle Flexionsformen Häuser,... von Haus be* bei, Belag, Besen, alle Wortformen, die bereit... mit be- beginnen *chen bisschen, alle Wortformen, die Häuschen, mischen, mit -chen enden Wochen... (nach Scherer 2006, S.82)

16 Die Anfragesprache (2) Komplexe Suchausdrücke: Operatoren Anfrage Treffer se?en Segen, sehen, seien,,, alle Wortformen, bei denen zwischen se und en genau ein Buchstabe steht se+en Seen, Segen, sehen, seien... se*en sechsten, Seen, Segen, sehen,... alle Wortformen, bei denen zwischen se und en kein oder genau ein Buchstabe steht alle Wortformen, bei denen zwischen se und en beliebig viele Buchstaben stehen (nach Scherer 2006, S.82)

17 Die Anfragesprache (3) Morphologische Annotation & Satzzeichen Anfrage &be- Treffer bekochen, belügen, beraten, besingen.. alle Wortformen, die das Präfix be- enthalten alle Wortformen, die das Suffix -chen enthalten alle Sätze, die mit einem Fragezeichen enden. &-chen Bäumchen, Häuschen, Kindchen... \$ Was hast du gesagt? (nach Scherer 2006, S.82)

18 Ablauf einer Suchabfrage (1) 1. Wahl eines Archivs 2. Definition eines virtuellen Korpus 3. Formulieren der Suchanfrage für Zugriff auf morphologische Analyse im Menü Einstellungen die Lemmatisierung von Komposita und anderen Wordbildungsformen aktivieren 4. Suche starten mit der Erzeugung einer Wortformenliste Abfrage vorbereiten

19 Ablauf einer Suchabfrage (2) 5. Auswahl der Wortformen für weitere Inspektion (Ankreuzen) 6. Bereitstellung der Fundstellen Ergebnisse 7. KWIC-Format (Kontextgröße einstellen): ggf. weitere Auswahl 8. Volltextanzeige (Kontextgröße einstellen): ggf. weitere Auswahl 9. Export der KWIC- oder Volltextinformation

20 Gliederung 1 Einleitung 2 Korpusbestand am IDS 3 Korpusrecherche mit COSMAS II 4 Referenzen

21 Referenzen Hauptquellen Online-Dokumentation von COSMAS II Scherer, C. (2006): Korpuslinguistik. Heidleberg: Universitätsverlag Winter, Kap. 5.3 Weitere Literatur Lemnitzer, L. und H. Zinsmeister (2006): Korpuslinguistik. Eine Einführung. Tübingen: Narr, S. 90ff. Zifonun, G. et al. (1997): Grammatik der deutschen Sprache. Berlin: de Gruyter.

COSMAS II Corpus Search Management and Analysis System

COSMAS II Corpus Search Management and Analysis System COSMAS II Corpus Search Management and Analysis System http://www.ids-mannheim.de/cosmas2/ 13. November 2012, Jeanette Isele Seminar: Korpuslinguistik Übersicht Theoretischer Teil Was ist COSMAS II? Die

Mehr

Korpusanalyse am IDS Die Korpora

Korpusanalyse am IDS Die Korpora Die Korpora DeReKo: Das Deutsche Referenzkorpus Die Korpora am IDS Größe: über 3,4 Milliarden Textwörter (Stand: 2008) Akquise: im Hinblick auf Umfang, Variabilität, Qualität und Aktualität; urheberrechtlich

Mehr

Zugang zur Konkordanzsuche

Zugang zur Konkordanzsuche Zugang zur Konkordanzsuche 1.1 Zugriff Mit dem Recherchetool können Sie: - Konkordanzen (= eine Liste aller Vorkommen eines Suchwortes im Kontext) aus der Verbalspur und den Annotationen erstellen, - Metadaten

Mehr

Korpuslinguistik. Vorlesungsreihe»Methoden der Linguistik«(WS 2004/05) Universität Zürich, Korpuslinguistik. Jürgen Spitzmüller.

Korpuslinguistik. Vorlesungsreihe»Methoden der Linguistik«(WS 2004/05) Universität Zürich, Korpuslinguistik. Jürgen Spitzmüller. Vorlesungsreihe»Methoden der Linguistik«(WS 2004/05) Universität Zürich, 7.12.2004 1. Teil: Theorie Grundlegende theoretische Fragestellungen: Was sind überhaupt Korpora? Wozu Korpora? Was sollen Korpora

Mehr

Korpuslinguistik Grundlagen Korpusrecherchemethoden

Korpuslinguistik Grundlagen Korpusrecherchemethoden Methoden der Korpusanalyse Erstellung von Konkordanzen Erzeugung von Wortlisten mit Frequenzangaben Ermittlung von hochfrequenten Wortgruppen (Clusteranalyse) Berechnung von Kookkurrenzen Ermittlung von

Mehr

Intelligente Recherchestrategien für e-humanities Universität Duisburg-Essen

Intelligente Recherchestrategien für e-humanities Universität Duisburg-Essen Intelligente Recherchestrategien für e-humanities Universität Duisburg-Essen Softwaretest COSMAS II Client v3.6.1 Das Korpusrecherche- und -analyse-system COSMAS (Corpus Search, Management and Analysis

Mehr

Korpusanalyse am IDS Die Korpora

Korpusanalyse am IDS Die Korpora Die Korpora DeReKo: Das Deutsche Referenzkorpus Die Korpora am IDS Größe: über 3,4 Milliarden Textwörter (Stand: 2008) Akquise: im Hinblick auf Umfang, Variabilität, Qualität und Aktualität; urheberrechtlich

Mehr

COSMAS. (Corpus Storage, Maintenance and Access System)

COSMAS. (Corpus Storage, Maintenance and Access System) COSMAS (Corpus Storage, Maintenance and Access System) 1. Möglichkeiten von COSMAS - Suchen und Kombinationssuchen in einem vordefinierten Korpus. Die vordefinierten Korpora sind in Anlage 1 aufgelistet.

Mehr

Was ist ein Korpus. Zitat aus: Carstensen et al. Computerlinguistik und Sprachtechnologie: Eine Einführung. Kap. 4.2, Textkorpora

Was ist ein Korpus. Zitat aus: Carstensen et al. Computerlinguistik und Sprachtechnologie: Eine Einführung. Kap. 4.2, Textkorpora Was ist ein Korpus Korpora sind Sammlungen linguistisch aufbereitete(r) Texte in geschriebener oder gesprochener Sprache, die elektronisch gespeichert vorliegen. Zitat aus: Carstensen et al. Computerlinguistik

Mehr

Kookkurrenzanalyse Einführung

Kookkurrenzanalyse Einführung Einführung Kookkurenzanalyse die grundlegende Idee 1) Beobachtung: In einem Korpus tritt Wort X 1000mal auf, Wort Y 100mal, Wort Z 10mal. 2) Wahrscheinlichkeit: Die Kombination XY ist 10mal so wahrscheinlich

Mehr

Digital Humanities Recherche im DWDS und DTA

Digital Humanities Recherche im DWDS und DTA Digital Humanities Recherche im DWDS und DTA mit Booleschen Operatoren und Regulären Ausdrücken Jena Language & Information Engineering (JULIE) Lab Friedrich-Schiller-Universität Jena, Germany http://www.julielab.de

Mehr

Korpuslinguistik Grundlagen Korpora

Korpuslinguistik Grundlagen Korpora Was ist ein Korpus? Lemnitzer, Lothar und Heike Zinsmeister. Korpuslinguistik. Eine Einführung. Tübingen: Narr, 2006. S. 7. Stefan Engelberg, Linguistische Methodenlehre, FS 2009, Uni Mannheim [Folie 1]

Mehr

DWDS-Kernkorpus / DWDS-Korpusanalyse

DWDS-Kernkorpus / DWDS-Korpusanalyse Korpusrecherchesysteme Das DWDS-Kernkorpus DWDS-Kernkorpus / DWDS-Korpusanalyse Entwickler: Berlin-Brandenburgische Akademie der Wissenschaften. Version: (keine Versionierung). Recherche: online. Software:

Mehr

Offener Diskurs: Sprachdaten in Deutschland. Prof. Andreas Witt (Institut für Deutsche Sprache)

Offener Diskurs: Sprachdaten in Deutschland. Prof. Andreas Witt (Institut für Deutsche Sprache) Offener Diskurs: Sprachdaten in Deutschland Prof. Andreas Witt (Institut für Deutsche Sprache) 1 Institut für Deutsche Sprache (IDS) Das Institut für Deutsche Sprache ist die zentrale außeruniversitäre

Mehr

Kurze literarische Texte in literaturwissenschaftlicher und linguistischer Perspektive. Lyrik seit den 1990er Jahren

Kurze literarische Texte in literaturwissenschaftlicher und linguistischer Perspektive. Lyrik seit den 1990er Jahren Kurze literarische Texte in literaturwissenschaftlicher und linguistischer Perspektive Lyrik seit den 1990er Jahren Christine Hummel & Stefan Engelberg Institut für Deutsche Sprache, Mannheim Universität

Mehr

Forschungsdaten in den Geisteswissenschaften die germanistische Sprachwissenschaft

Forschungsdaten in den Geisteswissenschaften die germanistische Sprachwissenschaft Forschungsdaten in den Geisteswissenschaften die germanistische Sprachwissenschaft Andreas Witt Institut für Deutsche Sprache, Mannheim Workshop Forschungsdaten WGL Geschäftsstelle Berlin 2012-05-10 Institut

Mehr

Korpusbasierte Sprachreflexion mit Online-Ressourcen. Heike Zinsmeister Institut für Maschinelle Sprachverarbeitung Universität Stuttgart

Korpusbasierte Sprachreflexion mit Online-Ressourcen. Heike Zinsmeister Institut für Maschinelle Sprachverarbeitung Universität Stuttgart Korpusbasierte Sprachreflexion mit Online-Ressourcen Heike Zinsmeister Institut für Maschinelle Sprachverarbeitung Universität Stuttgart CLARIN-D Common Language Resources and Technology Infrastructure

Mehr

ANNIS Quickstart

ANNIS Quickstart Suche in ANNIS Bevor man suchen kann, muss das gewünschte Korpus in der Korpusliste ausgewählt werden (z.b. das Teilkorpus mo (monoethnisches Ergänzungskorpus) oder KiDKo mu (multiethnisches Korpus). Danach

Mehr

Die Corpus Workbench und ihre Syntax. Blockseminar Einführung in die Korpuslinguistik Seminarleitung: Yvonne Krämer, M.A.

Die Corpus Workbench und ihre Syntax. Blockseminar Einführung in die Korpuslinguistik Seminarleitung: Yvonne Krämer, M.A. Die Corpus Workbench und ihre Syntax Blockseminar Einführung in die Korpuslinguistik Seminarleitung: Yvonne Krämer, M.A. Die IMS Open Corpus Workbench (CWB) Mächtige Konkordanz- und Korpusanalyse-Software

Mehr

MIT COSMAS II»IN DEN WEITEN DER IDS-KORPORA UNTERWEGS«

MIT COSMAS II»IN DEN WEITEN DER IDS-KORPORA UNTERWEGS« 02 FORSCHUNG Franck Bodmer Mory MIT COSMAS II»IN DEN WEITEN DER IDS-KORPORA UNTERWEGS«Abb. 1: Die Web-Oberfläche von COSMAS II mit Benutzerkorpus Finanzen..." Einleitung cosmas ii (= Corpus Search, Management

Mehr

Aufgaben aus Kegli 2 (Korpuslinguistik)

Aufgaben aus Kegli 2 (Korpuslinguistik) Aufgaben aus Kegli 2 (Korpuslinguistik) Kapitel 1 1. Überprüfen Sie mithilfe einer beliebigen Suchmaschine den Sprachgebrauch im Internet. Finden Sie die Formen wegen dem Regen bzw. wegen des Regens und

Mehr

Linguistische Forschungsdaten

Linguistische Forschungsdaten Linguistische Forschungsdaten Andreas Witt Institut für Deutsche Sprache (IDS), Mannheim 45 Jahre und mehr IDS, Korpora, Verfügbarkeit, rechtliche Fragen (1) 1964 Das Institut für Deutsche Sprache wird

Mehr

Korpora. Referenten Duyen Tao-Pham Nedyalko Georgiev

Korpora. Referenten Duyen Tao-Pham Nedyalko Georgiev Korpora Referenten Duyen Tao-Pham Nedyalko Georgiev Hauptseminar: Angewandte Linguistische Datenverarbeitung (WS 11/12) Dozent: Prof. Dr. Jürgen Rolshoven Sprachliche Informationsverarbeitung Universität

Mehr

Einführung. Stefanie Dipper Stefan Evert Heike Zinsmeister

Einführung. Stefanie Dipper Stefan Evert Heike Zinsmeister Einführung Stefanie Dipper Stefan Evert Heike Zinsmeister München, 28.1.2011 Korpus eine Sammlung gesprochener oder geschriebener Äußerungen typischerweise digitalisiert und maschinenlesbar Ebenen eines

Mehr

Einsteiger-Tutorial zu Korpusrecherchen mit COSMAS II

Einsteiger-Tutorial zu Korpusrecherchen mit COSMAS II Einsteiger-Tutorial zu Korpusrecherchen mit COSMAS II Angenommen, wir wollen mit Hilfe von COSMAS II den Gebrauch des Erstglieds (Präfixoids?) Schwarz- bei Personenbezeichnungen auf -er nachvollziehen,

Mehr

Inhalt und Typen von Korpora. Welche Sprachinhalte können Korpora haben und welche Arten von Korpora gibt es

Inhalt und Typen von Korpora. Welche Sprachinhalte können Korpora haben und welche Arten von Korpora gibt es Inhalt und Typen von Korpora Welche Sprachinhalte können Korpora haben und welche Arten von Korpora gibt es Inhalt von Korpora Korpora können die verschiedensten Texte in den unterschiedlichsten Zusammensetzungen

Mehr

Doris Steffens / Doris al-wadi. Neuer Wortschatz. Neologismen im Deutschen Band 2: kiten Z

Doris Steffens / Doris al-wadi. Neuer Wortschatz. Neologismen im Deutschen Band 2: kiten Z Doris Steffens / Doris al-wadi Neuer Wortschatz Neologismen im Deutschen 2001 2010 Band 2: kiten Z Bibliografische Information der Deutschen Nationalbibliothek Die Deutsche Nationalbibliothek verzeichnet

Mehr

Korpora zu geschriebener und gesprochener Sprache

Korpora zu geschriebener und gesprochener Sprache FAU Erlangen-Nürnberg Stand: 25.05.2015 Department Germanistik und Komparatistik Lehrstuhl für Germanistische Sprachwissenschaft Andreas Blombach Korpora zu geschriebener und gesprochener Sprache 1 Geschriebenes

Mehr

Sprachressourcen in der Lehre: Erfahrungen aus der historischen Korpuslinguis7k

Sprachressourcen in der Lehre: Erfahrungen aus der historischen Korpuslinguis7k Arbeitsstelle Computerphilologie Sprachressourcen in der Lehre: Erfahrungen aus der historischen Korpuslinguis7k Cris%na Vertan cris%na.vertan@uni hamburg.de 18.01.2011 1 Überblick Das Kontext (Lehrangebot

Mehr

Swantje Westpfahl & Thomas Schmidt POS für(s) FOLK

Swantje Westpfahl & Thomas Schmidt POS für(s) FOLK Swantje Westpfahl & Thomas Schmidt POS für(s) FOLK Problemanalyse des POS- Taggings für spontansprachliche Daten anhand des Forschungsund Lehrkorpus Gesprochenes Deutsch 2 FOLK Forschungs- und Lehrkorpus

Mehr

linguistischer und literaturwissenschaftlicher Perspektive

linguistischer und literaturwissenschaftlicher Perspektive Sprachliche Eigenarten literarischer Kurzformen in linguistischer und literaturwissenschaftlicher Perspektive Stefan Engelberg & Christine Hummel Institut für Deutsche Sprache, Mannheim Universität Freiburg

Mehr

Computerlinguistische Grundlagen. Jürgen Hermes Sommersemester 17 Sprachliche Informationsverarbeitung Institut für Linguistik Universität zu Köln

Computerlinguistische Grundlagen. Jürgen Hermes Sommersemester 17 Sprachliche Informationsverarbeitung Institut für Linguistik Universität zu Köln Computerlinguistische Grundlagen Jürgen Hermes Sommersemester 17 Sprachliche Informationsverarbeitung Institut für Linguistik Universität zu Köln Computerlinguistik: Schnittstellen Computerlinguistik aus

Mehr

Gebrauchsorien-erte Sprachbeschreibung: Korpuslinguis-sche Analysen von (Fast-)Synonymen

Gebrauchsorien-erte Sprachbeschreibung: Korpuslinguis-sche Analysen von (Fast-)Synonymen Gebrauchsorien-erte Sprachbeschreibung: Korpuslinguis-sche Analysen von (Fast-)Synonymen Heike Zinsmeister Seminar Krea-ves Schreiben Universität Vilnius 25.10.2017 Online: hmps://www.korpuslab.uni-hamburg.de/lehrmaterialien/diverses.html

Mehr

TextGrid Arbeitsgruppen

TextGrid Arbeitsgruppen TextGrid Arbeitsgruppen Eine Reihe von Arbeitsgruppen in TextGrid behandeln bestimmte Themengebiete und sichern die Arbeitspaket-übergreifende Diskussion. Sie arbeiten Themengebiete zur effizienten Informationsweitergabe

Mehr

Sprachdaten sammeln und auswerten

Sprachdaten sammeln und auswerten 130 Sprachdaten sammeln und auswerten Die Korpuslinguistik am Institut für Deutsche Sprache (IDS) Von Peter Anliker 1 Im Jahr 1964, also vor fünfzig Jahren, wurde in Mannheim das Institut für Deutsche

Mehr

Reguläre Ausdrücke. Reguläre Ausdrücke = Regular Expressions = reg.exp./regexp/regexp = RE

Reguläre Ausdrücke. Reguläre Ausdrücke = Regular Expressions = reg.exp./regexp/regexp = RE Blockseminar Einführung in die Korpuslinguistik Seminarleitung: Yvonne Krämer, M.A. REGULAR EXPRESSIONS RegExp Was ist ein regulärer Ausdruck? = Regular Expressions = reg.exp./regexp/regexp = RE Ein regulärer

Mehr

Korpuslinguistik Annis 3 -Korpussuchtool Suchen in tief annotierten Korpora

Korpuslinguistik Annis 3 -Korpussuchtool Suchen in tief annotierten Korpora Korpuslinguistik Annis 3 -Korpussuchtool Suchen in tief annotierten Korpora Anke Lüdeling, Marc Reznicek, Amir Zeldes, Hagen Hirschmann... und anderen Mitarbeitern der HU-Korpuslinguistik Ziele Wie/Was

Mehr

SCHNITTSTELLEN ZUR NUTZUNG DER KORPUSANALYSEPLATTFORM KORAP

SCHNITTSTELLEN ZUR NUTZUNG DER KORPUSANALYSEPLATTFORM KORAP Marc Kupietz und Nils Diewald SCHNITTSTELLEN ZUR NUTZUNG DER KORPUSANALYSEPLATTFORM KORAP KobRA-Abschlusstagung, 30.10.2015 ÜBERBLICK 1. 2. 3. 4. 5. IDS im KobRA-Projekt KorAP Schnittstellen Protokoll

Mehr

Korpuslinguistik Annis 3 -Korpussuchtool Linguistische Suchen im Ridges-Korpus LAUDATIO-Workshop Hagen Hirschmann

Korpuslinguistik Annis 3 -Korpussuchtool Linguistische Suchen im Ridges-Korpus LAUDATIO-Workshop Hagen Hirschmann Korpuslinguistik Annis 3 -Korpussuchtool Linguistische Suchen im Ridges-Korpus 07.10.2014 LAUDATIO-Workshop Hagen Hirschmann Was ist ANNIS? ANNIS steht für ANNotation of Information Structure http://www.sfb632.uni-potsdam.de/d1/annis/

Mehr

Das Zusammenspiel interpretativer und automatisierbarer Verfahren bei der Aufbereitung und Auswertung mündlicher Daten

Das Zusammenspiel interpretativer und automatisierbarer Verfahren bei der Aufbereitung und Auswertung mündlicher Daten Das Zusammenspiel interpretativer und automatisierbarer Verfahren bei der Aufbereitung und Auswertung mündlicher Daten Ein Fallbeispiel aus der angewandten Wissenschaftssprachforschung Cordula Meißner

Mehr

Einleitung. Definitionen von Korpuslinguistik und das Repräsentativitätsmerkmal

Einleitung. Definitionen von Korpuslinguistik und das Repräsentativitätsmerkmal Definitionen von Korpuslinguistik und das Repräsentativitätsmerkmal Einleitung 1. Einleitung 2. Definitionen von Korpuslinguistik 2.1 Entstehung 2.1.1 : korpusbasiert vs. korpusgestützt 2.1.2 Generative

Mehr

Valenz Syntaktische Valenz

Valenz Syntaktische Valenz Valenz Syntaktische Valenz Anm. 1: Verbunabhängige Unzulässigkeit von Valenzrahmen a. sie hat verkauft b. sie hat den Porsche verkauft c. sie hat an ihren Freund verkauft d. sie hat den Porsche an ihren

Mehr

Daten Methoden Theorien Definitionen & Operationalisierungen

Daten Methoden Theorien Definitionen & Operationalisierungen Operationale Verfahren Daten Methoden Theorien Definitionen & Operationalisierungen Das Überbrückungsproblem Hypothese Explizite Formulierung einer als wahr vermuteten, begründbaren Aussage über das Phänomen

Mehr

Daten Methoden Theorien Definitionen & Operationalisierungen

Daten Methoden Theorien Definitionen & Operationalisierungen Definitionen Daten Methoden Theorien Definitionen & Operationalisierungen Eine Realdefinition legt fest, wie ein Ausdruck verwendet wird, indem sie die Beobachtungen, das Wissen, die Intuitionen, die wir

Mehr

Korpus. Was ist ein Korpus?

Korpus. Was ist ein Korpus? Was ist ein Korpus? Korpus Endliche Menge von konkreten sprachlichen Äußerungen, die als empirische Grundlage für sprachwiss. Untersuchungen dienen. Stellenwert und Beschaffenheit des Korpus hängen weitgehend

Mehr

Korpus Beratungsgespräche (BG--)

Korpus Beratungsgespräche (BG--) 1 Institut für Deutsche Sprache, Mannheim Abteilung Pragmatik: Archiv für Gesprochenes Deutsch URL: http://agd.ids-mannheim.de 2014 IDS, Mannheim Korpus Beratungsgespräche (BG--) Korpus_Projekt_Kurzbeschreibung

Mehr

EVA-MARIA HEINLE. Diachronische Wortbildung unter syntaktischem Aspekt. Das Adverb. Universitätsverlag WINTER. Heidelberg

EVA-MARIA HEINLE. Diachronische Wortbildung unter syntaktischem Aspekt. Das Adverb. Universitätsverlag WINTER. Heidelberg EVA-MARIA HEINLE Diachronische Wortbildung unter syntaktischem Aspekt Das Adverb Universitätsverlag WINTER Heidelberg INHALTSVERZEICHNIS INHALTSVERZEICHNIS ABKÜRZUNGSVERZEICHNIS iii 1. Quellen iii 2. Zeitschriften-

Mehr

ordnet.dk und elexiko ein Vergleich Jörg Asmussen Gesellschaft für dänische Sprache und Literatur, DSL

ordnet.dk und elexiko ein Vergleich Jörg Asmussen Gesellschaft für dänische Sprache und Literatur, DSL ordnet.dk und elexiko ein Vergleich Jörg Asmussen Gesellschaft für dänische Sprache und Literatur, DSL Inhaltsübersicht 1. Wörterbücher und Korpora der DSL 2. Das Projekt ordnet.dk 3. Vergleich elexiko

Mehr

Das Sichtenkonzept im DWDS- Wortinformationssystem

Das Sichtenkonzept im DWDS- Wortinformationssystem Das Sichtenkonzept im DWDS- Wortinformationssystem Alexander Geyken, Edmund Pohl, Lothar Lemnitzer Berlin-Brandenburgische Akademie der Wissenschaften 6. Arbeitstreffen des Forschungsnetzwerks Internetlexikographie

Mehr

Daten Methoden Theorien Hypothesen

Daten Methoden Theorien Hypothesen Hypothesen Die Wahrheit von wenn-dann-sätzen ergibt sich aus der Wahrheitstabelle für konditionale Verknüpfungen. wenn p, dann q p p nicht p nicht p q nicht q q nicht q WAHR FALSCH WAHR WAHR ϕ ist ein

Mehr

Einsteiger-Tutorial zu Korpusrecherchen mit WaCkY

Einsteiger-Tutorial zu Korpusrecherchen mit WaCkY Einsteiger-Tutorial zu Korpusrecherchen mit WaCkY Um Sprachdaten aus dem Internet zu gewinnen, waren Linguistinnen lange auf konventionelle Suchmaschinen angewiesen. Dies hatte den Nachteil, dass quantitative

Mehr

Emprirische Lexikologie

Emprirische Lexikologie Emprirische Lexikologie Stefan Engelberg Hauptseminar, Uni Mannheim, Herbst 2007 http://www.ids-mannheim.de/ll/lehre/engelberg/ Webseite_Empirische_Lexikologie/Empirische_Lexikologie.html engelberg@ids-mannheim.de

Mehr

Deutsches Textarchiv (DTA)

Deutsches Textarchiv (DTA) Deutsches Textarchiv (DTA) Einführung in die Korpuslinguistik Vortrag am 05.11.2014 Stefanie Bischoff (MA Europäische Sprachen); 1. Semester Romy Sachs (BA Germanistik / Philosophie); 5. Semester Gliederung

Mehr

Syntaktische Tendenzen der Gegenwartssprache

Syntaktische Tendenzen der Gegenwartssprache Syntaktische Tendenzen der Gegenwartssprache Anforderungen: Regelmäßige Teilnahme: max. 2 Fehlzeiten Vorbereitung auf die Sitzung: Text lesen, Fragen notieren, mitdiskutieren (!) Leitung einer Sitzung

Mehr

Inhaltsverzeichnis [Beispiel]

Inhaltsverzeichnis [Beispiel] Satzmuster für die Kurzen Einführungen in die germanistische Linguistik (Kegli) Universitätsverlag Winter, Heidelberg Inhaltsverzeichnis [Beispiel] 1. Einleitung Schriftgröße: 14pt 1 1.1 Sprache in Literatur

Mehr

. Syntaktische und semantische Annotation frühneuhochdeutscher Hexenverhörprotokolle. Fabian Barteld 29.11.2013

. Syntaktische und semantische Annotation frühneuhochdeutscher Hexenverhörprotokolle. Fabian Barteld 29.11.2013 .. Syntaktische und semantische Annotation frühneuhochdeutscher Hexenverhörprotokolle Fabian Barteld Fabian.Barteld@uni-hamburg.de 29.11.2013 Fabian Barteld Annotation frnhd. Hexenverhörprotokolle 29.11.2013

Mehr

Das Deutsche Textarchiv als Repositorium und Werkzeug. Frank Wiegand (BBAW) Deutsches Textarchiv

Das Deutsche Textarchiv als Repositorium und Werkzeug. Frank Wiegand (BBAW) Deutsches Textarchiv Das Deutsche Textarchiv als Repositorium und Werkzeug Frank Wiegand (BBAW) Deutsches Textarchiv www.deutschestextarchiv.de wiegand@bbaw.de Deutsches Textarchiv Referenzkorpus für die schriftliche neuhochdeutsche

Mehr

2. 1. Suche vorbereiten

2. 1. Suche vorbereiten 2. 1. Suche vorbereiten Wie soll ich suchen? Wie weiss ich, dass mir bei der Suche nichts entgangen ist? Wo finde ich die relevanten Publikationen, Quellen und Informationen? Eine gut vorbereitete Suche

Mehr

Teil I. Anspruch und Ziele des Berichts. Open Access

Teil I. Anspruch und Ziele des Berichts. Open Access ZRS 2014; 6(1 2): 10 16 Open Access DOI 10.1515/zrs-2014-0003 Deutsche Akademie für Sprache und Dichtung, Union der deutschen Akademien der Wissenschaften (Hg.). 2013. Reichtum und Armut der deutschen

Mehr

Korpuslinguistik Grundlagen Korpora. Lyrik & Linguistik. Korpuslinguistik Grundlagen Korpora. Korpuslinguistik Grundlagen Korpora. Was ist ein Korpus?

Korpuslinguistik Grundlagen Korpora. Lyrik & Linguistik. Korpuslinguistik Grundlagen Korpora. Korpuslinguistik Grundlagen Korpora. Was ist ein Korpus? Lyrik & Linguistik Was ist ein Korpus? Stefan Engelberg & Christine Hummel Institut für Deutsche Sprache, Mannheim Universität Freiburg Hauptseminar, Uni Mannheim, FS 2008 Lemnitzer, Lothar und Heike Zinsmeister.

Mehr

Korpus Schlichtungs- und Gerichtsverhandlungen (SG--)

Korpus Schlichtungs- und Gerichtsverhandlungen (SG--) 1 Institut für Deutsche Sprache, Mannheim Abteilung Pragmatik: Archiv für Gesprochenes Deutsch URL: http://agd.ids-mannheim.de 2014 IDS, Mannheim Korpus Schlichtungs- und Gerichtsverhandlungen (SG--) Korpus_Projekt_Kurzbeschreibung

Mehr

Einrichtung der FRITZ!Box ALP-600. alphago. IP SIP Video Sprechanlage

Einrichtung der FRITZ!Box ALP-600. alphago. IP SIP Video Sprechanlage Einrichtung der FRITZ!Box ALP-600 IP SIP Video Sprechanlage Inhaltsverzeichnis Einleitung und Sicherheitshinweise... 3 Türsprechanlage in FRITZ!Box einrichten... 4 FRITZ!Box in ALP-600 einrichten... 9

Mehr

Korpuslinguistik. Rainer Perkuhn / Holger Keibel / Marc Kupietz (2012): Korpuslinguistik. Paderborn: Fink. (Reihe LIBAC Linguistik für Bachelor 3433).

Korpuslinguistik. Rainer Perkuhn / Holger Keibel / Marc Kupietz (2012): Korpuslinguistik. Paderborn: Fink. (Reihe LIBAC Linguistik für Bachelor 3433). Ergänzungen zu Korpuslinguistik Rainer Perkuhn / Holger Keibel / Marc Kupietz (2012): Korpuslinguistik. Paderborn: Fink. (Reihe LIBAC Linguistik für Bachelor 3433). Stand: 18. Juni 2012 Inhalt E2 Elementare

Mehr

Brauchen wir neue Wörter?Lexikographische Behandlung von Neologismen im Deutschen. p.1

Brauchen wir neue Wörter?Lexikographische Behandlung von Neologismen im Deutschen. p.1 Brauchen wir neue Wörter? Lexikographische Behandlung von Neologismen im Deutschen. Lothar Lemnitzer lothar@sfs.uni-tuebingen.de Dortmund, 11. November 2004 Brauchen wir neue Wörter?Lexikographische Behandlung

Mehr

Was ist Statistik? Wozu dienen statistische Methoden?

Was ist Statistik? Wozu dienen statistische Methoden? 25. APRIL 2002: BLATT 1 Übersicht Was ist Statistik? Wozu dienen statistische Methoden? Was ist maschinelle Sprachverarbeitung? Welche Rolle spielen statistische Methoden in verschiedenen Teilbereichen

Mehr

Das Denkwerkprojekt Schüler machen Wörterbücher Wörterbücher machen Schule. Handreichung zu den Projekttagen am 25. und 26.

Das Denkwerkprojekt Schüler machen Wörterbücher Wörterbücher machen Schule. Handreichung zu den Projekttagen am 25. und 26. 2017 Das Denkwerkprojekt Schüler machen Wörterbücher Wörterbücher machen Schule Handreichung zu den Projekttagen am 25. und 26. Januar 2017 Willkommen! Liebe Schülerinnen und Schüler, in dieser Handreichung

Mehr

Terminologiearbeit und Terminographie. Von Thomas Hopp

Terminologiearbeit und Terminographie. Von Thomas Hopp und Terminographie Von Thomas Hopp Datenkategorien Gliederung Terminologiearbeit Datenkategorien zur Terminologieverwaltung Referat Terminologiearbeit Thomas Hopp 3.Semester 2 Datenkategorien Terminologiearbeit

Mehr

Phraseologismen im Wörterbuch und im deutschen und tschechischen Sprachgebrauch

Phraseologismen im Wörterbuch und im deutschen und tschechischen Sprachgebrauch Sprache - System und Tätigkeit 62 Phraseologismen im Wörterbuch und im deutschen und tschechischen Sprachgebrauch Am Beispiel von Phraseologismen mit dem Bild von Mann und Frau Bearbeitet von Eva Cieslarová

Mehr

Verfügbare Deutsche Korpora (gesprochene und geschriebene Texte)

Verfügbare Deutsche Korpora (gesprochene und geschriebene Texte) Verfügbare Deutsche Korpora (gesprochene und geschriebene Texte) Chatkorpus von Michael Beißwenger http://www.linse.uni-due.de/tl_files/pdfs/publikationen-rezensionen/chatkorpus_beisswenger_2013.pdf Hamburg

Mehr

Sprachtechnologie als Grundlage für die maschinelle Auswertung von Texten

Sprachtechnologie als Grundlage für die maschinelle Auswertung von Texten Sprachtechnologie als Grundlage für die maschinelle Auswertung von Texten Dr-Ing Michael Piotrowski Leibniz-Institut für Europäische Geschichte @true_mxp Bamberg, 20 November 2015

Mehr

ELEKTRONISCHE KORPORA ALS MITTEL DES INFROMATIONSERWERBS IM UNTERRICHT von VĚRA HEJHALOVÁ (Prag)

ELEKTRONISCHE KORPORA ALS MITTEL DES INFROMATIONSERWERBS IM UNTERRICHT von VĚRA HEJHALOVÁ (Prag) ELEKTRONISCHE KORPORA ALS MITTEL DES INFROMATIONSERWERBS IM UNTERRICHT von VĚRA HEJHALOVÁ (Prag) 1. Einleitung Der vorliegende Artikel setzt sich zum Ziel, die Möglichkeiten der Ausnutzung elektronischer

Mehr

Nutzungshinweise zu den Lemmalisten für das Teilkorpus DEU_L1_EV. September 2015 David Stoppel, Franziska Wallner

Nutzungshinweise zu den Lemmalisten für das Teilkorpus DEU_L1_EV. September 2015 David Stoppel, Franziska Wallner Nutzungshinweise zu den Lemmalisten für das Teilkorpus DEU_L1_EV September 2015 David Stoppel, Franziska Wallner Einleitung Die Lemmalisten liefern Häufigkeitsangaben für Wörter der deutschen gesprochenen

Mehr

DicomStar. DicomStar. Dateien. True IT Solutions For You

DicomStar. DicomStar. Dateien. True IT Solutions For You DicomStar DicomStar Ein Google für DICOM-Dateien Dateien Motivation... Sie brauchen bestimmte DICOM-Bilder und DICOM-Dateien...... Das Finden der Bilder in Archiven dauert lange...... Sie müssen spezielle

Mehr

TERMINALSERVER BENUTZERLEITFADEN. TELCAT Kommunikationstechnik GmbH Sudetenstraße Salzgitter

TERMINALSERVER BENUTZERLEITFADEN. TELCAT Kommunikationstechnik GmbH Sudetenstraße Salzgitter TERMINALSERVER BENUTZERLEITFADEN Bearbeiter: Team Applikationen Anschrift: TELCAT Kommunikationstechnik GmbH Sudetenstraße 10 38239 Salzgitter Abteilung: TI A Stand: V1.5 21.09.2017 INHALT 1 Einleitung...

Mehr

Wortstellung nominaler Elemente im Mittelfeld

Wortstellung nominaler Elemente im Mittelfeld HS Korpuslinguistische Beschreibung von Phänomenen des Deutschen Wortstellung nominaler Elemente im Mittelfeld Untersuchung zur Stellung nominaler Elemente im deutschen Mittelfeld - Kurzvortrag, 19.11.2003

Mehr

Einführung in die Computerlinguistik: Morphologie und Automaten I

Einführung in die Computerlinguistik: Morphologie und Automaten I Einführung in die Computerlinguistik: Morphologie und Automaten I WS 2013/2014 Manfred Pinkal Morphologie Morphologie ist der Teilbereich der Linguistik, der sich mit der internen Struktur von Wörtern

Mehr

2 Bestimmung der Konzepte. Eine Beschreibung der Markup-Sprache grammisml findet sich in Schneider (2004, S. 251ff).

2 Bestimmung der Konzepte. Eine Beschreibung der Markup-Sprache grammisml findet sich in Schneider (2004, S. 251ff). Eine Ontologie für die Grammatik Modellierung und Einsatzgebiete domänenspezifischer Wissensstrukturen Roman SCHNEIDER Institut für deutsche Sprache (IDS) R5, 6-13 D-68161 Mannheim schneider@ids-mannheim.de

Mehr

Einführung in die Computerlinguistik

Einführung in die Computerlinguistik Mehrdeutigkeit der Wortart Einführung in die Computerlinguistik Statistische Modellierung und Evaluation WS 2008/2009 Manfred Pinkal Sie haben in Moskau liebe genossen Sie haben in Moskau liebe Genossen

Mehr

Schwache Definita im Deutschen

Schwache Definita im Deutschen Schwache Definita im Deutschen Łukasz Jędrzejowski l.jedrzejowski@uni-koeln.de 31. Mai 2017 31.05.17 1 Gliederung 1. Einführung 2. Schwache Definita: Nübling (1998, 2005) 3. Schwache Definita in Korpora

Mehr

AVS - M 01. Allgemeine und Vergleichende Sprachwissenschaft/ Verantwortlich:

AVS - M 01. Allgemeine und Vergleichende Sprachwissenschaft/ Verantwortlich: AVS - M 01 1. Name des Moduls: Basismodul I: Grundlagen und Methoden der AVS Allgemeine und Vergleichende Sprachwissenschaft/ 3. Inhalte / Lehrziele Die Studierenden werden in diesem Basismodul vertraut

Mehr

Korpuslinguistik in der linguistischen Lehre Erfolge und Misserfolge

Korpuslinguistik in der linguistischen Lehre Erfolge und Misserfolge Korpuslinguistik in der linguistischen Lehre Erfolge und Misserfolge 18. Januar 2011 D-Spin Workshop, BBAW, Berlin Inhalt Ideen und Resultate Hoffnungen und Enttäuschungen Bedürfnisse und Probleme Ausblick

Mehr

Perinorm Anwendertreffen Workshop 4: Schnittstellenanforderungen in andere Systeme definieren

Perinorm Anwendertreffen Workshop 4: Schnittstellenanforderungen in andere Systeme definieren 2017-09-13 Perinorm Anwendertreffen Workshop 4: Schnittstellenanforderungen in andere Systeme definieren Andrea Hillers/Thomas Menath Agenda Ziele des Workshops Prozesse, die mit dem Normen-Management

Mehr

LAUDATIO-Repository für Anwender. Carolin Odebrecht Humboldt-Universität zu Berlin LAUDATIO-repository.org

LAUDATIO-Repository für Anwender. Carolin Odebrecht Humboldt-Universität zu Berlin LAUDATIO-repository.org LAUDATIO-Repository für Anwender Carolin Odebrecht Humboldt-Universität zu Berlin LAUDATIO-repository.org Arbeiten mit (historischen) Fragen, die oft gestellt werden: Korpora Wo finde ich Korpora aus dem

Mehr

Konkordanzen aus dem Bonner Frühneuhochdeutschkorpus exportieren

Konkordanzen aus dem Bonner Frühneuhochdeutschkorpus exportieren Konkordanzen aus dem Bonner Frühneuhochdeutschkorpus exportieren Das Bonner Frühneuhochdeutschkorpus (FnhdC) ist derzeit eine der besten Ressourcen, die wir zu dieser Periode der deutschen Sprachgeschichte

Mehr

Grammatiken und linguistische Evidenz

Grammatiken und linguistische Evidenz Grammatiken und linguistische Evidenz SE: Quantitative Analyse linguistischer Variation Dozentin: Ines Rehbein 14.11.2012 Linguistische Variation (Ines Rehbein) WS 2012/13 1 / 28 Heutige Sitzung I. Zusammenfassung

Mehr

Computergestützte Korpuslinguistik und die Kollokationstheorie PS: Computerlinguistik Kristin Dill

Computergestützte Korpuslinguistik und die Kollokationstheorie PS: Computerlinguistik Kristin Dill Computergestützte Korpuslinguistik und die Kollokationstheorie PS: Computerlinguistik Kristin Dill Korpuslinguistik Die Korpuslinguistik ist ein Bereich der Linguistik, in dem Theorien über Sprache anhand

Mehr

Prof. Dr. Uwe Schmidt. 31. Januar Aufgaben zur Klausur Softwaredesign im WS 2010/11 (WI h253, MI h405, BInf v310, BMInf v300, BWInf v310 )

Prof. Dr. Uwe Schmidt. 31. Januar Aufgaben zur Klausur Softwaredesign im WS 2010/11 (WI h253, MI h405, BInf v310, BMInf v300, BWInf v310 ) Prof. Dr. Uwe Schmidt 31. Januar 2011 Aufgaben zur Klausur Softwaredesign im WS 2010/11 (WI h253, MI h405, BInf v310, BMInf v300, BWInf v310 ) Zeit: 75 Minuten erlaubte Hilfsmittel: keine Bitte tragen

Mehr

DER BEGRIFF KOLLOKATION IN VERSCHIEDENEN DOMÄNEN DER BEGRIFF KOLLOKATION IN VERSCHIEDENEN DOMÄNEN

DER BEGRIFF KOLLOKATION IN VERSCHIEDENEN DOMÄNEN DER BEGRIFF KOLLOKATION IN VERSCHIEDENEN DOMÄNEN DER BEGRIFF KOLLOKATION IN VERSCHIEDENEN DOMÄNEN Kollokationen als überraschende / beschreibenswerte / lernenswerte Wortkombinationen Rainer Perkuhn, Programmbereich Korpuslinguistik (IDS Mannheim) didaktischer

Mehr

Die Sammlung unikaler Wörter des Deutschen Aufbauprinzipien und erste Auswertungsergebnisse

Die Sammlung unikaler Wörter des Deutschen Aufbauprinzipien und erste Auswertungsergebnisse Die Sammlung unikaler Wörter des Deutschen Aufbauprinzipien und erste Auswertungsergebnisse Manfred Sailer und Beata Trawiński SFB 441 Universität Tübingen {mf,trawinsk}@sfs.uni-tuebingen.de. EUROPHRAS

Mehr

Bücher online lesen E-Books an der Staatsbibliothek zu Berlin

Bücher online lesen E-Books an der Staatsbibliothek zu Berlin Bücher online lesen E-Books an der Staatsbibliothek zu Berlin Moritz Böhme Friederike Glaab-Kühn Elektronische Ressourcen für das moderne wissenschaftliche Arbeiten Haus Potsdamer Straße 16. April 2013

Mehr

beck-online Inhalt: Literatur

beck-online Inhalt: Literatur beck-online Inhalt: 0. Rechtsinformationen 1. Was ist beck-online überhaupt? 2. Was bietet beck-online? 3. Suchmöglichkeiten bei beck-online 4. Rechercheergebnisse weiterverwenden 5. Überblick über das

Mehr

Aufgabe. Erstellen eines kleinen Lernerkorpus exemplarisches Aufzeigen, wie Fehler sinnvoll klassifiziert und annotiert werden könnten

Aufgabe. Erstellen eines kleinen Lernerkorpus exemplarisches Aufzeigen, wie Fehler sinnvoll klassifiziert und annotiert werden könnten Aufgabe Erstellen eines kleinen Lernerkorpus exemplarisches Aufzeigen, wie Fehler sinnvoll klassifiziert und annotiert werden könnten Mitstreiterinnen: Elena Briskina, Julia Hantschel, Jenny Krüger, Stéphanie

Mehr

Gliederung. Das TIGER-Korpus: Annotation und Exploration. TIGER-Korpus. 1. TIGER-Korpus. entstanden im Projekt TIGER (1999 heute) beteiligte Institute

Gliederung. Das TIGER-Korpus: Annotation und Exploration. TIGER-Korpus. 1. TIGER-Korpus. entstanden im Projekt TIGER (1999 heute) beteiligte Institute Das TIGER-Korpus: Annotation und Exploration Stefanie Dipper Forschungskolloquium Korpuslinguistik, 11.11.03 Gliederung 1. TIGER-Korpus 2. Annotation 3. Visualisierung 4. Suche, Retrieval 5. Demo 6. Repräsentation

Mehr

Das neue wiso Mehr Inhalte, mehr Usability, neues Design! powered by

Das neue wiso Mehr Inhalte, mehr Usability, neues Design!  powered by Das neue wiso 2010 Mehr Inhalte, mehr Usability, neues Design! www.wiso-net.de powered by So suchen Sie Für die Recherche stehen zahlreiche Optionen zur Verfügung: Von der Schnellsuche über alle Medien

Mehr

Neue Funktionen in der KorpusSuchmaschine ANNIS 3.1

Neue Funktionen in der KorpusSuchmaschine ANNIS 3.1 Neue Funktionen in der KorpusSuchmaschine ANNIS 3.1 Thomas Krause 1 Vorkenntnisse??? 2 Hands On Im Browser (möglichst Firefox oder Chrome) https://korpling.german.hu-berlin.de/annis3/ aufrufen Nachfragen!

Mehr

Blockseminar Einführung in die Korpuslinguistik Seminarleitung: Yvonne Krämer, M.A. Das Korpus. und seine Aufbereitung

Blockseminar Einführung in die Korpuslinguistik Seminarleitung: Yvonne Krämer, M.A. Das Korpus. und seine Aufbereitung Blockseminar Einführung in die Korpuslinguistik Seminarleitung: Yvonne Krämer, M.A. Das Korpus und seine Aufbereitung Bestandteile eines Korpus sind i.d.r.: Primärdaten Metadaten Annotationen Annotationen

Mehr

Themen. GK C: Einführung in die Korpuslinguistik. Vorverarbeitung. Tokenisierung. Tokenisierung. Aber. Vorverarbeitung

Themen. GK C: Einführung in die Korpuslinguistik. Vorverarbeitung. Tokenisierung. Tokenisierung. Aber. Vorverarbeitung GK C: Einführung in die Korpuslinguistik Anke Lüdeling anke.luedeling@rz.hu-berlin.de Sommersemester 2003 Themen Vorverarbeitung Tokenisieren Taggen Lemmatisieren Vorverarbeitung auf allen Vorverarbeitungsebenen

Mehr

Stephan Lamprecht. Texte professionell konzipieren, schreiben und veröffentlichen

Stephan Lamprecht. Texte professionell konzipieren, schreiben und veröffentlichen Stephan Lamprecht Texte professionell konzipieren, schreiben und veröffentlichen Vorwort............................................. 11 1: Vergessen Sie Textverarbeitungen! 15 1.1 So fein gliedern, wie

Mehr

Fürstinnenkorrespondenzen Experiment einer Nachnutzung. Stefan Dumont, Berlin

Fürstinnenkorrespondenzen Experiment einer Nachnutzung. Stefan Dumont, Berlin Fürstinnenkorrespondenzen Experiment einer Nachnutzung Stefan Dumont, Berlin Ressource Frühneuzeitliche Fürstinnenkorrespondenzen im mitteldeutschen Raum Ziel: Kulturhistorisch bedeutsame Korrespondenzen

Mehr