Korpuslinguistik IDS-Korpora und COSMAS II
|
|
- Hansi Bader
- vor 7 Jahren
- Abrufe
Transkript
1 Korpuslinguistik IDS-Korpora und COSMAS II Heike Zinsmeister Korpuslinguistik
2 Gliederung 1 Einleitung 2 Korpusbestand am IDS 3 Korpusrecherche mit COSMAS II 4 Referenzen
3 Das Institut für Deutsche Sprache (IDS) Hintergrund das IDS befindet sich in Mannheim beherbergt die größte zentrale Sammlung deutschsprachiger Korpora Beispiele korpus-basierter Arbeiten am IDS dreibändige IDS-Grammatik (Zifonun et al. 1997) Online-Referenzlexikon des Projekts Elexiko Online-Referenzgrammatik des Projekts grammis Arbeiten zu Neologismen
4 Gliederung 1 Einleitung 2 Korpusbestand am IDS 3 Korpusrecherche mit COSMAS II 4 Referenzen
5 Korpora am IDS Zwei Verwaltungsstellen geschriebene Sprache: Korpusarchiv der Arbeitsgruppe für Korpustechnologie gesprochene Sprache: Archiv für gesprochenes Wort (AGD) der Abteilung Pragmatik
6 Korpora geschriebener Sprache COSMAS II neuerdings auch DeReKo (= Deutsches Referenzkorpus) zwei Milliarden Token in 50 Korpora ca. zwei Drittel sind für wissenschaftliche Zwecke frei nutzbar Schwerpunkt liegt auf Standardsprache und Zeitungstexte nach 1945, zusätzlich Belletristik, Trivial- uns Fachliteratur 5 Korpora (7 Millionen Token) entstammen aus den Jahren
7 Korpora gesprochener Sprache AGD 50 Korpora mit mehr als 4000 Stunden Video- und Audioaufnahmen knapp drei Viertel sind für wissenschaftliche Zwecke frei nutzbar; 2 Millionen transkribierte Token umfasst unterschiedliche Varietäten des Deutschen im Inund Ausland
8 Organisation der Korpora (1) Archive Die ca. 190 COSMAS II-Korpora sind in 7 Archiven organisiert W: Archiv der geschriebenen Korpora (das größte Archiv) N: Archiv der neuakquirierten geschriebenen Korpora HIK: Archiv der historischen Korpora FNZ: Archiv der frühen Nachkriegszeit TAGGED: Archiv der morphosyntaktisch annotierten Korpora WK-PH: Archiv der phasengegliederten Korpora W-Übrig: Archiv der aussortierten geschriebenen Korpora SZ: Archiv der Süddeutschen Zeitung (nur IDS-intern nutzbar)
9 Organisation der Korpora (2) Interner Aufbau der Archive Archive bestehen aus Teilkorpora, größtenteils externe Korpora z.b. Teilkorpus des Bonner Limas-Korpus (1 Millionen Token) Teilkorpora gliedern sich in Dokumente, z.b. das taz-teilkorpus von 1997 in zwölf Dokumente. Dokumente bestehen aus einzelnen Texten, z.b. das Dokument von Juli 1997 aus Texten.
10 Aufbereitung der Korpora Abfragbare Annotation Textstruktur Lemmata Flexionsmorphologie Morphsyntax (= Wortarten), eingeschränkt
11 Gliederung 1 Einleitung 2 Korpusbestand am IDS 3 Korpusrecherche mit COSMAS II 4 Referenzen
12 Zugriff auf die Korpora mit COSMAS II Virtuelle Korpora für die Recherche fasst der Nutzer Teilkorpora, Dokumente und/oder Texte zu einem virtuellen Korpus zusammen. zusätzlichen werden vordefinierte virtuelle Korpora angeboten Virtuelles Korpus Zusammensetzung Anmerkung Zugang TAG-gesamt mm-tag lim-tag das gesamte Archiv spiegel-tag TAG-öffentlich mm-tag lim-tag der öffentliche Teil des Archivs lim-tag lim-tag LIMAS-Korpus, annotiert mm-tag m91-tag m94-tag Mannheimer Morgen, m95-tag m96-tag annotiert nichtöffentl. öffentl. öffentl. öffentl.
13 Zugriff auf die Korpora mit COSMAS II Registrierung ist nötig, aber kostenfrei und automatisiert per . Drei Zugangsarten Online: COSMAS IIweb Windows-Client: COSMAS IIwin (am komfortabelsten) Skript-basiert: COSMAS IIscript
14 Suche mit COSMAS II Suchmodus grafisch zeilenbasiert Suchinhalte Frequenzen von einzelnen Wörtern/Lemmata, Wortteilen, Wortkombinationen, Kontextbedingungen, (Wortarten) Ausgabe Frequenzen, Kollokationen (LogLikelihood Score), Konkordanz mit Kontext, Volltext (einschließlich Quellennachweis), Export nach.txt und.rtf (max Treffer)
15 Die Anfragesprache (1) Einfache Suchausdrücke Anfrage Treffer Haus Haus nur die Wortform Haus &Haus Haus, Hauses, alle Flexionsformen Häuser,... von Haus be* bei, Belag, Besen, alle Wortformen, die bereit... mit be- beginnen *chen bisschen, alle Wortformen, die Häuschen, mischen, mit -chen enden Wochen... (nach Scherer 2006, S.82)
16 Die Anfragesprache (2) Komplexe Suchausdrücke: Operatoren Anfrage Treffer se?en Segen, sehen, seien,,, alle Wortformen, bei denen zwischen se und en genau ein Buchstabe steht se+en Seen, Segen, sehen, seien... se*en sechsten, Seen, Segen, sehen,... alle Wortformen, bei denen zwischen se und en kein oder genau ein Buchstabe steht alle Wortformen, bei denen zwischen se und en beliebig viele Buchstaben stehen (nach Scherer 2006, S.82)
17 Die Anfragesprache (3) Morphologische Annotation & Satzzeichen Anfrage &be- Treffer bekochen, belügen, beraten, besingen.. alle Wortformen, die das Präfix be- enthalten alle Wortformen, die das Suffix -chen enthalten alle Sätze, die mit einem Fragezeichen enden. &-chen Bäumchen, Häuschen, Kindchen... \$ Was hast du gesagt? (nach Scherer 2006, S.82)
18 Ablauf einer Suchabfrage (1) 1. Wahl eines Archivs 2. Definition eines virtuellen Korpus 3. Formulieren der Suchanfrage für Zugriff auf morphologische Analyse im Menü Einstellungen die Lemmatisierung von Komposita und anderen Wordbildungsformen aktivieren 4. Suche starten mit der Erzeugung einer Wortformenliste Abfrage vorbereiten
19 Ablauf einer Suchabfrage (2) 5. Auswahl der Wortformen für weitere Inspektion (Ankreuzen) 6. Bereitstellung der Fundstellen Ergebnisse 7. KWIC-Format (Kontextgröße einstellen): ggf. weitere Auswahl 8. Volltextanzeige (Kontextgröße einstellen): ggf. weitere Auswahl 9. Export der KWIC- oder Volltextinformation
20 Gliederung 1 Einleitung 2 Korpusbestand am IDS 3 Korpusrecherche mit COSMAS II 4 Referenzen
21 Referenzen Hauptquellen Online-Dokumentation von COSMAS II Scherer, C. (2006): Korpuslinguistik. Heidleberg: Universitätsverlag Winter, Kap. 5.3 Weitere Literatur Lemnitzer, L. und H. Zinsmeister (2006): Korpuslinguistik. Eine Einführung. Tübingen: Narr, S. 90ff. Zifonun, G. et al. (1997): Grammatik der deutschen Sprache. Berlin: de Gruyter.
COSMAS II Corpus Search Management and Analysis System
COSMAS II Corpus Search Management and Analysis System http://www.ids-mannheim.de/cosmas2/ 13. November 2012, Jeanette Isele Seminar: Korpuslinguistik Übersicht Theoretischer Teil Was ist COSMAS II? Die
MehrKorpusanalyse am IDS Die Korpora
Die Korpora DeReKo: Das Deutsche Referenzkorpus Die Korpora am IDS Größe: über 3,4 Milliarden Textwörter (Stand: 2008) Akquise: im Hinblick auf Umfang, Variabilität, Qualität und Aktualität; urheberrechtlich
MehrZugang zur Konkordanzsuche
Zugang zur Konkordanzsuche 1.1 Zugriff Mit dem Recherchetool können Sie: - Konkordanzen (= eine Liste aller Vorkommen eines Suchwortes im Kontext) aus der Verbalspur und den Annotationen erstellen, - Metadaten
MehrKorpuslinguistik. Vorlesungsreihe»Methoden der Linguistik«(WS 2004/05) Universität Zürich, Korpuslinguistik. Jürgen Spitzmüller.
Vorlesungsreihe»Methoden der Linguistik«(WS 2004/05) Universität Zürich, 7.12.2004 1. Teil: Theorie Grundlegende theoretische Fragestellungen: Was sind überhaupt Korpora? Wozu Korpora? Was sollen Korpora
MehrKorpuslinguistik Grundlagen Korpusrecherchemethoden
Methoden der Korpusanalyse Erstellung von Konkordanzen Erzeugung von Wortlisten mit Frequenzangaben Ermittlung von hochfrequenten Wortgruppen (Clusteranalyse) Berechnung von Kookkurrenzen Ermittlung von
MehrIntelligente Recherchestrategien für e-humanities Universität Duisburg-Essen
Intelligente Recherchestrategien für e-humanities Universität Duisburg-Essen Softwaretest COSMAS II Client v3.6.1 Das Korpusrecherche- und -analyse-system COSMAS (Corpus Search, Management and Analysis
MehrKorpusanalyse am IDS Die Korpora
Die Korpora DeReKo: Das Deutsche Referenzkorpus Die Korpora am IDS Größe: über 3,4 Milliarden Textwörter (Stand: 2008) Akquise: im Hinblick auf Umfang, Variabilität, Qualität und Aktualität; urheberrechtlich
MehrCOSMAS. (Corpus Storage, Maintenance and Access System)
COSMAS (Corpus Storage, Maintenance and Access System) 1. Möglichkeiten von COSMAS - Suchen und Kombinationssuchen in einem vordefinierten Korpus. Die vordefinierten Korpora sind in Anlage 1 aufgelistet.
MehrWas ist ein Korpus. Zitat aus: Carstensen et al. Computerlinguistik und Sprachtechnologie: Eine Einführung. Kap. 4.2, Textkorpora
Was ist ein Korpus Korpora sind Sammlungen linguistisch aufbereitete(r) Texte in geschriebener oder gesprochener Sprache, die elektronisch gespeichert vorliegen. Zitat aus: Carstensen et al. Computerlinguistik
MehrKookkurrenzanalyse Einführung
Einführung Kookkurenzanalyse die grundlegende Idee 1) Beobachtung: In einem Korpus tritt Wort X 1000mal auf, Wort Y 100mal, Wort Z 10mal. 2) Wahrscheinlichkeit: Die Kombination XY ist 10mal so wahrscheinlich
MehrDigital Humanities Recherche im DWDS und DTA
Digital Humanities Recherche im DWDS und DTA mit Booleschen Operatoren und Regulären Ausdrücken Jena Language & Information Engineering (JULIE) Lab Friedrich-Schiller-Universität Jena, Germany http://www.julielab.de
MehrKorpuslinguistik Grundlagen Korpora
Was ist ein Korpus? Lemnitzer, Lothar und Heike Zinsmeister. Korpuslinguistik. Eine Einführung. Tübingen: Narr, 2006. S. 7. Stefan Engelberg, Linguistische Methodenlehre, FS 2009, Uni Mannheim [Folie 1]
MehrDWDS-Kernkorpus / DWDS-Korpusanalyse
Korpusrecherchesysteme Das DWDS-Kernkorpus DWDS-Kernkorpus / DWDS-Korpusanalyse Entwickler: Berlin-Brandenburgische Akademie der Wissenschaften. Version: (keine Versionierung). Recherche: online. Software:
MehrOffener Diskurs: Sprachdaten in Deutschland. Prof. Andreas Witt (Institut für Deutsche Sprache)
Offener Diskurs: Sprachdaten in Deutschland Prof. Andreas Witt (Institut für Deutsche Sprache) 1 Institut für Deutsche Sprache (IDS) Das Institut für Deutsche Sprache ist die zentrale außeruniversitäre
MehrKurze literarische Texte in literaturwissenschaftlicher und linguistischer Perspektive. Lyrik seit den 1990er Jahren
Kurze literarische Texte in literaturwissenschaftlicher und linguistischer Perspektive Lyrik seit den 1990er Jahren Christine Hummel & Stefan Engelberg Institut für Deutsche Sprache, Mannheim Universität
MehrForschungsdaten in den Geisteswissenschaften die germanistische Sprachwissenschaft
Forschungsdaten in den Geisteswissenschaften die germanistische Sprachwissenschaft Andreas Witt Institut für Deutsche Sprache, Mannheim Workshop Forschungsdaten WGL Geschäftsstelle Berlin 2012-05-10 Institut
MehrKorpusbasierte Sprachreflexion mit Online-Ressourcen. Heike Zinsmeister Institut für Maschinelle Sprachverarbeitung Universität Stuttgart
Korpusbasierte Sprachreflexion mit Online-Ressourcen Heike Zinsmeister Institut für Maschinelle Sprachverarbeitung Universität Stuttgart CLARIN-D Common Language Resources and Technology Infrastructure
MehrANNIS Quickstart
Suche in ANNIS Bevor man suchen kann, muss das gewünschte Korpus in der Korpusliste ausgewählt werden (z.b. das Teilkorpus mo (monoethnisches Ergänzungskorpus) oder KiDKo mu (multiethnisches Korpus). Danach
MehrDie Corpus Workbench und ihre Syntax. Blockseminar Einführung in die Korpuslinguistik Seminarleitung: Yvonne Krämer, M.A.
Die Corpus Workbench und ihre Syntax Blockseminar Einführung in die Korpuslinguistik Seminarleitung: Yvonne Krämer, M.A. Die IMS Open Corpus Workbench (CWB) Mächtige Konkordanz- und Korpusanalyse-Software
MehrMIT COSMAS II»IN DEN WEITEN DER IDS-KORPORA UNTERWEGS«
02 FORSCHUNG Franck Bodmer Mory MIT COSMAS II»IN DEN WEITEN DER IDS-KORPORA UNTERWEGS«Abb. 1: Die Web-Oberfläche von COSMAS II mit Benutzerkorpus Finanzen..." Einleitung cosmas ii (= Corpus Search, Management
MehrAufgaben aus Kegli 2 (Korpuslinguistik)
Aufgaben aus Kegli 2 (Korpuslinguistik) Kapitel 1 1. Überprüfen Sie mithilfe einer beliebigen Suchmaschine den Sprachgebrauch im Internet. Finden Sie die Formen wegen dem Regen bzw. wegen des Regens und
MehrLinguistische Forschungsdaten
Linguistische Forschungsdaten Andreas Witt Institut für Deutsche Sprache (IDS), Mannheim 45 Jahre und mehr IDS, Korpora, Verfügbarkeit, rechtliche Fragen (1) 1964 Das Institut für Deutsche Sprache wird
MehrKorpora. Referenten Duyen Tao-Pham Nedyalko Georgiev
Korpora Referenten Duyen Tao-Pham Nedyalko Georgiev Hauptseminar: Angewandte Linguistische Datenverarbeitung (WS 11/12) Dozent: Prof. Dr. Jürgen Rolshoven Sprachliche Informationsverarbeitung Universität
MehrEinführung. Stefanie Dipper Stefan Evert Heike Zinsmeister
Einführung Stefanie Dipper Stefan Evert Heike Zinsmeister München, 28.1.2011 Korpus eine Sammlung gesprochener oder geschriebener Äußerungen typischerweise digitalisiert und maschinenlesbar Ebenen eines
MehrEinsteiger-Tutorial zu Korpusrecherchen mit COSMAS II
Einsteiger-Tutorial zu Korpusrecherchen mit COSMAS II Angenommen, wir wollen mit Hilfe von COSMAS II den Gebrauch des Erstglieds (Präfixoids?) Schwarz- bei Personenbezeichnungen auf -er nachvollziehen,
MehrInhalt und Typen von Korpora. Welche Sprachinhalte können Korpora haben und welche Arten von Korpora gibt es
Inhalt und Typen von Korpora Welche Sprachinhalte können Korpora haben und welche Arten von Korpora gibt es Inhalt von Korpora Korpora können die verschiedensten Texte in den unterschiedlichsten Zusammensetzungen
MehrDoris Steffens / Doris al-wadi. Neuer Wortschatz. Neologismen im Deutschen Band 2: kiten Z
Doris Steffens / Doris al-wadi Neuer Wortschatz Neologismen im Deutschen 2001 2010 Band 2: kiten Z Bibliografische Information der Deutschen Nationalbibliothek Die Deutsche Nationalbibliothek verzeichnet
MehrKorpora zu geschriebener und gesprochener Sprache
FAU Erlangen-Nürnberg Stand: 25.05.2015 Department Germanistik und Komparatistik Lehrstuhl für Germanistische Sprachwissenschaft Andreas Blombach Korpora zu geschriebener und gesprochener Sprache 1 Geschriebenes
MehrSprachressourcen in der Lehre: Erfahrungen aus der historischen Korpuslinguis7k
Arbeitsstelle Computerphilologie Sprachressourcen in der Lehre: Erfahrungen aus der historischen Korpuslinguis7k Cris%na Vertan cris%na.vertan@uni hamburg.de 18.01.2011 1 Überblick Das Kontext (Lehrangebot
MehrSwantje Westpfahl & Thomas Schmidt POS für(s) FOLK
Swantje Westpfahl & Thomas Schmidt POS für(s) FOLK Problemanalyse des POS- Taggings für spontansprachliche Daten anhand des Forschungsund Lehrkorpus Gesprochenes Deutsch 2 FOLK Forschungs- und Lehrkorpus
Mehrlinguistischer und literaturwissenschaftlicher Perspektive
Sprachliche Eigenarten literarischer Kurzformen in linguistischer und literaturwissenschaftlicher Perspektive Stefan Engelberg & Christine Hummel Institut für Deutsche Sprache, Mannheim Universität Freiburg
MehrComputerlinguistische Grundlagen. Jürgen Hermes Sommersemester 17 Sprachliche Informationsverarbeitung Institut für Linguistik Universität zu Köln
Computerlinguistische Grundlagen Jürgen Hermes Sommersemester 17 Sprachliche Informationsverarbeitung Institut für Linguistik Universität zu Köln Computerlinguistik: Schnittstellen Computerlinguistik aus
MehrGebrauchsorien-erte Sprachbeschreibung: Korpuslinguis-sche Analysen von (Fast-)Synonymen
Gebrauchsorien-erte Sprachbeschreibung: Korpuslinguis-sche Analysen von (Fast-)Synonymen Heike Zinsmeister Seminar Krea-ves Schreiben Universität Vilnius 25.10.2017 Online: hmps://www.korpuslab.uni-hamburg.de/lehrmaterialien/diverses.html
MehrTextGrid Arbeitsgruppen
TextGrid Arbeitsgruppen Eine Reihe von Arbeitsgruppen in TextGrid behandeln bestimmte Themengebiete und sichern die Arbeitspaket-übergreifende Diskussion. Sie arbeiten Themengebiete zur effizienten Informationsweitergabe
MehrSprachdaten sammeln und auswerten
130 Sprachdaten sammeln und auswerten Die Korpuslinguistik am Institut für Deutsche Sprache (IDS) Von Peter Anliker 1 Im Jahr 1964, also vor fünfzig Jahren, wurde in Mannheim das Institut für Deutsche
MehrReguläre Ausdrücke. Reguläre Ausdrücke = Regular Expressions = reg.exp./regexp/regexp = RE
Blockseminar Einführung in die Korpuslinguistik Seminarleitung: Yvonne Krämer, M.A. REGULAR EXPRESSIONS RegExp Was ist ein regulärer Ausdruck? = Regular Expressions = reg.exp./regexp/regexp = RE Ein regulärer
MehrKorpuslinguistik Annis 3 -Korpussuchtool Suchen in tief annotierten Korpora
Korpuslinguistik Annis 3 -Korpussuchtool Suchen in tief annotierten Korpora Anke Lüdeling, Marc Reznicek, Amir Zeldes, Hagen Hirschmann... und anderen Mitarbeitern der HU-Korpuslinguistik Ziele Wie/Was
MehrSCHNITTSTELLEN ZUR NUTZUNG DER KORPUSANALYSEPLATTFORM KORAP
Marc Kupietz und Nils Diewald SCHNITTSTELLEN ZUR NUTZUNG DER KORPUSANALYSEPLATTFORM KORAP KobRA-Abschlusstagung, 30.10.2015 ÜBERBLICK 1. 2. 3. 4. 5. IDS im KobRA-Projekt KorAP Schnittstellen Protokoll
MehrKorpuslinguistik Annis 3 -Korpussuchtool Linguistische Suchen im Ridges-Korpus LAUDATIO-Workshop Hagen Hirschmann
Korpuslinguistik Annis 3 -Korpussuchtool Linguistische Suchen im Ridges-Korpus 07.10.2014 LAUDATIO-Workshop Hagen Hirschmann Was ist ANNIS? ANNIS steht für ANNotation of Information Structure http://www.sfb632.uni-potsdam.de/d1/annis/
MehrDas Zusammenspiel interpretativer und automatisierbarer Verfahren bei der Aufbereitung und Auswertung mündlicher Daten
Das Zusammenspiel interpretativer und automatisierbarer Verfahren bei der Aufbereitung und Auswertung mündlicher Daten Ein Fallbeispiel aus der angewandten Wissenschaftssprachforschung Cordula Meißner
MehrEinleitung. Definitionen von Korpuslinguistik und das Repräsentativitätsmerkmal
Definitionen von Korpuslinguistik und das Repräsentativitätsmerkmal Einleitung 1. Einleitung 2. Definitionen von Korpuslinguistik 2.1 Entstehung 2.1.1 : korpusbasiert vs. korpusgestützt 2.1.2 Generative
MehrValenz Syntaktische Valenz
Valenz Syntaktische Valenz Anm. 1: Verbunabhängige Unzulässigkeit von Valenzrahmen a. sie hat verkauft b. sie hat den Porsche verkauft c. sie hat an ihren Freund verkauft d. sie hat den Porsche an ihren
MehrDaten Methoden Theorien Definitionen & Operationalisierungen
Operationale Verfahren Daten Methoden Theorien Definitionen & Operationalisierungen Das Überbrückungsproblem Hypothese Explizite Formulierung einer als wahr vermuteten, begründbaren Aussage über das Phänomen
MehrDaten Methoden Theorien Definitionen & Operationalisierungen
Definitionen Daten Methoden Theorien Definitionen & Operationalisierungen Eine Realdefinition legt fest, wie ein Ausdruck verwendet wird, indem sie die Beobachtungen, das Wissen, die Intuitionen, die wir
MehrKorpus. Was ist ein Korpus?
Was ist ein Korpus? Korpus Endliche Menge von konkreten sprachlichen Äußerungen, die als empirische Grundlage für sprachwiss. Untersuchungen dienen. Stellenwert und Beschaffenheit des Korpus hängen weitgehend
MehrKorpus Beratungsgespräche (BG--)
1 Institut für Deutsche Sprache, Mannheim Abteilung Pragmatik: Archiv für Gesprochenes Deutsch URL: http://agd.ids-mannheim.de 2014 IDS, Mannheim Korpus Beratungsgespräche (BG--) Korpus_Projekt_Kurzbeschreibung
MehrEVA-MARIA HEINLE. Diachronische Wortbildung unter syntaktischem Aspekt. Das Adverb. Universitätsverlag WINTER. Heidelberg
EVA-MARIA HEINLE Diachronische Wortbildung unter syntaktischem Aspekt Das Adverb Universitätsverlag WINTER Heidelberg INHALTSVERZEICHNIS INHALTSVERZEICHNIS ABKÜRZUNGSVERZEICHNIS iii 1. Quellen iii 2. Zeitschriften-
Mehrordnet.dk und elexiko ein Vergleich Jörg Asmussen Gesellschaft für dänische Sprache und Literatur, DSL
ordnet.dk und elexiko ein Vergleich Jörg Asmussen Gesellschaft für dänische Sprache und Literatur, DSL Inhaltsübersicht 1. Wörterbücher und Korpora der DSL 2. Das Projekt ordnet.dk 3. Vergleich elexiko
MehrDas Sichtenkonzept im DWDS- Wortinformationssystem
Das Sichtenkonzept im DWDS- Wortinformationssystem Alexander Geyken, Edmund Pohl, Lothar Lemnitzer Berlin-Brandenburgische Akademie der Wissenschaften 6. Arbeitstreffen des Forschungsnetzwerks Internetlexikographie
MehrDaten Methoden Theorien Hypothesen
Hypothesen Die Wahrheit von wenn-dann-sätzen ergibt sich aus der Wahrheitstabelle für konditionale Verknüpfungen. wenn p, dann q p p nicht p nicht p q nicht q q nicht q WAHR FALSCH WAHR WAHR ϕ ist ein
MehrEinsteiger-Tutorial zu Korpusrecherchen mit WaCkY
Einsteiger-Tutorial zu Korpusrecherchen mit WaCkY Um Sprachdaten aus dem Internet zu gewinnen, waren Linguistinnen lange auf konventionelle Suchmaschinen angewiesen. Dies hatte den Nachteil, dass quantitative
MehrEmprirische Lexikologie
Emprirische Lexikologie Stefan Engelberg Hauptseminar, Uni Mannheim, Herbst 2007 http://www.ids-mannheim.de/ll/lehre/engelberg/ Webseite_Empirische_Lexikologie/Empirische_Lexikologie.html engelberg@ids-mannheim.de
MehrDeutsches Textarchiv (DTA)
Deutsches Textarchiv (DTA) Einführung in die Korpuslinguistik Vortrag am 05.11.2014 Stefanie Bischoff (MA Europäische Sprachen); 1. Semester Romy Sachs (BA Germanistik / Philosophie); 5. Semester Gliederung
MehrSyntaktische Tendenzen der Gegenwartssprache
Syntaktische Tendenzen der Gegenwartssprache Anforderungen: Regelmäßige Teilnahme: max. 2 Fehlzeiten Vorbereitung auf die Sitzung: Text lesen, Fragen notieren, mitdiskutieren (!) Leitung einer Sitzung
MehrInhaltsverzeichnis [Beispiel]
Satzmuster für die Kurzen Einführungen in die germanistische Linguistik (Kegli) Universitätsverlag Winter, Heidelberg Inhaltsverzeichnis [Beispiel] 1. Einleitung Schriftgröße: 14pt 1 1.1 Sprache in Literatur
Mehr. Syntaktische und semantische Annotation frühneuhochdeutscher Hexenverhörprotokolle. Fabian Barteld 29.11.2013
.. Syntaktische und semantische Annotation frühneuhochdeutscher Hexenverhörprotokolle Fabian Barteld Fabian.Barteld@uni-hamburg.de 29.11.2013 Fabian Barteld Annotation frnhd. Hexenverhörprotokolle 29.11.2013
MehrDas Deutsche Textarchiv als Repositorium und Werkzeug. Frank Wiegand (BBAW) Deutsches Textarchiv
Das Deutsche Textarchiv als Repositorium und Werkzeug Frank Wiegand (BBAW) Deutsches Textarchiv www.deutschestextarchiv.de wiegand@bbaw.de Deutsches Textarchiv Referenzkorpus für die schriftliche neuhochdeutsche
Mehr2. 1. Suche vorbereiten
2. 1. Suche vorbereiten Wie soll ich suchen? Wie weiss ich, dass mir bei der Suche nichts entgangen ist? Wo finde ich die relevanten Publikationen, Quellen und Informationen? Eine gut vorbereitete Suche
MehrTeil I. Anspruch und Ziele des Berichts. Open Access
ZRS 2014; 6(1 2): 10 16 Open Access DOI 10.1515/zrs-2014-0003 Deutsche Akademie für Sprache und Dichtung, Union der deutschen Akademien der Wissenschaften (Hg.). 2013. Reichtum und Armut der deutschen
MehrKorpuslinguistik Grundlagen Korpora. Lyrik & Linguistik. Korpuslinguistik Grundlagen Korpora. Korpuslinguistik Grundlagen Korpora. Was ist ein Korpus?
Lyrik & Linguistik Was ist ein Korpus? Stefan Engelberg & Christine Hummel Institut für Deutsche Sprache, Mannheim Universität Freiburg Hauptseminar, Uni Mannheim, FS 2008 Lemnitzer, Lothar und Heike Zinsmeister.
MehrKorpus Schlichtungs- und Gerichtsverhandlungen (SG--)
1 Institut für Deutsche Sprache, Mannheim Abteilung Pragmatik: Archiv für Gesprochenes Deutsch URL: http://agd.ids-mannheim.de 2014 IDS, Mannheim Korpus Schlichtungs- und Gerichtsverhandlungen (SG--) Korpus_Projekt_Kurzbeschreibung
MehrEinrichtung der FRITZ!Box ALP-600. alphago. IP SIP Video Sprechanlage
Einrichtung der FRITZ!Box ALP-600 IP SIP Video Sprechanlage Inhaltsverzeichnis Einleitung und Sicherheitshinweise... 3 Türsprechanlage in FRITZ!Box einrichten... 4 FRITZ!Box in ALP-600 einrichten... 9
MehrKorpuslinguistik. Rainer Perkuhn / Holger Keibel / Marc Kupietz (2012): Korpuslinguistik. Paderborn: Fink. (Reihe LIBAC Linguistik für Bachelor 3433).
Ergänzungen zu Korpuslinguistik Rainer Perkuhn / Holger Keibel / Marc Kupietz (2012): Korpuslinguistik. Paderborn: Fink. (Reihe LIBAC Linguistik für Bachelor 3433). Stand: 18. Juni 2012 Inhalt E2 Elementare
MehrBrauchen wir neue Wörter?Lexikographische Behandlung von Neologismen im Deutschen. p.1
Brauchen wir neue Wörter? Lexikographische Behandlung von Neologismen im Deutschen. Lothar Lemnitzer lothar@sfs.uni-tuebingen.de Dortmund, 11. November 2004 Brauchen wir neue Wörter?Lexikographische Behandlung
MehrWas ist Statistik? Wozu dienen statistische Methoden?
25. APRIL 2002: BLATT 1 Übersicht Was ist Statistik? Wozu dienen statistische Methoden? Was ist maschinelle Sprachverarbeitung? Welche Rolle spielen statistische Methoden in verschiedenen Teilbereichen
MehrDas Denkwerkprojekt Schüler machen Wörterbücher Wörterbücher machen Schule. Handreichung zu den Projekttagen am 25. und 26.
2017 Das Denkwerkprojekt Schüler machen Wörterbücher Wörterbücher machen Schule Handreichung zu den Projekttagen am 25. und 26. Januar 2017 Willkommen! Liebe Schülerinnen und Schüler, in dieser Handreichung
MehrTerminologiearbeit und Terminographie. Von Thomas Hopp
und Terminographie Von Thomas Hopp Datenkategorien Gliederung Terminologiearbeit Datenkategorien zur Terminologieverwaltung Referat Terminologiearbeit Thomas Hopp 3.Semester 2 Datenkategorien Terminologiearbeit
MehrPhraseologismen im Wörterbuch und im deutschen und tschechischen Sprachgebrauch
Sprache - System und Tätigkeit 62 Phraseologismen im Wörterbuch und im deutschen und tschechischen Sprachgebrauch Am Beispiel von Phraseologismen mit dem Bild von Mann und Frau Bearbeitet von Eva Cieslarová
MehrVerfügbare Deutsche Korpora (gesprochene und geschriebene Texte)
Verfügbare Deutsche Korpora (gesprochene und geschriebene Texte) Chatkorpus von Michael Beißwenger http://www.linse.uni-due.de/tl_files/pdfs/publikationen-rezensionen/chatkorpus_beisswenger_2013.pdf Hamburg
MehrSprachtechnologie als Grundlage für die maschinelle Auswertung von Texten
Sprachtechnologie als Grundlage für die maschinelle Auswertung von Texten Dr-Ing Michael Piotrowski Leibniz-Institut für Europäische Geschichte @true_mxp Bamberg, 20 November 2015
MehrELEKTRONISCHE KORPORA ALS MITTEL DES INFROMATIONSERWERBS IM UNTERRICHT von VĚRA HEJHALOVÁ (Prag)
ELEKTRONISCHE KORPORA ALS MITTEL DES INFROMATIONSERWERBS IM UNTERRICHT von VĚRA HEJHALOVÁ (Prag) 1. Einleitung Der vorliegende Artikel setzt sich zum Ziel, die Möglichkeiten der Ausnutzung elektronischer
MehrNutzungshinweise zu den Lemmalisten für das Teilkorpus DEU_L1_EV. September 2015 David Stoppel, Franziska Wallner
Nutzungshinweise zu den Lemmalisten für das Teilkorpus DEU_L1_EV September 2015 David Stoppel, Franziska Wallner Einleitung Die Lemmalisten liefern Häufigkeitsangaben für Wörter der deutschen gesprochenen
MehrDicomStar. DicomStar. Dateien. True IT Solutions For You
DicomStar DicomStar Ein Google für DICOM-Dateien Dateien Motivation... Sie brauchen bestimmte DICOM-Bilder und DICOM-Dateien...... Das Finden der Bilder in Archiven dauert lange...... Sie müssen spezielle
MehrTERMINALSERVER BENUTZERLEITFADEN. TELCAT Kommunikationstechnik GmbH Sudetenstraße Salzgitter
TERMINALSERVER BENUTZERLEITFADEN Bearbeiter: Team Applikationen Anschrift: TELCAT Kommunikationstechnik GmbH Sudetenstraße 10 38239 Salzgitter Abteilung: TI A Stand: V1.5 21.09.2017 INHALT 1 Einleitung...
MehrWortstellung nominaler Elemente im Mittelfeld
HS Korpuslinguistische Beschreibung von Phänomenen des Deutschen Wortstellung nominaler Elemente im Mittelfeld Untersuchung zur Stellung nominaler Elemente im deutschen Mittelfeld - Kurzvortrag, 19.11.2003
MehrEinführung in die Computerlinguistik: Morphologie und Automaten I
Einführung in die Computerlinguistik: Morphologie und Automaten I WS 2013/2014 Manfred Pinkal Morphologie Morphologie ist der Teilbereich der Linguistik, der sich mit der internen Struktur von Wörtern
Mehr2 Bestimmung der Konzepte. Eine Beschreibung der Markup-Sprache grammisml findet sich in Schneider (2004, S. 251ff).
Eine Ontologie für die Grammatik Modellierung und Einsatzgebiete domänenspezifischer Wissensstrukturen Roman SCHNEIDER Institut für deutsche Sprache (IDS) R5, 6-13 D-68161 Mannheim schneider@ids-mannheim.de
MehrEinführung in die Computerlinguistik
Mehrdeutigkeit der Wortart Einführung in die Computerlinguistik Statistische Modellierung und Evaluation WS 2008/2009 Manfred Pinkal Sie haben in Moskau liebe genossen Sie haben in Moskau liebe Genossen
MehrSchwache Definita im Deutschen
Schwache Definita im Deutschen Łukasz Jędrzejowski l.jedrzejowski@uni-koeln.de 31. Mai 2017 31.05.17 1 Gliederung 1. Einführung 2. Schwache Definita: Nübling (1998, 2005) 3. Schwache Definita in Korpora
MehrAVS - M 01. Allgemeine und Vergleichende Sprachwissenschaft/ Verantwortlich:
AVS - M 01 1. Name des Moduls: Basismodul I: Grundlagen und Methoden der AVS Allgemeine und Vergleichende Sprachwissenschaft/ 3. Inhalte / Lehrziele Die Studierenden werden in diesem Basismodul vertraut
MehrKorpuslinguistik in der linguistischen Lehre Erfolge und Misserfolge
Korpuslinguistik in der linguistischen Lehre Erfolge und Misserfolge 18. Januar 2011 D-Spin Workshop, BBAW, Berlin Inhalt Ideen und Resultate Hoffnungen und Enttäuschungen Bedürfnisse und Probleme Ausblick
MehrPerinorm Anwendertreffen Workshop 4: Schnittstellenanforderungen in andere Systeme definieren
2017-09-13 Perinorm Anwendertreffen Workshop 4: Schnittstellenanforderungen in andere Systeme definieren Andrea Hillers/Thomas Menath Agenda Ziele des Workshops Prozesse, die mit dem Normen-Management
MehrLAUDATIO-Repository für Anwender. Carolin Odebrecht Humboldt-Universität zu Berlin LAUDATIO-repository.org
LAUDATIO-Repository für Anwender Carolin Odebrecht Humboldt-Universität zu Berlin LAUDATIO-repository.org Arbeiten mit (historischen) Fragen, die oft gestellt werden: Korpora Wo finde ich Korpora aus dem
MehrKonkordanzen aus dem Bonner Frühneuhochdeutschkorpus exportieren
Konkordanzen aus dem Bonner Frühneuhochdeutschkorpus exportieren Das Bonner Frühneuhochdeutschkorpus (FnhdC) ist derzeit eine der besten Ressourcen, die wir zu dieser Periode der deutschen Sprachgeschichte
MehrGrammatiken und linguistische Evidenz
Grammatiken und linguistische Evidenz SE: Quantitative Analyse linguistischer Variation Dozentin: Ines Rehbein 14.11.2012 Linguistische Variation (Ines Rehbein) WS 2012/13 1 / 28 Heutige Sitzung I. Zusammenfassung
MehrComputergestützte Korpuslinguistik und die Kollokationstheorie PS: Computerlinguistik Kristin Dill
Computergestützte Korpuslinguistik und die Kollokationstheorie PS: Computerlinguistik Kristin Dill Korpuslinguistik Die Korpuslinguistik ist ein Bereich der Linguistik, in dem Theorien über Sprache anhand
MehrProf. Dr. Uwe Schmidt. 31. Januar Aufgaben zur Klausur Softwaredesign im WS 2010/11 (WI h253, MI h405, BInf v310, BMInf v300, BWInf v310 )
Prof. Dr. Uwe Schmidt 31. Januar 2011 Aufgaben zur Klausur Softwaredesign im WS 2010/11 (WI h253, MI h405, BInf v310, BMInf v300, BWInf v310 ) Zeit: 75 Minuten erlaubte Hilfsmittel: keine Bitte tragen
MehrDER BEGRIFF KOLLOKATION IN VERSCHIEDENEN DOMÄNEN DER BEGRIFF KOLLOKATION IN VERSCHIEDENEN DOMÄNEN
DER BEGRIFF KOLLOKATION IN VERSCHIEDENEN DOMÄNEN Kollokationen als überraschende / beschreibenswerte / lernenswerte Wortkombinationen Rainer Perkuhn, Programmbereich Korpuslinguistik (IDS Mannheim) didaktischer
MehrDie Sammlung unikaler Wörter des Deutschen Aufbauprinzipien und erste Auswertungsergebnisse
Die Sammlung unikaler Wörter des Deutschen Aufbauprinzipien und erste Auswertungsergebnisse Manfred Sailer und Beata Trawiński SFB 441 Universität Tübingen {mf,trawinsk}@sfs.uni-tuebingen.de. EUROPHRAS
MehrBücher online lesen E-Books an der Staatsbibliothek zu Berlin
Bücher online lesen E-Books an der Staatsbibliothek zu Berlin Moritz Böhme Friederike Glaab-Kühn Elektronische Ressourcen für das moderne wissenschaftliche Arbeiten Haus Potsdamer Straße 16. April 2013
Mehrbeck-online Inhalt: Literatur
beck-online Inhalt: 0. Rechtsinformationen 1. Was ist beck-online überhaupt? 2. Was bietet beck-online? 3. Suchmöglichkeiten bei beck-online 4. Rechercheergebnisse weiterverwenden 5. Überblick über das
MehrAufgabe. Erstellen eines kleinen Lernerkorpus exemplarisches Aufzeigen, wie Fehler sinnvoll klassifiziert und annotiert werden könnten
Aufgabe Erstellen eines kleinen Lernerkorpus exemplarisches Aufzeigen, wie Fehler sinnvoll klassifiziert und annotiert werden könnten Mitstreiterinnen: Elena Briskina, Julia Hantschel, Jenny Krüger, Stéphanie
MehrGliederung. Das TIGER-Korpus: Annotation und Exploration. TIGER-Korpus. 1. TIGER-Korpus. entstanden im Projekt TIGER (1999 heute) beteiligte Institute
Das TIGER-Korpus: Annotation und Exploration Stefanie Dipper Forschungskolloquium Korpuslinguistik, 11.11.03 Gliederung 1. TIGER-Korpus 2. Annotation 3. Visualisierung 4. Suche, Retrieval 5. Demo 6. Repräsentation
MehrDas neue wiso Mehr Inhalte, mehr Usability, neues Design! powered by
Das neue wiso 2010 Mehr Inhalte, mehr Usability, neues Design! www.wiso-net.de powered by So suchen Sie Für die Recherche stehen zahlreiche Optionen zur Verfügung: Von der Schnellsuche über alle Medien
MehrNeue Funktionen in der KorpusSuchmaschine ANNIS 3.1
Neue Funktionen in der KorpusSuchmaschine ANNIS 3.1 Thomas Krause 1 Vorkenntnisse??? 2 Hands On Im Browser (möglichst Firefox oder Chrome) https://korpling.german.hu-berlin.de/annis3/ aufrufen Nachfragen!
MehrBlockseminar Einführung in die Korpuslinguistik Seminarleitung: Yvonne Krämer, M.A. Das Korpus. und seine Aufbereitung
Blockseminar Einführung in die Korpuslinguistik Seminarleitung: Yvonne Krämer, M.A. Das Korpus und seine Aufbereitung Bestandteile eines Korpus sind i.d.r.: Primärdaten Metadaten Annotationen Annotationen
MehrThemen. GK C: Einführung in die Korpuslinguistik. Vorverarbeitung. Tokenisierung. Tokenisierung. Aber. Vorverarbeitung
GK C: Einführung in die Korpuslinguistik Anke Lüdeling anke.luedeling@rz.hu-berlin.de Sommersemester 2003 Themen Vorverarbeitung Tokenisieren Taggen Lemmatisieren Vorverarbeitung auf allen Vorverarbeitungsebenen
MehrStephan Lamprecht. Texte professionell konzipieren, schreiben und veröffentlichen
Stephan Lamprecht Texte professionell konzipieren, schreiben und veröffentlichen Vorwort............................................. 11 1: Vergessen Sie Textverarbeitungen! 15 1.1 So fein gliedern, wie
MehrFürstinnenkorrespondenzen Experiment einer Nachnutzung. Stefan Dumont, Berlin
Fürstinnenkorrespondenzen Experiment einer Nachnutzung Stefan Dumont, Berlin Ressource Frühneuzeitliche Fürstinnenkorrespondenzen im mitteldeutschen Raum Ziel: Kulturhistorisch bedeutsame Korrespondenzen
Mehr