COSMAS II Corpus Search Management and Analysis System
|
|
- Calvin Krause
- vor 7 Jahren
- Abrufe
Transkript
1 COSMAS II Corpus Search Management and Analysis System November 2012, Jeanette Isele Seminar: Korpuslinguistik
2 Übersicht Theoretischer Teil Was ist COSMAS II? Die Archive und Korpora von COSMAS II Textklassifikation Suchanfragen (erster Überblick) Ergebnisanzeige (erster Überblick) Zielgruppe / Benutzer von COSMAS II Verwendungsmöglichkeiten & Projekte mit COSMAS II Praktischer Teil Suchablauf anhand eines einfachen Beispiels (im geschriebenen Korpus) Abfrage im getaggten Korpus (Treetagger) Abfrage im getaggten Korpus (CONNEXOR)
3 Theoretischer Teil COSMAS II
4 Was ist COSMAS II? Portal für die Korpusrecherche vom Institut für Deutsche Sprache in Mannheim Insgesamt 108 Textkorpora (7.3 Mrd. Wortformen, 18.2 Mio. Buchseiten) Unentgeltliche Registrierung notwendig (insgesamt Nutzer aus 100 versch. Ländern) Aktuelles System: COSMAS II (Nachfolgesystem von COSMAS I, )
5 Die Korpora Insgesamt 108 Korpora, in 10 Archive gegliedert: Archiv der geschriebenen Korpora (das Hauptarchiv) Archiv morphosyntaktisch annotierter Korpora (CONNEXOR-Tagset) Archiv morphosyntaktisch annotierter Korpora (TreeTagger-Tagset) Archiv morphosyntaktisch annotierter Korpora (MECOLB-Tagset) Archiv der historischen Korpora Archiv des Projekts "Sprachliche Umbrüche des 20. Jahrhunderts" Korpus-Kartei der Gesellschaft für deutsche Sprache Archiv der phasengegliederten Wendekorpora Archiv der aussortierten geschriebenen Korpora Archiv der Süddeutschen Zeitung
6 Die Korpora Korpusgrösse: Anzahl Texte: Anzahl Wortformen: Korpusgrösse: Anzahl Texte: Anzahl Wortformen:
7 Die Korpora Die verschiedenen Archive sind in Korpora gegliedert.
8 Neue Elemente in der Textklassifikation Nach Textsorte (z.b. Abstract, Buchauszug, Leserbrief, Nachruf, versch. Arten von Berichten) Nach Thematik (z.b. Fiktion, Kultur, Politik, Sport, Natur/Umwelt, Staat/Gesellschaft, Wissenschaft, Wirtschaft)
9 Suchanfragen bei COSMAS II (erster Überblick) Nach Wortform(en) (z.b. ruft) Die Verwendung regulärer Ausdrücke ist bisher nicht möglich, aber eigene Suchabfragesprache Nach Wortart (z.b. nach Substantiven) Angabe zum Abstand zwischen Wörtern/Sätzen möglich Angabe zu Textbereichen (z.b. gesuchtes Wort soll im Titel vorkommen) und zur Position (z.b. erstes oder letztes Wort im Satz)
10 Ergebnisse bei COSMAS II (erster Überblick) KWIC-Anzeige Sortierung nach Entstehungszeit, Land oder Thematik Statistiken können angezeigt werden (z.b. um Gebrauchshäufigkeit von etwas zu berechnen) Metainformationen: Verlag, evtl. Autor, Entstehungszeit, Seitenangabe Auswahl und Export möglich
11 Zielgruppe/Benutzer von COSMAS II Linguisten Forscher der Psychologie, Neurologie, Kognitionswissenschaft, Sprachtherapie, Kommunikationsund Medienwissenschaft, Statistik Übersetzer und Sprachlehrer (um Beispiele zu erhalten) Sprachinteressierte "Laien" auf der Suche nach Wortzusammenhängen oder Verwendungsweisen von Wörtern
12 Verwendungsmöglichkeiten von COSMAS II Wortgebrauch (Kontext, Zeit, Textsorte) Vielfalt der Wortkompositionen Kookkurenz-Analyse (mit Statistiken) Neologismenforschung Neue/andere Wortbedeutungen finden Gesellschaftliche Trends Verwendung bestimmter grammatischer Strukturen etc.
13 Projekte am IDS mit COSMAS II OWID (Online-Wortschatz-Informationsystem Deutsch) DFWB (Deutsches Fremdwörterbuch) Handbuch deutscher Kommunikationsverben GRAMMIS (grammatisches Informationssystem) Handbuch der deutschen Konnektoren Für die Erarbeitung und das Testen korpuslinguistischer Methoden
14 Praktischer Teil COSMAS II
15 Suchablauf
16 1. Archiv wählen
17 2. Korpus wählen
18 2. Korpus wählen - benutzerdefiniert
19 3. Anfrage formulieren
20 3. Anfrage formulieren - Abfragesprache
21 3. Anfrage formulieren Abfragesprache (Grundlagen) Suchanfrage &Park Park* Park? Park+ Im /+w2 Park Parks /w0 MORPH(N) Abgefragte Wortformen/Konstruktionen Alle Flexionsformen von Park Danach darf eine beliebige Anzahl an Zeichen folgen (auch 0 Zeichen), Bsp. «Parkanlage» Es muss genau 1 Zeichen folgen, Bsp. «Parks» Es darf höchstens 1 Zeichen folgen, Bsp. «Parks», «Park» Max. Wortabstand = 2, z.b. «im schönen Park» Es muss sich um ein Nomen handeln (wichtig: Wortabstand = 0)
22 3. Anfrage formulieren - Optionen
23 4. Wortformenliste bearbeiten
24 5. Ergebnisanzeige
25 5. Ergebnisanzeige - Quellenansicht - Korpusansicht - Dokumentansicht - Ansicht vor/seit Zeitpunkt - Jahrzehntansicht - Jahresansicht - Monatsansicht - Tagesansicht - Länderansicht - Textsortenansicht - Themenansicht - KWIC - Kookkurrenzanalyse
26 6. KWIC
27 7. Export von Ergebnissen Wichtig: Ergebnisansicht und Korpusansicht ankreuzen
28 7. Export von Ergebnissen
29 7. Export von Ergebnissen
30 Abfragen im getaggten Korpus (Treetagger) - Mit dem getaggten Korpus kann man gezielt nach bestimmten Wortarten suchen - Einfaches Beispiel: Floh (Substantiv) vs. floh (Verb) - Suchanfrage Floh (Substantiv): floh /w0 MORPH(N) - Suchanfrage floh (Verb): floh /w0 MORPH(VRB fin v)
31 Abfragen im getaggten Korpus (Treetagger) - Beispiel: anerkennt vs. erkennt an - Suchanfrage 1 (anerkennt): anerkennt /w0 MORPH(VRB fin v) - Suchabfrage 2 (erkennt an): (erkennt /w0 MORPH(VRB fin v))/w+5 (an /w0 MORPH(PTK vz)) - Suchanfrage 3 (erkennt an, optimiert): (erkennt /w0 MORPH(VRB fin v))/s+0 (an /w0 MORPH(PTK vz))
32 Abfragen im getaggten Korpus (Treetagger) Suchanfrage 1 (anerkennt) Treffer Anzahl Wörter A CH D
33 Abfragen im getaggten Korpus (Treetagger) Suchanfrage 2 (erkennt an) Treffer Anzahl Wörter A CH D
34 Abfragen im getaggten Korpus (Treetagger) Suchanfrage 3 (erkennt an) Treffer Anzahl Wörter A CH D
35 Abfragen im getaggten Korpus (Treetagger) Ergebnisse anerkennt erkennt an (Abstand 5 Wörter) erkennt an (gleicher Satz) Wortmenge A CH D
36 Einschränkungen im getaggten Korpus (Treetagger) - Das getaggte Korpus (Treetagger) enthält keine syntaktischen Informationen: - bei folgenden Fragen kommen wir mit dem getaggten Korpus (Treetagger) also auch nicht weiter: - - Pluralformen von Park (Parks, Pärke)? Problem: Parks kann Genitiv (Sg.) oder Nominatik (Pl.) sein - - Wird wegen mit Genitiv oder Dativ verwendet? Problem: keine Informationen über den Kasus - - Wird (an)rufen mit Dativ oder Akkusativ verwendet? Problem: keine Informationen über den Kasus
37 Abfragen im getaggten Korpus (CONNEXOR) Numerus-Abfrage möglich: wir können hier gezielt nach den Pluralformen Parks und Pärke suchen Abfrage 1: *parks /w0 MORPH(N PL) Abfrage 2: *parke /w0 MORPH(N PL) Abfrage 3: *pärke /w0 MORPH(N PL) (Achtung bei Abfrage 3: vorgeschlagene Wortformen enthalten auch parke)
38 Abfragen im getaggten Korpus (CONNEXOR): Parks
39 Abfragen im getaggten Korpus (CONNEXOR): Parke
40 Abfragen im getaggten Korpus (CONNEXOR): Pärke Keine Treffer!
41 Abfragen im getaggten Korpus (CONNEXOR): Parks/-parks Parke/-parke Pärke/-pärke Wortmenge A CH D
42 Abfrage Pärke/-pärke im Gesamtkorpus Pärke/-pärke Wortmenge A CH D
43 Abfrage Pärke/-pärke im getaggten Korpus (CONNEXOR) Ohne morphologische Informationen: Pärke/-pärke Wortmenge A CH D Pärke/-pärke wird vermutlich falsch getaggt (im CONNECOR-Korpus)
44 COSMAS II Corpus Search Management and Analysis System 13. November 2012, Jeanette Isele Seminar: Korpuslinguistik
Korpuslinguistik IDS-Korpora und COSMAS II
Korpuslinguistik IDS-Korpora und COSMAS II Heike Zinsmeister Korpuslinguistik 11. 11. 2011 Gliederung 1 Einleitung 2 Korpusbestand am IDS 3 Korpusrecherche mit COSMAS II 4 Referenzen Das Institut für Deutsche
MehrKorpusanalyse am IDS Die Korpora
Die Korpora DeReKo: Das Deutsche Referenzkorpus Die Korpora am IDS Größe: über 3,4 Milliarden Textwörter (Stand: 2008) Akquise: im Hinblick auf Umfang, Variabilität, Qualität und Aktualität; urheberrechtlich
MehrWas ist ein Korpus. Zitat aus: Carstensen et al. Computerlinguistik und Sprachtechnologie: Eine Einführung. Kap. 4.2, Textkorpora
Was ist ein Korpus Korpora sind Sammlungen linguistisch aufbereitete(r) Texte in geschriebener oder gesprochener Sprache, die elektronisch gespeichert vorliegen. Zitat aus: Carstensen et al. Computerlinguistik
MehrKorpuslinguistik. Vorlesungsreihe»Methoden der Linguistik«(WS 2004/05) Universität Zürich, Korpuslinguistik. Jürgen Spitzmüller.
Vorlesungsreihe»Methoden der Linguistik«(WS 2004/05) Universität Zürich, 7.12.2004 1. Teil: Theorie Grundlegende theoretische Fragestellungen: Was sind überhaupt Korpora? Wozu Korpora? Was sollen Korpora
MehrIntelligente Recherchestrategien für e-humanities Universität Duisburg-Essen
Intelligente Recherchestrategien für e-humanities Universität Duisburg-Essen Softwaretest COSMAS II Client v3.6.1 Das Korpusrecherche- und -analyse-system COSMAS (Corpus Search, Management and Analysis
MehrKorpuslinguistik Grundlagen Korpusrecherchemethoden
Methoden der Korpusanalyse Erstellung von Konkordanzen Erzeugung von Wortlisten mit Frequenzangaben Ermittlung von hochfrequenten Wortgruppen (Clusteranalyse) Berechnung von Kookkurrenzen Ermittlung von
MehrDas Flexionssystem des Deutschen: Allgemeines
Die Nominalflexion des Deutschen WS 2005/06 Das Flexionssystem des Deutschen 1 Das Flexionssystem des Deutschen: Allgemeines Das Deutsche als flektierende Sprache Nach der an morphologischen Kriterien
MehrCOSMAS. (Corpus Storage, Maintenance and Access System)
COSMAS (Corpus Storage, Maintenance and Access System) 1. Möglichkeiten von COSMAS - Suchen und Kombinationssuchen in einem vordefinierten Korpus. Die vordefinierten Korpora sind in Anlage 1 aufgelistet.
MehrComputerlinguistische Grundlagen. Jürgen Hermes Sommersemester 17 Sprachliche Informationsverarbeitung Institut für Linguistik Universität zu Köln
Computerlinguistische Grundlagen Jürgen Hermes Sommersemester 17 Sprachliche Informationsverarbeitung Institut für Linguistik Universität zu Köln Computerlinguistik: Schnittstellen Computerlinguistik aus
MehrVorlesung Morphologie Flexion
Vorlesung Morphologie 13.6. - Flexion Anke Lüdeling anke.luedeling@rz.hu-berlin.de Sommersemester 2008 Vertretung: Hagen Hirschmann Flexion Inhalte heute Flexionskategorien & Paradigmata Nomen Adjektive
MehrKorpus. Was ist ein Korpus?
Was ist ein Korpus? Korpus Endliche Menge von konkreten sprachlichen Äußerungen, die als empirische Grundlage für sprachwiss. Untersuchungen dienen. Stellenwert und Beschaffenheit des Korpus hängen weitgehend
MehrDaten Methoden Theorien Definitionen & Operationalisierungen
Operationale Verfahren Daten Methoden Theorien Definitionen & Operationalisierungen Das Überbrückungsproblem Hypothese Explizite Formulierung einer als wahr vermuteten, begründbaren Aussage über das Phänomen
MehrEinsteiger-Tutorial zu Korpusrecherchen mit COSMAS II
Einsteiger-Tutorial zu Korpusrecherchen mit COSMAS II Angenommen, wir wollen mit Hilfe von COSMAS II den Gebrauch des Erstglieds (Präfixoids?) Schwarz- bei Personenbezeichnungen auf -er nachvollziehen,
MehrKorpusanalyse am IDS Die Korpora
Die Korpora DeReKo: Das Deutsche Referenzkorpus Die Korpora am IDS Größe: über 3,4 Milliarden Textwörter (Stand: 2008) Akquise: im Hinblick auf Umfang, Variabilität, Qualität und Aktualität; urheberrechtlich
MehrDWDS-Kernkorpus / DWDS-Korpusanalyse
Korpusrecherchesysteme Das DWDS-Kernkorpus DWDS-Kernkorpus / DWDS-Korpusanalyse Entwickler: Berlin-Brandenburgische Akademie der Wissenschaften. Version: (keine Versionierung). Recherche: online. Software:
MehrKorpuslinguistik Annis 3 -Korpussuchtool Linguistische Suchen im Ridges-Korpus LAUDATIO-Workshop Hagen Hirschmann
Korpuslinguistik Annis 3 -Korpussuchtool Linguistische Suchen im Ridges-Korpus 07.10.2014 LAUDATIO-Workshop Hagen Hirschmann Was ist ANNIS? ANNIS steht für ANNotation of Information Structure http://www.sfb632.uni-potsdam.de/d1/annis/
MehrBlockseminar Einführung in die Korpuslinguistik Seminarleitung: Yvonne Krämer, M.A. Das Korpus. und seine Aufbereitung
Blockseminar Einführung in die Korpuslinguistik Seminarleitung: Yvonne Krämer, M.A. Das Korpus und seine Aufbereitung Bestandteile eines Korpus sind i.d.r.: Primärdaten Metadaten Annotationen Annotationen
MehrAufgaben aus Kegli 2 (Korpuslinguistik)
Aufgaben aus Kegli 2 (Korpuslinguistik) Kapitel 1 1. Überprüfen Sie mithilfe einer beliebigen Suchmaschine den Sprachgebrauch im Internet. Finden Sie die Formen wegen dem Regen bzw. wegen des Regens und
MehrSchwache Definita im Deutschen
Schwache Definita im Deutschen Łukasz Jędrzejowski l.jedrzejowski@uni-koeln.de 31. Mai 2017 31.05.17 1 Gliederung 1. Einführung 2. Schwache Definita: Nübling (1998, 2005) 3. Schwache Definita in Korpora
MehrMIT COSMAS II»IN DEN WEITEN DER IDS-KORPORA UNTERWEGS«
02 FORSCHUNG Franck Bodmer Mory MIT COSMAS II»IN DEN WEITEN DER IDS-KORPORA UNTERWEGS«Abb. 1: Die Web-Oberfläche von COSMAS II mit Benutzerkorpus Finanzen..." Einleitung cosmas ii (= Corpus Search, Management
MehrANNIS Quickstart
Suche in ANNIS Bevor man suchen kann, muss das gewünschte Korpus in der Korpusliste ausgewählt werden (z.b. das Teilkorpus mo (monoethnisches Ergänzungskorpus) oder KiDKo mu (multiethnisches Korpus). Danach
MehrZugang zur Konkordanzsuche
Zugang zur Konkordanzsuche 1.1 Zugriff Mit dem Recherchetool können Sie: - Konkordanzen (= eine Liste aller Vorkommen eines Suchwortes im Kontext) aus der Verbalspur und den Annotationen erstellen, - Metadaten
MehrMorphologische Merkmale. Merkmale Merkmale in der Linguistik Merkmale in der Morpholgie Morphologische Typologie Morphologische Modelle
Morphologische Merkmale Merkmale Merkmale in der Linguistik Merkmale in der Morpholgie Morphologische Typologie Morphologische Modelle Merkmale Das Wort 'Merkmal' ' bedeutet im Prinzip soviel wie 'Eigenschaft'
MehrKorpuslinguistik Annis 3 -Korpussuchtool Suchen in tief annotierten Korpora
Korpuslinguistik Annis 3 -Korpussuchtool Suchen in tief annotierten Korpora Anke Lüdeling, Marc Reznicek, Amir Zeldes, Hagen Hirschmann... und anderen Mitarbeitern der HU-Korpuslinguistik Ziele Wie/Was
MehrGrammatikbingo Anleitung
Grammatikbingo Anleitung 1. Die Schüler legen auf einem Blatt oder in ihrem Heft eine Tabelle mit 16 Feldern (4x4) an. Die Tabelle sollte ca. die Hälfte des Blattes einnehmen. 2. Der Lehrer liest die Aufgaben
MehrEinführung in die Sprachwissenschaft des Deutschen. Syntax II. PD Dr. Alexandra Zepter
Einführung in die Sprachwissenschaft des Deutschen Syntax II PD Dr. Alexandra Zepter Überblick Syntax Fokus auf linearer Ordnung: Sprachtypen, Topologisches Feldermodell Fokus auf hierarchischer Ordnung:
MehrKookkurrenzanalyse Einführung
Einführung Kookkurenzanalyse die grundlegende Idee 1) Beobachtung: In einem Korpus tritt Wort X 1000mal auf, Wort Y 100mal, Wort Z 10mal. 2) Wahrscheinlichkeit: Die Kombination XY ist 10mal so wahrscheinlich
MehrAutomatische Lexikonakquisition aus Textkorpora. Vortrag von Peter Adolphs Forschungskolloquium Korpuslinguistik 14. Juni 2006
Automatische Lexikonakquisition aus Textkorpora Vortrag von Peter Adolphs Forschungskolloquium Korpuslinguistik 14. Juni 2006 Inhalt Vorüberlegungen zu meiner Diplomarbeit Thema: (semi-)automatische Akquisition
MehrDoris Steffens / Doris al-wadi. Neuer Wortschatz. Neologismen im Deutschen Band 2: kiten Z
Doris Steffens / Doris al-wadi Neuer Wortschatz Neologismen im Deutschen 2001 2010 Band 2: kiten Z Bibliografische Information der Deutschen Nationalbibliothek Die Deutsche Nationalbibliothek verzeichnet
MehrKorrespondenz. Kongruenz_Teil II. Kongruenz. Kongruenz, Rektion, Anaphorik. R 1_Beispiele. Kongruenzfehler_Richtlinie 1
Kongruenz_Teil II HS: Korpuslinguistische Bearbeitung von Phänomenen des Deutschen Dozentin: Prof. Dr. Anke Lüdeling Referenten: Heike Ewert, Stephan Klinger, Eva Lippert; Gruppe: Julia Kudrjawzewa, Wolfram
MehrSprachdaten sammeln und auswerten
130 Sprachdaten sammeln und auswerten Die Korpuslinguistik am Institut für Deutsche Sprache (IDS) Von Peter Anliker 1 Im Jahr 1964, also vor fünfzig Jahren, wurde in Mannheim das Institut für Deutsche
MehrDas Denkwerkprojekt Schüler machen Wörterbücher Wörterbücher machen Schule. Handreichung zu den Projekttagen am 25. und 26.
2017 Das Denkwerkprojekt Schüler machen Wörterbücher Wörterbücher machen Schule Handreichung zu den Projekttagen am 25. und 26. Januar 2017 Willkommen! Liebe Schülerinnen und Schüler, in dieser Handreichung
MehrDaten Methoden Theorien Definitionen & Operationalisierungen
Definitionen Daten Methoden Theorien Definitionen & Operationalisierungen Eine Realdefinition legt fest, wie ein Ausdruck verwendet wird, indem sie die Beobachtungen, das Wissen, die Intuitionen, die wir
MehrHinweise zur flexionsmorphologischen Glossierung
Morphologie und Lexikon SS 2006 flexionsmorphologische Glossierung 1 Hinweise zur flexionsmorphologischen Glossierung Allgemeines Die flexionsmorphologische Glossierung steht als zweite Zeile unterhalb
MehrGrundkurs Linguistik - Morphologie
Grundkurs Linguistik - Jens Fleischhauer fleischhauer@phil.uni-duesseldorf.de Heinrich-Heine Universität Düsseldorf; Abteilung für Allgemeine Sprachwissenschaft 10.11.2016; WS 2016/2017 1 / 21 Jens Fleischhauer
MehrKorpuslinguistik in der linguistischen Lehre Erfolge und Misserfolge
Korpuslinguistik in der linguistischen Lehre Erfolge und Misserfolge 18. Januar 2011 D-Spin Workshop, BBAW, Berlin Inhalt Ideen und Resultate Hoffnungen und Enttäuschungen Bedürfnisse und Probleme Ausblick
MehrKorpora zu geschriebener und gesprochener Sprache
FAU Erlangen-Nürnberg Stand: 25.05.2015 Department Germanistik und Komparatistik Lehrstuhl für Germanistische Sprachwissenschaft Andreas Blombach Korpora zu geschriebener und gesprochener Sprache 1 Geschriebenes
MehrKorpusbasierte Sprachreflexion mit Online-Ressourcen. Heike Zinsmeister Institut für Maschinelle Sprachverarbeitung Universität Stuttgart
Korpusbasierte Sprachreflexion mit Online-Ressourcen Heike Zinsmeister Institut für Maschinelle Sprachverarbeitung Universität Stuttgart CLARIN-D Common Language Resources and Technology Infrastructure
MehrVerfügbare Deutsche Korpora (gesprochene und geschriebene Texte)
Verfügbare Deutsche Korpora (gesprochene und geschriebene Texte) Chatkorpus von Michael Beißwenger http://www.linse.uni-due.de/tl_files/pdfs/publikationen-rezensionen/chatkorpus_beisswenger_2013.pdf Hamburg
MehrDie Corpus Workbench und ihre Syntax. Blockseminar Einführung in die Korpuslinguistik Seminarleitung: Yvonne Krämer, M.A.
Die Corpus Workbench und ihre Syntax Blockseminar Einführung in die Korpuslinguistik Seminarleitung: Yvonne Krämer, M.A. Die IMS Open Corpus Workbench (CWB) Mächtige Konkordanz- und Korpusanalyse-Software
MehrDie Grammatikalisierung deutscher Präpositionen
Claudio Di Meola 0 Die Grammatikalisierung deutscher Präpositionen STAÜFFENBURG VERLAG Inhalt Vorwort xi Einleitung 1 1. Theoretischer Rahmen und Forschungsstand 5 1.1. Grundannahmen der Grammatikalisierungsforschung
Mehr6. Klasse. Grammatik. Deutsch. Grammatik. in 15 Minuten
Grammatik 6. Klasse Deutsch Grammatik in 15 Minuten Klasse So übst du mit diesem Buch Im Inhaltsverzeichnis findest du alle für deine Klassenstufe wichtigen Themengebiete. Du hast zwei Möglichkeiten: 1.
MehrFlexion. Grundkurs Germanistische Linguistik (Plenum) Judith Berman Derivationsmorphem vs. Flexionsmorphem
Grundkurs Germanistische Linguistik (Plenum) Judith Berman 23.11.04 vs. Wortbildung (1)a. [saft - ig] b. [[An - geb] - er] Derivationsmorphem vs. smorphem (4)a. Angeber - saftiger b. saftig - Safts c.
MehrDigital Humanities Recherche im DWDS und DTA
Digital Humanities Recherche im DWDS und DTA mit Booleschen Operatoren und Regulären Ausdrücken Jena Language & Information Engineering (JULIE) Lab Friedrich-Schiller-Universität Jena, Germany http://www.julielab.de
MehrKorpora. Referenten Duyen Tao-Pham Nedyalko Georgiev
Korpora Referenten Duyen Tao-Pham Nedyalko Georgiev Hauptseminar: Angewandte Linguistische Datenverarbeitung (WS 11/12) Dozent: Prof. Dr. Jürgen Rolshoven Sprachliche Informationsverarbeitung Universität
Mehrmemoq 2015 Übersetzung, Terminologie, Alignment Schulungshandbuch für Einsteiger
memoq 2015 Übersetzung, Terminologie, Alignment Schulungshandbuch für Einsteiger Copyright memoq 2015 Copyright Autoren Angelika Zerfaß, Verena Isele, info@zaac.de Druck 18. August 2015 Copyright zaac
MehrWortarten I: Die Deklinierbaren
Wortarten I: Die Deklinierbaren 1.) Substantive: Morphologische Grundmerkmale: 1.) Zugehörigkeit zu jeweils bestimmten Typenklassen der Deklination und der Pluralbildung. 2.) Festes Genus. Syntaktisches
MehrWiederholung: Korpuslinguistik. Einführung in die Korpuslinguistik. Vorverarbeitung: Themen. Vorverarbeitung. Vorverarbeitung.
Wiederholung: Korpuslinguistik Einführung in die Korpuslinguistik Anke Lüdeling anke.luedeling@rz.hu-berlin.de Sommersemester 2007 beschäftigt sich damit, welche linguistischen Fragen anhand (großer) Textmengen
Mehr6. Klasse. Grammatik. Deutsch. Grammatik. in 15 Minuten
Grammatik 6. Klasse Deutsch Grammatik in 15 Minuten Klasse So übst du mit diesem Buch Im Inhaltsverzeichnis findest du alle für deine Klassenstufe wichtigen Themengebiete. Du hast zwei Möglichkeiten: 1.
MehrKorpuslinguistik Grundlagen Korpora
Was ist ein Korpus? Lemnitzer, Lothar und Heike Zinsmeister. Korpuslinguistik. Eine Einführung. Tübingen: Narr, 2006. S. 7. Stefan Engelberg, Linguistische Methodenlehre, FS 2009, Uni Mannheim [Folie 1]
MehrBenutzung der bibliographischen Datenbanken
Benutzung der bibliographischen Datenbanken Année philologique Online Gnomon Bibliographie papyrologique Seminar für Griechische und Lateinische Philologie der Universität Zürich Rämistrasse 68 8001 Zürich
MehrKurze literarische Texte in literaturwissenschaftlicher und linguistischer Perspektive. Lyrik seit den 1990er Jahren
Kurze literarische Texte in literaturwissenschaftlicher und linguistischer Perspektive Lyrik seit den 1990er Jahren Christine Hummel & Stefan Engelberg Institut für Deutsche Sprache, Mannheim Universität
MehrSwantje Westpfahl & Thomas Schmidt POS für(s) FOLK
Swantje Westpfahl & Thomas Schmidt POS für(s) FOLK Problemanalyse des POS- Taggings für spontansprachliche Daten anhand des Forschungsund Lehrkorpus Gesprochenes Deutsch 2 FOLK Forschungs- und Lehrkorpus
MehrBricsCAD System Variablen
BricsCAD System Variablen System Variable und Benutzer Einstellungen Der Dialog Einstellungen (Internetverbindung erforderlich) BricsCAD sucht in den Variablen Namen, Titeln und/oder Hilfe-Texten. Anzeigen
MehrELEKTRONISCHE KORPORA ALS MITTEL DES INFROMATIONSERWERBS IM UNTERRICHT von VĚRA HEJHALOVÁ (Prag)
ELEKTRONISCHE KORPORA ALS MITTEL DES INFROMATIONSERWERBS IM UNTERRICHT von VĚRA HEJHALOVÁ (Prag) 1. Einleitung Der vorliegende Artikel setzt sich zum Ziel, die Möglichkeiten der Ausnutzung elektronischer
MehrÜberblick Kasus. NIVEAU NUMMER SPRACHE Anfänger A1_1033G_DE Deutsch
Überblick Kasus GRAMMATIK NIVEAU NUMMER SPRACHE Anfänger A1_1033G_DE Deutsch Lernziele Deutsche Fälle im Überblick lernen Nominativ, Akkusativ und Dativ üben 2 Ich erzähle dir eine Geschichte? oder vielleicht
MehrRe exivpronomen. Arbeitsblätter zum Ausdrucken von sofatutor.com
Arbeitsblätter zum Ausdrucken von sofatutor.com Re exivpronomen 2 Gib an, ob es sich um Re exivpronomen oder Personalpronomen handelt. 3 Bestimme das Re exivpronomen und das Subjekt. 4 Bestimme den Kasus.
MehrWort. nicht flektierbar. flektierbar. nach Person, Numerus, Modus, Tempus, Genus verbi flektiert. nach Genus, Kasus, Numerus flektiert
Wort flektierbar nicht flektierbar nach Person, Numerus, Modus, Tempus, Genus verbi flektiert genufest nach Genus, Kasus, Numerus flektiert genusveränderlich komparierbar nicht komparierbar Verb Substantiv
MehrEinführung in die Computerlinguistik. Morphologie II
Einführung in die Computerlinguistik Morphologie II Hinrich Schütze & Robert Zangenfeind Centrum für Informations- und Sprachverarbeitung, LMU München 30.11.2015 Schütze & Zangenfeind: Morphologie II 1
MehrArgumentstrukturalternanzen Argumentstrukturalternanzen und Valenz
und Valenz Gängige Annahme: Syntaktische Strukturen werden bestimmt durch (i) allgemeine syntaktische Regeln und Prinzipien und durch (ii) idiosynkratische syntaktische Eigenschaften einzelner Lexeme (z.
MehrEinsteiger-Tutorial zu Korpusrecherchen mit WaCkY
Einsteiger-Tutorial zu Korpusrecherchen mit WaCkY Um Sprachdaten aus dem Internet zu gewinnen, waren Linguistinnen lange auf konventionelle Suchmaschinen angewiesen. Dies hatte den Nachteil, dass quantitative
MehrProbeklausur Syntax-Übung MA Linguistik
Probeklausur Syntax-Übung MA Linguistik Prof. Dr. Stefan Müller Humboldt Universität Berlin St.Mueller@hu-berlin.de 12. Februar 2018 In diesem Dokument gibt es Fragen zu allem, was in der Veranstaltung
MehrArtikelwörter. Jason Rothe
Artikelwörter Jason Rothe Was ist das für 1 geiler Vortrag? Gliederung 1. Einleitung 2. Lehrbuchauszug 3. These 4. Stellung der Artikelwörter 5. Artikel vs. Artikelwort 6. Zuschreibung des Genus 7. Morphosyntaktische
MehrHS: Korpuslinguistische Behandlung von Phänomenen des Deutschen
HS: Korpuslinguistische Behandlung von Phänomenen des Deutschen WS 2005/2006 Anke Lüdeling with a lot of help from Stefan Evert & Marco Baroni Kontrastive Analyse (CIA) (quantitativer) Vergleich von zwei
MehrMinimalistische Morphologie
Minimalistische Morphologie minimalistisch: basiert auf wenigen Prinzipien befasst sich mit flektierten Wortformen und deren Rolle in der Syntax Basis-Annahmen 1. keine abstrakten Morpheme 2. maximale
Mehra) Erklären Sie, was eine SOV Sprache ist und was eine V2 Sprache ist. b) Welche Wortstellungsmuster sind eher selten in Sprachen der Welt?
Syntax 1) Wortstellung a) Erklären Sie, was eine SOV Sprache ist und was eine V2 Sprache ist. Unter SOV Sprachen verstehen wir all jene Sprachen, die als Grundwortstellung die Reihenfolge Subjekt (S) Objekt
MehrDas Aktantenpotenzial beschreibt die Möglichkeit eines Verbs andere Wörter an
1 2 Das Aktantenpotenzial beschreibt die Möglichkeit eines Verbs andere Wörter an sich zu binden, nämlich die Aktanten. Aktant ist demzufolge ein Begriff, der für die Valenzpartner eines Verbs auf der
MehrUnterrichtsmaterialien in digitaler und in gedruckter Form. Auszug aus: Kein leichter Fall - das deutsche Kasussystem
Unterrichtsmaterialien in digitaler und in gedruckter Form Auszug aus: Kein leichter Fall - das deutsche Kasussystem Das komplette Material finden Sie hier: School-Scout.de 2 von 28 Kasus Grammatik und
Mehr"Studienbegleitende Angebote zum akademischen Schreiben in der Fremdsprache Deutsch"
Fachtagung Universität Bielefeld mit Unterstützung des FaDaF e.v. "Studienbegleitende Angebote zum akademischen Schreiben in der Fremdsprache Deutsch" Zur praktischen Einübung der akademischen Textsorte
MehrDistribution Dieser Begriff bezieht sich nicht nur auf morphologische Einheiten, sondern ist z.b. auch auf <Phoneme anwendbar.
Distribution Dieser Begriff bezieht sich nicht nur auf morphologische Einheiten, sondern ist z.b. auch auf
MehrVertiefung der Grundlagen der Computerlinguistik. Semesterüberblick und Einführung zur Dependenz. Robert Zangenfeind
Vertiefung der Grundlagen der Computerlinguistik Semesterüberblick und Einführung zur Dependenz Robert Zangenfeind Centrum für Informations- und Sprachverarbeitung, LMU München 17.10.2017 Zangenfeind:
MehrÜberblick Kasus. NIVEAU NUMMER SPRACHE Anfänger A1_1033G_DE Deutsch
Überblick Kasus GRAMMATIK NIVEAU NUMMER SPRACHE Anfänger A1_1033G_DE Deutsch Lernziele Deutsche Fälle im Überblick lernen Nominativ, Akkusativ und Dativ üben 2 Ich erzähle dir eine Geschichte? oder vielleicht
MehrArtikelspiel erstellt von L. Schikowski M.A., Universität Göttingen, IIK e.v. Göttingen, lschikowski@gmail.com, Gruppen-/Partnerarbeit
Genus Rede Kardinalzahl Prädikat Konsonant Modus Stamm Vokal Subjekt Plural Prä-/Suffix Genitiv Artikel mit Grammatikbegriffen üben Präteritum Numerus Funktionsverbgefüge Plusquamperfekt Konjugation Kasus
Mehr1. Verben ohne Präpositionen
1. Verben ohne Präpositionen - 1 - 1. Ergänze den bestimmten Artikel. 2. Ergänze den unbestimmten Artikel. 3. Weihnachten. Ergänze die Artikel. 4. Vaters Geburtstag. Ergänze die Artikel. - 2 - 2. Verben
MehrKern- und Schulcurriculum für das Fach Latein Klasse 5/6. Stand Schuljahr 2016/17
Kern- und Schulcurriculum für das Fach Latein Klasse 5/6 Stand Schuljahr 2016/17 Themen zugeordnete Bildungsstandards / Inhalte Empfehlungen, Projekte, Strategien und Methoden Wortschatz Satzlehre > lateinische
MehrSS 2010 Einführung in die Sprachwissenschaft Flexion und Wortarten Morphologie II: Nominale und verbale Flexion, Wortarten
Morphologie II: Nominale und verbale Flexion, Wortarten Anna Volodina 1 Teilgebiete der Morphologie 2 Teilgebiete der Morphologie 3 Plan der heutigen Sitzung Flexion: Begriffsbestimmung und Funktion Flexionsmorpheme
MehrUniversität Hamburg. Institut für Germanistik I Seminar 1b: Wort, Name, Begriff Seminarleiter: Prof. Dr. Walther v. Hahn
Universität Hamburg Institut für Germanistik I 07.137 Seminar 1b: Wort, Name, Begriff Seminarleiter: Prof. Dr. Walther v. Hahn Lexikographie 20.06.2006 Referentin: Yvette Richau Was ist Lexikographie?
MehrÜbung 1 Lösungsvorschläge
Übung 1 Lösungsvorschläge In welchen Kontexten wird das Adjektiv licht verwendet? Korpus: DWDS-Kernkorpus Die Ausgabe wird als Konkordanz bezeichnet bzw. als Key Word in Context-Ansicht (KWiC view). Aufgabe
MehrAufgabe. Erstellen eines kleinen Lernerkorpus exemplarisches Aufzeigen, wie Fehler sinnvoll klassifiziert und annotiert werden könnten
Aufgabe Erstellen eines kleinen Lernerkorpus exemplarisches Aufzeigen, wie Fehler sinnvoll klassifiziert und annotiert werden könnten Mitstreiterinnen: Elena Briskina, Julia Hantschel, Jenny Krüger, Stéphanie
MehrGebrauchsorien-erte Sprachbeschreibung: Korpuslinguis-sche Analysen von (Fast-)Synonymen
Gebrauchsorien-erte Sprachbeschreibung: Korpuslinguis-sche Analysen von (Fast-)Synonymen Heike Zinsmeister Seminar Krea-ves Schreiben Universität Vilnius 25.10.2017 Online: hmps://www.korpuslab.uni-hamburg.de/lehrmaterialien/diverses.html
MehrGrundlagen der Grammatik. Mathilde Hennig
Grundlagen der Grammatik Mathilde Hennig 23.09.2013 Struktur der Vorlesung 1. Grammatik Wozu? 2. Grammatik Wie? 3. Grammatik Wo? 1. Grammatik wozu? Aus der Perspektive des Sprachbenutzers 2. Grammatik
Mehr// Maximilian Arend, Florian Watterott
01.06.2016 // Maximilian Arend, Florian Watterott Wohin ist der Genitiv verschwunden? AUSGANGSPUNKT verbabhängige Genitive (sich eines Vorfalls erinnern) sowie nomenabhängige Genitive (das Auto meines
MehrGrundkurs Linguistik - Syntax
Grundkurs Linguistik - Syntax Jens Fleischhauer fleischhauer@phil.uni-duesseldorf.de Universität Düsseldorf; Abteilung für Allgemeine Sprachwissenschaft 19.11.2015; WS 2015/2016 1 / 24 Jens Fleischhauer
MehrScopus bietet vier verschiedene Sucheinstiege an: Die Document-, Author-, Affiliation- und Advanced Search.
Scopus - Kurzinformation Scopus ist eine interdisziplinäre Abstract- und Zitationsdatenbank, in der Forschungsliteratur aus mehr als 23.000 laufenden internationalen Zeitschriften sowie conference proceedings
MehrDas Sichtenkonzept im DWDS- Wortinformationssystem
Das Sichtenkonzept im DWDS- Wortinformationssystem Alexander Geyken, Edmund Pohl, Lothar Lemnitzer Berlin-Brandenburgische Akademie der Wissenschaften 6. Arbeitstreffen des Forschungsnetzwerks Internetlexikographie
MehrThemen. GK C: Einführung in die Korpuslinguistik. Vorverarbeitung. Tokenisierung. Tokenisierung. Aber. Vorverarbeitung
GK C: Einführung in die Korpuslinguistik Anke Lüdeling anke.luedeling@rz.hu-berlin.de Sommersemester 2003 Themen Vorverarbeitung Tokenisieren Taggen Lemmatisieren Vorverarbeitung auf allen Vorverarbeitungsebenen
MehrFachportal Pädagogik. Inhalt der Literaturdatenbank:
Fachportal Pädagogik Inhalt der Literaturdatenbank: Das Fachportal Pädagogik bietet neben Literaturnachweisen zu allen pädagogischen und bildungsspezifischen Themenfeldern einen Forschungsführer mit relevanten
MehrLAUDATIO - Eine Infrastruktur zur linguistischen Analyse historischer Korpora
LAUDATIO - Eine Infrastruktur zur linguistischen Analyse historischer Korpora Carolin Odebrecht, Humboldt-Universität zu Berlin Florian Zipser, Humboldt-Universität zu Berlin, INRIA Historische Textkorpora
MehrSprachressourcen in der Lehre: Erfahrungen aus der historischen Korpuslinguis7k
Arbeitsstelle Computerphilologie Sprachressourcen in der Lehre: Erfahrungen aus der historischen Korpuslinguis7k Cris%na Vertan cris%na.vertan@uni hamburg.de 18.01.2011 1 Überblick Das Kontext (Lehrangebot
MehrUnterrichtsmaterialien in digitaler und in gedruckter Form. Auszug aus: Das Grammatikfundament: Wortarten. Das komplette Material finden Sie hier:
Unterrichtsmaterialien in digitaler und in gedruckter Form Auszug aus: Das Grammatikfundament: Wortarten Das komplette Material finden Sie hier: School-Scout.de Uta Livonius Das Grammatikfundament: Wortarten
MehrSpezielle Themen der KI. NLP Natural Language Processing. Sprachverstehen
Spezielle Themen der KI NLP Natural Language Processing Sprachverstehen NLP - Verarbeitungsstufen des Sprachverstehen 2 Phonologie und Phonetik Phonologie Lautlehre oder Sprachgebilde-Lautlehre untersucht
MehrLexikalisch-semantische Analyse von Korpora
Lexikalisch-semantische Analyse von Korpora Lothar Lemnitzer Workshop Internetlinguistik und Korpusanalyse, Hannover, 1. Mai 2015 Inhalt Rahmen meiner Darstellung Korpora in der lexikographischen Arbeit
MehrJahresprogramm 2015/2016. Fach: Deutsch als Zweitsprache. 2. Klasse: neusprachliche Fachrichtung. Fachlehrerin: Renate Kaute
Jahresprogramm 2015/2016 Fach: Deutsch als Zweitsprache 2. Klasse: neusprachliche Fachrichtung Fachlehrerin: Renate Kaute Ausgehend von den Rahmenrichtlinien (D. L. R. 2041, 13.12.10) und den damit verbundenen
MehrWebbasierte Recherche
Online-Grundlagen Webbasierte Recherche In diesem Kapitel lernen Sie, was Suchmaschinen sind, und wie Sie eine Suchmaschine verwenden können. Am Beispiel von Google werden Sie Suchanfragen formulieren
Mehrg ( ) Aufbau des Vortrags
g Merkmale g Die Untersuchung von Biber (1) Arbeitsgruppe 3: Korpusbasierte Registeranalyse Wie kann mit korpuslinguistischen Mitteln zwischen verschiedenen Textsorten unterschieden werden? Marlon Berlin
MehrNomen Überblicksübung Lösungsansätze
Gymbasis Deutsch: Grammatik Wortarten Nomen Überblicksübung 1 Nomen Überblicksübung Lösungsansätze Unterstreiche in folgendem Text alle (echten) Nomen; die Nominalisierungen von anderen Wortarten musst
MehrHandbuch zum Statistiktool Pentaho Stand: Dezember 2013
Handbuch zum Statistiktool Pentaho Stand: Dezember 2013 Sie erreichen das Tool über folgenden Link http://reports.onleihe.de/pentaho/login Anmeldung Startbildschirm Oben: Navigation Linke Spalte: Ordner
MehrEine kurze Einführung in die Nutzung. der Such- und Erinnerungsfunktionen des. Göttingen Campus Event Calendar
Eine kurze Einführung in die Nutzung der Such- und Erinnerungsfunktionen des Göttingen Campus Event Calendar Katrin Wodzicki, Christof Pohl, Andreas Riechel Inhalt Was bietet der Göttingen Campus Eventkalender...
MehrArbeitsgruppe 3: Korpusbasierte Registeranalyse
Arbeitsgruppe 3: Korpusbasierte Registeranalyse Wie kann mit korpuslinguistischen Mitteln zwischen verschiedenen Textsorten unterschieden werden? Marlon Berlin Kapka Borisova Stephan Klinger Cornelius
Mehr