Stefan Engelberg (IDS Mannheim), Workshop Corpora in Lexical Research, Bucharest, Nov [Folie 1] DWDS-Kernkorpus / DWDS corpus analysis

Save this PDF as:
 WORD  PNG  TXT  JPG

Größe: px
Ab Seite anzeigen:

Download "Stefan Engelberg (IDS Mannheim), Workshop Corpora in Lexical Research, Bucharest, Nov. 2008 [Folie 1] DWDS-Kernkorpus / DWDS corpus analysis"

Transkript

1 Content 1. Empirical linguistics 2. Text corpora and corpus linguistics 3. Concordances 4. Application I: The German progressive 5. Part-of-speech tagging 6. Fequency analysis 7. Application II: Compounds 8. Co-occurrence analysis 9. Application III: Word senses in lexicography 10. Keyword analysis 5.1 Software III: DWDS corpora and analysis 5.2 Using POS tags Stefan Engelberg (IDS Mannheim), Workshop Corpora in Lexical Research, Bucharest, Nov [Folie 1] DWDS-Kernkorpus / DWDS corpus analysis Developer: Berlin-Brandenburgische Akademie der Wissenschaften. Version: (no versioning). Search: online. Software: online. Access: free, registration. Corpora: online; DWDS-Kernkorpus (100 mio. running words) and other corpora (more than 500 mio. running words). Languages: German. URL: Stefan Engelberg (IDS Mannheim), Workshop Corpora in Lexical Research, Bucharest, Nov [Folie 2] 1

2 5.1 Software II: DWDS corpora & analysis text basis Basis of the Digitales Wörterbuch der Deutschen Sprache des 20. Jahrhunderts 100 mio. running words (public part), distributed evenly over 10 decades lemmatized, POS-tagged Texts in the DWDS-Kernkorpus : Fiction (ca. 26%) newspapers / journals (ca. 27%) specialized texts (ca. 22%) other non-fiction (ca. 20%) (transcribed) spoken language. (ca. 5%) Stefan Engelberg (IDS Mannheim), Workshop Corpora in Lexical Research, Bucharest, Nov [Folie 3] search filters search expression (hier: national) Filter option Zeitraum (period) (here: ) Filter option Textsorte (text type) (here: science) Stefan Engelberg (IDS Mannheim), Workshop Corpora in Lexical Research, Bucharest, Nov [Folie 4] 2

3 Results Stefan Engelberg (IDS Mannheim), Workshop Corpora in Lexical Research, Bucharest, Nov [Folie 5] Syntax of search language Some examples Funktion Lemmasuche Wortformensuche Wortkettensuche Wortteilsuche Abstandssuche und-suche Suche mit Tags Beispiel "spielen Domino" Domino" *spiel "spielen #3 Domino" Domino && Schach "haben Suchziel: Belege mit beliebigen Wortformen des Lexems spielen der Wortform spielte Wortketten, die aus einer beliebigen Wortform von spielen gefolgt von einer beliebigen Wortform von Domino bestehen Wortketten, die aus der Wortform spiele gefolgt von einer beliebigen Wortform von Domino bestehen einer Wortform, die auf spiel endet Wortketten, die aus einer beliebigen Wortform von spielen gefolgt im Abstand von bis zu 3 Wörtern von einer beliebigen Wortform von Domino bestehen sowohl der Wortform Domino als auch der Wortform Schach Wortketten, die aus einer beliebigen Wortform von haben gefolgt von einem Infinitiv und der Wortform können bestehen Stefan Engelberg (IDS Mannheim), Workshop Corpora in Lexical Research, Bucharest, Nov [Folie 6] 3

4 5.2 Using POS tags Part-of-speech tagging Part-of-speech tagging (POS tagging or POST), also called grammatical tagging or word-category disambiguation, is the process of marking up the words in a text as corresponding to a particular part of speech, based on both its definition, as well as its context i.e., relationship with adjacent and related words in a phrase, sentence, or paragraph.. "Part-of-speech tagging." Wikipedia, The Free Encyclopedia. 31 Oct 2008, 03:11 UTC. 1 Nov 2008 < Warning Part-of-speech tagging is not throughout reliable. The definition of the parts of speech are not always accessible to the corpus user. Part-of-speech tagger always cover the data with a theory-dependent structure. Stefan Engelberg (IDS Mannheim), Workshop Corpora in Lexical Research, Bucharest, Nov [Folie 7] Tag sets 5.2 Using POS tags Part of the tag set used for the DWDS corpora ADJA attributives Adjektiv [das] große [Haus] ADJD adverbiales oder [er fährt] schnell prädikatives Adjektiv [er ist] schnell ADV Adverb schon, bald, doch APPR Präposition; Zirkumpos. links in [der Stadt], ohne [mich] APPRART Präposition mit Artikel im [Haus], zur [Sache] APPO Postposition [ihm] zufolge, [der Sache] wegen APZR Zirkumposition rechts [von jetzt] an ART bestimmter oder der, die, das, unbestimmter Artikel ein, eine,... CARD Kardinalzahl zwei [Männer], [im Jahre] 1994 (Ordinalzahlen sind als ADJA getaggt) FM Fremdsprachliches Material [Er hat das mit ``] A big fish ['' übersetzt] ITJ Interjektion mhm, ach, tja KOUI unterordnende Konjunktion um [zu leben], mit ``zu'' und Infinitiv anstatt [zu fragen] KOUS unterordnende Konjunktion weil, daß, damit, mit Satz wenn, ob KON nebenordnende Konjunktion und, oder, aber KOKOM Vergleichskonjunktion als, wie Stefan Engelberg (IDS Mannheim), Workshop Corpora in Lexical Research, Bucharest, Nov [Folie 8] 4

5 Korpusrecherchesysteme search expression: "haben DWDS-Kernkorpus (form of haben + Infinitive +Das können), DWDS-Kernkorpus, KWICs Stefan Engelberg (IDS Mannheim), Workshop Corpora in Lexical Research, Bucharest, Nov [Folie 9] search expression: $p=appr (form of reden + sich + preposition), full text, DWDS-corpus Berliner Zeitung Stefan Engelberg (IDS Mannheim), Workshop Corpora in Lexical Research, Bucharest, Nov [Folie 10] 5

6 search expression: um $p=art $p=nn herum (um + determiner + noun + herum), full text, DWDS-corpus Berliner Zeitung Stefan Engelberg (IDS Mannheim), Workshop Corpora in Lexical Research, Bucharest, Nov [Folie 11] 6

Daten Methoden Theorien Definitionen & Operationalisierungen

Daten Methoden Theorien Definitionen & Operationalisierungen Operationale Verfahren Daten Methoden Theorien Definitionen & Operationalisierungen Das Überbrückungsproblem Hypothese Explizite Formulierung einer als wahr vermuteten, begründbaren Aussage über das Phänomen

Mehr

Tagger for German. Online BRILL-Tagger für das Deutsche

Tagger for German. Online BRILL-Tagger für das Deutsche Tagger for German Online BRILL-Tagger für das Deutsche Morphologie V/Ü, Anke Holler Uni Heidelberg, SS2007 Nataliya Mytyay Éva Mújdricza 19.07.2007 Designed by: Dóra Dobos Tagger for German Eric Brill

Mehr

Stefan Engelberg (IDS Mannheim), Workshop Corpora in Lexical Research, Bucharest, Nov. 2008 [Folie 1]

Stefan Engelberg (IDS Mannheim), Workshop Corpora in Lexical Research, Bucharest, Nov. 2008 [Folie 1] Content 1. Empirical linguistics 2. Text corpora and corpus linguistics 3. Concordances 4. Application I: The German progressive 5. Part-of-speech tagging 6. Fequency analysis 7. Application II: Compounds

Mehr

Daten Methoden Theorien Definitionen & Operationalisierungen

Daten Methoden Theorien Definitionen & Operationalisierungen Definitionen Daten Methoden Theorien Definitionen & Operationalisierungen Eine Realdefinition legt fest, wie ein Ausdruck verwendet wird, indem sie die Beobachtungen, das Wissen, die Intuitionen, die wir

Mehr

DWDS: Hilfe Kurzübersicht

DWDS: Hilfe Kurzübersicht DWDS: Hilfe Kurzübersicht (auch online unter http://www.dwds.de/?corpus=1&opt=hilfe&qu) Voreinstellungen Lemmasuche: Suchwörter werden automatisch zum Lemma expandiert. Vorsicht: befindet sich das Suchwort

Mehr

Tutorial II: Corpus Methods for Historical Linguistics

Tutorial II: Corpus Methods for Historical Linguistics Tutorial II: Corpus Methods for Historical Linguistics Formal Diachronics Semantics 2016 University of Konstanz Christin Schätzle and Gerold Schneider firstname.lastname@uni-konstanz.de 13.09.2016 1 Regular

Mehr

KURZÜBERSICHT SONDERTEIL

KURZÜBERSICHT SONDERTEIL 402 BERUFSKOLLEG / FACHOBERSCHULEN - Englisch - Inhalt - Kurzübersicht KURZÜBERSICHT SONDERTEIL 402 410 Inhaltsverzeichnis 411-439 Notizen 440 476 Language-Aufgaben (Vocabulary) 477-489 Notizen 490 506

Mehr

Sprachsynthese: Part-of-Speech-Tagging

Sprachsynthese: Part-of-Speech-Tagging Sprachsynthese: Part-of-Speech-Tagging Institut für Phonetik und Sprachverarbeitung Ludwig-Maximilians-Universität München reichelu@phonetik.uni-muenchen.de 29. Oktober 2014 Inhalt POS- Markov- Transformationsbasiertes

Mehr

VorlaugeGuidelinesfurdasTaggingdeutscherTextcorpora AnneSchiller,SimoneTeufel,ChristineStockert mitstts InstitutfurmaschinelleSprachverarbeitung UniversitatStuttgart SeminarfurSprachwissenschaft UniversitatTubingen

Mehr

Mitglied der Leibniz-Gemeinschaft

Mitglied der Leibniz-Gemeinschaft Methods of research into dictionary use: online questionnaires Annette Klosa (Institut für Deutsche Sprache, Mannheim) 5. Arbeitstreffen Netzwerk Internetlexikografie, Leiden, 25./26. März 2013 Content

Mehr

"What's in the news? - or: why Angela Merkel is not significant

What's in the news? - or: why Angela Merkel is not significant "What's in the news? - or: why Angela Merkel is not significant Andrej Rosenheinrich, Dr. Bernd Eickmann Forschung und Entwicklung, Unister GmbH, Leipzig UNISTER Seite 1 Unister Holding UNISTER Seite 2

Mehr

Phonetische Lexika Part-of-Speech Tagging. Uwe D. Reichel IPSK, LMU München

Phonetische Lexika Part-of-Speech Tagging. Uwe D. Reichel IPSK, LMU München Phonetische Lexika Part-of-Speech Tagging Uwe D. Reichel IPSK, LMU München reichelu@phonetik.uni-muenchen.de Inhalt Parts of Speech POS-Tagging-Probleme: OOV, Ambiguitäten Regelbasierte Tagger Markov-Tagger

Mehr

Part of Speech Tagging. Linguistische Sicht. Carolin Deck

Part of Speech Tagging. Linguistische Sicht. Carolin Deck Part of Speech Tagging Linguistische Sicht Carolin Deck Gliederung 1. Begriffsklärung 2. Vorstellung zwei wichtiger Tagsets (STTS & PTTS) 3. Bedeutung des POS-Tagging für die Sprachwissenschaft 4. Tagzuweisung

Mehr

Security Patterns. Benny Clauss. Sicherheit in der Softwareentwicklung WS 07/08

Security Patterns. Benny Clauss. Sicherheit in der Softwareentwicklung WS 07/08 Security Patterns Benny Clauss Sicherheit in der Softwareentwicklung WS 07/08 Gliederung Pattern Was ist das? Warum Security Pattern? Security Pattern Aufbau Security Pattern Alternative Beispiel Patternsysteme

Mehr

Braucht Social TV ein neues Interface? Felix Segebrecht

Braucht Social TV ein neues Interface? Felix Segebrecht Braucht Social TV ein neues Interface? Felix Segebrecht Braucht Social TV ein neues Interface? Nein! Social TV hat sehr erfolgreiche Interfaces Was ist social TV? Gemeinsam gucken? Im Büro über den Tatort

Mehr

When you use any of these prepositions, you need to put the noun or pronoun following them into the accusative case. For example:

When you use any of these prepositions, you need to put the noun or pronoun following them into the accusative case. For example: Accusative Prepositions Up to now, we ve been using the accusative case only for direct objects. There is another part of speech that requires the accusative case in German: the accusative prepositions.

Mehr

Corpus-based language analysis in research and teaching:

Corpus-based language analysis in research and teaching: Corpus-based language analysis in research and teaching: Experiences, requirements and perspectives Angelika Storrer Corpus-based research projects Bericht zur Lage der deutschen Sprache [report on the

Mehr

Java Tools JDK. IDEs. Downloads. Eclipse. IntelliJ. NetBeans. Java SE 8 Java SE 8 Documentation

Java Tools JDK. IDEs.  Downloads. Eclipse. IntelliJ. NetBeans. Java SE 8 Java SE 8 Documentation Java Tools JDK http://www.oracle.com/technetwork/java/javase/ Downloads IDEs Java SE 8 Java SE 8 Documentation Eclipse http://www.eclipse.org IntelliJ http://www.jetbrains.com/idea/ NetBeans https://netbeans.org/

Mehr

Linguistische Grundlagen. Warum Tagging? Klassische Wortartenlehre Tagsets Annotation höherer Ebenen Design von Tagsets

Linguistische Grundlagen. Warum Tagging? Klassische Wortartenlehre Tagsets Annotation höherer Ebenen Design von Tagsets Linguistische Grundlagen Warum Tagging? Klassische Wortartenlehre Tagsets Annotation höherer Ebenen Design von Tagsets Warum Tagging? Abfragbarkeit linguistischer Information Generalisierbarkeit von Abfragen

Mehr

Listening Comprehension: Talking about language learning

Listening Comprehension: Talking about language learning Talking about language learning Two Swiss teenagers, Ralf and Bettina, are both studying English at a language school in Bristo and are talking about language learning. Remember that Swiss German is quite

Mehr

Tube Analyzer LogViewer 2.3

Tube Analyzer LogViewer 2.3 Tube Analyzer LogViewer 2.3 User Manual Stand: 25.9.2015 Seite 1 von 11 Name Company Date Designed by WKS 28.02.2013 1 st Checker 2 nd Checker Version history Version Author Changes Date 1.0 Created 19.06.2015

Mehr

Exploring the knowledge in Semi Structured Data Sets with Rich Queries

Exploring the knowledge in Semi Structured Data Sets with Rich Queries Exploring the knowledge in Semi Structured Data Sets with Rich Queries Jürgen Umbrich Sebastian Blohm Institut AIFB, Universität Karlsruhe (TH) Forschungsuniversität gegründet 1825 www.kit.ed Overview

Mehr

Wenn Russland kein Gas mehr liefert

Wenn Russland kein Gas mehr liefert Ergänzen Sie die fehlenden Begriffe aus der Liste. abhängig Abhängigkeit bekommen betroffen bezahlen Gasspeicher Gasverbrauch gering hätte helfen importieren liefert 0:02 Pläne politischen Projekte Prozent

Mehr

APPENDICES, VOCABULARY, INDEX

APPENDICES, VOCABULARY, INDEX APPENDICES, VOCABULARY, INDEX 33490_31_appA_p287-291.indd 287 12/27/07 6:49:41 PM The German Case System APPENDIX A German uses a signal called case to identify the function of nouns and s within a sentence.

Mehr

Willkommen zurück in Wellesley. Dialoge: Introduction

Willkommen zurück in Wellesley. Dialoge: Introduction Prof T. Hansen Frühjahr 2007 Mein Büro: FND 412 E-mail: thansen@wellesley.edu Deutsch 102, Beginning German 102.2 Mo., Mi., Do.: 9:50 11:00 Uhr; Founders 121 Sprechstunde: Mo. und Mi.: 11:00-11:45; Mo

Mehr

Morphologie, Lemmatisierung und Wortartenklassifikationen. Lexikonaufbau und Morphologie-Analyseverfahren Gerold Schneider, SS 2005

Morphologie, Lemmatisierung und Wortartenklassifikationen. Lexikonaufbau und Morphologie-Analyseverfahren Gerold Schneider, SS 2005 Morphologie, Lemmatisierung und Wortartenklassifikationen Morphologieanalyse und Lexikonaufbau (1. Vorlesung) Übersicht Was ist Morphologie? Warum braucht man Morphologieanalyse in der CL? Was ist ein

Mehr

Die Corpus Workbench und ihre Syntax. Blockseminar Einführung in die Korpuslinguistik Seminarleitung: Yvonne Krämer, M.A.

Die Corpus Workbench und ihre Syntax. Blockseminar Einführung in die Korpuslinguistik Seminarleitung: Yvonne Krämer, M.A. Die Corpus Workbench und ihre Syntax Blockseminar Einführung in die Korpuslinguistik Seminarleitung: Yvonne Krämer, M.A. Die IMS Open Corpus Workbench (CWB) Mächtige Konkordanz- und Korpusanalyse-Software

Mehr

WP2. Communication and Dissemination. Wirtschafts- und Wissenschaftsförderung im Freistaat Thüringen

WP2. Communication and Dissemination. Wirtschafts- und Wissenschaftsförderung im Freistaat Thüringen WP2 Communication and Dissemination Europa Programm Center Im Freistaat Thüringen In Trägerschaft des TIAW e. V. 1 GOALS for WP2: Knowledge information about CHAMPIONS and its content Direct communication

Mehr

STRATEGISCHES BETEILIGUNGSCONTROLLING BEI KOMMUNALEN UNTERNEHMEN DER FFENTLICHE ZWECK ALS RICHTSCHNUR FR EIN ZIELGERICHTETE

STRATEGISCHES BETEILIGUNGSCONTROLLING BEI KOMMUNALEN UNTERNEHMEN DER FFENTLICHE ZWECK ALS RICHTSCHNUR FR EIN ZIELGERICHTETE BETEILIGUNGSCONTROLLING BEI KOMMUNALEN UNTERNEHMEN DER FFENTLICHE ZWECK ALS RICHTSCHNUR FR EIN ZIELGERICHTETE PDF-SBBKUDFZARFEZ41-APOM3 123 Page File Size 5,348 KB 3 Feb, 2002 TABLE OF CONTENT Introduction

Mehr

GAUSS towards a common certification process for GNSS applications using the European Satellite System Galileo

GAUSS towards a common certification process for GNSS applications using the European Satellite System Galileo GAUSS towards a common certification process for GNSS applications using the European Satellite System Galileo Matthias Grimm, Dr. Michael Meyer zu Hörste Vortragstitel > 11. Juni 2010 > Folie 1 Agenda

Mehr

Daten haben wir reichlich! 25.04.14 The unbelievable Machine Company 1

Daten haben wir reichlich! 25.04.14 The unbelievable Machine Company 1 Daten haben wir reichlich! 25.04.14 The unbelievable Machine Company 1 2.800.000.000.000.000.000.000 Bytes Daten im Jahr 2012* * Wenn jedes Byte einem Buchstaben entspricht und wir 1000 Buchstaben auf

Mehr

Aux Flip in German: A Walk in the Woods

Aux Flip in German: A Walk in the Woods Aux Flip in German: A Walk in the Woods Erhard Hinrichs 1, Kathrin Beck 1, and Tsuneko Nakazawa 2 1 Seminar für Sprachwissenschaft Eberhard Karls Universität Tübingen 2 University of Tokyo Aux Flip in

Mehr

A Classification of Partial Boolean Clones

A Classification of Partial Boolean Clones A Classification of Partial Boolean Clones DIETLINDE LAU, KARSTEN SCHÖLZEL Universität Rostock, Institut für Mathematik 25th May 2010 c 2010 UNIVERSITÄT ROSTOCK MATHEMATISCH-NATURWISSENSCHAFTLICHE FAKULTÄT,

Mehr

time marker cluster term term URL Link to AEC media

time marker cluster term term URL Link to AEC media AEC ZKM ICC OK institution () time marker comming soon cluster defined in table or dynamic location () person or sentence (long description, notion, year) Default Linz AEC DB memory theater source (attribute)

Mehr

2 German sentence: write your English translation before looking at p. 3

2 German sentence: write your English translation before looking at p. 3 page Edward Martin, Institut für Anglistik, Universität Koblenz-Landau, Campus Koblenz 2 German sentence: write your English translation before looking at p. 3 3 German sentence analysed in colour coding;

Mehr

Introduction to Computational Linguistics

Introduction to Computational Linguistics Introduction to Computational Linguistics Frank Richter fr@sfs.uni-tuebingen.de. Seminar für Sprachwissenschaft Eberhard Karls Universität Tübingen Germany Intro to CL WS 2012/13 p.1 Part-of-speech (POS)

Mehr

Morphologie (5) Wortarten (2) Part-of-Speech Tagging Stemming

Morphologie (5) Wortarten (2) Part-of-Speech Tagging Stemming Morphologie (5) Wortarten (2) Part-of-Speech Tagging Stemming Robert Zangenfeind Centrum für Informations- und Sprachverarbeitung, LMU München 24.11.2014, 9 c.t. Zangenfeind: Morphologie 1 / 18 Wdh.: Klassifizierung

Mehr

Part-of-Speech-Tagging mit Transduktoren

Part-of-Speech-Tagging mit Transduktoren Ruprecht-Karls Universität Heidelberg Hauptseminar Computerlinguistik Endliche Automaten für die Sprachverarbeitung PD Dr Karin Haenelt Sommersemester 2005 Part-of-Speech-Tagging mit Transduktoren Maria

Mehr

J RG IMMENDORFF STANDORT F R KRITIK MALEREI UND INSPIRATION ERSCHEINT ZUR AUSSTELLUNG IM MUSEUM LU

J RG IMMENDORFF STANDORT F R KRITIK MALEREI UND INSPIRATION ERSCHEINT ZUR AUSSTELLUNG IM MUSEUM LU J RG IMMENDORFF STANDORT F R KRITIK MALEREI UND INSPIRATION ERSCHEINT ZUR AUSSTELLUNG IM MUSEUM LU 8 Feb, 2016 JRISFRKMUIEZAIMLAPOM-PDF33-0 File 4,455 KB 96 Page If you want to possess a one-stop search

Mehr

Part-of-Speech-Tagging mit Transduktoren

Part-of-Speech-Tagging mit Transduktoren Ruprecht-Karls Universität Heidelberg Hauptseminar Computerlinguistik Endliche Automaten für die Sprachverarbeitung PD Dr. Karin Haenelt Sommersemester 2005 Part-of-Speech-Tagging mit Transduktoren Maria

Mehr

ColdFusion 8 PDF-Integration

ColdFusion 8 PDF-Integration ColdFusion 8 PDF-Integration Sven Ramuschkat SRamuschkat@herrlich-ramuschkat.de München & Zürich, März 2009 PDF Funktionalitäten 1. Auslesen und Befüllen von PDF-Formularen 2. Umwandlung von HTML-Seiten

Mehr

Background for Hybrid Processing

Background for Hybrid Processing Background for Hybrid Processing Hans Uszkoreit Foundations of LST WS 04/05 Scope Classical Areas of Computational Linguistics: computational morphology, computational syntax computational semantics computational

Mehr

Korpusanalyse am IDS Die Korpora

Korpusanalyse am IDS Die Korpora Die Korpora DeReKo: Das Deutsche Referenzkorpus Die Korpora am IDS Größe: über 3,4 Milliarden Textwörter (Stand: 2008) Akquise: im Hinblick auf Umfang, Variabilität, Qualität und Aktualität; urheberrechtlich

Mehr

Username and password privileges. Rechteverwaltung. Controlling User Access. Arten von Rechten Vergabe und Entzug von Rechten DBS1 2004

Username and password privileges. Rechteverwaltung. Controlling User Access. Arten von Rechten Vergabe und Entzug von Rechten DBS1 2004 Arten von Rechten Vergabe und Entzug von Rechten Seite 1 Controlling User Access Database administrator Username and password privileges Users Seite 2 Privileges Database security System security Data

Mehr

Abkürzungen Abbreviations Unbestimmte Artikel Indefinite Article... 9

Abkürzungen Abbreviations Unbestimmte Artikel Indefinite Article... 9 Preface 3 Vorwort Wer möchte nicht auch mal Spaß haben beim Lernen? Die Englisch-Comics machen es möglich, frei nach dem Motto "Wer zuerst lacht, lernt am besten". Jedes Kapitel startet mit einem Comic,

Mehr

Digital Humanities Recherche im DWDS und DTA

Digital Humanities Recherche im DWDS und DTA Digital Humanities Recherche im DWDS und DTA mit Booleschen Operatoren und Regulären Ausdrücken Jena Language & Information Engineering (JULIE) Lab Friedrich-Schiller-Universität Jena, Germany http://www.julielab.de

Mehr

Einführung in die Computerlinguistik. Morphologie III

Einführung in die Computerlinguistik. Morphologie III Einführung in die Computerlinguistik Morphologie III Hinrich Schütze & Robert Zangenfeind Centrum für Informations- und Sprachverarbeitung, LMU München 7.12.2015 Schütze & Zangenfeind: Morphologie III

Mehr

Morphologie, Lemmatisierung und Wortartenklassifikationen

Morphologie, Lemmatisierung und Wortartenklassifikationen Morphologie, Lemmatisierung und Wortartenklassifikationen Morphologieanalyse und Lexikonaufbau (1. Vorlesung) Übersicht Was ist Morphologie? Warum braucht man Morphologieanalyse in der CL? Was ist ein

Mehr

Open Archives Initiative - Protocol for Metadata Harvesting (OAI-PMH)

Open Archives Initiative - Protocol for Metadata Harvesting (OAI-PMH) , XML LV BF23 (0F32) Open Archives Initiative - Protocol for Metadata Harvesting (OAI-PMH) Achim Oßwald FH Köln Institut für Informationswissenschaft Wintersemester 2010 (Stand: 3.12.10) 1/ 18 OAI-PMH

Mehr

Friedrich-Alexander-Universität Professur für Computerlinguistik. Nguyen Ai Huong

Friedrich-Alexander-Universität Professur für Computerlinguistik. Nguyen Ai Huong Part-of-Speech Tagging Friedrich-Alexander-Universität Professur für Computerlinguistik Nguyen Ai Huong 15.12.2011 Part-of-speech tagging Bestimmung von Wortform (part of speech) für jedes Wort in einem

Mehr

Accounting course program for master students. Institute of Accounting and Auditing http://www.wiwi.hu-berlin.de/rewe

Accounting course program for master students. Institute of Accounting and Auditing http://www.wiwi.hu-berlin.de/rewe Accounting course program for master students Institute of Accounting and Auditing http://www.wiwi.hu-berlin.de/rewe 2 Accounting requires institutional knowledge... 3...but it pays: Lehman Bros. Inc.,

Mehr

Einsatz einer Dokumentenverwaltungslösung zur Optimierung der unternehmensübergreifenden Kommunikation

Einsatz einer Dokumentenverwaltungslösung zur Optimierung der unternehmensübergreifenden Kommunikation Einsatz einer Dokumentenverwaltungslösung zur Optimierung der unternehmensübergreifenden Kommunikation Eine Betrachtung im Kontext der Ausgliederung von Chrysler Daniel Rheinbay Abstract Betriebliche Informationssysteme

Mehr

Why learner texts are easy to tag A comparative evaluation of part-of-speech tagging of Kobalt

Why learner texts are easy to tag A comparative evaluation of part-of-speech tagging of Kobalt Why learner texts are easy to tag A comparative evaluation of part-of-speech tagging of Kobalt Marc Reznicek and Heike Zinsmeister Workshop: Modeling non-standardized writing DGfS Jahrestagung, Potsdam

Mehr

Wittgenstein s Nachlass : Structures and Access

Wittgenstein s Nachlass : Structures and Access Wittgenstein s Nachlass : Structures and Access Alfred Schmidt München, Juli 2013 What I should like to get you to do is not to agree with me in particular opinions but to investigate the matter in the

Mehr

Maschinelle Sprachverarbeitung: Part-of-Speech-Tagging

Maschinelle Sprachverarbeitung: Part-of-Speech-Tagging HUMBOLDT-UNIVERSITÄT ZU BERLIN Institut für Informatik Lehrstuhl Wissensmanagement Maschinelle Sprachverarbeitung: Part-of-Speech-Tagging Tobias Scheffer Ulf Brefeld POS-Tagging Zuordnung der Wortart von

Mehr

To conjugate in the present tense: take the regular verb infinitive kaufen remove the -en ending add the following endings. er, sie, es t sie,sie en

To conjugate in the present tense: take the regular verb infinitive kaufen remove the -en ending add the following endings. er, sie, es t sie,sie en Regular Present Tense Verbs: Regular verbs (regelmässing) without exception never have a stem change, not in any verb tense. For instance this is what the verb to buy (kaufen) looks like in the infinitive,

Mehr

Call Centers and Low Wage Employment in International Comparison

Call Centers and Low Wage Employment in International Comparison Wissenschaftszentrum Nordrhein-Westfalen Kulturwissenschaftliches Institut Wuppertal Institut für Klima, Umwelt, Energie Institut Arbeit und Technik Call Centers and Low Wage Employment in International

Mehr

Falko. Error annotations in Falko 2.x. Marc Reznicek & Cedric Krummes

Falko. Error annotations in Falko 2.x. Marc Reznicek & Cedric Krummes Falko Error annotations in Falko 2.x Marc Reznicek & Cedric Krummes Symposium What s Hard in German? Structural Difficulties, Research Approaches and Pedagogic Solutions Bangor University Monday and Tuesday,

Mehr

ÜBERBLICK ÜBER DAS KURS-ANGEBOT

ÜBERBLICK ÜBER DAS KURS-ANGEBOT ÜBERBLICK ÜBER DAS KURS-ANGEBOT Alle aufgeführten Kurse sind 100 % kostenfrei und können unter http://www.unterricht.de abgerufen werden. SATZBAU & WORTSTELLUNG - WORD ORDER Aussagesätze / Affirmative

Mehr

Zu + Infinitiv Constructions

Zu + Infinitiv Constructions Zu + Infinitiv Constructions You have probably noticed that in many German sentences, infinitives appear with a "zu" before them. These "zu + infinitive" structures are called infinitive clauses, and they're

Mehr

Korpuslinguistik Grundlagen Korpusrecherchemethoden

Korpuslinguistik Grundlagen Korpusrecherchemethoden Methoden der Korpusanalyse Erstellung von Konkordanzen Erzeugung von Wortlisten mit Frequenzangaben Ermittlung von hochfrequenten Wortgruppen (Clusteranalyse) Berechnung von Kookkurrenzen Ermittlung von

Mehr

Arbeiten mit Datenbanken

Arbeiten mit Datenbanken Prof. Dr. Rüdiger Zarnekow TU Berlin, Fakultät VII Kommunikationsmanagement Kommunikationsmanagement Inhalte und Ziele 1. wichtige Hinweise 2. Freie Datenbanken der TU 3. Schlagwortsuche 4. Übung 1 5.

Mehr

Deutsch Grammatik Sekundarstufe 1 Die 5 Wortarten

Deutsch Grammatik Sekundarstufe 1 Die 5 Wortarten Deutsch Grammatik Sekundarstufe 1 Die 5 Wortarten Theorie und Klassenübungen (mit Lösungen) Geeignet für 8. bis 10. Schuljahr MSV- Unterricht ILF- Unterricht Als Skript verwendbar Mit Kommentaren und Erklärungen

Mehr

Langenscheidt Englisch-Comics Grammatik

Langenscheidt Englisch-Comics Grammatik Langenscheidt Comics Grammatik Langenscheidt Englisch-Comics Grammatik von Anke Williamson 1. Auflage Langenscheidt Englisch-Comics Grammatik Williamson schnell und portofrei erhältlich bei beck-shop.de

Mehr

NEWSLETTER. FileDirector Version 2.5 Novelties. Filing system designer. Filing system in WinClient

NEWSLETTER. FileDirector Version 2.5 Novelties. Filing system designer. Filing system in WinClient Filing system designer FileDirector Version 2.5 Novelties FileDirector offers an easy way to design the filing system in WinClient. The filing system provides an Explorer-like structure in WinClient. The

Mehr

DIE NEUORGANISATION IM BEREICH DES SGB II AUSWIRKUNGEN AUF DIE ZUSAMMENARBEIT VON BUND LNDERN UND KOMMUNEN

DIE NEUORGANISATION IM BEREICH DES SGB II AUSWIRKUNGEN AUF DIE ZUSAMMENARBEIT VON BUND LNDERN UND KOMMUNEN DIE NEUORGANISATION IM BEREICH DES SGB II AUSWIRKUNGEN AUF DIE ZUSAMMENARBEIT VON BUND LNDERN UND KOMMUNEN WWOM537-PDFDNIBDSIAADZVBLUK 106 Page File Size 4,077 KB 16 Feb, 2002 COPYRIGHT 2002, ALL RIGHT

Mehr

Introduction to the diploma and master seminar in FSS 2010. Prof. Dr. Armin Heinzl. Sven Scheibmayr

Introduction to the diploma and master seminar in FSS 2010. Prof. Dr. Armin Heinzl. Sven Scheibmayr Contemporary Aspects in Information Systems Introduction to the diploma and master seminar in FSS 2010 Chair of Business Administration and Information Systems Prof. Dr. Armin Heinzl Sven Scheibmayr Objective

Mehr

H. Enke, Sprecher des AK Forschungsdaten der WGL

H. Enke, Sprecher des AK Forschungsdaten der WGL https://escience.aip.de/ak-forschungsdaten H. Enke, Sprecher des AK Forschungsdaten der WGL 20.01.2015 / Forschungsdaten - DataCite Workshop 1 AK Forschungsdaten der WGL 2009 gegründet - Arbeit für die

Mehr

A Topical/Local Classifier for Word Sense Idendification (TLC) Anne Schwartz

A Topical/Local Classifier for Word Sense Idendification (TLC) Anne Schwartz A Topical/Local Classifier for Word Sense Idendification (TLC) Anne Schwartz anne@coli.uni-sb.de A Topical/Local Classifier for Word Sense Idendification (TLC) entwickelt von: - Martin Chodorow (Dep. of

Mehr

A Schema for Augmented Text

A Schema for Augmented Text Appendix A Schema for Augmented Text This schema defines the elements and attributes that are added to a document during linguistic preprocessing (cf. Sec. 12.1). # A RELAX NG compact syntax pattern for

Mehr

Harry gefangen in der Zeit Begleitmaterialien

Harry gefangen in der Zeit Begleitmaterialien Folge 029 Grammatik 1. The pronoun "es" (review) "es" is a pronoun that usually substitutes a neuter noun. Example: Ist das Bett zu hart? - Nein, es ist nicht zu hart. (es = it das Bett = the bed) But:

Mehr

Group and Session Management for Collaborative Applications

Group and Session Management for Collaborative Applications Diss. ETH No. 12075 Group and Session Management for Collaborative Applications A dissertation submitted to the SWISS FEDERAL INSTITUTE OF TECHNOLOGY ZÜRICH for the degree of Doctor of Technical Seiences

Mehr

Data Mining and Data Analysis using the Example of cross-border Traffic Management during Extreme Weather Events

Data Mining and Data Analysis using the Example of cross-border Traffic Management during Extreme Weather Events Data Mining and Data Analysis using the Example of cross-border Traffic Management during Extreme Weather Events Dipl.-Ing. Marc Hohloch Extreme Weather Events and the Impact for Mobility of Rescue Forces

Mehr

(` Download Fraud Detection. Data- Mining-Verfahren Zur Aufdeckung Von Abrechnungsbetrug Im Gesundheitswesen (German Edition) books free read online

(` Download Fraud Detection. Data- Mining-Verfahren Zur Aufdeckung Von Abrechnungsbetrug Im Gesundheitswesen (German Edition) books free read online (` Download Fraud Detection. Data- Mining-Verfahren Zur Aufdeckung Von Abrechnungsbetrug Im Gesundheitswesen (German Edition) books free read online ID:jaifku Click Here to Read Fraud Detection. Data-Mining-Verfahren

Mehr

PhysNet and its Mirrors

PhysNet and its Mirrors PhysNet and its Mirrors - the project SINN - www.physnet.net 1 2 The Project SINN! supported by the German Research Network (DFN-Verein)! financial support of German Ministry of Education and Research

Mehr

Getting started with MillPlus IT V530 Winshape

Getting started with MillPlus IT V530 Winshape Getting started with MillPlus IT V530 Winshape Table of contents: Deutsche Bedienungshinweise zur MillPlus IT V530 Programmierplatz... 3 English user directions to the MillPlus IT V530 Programming Station...

Mehr

New avalanche forecasting products in Switzerland

New avalanche forecasting products in Switzerland New avalanche forecasting products in Switzerland Lukas Dürr, SLF Davos WSL-Institut für Schnee- und Lawinenforschung SLF 1 New Avalanche Bulletin This presentation offers ideas and facts on: how to make

Mehr

Open Access and Open Science at the University of Mannheim. Eugen Underberg Subject librarian for political and social sciences

Open Access and Open Science at the University of Mannheim. Eugen Underberg Subject librarian for political and social sciences Open Access and Open Science at the University of Mannheim Eugen Underberg Subject librarian for political and social sciences Content University of Mannheim and Mannheim University Library Open Access

Mehr

Korpuslinguistik mit Online-Ressourcen Workshop des LIPP-Doktorandenkolloquiums (LMU München)

Korpuslinguistik mit Online-Ressourcen Workshop des LIPP-Doktorandenkolloquiums (LMU München) Korpuslinguistik mit Online-Ressourcen Workshop des LIPP-Doktorandenkolloquiums (LMU München) Stefanie Dipper, Stefan Evert, Heike Zinsmeister 28. Januar 2011 http://wordspace.collocations.de/doku.php/corpus_tutorial:lipp2011

Mehr

DATA ANALYSIS AND REPRESENTATION FOR SOFTWARE SYSTEMS

DATA ANALYSIS AND REPRESENTATION FOR SOFTWARE SYSTEMS DATA ANALYSIS AND REPRESENTATION FOR SOFTWARE SYSTEMS Master Seminar Empirical Software Engineering Anuradha Ganapathi Rathnachalam Institut für Informatik Software & Systems Engineering Agenda Introduction

Mehr

Exercise (Part XI) Anastasia Mochalova, Lehrstuhl für ABWL und Wirtschaftsinformatik, Kath. Universität Eichstätt-Ingolstadt 1

Exercise (Part XI) Anastasia Mochalova, Lehrstuhl für ABWL und Wirtschaftsinformatik, Kath. Universität Eichstätt-Ingolstadt 1 Exercise (Part XI) Notes: The exercise is based on Microsoft Dynamics CRM Online. For all screenshots: Copyright Microsoft Corporation. The sign ## is you personal number to be used in all exercises. All

Mehr

Markus BöhmB Account Technology Architect Microsoft Schweiz GmbH

Markus BöhmB Account Technology Architect Microsoft Schweiz GmbH Markus BöhmB Account Technology Architect Microsoft Schweiz GmbH What is a GEVER??? Office Strategy OXBA How we used SharePoint Geschäft Verwaltung Case Management Manage Dossiers Create and Manage Activities

Mehr

Strategy. Execution. Results. CIAgenda. COPYRIGHT Phil Winters 2014 ALL RIGHTS PROTECTED AND RESERVED.

Strategy. Execution. Results. CIAgenda. COPYRIGHT Phil Winters 2014 ALL RIGHTS PROTECTED AND RESERVED. CIAgenda 1 Customer Strategy Datenflüsterer Experte für Strategien aus der Kundenperspektive 2 Customer Experience COPYRIGHT Phil Winters 2014. ALL RIGHTS PROTECTED AND RESERVED. 3 Aus der Kundenperspektive

Mehr

GER_A G. Das Verb "lassen" Reading a newspaper Grammar & Structure Level A2 GER_A G.

GER_A G. Das Verb lassen Reading a newspaper Grammar & Structure Level A2 GER_A G. Das Verb "lassen" Reading a newspaper Grammar & Structure Level A2 www.lingoda.com 1 Das Verb lassen Leitfaden/Outline Inhalt/Content Das Verb lassen wird sehr häufig und vielfältig verwendet. Man kann

Mehr

Verzeichnisdienste in heterogenen Systemen

Verzeichnisdienste in heterogenen Systemen Verzeichnisdienste in heterogenen Systemen Zielsetzungen Implementierung Aufbau: Active Directory (AD) auf Basis von Windows Server 008 R mit Windows Client(s), Linux Client(s) und einem Linux Server (Dateiserver).

Mehr

Die Schule. Activity 1 Dominoes for Lower Ability. www.teachitlanguages.co.uk 2012 15980 Page 1 of 7

Die Schule. Activity 1 Dominoes for Lower Ability. www.teachitlanguages.co.uk 2012 15980 Page 1 of 7 Activity 1 Dominoes for Lower Ability Kunst Musik Mathe Sport Französisch Biologie Erdkunde Technologie Geschichte Informatik www.teachitlanguages.co.uk 2012 15980 Page 1 of 7 Englisch Deutsch Religion

Mehr

Übung 2: Wie oft musst du das machen? Oft (often), manchmal (sometimes) oder nie (never)? Name: das Auto waschen

Übung 2: Wie oft musst du das machen? Oft (often), manchmal (sometimes) oder nie (never)? Name: das Auto waschen f e r n l e r n e n Deutsch I BLOCK Kapitel 9 Tutorstunde 9B Name: Übung 1: neue Vokabeln: was machst du zu Hause? Identify each chore in German, using the noun with definite article and appropriate verb,

Mehr

SnagIt 9.0.2. Movable Type Output By TechSmith Corporation

SnagIt 9.0.2. Movable Type Output By TechSmith Corporation SnagIt 9.0.2 By TechSmith Corporation TechSmith License Agreement TechSmith Corporation provides this manual "as is", makes no representations or warranties with respect to its contents or use, and specifically

Mehr

Sicherheit / Sicherung - unterschiedliche Begriffsbestimmung, gemeinsame Fachaspekte

Sicherheit / Sicherung - unterschiedliche Begriffsbestimmung, gemeinsame Fachaspekte Sicherheit / Sicherung - unterschiedliche Begriffsbestimmung, gemeinsame Fachaspekte F. Seidel, BfS Salzgitter (Juli 2002) 1) Begriffsbestimmung (Vergleich unter Nutzung nationaler und internationaler

Mehr

ÜBERBLICK ÜBER DAS KURS-ANGEBOT

ÜBERBLICK ÜBER DAS KURS-ANGEBOT ÜBERBLICK ÜBER DAS KURS-ANGEBOT Alle aufgeführten Kurse sind 100 % kostenfrei und können unter http://www.unterricht.de abgerufen werden. SATZBAU & WORTSTELLUNG - WORD ORDER Aussagesätze / Affirmative

Mehr

Analyse von Beurteilungen räumlicher Objekte in natürlich sprachlichen Texten Sarah Tauscher, Karl Neumann

Analyse von Beurteilungen räumlicher Objekte in natürlich sprachlichen Texten Sarah Tauscher, Karl Neumann Analyse von Beurteilungen räumlicher Objekte in natürlich sprachlichen Texten Sarah Tauscher, Karl Neumann Institut für Informationssysteme Technische Universität Braunschweig Example: Main Tower Main

Mehr

Parametric Spectral Estimation

Parametric Spectral Estimation Parametric Spectral Estimation Exercises for Digital Signal Processing II Exercise 2.3.26 Stefan Goetze / Volker Mildner Infos about the examination Diploma students: Oral examinations on March, 29 th.-

Mehr

Wege zur Integration In und mit der Cloud. Wolfgang Schmidt Vorstand Cloud-EcoSystem. 2014 W.Schmidt, X-INTEGRATE

Wege zur Integration In und mit der Cloud. Wolfgang Schmidt Vorstand Cloud-EcoSystem. 2014 W.Schmidt, X-INTEGRATE Wege zur Integration In und mit der Cloud Wolfgang Schmidt Vorstand Cloud-EcoSystem Wie viele Cloud Integrationstechnologien braucht man? Antworten auf den 150+ Folien Quelle: Forrester Report: How Many

Mehr

Langenscheidt Englisch-Comics Grammatik

Langenscheidt Englisch-Comics Grammatik Langenscheidt Comics Grammatik Langenscheidt Englisch-Comics Grammatik Bearbeitet von Anke Williamson 1. Auflage 2007. Broschüren im Ordner. 64 S. Spiralbindung ISBN 978 3 468 34964 5 Format (B x L): 10,6

Mehr

Modul 6 Virtuelle Private Netze (VPNs) und Tunneling

Modul 6 Virtuelle Private Netze (VPNs) und Tunneling Modul 6 Virtuelle Private Netze (VPNs) und Tunneling M. Leischner Netzmanagement Folie 1 Virtuelle Private Netze Begriffsdefinition Fortsetz. VPNC Definition "A virtual private network (VPN) is a private

Mehr

In German, there is only one way: you always add -er for comparative, and -(e)st for superlative.

In German, there is only one way: you always add -er for comparative, and -(e)st for superlative. Komparativ und Superlativ In English, we have two ways to make a comparison using adjectives, depending on the syllables of the adjective. cheap cheaper the cheapest expensive more expensive the most expensive

Mehr

Unterrichtsmaterialien in digitaler und in gedruckter Form. Auszug aus: Grammatik einfach praktisch - Englisch (Niveau: A1 - B2)

Unterrichtsmaterialien in digitaler und in gedruckter Form. Auszug aus: Grammatik einfach praktisch - Englisch (Niveau: A1 - B2) Unterrichtsmaterialien in digitaler und in gedruckter Form Auszug aus: Grammatik einfach praktisch - Englisch (Niveau: A1 - B2) Das komplette Material finden Sie hier: School-Scout.de Eine moderne und

Mehr

das Haus - Vokabeln der Schornstein die Toilette Verben wohnen Andere Wörter die Einfahrt

das Haus - Vokabeln der Schornstein die Toilette Verben wohnen Andere Wörter die Einfahrt das Haus - Vokabeln das Haus die Wohnung der Garten der Schornstein der Keller die Garage die Tür die Toilette die Küche das Dach das Badezimmer das Schlafzimmer das Fenster das Eßzimmer das Wohnzimmer

Mehr

Wittgenstein Scholarship 2013 München, Juli 25 26, 2013

Wittgenstein Scholarship 2013 München, Juli 25 26, 2013 CIS, München, Juli 25. 26. München, Juli 25 26, 2013 CIS, München, Juli 25. 26. Centrum für Informatons- und Disambiguation of particle verb constructions in Big Typescript of Ludwig Wittgenstein introduced

Mehr

Punctuality is expected. Repeated tardiness will be counted as an absence.

Punctuality is expected. Repeated tardiness will be counted as an absence. German 101 Prof. Kim Vivian Fall 2007 Office: DK 109 MWF 1000-1115 (B Period) Phone: 7606 DK-B2 Office Hours: TTH 0900-1100, and by appointment I. Grading: Participation 10% A+ 100 Homework 10% A 93-99

Mehr