WortartenannotaGon: Tagging
|
|
- Felix Meissner
- vor 6 Jahren
- Abrufe
Transkript
1 WortartenannotaGon: Tagging BASIEREND AUF FOLIEN VON DR. H. ZINSMEISTER Gertrud Faaβ Universität StuNgart, InsGtut für maschinelle Sprachverarbeitung Azenbergstr. 12, StuNgart stungart.de 1
2 Einleitung Kategorien: Parts of Speech Philosophie: Kategorienlehre von Aristoteles als SystemaGk der Grundformen des Seins Substanz, QuanGtät, Qualität, RelaGon, Ort, Zeit, Lage, Haben, Wirken und Leiden 2
3 Einleitung Dionysios Thrax (ca v.chr), Alexandria erste griechische GrammaGk 8 Wortarten: Adverben, ArGkel, KonjunkGonen, Nomen, ParGzipien, PräposiGonen, Pronomen und Verben 3
4 Kriterien Morphologische Kriterien flekgerbar oder nicht, Art der FlekGon wortartenspezifische Affigierung in der Wortbildung SemanGsche Kriterien teilweise Bildung von Unterklassen durch Bedeutungsunterschiede DistribuGonelle Kriterien Wortartenkontexte / PosiGonen im Satz, in denen ein Element typischerweise auorin Keines der Kriterien gilt absolut. Es gibt Interaktionen und Ausnahmen. 4
5 MASCHINELLE SPRACHVERARBEITUNG Gertrud Faaß Basierend auf Folien von Dr. H Zinsmeister Klassifizierung Klassifizierung nach morphologischen Kriterien (PiNner & Berman, 2004:15): Wort flekGerbar nicht flekGerbar deklinierbar SubstanGve AdjekGve ArGkel konjugierbar Verben KonjunkGonen PräposiGonen Adverbien ParGkeln InterjekGonen 5
6 Zwei Tagsets StuNgart Tübingen TagSet (STTS) Deutsch Penn Treebank Tagset Englisch 6
7 STTS STTS (Schiller et al. 1999) Wortarten Analyse für die manuelle (und automagsche) AnnotaGon von deutschen Textkorpora Vereinfachung: Leerzeichen = Wortgrenze, keine Mehrwortlexeme 7
8 STTS OrienGerung am Standard der Text Encoding IniGaGve (TEI): 11 Hauptwortarten, spezifiziert in 54 Wortarten Tags (48 & 6 Zusatztags) (Schiller et al., 1999:4) 8
9 STTS: Label Tag ( Label ) Struktur: vom Allgemeinen zum Besonderen (Spezifischeren) Beispiel: Pronomen (1) Diese Lösung klappt. (2) Diese klappt nicht. ad (1): Pronomen demonstragv attribuierend, PDAT ad (2): Pronomen demonstragv subsgtuierend, PDS 9
10 Penn Treebank Tagset Penn Treebank Tagset Santorini (1991) 45 Labels (36 Wortarten und 9 punctuagon tags basiert auf umfangreicheren Tagset des Brown Corpus (Francis & Kudera 1982) Typen von Tags Hauptklassen: noun (common and proper), verb, adjekgve, adverb FunkGonswörter: determiners, preposigons, conjuncgons, pronouns, etc. 10
11 Penn Treebank Tagset Typen von Tags Hauptklassen: noun (common and proper), verb, adjekgve, adverb FunkGonswörter: determiners, preposigons, conjuncgons, pronouns, etc. wichgge Einzelwörter: to, there InterpunkGon Fremdsprachl. Material, Symbole, InterjekGonen, List Marker 11
12 Penn Treebank Tagset Labels sind weniger hierarchisch aufgebaut als im STTS Manche Tags nicht intuigv, JJ = AdjekGve RB = Adverb To ist immer als to annogert ( getaggt ) (1) to_to go_vb to_to university_nn (2) There_EX is_vbz a_dt unicorn_nn in_in the_dt garden_nn 12
13 WortartenannotaGon technisch Wie wird annogert? ImplemenGerungsabhängig university_nn university NN university/nn <word university <pos NN>> Hilfreich: Abfragen auf POS Ebene CWB [(pos= NN )&(word= uni.* )] (Corpus WorkBench, Christ (1994)) 13
14 Wortartenübersicht DIE WORTARTEN DES DEUTSCHEN 14
15 Nomen NOMEN (auch SubstanGv), Pl.: Nomina Morphologische Eigenschaoen: festes Genus Maskulin, Feminin, Neutrum aber: dialektale bzw. regionale Schwankungen:» der/das Teller, der/das Radio aber: Neue Wörter und andere Unsicherheiten:» der/das Joghurt, das/die , der/das Virus Werden nach Numerus und Kasus dekliniert 15
16 Nomen NOMEN(2) Pluralia Tanta: Geschwister, Alpen StoffsubstanGve: nur Singular Reis, Mehl, Sand, Ruhe Hass, Wut, etc. 16
17 Nomen: semangsche Eigenschaoen SemanGsche Eigenschaoen Konkreta Abstrakta Gegenständliches Vorstellungen / Handlungen / Vorgänge / Zustände/Eigenschaoen... (1) Stuhl / Obst Meinung / Ruhe belebt unbelebt (2) Katze / Alge Weg / Schule GaNungsbezeichungen (AppellaGva) Eigennamen (3) ein/der Hund Wolfie 17
18 Nomen: semangsche Eigenschaoen diskret / zaehlbar nicht zaehlbar (4) zwei Stuehle (Sitzmöbel) zwei *Obst (5) zwei Meinungen zwei *Ruhen 18
19 Nomen: semangsche Eigenschaoen Ontologien: Germanet (Deutsche Fassung von Wordnet) Idee: Eine Hierarchie vom Allgemeinen zum Besonderen (in sets) z.b. (Terme: Hypernym (drüber), Hyponym (drunter)) Es gibt EnGtäten (das Seiende) EnGtäten bezeichnen Belebtes, Unbelebtes (Teilweise auch abstrakte Begriffe wie Prozesse) Zu den Belebten zählen Menschen und Tiere Kinder sind Menschen Mädchen sind Kinder, Menschen, Belebtes, EnGtäten 19
20 Nomen: semangsche Eigenschaoen CL Idee MÜ e.g. Englisch Deutsch: Menschen haben doch am Ende in allen Sprachen dieselbe EnGtätshierarchie: könnte mit Hilfe zwei solcher hierarchischen Lexika eine maschinelle Übersetzung vereinfacht werden? Antwort wie Radio Eriwan: Im Prinzip Ja... Beispiel Demo: Schaf versus sheep Wordnet vs. Germanet 20
21 Nomen: semangsche Eigenschaoen Beispiel Hypernyme: Schaf:..ziegenarGger Hohlhörner, Hohlhörner, Wiederkäuer, Paarhufer,...,Plazenta SäugeGer...EnGtät sheep:...bovid (hollow horned ruminants), ruminant, even toad,... placental mammal,...engty... ok 21
22 Nomen: semangsche Eigenschaoen Beispiel Hyponyme: Schaf: Schafsbock, Widder Schaf Lamm Mufflon sheep: hnp://wordnetweb.princeton.edu/perl/webwn 22
23 Nomen: semangsche Eigenschaoen Problem: In den weiteren Begriffen sind sich die Menschen wohl über die meisten Sprachen hinweg einig, aber wenn es um konkrete Gegenstände geht, differieren die Ontologien (unerwartet) stark: Demo Sauerkraut 23
24 Nomen: distribugonelle Eigenschaoen DistribuGonelle Kriterien, typische Kontexte ArGkel (AdjekGv) Nomen (1) Er liest ein neues Buch Aber: Eigennamen, Plurale, StoffsubstanGve, FunkGonsverbgefüge, (2) Max liest gerne Comics. (3) Er isst Obst (ein *Obst) (4) Er hat mit ihr geschlossen 24
25 Nomen: distribugonelle Eigenschaoen DistribuGonelle Kriterien, typische Kontexte PräposiGon (ArGkel)? (AdjekGv)* Nomen (5) Sie zieht die OpGon in Betracht NotaGon: * = Kleene Star (x)* = x kommt null mal, ein mal oder beliebig oo vor (x)? = x kommt nicht oder genau einmal vor 25
26 Nomen: Labels STTS NN: normales Nomen (common noun) NE: Eigenname Penn Treebank NN: noun, singular or mass NNS: noun, plural NNP: proper noun, singular NNPs: proper noun, plural 26
27 Verben: (semangsche) Eigenschaoen VERBEN werden konjugiert: tempus, modus, numerus, person Kategorien / SemanGsche Eigenschaoen: Vollverben (eigene SemanGk) Hilfsverben (Auxiliare, grammagsche Bedeutung) Modalverben (Moeglichkeit, Notwendigkeit, Erlaubnis, Einschaetzung der Wahrscheinlichkeit) Kopulaverben (Zustand oder Fortdauern) 27
28 Verben: distribugonelle Eigenschaoen Verben: distribugonelle Eigenschaoen Vollverben treten selbstständig auf Hilfsverben treten nur zusammen mit einem infiniten Vollverb auf (im ParGzip oder InfiniGv): haben, sein, werden Modalverben treten mit infiniten Vollverben und Kopulaverben auf: können, dürfen, müssen, sollen, wollen, mögen Halbmodalverben mit Vollverb im zu InfiniGv: scheint zu schlafen, verspricht zu bleiben, droht zu kommen,... 28
29 Verben: distribugonelle Eigenschaoen Verben: distribugonelle Eigenschaoen Kopulaverben Sind grammagscher KiN für nicht verbale Prädikate Zählen mehr zu den Vollverben als zu den Auxiliaren (sein,bleiben, werden) (1) Er ist [ NP ein guter Fußballer] (2) Sie wird [ AdjP gesund] (3) Ein GewiNer ist [ PP im Anmarsch] 29
30 Verben: Labels STTS: Vollverben VVFIN: Vollverb, finit VVIMP: Vollverb, ImperaGv VVINF: Vollverb, InfiniGv VVIZU: Vollverb, zu InfiniGv VVPP: Vollverb, ParGzip Perfekt Auxiliare: VAFIN, VAIMP, VAINF, VAPP (haben/sein immer als VA) Modalverben: VMFIN, VMINF,VMPP 30
31 Verben: Labels Penn Treebank VB: Verb, base form VBD: Verb, past tense VBG: Verb, gerund or present pargciple VPN: Verb, past pargciple VBP: Verb, non 3 rd person singular present VBZ: Verb, 3 rd person singular present 31
32 AdjekGve ADJEKTIVE: morphologische Eigenschaoen deklinierbar: groß, große, großes,... Komparierbar: große, größere, größte SemanGsche Eigenschaoen: Qualität: rot, rund, gut, angeblich,... RelaGon: asiahsch, ärztlich, hölzern,... QuanGtät: viel, zweiter, eine, hundert,... adjekgvisch gebrauchte ParGzipien: suchend 32
33 AdjekGve: distribugonelle Eigenschaoen ADJEKTIVE: distribugonelle Eigenschaoen PraedikaGv mit Kopulaverb (nicht flekgert) (1) Der Ball ist rund. Die Freunde sind quin. adverbial verwendet mit Vollverb (nicht flekgert) (2) Das Auto fährt schnell anribuierend (normalerweise flekgert) (3) Der rote Ball. Die roten Linken. können Argumente selegieren (4) Er ist stolz (auf seinen Sieg), Sie ist imstande (zu gehen) 33
34 AdjekGve: Labels STTS ADJA: anribuierendes AdjekGv ADJD: adverbiales oder prädikagves AdjekGv anderen Wortklassen zugeordnet: PIS/PIAT: viele, manche,... CARD: zwei Männer,... 34
35 AdjekGve: Labels Penn Treebank JJ: adjecgve JJR: adjecgve, comparagve JJS: AdjecGve, superlagve CD: two men,... 35
36 Andere Wortarten Pronomen er, sie, es,... Determiner (ArGkel) der, die, das, ein,... Adverb: Satzadverb (leider), KonjunkHonaladverb (infolgedessen),... PräposiGon (AdposiGon) in, vor, auf KonjunkGon (koordinieren) und SubjunkGon (subordinierende KonjunkGon) dass ParGkel ja, doch, auch, ziemlich 36
37 Wortarten: Zusatz Sind Wortarten universell? NEIN! Latein kennt keine ArGkel, NSotho keine PräposiGonen, Anpassungen! Versuch einer Standardisierung: hnp:// (EAGLES: Empfehlungen für europäische Sprachen) 37
38 Referenzen Christ Oliver (1994). A modular and flexible architecture for an integrated corpus query system. COMPLEX 94, Budapest, 199 hnp:// stungart.de/projekte/corpusworkbench/#papers Meibauer Jörg et al. (2007). Einführung in die germanisgsche LinguisGk. StuNgart / Weimar: Metzler, Kapitel 4.1 2, 4.4.1, 4.5 Dudenverlag: Duden Die GrammaGk (Bd. 4). W. Nelson Francis und Henry Kučera Frequency analysis of English usage : lexicon and grammar. Boston : Houghton Mifflin, 1982; hnp://icame.uib.no/brown/bcm.html Elke Nowak Einführung ins InukGtut. Manuskript. TU Berlin. hnp:// berlin.de/fak1/ el/ board.cgi?id=angli&acgon=view&gul=83&page=1&go_cnt=0 Anne Schiller, Simone Teufel, ChrisGne Stöckert und ChrisGne Thielen Guidelines für das Tagging deutscher Textcorpora mit STTS. Technischer Bericht. InsGtut für maschinelle Sprachverarbeitung, StuNgart.hNp:// stungart.de/projekte/corplex/tagsets/ sns 1999.pdf Beatrice Santorini Part of Speech Tagging Guidelines for the Penn Treebank Project. Technischer Bericht. University of Pennsylvania.op://op.cis.upenn.edu/pub/treebank/doc/ tagguide.ps.gz Germanet: hnp:// tuebingen.de/germanet wordnet: hnp://wordnet.princeton.edu 38
Wortarten und Tagsets. Korpuslinguistik Dr. Heike Zinsmeister WS 2009/10
Wortarten und Tagsets Korpuslinguistik Dr. Heike Zinsmeister WS 2009/10 Wortarten - Hintergrund Kategorien Grundbegriffe eines Systems Philosophie: Kategorienlehre von Aristoteles als Systematik der Grundformen
MehrTagging: Wortarten. Wortarten - Hintergrund
Tagging: Wortarten Machine Language Processing Heike Zinsmeister WS 2008/09 Wortarten - Hintergrund Kategorien Grundbegriffe eines Systems Philosophie: Kategorienlehre von Aristoteles als Systematik der
MehrEinschub: Tagsets STTS (Deutsch) und Penn. Wortarten - Hintergrund. Wortarten und Tagsets. Wortarten - Kriterien STTS
Wortarten und Tagsets Korpuslinguistik Dr. Heike Zinsmeister WS 2009/10 Kategorien Wortarten - Hintergrund Grundbegriffe eines Systems Philosophie: Kategorienlehre von Aristoteles als Systematik der Grundformen
MehrLinguistische Grundlagen. Warum Tagging? Klassische Wortartenlehre Tagsets Annotation höherer Ebenen Design von Tagsets
Linguistische Grundlagen Warum Tagging? Klassische Wortartenlehre Tagsets Annotation höherer Ebenen Design von Tagsets Warum Tagging? Abfragbarkeit linguistischer Information Generalisierbarkeit von Abfragen
MehrTutorial II: Corpus Methods for Historical Linguistics
Tutorial II: Corpus Methods for Historical Linguistics Formal Diachronics Semantics 2016 University of Konstanz Christin Schätzle and Gerold Schneider firstname.lastname@uni-konstanz.de 13.09.2016 1 Regular
MehrPart of Speech Tagging. Linguistische Sicht. Carolin Deck
Part of Speech Tagging Linguistische Sicht Carolin Deck Gliederung 1. Begriffsklärung 2. Vorstellung zwei wichtiger Tagsets (STTS & PTTS) 3. Bedeutung des POS-Tagging für die Sprachwissenschaft 4. Tagzuweisung
MehrKorpuslinguistik Annis 3 -Korpussuchtool Suchen in tief annotierten Korpora
Korpuslinguistik Annis 3 -Korpussuchtool Suchen in tief annotierten Korpora Anke Lüdeling, Marc Reznicek, Amir Zeldes, Hagen Hirschmann... und anderen Mitarbeitern der HU-Korpuslinguistik Ziele Wie/Was
MehrTagger for German. Online BRILL-Tagger für das Deutsche
Tagger for German Online BRILL-Tagger für das Deutsche Morphologie V/Ü, Anke Holler Uni Heidelberg, SS2007 Nataliya Mytyay Éva Mújdricza 19.07.2007 Designed by: Dóra Dobos Tagger for German Eric Brill
MehrInhaltsverzeichnis. Abkürzungen... 9 Niveaustufentests Tipps & Tricks Auf einen Blick Auf einen Blick Inhaltsverzeichnis
Inhaltsverzeichnis Inhaltsverzeichnis Abkürzungen... 9 Niveaustufentests... 10 Tipps & Tricks... 18 1 Der Artikel... 25 1.1 Der bestimmte Artikel... 25 1.2 Der unbestimmte Artikel... 27 2 Das Substantiv...
MehrVorlaugeGuidelinesfurdasTaggingdeutscherTextcorpora AnneSchiller,SimoneTeufel,ChristineStockert mitstts InstitutfurmaschinelleSprachverarbeitung UniversitatStuttgart SeminarfurSprachwissenschaft UniversitatTubingen
MehrWortarten Merkblatt. Veränderbare Wortarten Unveränderbare Wortarten
Wortarten Merkblatt Veränderbare Wortarten Deklinierbar (4 Fälle) Konjugierbar (Zeiten) Unveränderbare Wortarten Nomen Konjunktionen (und, weil,...) Artikel Verben Adverbien (heute, dort,...) Adjektive
MehrWortarten Merkblatt. Veränderbare Wortarten Unveränderbare Wortarten
Wortarten Merkblatt Veränderbare Wortarten Deklinierbar (4 Fälle) Konjugierbar (Zeiten) Unveränderbare Wortarten Nomen Konjunktionen (und, weil,...) Artikel Verben Adverbien (heute, dort,...) Adjektive
MehrMaschinelle Sprachverarbeitung: Part-of-Speech-Tagging
HUMBOLDT-UNIVERSITÄT ZU BERLIN Institut für Informatik Lehrstuhl Wissensmanagement Maschinelle Sprachverarbeitung: Part-of-Speech-Tagging Tobias Scheffer Ulf Brefeld POS-Tagging Zuordnung der Wortart von
MehrDeutsch Grammatik Sekundarstufe 1 Die 5 Wortarten
Deutsch Grammatik Sekundarstufe 1 Die 5 Wortarten Theorie und Klassenübungen (mit Lösungen) Geeignet für 8. bis 10. Schuljahr MSV- Unterricht ILF- Unterricht Als Skript verwendbar Mit Kommentaren und Erklärungen
MehrGymbasis Deutsch: Grammatik Wortarten Verb: Bestimmung der infiniten Verben Lösung 1 Lösungsansätze Bestimmung der infiniten Verben
Gymbasis Deutsch: Grammatik Wortarten Verb: Bestmung der Verben Lösung 1 Lösungsansätze Bestmung der Verben An anderer Stelle diente der unten stehende Text bereits zur Bestmung der Formen des. Unterstreiche
MehrEinführung in die Computerlinguistik. Morphologie III
Einführung in die Computerlinguistik Morphologie III Hinrich Schütze & Robert Zangenfeind Centrum für Informations- und Sprachverarbeitung, LMU München 7.12.2015 Schütze & Zangenfeind: Morphologie III
MehrModifikationsvorschläge zu STTS Stand der bisherigen Diskussion
Modifikationsvorschläge zu STTS Stand der bisherigen Diskussion Heike Zinsmeister STTS-Workshop, 24. September 2012 0/18 Eine kleine Chronik Vorläufer - ELWIS (Helmut Feldweg, Christine Thielen, Tübingen),
MehrSwantje Westpfahl & Thomas Schmidt POS für(s) FOLK
Swantje Westpfahl & Thomas Schmidt POS für(s) FOLK Problemanalyse des POS- Taggings für spontansprachliche Daten anhand des Forschungsund Lehrkorpus Gesprochenes Deutsch 2 FOLK Forschungs- und Lehrkorpus
MehrFlexion. Grundkurs Germanistische Linguistik (Plenum) Judith Berman Derivationsmorphem vs. Flexionsmorphem
Grundkurs Germanistische Linguistik (Plenum) Judith Berman 23.11.04 vs. Wortbildung (1)a. [saft - ig] b. [[An - geb] - er] Derivationsmorphem vs. smorphem (4)a. Angeber - saftiger b. saftig - Safts c.
MehrMorphologie, Lemmatisierung und Wortartenklassifikationen. Lexikonaufbau und Morphologie-Analyseverfahren Gerold Schneider, SS 2005
Morphologie, Lemmatisierung und Wortartenklassifikationen Morphologieanalyse und Lexikonaufbau (1. Vorlesung) Übersicht Was ist Morphologie? Warum braucht man Morphologieanalyse in der CL? Was ist ein
MehrAbkürzungen Abbreviations Unbestimmte Artikel Indefinite Article... 9
Preface 3 Vorwort Wer möchte nicht auch mal Spaß haben beim Lernen? Die Englisch-Comics machen es möglich, frei nach dem Motto "Wer zuerst lacht, lernt am besten". Jedes Kapitel startet mit einem Comic,
MehrIntroduction to Computational Linguistics
Introduction to Computational Linguistics Frank Richter fr@sfs.uni-tuebingen.de. Seminar für Sprachwissenschaft Eberhard Karls Universität Tübingen Germany Intro to CL WS 2012/13 p.1 Part-of-speech (POS)
MehrFinite-State-Morphologie in XLE. Grammatikentwicklung, SS 2010
Finite-State-Morphologie in XLE Grammatikentwicklung, SS 2010 1 / 20 Worum es heute geht: Nutzen von Finite-State-Morphologien... und wie man sie in XLE einbaut 2 / 20 Lexikon in XLE Bis jetzt: so genanntes
MehrMorphologie, Lemmatisierung und Wortartenklassifikationen
Morphologie, Lemmatisierung und Wortartenklassifikationen Morphologieanalyse und Lexikonaufbau (1. Vorlesung) Übersicht Was ist Morphologie? Warum braucht man Morphologieanalyse in der CL? Was ist ein
MehrSyntax. Ending Khoerudin Deutschabteilung FPBS UPI
Syntax Ending Khoerudin Deutschabteilung FPBS UPI Traditionale Syntaxanalyse Was ist ein Satz? Syntax: ein System von Regeln, nach denen aus einem Grundinventar kleinerer Einheiten (Wörter und Wortgruppen)
MehrKorpuslinguistik Annis 3 -Korpussuchtool Suchen in tief annotierten Korpora
Korpuslinguistik Annis 3 -Korpussuchtool Suchen in tief annotierten Korpora Anke Lüdeling, Marc Reznicek, Amir Zeldes, Hagen Hirschmann hirschhx@hu-berlin.de... und vielen anderen Mitarbeitern der HU-Korpuslinguistik
MehrMorphologische Merkmale. Merkmale Merkmale in der Linguistik Merkmale in der Morpholgie Morphologische Typologie Morphologische Modelle
Morphologische Merkmale Merkmale Merkmale in der Linguistik Merkmale in der Morpholgie Morphologische Typologie Morphologische Modelle Merkmale Das Wort 'Merkmal' ' bedeutet im Prinzip soviel wie 'Eigenschaft'
MehrInhalt.
Inhalt EINLEITUNG II TEIL A - THEORETISCHE ASPEKTE 13 GRAMMATIK 13 Allgemeines 13 Die sprachlichen Ebenen 15 MORPHOLOGIE 17 Grundbegriffe der Morphologie 17 Gliederung der Morpheme 18 Basis- (Grund-) oder
Mehra) bestimmter Artikel b) unbestimmter Artikel c) Nullartikel (d) "Artikelwörter"/"adjektivische Pronomen )
3.) Artikel: a) bestimmter Artikel b) unbestimmter Artikel c) Nullartikel (d) "Artikelwörter"/"adjektivische Pronomen ) Merkmal der klassischen Artikel (a bis c), das sie von Adjektiven unterschiedet:
MehrUnterrichtsmaterialien in digitaler und in gedruckter Form. Auszug aus: Das Grammatikfundament: Wortarten. Das komplette Material finden Sie hier:
Unterrichtsmaterialien in digitaler und in gedruckter Form Auszug aus: Das Grammatikfundament: Wortarten Das komplette Material finden Sie hier: School-Scout.de Uta Livonius Das Grammatikfundament: Wortarten
MehrWortarten I: Die Deklinierbaren
Wortarten I: Die Deklinierbaren 1.) Substantive: Morphologische Grundmerkmale: 1.) Zugehörigkeit zu jeweils bestimmten Typenklassen der Deklination und der Pluralbildung. 2.) Festes Genus. Syntaktisches
MehrLies die Sätze und schreibe die entsprechende Zeitform in das Kästchen!
check 8. check 9. Wann bricht ein Vulkan aus? Verben in Zeitformen check 8. Wann bricht ein Vulkan aus? text- und Satzstrukturen kennen und anwenden / 4 Lies die Sätze und schreibe die entsprechende Zeitform
MehrKAPITEL I EINLEITUNG
KAPITEL I EINLEITUNG A. Der Hintergrund Die Wortklasse oder part of speech hat verschiedene Merkmale. Nach dem traditionellen System werden die deutschen Wortklassen in zehn Klassen unterteilt (Gross,
MehrBlockseminar Einführung in die Korpuslinguistik Seminarleitung: Yvonne Krämer, M.A. Das Korpus. und seine Aufbereitung
Blockseminar Einführung in die Korpuslinguistik Seminarleitung: Yvonne Krämer, M.A. Das Korpus und seine Aufbereitung Bestandteile eines Korpus sind i.d.r.: Primärdaten Metadaten Annotationen Annotationen
MehrReferat Wortstellung. 1. Generelle Theorien zu Wortstellung Stellungsfeldermodell
Humboldt-Universität zu Berlin, Institut für deutsche Sprache und Linguistik WiSe 2004/2005, HS: Korpuslinguistische Behandlung von Phänomenen des Deutschen Referentin: Gruppe 6 (Wortstellung) Yuko Makata,
MehrVorkurs Mediencode 7595-50. Die wichtigsten grammatikalischen Termini
Vorkurs Mediencode 7595-50 Die wichtigsten grammatikalischen Termini Für die Arbeit mit Ihrem Lateinbuch benötigen Sie eine Reihe von grammatikalischen Fachbegriffen und auch ein Grundverständnis wichtiger
MehrStatus quo. Wortbildungslehre, Formenlehre. Wortbildung. Wortbildung(slehre)
Wortbildung Wortbildung, Formenlehre Wortbildungslehre Wortbildung(slehre) Wortbildungslehre, Formenlehre Wortbildung, Morphologie (Formenlehre) Wortbildung und Morphologie (Formenlehre) Ägyptische EO
MehrLösungsansätze Bestimmung der finiten Verben
Gymbasis Deutsch: Grammatik Wortarten Verb: Bestimmung der finiten Verben Lösung 1 Lösungsansätze Bestimmung der finiten Verben Unterstreiche zuerst in den folgenden Sätzen die konjugierten Verben und
Mehratttributive Adjektive das die attributiven Adjektive attributive adjectives das blaue Haus --- ist nicht relevant--
Substantiv Die Substantive Das Pronomen, Nomen noun Lehrerin, der Spiegel, Dorf, Freiheit Groß geschrieben, Genus, Kasus, und dekliniert oder flektiertgroß geschrieben, Genus, Kasus, und dekliniert oder
MehrDWDS: Hilfe Kurzübersicht
DWDS: Hilfe Kurzübersicht (auch online unter http://www.dwds.de/?corpus=1&opt=hilfe&qu) Voreinstellungen Lemmasuche: Suchwörter werden automatisch zum Lemma expandiert. Vorsicht: befindet sich das Suchwort
MehrMorphologische Grundmerkmale prototypischer Adjektive: 1.) deklinierbar. 2.) freies Genus (Unterschied zu Nomen)
2.) Adjektive: Morphologische Grundmerkmale prototypischer Adjektive: 1.) deklinierbar 2.) komparierbar 2.) freies Genus (Unterschied zu Nomen) Randtypen I: nur deklinierbare, nicht komparierbare Adjektive
MehrLangenscheidt Englisch-Comics Grammatik
Langenscheidt Comics Grammatik Langenscheidt Englisch-Comics Grammatik Bearbeitet von Anke Williamson 1. Auflage 2007. Broschüren im Ordner. 64 S. Spiralbindung ISBN 978 3 468 34964 5 Format (B x L): 10,6
Mehr1 Einführung Morphologie Phonologie Semantik
1 Einführung Das Wort Syntax geht auf ein griechisches Verb zurück, das soviel wie zusammenstellen, zusammenordnen bedeutet. Allgemein bezeichnet Syntax die Regeln für die Kombination von Zeichen in einem
MehrSS 2010 Einführung in die Sprachwissenschaft Flexion und Wortarten Morphologie II: Nominale und verbale Flexion, Wortarten
Morphologie II: Nominale und verbale Flexion, Wortarten Anna Volodina 1 Teilgebiete der Morphologie 2 Teilgebiete der Morphologie 3 Plan der heutigen Sitzung Flexion: Begriffsbestimmung und Funktion Flexionsmorpheme
MehrÜBERBLICK ÜBER DAS KURS-ANGEBOT
ÜBERBLICK ÜBER DAS KURS-ANGEBOT Alle aufgeführten Kurse sind 100 % kostenfrei und können unter http://www.unterricht.de abgerufen werden. SATZBAU & WORTSTELLUNG - WORD ORDER Aussagesätze / Affirmative
MehrDeutsche Grammatik WS 14/15. Kerstin Schwabe
Deutsche Grammatik WS 14/15 Kerstin Schwabe Generelle Information Dr. Kerstin Schwabe Zentrum für Allgemeine Sprachwissenschaft Schützenstraße 18, R. 432 10117 Berlin Tel.: 20192410 E-mail: schwabe@zas.gwz-berlin.de
MehrÜBERBLICK ÜBER DAS KURS-ANGEBOT
ÜBERBLICK ÜBER DAS KURS-ANGEBOT Alle aufgeführten Kurse sind 100 % kostenfrei und können unter http://www.unterricht.de abgerufen werden. SATZBAU & WORTSTELLUNG - WORD ORDER Aussagesätze / Affirmative
MehrLangenscheidt Englisch-Comics Grammatik
Langenscheidt Comics Grammatik Langenscheidt Englisch-Comics Grammatik von Anke Williamson 1. Auflage Langenscheidt Englisch-Comics Grammatik Williamson schnell und portofrei erhältlich bei beck-shop.de
MehrEinführung in die Computerlinguistik
Einführung in die Computerlinguistik HMM POS-Tagging Laura Kallmeyer Heinrich-Heine-Universität Düsseldorf Summer 2016 1 / 20 POS Tags (1) Jurafsky and Martin (2009) POS = part-of-speech Tags sind morphosyntaktische
MehrDie Fälle Nominativ, Akkusativ und Dativ. NIVEAU NUMMER SPRACHE Anfänger A1_2057G_DE Deutsch
Die Fälle Nominativ, Akkusativ und Dativ GRAMMATIK NIVEAU NUMMER SPRACHE Anfänger A1_2057G_DE Deutsch Lernziele Die verschiedenen Fälle wiederholen Den Fall eines Nomens erkennen 2 Der Mann gab der Frau
MehrPOS Tagging. Stefanie Dipper. CL-Einführung, 2. Mai 2007
POS Tagging Stefanie Dipper CL-Einführung, 2. Mai 2007 Überblick 1. Was ist POS-Tagging? 2. Geschichtlicher Überblick 3. ( Moderne Tagger) 1. Was ist POS-Tagging? POS (PoS) = part of speech: Wortart Tag:
MehrPart-of-Speech-Tagging mit Transduktoren
Ruprecht-Karls Universität Heidelberg Hauptseminar Computerlinguistik Endliche Automaten für die Sprachverarbeitung PD Dr. Karin Haenelt Sommersemester 2005 Part-of-Speech-Tagging mit Transduktoren Maria
MehrPart-of-Speech-Tagging mit Transduktoren
Ruprecht-Karls Universität Heidelberg Hauptseminar Computerlinguistik Endliche Automaten für die Sprachverarbeitung PD Dr Karin Haenelt Sommersemester 2005 Part-of-Speech-Tagging mit Transduktoren Maria
MehrSyntaktische Kategorien: Phrasenkategorien
Syntaktische Kategorien: Phrasenkategorien FLM0410 - Introdução à Linguística Alemã I Profa. Dra. Ma. Helena Voorsluys Battaglia Eugenio Braga 8974165 Márcio Ap. de Deus 7000382 Wörter Phrasen Satz Satz
MehrBegriffsammlung Deutsch. Das kleine Huser sche Nachschlagewerk
Begriffsammlung Deutsch Das kleine Huser sche Nachschlagewerk Erklärungen zu folgenden Begriffen Singular Plural Imperativ Verbale Wortkette Wortarten maskulin feminin neutrum Infinitiv Partizip 2 Weiter
MehrRAW TEXT TOKENIZATION + PRE - TAGGING LEXICAL RESSOURCES REFERENCE CORPUS AMBIGUOUSLY ANNOTATED TEXT TRANSITION TABLES + WORD TAG PROBAB.
Ansätze des Tagging Ein Seminarreferat, vorgestellt von Alexander Valet, Christian Pretzsch und Vanessa Micelli im Rahmen des Hauptseminars Parsing bei Dr. Karin Haenelt im SS 2003 an der Ruprecht-Karls
MehrSprachsynthese: Part-of-Speech-Tagging
Sprachsynthese: Part-of-Speech-Tagging Institut für Phonetik und Sprachverarbeitung Ludwig-Maximilians-Universität München reichelu@phonetik.uni-muenchen.de 29. Oktober 2014 Inhalt POS- Markov- Transformationsbasiertes
MehrVORSCHAU. Inhalt. zur Vollversion. Seite. Vorwort 4 Didaktisch-methodische Anmerkungen Informationen zu den einzelnen Wortarten 6-8
Inhalt Seite Vorwort 4 Didaktisch-methodische Anmerkungen 5 1. Informationen zu den einzelnen Wortarten 6-8 2. Nomen (Substantive), Verben und Adjektive 9-11 3. Die zehn Wortarten 12-21 4. Präpositionen
MehrKinderleichte Kurzgrammatik
Doreen Fant Kinderleichte Kurzgrammatik der deutschen Sprache Kinderleichte Kurzgrammatik der deutschen Sprache Doreen Fant: Kinderleichte Kurzgrammatik der deutschen Sprache Doreen Fant Verlag, Vöhringen,
MehrGrammatikbingo Anleitung
Grammatikbingo Anleitung 1. Die Schüler legen auf einem Blatt oder in ihrem Heft eine Tabelle mit 16 Feldern (4x4) an. Die Tabelle sollte ca. die Hälfte des Blattes einnehmen. 2. Der Lehrer liest die Aufgaben
MehrWort. nicht flektierbar. flektierbar. nach Person, Numerus, Modus, Tempus, Genus verbi flektiert. nach Genus, Kasus, Numerus flektiert
Wort flektierbar nicht flektierbar nach Person, Numerus, Modus, Tempus, Genus verbi flektiert genufest nach Genus, Kasus, Numerus flektiert genusveränderlich komparierbar nicht komparierbar Verb Substantiv
Mehr1 Das Lernen der norwegischen Sprache Begrifflichkeit... 11
Inhalt Seite Vorwort 3 Einleitung 10. 1 Das Lernen der norwegischen Sprache... 10 2 Begrifflichkeit... 11 1 Wortarten... 11 2 Veränderbarkeit von Wörtern.... 12 Substantive 13. 3 Grundsätzliches... 13
MehrEinführung in die Computerlinguistik. Morphologie II
Einführung in die Computerlinguistik Morphologie II Hinrich Schütze & Robert Zangenfeind Centrum für Informations- und Sprachverarbeitung, LMU München 30.11.2015 Schütze & Zangenfeind: Morphologie II 1
MehrVertiefung der Grundlagen der Computerlinguistik. Semesterüberblick und Einführung zur Dependenz. Robert Zangenfeind
Vertiefung der Grundlagen der Computerlinguistik Semesterüberblick und Einführung zur Dependenz Robert Zangenfeind Centrum für Informations- und Sprachverarbeitung, LMU München 17.10.2017 Zangenfeind:
MehrNLP Eigenschaften von Text
NLP Eigenschaften von Text Dr. Andreas Hotho Dominik Benz Beate Krause Sommersemester 2008 Folie: 1 Übersicht Einführung Eigenschaften von Text Words I: Satzgrenzenerkennung, Tokenization, Kollokationen
MehrGrammatikanalyse. Prof. Dr. John Peterson. Sprechstunde: Montags, 14:30-15:30h Raum LS10/Raum 425. Sommersemester 2015 Donnerstags, 14:15h-15:45h
Grammatikanalyse Sommersemester 2015 Donnerstags, 14:15h-15:45h Prof. Dr. John Peterson Sprechstunde: Montags, 14:30-15:30h Raum LS10/Raum 425 1 Termin Thema 16.4. Einführung Zerlegung des Satzes in seine
MehrLösung für Lehrerinnen und Lehrer Grammatik-Lapbook Teil 1: Wortarten
Lösung für Lehrerinnen und Lehrer Grammatik-Lapbook Teil 1: Wortarten Es wird zunächst eine Grundform für das Lapbook erstellt. Dabei bietet es sich an, aus Tonkarton ein Buch zu falten (siehe auch Arbeitsblatt
MehrNomen im Plural. NIVEAU NUMMER SPRACHE Anfänger A1_1032X_DE Deutsch
Nomen im Plural BAUSTEINE NIVEAU NUMMER SPRACHE Anfänger A1_1032X_DE Deutsch Lernziele Nomen im Plural lernen Nomen im Plural verwenden 2 Auf der Welt gibt es viele Männer, Frauen, Kinder, Tiere, 3 Nomen
MehrÜberblick Wortarten (Einteilung nach Formveränderung bzw. Flexion)
Überblick Wortarten (Einteilung nach Formveränderung bzw. Flexion) Flektierbar (veränderlich) nicht flektierbar (Partikeln) konjugierbar deklinierbar komparierbar nach Person und Zahl veränderbar Beugen
MehrA Topical/Local Classifier for Word Sense Idendification (TLC) Anne Schwartz
A Topical/Local Classifier for Word Sense Idendification (TLC) Anne Schwartz anne@coli.uni-sb.de A Topical/Local Classifier for Word Sense Idendification (TLC) entwickelt von: - Martin Chodorow (Dep. of
MehrDie Pronomen (Fürwörter)
Die Pronomen (Fürwörter) "Pro" bedeutet "für" - ein Pronomen steht also für ein Nomen (es ist der "Stellvertreter des Nomens"). Beispiel: Christine liest ein Buch. > Sie liest ein Buch. Ein Pronomen kann
MehrEinführung in die Computerlinguistik POS-Tagging
Einführung in die Computerlinguistik POS-Tagging Laura Heinrich-Heine-Universität Düsseldorf Sommersemester 2013 POS Tags (1) POS = part-of-speech Tags sind morphosyntaktische Kategorien von Wortformen.
MehrMorphologie. Dazu gehört auch: Wortarten und ihre Einteilung. Morphologie ist die Lehre vom Strukturaufbau der Wörter.
Wörter und ihre Teile: Morphologie Flexion Morphologie von Goethe geprägter Begriff für Form und Struktur lebender Organismen im 19. Jh. in die Sprachwissenschaft übernommen Morphologie ist die Lehre vom
MehrStichwortverzeichnis. Anhang. Bedingungssatz siehe Konditionalsatz Befehlsform
Anhang 130 A Adjektiv 68 73, 112 Bildung aus anderen Wörtern 69 mit Genitiv 63 Übersicht Deklination 108 109 Adverb 74 77, 112 Steigerung 76 Stellung 77 Typen (lokal, temporal, kausal, modal) 75 adverbiale
MehrDie Grammatik. Auflage
Die Grammatik Unentbehrlich für richtiges Deutsch Der Aufbau der deutschen Sprache vom Laut über das Wort und den Satz bis hin zum Text und zu den Merkmalen der gesprochenen Sprache 4 9. Auflage Allgemeine
Mehr1.Auflage Reinhard Laun Zeichnungen und Grafik: Reinhard Laun. Verlag: Tradition GmbH, Hamburg Printed in Germany
Das Werk und seine Teile sind urheberrechtlich geschützt. Jede Verwertung in anderen als den gesetzlich zugelassenen Fällen bedarf der vorherigen schriftlichen Einwilligung des Autors. Hinweis zu 52a UrG:
Mehr1 Das Lernen der schwedischen Sprache Begrifflichkeit... 11
Inhalt Seite Vorwort 3 Einleitung 10 1 Das Lernen der schwedischen Sprache.................... 10 2 Begrifflichkeit........................................ 11 1 Wortarten.........................................
MehrGroß- und kleinschreibung
check 5. Groß- und kleinschreibung check 5. Groß- und kleinschreibung / 39 Setze die fehlenden Buchstaben richtig ein! 16 1. als rstes öffnete Brigitte das rößte Geschenk. das leinste machte sie zuletzt
MehrUnbestimmte Artikel und Negativartikel. NIVEAU NUMMER SPRACHE Anfänger A1_1023G_DE Deutsch
Unbestimmte Artikel und Negativartikel GRAMMATIK NIVEAU NUMMER SPRACHE Anfänger A1_1023G_DE Deutsch Lernziele Unbestimmte Artikel lernen Negativartikel lernen 2 Ein Mann und eine Frau haben ein Kind. Sie
MehrInhaltsverzeichnis. Abkürzungen... 9 Tipps & Tricks Inhaltsverzeichnis. 1.1 Der bestimmte Artikel Der unbestimmte Artikel...
Inhaltsverzeichnis Inhaltsverzeichnis Abkürzungen... 9 Tipps & Tricks... 10 1 Der Artikel... 17 1.1 Der bestimmte Artikel... 17 1.2 Der unbestimmte Artikel... 19 2 Das Substantiv... 20 2.1 Das Genus...
MehrProseminar Linguistische Annotation
Proseminar Linguistische Annotation Ines Rehbein und Josef Ruppenhofer SS 2010 Ines Rehbein und Josef Ruppenhofer (SS10) Linguistische Annotation April 2010 1 / 22 Seminarplan I. Linguistische Annotation
MehrMorphologie Einleitung. System der deutschen Sprache Morphologie nominale Kategorie: Genus
System der deutschen Sprache nominale Kategorie: Genus Beat Siebenhaar Frank Liedtke Einleitung! Morphem als kleinste bedeutungstragende Einheit! als Lehre von den Morphemen! Agglutination! Flexion! Genus,
MehrSingular oder Plural? Markieren Sie die Substantive (Nomina).
Singular oder Plural? Markieren Sie die Substantive (Nomina). stilepochen der Architektur sehen; z. B. den gotischen Stephansdom, die Attraktion. Im Jahr 2005 haben etwa sieben Millionen Touristen das
MehrDer s-gemtiv Der of-genitiv Üben und Anwenden Der bestimmte Artikel Der unbestimmte Artikel Üben und Anwenden...
1 DAS SUBSTANTIV... 11 Groß- und Kleinschreibung... 11 Das Geschlecht der Substantive...... 12 Plural der Substantive...... 13 Nicht zählbare Substantive...... 15 Substantive, die es nur im Plural gibt.......
MehrUnterrichtsmaterialien in digitaler und in gedruckter Form. Auszug aus: Grammatik einfach praktisch - Englisch (Niveau: A1 - B2)
Unterrichtsmaterialien in digitaler und in gedruckter Form Auszug aus: Grammatik einfach praktisch - Englisch (Niveau: A1 - B2) Das komplette Material finden Sie hier: School-Scout.de Eine moderne und
MehrLangenscheidt Deutsch-Flip Grammatik
Langenscheidt Flip Grammatik Langenscheidt Deutsch-Flip Grammatik 1. Auflage 2008. Broschüren im Ordner. ca. 64 S. Spiralbindung ISBN 978 3 468 34969 0 Format (B x L): 10,5 x 15,1 cm Gewicht: 64 g schnell
MehrAnnotation des Wittgenstein-Korpus mit Wortart-Information
Annotation des Wittgenstein-Korpus mit Wortart-Information Institut für Informations- und Sprachverarbeitung Ludwig-Maximilian-Universität München schmid@cis.uni-muenchen.de Überblick Was ist Wortart-Tagging?
MehrHidden Markov Models. Vorlesung Computerlinguistische Techniken Alexander Koller. 8. Dezember 2014
idden Markov Models Vorlesung omputerlinguistische Techniken Alexander Koller 8. Dezember 04 n-gramm-modelle Ein n-gramm ist ein n-tupel von Wörtern. -Gramme heißen auch Unigramme; -Gramme Bigramme; -Gramme
MehrSprachtechnologie als Grundlage für die maschinelle Auswertung von Texten
Sprachtechnologie als Grundlage für die maschinelle Auswertung von Texten Dr-Ing Michael Piotrowski Leibniz-Institut für Europäische Geschichte @true_mxp Bamberg, 20 November 2015
MehrAuf einen Blick. Einführung Teil I: Toma la Palabra Erste Wörter Teil II: Viel Zeit für Aktivitäten Modi und Zeiten...
Auf einen Blick Einführung... 19 Teil I: Toma la Palabra Erste Wörter... 21 Kapitel 1: Bestimmte und unbestimmte Artikel... 23 Kapitel 2: Nomen und Pronomen... 35 Kapitel 3: Etwas beschreiben Adjektive
MehrSyntaktische Annotationen. Korpuslinguistik Dr. Heike Zinsmeister
Syntaktische Annotationen Korpuslinguistik Dr. Heike Zinsmeister 18.11.2011 Syntax Gestern war mir, wie vielen europäischen Abgeordneten, die Teilnahme unmöglich, da der Flug von Air France, mit dem wir
MehrDie konjunktierbare Wortart: Verben
Die konjunktierbare Wortart: Verben Vollverben: volle Semantik Hilfsverben (Auxiliarverben): helfen dem Vollverb dabei, bestimmte Tempusformen (Perfekt, Plusquamperfekt, Futur I und II), den Konjunktiv
MehrEinführung Konzepte und Begriffe Ähnliche Projekte Arbeiten mit WordNet
Randy Witte http://wordnet.princeton.edu/ http://www.linguistik.uni-erlangen.de SemNet.pdf http://en.wikipedia.org/wiki/wordnet http://www.globalwordnet.org/ Einführung Konzepte und Begriffe Ähnliche Projekte
Mehr6. Klasse. Grammatik. Deutsch. Grammatik. in 15 Minuten
Grammatik 6. Klasse Deutsch Grammatik in 15 Minuten Klasse So übst du mit diesem Buch Im Inhaltsverzeichnis findest du alle für deine Klassenstufe wichtigen Themengebiete. Du hast zwei Möglichkeiten: 1.
Mehr7. Klasse. Grammatik. Deutsch. Grammatik. in 15 Minuten
Grammatik 7. Klasse Deutsch Grammatik in 5 Minuten Klasse Duden Deutsch in 5 Minuten Grammatik 7. Klasse 2., aktualisierte Auflage Dudenverlag Mannheim Zürich Inhalt Wortarten und Wortbildung Flektierbare
MehrBayDat Die bayerische Dialektdatenbank Abschlussbericht
2. Kongress der Internationalen Gesellschaft für f r Dialektologie des Deutschen Wien, 20. 23. September 2006 Ralf Zimmermann, Würzburg Abschlussbericht Folie 1 Gliederung Folie 2 1.Linguistische Auszeichnung
MehrDie Corpus Workbench und ihre Syntax. Blockseminar Einführung in die Korpuslinguistik Seminarleitung: Yvonne Krämer, M.A.
Die Corpus Workbench und ihre Syntax Blockseminar Einführung in die Korpuslinguistik Seminarleitung: Yvonne Krämer, M.A. Die IMS Open Corpus Workbench (CWB) Mächtige Konkordanz- und Korpusanalyse-Software
MehrNutzungshinweise zu den Lemmalisten für das Teilkorpus DEU_L1_EV. September 2015 David Stoppel, Franziska Wallner
Nutzungshinweise zu den Lemmalisten für das Teilkorpus DEU_L1_EV September 2015 David Stoppel, Franziska Wallner Einleitung Die Lemmalisten liefern Häufigkeitsangaben für Wörter der deutschen gesprochenen
MehrDie Wortarten. Die Duden-Grammatik (2. Aufl. 1966, S ) unterscheidet sechs Wortarten:
Die Wortarten Der gesamte Wortschatz (Wortbestand) einer Sprache gliedert sich in Wortarten (Wortklassen). Dieser Gliederung liegen im Prinzip drei Kriterien zu Grunde: 1) morphologisches Kriterium 2)
Mehr