Referenzkorpus Altdeutsch

Ähnliche Dokumente
Referenzkorpus Altdeutsch

Stichwortverzeichnis. Anhang. Bedingungssatz siehe Konditionalsatz Befehlsform

Korpuslinguistik Annis 3 -Korpussuchtool Suchen in tief annotierten Korpora


Tagger for German. Online BRILL-Tagger für das Deutsche

Vertiefung der Grundlagen der Computerlinguistik. Semesterüberblick und Einführung zur Dependenz. Robert Zangenfeind

Unterrichtsmaterialien in digitaler und in gedruckter Form. Auszug aus: Schulgrammatik Deutsch. Das komplette Material finden Sie hier:

Einführung in die Computerlinguistik. Morphologie II

Morphologische Merkmale. Merkmale Merkmale in der Linguistik Merkmale in der Morpholgie Morphologische Typologie Morphologische Modelle

UBUNGS- GRAMMATIK DEUTSCH

Linguistische Grundlagen. Warum Tagging? Klassische Wortartenlehre Tagsets Annotation höherer Ebenen Design von Tagsets

Barbara Kunzmann-Müller. ^Grammatikhandbuch des Kroatischen

Inhaltsverzeichnis. Abkürzungen... 9 Niveaustufentests Tipps & Tricks Auf einen Blick Auf einen Blick Inhaltsverzeichnis

Hinweise zur flexionsmorphologischen Glossierung

Deutsch Grammatik Sekundarstufe 1 Die 5 Wortarten

Korpuslinguistik Annis 3 -Korpussuchtool Suchen in tief annotierten Korpora

GRUNDLAGEN DEUTSCH ALS FREMD- UND ZWEITSPRACHE. Herausgegeben von Christian Fandrych, Marina Foschi Albert, Karen Schramm und Maria Thurmair

Unterrichtsmaterialien in digitaler und in gedruckter Form. Auszug aus: Das Grammatikfundament: Wortarten. Das komplette Material finden Sie hier:

I N H A L T S V E R Z E I C H N I S

Einleitung 3. s Die unpersönlichen Sätze 14 Übungen Die bejahenden und die verneinenden Sätze 17 Übungen 20

Iwona Luz DEUTSCHE GRAMMATIK DEUTSCH ALS FREMDSPRACHE ZUM LERNEN, ÜBEN, LEHREN UND NACHSCHLAGEN. Verlag MARE BALTICUM

Grundwissen: Formale Sprachbetrachtung (Unterstufenpensum)

Grammatikbingo Anleitung

Korpuslinguistik Annis 2 -Korpussuchtool Suchen in Falko

Schulgrammatik extra. Deutsch. 5. bis 10. Klasse. Grammatik und Rechtschreibung. Aufsatz und Textanalyse. Umgang mit Medien.

ABKÜRZUNGEN UND SYMBOLE 14 DIE EINZELNEN WORTKLASSEN 15

LATEINISCHE GRAMMATIK

Deutsche Grammatik WS 14/15. Kerstin Schwabe

Probeklausur Syntax-Übung MA Linguistik

DWDS: Hilfe Kurzübersicht

LEITFADEN DER DEUTSCHEN GRAMMATIK

Wort. nicht flektierbar. flektierbar. nach Person, Numerus, Modus, Tempus, Genus verbi flektiert. nach Genus, Kasus, Numerus flektiert

Wissen fürs. Deutsch Englisch Mathematik 7./8. Klasse

1 Das Lernen der norwegischen Sprache Begrifflichkeit... 11

/.'"/ / Wilhelm K. Jude. Deutsche Grammatik. Neufassung Rainer F. Schönhaar A des FüfSisntü-.s Li;;;:iU)iisij:n Vaduz.

GERHARD HELBIG JOACHIM BUSCHA. Deutsche Grammatik. Ein Handbuch für den Ausländerunterricht. VERLAG ENZYKLOPÄDIE LANGENSCHEIDT Leipzig Berlin München

1 Das Lernen der schwedischen Sprache Begrifflichkeit... 11

LEITFADEN DER DEUTSCHEN GRAMMATIK

Verzeichnis grundlegender grammatischer Fachausdrücke Vorbemerkung*

Wortarten-Tagging (auch Part-of-Speech(PoS)-Tagging) Ein erster Schritt zur syntaktischen Annotation

Nutzungshinweise zu den Lemmalisten für das Teilkorpus DEU_L1_EV. September 2015 David Stoppel, Franziska Wallner

Morphologie, Lemmatisierung und Wortartenklassifikationen. Lexikonaufbau und Morphologie-Analyseverfahren Gerold Schneider, SS 2005

D5 WA D5 WA D5 WA D5 WA

Status quo. Wortbildungslehre, Formenlehre. Wortbildung. Wortbildung(slehre)

Wortarten Merkblatt. Veränderbare Wortarten Unveränderbare Wortarten

Gymbasis Deutsch: Grammatik Wortarten Verb: Bestimmung der infiniten Verben Lösung 1 Lösungsansätze Bestimmung der infiniten Verben

Inhalt.

Ivana Daskalovska. Willkommen zur Übung Einführung in die Computerlinguistik. Morphologie. Sarah Bosch,

Modul 4: Automatische Korpusannotation mit computerlinguistischen Werkzeugen: Bestimmung von Wortarten und Grundformen

Grammatische Terminologie

Flexion. Grundkurs Germanistische Linguistik (Plenum) Judith Berman Derivationsmorphem vs. Flexionsmorphem

Wortarten Merkblatt. Veränderbare Wortarten Unveränderbare Wortarten

Deutsche Grammatik Grundfragen und Abriß

Das Flexionssystem des Deutschen: Allgemeines

Aufgabe 3 (Wortmeldung erforderlich) Nennen Sie in hierarchischer Anordnung vom Großen zum Kleinen fünf grammatische Beschreibungsebenen der Sprache.

Morphologie, Lemmatisierung und Wortartenklassifikationen

Inhalt. Einleitung. Wortarten 1

Übungsblätter. Schulgrammatik extra. Deutsch. 5. bis 10. Klasse. Kopiervorlagen zum Üben und Wiederholen von Grammatik

Sprachsynthese: Part-of-Speech-Tagging

Lexikoneinträge. Aufbau und Erstellung eines Lexikoneintrages

Erste Hilfe Grammatik

Verzeichnis Grundlegender Grammatischer Fachausdrücke

Syntaktische Funktionen der Nebensätze

1.Auflage Reinhard Laun Zeichnungen und Grafik: Reinhard Laun. Verlag: Tradition GmbH, Hamburg Printed in Germany

Wortarten und -formen 11

Swantje Westpfahl & Thomas Schmidt POS für(s) FOLK

Verzeichnis grundlegender grammatischer Fachausdrücke

KASUS NUMERUS GENUS DEKLIN. MUSTER/PARA. -en Gen (Sg) Schw 10 / 26

Inhaltsverzeichnis. Prokosch, Erich ZusÃ?tze zum Supplement zu den Osmanischen Grammatiken (GLM 18) digitalisiert durch: IDS Basel Bern

Langenscheidt Deutsch-Flip Grammatik

Unterrichtsmaterialien in digitaler und in gedruckter Form. Auszug aus: Lerntheke: Sportlich, sportlich - Wortarten und Satzglieder trainieren

Deutsch Diachron Digital Tagset (DDDTS)

Unterrichtsmaterialien in digitaler und in gedruckter Form. Auszug aus: Deutsch - ABER HALLO! Grammatikübungen Mittel- und Oberstufe

Inhalt. Vorwort. Fortsetzung siehe nächste Seite

Lösungsvorschlag für das Übungsblatt 8. Aufgabe1.

Phonetische Lexika Part-of-Speech Tagging. Uwe D. Reichel IPSK, LMU München

Inhaltsverzeichnis. Vorwort 11 Aus der Lautlehre 13

(2) Die für Schüler schwer nachvollziehbare Aufgabenstellung des vergangenen Schuljahres aus dem Schulbuch, die die Lehrer damals ausgewählt hatten,

7. Klasse. Grammatik. Deutsch. Grammatik. in 15 Minuten


KAPITEL I EINLEITUNG

Unterrichtsmaterialien in digitaler und in gedruckter Form. Auszug aus: Kurzgrammatik Deutsch (Niveau: A1 - B1)

7. Klasse. Grammatik. Deutsch. Grammatik. in 15 Minuten

Sing Nf. Unb Gen Unb Def. Mask. Nom ich 1 Nom wir 1 Nom man 1 Gen meiner 1 Gen unser 1 Dat mir 1 Dat uns 1 Akk mich 1 Akk uns 1 ICH WP WIR MAN WP

Modulabschlussklausur Einführung in das Studium der Sprachwissenschaft

Basic Verbs 10 sein haben werden 10 ich bin, ich habe, ich werde können dürfen müssen 12 ich kann, ich muss, ich darf,

Einführung in die Grammatik der deutschen Gegenwartssprache

3. Schulkonzept. Empfohlener Stundenumfang

Russische Grammatik Ein Leitfaden

Inhalt. Verben: a-konjugation und esse (3. Person Präsens) 13 Subjekt und Prädikat 14. Subjekt im Prädikat 14. Akkusativ als Objekt 19

Inhalt. Inhalt. Vorwort vii. Abkürzungsverzeichnis xv. Tabellen- und Abbildungsverzeichnis xvii. Einleitung 1

Der s-genitiv 23 Der o/-genitiv 24 Uben und Anwenden 25. Der bestimmte Artikel 28 Der unbestimmte Artikel 30 Oben und Anwenden 31.

Inhaltsverzeichnis. Sexta. Erste Abteilung. n. Laut- und Wortbildungslehre. I. Grundbegriffe aus der Wort- und Satzlehre. III. Wortformev lehre.

Blockseminar Einführung in die Korpuslinguistik Seminarleitung: Yvonne Krämer, M.A. Das Korpus. und seine Aufbereitung

Schulcurriculum Gymnasium Korntal-Münchingen

Auswertung der Leistung von zwei frei zugänglichen POS-Taggern für die Annotation von Korpora des gesprochenen Deutsch

Morphologie: Was bisher geschah. Morphologie IV. Morphologie. Überblick. Derivation

Register zu den Syntax-Kursen I.1, I.2, I.3, II.1, II.2 und III

Transkript:

Referenzkorpus Altdeutsch Kurzbeschreibung Sonja Linde www.sprachgeschichte.de/ddd

1 Einleitung Das Referenzkorpus Altdeutsch erfasst und annotiert sämtliche althochdeutschen und altniederdeutschen Texte (ca. 750 1050 u.z.). Nach Abschluss der Arbeiten wird das Korpus etwa 650 000 Wörter umfassen. Das Korpus wird mittels der Datenbank ANNIS 1, die exzellente Recherchemöglichkeiten bietet, der Öffentlichkeit zur Verfügung gestellt. Die althochdeutsche und altniederdeutsche Überlieferung umfasst 5 größere Texte (Isidor, Tatian, Otfrid, Notker und Heliand) und eine Vielzahl an kleineren und kleinsten Textdenkmälern aus verschiedenen Sprachgebieten. Da ein Teil der ahd. Überlieferung einen engen Bezug zu lateinischen Vorlagen aufweist, werden im Korpus auch die parallel überlieferten lateinische Texte und Textpassagen erfasst, vollständig annotiert und mit den ahd. Daten aligniert, um so Vergleiche zwischen der lat. Vorlage und der volkssprachlichen Übersetzung oder Bearbeitung zu ermöglichen. Die Grundlage für das Korpus bilden als Referenztexte die handschriftengetreuesten gedruckten Texteditionen, soweit diese zugänglich sind. Alle Wortformen werden sowohl auf der Wortebene als auch auf der Buchstabenebene aufgenommen, so dass es möglich ist, neben den belegten Wortformen auch nach einzelnen Graphemen zu suchen. Neben den Formen der Editionen werden die Schreibweise der Handschriften ebenso wie einheitlich standardisierte Wortformen in das Korpus aufgenommen. Graphische Besonderheiten wie z.b. Rubrizierung in den Manuskripten, Kursivierung, in den Editionen aufgelöste Diakritika oder Ligaturen werden im Korpus kommentiert. Eine Übersicht über die in das Korpus aufgenommenen Referenztexte findet sich im Anhang. Alle Wortformen sind lemmatisiert. Die Basis für den -Ansatz des Althochdeutschen bildet das Wörterbuch von Splett 1993; die altsächsische tisierung orientiert sich an Sehrt 1966. Die ta sind mit neuhochdeutschen Glossierungen versehen, die jeweils an den Kontext angepasst sind. Die linguistische Annotation umfasst die Wortarten, morphologische Informationen und Angaben zu den Sätzen (siehe 2 4), des Weiteren werden Zeilenumbrüche, Absätze und andere Mittel zur Textgliederung ebenso wie Angaben zu Versgliederung und Reimpositionen, soweit vorhanden, erfasst. 1 ANNIS wurde im Rahmen des SFB 632 Informationsstruktur (Potsdam/Berlin) entwickelt, vgl. http://www.sfb632.uni-potsdam.de/d1/annis/.

Alle in die Datenbank aufgenommenen Texte sind mit Header-Informationen versehen, die die sprach- und literaturwissenschaftlich relevanten Informationen zum jeweiligen Text wie z.b. Entstehungszeit, sprachlicher Raum und Überlieferungskontext enthalten. 2 Tagging der Wortarten Die Annotation der Wortart wird nach dem von den Partnerprojekten Referenzkorpus Altdeutsch und Referenzkorpus Mittelhochdeutsch entwickelten DDDTS (Deutsch Diachron Digital Tagset) vorgenommen. Dieses Tagset schließt sich an das bekannte und gut eingeführte STTS (Stuttgart Tübingen Tagset; Schiller et al. 1999) an und modifiziert dieses für die besonderen Ansprüche der Annotation des historischen Deutschen. Das STTS baut die Zuweisung der einzelnen Wortarten und deren Präzisierungen hierarchisch auf, so dass ein Tag zunächst durch möglichst selbsterklärende Buchstabensequenzen (Schiller et al. 1999:4) die Hauptwortart kennzeichnet und sich dann die Markierungen von möglichen Unterwortarten anschließen. Die Übernahme dieses Vorgehens für DDDTS gewährleistet die klare Kennzeichnung von Hauptwortarten entsprechend STTS, womit die Zusammenführung von STTS-annotierten und DDDTS-annotierten Korpora vor der Perspektive, diachrone Korpora aus den annotiert vorliegenden Materialien zu erstellen, ermöglicht wird. Zum anderen gestattet der Bausatz-artige Aufbau der einzelnen Tags die Modifizierung der Beschreibungen von Unterwortarten, die sich aus den grammatischen Besonderheiten der historischen Texte und unseren Überlegungen ergeben. Jede Wortart einer Wortform wird zweifach nach und nach annotiert. Mit diesem Vorgehen wird zwischen der Zuordnung des s zu einer Hauptwortart und der Verwendung des konkreten s unterschieden. Des Weiteren wird so der oftmals unsicheren lage hinsichtlich der Wortartzugehörigkeit, aber auch möglichen Erscheinungen von Wortklassenwechsel Rechnung getragen. (1) zeigt die Präzisierung der Wortart des s an der PoS-Annotation der belegten Wortform. So ist z.b. in als Adposition [AP] im Lexikon verzeichnet und wird an dieser Textstelle als Präposition [APPR] realisiert. Die ta der Hilfsverben sein, werden und haben werden in DDDTS in Anlehnung an STTS stets als Auxiliare [VA] ge-

kennzeichnet 2. In (1) wird die finite Form von sein als Vollverb verwendet, was durch das entsprechende Tagging abgebildet wird. (1) Tat 88,1 Ist in Hierusalem scáfuuiuuari, the ginemnit ist in ebreiscun Bethsaida ist in Jerusalem Schafweiher PTK:REL genannt ist in Hebräisch Bethesda Es gibt in Jerusalem einen Schafweiher, der auf Hebräisch Bethesda genannt wird AHD Ist in Hierusalem scáfuuiuuari, the ginemnit ist in Jerusalem de ( ) VA AP NE NA $, PTK VV VA VVFIN APPR NE NA $, PTKREL VVPP VAFIN Bestimmte Sprachwandelerscheinungen, deren Reflexe sich in den altdeutschen Daten zeigen, können durch die getrennte Annotation der Wortart des s und der Wortart der belegten Wortform dargestellt werden. So entwickelt sich z.b. im Althochdeutschen die Verwendung der Genitiv-Plural-Form iro des Personalpronomens in der Funktion eines Possessivums, ohne jedoch in das sparadigma des Possessivpronomens integriert zu sein (2). Synchron ist des Weiteren im Altdeutschen wie in (2) bei möglichen Partikelverben oft nicht zweifelsfrei entscheidbar, ob es sich bei den Verbzusätzen um trennbare Verbbestandteile oder um echte Adverben handelt. Bei diesen und weiteren Phänomena wird bei der Kennzeichnung zwischen der Wortart des s und der des s unterschieden. (2) Tat 171,3 Uz fon iro samanungu duont sie iuuuih aus von sie-gen.pl.m Versammlung-DAT.SG.F tun sie euch Sie schließen euch aus ihrer Gemeinde aus (uz-duon heraus-tun = ausschließen, rauswerfen) 2 Dieses Vorgehen mag aus diachroner Perspektive problematisch erscheinen, bringt aber den Vorteil mit sich, dass sinnvolle parallele Suchabfragen in DDDTS- und STTS- annotierten Korpora ermöglicht werden.

AHD Uz fon iro samanungu duont sie iuuuih ADV AP PPER NA VV PPER PPER PTKVZ APPR D NA VVFIN PPER PPER Deutsch Diachron Digital Tagset (DDDTS) 3 Morphologische Annotation Die morphologische Annotation kennzeichnet zum einen die unveränderlichen, dem inhärenten Kategorien wie sklasse und ggf. Genus, zum anderen werden die veränderlichen flexionsmorphologischen Merkmale erfasst. Die Trennung der veränderlichen von den unveränderlichen Werten lässt für letztere die Unterscheidung von und der belegten Wortform ähnlich dem Vorgehen beim PoS-Tagging zu, wodurch schwankende sklassen ebenso wie Genuswechsel erfasst werden können. Bei den adjektivischen en wird auf diese Weise die Realisierung der starken oder schwachen an der belegten Wortform vermerkt. Die Kennzeichnung der morphologischen Werte erfolgt demnach auf drei voneinander unterschiedenen, jeweils einzeln recherchierbaren Ebenen: 1. sklasse und ggf. Genus des s 2. sklasse und ggf. Genus des s 3. smorphologie des s Die folgende Tabelle (3) zeigt die Zuweisung der unveränderlichen Werte nach Wortart jeweils bei - und bei bezug.

(3) Tagging der unveränderlichen morphologischen Kategorien 3 Attribut Wortart PoS-Tag mögliche Werte mögliche Werte sklasse Substantiv NA a, ja, wa, z, o, jo, wo, n, in, er, nd, C Adjektiv ADJ a, ja, wa, o, jo, wo, u a, ja, wa, z, o, jo, wo, n, in, er, nd, C a, ja, wa, o, jo, wo, u, P, n Pronomina D, DW, PI a, o a, o, P, n Numerale CARD a, o, i, irr a, o, i, P, n, irr ADJO a, o a, o, P, n Verb VV, VA, VM wk1a, wk1b, wk2, wk3, st1a, st1b, st2a, st2b, st3a, st3b, st4, st5, st6, red1, red2, prpr, irr wk1a, wk1b, wk2, wk3, st1a, st1b, st1, st2, st2a, st2b, st3a, st3b, st4, st5, st6, red1, red1a, red1b, red2, prpr, irr Genus Substantiv NA Fem, Masc, Neut Fem, Masc, Neut Wenn die Vergabe mehrerer Werte möglich ist, werden alle Möglichkeiten angeführt. Dies ist bei den adjektivischen en mit lemmatischem Bezug immer der Fall, da diese nach dem femininen (o-) oder nach dem maskulinen (a-) Paradigma flektieren können. Bei Substantiven und Verben werden alle für das jeweilige im Wortschatz verzeichneten sklassen annotiert. Für den Bezug auf den werden nur die an der Wortform flexionsmorphologisch realisierten sklassen angeführt. (5) Tat 182, 7 inti mannes sun uuirdit giselit in hant suntigero und Mannes Sohn wird übergeben in Hand sündig-gen.pl.m Und der Menschensohn wird in die Hand der Sünder übergeben 3 Die Werte in den Tabellen (3) und (4) beziehen sich ausschließlich auf das deutsche Tagset, d.h. für die lateinischen Daten werden für die unterschiedlichen Kategorien z.t. abweichende und/oder zusätzliche Werte vergeben.

AHD Inti mannes sun uuirdit geselit in hant suntigero 1 KO NA NA VA VV AP NA ADJ KON NA NA VAFIN VVPP APPR NA ADJS C,a_Masc u,i_masc st3b wk1a u,i_fem a,o a_masc i_masc st3b wk1a i_fem P Tabelle (6) gibt die flexionsmorphologischen Werte, die für eine belegte Wortform vergeben werden können, an. 4 (6) Tagging der veränderlichen morphologischen Kategorien Attribut Wortart PoS-Tag mögliche Werte Numerus Substantiv, Adjektiv, Pronomen, Verb, Numerale NA, NE, NEO; ADJ, ADJN, ADJD, ADJS, ADJO; PI, PIN; DI, DIA, DIN, DIS; D, DN, DS; DW, DWS, DWSREL; VVFIN, VVINFS, VVPS, VVPSS, VVPSD, VVPSA, VVPSN, VVPP, VVPPS, VVPPD, VVPPA, VVPPN, VVIMP, VAFIN, VAIMP, VMFIN; CARD, CARDN, CARDS Sg, Pl, Du Kasus Substantiv, Adjektiv, Pronomen, Numerale, Verb NA, NE, NEO; ADJ, ADJN, ADJD, ADJS, ADJO; PI, PIN; DI, DIA, DIN, DIS; D, DN, DS; DW, DWS, DWSREL; CARD, CARDN, CARDS; VVINFS Nom, Gen, Dat, Acc, Ins 4 Hierbei bestehen zwischen altsächsischen und den althochdeutschen Werten z.t. Unterschiede, so dass nicht alle Werte für beide Sprachen verwendet werden.

Grad Adjektiv, Verb ADJN, ADJD, ADJS, ADJO; VVPS, VVPSS, VVPSD, VVPSA, VVPSN, VVPP, VVPPS, VVPPD, VVPPA, VVPPN Pos, Comp, Sup Deklinationsweise Adjektiv, Pronomen ADJN, ADJD, ADJS, ADJO; D, DS, DN st, sw, 0 Modus Verb VVFIN, VVIMP, VAFIN, VAIMP, VMFIN Ind, Subj, Imp Tempus Verb VVFIN, VAFIN, VMFIN Pres, Past Person Pronomen, Verb D, DS, DN; VVFIN, VAFIN, VMFIN 1, 2, 3 Partizipalflexionsklasse Verb VVPS, VVPSS, VVPSD, VVPSA, VVPSN, VVPP, VVPPS, VVPPD, VVPPA, VVPPN ja, jo, a, o, P, n Die Vergabe der veränderlichen flexionsmorphologischen Werte erfolgt wie beschrieben auf einer zusätzlichen Ebene. (5 ) Tat 182, 7 ( ) AHD mannes sun uuirdit geselit in hant suntigero 2 NA NA VAFIN VVPP AP NA ADJS Sg_Gen Sg_Nom Ind_Pres_Sg_3 Sg_Acc Pos_Masc_Pl_Gen_st Alle drei morphologischen Ebenen können separat durchsucht werden. Es besteht also z.b. die Möglichkeit, über einfache statistische Abfragen zu erfahren, wie häufig ein bestimmtes, in verschiedenen Klassen belegtes ahd. in den overten Kasus welcher Klasse folgt.

4 Annotation der Sätze Für das Referenzkorpus Altdeutsch ist in der ersten Phase keine syntaktische Kommentierung mittels einer Baumbank-Annotation vorgesehen, jedoch werden bestimmte syntaktische Informationen mithilfe eines einfachen, linearen Schemas angeboten, um so z.b. die Suche nach bestimmten Satztypen zu ermöglichen. Jeder Satz wird als Spanne gekennzeichnet, welche mit Werten für z.b. Finitheit, syntaktischer Status oder Semantik des Satzes versehen ist. Die Satzannotation erfolgt mit den in (7) aufgeführten Werten: (7) Tag Ad Adv Att Caus CC CE CF CI Cnc Cnd Cns CP CS Ex Fin I ID Imp Int Loc M Mod O Beschreibung adversative clause, Adversativsatz adverbial clause, Adverbialsatz attributive clause, Attributsatz causal clause, Kausalsatz continued clause, Wiederaufnahme elliptical clause, elliptischer Satz finite clause, finiter Satz infinite clause, infiniter Satz concessive clause, Konzessivsatz conditional clause, Konditionalsatz consecutive clause, Folgesatz participle clause, Partizipalsatz suspended clause, Unterbrechung exclamation, Ausrufesatz final clause, Finalsatz introduction, eingeleiteter Satz dependent interrogative clause, abhängiger Fragesatz imperative clause, Imperativsatz interrogative clause, Fragesatz local clause, Lokalsatz main clause, Hauptsatz modal clause, Modalsatz object clause, Objektsatz

P S Temp U predicative clause, Prädikativsatz subject clause, Subjektsatz temporal clause, Temporalsatz clause unintroduced, uneingeleiteter Satz Die Werte über die syntaktischen Informationen werden stets in der Reihenfolge wie in (8) vergeben: (8) CF CI CP CE CS CC I U M S O Att P Int ID Imp Ex Adv Temp Loc Caus Mod Fin Cnd Cnc Cns Ad Ein eingeleiteter Hauptsatz wie in (5) wird also wie folgt kommentiert: (9) inti mannes sun uuirdit giselit in hant suntigero CF_I_M (10) zeigt die Annotation eines komplexen Satzgefüges mit allen in der Datenbank durchsuchbaren Ebenen. (10) Tat 168, 3 Ih quidu iuuuih friunta uuanta allu thiu ih gihorta ich sage euch-acc Freunde-ACC weil alle-acc.n die-acc.pl.n ich hörte fon minemo fater teta ih iu cundiu von meinem Vater tat ich euch-dat kund-acc.pl.n Ich sage von euch, dass ihr Freunde seid, weil ich Euch alles, was ich von meinem Vater gehört habe, bekannt mache

AHD ih quidu iuuuih friunta, uuanta allu, ich quëdan ir friunt wanta al PPER VV PPER NA $, PPER VVFIN PPER NA $, KO DI $, KOUS DIS $, st5 a,nd_masc a,o st5 a_masc P Sg_Nom_1 Ind_Pres_Sg_1 Pl_Acc_2 Pl_Acc Neut_Pl_Acc_st 2 Satz CF_U_M CF_CS_I_Adv_Caus AHD thiu ih gihorta fon minemo fater dër ich gihōren fona mīn fater 1 2 Satz DD PPER VV AP D NA DDSREL PPER VVFIN APPR D NA wk1a a,o er_masc wk1a P er_masc Neut_Pl_Acc Sg_Nom_1 Ind_Past_Sg_1 Masc_Sg_Dat_st Sg_Dat CF_I_Att

AHD teta ih iu cundiu. tuon ih ir kund 1 2 Satz VV PPER PPER ADJ $. VVFIN PPER PPER ADJD $. irr a,o irr P Ind_Past_Sg_1 Sg_Nom_1 Pl_Dat_2 Pos_Neut_Pl_Acc_st CF_CC_I_Adv_Caus 5 Literatur Schiller, Anne et al. (1999). Guidelines für das Tagging deutscher Textcorpora mit STTS. (Großes und kleines Tagset). http://www.sfb441.uni-tuebingen.de/a5/codii/infostts-en.xhtml Sehrt, Edward H. (1966). Vollständiges Wörterbuch zum Heliand und zur altsächsischen Genesis. Göttingen: Vandenhoeck und Ruprecht. Splett, Jochen (1993). Althochdeutsches Wörterbuch. Berlin: de Gruyter. Anhang: Referenztexte