Computerlexikographie-Tutorium 09.05.2008 Themen für heute: Teil I: Aufbau der Wörterbücher Mikrostruktur Rey-Debove Herbert Ernst Wiegand Beispiele Teil II: Mikrostrukturprogramme in Online-Lexika elexiko DWDS Wortschatz
Teil I: Aufbau der Wörterbücher Aufbau der Wörterbücher: Makrostruktur Mikrostruktur Verweisstruktur / Mesostruktur / Mediostruktur + Umtexte (z.b. Vorwort, Benutzerhinweise, Wörterbuchgrammatik,...) Ordnungsstruktur Erwünschte Eigenschaften: Konsistenz Benutzerfreundlichkeit standardisierte Strukturierung (in elektronischen Wörterbüchern) 2
Ordnungsstruktur: Verweisstruktur Verweisstruktur = Mesostruktur = Mediostruktur Verweis = Verweisursprung + Verweisziel + Verweissymbol Verweistypen: grammatisch buk 1backen inhaltlich Anion Ion potentiell tektonisch: die Tektonik betreffend zirkulär andere Wenn ein Verweis zu Lemma A auf ein Lemma B zeigt, das wiederum einen Verweis auf Lemma A enthält. Unterschiedliche Verweissymbole (z.b.):,, s., vgl., a. Wichtig: Konsistenz das Verweisziel muss vorhanden sein! 3
Ordnungsstruktur: Mikro- und Makrostruktur Die Beziehung zwischen der Mikro- und Makrostruktur nach Hausmann (Wiegand 1989a: 422): 4
Ordnungsstruktur: Makrostruktur eine geordnete Menge von Wörterbucheinträgen / Lemmata Die Lemmata können nach verschiedenen Prinzipien geordnet werden, z.b.: alphabetisch: strikt alphabetisch: glattalphabetisch, nischenalphabetisch nicht strikt alphabetisch: nestalphabetisch konzeptuell: z.b. Thesauri Zusammenfassung mit Beispielen: Andreas Rothenhöfer & Boris Körkel (1999): Theorie der Wörterbuchform: Makrostrukturen: http://de.geocities.com/boriskoerkelweb/studies/lexiko/makro1.html Lemma: die kanonische Form / Grundform eines Wortes Teil sowohl der Makro- als auch der Mikrostruktur stellt die wesentliche Zugriffsstruktur auf die Elemente dar 5
Ordnungsstruktur: Makrostruktur Beispiele für die verschiedenen alphabetischen Gliederungsmöglichkeiten (Engelberg & Lemnitzer 2001: 127): 6
Ordnungsstruktur: Mikrostruktur Mikrostruktur: Die zu jedem Lemma verzeichnete strukturierte Information, also: Binnengliederung eines Wörterbucheintrages zu einem konkreten Stichwort konkrete Mikrostruktur abstrakten Stichwort abstrakte Mikrostruktur Die Anzahl der Informationsklassen sowie die Menge der Ordnungsrelationen, in denen die Infromationsklassen des Wörterbuchartikeltyps stehen, der allen Wörterbuchartikel(exemplaren) eines Wörterbuchs zugrunde liegt. (Wiegand 1989a: 422) Theorien über die Mikrostruktur: Josette Rey-Debove: lineare Mikrostruktur mit linguistischem Informationsprogramm Herbert Ernst Wiegand: hierarchische Mikrostruktur: Basisstruktur: WA = FK + SK Angabetypen sind Trägermengen der Mikrostruktur 7
Mikrostruktur bei Rey-Debove Linear geordnete Struktur des Wörterbuchartikels hinter dem Lemma (Bei Wiegand und bei Hausmann ist das Lemma Teil der Mikrostruktur, bei Rey-Debove nicht!), die durch ein lexikographisches Informationsprogramm fest angegeben wird. Lexikographisches Informationsprogramm: die abstrakte lineare Mikrostruktur, die für jede Angabe eine feste Position vorsieht. Für Angaben, die im konkreten Wörterbuchartikel fehlen, werden Nullangaben / Nullinformationen angenommen. Informationskern eines Wörterbuches: die kleinste abstrakte lineare Mikrostruktur: Wortartenangabe < Bedeutungsangabe Bei mehrdeutigen Lemmazeichen werden mehrere Teilstrukturen innerhalb der Hauptstruktur angenommen. Das Analyseergebnis ist auch linear lesbar (parallel zum eigentlichen Wörterbucheintrag). 8
Mikrostruktur bei Rey-Debove Beispiel für ein Informationsprogramm: x < y heißt: x geht y voran; n ist die Anzahl der Lesarten (A < B < C < D) < (E < F < G < H)n-mal A:Genusangabe < B:Deklinationsangabe < C:Aussrapcheangabe < D:Abkürzungsangabe < E:pragmatische Angabe < F:Bedeutungsangabe < G:Kompositagruppenangabe < H:Phrasemangabe Burg, die: -, -en; [bqrk] 1 befestigter Wohn- und Verteidigungsbau mittelalterlicher Feudalherren; Flieh~, Ritter~, Stamm~ ; 2 Wall aus Sand, vor allem um den Strandkorb; Sand~ ; 3 Jägerspr. Bau der Biber; Biber~. 9
Mikrostruktur bei Rey-Debove Beispiel für ein Informationsprogramm: x < y heißt: x geht y voran; n ist die Anzahl der Lesarten (A < B < C < D) < (E < F < G < H)n-mal A:Genusangabe < B:Deklinationsangabe < C:Aussrapchenangabe < D:Abkürzungsangabe < E:pragmatische Angabe < F:Bedeutungsangabe < G:Kompositagruppenangabe < H:Phrasemangabe A B C D:Ø Burg, die: -, -en; [bqrk] 1 befestigter Wohn- und Verteidigungsbau mittelalterlicher Feudalherren; Flieh~, Ritter~, Stamm~ ; 2 Wall aus Sand, vor allem um den Strandkorb; Sand~ ; 3 Jägerspr. Bau der Biber; Biber~. 10
Mikrostruktur bei Rey-Debove Beispiel für ein Informationsprogramm: x < y heißt: x geht y voran; n ist die Anzahl der Lesarten (A < B < C < D) < (E < F < G < H)n-mal A:Genusangabe < B:Deklinationsangabe < C:Aussrapchenangabe < D:Abkürzungsangabe < E:pragmatische Angabe < F:Bedeutungsangabe < G:Kompositagruppenangabe < H:Phrasemangabe A B C D:Ø E:Ø F G H:Ø Burg, die: -, -en; [bqrk] 1 befestigter Wohn- und Verteidigungsbau mittelalterlicher Feudalherren; Flieh~, Ritter~, Stamm~ ; 2 Wall aus Sand, vor allem um den Strandkorb; Sand~ ; 3 Jägerspr. Bau der Biber; Biber~. 11
Mikrostruktur bei Rey-Debove Beispiel für ein Informationsprogramm: x < y heißt: x geht y voran; n ist die Anzahl der Lesarten (A < B < C < D) < (E < F < G < H)n-mal A:Genusangabe < B:Deklinationsangabe < C:Aussrapchenangabe < D:Abkürzungsangabe < E:pragmatische Angabe < F:Bedeutungsangabe < G:Kompositagruppenangabe < H:Phrasemangabe A B C D:Ø E:Ø F G H:Ø E:Ø F Burg, die: -, -en; [bqrk] 1 befestigter Wohn- und Verteidigungsbau mittelalterlicher Feudalherren; Flieh~, Ritter~, Stamm~ ; 2 Wall aus Sand, vor allem um den Strandkorb; Sand~ ; 3 Jägerspr. Bau der Biber; Biber~. G H:Ø 12
Mikrostruktur bei Rey-Debove Beispiel für ein Informationsprogramm: x < y heißt: x geht y voran; n ist die Anzahl der Lesarten (A < B < C < D) < (E < F < G < H)n-mal A:Genusangabe < B:Deklinationsangabe < C:Aussrapchenangabe < D:Abkürzungsangabe < E:pragmatische Angabe < F:Bedeutungsangabe < G:Kompositagruppenangabe < H:Phrasemangabe A B C D:Ø E:Ø F G H:Ø E:Ø F Burg, die: -, -en; [bqrk] 1 befestigter Wohn- und Verteidigungsbau mittelalterlicher Feudalherren; Flieh~, Ritter~, Stamm~ ; 2 Wall aus Sand, vor allem um den Strandkorb; Sand~ ; 3 Jägerspr. Bau der Biber; Biber~. G H:Ø E F G H:Ø 13
Mikrostruktur bei Wiegand Ein Wörterbuchartikel kann als einen Text angesehen werden. Er besteht aus Textsegmenten. Lexikographische Textsegmente sind: nichtfunktionale Textsegmente (für uns nicht wichtig) funktionale Textsegmente: Ein Teil (Segment) des Wörterbuchartikels, der aus einer Form + mind. einem Zweck besteht. Der Zweck ist die Funktion des Segmentes. funktionale Textsegmente: Angaben: liefern lexikographische Informationen über den Wörterbuchgegenstand oder über die Wörterbuchform. Strukturanzeiger: liefern lexikographische Informationen über die Wörterbuchform. Sie unterstützen den Benutzer, die gesuchte Informationen (schneller) zu finden. typographisch (Suprasegmente wie Fettdruck oder Kursiv) nichttypographisch (zusätzliche Zeichen wie (), [],, ;, :; ) 14
Lexikogr. Textsegmente Lexikographische Textsegmente (Wiegand 1989a: 433) Wiegand spricht von insgesamt mehr als 200 Angaben. 15
(Wiegand 1989a: 433) Text 16
Angaben sprachlich (mit Zeichen eines Schriftsystems ~ Buchstaben) vs. nichtsprachlich (Illustrationen, pragmatische Angaben wie ) linguistisch (über sprachliche Einheiten) vs. enzyklopädisch (über nichtsprachliche Gegenstände) implizit (z.b. Singularbildungsangabe: - ; Platzhaltersymbole wie ~ ) vs. explizit (z.b. Genusangabe: die ) standardisiert vs. nichtstandardisiert obligatorisch optional nicht zulässig 17
Linguistische Angaben (Wiegand 1989a: 433) 18
Linguistische Angaben Eine feinere Aufteilung (Wiegand 1989b: 468) 19
20
Mikrostruktur bei Wiegand Die Mikrostruktur ist hierarchisch aufgebaut: Die Angaben und Strukturanzeiger werden in einer Teil-Ganzes-Beziehung geordnet. Darstellung als Strukturgraph, der i.d.r. partitiv ist, d.h. seine Endknoten sind nicht linear geordnet. Basisstruktur: Wörterbuchartikel (WA) = Formkommentar (FK) + semantischer Kommentar (SK) (Wiegand 1989a: 436) 21
Abstrakte Mikrostruktur Die Mikrostruktur kann konkret realisiert werden oder abstrakt vorliegen. SSK = Semantischer Subkommentar (für jeweils eine Lesart) (Wiegand 1989a: 453) 22
Abstrakte und konkrete Mikrostruktur Die abstrakte Struktur kann zu einer konkreten ergänzt werden (Wiegand 1989a: 454). 23
Beispiel: famos Wie sieht die Mikrostruktur dieses Wörterbuchartikels aus? (Engelberg & Lemnitzer 2001: 139) 24
25
Beispiel: Burg (Wiegand 1989a: 437) 26
Burg linear + hierarchisch StA.TZ = Strukturangabe: Trennzeichen 27
Beispiel: Generator (Wiegand 1989b: 483) 28
Generator Semantischer Kommentar: 29
Teil II: Anwendungen elexiko DWDS Wortschatz 30
Lexikographische Informationssysteme Kriterien: Korrektheit Aktualität dynamische Bereicherung angemessene Aquisitionsstrategie manuell erstellt aus Korpora (halb)automatisch gewonnen aus anderen lexikalischen Ressourcen gewonnen Beispiele: DWDS elexiko wortschatz 31
DWDS http://www.dwds.de/ Wörterbuch der Deutschen Gegenwartssprache (bis 1977) digitalisiert dieser Teil nicht mehr aktuell. Verfügt über kein eigenständiges Informationsprogramm. Zusatzdienste: automatisch extrahierte Angaben aus verschiedenen Korpora (nicht lesartenbezogen): Textbeispiele Kollokationen lexikalisch-semantische Relationen 32
elexiko http://hypermedia.ids-mannheim.de/pls/elexiko/p4_start.portal Entwickler: IDS-Mannheim Ein Teil wird von Hand erstellt und verifiziert. Elementare Einheit: lexical unit = Form-Bedeutung-Einheit (Cruse) Strategien zur Lemmabearbeitung: horizontal: minimale Angabenmenge erstellt vertikal: das ganze Informationsprogramm erstellt Mehrschichtige Architektur: Datenspeicherungsebene: Datenbankmanagementsystem ORACLE konzeptuelle Ebene: abstrakte Mikrostrukturen (DTD, XML): modularer + hierarchischer Aufbau Präsentationsebene: Konkrete Mikrostrukturen werden dynamisch erzeugt. Hyptertextsystem: Verlinkte Struktur zur Erschließung der benötigten Informationen. 33
Wortschatz http://wortschatz.uni-leipzig.de/ Wörter des Tages Wortschatzportal: Search in 23 Corpus-Based Monolingual Dictionaries statistisch berechnete Ergebnisse grammatische und lexikalisch-semantische Relationen Kookkurrenzen Kollokationsgraph Wörterbuch: Deutsch Englisch 34
Quellen Engelberg, Stefan & Lothar Lemnitzer (2001): Lexikographie und Wörterbuchbenutzung. Tübingen : Stauffenburg. (= Stauffenburg Einführungen, Bd. 14). Götz, Dieter, Günther Haensch & Hans Wellmann (Hrsg.) (2008): Langenscheidt: Großwörterbuch Deutsch als Fremdsprache. Berlin / München / Wien / Zürich / New York. Langenscheidt. Kunze, Claudia & Lothar Lemnitzer (2007): Einführung in die Computerlexikographie. Tübingen : Narr. Rothenhöfer, Andreas & Boris Körkel (1999): Theorie der Wörterbuchform: Makrostrukturen. Link: http://de.geocities.com/boriskoerkelweb/studies/lexiko/makro1.html (Stand: 08.05.2008, 23:47) Wiegand, Herbert Ernst (1989a): Der Begriff der Mikrostruktur: Geschichte, Probleme, Perspektiven. In: Hausmann, Franz Josef, Oskar Reichmann, Herbert Ernst Wiegand & Ladislav Zgusta (Hrsg.): Wörterbücher: Ein internationales Handbuch zur Lexikographie. Berlin / New York : de Gruyter. S. 409462. (= Handbücher zur Sprach- und Kommunikationswissenschaft Bd. 5.1). Wiegand, Herbert Ernst (1989b): Arten von Mikrostrukturen im allgemeinen einsprachigen Wörterbuch. In: Hausmann, Franz Josef, Oskar Reichmann, Herbert Ernst Wiegand & Ladislav Zgusta (Hrsg.): Wörterbücher: Ein internationales Handbuch zur Lexikographie. Berlin / New York : de Gruyter. S. 462501. (= Handbücher zur Sprach- und Kommunikationswissenschaft Bd. 5.1). 35