Computerlexikographie-Tutorium

Ähnliche Dokumente
Kookkurrenzanalyse Einführung

Wörterbuchstrukturen II EBERHARD KARLS UNIVERSITÄT TÜBINGEN. Claudia Kunze. Computational Lexicography

Korpuslinguistik Grundlagen Korpusrecherchemethoden

Das Sichtenkonzept im DWDS- Wortinformationssystem

doi: /

Brauchen wir neue Wörter?Lexikographische Behandlung von Neologismen im Deutschen. p.1

Das Hypertext-Konzept in der Lexikographie

1. Lexikographie: Gegenstand und Teilbereiche

Korpuslinguistik Grundlagen Korpusrecherchemethoden

Daten Methoden Theorien Definitionen & Operationalisierungen

Hausaufgabe. Unterrichtsstunde 1: Wörterbuchtypologie

Universität Hamburg. Institut für Germanistik I Seminar 1b: Wort, Name, Begriff Seminarleiter: Prof. Dr. Walther v. Hahn

BWID 4. Semester

Lexikalische Semantik, Phraseologie und Lexikographie

Bachelorstudiengang Übersetzen 1/6 Kurs Recherchieren 1

ERSTELLUNG EINES ELEKTRONISCHEN FACHWÖRTERBUCHS FÜR DIE LOGISTIK ODER EINE NEUE DIMENSION DER E-FACHLEXIKOGRAPHIE

Computerlinguistische Grundlagen. Jürgen Hermes Sommersemester 17 Sprachliche Informationsverarbeitung Institut für Linguistik Universität zu Köln

Wörterbuch und Übersetzung

Adressierung in der ein- und zweisprachigen. Eine einführende Übersicht über die Forschungs- und Problemlage

Wörterbuchstrukturen II EBERHARD KARLS UNIVERSITÄT TÜBINGEN. Claudia Kunze. Computational Lexicography

4. Makrostrukturen in Printwörterbüchern: Ein Überblick. 1 Zur historischen Entwicklung des Begriffs der Makrostruktur

Computerlexikographie-Tutorium

Adressierung in Printwörterbüchern Präzisierungen und weiterführende Überlegungen

Prof. Dr. Stefan Schierholz WS 18/19 HS: Allgemeinsprachliche Online-Wörterbücher des Deutschen Di , C 203

Eine neue Adressierungsart: Positionsadressierung bei indexikalischen Angaben und funktionalen Angabezusätzen

DISKUSSIONEN WÖRTERBUCH DER ANGLIZISMEN IM HEUTIGEN DEUTSCH

Valenzwörterbuchs deutscher und polnischer Verben

Lexikologie und Lexikographie

ordnet.dk Vernetzung zwischen Wörterbuch und Korpus

Lexikalisch-semantische Analyse von Korpora

Kookkurrenzanalyse Noch einmal: Grundlagen

Perspektiven der automatischen Vernetzung von WDG und DWB-Erstausgabe. Alexander Geyken (DWDS) & Norbert Schrader (DWB)

Simullda. Structured Interlingua MultiLingual Lexical Database Application. Sonja Weber

Einführung in die portugiesische Sprachwissenschaft

Lexikalische Semantik. Was ist ein Wort? Was ist in einem Wort?

Elektronische Korpora in der Lehre Anwendungsbeispiele aus der theoretischen 2 und / 27der. und der Computerlinguistik

WIEGAND, HERBERT ERNST.

Phraseologie. Eine Einfuhrung am Beispiel des Deutschen ERICH SCHMIDT VERLAG. von Harald Burger. 2., überarbeitete Auflage

Lexikographie der deutschen Gegenwartssprache

Semantische Klassifikation von Kollokationen auf Grundlage des DWDS- Wortprofils

Gliederung Gruppe Ausdruck Abschlusspräsentation. Einleitung Vorgehensweise. Einleitung. Einleitung Vorgehensweise. Einleitung Vorgehensweise

Phraseologie. Eine Einführung am Beispiel des Deutschen. von Harald Burger ERICH SCHMIDT VERLAG. 3., neu bearbeitete Auflage

Ressourcen in den GSHS... am Beispiel LEXUS

LEITFADEN FÜR DAS PRÜFUNGSPROJEKT (BA) KOMMENTIERTE ÜBERSETZUNG

Fakultät für Linguistik und Literaturwissenschaft

Angaben, funktionale Angabezusätze, Angabetexte, Angabestrukturen, Strukturanzeiger, Kommentare und mehr. Ein Beitrag zur Theorie der Wörterbuchform

Sprachliches Wissen: mentales Lexikon, grammatisches Wissen. Gedächtnis. Psycholinguistik (2/11; HS 2010/2011) Vilnius, den 14.

DELA Wörterbücher ===========================================================

Phraseologie. Eine Einführung am Beispiel des Deutschen ERICH SCHMIDT VERLAG. von Harald Burger. 3., neu bearbeitete Auflage

Die Konzession als strategisches Sprachspiel

Emprirische Lexikologie

Nichtnatürlich über natürliche Sprache schreiben

Kurs: Lexikographie und Korpora (Gergely Pethő), 6. Sitzung

INHALT Fazit Topik auf der Satzebene Topik auf der globalen Ebene des Textes Fazit 36

Kurze literarische Texte in literaturwissenschaftlicher und linguistischer Perspektive. Lyrik seit den 1990er Jahren

elexiko - ein Online»Wörterbuch«zum Gegenwartsdeutschen

Makro- und mikrostrukturelle Präsentationsprobleme bei Phrasemen in allgemeinen einsprachigen Wörterbüchern. Vorschläge für ihre Lösung

Inhaltsverzeichnis. Verzeichnis der verwendeten Abkürzungen und Symbole...15

NLP Eigenschaften von Text

Wörterbuch zur Lexikographie und Wörterbuchforschung (WLWF): Eine kurze Projektbeschreibung

Lexik der gesprochenen Sprache aus der Sicht des DWDS

Hellmut Riediger Recherchieren: Grundsätze und Grundbegriffe. Online-Wörterbücher und -Lexika

Extraktion guter Belege aus Textkorpora durch Kombination eines regelbasierten Verfahrens mit maschinellem Lernen

Über die Datenakzessivität in Printwörterbüchern. Einblicke in neuere Entwicklungen einer Theorie der Wörterbuchform *

Daten Methoden Theorien Definitionen & Operationalisierungen

Über die Datenakzessivität in Printwörterbüchern. Einblicke in neuere Entwicklungen einer Theorie der Wörterbuchform *

Angewandte Linguistik und Computer

Im Rahmen des Seminars werden einige ausgewählten Aspekte der deutschen Lexikologie behandelt.

Uwe Quasthoff: Wörterbuch der Kollokationen im Deutschen. Berlin, New York: Walter de Gruyter ISBN

Brauchen wir neue Wörter?Neologismen als Problem und Aufgabe von Lexikographie und Computerlinguistik p.1

Computerlexikographie-Tutorium

Hueber Wörterbuch Deutsch als Fremdsprache Basiswissen kompakt

Das Online-Wörterbuch zum Schulddiskurs in OWID

STILISTIK. PhDr. Tamara Bučková, Ph.D. Lehrstuhl für Germanistik an der Päd. Fakultät der Karlsuniversität

Lexikologie der deutschen Gegenwartssprache. Herbstsemester 2011/2012 Assist. Daumantas Katinas

Computergestützte Metalexikographie

Ausgewählte neuartige Komponenten der Wörterbuchform in deutschen und englischen einsprachigen Lernerwörterbüchern

Sprachproduktion: grammatische Enkodierung nach Levelt 1989 bzw. Kempen & Hoenkamp 1987

Argumentstrukturalternanzen Diathesen

Wörterbuchbenutzung: Ergebnisse einer Umfrage bei italienischen DaF-Lernern

Referate. 3. Sitzung: Theorien und Ansätze I (Merkmalanalyse Generatives Lexikon)

Lexika & Zugriff. Marcel Boeing

Optimalitätstheorie. Was ist die Optimalitätstheorie? Universalien

Burkhard Schaeder (Siegen) MEDIOSTRUKTURPROGRAMM ÜBERLEGUNGEN FÜR EIN WÖRTERBUCH DER FACHLEXIKOGRAPHIE

Theoriebedingte Wörterbuchformprobleme. Ein Beitrag zur Wörterbuchkritik und zur Erweiterung der Theorie der Wörterbuchform *

Relationen zwischen Nomen und ihren Assoziationen. Michael Roth

Wolfgang Wildgen. Kognitive Grammatik. Klassische Paradigmen und neue Perspektiven. Walter de Gruyter Berlin New York

Inhalt. Vorwort 11. Epigraf 13

Die Wortbildungsangaben im Online-Wörterbuch und wie Nutzer sie beurteilen eine Umfrage zu elexiko

How To Read A Danish Dictionary

Zum Stand und den Perspektiven der allgemeinsprachlichen Lexikographie mit Deutsch und Slowenisch

Transkript:

Computerlexikographie-Tutorium 09.05.2008 Themen für heute: Teil I: Aufbau der Wörterbücher Mikrostruktur Rey-Debove Herbert Ernst Wiegand Beispiele Teil II: Mikrostrukturprogramme in Online-Lexika elexiko DWDS Wortschatz

Teil I: Aufbau der Wörterbücher Aufbau der Wörterbücher: Makrostruktur Mikrostruktur Verweisstruktur / Mesostruktur / Mediostruktur + Umtexte (z.b. Vorwort, Benutzerhinweise, Wörterbuchgrammatik,...) Ordnungsstruktur Erwünschte Eigenschaften: Konsistenz Benutzerfreundlichkeit standardisierte Strukturierung (in elektronischen Wörterbüchern) 2

Ordnungsstruktur: Verweisstruktur Verweisstruktur = Mesostruktur = Mediostruktur Verweis = Verweisursprung + Verweisziel + Verweissymbol Verweistypen: grammatisch buk 1backen inhaltlich Anion Ion potentiell tektonisch: die Tektonik betreffend zirkulär andere Wenn ein Verweis zu Lemma A auf ein Lemma B zeigt, das wiederum einen Verweis auf Lemma A enthält. Unterschiedliche Verweissymbole (z.b.):,, s., vgl., a. Wichtig: Konsistenz das Verweisziel muss vorhanden sein! 3

Ordnungsstruktur: Mikro- und Makrostruktur Die Beziehung zwischen der Mikro- und Makrostruktur nach Hausmann (Wiegand 1989a: 422): 4

Ordnungsstruktur: Makrostruktur eine geordnete Menge von Wörterbucheinträgen / Lemmata Die Lemmata können nach verschiedenen Prinzipien geordnet werden, z.b.: alphabetisch: strikt alphabetisch: glattalphabetisch, nischenalphabetisch nicht strikt alphabetisch: nestalphabetisch konzeptuell: z.b. Thesauri Zusammenfassung mit Beispielen: Andreas Rothenhöfer & Boris Körkel (1999): Theorie der Wörterbuchform: Makrostrukturen: http://de.geocities.com/boriskoerkelweb/studies/lexiko/makro1.html Lemma: die kanonische Form / Grundform eines Wortes Teil sowohl der Makro- als auch der Mikrostruktur stellt die wesentliche Zugriffsstruktur auf die Elemente dar 5

Ordnungsstruktur: Makrostruktur Beispiele für die verschiedenen alphabetischen Gliederungsmöglichkeiten (Engelberg & Lemnitzer 2001: 127): 6

Ordnungsstruktur: Mikrostruktur Mikrostruktur: Die zu jedem Lemma verzeichnete strukturierte Information, also: Binnengliederung eines Wörterbucheintrages zu einem konkreten Stichwort konkrete Mikrostruktur abstrakten Stichwort abstrakte Mikrostruktur Die Anzahl der Informationsklassen sowie die Menge der Ordnungsrelationen, in denen die Infromationsklassen des Wörterbuchartikeltyps stehen, der allen Wörterbuchartikel(exemplaren) eines Wörterbuchs zugrunde liegt. (Wiegand 1989a: 422) Theorien über die Mikrostruktur: Josette Rey-Debove: lineare Mikrostruktur mit linguistischem Informationsprogramm Herbert Ernst Wiegand: hierarchische Mikrostruktur: Basisstruktur: WA = FK + SK Angabetypen sind Trägermengen der Mikrostruktur 7

Mikrostruktur bei Rey-Debove Linear geordnete Struktur des Wörterbuchartikels hinter dem Lemma (Bei Wiegand und bei Hausmann ist das Lemma Teil der Mikrostruktur, bei Rey-Debove nicht!), die durch ein lexikographisches Informationsprogramm fest angegeben wird. Lexikographisches Informationsprogramm: die abstrakte lineare Mikrostruktur, die für jede Angabe eine feste Position vorsieht. Für Angaben, die im konkreten Wörterbuchartikel fehlen, werden Nullangaben / Nullinformationen angenommen. Informationskern eines Wörterbuches: die kleinste abstrakte lineare Mikrostruktur: Wortartenangabe < Bedeutungsangabe Bei mehrdeutigen Lemmazeichen werden mehrere Teilstrukturen innerhalb der Hauptstruktur angenommen. Das Analyseergebnis ist auch linear lesbar (parallel zum eigentlichen Wörterbucheintrag). 8

Mikrostruktur bei Rey-Debove Beispiel für ein Informationsprogramm: x < y heißt: x geht y voran; n ist die Anzahl der Lesarten (A < B < C < D) < (E < F < G < H)n-mal A:Genusangabe < B:Deklinationsangabe < C:Aussrapcheangabe < D:Abkürzungsangabe < E:pragmatische Angabe < F:Bedeutungsangabe < G:Kompositagruppenangabe < H:Phrasemangabe Burg, die: -, -en; [bqrk] 1 befestigter Wohn- und Verteidigungsbau mittelalterlicher Feudalherren; Flieh~, Ritter~, Stamm~ ; 2 Wall aus Sand, vor allem um den Strandkorb; Sand~ ; 3 Jägerspr. Bau der Biber; Biber~. 9

Mikrostruktur bei Rey-Debove Beispiel für ein Informationsprogramm: x < y heißt: x geht y voran; n ist die Anzahl der Lesarten (A < B < C < D) < (E < F < G < H)n-mal A:Genusangabe < B:Deklinationsangabe < C:Aussrapchenangabe < D:Abkürzungsangabe < E:pragmatische Angabe < F:Bedeutungsangabe < G:Kompositagruppenangabe < H:Phrasemangabe A B C D:Ø Burg, die: -, -en; [bqrk] 1 befestigter Wohn- und Verteidigungsbau mittelalterlicher Feudalherren; Flieh~, Ritter~, Stamm~ ; 2 Wall aus Sand, vor allem um den Strandkorb; Sand~ ; 3 Jägerspr. Bau der Biber; Biber~. 10

Mikrostruktur bei Rey-Debove Beispiel für ein Informationsprogramm: x < y heißt: x geht y voran; n ist die Anzahl der Lesarten (A < B < C < D) < (E < F < G < H)n-mal A:Genusangabe < B:Deklinationsangabe < C:Aussrapchenangabe < D:Abkürzungsangabe < E:pragmatische Angabe < F:Bedeutungsangabe < G:Kompositagruppenangabe < H:Phrasemangabe A B C D:Ø E:Ø F G H:Ø Burg, die: -, -en; [bqrk] 1 befestigter Wohn- und Verteidigungsbau mittelalterlicher Feudalherren; Flieh~, Ritter~, Stamm~ ; 2 Wall aus Sand, vor allem um den Strandkorb; Sand~ ; 3 Jägerspr. Bau der Biber; Biber~. 11

Mikrostruktur bei Rey-Debove Beispiel für ein Informationsprogramm: x < y heißt: x geht y voran; n ist die Anzahl der Lesarten (A < B < C < D) < (E < F < G < H)n-mal A:Genusangabe < B:Deklinationsangabe < C:Aussrapchenangabe < D:Abkürzungsangabe < E:pragmatische Angabe < F:Bedeutungsangabe < G:Kompositagruppenangabe < H:Phrasemangabe A B C D:Ø E:Ø F G H:Ø E:Ø F Burg, die: -, -en; [bqrk] 1 befestigter Wohn- und Verteidigungsbau mittelalterlicher Feudalherren; Flieh~, Ritter~, Stamm~ ; 2 Wall aus Sand, vor allem um den Strandkorb; Sand~ ; 3 Jägerspr. Bau der Biber; Biber~. G H:Ø 12

Mikrostruktur bei Rey-Debove Beispiel für ein Informationsprogramm: x < y heißt: x geht y voran; n ist die Anzahl der Lesarten (A < B < C < D) < (E < F < G < H)n-mal A:Genusangabe < B:Deklinationsangabe < C:Aussrapchenangabe < D:Abkürzungsangabe < E:pragmatische Angabe < F:Bedeutungsangabe < G:Kompositagruppenangabe < H:Phrasemangabe A B C D:Ø E:Ø F G H:Ø E:Ø F Burg, die: -, -en; [bqrk] 1 befestigter Wohn- und Verteidigungsbau mittelalterlicher Feudalherren; Flieh~, Ritter~, Stamm~ ; 2 Wall aus Sand, vor allem um den Strandkorb; Sand~ ; 3 Jägerspr. Bau der Biber; Biber~. G H:Ø E F G H:Ø 13

Mikrostruktur bei Wiegand Ein Wörterbuchartikel kann als einen Text angesehen werden. Er besteht aus Textsegmenten. Lexikographische Textsegmente sind: nichtfunktionale Textsegmente (für uns nicht wichtig) funktionale Textsegmente: Ein Teil (Segment) des Wörterbuchartikels, der aus einer Form + mind. einem Zweck besteht. Der Zweck ist die Funktion des Segmentes. funktionale Textsegmente: Angaben: liefern lexikographische Informationen über den Wörterbuchgegenstand oder über die Wörterbuchform. Strukturanzeiger: liefern lexikographische Informationen über die Wörterbuchform. Sie unterstützen den Benutzer, die gesuchte Informationen (schneller) zu finden. typographisch (Suprasegmente wie Fettdruck oder Kursiv) nichttypographisch (zusätzliche Zeichen wie (), [],, ;, :; ) 14

Lexikogr. Textsegmente Lexikographische Textsegmente (Wiegand 1989a: 433) Wiegand spricht von insgesamt mehr als 200 Angaben. 15

(Wiegand 1989a: 433) Text 16

Angaben sprachlich (mit Zeichen eines Schriftsystems ~ Buchstaben) vs. nichtsprachlich (Illustrationen, pragmatische Angaben wie ) linguistisch (über sprachliche Einheiten) vs. enzyklopädisch (über nichtsprachliche Gegenstände) implizit (z.b. Singularbildungsangabe: - ; Platzhaltersymbole wie ~ ) vs. explizit (z.b. Genusangabe: die ) standardisiert vs. nichtstandardisiert obligatorisch optional nicht zulässig 17

Linguistische Angaben (Wiegand 1989a: 433) 18

Linguistische Angaben Eine feinere Aufteilung (Wiegand 1989b: 468) 19

20

Mikrostruktur bei Wiegand Die Mikrostruktur ist hierarchisch aufgebaut: Die Angaben und Strukturanzeiger werden in einer Teil-Ganzes-Beziehung geordnet. Darstellung als Strukturgraph, der i.d.r. partitiv ist, d.h. seine Endknoten sind nicht linear geordnet. Basisstruktur: Wörterbuchartikel (WA) = Formkommentar (FK) + semantischer Kommentar (SK) (Wiegand 1989a: 436) 21

Abstrakte Mikrostruktur Die Mikrostruktur kann konkret realisiert werden oder abstrakt vorliegen. SSK = Semantischer Subkommentar (für jeweils eine Lesart) (Wiegand 1989a: 453) 22

Abstrakte und konkrete Mikrostruktur Die abstrakte Struktur kann zu einer konkreten ergänzt werden (Wiegand 1989a: 454). 23

Beispiel: famos Wie sieht die Mikrostruktur dieses Wörterbuchartikels aus? (Engelberg & Lemnitzer 2001: 139) 24

25

Beispiel: Burg (Wiegand 1989a: 437) 26

Burg linear + hierarchisch StA.TZ = Strukturangabe: Trennzeichen 27

Beispiel: Generator (Wiegand 1989b: 483) 28

Generator Semantischer Kommentar: 29

Teil II: Anwendungen elexiko DWDS Wortschatz 30

Lexikographische Informationssysteme Kriterien: Korrektheit Aktualität dynamische Bereicherung angemessene Aquisitionsstrategie manuell erstellt aus Korpora (halb)automatisch gewonnen aus anderen lexikalischen Ressourcen gewonnen Beispiele: DWDS elexiko wortschatz 31

DWDS http://www.dwds.de/ Wörterbuch der Deutschen Gegenwartssprache (bis 1977) digitalisiert dieser Teil nicht mehr aktuell. Verfügt über kein eigenständiges Informationsprogramm. Zusatzdienste: automatisch extrahierte Angaben aus verschiedenen Korpora (nicht lesartenbezogen): Textbeispiele Kollokationen lexikalisch-semantische Relationen 32

elexiko http://hypermedia.ids-mannheim.de/pls/elexiko/p4_start.portal Entwickler: IDS-Mannheim Ein Teil wird von Hand erstellt und verifiziert. Elementare Einheit: lexical unit = Form-Bedeutung-Einheit (Cruse) Strategien zur Lemmabearbeitung: horizontal: minimale Angabenmenge erstellt vertikal: das ganze Informationsprogramm erstellt Mehrschichtige Architektur: Datenspeicherungsebene: Datenbankmanagementsystem ORACLE konzeptuelle Ebene: abstrakte Mikrostrukturen (DTD, XML): modularer + hierarchischer Aufbau Präsentationsebene: Konkrete Mikrostrukturen werden dynamisch erzeugt. Hyptertextsystem: Verlinkte Struktur zur Erschließung der benötigten Informationen. 33

Wortschatz http://wortschatz.uni-leipzig.de/ Wörter des Tages Wortschatzportal: Search in 23 Corpus-Based Monolingual Dictionaries statistisch berechnete Ergebnisse grammatische und lexikalisch-semantische Relationen Kookkurrenzen Kollokationsgraph Wörterbuch: Deutsch Englisch 34

Quellen Engelberg, Stefan & Lothar Lemnitzer (2001): Lexikographie und Wörterbuchbenutzung. Tübingen : Stauffenburg. (= Stauffenburg Einführungen, Bd. 14). Götz, Dieter, Günther Haensch & Hans Wellmann (Hrsg.) (2008): Langenscheidt: Großwörterbuch Deutsch als Fremdsprache. Berlin / München / Wien / Zürich / New York. Langenscheidt. Kunze, Claudia & Lothar Lemnitzer (2007): Einführung in die Computerlexikographie. Tübingen : Narr. Rothenhöfer, Andreas & Boris Körkel (1999): Theorie der Wörterbuchform: Makrostrukturen. Link: http://de.geocities.com/boriskoerkelweb/studies/lexiko/makro1.html (Stand: 08.05.2008, 23:47) Wiegand, Herbert Ernst (1989a): Der Begriff der Mikrostruktur: Geschichte, Probleme, Perspektiven. In: Hausmann, Franz Josef, Oskar Reichmann, Herbert Ernst Wiegand & Ladislav Zgusta (Hrsg.): Wörterbücher: Ein internationales Handbuch zur Lexikographie. Berlin / New York : de Gruyter. S. 409462. (= Handbücher zur Sprach- und Kommunikationswissenschaft Bd. 5.1). Wiegand, Herbert Ernst (1989b): Arten von Mikrostrukturen im allgemeinen einsprachigen Wörterbuch. In: Hausmann, Franz Josef, Oskar Reichmann, Herbert Ernst Wiegand & Ladislav Zgusta (Hrsg.): Wörterbücher: Ein internationales Handbuch zur Lexikographie. Berlin / New York : de Gruyter. S. 462501. (= Handbücher zur Sprach- und Kommunikationswissenschaft Bd. 5.1). 35