Practical Grammar Engineering Using HPSG 2.Tag. Frederik Fouvry, Petter Haugereid, Valia Kordoni, Melanie Siegel

Ähnliche Dokumente
Practical Grammar Engineering Using HPSG. Frederik Fouvry, Petter Haugereid, Valia Kordoni, Melanie Siegel

HPSG und Performanzkompatibiltät

Einführung Computerlinguistik. Konstituentensyntax II

Eine formale Beschreibung der Gebärdensprache mit HPSG

Quantoren und Quantifikation


Definition von domänenspezifischen Sprachen mit Xtext: Einführung

Parsing von unifikationsbasierten Grammatikformalismen

Transition Network Parser

Interdisziplinäre fachdidaktische Übung: Modelle für Sprachen in der Informatik. SS 2016: Grossmann, Jenko

16. BEGLEITBLATT. 13 Kapitel : The Structure of the Lexicon Introduction Lexemes

Parsing SystemVerilog 2012

Was machen wir in diesem Kurs? Einführung in die Grammatikentwicklung. Head-Driven Phrase Structure Grammar (Hintergrund)

Grammatiktheorie: Merkmale, Merkmalstrukturen, Unifikation, Unifikationsgrammatiken

Formale Semantik. Anke Assmann Heim & Kratzer 1998, Kap. 3. Universität Leipzig, Institut für Linguistik

Praktikum Softwareanalyse und -transformation

Formale Semantik. Anke Assmann Heim & Kratzer 1998, Kap. 2. Universität Leipzig, Institut für Linguistik

Einführung in die Computerlinguistik. Syntax II

Typengetriebene Interpretation. Arnim von Stechow Einführung in die Semantik

Sprachen sind durch folgenden Aufbau gekennzeichnet:

Eine Erweiterung der kontextfreien Grammatiken: PATR-II

Eine nebenläufige Syntax-Semantik-Schnittstelle für Dependenzgrammatik 1

Ein Fragment von Pascal

Was bisher geschah Klassische Aussagenlogik zur Modellierung von Aussagen Syntax: Formeln

Einstieg in die Informatik mit Java

Kontextfreie Grammatiken

Einstieg in die Informatik mit Java

Vorlesung Programmieren

Einführung Compilergenerierung Bewertung Referenzen. SableCC. Benjamin Daeumlich

Dirk Ammelburger XML. Grundlagen der Sprache und Anwendungen in der Praxis HANSER

Finite-State-Morphologie in XLE. Grammatikentwicklung, SS 2010

Stream EDitor SED und Reguläre Ausdrücke

Probeklausur: Einführung in die formale Grammatiktheorie

Einführung in die Computerlinguistik

Teil 4: Rekursion und Listen

Syntax III. Joost Kremers WS

7. Syntax: Grammatiken, EBNF

Inhalt Kapitel 11: Formale Syntax und Semantik

Merkmalstrukturen. bersicht. Ziel. Beispiele fÿr Merkmalstrukturen Koreferenz, Unifikation Sinn und Zweck Merkmalstrukturen in Prolog: GULP.

MODIFIKATIONEN DES TOMITA-PARSERS FÜR ID/LP UND FEATURE GRAMMARS Jens Woch

LR-Parser, Shift-Reduce-Verfahren

Einführung Computerlinguistik. Konstituentensyntax II

Von der Grammatik zum AST

Gliederung. Algorithmen und Datenstrukturen I. Listen in Haskell: Listen in Haskell: Listen in Haskell. Datentyp Liste Strings Listenkomprehension

Algorithmen und Formale Sprachen

LinGO Linguistic Grammars Online

Aufgabe 1 Basiswissen zur Vorlesung (8 Punkte)

Variablenarten. Gerd Bohlender. Institut für Angewandte und Numerische Mathematik. Vorlesung: Einstieg in die Informatik mit Java

Form und Darstellung von Informationen

GTI. Hannes Diener. 18. Juni. ENC B-0123,

Vorlesung 7: LFG I. Einführung, c- und f-strukturen

Wirtschaftsinformatik (PWIN) 5. Mentorium. Wirtschaftsinformatik (PWIN), SS2010, Professur für Mobile Business & Multilateral Security 1

Zum Kasus der Aktanten

Einführung in die Programmierung

Software Entwicklung 1. Fallstudie: Arithmetische Ausdrücke. Rekursive Klassen. Überblick. Annette Bieniusa / Arnd Poetzsch-Heffter

Formale Sprachen. Inhaltsverzeichnis. M. Jakob. 10. Dezember Allgemeine Einführung. Aufbau formaler Sprachen

Einführung in unifikationsbasierte Grammatikformalismen

Programmierung 1 (Wintersemester 2015/16) Wiederholungstutorium Lösungsblatt 15 (Linearer Speicher, Listen, Bäume)

Methoden zur Interpretation LISPähnlicher. Programmiersprachen. Seminarvortrag / 53 FH AACHEN FACHBEREICH 9 TOBIAS STUMM MATR.-NR.

Semantik. Anke Himmelreich Formale Semantik. Universität Leipzig, Institut für Linguistik 1 / 47

Formale Sprachen. Inhalte. Lehrplan. Hinweis

Interpreter - Gliederung

UNIX Power Tools. Helferlein für den Alltag. Maximilian Haupt

Datenaustausch mit JSON

Martin Schmidt

Graphdurchmusterung, Breiten- und Tiefensuche

Software Entwicklung 1

Fachbeiträge. und System. Syntaxbasierte Satzgenerierung mit PLNLP. 1 PLNLP - Programmiersprache. Zusammenfassung

Dateien und Module. Heute: Ein- und Ausgabe. Module. Programmierkurs Prolog p.1

Konstruktionsgrammatik

Werkzeugunterstützung für UML Profiles. Verteidigung des Großen Belegs Andreas Pleuß

Was ist Wartung und welche vier Arten der Wartung unterscheidet die Norm ISO/IEC 12207? Wie lautet die Regel von Boehm? (ein Beispiel ausrechnen)

Zuerst wird die Bedingung ausgewertet. Ist sie erfüllt, wird der Rumpf des while-statements ausgeführt. Nach Ausführung des Rumpfs wird das gesamte

Logische und funktionale Programmierung

Probabilistische kontextfreie Grammatiken

Aufgabe: Platz-effiziente Kompression von Textdaten

Sprachanalyse. Fachseminar WS 08/09 Dozent: Prof. Dr. Helmut Weber Referentin: Nadia Douiri

Funktionale Programmierung und Typtheorie

Definition von LR(k)-Grammatiken

Featuregrammatiken. Vorlesung Computerlinguistische Techniken Alexander Koller. 21. November 2014

Einführung in die Programmiertechnik

Logische Grundlagen für die Computerlinguistik

Beuth Hochschule Einführende Gentle-Programme WS12/13, S. 1

Übungsblatt 1 - Lösung

EF Semantik: Musterlösung zu Aufgabenblatt 2

Ausgewählte Techniken der Maschinellen Übersetzung. Susanne J. Jekat ZHW Subject: MTZH

Deterministische PDAs

Die Konstruktion von Lexika für die maschinelle syntaktische Analyse

Unterrichtsmaterialien in digitaler und in gedruckter Form. Auszug aus: Formale Sprachen und endliche Automaten - Schülerband

Theoretische Informatik I

LFG- Einführung. Grammatiktheorien. LFG- Einführung (2) Theorie-Architektur. Aufbau der Grammatik. Lexikon

Mehr Listen und noch ein bisschen Arithmetik

Merkmalsstrukturen. Merkmalsstrukturen. Merkmalsstrukturen (MS):

Institut für Programmierung und Reaktive Systeme 7. Mai Programmieren II. 11. Übungsblatt

Phonological Analysis in Typed Feature Systems

LR-Parsing. Präsentation vom 19. Dez Adriana Kosior, Sandra Pyka & Michael Weidauer. Automatische Syntaxanalyse (Parsing) Wintersemester 12/13

DELA Wörterbücher ===========================================================

Semantik und Pragmatik

Formale Methoden 1. Gerhard Jäger 28. November Uni Bielefeld, WS 2007/2008 1/15

Transkript:

Practical Grammar Engineering Using HPSG 2.Tag Frederik Fouvry, Petter Haugereid, Valia Kordoni, Melanie Siegel

Inhalt Matrix Differenzlisten Debugging (Demo, Frederik)

Die LinGO Grammar Matrix Ein Nachteil von präzisen Grammatiken ist, dass der Aufbau aufwändig ist. Die Matrix ist ein Starter Kit, mit dem ein schneller Aufbau gewährleistet werden soll. Sie enthält Hypothesen über crosslinguale Eigenschaften von Sprache.

Einige Hypothesen der Matrix Wörter und Phrasen werden zu größeren Phrasen kombiniert. Die Semantik einer Phrase wird durch die Wörter und ihre Kombination bestimmt. Phrasenstrukturregeln können Semantik hinzufügen. Die meisten Phrasen haben eine identifizierbare Kopftochter. Köpfe bestimmen, welche Arten von Argumenten sie fordern und wie sie mit ihnen semantisch kombiniert werden. Modifikatoren bestimmen, welche Arten von Köpfen sie modifizieren und wie sie mit diesen semantisch kombiniert werden. Keine lexikalische oder syntaktische Regel löscht semantische Information.

Die Dateien in Matrix matrix.tdl irules.tdl lrules.tdl lexicon.tdl rules.tdl my_language.tdl roots.tdl labels.tdl irregs.tab README Version.lsp enthält die Matrix-Typenhierarchie hier kommen Flexionsregeln rein hier kommen lexikalische Regeln rein hier kommen die Lexikoneinträge rein hier kommen die Regeln rein hier kommen die sprachspezifischen Typen rein hier werden die Startsymbole definiert hier bekommen die Knoten im Baum Namen für unregelmäßige Flexionen Information über Matrix-Updates Information über die Matrix-Version

Die Dateien in Matrix lkb/script lkb/user-fns.lsp lkb/globals.lsp lkb/mrsglobals.lisp lkb/mrsmunge.tdl pet.tdl und pet/ Definition der Dateien, die geladen werden Benutzereinstellungen zum Parsen Globale Parameter für die Grammatik Parameter für die Semantikkonstruktion Filter für semantisch leere Zeichen in der Generierung Hier stehen Einstellungen für die effiziente Verarbeitung mit dem PET System

Listen Manche Informationen in den Feature- Strukturen steht in Listen. Wir haben das z.b. schon bei ARGS gesehen: TDL-Notation: ARGS < phrase, phrase > [ FIRST phrase, REST phrase ]

Listen In matrix.tdl: list := avm. cons list 0-1-list cons := list & [ FIRST *top*, REST *top* ]. 0-1-list := list. 1-plus-list 1-list null 1-list := 0-1-list & cons & [ REST null ]. null := 0-1-list. 1-plus-list := cons & [ REST cons ].

Das Problem: Listen sollen zusammengefügt werden Z.B.: Der Mutterknoten soll in ORTH eine Liste der abgearbeiteten Wörter enthalten. ORTH <! the, dog!> ORTH <! the!> ORTH <! dog!>

Problematik der Listenzusammenfügung Das Ergebnis soll möglichst wenig Struktur enthalten, am Besten einfach eine Liste sein. Dazu bräuchte man sowas wie append, aber dazu müsste man wissen, was das Ende der ersten Liste ist. Ein append von Listen mit bekannter Länge ließe sich definieren, aber...

Die Lösung: Differenzlisten *diff-list* LAST 1 *list* FIRST REST a *list* FIRST REST b 1 <! a, b!>

Einer Differenzliste etwas hinzufügen LAST #list #last LAST #list #middle LAST #middle #last

Zum Beispiel <! a,b,c,d,e!> <! a,b,c!> <! d,e!> LAST #1 FIRST a REST FIRST b REST FIRST c REST #1 FIRST d REST FIRST e REST #2 LAST #2

LAST der linken Tochter = der rechten LAST #list #last LAST #list #middle LAST #middle #last

LAST der linken Tochter = der rechten <! a,b,c,d,e!> <! a,b,c!> <! d,e!> LAST #1 FIRST a REST FIRST b REST FIRST c REST #1 FIRST d REST FIRST e REST #2 LAST #2

LAST der linken Tochter = der rechten LAST #1 FIRST a REST FIRST b REST FIRST c REST #1 FIRST d REST FIRST e REST #2 LAST #2 FIRST a REST FIRST b REST FIRST c REST #1 LAST #1 & FIRST d REST FIRST e REST #2

der Mutter = der linken Tochter LAST #list #last LAST #list #middle LAST #middle #last

der Mutter = der linken Tochter M FIRST a REST FIRST b REST FIRST REST c FIRST d REST FIRST e REST #last D1 LAST #1 FIRST a REST FIRST b REST FIRST c REST #1 FIRST d REST FIRST e REST #last

LAST der Mutter = LAST der rechten Tochter M FIRST a REST FIRST b REST FIRST REST c FIRST d REST FIRST e REST #last LAST #last D1 D2 FIRST d REST LAST #last FIRST e REST #last

Literatur und weitere Informationen On-Line User-Manual für LKB: http://www-csli.stanford.edu/~aac/lkb.html Kursmaterialien: http://www.coli.uni-sb.de/~fouvry/grammatikentwicklung Literatur: Copestake, Ann: Implementing Typed Feature Structure Grammars. CSLI Publications, Stanford, CA (2002). Copestake, Ann: The (New) LKB System. Manuscript. CSLI Stanford, Stanford, CA (2000). [http://www-csli.stanford.edu/~aac/lkb.html] Sag, Ivan A., Thomas Wasow, and Emily M. Bender. 2003. Syntactic Theory: A Formal Introduction, 2nd edition. Stanford, CA: CSLI Publications. Fouvry, Frederik and Oepen, Stephan: Introduction to Grammar Engineering Using HPSG. Scandinavian Summer School in Constraint-Based Grammar. Trondheim, Norge (2001). [http://www.coli.uni-sb.de/trondheim01/] LinGO project, CSLI Stanford: http://lingo.stanford.edu