Semantic Role Labeling

Ähnliche Dokumente
The Proposi+on Bank: An Annotated Corpus of Seman+c Roles

Named Entity Recognition (NER)

Thematische Rollen. Randolf Altmeyer Proseminar Lexikalische Semantik WS 05/06 Prof. Pinkal

Lösungsvorschlag für das Übungsblatt 8. Aufgabe1.

Kontextfreie Grammatiken

Ergänzende Betrachtungen zur syntaktischen Dependenz

Funktionale-Grammatik

Lange Abhängigkeiten in Brosziewski-Derivationen

NLP Eigenschaften von Text

Semantik und Pragmatik

Earley Parser. Flutura Mestani

Einführung in die Linguistik, Teil 4

Asciidoctor mal Groovy. Stephan Classen

Ivana Daskalovska. Willkommen zur Übung Einführung in die Computerlinguistik. Syntax. Sarah Bosch,

Ivana Daskalovska. Willkommen zur Übung Einführung in die Computerlinguistik. Semantik. Sarah Bosch,

Syntax natürlicher Sprachen

Grundlagen der LFG. 2. Analysieren Sie jeweils einen der Sätze in (1) und (2), d.h., zeigen Sie, wie die C- und die F-Strukturen aussehen sollten.

Chart-Parsing. bersicht. Ziel. Motivation: Bisher vorgestellte Verfahren sind nicht effizient Grundidee des Chart-Parsing Datenstruktur

Wolfgang Sternefeld Comparing Reference Sets

Slot Grammar Eine Einführung

Syntax und Morphologie

Semantik und Pragmatik

Funktionale-Grammatik

Advanced Computational Semantics Sommersemester 2008, Hauptseminar. Lösung zu Übung 6,

Einführung in die Linguistik, Teil 4

Formale Methoden III - Tutorium

Inhalt. Was ist Dependenzgrammatik? Dependenzgrammatik und Phrasenstrukturgrammatik Maltparser Syntaxnet/Parsey McParseface Übung Quellen

Eine Erweiterung der kontextfreien Grammatiken: PATR-II

Latent Vector Weighting. Word Meaning in Context

LFG-basierter Transfer

Unterrichtsmaterialien in digitaler und in gedruckter Form. Auszug aus: Vertretungsstunde Englisch 5. Klasse: Grammatik

Einführung in unifikationsbasierte Grammatikformalismen

Grammatiktheorie: Merkmale, Merkmalstrukturen, Unifikation, Unifikationsgrammatiken

Koordination in LFG und XLE

R. Montague: ÈEnglish as a Formal LanguageÇ Vortrag von Sascha Brawer á 18. Januar 1995

Dependenz. Ferdinand de Saussure (* )

Charts. Motivation. Grundfrage. Chart als Graph

Semantische Technologien (M-TANI)

Softwaretechnologie für die Ressourcenlinguistik

Generierung & Übersetzung mit XLE

Probabilistische kontextfreie Grammatiken

Parsing mit NLTK. Parsing mit NLTK. Parsing mit NLTK. Parsing mit NLTK. Beispiel: eine kleine kontextfreie Grammatik (cf. [BKL09], Ch. 8.

Automatisches Verstehen gesprochener Sprache

LEXIKALISCH- FUNKTIONALE- GRAMMATIK VON DER K-STRUKTUR ZUR F-STRUKTUR KONTROLLVERBEN ADJUNKTE KOORDINATIONEN

time marker cluster term term URL Link to AEC media

Vorlesung 7: LFG I. Einführung, c- und f-strukturen

Topic Maps. Wissensmanagement in Bildungseinrichtungen. Seminar Web Engineering Lars Heuer,

Compilerbau für die Common Language Run-Time

Der Earley-Algorithmus

LFG- Einführung. Grammatiktheorien. LFG- Einführung (2) Theorie-Architektur. Aufbau der Grammatik. Lexikon

Typengetriebene Interpretation. Arnim von Stechow Einführung in die Semantik

Der Earley-Algorithmus

Universität Potsdam Institut für Informatik Lehrstuhl Maschinelles Lernen. Sprachtechnologie. Tobias Scheffer Paul Prasse Michael Großhans

Syntax natürlicher Sprachen

Combinatory Categorial Grammar. Teil 2: Semantik in der CCG

Einführung in die Computerlinguistik

Relationsextraktion aus Artikelvolltexten der Wikipedia: wiki2rdf und darüber hinaus

2 Theorie der semantischen Typen

DARIAH-DKPro-Wrapper Nils Reimers

Background for Hybrid Processing

Labor Demand. Anastasiya Shamshur

OO Programmiersprache vs relationales Model. DBIS/Dr. Karsten Tolle

a) Erklären Sie, was eine SOV Sprache ist und was eine V2 Sprache ist. b) Welche Wortstellungsmuster sind eher selten in Sprachen der Welt?

Formale Semantik. Anke Assmann Heim & Kratzer 1998, Kap. 3. Universität Leipzig, Institut für Linguistik

TreeTagger. Deborah Watty

Einführung Computerlinguistik. Konstituentensyntax II

The English Tenses Die englischen Zeitformen

Grundlagen der LFG. (1) I danced a dance, I sneezed a sneeze, I laughed a laugh I stumbled a stumble, *I drowned a drown, *I floated a float

WAS IST DER KOMPARATIV: = The comparative

Finding the Sources and Targets of Subjective Expressions

Inaugural-Dissertation. Philosophie

11. Java Klassen. Klassen - Technisch. Klassen - Beispiel: Erdbebendaten. Klassen - Konzeptuell

Semantische Netze Psychologische Plausibilität

Einführung Computerlinguistik. Konstituentensyntax II

Zur Struktur der Verbalphrase

Dockerbank II. Block 2: Komplexbeispiel. Benjamin Baum 1, Christian Bauer 1

English grammar BLOCK F:

Context-adaptation based on Ontologies and Spreading Activation

Syntax natürlicher Sprachen

Faktivität. Referentin: Carolin Reinert. Spracherwerb an der Syntax/Semantik-Schnittstelle (Prof. Dr. Schulz) WS 10/11, 31.

PONS DIE DREI??? FRAGEZEICHEN, ARCTIC ADVENTURE: ENGLISCH LERNEN MIT JUSTUS, PETER UND BOB

Hintergrund und Einführung

Einführung in die Computerlinguistik. Semantik

Improving Part-Of-Speech Tagging for Social Media via Automatic Spelling Error Correction

Syntax und Parsing. OS Einblicke in die Computerlinguistik. Philipp Rabe, 13IN-M

Dependency-Based Construction of Semantic Space Models ( Padó, Lapata 2007) Distributionelle Semantik WS 11/

Final Exam. Friday June 4, 2008, 12:30, Magnus-HS

14. Java Klassen. Klassen (Java) vs. Records (Pascal) Klassen - Konzeptuell. Klassen - Technisch

!! Um!in!ADITION!ein!HTML51Werbemittel!anzulegen,!erstellen!Sie!zunächst!ein!neues! Werbemittel!des!Typs!RichMedia.!!!!!!

Karl Heinz Wagner

Konstituentenstruktur

Interdisziplinäre fachdidaktische Übung: Modelle für Sprachen in der Informatik. SS 2016: Grossmann, Jenko

Einführung in die Computerlinguistik Syntaktische Funktionen & Dependenzen

LPI Update 2013 Neues vom LPI aus erster Hand Teil 1

Inhaltsverzeichnis. Vorwort... 11

2 Grad globale Erwärmung: Was bedeutet das für unser Klima?

Transkript:

Semantic Role Labeling Am Beispiel von EasySRL und SEMAFOR Max Depenbrock Proseminar "Tools für Computerlinguisten" 5.1.2018 Max Depenbrock SRL 5.1.2018 1 / 36

Was ist Semantic Role Labeling? Was ist Semantic Role Labeling? Max Depenbrock SRL 5.1.2018 2 / 36

Was ist Semantic Role Labeling? Semantic Role Labeling Name Abgekürzt SRL Auch Shallow Semantic Parsing genannt Ziel Ereignisse und die daran Beteilgten verstehen Who did what to whom? ARG0 ARG1 Hans liebt Maria Max Depenbrock SRL 5.1.2018 3 / 36

Warum braucht man SRL? Warum braucht man SRL? Max Depenbrock SRL 5.1.2018 4 / 36

Warum braucht man SRL? Warum nicht einfach POS-Tags / Phrasenstruktur? (1) John broke the window NE V DET NN (2) John broke the window with a rock NE V DET NN P DET NN (3) The rock broke the window DET NN V DET NN (4) The window broke DET NN V Max Depenbrock SRL 5.1.2018 5 / 36

Warum braucht man SRL? Warum keine Dependenzbäume? subj obj Hans liebt Maria subj aux prep obj Maria wird von Hans geliebt Grammatische Funktionen nicht eindeutig Max Depenbrock SRL 5.1.2018 6 / 36

Warum braucht man SRL? Warum nicht gleich volles semantisches Parsing? Satz PL-Darstellung Hans liebt Maria lieben (hans, maria ) Maria wird von Hans geliebt lieben (hans, maria ) Maria ist verheiratet x : verheiratet-mit (maria, x) Jeder Mensch hat einen Fehler x : (mensch (x) y : (fehler (y) hat (x, y))) Volles semantisches Parsing zu komplex Max Depenbrock SRL 5.1.2018 7 / 36

SRL-Frameworks SRL-Frameworks Max Depenbrock SRL 5.1.2018 8 / 36

SRL-Frameworks SRL-Frameworks 2 verschiedene Frameworks Proposition Bank (PropBank) FrameNet Max Depenbrock SRL 5.1.2018 9 / 36

SRL-Frameworks PropBank PropBank Inhalt Sätze mit semantischen Rollen Penn TreeBank Aufbau Verben als Ereignisse Verben haben Rollen ARG0 - ARG5 Genaue Semantik der Rollen in Frame-Files definiert ARG0 ARG1 John loves Mary Max Depenbrock SRL 5.1.2018 10 / 36

SRL-Frameworks PropBank Frame-Files agree.01 Arg0: Agreer Arg1: Proposition Arg2: Other entity agreeing ARG1 ARG0 ARG2 John agrees with Mary on everything Max Depenbrock SRL 5.1.2018 11 / 36

SRL-Frameworks PropBank ArgMs Nicht-nummerierte Adjunkte ArgM-TMP: wann? ArgM-LOC: wo? ArgM-MNR: wie? ArgM-TMP ARG0 ARG2 ARG1 Usually John agrees with Mary on everything Max Depenbrock SRL 5.1.2018 12 / 36

SRL-Frameworks FrameNet Grenzen von PropBank ARG1 The price of bananas increased ARG1 The price of bananas rose ARG1 There has been a rise in the price of bananas Gleiche Bedeutung, unterschiedliche Realisierung Max Depenbrock SRL 5.1.2018 13 / 36

SRL-Frameworks FrameNet FrameNet Idee Wörter mit ähnlicher / gleicher Bedeutung werden zu einem Frame zusammengefasst Frame Semantische Rollen (frame elements) Wörter, die ein Frame evozieren Max Depenbrock SRL 5.1.2018 14 / 36

SRL-Frameworks FrameNet Beispiel für ein Frame Definition: Change position on a scale This frame consists of words that indicate the change of an Item s position on a scale (the Attribute) from a starting point (Initial value) to an end point (Final value). Evoziert durch (u.a.) grow gain rise elevation elevated Max Depenbrock SRL 5.1.2018 15 / 36

SRL-Frameworks FrameNet FrameNet und Bananenpreise Max Depenbrock SRL 5.1.2018 16 / 36

SRL-Frameworks FrameNet PropBank vs. FrameNet PropBank Dank weniger Argumente leicht lernbar FrameNet Viele Wörter können einem Frame zugeordnet werden Max Depenbrock SRL 5.1.2018 17 / 36

Tools Tools Max Depenbrock SRL 5.1.2018 18 / 36

Tools Preprocessing 1 Tokenizer 2 POS-Tagger 3 {Dependenz, Phrasenstruktur, CCG,...}-Parser 4 SRL Alle Vorverarbeitungsschritte sind sprachabhängig! Max Depenbrock SRL 5.1.2018 19 / 36

Tools EasySRL Allgemeines Entwickelt 2015 Basierend auf PropBank Trainiert mit PropBank-Daten Kategorialgrammatik und A* Max Depenbrock SRL 5.1.2018 20 / 36

Tools EasySRL Kategorialgrammatik (CCG) chased Mary VP V NP NP N V chased N Mary A/B: Mit einem B von rechts wird daraus ein A Max Depenbrock SRL 5.1.2018 21 / 36

Tools EasySRL Kategorialgrammatik (CCG) chased Mary VP V NP NP N NP Det N V chased N Mary N cat Det The S NP VP A\B: Mit einem B von links wird daraus ein A Max Depenbrock SRL 5.1.2018 22 / 36

Tools EasySRL Motivation für CCG-basiertes SRL Problem: Dependenzkanten SRL-Kanten ARG0 ARG0 ARG1 ARG0 He refused to conf rm or deny the reports nsubj ARG1 xcomp mark cc conj dobj ARG1 det Lösung: Relationen zwischen CCG-Argumenten definieren He refused to conf rm or deny reports NP (S \ NP )/ (S \ NP ) S / S (S \ NP )/ NP conj (S \ NP )/ NP NP ARG0 ARG1 ARG1 ARG0 ARG1 ARG0 Max Depenbrock SRL 5.1.2018 23 / 36

Tools EasySRL CCG-basiertes SRL Köpfe deny the report (S deny \ NP x )/ NP y NP z / N z N report {deny x, deny y} {the z} {} > NP report {the report} > S deny \ NP x {deny x, deny report, the report} Jede Kategorie bekommt einen Kopf / Variable zugeordnet (Subscripte) In geschweiften Klammern sind Relationen definiert Köpfe und Variablen werden unifiziert Max Depenbrock SRL 5.1.2018 24 / 36

Tools EasySRL CCG-basiertes SRL A* conf rm S\ NP (S\ NP )/ NP NP S\ NP (S\ NP)/ NP (S\ NP )/ NP ARG0 ARG1 He reports refused 1 Auswahl einer Repräsentation 2 Auswahl eines Argumentes 3 Auswahl einer Rolle 4 Auswahl eines Zieles Max Depenbrock SRL 5.1.2018 25 / 36

Tools SEMAFOR Allgemeines Entwickelt 2010 Basierend auf FrameNet Trainiert mit PropBank- und SemEval-Daten Probabilistisches Modell basierend auf Dependenzstrukturen Max Depenbrock SRL 5.1.2018 26 / 36

Tools SEMAFOR Funktionsweise 1. Target Identification Welche Wörter evozieren Frames? Regelbasiert 2. Frame Identification Zu welchem Frame gehören die Targets? Potentiell ambig Probabilistisches Modell 3. Argument Identification Welche Wörter übernehmen welche Rolle? Weiteres probabilistisches Modell Max Depenbrock SRL 5.1.2018 27 / 36

Tools Honorable Mentions Honorable Mentions Shalmaneser Entwickelt an der UdS Deutsche und englische Modelle FrameNet-basiert PathLSTM Von ehemaligem Coli-Doktorand entwickelt PropBank-basiert verwendet neuronale Netze Max Depenbrock SRL 5.1.2018 28 / 36

Übung Übung Max Depenbrock SRL 5.1.2018 29 / 36

Übung Einführung Docker-Image Verzeichnisse mounten docker run -it -v /local/path:/host/path srl /bin/bash Verzeichnisstruktur /tools test.txt EasySRL/ semafor/ Folien http://depenbrock.no-ip.biz:48080/srl/slides.pdf Max Depenbrock SRL 5.1.2018 30 / 36

Übung EasySRL EasySRL Interaktiver Modus java -jar easysrl.jar --model model --outputformat srl Lesen aus Datei java -jar easysrl.jar --model model --outputformat srl < test.txt Beispielausgabe ===Model loaded: parsing...=== love ARG0 John love ARG1 Mary Max Depenbrock SRL 5.1.2018 31 / 36

Übung SEMAFOR SEMAFOR RAM zuweisen./autoconfig_ram.sh Lesen aus Datei./bin/runSemafor.sh /tools/test.txt /tools/semafor/out.txt 1 Ausgabedatei darf beim Ausführen nicht existieren! Max Depenbrock SRL 5.1.2018 32 / 36

Übung SEMAFOR Output Max Depenbrock SRL 5.1.2018 33 / 36

Übung Links Links Semafor-Web-Interface: http://demo.ark.cs.cmu.edu/parse FrameNet-Suche: https://framenet.icsi.berkeley.edu/ fndrupal/framenet_search Frame-Übersicht: https: //framenet.icsi.berkeley.edu/fndrupal/frameindex PropBank-Definitionen: http://verbs.colorado.edu/ propbank/framesets-english-aliases/ Max Depenbrock SRL 5.1.2018 34 / 36

Zusammenfassung Zusammenfassung Max Depenbrock SRL 5.1.2018 35 / 36

Zusammenfassung Was haben wir heute gesehen? SRL zwischen Dependenzanalysen und semantischem Parsing Frameworks PropBank (ARG0-ARG5) FrameNet (Wörter in Frames) Tools EasySRL (PropBank, CCG) SEMAFOR (FrameNet, prob.) Max Depenbrock SRL 5.1.2018 36 / 36