Semantic Role Labeling im modernen Text-Analyse-Prozess

Größe: px

Ab Seite anzeigen:

Download "Semantic Role Labeling im modernen Text-Analyse-Prozess"

Hede Beckenbauer
vor 7 Jahren
Abrufe

1 Semantic Role Labeling im modernen Text-Analyse-Prozess Bastian Haarmann

2 Agenda I Text-Analyse-Prozesse 1. Motivation 2. Informationsextraktion 3. Semantic Role Labeling 4. Integration von Ontologien II Anwendung 1. Anwendungsfelder 2. Semantisches Suchen 3. Beispiel Quelle:

3 Text-Analyse-Prozesse Motivation Die Anzahl auszuwertender Dokumente übersteigt die menschliche Kapazität Automatische Text-Analyse Experten müssen nur noch kontrollieren Texte müssen zur semantischen Analyse umgewandelt werden Experten können semantisch nach relevanten Dokumenten suchen Beides kann durch den Einsatz von Ontologien unterstützt werden

4 Text-Analyse-Prozesse Informationsextraktion Die automatische Text-Analyse beginnt mit der Extraktion von Information, bestehend aus einer modularen Verarbeitungskette. Diese Verarbeitungskette ( Pipeline ) umfasst (unter anderem) Tokenizing Gazetteer Look Up Sentence Splitting Part-of-Speech Tagging Morphological Analysis Named Entity Recognition Chunking oder Parsing

5 Informationsextraktion Tokenizing Zeichenketten (Wörter) werden segmentiert und annotiert Gazetteer Look Up Namen von Personen, Gebäuden, Lokalitäten etc., die in spezifischen Namenslisten vorkommen, werden erkannt und annotiert

6 Informationsextraktion Sentence Splitting, Part-of-Speech Tagging, Morphological Analysis Sätze werden segmentiert. Die Wortart (part of speech) wird durch den Wert category angegeben (NN für Nomen). Die Morphologische Analyse reduziert Plurale, Verbkonjugationen etc. zur Grundform und trägt sie unter root ein.

7 Informationsextraktion Named Entity Recognition Die NE Recognition baut einzelne Gazetteer Look Ups zu größeren Namenseinheiten auf

8 Informationsextraktion Chunking vs. Parsing Chunking und Parsing führen zusammengehörende Wörter zu Phrasen zusammen. Hierzu gehören Verbgruppen, Nominalphrasen und Präpositionalphrasen.

9 Semantic Role Labeling Prinzip Die Phrasen werden nach dem Chunking semantisch annotiert. Semantische Rollen, wie Täter, Lokation, etc. werden als Labels vergeben. Diesen Prozess nennt man Semantic Role Labeling.

Semantic Role Labeling Prinzip Das Semantic Role Labeling nutzt die syntaktischen, lexikalischen und semantischen Informationen aus den vorhergehenden Prozessmodulen.

10 Semantic Role Labeling Prinzip Das Semantic Role Labeling nutzt die syntaktischen, lexikalischen und semantischen Informationen aus den vorhergehenden Prozessmodulen. Im obigen Beispielsatz bekommt Aeroflot flight no. 212 das Label Agent, da es vor dem Verb steht. At Oslo Airport Gardermoen (ENGM) erhält Location, da es der Name eines Orts in einer Präpositionalphrase mit der Präposition at ist.

11 Integration von Ontologien Definition An ontology is an explicit specification of a [shared] conceptualization. Gruber, T.R. (1992). Toward Principles for the Design of Ontologies Used for Knowledge Sharing. International Journal Human-Computer Studies, 43, Einen Ontologie repräsentiert faktisches Weltwissen und stellt dieses für ein System maschinenlesbar bereit. Nach Gruber gilt: Every piece of knowledge, a system has to know, has to be represented explicitly. This is especially true for knowledge, humans take for granted.

Ontologie Aufbau In einer Ontologie sind die repräsentierten Konzepte in einer Taxonomie kategorisiert. Konzepte werden als Klassen repräsentiert.

12 Ontologie Aufbau In einer Ontologie sind die repräsentierten Konzepte in einer Taxonomie kategorisiert. Konzepte werden als Klassen repräsentiert. Individuelle Objekte werden als Instanzen innerhalb einer Klasse repräsentiert. Die Wissensrepräsentation in einer Ontologie umfasst darüber hinaus Attribut-Wert-Einträge und Beziehungen zwischen den Objekten.

Integration von Ontologien Semantic Role Labeling mithilfe einer Verb-Ontologie Um semantische Rollen zu bestimmen, wird Wissen aus einer Ontologie, genauer

14 Integration von Ontologien Semantic Role Labeling mithilfe einer Verb-Ontologie Um semantische Rollen zu bestimmen, wird Wissen aus einer Ontologie, genauer gesagt einer Verb-Ontologie, genutzt. In der Ontologie sind die Verben kategorisiert nach dem Set an semantischen Rollen, die sie erlauben, benötigen oder verbieten.

15 Integration von Ontologien Semantic Role Labeling mithilfe einer Verb-Ontologie Für das Hauptverb jedes Satzes wird das korrespondierende Set von semantischen Rollen (der Verbrahmen ) in der Ontologie gesucht. Der Rahmen wird dann mit den Phrasen des Satzes gefüllt.

16 Integration von Ontologien Semantische Restriktionen Eine weitere Unterstützung ist die Angabe von Restriktionen in der Ontologie. Dies verhindert z.b. die Vergabe belebter Rollen an unbelebte Phrasen. Die Informationen über Belebtheit können aus einer anderen Ontologie oder einer Gazetteer-Liste kommen.

17 Anwendung Nach der Analyse sind die Satzbestandteile (Wörter und Phrasen) syntaktisch annotiert. Die meisten Phrasen haben außerdem eine semantische Rolle zugewiesen bekommen. Dies erlaubt eine Vielzahl von Anwendungsmöglichkeiten: Semantische Suche Gefahrenerkennung Profilerstellung Ontologie-Anreicherung uvm.

18 Anwendung Semantisches Suchen Die semantische Suche spezifischer Dokumente aus dem Bestand erfolgt über eine Suchabfrage. Benutzer können diese gemäß ihren Anforderungen und ihrem Expertenwissen formulieren. Die Suchabfrage benutzt erneut die zugrundeliegende Ontologie.

19 Beispiel Suche: Bombenbau Ausdruck: Beschaffung von Dünger Die Formulierung einer Suchabfrage beginnt mit der Wahl eines Verbs bzw. einer Verb-Oberklasse, welches die zu suchende Handlung ausdrückt.

20 Der Ausdruck kann nun weiter eingeschränkt werden, z.b. durch Angabe der möglichen Werte für die semantische Rolle theme.

21 Anwendung Semantisches Suchen Indikatoren Auch hier kommt wieder die Ontologie zum Einsatz. Als theme wird nun Düngemittel gewählt.

22 Der Ausdruck kann nun ausgeführt werden und ergibt alle relevanten Texte, in denen der gesuchte Sachverhalt (Beschaffung von Dünger) erwähnt wird.

23 Literatur Haarmann, B & Sikorski, L. (2011). Ontology-driven Information Extraction. NATO RTO IST-097, November 2011, Oslo. Haarmann, B., Sikorski, L. & Schade, U. (2011). Text Analysis beyond Keyword Spotting. MCC 2011, October 2011, Amsterdam. Rein, K. & Schade, U. (2011). Making Molehills out of Mountains: A Methodology for Shallow Processing for Text-Based Information Fusion. World Conference on Soft Computing 2011, May 2011, San Francisco, CA. Sikorski, L. Haarmann, B. & Schade, U. (2011). Computational Linguistics Tools Exploited for Automatic Threat Recognition. NATO RTO IST-099 Symposium Emerged/Emerging Disruptive Technologies (Best Paper Award), May 2011, Madrid. Jenge, C., Kawaletz, S. & Schade, U. (2009). Combining Different NLP Methods for HUMINT Report Analysis. NATO RTO IST Panel Symposium, October 2009, Stockholm. Rein, K., Schade, U. (2009). How certain is certain? Evaluation of uncertainty in the fusion of information derived from diverse sources. 12th International Conference on Information Fusion 2009, July 2009, Seattle, WA. Jenge, C. & Frey, M. (2008). Ontologies in Automated Threat Recognition. MCC 2008, September 2008, Krakau. Kruger, K., Schade, U. & Ziegler, J. (2008). Uncertainty in the fusion of information from multiple diverse sources for situation awareness. 11th International Conference on Information Fusion, July 2008, Köln.

24 Vielen Dank!

Ähnliche Dokumente

Inaugural-Dissertation. Philosophie

Inaugural-Dissertation. Philosophie Ontology On Demand Vollautomatische Ontologieerstellung aus deutschen Texten mithilfe moderner Textmining-Prozesse Inaugural-Dissertation zur Erlangung des Grades eines Doktors der Philosophie in der Fakultät