Beschreibungslogik Kapitel 7: ABoxen und Anfragebeantwortung

Ähnliche Dokumente
Beschreibungslogik Kapitel 2: Grundlagen

Vorlesungsübersicht. Beschreibungslogik Kapitel 6: Effiziente Beschreibungslogiken. Kapitel 6: Effiziente Beschreibungslogiken.

Komplexitätstheorie Datenbanken und Deskriptive Komplexität

Description Logics (Beschreibungslogiken)

Vorlesung Datenbanktheorie. Einige Erweiterungen der Anfragesprachen. Regelbasierte konjunktive Anfragen mit = Vorlesung vom Mittwoch, 26.

Komplexität. Matthias Sax. 9. Juli Humboldt-Universität zu Berlin. Institut für Informatik

Beschreibungslogik. Vorlesung im Sommersemester 2016

Datenbanktheorie. Teil A: Einleitung 1: Grundbegriffe. Sommersemester Thomas Schwentick. Version von: 4. April 2012 (11:50)

Die Prädikatenlogik erster Stufe: Syntax und Semantik

Beschreibungslogik. Vorlesung im Sommersemester 2015

THEORETISCHE INFORMATIK UND LOGIK

Allgemeingültige Aussagen

5. Beschreibungslogiken und Web-Ontologien. Eigenschaften von Beschreibungslogiken. Das Grundvokabular besteht aus

Spezifikation in Datalog:

Logik Vorlesung 4: Horn-Logik und Kompaktheit

Konjunktive Anfragen II

Künstliche Intelligenz Logische Agenten & Resolution

Logik erster Stufe FO

Logik für Informatiker

Kapitel 1. Aussagenlogik

Was bisher geschah. wahr 0 t 1 falsch 0 f 0 Konjunktion 2 min Disjunktion 2 max Negation 1 x 1 x Implikation 2 Äquivalenz 2 =

Regeln fuer OWL. Foliensatz: Markus Kroetzsch, Sebastian Rudolph. Webbasierte Informationssysteme 15. November 2010

Aussagenlogik: Syntax von Aussagen

Vorlesung Logik und Datenbanken

Komplexitätstheorie NP-Vollständigkeit: Reduktionen (2) Der Satz von Cook/Levin

Tableaukalkül für Aussagenlogik

Kapitel DB:V (Fortsetzung)

Grundbegriffe für dreiwertige Logik

Formale Grundlagen der Informatik 1 Kapitel 19. Syntax & Semantik

Organisatorisches. Zeit und Ort: Di 8 10 MZH 1090 Mi MZH 1110

Logik für Informatiker

Nichtklassische Logiken

THEORETISCHE INFORMATIK UND LOGIK

Beweisen mit Semantischen Tableaux

Logik für Informatiker

Logik für Informatiker

Logik für Informatiker

Informatik A. Prof. Dr. Norbert Fuhr auf Basis des Skripts von Prof. Dr. Wolfram Luther und der Folien von Peter Fankhauser

Was ist Logik? Was ist Logik? Aussagenlogik. Wahrheitstabellen. Geschichte der Logik eng verknüpft mit Philosophie

Kapitel 3: Grundlagen von Anfragesprachen

Eliminierung der TBox. Definitorische Terminologien. Normalisierte Terminologien. Eliminierung der TBox (Beispiel)

Beachte: Mit n = 0 sind auch Konstanten Terme.

Logik Vorlesung 8: Modelle und Äquivalenz

Syntax der Prädikatenlogik: Komplexe Formeln

Logik. Logik. Vorkurs Informatik Theoretischer Teil WS 2013/ September Vorkurs Informatik - Theorie - WS2013/14

Prädikatenlogik. Übersicht: 1 Teil 1: Syntax und Semantik. 2 Teil 2: Normalformen und Grenzen der Prädikatenlogik 1. Stufe

Formale Methoden 2. Gaetano Geck Lehrstuhl I Logik in der Informatik WS 2015/2016

Nicht-Standard-Logiken. Intuitionistische Aussagenlogik Prädikatenlogik 2. Stufe Modallogik

Konjunktive Anfragen (I) Konjunktive Anfragen (I) Regelbasierte Konjunktive Anfragen Präzise. Regelbasierte Konjunktive Anfragen Informell

SS Juli Übungen zur Vorlesung Logik Blatt 11

Kapitel 2: Grundlagen von Anfragesprachen

Logik Vorlesung 5: Grundlagen Resolution

Entscheidungsverfahren mit Anwendungen in der Softwareverifikation

Normal Programs. Vervollständigung. Steffen Staab ISWeb Vorlesung Datenbanken II

Normalformen boolescher Funktionen

Formale Grundlagen der Informatik 1 Wiederholung zum Logik-Teil

Syntax. 1 Jedes A AS AL ist eine (atomare) Formel. 2 Ist F eine Formel, so ist auch F eine Formel. 3 Sind F und G Formeln, so sind auch

Informatik III. Christian Schindelhauer Wintersemester 2006/ Vorlesung

Kurseinheit 1 Einführung und mathematische Grundlagen Aussagenlogik

Anfragesprachen mit Rekursion Datalog

Wissensrepräsentation und -verarbeitung in Logiken. bereinigt Pränex Skolem ( -Eliminierung) Klausel (Menge von Klauseln, Notation ohne Quantoren)

Logik Vorlesung 3: Äquivalenz und Normalformen

Logik für Informatiker

Logik für Informatiker

Normalformen der Prädikatenlogik

Auffalten der ABox und Instanzklassifikation. Schlussfolgerungsdienste bzgl. der ABox (1) Fragestellung des speziellsten Begriffs zu einem Individuum

Einige Grundlagen der Komplexitätstheorie

Einführung in die Theoretische Informatik

Konjunktive Anfragen II

Grundlagen der Logik

das Konzept der Gleichung in der Algebra Robert Recorde Spielsemantik Semantik-Spiel FO mit oder ohne =? Abschnitt 2.5

Das SAT Problem oder Erfüllbarkeitsproblem. Formale Systeme. Teilklassen. Satz von Cook. SAT Instanz: Eine aussagenlogische Formel F For 0

THEORETISCHE INFORMATIK UND LOGIK

Informatik III. Christian Schindelhauer Wintersemester 2006/ Vorlesung

WS 2013/14. Diskrete Strukturen

Syntax der Aussagenlogik. Vorlesung Logik Sommersemester 2012 Universität Duisburg-Essen. Formel als Syntaxbaum. Teilformel A 3 A 1 A 4

1.1 Grundbegriffe. Logik und Diskrete Strukturen (Sommer 2018) Prof. Dr. Ulrich Hertrampf

Mathematische und logische Grundlagen der Linguistik. Kapitel 3: Grundbegriffe der Aussagenlogik

Beschreibungslogiken. Daniel Schradick

Motivation. Formale Grundlagen der Informatik 1 Kapitel 14 Aussagenlogik Syntax & Semantik. Motivation. Motivation

Mathematische und logische Grundlagen der Linguistik. Mathematische und logische Grundlagen der Linguistik. Karl Heinz Wagner. Hier Titel eingeben 1

Minesweeper ist NP-vollständig

Logik Vorlesung 2: Semantik der Aussagenlogik

Einführung in die Methoden der Künstlichen Intelligenz. Klausurvorbereitung Überblick, Fragen,...

Logik Vorlesung 2: Semantik der Aussagenlogik

Formale Grundlagen der Informatik II

Motivation und Geschichte. Geschichte der Logik Logik und Informatik

Frank Heitmann 2/42. 1 Etwas aus der realen Welt in der Logik abstrakt ausdrücken. 2 In der Logik Schlüsse ziehen.

Andere Logiken. o Modallogik(en) o Temporallogik(en) o Beschreibungslogik(en) Konzepte und Rollen Fragen und Entscheidbarkeit. Andere Logiken 240

Formale Grundlagen der Informatik 1 Kapitel 13 Aussagenlogik Syntax & Semantik

Das Relationale Modell

1 Aussagenlogik. 1.1 Aussagen. 15 ist eine Primzahl. 3 < 8 x < 15 (hängt von x ab, keine Aussage) Aussage = Behauptung Beispiele: Es regnet.

1 Aussagenlogik. 1.1 Aussagen. 15 ist eine Primzahl. 3 < 8 x < 15 (hängt von x ab, keine Aussage) Aussage = Behauptung Beispiele: Es regnet.

Was bisher geschah Modellierung in Logiken: klassische Prädikatenlogik FOL(Σ, X) Spezialfall klassische Aussagenlogik AL(P)

Syntax der Aussagenlogik

Aussagenlogik. Übersicht: 1 Teil 1: Syntax und Semantik. 2 Teil 2: Modellierung und Beweise. Aussagenlogik H. Kleine Büning 1/25

Logik für Informatiker Logic for computer scientists

7. Prädikatenlogik. Aussagenlogik hat wünschenswerte Eigenschaften wie Korrektheit, Vollständigkeit, Entscheidbarkeit.

Grundlagen der Künstlichen Intelligenz

Jeder Aussage p kann ein Wahrheitswert W(p) {0, 1} zugeordnet werden. Beispiele: W(Es regnet.) =? (je nach Lage der Dinge) W(Die Straße ist naß.) =?

Transkript:

Beschreibungslogik Kapitel 7: ABoxen und Anfragebeantwortung Sommersemester 2017 Thomas Schneider AG Theorie der künstlichen Intelligenz (TdKI) http://tinyurl.com/ss17-bl Beschreibungslogik SoSe 2017 7 ABoxen und Anfragebeantwortung 1

Vorlesungsübersicht Kapitel 1: Einleitung Kapitel 2: Grundlagen Kapitel 3: Ausdrucksstärke und Modellkonstruktionen Kapitel 4: Tableau-Algorithmen Kapitel 5: Komplexität Kapitel 6: E ziente Beschreibungslogiken Kapitel 7: ABoxen und Anfragebeantwortung Beschreibungslogik SoSe 2017 7 ABoxen und Anfragebeantwortung 2

Ziel des Kapitels TBoxen repräsentieren allgemeines, begri liches Wissen. Um konkrete Situationen zu repräsentieren, braucht man Instanzdaten. Für medizinische Ontologien wie SNOMED z. B. Patientendaten: Patient(p 1 ) Patient(p 2 ) Medikament(m) Krankheit(k) erhält(p 1, m) erhält(p 2, m) heilt(m, k) hat(p 1, k) Konzeptnamen Patient, Medikament etc. können in TBox definiert sein. Beschreibungslogik SoSe 2017 7 ABoxen und Anfragebeantwortung 3

Ziel des Kapitels Ziel des Kapitels Einführen eines Formalismus für Instanzdaten (ABox) Studium von Schlussfolgerungsproblemen mit Instanzdaten (insb. verschiedene Varianten von Anfragebeantwortung) Fokus: Anfragebeantw. mit Datenbanksystemen und Ontologien (Query Rewriting) Beschreibungslogik SoSe 2017 7 ABoxen und Anfragebeantwortung 4

Kapitel 7: ABoxen und Anfragebeantwortung 1 Grundlagen 2 Etwas Datenbanktheorie 3 Konjunktive Anfragen & Beschreibungslogik-TBoxen 4 Query Rewriting 5 Konjunktive Anfragen mit Ungleichheit (?) Beschreibungslogik SoSe 2017 7 ABoxen und Anfragebeantwortung 5

Kapitel 7: E ziente Beschreibungslogiken 1 Grundlagen 2 Etwas Datenbanktheorie 3 Konjunktive Anfragen & Beschreibungslogik-TBoxen 4 Query Rewriting 5 Konjunktive Anfragen mit Ungleichheit (?) Beschreibungslogik SoSe 2017 7 ABoxen und Anfragebeantwortung 6

ABoxen: Syntax Wir reservieren eine unendliche Menge von Individuen a, b,... Diese entsprechen Konstanten im Sinne der Prädikatenlogik. Definition 7.1 (ABoxen, Syntax) Eine Konzeptassertion hat die Form A(a), A Konzeptname. Eine Rollenassertion hat die Form r(a, b), r Rollenname. Eine ABox ist eine endliche Menge von (Konzept- und Rollen-)assertionen. Ind(A) bezeichnet die Menge der in A verwendeten Individuen. T 7.1 Beschreibungslogik SoSe 2017 7 ABoxen und Anfragebeantwortung 7

ABoxen: Semantik Definition 7.2 (ABoxen, Semantik) Interpretation I erfüllt A(a), wenn a 2 A I ; erfüllt r(a, b), wenn (a, b) 2 r I. I ist Modell von A, wenn I alle Assertionen in A erfüllt. Beachte: Modell I darf zusätzlich Assertionen wahr machen, die in A nicht vorkommen. T 7.1 Forts. Das in ABoxen repräsentierte Wissen ist also unvollständiges Wissen. Beschreibungslogik SoSe 2017 7 ABoxen und Anfragebeantwortung 8

Wissensbasen ABox und TBox fasst man manchmal zu einer Wissensbasis zusammen: Definition 7.3 (Wissensbasis) Wissensbasis (WB) K = (T, A) besteht aus TBox T und ABox A. Interpretation I ist Modell von K, wenni Modell von T und von A. In vielen Anwendungen haben T und A unterschiedlichen Status: T wird einmal erstellt; ändert sich danach üblicherweise nicht mehr. A ändert sich häufig (wie Datenbank). Beschreibungslogik SoSe 2017 7 ABoxen und Anfragebeantwortung 9

Grundlegende Schlussfolgerungsprobleme Definition 7.4 (Konsistenz, Instanz) Sei K Wissensbasis, A(a) Konzeptassertion. Dann ist K konsistent, wenn K Modell hat; a eine Instanz von A bzgl. K, wenn jedes Modell von K auch A(a) erfüllt. Wir schreiben dann K = A(a). Konsistenzproblem: Gegeben K, entscheide ob K konsistent ist. T 7.2 Instanzproblem: Gegeben K und A(a), entscheide ob K = A(a). Beschreibungslogik SoSe 2017 7 ABoxen und Anfragebeantwortung 10

Reduktionen Konsistenz- und (Nicht-)Instanzproblem sind wechselseitig polynomiell reduzierbar: Lemma 7.5 1 K ist konsistent gdw. K 6 = A(a), A neuer Konzeptname. 2 (T, A) = A(a) gdw. (T [{A A}, A [{A(a)}) inkonsistent. Konzept-Erfüllbarkeit ist polynomiell reduzierbar auf Konsistenz: Lemma 7.6 A erfüllbar bzgl. T gdw. (T, {A(a)}) konsistent. T 7.3 Intuitiv: Erfüllbarkeit entspricht genau WB-Konsistenz mit ABoxen der Form {A(a)}. Beschreibungslogik SoSe 2017 7 ABoxen und Anfragebeantwortung 11

Anfragebeantwortung Viele Anwendungen verwenden ABoxen wie (semantische) Datenbanken. Verschiedene Anfragesprachen möglich: Instanzanfrage: gegeben K und A, ermittleallea mit K = A(a). Konjunktive Anfragen: mächtigere Anfragesprache, Definition später Anfragebeantwortung ist ein Berechnungsproblem, kein Entscheidungsproblem! T 7.2 Forts. Beschreibungslogik SoSe 2017 7 ABoxen und Anfragebeantwortung 12

Instanzanfragen in ALC Beantworten einer Instanzanfrage A zur Wissensbasis K = (T, A): Antworten berechenbar durch mehrfaches Entscheiden des Instanzproblems: Überprüfe, ob K = A(a) für alle Individuen a in A. Instanzproblem kann auf Konsistenzproblem reduziert werden. Zur Beantwortung von Instanzanfragen ist es also im Prinzip ausreichend, Konsistenz von Wissensbasen entscheiden zu können. In der Praxis ist das allerdings nicht sehr e Mögliche Algorithmen für Konsistenz: zient. Erweiterung von ALC-Elim (bzw. ALC-Worlds, falls T = ;) Erweiterung von Tableau-Algorithmen Reduktion auf Konzept-Erfüllbarkeit bzgl. T (Precompletion) Beschreibungslogik SoSe 2017 7 ABoxen und Anfragebeantwortung 13

Komplexität Mit wenigen Ausnahmen: Konsistenzproblem hat dieselbe Komplexität wie Erfüllbarkeit. Für ALC, ALCI also EXPTIME-vollständig. Konjunktive Anfragen führen zu noch höheren Komplexitäten: Fragen: in ALC immer noch EXPTIME-vollständig in ALCI 2EXPTIME-vollständig Wie kann e ziente Anfragebeantwortung realisiert werden? Kann man relationale Datenbanksysteme (SQL-Datenbanken) einsetzen? Beschreibungslogik SoSe 2017 7 ABoxen und Anfragebeantwortung 14

Kapitel 7: E ziente Beschreibungslogiken 1 Grundlagen 2 Etwas Datenbanktheorie 3 Konjunktive Anfragen & Beschreibungslogik-TBoxen 4 Query Rewriting 5 Konjunktive Anfragen mit Ungleichheit (?) Beschreibungslogik SoSe 2017 7 ABoxen und Anfragebeantwortung 15

Relationale Datenbanken Zur Erinnerung: Relationales Schema ist Menge von Tabellennamen mit Stelligkeit. Konkrete Datenbankinstanz füllt die Tabellen mit Inhalten. Anfragen sind in SQL formuliert. Wir betrachten relationale Datenbanken, in denen alle Tabellen nur eine oder zwei Spalten haben. Einspaltige Tabellen entsprechen Konzeptnamen; zweispaltige Tabellen entsprechen Rollennamen. Datenbankinstanz entspricht dann Interpretation (nicht ABox): Datenbanken werden als vollständig behandelt (Semantik ). T 7.4 Beschreibungslogik SoSe 2017 7 ABoxen und Anfragebeantwortung 16

ABoxen versus Datenbanken (Un)vollständigkeit hat weitreichende Konsequenzen: Anfragebeantwortung in relationalen Datenbanken entspricht dem Model-Checking-Problem: Datenbank = Modell Anfrage = logische Formel Anfragebeantwortung in Beschreibungslogik entspricht logischer Folgerbarkeit: KB = logische Theorie Anfrage = logische Formel Letzteres ist in der Regel ein wesentlich schwierigeres Problem. Beschreibungslogik SoSe 2017 7 ABoxen und Anfragebeantwortung 17

Verschiedene wichtige Anfragesprachen SQL = relationale Algebra = relationales Kalkül (Logik erster Stufe) Nützliche und weit verbreitete Anfragesprache. Führt im Zusammenhang mit unvollständigen Daten und TBoxen leider sofort zu Unentscheidbarkeit. select-from-where-anfragen = select-project-join-anfragen = konjunktive Anfragen Datalog Wichtiges Fragment von SQL, keine Negation, keine Disjunktion In der Praxis sind > 90 % aller SQL-Anfragen von dieser Art. Regelbasierte Anfragesprache, Aussdrucksstärke orthogonal zu SQL Erlaubt Rekursion, aber keine Negation Beschreibungslogik SoSe 2017 7 ABoxen und Anfragebeantwortung 18

Konjunktive Anfragen: Syntax Von nun an sei V eine Menge von Variablen. Definition 7.7 (Konjunktive Anfrage, CQ) Ein Konzeptatom hat die Form A(x), A Konzeptname, x 2 V. Ein Rollenatom hat die Form r(x, y), r Rollenname, x, y 2 V. Eine konjunktive Anfrage (CQ) hat die Form y Ï(x, y), wobei y = y 0 y m die quantifizierten Variablen sind; x = x 0 x n die Antwortvariablen sind; Ï(x, y) Konjunktion von Konzept- und Rollenatomen über x [ y ist. ( CQ steht für conjunctive query.) T 7.5 Beschreibungslogik SoSe 2017 7 ABoxen und Anfragebeantwortung 19

CQs: Notation Wir schreiben: x, y, z für Variablen x, y, z für Tupel von Variablen Ï(x, y) für Konjunktionen von Atomen über Variablen x [ y q(x) für konjunktive Anfragen mit Antwortvariablen x Beschreibungslogik SoSe 2017 7 ABoxen und Anfragebeantwortung 20

CQs: Semantik Definition 7.8 (Homomorphismus, Antwort bzgl. Interpretation) Sei I Interpretation und q(x) = 9y Ï(x, y) mit x = x 1 x n. Ein Homomorphismus von q(x) nach I ist eine Abbildung h : x [ y! I,sodass: h(x) 2 A I (h(x), h(y)) 2 r I für alle Konzeptatome A(x) in Ï für alle Rollenatome r(x, y) in Ï Eine Antwort auf q(x) in I ist ein Tupel a = a 1 a n von Elementen, so dass es einen Homomorphismus h von q(x) nach I gibt mit h(x i ) = a i für 1 apple i apple n. ans(q, I) bezeichnet die Menge aller Antworten auf q(x) in I. T 7.6 Beschreibungslogik SoSe 2017 7 ABoxen und Anfragebeantwortung 21

Boolesche CQs Boolesche konjunktive Anfrage: CQ q ohne Antwortvariablen Wir schreiben q æi, wenn es Homomorphismus von q nach Interpretation I gibt. Boolesche CQ q liefert für jede Interpretation I entweder keine Antwort (wenn q 6! I); wir schreiben dann I = q, sagen I macht q falsch ; oder das leere Tupel () als einzige Antwort (wenn q! I); wir schreiben dann I = q, sagen I macht q wahr. Bei Komplexitätsanalysen betrachten wir meist Boolesche Anfragen. Die Ergebnisse übertragen sich im Prinzip auf Anfragen mit Antwortvariablen. Beschreibungslogik SoSe 2017 7 ABoxen und Anfragebeantwortung 22

Datenkomplexität In typischen Datenbank-Anwendungen sind die Daten extrem groß, Anfragen jedoch verhältnismäßig klein. Datenkomplexität: Die Anfrage wird als fest angenommen, hat daher konstante Größe. Die Daten sind also die einzige Eingabe. Im Gegensatz dazu kombinierte Komplexität: Daten und Anfrage werden als Eingabe angesehen. Einige beispielhafte Komplexitäten: Datenkomplexität kombinierte Kompl. CQ in AC 0 NP-vollständig SQL in AC 0 PSPACE-vollständig Datalog P-vollständig EXPTIME-vollständig Datenkomplexität bildet praktische Beobachtungen deutlich realistischer ab! Beschreibungslogik SoSe 2017 7 ABoxen und Anfragebeantwortung 23