Informationsintegration

Größe: px
Ab Seite anzeigen:

Download "Informationsintegration"

Transkript

1 Informationsintegration Korrespondenzen Local-as-View Semantik der Anfrageplanung Ulf Leser Wissensmanagement in der Bioinformatik

2 Abstrakter Wenn das integrierte System ein globales Schema zur Verfügung stellt Wie beschreibt man die Beziehungen zwischen dem globalen und den verschiedenen lokalen Schemata? Wie benutzt man diese Beziehungen zur Anfrageplanung? Kann man aus solchen Beziehungen das integrierte Schema erzeugen? Ulf Leser: Informationsintegration, Wintersemester 2008/2009 2

3 Aufgabe Globales Schema Korrespondenzen Exportschema Aufgabe der Anfragebearbeitung Gegeben eine Anfrage q gegen das globale Schema Gegeben eine Menge von Korrespondenzen zwischen globalem und lokalen Schemata Finde alle Antworten auf q Ulf Leser: Informationsintegration, Wintersemester 2008/2009 3

4 Anfragebearbeitung Schritt 1: Anfrageplanung (in den nächsten Wochen) Welche Quellen können / sollen / müssen benutzt werden? Welche Teile der Anfrage sollen an welche Quelle geschickt werden? Schritt 2: Anfrageübersetzung Übersetzung aus der Sprache der Föderation in die Sprache der Quellen Schritt 3: Anfrageoptimierung Finde geeignete Reihenfolge der Ausführung der Teilanfragen Wer führt was aus (Pushen)? Wer kann was ausführen (Kompensation)? Schritt 4: Anfrageausführung Monitoring, Puffern, Cachen Dynamische Reoptimierung Schritt 5: Ergebnisintegration Duplikaterkennung und Konfliktauflösung Ulf Leser: Informationsintegration, Wintersemester 2008/2009 4

5 Beispiel Globales Schema Datenquellen Ulf Leser: Informationsintegration, Wintersemester 2008/2009 5

6 Anfrageplanung Globale Anfrage Alle Filme, in denen Hans Albers eine Hauptrolle spielte Was kommt in Frage? film: Quellen imdb.movie und fd.film spielt: Quellen imdb.acts und fd.spielt Ergibt vier Anfragepläne Ulf Leser: Informationsintegration, Wintersemester 2008/2009 6

7 Global as View / Local as View Global as View Relationen des globalen Schemata werden als Sichten auf die lokalen Schemas der Quellen ausgedrückt Local as View Relationen der Schemata der Quellen werden als Sichten auf das globale Schema ausgedrückt Ulf Leser: Informationsintegration, Wintersemester 2008/2009 7

8 Global as View (GaV) Beispiel Film( Titel, Name, Jahr, Genre) Regisseur( Name, Foto, Alter) S1: IMDB( Titel, Regie, Jahr, Genre) S2: MyMovies( Titel, Regie, Jahr, Genre) S3: RegieDB( Titel, Regie) S4: GenreDB( Titel, Jahr, Genre) CREATE VIEW Film AS SELECT * FROM IMDB UNION SELECT * FROM MyMovies UNION SELECT RegieDB.Titel, RegieDB.Regie, GenreDB.Jahr, GenreDB.Genre FROM RegieDB, GenreDB WHERE RegieDB.Titel = GenreDB.Titel Quelle: VL Data Integration, Alon Halevy, University of Washington, 2002 Ulf Leser: Informationsintegration, Wintersemester 2008/2009 8

9 Zwei Arten von GaV Regel Einfache GaV Regeln: Quellspezifisch Lokale Anfrage adressiert nur eine Quelle Verknüpfung über Quellen hinweg übernimmt die Anfrageplanung Besser wartbar (Änderung einer Quelle kann nur wenige Sichten betreffen) Einfacher zu erweitern (bestehende Views nicht anfassen) Komplexe GaV Regeln: Quellübergreifend Lokale Anfrage ist eine Anfrage in einer Multidatenbanksprache Eine Sicht fasst alle Objekte einer globalen Relation zusammen Sicht film, schauspieler, Anfrageplanung übernimmt nur noch Verknüpfung zwischen verschiedenen Relationen, d.h., Joins in der globalen Anfrage Weniger robust, schwerer zu erweitern Änderung einer Quelle kann alle Sichten betreffen Klassenspezifische Konfliktlösung kann in den View eingebaut werden Ulf Leser: Informationsintegration, Wintersemester 2008/2009 9

10 Globale Integritätsconstraints Neuerfilm( Titel, Regie, Jahr, Genre); Regisseur( Name, Foto, Alter); IC: Jahr > 2000 CREATE VIEW NeuerFilm AS SELECT * FROM IMDB WHERE Jahr > 2000 UNION SELECT * FROM MyMovies WHERE Jahr > 2000 S1: IMDB( Titel, Regie, Jahr, Genre) S2: MyMovies( Titel, Regie, Jahr, Genre) IC auf globalem Schema in die Sichtdefinition aufnehmen Ausführung in der Quelle (push) oder im Mediator Gegenbeispiel? Ulf Leser: Informationsintegration, Wintersemester 2008/

11 GaV Beispiel 3 Film(Titel, Regie, Jahr, Genre) Programm(Kino, Titel, Zeit) S1: IMDB(Titel, Regie, Jahr, Genre) S2: RegieDB(Titel, Regie) S3: GenreDB(Titel, Jahr, Genre) S7: KinoDB(Titel, Kino, Zeit) SELECT F.Titel, P.Kino, F.Regie FROM Film F, Programm P WHERE F.Titel = P.Titel AND P.Zeit > 20:00 SELECT F.Titel, P.Kino, F.Regie FROM ( SELECT * FROM IMDB UNION SELECT R.Titel, R.Regie, G.Jahr, G.Genre FROM RegieDB R, GenreDB G WHERE R.Titel = G.Titel) AS F, ( SELECT * FROM KinoDB) AS P WHERE F.Titel = P.Titel AND P.Zeit > 20:00 Ulf Leser: Informationsintegration, Wintersemester 2008/

12 Direkte Übersetzung SELECT F.Titel, P.Kino FROM ( SELECT * FROM IMDB UNION SELECT R.Titel, R.Regie, FROM RegieDB R, GenreDB G WHERE R.Titel = G.Titel) AS F, ( SELECT * FROM KinoDB) AS P WHERE F.Titel = P.Titel AND P.Zeit > 20:00 π titel,kino σ P.Zeit>20:00 Titel Titel GenreDB RegieDB IMDB KinoDB Ulf Leser: Informationsintegration, Wintersemester 2008/

13 Alternative Join-Ausführung π titel,kino π titel,kino Titel σ P.Zeit>20:00 Titel Titel Titel σ P.Zeit>20:00 GenreDB RegieDB IMDB KinoDB GenreDB RegieDB IMDB KinoDB Ulf Leser: Informationsintegration, Wintersemester 2008/

14 Inhalt dieser Vorlesung Anfragekorrespondenzen Einführung Korrespondenztypen und -arten GaV erklärt Local as View Query Containment Semantische Korrektheit von Anfrageplänen Später Algorithmen zum Query Containment Answering Queries using Views GLaV Global and Local as View Ulf Leser: Informationsintegration, Wintersemester 2008/

15 Anfrageplan Gegeben Eine Anfrage q an das globale Schema Lokale Schemata Definition Gegeben eine globale Anfrage q. Ein Anfrageplan p für q ist eine Anfrage der Form q 1 q n so dass Jedes q i kann von genau einem Wrapper ausgeführt werden Jedes von p berechnete Tupel ist eine semantisch korrekte Antwort für q Bemerkungen Semantisch korrekt haben wir noch nicht definiert In der Regel gibt es viele Anfragepläne Die q i heißen Teilanfragen oder Teilpläne Ulf Leser: Informationsintegration, Wintersemester 2008/

16 Viele Anfragepläne Definition Gegeben eine globale Anfrage q. Sei p 1,, p n die Menge aller Anfragepläne für q. Dann ist das Ergebnis von q definiert als Bemerkungen result( q) = In der Informationsintegration sollte UNION Duplikate entfernen Problem der Ergebnisintegration Wie das Ergebnis berechnet wird, ist Sache der Anfrageoptimierung Pläne können sich in Teilanfragen überlappen Ergebnis von q hängt nur von den definierten Korrespondenzen ab U i= 1.. n result( p i ) Ulf Leser: Informationsintegration, Wintersemester 2008/

17 Anfragekorrespondenzen Anfrageplanung übersetzt zwischen verschiedenen Sprachen im selben Datenmodell Zielschema und Quellschemata Beziehungen zwischen den Sprachelementen sind Grundlage der semantischen Korrektheit von Plänen Beziehungen: Homonyme, Synonyme, Hyperonyme, etc. Sprachen: Wörter, Sätze, Texte Schemata: Attribute, Relationen, Anfragen Beziehungen werden durch Korrespondenzen ausgedrückt Ulf Leser: Informationsintegration, Wintersemester 2008/

18 Übersetzung The dog barked and went away Der Hund bellte und ging weg Strukturelle und semantische Heterogenität Last summer we went to greece spending a year s income Wir sind letzten Sommer nach Griechenland gefahren und haben ein Jahreseinkommen auf den Kopf gehauen Ulf Leser: Informationsintegration, Wintersemester 2008/

19 Auf Schemaebene SELECT titel, regisseur FROM film titel SELECT titel, rolle FROM spielt WHERE rolle= Hauptrolle AND s_name= Hans Albers q 1 SELECT title, director FROM imdb.movie q 2 p = q 1 title q 2 SELECT title, role FROM imdb.acts WHERE role = main actor AND actor_name= Hans Albers Ulf Leser: Informationsintegration, Wintersemester 2008/

20 Viele Fragen Welche Attribute entsprechen welchen Attributen? Wie bricht man die globale Anfrage am besten auf? Für welche Teile der globalen Anfrage gibt es äquivalente Anfragen an Wrapper? Wie drückt man diese Korrespondenzen aus? Wie kann man dabei mit beschränkten Quellen umgehen? Ulf Leser: Informationsintegration, Wintersemester 2008/

21 Inhalt dieser Vorlesung Anfragekorrespondenzen Einführung Korrespondenztypen und -arten GaV erklärt Local as View Query Containment Semantische Korrektheit von Anfrageplänen Ulf Leser: Informationsintegration, Wintersemester 2008/

22 Korrespondenzarten Beziehungen zwischen Attributen Einfach zu finden: Schema Mapping Bottom-Up Beziehungen zwischen Relationen / Anfragen werden hergeleitet Das geht nicht immer eindeutig (später) Beziehungen zwischen Relationen Natürliche Ebene Planung wird zur Ersetzung von Relationennamen Reicht oft nicht, weil Relationen eines Schemas nicht 1:1 den Relationen eines anderen Schemas entsprechen Beziehungen zwischen Anfragen Subsumiert beide vorherigen Konzepte Sehr flexibel Schwierigere Anfrageplanung (LaV gleich) Ulf Leser: Informationsintegration, Wintersemester 2008/

23 Korrespondenztypen 1 Sei q 1 ein Sprachelement des globalen Schemas und q 2 ein Sprachelement eines lokalen Schemas Sprachelement = Anfrage/Relation/Attribut Exklusion: q 1 q 2 = Die Extensionen von q 1 und q 2 sind überlappungsfrei Das ist der Normalfall und wird angenommen, wenn keine Korrespondenz zwischen zwei Anfragen bekannt ist Inklusion: q 1 q 2 Die Extensionen von q 2 ist in der von q 1 enthalten In unserem Setting: Extension der Wrapperanfragen (q 2 ) ist in der Extension der globalen Anfrage (q 1 ) enthalten Besser denken: soll enthalten sein Beachte: q 2 wird nur einmal in einer Korrespondenz vorkommen, aber q 1 kann die Obermenge vieler Wrapperanfragen sein Ulf Leser: Informationsintegration, Wintersemester 2008/

24 Korrespondenztypen 2 Äquivalenz: q 1 q 2 Die Extensionen von q 1 und q 2 sind identisch Interpretation: q 2 ist die einzig mögliche Datenquelle von q 1 Es darf also keine weitere Regel der Art q i q 2 oder q i q 2 geben Oder damit wird ausgedrückt, dass q 1 q i Betrachten wir im folgenden nicht Überlappung: q 1 q 2 (q 1 q 2 ) ( q 1 q 2 ) Die Extensionen von q 1 und q 2 überschneiden sich, ohne das eine die andere enthält Damit sind manche Ergebnisse von q 2 nicht in der Extension von q 1 enthalten falsche Ergebnisse Diese Korrepondenzen nützen uns nichts Vorgehen: Finde eine Einschränkung filter von q 2 so, dass q 1 filter(q 2 ) Ulf Leser: Informationsintegration, Wintersemester 2008/

25 Korrespondenzen Definition Eine (Anfrage-)korrespondenz ist eine Regel der Art q 1 q 2 q 1 ist eine Anfrage an das globale Schema q 2 ist eine ausführbare Anfrage an das Exportschema eines Wrappers Bemerkung Eine Korrespondenz sagt etwas über die Extensionen von Anfragen aus Also über die Beziehungen von Tupelmengen, die durch Anfragen in unterschiedlichen Schemata berechnet werden Also ist das eine Aussage über die Semantik von Anfragen Ulf Leser: Informationsintegration, Wintersemester 2008/

26 GaV und LaV Definition Eine Korrespondenz q 1 q 2 heißt GaV (Global-as-View), wenn q 1 (globales Schema) eine einzelne Relation ohne Selektionen oder Joins ist LaV (Local-as-View), wenn q 2 (Wrapperschema) eine einzelne Relation ohne Selektionen oder Joins ist Sonst heißt sie GLaV (Global-local-as-view) Bemerkungen Wir verwenden ab jetzt nur noch - Korrespondenzen Die nächste Zeit wird uns LaV beschäftigen Ulf Leser: Informationsintegration, Wintersemester 2008/

27 Inhalt dieser Vorlesung Anfragekorrespondenzen Einführung Korrespondenztypen und -arten GaV erklärt Local as View Query Containment Semantische Korrektheit von Anfrageplänen Ulf Leser: Informationsintegration, Wintersemester 2008/

28 Global-as-View erklärt Eine GaV-Korrespondenz besteht also aus Einer Relation q 1 des globalen Schemas mit Projektionen Aber ohne Selektionen Einer ausführbaren Anfrage q 2 an ein Wrapperschema q 2 hat dasselbe Exportschema wie q 1 Beispiel π titel,regisseur ( film) π title,director ( imdb.movie) π titel,rolle,s_name (spielt) π title,role,actor_name (imdb.acts) Ulf Leser: Informationsintegration, Wintersemester 2008/

29 GaV Planung σ rolle,s_name (π titel,regisseur ( film) titel π titel,rolle,s_name (spielt)) π title,director ( imdb.movie) π title,role,actor_name (imdb.acts) p = σ rolle,s_name (q 1 title q 2 ) Ulf Leser: Informationsintegration, Wintersemester 2008/

30 Spezifischere Korrespondenzen Man könnte auch andere Regeln spezifizieren q 1 : π titel,regisseur ( film) π title,director ( imdb.movie) q 2 : π titel,rolle,s_name (spielt) σ role,actor_name ( π title,role,actor_name (imdb.acts)) Damit q: π titel,regisseur (film) titel σ rolle,s_name (π titel,rolle,s_name (spielt)) q: q 1 q 2 Vorteil Selektionen werden implizit (durch Regeldefinition) gepushed Nachteil Regel ist gut genau für q für andere Anfragen schlecht Wir brauchen exponentiell mehr Regeln Deklarativer Charakter von Korrespondenzen geht verloren Korrespondenzen: so generisch wie möglich Alles weitere der Anfrageoptimierung überlassen Ulf Leser: Informationsintegration, Wintersemester 2008/

31 GaV Planung Relationen des globalen Schemas werden in Anfragen an Wrapper übersetzt Wir fordern meistens an einen Wrapper, aber das kann auch eine UNION von Anfragen an verschiede Wrapper sein Planung mit GaV Regeln: Gegeben q q in relationale Algebra übersetzen Alle Selektionen nach außen ziehen Damit werden alle Selektionen im Mediator ausgeführt Raum für Anfrageoptimierung Projektionen nach außen ziehen Dito - Anfrageoptimierung Alle Relationen in q durch entsprechende Anfragen aus GaV Regeln für die jeweilige Relation ersetzen Testen, ob der Plan ausführbar ist Was kann schief gehen? Alle Pläne: Alle möglichen Kombinationen aus Ersetzungen Ulf Leser: Informationsintegration, Wintersemester 2008/

32 Zu allgemeine Wrapperkonzepte Wenn nun aber Global: luxusauto( ) Lokal: auto( ) Luxusautos sind Autos, aber nicht umgekehrt: luxusauto auto Können wir die Quelle also nicht verwenden? Korrespondenzen anders spezifizieren Lokal: auto(,preis, ) Damit: luxusauto σ preis>50000 ( auto(,preis, )) Wenn semantische Einschränkungen nicht durch Anfragen ausdrückbar sind, kann man die Quelle tatsächlich nicht sicher integrieren Siehe globale Integritätsconstraints bei GaV Ulf Leser: Informationsintegration, Wintersemester 2008/

33 Inhalt dieser Vorlesung Anfragekorrespondenzen Local as View Notation: Datalog Local-as-View Korrespondenzen Query Containment Semantische Korrektheit von Anfrageplänen Ulf Leser: Informationsintegration, Wintersemester 2008/

34 Konjunktive Anfragen Wir betrachten nur konjunktive Anfragen Equi-joins und Bedingungen mit =,<,> zwischen Attribut und Wert Kein NOT, EXISTS, GROUP BY,, X>Y,... LaV Planung viel schwieriger für andere Anfrageklassen Ulf Leser: Informationsintegration, Wintersemester 2008/

35 Kürzere Schreibweise Schreibweise: Datalog (Prolog) q(t,r,o) :- film(t,r,j),spielt(t,n,o),n= Hans Albers ; SELECT Klausel Regelkopf, Exported Variables FROM Klausel Relationen werden zu Prädikaten Attribute werden über Position statt Name adressiert WHERE Klausel Joins: gleiche Variablen an mehreren Stellen repräsentiert Bedingungen mit >,< werden explizit angegeben Gleichheitsbedingungen Attribut = Wert werden durch Konstante in Literal angegeben oder durch eigene Bedingung Ulf Leser: Informationsintegration, Wintersemester 2008/

36 SQL Datalog SELECT FROM WHERE Join q(t,r,o) :- film(t,r,j), spielt(t,n,o), N= Hans Albers, O= Hauptrolle ; Ulf Leser: Informationsintegration, Wintersemester 2008/

37 Begriffe Ulf Leser: Informationsintegration, Wintersemester 2008/

38 Beispiel q(t,r,o) :- film(t,r,j), spielt(t,n,o), N= Hans Albers, O= Hauptrolle ; q(t,r,o) :- film(t,r,_), spielt(u Hans Albers, Hauptrolle ), T=U; film, spielt,.. sind Prädikate Relationen des Schemas film( T,R,J), spielt(t,n,o) sind Literale Eine Anfrage kann ein Prädikat mehrmals enthalten - mehrere Literale desselben Prädikats Literale sind eindeutig in einer Anfrage, Prädikate nicht Variable, die nicht interessieren, kürzt man mit _ ab q ist sicher, wenn jede exportierte Variable im Rumpf vorkommt Ulf Leser: Informationsintegration, Wintersemester 2008/

39 Kein echtes Datalog Datalog kennt noch mehr Disjunktion und Vereinigung Andere Joins als Equi-Joins Rekursive Anfragen Extensional predicates: Prädikate, deren Extension in der Datenbank vorliegen Intensional predicates: Prädikate, die zur Laufzeit berechnet werden SQL: Views Verwendet ein intensionales Prädikat sich selber im Rumpf, wird dadurch eine rekursive Anfrage definiert Normales SQL: Verboten Rekursives SQL: Views mit Namen Ulf Leser: Informationsintegration, Wintersemester 2008/

40 Inhalt dieser Vorlesung Anfragekorrespondenzen Local as View Notation: Datalog Local-as-View Korrespondenzen Query Containment Semantische Korrektheit von Anfrageplänen Ulf Leser: Informationsintegration, Wintersemester 2008/

41 Warum Local-as-View? Andere Sichtweise Es gibt in der Welt eine Menge von Filmen, Schauspielern, Das globale Schema modelliert diese Welt Theoretisch steht damit die Extension fest Aber niemand kennt sie Informationsintegration versucht sie herzustellen Quellen speichern Ausschnitte der realen Welt Also Sichten auf die globale Extension Nur die können wir verwenden Film Globales Schema Schauspieler Quelle 2 Quelle 1 Quelle 3 Ulf Leser: Informationsintegration, Wintersemester 2008/

42 LaV Beispiel Film(Titel, Regie, Jahr, Genre) Programm(Kino, Titel, Zeit) S1: IMDB(Titel, Regie, Jahr, Genre) S2: MyMovies(Titel, Genre, Regie, Jahr) S3: RegieDB(Titel, Regie) S4: GenreDB(Titel, Jahr, Genre) CREATE VIEW S1 AS SELECT * FROM Film CREATE VIEW S2 AS SELECT Titel, Regie, Jahr, Genre FROM Film CREATE VIEW S3 AS SELECT F.Titel, F.Regie FROM Film F CREATE VIEW S4 AS SELECT F.Titel, F.Jahr, F.Genre FROM Film F Quelle: VL Data Integration, Alon Halevy, University of Washington, 2002 Ulf Leser: Informationsintegration, Wintersemester 2008/

43 Uninteressante lokale Attribute Film(Titel, Regie, Jahr, Genre) Programm(Kino, Titel, Zeit) CREATE VIEW S9 AS SELECT Titel, Jahr FROM Film S9: ActorDB(Titel, Schauspieler, Jahr) schauspieler gibt es im globalen Schema nicht Für diese Anwendung uninteressant Ulf Leser: Informationsintegration, Wintersemester 2008/

44 Assoziationen im globalen Schema Film(Titel, Regie, Jahr, Genre) Programm(Kino, Titel, Zeit) CREATE VIEW S7 AS SELECT P.Kino, F.Genre FROM Film F, Programm P WHERE F.Titel = P.Titel S7: KinoDB(Kino, Genre) Assoziationen des globalen Schemas können in der Sicht dargestellt werden Ulf Leser: Informationsintegration, Wintersemester 2008/

45 Assoziationen im lokalen Schema Film(Titel, Regie, Jahr, Genre) Programm(Kino, Titel, Zeit) CREATE VIEW S7Filme AS SELECT Titel, Jahr FROM Film CREATE VIEW S7Regie AS SELECT Regie FROM Film S9: Filme(Titel, Jahr, Ort, RegieID); Regie(ID, Regisseur); Assoziationen des lokalen Schemas können nicht abgebildet werden Ulf Leser: Informationsintegration, Wintersemester 2008/

46 Lokale Integritätsconstraints Film(Titel, Regie, Jahr, Genre) Programm(Kino, Titel, Zeit) CREATE VIEW S8 AS SELECT Titel, Regie, Genre FROM Film WHERE Jahr > 2000 S8: NeueFilme(Titel, Regie, Genre), Jahr>2000; Nebenbedingung auf der Quelle kann modelliert werden Wenn das Attribut im globalen Schema existiert IC müssen in der Quelle nicht explizit definiert sein Auch implizite Einschränkungen können in den View Ulf Leser: Informationsintegration, Wintersemester 2008/

47 Globale Integritätsconstraints Film(Titel, Regie, Jahr, Genre) Programm(Kino, Titel, Zeit) Jahr > 2000 CREATE VIEW S1 AS SELECT * FROM Film (WHERE Jahr> 2000)?? S1: IMDB(Titel, Regie, Jahr, Genre) Nebenbedingungen auf dem globalen Schema können wir nicht modellieren Das ging bei GaV Also hat beides Stärken und Schwächen Ulf Leser: Informationsintegration, Wintersemester 2008/

48 Komplexere Beispiele Ulf Leser: Informationsintegration, Wintersemester 2008/

49 Anfragebearbeitung - Probleme Alle Filme kürzer als 100 Minuten spielfilme (filtern) kurzfilme (vollständig) us_spielfilm (filtern) Alle Filme, die länger als 60 Minuten sind spielfilme (filtern) us_spielfilm (filtern) Besetzungen von Hauptrollen in Filmen unter 100 Minuten spielfilme filmkritiken? spielfilme spielfilm_kritiken? spielfilme us_spielfilm? spielfilme kurzfilm_rollen? Ulf Leser: Informationsintegration, Wintersemester 2008/

50 Anders formuliert Globale Anfrage film(t,_,_,l), spielt(t,s,o,_), O= Hauptrolle, L<100; Plan 1 spielfilme filmkritiken Expandiert: film(t,y,r,l),l>79,y= Spielfilm, film(t,_,r,_),spielt(t,s,o,_),o = Hauptrolle, T=T Frage? Erzeugt film(t, Spielfilm,R,L),L>79, film(t,_,r,_),spielt(t,s, Hauptrolle,_); Nur richtige Antworten für film(t,_,_,l), spielt(t,s, Hauptrolle,_), L<100; Ulf Leser: Informationsintegration, Wintersemester 2008/

51 Anfrageplanung mit LaV Gegeben Ein globales Schema S Eine Anfrage q an S Eine Menge von Sichten v 1,,v n auf S Gesucht Alle Kombinationen von Sichten, die q beantworten Wir wissen aber nicht, wie wir q am besten zerlegen, so dass eine Teilquery immer einer Sichtdefinition entspricht In der Regel wird das auch nicht gelingen Planung ist viel schwieriger als bei GaV Answering queries using views Anderes Bild: Eine Datenbank und eine Reihe materialisierter Sichten Plötzlich: alle Relationen der Datenbank weg, nur die Views sind noch da Können wir eine Anfrage q nur mit den Views beantworten? Ulf Leser: Informationsintegration, Wintersemester 2008/

52 Inhalt dieser Vorlesung Anfragekorrespondenzen Local as View Query Containment Semantische Korrektheit von Anfrageplänen Ulf Leser: Informationsintegration, Wintersemester 2008/

53 Zwei Teilprobleme Welche Kombinationen von Views (also Quellen) liefern semantisch korrekte Antworten auf eine globale Anfrage Anfrageplanung Answering Queries using Views Wann ist ein beliebiger Plan semantisch korrekt? Wir wissen nur, dass bestimmte Teilanfragen (Sichtdefinition) gegen das globale Schema extensional bestimmte Quellrelationen enthalten Durch die Korrespondenzen Wie kann man das auf beliebige Anfragen übertragen? Query Containment Zunächst arbeiten wir nur mit einem View Also: Wenn liefert ein View korrekte Ergebnisse für eine Query? Ulf Leser: Informationsintegration, Wintersemester 2008/

54 Query Containment Intuitiv wollen wir das folgende Ein View v liefert nur semantisch korrekte Anfragen auf eine globale Anfrage q, wenn seine Extension in der Extension von q enthalten ist Definition Sei S ein Datenbankschema, I eine Instanz von S und q 1, q 2 Anfragen gegen S. Sei q(i) das Ergebnis einer Anfrage q angewandt auf I. Dann ist q 1 enthalten in q 2, geschrieben q 1 q 2 gdw. q 1 (I) q 2 (I) für alle I Bemerkung Der wichtige Teil ist der letzte: für alle möglichen Instanzen von S Die können wir natürlich nicht alle ausprobieren Ulf Leser: Informationsintegration, Wintersemester 2008/

55 Äquivalenz Definition Sei S ein Datenbankschema, I eine Instanz von S und q 1, q 2 Anfragen gegen S. Sei q(i) das Ergebnis einer Anfrage q angewandt auf I. Dann ist q 1 äquivalent zu q 2, geschrieben q 1 q 2 gdw. q 1 (I) q 2 (I) und q 1 (I) q 2 (I) für alle I Bemerkung Wir beschäftigen uns nur mit enthaltenen Anfragen Ulf Leser: Informationsintegration, Wintersemester 2008/

56 Einfache Beispiele film(t,y,r,l) film(t,y,r,l) film(t, Dokumentarfilm,R,L) film(t,y,r,l) film(t,y,r,l), L<100 film(t,y,r,l) film(t,y,r,l),spielt(t,s,o) film(t,y,r,l) film(t,y,r,l) spielt(t,s,o) film(t,_,_,_) spielt(t,_,_) Ulf Leser: Informationsintegration, Wintersemester 2008/

57 Beispiel Offensichtlich muss eine Sicht mindestens jedes Prädikat der Anfrage enthalten Außerdem müssen die richtigen Attribute vorhanden sein Welche Quellen kommen für spielt in Frage? Ulf Leser: Informationsintegration, Wintersemester 2008/

58 Beispiel Welche Quellen kommen für spielt in Frage? filmkritiken Einschränkung auf Hauptrolle macht Tupel nicht falsch us_spielfilm, kurzfilm_rollen Keine Kritiken spielfilm_kritiken Richtige Quelle Ulf Leser: Informationsintegration, Wintersemester 2008/

59 Schwierige Fälle Anfragen an Graphen Relation edge( X,Y) speichert Kanten von X nach Y Wir suchen Subgraphen Ist p in q enthalten oder umgedreht? A C Y X Y A X C D B Z D Z B Ulf Leser: Informationsintegration, Wintersemester 2008/

60 Inhalt dieser Vorlesung Anfragekorrespondenzen Local as View Query Containment Semantische Korrektheit von Anfrageplänen Ulf Leser: Informationsintegration, Wintersemester 2008/

61 Semantische Korrektheit Wir können jetzt (endlich) definieren, wann ein Plan semantisch korrekt ist Aber wir können es noch nicht testen Definition Sei S ein globales Schema, q eine Anfrage gegen S, und p eine Verknüpfung von Views v 1,,v n gegen S, die als rechte Seite von LaV Korrespondenzen definiert sind. Dann ist p semantisch korrekt für q, gdw. p q Bemerkung Die Extension von q gibt es natürlich zum Anfragezeitpunkt nicht Wir verwenden nur Joins als Verknüpfung Ulf Leser: Informationsintegration, Wintersemester 2008/

62 Ergebnis einer globalen Anfrage Definition Sei S ein globales Schema, q eine Anfrage gegen S, und p 1,,p n alle semantisch korrekten Pläne für q. Dann ist das Ergebnis von q definiert als q U i=1... n p i Bemerkung Wir müssen alle semantisch korrekten Pläne finden Wie wir die ausführen, bleibt dem Optimierer überlassen Ulf Leser: Informationsintegration, Wintersemester 2008/

63 Verblüffende Effekte Eine Quelle für Graphkanten Eine Korrespondenz edge(a,b),edge(b,c) threewaypaths(a,b,c) Nehmen wir die folgende Extension einer Quelle an From (A) Via (B) To (C) Nun führen wir darauf aus q: edge(a,b),edge(b,c) from via to Ulf Leser: Informationsintegration, Wintersemester 2008/

64 Verblüffende Effekte Was ist nun unser Ergebnis? Die komplette Tabelle Wenn die Korrespondenz richtig ist Dann muss die Quelle unvollständig sein Wir können das im Mediator reparieren Wie kriegen wir das rechnerisch? Sei v die linke Seite der Korrespondenz, q die globale Query Dann ist v auf verschiedene Weisen in q enthalten Die werden wir auch alle berechnen Folge der spezifischen Weise, wie wir das Ergebnis einer globalen Anfrage definiert haben Und damit die Semantik der Anfragebearbeitung Ulf Leser: Informationsintegration, Wintersemester 2008/

Informationsintegration

Informationsintegration Informationsintegration Local-as-View Anfrageplanung Ulf Leser Inhalt dieser Vorlesung Anfragekorrespondenzen Formale Definition Korrespondenztypen und -arten GaV erklärt Local as View Query Containment

Mehr

Informationsintegration

Informationsintegration Informationsintegration Übersicht Anfrageplanung Global-as-View Ulf Leser Inhalt dieser Vorlesung Das Problem Anfrageplanung: Übersicht Global-as-View Modellierung GaV und Integritätsconstraints Implementierung

Mehr

Informationsintegration Global-as-View: GaV Felix Naumann

Informationsintegration Global-as-View: GaV Felix Naumann Informationsintegration Global-as-View: GaV 5.6.2012 Felix Naumann Überblick 2 Motivation Korrespondenzen Übersicht Anfrageplanung Global as View (GaV) Modellierung Anfragebearbeitung Local as View (LaV)

Mehr

Informationsintegration Global-as-View: GaV Felix Naumann

Informationsintegration Global-as-View: GaV Felix Naumann Informationsintegration Global-as-View: GaV 26.6.2008 Felix Naumann Überblick 2 Motivation Korrespondenzen Übersicht Anfrageplanung Global as View (GaV) Modellierung Anfragebearbeitung Local as View (LaV)

Mehr

Datenintegration & Datenherkunft Global-as-View (GaV) und Local-as-View (LaV)

Datenintegration & Datenherkunft Global-as-View (GaV) und Local-as-View (LaV) Datenintegration & Datenherkunft Global-as-View (GaV) und Local-as-View (LaV) Wintersemester 2010/11 Melanie Herschel melanie.herschel@uni-tuebingen.de Lehrstuhl für Datenbanksysteme, Universität Tübingen

Mehr

Modellierung von Datenquellen

Modellierung von Datenquellen Modellierung von Datenquellen Komplexe Informationssysteme Fabian Panse panse@informatik.uni-hamburg.de Universität Hamburg Modellierung von Datenquellen Eine Quellbeschreibung enthält Informationen über

Mehr

Überblick. Informationsintegration Local-as-View: LaV Felix Naumann

Überblick. Informationsintegration Local-as-View: LaV Felix Naumann Informationsintegration Local-as-View: LaV 7.6.2007 Felix Naumann Überblick 2 Motivation Korrespondenzen Übersicht Anfrageplanung Global as View (GaV) Local as View (LaV) Modellierung Anwendungen Anfragebearbeitung

Mehr

Informationsintegration Local-as-View: LaV Felix Naumann

Informationsintegration Local-as-View: LaV Felix Naumann Informationsintegration Local-as-View: LaV 10.7.2008 Felix Naumann Überblick 2 Motivation Korrespondenzen Übersicht Anfrageplanung Global as View (GaV) Local as View (LaV) Modellierung Anwendungen Anfragebearbeitung

Mehr

Kapitel 5: Anfrageverarbeitung. Multidatenbanksprachen am Beispiel von SchemaSQL

Kapitel 5: Anfrageverarbeitung. Multidatenbanksprachen am Beispiel von SchemaSQL Datenintegration Datenintegration Kapitel 5: Anfrageverarbeitung Andreas Thor Sommersemester 2008 Universität Leipzig Institut für Informatik http://dbs.uni-leipzig.de 1 Inhalt Multidatenbanksprachen am

Mehr

Datenintegration. Kapitel 5: Anfrageverarbeitung. Dr. Anika Groß Sommersemester 2016

Datenintegration. Kapitel 5: Anfrageverarbeitung. Dr. Anika Groß Sommersemester 2016 Datenintegration Datenintegration Kapitel 5: Anfrageverarbeitung Dr. Anika Groß Sommersemester 2016 Universität Leipzig Institut für Informatik http://dbs.uni-leipzig.de 1 Inhalt Multidatenbanksprachen

Mehr

Lösung - Übungsblatt 2

Lösung - Übungsblatt 2 Lösung - Übungsblatt 2 (Modellierung von Datenquellen) Fabian Panse panse@informatik.uni-hamburg.de Universität Hamburg Aufgabe 1: GaV mit Nebenbedingungen Student(MNr, Name, Sem, SG) IC: Sem > 5 S1(MNr,

Mehr

Informationsintegration Local-as-View: LaV. 15.6.2012 Felix Naumann

Informationsintegration Local-as-View: LaV. 15.6.2012 Felix Naumann Informationsintegration Local-as-View: LaV 15.6.2012 Felix Naumann Überblick 2 Motivation Korrespondenzen Übersicht Anfrageplanung Global as View (GaV) Local as View (LaV) Modellierung Anwendungen Anfragebearbeitung

Mehr

Informationsintegration

Informationsintegration Informationsintegration Answering Queries using (only) Views Ulf Leser Inhalt dieser Vorlesung Answering Queries using Views Längenbeschränkung Bucket Algorithmus Komplexität und Vollständigkeit Zwei weitere

Mehr

Integration, Migration und Evolution

Integration, Migration und Evolution 14. Mai 2013 Programm für heute 1 2 Quelle Das Material zu diesem Kapitel stammt aus der Vorlesung Datenintegration & Datenherkunft der Universität Tübingen gehalten von Melanie Herschel im WS 2010/11.

Mehr

Informationsintegration Beispiel

Informationsintegration Beispiel Informationsintegration Beispiel 17.4.2007 Felix Naumann Informationsintegration 2 Web Service A Web Service B Federated Database Systems Amit Sheth

Mehr

II Heterogenität und Architekturen

II Heterogenität und Architekturen II Heterogenität und Dr. Armin Roth arminroth.de 24.04.2013 Dr. Armin Roth (arminroth.de) II Heterogenität und 24.04.2013 1 / 24 Agenda 1 Semantische Heterogenität 2 Architekturparadigmen PDMS Dr. Armin

Mehr

Teil 1: Deduktive Datenbanken Gerd Stumme Christoph Schmitz

Teil 1: Deduktive Datenbanken Gerd Stumme Christoph Schmitz Teil 1: Deduktive Datenbanken Gerd Stumme Christoph Schmitz Wintersemester 004/05 Deduktive Datenbanken Grundkonzepte einer deduktiven Datenbank IDB intensionale Datenbasis (hergeleitete Relationen) Regeln

Mehr

Vorlesung Datenbanken I Zwischenklausur

Vorlesung Datenbanken I Zwischenklausur Prof. Dr. Stefan Brass 12. Dezember 2003 Institut für Informatik MLU Halle-Wittenberg Vorlesung Datenbanken I Zwischenklausur Name: Matrikelnummer: Studiengang: Aufgabe Punkte Max. Punkte Zeit 1 (Integritätsbedingungen)

Mehr

Komplexität. Matthias Sax. 9. Juli Humboldt-Universität zu Berlin. Institut für Informatik

Komplexität. Matthias Sax. 9. Juli Humboldt-Universität zu Berlin. Institut für Informatik Komplexität Matthias Sax Humboldt-Universität zu Berlin Institut für Informatik 9. Juli 2007 Matthias Sax Komplexität 1 / 21 1 Problemstellung 2 Polynomiale Fälle Ungleichheit Anfragen in der Logik der

Mehr

Vorlesung Datenbanktheorie. Einige Erweiterungen der Anfragesprachen. Regelbasierte konjunktive Anfragen mit = Vorlesung vom Mittwoch, 26.

Vorlesung Datenbanktheorie. Einige Erweiterungen der Anfragesprachen. Regelbasierte konjunktive Anfragen mit = Vorlesung vom Mittwoch, 26. Vorlesung Datenbanktheorie Vorlesung vom Mittwoch, 26. April 2006 Nicole Schweikardt Humboldt-Universität zu Berlin Sommersemester 2006 Letzte Vorlesung: regelbasierte konjunktive Anfragen Tableau-Anfragen

Mehr

Kapitel 2: Ein abstraktes Geo-Datenmodell

Kapitel 2: Ein abstraktes Geo-Datenmodell LUDWIG- MAXIMILIANS- UNIVERSITY MUNICH DEPARTMENT INSTITUTE FOR INFORMATICS Kapitel 2: Ein abstraktes Geo-Datenmodell Skript zur Vorlesung Geo-Informationssysteme Wintersemester 2011/12 Ludwig-Maximilians-Universität

Mehr

Spezifikation in Datalog:

Spezifikation in Datalog: Spezifikation in Datalog: darf_hinzufügen (X,W) :- editiert (Z,W), hat_mitglied (Z,X). darf_löschen (X,E) :- besitzt (X,E). darf_modifizieren (X,E) :- besitzt (X,E). darf_modifizieren (X,E) :- besitzt

Mehr

Kapitel 2: Ein abstraktes Geo-Datenmodell

Kapitel 2: Ein abstraktes Geo-Datenmodell LUDWIG- MAXIMILIANS- UNIVERSITY MUNICH DEPARTMENT INSTITUTE FOR INFORMATICS DATABASE Kapitel 2: Ein abstraktes Geo-Datenmodell Skript zur Vorlesung Geo-Informationssysteme Wintersemester 2013/14 Ludwig-Maximilians-Universität

Mehr

Datenbanken Unit 5: Datenintegrität und funktionale Abhängigkeit

Datenbanken Unit 5: Datenintegrität und funktionale Abhängigkeit Datenbanken Unit 5: Datenintegrität und funktionale Abhängigkeit 23. IV. 2018 Outline 1 Organisatorisches 2 Relationale Algebra Notation 3 Datenintegrität 4 Funktionale Abhängigkeit 5 SQL Outline 1 Organisatorisches

Mehr

Dieser Foliensatz darf frei verwendet werden unter der Bedingung, dass diese Titelfolie nicht entfernt wird.

Dieser Foliensatz darf frei verwendet werden unter der Bedingung, dass diese Titelfolie nicht entfernt wird. Thomas Studer Relationale Datenbanken: Von den theoretischen Grundlagen zu Anwendungen mit PostgreSQL Springer, 2016 ISBN 978-3-662-46570-7 Dieser Foliensatz darf frei verwendet werden unter der Bedingung,

Mehr

Datenbanken Unit 4: Das Relationale Modell & Datenintegrität

Datenbanken Unit 4: Das Relationale Modell & Datenintegrität Datenbanken Unit 4: Das Relationale Modell & Datenintegrität 15. III. 2016 Outline 1 Organisatorisches 2 SQL 3 Relationale Algebra Notation 4 Datenintegrität Organisatorisches Erster Zwischentest: nach

Mehr

II Einführung Informationsintegration

II Einführung Informationsintegration II Einführung Informationsintegration Fabian Panse 01.09.2014 Fabian Panse II Einführung Informationsintegration 01.09.2014 1 / 56 Agenda 1 Einführung 2 Organisation 3 Integration von Informationssystemen

Mehr

Dieser Foliensatz darf frei verwendet werden unter der Bedingung, dass diese Titelfolie nicht entfernt wird.

Dieser Foliensatz darf frei verwendet werden unter der Bedingung, dass diese Titelfolie nicht entfernt wird. Thomas Studer Relationale Datenbanken: Von den theoretischen Grundlagen zu Anwendungen mit PostgreSQL Springer, 2016 ISBN 978-3-662-46570-7 Dieser Foliensatz darf frei verwendet werden unter der Bedingung,

Mehr

Aggregatfunktionen in der Relationenalgebra?

Aggregatfunktionen in der Relationenalgebra? Aggregatfunktionen in der Relationenalgebra? Dieter Sosna Aggregatfunktionen in der Relationenalgebra p.1/23 Gliederung Motivation Begriffe Definitionen Anwendungen Zusammenfassung Aggregatfunktionen in

Mehr

Schemamerging und -mapping

Schemamerging und -mapping Schemamerging und -mapping Seminar Informationsqualität und -integration, 30.06.2006 Überblick Schemaintegration / Einleitung Ziele Integrationskonflikte Integrationstechniken Multidatenbankanfragesprachen

Mehr

Deklarative Informationsextraktion

Deklarative Informationsextraktion Deklarative Informationsextraktion Alexander Behringer (alexander.behringer@informatik.hu-berlin.de) Im Rahmen der Vorlesung «Text Analytics» (U. Leser) 15.11.2012 1 / 29 Fahrplan Einführung XLog Erweiterte

Mehr

Kap. 5 Erweiterung der Relationenalgebra für Deduktive Datenbanken

Kap. 5 Erweiterung der Relationenalgebra für Deduktive Datenbanken Kap. 5 Erweiterung der Relationenalgebra für Deduktive Datenbanken Ziel dieses kurzen Kapitels: Verbindung herstellen zwischen Logiksprachen und Relationenalgebra. Umgehen mit (rekursiven) Regeln zusätzlich

Mehr

Wir haben folgende Ausprägung der Relation Studenten:

Wir haben folgende Ausprägung der Relation Studenten: Übungen Aufgabe 1 Wir haben folgende Ausprägung der Relation Studenten: SID Name Email Age Note 2833 Jones jones@scs.ubbcluj.ro 19 9 2877 Smith smith@scs.ubbcluj.ro 20 8 2976 Jones jones@math.ubbcluj.ro

Mehr

Datalog. Moritz Kaufmann 1. Juni Technische Universität München

Datalog. Moritz Kaufmann 1. Juni Technische Universität München Datalog Moritz Kaufmann 1. Juni 2015 Technische Universität München Datalog Grundlagen Zusammenfassung 1. Faktenbasis (EDB = extensionale Datenbasis) 2. + logische Herleitungsregeln Ableitung neuer Fakten

Mehr

SQL 2. Ziele. Fortgeschrittene SQL-Konstrukte. Aggregatfunktionen revisited. Subqueries. Korrelierte Subqueries

SQL 2. Ziele. Fortgeschrittene SQL-Konstrukte. Aggregatfunktionen revisited. Subqueries. Korrelierte Subqueries SQL 2 Lehr- und Forschungseinheit Datenbanken und Informationssysteme 1 Ziele Fortgeschrittene SQL-Konstrukte groupby having union / intersect / except Aggregatfunktionen revisited Subqueries Korrelierte

Mehr

Einführung in die Logik (Vorkurs)

Einführung in die Logik (Vorkurs) Einführung in die Logik (Vorkurs) Jürgen Koslowski 2014-04-07 Ein Beispiel Familie A will im kommenden Jahr eine Waschmaschine, ein Auto und ein Moped anschaffen. Aber falls Herr A seinen üblichen Bonus

Mehr

Logische und funktionale Programmierung

Logische und funktionale Programmierung Logische und funktionale Programmierung Vorlesung 11: Logikprogramme Babeş-Bolyai Universität, Department für Informatik, Cluj-Napoca csacarea@cs.ubbcluj.ro 19. Dezember 2016 1/55 WIEDERHOLUNG: HORN-KLAUSELN

Mehr

Komplexitätstheorie Datenbanken und Deskriptive Komplexität

Komplexitätstheorie Datenbanken und Deskriptive Komplexität Tabellen von Elementen Komplexitätstheorie Datenbanken und Deskriptive Komplexität Helmut Veith Technische Universität München E: A B ========= 1 2 2 1 3 4 2 3 1 4 3 1 1 1 1 3 2 4 SQL: Anfragen über Tabellen

Mehr

Kapitel 3: Grundlagen von Anfragesprachen

Kapitel 3: Grundlagen von Anfragesprachen 3. Grundlagen von Anfragesprachen 3. Kapitel 3: Grundlagen von Anfragesprachen Sprachparadigmen Relationenalgebra Relationenkalkül Datenbanken und Informationssysteme, WS 2012/13 9. November 2012 Seite

Mehr

2. Ein abstraktes Geo-Datenmodell

2. Ein abstraktes Geo-Datenmodell 2 Ein abstraktes Geo-Datenmodell 1 Was soll modelliert werden? 2 Spatial Data Types 3 Integration in das relationale Datenmodell Geo-Informationssysteme 24 21 Was soll modelliert werden? Einzelne Objekte

Mehr

Datenbanken: Relationales Modell und SQL. Dr. Matthias Uflacker, Stefan Klauck 23. April 2018

Datenbanken: Relationales Modell und SQL. Dr. Matthias Uflacker, Stefan Klauck 23. April 2018 Datenbanken: Relationales Modell und SQL Dr. Matthias Uflacker, Stefan Klauck 23. April 2018 Vorlesungsinhalte/-aufbau Phase 1 Einführung zu Unternehmensanwendungen (2 Vorlesungen) Grundlagen von spaltenorientierten

Mehr

Informationsintegration

Informationsintegration Informationsintegration Semantische Integration Ulf Leser Wissensmanagement in der Bioinformatik Inhalt dieser Vorlesung Wdh: Semantische Heterogenität Semantische Integration Ontologien Beschreibungslogiken

Mehr

mehrwertige Abhängigkeiten

mehrwertige Abhängigkeiten mehrwertige Abhängigkeiten Mit funktionalen Abhängigkeiten kann man auf der Ebene der Modellierung erkannte Funktionalitäten einer Eigenschaft bzw. einer Beziehung formalisieren. Dies setzt voraus, daß

Mehr

Kapitel 10: Relationale Anfragebearbeitung

Kapitel 10: Relationale Anfragebearbeitung Ludwig Maimilians Universität München Institut für Informatik Lehr- und Forschungseinheit für Datenbanksysteme Skript zur Vorlesung Wintersemester 201/2016 Kapitel 10: Relationale Anfragebearbeitung Vorlesung:

Mehr

Vorlesung Logik und Datenbanken

Vorlesung Logik und Datenbanken Vorlesung Logik und Datenbanken Nicole Schweikardt Johann Wolfgang Goethe-Universität Frankfurt am Main Sommersemester 2008 Konjunktive Anfragen (I) 2.1 2.2 Auswertungskomplexität 2.3 Algebraischer Ansatz:

Mehr

Anfragebearbeitung. Logische Optimierung Physische Optimierung (Kostenmodelle Tuning ) Kapitel 8 1

Anfragebearbeitung. Logische Optimierung Physische Optimierung (Kostenmodelle Tuning ) Kapitel 8 1 Anfragebearbeitung Logische Optimierung Physische Optimierung (Kostenmodelle Tuning ) Kapitel 8 1 Ablauf der Anfrageoptimierung Deklarative Anfrage (SQL) Scanner Parser Sichtenauflösung Algebraischer Ausdruck

Mehr

Datenbanksysteme I WS 17/18 HS-Übung. Universität Leipzig, Institut für Informatik Abteilung Datenbanken Prof. Dr. E. Rahm, V. Christen, M.

Datenbanksysteme I WS 17/18 HS-Übung. Universität Leipzig, Institut für Informatik Abteilung Datenbanken Prof. Dr. E. Rahm, V. Christen, M. Datenbanksysteme I WS 17/18 HS-Übung Universität Leipzig, Institut für Informatik Abteilung Datenbanken Prof. Dr. E. Rahm, V. Christen, M. Franke Kapitel 1: Definitionen Grundlegenge Begriffe IS, DB, DBMS/

Mehr

Einführung in die Informatik II

Einführung in die Informatik II Einführung in die Informatik II Relationale Datenbanken und SQL Theorie und Anwendung Prof. Dr. Nikolaus Wulff Gründe für eine Datenbank Meist werden Daten nicht in XML-Dokumenten, sondern innerhalb einer

Mehr

d.h. zu Definitions-Stelle eindeutiger Funktionswert x X! y Y : (x,y) f umgekehrt: (x 1,y), (x 2,y) f ist o.k. X Y f(x) = y

d.h. zu Definitions-Stelle eindeutiger Funktionswert x X! y Y : (x,y) f umgekehrt: (x 1,y), (x 2,y) f ist o.k. X Y f(x) = y Kapitel 7 Normalformen und DB-Entwurf Kap. 7.1 Normalformen Theorie Funktionale Abhängigkeit: f X Y f als Relation, d.h. Menge von Paaren {(x,y)} x: Definitions-Stelle, y: Funktionswert f ist Funktion

Mehr

Query Languages (QL) Relationale Abfragesprachen/Relational

Query Languages (QL) Relationale Abfragesprachen/Relational Relationale Algebra Relationale Abfragesprachen/Relational Query Languages (QL) Abfragesprachen: Daten aus einer Datenbank zu manipulieren und abzufragen (retrieve information) Das relationalle Modell

Mehr

Dieser Foliensatz darf frei verwendet werden unter der Bedingung, dass diese Titelfolie nicht entfernt wird.

Dieser Foliensatz darf frei verwendet werden unter der Bedingung, dass diese Titelfolie nicht entfernt wird. Thomas Studer Relationale Datenbanken: Von den theoretischen Grundlagen zu Anwendungen mit PostgreSQL Springer, 2016 ISBN 978-3-662-46570-7 Dieser Foliensatz darf frei verwendet werden unter der Bedingung,

Mehr

Geoinformation Abbildung auf Tabellen

Geoinformation Abbildung auf Tabellen Folie 1 von 32 Geoinformation Abbildung auf Tabellen Folie 2 von 32 Abbildung auf Tabellen Übersicht Motivation des relationalen Datenmodells Von Objekten zu Tabellen Abbildung von Objekten Schlüssel Abbildung

Mehr

SQL. Ziele. Grundlagen von SQL. Beziehung zur relationalen Algebra SELECT, FROM, WHERE. Joins ORDER BY. Aggregatfunktionen. dbis.

SQL. Ziele. Grundlagen von SQL. Beziehung zur relationalen Algebra SELECT, FROM, WHERE. Joins ORDER BY. Aggregatfunktionen. dbis. SQL Lehr- und Forschungseinheit Datenbanken und Informationssysteme Ziele Grundlagen von SQL Beziehung zur relationalen Algebra SELECT, FROM, WHERE Joins ORDER BY Aggregatfunktionen Lehr- und Forschungseinheit

Mehr

Schema Mapping. Dr. Armin Roth arminroth.de. Dr. Armin Roth (arminroth.de) II Schema Mapping / 23

Schema Mapping. Dr. Armin Roth arminroth.de. Dr. Armin Roth (arminroth.de) II Schema Mapping / 23 Dr. Armin Roth arminroth.de 25.04.2013 Dr. Armin Roth (arminroth.de) II Schema Mapping 25.04.2013 1 / 23 Agenda 1 Wiederholung: Schema Matching / Integration 2 Schema Mapping Definitionen Beispiel Algorithmus

Mehr

Dieser Foliensatz darf frei verwendet werden unter der Bedingung, dass diese Titelfolie nicht entfernt wird.

Dieser Foliensatz darf frei verwendet werden unter der Bedingung, dass diese Titelfolie nicht entfernt wird. Thomas Studer Relationale Datenbanken: Von den theoretischen Grundlagen zu Anwendungen mit PostgreSQL Springer, 2016 ISBN 978-3-662-46570-7 Dieser Foliensatz darf frei verwendet werden unter der Bedingung,

Mehr

Indexstrukturen in SQL

Indexstrukturen in SQL Indestrukturen in SQL Anlegen eines Primärinde in SQL: Anlegen eines Sekundärinde in SQL: Bsp: create table Dozenten ( DNr integer primary key, Name varchar(0), Geburt date, ) create [Unique] inde indename

Mehr

Informationsintegration. Ulf Leser Sebastian Wandelt

Informationsintegration. Ulf Leser Sebastian Wandelt Informationsintegration Ulf Leser Sebastian Wandelt Informationsintegration Anfrage Integriertes Informations- system Oracle, DB2 Dateisystem Web Service App HTML Form Integriertes Info.-system Ulf Leser:

Mehr

SQL. DDL (Data Definition Language) Befehle und DML(Data Manipulation Language)

SQL. DDL (Data Definition Language) Befehle und DML(Data Manipulation Language) SQL DDL (Data Definition Language) Befehle und DML(Data Manipulation Language) DML(Data Manipulation Language) SQL Abfragen Studenten MatrNr Name Vorname Email Age Gruppe 1234 Schmidt Hans schmidt@cs.ro

Mehr

Beschreibungslogik Kapitel 7: ABoxen und Anfragebeantwortung

Beschreibungslogik Kapitel 7: ABoxen und Anfragebeantwortung Beschreibungslogik Kapitel 7: ABoxen und Anfragebeantwortung Sommersemester 2017 Thomas Schneider AG Theorie der künstlichen Intelligenz (TdKI) http://tinyurl.com/ss17-bl Beschreibungslogik SoSe 2017 7

Mehr

Informationsintegration

Informationsintegration Informationsintegration Schemaintegration Ulf Leser Wissensmanagement in der Bioinformatik Richtung Schemaintegration versus Anfragebearbeitung FDBS Schema integration Data source Data source Data source

Mehr

TU München, Fakultät für Informatik Lehrstuhl III: Datenbanksysteme Prof. Alfons Kemper, Ph.D.

TU München, Fakultät für Informatik Lehrstuhl III: Datenbanksysteme Prof. Alfons Kemper, Ph.D. TU München, Fakultät für Informatik Lehrstuhl III: Datenbanksysteme Prof. Alfons Kemper, Ph.D. Blatt Nr. 07 Übung zur Vorlesung Grundlagen: Datenbanken im WS16/17 Harald Lang, Linnea Passing (gdb@in.tum.de

Mehr

Logisches und funktionales Programmieren

Logisches und funktionales Programmieren Prof. Dr. Christoph Beierle, Dr. Harald Ganzinger, Prof. Dr. Michael Hanus Kurs 01816 Logisches und funktionales Programmieren LESEPROBE Das Werk ist urheberrechtlich geschützt. Die dadurch begründeten

Mehr

Logik Vorlesung 5: Grundlagen Resolution

Logik Vorlesung 5: Grundlagen Resolution Logik Vorlesung 5: Grundlagen Resolution Andreas Maletti 21. November 2014 Überblick Inhalt 1 Motivation und mathematische Grundlagen 2 Aussagenlogik Syntax und Semantik Äquivalenz und Normalformen Weitere

Mehr

Datenbanktheorie. Literatur: Abiteboul, S., R. Hull und V. Vianu, Foundations of Databases, Addison-Wesley 1995.

Datenbanktheorie. Literatur: Abiteboul, S., R. Hull und V. Vianu, Foundations of Databases, Addison-Wesley 1995. FGIS SS 2009 1. Datenbanktheorie 1. Datenbanktheorie 1 Enthaltensein-Problem konjunktiver Anfragen 2 Minimierung und Chase 3 Auswertung von Verbundausdrücken Literatur: Abiteboul, S., R. Hull und V. Vianu,

Mehr

Wiederholung VU Datenmodellierung

Wiederholung VU Datenmodellierung Wiederholung VU Datenmodellierung VL Datenbanksysteme Reinhard Pichler Arbeitsbereich Datenbanken und Artificial Intelligence Institut für Informationssysteme Technische Universität Wien Wintersemester

Mehr

Grundlagen von Datenbanken

Grundlagen von Datenbanken Grundlagen von Datenbanken SS 2010 4. Prolog als Datenbanksprache Prof. Dr. Stefan Böttcher Universität Paderborn Grundlagen von Datenbanken - SS 2010 - Prof. Dr. Stefan Böttcher 4. Prolog als Datenbanksprache

Mehr

Übung 4. Tutorübung zu Grundlagen: Datenbanken (Gruppen Do-T24 / Do-T31 WS 2016/2017)

Übung 4. Tutorübung zu Grundlagen: Datenbanken (Gruppen Do-T24 / Do-T31 WS 2016/2017) Übung 4 Tutorübung zu Grundlagen: Datenbanken (Gruppen Do-T24 / Do-T31 WS 2016/2017) Dennis Fischer dennis.fischer@tum.de http://home.in.tum.de/~fischerd/ Technische Universität München Fakultät für Informatik

Mehr

Kapitel 1: Einführung 1.1 Datenbanken?

Kapitel 1: Einführung 1.1 Datenbanken? Kapitel 1: Einführung 1.1 Datenbanken? 1. Einführung 1.1. Datenbanken Grundlagen der Datenbanksysteme, WS 2012/13 29. Oktober 2012 Seite 1 1. Einführung 1.1. Datenbanken Willkommen! Studierenden-Datenbank

Mehr

Kapitel 2: Grundlagen von Anfragesprachen

Kapitel 2: Grundlagen von Anfragesprachen 2. Grundlagen von Anfragesprachen Seite 1 Kapitel 2: Grundlagen von Anfragesprachen Sprachparadigmen Relationenalgebra Relationenkalkül später SQL 2. Grundlagen von Anfragesprachen 2.1. Relationenalgebra

Mehr

Aufgabenblatt 4 SQL. Vorbereitungen für das Aufgabenblatt: IMDB in DB2 laden

Aufgabenblatt 4 SQL. Vorbereitungen für das Aufgabenblatt: IMDB in DB2 laden Aufgabenblatt 4 SQL Abgabetermin: Dienstag, 07.06.11 Zur Prüfungszulassung muss ein Aufgabenblatt mit mind. 25% der Punkte bewertet werden und alle weiteren Aufgabenblätter mit mindestens 50% der Punkte.

Mehr

Logik Vorlesung 4: Horn-Logik und Kompaktheit

Logik Vorlesung 4: Horn-Logik und Kompaktheit Logik Vorlesung 4: Horn-Logik und Kompaktheit Andreas Maletti 14. November 2014 Überblick Inhalt 1 Motivation und mathematische Grundlagen 2 Aussagenlogik Syntax und Semantik Äquivalenz und Normalformen

Mehr

Kap. 3 Relationenmodell mit relationaler Algebra

Kap. 3 Relationenmodell mit relationaler Algebra Kap. 3 Relationenmodell mit relationaler Algebra Kap. 3.1. Trägermenge Seien D 1, D 2,..., D k Domänen: (Typen, Arten, Sorten, Wertmengen) z.b. string integer real Boolean DateTime BLOB, TIFF-image, HTML-Doc,

Mehr

Informationsintegration

Informationsintegration Informationsintegration Anfrageplanung mit beschränkten Quellen Ulf Leser Inhalt dieser Vorlesung Gebundene und freie Variablen Anfrageplanung Verfeinerungen Ulf Leser: Informationsintegration 2 Beschränkte

Mehr

Kapitel 10: Relationale Anfragebearbeitung

Kapitel 10: Relationale Anfragebearbeitung Ludwig Maimilians Universität München Institut für Informatik Lehr- und Forschungseinheit für Datenbanksysteme Skript zur Vorlesung Datenbanksysteme I Wintersemester 2017/2018 Kapitel 10: Relationale Anfragebearbeitung

Mehr

Relationen-Algebra. Prof. Dr. T. Kudraß 1

Relationen-Algebra. Prof. Dr. T. Kudraß 1 Relationen-Algebra Prof. Dr. T. Kudraß 1 Relationale Anfragesprachen Query Language (QL): Manipulation und Retrieval von Daten einer Datenbank Relationenmodell erlaubt einfache, mächtige Anfragesprachen

Mehr

Abschnitt 3: Mathematische Grundlagen

Abschnitt 3: Mathematische Grundlagen Abschnitt 3: Mathematische Grundlagen 3. Mathematische Grundlagen 3.1 Mengen und Abbildungen 3.2 Induktion und Rekursion 3.3 Ausdrücke 3 Mathematische Grundlagen Einf. Progr. (WS 08/09) 102 Überblick 3.

Mehr

Anfragebearbeitung und Optimierung

Anfragebearbeitung und Optimierung In diesem Kapitel geht es darum, wie ein DBMS eine SQL-Anfrage verarbeitet. Also: 1. Schritte der Anfragebearbeitung 2. Parsen und Validieren 3. Optimieren und Erstellen des Zugriffsplans Schritte der

Mehr

Seminar 1 SQL Abfragen DML. MatrNr Name Vorname Age Gruppe Schmidt Hans Meisel Amelie

Seminar 1 SQL Abfragen DML. MatrNr Name Vorname  Age Gruppe Schmidt Hans Meisel Amelie Seminar 1 SQL Abfragen DML Studenten MatrNr Name Vorname Email Age Gruppe 1234 Schmidt Hans schmidt@cs.ro 21 331 1235 Meisel Amelie meisel@cs.ro 22 331 1236 Krause Julia krause@cs.ro 21 332 1237 Rasch

Mehr

DBS1: Übungsserie Normalformen und relationale Algebra Structured Query Language (SQL)

DBS1: Übungsserie Normalformen und relationale Algebra Structured Query Language (SQL) DBS1: Übungsserie 3 + 4 Normalformen und relationale Algebra Structured Query Language (SQL) Sascha Szott Fachgebiet Informationssysteme Aufgabe 1a: Bestimmung von 2 gegeben: Relation R mit Attributen

Mehr

SchemaSQL Eine Multidatenbank Sprache. Volodymyr Biryuk

SchemaSQL Eine Multidatenbank Sprache. Volodymyr Biryuk SchemaSQL Eine Multidatenbank Sprache Volodymyr Biryuk Herausforderung Aufbau eines Multi-Datenbank-Systems (MDBS) Problem Autonomie Distribution Heterogenität Integration heterogener Datenquellen Art

Mehr

Data Warehousing und Data Mining

Data Warehousing und Data Mining Data Warehousing und Data Mining Materialisierte Sichten I Optimierung mit MV Ulf Leser Wissensmanagement in der Bioinformatik Inhalt dieser Vorlesung Materialisierte Sichten Logische Anfrageplanung mit

Mehr

Wiederholung VU Datenmodellierung

Wiederholung VU Datenmodellierung Wiederholung VU Datenmodellierung VU Datenbanksysteme Reinhard Pichler Arbeitsbereich Datenbanken und Artificial Intelligence Institut für Informationssysteme Technische Universität Wien Wintersemester

Mehr

Universität Augsburg, Institut für Informatik Wintersemester 2008/2009 Prof. Dr. W. Kießling 03. Februar Semesterklausur

Universität Augsburg, Institut für Informatik Wintersemester 2008/2009 Prof. Dr. W. Kießling 03. Februar Semesterklausur Universität Augsburg, Institut für Informatik Wintersemester 2008/2009 Prof. Dr. W. Kießling 03. Februar 2009 Dr. A. Huhn, M. Endres, T. Preisinger Datenbanksysteme I Semesterklausur Hinweise: Die Bearbeitungszeit

Mehr

5. Übungsblatt (Testatwoche: Mai 2010)

5. Übungsblatt (Testatwoche: Mai 2010) 5. Übungsblatt (Testatwoche: 18. - 20. Mai 2010) Einführung in Datenbanksysteme Datenbanken für die Bioinformatik Heinz Schweppe, Katharina Hahn Aufgabe 1 (Kardinalitäten von Ergebnisrelationen) 6 Punkte

Mehr

Data Warehousing und Data Mining

Data Warehousing und Data Mining Data Warehousing und Data Mining Materialisierte Sichten I Optimierung mit MV Ulf Leser Wissensmanagement in der Bioinformatik Inhalt dieser Vorlesung Materialisierte Sichten Logische Anfrageplanung mit

Mehr

Abschnitt 3: Mathematische Grundlagen

Abschnitt 3: Mathematische Grundlagen Abschnitt 3: Mathematische Grundlagen 3. Mathematische Grundlagen 3.1 3.2 Induktion und Rekursion 3.3 Boolsche Algebra Peer Kröger (LMU München) Einführung in die Programmierung WS 14/15 48 / 155 Überblick

Mehr

Ausgangspunkt. Datenintegration. Ziel. Konflikte. Architekturen. Transparenz

Ausgangspunkt. Datenintegration. Ziel. Konflikte. Architekturen. Transparenz Ausgangspunkt Datenintegration Web Informationssysteme Wintersemester 2002/2003 Donald Kossmann Daten liegen in verschiedenen Datenquellen (Extremfall: jede URL eigene Datenquelle) Mietautos bei www.hertz.com

Mehr

Semesterklausur Datenbanksysteme 1 SS 2015

Semesterklausur Datenbanksysteme 1 SS 2015 Universität Augsburg, Institut für Informatik Sommersemester 2015 Prof. Dr. W. Kießling 10. April 2015 F. Wenzel, L.Rudenko Datenbanksysteme 1 Semesterklausur Datenbanksysteme 1 SS 2015 Hinweise: Die Bearbeitungszeit

Mehr

Wirtschaftsinformatik 7a: Datenbanken. Hochschule für Wirtschaft und Recht SS 16 Dozent: R. Witte

Wirtschaftsinformatik 7a: Datenbanken. Hochschule für Wirtschaft und Recht SS 16 Dozent: R. Witte Wirtschaftsinformatik 7a: Datenbanken Hochschule für Wirtschaft und Recht SS 16 Dozent: R. Witte Drei Gäste bezahlen nach einem gemeinsamen Abendessen eine Rechnung von 30 Euro, so dass jeder 10 Euro gibt.

Mehr

Data Warehousing und Data Mining

Data Warehousing und Data Mining Data Warehousing und Data Mining Materialisierte Sichten I Optimierung mit MV Ulf Leser Wissensmanagement in der Bioinformatik Inhalt dieser Vorlesung Materialisierte Sichten Logische Anfrageplanung mit

Mehr

TU München, Fakultät für Informatik Lehrstuhl III: Datenbanksysteme Prof. Alfons Kemper, Ph.D.

TU München, Fakultät für Informatik Lehrstuhl III: Datenbanksysteme Prof. Alfons Kemper, Ph.D. TU München, Fakultät für Informatik Lehrstuhl III: Datenbanksysteme Prof. Alfons Kemper, Ph.D. Übung zur Vorlesung Einführung in die Informatik 2 für Ingenieure (MSE) Alexander van Renen (renen@in.tum.de)

Mehr

Logischer Entwurf. Stufen der Entwicklung einer Datenbank. Inhalt. Übersicht. 1. Datenbank - Entwurf ( ER - Diagramm)

Logischer Entwurf. Stufen der Entwicklung einer Datenbank. Inhalt. Übersicht. 1. Datenbank - Entwurf ( ER - Diagramm) 10. Logischer Entwurf 10-1 10. Logischer Entwurf 10-2 Stufen der Entwicklung einer Datenbank 1. Datenbank - Entwurf ( ER - Diagramm) Logischer Entwurf 2. Umsetzen des ER - Diagramms ins relationale Modell

Mehr