Informationsintegration

Größe: px
Ab Seite anzeigen:

Download "Informationsintegration"

Transkript

1 Informationsintegration Schemaintegration Ulf Leser Wissensmanagement in der Bioinformatik

2 Richtung Schemaintegration versus Anfragebearbeitung FDBS Schema integration Data source Data source Data source Query processing: Query planning Decomposition Translation Result integration Ulf Leser: Informationsintegration, Wintersemester 2006/2007 2

3 Schema Matching Schema/ Datenbank 1 Mapping/ Korrespondenzen Schema/ Datenbank 2 Ulf Leser: Informationsintegration, Wintersemester 2006/2007 3

4 Schema Mapping Mapping/ Schema 1 Korrespondenzen Schema 2 Datenbank 1 Transformationsregeln Datenbank 2 Ulf Leser: Informationsintegration, Wintersemester 2006/2007 4

5 Schemaintegration Integriertes Schema Schema 1 Schema 2 Ulf Leser: Informationsintegration, Wintersemester 2006/2007 5

6 Schema Matching Ulf Leser: Informationsintegration, Wintersemester 2006/2007 6

7 Klassifikation von Ansätzen [RB01] Schema Matching Ansätze Individuelle Ansätze Kombinierte Ansätze Schema-basiert Instanz-basiert Hybrid Zusammengesetzt Linguistisch Linguistisch Constraintbasiert Duplikatbasiert Manuell Automatisch Constraint-basiert Ulf Leser: Informationsintegration, Wintersemester 2006/2007 7

8 Label-based Gegeben zwei Schemata mit Attributmengen A und B Kernidee: Bilde Kreuzprodukt aller Attribute aus A und B. Für jedes Paar vergleiche Ähnlichkeit bzgl. Attributnamen (Label). Z.B. Edit-distance Ähnlichste Paare sind Matches Probleme: Auswahl der besten Matches (globales Matching) Iterativ? Stable Marriage? Synonyme und Homonyme werden nicht erkannt Ulf Leser: Informationsintegration, Wintersemester 2006/2007 8

9 Instance-based Gegeben zwei Schemata mit Attributmengen A und B, jeweils mit darunter liegenden Daten. Kernidee Für jedes Attribute extrahiere interessante Eigenschaften der Daten Buchstabenverteilung, Länge, etc. Bilde Kreuzprodukt aller Attribute aus A und B. Für jedes Paar vergleiche Ähnlichkeit bzgl. der Eigenschaften Probleme Performanz (Sampling) Auswahl der Eigenschaften Vergleichsmethode Semantikfreie Daten Integer-IDs, Integer-Codes, Fast-leere Tabellen Ulf Leser: Informationsintegration, Wintersemester 2006/2007 9

10 Structure-based Beispiel: Similarity Flooding nach [MGMR02] Gegeben initiale Ähnlichkeit zwischen Schemaelementen (z.b. durch edit-distance oder durch Analyse der darunter liegenden Daten) Lasse Ähnlichkeiten abfärben auf die Nachbarn Nachbarn sind durch Struktur definiert Sind alle Nachbarn von x und y ähnlich zueinander, sind (vielleicht) auch x und y ein match. Analogie: Man flutet das Netzwerk der Ähnlichkeiten bis ein Gleichgewicht erreicht ist. Ulf Leser: Informationsintegration, Wintersemester 2006/

11 Erweiterungen n:1 und m:n Matches Viele Kombinationsmöglichkeiten Viele Funktionen denkbar Parsingregeln n:1 Matching Vorname Nachname concat() Name 1:n Matching Name extract() extract() Vorname Nachname m:n matching Name extract() Title extract() concat() First name Last name Ulf Leser: Informationsintegration, Wintersemester 2006/

12 Schema Matching Erweiterungen Globales Matching Matche Tabellen und Schemata, nicht nur Attribute Stable Marriage bzw. Maximum Weighted Matching A B C D Ulf Leser: Informationsintegration, Wintersemester 2006/

13 Stable Marriage Gegeben n Frauen (Attribute in Schema A) und m Männer (Attribute in Schema B) Monogamie Je eine Frau kann nur mit je einem Mann verheiratet sein Jede Frau hat eine Rangliste der Männer und umgekehrt Bei Schema Matching Attribut-Ähnlichkeit gemäß eines der vorigen Verfahren Rangliste ist (normalerweise) symmetrisch Gesucht: Paarung (globales Matching), so dass niemals gilt f1 heiratet m1, f2 heiratet m2, aber f1 bevorzugt m2 und m2 bevorzugt f1 (Instabil!) Ulf Leser: Informationsintegration, Wintersemester 2006/

14 Inhalt dieser Vorlesung Schema-X Schemaintegration Correspondence Assertions Generic Integration Model Ulf Leser: Informationsintegration, Wintersemester 2006/

15 Schemaintegration Erzeugung eines integrierten (globalen) Schemas aus den Exportschemata einer Menge von Datenquellen Zentrales Problem bei der Integration strukturierter Informationen Forderungen Vollständigkeit: Alle Daten der Quellsysteme sind repräsentiert Eigentlich nicht immer notwendig Korrektheit: Alle Daten werden semantisch korrekt repräsentiert Integritätsconstraints, Kardinalitäten, Minimal: Minimales oder wenigstens übersichtliches Schema Insbesondere redundanzfrei (Normalformen?) Ohne diese Forderung wäre Schemaintegration einfach wie? Verständlich Viel erforscht, insb. im Umfeld föderierter Datenbanken Ulf Leser: Informationsintegration, Wintersemester 2006/

16 Korrespondenzbasierte Schemaintegration Integriertes Schema Mapping/ Schema 1 Korrespondenzen Schema 2 Ulf Leser: Informationsintegration, Wintersemester 2006/

17 Einsatzszenarien Virtuelle Integration Integriertes Schema Mapping/ Schema 1 Korrespondenzen Schema 2 Korrespondenzen Korrespondenzen Materialisierte Integration Integriertes Schema Mapping/ Schema 1 Korrespondenzen Schema 2 Transformationen Transformationen Ulf Leser: Informationsintegration, Wintersemester 2006/

18 Verwandtes Problem Sichtintegration beim Design großer Systeme User 1 User 2 User 3 Requirement Requirement Requirement Consolidated schema Unterschied: Keine Daten Ulf Leser: Informationsintegration, Wintersemester 2006/

19 Integrationsschritte Vorintegration Auswahl der Integrationsreihenfolge (immer binäre Einzelschritte) Konvertierung der Daten in kanonisches Datenmodell Schemavergleich Ermittlung von Korrespondenzen Zwischen Attributen, Anfragen, Ermittlung von Konflikten Strukturell und semantisch Schemaangleichung Umformung der Einzelschema zur Behebung von Konflikten Umbenennungen, Restrukturierungen Erzeugt leichter zu integrierende Ausgangsschemata Schemafusion Erstellung des integrierten Schemas aufgrund der Korrespondenzen Auflösung aller Konflikte Wahl einer der möglichen Repräsentationsform Auch Schemaintegration verlangt nach Schemadesign Ulf Leser: Informationsintegration, Wintersemester 2006/

20 Methoden und Verfahren In der Literatur wurden viele Verfahren vorgestellt Upward inheritence Assertion-based integration Object-oriented schema integration Generic Integration Model Carnot Pegasus... Meist eher Vorgehensbeschreibungen als Algorithmen Keine kommerziellen oder prototypischen Implementierungen verfügbar Wir besprechen zwei Beispiele (später) Ulf Leser: Informationsintegration, Wintersemester 2006/

21 Fusion Beispieloperationen Ausgangspunkt ist immer eine Korrespondenz zwischen zwei Klassen Wir verwenden ein objektorientiertes Datenmodell Natürliches Vorgehen für Inklusionsbeziehungen Im relationalen Model sind Inklusionsbeziehungen deutlich schwieriger Fall 1: E E, aber verschiedene Attributmengen Fall 2: E1 E2 Fall 3: E1 und E2 sind extensional disjunkt, aber intensional verwandt Fall 4: E1 überlappt E2 Quelle z.t.: Rahm, Leipzig Ulf Leser: Informationsintegration, Wintersemester 2006/

22 Schemavereinfachung Durch Integrationsschritte entstehen oft unnötig komplizierte Schema Sinnvoll: Ein expliziter Vereinfachungsschritt Ulf Leser: Informationsintegration, Wintersemester 2006/

23 Korrespondenzbasiertes Verfahren [SPD92] Ausgangschemata werden im GDM ausgedrückt Generic Data Model Klassen, komplexe und einfache Attribute, Beziehungen Eng verwandt zu E/R Modellen Subsumiert manche Datenmodelle, manche nicht Keine Vererbung Correspondence Assertations (CA) Korrespondenzen zwischen Klassen und Attributen Korrespondenzen zwischen Pfaden von Klassen - Beziehungen Theoretisch alle Korrespondenztypen Wir (und [SPD92]) behandeln nur Äquivalenz Ulf Leser: Informationsintegration, Wintersemester 2006/

24 Integrationsregeln Eingabe Zwei Schemata im GDM Eine Menge von CA Ausgabe: Globales Schema S im GDM Fünf Integrationsregeln Elemente eines Schemas, die in keiner CA auftauchen, werden nach S übernommen Äquivalente Klassen werden mit der Vereinigung ihrer Attribute nach S übernommen Äquivalente direkte Beziehungen zwischen äquivalenten Klassen werden nach S übernommen A A, B B, A-B A -B : Dann wird A S -B S übernommen Pfade zwischen äquivalenten Klassen werden nach S übernommen A A, B B, A-B A -A 1 - -A m -B : Dann wird nur der längere Pfad übernommen Der kürzere wird dadurch subsumiert A A, B B, A-A 1 - -A n -B A -A 1 - -A m -B : Dann werden beide Pfade übernommen Da keine sichere Subsumption möglich Äquivalenzen zwischen einer Klasse und einem Attribut werden als Beziehungen nach S übernommen Eingeschränkte Behandlung schematischer Heterogenität Ulf Leser: Informationsintegration, Wintersemester 2006/

25 Beispiel CAs film spielfilm id film_id und titel name r_name regisseur filmstudio s_name filmstudio fuehrt_regie film s_name studio spielfilm r_name regisseur fuehrt_regie film regisseur-spielfilm Ulf Leser: Informationsintegration, Wintersemester 2006/

26 Beispiel film spielfilm mit r_name regisseur filmstudio s_name filmstudio fuehrt_regie film s_name studio spielfilm r_name regisseur fuehrt_regie film regisseur spielfilm Integriertes Schema film und spielfilm verschmelzen Andere Relationen werden übernommen Film ID Titel Genre Umsatz Regisseur Studio_id Studio ID s_name adresse rechtsform Regisseur person_id r_name adresse alter Fuehrt_regie film_id regie_id Ulf Leser: Informationsintegration, Wintersemester 2006/2007 filmstudio 26

27 Beispiel film spielfilm mit r_name regisseur filmstudio s_name filmstudio fuehrt_regie film s_name studio spielfilm r_name regisseur fuehrt_regie film regisseur spielfilm Integriertes Schema film und spielfilm verschmelzen Andere Relationen werden übernommen regisseur und r_name werden verschmolzen und der Pfad r_nameregisseur-fuehrt_regie-film übernommen Pfade der Länge 1 fallen weg Film ID Titel Genre Umsatz regisseur Studio_id Regisseur person_id r_name adresse alter Studio ID s_name adresse rechtsform Fuehrt_regie film_id regie_id Ulf Leser: Informationsintegration, Wintersemester 2006/2007 filmstudio 27

28 Beispiel film spielfilm mit r_name regisseur filmstudio s_name filmstudio fuehrt_regie film s_name studio spielfilm r_name regisseur fuehrt_regie film regisseur spielfilm Integriertes Schema film und spielfilm verschmelzen Andere Relationen werden übernommen regisseur und r_name werden verschmolzen und der Pfad r_nameregisseur-fuehrt_regie-film übernommen Pfade der Länge 1 fallen weg filmstudio und s_name werden nicht verschmolzen, da beide Pfade Länge > 1 haben; beide Pfade werden übernommen Film ID Titel Genre Umsatz Studio_id Regisseur person_id r_name adresse alter Studio ID s_name adresse rechtsform Studio besitzt Rechte? Hier wurde gedreht? Fuehrt_regie film_id regie_id Ulf Leser: Informationsintegration, Wintersemester 2006/2007 filmstudio 28

29 Bewertung Bietet befriedigende Behandlung nur für Äquivalenzkorrespondenzen Das ist aber ein eher seltener Fall Weiterentwicklung ist nicht erfolgt Keine Integration von nicht-binären Beziehungen Generiert komplexe und große Schemata Beide Pfade werden übernommen : Übernahme des kleinsten gemeinsamen Nenners bzw. der flexibelsten Struktur Paper gibt auch Ableitung von Regeln zur Datentransformationsregeln an Ulf Leser: Informationsintegration, Wintersemester 2006/

30 Generic Integration Model [Sch98] GIM: Generic Integration Model Entwickelt an der Uni Magdburg Focus: Integration von Spezialisierungshierarchien in objektorientierten Schemata Terminologie: Extension: Menge der Objekte einer Klasse Intension: Menge der Attribute einer Klasse Ulf Leser: Informationsintegration, Wintersemester 2006/

31 Übersicht Schritt 1: Extensionale Zerlegung Finde extensionale Überlappung Duplikaterkennung! Berechne Menge aller disjunkten Extensionen Bisherige Extensionen sind Vereinigungen daraus Schritt 2: Intensionale Zerlegung Finde intensionale Überlappungen Homonyme, Synonyme von Attributen Behandle Probleme auf Attributebene (Transformationen, 1:n, ) Schritt 3: Berechnung der GIM Matrix Schritt 4: Berechnung des integrierten Schemas Ulf Leser: Informationsintegration, Wintersemester 2006/

32 Beispiel Ulf Leser: Informationsintegration, Wintersemester 2006/

33 Extensionale Zerlegung S1.books S1.publication S1.books S2.books Ergibt fünf disjunkte Extensionen M4 M3 M1 M2 M3 M4 M5 not S1.book and S2.book, S2.book S2.book not S1.book S1.Pub, not S1.book Only S2.book S1.publicati X X X X S1.book X X S2.book X X X M1 M2 M5 Ulf Leser: Informationsintegration, Wintersemester 2006/

34 Intensionale Zerlegung Berechnung von Attributmengen Grundannahme: Gleiche Attribute gleiche Semantik Drei disjunkte Mengen X1 PubNr Title X2 Author Publisher X3 ISBN Price S1.publica X X X S1.book i X X X X X X S2.book X X X X X Ulf Leser: Informationsintegration, Wintersemester 2006/

35 GIM Matrix Kombiniere intensionale und extensionale Zerlegungen Welche Extensionen haben welche Intensionen? Berechnung aller kleinsten unterschiedlichen Einheiten M1 M2 M3 M4 M5 not S1.book and S2.book, S2.book S2.book not S1.book S1.Pub, not S1.book Only S2.book S1.publisher X X X X S1.book X X S2.book X X X X1 PubNr Title X2 Author Publisher X3 ISBN Price S1.publish X X X S1.book X X X X X S2.book X X X X X M1 M2 M3 M4 M5 X1 X X X X X2 X X X X X X3 X X X X Ulf Leser: Informationsintegration, Wintersemester 2006/

36 Sortierung der GIM Matrix Permutation der Spalten und der Zeilen Ziel: Lücken nach rechts-unten bewegen Dabei gibt es einige Freiheitsgrade Auswirkungen auf das integrierte Schema M1 M2 M3 M4 M5 X1 X X X X X2 X X X X X X3 X X X X Vertausche X1 und X2 M1 M2 M3 M4 M5 X2 X X X X X X1 X X X X X3 X X X X Schiebe M1 vor M5 M2 M3 M4 M1 M5 X2 X X X X X X1 X X X X X3 X X X X Ulf Leser: Informationsintegration, Wintersemester 2006/

37 Schemaableitung Blöcke der Matrix ergeben Klassen Mehr Zeilen und weniger Spalten Unterklasse Lücken in den Blöcken bestimmen Eltern Ziel: Keine Attribute ohne Werte M2 M3 M4 M1 M5 X2 X X X X X X1 X X X X X3 X X X X All_publications Title Author M2 M3 M4 M1 M5 X2 X X X X X X1 X X X X X3 X X X X M2 M3 M4 M1 M5 X2 X X X X X X1 X X X X X3 X X X X M2 M3 M4 M1 M5 X2 X X X X X X1 X X X X X3 X X X X All_pubs_s1 PubNr All_books_s1 Publisher ISBN Price Only_S2 Publisher ISBN Price Ulf Leser: Informationsintegration, Wintersemester 2006/

38 Eigenschaften von GIM Elegante Methode Einige Einschränkungen Keine Behandlung von Assoziationen Keine Behandlung schematischer Konflikte Attribute müssen sich 1:1 transformieren lassen Die Schwierigkeiten liegen in den beiden ersten Schritten Bestimmung der Zerlegungen Wenn man die kennt, hat man alle Korrespondenzen implizit gefunden GIM hilft dann vor allem bei der Erzeugung des integrierten Schemas Versucht immer, einer einzige Hierarchie zu erzeugen Neigt zu großen und komplexen Hierarchien Attribute mit NULL werden zunächst nicht in Kauf genommen Ulf Leser: Informationsintegration, Wintersemester 2006/

39 Fazit Schemaintegration Generelles Vorgehen Korrespondenzen finden Daraus Schema ableiten Viele ungelöste Probleme Verfahren nur halbautomatisch Neigen alle zu sehr großen, komplexen Schemata Aufgrund der Forderung nach Vollständigkeit Kein Ansatz kann alle Arten von Heterogenität auflösen Schemaintegration nur ein Zwischenschritt zur Informationsintegration Nächstes Problem: Data Exchange [FKMP03] Transformationsregeln für existierende Daten ableiten Neuer Terminus: Schema Management [BLP00] Ziel: Algebra zum Umgang mit Schemata Ulf Leser: Informationsintegration, Wintersemester 2006/

40 Literatur [Con97] Conrad, S. (1997). "Föderierte Datenbanksysteme: Konzepte der Datenintegration". Berlin, Springer-Verlag. [Sch98] Schmitt, I. (1998). "Schemaintegration fuer den Entwurf föderierter Datenbanken". Sankt Augustin, Infix Verlag. [BLN86] Batini, C., Lenzerini, M. and Navathe, S. B. (1986). "A Comparative Analysis of Methodologies for Database Schema Integration." ACM Computing Surveys 18(4): [SPD92] Spaccapietra, S., Parent, C. and Dupont, Y. (1992). "Model Independent Assertions for Integration of Heterogeneous Schemas." The VLDB Journal 1(1): [BLP00] Bernstein, P. A., Levy, A. Y. and Pottinger, R. A. (2000). "A Vision of Management of Complex Models." SIGMOD Record 29(4): [FKMP03] Fagin, R., Kolaitis, P. G., Miller, R. J. and Popa, L. (2003). "Data Exchange: Semantics and Query Answering". 9th International Conference on Database Theory, Siena, Italy. pp Ulf Leser: Informationsintegration, Wintersemester 2006/

Informationsintegration Schema Mapping Felix Naumann

Informationsintegration Schema Mapping Felix Naumann Informationsintegration Schema Mapping 8.5.2012 Felix Naumann Erste Hälfte 2 Problemstellung Einführung in die Informationsintegration Szenarien der Informationsintegration Verteilung und Autonomie Heterogenität

Mehr

Extraktion, Transformation, Laden (ETL)

Extraktion, Transformation, Laden (ETL) Extraktion, Transformation, Laden (ETL) ETL-Prozeß Integrationsschritte Integrationsprobleme fi Konflikte und deren Klassifikation fi Behebung von Konflikten Data Cleaning VL Data Warehouses, WS 2000/2001

Mehr

Extraktion, Transformation, Laden (ETL)

Extraktion, Transformation, Laden (ETL) Extraktion, Transformation, Laden (ETL) ETL-Prozeß Integrationsschritte Integrationsprobleme Konflikte und deren Klassifikation Behebung von Konflikten Data Cleaning Vorlesung Data-Warehouse-Technologien

Mehr

30. Juni 2006 - Technische Universität Kaiserslautern. Paul R. Schilling

30. Juni 2006 - Technische Universität Kaiserslautern. Paul R. Schilling 30. Juni 2006 - Technische Universität Kaiserslautern Paul R. Schilling ! " #$% & '( ( ) *+, - '. / 0 1 2("$ DATEN SIND ALLGEGENWÄRTIG Bill Inmon, father of data warehousing Unternehmen In einer vollkommenen

Mehr

Schema Mapping. Armin Roth 25.04.2013. arminroth.de. Armin Roth (arminroth.de) II Schema Mapping 25.04.2013 1 / 23

Schema Mapping. Armin Roth 25.04.2013. arminroth.de. Armin Roth (arminroth.de) II Schema Mapping 25.04.2013 1 / 23 Schema Mapping Armin Roth arminroth.de 25.04.2013 Armin Roth (arminroth.de) II Schema Mapping 25.04.2013 1 / 23 Agenda 1 Wiederholung: Schema Mapping 2 Logische Mappings 3 Erzeugung der Anfragen Armin

Mehr

Modellbasierter Entwurf föderierter Informationssysteme

Modellbasierter Entwurf föderierter Informationssysteme Diese Arbeit baut auf auf eine Reihe von Vorarbeiten bei der Fachgruppe Computergestützte Informationssysteme der TU Berlin und am Fraunhofer ISST, die sich mit dem komplexen Gebiet der Definition, Verwaltung

Mehr

Theorie zur Übung 8 Datenbanken

Theorie zur Übung 8 Datenbanken Theorie zur Übung 8 Datenbanken Relationale Datenbanksysteme Ein relationales Datenbanksystem (RDBS) liegt vor, wenn dem DBS ein relationales Datenmodell zugrunde liegt. RDBS speichern Daten in Tabellenform:

Mehr

3. Das Relationale Datenmodell

3. Das Relationale Datenmodell 3. Das Relationale Datenmodell Das Relationale Datenmodell geht zurück auf Codd (1970): E. F. Codd: A Relational Model of Data for Large Shared Data Banks. Comm. of the ACM 13(6): 377-387(1970) DBMS wie

Mehr

Datenintegration. Kapitel 1: Einführung. Michael Hartung in Vertretung von Dr. Andreas Thor Wintersemester 2010/11

Datenintegration. Kapitel 1: Einführung. Michael Hartung in Vertretung von Dr. Andreas Thor Wintersemester 2010/11 Datenintegration Datenintegration Kapitel 1: Einführung Michael Hartung in Vertretung von Dr. Andreas Thor Wintersemester 2010/11 Universität Leipzig Institut für Informatik http://dbs.uni-leipzig.de 1

Mehr

Präsentation zum Thema XML Datenaustausch und Integration

Präsentation zum Thema XML Datenaustausch und Integration Sebastian Land Präsentation zum Thema XML Datenaustausch und Integration oder Warum eigentlich XML? Gliederung der Präsentation 1. Erläuterung des Themas 2. Anwendungsbeispiel 3. Situation 1: Homogene

Mehr

Aktuelles Schlagwort Semi-strukturierte Daten

Aktuelles Schlagwort Semi-strukturierte Daten Aktuelles Schlagwort Semi-strukturierte Daten François Bry, Michael Kraus, Dan Olteanu und Sebastian Schaffert Institut für Informatik, Universität München, Oettingenstraße 67, 80538 München, http://www.pms.informatik.uni-muenchen.de

Mehr

Semantische Datenintegration: Strategien zur Integration von Datenbanken

Semantische Datenintegration: Strategien zur Integration von Datenbanken Semantische Datenintegration: Strategien zur Integration von Datenbanken Inhalt 1. Wiederholung Integrationskonflikte 2. Klassische Strategien zur Integration 1. Eng gekoppelte Ansätze 2. Lose gekoppelte

Mehr

Informationsintegration

Informationsintegration Informationsintegration Heterogenität Transparenz Ulf Leser Wissensmanagement in der Bioinformatik Klassifikationsdimensionen Verteilung Autonomie Heterogenität Ulf Leser: Informationsintegration, Wintersemester

Mehr

Ausgangspunkt. Datenintegration. Ziel. Konflikte. Architekturen. Transparenz

Ausgangspunkt. Datenintegration. Ziel. Konflikte. Architekturen. Transparenz Ausgangspunkt Datenintegration Web Informationssysteme Wintersemester 2002/2003 Donald Kossmann Daten liegen in verschiedenen Datenquellen (Extremfall: jede URL eigene Datenquelle) Mietautos bei www.hertz.com

Mehr

Integration lokaler Daten in ifuice

Integration lokaler Daten in ifuice : Integration lokaler Daten in ifuice Bearbeiter: Sarah Gebhardt Betreuer: Andreas Thor Seite 1 Motivation Warum eine Integration lokaler Daten? Viele Infos im Web, aber andere Listen im Web, aber nicht

Mehr

Datenintegration. Kapitel 1: Einführung. Andreas Thor Sommersemester 2008. Inhalt

Datenintegration. Kapitel 1: Einführung. Andreas Thor Sommersemester 2008. Inhalt Datenintegration Datenintegration Kapitel 1: Einführung Andreas Thor Sommersemester 2008 Universität Leipzig Institut für Informatik http://dbs.uni-leipzig.de 1 Inhalt Begriffsdefinition Anwendungsgebiete

Mehr

Extraktion, Transformation, Laden (ETL)

Extraktion, Transformation, Laden (ETL) Extraktion, Transformation, Laden (ETL) ƒ ETL-Prozeß ƒ Integrationsschritte ƒ Integrationsprobleme Konflikte und deren Klassifikation Behebung von Konflikten ƒ Data Cleaning Vorlesung Data-Warehouse-Technologien

Mehr

Vorlesung Datenbank-Entwurf Klausur

Vorlesung Datenbank-Entwurf Klausur Dr. Stefan Brass 3. Juli 2002 Institut für Informatik Universität Giessen Vorlesung Datenbank-Entwurf Klausur Name: Geburtsdatum: Geburtsort: (Diese Daten werden zur Ausstellung des Leistungsnachweises

Mehr

Rückblick: Datenbankentwurf

Rückblick: Datenbankentwurf Rückblick: Datenbankentwurf Entity-Relationship-Modell für konzeptuellen Entwurf Entitytypen (entity types) (z.b. Studenten) Beziehungstypen (relationships) (z.b. hören) Attribute beschreiben Gegenstände

Mehr

Arbeitsblätter zu Teil I des Praktikums

Arbeitsblätter zu Teil I des Praktikums Arbeitsblätter zu Teil I des Praktikums Allgemeine Hilfsmittel Bitte benutzen Sie bei Schwierigkeiten mit spezifischem Domänenwissen das Internet als Recherchemöglichkeit (beispielsweise Google oder Wikipedia).

Mehr

Kapitel 7: Formaler Datenbankentwurf

Kapitel 7: Formaler Datenbankentwurf 7. Formaler Datenbankentwurf Seite 1 Kapitel 7: Formaler Datenbankentwurf Die Schwierigkeiten der konzeptuellen Modellierung sind zu einem großen Teil dadurch begründet, dass sich die relevanten Strukturen

Mehr

Speicherung von XML in (objekt-)relationalen Datenbanken. Burkhard Schäfer

Speicherung von XML in (objekt-)relationalen Datenbanken. Burkhard Schäfer Speicherung von XML in (objekt-)relationalen Datenbanken Burkhard Schäfer Übersicht Motivation Anforderungen Ansätze modellorientiert strukturorientiert Zusammenfassung Motivation Warum XML in Datenbanken

Mehr

Daten-Definitionssprache (DDL) Bisher: Realwelt -> ERM -> Relationen-Modell -> normalisiertes Relationen-Modell. Jetzt: -> Formulierung in DDL

Daten-Definitionssprache (DDL) Bisher: Realwelt -> ERM -> Relationen-Modell -> normalisiertes Relationen-Modell. Jetzt: -> Formulierung in DDL Daten-Definitionssprache (DDL) Bisher: Realwelt -> ERM -> Relationen-Modell -> normalisiertes Relationen-Modell Jetzt: -> Formulierung in DDL Daten-Definitionssprache (DDL) DDL ist Teil von SQL (Structured

Mehr

Konzeptueller Entwurf

Konzeptueller Entwurf Konzeptueller Entwurf UML Klassendiagrame UML Assoziationen Entspricht Beziehungen Optional: Assoziationsnamen Leserichtung ( oder ), sonst bidirektional Rollennamen Kardinalitätsrestriktionen UML Kardinalitätsrestriktionen

Mehr

Präsentation der Bachelorarbeit

Präsentation der Bachelorarbeit Präsentation der Bachelorarbeit Einrichtung einer BI-Referenzumgebung mit Oracle 11gR1 Jörg Bellan Hochschule Ulm Fakultät Informatik Institut für Betriebliche Informationssysteme 15. Oktober 2009 Agenda

Mehr

Declarative Data Cleaning

Declarative Data Cleaning Declarative Data Cleaning Vortragsgrundlage: Helena Galhardas, Daniela Florescu, Dennis Shasha, Eric Simon, Cristian Augustin Saita: Declarative Data Cleaning: Language, Model, and Algorithms, in VLDB

Mehr

Datenmanagement in Android-Apps. 16. Mai 2013

Datenmanagement in Android-Apps. 16. Mai 2013 Datenmanagement in Android-Apps 16. Mai 2013 Überblick Strukturierung von datenorientierten Android-Apps Schichtenarchitektur Möglichkeiten der Datenhaltung: in Dateien, die auf der SDCard liegen in einer

Mehr

Cognitive Systems Master thesis

Cognitive Systems Master thesis Cognitive Systems Master thesis Recherche Phase SS 2011 Gliederung 1. Einleitung 2. Analogie Modelle 2.1 SME 2.2 Ava 2.3 Lisa 3. Zusammenfassung 4. Ausblick 2 Einleitung Analogie Problemsituation wird

Mehr

Allgemeines zu Datenbanken

Allgemeines zu Datenbanken Allgemeines zu Datenbanken Was ist eine Datenbank? Datensatz Zusammenfassung von Datenelementen mit fester Struktur Z.B.: Kunde Alois Müller, Hegenheimerstr. 28, Basel Datenbank Sammlung von strukturierten,

Mehr

Fundamentals of Software Engineering 1

Fundamentals of Software Engineering 1 Folie a: Name Fundamentals of Software Engineering 1 Grundlagen der Programmentwurfstechnik 1 Sommersemester 2012 Dr.-Ing. Stefan Werner Fakultät für Ingenieurwissenschaften Folie 1 Inhaltsverzeichnis

Mehr

1. Einführung. Datenbanken Grundlagen

1. Einführung. Datenbanken Grundlagen 1. Einführung Datenbanken Grundlagen Wo finden wir Datenbanken? Was sind Datenbanken/ Datenbankensysteme(DBS)? A collection of related data items mit folgenden Eigenschaften: Eine Datebank repräsentiert

Mehr

10. Vorlesung: Datenorganisation SS 2007

10. Vorlesung: Datenorganisation SS 2007 10. Vorlesung: Datenorganisation SS 2007 8 Parallele Transaktionen 9 9.1 Drei-Ebenen Ebenen-Architektur 9.2 Verteilte Datenbanken 9.3 Client-Server Server-Datenbanken 9.4 Föderierte Datenbanken 9.5 Das

Mehr

Formen der Heterogenität

Formen der Heterogenität 16. Juli 2004 Überblick Integration Migration Nachrichtenaustausch Überblick Datenmodellheterogenität Semantische Heterogenität Strukturelle Heterogenität Integration Migration Nachrichtenaustausch Integration

Mehr

Objektorientierte Datenmodelle und - verwaltung

Objektorientierte Datenmodelle und - verwaltung Schlagworte der 90er: Objektorientiertes GIS OpenGIS Case-Tool Geoökologe Legt Problemstellung fest (Art, Anzahl, Dimension, Skalierung) Wählt Koordinatensystem Wählt Fachattribute OOUI (object-oriented

Mehr

Kapitel 12: Schnelles Bestimmen der Frequent Itemsets

Kapitel 12: Schnelles Bestimmen der Frequent Itemsets Einleitung In welchen Situationen ist Apriori teuer, und warum? Kapitel 12: Schnelles Bestimmen der Frequent Itemsets Data Warehousing und Mining 1 Data Warehousing und Mining 2 Schnelles Identifizieren

Mehr

Enterprise Applikation Integration und Service-orientierte Architekturen. 02 Integrationskonflikte

Enterprise Applikation Integration und Service-orientierte Architekturen. 02 Integrationskonflikte Enterprise Applikation Integration und Service-orientierte Architekturen 02 Integrationskonflikte Was ist bei einer Datenintegration zu beachten? Werden die richtigen Daten bereitgestellt? Wie erwartet

Mehr

DBMS für spezielle Anwendungen XML als Mittel der Datenbank-Interoperabilität

DBMS für spezielle Anwendungen XML als Mittel der Datenbank-Interoperabilität DBMS für spezielle Anwendungen XML als Mittel der Datenbank-Interoperabilität Seminarvortrag von D. Zimmermann 26-Februar-2004 Gliederung Datenbanken und Interoperabilität Begriffe Bedarf Ansätze XML als

Mehr

10. Datenbank Design 1

10. Datenbank Design 1 1 Die Hauptaufgabe einer Datenbank besteht darin, Daten so lange zu speichern bis diese explizit überschrieben oder gelöscht werden. Also auch über das Ende (ev. sogar der Lebenszeit) einer Applikation

Mehr

Informationsintegration I Einführung

Informationsintegration I Einführung Informationsintegration I Einführung Felix Naumann Integrierte Informationssysteme Anfrage Integriertes Informationssystem Oracle, DB2 Anwendung Dateisystem Web Service HTML Form Integriertes Info.-system

Mehr

3. Spezielle ER-Modelle und Tabellenableitung. Transformation von ER-Diagrammen in Relationen

3. Spezielle ER-Modelle und Tabellenableitung. Transformation von ER-Diagrammen in Relationen 3. Spezielle ER-Modelle und Tabellenableitung Spezialfälle von ER-Modellen Grundlage, was sind Relationen Transformation von ER-Diagrammen in Relationen 56 Lesebeispiel Access (Realisierungmodell!) 57

Mehr

Grundlagen von Datenbanken

Grundlagen von Datenbanken Agenda: Grundlagen von Datenbanken SS 2010 3. Relationale Algebra Prof. Dr. Stefan Böttcher Universität Paderborn mit Material von Prof. Dr. Gregor Engels Grundlagen von Datenbanken - SS 2010 - Prof. Dr.

Mehr

Der Tabellenname wird in Grossbuchstaben geschrieben.

Der Tabellenname wird in Grossbuchstaben geschrieben. Datenbanken: Abbildungsregeln 1 Tabellen Einleitung Da ein relationales Datenbankschema als Objekte nur Tabellen zulässt, müssen sowohl die Entitäts- als auch die Beziehungsmengen in Tabellenform ausgedrückt

Mehr

Grundlagen von Datenbanksystemen

Grundlagen von Datenbanksystemen Ramez Elmasri Shamkant B. Navathe Grundlagen von Datenbanksystemen 3., überarbeitete Auflage ein Imprint der Pearson Education Deutschland GmbH Inhaltsverzeichnis Vorwort 9 Über die Autoren 13 Teil 1 Grundkonzepte

Mehr

Vorstellung. Collaborative CAD/CAE Integration (C3I)

Vorstellung. Collaborative CAD/CAE Integration (C3I) Vorstellung Collaborative CAD/CAE Integration (C3I) Projektleiter: Thomas Merkt, Porsche AG Projektkoordinator: Dr. Marcus Krastel, :em AG 2008, ProSTEP ivip / VDA, 08-12-11 Abgrenzung zum Vorgängerprojekt

Mehr

Data Lakes: Lösung oder neue Herausforderung für Data-Integration

Data Lakes: Lösung oder neue Herausforderung für Data-Integration Data Lakes: Lösung oder neue Herausforderung für Big-Data Data-Integration Integration? PD Dr. Christoph Quix Fraunhofer-Institut für Angewandte Informationstechnik FIT Life Science Informatics Abteilungsleiter

Mehr

Einleitung Projektion Selektion Join Mengenop. Vollst.keit. Einleitung Projektion. Selektion Join. Vollst.keit. Einleitung Projektion Selektion Join

Einleitung Projektion Selektion Join Mengenop. Vollst.keit. Einleitung Projektion. Selektion Join. Vollst.keit. Einleitung Projektion Selektion Join Parsen der Anfrage (SQL) Transformation in eine Standardform (Relationenalgebra) Logische Optimierung Transformation in alternative Zugriffspläne, Physische Optimierung Ausführung des gewählten Zugriffsplans

Mehr

Uni Duisburg-Essen Fachgebiet Informationssysteme Prof. Dr. N. Fuhr

Uni Duisburg-Essen Fachgebiet Informationssysteme Prof. Dr. N. Fuhr Raum: LF 230 Bearbeitung: 9.-11. Mai 2005 Datum Gruppe Vorbereitung Präsenz Aktuelle Informationen unter: http://www.is.informatik.uni-duisburg.de/courses/dbp_ss03/ Tabellen in IBM DB2 Tabellen Eine relationale

Mehr

Informationsintegration

Informationsintegration Informationsintegration Verteilung, Autonomie, Heterogenität, Transparenz Ulf Leser Inhalt dieser Vorlesung Verteilung Autonomie Heterogenität Transparenz Ulf Leser: Informationsintegration 2 Klassifikationsdimensionen

Mehr

Kapitel 3: Eigenschaften von Integrationssystemen. Einordnung von Integrationssystemen bzgl. Kriterien zur Beschreibung von Integrationssystemen

Kapitel 3: Eigenschaften von Integrationssystemen. Einordnung von Integrationssystemen bzgl. Kriterien zur Beschreibung von Integrationssystemen Datenintegration Datenintegration Kapitel 3: Eigenschaften von Integrationssystemen Andreas Thor Sommersemester 2008 Universität Leipzig Institut für Informatik http://dbs.uni-leipzig.de 1 Inhalt Einordnung

Mehr

D1: Relationale Datenstrukturen (14)

D1: Relationale Datenstrukturen (14) D1: Relationale Datenstrukturen (14) Die Schüler entwickeln ein Verständnis dafür, dass zum Verwalten größerer Datenmengen die bisherigen Werkzeuge nicht ausreichen. Dabei erlernen sie die Grundbegriffe

Mehr

Das Entity-Relationship-Modell. Prof. Dr. T. Kudraß 1

Das Entity-Relationship-Modell. Prof. Dr. T. Kudraß 1 Das Entity-Relationship-Modell Prof. Dr. T. Kudraß 1 Datenmodell Datenmodelle System von Konzepten zur abstrakten Darstellung eines Ausschnitts der realen Welt mittels Daten Verschiedene Abstraktionsebenen

Mehr

Teil 7: Einführung in den logischen Entwurf

Teil 7: Einführung in den logischen Entwurf 7. Einführung in den logischen Entwurf 7-1 Teil 7: Einführung in den logischen Entwurf Literatur: Elmasri/Navathe:Fundamentals of Database Systems, 3. Auflage, 1999. Chapter 3, Data Modeling Using the

Mehr

Verwandt, logisch kohärent, zweckspezifisch, an reale Welt orientiert. Entität kann in einer oder mehreren Unterklassen sein

Verwandt, logisch kohärent, zweckspezifisch, an reale Welt orientiert. Entität kann in einer oder mehreren Unterklassen sein 1 Definitionen 1.1 Datenbank Verwandt, logisch kohärent, zweckspezifisch, an reale Welt orientiert Integriert, selbstbeschreibend, verwandt 1.2 Intension/Extension Intension: Menge der Attribute Extension:

Mehr

Klassifikation von Integrationskonflikten

Klassifikation von Integrationskonflikten Klassifikation von Integrationskonflikten Christiane Telöken 1 Inhaltsverzeichnis 1. Was bedeutet Integration? 2. Strukturelle Heterogenitätskonflikte 2.1 Konflikte bei bilateralen Korrespondenzen 2.2

Mehr

Dieser Foliensatz darf frei verwendet werden unter der Bedingung, dass diese Titelfolie nicht entfernt wird.

Dieser Foliensatz darf frei verwendet werden unter der Bedingung, dass diese Titelfolie nicht entfernt wird. Thomas Studer Relationale Datenbanken: Von den theoretischen Grundlagen zu Anwendungen mit PostgreSQL Springer, 2016 ISBN 978-3-662-46570-7 Dieser Foliensatz darf frei verwendet werden unter der Bedingung,

Mehr

Szenario: B2B Lösung W4F / Lixto /

Szenario: B2B Lösung W4F / Lixto / Unterschiede und Gemeinsamkeiten XML als Web Datenformat Motivation HTML Dokumentorientiert Flexibilität Layout Präsentation Datenbanken Datenorientiert Abstraktion Anfragesprache Manipulationssprache

Mehr

Inhaltsverzeichnis. Kurzfassung. Abstract

Inhaltsverzeichnis. Kurzfassung. Abstract Inhaltsverzeichnis Kurzfassung Abstract Inhaltsverzeichnis iii v vii 1 Einleitung 1 1.1 Problemstellung und Einordnung der Arbeit 1 1.2 Lösungsansatz 7 L3 Verwandte Arbeiten S 1.3.1 Datenbank-Suchmaschmen

Mehr

Integration, Migration und Evolution

Integration, Migration und Evolution 14. Mai 2013 Programm für heute 1 2 Quelle Das Material zu diesem Kapitel stammt aus der Vorlesung Datenintegration & Datenherkunft der Universität Tübingen gehalten von Melanie Herschel im WS 2010/11.

Mehr

ACCESS SQL ACCESS SQL

ACCESS SQL ACCESS SQL ACCESS SQL Datenbankabfragen mit der Query-Language ACCESS SQL Datenbankpraxis mit Access 34 Was ist SQL Structured Query Language Bestehend aus Datendefinitionssprache (DDL) Datenmanipulationssprache

Mehr

Kollaboratives Data Warehousing - Konzeption und prototypische Realisierung flexibler Schemaund Datenintegration

Kollaboratives Data Warehousing - Konzeption und prototypische Realisierung flexibler Schemaund Datenintegration Association for Information Systems AIS Electronic Library (AISeL) Wirtschaftinformatik Proceedings 2007 Wirtschaftinformatik 2-28-2007 Kollaboratives Data Warehousing - Konzeption und prototypische Realisierung

Mehr

Vorlesung Datenbanktheorie. Church-Rosser-Eigenschaft der Verfolgungsjagd. Berechnung von chase(t, t, Σ) Vorlesung vom Mittwoch, 05.

Vorlesung Datenbanktheorie. Church-Rosser-Eigenschaft der Verfolgungsjagd. Berechnung von chase(t, t, Σ) Vorlesung vom Mittwoch, 05. Vorlesung Datenbanktheorie Nicole Schweikardt Humboldt-Universität zu Berlin Sommersemester 2006 Vorlesung vom Mittwoch, 05. Juli 2006 Letzte Vorlesung: Kurze Bemerkungen zum Armstrong-Kalkül The Chase:

Mehr

Datenbanksysteme Teil 3 Indizes und Normalisierung. Stefan Maihack Dipl. Ing. (FH) Datum:

Datenbanksysteme Teil 3 Indizes und Normalisierung. Stefan Maihack Dipl. Ing. (FH) Datum: Datenbanksysteme Teil 3 Indizes und Normalisierung Stefan Maihack Dipl. Ing. (FH) Datum: 01.11.2005 1 MySQL - Normalisierung Durch die Normalisierung von Tabellen soll folgendes erreicht werden Redundanzfreie,

Mehr

Design Theorie für relationale Datenbanken

Design Theorie für relationale Datenbanken Design Theorie für relationale Datenbanken Design von relationalen Datenbanken alternativen Datenabhängigkeiten Normalisierung Ziel: automatisches Datenbankdesign IX-1 Schlechtes Datenbank Design Frage:

Mehr

Data Warehousing. Sommersemester 2005. Ulf Leser Wissensmanagement in der Bioinformatik

Data Warehousing. Sommersemester 2005. Ulf Leser Wissensmanagement in der Bioinformatik Data Warehousing Sommersemester 2005 Ulf Leser Wissensmanagement in der Bioinformatik ... Der typische Walmart Kaufagent verwendet täglich mächtige Data Mining Werkzeuge, um die Daten der 300 Terabyte

Mehr

Ein Schlüssel ist eine Menge von Attributen (also eines oder mehrere), die eine Datenzeile (Tupel) einer Tabelle eindeutig identifiziert

Ein Schlüssel ist eine Menge von Attributen (also eines oder mehrere), die eine Datenzeile (Tupel) einer Tabelle eindeutig identifiziert Maika Büschenfeldt Datenbanken: Skript 1 1. Was ist eine relationale Datenbank? In Datenbanken können umfangreiche Datenbestände strukturiert abgelegt werden. Das Konzept relationaler Datenbanken soll

Mehr

KONZEPTUELLES DATENBANKEN-DESIGN

KONZEPTUELLES DATENBANKEN-DESIGN KONZEPTUELLES DATENBANKEN-DESIGN Batini, Ceri, Navathe, Conceptual Database Design, The Benjamin/Cummings Pub., 1992 ISBN 0-8053-0244-1 Part I: Kapitel 1 und Kapitel 2 II-1 Methode des Datenbanken-Designs

Mehr

Profilbezogene informatische Bildung in den Klassenstufen 9 und 10. Schwerpunktthema Daten und Datenbanken

Profilbezogene informatische Bildung in den Klassenstufen 9 und 10. Schwerpunktthema Daten und Datenbanken Profilbezogene informatische Bildung in den Klassenstufen 9 und 10 Schwerpunktthema Robby Buttke Fachberater für Informatik RSA Chemnitz Fachliche Einordnung Phasen relationaler Modellierung Fachlichkeit

Mehr

Domain-independent. independent Duplicate Detection. Vortrag von Marko Pilop & Jens Kleine. SE Data Cleansing

Domain-independent. independent Duplicate Detection. Vortrag von Marko Pilop & Jens Kleine. SE Data Cleansing SE Data Cleansing Domain-independent independent Duplicate Detection Vortrag von Marko Pilop & Jens Kleine http://www.informatik.hu-berlin.de/~pilop/didd.pdf {pilop jkleine}@informatik.hu-berlin.de 1.0

Mehr

Diplomarbeit: GOMMA: Eine Plattform zur flexiblen Verwaltung und Analyse von Ontologie Mappings in der Bio-/Medizininformatik

Diplomarbeit: GOMMA: Eine Plattform zur flexiblen Verwaltung und Analyse von Ontologie Mappings in der Bio-/Medizininformatik Diplomarbeit: GOMMA: Eine Plattform zur flexiblen Verwaltung und Analyse von Ontologie Mappings in der Bio-/Medizininformatik Bearbeiter: Shuangqing He Betreuer: Toralf Kirsten, Michael Hartung Universität

Mehr

Kapitel DB:III (Fortsetzung)

Kapitel DB:III (Fortsetzung) Kapitel DB:III (Fortsetzung) III. Konzeptueller Datenbankentwurf Einführung in das Entity-Relationship-Modell ER-Konzepte und ihre Semantik Charakterisierung von Beziehungstypen Existenzabhängige Entity-Typen

Mehr

Bioinformatik. Lokale Alignierung Gapkosten. Silke Trißl / Ulf Leser Wissensmanagement in der. Bioinformatik

Bioinformatik. Lokale Alignierung Gapkosten. Silke Trißl / Ulf Leser Wissensmanagement in der. Bioinformatik Bioinformatik Lokale Alignierung Gapkosten Silke Trißl / Ulf Leser Wissensmanagement in der Bioinformatik Inhalt dieser Vorlesung Ähnlichkeit Lokales und globales Alignment Gapped Alignment Silke Trißl:

Mehr

Universität zu Köln Informationsverarbeitung WS 2009/10. Datenbanken vs. Markup Prof. Dr. M.Thaller 25.11.2009. XML als Datenbank

Universität zu Köln Informationsverarbeitung WS 2009/10. Datenbanken vs. Markup Prof. Dr. M.Thaller 25.11.2009. XML als Datenbank Universität zu Köln Informationsverarbeitung WS 2009/10 HS: Dozent: Referentin: 25.11.2009 Datenbanken vs. Markup Prof. Dr. M.Thaller Frauke Schmidt XML als Datenbank Inhalt XML Datenbanken Anforderungen

Mehr

Anfragebearbeitung. Anfrage. Übersetzer. Ausführungsplan. Laufzeitsystem. Ergebnis

Anfragebearbeitung. Anfrage. Übersetzer. Ausführungsplan. Laufzeitsystem. Ergebnis Anfragebearbeitung Anfrage Übersetzer Ausführungsplan Laufzeitsystem Ergebnis Übersetzung SQL ist deklarativ, Übersetzung für Laufzeitsystem in etwas prozedurales DBMS übersetzt SQL in eine interne Darstellung

Mehr

Ad-hoc-Integration in schemabasierten P2P-Systemen

Ad-hoc-Integration in schemabasierten P2P-Systemen Ad-hoc-Integration in schemabasierten P2P-Systemen Marcel Karnstedt 1 Kai-Uwe Sattler 1 Eike Schallehn 2 Martin Endig 3 1 Technische Universität Ilmenau, Postfach 100565, 98684 Ilmenau 2 Universität Magdeburg,

Mehr

Software-Engineering Einführung

Software-Engineering Einführung Software-Engineering Einführung 7. Übung (04.12.2014) Dr. Gergely Varró, gergely.varro@es.tu-darmstadt.de Erhan Leblebici, erhan.leblebici@es.tu-darmstadt.de Tel.+49 6151 16 4388 ES Real-Time Systems Lab

Mehr

Informationsintegration

Informationsintegration Informationsintegration Anwendungsszenarien Ulf Leser Inhalt dieser Vorlesung Zwei Anwendungsszenarien Data Warehouse Föderierte Datenbanken Abgrenzung Daten versus Schema Ulf Leser: Informationsintegration

Mehr

Dieser Foliensatz darf frei verwendet werden unter der Bedingung, dass diese Titelfolie nicht entfernt wird.

Dieser Foliensatz darf frei verwendet werden unter der Bedingung, dass diese Titelfolie nicht entfernt wird. Thomas Studer Relationale Datenbanken: Von den theoretischen Grundlagen zu Anwendungen mit PostgreSQL Springer, 2016 ISBN 978-3-662-46570-7 Dieser Foliensatz darf frei verwendet werden unter der Bedingung,

Mehr

Abstraktionsschichten. Das Relationale Datenmodell

Abstraktionsschichten. Das Relationale Datenmodell Abstraktionsschichten. Das Relationale Datenmodell Verschiedene Abstraktionsebene Data in Beziehung zur Application Data in Beziehung zur Datenmodell Data in Beziehung zur physischen Darstellung Datenunabhängigkeit

Mehr

Informationsintegration Local-as-View: LaV. 15.6.2012 Felix Naumann

Informationsintegration Local-as-View: LaV. 15.6.2012 Felix Naumann Informationsintegration Local-as-View: LaV 15.6.2012 Felix Naumann Überblick 2 Motivation Korrespondenzen Übersicht Anfrageplanung Global as View (GaV) Local as View (LaV) Modellierung Anwendungen Anfragebearbeitung

Mehr

Servicebasierte Datenintegration

Servicebasierte Datenintegration Präsentation zur Seminararbeit Christoph Aßmann Aßmann, Christoph Leipzig, 26.01.2010 Folie 1 Inhalt Begriffe Motivation Abgrenzung Grid Cloud OGSA: Architektur servicebasierter Grids Standardisierung

Mehr

Algorithmen zur Berechnung der Transitiven Hülle einer Datenbankrelation

Algorithmen zur Berechnung der Transitiven Hülle einer Datenbankrelation Algorithmen zur Berechnung der Transitiven Hülle einer Datenbankrelation Daniel Reinhold Shenja Leiser 6. Februar 2006 2/28 Gliederung Einführung Transitive Hülle Definition Iterative Algorithmen 1. Naive

Mehr

Kapitel 4: Konzeptueller Datenbankentwurf

Kapitel 4: Konzeptueller Datenbankentwurf 4. Konzeptueller Datenbankentwurf Seite 1 Kapitel 4: Konzeptueller Datenbankentwurf Der Entwurf des konzeptuellen Schemas ist Teil eines übergeordneten Softwareentwurfsprozesses. Im Pflichtenheft eines

Mehr

OM Datenbanken. OM Datenbanken. 8.1 Was ist ein Datenbanksystem? Motivation

OM Datenbanken. OM Datenbanken. 8.1 Was ist ein Datenbanksystem? Motivation 1 Inhalt: Relationale Datenbanken 8.1 Was ist ein Datenbanksystem? 8.2 Relationale Datenbanksysteme 8.3 Abbildung des objektorientierten Modells auf Tabellen 2 8.1 Was ist ein Datenbanksystem? Motivation

Mehr

SQL für Trolle. mag.e. Dienstag, 10.2.2009. Qt-Seminar

SQL für Trolle. mag.e. Dienstag, 10.2.2009. Qt-Seminar Qt-Seminar Dienstag, 10.2.2009 SQL ist......die Abkürzung für Structured Query Language (früher sequel für Structured English Query Language )...ein ISO und ANSI Standard (aktuell SQL:2008)...eine Befehls-

Mehr

Einleitung. Komplexe Anfragen. Suche ist teuer. VA-File Verfeinerungen. A0-Algo. GeVAS. Schluß. Folie 2. Einleitung. Suche ist teuer.

Einleitung. Komplexe Anfragen. Suche ist teuer. VA-File Verfeinerungen. A0-Algo. GeVAS. Schluß. Folie 2. Einleitung. Suche ist teuer. Anwendung Input: Query-Bild, Ergebnis: Menge ähnlicher Bilder. Kapitel 8: Ähnlichkeitsanfragen und ihre effiziente Evaluierung Wie zu finden? Corbis, NASA: EOS Bilddatenbank Folie Folie 2 Ähnlichkeitssuche

Mehr

IT-Kompaktkurs. Datenbanken Skript zur Folge 5. Prof. Dr. Georg Herde Fachhochschule Deggendorf

IT-Kompaktkurs. Datenbanken Skript zur Folge 5. Prof. Dr. Georg Herde Fachhochschule Deggendorf IT-Kompaktkurs Skript zur Folge 5 Prof. Dr. Georg Herde Fachhochschule Deggendorf Semantisches Datenmodell, Entity-Relationship, Normalformen Bei der Entwicklung einer Datenbank wird das Ziel angestrebt,

Mehr

Themenfeld Datenbanken

Themenfeld Datenbanken Sommersemester 2006 Institut für Germanistik I Vorlesung Computerphilologie Themenfeld Datenbanken Welche Optionen hat man beim Aufbau einer Datenbank und was braucht man für was? 1 Datenbank - Definition

Mehr

Datenbanktechnologie für Data-Warehouse-Systeme

Datenbanktechnologie für Data-Warehouse-Systeme Wolfgang Lehner Datenbanktechnologie für Data-Warehouse-Systeme Konzepte und Methoden dpunkt.verlag 1 1.1 1.2 1.3 1.4 1. 5 2 2.1 2.2 2.3 Einleitung 1 Betriebswirtschaftlicher Ursprung des Data Warehousing...

Mehr

Kopplung Verteilter Datenbanksysteme. Eric Ndengang

Kopplung Verteilter Datenbanksysteme. Eric Ndengang Kopplung Verteilter Datenbanksysteme Eric Ndengang 21.06.2004 Seminar SS 2004 Universität Karlsruhe Babel 21.06.2004 Seminar SS 2004 2 Übersicht Einleitung Problematik Wrapper / Mediator-basierte Architekturen

Mehr

AutoSPARQL. Let Users Query Your Knowledge Base

AutoSPARQL. Let Users Query Your Knowledge Base AutoSPARQL Let Users Query Your Knowledge Base Christian Olczak Seminar aus maschinellem Lernen WS 11/12 Fachgebiet Knowledge Engineering Dr. Heiko Paulheim / Frederik Janssen 07.02.2012 Fachbereich Informatik

Mehr

Datenbanken. Sommersemester 2010 Probeklausur

Datenbanken. Sommersemester 2010 Probeklausur Prof. Dr. V. Linnemann Christoph Reinke Universität zu Lübeck Institut für Informationssysteme Lübeck, den 29. Juli 2010 Datenbanken Sommersemester 2010 Probeklausur Hinweise: Es ist sinnvoll, die Aufgaben

Mehr

Rückblick: Entity-Relationship-Modell

Rückblick: Entity-Relationship-Modell Rückblick: Entity-Relationship-Modell Entity-Relationship-Modell für konzeptuellen Entwurf Entitytypen (entity types) (z.b. Studenten) Beziehungstypen (relationships) (z.b. hören) Attribute beschreiben

Mehr

Datenbanken und Informationssysteme. Datenbanken und Informationssysteme

Datenbanken und Informationssysteme. Datenbanken und Informationssysteme Datenbanken und Informationssysteme Wolfgang Menzel: Natürlichsprachliche Systeme (NATS) Norbert Ritter: Datenbanken und Informationssysteme (IS) NATS Ziele der Vorlesung (1) Vermittlung von Grundlagen-

Mehr

Datenbanken und Informationssysteme

Datenbanken und Informationssysteme Datenbanken und Informationssysteme Wolfgang Menzel: Natürlichsprachliche Systeme (NATS) Norbert Ritter: Datenbanken und Informationssysteme (IS) NATS Ziele der Vorlesung (1) Vermittlung von Grundlagen-

Mehr

Abstrakt zum Vortrag im Oberseminar. Graphdatenbanken. Gero Kraus HTWK Leipzig 14. Juli 2015

Abstrakt zum Vortrag im Oberseminar. Graphdatenbanken. Gero Kraus HTWK Leipzig 14. Juli 2015 Abstrakt zum Vortrag im Oberseminar Graphdatenbanken Gero Kraus HTWK Leipzig 14. Juli 2015 1 Motivation Zur Darstellung komplexer Beziehungen bzw. Graphen sind sowohl relationale als auch NoSQL-Datenbanken

Mehr

Eine Schnittstelle für Arztpraxisdaten mittels einer Ontologie auf Basis von HL7 Version 3

Eine Schnittstelle für Arztpraxisdaten mittels einer Ontologie auf Basis von HL7 Version 3 Eine Schnittstelle für Arztpraxisdaten mittels einer Ontologie auf Basis von HL7 Version 3 Jan Kunze, Thomas Riechert, Sören Auer Universität Leipzig Augustusplatz 10-11 04109 Leipzig jan-kunze@gmx.de,

Mehr

Seminar Informationsintegration und Informationsqualität. Dragan Sunjka. 30. Juni 2006

Seminar Informationsintegration und Informationsqualität. Dragan Sunjka. 30. Juni 2006 Seminar Informationsintegration und Informationsqualität TU Kaiserslautern 30. Juni 2006 Gliederung Autonomie Verteilung führt zu Autonomie... Intra-Organisation: historisch Inter-Organisation: Internet

Mehr

Datenvorverarbeitung von nominalen Daten für Data Mining

Datenvorverarbeitung von nominalen Daten für Data Mining Datenvorverarbeitung von nominalen Daten für Data Mining Entstanden 2004/2005 bei der T-Systems International GmbH unter Betreuung von Prof. Dr. J. Fürnkranz Seite 1 Gliederung Datenvorverarbeitung Prepared

Mehr

Refactoring relationaler Datenbank. Shaoke Wu

Refactoring relationaler Datenbank. Shaoke Wu Refactoring relationaler Datenbank Shaoke Wu Überblick Einführung Bad Smells Probleme bei Database Refactoring Durchführung von Database Refactoring Visualisierung Refactoring relationaler DB Einführung

Mehr

Persistenz. Workplace Solutions. Persistenz. ÿ RDBMS und OO ÿ Strukturkonflikt ÿ Object-RDBMS-Mapping. Abbildung Objekte auf RDBMS

Persistenz. Workplace Solutions. Persistenz. ÿ RDBMS und OO ÿ Strukturkonflikt ÿ Object-RDBMS-Mapping. Abbildung Objekte auf RDBMS Persistenz ÿ RDBMS und OO ÿ Strukturkonflikt ÿ Object-RDBMS-Mapping APCON Abbildung Objekte auf RDBMS Der Strukturkonflikt Basisklassen und Domänen Klassen zur Kapselung der relationalen Datenbank Abbildung

Mehr