II Heterogenität und Architekturen

Größe: px
Ab Seite anzeigen:

Download "II Heterogenität und Architekturen"

Transkript

1 II Heterogenität und Dr. Armin Roth arminroth.de Dr. Armin Roth (arminroth.de) II Heterogenität und / 24

2 Agenda 1 Semantische Heterogenität 2 Architekturparadigmen PDMS Dr. Armin Roth (arminroth.de) II Heterogenität und / 24

3 Semantische Heterogenität Modelle und Strukturelle Heterogenität Modelle sind Abstraktionen Beispiele: Konzeptuelle Modelle (Entity-Relationship-Modell, Ontologie) Logisches DBMS-Schema (relational oder XML) Strukturelle Heterogenität betrifft Modellebene betrachtet Art und Struktur der Modelle ignoriert Bedeutung der Modellelemente (z.b. einer Relation) (Unrealistische) Annahme bisher: gleiche Bezeichung im Modell gleiche Bedeutung Dr. Armin Roth (arminroth.de) II Heterogenität und / 24

4 Semantische Heterogenität Semantik von Modellen Bedeutung der Konzepte des Modells? Semantik eines Konzepts := Zugeordnete Enitäten der realen Welt (bzw. deren Repräsentanten in der Datenbank-Instanz) Schema Instanz Dr. Armin Roth (arminroth.de) II Heterogenität und / 24

5 Semantische Heterogenität Semantik Integriertes Informationssystem [Len02] Integriertes Informationssystem Integriertes IS I = {G, S, M} Globales Schema G Lokale Schemata S Schema Mappings M Lokale Instanzen C Semantik sem C (I): Globale Instanzen B, die I erfüllen Globales Schema Lokales Schema Lokale Instanz Schema Mapping Globale Instanz Lokales Schema Lokale Instanz sem C (I) = { B B ist Instanz von G und erfüllt M bzgl. C} Dr. Armin Roth (arminroth.de) II Heterogenität und / 24

6 Semantische Heterogenität Konflikte in Namen / Bezeichnungen Definition Konzept in Modell? Korrespondenzarten zwischen Semantik unterschiedlicher Konzepte A und B: A = B Äquivalenz A B Inklusion A B Überlappung A B Disjunktion Synonyme (z.b. surname vs. last name) Homonyme Einheiten Werte Dr. Armin Roth (arminroth.de) II Heterogenität und / 24

7 Semantische Heterogenität Identität von Real-world Entities Zentrale Fragen: Was ist ein (Geschäfts-)Objekt? XML: Über mehrere Schachtelungsebenen hinweg Relationales Modell: Über mehrere Relationen hinweg Repräsentiert Objekt a die gleiche real-world Entität wie Objekt b? Wie finde ich effizient gleiche Repräsentationen (d.h. ohne quadratische Laufzeit, Ähnlichkeitsmaße)? Synonyme für Problem: Duplikaterkennung Objektidentifikation Record Linkage Data Cleansing... Auf Datenebene Dr. Armin Roth (arminroth.de) II Heterogenität und / 24

8 Datenkonflikte Semantische Heterogenität Datenkonflikt: Zwei Duplikate haben unterschiedliche Attributwerte für ein semantisch gleiches Attribut. Im Gegensatz zu Konflikten mit Integritätsbedingungen Datenkonflikte entstehen innerhalb eines Informationssystems (intra-source) bei Integration mehrerer Informationssysteme (inter-source). Dr. Armin Roth (arminroth.de) II Heterogenität und / 24

9 Semantische Heterogenität Datenkonflikte Beispiel amazon.de Konflikt kann auch mit NULL-Wert herrschen H. Melville $3.98 ID Herman Melville Moby Dick $5.99 bol.de Dr. Armin Roth (arminroth.de) II Heterogenität und / 24

10 Agenda Architekturparadigmen 1 Semantische Heterogenität 2 Architekturparadigmen PDMS Dr. Armin Roth (arminroth.de) II Heterogenität und / 24

11 Architekturparadigmen Architekturparadigmen Materialisiert A priori-integration Zentrale Datenbasis Zentrale Anfragebearbeitung Typisches Beispiel: Data Warehouse Virtuell On demand-integration Dezentrale Daten Dezentrale Anfragebearbeitung Typisches Beispiel: Mediator-basiertes Informationssystem Dr. Armin Roth (arminroth.de) II Heterogenität und / 24

12 Architekturparadigmen Materialisierte Integration Datenfluss Push Erstmaliges Laden (population) des DW (Data Cleansing) Periodischer Datenimport: Updating materialized views Redundante Datenhaltung Aggregation und Löschung alter Daten Anwendung 1 Data Warehouse Anwendung 2 ETL 1 ETL 2 ETL 3 Quelle 1 Quelle 2 Quelle 3 Dr. Armin Roth (arminroth.de) II Heterogenität und / 24

13 Materialisierte Integration Anfragebearbeitung/Schema Architekturparadigmen Anfragebearbeitung: Wie normale DBMS Aggregation Decision Support Schema: Bottom-Up-Entwurf Schemaintegration Star-Schema (Fact Table, Dimension Tables) Anwendung 1 Data Warehouse Anwendung 2 ETL 1 ETL 2 ETL 3 Quelle 1 Quelle 2 Quelle 3 Dr. Armin Roth (arminroth.de) II Heterogenität und / 24

14 Architekturparadigmen Virtuelle Integration Datenfluss Pull Daten sind in Quellen gespeichert Nur Anfragen und Ergebnisse werden übertragen (Query Shipping) Anwendung 1 Anwendung 2 Wrapper 1 Mediator Wrapper 2 Wrapper 3 Data Cleansing nur online möglich Quelle 1 Quelle 2 Quelle 3 Dr. Armin Roth (arminroth.de) II Heterogenität und / 24

15 Architekturparadigmen Virtuelle Integration Anfragebearbeitung/Schema Anfragebearbeitung: Optimierung schwierig (Fähigkeiten, Geschwindigkeiten der Quellen) Viele mögliche Pläne zur Berechnung des Anfrageergebnisses Schema: Top-down Entwurf Leicht erweiterbar (global durch neue Quellen, lokal durch ein Mapping) Schema Mapping statt Schemaintegration Anwendung 1 Anwendung 2 Wrapper 1 Mediator Wrapper 2 Wrapper 3 Quelle 1 Quelle 2 Quelle 3 Dr. Armin Roth (arminroth.de) II Heterogenität und / 24

16 Architekturparadigmen Materialisiert vs. Virtuelle Integration Vergleich Materialisiert Virtuell Aktualität (Cache) + Antwortzeit + Flexibilität (GaV) + (LaV) Komplexität + ++ Autonomie + Anfragemächtigkeit + Read/Write +/+ +/ Ressourcenbedarf? (workload)? (workload) Vollständigkeit +? (OWA, CWA) Datenreinigung + Informationsqualität + Legende: : wenig, +: viel, ++: sehr viel Dr. Armin Roth (arminroth.de) II Heterogenität und / 24

17 Agenda PDMS 1 Semantische Heterogenität 2 Architekturparadigmen PDMS Dr. Armin Roth (arminroth.de) II Heterogenität und / 24

18 PDMS Nachteile integrierter Informationssysteme Globales Schema: Komplex Einigungsprozess erforderlich Wartung bedeutet (aufwändige) Schema-Evolution Praxis bevorzugt dynamische Integration mit ähnlichen Informationssystemen Skalierbarkeit, Flexibilität problematisch Mediator: Single point of... Control Failure Maintenance Dr. Armin Roth (arminroth.de) II Heterogenität und / 24

19 PDMS Beispiel: Standardisiertes Schema ISO (STEP): Standard for Exchange of Product Data Teilschema Grunddaten für Automotive Mechanik-Entwurfsprozess (ISO ) Entstanden in langem Standardisierungsprozess Datentransformation aufwändig Dr. Armin Roth (arminroth.de) II Heterogenität und / 24

20 PDMS PDMS: Generalisierung integrierter Inform. Integration bereits existierender integrierter Informationssysteme Beispielsweise bei Firmenzusammenschlüssen Reorganisationen Integriertes Informationssystem A Integriertes Informationssystem B Dr. Armin Roth (arminroth.de) II Heterogenität und / 24

21 PDMS Peers: Integrierte Informationssysteme Funktionalität: Anfragen initiieren Anfragen auswerten Anfragevermittlung (Mediation) Lokale Mappings Peer Schema Peer Mappings Lokale Datenquellen (lokales Schema) Dr. Armin Roth (arminroth.de) II Heterogenität und / 24

22 Beispiel-PDMS PDMS P 1 P 5 P 2 P 4 P 6 Dr. Armin Roth (arminroth.de) II Heterogenität und / 24

23 PDMS Ausblick PDMS-Anfragebearbeitung P 1 Mappings sind gerichtet! P 5 Mappings bilden Zyklen! Abhängig von Semantik der Mappings kann Anfragebearbeitung undecidable sein! P 2 P 4 P 6 Dr. Armin Roth (arminroth.de) II Heterogenität und / 24

24 Literatur PDMS [Len02] Maurizio Lenzerini. Data integration: A theoretical perspective. In Proc. of the Symposium on Principles of Database Systems (PODS), (optional, sehr theoretisch). Dr. Armin Roth (arminroth.de) II Heterogenität und / 24

Autonomie & Heterogenität

Autonomie & Heterogenität Autonomie & Heterogenität Komplexe Informationssysteme Fabian Panse panse@informatik.uni-hamburg.de Universität Hamburg Probleme Einführung Autonomie Heterogenität Daten sind auf mehrere Quellen verteilt

Mehr

Schema Mapping. Dr. Armin Roth arminroth.de. Dr. Armin Roth (arminroth.de) II Schema Mapping / 23

Schema Mapping. Dr. Armin Roth arminroth.de. Dr. Armin Roth (arminroth.de) II Schema Mapping / 23 Dr. Armin Roth arminroth.de 25.04.2013 Dr. Armin Roth (arminroth.de) II Schema Mapping 25.04.2013 1 / 23 Agenda 1 Wiederholung: Schema Matching / Integration 2 Schema Mapping Definitionen Beispiel Algorithmus

Mehr

Informationsintegration Materialisierte vs Felix Naumann

Informationsintegration Materialisierte vs Felix Naumann Informationsintegration Materialisierte vs. Virtuelle Integration 15.5.2008 Felix Naumann Überblick 2 Szenarien der Informationsintegration Data Warehouse Föderierte Datenbanken Einführung Materialisiert

Mehr

Datenintegration. Kapitel 0: Organisatorisches. Dr. Anika Groß Sommersemester 2016

Datenintegration. Kapitel 0: Organisatorisches. Dr. Anika Groß Sommersemester 2016 Datenintegration Datenintegration Kapitel 0: Organisatorisches Dr. Anika Groß Sommersemester 2016 Universität Leipzig Institut für Informatik http://dbs.uni-leipzig.de 1 Organisatorisches Termin: donnerstags,

Mehr

Datenintegration & Datenherkunft Verteilung, Autonomie und Heterogenität

Datenintegration & Datenherkunft Verteilung, Autonomie und Heterogenität Datenintegration & Datenherkunft Verteilung, Autonomie und Heterogenität Wintersemester 2010/11 Melanie Herschel melanie.herschel@uni-tuebingen.de Lehrstuhl für Datenbanksysteme, Universität Tübingen 1

Mehr

Kapitel DB:IV (Fortsetzung)

Kapitel DB:IV (Fortsetzung) Kapitel DB:IV (Fortsetzung) IV. Logischer Datenbankentwurf mit dem relationalen Modell Das relationale Modell Integritätsbedingungen Umsetzung ER-Schema in relationales Schema DB:IV-46 Relational Design

Mehr

Duplikaterkennung. Dr. Armin Roth arminroth.de. Dr. Armin Roth (arminroth.de) II Duplikaterkennung / 17

Duplikaterkennung. Dr. Armin Roth arminroth.de. Dr. Armin Roth (arminroth.de) II Duplikaterkennung / 17 Dr. Armin Roth arminroth.de 27.04.2013 Dr. Armin Roth (arminroth.de) II Duplikaterkennung 27.04.2013 1 / 17 Agenda 1 Wiederholung: Datenwertintegration 2 Duplikaterkennung Dr. Armin Roth (arminroth.de)

Mehr

Kapitel 3: Eigenschaften von Integrationssystemen. Einordnung von Integrationssystemen bzgl. Kriterien zur Beschreibung von Integrationssystemen

Kapitel 3: Eigenschaften von Integrationssystemen. Einordnung von Integrationssystemen bzgl. Kriterien zur Beschreibung von Integrationssystemen Datenintegration Datenintegration Kapitel 3: Eigenschaften von Integrationssystemen Andreas Thor Sommersemester 2008 Universität Leipzig Institut für Informatik http://dbs.uni-leipzig.de 1 Inhalt Einordnung

Mehr

Data Lineage / Data Fusion

Data Lineage / Data Fusion Data Lineage / Data Fusion Dr. Armin Roth arminroth.de 27.04.2013 Dr. Armin Roth (arminroth.de) II Data Lineage / Data Fusion 27.04.2013 1 / 38 Agenda 1 Data Lineage Herkunft existierender Daten Herkunft

Mehr

Medizininformatik Software Engineering

Medizininformatik Software Engineering Vorlesung Software Engineering Inhaltsverzeichnis 1. Einleitung 2. Software und Medizinprodukt 3. Vorgehensmodelle 4. Strukturierter Entwurf von Echtzeitsystemen 4.1 Echzeit, was ist das? 4.2 Einführung

Mehr

Überblick. Informationsintegration Materialisierte vs. Virtuelle Integration. 1.11.2005 Felix Naumann. Ankündigungen

Überblick. Informationsintegration Materialisierte vs. Virtuelle Integration. 1.11.2005 Felix Naumann. Ankündigungen Informationsintegration Materialisierte vs. Virtuelle Integration 1.11.2005 Felix Naumann Ankündigungen Überblick 2 Szenarien der Informationsintegration Data Warehouse Föderierte Datenbanken Einführung

Mehr

Anfragebearbeitung LaV und PDMS

Anfragebearbeitung LaV und PDMS Anfragebearbeitung LaV und PDMS Dr. Armin Roth arminroth.de 25.06.2012 Dr. Armin Roth (arminroth.de) II Anfragebearbeitung LaV, PDMS 25.06.2012 1 / 26 Agenda 1 Anfragebearbeitung Local-as-View Nutzung

Mehr

Informationsintegration

Informationsintegration Informationsintegration Heterogenität Datenkonflikte Transparenz Ulf Leser Wissensmanagement in der Bioinformatik Klassifikationsdimensionen [ÖV99] Klassische Eigenschaften von Informationssystemen Verteilung

Mehr

Informationsintegration

Informationsintegration Informationsintegration Architekturen Vergleichskriterien für integrierte Systeme Ulf Leser Wissensmanagement in der Bioinformatik Übersicht Technische Heterogenität Technische Realisierung des Datenzugriffs

Mehr

Datenbankentwurf. Kapitel 3. Datenbankentwurf 76 / 508

Datenbankentwurf. Kapitel 3. Datenbankentwurf 76 / 508 Kapitel 3 Datenbankentwurf 76 / 508 Phasen des Datenbankentwurfs Phasen des Datenbankentwurfs Anforderungsanalyse Spezifikation Konzeptueller Entwurf Konzeptuelles Schema Logischer Entwurf Logisches Schema

Mehr

Kapitel 1: Wiederholungsfragen Grundlagen DBS

Kapitel 1: Wiederholungsfragen Grundlagen DBS Grundlagen DBS 1. Welche zentralen Anforderungen an ein DBS definierte Edgar Codd? 2. Was ist eine Transaktion? 3. Welche Eigenschaften muss das DBMS bei der Transaktionsverarbeitung sicherstellen? 4.

Mehr

30. Juni 2006 - Technische Universität Kaiserslautern. Paul R. Schilling

30. Juni 2006 - Technische Universität Kaiserslautern. Paul R. Schilling 30. Juni 2006 - Technische Universität Kaiserslautern Paul R. Schilling ! " #$% & '( ( ) *+, - '. / 0 1 2("$ DATEN SIND ALLGEGENWÄRTIG Bill Inmon, father of data warehousing Unternehmen In einer vollkommenen

Mehr

Schema Mapping. Armin Roth 25.04.2013. arminroth.de. Armin Roth (arminroth.de) II Schema Mapping 25.04.2013 1 / 23

Schema Mapping. Armin Roth 25.04.2013. arminroth.de. Armin Roth (arminroth.de) II Schema Mapping 25.04.2013 1 / 23 Schema Mapping Armin Roth arminroth.de 25.04.2013 Armin Roth (arminroth.de) II Schema Mapping 25.04.2013 1 / 23 Agenda 1 Wiederholung: Schema Mapping 2 Logische Mappings 3 Erzeugung der Anfragen Armin

Mehr

Informationssysteme für Ingenieure

Informationssysteme für Ingenieure Informationssysteme für Ingenieure Vorlesung Herbstsemester 2016 Überblick und Organisation R. Marti Organisation Web Site: http://isi.inf.ethz.ch Dozent: Robert Marti, martir ethz.ch Assistenz:??

Mehr

Konzeptueller Entwurf

Konzeptueller Entwurf Konzeptueller Entwurf UML Klassendiagrame UML Assoziationen Entspricht Beziehungen Optional: Assoziationsnamen Leserichtung ( oder ), sonst bidirektional Rollennamen Kardinalitätsrestriktionen UML Kardinalitätsrestriktionen

Mehr

Komplexität. Matthias Sax. 9. Juli Humboldt-Universität zu Berlin. Institut für Informatik

Komplexität. Matthias Sax. 9. Juli Humboldt-Universität zu Berlin. Institut für Informatik Komplexität Matthias Sax Humboldt-Universität zu Berlin Institut für Informatik 9. Juli 2007 Matthias Sax Komplexität 1 / 21 1 Problemstellung 2 Polynomiale Fälle Ungleichheit Anfragen in der Logik der

Mehr

Semantische Datenintegration: Strategien zur Integration von Datenbanken

Semantische Datenintegration: Strategien zur Integration von Datenbanken Semantische Datenintegration: Strategien zur Integration von Datenbanken Inhalt 1. Wiederholung Integrationskonflikte 2. Klassische Strategien zur Integration 1. Eng gekoppelte Ansätze 2. Lose gekoppelte

Mehr

Datenbanken Grundlagen und Design

Datenbanken Grundlagen und Design Frank Geisler Datenbanken Grundlagen und Design 3., aktualisierte und erweiterte Auflage mitp Vorwort 15 Teil I Grundlagen 19 i Einführung in das Thema Datenbanken 21 i.i Warum ist Datenbankdesign wichtig?

Mehr

8 Schlussfolgerungen

8 Schlussfolgerungen 112 8 Schlussfolgerungen Die Zielsetzung der vorliegenden Arbeit wurde mit der Erstellung eines Referenzmodells als Vorschlag der Datenorganisation für den Bereich der Milcherzeugung unter Anwendung eines

Mehr

Informationsintegration

Informationsintegration Informationsintegration Einführung Ulf Leser Wissensmanagement in der Bioinformatik Informationsintegration Anfrage Integriertes Informationssystem Oracle, DB2 Anwendung Dateisystem Web Service HTML Form

Mehr

Informationsintegration. Ulf Leser Sebastian Wandelt

Informationsintegration. Ulf Leser Sebastian Wandelt Informationsintegration Ulf Leser Sebastian Wandelt Informationsintegration Anfrage Integriertes Informations- system Oracle, DB2 Dateisystem Web Service App HTML Form Integriertes Info.-system Ulf Leser:

Mehr

Beyond Information Integration: Content Merging Forschungskolloquium CIS/ISST

Beyond Information Integration: Content Merging Forschungskolloquium CIS/ISST Beyond Information Integration: Content Merging Forschungskolloquium CIS/ISST Felix Naumann naumann@informatik.hu-berlin.de Einige Untertitel Content Merging Objekt/Data Fusion Data Amalgamation Data Consolidation

Mehr

Inhaltsverzeichnis. 1 Einleitung Motivation und Umfeld Zielsetzung der Arbeit Methodisches Vorgehen und Aufbau der Arbeit 3

Inhaltsverzeichnis. 1 Einleitung Motivation und Umfeld Zielsetzung der Arbeit Methodisches Vorgehen und Aufbau der Arbeit 3 Inhaltsverzeichnis 1 Einleitung 1 1.1 Motivation und Umfeld 1 1.2 Zielsetzung der Arbeit 2 1.3 Methodisches Vorgehen und Aufbau der Arbeit 3 2 Grundlagen des Feuerwehrwesens 5 2.1 Kategorisierung der Feuerwehren

Mehr

Integration, Migration und Evolution

Integration, Migration und Evolution 14. Mai 2013 Programm für heute 1 2 Quelle Das Material zu diesem Kapitel stammt aus der Vorlesung Datenintegration & Datenherkunft der Universität Tübingen gehalten von Melanie Herschel im WS 2010/11.

Mehr

Relationales Datenbanksystem Oracle

Relationales Datenbanksystem Oracle Relationales Datenbanksystem Oracle 1 Relationales Modell Im relationalen Modell wird ein relationales Datenbankschema wie folgt beschrieben: RS = R 1 X 1 SC 1... R n X n SC n SC a a : i=1...n X i B Information

Mehr

Informationsintegration

Informationsintegration Informationsintegration Heterogenität Transparenz Ulf Leser Wissensmanagement in der Bioinformatik Klassifikationsdimensionen Verteilung Autonomie Heterogenität Ulf Leser: Informationsintegration, Wintersemester

Mehr

Schema Matching und Integration

Schema Matching und Integration und Integration Dr. Armin Roth arminroth.de 25.04.2013 Dr. Armin Roth (arminroth.de) II Schema Matching und Integr. 25.04.2013 1 / 26 Agenda 1 Schema Matching 2 Schema Integration Dr. Armin Roth (arminroth.de)

Mehr

Kapitel DB:IV (Fortsetzung)

Kapitel DB:IV (Fortsetzung) Kapitel DB:IV (Fortsetzung) IV. Logischer Datenbankentwurf mit dem relationalen Modell Das relationale Modell Integritätsbedingungen Umsetzung ER-Schema in relationales Schema DB:IV-45 Relational Design

Mehr

Informationsintegration

Informationsintegration Informationsintegration Einleitung Teil 2 Ulf Leser Informationsintegration am Beispiel Quellen Daten versus Schemata Ulf Leser: Informationsintegration 2 Frage eines Biologen Finde alle menschlichen Sequenzen,

Mehr

Datenintegration & Datenherkunft Verteilung, Autonomie, und Heterogenität

Datenintegration & Datenherkunft Verteilung, Autonomie, und Heterogenität Datenintegration & Datenherkunft Verteilung, Autonomie, und Wintersemester 2010/11 Melanie Herschel melanie.herschel@uni-tuebingen.de Lehrstuhl für Datenbanksysteme, Universität Tübingen 1 Klassifikation

Mehr

Data Warehouse Grundlagen

Data Warehouse Grundlagen Seminarunterlage Version: 2.13 Version 2.13 vom 27. August 2018 Dieses Dokument wird durch die veröffentlicht.. Alle Rechte vorbehalten. Alle Produkt- und Dienstleistungs-Bezeichnungen sind Warenzeichen

Mehr

Common Warehouse Metamodel und Imperfektion

Common Warehouse Metamodel und Imperfektion Common Warehouse Metamodel und Imperfektion Christoph Goebel Imperfektion und erweiterte Konzepte im Data Warehousing 2 Fragestellungen Welche Bedeutung haben Metadaten in der Information Supply Chain

Mehr

Konzeptionelle Modellierung von XML-Dokumenttypen

Konzeptionelle Modellierung von XML-Dokumenttypen Konzeptionelle Modellierung von XML-Dokumenttypen Rainer Eckstein Institut für Informatik LFE DBIS Humboldt-Universität zu Berlin Rainer Eckstein 1 Konzeptionelle Modellierung von XML: XML (extensible

Mehr

Repetitorium. Data Warehousing und Data Mining 11/12. Sebastian Wandelt 13./16. Februar 2012

Repetitorium. Data Warehousing und Data Mining 11/12. Sebastian Wandelt 13./16. Februar 2012 Repetitorium Data Warehousing und Data Mining 11/12 Sebastian Wandelt 13./16. Februar 2012 Inhalt Data Warehousing und Data Mining auf 40 Slides Weder in-, noch exklusiv! Subjektive Zusammenfassung pro

Mehr

Inhaltsübersicht...IX Inhaltsverzeichnis...XI Abbildungsverzeichnis...XVII Tabellenverzeichnis... XXIII Abkürzungsverzeichnis...

Inhaltsübersicht...IX Inhaltsverzeichnis...XI Abbildungsverzeichnis...XVII Tabellenverzeichnis... XXIII Abkürzungsverzeichnis... Inhaltsübersicht...IX Inhaltsverzeichnis...XI Abbildungsverzeichnis...XVII Tabellenverzeichnis... XXIII Abkürzungsverzeichnis... XXV 1 Einführung... 1 1.1 Problemstellung... 1 1.2 Zielsetzung... 3 1.3

Mehr

Informationsintegration

Informationsintegration Informationsintegration Local-as-View Anfrageplanung Ulf Leser Inhalt dieser Vorlesung Anfragekorrespondenzen Formale Definition Korrespondenztypen und -arten GaV erklärt Local as View Query Containment

Mehr

Kapitel 2: Ein abstraktes Geo-Datenmodell

Kapitel 2: Ein abstraktes Geo-Datenmodell LUDWIG- MAXIMILIANS- UNIVERSITY MUNICH DEPARTMENT INSTITUTE FOR INFORMATICS DATABASE Kapitel 2: Ein abstraktes Geo-Datenmodell Skript zur Vorlesung Geo-Informationssysteme Wintersemester 2013/14 Ludwig-Maximilians-Universität

Mehr

Informationsintegration Architekturen. 17.4.2012 Felix Naumann

Informationsintegration Architekturen. 17.4.2012 Felix Naumann Informationsintegration Architekturen 17.4.2012 Felix Naumann Überblick 2 Überblick über Informationssysteme Klassifikation Materialisiert vs. virtuell Architekturen 3 Schichten Architektur 4 Schichten

Mehr

Erfolg mit Oracle BI?

Erfolg mit Oracle BI? Erfolg mit Oracle BI? Typische Fehlerszenarien und deren Lösung Gerd Aiglstorfer G.A. itbs GmbH Das Thema 2 Oracle BI (OBIEE)? Das war eine Fehlentscheidung! Viel zu umständlich! Wenig Flexibilität & teure

Mehr

Datenintegration & Datenherkunft Einführung

Datenintegration & Datenherkunft Einführung Datenintegration & Datenherkunft Einführung Wintersemester 2010/11 Melanie Herschel melanie.herschel@uni-tuebingen.de Lehrstuhl für Datenbanksysteme, Universität Tübingen 1 Kapitel 1 Einführung Vorstellung

Mehr

Kapitel 1 Grundlagen. Skript zur Vorlesung: Datenbanksysteme II Sommersemester Vorlesung: PD Dr. Peer Kröger

Kapitel 1 Grundlagen. Skript zur Vorlesung: Datenbanksysteme II Sommersemester Vorlesung: PD Dr. Peer Kröger LUDWIG- MAXIMILIANS- UNIVERSITY MUNICH DEPARTMENT INSTITUTE FOR INFORMATICS DATABASE Skript zur Vorlesung: Datenbanksysteme II Sommersemester 2016 Kapitel 1 Grundlagen Vorlesung: PD Dr. Peer Kröger http://www.dbs.ifi.lmu.de/cms/datenbanksysteme_ii

Mehr

Data Warehouse schnell gemacht Performanceaspekte im Oracle DWH

Data Warehouse schnell gemacht Performanceaspekte im Oracle DWH Data Warehouse schnell gemacht Performanceaspekte im Oracle DWH Dani Schnider Principal Consultant Business Intelligence BI Trilogie, Zürich/Basel 25./26. November 2009 Basel Baden Bern Lausanne Zürich

Mehr

XML-Datenaustausch in der Praxis Projekt TOMIS bei der ThyssenKrupp Stahl AG

XML-Datenaustausch in der Praxis Projekt TOMIS bei der ThyssenKrupp Stahl AG Mittwoch, 9. November 2005 13h00, Bruno-Schmitz-Saal 18. Deutsche ORACLE-Anwenderkonferenz XML-Datenaustausch in der Praxis Projekt TOMIS bei der ThyssenKrupp Stahl AG Volker Husemann Thyssen Krupp Stahl

Mehr

Qualitäts- und Semantik-gesteuerte Anfragebearbeitung für Peer-basierte Datenmanagementsysteme (PDMS)

Qualitäts- und Semantik-gesteuerte Anfragebearbeitung für Peer-basierte Datenmanagementsysteme (PDMS) Qualitäts- und Semantik-gesteuerte Anfragebearbeitung für Peer-basierte Datenmanagementsysteme (PDMS) Armin Roth DaimlerChrysler Forschungszentrum Ulm armin.roth@daimlerchrysler.com Felix Naumann Humboldt-Universität

Mehr

Datenbankmodelle und Datenbanksprachen

Datenbankmodelle und Datenbanksprachen Datenbankmodelle und Datenbanksprachen Dr.-Ing. Guy Vollmer FH Dortmund, FB Informatik Dienstag, 30. September 2008 1 Agenda 1. Einordnung des Themas 2. Datenbankmodelle Relationales Datenmodell 3. Datenbanksprachen

Mehr

Ausgabe: Eine DBMS unabhängige high-level Repräsentation der Anforderungen, das "konzeptuelle Schema".

Ausgabe: Eine DBMS unabhängige high-level Repräsentation der Anforderungen, das konzeptuelle Schema. Phasen des Datenbanken-Designs Konzeptuelles Design Eingabe: Anforderungen Ausgabe: Eine DBMS unabhängige high-level Repräsentation der Anforderungen, das "konzeptuelle Schema". Qualität: Richtigkeit und

Mehr

Das relationale Modell (Teil 1)

Das relationale Modell (Teil 1) Vorlesung #2 Das relationale Modell (Teil 1) Fahrplan WS 2010/11 Feedback Vorlesung#1 Das relationale Modell Einordnung (wir überspringen die Modellierung, das kommt im 4. Semester Datenmanagement ) Definition,

Mehr

Machen Sie Ihre Daten bereit für INSPIRE mit HALE

Machen Sie Ihre Daten bereit für INSPIRE mit HALE Machen Sie Ihre Daten bereit für INSPIRE mit HALE Christian Malewski Fraunhofer-Institut für Graphische Datenverarbeitung IGD Fraunhoferstraße 5 64283 Darmstadt Tel +49 6151 155 424 Fax 444 christian.malewski@igd.fraunhofer.de

Mehr

1. Einführung Seite 1. Kapitel 1: Einführung

1. Einführung Seite 1. Kapitel 1: Einführung 1. Einführung Seite 1 Kapitel 1: Einführung 1. Einführung Seite 2 Willkommen! Studierenden-Datenbank Hans Eifrig hat die Matrikelnummer 1223. Seine Adresse ist Seeweg 20. Er ist im zweiten Semester. Lisa

Mehr

2. Architektur verteilter Datenbanksysteme

2. Architektur verteilter Datenbanksysteme 2. Architektur verteilter Datenbanksysteme Verteilte Datenbank, kurz DDB (engl. distributed database): eine Sammlung logisch zusammengehöriger Datenbanken, welche über Rechnerknoten ( Sites ) verteilt

Mehr

Extraktion, Transformation, Laden (ETL)

Extraktion, Transformation, Laden (ETL) Extraktion, Transformation, Laden (ETL) ETL-Prozeß Integrationsschritte Integrationsprobleme fi Konflikte und deren Klassifikation fi Behebung von Konflikten Data Cleaning VL Data Warehouses, WS 2000/2001

Mehr

Kapitel 2: Ein abstraktes Geo-Datenmodell

Kapitel 2: Ein abstraktes Geo-Datenmodell LUDWIG- MAXIMILIANS- UNIVERSITY MUNICH DEPARTMENT INSTITUTE FOR INFORMATICS Kapitel 2: Ein abstraktes Geo-Datenmodell Skript zur Vorlesung Geo-Informationssysteme Wintersemester 2011/12 Ludwig-Maximilians-Universität

Mehr

SchemaSQL Eine Multidatenbank Sprache. Volodymyr Biryuk

SchemaSQL Eine Multidatenbank Sprache. Volodymyr Biryuk SchemaSQL Eine Multidatenbank Sprache Volodymyr Biryuk Herausforderung Aufbau eines Multi-Datenbank-Systems (MDBS) Problem Autonomie Distribution Heterogenität Integration heterogener Datenquellen Art

Mehr

Kapitel 3: Datenbanksysteme

Kapitel 3: Datenbanksysteme LUDWIG- MAXIMILIANS- UNIVERSITY MUNICH DEPARTMENT INSTITUTE FOR INFORMATICS Skript zur Vorlesung: Einführung in die Informatik: Systeme und Anwendungen Sommersemester 2018 Kapitel 3: Datenbanksysteme Vorlesung:

Mehr

Kapitel 6. Vorlesung: PD Dr. Peer Kröger

Kapitel 6. Vorlesung: PD Dr. Peer Kröger Kapitel 6 Einführung in Data Warehouses Vorlesung: PD Dr. Peer Kröger Dieses Skript basiert auf den Skripten zur Vorlesung Datenbanksysteme II an der LMU München Dieses Skript basiert auf den Skripten

Mehr

2. Klassifikation von Mehrrechner-DBS

2. Klassifikation von Mehrrechner-DBS 2. Klassifikation von Mehrrechner-DBS Merkmale für PDBS/VDBS Räumliche Verteilung: ortsverteilt oder lokal Rechnerkopplung: enge, lose oder nahe Kopplung Externspeicheranbindung: partitioniert oder gemeinsam

Mehr

Überblick. Informationsintegration Local-as-View: LaV Felix Naumann

Überblick. Informationsintegration Local-as-View: LaV Felix Naumann Informationsintegration Local-as-View: LaV 7.6.2007 Felix Naumann Überblick 2 Motivation Korrespondenzen Übersicht Anfrageplanung Global as View (GaV) Local as View (LaV) Modellierung Anwendungen Anfragebearbeitung

Mehr

Datenbankbasierte Lösungen

Datenbankbasierte Lösungen Technologische Beiträge für verteilte GIS - Anforderungen an verteilte GIS und Lösungsansätze Datenbankbasierte Lösungen Johannes Kebeck Senior Systemberater ORACLE Deutschland GmbH Agenda TOP Thema 1

Mehr

Data Warehousing. Sommersemester 2005. Ulf Leser Wissensmanagement in der Bioinformatik

Data Warehousing. Sommersemester 2005. Ulf Leser Wissensmanagement in der Bioinformatik Data Warehousing Sommersemester 2005 Ulf Leser Wissensmanagement in der Bioinformatik ... Der typische Walmart Kaufagent verwendet täglich mächtige Data Mining Werkzeuge, um die Daten der 300 Terabyte

Mehr

.NETUser. René Leupold Patrick Weibel. Group Bern. Follow dnugbe on twitter

.NETUser. René Leupold Patrick Weibel.  Group Bern. Follow dnugbe on twitter .NETUser Group Bern René Leupold Patrick Weibel www.dnug-bern.ch Follow dnugbe on twitter DNUG Bern Sponsoren Über René Leupold connect@databinding.net http://www.databinding.net CV siehe Xing ;-) Über

Mehr

Logische Modellierung von Data Warehouses

Logische Modellierung von Data Warehouses Logische Modellierung von Data Warehouses Vertiefungsarbeit von Karin Schäuble Gliederung. Einführung. Abgrenzung und Grundlagen. Anforderungen. Logische Modellierung. Methoden.. Star Schema.. Galaxy-Schema..

Mehr

Inhaltsverzeichnis. vii.

Inhaltsverzeichnis. vii. vii 1 Einführung in Data-Warehouse-Systeme 1 1.1 Anwendungsszenario Getränkemarkt 2 1.2 OLTP versus OLAP 4 1.2.1 OLAP-versus OLTP-Transaktionen 5 1.2.2 Vergleich von OLTP und OLAP 6 1.2.3 Abgrenzung: DBMS-Techniken

Mehr

Datenbankanwendungen werden oft über einen sehr langen Zeitraum (z.b. Jahrzehnte) eingesetzt

Datenbankanwendungen werden oft über einen sehr langen Zeitraum (z.b. Jahrzehnte) eingesetzt 2. Datenbankentwurf Motivation Datenbankanwendungen werden oft über einen sehr langen Zeitraum (z.b. Jahrzehnte) eingesetzt Fehler sind umso teurer zu beheben, je weiter die Entwicklung bzw. der Einsatz

Mehr

Inhalt. 1 Einleitung Warum dieses Buch? Der rote Faden Danksagung URL zum Buch 4. TEIL I Einführung 5

Inhalt. 1 Einleitung Warum dieses Buch? Der rote Faden Danksagung URL zum Buch 4. TEIL I Einführung 5 Inhalt 1 Einleitung 1 1.1 Warum dieses Buch? 1 1.2 Der rote Faden 2 1.3 Danksagung 3 1.4 URL zum Buch 4 TEIL I Einführung 5 2 XML-Grundlagen 7 2.1 Einleitung 7 2.2 WasistXML? 7 2.3 Dokumenttypen und Namensräume

Mehr

Data Warehousing. Sommersemester Ulf Leser Wissensmanagement in der Bioinformatik

Data Warehousing. Sommersemester Ulf Leser Wissensmanagement in der Bioinformatik Data Warehousing Sommersemester 2004 Ulf Leser Wissensmanagement in der Bioinformatik ... Der typische Walmart Kaufagent verwendet täglich mächtige Data Mining Werkzeuge, um die Daten der 300 Terabyte

Mehr

Foundations of uncertain data integration

Foundations of uncertain data integration Foundations of uncertain data integration Seminar Informationsintegration Stephan Barnert IT Management & Consulting 11.09.2015 Agenda Problemstellung Einleitung Beispiel zur Integration Wiederholung LAV

Mehr

Datenbanken 1. Kapitel 2: Datenbankentwurf. Ansprechpartner hat Name Adresse. Geschaeftspartner <pi> Characters (30) Characters (50) ist.

Datenbanken 1. Kapitel 2: Datenbankentwurf. Ansprechpartner hat Name Adresse. Geschaeftspartner <pi> Characters (30) Characters (50) ist. Datenbanken 1 Kapitel 2: Datenbankentwurf Ansprechpartner hat Name Adresse Geschaeftspartner Characters (30) Characters (50) ist Haendler Rabatt Integer Spediteur Verfuegbar Characters (20) Kunde

Mehr

Informationsintegration

Informationsintegration Informationsintegration Data Warehouse (= Materialisierte Integration) Ulf Leser Sebastian Wandelt Inhalt dieser Vorlesung Data Warehouses OLAP versus OLTP Multidimensionale Modellierung ETL Prozess Vergleich:

Mehr

Ein Transparentes Datenmodell zur Verarbeitung Verlinkter XML-Dokumente

Ein Transparentes Datenmodell zur Verarbeitung Verlinkter XML-Dokumente Ein Transparentes Datenmodell zur Verarbeitung Verlinkter XML-Dokumente Wolfgang May Univ. Freiburg/Göttingen & Dimitrio Malheiro Univ. Freiburg GI-Fachtagung BTW 2003 Leipzig, 26.2.2003 Situation autonome

Mehr

Konzeptuelle Modellierung

Konzeptuelle Modellierung Kapitel 2 Konzeptuelle Modellierung 2.1 Das Entity-Relationship-Modell Die grundlegenden Modellierungsstrukturen dieses Modells sind die Entities (Gegenstände) und die Relationships (Beziehungen) zwischen

Mehr

Informationsintegration

Informationsintegration Informationsintegration Verteilung, Autonomie, Heterogenität, Transparenz Ulf Leser Sebastian Wandelt Inhalt dieser Vorlesung Verteilung Autonomie Heterogenität Transparenz Ulf Leser: Informationsintegration

Mehr

Geoinformation Abbildung auf Tabellen

Geoinformation Abbildung auf Tabellen Folie 1 von 32 Geoinformation Abbildung auf Tabellen Folie 2 von 32 Abbildung auf Tabellen Übersicht Motivation des relationalen Datenmodells Von Objekten zu Tabellen Abbildung von Objekten Schlüssel Abbildung

Mehr

Kapitel DB:II. II. Datenbankentwurf und Datenbankmodelle. Entwurfsprozess Datenbankmodelle

Kapitel DB:II. II. Datenbankentwurf und Datenbankmodelle. Entwurfsprozess Datenbankmodelle Kapitel DB:II II. Datenbankentwurf und Datenbankmodelle Entwurfsprozess Datenbankmodelle DB:II-1 DB Design and Models STEIN 2004-2018 Entwurfsprozess ANSI/SPARC-Schema-Architektur externe Ebene externes

Mehr

Informationsintegration Einführung

Informationsintegration Einführung Informationsintegration Einführung 17.4.2007 Felix Naumann Integrierte Informationssysteme 2 Anfrage Integriertes Informationssystem Oracle, DB2 Anwendung Dateisystem Web Service HTML Form Integriertes

Mehr

METHODEN DES DATENBANKDESIGNS

METHODEN DES DATENBANKDESIGNS METHODEN DES DATENBANKDESIGNS Man unterscheidet vier Strategien zum Design eines Schemas: Top-Down Bottom-Up Inside-Out und Mixed. Jede Strategie ist durch einen bestimmten Satz von Primitiven charakterisiert

Mehr

Architektur eines Identitätsmanagementsystems an einer Hochschule

Architektur eines Identitätsmanagementsystems an einer Hochschule Diplomarbeit Architektur eines Identitätsmanagementsystems an einer Hochschule steffen.hofmann@fu-berlin.de betreut von Birgit Feldmann an der Fakultät für Mathematik und Informatik, Lehrgebiet Informationssysteme

Mehr

Einführung in die Datenorganisation. Informationssysteme

Einführung in die Datenorganisation. Informationssysteme Einführung in die Datenorganisation Informationssysteme Informationen Sind Kenntnisse über Sachverhalte Daten sind abgelegte Informationen Nachrichten sind Informationen zur Weitergabe Drei Betrachtungsebenen

Mehr

Daten Bank. 2. Vorlesung. Dr. Karsten Tolle PRG2 SS 2014

Daten Bank. 2. Vorlesung. Dr. Karsten Tolle PRG2 SS 2014 Daten Bank 2. Vorlesung Dr. Karsten Tolle PRG2 SS 2014 Letzte Vorlesung Grundbegriffe SQL create table insert select Dr. Karsten Tolle PRG2 SS 2014 2 Heute Übersicht Modellierung (ER-Diagramme) Entitäten

Mehr

Logischer Entwurf. Stufen der Entwicklung einer Datenbank. Inhalt. Übersicht. 1. Datenbank - Entwurf ( ER - Diagramm)

Logischer Entwurf. Stufen der Entwicklung einer Datenbank. Inhalt. Übersicht. 1. Datenbank - Entwurf ( ER - Diagramm) 10. Logischer Entwurf 10-1 10. Logischer Entwurf 10-2 Stufen der Entwicklung einer Datenbank 1. Datenbank - Entwurf ( ER - Diagramm) Logischer Entwurf 2. Umsetzen des ER - Diagramms ins relationale Modell

Mehr

Data Cubes PG Wissensmangement Seminarphase

Data Cubes PG Wissensmangement Seminarphase PG 402 - Wissensmangement Seminarphase 23.10.2001-25.10.2001 Hanna Köpcke Lehrstuhl für Künstliche Intelligenz Universität Dortmund Übersicht 1. Einführung 2. Aggregation in SQL, GROUP BY 3. Probleme mit

Mehr

Kapitel 1: Einführung 1.1 Datenbanken?

Kapitel 1: Einführung 1.1 Datenbanken? Kapitel 1: Einführung 1.1 Datenbanken? 1. Einführung 1.1. Datenbanken Grundlagen der Datenbanksysteme, WS 2012/13 29. Oktober 2012 Seite 1 1. Einführung 1.1. Datenbanken Willkommen! Studierenden-Datenbank

Mehr

Datenqualität-Der GQM- Ansatz und das DWQ- Projekt

Datenqualität-Der GQM- Ansatz und das DWQ- Projekt Datenqualität-Der GQM- Ansatz und das DWQ- Projekt Guy Hermann Ngassa Imperfektion und erweiterte Konzepte im Data Warehousing 2 Überblick Einleitung Data-Warehouse-Qualität-Projekt (DWQ-Projekt) Bezug

Mehr

DATAFUSION IM MILCHVIEHSTALL

DATAFUSION IM MILCHVIEHSTALL Forschen und Prüfen für die Landwirtschaft Josephinum Research DATAFUSION IM MILCHVIEHSTALL Smart Farming und Nachhaltigkeit: Chancen und Herausforderungen 4. Agroscope-Nachhaltigkeitstagung Franz Handler,

Mehr

Data Lakes: Lösung oder neue Herausforderung für Data-Integration

Data Lakes: Lösung oder neue Herausforderung für Data-Integration Data Lakes: Lösung oder neue Herausforderung für Big-Data Data-Integration Integration? PD Dr. Christoph Quix Fraunhofer-Institut für Angewandte Informationstechnik FIT Life Science Informatics Abteilungsleiter

Mehr

Literatur. Inhalt. Einführung und Grundlagen

Literatur. Inhalt. Einführung und Grundlagen Einführung und Grundlagen A.Kaiser; WU-Wien MIS 36 Literatur Gluchowski, Peter, Gabriel, Roland, Chamoni, Peter; Management-Support- Systeme, Springer, 1997 Vetschera, Rudolf, Informationssysteme der Unternehmensführung,

Mehr

Lösung - Übungsblatt 2

Lösung - Übungsblatt 2 Lösung - Übungsblatt 2 (Modellierung von Datenquellen) Fabian Panse panse@informatik.uni-hamburg.de Universität Hamburg Aufgabe 1: GaV mit Nebenbedingungen Student(MNr, Name, Sem, SG) IC: Sem > 5 S1(MNr,

Mehr

Datenbanken. Datenbanken. Grundlagen und Design. Grundlagen und Design. Frank. Geisler. 4. Auflage

Datenbanken. Datenbanken. Grundlagen und Design. Grundlagen und Design. Frank. Geisler. 4. Auflage Datenbanksysteme, Datenbankanwendungen und Middleware Das relationale Datenbankmodell ER-Datenbankmodellierung und Normalisierung SQL-Grundlagen Projektablauf bei der Erstellung einer Datenbank Transaktionen

Mehr

Informationsintegration Local-as-View: LaV Felix Naumann

Informationsintegration Local-as-View: LaV Felix Naumann Informationsintegration Local-as-View: LaV 10.7.2008 Felix Naumann Überblick 2 Motivation Korrespondenzen Übersicht Anfrageplanung Global as View (GaV) Local as View (LaV) Modellierung Anwendungen Anfragebearbeitung

Mehr

Datenmodelle. Einführung in das Entity-Relationship-Modell. Datenbankmodelle. Beispiel für ein ER-Schema. Kunde( Meier, , ) 41, Meier

Datenmodelle. Einführung in das Entity-Relationship-Modell. Datenbankmodelle. Beispiel für ein ER-Schema. Kunde( Meier, , ) 41, Meier Einführung in das Entity-Relationship-Modell Datenmodelle Datenmodelle dienen der Darstellung der Informationsstruktur, nicht der Darstellung der Informationen selbst. Motivation Grundbestandteile von

Mehr

Datenmodelle dienen der Darstellung der Informationsstruktur, nicht der Darstellung der Informationen selbst. Motivation

Datenmodelle dienen der Darstellung der Informationsstruktur, nicht der Darstellung der Informationen selbst. Motivation Einführung in das Entity-Relationship-Modell Datenmodelle Datenmodelle dienen der Darstellung der Informationsstruktur, nicht der Darstellung der Informationen selbst. Motivation Grundbestandteile von

Mehr

Wissensentdeckung in Datenbanken

Wissensentdeckung in Datenbanken Wissensentdeckung in Datenbanken SQL, Häufige Mengen Nico Piatkowski und Uwe Ligges 11.05.2017 1 von 16 Überblick Was bisher geschah... Modellklassen Verlustfunktionen Numerische Optimierung Regularisierung

Mehr