Datenintegration & Datenherkunft Architekturen



Ähnliche Dokumente
Informationsintegration

Informationsintegration Architekturen

Seminar Informationsintegration und Informationsqualität. Dragan Sunjka. 30. Juni 2006

Enterprise Applikation Integration und Service-orientierte Architekturen. 01 Einführung

Integration verteilter Datenquellen in GIS-Datenbanken

WS 2002/03. Prof. Dr. Rainer Manthey. Institut für Informatik III Universität Bonn. Informationssysteme. Kapitel 1. Informationssysteme

Database Exchange Manager. Infinqa IT Solutions GmbH, Berlin Stralauer Allee Berlin Tel.:+49(0) Fax.:+49(0)

White Paper. Konfiguration und Verwendung des Auditlogs Winter Release

Datenbanken. Prof. Dr. Bernhard Schiefer.

Ein Beispiel. Ein Unternehmen will Internettechnologien im Rahmen des E- Business nutzen Welche Geschäftsprozesse?

Anleitung Redmine. Inhalt. Seite 1 von 11. Anleitung Redmine

Software Engineering. Zur Architektur der Applikation Data Repository. Franz-Josef Elmer, Universität Basel, HS 2015

Information-Design-Tool

Schritt 1: Verwenden von Excel zum Erstellen von Verbindungen mit SQL Server-Daten

Kommunikationsübersicht XIMA FORMCYCLE Inhaltsverzeichnis

Anforderungen an die HIS

Fachbericht zum Thema: Anforderungen an ein Datenbanksystem

Schritt 1: Verwenden von Excel zum Erstellen von Verbindungen zu SQL Server Analysis Services-Daten

white sheep GmbH Unternehmensberatung Schnittstellen Framework

Java Enterprise Architekturen Willkommen in der Realität

Autorisierung. Sicherheit und Zugriffskontrolle & Erstellen einer Berechtigungskomponente

IBM SPSS Data Access Pack Installationsanweisung für Windows

How-to: Webserver NAT. Securepoint Security System Version 2007nx

ACDSee Pro 2. ACDSee Pro 2 Tutorials: Übertragung von Fotos (+ Datenbank) auf einen anderen Computer. Über Metadaten und die Datenbank

Informationsintegration Architekturen Felix Naumann

2 Die Terminaldienste Prüfungsanforderungen von Microsoft: Lernziele:

Dynamisches SQL. Folien zum Datenbankpraktikum Wintersemester 2009/10 LMU München

Fassade. Objektbasiertes Strukturmuster. C. Restorff & M. Rohlfing

Hilfe zur Urlaubsplanung und Zeiterfassung

IRF2000 Application Note Lösung von IP-Adresskonflikten bei zwei identischen Netzwerken

Kapitel 10: Datenbankzugriff & Pufferung 2

Kapitel 4 Die Datenbank Kuchenbestellung Seite 1

Web Data Management Systeme

Kapitel 10 Aktive DBMS

Ablösung von Control-M durch JobScheduler

Definition Informationssystem

(1) Mit dem Administrator Modul werden die Datenbank, Gruppen, Benutzer, Projekte und sonstige Aufgaben verwaltet.

MSSQL Server Fragen GridVis

Lokale Installation von DotNetNuke 4 ohne IIS

Step by Step Remotedesktopfreigabe unter Windows Server von Christian Bartl

Systemvoraussetzungen Informationscenter IFC

Whitepaper. Produkt: combit Relationship Manager. Einbindung externer FiBu-/Warenwirtschaftsdaten. combit GmbH Untere Laube Konstanz

Mobile-Szenario in der Integrationskomponente einrichten

7. Übung - Datenbanken

SWT II Projekt. Chat - Anwendung. Pflichtenheft 2000 SWT

OERA OpenEdge Reference Architecture. Mike Fechner PUG Infotag 19. Mai 05 Frankfurt

Lizenzierung von System Center 2012

ERPaaS TM. In nur drei Minuten zur individuellen Lösung und maximaler Flexibilität.

Wichtige Hinweise zu den neuen Orientierungshilfen der Architekten-/Objektplanerverträge

Installation der 4Dv12sql Software für Verbindungen zum T.Base Server

SDD System Design Document

OutLook 2003 Konfiguration

Windows Server 2012 R2 Essentials & Hyper-V

Workflow, Business Process Management, 4.Teil

Proxy. Krishna Tateneni Übersetzer: Stefan Winter

Import und Export von Übergängern

Fragen zur GridVis MSSQL-Server

ORACLE Business Components for Java (BC4J) Marco Grawunder

Educase. Release Notes 1.7: Neue Funktionen und Verbesserungen. Base-Net Informatik AG Wassergrabe 14 CH-6210 Sursee

ACCOUNTS. Wer ist marken mehrwert und was passiert mit den Daten? Wozu brauche ich einen Account bei marken mehrwert?

System Center Essentials 2010

Aufbau eines virtuellen privaten Netzes mit Peer-to-Peer-Technologie

Informationsintegration Architekturen Felix Naumann

Guten Tag! CampusSource. Die CSE Integration Platform. CampusSource Engine. Christof Pohl Softwareentwicklung Medienzentrum Universität Dortmund

Er musste so eingerichtet werden, dass das D-Laufwerk auf das E-Laufwerk gespiegelt

pro4controlling - Whitepaper [DEU] Whitepaper zur CfMD-Lösung pro4controlling Seite 1 von 9

SHAREPOINT SAP INTEGRATION

ecommerce Deshalb ist es für Unternehmen jeder Grösse wichtig, den Schritt in den Online-Verkauf nicht zu verpassen.

Best Practice Infor PM 10 auf Infor Blending

Datenmanagement in Android-Apps. 16. Mai 2013

Stecken Sie Ihren USB Stick oder Ihre externe USB Festplatte in den USB Steckplatz des Sinus 154 DSL SE.

Kurzanleitung OOVS. Reseller Interface. Allgemein

Allgemeines zu Datenbanken

Web Services stellen eine Integrationsarchitektur dar, die die Kommunikation zwischen verschiedenen Anwendungen

Der beste Plan für Office 365 Archivierung.

Konfigurationsanleitung Access Control Lists (ACL) Funkwerk. Copyright Stefan Dahler Oktober 2008 Version 1.0.

3 Windows als Storage-Zentrale

Teamschool Installation/ Konvertierungsanleitung

Anton Ochsenkühn. amac BUCH VERLAG. Ecxel für Mac. amac-buch Verlag

Mobiles SAP für Entscheider. Permanente Verfügbarkeit der aktuellen Unternehmenskennzahlen durch den mobilen Zugriff auf SAP ERP.

Einteilung von Datenbanken

Carl-Christian Kanne. Einführung in Datenbanken p.1/513

Objektrelationale Datenbanken

Lizenzen auschecken. Was ist zu tun?

3. Stored Procedures und PL/SQL

RMeasy das SAP IS U Add On für Versorgungsunternehmen. Optimieren Sie Ihre Prozesse in Kundengewinnung und Kundenbindung.

Anleitung Redmine. Inhalt. Seite 1 von 11. Anleitung Redmine

Referenz-Konfiguration für IP Office Server. IP Office 8.1

Business Application Framework für SharePoint Der Kern aller PSC-Lösungen

Inhalt. 1 Einleitung AUTOMATISCHE DATENSICHERUNG AUF EINEN CLOUDSPEICHER

Step by Step Webserver unter Windows Server von Christian Bartl

PowerWeiss Synchronisation

Diplomarbeit. Konzeption und Implementierung einer automatisierten Testumgebung. Thomas Wehrspann. 10. Dezember 2008

ACDSee Pro 3-Tutorials: Fotos (+ Datenbank) auf einen anderen Computer bringen

Gesicherte Prozeduren

Anwendungshinweis Nr. 12. Wie konfiguriere ich redundante Serververbindungen

Kurzanweisung für Google Analytics

Transkript:

Datenintegration & Datenherkunft Architekturen Wintersemester 2010/11 Melanie Herschel melanie.herschel@uni-tuebingen.de Lehrstuhl für Datenbanksysteme, Universität Tübingen 1 Kapitel 4 Architekturen Überblick der besprochenen Architekturen Föderierte DB Architekturen 3 Schichten Architektur 4 Schichten Architektur Multidatenbankarchitektur 5 Schichten Architektur Mediator-Wrapper Architektur Konfigurationen Mediatoren Wrapper 2

Betrachtete Datenbanksysteme! Monolithische Datenbanken! Laufen auf einzelnem Rechner! ANSI/SPARC 3-Schichten Architektur! Verteilte Datenbanken! Verschiedene Rechner! Kaum Heterogenität! 4-Schichten Architektur! Multidatenbanken! Mehrere heterogene Datenquellen! Integration auf Anfrageebene! Multidatenbankarchitektur (4 Schichten) 3 Betrachtete Datenbanksysteme! Föderierte Datenbanken! Mehrere heterogene Datenquellen! Integration auf ebene! 5-Schichten Architektur! Mediatorbasierte Datenbanken! Verallgemeinerung der anderen Ansätze! Mediator-Wrapper Architektur! Peer-Daten-Management-Systeme! Auflösung der Unterscheidung zwischen Datenquelle und integriertem System! PDMS Architektur 4

Verteilung Klassifikation verteilter DBMS nach [ÖV99] Platzierung der verschiedenen Datenbanksystene auf Klassifikation Verteilung/Distribution Peer-topeer Client/Server Autonomie Heterogenität Enge Integration Semiautonom Kapitel 4 Architekturen Überblick der besprochenen Architekturen Föderierte DB Architekturen 3 Schichten Architektur 4 Schichten Architektur Multidatenbankarchitektur 5 Schichten Architektur Mediator-Wrapper Architektur Konfigurationen Mediatoren Wrapper 6 Isolation 5

3-Schichten Architektur ANSI/SPARC 3-Schichten Architektur für zentralisierte DBMS! Interne (physische) Sicht! Speichermedium (Tape, Festplatte)! Speicherort (Zylinder, Block)! Konzeptionelle (logische) Sicht! Unabhängig von physischer Sicht! Definiert durch Datenmodell! Stabiler Bezugspunkt für interne und externe Sichten! Externe (logische) Sicht! Erlauben Anwendungsprogrammen den Zugriff! Nur auf die relevanten Daten! Enthält Aggregationen und Transformationen 1 N Konzeptionelles Internes 7 3-Schichten Architektur Anwendungen 1 N DBMS Konzeptionelles Internes 8

4-Schichten Architektur! Für verteilte DBMS! Neu: Trennung lokales vs. globales konzeptionelles.! Globales konzeptionelles ist integriert aus den lokalen konzeptionellen s.! und globales konzept. können gleich sein. 1 konzept. Internes Konzeptionelles N konzept. Internes 9 4-Schichten Architektur Anwendungen 1 N Verteiltes DBMS Konzeptionelles konzept. konzept. Lokale DBMS Internes Internes 10

Multidatenbankarchitektur (4 Schichten) [LMR90]! Jede Quelle bietet ein Exportschema an. und Export- können gleich sein.! Integration ist Teil externen ta.! Multi-DBMS stellt den Anwendungen Multidantenbanksprache zur Verfügung.! Externe ta können mit der Multidatenbanksprache definiert werden.! Voraussetzung! Nutzer/Anwendungen kennen die jeweiligen ta! Multidatenbanksprache! Lose Kopplung 1 Export- konzept. Internes N Export- konzept. Internes 11 4-Schichten Architektur Anwendungen 1 N Export- Export- Lokale DBMS konzept. konzept. Internes Internes 12

5-Schichten Architektur [SL90]! Neu:! Interne ta werden nicht mehr betrachtet. 1 N! Exportschemas! Integriertes, föderiertes Exportschema Föderiertes Exportschema! Terminologie! = lokales konzept. Komponentenschema Komponentenschema! Föderiertes = globales konzept. 13 5-Schichten Architektur [SL90]! Lokale s! Konzeptionell! Komponentenschemas! Kanonisches Datenmodell 1 N Föderiertes! Übergang durch Mappings.! Überwindet Datenmodellheterogenität.! Exportschemas! Teilmenge des Exportschema Exportschema Komponentenschema Komponentenschema Komponentenschemas! Verwaltet Zugangsberechtigungen 14

5-Schichten Architektur [SL90]! Föderiertes! Integriert aus den Exportschemas! Kennt Datenverteilung! Andere Namen:! Import! Globales! Enterprise! Unified! Mediator!! Föderiertes kann sehr groß sein " Vereinfachung im Exportschema! Evolution leichter! Zusätzliche Integritätsbedingungen! Zugangskontrollen 1 Exportschema N Föderiertes Exportschema 15 5-Schichten Architektur [SL90]! Mischformen! Einige Schichten nicht immer nötig.! Z.B. wenn lokales und Komponentenschema gleich sind.! Z.B. wenn komplettes Komponentenschema exportiert werden soll.! Ein Komponentenschema kann mehrere Exportschemas haben.! Große FDBS können mehrere föderierte s haben.! Föderation!! Nur semi-autonom! Lokale DBMS müssen bereits kanonisches Datenmodell unterstützen. 1 Exportschema N Föderiertes Exportschema Komponentenschema Komponentenschema Komponentenschema Komponentenschema 16

5-Schichten Architektur [SL90] Anwendungen 1 N Föd. DBMS Exportschema Föderiertes Exportschema Lokale DBMS Komponentenschema Komponentenschema 17 Vergleich der Architekturen [Con97] Import / Export 4-Schichten 5-Schichten Lose Kopplung Lose Kopplung Enge Kopplung Integration durch Nutzer und globalen Admin Zugriff über lokales System Keine globale DBMS Funktionalität Integration durch Nutzer Zugriff über globale Schnittstellen DBMS-Funktionalität nur durch Multidatenbanksprachen Integration durch globalen Administrator Zugriff durch globales System DBMS-Funktionalität im globalen System 18

Kapitel 4 Architekturen Überblick der besprochenen Architekturen Föderierte DB Architekturen 3 Schichten Architektur 4 Schichten Architektur Multidatenbankarchitektur 5 Schichten Architektur Mediator-Wrapper Architektur Konfigurationen Mediatoren Wrapper 19 Die Architektur Mediator Globales (Mediator-) Wrapper Wrapperschema Datenquelle (Export-) Wrapper Wrapperschema Datenquelle (Export-) Jede Komponente kann (muss aber nicht) ein autonomes System sein. 20

Mediator-Wrapper Architektur Wrapper für mehrere Quellen Anwendung 1 Anwendung 2 Mediator Wrapper1 Wrapper3 Quelle 1 Quelle 2 Quelle 3 Quelle 1 und Quelle 2 unterscheiden sich nur leicht, z.b. zwei Oracle Datenbanken mit identischen s. 21 Mediator-Wrapper Architektur Schachtelung von Mediatoren Anwendung 1 Anwendung 2 Mediator1 Mediator2 Wrapper3 Wrapper1 Wrapper2 Quelle 1 Quelle 2 Quelle 3 Mediatoren dienen als Quellen für andere Mediatoren. Stufenweise Added- Value. 22

Mediator-Wrapper Architektur Zugriff von Anwendungen auf Wrapper Anwendung 1 Anwendung 2 Mediator1 Wrapper1 Mediator2 Wrapper2 Wrapper3 Quelle 1 Quelle 2 Quelle 3 Anwendungen können auch direkt mit Quellen kommunizieren. etc. 23 Mediatoren Definition Mediator! A mediator is a software module that exploits encoded knowledge about certain sets or subsets of data to create information for a higher layer of applications Wiederhold `92 [Wie92]! Ein Mediator ist eine Softwarekomponente, die Wissen über bestimmte Daten benutzt, um Informationen für höherwertige Anwendungen zu erzeugen. 24

Mediatoren Daten werden zu Informationen 25 Mediatoren Aufgaben Zentrale Aufgabe eines Mediators ist, Daten einen Mehrwert zu geben. Dazu gehören Aufgaben wie! Informationsintegration zur Ergänzung der Daten durch zusätzliche Quellen! Suche und Auswahl relevanter Datenquellen! Datentransformationen zur Konsistenzerhaltung! Bereitstellung von Metadaten zur Weiterverarbeitung! Integration von Daten mittels gemeinsamer Schlüssel! Abstraktion bzw. Aggregation zum besseren Verständnis! Ordnen von Ergebnissen in einem Ranking! Filter zur Zugangskontrolle! Semantisch sinnvolle Ausweitungen von Anfragen! 26

Mediatoren Expertenwissen! Um die Aufgaben zu erfüllen wird in der Regel ein Domänenexperte benötigt.! Das integrierte und die Abbildung der Quellschemata auf das integrierte stellen das Expertenwissen dar.! Bei der Erweiterung von Anfragen muss ebenfalls auf Expertenwissen zurückgegriffen werden, das idealerweise in einem Thesaurus oder einer Ontologie abgelegt ist. 27 Keep it Simple [A mediator] should be small and simple, so that it can be maintained by one expert or, at most, a small and coherent group of experts. Wiederhold `92 Ein Mediator sollte klein und einfach genug sein, um durch einen einzigen oder höchstens eine kleine Gruppe von Experten gewartet werden zu können. D.h.: Einfaches föderiertes, begrenzte Domäne, einfache Schnittstellen Erfahrung: Suchmaschinen ändern wöchentlich ihre Schnittstelle 28

Keep it Simple 29 Dicke und Dünne Mediatoren Serviceumfang Geringer Mehrwert Zu dünn Zu dick Schlecht komponierbar Genau richtig Wenig Nutzer Zu schmal Zu breit Schwer wartbar Diskursbereich 30

Wrapper Definition Wrapper! Wrapper sind Softwarekomponenten, die die Kommunikation und den Datenfluss zwischen Mediatoren und Datenquellen herstellen.! Wrapper sind jeweils spezialisiert auf eine Ausprägung autonomer, heterogener Quellen.! Wrapper vermitteln zwischen Mediator und Quelle. 31 Wrapper Aufgaben! Lösen Schnittstellenheterogenität! technisch! SQL, HTML Formulare, http, CORBA,! Mächtigkeit der Anfragesprache! Lösen Datenmodellheterogenität! Lösen schematische Heterogenität! Liefern globales! Reduzieren Anzahl der Datenmodelle (mit denen das IIS umgehen muss)! Reduzieren Anzahl der ta! Unterstützen globale Optimierung! Kostenmodell! Anfragefähigkeiten 32

Wrapper Anforderungen! Sollten schnell implementiert werden können! (< 1 Woche)! Sollten wiederverwendbar sein! Lokale Wartung (bei föderierten Systemen)! An den Wrappern scheitern viele Projekte!! Deshalb Forschung zur schnellen oder sogar automatischen Wrappergenerierung.! Wrapperbibliotheken 33 Garlic Wrapper Generierung Praktische Anforderungen aus [TS97]! Start-up Kosten gering (Stunden)! Erweiterbarkeit! Einfacher Start! Später Fähigkeiten der Quellen hinzufügen! Flexibilität! Möglichst breites Spektrum an Quellen abdecken! Neue Quellen stören Architektur nicht.! Optimierung! Nicht durch Autoren sondern durch Garlic 34

Garlic Wrapper Generierung Vier Grund-Services 1. Modellierung und Zugriff auf die Daten in der Quelle 2. Aufruf von Methoden in der Quelle 3. Mithilfe bei der Anfrageplanung 4. Anfrageausführung 35 Garlic Wrapper Generierung Quelle: [TS97] 36

Garlic Wrapper Generierung Modellierung und Zugriff auf die Daten! Garlic nutzt OO Modell! Wrapper stellt Daten als Objekte mit Interface (globales ) und Implementierung (lokales ) dar.! Stellt Identität von Objekten her. 37 Garlic Wrapper Generierung Aufruf von Methoden in der Quelle! Implizit immer: Get_attr() für jedes Attribut! Implizit immer: Set_attr() für jedes nicht-read-only Attribut! Um auch Quellen abzudecken, die nur über Methoden zu erreichen sind.! Um besondere Fähigkeiten von Quellen auszuschöpfen.! Beispiel: display_image(imageid) 38

Garlic Wrapper Generierung Mithilfe bei der Anfrageplanung (query planning)! Garlics Anfrageplanung betrachtet alternative Pläne und sucht den besten heraus.! Kostenbasiert! Mediator verschickt Teilaufgaben an Wrapper.! Wrapper kann Teile davon ablehnen (je nach Fähigkeiten der Quelle).! Mediator gleicht aus.! Preprocessing! Postprocessing! Wrapper liefert null oder mehr Teilpläne zurück.! Teilpläne werden in Gesamtplan eingebaut. 39 Garlic Wrapper Generierung Anfrageausführung (query execution)! Mediator führt einen Operatorbaum aus.! Wrapper-Teilpläne sind Blätter in dem Baum.! Pläne werden in Iteratoren umgewandelt.! Pipelining 40

Garlic Wrapper Generierung XML Wrapper für DB2 Kunden Posten Bestellungen Zahlungen XML Posten Bestellungen Relationales (virtuelle Tabellen, nicknames) Kunden Shredding Zahlungen 41 Garlic Wrapper Generierung XML Wrapper für DB2 CREATE NICKNAME kunden_nn( name VARCHAR(48) OPTIONS(XPATH './name/text()'), addresse VARCHAR(48) OPTIONS(XPATH './address/text()'), kunden_nn_id VARCHAR(48) OPTIONS(PRIMARY_KEY 'YES')) FOR SERVER xml_server OPTIONS(XPATH '//customer', FILE_PATH customers.xml'); CREATE NICKNAME order_nn( amount DOUBLE OPTIONS(XPATH './amount/text()'), date VARCHAR(48) OPTIONS(XPATH './date/text()'), order_nn_id VARCHAR(48) OPTIONS(PRIMARY_KEY 'YES'), customer_nn_fid VARCHAR(48) OPTIONS(FOREIGN_KEY 'CUSTOMER_NN')) FOR SERVER xml_server OPTIONS(XPATH './/order'); CREATE NICKNAME item_nn( name! VARCHAR(48) OPTIONS(XPATH './name/text()'), quant!integer OPTIONS(XPATH './quant/text()'), order_nn_fid! VARCHAR(48) OPTIONS(FOREIGN_KEY 'ORDER_NN')) FOR SERVER xml_server OPTIONS(XPATH './/item'); CREATE NICKNAME payment_nn( amount INTEGER OPTIONS(XPATH './amount/text()'), date VARCHAR(48) OPTIONS(XPATH './date/text()'), customer_nn_fid VARCHAR(48) OPTIONS(FOREIGN_KEY 'CUSTOMER_NN')) FOR SERVER xml_server OPTIONS(XPATH './/payment'); 42

Zusammenfassung Föderierte Datenbankarchitekturen Import/Export Architektur 4 Schichten Architektur 5 Schichten Architektur Mediator-Wrapper Architektur Mediator Wrapper Wrappergenerierung mit Garlic 43