Informationsintegration



Ähnliche Dokumente
Kapitel 3: Eigenschaften von Integrationssystemen. Einordnung von Integrationssystemen bzgl. Kriterien zur Beschreibung von Integrationssystemen

Informationsintegration

Seminar Informationsintegration und Informationsqualität. Dragan Sunjka. 30. Juni 2006

Enterprise Applikation Integration und Service-orientierte Architekturen. 01 Einführung

Datenintegration & Datenherkunft Architekturen

Fachbericht zum Thema: Anforderungen an ein Datenbanksystem

WS 2002/03. Prof. Dr. Rainer Manthey. Institut für Informatik III Universität Bonn. Informationssysteme. Kapitel 1. Informationssysteme

Web Data Management Systeme

Ein Beispiel. Ein Unternehmen will Internettechnologien im Rahmen des E- Business nutzen Welche Geschäftsprozesse?

Definition Informationssystem

Klassenentwurf. Wie schreiben wir Klassen, die leicht zu verstehen, wartbar und wiederverwendbar sind? Objektorientierte Programmierung mit Java

Verteilungsmechanismen in verschiedenen RDBMS

Fragenkatalog zum Kurs 1666 (Datenbanken in Rechnernetzen) Kurstext von SS 96

Kapitel 14 Verteilte DBMS

Datenbanken und Informationssysteme

Fachhochschule Deggendorf Platzziffer:...

Datenbanken. Prof. Dr. Bernhard Schiefer.

Semantische Infomationsintegration à la carte?

Dr. Klaus Körmeier BlueBridge Technologies AG

Step by Step Webserver unter Windows Server von Christian Bartl

Information-Design-Tool

Fassade. Objektbasiertes Strukturmuster. C. Restorff & M. Rohlfing

XAMPP-Systeme. Teil 3: My SQL. PGP II/05 MySQL

Grundlagen von Datenbanken

Anleitung zur Einrichtung einer ODBC Verbindung zu den Übungsdatenbanken

Carl-Christian Kanne. Einführung in Datenbanken p.1/513

16.4 Wiederverwendung von COTS-Produkten

Themen. M. Duffner: Datenbanksysteme

Semantic Web Technologies I! Lehrveranstaltung im WS10/11! Dr. Andreas Harth! Dr. Sebastian Rudolph!

Prof. Dr.-Ing. Rainer Schmidt 1

Synchronisation von redundanten Datenbeständen

Suche schlecht beschriftete Bilder mit Eigenen Abfragen

Software Engineering. Zur Architektur der Applikation Data Repository. Franz-Josef Elmer, Universität Basel, HS 2015

ONET: FT-NIR-Netzwerke mit zentraler Administration & Datenspeicherung. ONET Server

Whitepaper. Produkt: combit Relationship Manager. Einbindung externer FiBu-/Warenwirtschaftsdaten. combit GmbH Untere Laube Konstanz

Lars Priebe Senior Systemberater. ORACLE Deutschland GmbH

Whitepaper. Produkt: combit Relationship Manager / address manager. Integration der Ansicht "Adressen" in eigene Solution

Um sich zu registrieren, öffnen Sie die Internetseite und wählen Sie dort rechts oben

Betriebshandbuch. MyInTouch Import Tool

Datenbanken Die Entwicklung der Datenbanksysteme ist eng an die der Hardware gekoppelt und wird wie jene in Generationen eingeteilt:

DER BESSER INFORMIERTE GEWINNT!

pro4controlling - Whitepaper [DEU] Whitepaper zur CfMD-Lösung pro4controlling Seite 1 von 9

1. Man schreibe die folgenden Aussagen jeweils in einen normalen Satz um. Zum Beispiel kann man die Aussage:

How-to: Webserver NAT. Securepoint Security System Version 2007nx

Mobile-Szenario in der Integrationskomponente einrichten

Marketing Intelligence Schwierigkeiten bei der Umsetzung. Josef Kolbitsch Manuela Reinisch

Neues Modul für individuelle Anlagen. Änderung bei den Postleitzahl-Mutationen

RIGGTEK. Dissolution Test Systems. DissoPrep Browser-Interface

Berechtigungsgruppen TimeSafe Leistungserfassung

Werkzeuge für ein innovatives Wissensmanagement. W3L AG

SICHERN DER FAVORITEN

Workflow, Business Process Management, 4.Teil

30. Juni Technische Universität Kaiserslautern. Paul R. Schilling

Datenmanagement. Simone Unfried, Passau Vitaly Aleev, Passau Claus Schönleber, Passau. Strategisches Informationsmanagement 1 (01/2006)

Wiederherstellen der Beispieldatenbanken zum Buch Microsoft Project 2010

Was ist das Tekla Warehouse

SharePoint Demonstration

SEMINAR Modifikation für die Nutzung des Community Builders

Datenbank-Verschlüsselung mit DbDefence und Webanwendungen.

Java Enterprise Architekturen Willkommen in der Realität

KONVERTIERUNG VON EXTERNEN DTA DATEIEN (ÜBERWEISUNGEN)

Das neue Webmail Überblick über die neuen Funktionen im Outlook Web App 2010

ODBC-Treiber Programmübersicht

SDD System Design Document

Internet Explorer Version 6

Titel. SCSM ITIL - CMDB - neue CI Klasse erstellen und benutzen. Eine beispielhafte Installationsanleitung zur Verwendung im Testlab

Datenmanagement in Android-Apps. 16. Mai 2013

Outlook 2010 Daten importieren und exportieren

Arbeiten mit einem lokalen PostgreSQL-Server

Anmeldung, Registrierung und Elternkontrolle des MEEP!-Tablet-PC

EXCHANGE Neuerungen und Praxis

7. Übung - Datenbanken

Database Exchange Manager. Infinqa IT Solutions GmbH, Berlin Stralauer Allee Berlin Tel.:+49(0) Fax.:+49(0)

Wir beraten Sie. Wir unterstützen Sie. Wir schaffen Lösungen. Wir bringen Qualität. Wir beraten Sie. Wir unterstützen Sie. Wir schaffen Lösungen

Softwaretests in Visual Studio 2010 Ultimate Vergleich mit Java-Testwerkzeugen. Alexander Schunk Marcel Teuber Henry Trobisch

Funktionsbeschreibung Virtueller Stundenplan APP

IBM SPSS Data Access Pack Installationsanweisung für Windows

OLXTeamOutlook 1.5 für Outlook 2003, 2002/XP, 2000 und 97/98

OutLook 2003 Konfiguration

Dokumentation. Schnittstelle IKISS Bayerischer Behördenwegweiser. Stand:

HSR git und subversion HowTo

BigData Wie wichtig ist die Datenqualität bei der Analyse und Auswertung von großen Daten Praxisbeispiel. Christin Otto

Das Handbuch zu KNetAttach. Orville Bennett Übersetzung: Thomas Bögel

Data Mining: Einige Grundlagen aus der Stochastik

PIWIN II. Praktische Informatik für Wirtschaftsmathematiker, Ingenieure und Naturwissenschaftler II. Vorlesung 2 SWS SS 08

Drei Wege zur sicheren Luftfracht Alternativen nach Einführung des zertifizierten bekannten Versenders

virtuos Leitfaden für die virtuelle Lehre

PK-Website: Besuche & Seitenaufrufe 2010 und 2011

Allgemeines zu Datenbanken

Anwendungsbeispiele Sign Live! Secure Mail Gateway

Apache HBase. A BigTable Column Store on top of Hadoop

Handbuch ECDL 2003 Professional Modul 3: Kommunikation Postfach aufräumen und archivieren

Kostenstellen verwalten. Tipps & Tricks

Transkript:

Informationsintegration Grundlegende Architekturen Ulf Leser

Inhalt diese Vorlesung Klassifikation verteilter, autonomer, heterogener Systeme Weitere Klassifikationskriterien Schichtenaufbau integrierter Systeme Ulf Leser: Informationsintegration 2

Klassifikation [ÖV91] Verteilte DBS Verteilung Standardkonforme DBS Klassische DBS Föderierte DBS Autonomie Heterogenität Schlecht modellierte/betriebene DBS Ulf Leser: Informationsintegration 3

Verteilung Zentrale Datenbank Autonomie Normalfall homogene, zentrale Datenbank Daten/Berechnung können trotzdem begrenzt verteilt sein Partitionierung, RAID, SAN Parallele Datenbanken Datenbank entsteht aus homogenem Entwurf Wenn Redundanz / Heterogenität, dann mit Absicht und kontrolliert Problem: Weiterentwicklung (Evolution) Zentrale Kontrolle und Administration Hetero- genität Ulf Leser: Informationsintegration 4

Verteilung Verteilte Datenbanken Autonomie Daten liegen physisch verteilt Absichtsvolle, kontrollierte, a-priori Verteilung Homogenes, verteilt realisierten Knoten haben keine Autonomie Heterogenität wird unterdrückt Hetero- genität Ortstransparenz, aber keine Verteilungstransparenz Aliase und Proxy kapseln entfernte Orte Verteilungstransparenz durch Sichten möglich, aber nicht durch System erzeugt Ulf Leser: Informationsintegration 5

Einschub Oracle-DBs können auf andere Oracle-DBs zugreifen Database Links CREATE [PUBLIC] DATABASE LINK <link_name> CONNECT TO <user_name> <IDENTIFIED BY <password> USING '<service_name>'; service_name muss über Konfigurationsfiles aufgelöst werden SELECT col1, col2, FROM tab1@link_name; Zugriff wie auf lokale Tabelle (Joins, Selektion, Projektion, ) Transparenz durch Sicht möglich CREATE VIEW myview AS SELECT * FROM tab1@link_name; Anwendung z.b. zur automatische Replikation Ulf Leser: Informationsintegration 6

Gateways Zugriff z.b. über ODBC Umwandlung von Datentypen Unterstützung verschiedener SQL-Dialekte Kompensation fehlender Funktionen Ulf Leser: Informationsintegration 7

Verteilte versus parallele Datenbanken Parallele Datenbank Verteilte Datenbank Externes 1 Externes N Konzeptionelles Internes, physisches Externes 1 Lokales konzept. Konzeptionelles Externes N Lokales konzept. Internes Internes Ulf Leser: Informationsintegration 8

Verteilung Verteilte & autonome DB Autonomie Heterogenität Verteilte, aber homogene Datenbestände Entsteht durch freiwillige Übernahme von Regeln Standards, Verträge, Autonomie wird teilweise aufgegeben Z.B. Aufgabe von Designautonomie Z.B. nicht Kommunikationsautonomie Z.B. nicht juristische Autonomie Ulf Leser: Informationsintegration 9

Verteilung Multidatenbanken Autonomie Verteilt, autonom, etwas heterogen Keine technische Heterogenität Keine Datenmodellheterogenität Zugriff über einheitliche Sprache möglich Autonomie bleibt bewahrt Heterogenität Aber Zugriff muss möglich sein (Kommunikationsautonomie) Multidatenbanksprachen Qualifizierung von Tabellennamen mit Datenbanknamen Überbrückung technischer Probleme (siehe Gateways) Ulf Leser: Informationsintegration 10

Verteilung Föderierte Datenbanken Autonomie Häufiger Begriff ohne klare Definition In der Forschung: Enge, virtuelle Koppelung Heterogenität Integrierte ta, bereinigte Daten Datenbankhersteller meiden semantische Integration In der Industrie: Virtuelle Datenbankintegration Allgemeiner Begriff für integrierten Zugang Kommerziell meistens über Multidatenbanksprachen Definition von Sichten zur Erstellung (teil-)integrierter Ulf Leser: Informationsintegration 11

Verteilung Mediator-Wrapper Systeme Ebenfalls keine klare Definition Trennung der Aufgaben Wrapper verantwortlich für technische / syntaktische Integration Mediatoren verantwortlich für strukturelle/ semantische Integration Unterschiede FDBS setzt meist (relationale) Datenbanken voraus und fokussiert auf Anfrageoptimierung Mediator-basierte Systeme adressieren auch semi- / unstrukturierte Daten (Web) und fokussieren auf semantische Probleme Hetero- genität Autonomie Anwendung 1 Anwendung 2 Wrapper Mediator Wrapper Quelle 1 Quelle 2 Ulf Leser: Informationsintegration 12

Überblick Klassifikation Weitere Klassifikationskriterien Schichtenaufbau integrierter Systeme Ulf Leser: Informationsintegration 13

Kriterien föderierter Informationssysteme Föderierte Informationssysteme als Oberbegriff Weitere (nicht-orthogonale) Kriterien [BKLW99] Strukturiertheit der Komponenten Enge und lose Kopplung Datenmodell Art der semantischen Integration Transparenz Anfrage-Paradigma Bottom-up oder Top-down Entwurf Virtuell oder materialisiert Read-only oder read-&-write Ulf Leser: Informationsintegration 14

Strukturiertheit der Komponenten Strukturiert: Festes, festes Format Semi-strukturiert: Feste Elemente, erweiterbar Struktur nur teilweise festgelegt Beispiel: XML/RDF ohne/mit ta Unstrukturiert Beispiel: Textuelle Daten, Webseiten, Berichte Ulf Leser: Informationsintegration 15

Enge oder lose Kopplung Enge Kopplung Festes, integriertes/föderiertes Für den Benutzer einheitliche Sicht System muss Änderungen der Quellen kompensieren Lose Kopplung Kein globales, einheitliches Nutzer integrieren selber Nur technische und Datenmodellheterogenität ist gelöst Änderungen in Quellen gelangen zum Benutzer Ulf Leser: Informationsintegration 16

Art der semantischen Integration Vereinigung Simple Konkatenation von Objekten Erzeugt redundante Daten Anreicherung Mit Metadaten; keine Konfliktauflösung Erzeugt mehr, aber nicht notwendigerweise bessere Daten Datenfusion Objektidentifizierung Re-Strukturierung Komplementierung Konfliktlösung Ulf Leser: Informationsintegration 17

Bottom-up oder Top-down Entwurf Bottom-up Bedarf nach Integration einer festen Menge von Quellen Globales durch integration Änderungen in Quellen i.d.r. schwierig (Neuintegration) Hohe Ansprüchen an Vollständigkeit und Qualität Data Warehouse, Merging von Unternehmensdatenbanken Top-down Ausgelöst durch globalen Informationsbedarf Neuentwurf eines globalen s Quellen werden nach Bedarf und Eignung hinzugefügt (spezielle Verfahren notwendig) Geringere Ansprüche an Vollständigkeit und Qualität Webquellen, sehr grosse Integrationssysteme Ulf Leser: Informationsintegration 18

Taxonomie nach [SL90] DBMS Zentralisiertes DBMS Verteiltes DBMS Kontrollierte, gewollte Verteilung Einfaches verteiltes DBMS Multidatenbanksystem Kein einheitlicher Zugriff Nicht-föderierte DBS Föderierte DBS (FDBS) Nutzer muss selbst integrieren Lose Kopplung Enge Kopplung Nur ein föderiertes Einfache Föderation Mehrfache Föderation Ulf Leser: Informationsintegration 19

Überblick Klassifikation Weitere Klassifikationskriterien Schichtenaufbau integrierter Systeme Ulf Leser: Informationsintegration 20

ANSI/SPARC 3-Schichten Architektur Externe (logische) Sicht Je nach Anwendung Nur relevante Daten Sichten (Views) Konzeptionelle (logische) Sicht Unabhängig von physischer Sicht Definiert durch Datenmodell Stabiler Bezugspunkt Interne (physische) Sicht Dateistruktur Speicherort (Zylinder, Block) Indexe, Partitionen, Externes 1 Externes N Konzeptionelles Internes, physisches Ulf Leser: Informationsintegration 21

4-Schichten Architektur Globales konzeptionelles integriert die lokalen konzeptionellen ta Lokales und globales konzeptionelles können gleich sein Aber Datenbestände unterschiedlich Externes 1 Lokales konzept. Globales konzeptionelles Externes N Lokales konzept. Physisches Physisches Ulf Leser: Informationsintegration 22

5-Schichten Architektur [SL90] Föderiertes = globales konzeptionelles Exportschema: Für die Föderation zugänglicher Ausschnitt des Komponentenschemas Komponentenschema = lokales konzeptionelles im kanonischen Datenmodell Externes 1 Exportschema Komponentenschema Lokales konzept. Externes N Föderiertes Exportschema Komponentenschema Lokales konzept. Ulf Leser: Informationsintegration 23

Import-/Export--Architektur [HM85] = lokales konzeptionelles Teilmenge des lokalen konzeptionellen s wird der Föderation zur Verfügung gestellt Ausgewählte Teilmengen der Exportschemata werden importiert Ulf Leser: Informationsintegration 24