Informationsintegration

Größe: px
Ab Seite anzeigen:

Download "Informationsintegration"

Transkript

1 Informationsintegration Architekturen Ulf Leser Wissensmanagement in der Bioinformatik

2 Übersicht Technische Heterogenität Technische Realisierung des Datenzugriffs Technische Unterschiede in der Darstellung Syntaktische Unterschiede Unterschiede in der Darstellung Gleiche Dinge syntaktisch verschieden repräsentieren Datenmodellheterogenität Strukturelle Heterogenität Strukturelle Unterschiede in der Darstellung Gleiche Dinge verschieden modellieren Semantische Heterogenität Unterschiede in der Bedeutung von Namen (Schema und Daten) Gleiches sagen, verschiedenes meinen (oder andersrum) Ulf Leser: Informationsintegration, Wintersemester 2006/2007 2

3 Ausprägung 2 Anfrage Integriertes Informationssystem Heterogenität zwischen globaler Schicht und Datenquellen Quelle Ulf Leser: Informationsintegration, Wintersemester 2006/2007 3

4 Technische Heterogenität Ulf Leser: Informationsintegration, Wintersemester 2006/2007 4

5 Mächtige globale Anfragesprache SQL SELECT * FROM Books WHERE Author = Defoe AND PubYear = 1979 HTML Form Ulf Leser: Informationsintegration, Wintersemester 2006/2007 5

6 Kompensation möglich SELECT * FROM Books WHERE Author = Defoe AND PubYear = 1979 Daniel Defoe, Robinson Crusoe, 1979 PubYear = 1979 Daniel Defoe, Robinson Crusoe, 1986 Daniel Defoe, Robinson Crusoe, 1979 Daniel Defoe, Moll Flanders, 1933 Defoe Ulf Leser: Informationsintegration, Wintersemester 2006/2007 6

7 Syntaktische Heterogenität Unterschiedliche Darstellung desselben Sachverhalts Dezimalpunkt oder komma Euro oder Comma-separated oder tab-separated HTML oder ASCII oder Unicode Notenskala 1-6 oder sehr gut, gut, Binärcodierung oder Zeichen Datumsformate (12. September 2006, , 9/12/2006, ) Überwindung in der Regel nicht problematisch Umrechnung, Übersetzungstabellen, Ulf Leser: Informationsintegration, Wintersemester 2006/2007 7

8 Strukturelle Heterogenität Allgemein Gleiche Dinge in unterschiedlichen Schemata ausdrücken Andere Aufteilung von Attributen auf Tabellen Fehlende / neue Attribute (wenn Intension nicht betroffen ist) Setzt intensionale Überlappung voraus ( gleiche Dinge ) Meistens mit semantischen Heterogenität verbunden Ausnahme: 1:1 Beziehungen Spezialfall: Schematische Heterogenität Verwendung anderer Elemente eines Datenmodells Kann meist nicht durch Anfragesprachen überwunden werden Ulf Leser: Informationsintegration, Wintersemester 2006/2007 8

9 Spezialfall: Schematische Heterogenität maenner( Id, vorname, nachname) frauen( Id, vorname, nachname) Relation vs. Attribut Relation vs. Wert person( Id, vorname, nachname, maennlich?, weiblich?) person( Id, vorname, nachname, geschlecht) Attribut vs. Wert Ulf Leser: Informationsintegration, Wintersemester 2006/2007 9

10 Integrierte Sichten Verlangt viele Verrenkungen Sicht muss angepasst werden, wenn neue Filmtypen vorliegen Datenänderungen bedingen Schemaänderungen Das will man unbedingt vermeiden Ulf Leser: Informationsintegration, Wintersemester 2006/

11 Semantik von was? Name Extension Intension Realweltliche Objekte repräsentiert Konzept Ulf Leser: Informationsintegration, Wintersemester 2006/

12 Probleme Mögliche Beziehungen zwischen den Mengen realweltlicher Objekte, die Konzepte repräsentieren A=B (Äquivalenz): semantische (echte) Synonyme Kreditinstitut, Bank (?) Gibt es echte Synonyme? A B (Inklusion): B ist Hyperonym (Oberbegriff) zu A; A ist Hyponym zu B Tochter Kind A B A B (Überlappung): Schwierigster Fall Küche-Kochnische; Haus-Gebäude; Regisseur-Schauspieler A B = (Disjunktion): nicht verwandte Begriffe (häufigster Fall) Dose-Lohnsteuerjahresausgleich Ulf Leser: Informationsintegration, Wintersemester 2006/

13 Semantik: Woher nehmen? Schemaelemente sind erst mal nur Namen Was bestimmt die Semantik eines Namens? Für Attributnamen Datentyp Constraints (Schlüssel, FK, unique, CHECK, ) Zugehörigkeit zu einer Relation Andere Attribute dieser Relation Beziehung der Relation zu anderen Relationen Dokumentation Vorhandene Werte Wissen über den Anwendungsbereich Der Kontext Ulf Leser: Informationsintegration, Wintersemester 2006/

14 Kontext Semantik eines Namens hängt vom Kontext ab Beispiel Unternehmen A: angestellte( ) Unternehmen B: mitarbeiter( ) Mitarbeiter und Angestellte kann man als Synonyme betrachten Aber: A.angestellte B.mitarbeiter = Wenn Personen nicht in zwei Unternehmen beschäftigt sind Erst bei einem Merger von A und B werden A.angestellte und B.mitarbeiter zu Synonymen Sollten dann zu einer Tabelle integriert werden Ulf Leser: Informationsintegration, Wintersemester 2006/

15 Entstehung von Inter-Source-Konflikten Bei der Integration von Informationssystemen Lokal konsistent aber global inkonsistent Voraussetzung sind Duplikate Extensionale Redundanz Andere Datentypen ( 1 versus eins ) Andere lokale Schreibweisen oder Konventionen Skalen (inch cm), Währungen, rechtliche Bedingungen (MWST), Übertragungsfehler Fehlerhafte Parser beim ETL Fehlendes Verständnis für die Bedeutung der Dinge Mangelnde Dokumentation, falsches Re-engineering, Verwendung unterschiedlicher Standards Produktnummern, Produktklassen, Berufsbezeichnungen, Verschiedene Messungen Temperatur an einem Tag? Ulf Leser: Informationsintegration, Wintersemester 2006/

16 Voraussetzung: Identität Konzept = Realweltobjekt Name = Identifikation, Schlüssel Duplikate: Semantische Konflikte auf Datenebene Synonyme: Verschiedene IDs für gleiches Objekt Personalausweisnummer und Führerscheinnummer ISBN und Kombination Autor/Titel Homonym: Gleiche IDs für verschiedene Objekte Dann ging was schief (gefälschte Pässe, ) Oder über Unternehmensgrenzen hinweg (Kunden.ID, ) Schwieriges Problem: Lokale IDs Schlüssel gelten in einer Tabelle Häufig verwendet man nur surrogate Keys (sequence) Die bedeuten nichts außerhalb der eigenen Datenbank Integration erfordert Duplikaterkennung Ulf Leser: Informationsintegration, Wintersemester 2006/

17 Transparenz Verteilung, Autonomie, Heterogenität kann in unterschiedlichem Maße überwunden werden Ortstransparenz Benutzer müssen den Ort der integrierten Systeme nicht kennen Keine URLs, Datenbankpräfixe, Quellentransparenz, Verteilungstransparenz Benutzer weiß nicht, welche Quelle für eine Anfrage benutzt werden kann (und muss daher nicht auswählen) Benutzer weiß nicht, welche Quelle für eine Anfrage benutzt wurde (Datenherkunft) Setzt ein globales Schema voraus Ulf Leser: Informationsintegration, Wintersemester 2006/

18 Will man nicht immer! Intuitiv strebt man maximale Transparenz an Tatsächlich ist das oft kontraproduktiv Benutzer kennen und lieben ihre Datenquellen Datenherkunft ist wichtigstes Kriterium für Einschätzung der Qualität der Informationen Zugriff durch globales Schemas nur bei Kenntnis dieses Benutzer muss neues Schema lernen Globale Schemata können sehr kompliziert werden Da sie viele Quellen integrieren Für kleine Zugriffe unnötig schwierig Transparenz bedingt Informationsverlust Ulf Leser: Informationsintegration, Wintersemester 2006/

19 Inhalt diese Vorlesung Klassifikation Verteilter, autonomer, heterogener Systeme Führt zu möglichen Architekturen Weitere Klassifikationskriterien Schichtenaufbau integrierter Systeme 3-5 Schichten Ulf Leser: Informationsintegration, Wintersemester 2006/

20 Klassifikation [ÖV91] Verteilte, homogene DBS Verteilung Verteilte, föderierte DBS Verteilte, heterogene DBS Logisch integrierte und homogene DBS Heterogenität Verteilte, heterogene föderierte DBS Autonomie Ulf Leser: Informationsintegration, Wintersemester 2006/

21 Verteilung 1. Zentrale Datenbank Autonomie Heterogenität Normalfall homogene, zentrale Datenbank Daten/Berechnung können trotzdem begrenzt verteilt sein Filesystem: Partitionierung, RAID, SAN Berechnung: Cluster Parallele Datenbanken Datenbank entsteht aus homogenem Entwurf Wenn Redundanz / Heterogenität, dann mit Absicht und kontrolliert Problem: Weiterentwicklung (Evolution) Zentrale Kontrolle und Administration Ulf Leser: Informationsintegration, Wintersemester 2006/

22 Verteilung 2. Verteilte Datenbanken Autonomie Daten liegen physisch verteilt Absichtsvolle, kontrollierte, a-priori Verteilung Existenz eines konzeptionell homogenen, verteilt realisierten Schemas Ziele Höhere Performanz durch Parallelisierung Höhere Sicherheit vor Katastrophen Höhere Ausfallsicherheit durch redundant ausgelegte Systeme (Replikation) Knoten haben keine Autonomie Heterogenität wird unterdrückt Ortstransparenz, aber keine Verteilungstransparenz Aliase und Proxy kapseln entfernte Orte Heterogenität Verteilungstransparenz durch Sichten möglich, aber nicht durch System erzeugt Ulf Leser: Informationsintegration, Wintersemester 2006/

23 Einschub: Verteilte Datenbanken mit Oracle Oracle-DB können auf andere Oracle-DB zugreifen Database Links CREATE [PUBLIC] DATABASE LINK <link_name> CONNECT TO <user_name> <IDENTIFIED BY <password> USING '<service_name>'; service_name muss über Konfigurationsfiles aufgelöst werden SELECT col1, col2, FROM Zugriff wie auf lokale Tabelle (Joins, Selektion, Projektion, ) Transparenz durch Sicht möglich CREATE VIEW myview AS SELECT * FROM tab1@link_name; Schwieriger Verteilte Optimierung (später) 2-phase-commit Anwendung (z.b.): automatische Replikation Verschiedene Refresh-Optionen Ulf Leser: Informationsintegration, Wintersemester 2006/

24 Einschub: Partitionierung Aufteilung der Daten einer Tabelle in Untereinheiten Für den Benutzer transparente Partitionierung Nach Definition der Partitionen Muss vom System unterstützt werden Für den Benutzer nicht transparente Partitionierung Explizites Anlegen mehrerer Tabellen Anfragen müssen entsprechend formuliert werden Geht immer Daten sind im Ergebnis physisch verteilt Verschiedene Platten, verschiedene Controller Voraussetzung zur verteilten Bearbeitung Ulf Leser: Informationsintegration, Wintersemester 2006/

25 Vertikale Partitionierung id price amount code form CASH VISA VISA id price amount id code form CASH VISA VISA Ulf Leser: Informationsintegration, Wintersemester 2006/

26 Bewertung Zerstört semantische Einheiten die Tupel Zusammenfassen erfordert (teure) Joins Geeignete Technik zur Auslagerung... von selten benutzten Attributen von Attributen, die häufiger als andere verändert werden (und deshalb zu Reorganisation / Row Splits führen) von BLOBs, LONG, etc. Transparenz für Benutzer ist möglich Definition eines Views Performanceverschlechterung, wenn Optimierer mit dem View nicht richtig umgehen kann Benötigt immer zusätzliche Joins Forschung: Column-wise databases Ulf Leser: Informationsintegration, Wintersemester 2006/

27 Horizontale Partitionierung id price amount code form CASH VISA VISA CASH CASH CASH VISA CASH VISA VISA CASH VISA Ulf Leser: Informationsintegration, Wintersemester 2006/

28 Horizontale Partitionierung Wichtige Erweiterung der meisten kommerziellen RDBMS der letzten Jahre Hauptvorteile Datenmanagement Partitionen als eigenständige Datenbankobjekte Parallele Verarbeitung Scans können Partitionen auslassen (Partition pruning) Ulf Leser: Informationsintegration, Wintersemester 2006/

29 Prinzip CREATE TABLE sales_range (salesman_id NUMBER(5), salesman_name VARCHAR2(30), sales_amount NUMBER(10), sales_date DATE) PARTITION BY RANGE(sales_date) ( PARTITION t21 VALUES LESS THAN(TO_DATE('02/01/2000','DD/MM/YYYY')), PARTITION t22 VALUES LESS THAN(TO_DATE('03/01/2000','DD/MM/YYYY')), PARTITION t23 VALUES LESS THAN(TO_DATE('04/01/2000','DD/MM/YYYY')), PARTITION t24 VALUES LESS THAN(TO_DATE('05/01/2000','DD/MM/YYYY')) ); Partitionen sind eigene Datenbankobjekte Eigene DDL Kommandos Müssen explizit angelegt werden Können einzeln positioniert und gemanaged werden Nach Anlage vollkommen transparente Benutzung Partitionierungskriterium kann auch jederzeit geändert werden Ulf Leser: Informationsintegration, Wintersemester 2006/

30 Verteilte versus parallele Datenbanken ANSI/SPARC 3-Schichten Architektur für zentralisierte DBMS Externes Schema 1... Externes Schema N Konzeptionelles Schema Internes, physisches Schema Ulf Leser: Informationsintegration, Wintersemester 2006/

31 Vergleich Parallele Datenbank Verteilte Datenbank Externes Schema 1... Externes Externes Schema N Schema 1... Externes Schema N Konzeptionelles Schema Konzep. Schema Konzep. Schema Internes, physisches Schema Internes Schema Internes Schema Ulf Leser: Informationsintegration, Wintersemester 2006/

32 Einschub: Parallele Datenbanken Auswirkung nur auf der physischen Schicht Es existiert nur ein logisches Schema Interquery: Queries werden (jeweils als ganzes) auf verschiedene Knoten verteilt Intraquery: Einzelne Queries werden aufgebrochen und die Fragmente verteilt (z.b. Partitionen) Shared Nothing (DB2) Verschiedene Knoten haben eigene Platten Zentrale Instanz verteilt Anfragen Verteilungsmöglichkeiten mit Konfiguration festgelegt Shared Disc (Oracle) Alle Knoten greifen auf gleiche Platten zu Schwierige Synchronisation Dynamische Verteilung je nach Last möglich Ulf Leser: Informationsintegration, Wintersemester 2006/

33 Einschub: Gateways Ähnlich verteilte Datenbanken Zugriff z.b. über ODBC Umwandlung von Datentypen Unterstützung verschiedener SQL-Dialekte Kompensation fehlender Funktionen Siehe auch: GARLIC (später) Ulf Leser: Informationsintegration, Wintersemester 2006/

34 Verteilung 3. Verteilte & heterogene DB Autonomie Daten liegen physisch verteilt vor Daten sind heterogen Z.B. aufgrund der Historie der Entstehung Keine Autonomie Heterogenität sollte also nicht schlimmer werden Typischer Zwischenzustand Heterogenität Ulf Leser: Informationsintegration, Wintersemester 2006/

35 Verteilung 4. Verteilte & autonome DB Autonomie Heterogenität Verteilte, aber homogene Datenbestände Entsteht durch freiwillige Übernahme von Regeln Standards, Verträge, Autonomie wird teilweise aufgegeben Z.B. Aufgabe von Designautonomie Z.B. nicht Kommunikationsautonomie Z.B. nicht juristische Autonomie Ulf Leser: Informationsintegration, Wintersemester 2006/

36 Verteilung 5. Multidatenbanken Autonomie Verteilt, autonom, und etwas heterogen Keine technische und Datenmodellheterogenität Z.B.: verteilte Systeme benutzen gleiche Techniken (RDBMS) Schemata können strukturell und semantisch heterogen sein Zugriff über einheitliche Sprache Oder Simulation durch Wrapper (später) Autonomie bleibt bewahrt Aber Zugriff muss möglich sein (Kommunikationsautonomie) Zugriff über Multidatenbanksprachen Qualifizierung von Tabellennamen mit Datenbanknamen Ähnlich Database-Links; Beispiel: SchemaSQL Heterogenität Ulf Leser: Informationsintegration, Wintersemester 2006/

37 Verteilung 6. Verteilt, heterogen, autonom Autonomie Das ist das hauptsächliche Szenario dieser Vorlesung Quellen behalten volle Autonomie Wissen u.u. nichts von ihrer Integration Nehmen u.u. keine Rücksicht bzgl. Änderungen Quellen sind heterogen Quellen sind verteilt Heterogenität Ulf Leser: Informationsintegration, Wintersemester 2006/

38 Taxonomie nach [SL90] DBMS Kontrollierte, gewollte Verteilung Kein Zugriff durch einheitlichen Mechanismus Zentralisiertes DBMS Einfaches, verteiltes DBMS Nicht-föderierte DBS Verteiltes DBMS Multidatenbanksystem Föderierte DBS (FDBS) Nutzer muss selbst integrieren (durch Views etc.) Lose Kopplung Enge Kopplung Nur ein föderiertes Schema Einfache Föderation Mehrfache Föderation Ulf Leser: Informationsintegration, Wintersemester 2006/

39 Überblick Klassifikation Verteilter, autonomer, heterogener Systeme Weitere Klassifikationskriterien Schichtenaufbau integrierter Systeme 3-5 Schichten Prominente Architekturen Ulf Leser: Informationsintegration, Wintersemester 2006/

40 Kriterien föderierter Informationssysteme Nach [BKLW99] Weitere (nicht-orthogonale) Kriterien Strukturierung der Komponenten Enge und lose Kopplung Datenmodell Art der semantischen Integration Transparenz Anfrage-Paradigma Bottom-up oder Top-down Entwurf Virtuell oder materialisiert Read-only oder read-&-write Ulf Leser: Informationsintegration, Wintersemester 2006/

41 Struktur der Komponenten Strukturiert Festes Schema, festes Format Beispiel: Datenbanken Semi-strukturiert Struktur vorhanden, aber höchstens teilweise festgelegt Individuelle Abweichungen jederzeit möglich Vor allem neue Attribute, Tabellen, Elemente, Prädikate, Daten sind mit semantischen Tags versehen Beispiel: XML/RDF ohne Schemata, OEM Daten, UNQL, ACeDB, Unstrukturiert Keine Struktur Search, Information Retrieval, Informationsextraktion Beispiel: Textuelle Daten, Webseiten, Berichte Ulf Leser: Informationsintegration, Wintersemester 2006/

42 Enge oder lose Kopplung Enge Kopplung Festes, integriertes/föderiertes Schema Korrespondenzen regeln die Zusammenhänge Für den Benutzer einheitliche Sicht Erfordert Kooperation der Quellen Anpassungen, Schemaevolution Lose Kopplung Kein globales, einheitliches Schema Nutzer müssen Semantik der Quellen kennen Nutzer integrieren selber Nur technische und Datenmodellheterogenität ist gelöst Verlangt weniger Kooperation Zugriff muss möglich sein, aber Schemata können sich ändern Multidatabase query language (MDBQL) Ulf Leser: Informationsintegration, Wintersemester 2006/

43 Verwendetes Datenmodell Kanonisches Datenmodell Objektorientiertes Modell Relationales Modell XML Datenmodell Abbildung zwischen Datenmodellen ist schwierig Relational zu XML Abbildung von m:n Beziehungen? OO zu Relational Schlüssel versus ID, Assoziation versus Foreign Keys, Vererbung? Abbildung in semantisch schwächere Datenmodelle bringt Verlust Muss durch Anwendung kompensiert werden Integration semantisch starker Modelle ist schwieriger Ulf Leser: Informationsintegration, Wintersemester 2006/

44 Art der semantischen Integration Vereinigung Simple Konkatenation von Objekten Anreicherung Mit Metadaten Keine Konfliktauflösung Erzeugt mehr, aber nicht notwendigerweise bessere Daten Sehr häufig! Datenfusion Objektidentifizierung Re-Strukturierung Komplementierung Konfliktlösung Ulf Leser: Informationsintegration, Wintersemester 2006/

45 Welche Transparenz wird erreicht? Orttransparenz Physischer Ort der Daten unbekannt IP, Quellenname, DB Name Verteilungstransparenz Nutzer sehen nur integriertes Schema Strukturelle Konflikte werden verborgen Schnittstellentransparenz Nutzer muss nur eine Sprache beherrschen Integriertes System übersetzt Ulf Leser: Informationsintegration, Wintersemester 2006/

46 Welche Art von Anfragen werden unterstützt? Strukturierte Anfragen Schema ist Nutzern bekannt und wird in Anfragen verwendet Z.B. SQL, OQL, QBE Canned queries Vordefinierte Anfragen mit Parametern Z.B.: Webformulare, Funktionen Such-Anfragen (Information Retrieval) Struktur unbekannt oder nicht vorhanden Z.B. Suchmaschinen auf Texten Browsing Kein Such-Interface Beispiel: WWW, Hypertext, Reports Ulf Leser: Informationsintegration, Wintersemester 2006/

47 Bottom-up oder Top-down Entwurf Bottom-up Beginnt mit dem Bedarf nach der Integration einer festen Menge von genau bestimmten Quellen Globales Schema wird durch Schemaintegration erstellt Änderungen in Quellen i.d.r. schwierig (Neuintegration) Verbunden mit hohen Ansprüchen an Vollständigkeit und Qualität Typisches Szenario: Data Warehouse, Merging von Unternehmensdatenbanken Top-down Ausgelöst durch globalen Informationsbedarf Neuentwurf des globalen Schemas Quellen werden nach Bedarf und Eignung hinzugefügt Verlangt flexiblere Integrationsmechanismen Vorteilhaft bei volatilen Quellen (Web) Verbunden mit geringeren Ansprüchen an Vollständigkeit und Qualität Typisches Szenario: Webintegration, Integration als Service Ulf Leser: Informationsintegration, Wintersemester 2006/

48 Bottom-up Entwicklung Ulf Leser: Informationsintegration, Wintersemester 2006/

49 Top-down Entwicklung Ulf Leser: Informationsintegration, Wintersemester 2006/

50 Virtuell oder materialisiert Virtuell Kein zentraler Datenpool Anfragen werden in Teilanfragen zerlegt und in den Quellen beantwortet Daten werden nur bei Bedarf übertragen und höchstens temporär gespeichert Immer aktuell, potentiell langsam, eingeschränkte Queries Materialisiert Aufbau eines zentralen Datenpools Redundante Datenhaltung Daten werden offline transformiert und integriert Anfragen werden direkt gegen die materialisierten Daten gestellt Potentiell veraltet, sehr schnell, volle Queries Setzt Zugriff auf komplette Datenbasis voraus Später mehr Ulf Leser: Informationsintegration, Wintersemester 2006/

51 Read-only oder read-&-write Read-only die beliebtere Variante Write (insert & update) schwierig Viele Interfaces erlauben kein Schreiben Update durch Sichten ist schwierig Bei Komplementierung: Welche Quelle? Globale Transaktionen (komplexe Protokolle) Autonomie! Ulf Leser: Informationsintegration, Wintersemester 2006/

52 Überblick Klassifikation Verteilter, autonomer, heterogener Systeme Führt zu möglichen Architekturen Weitere Klassifikationskriterien Schichtenaufbau integrierter Systeme 3-5 Schichten Prominente Architekturen Ulf Leser: Informationsintegration, Wintersemester 2006/

53 ANSI/SPARC 3-Schichten Architektur Externe (logische) Sicht Je nach Anwendung Nur relevante Daten Sichten (Views) Konzeptionelle (logische) Sicht Unabhängig von physischer Sicht Definiert durch Datenmodell Stabiler Bezugspunkt Interne (physische) Sicht Dateistruktur Speicherort (Zylinder, Block) Indexe, Partitionen, Ulf Leser: Informationsintegration, Wintersemester 2006/

54 3-Schichten Architektur Anwendungen Externes Schema 1... Externes Schema N DBMS Konzeptionelles Schema Internes Schema Ulf Leser: Informationsintegration, Wintersemester 2006/

55 4-Schichten Architektur Für verteilte DBMS Lokales vs. globales konzeptionelles Schema Globales konzeptionelles Schema integriert die lokalen konzeptionellen Schemata Lokales und globales konzeptionelles Schema können gleich sein Aber Datenbestände unterschiedlich Externes Schema 1 Lokales konzept. Schema Internes Schema... Konzeptionelles Schema Externes Schema N Lokales konzept. Schema Internes Schema Ulf Leser: Informationsintegration, Wintersemester 2006/

56 4-Schichten Architektur Anwendungen Externes Schema 1... Externes Schema N Vert. DBMS Konzeptionelles Schema Lokale DBMS Lokales konzept. Schema... Lokales konzept. Schema Internes Schema... Internes Schema Ulf Leser: Informationsintegration, Wintersemester 2006/

57 Import-/Export-Schema-Architektur [HM85] = lokales konzeptionelles Schema Idee: Nur Teilmenge des lokalen konzeptionellen Schemas wird der Föderation zur Verfügung gestellt. Idee: Nur Teilmengen der Exportschemas sollen verwendet werden. Ulf Leser: Informationsintegration, Wintersemester 2006/

58 Multidatenbankarchitektur Siehe [LMR90] Voraussetzung Nutzer kennen die jeweiligen Schemas Multidatenbanksprache Lose Kopplung Externes Schema 1 Export-Schema... Externes Schema N Export-Schema Lokales konzept. Schema... Lokales konzept. Schema Internes Schema... Internes Schema Ulf Leser: Informationsintegration, Wintersemester 2006/

59 4-Schichten Architektur Anwendungen Anwendungen müssen selbst integrieren Externes Schema 1 Export-Schema... Externes Schema N Export-Schema Lokale DBMS Lokales konzept. Schema... Lokales konzept. Schema Internes Schema... Internes Schema Ulf Leser: Informationsintegration, Wintersemester 2006/

60 5-Schichten Architektur [SL90] Eigentlich 6 Schichten Interne Schemas werden nicht mehr betrachtet Integriertes, föderiertes Schema Komponentenschema = lokales konzept. Schema Föderiertes Schema = globales konzept. Schema Externes Schema 1 Föderiertes Schema Exportschema Lokales Schema Externes Schema N Exportschema Komponentenschema Komponentenschema Lokales Schema Ulf Leser: Informationsintegration, Wintersemester 2006/

61 5-Schichten Architektur [SL90] Anwendungen Externes Schema 1... Externes Schema N Föderiertes DBMS Föderiertes Schema Exportschema Exportschema Lokale DBMS... Komponentenschema Komponentenschema Lokales internes Schema Lokales internes Schema Ulf Leser: Informationsintegration, Wintersemester 2006/

62 5-Schichten Architektur [SL90] Exportschemas Teilmenge des Komponentenschemas Zugangsberechtigungen Unnötig, wenn komplettes Schema exportiert wird Komponentenschemas Kanonisches Datenmodell Fügt fehlende Semantik hinzu Übergang durch Mappings Unnötig, wenn lokales = kanonisches Datenmodell Lokale Schemas Konzeptionell Externes Schema 1 Föderiertes Schema Exportschema Lokales Schema Externes Schema N Exportschema Komponentenschema Komponentenschema Lokales Schema Ulf Leser: Informationsintegration, Wintersemester 2006/

63 5-Schichten Architektur [SL90] Externes Schema Föderiertes Schema kann sehr groß sein Vereinfachung im Exportschema Schema Evolution leichter Zugangskontrollen Föderiertes Schema Integriert aus den Exportschemas Kennt Datenverteilung Andere Namen: Import, global, unified, Enterprise Schema Externes Schema 1 Föderiertes Schema Exportschema Lokales Schema Externes Schema N Exportschema Komponentenschema Komponentenschema Lokales Schema Ulf Leser: Informationsintegration, Wintersemester 2006/

64 Überblick Klassifikation Verteilter, autonomer, heterogener Systeme Führt zu möglichen Architekturen Weitere Klassifikationskriterien Schichtenaufbau integrierter Systeme 3-5 Schichten Prominente Architekturen Ulf Leser: Informationsintegration, Wintersemester 2006/

65 Data Warehouses Quelle 1 RDBMS Staging Area Metadaten Mart 2 Quelle 2 IMS Staging Area Cube Mart 1 Materialisierte Integration Regelmäßiger Export, Transformation, Import einer festen Zahl von Datenquellen (ETL Prozess) Redundante Datenhaltung wegen unterschiedlicher Verwendung (OLAP versus OLTP) Kommerziell extrem wichtig Ulf Leser: Informationsintegration, Wintersemester 2006/

66 Mediator-Wrapper Architektur Virtuelle Integration Unabhängig von Strukturiertheit Quellspezifische Wrapper Datenmodelltransformation Übersetzung von Anfragen Mediatoren als Mehrwertdienste Datenintegration Verdichtung Anwendung 1 Anwendung 2 Mediator Wrapper 1 Wrapper 2 Wrapper 3 Quelle 1 Quelle 2 Quelle 3 Ulf Leser: Informationsintegration, Wintersemester 2006/

67 Föderierte Datenbanken Trotz häufiger Verwendung keine klare Definition vorhanden Klassischer Definition: 5-Schichten Architektur Lokales Schema, Komponentenschema, Exportschema, föderiertes Schema, externes Schema Integrierte Schemata verlangen aber semantische Integration Datenbankhersteller meiden dieses Gebiet Federated databases heute Allgemeiner Begriff für integrierten Zugang Kommerziell meistens über Multidatenbanksprachen Definition von Sichten zur Erstellung (teil-)integrierter Schema Ulf Leser: Informationsintegration, Wintersemester 2006/

68 Einordnung Distributed Databases Complexity Ulf Leser: Informationsintegration, Wintersemester 2006/

69 Literatur Wichtige Literatur [ÖV99] Principles of Distributed Database Systems. M. Tamer Özsu, Patrick Valduriez, Prentice Hall, [SL90] Amit P. Sheth and James A. Larson, Federated Database Systems for Managing Distributed, Heterogeneous, and Autonomous Databases, ACM Computing Surveys, Vol. 22(3), pp , [Con97] Stefan Conrad, Föderierte Datenbanksysteme. Springer, Heidelberg Weitere Literatur [LMR90] W. Litwin, L. Mark, N. Roussoupoulos, Interoperability of Multiple Autonomous Databases, ACM Computing Surveys, Vol. 22(3), pp , [HM85] Dennis Heimbigner, Dennis McLeod: A Federated Architecture for Information Management. ACM Trans. Inf. Syst. 3(3): (1985) Ulf Leser: Informationsintegration, Wintersemester 2006/

Informationsintegration

Informationsintegration Informationsintegration Architekturen Vergleichskriterien für integrierte Systeme Ulf Leser Wissensmanagement in der Bioinformatik Übersicht Technische Heterogenität Technische Realisierung des Datenzugriffs

Mehr

Informationsintegration

Informationsintegration Informationsintegration Grundlegende Architekturen Ulf Leser Inhalt diese Vorlesung Klassifikation verteilter, autonomer, heterogener Systeme Weitere Klassifikationskriterien Schichtenaufbau integrierter

Mehr

Kapitel 3: Eigenschaften von Integrationssystemen. Einordnung von Integrationssystemen bzgl. Kriterien zur Beschreibung von Integrationssystemen

Kapitel 3: Eigenschaften von Integrationssystemen. Einordnung von Integrationssystemen bzgl. Kriterien zur Beschreibung von Integrationssystemen Datenintegration Datenintegration Kapitel 3: Eigenschaften von Integrationssystemen Andreas Thor Sommersemester 2008 Universität Leipzig Institut für Informatik http://dbs.uni-leipzig.de 1 Inhalt Einordnung

Mehr

Informationsintegration

Informationsintegration Informationsintegration Verteilung, Autonomie, Heterogenität, Transparenz Ulf Leser Klassifikationsdimensionen [ÖV99] Eigenschaften von Informationssystemen in Bezug auf deren Integration Verteilung Autonomie

Mehr

Informationsintegration

Informationsintegration Informationsintegration Heterogenität Datenkonflikte Transparenz Ulf Leser Wissensmanagement in der Bioinformatik Klassifikationsdimensionen [ÖV99] Klassische Eigenschaften von Informationssystemen Verteilung

Mehr

Informationsintegration

Informationsintegration Informationsintegration Heterogenität Transparenz Ulf Leser Wissensmanagement in der Bioinformatik Klassifikationsdimensionen Verteilung Autonomie Heterogenität Ulf Leser: Informationsintegration, Wintersemester

Mehr

Datenintegration & Datenherkunft Architekturen

Datenintegration & Datenherkunft Architekturen Datenintegration & Datenherkunft Architekturen Wintersemester 2010/11 Melanie Herschel melanie.herschel@uni-tuebingen.de Lehrstuhl für Datenbanksysteme, Universität Tübingen 1 Kapitel 4 Architekturen Überblick

Mehr

Informationsintegration

Informationsintegration Informationsintegration Verteilung, Autonomie, Heterogenität, Transparenz Ulf Leser Inhalt dieser Vorlesung Verteilung Autonomie Heterogenität Transparenz Ulf Leser: Informationsintegration 2 Klassifikationsdimensionen

Mehr

Informationsintegration I Einführung

Informationsintegration I Einführung Informationsintegration I Einführung Felix Naumann Integrierte Informationssysteme Anfrage Integriertes Informationssystem Oracle, DB2 Anwendung Dateisystem Web Service HTML Form Integriertes Info.-system

Mehr

30. Juni 2006 - Technische Universität Kaiserslautern. Paul R. Schilling

30. Juni 2006 - Technische Universität Kaiserslautern. Paul R. Schilling 30. Juni 2006 - Technische Universität Kaiserslautern Paul R. Schilling ! " #$% & '( ( ) *+, - '. / 0 1 2("$ DATEN SIND ALLGEGENWÄRTIG Bill Inmon, father of data warehousing Unternehmen In einer vollkommenen

Mehr

VL Informationsintegration Verteilung, Autonomie und Heterogenität. 25.10.2004 Felix Naumann. Aufbau eines Data Warehouse

VL Informationsintegration Verteilung, Autonomie und Heterogenität. 25.10.2004 Felix Naumann. Aufbau eines Data Warehouse VL Informationsintegration Verteilung, Autonomie und Heterogenität 25.10.2004 Felix Naumann Wiederholung: Data Warehouse Aufbau eines Data Warehouse Quelle: Ulf Leser, VL Data Warehouses 25.10.2004 Felix

Mehr

Informationsintegration Architekturen. 17.4.2012 Felix Naumann

Informationsintegration Architekturen. 17.4.2012 Felix Naumann Informationsintegration Architekturen 17.4.2012 Felix Naumann Überblick 2 Überblick über Informationssysteme Klassifikation Materialisiert vs. virtuell Architekturen 3 Schichten Architektur 4 Schichten

Mehr

Ausgangspunkt. Datenintegration. Ziel. Konflikte. Architekturen. Transparenz

Ausgangspunkt. Datenintegration. Ziel. Konflikte. Architekturen. Transparenz Ausgangspunkt Datenintegration Web Informationssysteme Wintersemester 2002/2003 Donald Kossmann Daten liegen in verschiedenen Datenquellen (Extremfall: jede URL eigene Datenquelle) Mietautos bei www.hertz.com

Mehr

7. XML-Datenbanksysteme und SQL/XML

7. XML-Datenbanksysteme und SQL/XML 7. XML-Datenbanksysteme und SQL/XML Native XML-DBS vs. XML-Erweiterungen von ORDBS Speicherung von XML-Dokumenten Speicherung von XML-Dokumenten als Ganzes Generische Dekomposition von XML-Dokumenten Schemabasierte

Mehr

Relationales Datenbanksystem Oracle

Relationales Datenbanksystem Oracle Relationales Datenbanksystem Oracle 1 Relationales Modell Im relationalen Modell wird ein relationales Datenbankschema wie folgt beschrieben: RS = R 1 X 1 SC 1... R n X n SC n SC a a : i=1...n X i B Information

Mehr

SQL. SQL: Structured Query Language. Früherer Name: SEQUEL. Standardisierte Anfragesprache für relationale DBMS: SQL-89, SQL-92, SQL-99

SQL. SQL: Structured Query Language. Früherer Name: SEQUEL. Standardisierte Anfragesprache für relationale DBMS: SQL-89, SQL-92, SQL-99 SQL Früherer Name: SEQUEL SQL: Structured Query Language Standardisierte Anfragesprache für relationale DBMS: SQL-89, SQL-92, SQL-99 SQL ist eine deklarative Anfragesprache Teile von SQL Vier große Teile:

Mehr

Dieser Foliensatz darf frei verwendet werden unter der Bedingung, dass diese Titelfolie nicht entfernt wird.

Dieser Foliensatz darf frei verwendet werden unter der Bedingung, dass diese Titelfolie nicht entfernt wird. Thomas Studer Relationale Datenbanken: Von den theoretischen Grundlagen zu Anwendungen mit PostgreSQL Springer, 2016 ISBN 978-3-662-46570-7 Dieser Foliensatz darf frei verwendet werden unter der Bedingung,

Mehr

DBMS für spezielle Anwendungen XML als Mittel der Datenbank-Interoperabilität

DBMS für spezielle Anwendungen XML als Mittel der Datenbank-Interoperabilität DBMS für spezielle Anwendungen XML als Mittel der Datenbank-Interoperabilität Seminarvortrag von D. Zimmermann 26-Februar-2004 Gliederung Datenbanken und Interoperabilität Begriffe Bedarf Ansätze XML als

Mehr

Verteilte Datenbanken

Verteilte Datenbanken Verteilte Datenbanken Stand der Technik: Zentrale oder Verteilte Datenbanken Bisher (implizit) diskutiert: Zentraler Ansatz, d. h. keine Netzwerke berücksichtigt: Terminals / Arbeitsplatzrechner DB 1 Zentraler

Mehr

Schema Mapping. Dr. Armin Roth arminroth.de. Dr. Armin Roth (arminroth.de) II Schema Mapping / 23

Schema Mapping. Dr. Armin Roth arminroth.de. Dr. Armin Roth (arminroth.de) II Schema Mapping / 23 Dr. Armin Roth arminroth.de 25.04.2013 Dr. Armin Roth (arminroth.de) II Schema Mapping 25.04.2013 1 / 23 Agenda 1 Wiederholung: Schema Matching / Integration 2 Schema Mapping Definitionen Beispiel Algorithmus

Mehr

XML-Datenaustausch in der Praxis Projekt TOMIS bei der ThyssenKrupp Stahl AG

XML-Datenaustausch in der Praxis Projekt TOMIS bei der ThyssenKrupp Stahl AG Mittwoch, 9. November 2005 13h00, Bruno-Schmitz-Saal 18. Deutsche ORACLE-Anwenderkonferenz XML-Datenaustausch in der Praxis Projekt TOMIS bei der ThyssenKrupp Stahl AG Volker Husemann Thyssen Krupp Stahl

Mehr

Data Warehousing und Data Mining

Data Warehousing und Data Mining Data Warehousing und Data Mining Logische Optimierung Ulf Leser Wissensmanagement in der Bioinformatik Inhaltsübersicht Vorlesung Architektur Modellierung von Daten im DWH Umsetzung des multidimensionalen

Mehr

DB2 SQL, der Systemkatalog & Aktive Datenbanken

DB2 SQL, der Systemkatalog & Aktive Datenbanken DB2 SQL, der Systemkatalog & Aktive Datenbanken Lehr- und Forschungseinheit Datenbanken und Informationssysteme 1 Ziele Auf DB2 Datenbanken zugreifen DB2 Datenbanken benutzen Abfragen ausführen Den Systemkatalog

Mehr

Datenbanken Grundlagen und Design

Datenbanken Grundlagen und Design Frank Geisler Datenbanken Grundlagen und Design 3., aktualisierte und erweiterte Auflage mitp Vorwort 15 Teil I Grundlagen 19 i Einführung in das Thema Datenbanken 21 i.i Warum ist Datenbankdesign wichtig?

Mehr

Enterprise Applikation Integration und Service-orientierte Architekturen. 01 Einführung

Enterprise Applikation Integration und Service-orientierte Architekturen. 01 Einführung Enterprise Applikation Integration und Service-orientierte Architekturen 01 Einführung Agenda Warum EAI Klassifikation von EAI-Ansätzen Ebenen der Integration Architekturen zur Datenintegration Prof. Dr.

Mehr

Visualisierung in Informatik und Naturwissenschaften

Visualisierung in Informatik und Naturwissenschaften Visualisierung in Informatik und Naturwissenschaften Datenbankvisualisierung Sven Bernhard 12.06.1999 Datenbankvisualisierung Datenbanktheorie in 5 Minuten Visualisierung vs. Datenbanken Visualisierung

Mehr

Datenbankentwicklung

Datenbankentwicklung Datenbankentwicklung Berechnung und Präsentation von Daten Organisation der Daten in alleinstehende Tabellen Exklusiver Zugriff auf alle Informationen einer Tabelle Beschränkte Anzahl von Daten pro Tabellenblatt

Mehr

Datenintegration. Kapitel 2: Verteilung, Autonomie und Heterogenität. Dr. Anika Groß Sommersemester 2014

Datenintegration. Kapitel 2: Verteilung, Autonomie und Heterogenität. Dr. Anika Groß Sommersemester 2014 Datenintegration Datenintegration Kapitel 2: Verteilung, Autonomie und Heterogenität Dr. Anika Groß Sommersemester 2014 Universität Leipzig Institut für Informatik http://dbs.uni-leipzig.de 1 Inhalt Verteilung

Mehr

Integration, Migration und Evolution

Integration, Migration und Evolution 14. Mai 2013 Programm für heute 1 2 Quelle Das Material zu diesem Kapitel stammt aus der Vorlesung Datenintegration & Datenherkunft der Universität Tübingen gehalten von Melanie Herschel im WS 2010/11.

Mehr

Informationsintegration

Informationsintegration Informationsintegration Local-as-View Anfrageplanung Ulf Leser Inhalt dieser Vorlesung Anfragekorrespondenzen Formale Definition Korrespondenztypen und -arten GaV erklärt Local as View Query Containment

Mehr

Informationsintegration Einführung

Informationsintegration Einführung Informationsintegration Einführung 17.4.2007 Felix Naumann Integrierte Informationssysteme 2 Anfrage Integriertes Informationssystem Oracle, DB2 Anwendung Dateisystem Web Service HTML Form Integriertes

Mehr

Klausur Datenbanken II

Klausur Datenbanken II Klausur Datenbanken II 8.3.2001 Name Vorname Semester Matrikelnr Aufgabe Punkte maximal 1 8 2 8 3 3 4 3 5 4 6 6 7 6 8 6 9 [Zusatz] [4] Summe 44 Punkte erreicht Bitte geben Sie die Lösungen möglichst direkt

Mehr

Wirtschaftsinformatik 7a: Datenbanken. Hochschule für Wirtschaft und Recht SS 16 Dozent: R. Witte

Wirtschaftsinformatik 7a: Datenbanken. Hochschule für Wirtschaft und Recht SS 16 Dozent: R. Witte Wirtschaftsinformatik 7a: Datenbanken Hochschule für Wirtschaft und Recht SS 16 Dozent: R. Witte Drei Gäste bezahlen nach einem gemeinsamen Abendessen eine Rechnung von 30 Euro, so dass jeder 10 Euro gibt.

Mehr

Data Warehousing und Data Mining

Data Warehousing und Data Mining Data Warehousing und Data Mining Logische Optimierung Ulf Leser Wissensmanagement in der Bioinformatik Inhaltsübersicht Vorlesung Einleitung & Motivation Architektur Modellierung von Daten im DWH Umsetzung

Mehr

Datenintegration. Kapitel 2: Verteilung, Autonomie und Heterogenität. Andreas Thor Sommersemester 2008. Inhalt

Datenintegration. Kapitel 2: Verteilung, Autonomie und Heterogenität. Andreas Thor Sommersemester 2008. Inhalt Datenintegration Datenintegration Kapitel 2: Verteilung, Autonomie und Heterogenität Andreas Thor Sommersemester 2008 Universität Leipzig Institut für Informatik http://dbs.uni-leipzig.de 1 Inhalt Verteilung

Mehr

Grundlagen von SQL. Informatik 2, FS18. Dr. Hermann Lehner (Material von Dr. Markus Dahinden) Departement Informatik, ETH Zürich

Grundlagen von SQL. Informatik 2, FS18. Dr. Hermann Lehner (Material von Dr. Markus Dahinden) Departement Informatik, ETH Zürich Grundlagen von SQL Informatik 2, FS18 Dr. Hermann Lehner (Material von Dr. Markus Dahinden) Departement Informatik, ETH Zürich Markus Dahinden 13.05.18 1 Grundlagen von SQL (Structured Query Language)

Mehr

Geoinformation Abbildung auf Tabellen

Geoinformation Abbildung auf Tabellen Folie 1 von 32 Geoinformation Abbildung auf Tabellen Folie 2 von 32 Abbildung auf Tabellen Übersicht Motivation des relationalen Datenmodells Von Objekten zu Tabellen Abbildung von Objekten Schlüssel Abbildung

Mehr

10. Vorlesung: Datenorganisation SS 2007

10. Vorlesung: Datenorganisation SS 2007 10. Vorlesung: Datenorganisation SS 2007 8 Parallele Transaktionen 9 9.1 Drei-Ebenen Ebenen-Architektur 9.2 Verteilte Datenbanken 9.3 Client-Server Server-Datenbanken 9.4 Föderierte Datenbanken 9.5 Das

Mehr

Abschluss Einblick und Ausblick

Abschluss Einblick und Ausblick Abschluss Einblick und Ausblick Prof. Dr. T. Kudraß 1 Benutzer Komponenten eines DBMS (Überblick) I/O-Prozessor Output-Generierung Parser für selbst. oder eingebettete Kommandos Precompiler Autorisierungs-Kontrolle

Mehr

Wiederholung VU Datenmodellierung

Wiederholung VU Datenmodellierung Wiederholung VU Datenmodellierung VU Datenbanksysteme Reinhard Pichler Arbeitsbereich Datenbanken und Artificial Intelligence Institut für Informationssysteme Technische Universität Wien Wintersemester

Mehr

Einteilung von Datenbanken

Einteilung von Datenbanken Datenbanksysteme (c) A.Kaiser; WU-Wien 1 Einteilung von Datenbanken 1. formatierte Datenbanken 2. unformatierte Datenbanken Information Retrieval Systeme 2 Wozu Datenbanken? Speicherung und Verwaltung

Mehr

Kapitel 1: Wiederholungsfragen Grundlagen DBS

Kapitel 1: Wiederholungsfragen Grundlagen DBS Grundlagen DBS 1. Welche zentralen Anforderungen an ein DBS definierte Edgar Codd? 2. Was ist eine Transaktion? 3. Welche Eigenschaften muss das DBMS bei der Transaktionsverarbeitung sicherstellen? 4.

Mehr

WS 2010/11 Datenbanksysteme Fr 15:15 16:45 R 1.008. Vorlesung #5. SQL (Teil 3)

WS 2010/11 Datenbanksysteme Fr 15:15 16:45 R 1.008. Vorlesung #5. SQL (Teil 3) Vorlesung #5 SQL (Teil 3) Fahrplan Besprechung der Übungsaufgaben Rekursion Rekursion in SQL-92 Rekursion in DBMS- Dialekten (Oracle und DB2) Views (Sichten) - gespeicherte Abfragen Gewährleistung der

Mehr

Informationsintegration

Informationsintegration Informationsintegration Einführung Ulf Leser Wissensmanagement in der Bioinformatik Informationsintegration Anfrage Integriertes Informationssystem Oracle, DB2 Anwendung Dateisystem Web Service HTML Form

Mehr

Oracle Database 12c Was Sie immer schon über Indexe wissen wollten

Oracle Database 12c Was Sie immer schon über Indexe wissen wollten Oracle Database 12c Was Sie immer schon über Indexe wissen wollten Marco Mischke, 08.09.2015 DOAG Regionaltreffen B* Indexe - Aufbau 0-Level Index A-F G-Z 1-Level Index A-F G-Z 2-Level Index A-F G-M N-Z

Mehr

Überblick Felix Naumann. Zugriffsrechte Zugriffsrechte erzeugen Zugriffsrechte prüfen Zugriffsrechte vergeben Zugriffsrechte entziehen

Überblick Felix Naumann. Zugriffsrechte Zugriffsrechte erzeugen Zugriffsrechte prüfen Zugriffsrechte vergeben Zugriffsrechte entziehen Datenbanksysteme I Zugriffskontrolle (kleiner Einschub) 18.1.2007 Felix Naumann Überblick 2 Zugriffsrechte Zugriffsrechte erzeugen Zugriffsrechte prüfen Zugriffsrechte vergeben Zugriffsrechte entziehen

Mehr

Datenintegration & Datenherkunft Verteilung, Autonomie, und Heterogenität

Datenintegration & Datenherkunft Verteilung, Autonomie, und Heterogenität Datenintegration & Datenherkunft Verteilung, Autonomie, und Wintersemester 2010/11 Melanie Herschel melanie.herschel@uni-tuebingen.de Lehrstuhl für Datenbanksysteme, Universität Tübingen 1 Klassifikation

Mehr

Webbasierte Informationssysteme

Webbasierte Informationssysteme SS 2004 Prof. Dr. Stefan Böttcher Universität Paderborn - SS 2004 - Prof. Dr. Stefan Böttcher Folie 1 Was ist eine relationale Datenbank? Menge von Relationen (=Tabellen) und Constraints (=Integritätsbedingungen)

Mehr

P2P DATENBANKEN. Anwendungen 1 WS 2009/2010. Julissa Cusi Juarez. Department Informatik

P2P DATENBANKEN. Anwendungen 1 WS 2009/2010. Julissa Cusi Juarez. Department Informatik P2P DATENBANKEN Anwendungen 1 WS 2009/2010 Julissa Cusi Juarez Department Informatik HAW Hamburg 02.12.2009 1 Agenda 1. Motivation 2. Klassische Datenbanksysteme 3. Verteilte Datenbanksysteme 4. Peer to

Mehr

1 Einführung Ziele der Vorlesung Die Idee Lernkarte Selbsttest-Frage 3 Literaturhinweise 3

1 Einführung Ziele der Vorlesung Die Idee Lernkarte Selbsttest-Frage 3 Literaturhinweise 3 1 Einführung 1 1.1 Ziele der Vorlesung 1 1.2 Die Idee 1 1.3 Lernkarte 2 1.4 Selbsttest-Frage 3 Literaturhinweise 3 Teilt Die Zukunft von Enterprise-Computing 5 2 Neue Anforderungen an Enterprise Computing

Mehr

Kapitel 14. Objekt-relationales Mapping (ORM) mit Hibernate bzw. Java Persistance API (JPA) Prof. Dr. Wolfgang Weber Vorlesung Datenbanken

Kapitel 14. Objekt-relationales Mapping (ORM) mit Hibernate bzw. Java Persistance API (JPA) Prof. Dr. Wolfgang Weber Vorlesung Datenbanken Kapitel 14 Objekt-relationales Mapping (ORM) mit Hibernate bzw. Java Persistance API (JPA) 1 Wozu Objekt-relationales Mapping? - Problematik - Business-Schicht OO-Klassen Unvereinbarkeit der Paradigmen

Mehr

Datenbankbasierte Lösungen

Datenbankbasierte Lösungen Technologische Beiträge für verteilte GIS - Anforderungen an verteilte GIS und Lösungsansätze Datenbankbasierte Lösungen Johannes Kebeck Senior Systemberater ORACLE Deutschland GmbH Agenda TOP Thema 1

Mehr

Datenbanken. Zusammenfassung. Datenbanksysteme

Datenbanken. Zusammenfassung. Datenbanksysteme Zusammenfassung Datenbanksysteme Christian Moser Seite 1 vom 7 12.09.2002 Wichtige Begriffe Attribut Assoziation API Atomares Attribut Datenbasis DBMS Datenunabhängigkeit Datenbankmodell DDL DML DCL ER-Diagramm

Mehr

SQL (Structured Query Language) Schemata Datentypen

SQL (Structured Query Language) Schemata Datentypen 2 SQL Sprachelemente Grundlegende Sprachelemente von SQL. 2.1 Übersicht Themen des Kapitels SQL Sprachelemente Themen des Kapitels SQL (Structured Query Language) Schemata Datentypen Im Kapitel SQL Sprachelemente

Mehr

Kapitel DB:IV (Fortsetzung)

Kapitel DB:IV (Fortsetzung) Kapitel DB:IV (Fortsetzung) IV. Logischer Datenbankentwurf mit dem relationalen Modell Das relationale Modell Integritätsbedingungen Umsetzung ER-Schema in relationales Schema DB:IV-46 Relational Design

Mehr

Datenintegration. Kapitel 0: Organisatorisches. Dr. Anika Groß Sommersemester 2016

Datenintegration. Kapitel 0: Organisatorisches. Dr. Anika Groß Sommersemester 2016 Datenintegration Datenintegration Kapitel 0: Organisatorisches Dr. Anika Groß Sommersemester 2016 Universität Leipzig Institut für Informatik http://dbs.uni-leipzig.de 1 Organisatorisches Termin: donnerstags,

Mehr

1. Einführung, Problemstellung und Überblick Rechnernetze

1. Einführung, Problemstellung und Überblick Rechnernetze Inhaltsverzeichnis 1. Einführung, Problemstellung und Überblick 1 1.1 Einführung 1 1.2 Allgemeine Problemstellungen 5 1.2.1 Problemstellung bei Dezentralisierung 5 1.2.2 Problemstellung bei Integration

Mehr

Kap. 5.3: SAP-Datenmodell, Metadatenverwaltung

Kap. 5.3: SAP-Datenmodell, Metadatenverwaltung Kap. 5.3: SAP-Datenmodell, Metadatenverwaltung & Abbildung auf RDBMS SAP R/3 Repository Analyse: Datenmodell von SAP R/3 SAP-SERM Metadatenverwaltung Data Dictionary Abbildung von SAP-Tabellen auf RDBMS

Mehr

Vorwort zur 5. Auflage... 15 Über den Autor... 16

Vorwort zur 5. Auflage... 15 Über den Autor... 16 Vorwort zur 5. Auflage...................................... 15 Über den Autor............................................ 16 Teil I Grundlagen.............................................. 17 1 Einführung

Mehr

Das relationale Modell (Teil 1)

Das relationale Modell (Teil 1) Vorlesung #2 Das relationale Modell (Teil 1) Fahrplan WS 2010/11 Feedback Vorlesung#1 Das relationale Modell Einordnung (wir überspringen die Modellierung, das kommt im 4. Semester Datenmanagement ) Definition,

Mehr

Garten - Daten Bank. - survival pack -

Garten - Daten Bank. - survival pack - Garten - Daten Bank - survival pack - Dr. Karsten Tolle PRG2 SS 2017 Inhalt heute Kurz: Motivation und Begriffe SQL (survival pack) create table (Tabelle erzeugen) insert into (Einfügen) select (Anfragen)

Mehr

Auf einen Blick. Abfrage und Bearbeitung. Erstellen einer Datenbank. Komplexe Abfragen. Vorwort... 13

Auf einen Blick. Abfrage und Bearbeitung. Erstellen einer Datenbank. Komplexe Abfragen. Vorwort... 13 Auf einen Blick Vorwort... 13 Teil 1 Vorbereitung Kapitel 1 Einleitung... 17 Kapitel 2 SQL der Standard relationaler Datenbanken... 21 Kapitel 3 Die Beispieldatenbanken... 39 Teil 2 Abfrage und Bearbeitung

Mehr

Konzeptueller Entwurf

Konzeptueller Entwurf Konzeptueller Entwurf UML Klassendiagrame UML Assoziationen Entspricht Beziehungen Optional: Assoziationsnamen Leserichtung ( oder ), sonst bidirektional Rollennamen Kardinalitätsrestriktionen UML Kardinalitätsrestriktionen

Mehr

Datenmodellierung im Zeitalter agiler Softwareentwicklung

Datenmodellierung im Zeitalter agiler Softwareentwicklung Datenmodellierung im Zeitalter agiler Softwareentwicklung Sebastian Graf, PROMATIS software GmbH DOAG 2013, Nürnberg, 1 Agenda u Über den Referenten u Datenmodellierung Begriffsdefinition und Abgrenzung

Mehr

Informationsintegration

Informationsintegration Informationsintegration Anwendungsszenarien Ulf Leser Inhalt dieser Vorlesung Zwei Anwendungsszenarien Data Warehouse Föderierte Datenbanken Abgrenzung Daten versus Schema Ulf Leser: Informationsintegration

Mehr

In diesem Abschnitt wollen wir uns mit der Architektur von Datenbank Managements Systemen beschäftigen.

In diesem Abschnitt wollen wir uns mit der Architektur von Datenbank Managements Systemen beschäftigen. 1 In diesem Abschnitt wollen wir uns mit der Architektur von Datenbank Managements Systemen beschäftigen. Zunächst stellt sich die Frage: Warum soll ich mich mit der Architektur eines DBMS beschäftigen?

Mehr

Physischer DB-Entwurf

Physischer DB-Entwurf Physischer DB-Entwurf Prof. Dr. T. Kudraß 1 Überblick Ausgangslage: Konzeptuelles und externes Schema sind erstellt: ER Modell, Schemaverfeinerung und Definition von Sichten Nächster Schritt: Physischer

Mehr

Repetitorium. Data Warehousing und Data Mining 11/12. Sebastian Wandelt 13./16. Februar 2012

Repetitorium. Data Warehousing und Data Mining 11/12. Sebastian Wandelt 13./16. Februar 2012 Repetitorium Data Warehousing und Data Mining 11/12 Sebastian Wandelt 13./16. Februar 2012 Inhalt Data Warehousing und Data Mining auf 40 Slides Weder in-, noch exklusiv! Subjektive Zusammenfassung pro

Mehr

Daten-Definitionssprache (DDL) Bisher: Realwelt -> ERM -> Relationen-Modell -> normalisiertes Relationen-Modell. Jetzt: -> Formulierung in DDL

Daten-Definitionssprache (DDL) Bisher: Realwelt -> ERM -> Relationen-Modell -> normalisiertes Relationen-Modell. Jetzt: -> Formulierung in DDL Daten-Definitionssprache (DDL) Bisher: Realwelt -> ERM -> Relationen-Modell -> normalisiertes Relationen-Modell Jetzt: -> Formulierung in DDL Daten-Definitionssprache (DDL) DDL ist Teil von SQL (Structured

Mehr

Datenbanken und Informationssysteme. Datenbanken und Informationssysteme

Datenbanken und Informationssysteme. Datenbanken und Informationssysteme Datenbanken und Informationssysteme Wolfgang Menzel: Natürlichsprachliche Systeme (NATS) Norbert Ritter: Datenbanken und Informationssysteme (IS) NATS Ziele der Vorlesung (1) Vermittlung von Grundlagen-

Mehr

Datenbanken und Informationssysteme

Datenbanken und Informationssysteme Datenbanken und Informationssysteme Wolfgang Menzel: Natürlichsprachliche Systeme (NATS) Norbert Ritter: Datenbanken und Informationssysteme (IS) NATS Ziele der Vorlesung (1) Vermittlung von Grundlagen-

Mehr

Auf einen Blick. Abfrage und Bearbeitung. Erstellen einer Datenbank. Komplexe Abfragen. Vorwort 13

Auf einen Blick. Abfrage und Bearbeitung. Erstellen einer Datenbank. Komplexe Abfragen. Vorwort 13 Auf einen Blick Vorwort 13 Teil 1 Vorbereitung Kapitel 1 Einleitung 17 Kapitel 2 SQL - der Standard relationaler Datenbanken 21 Kapitel 3 Die Beispieldatenbanken 39 Teil 2 Abfrage und Bearbeitung Kapitel

Mehr

Datenbanken I. Karczewski Datenbanken I 1. Produkt (0,*) (0,*)

Datenbanken I. Karczewski Datenbanken I 1. Produkt (0,*) (0,*) Datenbanken I Produkt (0,*) (0,*) 3 Karczewski Datenbanken I 1 Literatur C.J. Date: An Introduction to Database Systems; Addison-Wesley Systems Programming Series. 6th ed. 1995 H.E. Erbs, S. Karczewski

Mehr

Informationsintegration

Informationsintegration Informationsintegration Schemaintegration Ulf Leser Wissensmanagement in der Bioinformatik Richtung Schemaintegration versus Anfragebearbeitung FDBS Schema integration Data source Data source Data source

Mehr

Oracle9i Designer. Rainer Willems. Page 1. Leitender Systemberater Server Technology Competence Center Frankfurt Oracle Deutschland GmbH

Oracle9i Designer. Rainer Willems. Page 1. Leitender Systemberater Server Technology Competence Center Frankfurt Oracle Deutschland GmbH Oracle9i Designer Rainer Willems Leitender Systemberater Server Technology Competence Center Frankfurt Oracle Deutschland GmbH Page 1 1 Agenda 9i Designer & 9i SCM in 9i DS Design Server Generierung &

Mehr

Cassandra Query Language (CQL)

Cassandra Query Language (CQL) Cassandra Query Language (CQL) Seminar: NoSQL Wintersemester 2013/2014 Cassandra Zwischenpräsentation 1 Gliederung Basic facts Datentypen DDL/DML ähnlich zu SQL Besonderheiten Basic facts CQL kurz für

Mehr

1. Einführung Seite 1. Kapitel 1: Einführung

1. Einführung Seite 1. Kapitel 1: Einführung 1. Einführung Seite 1 Kapitel 1: Einführung 1. Einführung Seite 2 Willkommen! Studierenden-Datenbank Hans Eifrig hat die Matrikelnummer 1223. Seine Adresse ist Seeweg 20. Er ist im zweiten Semester. Lisa

Mehr

Informationsintegration Architekturen

Informationsintegration Architekturen Informationsintegration Architekturen 3.5.2007 Felix Naumann Überblick 2 Überblick über Informationssysteme Klassifikation Weitere Kriterien Architekturen 3 Schichten Architektur 4 Schichten Architektur

Mehr

Ein Beispiel. Ein Unternehmen will Internettechnologien im Rahmen des E- Business nutzen Welche Geschäftsprozesse?

Ein Beispiel. Ein Unternehmen will Internettechnologien im Rahmen des E- Business nutzen Welche Geschäftsprozesse? Ein Beispiel Ein Unternehmen will Internettechnologien im Rahmen des E- Business nutzen Welche Geschäftsprozesse? Dipl.-Kfm. Claus Häberle WS 2015 /16 # 42 XML (vereinfacht) visa

Mehr

ISU 1. Ue_08/02_Datenbanken/SQL. 08 Datenbanken. Übung. SQL Einführung. Eckbert Jankowski. www.iit.tu-cottbus.de

ISU 1. Ue_08/02_Datenbanken/SQL. 08 Datenbanken. Übung. SQL Einführung. Eckbert Jankowski. www.iit.tu-cottbus.de 08 Datenbanken Übung SQL Einführung Eckbert Jankowski www.iit.tu-cottbus.de Datenmodell (Wiederholung, Zusammenfassung) Objekte und deren Eigenschaften definieren Beziehungen zwischen den Objekten erkennen/definieren

Mehr

Web Data Management Systeme

Web Data Management Systeme Web Data Management Systeme Seminar: Web-Qualitätsmanagement Arne Frenkel Agenda Einführung Suchsysteme Suchmaschinen & Meta-Suchmaschinen W3QS WebSQL WebLog Information Integration Systems Ariadne TSIMMIS

Mehr

Data Warehousing. Sommersemester Ulf Leser Wissensmanagement in der Bioinformatik

Data Warehousing. Sommersemester Ulf Leser Wissensmanagement in der Bioinformatik Data Warehousing Sommersemester 2004 Ulf Leser Wissensmanagement in der Bioinformatik ... Der typische Walmart Kaufagent verwendet täglich mächtige Data Mining Werkzeuge, um die Daten der 300 Terabyte

Mehr

Datenbanken Implementierungstechniken SS2015

Datenbanken Implementierungstechniken SS2015 Hochschule für Technik, Wirtschaft und Kultur Leipzig Leipzig University of Applied Sciences Parallele DBMS Datenbanken Implementierungstechniken SS2015 Alexander Müller Fakultät Informatik, Mathematik

Mehr

SQL. Ziele. Grundlagen von SQL. Beziehung zur relationalen Algebra SELECT, FROM, WHERE. Joins ORDER BY. Aggregatfunktionen. dbis.

SQL. Ziele. Grundlagen von SQL. Beziehung zur relationalen Algebra SELECT, FROM, WHERE. Joins ORDER BY. Aggregatfunktionen. dbis. SQL Lehr- und Forschungseinheit Datenbanken und Informationssysteme Ziele Grundlagen von SQL Beziehung zur relationalen Algebra SELECT, FROM, WHERE Joins ORDER BY Aggregatfunktionen Lehr- und Forschungseinheit

Mehr

Datenbanken und Informationssysteme

Datenbanken und Informationssysteme Datenbanken und Informationssysteme Lehrangebot Stefan Conrad Heinrich-Heine-Universität Düsseldorf Institut für Informatik April 2012 Stefan Conrad (HHU) Datenbanken und Informationssysteme April 2012

Mehr

Vorlesung: Relationale Datenbanksysteme

Vorlesung: Relationale Datenbanksysteme Vorlesung: Relationale Datenbanksysteme Softwareentwicklungsprojekt 1+2 Softwaretechnik 2 Dienstorientiertes Rechnen in der Praxis Dipl.-Inf. Andreas Göbel Friedrich-Schiller-Universität Jena Lehrstuhl

Mehr

<Insert Picture Here> z/os Migration und Integration

<Insert Picture Here> z/os Migration und Integration z/os Migration und Integration Thomas Niewel Leitender Systemberater Agenda Überblick Integration von z/os Daten und Anwendungen Migration von z/os Daten und Anwendungen Erfahrungen

Mehr

Die Grundbegriffe Die Daten Die Informationen

Die Grundbegriffe Die Daten Die Informationen Die Grundbegriffe Die Daten sind diejenigen Elemente, die vom Computer verarbeitet werden. Die Informationen sind Wissenselemente, welche durch die Analyse von Daten erhalten werden können. Die Daten haben

Mehr

7. XML-Datenbanksysteme und SQL/XML

7. XML-Datenbanksysteme und SQL/XML 7. XML-Datenbanksysteme und SQL/XML Native XML-DBS vs. XML-Erweiterungen von ORDBS Speicherung von XML-Dokumenten Speicherung von XML-Dokumenten als Ganzes Generische Dekomposition von XML-Dokumenten Schemabasierte

Mehr

Einführung relationale Datenbanken. Themenblock: Erstellung eines Cube. Schlüssel. Relationenmodell Relationenname Attribut. Problem.

Einführung relationale Datenbanken. Themenblock: Erstellung eines Cube. Schlüssel. Relationenmodell Relationenname Attribut. Problem. Themenblock: Erstellung eines Cube Einführung relationale Datenbanken Problem Verwaltung großer Mengen von Daten Praktikum: Data Warehousing und Data Mining Idee Speicherung der Daten in Form von Tabellen

Mehr

Themenblock: Erstellung eines Cube

Themenblock: Erstellung eines Cube Themenblock: Erstellung eines Cube Praktikum: Data Warehousing und Data Mining Einführung relationale Datenbanken Problem Verwaltung großer Mengen von Daten Idee Speicherung der Daten in Form von Tabellen

Mehr

Relationales Datenbankpraktikum 2016ss

Relationales Datenbankpraktikum 2016ss Relationales Datenbankpraktikum 2016ss 3 Teile 1) Datenbankentwurf, Datenimport 2) Formulierung von SQL-Anfragen V. Christen, Dr. A. Groß, M. Junghanns, Z. Sehili 3) Entwicklung einer Middleware für eine

Mehr

Materialized Views. Jan-Peter Timmermann. DOAG Regiotreffen Hamburg: Materialized Views Seite 1

Materialized Views. Jan-Peter Timmermann. DOAG Regiotreffen Hamburg: Materialized Views Seite 1 Materialized Views Jan-Peter Timmermann DOAG Regiotreffen Hamburg: Materialized Views Seite 1 Klassische View Sind virtuelle Tabellen Erstellung nicht aufwendig, da nur ein Eintrag im Data Dictionary vorgenommen

Mehr

Anfragebearbeitung. Anfrage. Übersetzer. Ausführungsplan. Laufzeitsystem. Ergebnis

Anfragebearbeitung. Anfrage. Übersetzer. Ausführungsplan. Laufzeitsystem. Ergebnis Anfragebearbeitung Anfrage Übersetzer Ausführungsplan Laufzeitsystem Ergebnis Übersetzung SQL ist deklarativ, Übersetzung für Laufzeitsystem in etwas prozedurales DBMS übersetzt SQL in eine interne Darstellung

Mehr

NoSQL Datenbanken EIN ÜBERBLICK ÜBER NICHT-RELATIONALE DATENBANKEN UND DEREN POTENTIALE IM ALLGEMEINEN UND IN DER INDUSTRIE

NoSQL Datenbanken EIN ÜBERBLICK ÜBER NICHT-RELATIONALE DATENBANKEN UND DEREN POTENTIALE IM ALLGEMEINEN UND IN DER INDUSTRIE NoSQL Datenbanken EIN ÜBERBLICK ÜBER NICHT-RELATIONALE DATENBANKEN UND DEREN POTENTIALE IM ALLGEMEINEN UND IN DER INDUSTRIE Was bedeutet NoSQL? Ein Sammelbegriff für alternative Datenbanklösungen, die

Mehr

Medizininformatik Software Engineering

Medizininformatik Software Engineering Vorlesung Software Engineering Inhaltsverzeichnis 1. Einleitung 2. Software und Medizinprodukt 3. Vorgehensmodelle 4. Strukturierter Entwurf von Echtzeitsystemen 4.1 Echzeit, was ist das? 4.2 Einführung

Mehr

Relationale Datenbanken

Relationale Datenbanken Ramon A. Mata-Toledo, Pauline K. Cushman Relationale Datenbanken Schaum's Repetitorien Übersetzung aus dem Amerikanischen von G&U Technische Dokumentation GmbH Z Die Autoren 9 Vorwort 9 1 Ein Überblick

Mehr

Datenmodellierung VU Einführung SS 2016

Datenmodellierung VU Einführung SS 2016 184.685 Datenmodellierung VU Einführung SS 2016 Nysret Musliu, Sebastian Skritek Institut für Informationssysteme Technische Universität Wien Nysret Musliu, Sebastian Skritek Seite 1 1. Motivation Motivation

Mehr

Andreas Heuer Gunter Saake Kai-Uwe Sattler. Datenbanken. kompakt

Andreas Heuer Gunter Saake Kai-Uwe Sattler. Datenbanken. kompakt Andreas Heuer Gunter Saake Kai-Uwe Sattler Datenbanken kompakt Inhaltsverzeichnis Vorwort v 1 Was sind Datenbanken 1 1.1 Warum Datenbanken 1 1.2 Datenbanksysteme 4 1.3 Anforderungen: Die Codd'schen Regeln

Mehr

XAMPP-Systeme. Teil 3: My SQL. PGP II/05 MySQL

XAMPP-Systeme. Teil 3: My SQL. PGP II/05 MySQL XAMPP-Systeme Teil 3: My SQL Daten Eine Wesenseigenschaft von Menschen ist es, Informationen, in welcher Form sie auch immer auftreten, zu ordnen, zu klassifizieren und in strukturierter Form abzulegen.

Mehr