Informationsintegration
|
|
- Ida Bergmann
- vor 6 Jahren
- Abrufe
Transkript
1 Informationsintegration Architekturen Ulf Leser Wissensmanagement in der Bioinformatik
2 Übersicht Technische Heterogenität Technische Realisierung des Datenzugriffs Technische Unterschiede in der Darstellung Syntaktische Unterschiede Unterschiede in der Darstellung Gleiche Dinge syntaktisch verschieden repräsentieren Datenmodellheterogenität Strukturelle Heterogenität Strukturelle Unterschiede in der Darstellung Gleiche Dinge verschieden modellieren Semantische Heterogenität Unterschiede in der Bedeutung von Namen (Schema und Daten) Gleiches sagen, verschiedenes meinen (oder andersrum) Ulf Leser: Informationsintegration, Wintersemester 2006/2007 2
3 Ausprägung 2 Anfrage Integriertes Informationssystem Heterogenität zwischen globaler Schicht und Datenquellen Quelle Ulf Leser: Informationsintegration, Wintersemester 2006/2007 3
4 Technische Heterogenität Ulf Leser: Informationsintegration, Wintersemester 2006/2007 4
5 Mächtige globale Anfragesprache SQL SELECT * FROM Books WHERE Author = Defoe AND PubYear = 1979 HTML Form Ulf Leser: Informationsintegration, Wintersemester 2006/2007 5
6 Kompensation möglich SELECT * FROM Books WHERE Author = Defoe AND PubYear = 1979 Daniel Defoe, Robinson Crusoe, 1979 PubYear = 1979 Daniel Defoe, Robinson Crusoe, 1986 Daniel Defoe, Robinson Crusoe, 1979 Daniel Defoe, Moll Flanders, 1933 Defoe Ulf Leser: Informationsintegration, Wintersemester 2006/2007 6
7 Syntaktische Heterogenität Unterschiedliche Darstellung desselben Sachverhalts Dezimalpunkt oder komma Euro oder Comma-separated oder tab-separated HTML oder ASCII oder Unicode Notenskala 1-6 oder sehr gut, gut, Binärcodierung oder Zeichen Datumsformate (12. September 2006, , 9/12/2006, ) Überwindung in der Regel nicht problematisch Umrechnung, Übersetzungstabellen, Ulf Leser: Informationsintegration, Wintersemester 2006/2007 7
8 Strukturelle Heterogenität Allgemein Gleiche Dinge in unterschiedlichen Schemata ausdrücken Andere Aufteilung von Attributen auf Tabellen Fehlende / neue Attribute (wenn Intension nicht betroffen ist) Setzt intensionale Überlappung voraus ( gleiche Dinge ) Meistens mit semantischen Heterogenität verbunden Ausnahme: 1:1 Beziehungen Spezialfall: Schematische Heterogenität Verwendung anderer Elemente eines Datenmodells Kann meist nicht durch Anfragesprachen überwunden werden Ulf Leser: Informationsintegration, Wintersemester 2006/2007 8
9 Spezialfall: Schematische Heterogenität maenner( Id, vorname, nachname) frauen( Id, vorname, nachname) Relation vs. Attribut Relation vs. Wert person( Id, vorname, nachname, maennlich?, weiblich?) person( Id, vorname, nachname, geschlecht) Attribut vs. Wert Ulf Leser: Informationsintegration, Wintersemester 2006/2007 9
10 Integrierte Sichten Verlangt viele Verrenkungen Sicht muss angepasst werden, wenn neue Filmtypen vorliegen Datenänderungen bedingen Schemaänderungen Das will man unbedingt vermeiden Ulf Leser: Informationsintegration, Wintersemester 2006/
11 Semantik von was? Name Extension Intension Realweltliche Objekte repräsentiert Konzept Ulf Leser: Informationsintegration, Wintersemester 2006/
12 Probleme Mögliche Beziehungen zwischen den Mengen realweltlicher Objekte, die Konzepte repräsentieren A=B (Äquivalenz): semantische (echte) Synonyme Kreditinstitut, Bank (?) Gibt es echte Synonyme? A B (Inklusion): B ist Hyperonym (Oberbegriff) zu A; A ist Hyponym zu B Tochter Kind A B A B (Überlappung): Schwierigster Fall Küche-Kochnische; Haus-Gebäude; Regisseur-Schauspieler A B = (Disjunktion): nicht verwandte Begriffe (häufigster Fall) Dose-Lohnsteuerjahresausgleich Ulf Leser: Informationsintegration, Wintersemester 2006/
13 Semantik: Woher nehmen? Schemaelemente sind erst mal nur Namen Was bestimmt die Semantik eines Namens? Für Attributnamen Datentyp Constraints (Schlüssel, FK, unique, CHECK, ) Zugehörigkeit zu einer Relation Andere Attribute dieser Relation Beziehung der Relation zu anderen Relationen Dokumentation Vorhandene Werte Wissen über den Anwendungsbereich Der Kontext Ulf Leser: Informationsintegration, Wintersemester 2006/
14 Kontext Semantik eines Namens hängt vom Kontext ab Beispiel Unternehmen A: angestellte( ) Unternehmen B: mitarbeiter( ) Mitarbeiter und Angestellte kann man als Synonyme betrachten Aber: A.angestellte B.mitarbeiter = Wenn Personen nicht in zwei Unternehmen beschäftigt sind Erst bei einem Merger von A und B werden A.angestellte und B.mitarbeiter zu Synonymen Sollten dann zu einer Tabelle integriert werden Ulf Leser: Informationsintegration, Wintersemester 2006/
15 Entstehung von Inter-Source-Konflikten Bei der Integration von Informationssystemen Lokal konsistent aber global inkonsistent Voraussetzung sind Duplikate Extensionale Redundanz Andere Datentypen ( 1 versus eins ) Andere lokale Schreibweisen oder Konventionen Skalen (inch cm), Währungen, rechtliche Bedingungen (MWST), Übertragungsfehler Fehlerhafte Parser beim ETL Fehlendes Verständnis für die Bedeutung der Dinge Mangelnde Dokumentation, falsches Re-engineering, Verwendung unterschiedlicher Standards Produktnummern, Produktklassen, Berufsbezeichnungen, Verschiedene Messungen Temperatur an einem Tag? Ulf Leser: Informationsintegration, Wintersemester 2006/
16 Voraussetzung: Identität Konzept = Realweltobjekt Name = Identifikation, Schlüssel Duplikate: Semantische Konflikte auf Datenebene Synonyme: Verschiedene IDs für gleiches Objekt Personalausweisnummer und Führerscheinnummer ISBN und Kombination Autor/Titel Homonym: Gleiche IDs für verschiedene Objekte Dann ging was schief (gefälschte Pässe, ) Oder über Unternehmensgrenzen hinweg (Kunden.ID, ) Schwieriges Problem: Lokale IDs Schlüssel gelten in einer Tabelle Häufig verwendet man nur surrogate Keys (sequence) Die bedeuten nichts außerhalb der eigenen Datenbank Integration erfordert Duplikaterkennung Ulf Leser: Informationsintegration, Wintersemester 2006/
17 Transparenz Verteilung, Autonomie, Heterogenität kann in unterschiedlichem Maße überwunden werden Ortstransparenz Benutzer müssen den Ort der integrierten Systeme nicht kennen Keine URLs, Datenbankpräfixe, Quellentransparenz, Verteilungstransparenz Benutzer weiß nicht, welche Quelle für eine Anfrage benutzt werden kann (und muss daher nicht auswählen) Benutzer weiß nicht, welche Quelle für eine Anfrage benutzt wurde (Datenherkunft) Setzt ein globales Schema voraus Ulf Leser: Informationsintegration, Wintersemester 2006/
18 Will man nicht immer! Intuitiv strebt man maximale Transparenz an Tatsächlich ist das oft kontraproduktiv Benutzer kennen und lieben ihre Datenquellen Datenherkunft ist wichtigstes Kriterium für Einschätzung der Qualität der Informationen Zugriff durch globales Schemas nur bei Kenntnis dieses Benutzer muss neues Schema lernen Globale Schemata können sehr kompliziert werden Da sie viele Quellen integrieren Für kleine Zugriffe unnötig schwierig Transparenz bedingt Informationsverlust Ulf Leser: Informationsintegration, Wintersemester 2006/
19 Inhalt diese Vorlesung Klassifikation Verteilter, autonomer, heterogener Systeme Führt zu möglichen Architekturen Weitere Klassifikationskriterien Schichtenaufbau integrierter Systeme 3-5 Schichten Ulf Leser: Informationsintegration, Wintersemester 2006/
20 Klassifikation [ÖV91] Verteilte, homogene DBS Verteilung Verteilte, föderierte DBS Verteilte, heterogene DBS Logisch integrierte und homogene DBS Heterogenität Verteilte, heterogene föderierte DBS Autonomie Ulf Leser: Informationsintegration, Wintersemester 2006/
21 Verteilung 1. Zentrale Datenbank Autonomie Heterogenität Normalfall homogene, zentrale Datenbank Daten/Berechnung können trotzdem begrenzt verteilt sein Filesystem: Partitionierung, RAID, SAN Berechnung: Cluster Parallele Datenbanken Datenbank entsteht aus homogenem Entwurf Wenn Redundanz / Heterogenität, dann mit Absicht und kontrolliert Problem: Weiterentwicklung (Evolution) Zentrale Kontrolle und Administration Ulf Leser: Informationsintegration, Wintersemester 2006/
22 Verteilung 2. Verteilte Datenbanken Autonomie Daten liegen physisch verteilt Absichtsvolle, kontrollierte, a-priori Verteilung Existenz eines konzeptionell homogenen, verteilt realisierten Schemas Ziele Höhere Performanz durch Parallelisierung Höhere Sicherheit vor Katastrophen Höhere Ausfallsicherheit durch redundant ausgelegte Systeme (Replikation) Knoten haben keine Autonomie Heterogenität wird unterdrückt Ortstransparenz, aber keine Verteilungstransparenz Aliase und Proxy kapseln entfernte Orte Heterogenität Verteilungstransparenz durch Sichten möglich, aber nicht durch System erzeugt Ulf Leser: Informationsintegration, Wintersemester 2006/
23 Einschub: Verteilte Datenbanken mit Oracle Oracle-DB können auf andere Oracle-DB zugreifen Database Links CREATE [PUBLIC] DATABASE LINK <link_name> CONNECT TO <user_name> <IDENTIFIED BY <password> USING '<service_name>'; service_name muss über Konfigurationsfiles aufgelöst werden SELECT col1, col2, FROM Zugriff wie auf lokale Tabelle (Joins, Selektion, Projektion, ) Transparenz durch Sicht möglich CREATE VIEW myview AS SELECT * FROM tab1@link_name; Schwieriger Verteilte Optimierung (später) 2-phase-commit Anwendung (z.b.): automatische Replikation Verschiedene Refresh-Optionen Ulf Leser: Informationsintegration, Wintersemester 2006/
24 Einschub: Partitionierung Aufteilung der Daten einer Tabelle in Untereinheiten Für den Benutzer transparente Partitionierung Nach Definition der Partitionen Muss vom System unterstützt werden Für den Benutzer nicht transparente Partitionierung Explizites Anlegen mehrerer Tabellen Anfragen müssen entsprechend formuliert werden Geht immer Daten sind im Ergebnis physisch verteilt Verschiedene Platten, verschiedene Controller Voraussetzung zur verteilten Bearbeitung Ulf Leser: Informationsintegration, Wintersemester 2006/
25 Vertikale Partitionierung id price amount code form CASH VISA VISA id price amount id code form CASH VISA VISA Ulf Leser: Informationsintegration, Wintersemester 2006/
26 Bewertung Zerstört semantische Einheiten die Tupel Zusammenfassen erfordert (teure) Joins Geeignete Technik zur Auslagerung... von selten benutzten Attributen von Attributen, die häufiger als andere verändert werden (und deshalb zu Reorganisation / Row Splits führen) von BLOBs, LONG, etc. Transparenz für Benutzer ist möglich Definition eines Views Performanceverschlechterung, wenn Optimierer mit dem View nicht richtig umgehen kann Benötigt immer zusätzliche Joins Forschung: Column-wise databases Ulf Leser: Informationsintegration, Wintersemester 2006/
27 Horizontale Partitionierung id price amount code form CASH VISA VISA CASH CASH CASH VISA CASH VISA VISA CASH VISA Ulf Leser: Informationsintegration, Wintersemester 2006/
28 Horizontale Partitionierung Wichtige Erweiterung der meisten kommerziellen RDBMS der letzten Jahre Hauptvorteile Datenmanagement Partitionen als eigenständige Datenbankobjekte Parallele Verarbeitung Scans können Partitionen auslassen (Partition pruning) Ulf Leser: Informationsintegration, Wintersemester 2006/
29 Prinzip CREATE TABLE sales_range (salesman_id NUMBER(5), salesman_name VARCHAR2(30), sales_amount NUMBER(10), sales_date DATE) PARTITION BY RANGE(sales_date) ( PARTITION t21 VALUES LESS THAN(TO_DATE('02/01/2000','DD/MM/YYYY')), PARTITION t22 VALUES LESS THAN(TO_DATE('03/01/2000','DD/MM/YYYY')), PARTITION t23 VALUES LESS THAN(TO_DATE('04/01/2000','DD/MM/YYYY')), PARTITION t24 VALUES LESS THAN(TO_DATE('05/01/2000','DD/MM/YYYY')) ); Partitionen sind eigene Datenbankobjekte Eigene DDL Kommandos Müssen explizit angelegt werden Können einzeln positioniert und gemanaged werden Nach Anlage vollkommen transparente Benutzung Partitionierungskriterium kann auch jederzeit geändert werden Ulf Leser: Informationsintegration, Wintersemester 2006/
30 Verteilte versus parallele Datenbanken ANSI/SPARC 3-Schichten Architektur für zentralisierte DBMS Externes Schema 1... Externes Schema N Konzeptionelles Schema Internes, physisches Schema Ulf Leser: Informationsintegration, Wintersemester 2006/
31 Vergleich Parallele Datenbank Verteilte Datenbank Externes Schema 1... Externes Externes Schema N Schema 1... Externes Schema N Konzeptionelles Schema Konzep. Schema Konzep. Schema Internes, physisches Schema Internes Schema Internes Schema Ulf Leser: Informationsintegration, Wintersemester 2006/
32 Einschub: Parallele Datenbanken Auswirkung nur auf der physischen Schicht Es existiert nur ein logisches Schema Interquery: Queries werden (jeweils als ganzes) auf verschiedene Knoten verteilt Intraquery: Einzelne Queries werden aufgebrochen und die Fragmente verteilt (z.b. Partitionen) Shared Nothing (DB2) Verschiedene Knoten haben eigene Platten Zentrale Instanz verteilt Anfragen Verteilungsmöglichkeiten mit Konfiguration festgelegt Shared Disc (Oracle) Alle Knoten greifen auf gleiche Platten zu Schwierige Synchronisation Dynamische Verteilung je nach Last möglich Ulf Leser: Informationsintegration, Wintersemester 2006/
33 Einschub: Gateways Ähnlich verteilte Datenbanken Zugriff z.b. über ODBC Umwandlung von Datentypen Unterstützung verschiedener SQL-Dialekte Kompensation fehlender Funktionen Siehe auch: GARLIC (später) Ulf Leser: Informationsintegration, Wintersemester 2006/
34 Verteilung 3. Verteilte & heterogene DB Autonomie Daten liegen physisch verteilt vor Daten sind heterogen Z.B. aufgrund der Historie der Entstehung Keine Autonomie Heterogenität sollte also nicht schlimmer werden Typischer Zwischenzustand Heterogenität Ulf Leser: Informationsintegration, Wintersemester 2006/
35 Verteilung 4. Verteilte & autonome DB Autonomie Heterogenität Verteilte, aber homogene Datenbestände Entsteht durch freiwillige Übernahme von Regeln Standards, Verträge, Autonomie wird teilweise aufgegeben Z.B. Aufgabe von Designautonomie Z.B. nicht Kommunikationsautonomie Z.B. nicht juristische Autonomie Ulf Leser: Informationsintegration, Wintersemester 2006/
36 Verteilung 5. Multidatenbanken Autonomie Verteilt, autonom, und etwas heterogen Keine technische und Datenmodellheterogenität Z.B.: verteilte Systeme benutzen gleiche Techniken (RDBMS) Schemata können strukturell und semantisch heterogen sein Zugriff über einheitliche Sprache Oder Simulation durch Wrapper (später) Autonomie bleibt bewahrt Aber Zugriff muss möglich sein (Kommunikationsautonomie) Zugriff über Multidatenbanksprachen Qualifizierung von Tabellennamen mit Datenbanknamen Ähnlich Database-Links; Beispiel: SchemaSQL Heterogenität Ulf Leser: Informationsintegration, Wintersemester 2006/
37 Verteilung 6. Verteilt, heterogen, autonom Autonomie Das ist das hauptsächliche Szenario dieser Vorlesung Quellen behalten volle Autonomie Wissen u.u. nichts von ihrer Integration Nehmen u.u. keine Rücksicht bzgl. Änderungen Quellen sind heterogen Quellen sind verteilt Heterogenität Ulf Leser: Informationsintegration, Wintersemester 2006/
38 Taxonomie nach [SL90] DBMS Kontrollierte, gewollte Verteilung Kein Zugriff durch einheitlichen Mechanismus Zentralisiertes DBMS Einfaches, verteiltes DBMS Nicht-föderierte DBS Verteiltes DBMS Multidatenbanksystem Föderierte DBS (FDBS) Nutzer muss selbst integrieren (durch Views etc.) Lose Kopplung Enge Kopplung Nur ein föderiertes Schema Einfache Föderation Mehrfache Föderation Ulf Leser: Informationsintegration, Wintersemester 2006/
39 Überblick Klassifikation Verteilter, autonomer, heterogener Systeme Weitere Klassifikationskriterien Schichtenaufbau integrierter Systeme 3-5 Schichten Prominente Architekturen Ulf Leser: Informationsintegration, Wintersemester 2006/
40 Kriterien föderierter Informationssysteme Nach [BKLW99] Weitere (nicht-orthogonale) Kriterien Strukturierung der Komponenten Enge und lose Kopplung Datenmodell Art der semantischen Integration Transparenz Anfrage-Paradigma Bottom-up oder Top-down Entwurf Virtuell oder materialisiert Read-only oder read-&-write Ulf Leser: Informationsintegration, Wintersemester 2006/
41 Struktur der Komponenten Strukturiert Festes Schema, festes Format Beispiel: Datenbanken Semi-strukturiert Struktur vorhanden, aber höchstens teilweise festgelegt Individuelle Abweichungen jederzeit möglich Vor allem neue Attribute, Tabellen, Elemente, Prädikate, Daten sind mit semantischen Tags versehen Beispiel: XML/RDF ohne Schemata, OEM Daten, UNQL, ACeDB, Unstrukturiert Keine Struktur Search, Information Retrieval, Informationsextraktion Beispiel: Textuelle Daten, Webseiten, Berichte Ulf Leser: Informationsintegration, Wintersemester 2006/
42 Enge oder lose Kopplung Enge Kopplung Festes, integriertes/föderiertes Schema Korrespondenzen regeln die Zusammenhänge Für den Benutzer einheitliche Sicht Erfordert Kooperation der Quellen Anpassungen, Schemaevolution Lose Kopplung Kein globales, einheitliches Schema Nutzer müssen Semantik der Quellen kennen Nutzer integrieren selber Nur technische und Datenmodellheterogenität ist gelöst Verlangt weniger Kooperation Zugriff muss möglich sein, aber Schemata können sich ändern Multidatabase query language (MDBQL) Ulf Leser: Informationsintegration, Wintersemester 2006/
43 Verwendetes Datenmodell Kanonisches Datenmodell Objektorientiertes Modell Relationales Modell XML Datenmodell Abbildung zwischen Datenmodellen ist schwierig Relational zu XML Abbildung von m:n Beziehungen? OO zu Relational Schlüssel versus ID, Assoziation versus Foreign Keys, Vererbung? Abbildung in semantisch schwächere Datenmodelle bringt Verlust Muss durch Anwendung kompensiert werden Integration semantisch starker Modelle ist schwieriger Ulf Leser: Informationsintegration, Wintersemester 2006/
44 Art der semantischen Integration Vereinigung Simple Konkatenation von Objekten Anreicherung Mit Metadaten Keine Konfliktauflösung Erzeugt mehr, aber nicht notwendigerweise bessere Daten Sehr häufig! Datenfusion Objektidentifizierung Re-Strukturierung Komplementierung Konfliktlösung Ulf Leser: Informationsintegration, Wintersemester 2006/
45 Welche Transparenz wird erreicht? Orttransparenz Physischer Ort der Daten unbekannt IP, Quellenname, DB Name Verteilungstransparenz Nutzer sehen nur integriertes Schema Strukturelle Konflikte werden verborgen Schnittstellentransparenz Nutzer muss nur eine Sprache beherrschen Integriertes System übersetzt Ulf Leser: Informationsintegration, Wintersemester 2006/
46 Welche Art von Anfragen werden unterstützt? Strukturierte Anfragen Schema ist Nutzern bekannt und wird in Anfragen verwendet Z.B. SQL, OQL, QBE Canned queries Vordefinierte Anfragen mit Parametern Z.B.: Webformulare, Funktionen Such-Anfragen (Information Retrieval) Struktur unbekannt oder nicht vorhanden Z.B. Suchmaschinen auf Texten Browsing Kein Such-Interface Beispiel: WWW, Hypertext, Reports Ulf Leser: Informationsintegration, Wintersemester 2006/
47 Bottom-up oder Top-down Entwurf Bottom-up Beginnt mit dem Bedarf nach der Integration einer festen Menge von genau bestimmten Quellen Globales Schema wird durch Schemaintegration erstellt Änderungen in Quellen i.d.r. schwierig (Neuintegration) Verbunden mit hohen Ansprüchen an Vollständigkeit und Qualität Typisches Szenario: Data Warehouse, Merging von Unternehmensdatenbanken Top-down Ausgelöst durch globalen Informationsbedarf Neuentwurf des globalen Schemas Quellen werden nach Bedarf und Eignung hinzugefügt Verlangt flexiblere Integrationsmechanismen Vorteilhaft bei volatilen Quellen (Web) Verbunden mit geringeren Ansprüchen an Vollständigkeit und Qualität Typisches Szenario: Webintegration, Integration als Service Ulf Leser: Informationsintegration, Wintersemester 2006/
48 Bottom-up Entwicklung Ulf Leser: Informationsintegration, Wintersemester 2006/
49 Top-down Entwicklung Ulf Leser: Informationsintegration, Wintersemester 2006/
50 Virtuell oder materialisiert Virtuell Kein zentraler Datenpool Anfragen werden in Teilanfragen zerlegt und in den Quellen beantwortet Daten werden nur bei Bedarf übertragen und höchstens temporär gespeichert Immer aktuell, potentiell langsam, eingeschränkte Queries Materialisiert Aufbau eines zentralen Datenpools Redundante Datenhaltung Daten werden offline transformiert und integriert Anfragen werden direkt gegen die materialisierten Daten gestellt Potentiell veraltet, sehr schnell, volle Queries Setzt Zugriff auf komplette Datenbasis voraus Später mehr Ulf Leser: Informationsintegration, Wintersemester 2006/
51 Read-only oder read-&-write Read-only die beliebtere Variante Write (insert & update) schwierig Viele Interfaces erlauben kein Schreiben Update durch Sichten ist schwierig Bei Komplementierung: Welche Quelle? Globale Transaktionen (komplexe Protokolle) Autonomie! Ulf Leser: Informationsintegration, Wintersemester 2006/
52 Überblick Klassifikation Verteilter, autonomer, heterogener Systeme Führt zu möglichen Architekturen Weitere Klassifikationskriterien Schichtenaufbau integrierter Systeme 3-5 Schichten Prominente Architekturen Ulf Leser: Informationsintegration, Wintersemester 2006/
53 ANSI/SPARC 3-Schichten Architektur Externe (logische) Sicht Je nach Anwendung Nur relevante Daten Sichten (Views) Konzeptionelle (logische) Sicht Unabhängig von physischer Sicht Definiert durch Datenmodell Stabiler Bezugspunkt Interne (physische) Sicht Dateistruktur Speicherort (Zylinder, Block) Indexe, Partitionen, Ulf Leser: Informationsintegration, Wintersemester 2006/
54 3-Schichten Architektur Anwendungen Externes Schema 1... Externes Schema N DBMS Konzeptionelles Schema Internes Schema Ulf Leser: Informationsintegration, Wintersemester 2006/
55 4-Schichten Architektur Für verteilte DBMS Lokales vs. globales konzeptionelles Schema Globales konzeptionelles Schema integriert die lokalen konzeptionellen Schemata Lokales und globales konzeptionelles Schema können gleich sein Aber Datenbestände unterschiedlich Externes Schema 1 Lokales konzept. Schema Internes Schema... Konzeptionelles Schema Externes Schema N Lokales konzept. Schema Internes Schema Ulf Leser: Informationsintegration, Wintersemester 2006/
56 4-Schichten Architektur Anwendungen Externes Schema 1... Externes Schema N Vert. DBMS Konzeptionelles Schema Lokale DBMS Lokales konzept. Schema... Lokales konzept. Schema Internes Schema... Internes Schema Ulf Leser: Informationsintegration, Wintersemester 2006/
57 Import-/Export-Schema-Architektur [HM85] = lokales konzeptionelles Schema Idee: Nur Teilmenge des lokalen konzeptionellen Schemas wird der Föderation zur Verfügung gestellt. Idee: Nur Teilmengen der Exportschemas sollen verwendet werden. Ulf Leser: Informationsintegration, Wintersemester 2006/
58 Multidatenbankarchitektur Siehe [LMR90] Voraussetzung Nutzer kennen die jeweiligen Schemas Multidatenbanksprache Lose Kopplung Externes Schema 1 Export-Schema... Externes Schema N Export-Schema Lokales konzept. Schema... Lokales konzept. Schema Internes Schema... Internes Schema Ulf Leser: Informationsintegration, Wintersemester 2006/
59 4-Schichten Architektur Anwendungen Anwendungen müssen selbst integrieren Externes Schema 1 Export-Schema... Externes Schema N Export-Schema Lokale DBMS Lokales konzept. Schema... Lokales konzept. Schema Internes Schema... Internes Schema Ulf Leser: Informationsintegration, Wintersemester 2006/
60 5-Schichten Architektur [SL90] Eigentlich 6 Schichten Interne Schemas werden nicht mehr betrachtet Integriertes, föderiertes Schema Komponentenschema = lokales konzept. Schema Föderiertes Schema = globales konzept. Schema Externes Schema 1 Föderiertes Schema Exportschema Lokales Schema Externes Schema N Exportschema Komponentenschema Komponentenschema Lokales Schema Ulf Leser: Informationsintegration, Wintersemester 2006/
61 5-Schichten Architektur [SL90] Anwendungen Externes Schema 1... Externes Schema N Föderiertes DBMS Föderiertes Schema Exportschema Exportschema Lokale DBMS... Komponentenschema Komponentenschema Lokales internes Schema Lokales internes Schema Ulf Leser: Informationsintegration, Wintersemester 2006/
62 5-Schichten Architektur [SL90] Exportschemas Teilmenge des Komponentenschemas Zugangsberechtigungen Unnötig, wenn komplettes Schema exportiert wird Komponentenschemas Kanonisches Datenmodell Fügt fehlende Semantik hinzu Übergang durch Mappings Unnötig, wenn lokales = kanonisches Datenmodell Lokale Schemas Konzeptionell Externes Schema 1 Föderiertes Schema Exportschema Lokales Schema Externes Schema N Exportschema Komponentenschema Komponentenschema Lokales Schema Ulf Leser: Informationsintegration, Wintersemester 2006/
63 5-Schichten Architektur [SL90] Externes Schema Föderiertes Schema kann sehr groß sein Vereinfachung im Exportschema Schema Evolution leichter Zugangskontrollen Föderiertes Schema Integriert aus den Exportschemas Kennt Datenverteilung Andere Namen: Import, global, unified, Enterprise Schema Externes Schema 1 Föderiertes Schema Exportschema Lokales Schema Externes Schema N Exportschema Komponentenschema Komponentenschema Lokales Schema Ulf Leser: Informationsintegration, Wintersemester 2006/
64 Überblick Klassifikation Verteilter, autonomer, heterogener Systeme Führt zu möglichen Architekturen Weitere Klassifikationskriterien Schichtenaufbau integrierter Systeme 3-5 Schichten Prominente Architekturen Ulf Leser: Informationsintegration, Wintersemester 2006/
65 Data Warehouses Quelle 1 RDBMS Staging Area Metadaten Mart 2 Quelle 2 IMS Staging Area Cube Mart 1 Materialisierte Integration Regelmäßiger Export, Transformation, Import einer festen Zahl von Datenquellen (ETL Prozess) Redundante Datenhaltung wegen unterschiedlicher Verwendung (OLAP versus OLTP) Kommerziell extrem wichtig Ulf Leser: Informationsintegration, Wintersemester 2006/
66 Mediator-Wrapper Architektur Virtuelle Integration Unabhängig von Strukturiertheit Quellspezifische Wrapper Datenmodelltransformation Übersetzung von Anfragen Mediatoren als Mehrwertdienste Datenintegration Verdichtung Anwendung 1 Anwendung 2 Mediator Wrapper 1 Wrapper 2 Wrapper 3 Quelle 1 Quelle 2 Quelle 3 Ulf Leser: Informationsintegration, Wintersemester 2006/
67 Föderierte Datenbanken Trotz häufiger Verwendung keine klare Definition vorhanden Klassischer Definition: 5-Schichten Architektur Lokales Schema, Komponentenschema, Exportschema, föderiertes Schema, externes Schema Integrierte Schemata verlangen aber semantische Integration Datenbankhersteller meiden dieses Gebiet Federated databases heute Allgemeiner Begriff für integrierten Zugang Kommerziell meistens über Multidatenbanksprachen Definition von Sichten zur Erstellung (teil-)integrierter Schema Ulf Leser: Informationsintegration, Wintersemester 2006/
68 Einordnung Distributed Databases Complexity Ulf Leser: Informationsintegration, Wintersemester 2006/
69 Literatur Wichtige Literatur [ÖV99] Principles of Distributed Database Systems. M. Tamer Özsu, Patrick Valduriez, Prentice Hall, [SL90] Amit P. Sheth and James A. Larson, Federated Database Systems for Managing Distributed, Heterogeneous, and Autonomous Databases, ACM Computing Surveys, Vol. 22(3), pp , [Con97] Stefan Conrad, Föderierte Datenbanksysteme. Springer, Heidelberg Weitere Literatur [LMR90] W. Litwin, L. Mark, N. Roussoupoulos, Interoperability of Multiple Autonomous Databases, ACM Computing Surveys, Vol. 22(3), pp , [HM85] Dennis Heimbigner, Dennis McLeod: A Federated Architecture for Information Management. ACM Trans. Inf. Syst. 3(3): (1985) Ulf Leser: Informationsintegration, Wintersemester 2006/
Informationsintegration
Informationsintegration Architekturen Vergleichskriterien für integrierte Systeme Ulf Leser Wissensmanagement in der Bioinformatik Übersicht Technische Heterogenität Technische Realisierung des Datenzugriffs
MehrInformationsintegration
Informationsintegration Grundlegende Architekturen Ulf Leser Inhalt diese Vorlesung Klassifikation verteilter, autonomer, heterogener Systeme Weitere Klassifikationskriterien Schichtenaufbau integrierter
MehrKapitel 3: Eigenschaften von Integrationssystemen. Einordnung von Integrationssystemen bzgl. Kriterien zur Beschreibung von Integrationssystemen
Datenintegration Datenintegration Kapitel 3: Eigenschaften von Integrationssystemen Andreas Thor Sommersemester 2008 Universität Leipzig Institut für Informatik http://dbs.uni-leipzig.de 1 Inhalt Einordnung
MehrInformationsintegration
Informationsintegration Verteilung, Autonomie, Heterogenität, Transparenz Ulf Leser Klassifikationsdimensionen [ÖV99] Eigenschaften von Informationssystemen in Bezug auf deren Integration Verteilung Autonomie
MehrInformationsintegration
Informationsintegration Heterogenität Datenkonflikte Transparenz Ulf Leser Wissensmanagement in der Bioinformatik Klassifikationsdimensionen [ÖV99] Klassische Eigenschaften von Informationssystemen Verteilung
MehrInformationsintegration
Informationsintegration Heterogenität Transparenz Ulf Leser Wissensmanagement in der Bioinformatik Klassifikationsdimensionen Verteilung Autonomie Heterogenität Ulf Leser: Informationsintegration, Wintersemester
MehrDatenintegration & Datenherkunft Architekturen
Datenintegration & Datenherkunft Architekturen Wintersemester 2010/11 Melanie Herschel melanie.herschel@uni-tuebingen.de Lehrstuhl für Datenbanksysteme, Universität Tübingen 1 Kapitel 4 Architekturen Überblick
MehrInformationsintegration
Informationsintegration Verteilung, Autonomie, Heterogenität, Transparenz Ulf Leser Inhalt dieser Vorlesung Verteilung Autonomie Heterogenität Transparenz Ulf Leser: Informationsintegration 2 Klassifikationsdimensionen
MehrInformationsintegration I Einführung
Informationsintegration I Einführung Felix Naumann Integrierte Informationssysteme Anfrage Integriertes Informationssystem Oracle, DB2 Anwendung Dateisystem Web Service HTML Form Integriertes Info.-system
Mehr30. Juni 2006 - Technische Universität Kaiserslautern. Paul R. Schilling
30. Juni 2006 - Technische Universität Kaiserslautern Paul R. Schilling ! " #$% & '( ( ) *+, - '. / 0 1 2("$ DATEN SIND ALLGEGENWÄRTIG Bill Inmon, father of data warehousing Unternehmen In einer vollkommenen
MehrVL Informationsintegration Verteilung, Autonomie und Heterogenität. 25.10.2004 Felix Naumann. Aufbau eines Data Warehouse
VL Informationsintegration Verteilung, Autonomie und Heterogenität 25.10.2004 Felix Naumann Wiederholung: Data Warehouse Aufbau eines Data Warehouse Quelle: Ulf Leser, VL Data Warehouses 25.10.2004 Felix
MehrInformationsintegration Architekturen. 17.4.2012 Felix Naumann
Informationsintegration Architekturen 17.4.2012 Felix Naumann Überblick 2 Überblick über Informationssysteme Klassifikation Materialisiert vs. virtuell Architekturen 3 Schichten Architektur 4 Schichten
MehrAusgangspunkt. Datenintegration. Ziel. Konflikte. Architekturen. Transparenz
Ausgangspunkt Datenintegration Web Informationssysteme Wintersemester 2002/2003 Donald Kossmann Daten liegen in verschiedenen Datenquellen (Extremfall: jede URL eigene Datenquelle) Mietautos bei www.hertz.com
Mehr7. XML-Datenbanksysteme und SQL/XML
7. XML-Datenbanksysteme und SQL/XML Native XML-DBS vs. XML-Erweiterungen von ORDBS Speicherung von XML-Dokumenten Speicherung von XML-Dokumenten als Ganzes Generische Dekomposition von XML-Dokumenten Schemabasierte
MehrRelationales Datenbanksystem Oracle
Relationales Datenbanksystem Oracle 1 Relationales Modell Im relationalen Modell wird ein relationales Datenbankschema wie folgt beschrieben: RS = R 1 X 1 SC 1... R n X n SC n SC a a : i=1...n X i B Information
MehrSQL. SQL: Structured Query Language. Früherer Name: SEQUEL. Standardisierte Anfragesprache für relationale DBMS: SQL-89, SQL-92, SQL-99
SQL Früherer Name: SEQUEL SQL: Structured Query Language Standardisierte Anfragesprache für relationale DBMS: SQL-89, SQL-92, SQL-99 SQL ist eine deklarative Anfragesprache Teile von SQL Vier große Teile:
MehrDieser Foliensatz darf frei verwendet werden unter der Bedingung, dass diese Titelfolie nicht entfernt wird.
Thomas Studer Relationale Datenbanken: Von den theoretischen Grundlagen zu Anwendungen mit PostgreSQL Springer, 2016 ISBN 978-3-662-46570-7 Dieser Foliensatz darf frei verwendet werden unter der Bedingung,
MehrDBMS für spezielle Anwendungen XML als Mittel der Datenbank-Interoperabilität
DBMS für spezielle Anwendungen XML als Mittel der Datenbank-Interoperabilität Seminarvortrag von D. Zimmermann 26-Februar-2004 Gliederung Datenbanken und Interoperabilität Begriffe Bedarf Ansätze XML als
MehrVerteilte Datenbanken
Verteilte Datenbanken Stand der Technik: Zentrale oder Verteilte Datenbanken Bisher (implizit) diskutiert: Zentraler Ansatz, d. h. keine Netzwerke berücksichtigt: Terminals / Arbeitsplatzrechner DB 1 Zentraler
MehrSchema Mapping. Dr. Armin Roth arminroth.de. Dr. Armin Roth (arminroth.de) II Schema Mapping / 23
Dr. Armin Roth arminroth.de 25.04.2013 Dr. Armin Roth (arminroth.de) II Schema Mapping 25.04.2013 1 / 23 Agenda 1 Wiederholung: Schema Matching / Integration 2 Schema Mapping Definitionen Beispiel Algorithmus
MehrXML-Datenaustausch in der Praxis Projekt TOMIS bei der ThyssenKrupp Stahl AG
Mittwoch, 9. November 2005 13h00, Bruno-Schmitz-Saal 18. Deutsche ORACLE-Anwenderkonferenz XML-Datenaustausch in der Praxis Projekt TOMIS bei der ThyssenKrupp Stahl AG Volker Husemann Thyssen Krupp Stahl
MehrData Warehousing und Data Mining
Data Warehousing und Data Mining Logische Optimierung Ulf Leser Wissensmanagement in der Bioinformatik Inhaltsübersicht Vorlesung Architektur Modellierung von Daten im DWH Umsetzung des multidimensionalen
MehrDB2 SQL, der Systemkatalog & Aktive Datenbanken
DB2 SQL, der Systemkatalog & Aktive Datenbanken Lehr- und Forschungseinheit Datenbanken und Informationssysteme 1 Ziele Auf DB2 Datenbanken zugreifen DB2 Datenbanken benutzen Abfragen ausführen Den Systemkatalog
MehrDatenbanken Grundlagen und Design
Frank Geisler Datenbanken Grundlagen und Design 3., aktualisierte und erweiterte Auflage mitp Vorwort 15 Teil I Grundlagen 19 i Einführung in das Thema Datenbanken 21 i.i Warum ist Datenbankdesign wichtig?
MehrEnterprise Applikation Integration und Service-orientierte Architekturen. 01 Einführung
Enterprise Applikation Integration und Service-orientierte Architekturen 01 Einführung Agenda Warum EAI Klassifikation von EAI-Ansätzen Ebenen der Integration Architekturen zur Datenintegration Prof. Dr.
MehrVisualisierung in Informatik und Naturwissenschaften
Visualisierung in Informatik und Naturwissenschaften Datenbankvisualisierung Sven Bernhard 12.06.1999 Datenbankvisualisierung Datenbanktheorie in 5 Minuten Visualisierung vs. Datenbanken Visualisierung
MehrDatenbankentwicklung
Datenbankentwicklung Berechnung und Präsentation von Daten Organisation der Daten in alleinstehende Tabellen Exklusiver Zugriff auf alle Informationen einer Tabelle Beschränkte Anzahl von Daten pro Tabellenblatt
MehrDatenintegration. Kapitel 2: Verteilung, Autonomie und Heterogenität. Dr. Anika Groß Sommersemester 2014
Datenintegration Datenintegration Kapitel 2: Verteilung, Autonomie und Heterogenität Dr. Anika Groß Sommersemester 2014 Universität Leipzig Institut für Informatik http://dbs.uni-leipzig.de 1 Inhalt Verteilung
MehrIntegration, Migration und Evolution
14. Mai 2013 Programm für heute 1 2 Quelle Das Material zu diesem Kapitel stammt aus der Vorlesung Datenintegration & Datenherkunft der Universität Tübingen gehalten von Melanie Herschel im WS 2010/11.
MehrInformationsintegration
Informationsintegration Local-as-View Anfrageplanung Ulf Leser Inhalt dieser Vorlesung Anfragekorrespondenzen Formale Definition Korrespondenztypen und -arten GaV erklärt Local as View Query Containment
MehrInformationsintegration Einführung
Informationsintegration Einführung 17.4.2007 Felix Naumann Integrierte Informationssysteme 2 Anfrage Integriertes Informationssystem Oracle, DB2 Anwendung Dateisystem Web Service HTML Form Integriertes
MehrKlausur Datenbanken II
Klausur Datenbanken II 8.3.2001 Name Vorname Semester Matrikelnr Aufgabe Punkte maximal 1 8 2 8 3 3 4 3 5 4 6 6 7 6 8 6 9 [Zusatz] [4] Summe 44 Punkte erreicht Bitte geben Sie die Lösungen möglichst direkt
MehrWirtschaftsinformatik 7a: Datenbanken. Hochschule für Wirtschaft und Recht SS 16 Dozent: R. Witte
Wirtschaftsinformatik 7a: Datenbanken Hochschule für Wirtschaft und Recht SS 16 Dozent: R. Witte Drei Gäste bezahlen nach einem gemeinsamen Abendessen eine Rechnung von 30 Euro, so dass jeder 10 Euro gibt.
MehrData Warehousing und Data Mining
Data Warehousing und Data Mining Logische Optimierung Ulf Leser Wissensmanagement in der Bioinformatik Inhaltsübersicht Vorlesung Einleitung & Motivation Architektur Modellierung von Daten im DWH Umsetzung
MehrDatenintegration. Kapitel 2: Verteilung, Autonomie und Heterogenität. Andreas Thor Sommersemester 2008. Inhalt
Datenintegration Datenintegration Kapitel 2: Verteilung, Autonomie und Heterogenität Andreas Thor Sommersemester 2008 Universität Leipzig Institut für Informatik http://dbs.uni-leipzig.de 1 Inhalt Verteilung
MehrGrundlagen von SQL. Informatik 2, FS18. Dr. Hermann Lehner (Material von Dr. Markus Dahinden) Departement Informatik, ETH Zürich
Grundlagen von SQL Informatik 2, FS18 Dr. Hermann Lehner (Material von Dr. Markus Dahinden) Departement Informatik, ETH Zürich Markus Dahinden 13.05.18 1 Grundlagen von SQL (Structured Query Language)
MehrGeoinformation Abbildung auf Tabellen
Folie 1 von 32 Geoinformation Abbildung auf Tabellen Folie 2 von 32 Abbildung auf Tabellen Übersicht Motivation des relationalen Datenmodells Von Objekten zu Tabellen Abbildung von Objekten Schlüssel Abbildung
Mehr10. Vorlesung: Datenorganisation SS 2007
10. Vorlesung: Datenorganisation SS 2007 8 Parallele Transaktionen 9 9.1 Drei-Ebenen Ebenen-Architektur 9.2 Verteilte Datenbanken 9.3 Client-Server Server-Datenbanken 9.4 Föderierte Datenbanken 9.5 Das
MehrAbschluss Einblick und Ausblick
Abschluss Einblick und Ausblick Prof. Dr. T. Kudraß 1 Benutzer Komponenten eines DBMS (Überblick) I/O-Prozessor Output-Generierung Parser für selbst. oder eingebettete Kommandos Precompiler Autorisierungs-Kontrolle
MehrWiederholung VU Datenmodellierung
Wiederholung VU Datenmodellierung VU Datenbanksysteme Reinhard Pichler Arbeitsbereich Datenbanken und Artificial Intelligence Institut für Informationssysteme Technische Universität Wien Wintersemester
MehrEinteilung von Datenbanken
Datenbanksysteme (c) A.Kaiser; WU-Wien 1 Einteilung von Datenbanken 1. formatierte Datenbanken 2. unformatierte Datenbanken Information Retrieval Systeme 2 Wozu Datenbanken? Speicherung und Verwaltung
MehrKapitel 1: Wiederholungsfragen Grundlagen DBS
Grundlagen DBS 1. Welche zentralen Anforderungen an ein DBS definierte Edgar Codd? 2. Was ist eine Transaktion? 3. Welche Eigenschaften muss das DBMS bei der Transaktionsverarbeitung sicherstellen? 4.
MehrWS 2010/11 Datenbanksysteme Fr 15:15 16:45 R 1.008. Vorlesung #5. SQL (Teil 3)
Vorlesung #5 SQL (Teil 3) Fahrplan Besprechung der Übungsaufgaben Rekursion Rekursion in SQL-92 Rekursion in DBMS- Dialekten (Oracle und DB2) Views (Sichten) - gespeicherte Abfragen Gewährleistung der
MehrInformationsintegration
Informationsintegration Einführung Ulf Leser Wissensmanagement in der Bioinformatik Informationsintegration Anfrage Integriertes Informationssystem Oracle, DB2 Anwendung Dateisystem Web Service HTML Form
MehrOracle Database 12c Was Sie immer schon über Indexe wissen wollten
Oracle Database 12c Was Sie immer schon über Indexe wissen wollten Marco Mischke, 08.09.2015 DOAG Regionaltreffen B* Indexe - Aufbau 0-Level Index A-F G-Z 1-Level Index A-F G-Z 2-Level Index A-F G-M N-Z
MehrÜberblick Felix Naumann. Zugriffsrechte Zugriffsrechte erzeugen Zugriffsrechte prüfen Zugriffsrechte vergeben Zugriffsrechte entziehen
Datenbanksysteme I Zugriffskontrolle (kleiner Einschub) 18.1.2007 Felix Naumann Überblick 2 Zugriffsrechte Zugriffsrechte erzeugen Zugriffsrechte prüfen Zugriffsrechte vergeben Zugriffsrechte entziehen
MehrDatenintegration & Datenherkunft Verteilung, Autonomie, und Heterogenität
Datenintegration & Datenherkunft Verteilung, Autonomie, und Wintersemester 2010/11 Melanie Herschel melanie.herschel@uni-tuebingen.de Lehrstuhl für Datenbanksysteme, Universität Tübingen 1 Klassifikation
MehrWebbasierte Informationssysteme
SS 2004 Prof. Dr. Stefan Böttcher Universität Paderborn - SS 2004 - Prof. Dr. Stefan Böttcher Folie 1 Was ist eine relationale Datenbank? Menge von Relationen (=Tabellen) und Constraints (=Integritätsbedingungen)
MehrP2P DATENBANKEN. Anwendungen 1 WS 2009/2010. Julissa Cusi Juarez. Department Informatik
P2P DATENBANKEN Anwendungen 1 WS 2009/2010 Julissa Cusi Juarez Department Informatik HAW Hamburg 02.12.2009 1 Agenda 1. Motivation 2. Klassische Datenbanksysteme 3. Verteilte Datenbanksysteme 4. Peer to
Mehr1 Einführung Ziele der Vorlesung Die Idee Lernkarte Selbsttest-Frage 3 Literaturhinweise 3
1 Einführung 1 1.1 Ziele der Vorlesung 1 1.2 Die Idee 1 1.3 Lernkarte 2 1.4 Selbsttest-Frage 3 Literaturhinweise 3 Teilt Die Zukunft von Enterprise-Computing 5 2 Neue Anforderungen an Enterprise Computing
MehrKapitel 14. Objekt-relationales Mapping (ORM) mit Hibernate bzw. Java Persistance API (JPA) Prof. Dr. Wolfgang Weber Vorlesung Datenbanken
Kapitel 14 Objekt-relationales Mapping (ORM) mit Hibernate bzw. Java Persistance API (JPA) 1 Wozu Objekt-relationales Mapping? - Problematik - Business-Schicht OO-Klassen Unvereinbarkeit der Paradigmen
MehrDatenbankbasierte Lösungen
Technologische Beiträge für verteilte GIS - Anforderungen an verteilte GIS und Lösungsansätze Datenbankbasierte Lösungen Johannes Kebeck Senior Systemberater ORACLE Deutschland GmbH Agenda TOP Thema 1
MehrDatenbanken. Zusammenfassung. Datenbanksysteme
Zusammenfassung Datenbanksysteme Christian Moser Seite 1 vom 7 12.09.2002 Wichtige Begriffe Attribut Assoziation API Atomares Attribut Datenbasis DBMS Datenunabhängigkeit Datenbankmodell DDL DML DCL ER-Diagramm
MehrSQL (Structured Query Language) Schemata Datentypen
2 SQL Sprachelemente Grundlegende Sprachelemente von SQL. 2.1 Übersicht Themen des Kapitels SQL Sprachelemente Themen des Kapitels SQL (Structured Query Language) Schemata Datentypen Im Kapitel SQL Sprachelemente
MehrKapitel DB:IV (Fortsetzung)
Kapitel DB:IV (Fortsetzung) IV. Logischer Datenbankentwurf mit dem relationalen Modell Das relationale Modell Integritätsbedingungen Umsetzung ER-Schema in relationales Schema DB:IV-46 Relational Design
MehrDatenintegration. Kapitel 0: Organisatorisches. Dr. Anika Groß Sommersemester 2016
Datenintegration Datenintegration Kapitel 0: Organisatorisches Dr. Anika Groß Sommersemester 2016 Universität Leipzig Institut für Informatik http://dbs.uni-leipzig.de 1 Organisatorisches Termin: donnerstags,
Mehr1. Einführung, Problemstellung und Überblick Rechnernetze
Inhaltsverzeichnis 1. Einführung, Problemstellung und Überblick 1 1.1 Einführung 1 1.2 Allgemeine Problemstellungen 5 1.2.1 Problemstellung bei Dezentralisierung 5 1.2.2 Problemstellung bei Integration
MehrKap. 5.3: SAP-Datenmodell, Metadatenverwaltung
Kap. 5.3: SAP-Datenmodell, Metadatenverwaltung & Abbildung auf RDBMS SAP R/3 Repository Analyse: Datenmodell von SAP R/3 SAP-SERM Metadatenverwaltung Data Dictionary Abbildung von SAP-Tabellen auf RDBMS
MehrVorwort zur 5. Auflage... 15 Über den Autor... 16
Vorwort zur 5. Auflage...................................... 15 Über den Autor............................................ 16 Teil I Grundlagen.............................................. 17 1 Einführung
MehrDas relationale Modell (Teil 1)
Vorlesung #2 Das relationale Modell (Teil 1) Fahrplan WS 2010/11 Feedback Vorlesung#1 Das relationale Modell Einordnung (wir überspringen die Modellierung, das kommt im 4. Semester Datenmanagement ) Definition,
MehrGarten - Daten Bank. - survival pack -
Garten - Daten Bank - survival pack - Dr. Karsten Tolle PRG2 SS 2017 Inhalt heute Kurz: Motivation und Begriffe SQL (survival pack) create table (Tabelle erzeugen) insert into (Einfügen) select (Anfragen)
MehrAuf einen Blick. Abfrage und Bearbeitung. Erstellen einer Datenbank. Komplexe Abfragen. Vorwort... 13
Auf einen Blick Vorwort... 13 Teil 1 Vorbereitung Kapitel 1 Einleitung... 17 Kapitel 2 SQL der Standard relationaler Datenbanken... 21 Kapitel 3 Die Beispieldatenbanken... 39 Teil 2 Abfrage und Bearbeitung
MehrKonzeptueller Entwurf
Konzeptueller Entwurf UML Klassendiagrame UML Assoziationen Entspricht Beziehungen Optional: Assoziationsnamen Leserichtung ( oder ), sonst bidirektional Rollennamen Kardinalitätsrestriktionen UML Kardinalitätsrestriktionen
MehrDatenmodellierung im Zeitalter agiler Softwareentwicklung
Datenmodellierung im Zeitalter agiler Softwareentwicklung Sebastian Graf, PROMATIS software GmbH DOAG 2013, Nürnberg, 1 Agenda u Über den Referenten u Datenmodellierung Begriffsdefinition und Abgrenzung
MehrInformationsintegration
Informationsintegration Anwendungsszenarien Ulf Leser Inhalt dieser Vorlesung Zwei Anwendungsszenarien Data Warehouse Föderierte Datenbanken Abgrenzung Daten versus Schema Ulf Leser: Informationsintegration
MehrIn diesem Abschnitt wollen wir uns mit der Architektur von Datenbank Managements Systemen beschäftigen.
1 In diesem Abschnitt wollen wir uns mit der Architektur von Datenbank Managements Systemen beschäftigen. Zunächst stellt sich die Frage: Warum soll ich mich mit der Architektur eines DBMS beschäftigen?
MehrPhysischer DB-Entwurf
Physischer DB-Entwurf Prof. Dr. T. Kudraß 1 Überblick Ausgangslage: Konzeptuelles und externes Schema sind erstellt: ER Modell, Schemaverfeinerung und Definition von Sichten Nächster Schritt: Physischer
MehrRepetitorium. Data Warehousing und Data Mining 11/12. Sebastian Wandelt 13./16. Februar 2012
Repetitorium Data Warehousing und Data Mining 11/12 Sebastian Wandelt 13./16. Februar 2012 Inhalt Data Warehousing und Data Mining auf 40 Slides Weder in-, noch exklusiv! Subjektive Zusammenfassung pro
MehrDaten-Definitionssprache (DDL) Bisher: Realwelt -> ERM -> Relationen-Modell -> normalisiertes Relationen-Modell. Jetzt: -> Formulierung in DDL
Daten-Definitionssprache (DDL) Bisher: Realwelt -> ERM -> Relationen-Modell -> normalisiertes Relationen-Modell Jetzt: -> Formulierung in DDL Daten-Definitionssprache (DDL) DDL ist Teil von SQL (Structured
MehrDatenbanken und Informationssysteme. Datenbanken und Informationssysteme
Datenbanken und Informationssysteme Wolfgang Menzel: Natürlichsprachliche Systeme (NATS) Norbert Ritter: Datenbanken und Informationssysteme (IS) NATS Ziele der Vorlesung (1) Vermittlung von Grundlagen-
MehrDatenbanken und Informationssysteme
Datenbanken und Informationssysteme Wolfgang Menzel: Natürlichsprachliche Systeme (NATS) Norbert Ritter: Datenbanken und Informationssysteme (IS) NATS Ziele der Vorlesung (1) Vermittlung von Grundlagen-
MehrAuf einen Blick. Abfrage und Bearbeitung. Erstellen einer Datenbank. Komplexe Abfragen. Vorwort 13
Auf einen Blick Vorwort 13 Teil 1 Vorbereitung Kapitel 1 Einleitung 17 Kapitel 2 SQL - der Standard relationaler Datenbanken 21 Kapitel 3 Die Beispieldatenbanken 39 Teil 2 Abfrage und Bearbeitung Kapitel
MehrDatenbanken I. Karczewski Datenbanken I 1. Produkt (0,*) (0,*)
Datenbanken I Produkt (0,*) (0,*) 3 Karczewski Datenbanken I 1 Literatur C.J. Date: An Introduction to Database Systems; Addison-Wesley Systems Programming Series. 6th ed. 1995 H.E. Erbs, S. Karczewski
MehrInformationsintegration
Informationsintegration Schemaintegration Ulf Leser Wissensmanagement in der Bioinformatik Richtung Schemaintegration versus Anfragebearbeitung FDBS Schema integration Data source Data source Data source
MehrOracle9i Designer. Rainer Willems. Page 1. Leitender Systemberater Server Technology Competence Center Frankfurt Oracle Deutschland GmbH
Oracle9i Designer Rainer Willems Leitender Systemberater Server Technology Competence Center Frankfurt Oracle Deutschland GmbH Page 1 1 Agenda 9i Designer & 9i SCM in 9i DS Design Server Generierung &
MehrCassandra Query Language (CQL)
Cassandra Query Language (CQL) Seminar: NoSQL Wintersemester 2013/2014 Cassandra Zwischenpräsentation 1 Gliederung Basic facts Datentypen DDL/DML ähnlich zu SQL Besonderheiten Basic facts CQL kurz für
Mehr1. Einführung Seite 1. Kapitel 1: Einführung
1. Einführung Seite 1 Kapitel 1: Einführung 1. Einführung Seite 2 Willkommen! Studierenden-Datenbank Hans Eifrig hat die Matrikelnummer 1223. Seine Adresse ist Seeweg 20. Er ist im zweiten Semester. Lisa
MehrInformationsintegration Architekturen
Informationsintegration Architekturen 3.5.2007 Felix Naumann Überblick 2 Überblick über Informationssysteme Klassifikation Weitere Kriterien Architekturen 3 Schichten Architektur 4 Schichten Architektur
MehrEin Beispiel. Ein Unternehmen will Internettechnologien im Rahmen des E- Business nutzen Welche Geschäftsprozesse?
Ein Beispiel Ein Unternehmen will Internettechnologien im Rahmen des E- Business nutzen Welche Geschäftsprozesse? Dipl.-Kfm. Claus Häberle WS 2015 /16 # 42 XML (vereinfacht) visa
MehrISU 1. Ue_08/02_Datenbanken/SQL. 08 Datenbanken. Übung. SQL Einführung. Eckbert Jankowski. www.iit.tu-cottbus.de
08 Datenbanken Übung SQL Einführung Eckbert Jankowski www.iit.tu-cottbus.de Datenmodell (Wiederholung, Zusammenfassung) Objekte und deren Eigenschaften definieren Beziehungen zwischen den Objekten erkennen/definieren
MehrWeb Data Management Systeme
Web Data Management Systeme Seminar: Web-Qualitätsmanagement Arne Frenkel Agenda Einführung Suchsysteme Suchmaschinen & Meta-Suchmaschinen W3QS WebSQL WebLog Information Integration Systems Ariadne TSIMMIS
MehrData Warehousing. Sommersemester Ulf Leser Wissensmanagement in der Bioinformatik
Data Warehousing Sommersemester 2004 Ulf Leser Wissensmanagement in der Bioinformatik ... Der typische Walmart Kaufagent verwendet täglich mächtige Data Mining Werkzeuge, um die Daten der 300 Terabyte
MehrDatenbanken Implementierungstechniken SS2015
Hochschule für Technik, Wirtschaft und Kultur Leipzig Leipzig University of Applied Sciences Parallele DBMS Datenbanken Implementierungstechniken SS2015 Alexander Müller Fakultät Informatik, Mathematik
MehrSQL. Ziele. Grundlagen von SQL. Beziehung zur relationalen Algebra SELECT, FROM, WHERE. Joins ORDER BY. Aggregatfunktionen. dbis.
SQL Lehr- und Forschungseinheit Datenbanken und Informationssysteme Ziele Grundlagen von SQL Beziehung zur relationalen Algebra SELECT, FROM, WHERE Joins ORDER BY Aggregatfunktionen Lehr- und Forschungseinheit
MehrDatenbanken und Informationssysteme
Datenbanken und Informationssysteme Lehrangebot Stefan Conrad Heinrich-Heine-Universität Düsseldorf Institut für Informatik April 2012 Stefan Conrad (HHU) Datenbanken und Informationssysteme April 2012
MehrVorlesung: Relationale Datenbanksysteme
Vorlesung: Relationale Datenbanksysteme Softwareentwicklungsprojekt 1+2 Softwaretechnik 2 Dienstorientiertes Rechnen in der Praxis Dipl.-Inf. Andreas Göbel Friedrich-Schiller-Universität Jena Lehrstuhl
Mehr<Insert Picture Here> z/os Migration und Integration
z/os Migration und Integration Thomas Niewel Leitender Systemberater Agenda Überblick Integration von z/os Daten und Anwendungen Migration von z/os Daten und Anwendungen Erfahrungen
MehrDie Grundbegriffe Die Daten Die Informationen
Die Grundbegriffe Die Daten sind diejenigen Elemente, die vom Computer verarbeitet werden. Die Informationen sind Wissenselemente, welche durch die Analyse von Daten erhalten werden können. Die Daten haben
Mehr7. XML-Datenbanksysteme und SQL/XML
7. XML-Datenbanksysteme und SQL/XML Native XML-DBS vs. XML-Erweiterungen von ORDBS Speicherung von XML-Dokumenten Speicherung von XML-Dokumenten als Ganzes Generische Dekomposition von XML-Dokumenten Schemabasierte
MehrEinführung relationale Datenbanken. Themenblock: Erstellung eines Cube. Schlüssel. Relationenmodell Relationenname Attribut. Problem.
Themenblock: Erstellung eines Cube Einführung relationale Datenbanken Problem Verwaltung großer Mengen von Daten Praktikum: Data Warehousing und Data Mining Idee Speicherung der Daten in Form von Tabellen
MehrThemenblock: Erstellung eines Cube
Themenblock: Erstellung eines Cube Praktikum: Data Warehousing und Data Mining Einführung relationale Datenbanken Problem Verwaltung großer Mengen von Daten Idee Speicherung der Daten in Form von Tabellen
MehrRelationales Datenbankpraktikum 2016ss
Relationales Datenbankpraktikum 2016ss 3 Teile 1) Datenbankentwurf, Datenimport 2) Formulierung von SQL-Anfragen V. Christen, Dr. A. Groß, M. Junghanns, Z. Sehili 3) Entwicklung einer Middleware für eine
MehrMaterialized Views. Jan-Peter Timmermann. DOAG Regiotreffen Hamburg: Materialized Views Seite 1
Materialized Views Jan-Peter Timmermann DOAG Regiotreffen Hamburg: Materialized Views Seite 1 Klassische View Sind virtuelle Tabellen Erstellung nicht aufwendig, da nur ein Eintrag im Data Dictionary vorgenommen
MehrAnfragebearbeitung. Anfrage. Übersetzer. Ausführungsplan. Laufzeitsystem. Ergebnis
Anfragebearbeitung Anfrage Übersetzer Ausführungsplan Laufzeitsystem Ergebnis Übersetzung SQL ist deklarativ, Übersetzung für Laufzeitsystem in etwas prozedurales DBMS übersetzt SQL in eine interne Darstellung
MehrNoSQL Datenbanken EIN ÜBERBLICK ÜBER NICHT-RELATIONALE DATENBANKEN UND DEREN POTENTIALE IM ALLGEMEINEN UND IN DER INDUSTRIE
NoSQL Datenbanken EIN ÜBERBLICK ÜBER NICHT-RELATIONALE DATENBANKEN UND DEREN POTENTIALE IM ALLGEMEINEN UND IN DER INDUSTRIE Was bedeutet NoSQL? Ein Sammelbegriff für alternative Datenbanklösungen, die
MehrMedizininformatik Software Engineering
Vorlesung Software Engineering Inhaltsverzeichnis 1. Einleitung 2. Software und Medizinprodukt 3. Vorgehensmodelle 4. Strukturierter Entwurf von Echtzeitsystemen 4.1 Echzeit, was ist das? 4.2 Einführung
MehrRelationale Datenbanken
Ramon A. Mata-Toledo, Pauline K. Cushman Relationale Datenbanken Schaum's Repetitorien Übersetzung aus dem Amerikanischen von G&U Technische Dokumentation GmbH Z Die Autoren 9 Vorwort 9 1 Ein Überblick
MehrDatenmodellierung VU Einführung SS 2016
184.685 Datenmodellierung VU Einführung SS 2016 Nysret Musliu, Sebastian Skritek Institut für Informationssysteme Technische Universität Wien Nysret Musliu, Sebastian Skritek Seite 1 1. Motivation Motivation
MehrAndreas Heuer Gunter Saake Kai-Uwe Sattler. Datenbanken. kompakt
Andreas Heuer Gunter Saake Kai-Uwe Sattler Datenbanken kompakt Inhaltsverzeichnis Vorwort v 1 Was sind Datenbanken 1 1.1 Warum Datenbanken 1 1.2 Datenbanksysteme 4 1.3 Anforderungen: Die Codd'schen Regeln
MehrXAMPP-Systeme. Teil 3: My SQL. PGP II/05 MySQL
XAMPP-Systeme Teil 3: My SQL Daten Eine Wesenseigenschaft von Menschen ist es, Informationen, in welcher Form sie auch immer auftreten, zu ordnen, zu klassifizieren und in strukturierter Form abzulegen.
Mehr