werden lokalen Schemaelemente restrukturiert und durch eine Betrachtung der Daten iterativ verfeinert. Die Bestimmung der Konfliktfreiheit der Daten k
|
|
- Götz Geiger
- vor 5 Jahren
- Abrufe
Transkript
1 Werkzeugunterstützung für die visuelle Integration heterogener Datenbestände Ingolf Geist Otto von Guericke Universität Magdeburg Institut für Technische und Betriebliche Informationssysteme Postfach 4120, D Magdeburg, Germany geist@iti.cs.uni-magdeburg.de Zusammenfassung Während der Integration von heterogenen Datenbeständen müssen Heterogenitäten auf verschiedenen Ebenen aufgelöst werden, wobei Integrationskonflikte sowohl auf der Schemaebene als auch auf der Datenebene vorhanden sind. Somit wird für einen vollständigen Entwurf eine Behandlung von Schema und Datenkonflikten benötigt. Diese Arbeit stellt das Werkzeug VIbE vor, das aufbauend auf den Möglichkeiten der Multidatenbanksprache FraQL die Schemaintegration um die Behandlung von Datenkonflikten erweitert. Dieser Prozeß der Instanzkonfliktbehandlung wird hierbei als ein datenorientierter, interaktiver und iterativer Vorgang beschrieben, der durch die Visualisierung der Operationen, Daten und Konflikte unterstützt wird. 1 Einführung Die Integration heterogener Datenbestände ist immer noch ein aktuelles Problem. Hierbei existieren verschiedene Ansätze der Integration: virtuelle Integration mit Multidatenbanksprachen oder Föderierte Datenbanksystemen bzw. mediatorbasierte System oder physische Integration in einem Data Warehouse. In allen Fällen ist eine Integration der Schemata und der aktuell vorhandenen Instanzen notwendig. Einen Überblick über Konzepte und Verfahren zur Integration von Schemata wurden u.a. in den Arbeiten [BLN86] oder [Con97] gegeben. Diese Methoden beschäftigen sich mit der Restrukturierung und Abbildung lokaler Schemata in föderiertes Schema. Hierbei werden die verschiedenen Schemakonflikte gelöst, die aufgrund der Heterogenität der lokalen Komponentensysteme entstehen. Die Instanzintegration hingegen beschäftigt sich mit tatsächlich existierenden Dateninstanzen und versucht diese in das globale Schema zu integrieren. Ansätze zur Instanzintegration sind u.a. in [RR98] beschrieben. Hierfür müssen zwei Aufgaben gelöst werden: die Abbildung semantisch äquivalenter Datenbankobjekte zueinander und die Auflösung von Attributwertkonflikten. Die Attributwertkonflikte äußern sichinunterschiedlichen Werten in korrespondierenden Attributen semantisch äquivalenter Tupel und können durch unterschiedliche Repräsentationen oder Dateninkonsistenzen entstanden sein. Der Prozeß dieser Instanzintegration geht dabei von einem globalen Schema aus, das durch eine Schemaintegrationsmethode oder durch einen Top Down Entwurf erzeugt wurde, und erstellt eine Abbildung der lokalen Elemente auf das globale Schema. Während dieser Abbildung
2 werden lokalen Schemaelemente restrukturiert und durch eine Betrachtung der Daten iterativ verfeinert. Die Bestimmung der Konfliktfreiheit der Daten kann nur interakiv mit dem semantischen Hintergrundwissen des Entwerfers der Föderation erfolgen. Aufbauend auf diesen Überlegungen soll ein Werkzeug geschaffen werden, das die Schemaintegration um die Behandlung von Instanzkonflikten erweitert. Dieses Werkzeug muß einen Lese Zugriff auf die verschiedenen lokalen Datenquellen ermöglichen und Operationen zur Auflösung von Integrationskonflikten anbieten, welche abgeschlossen und orthogonal sind. Weiterhin ist eine Visualisierung dieser Operationen und der Daten sowie der auftretenden Konflikte notwendig. 2 Integration mit FraQL Eine Multidatenbanksprache kann die Grundlage für den erwähnten Ablauf des Prozesses bilden, da sie die notwendigen Operationen zur Restrukurierung der Typen und der Datenwerte mitbringt. In unserem Fall wurde die Multidatenbanksprache FraQL [SC99] gewählt, die eine Erweiterung von SQL darstellt. Diese Sprache ist als ein Teil eines föderierten Anfragesystems implementiert und kann über Adapter auf verschiedene Komponentensysteme zugreifen. Diese Adapter verbergen die System und Datenmodellheterogenität, indem sie die Daten der Datenquellen mit Hilfe von objektrelationalen Schemata darstellen. Das globale Schema FraQL besteht aus Objekttypen und globalen Relationen, die in Import und Integrationsrelationen unterschieden werden. Die Struktur der globalen Daten werden durch Objekttypen beschrieben, die aus einer Menge von Attributen mit ihren Wertebereichen bestehen. Diese Typen sind in einer Spezialisierungshierarchie organisiert. Eine Importrelation stellt eine Projektion auf einer lokalen Relation aus einem Komponentensystem dar und repräsentiert somit deren Daten auf der globalen Schicht. Für ihre Definition muß der globale Typ, die lokale Relation und eine eventuell nötige Abbildung der lokalen Attribute auf die globalen Attribute angegeben werden. Hierbei können zur Anpassung der Repräsentationen Umbenennungen sowie nutzerdefinierte Funktion und Abbildungstabellen benutzt werden. Somit lösen die Importrelationen Beschreibungskonflikte. Die weitere Integration erfolgt durch Integrationsrelationen, die Sichten auf globale Relationen sind, die mit Hilfe der Operationen von FraQL aufgebaut wurden. Hierbei unterstützt FraQL erweiterte Join bzw. Union Operationen sowie die Verwendung von Metadaten in Anfragen und die Standardoperationen von SQL. Dadurch können neben strukturellen und semantischen Konflikten auch Instanzkonflikte behandelt werden. Unterschiedlich vertikal partionierte korrespondierende Relationen stellen einen strukturellen Konflikt dar, der mit Hilfe der Verbundoperationen Join und OuterJoin gelöst werden kann. Hierbei erweitert FraQL diese Operatoren um die Angabe einer nutzerdefinierten Funktion in der reconciled by Klausel, die eine Auflösung von Datenkonflikten in gemeinsamen Nichtschlüselattributen ermöglicht. Bei Konflikten in den Schlüsselwerten muß entweder in der ON Klausel die Verbundbedinung verfeinert oder Beschreibungskonflikte in den Importrelationen gelöst werden. Die Vereinigungsoperation behandelt semantisch überlappende Relatione, wobei wiederum die Aufgaben der Tupelidentifikation und der Attributwertkonflikte auf der Datenebene existieren. In der On Klausel sind die Schlüsselattribute der Relationen anzugeben, hierbei muß der gemeinsame Schlüssel der beiden Relationen gefunden werden, um eine eindeutige Zuordnung der Tupel zu erreichen. Eine nutzerdefinierte Funktion behandelt Konflikte in Nichtschlüsselattribute. Sie wird äquivalent zu den Verbundoperationen in der reconciled by Klausel der
3 Operation angegeben. Eine weitere Art von Konflikte sind die Metadatenkonflikte. Diese äußern sich darin, daß korrespondierende Elemente einmal als Metadaten, zum Beispiel Attributnamen, modelliert sind und in einem zweiten Schema als Datenwerte. Dieser Umstand wurde u.a. in [KLK91] beschrieben. Zur Auflösung dieser Konflikte erlaubt FraQL die Nutzung von Metadaten in Anfragen und Variablensubstitution, die eine Abbildung von Metadaten in Datenwerte ermöglicht. Weitere strukturelle Konflikte und Möglichkeiten ihrer Auflösung sind in [KCGS95] beschrieben. Zusammenfassend ist zu sagen, daß FraQL die Grundlage für ein Entwurfswerkzeug zur Unterstützung der Instanzintegration liefert. Die Sprache ermöglicht einerseits die Restrukturierung der Schemata und zweitens die Lösung von Datenkonflikten, dabei sind ihre Operationen abgeschlossen und orthogonal. Weiterhin können die Integrationsschritte sofort durch die Ausführung der Anfrage ausgwertet werden. 3 Visuelle Integration Aufbauend auf den Möglichkeiten von FraQL wurde das visuelle Anfragewerkzeug VIbE geschaffen, daß einen interaktiven und iterativen Prozeß zur Unterstützung der Auflösung von Instanzkonflikten ermöglicht. Zunächst ist der Ausgangspunkt das bestehende globale Schema, das durch eine Schemaintegrationsmethode oder durch ein Top Down Verfahren erstellt wurde. Die Exportschemata der Datenquellen liefert die Multidatenbanksprache in einer objektrelationalen Form. Der Zugriff von VIbE auf FraQL erfolgt über die JDBC Schnittstelle, für die ein Treiber zur Verfügung steht. Das Ziel des Prozesses ist die Integration der Schemata und der Instanzen, für dessen Erreichung Heterogenitäten auf der Schema und Datenebene erkannt und aufgelöst werden müssen. Als Ausgangsidee der Visualisierung des Prozesses dient der Integrationsgraph. Dieser azyklische und gerichtete Graph beschreibt den Ablauf der Abbildung von lokalen Relationen auf die globale Relationen. Die Knoten stellen dabei die Relationen, Import und Integrationsrelationen, dar. Die Kanten zeigen, welche Relationen zum Aufbau einer Integrationsrelation benutzt wurden. Hierbei kann eine Relationen mehrere Relationen zum Aufbau benutzen bzw. von mehreren benötigt werden. Als Operationen zum Aufbau des Graphen sind zunächst die Erstellung einer Importrelation und die Erstellung einer Integrationsrelation zu nennen. Die Eingabe und Darstellung der Parameter der Operationen erfolgt durch Formulare. Bevor Integrationsrelationen erstellt werden können, ist die Erstellung von Importrelationen notwendig. Diese Erzeugung geschieht in drei Schritten: erstens Auswahl der globalen Relation (Name und Typ), zweitens Auswahl der lokalen Relation und drittens die Spezifizierung der Abbildung der Typen. Diese Zuordnung ist in der Abbildung 1 zu sehen. Diese Zuordnung geschieht durch das Zeichnen von Linien zwischen den korrespondierenden Attributen. Den Verbindungen können optional Umrechnungsfunktionen oder Abbildungstabellen hinzugefügt werden, um die verschiedene Repräsentationen der Attributwerte zu homogenisieren, aber am Beginn des Prozesses können nur offensichtliche Konflikte erkannt werden und die Abbildung muß während der Integration weiter verfeinert werden. Sind die ersten Relationen importiert, ist die Erstellung von Integrationsrelationen in dem Graphen möglich. Ein Integrationsbaum repräsentiert dabei die Sichtdefinition und zeigt damit die schrittweise Integration der Relation. Diese Darstellung ist eine Detaildarstellung des Integrationsgraphen. Die Knoten des Baumes repräsentieren globale Relationen oder Operatio-
4 Abbildung 1: Abbildung Import einer Relation nen, deren Ergebnisse ebenfalls Relationen sind. Die Kanten im Baum zeigen den Verlauf der Restrukturierung und Transformation der Daten. Die einzelnen Operationsknoten werden mit Hilfe von Formularen spezifiziert, die an die Konzepte von Query by Example [Zlo77] angelehnt sind. Als verschiedene Operationen wurden zunächst die Projektion und Selektion, der Verbund, die Vereinigung und die Metadatenbehandlung definiert. Diese Operationen benötigen eine bzw. zwei Relationen als Eingabe und liefern eine Relation als Ergebnis. Somit kann die Restrukturierung schrittweise vom Benutzer erstellt und dadurchkomplexe Integrationskonflikte in einfachere Teilprobleme aufgeteilt werden. Nachdem die Operationen spezifiziert wurden, kann eine iterative Verfeinerung stattfinden, indem die Anfrage der Operation von FraQL ausgeführt wird, die Daten analysiert werden und anschließend die Parameter der Operation angepaßt werden. Hierbei ist die Erkennung der Konflikte auf der Instanzebene wichtig, wobei im ersten Schritt die Schlüsselwerte zu betrachten sind. Eine nicht vollständige Zuordnung der Tupel kann bei bekannten extensionalen Beziehungen aus den Kardinalitäten der Ergebnisrelationen und der Ausgangsrelationen erkannt werden. Aus der Ansicht der Daten erstellt der Benutzer die geeigenete Lösung durch die Veränderung der Operationen in einem interaktive und iterativen Vorgang. Hierbei besteht die Möglichkeit der Anpassung der der benutzten Importrelationen, um einen Beschreibungkonflikt zu lösen oder die Änderung der Verbundbedingung bzw. der Vereinigungsoperation. Nach der eindeutigen Zuordnung der Tupel ist es möglich Konflikte in den Werten der Nichtschlüsselattributen zu erkennen und zu lösen. Dafür wird dem Benutzer eine Konfliktansicht gezeigt, mit dessen Hilfe er die Konflikte nach einer Join oder Union Operation erkennen kann. Diese Ansicht wird durch einen Verbund erzeugt und korrespondierende Attribute in einander zugeordneten Tupeln, die unterschiedliche Werte aufweisen, werden hervorgehoben. Hierdurch erkennt der Benutzer die Konflikte und kann zu den entsprechenden Werten in der Ergebnisrelation navigieren. Als Auflösungsmöglichkeit wird kann die Angabe einer Auflösungsfunktion in der Join oder Union Operation erfolgen, die durch den Benutzer in Java zu implementieren ist. Am Ende des Integrationsprozesses liegen die Abbildungsdaten im Katalog von FraQL und die globalen Anwendungen können die entstandenen Sichten nutzen.
5 4 Zusammenfasssung und Ausblick In dieser Arbeit wurde eine Möglichkeit beschrieben wie ein Werkzeug zur Unterstützung der Instanzintegration aussehen kann. Hierbei wird die Schemaintegration durch einen interaktiven und iterativen Prozeß ergänzt. Der Prototyp VIbE stellt mit der Multidatenbanksprache FraQL einen ersten Schritt für die Unterstützung der Instanzintegration dar. Zur Verbesserung der Interaktionsmöglichkeiten müssen einmal eine bessere Visualisierung geschaffen und ein stärkere Automatisierung implementiert werden. Als Erweiterungen sind Datenfehlererkennungsverfahren oder eine automatische Berechnung von Abbildungsfunktionen in bestimmten Fällen denkbar. Weiterhin ist durch eine Nutzung von Samplingmethoden eine Verbesserung der Interaktion und der Darstellung der Konflikte möglich. Hierbei arbeitet der Benutzer auf Samples der eigentlichen Daten und erreicht dort die Konfliktlösung, die anschließend auf die gesamte Menge angewendet und damit überprüft werden kann. Somit ist eine beispielgetrieben Integrationsmethode zur Unterstützung der Instanzkonflikte während des Entwurfes eines förderierten Systems möglich. Literatur [BLN86] [Con97] C Batini, M. Lenzerini, and S. B. Navathe. A Comparative Analysis of Methologies for Database Schema Integration. ACM Computing Surveys, 18(4): , December S. Conrad. Föderierte Datenbanksysteme: Konzepte der Datenintegration. Springer- Verlag, Berlin/Heidelberg, [KCGS95] W. Kim, I. Choi, S. Gala, and M. Scheevel. On Resolving Schematic Heterogeneity in Multidatabase Systems. pages ACM Press/ Addison Wesley Publishing, [KLK91] [RR98] [SC99] R. Krishnamurthy, W. Litwin, and W. Kent. Interoperability of Heterogenous Databases with Schematic Discrepancies. In Y. Kambayashi, M. Rusinkiewicz, and A. Sheth, editors, Proc. First Interational Workshop on Interoperability in Multidatabase Systems (IMS'91), pages IEEE, S. Ram and V. Ramesh. Schema Integration: Past, Present, and Future. In A. Elmagarmid, M. Rusinkiewicz, and A. Sheth, editors, Management of Heterogenous and Autonomous Database Systems, pages Morgan Kaufmann Publishers, San Francisco, K. Sattler and S. Conrad. Konfliktbehandlung in einer Anfragesprache für Datenbankföderationen. In R.-D. Kutsche, U. Leser, and J.Ch. Freytag, editors, 4. Workshop Föderierte Datenbanken", Berlin November 1999 (Proceedings), pages Technische Universität Berlin, Computer Science, Report No , [Zlo77] M. M. Zloof. Query by Example: a data base language. IBM Systems Journal, 16(4): , 1977.
Schema Mapping. Dr. Armin Roth arminroth.de. Dr. Armin Roth (arminroth.de) II Schema Mapping / 23
Dr. Armin Roth arminroth.de 25.04.2013 Dr. Armin Roth (arminroth.de) II Schema Mapping 25.04.2013 1 / 23 Agenda 1 Wiederholung: Schema Matching / Integration 2 Schema Mapping Definitionen Beispiel Algorithmus
MehrSchemamerging und -mapping
Schemamerging und -mapping Seminar Informationsqualität und -integration, 30.06.2006 Überblick Schemaintegration / Einleitung Ziele Integrationskonflikte Integrationstechniken Multidatenbankanfragesprachen
MehrInformationsintegration Beispiel
Informationsintegration Beispiel 17.4.2007 Felix Naumann Informationsintegration 2 Web Service A Web Service B Federated Database Systems Amit Sheth
MehrAggregatfunktionen in der Relationenalgebra?
Aggregatfunktionen in der Relationenalgebra? Dieter Sosna Aggregatfunktionen in der Relationenalgebra p.1/23 Gliederung Motivation Begriffe Definitionen Anwendungen Zusammenfassung Aggregatfunktionen in
MehrKonfliktbehandlung in einer Anfragesprache für Datenbankföderationen
Konfliktbehandlung in einer Anfragesprache für Datenbankföderationen Kai-Uwe Sattler Stefan Conrad Institut für Technische und Betriebliche Informationssysteme Universität Magdeburg Postfach 4120, 39016
MehrSchemaSQL. 11. Multidatenbanksprachen. SchemaSQL: Beispiel-Anfragen. SchemaSQL: Beispiel
11. Multidatenbanksprachen Ziel: Globaler Zugriff auf mehrere (lokale) Datenbanken Lokale Datenbankschemata sind sichtbar. Benutzer darf eigene externe Schemata definieren. Multidatenbanksysteme (MDBS)
MehrII Heterogenität und Architekturen
II Heterogenität und Dr. Armin Roth arminroth.de 24.04.2013 Dr. Armin Roth (arminroth.de) II Heterogenität und 24.04.2013 1 / 24 Agenda 1 Semantische Heterogenität 2 Architekturparadigmen PDMS Dr. Armin
MehrSchemaSQL Eine Multidatenbank Sprache. Volodymyr Biryuk
SchemaSQL Eine Multidatenbank Sprache Volodymyr Biryuk Herausforderung Aufbau eines Multi-Datenbank-Systems (MDBS) Problem Autonomie Distribution Heterogenität Integration heterogener Datenquellen Art
MehrDaten-Definitionssprache (DDL) Bisher: Realwelt -> ERM -> Relationen-Modell -> normalisiertes Relationen-Modell. Jetzt: -> Formulierung in DDL
Daten-Definitionssprache (DDL) Bisher: Realwelt -> ERM -> Relationen-Modell -> normalisiertes Relationen-Modell Jetzt: -> Formulierung in DDL Daten-Definitionssprache (DDL) DDL ist Teil von SQL (Structured
MehrDatenbanken. Schemaerweiterung zur Abbildung von Imperfekten Daten. Andreas Merkel
Seminar Impferfektion und Datenbanken Schemaerweiterung zur Abbildung von Imperfekten Daten Andreas Merkel Inhalt Einführung - Eigenschaften des relationalen Modells - Erweiterungsmöglichkeiten Zwei unterschiedliche
MehrMasterarbeit. Anfragebearbeitung in föderierten räumlichen Datenbanksystemen
Fachgebiet Datenbanken und Informationssysteme Institut für Praktische Informatik Fakultät für Elektrotechnik und Informatik Universität Hannover Masterarbeit im Studiengang Informatik Anfragebearbeitung
MehrAlgorithmen zur Berechnung der Transitiven Hülle einer Datenbankrelation
Algorithmen zur Berechnung der Transitiven Hülle einer Datenbankrelation Daniel Reinhold Shenja Leiser 6. Februar 2006 2/28 Gliederung Einführung Transitive Hülle Definition Iterative Algorithmen 1. Naive
MehrVisualisierung in Informatik und Naturwissenschaften
Visualisierung in Informatik und Naturwissenschaften Datenbankvisualisierung Sven Bernhard 12.06.1999 Datenbankvisualisierung Datenbanktheorie in 5 Minuten Visualisierung vs. Datenbanken Visualisierung
Mehr3. Grundlagen relationaler Datenbanksysteme
3. Grundlagen relationaler Datenbanksysteme Hier nur kurze Rekapitulation, bei Bedarf nachlesen 3.1 Basiskonzepte des Relationenmodells 1 Darstellung der Miniwelt in Tabellenform (DB = Menge von Relationen
MehrFolien zum Textbuch. Kapitel 2: Planung, Entwicklung und Betrieb von IS. Teil 3: Modellierung von betrieblichen Informationssystemen
Folien zum Textbuch Kapitel 2: Planung, Entwicklung und Betrieb von IS Teil 3: Modellierung von betrieblichen Informationssystemen Textbuch-Seiten 185-208 WI Planung, Entwicklung und Betrieb von IS IS-Modellierung
MehrRelationen-Algebra. Prof. Dr. T. Kudraß 1
Relationen-Algebra Prof. Dr. T. Kudraß 1 Relationale Anfragesprachen Query Language (QL): Manipulation und Retrieval von Daten einer Datenbank Relationenmodell erlaubt einfache, mächtige Anfragesprachen
MehrInhaltsverzeichnis. 1 Einleitung 1. 2 Aufbau von Data-Warehouse-Systemen 15. Lehner, Wolfgang Datenbanktechnologie für Data-Warehouse-Systeme 2003
1 Einleitung 1 1.1 Betriebswirtschaftlicher Ursprung des Data Warehousing 2 1.2 Statistischer Ursprung des Data Warehousing 5 1.3 Fòderativer Ursprung des Data Warehousing 7 1.4 Definition eines Data-Warehouse-Systems
MehrWebbasierte Informationssysteme
SS 2004 Prof. Dr. Stefan Böttcher Universität Paderborn - SS 2004 - Prof. Dr. Stefan Böttcher Folie 1 Was ist eine relationale Datenbank? Menge von Relationen (=Tabellen) und Constraints (=Integritätsbedingungen)
MehrKapitel DB:IV (Fortsetzung)
Kapitel DB:IV (Fortsetzung) IV. Logischer Datenbankentwurf mit dem relationalen Modell Das relationale Modell Integritätsbedingungen Umsetzung ER-Schema in relationales Schema DB:IV-46 Relational Design
MehrInformationsintegration
Informationsintegration Grundlegende Architekturen Ulf Leser Inhalt diese Vorlesung Klassifikation verteilter, autonomer, heterogener Systeme Weitere Klassifikationskriterien Schichtenaufbau integrierter
Mehr5.2 Entity-Relationship-Modell
5.2 Entity-Relationship-Modell Mod-5.8 Entity-Relationship-Modell, ER-Modell (P. Chen 1976): Kalkül zur Modellierung von Aufgabenbereichen mit ihren Objekten, Eigenschaften und Beziehungen. Weitergehende
MehrDatenbanken. Prof. Jürgen Sauer. Datenbanken. Skriptum zur Vorlesung im SS 2001
Prof. Jürgen Sauer Datenbanken Skriptum zur Vorlesung im SS 2001 Inhaltsverzeichnis 1. Typologie der Datenbanksysteme 1.1 Einführung: Grenzen der herkömmlichen Datenverarbeitung 1.2 Erläuterung von Begriffen
MehrRelationale Datenbanken
Ramon A. Mata-Toledo, Pauline K. Cushman Relationale Datenbanken Schaum's Repetitorien Übersetzung aus dem Amerikanischen von G&U Technische Dokumentation GmbH Z Die Autoren 9 Vorwort 9 1 Ein Überblick
MehrStructured Query Language (SQL) als standardisierte Anfragesprache für relationale Datenbanken
Rückblick Structured Query Language (SQL) als standardisierte Anfragesprache für relationale Datenbanken Data Definition Language zur Schemadefinition (z.b. CREATE TABLE zum Anlegen von Tabellen) Data
MehrSchlüssel. Definition: Ein Schlüssel (key) einer Relation r(r) ist eine Til Teilmenge K von R, so dass für je zwei verschiedene Tupeln t 1
Schlüssel Definition: Ein Schlüssel (key) einer Relation r(r) ist eine Til Teilmenge K von R, so dass für je zwei verschiedene Tupeln t 1 und t 2 r gilt: - t 1 (K) t 2 (K) und - keine echte Teilmenge K'
Mehr4. Relationenalgebra. Einleitung. Selektion und Projektion Mengenoperatoren. Verbundoperationen (Join) Division Beispielanfragen
Einleitung 4. Relationenalgebra Selektion und Projektion Mengenoperatoren Vereinigung, Durchschnitt, Differenz kartesisches Produkt Verbundoperationen (Join) Theta-Join natürlicher Verbund Semi-Join äußerer
MehrDas relationale Datenmodell
Das relationale Datenmodell Konzepte Attribute, Relationenschemata, Datenbank-Schemata Konsistenzbedingungen Beispiel-Datenbank Seite 1 Einführung Zweck datenmäßige Darstellung von Objekten und Beziehungen
MehrDBMS für spezielle Anwendungen XML als Mittel der Datenbank-Interoperabilität
DBMS für spezielle Anwendungen XML als Mittel der Datenbank-Interoperabilität Seminarvortrag von D. Zimmermann 26-Februar-2004 Gliederung Datenbanken und Interoperabilität Begriffe Bedarf Ansätze XML als
MehrInformationsintegration I Einführung
Informationsintegration I Einführung Felix Naumann Integrierte Informationssysteme Anfrage Integriertes Informationssystem Oracle, DB2 Anwendung Dateisystem Web Service HTML Form Integriertes Info.-system
Mehr2. Relationale Datenbanken
2. Relationale Datenbanken Inhalt 2.1 Entity-Relationship-Modell 2.2 Relationales Modell 2.3 Relationale Entwurfstheorie 2.4 Relationale Algebra 2.5 Structured Query Language (SQL) 2 2.1 Entity-Relationship-Modell
MehrDatenbanken und Informationssysteme. Datenbanken und Informationssysteme
Datenbanken und Informationssysteme Wolfgang Menzel: Natürlichsprachliche Systeme (NATS) Norbert Ritter: Datenbanken und Informationssysteme (IS) NATS Ziele der Vorlesung (1) Vermittlung von Grundlagen-
MehrDatenbanken und Informationssysteme
Datenbanken und Informationssysteme Wolfgang Menzel: Natürlichsprachliche Systeme (NATS) Norbert Ritter: Datenbanken und Informationssysteme (IS) NATS Ziele der Vorlesung (1) Vermittlung von Grundlagen-
MehrDatenintegration als automatisierter Prozess
Datenintegration als automatisierter Prozess Hauptseminar Tom Schöner tom.schoener@haw-hamburg.de Department Informatik, Informatik Master 12.06.2018 1 Inhaltsübersicht Einführung Thema und Fragestellungen
MehrDatenbanken: Relationales Modell und SQL. Dr. Matthias Uflacker, Stefan Klauck 23. April 2018
Datenbanken: Relationales Modell und SQL Dr. Matthias Uflacker, Stefan Klauck 23. April 2018 Vorlesungsinhalte/-aufbau Phase 1 Einführung zu Unternehmensanwendungen (2 Vorlesungen) Grundlagen von spaltenorientierten
MehrÜberblick Felix Naumann. Zugriffsrechte Zugriffsrechte erzeugen Zugriffsrechte prüfen Zugriffsrechte vergeben Zugriffsrechte entziehen
Datenbanksysteme I Zugriffskontrolle (kleiner Einschub) 18.1.2007 Felix Naumann Überblick 2 Zugriffsrechte Zugriffsrechte erzeugen Zugriffsrechte prüfen Zugriffsrechte vergeben Zugriffsrechte entziehen
Mehr1. Einführung Seite 1. Kapitel 1: Einführung
1. Einführung Seite 1 Kapitel 1: Einführung 1. Einführung Seite 2 Willkommen! Studierenden-Datenbank Hans Eifrig hat die Matrikelnummer 1223. Seine Adresse ist Seeweg 20. Er ist im zweiten Semester. Lisa
MehrEinführung in die Informatik II
Einführung in die Informatik II Relationale Datenbanken und SQL Theorie und Anwendung Prof. Dr. Nikolaus Wulff Gründe für eine Datenbank Meist werden Daten nicht in XML-Dokumenten, sondern innerhalb einer
MehrTeil II: Architektur eines Data-Warehouse-Systems... 57
O:/Wiley/Reihe_Dummies/9783527714476_Gerken/3d/ftoc.3d from 08.08.2018 14:02:02 Auf einen Blick Einleitung... 19 Teil I: Was ist ein Data Warehouse?... 25 Kapitel 1: Ein Beispiel zur Einführung..... 27
Mehr7. XML-Datenbanksysteme und SQL/XML
7. XML-Datenbanksysteme und SQL/XML Native XML-DBS vs. XML-Erweiterungen von ORDBS Speicherung von XML-Dokumenten Speicherung von XML-Dokumenten als Ganzes Generische Dekomposition von XML-Dokumenten Schemabasierte
MehrData Lakes: Lösung oder neue Herausforderung für Data-Integration
Data Lakes: Lösung oder neue Herausforderung für Big-Data Data-Integration Integration? PD Dr. Christoph Quix Fraunhofer-Institut für Angewandte Informationstechnik FIT Life Science Informatics Abteilungsleiter
MehrVorlesung Wissensentdeckung in Datenbanken
Vorlesung Wissensentdeckung in Datenbanken Data Cube Katharina Morik, Uwe Ligges Informatik LS 8 22.04.2010 1 von 26 Gliederung 1 Einführung 2 Aggregation in SQL, GROUP BY 3 Probleme mit GROUP BY 4 Der
MehrDatenbanken. Seminararbeit. Einführung in das wissenschaftliche Arbeiten
Seminararbeit vorgelegt von: Gutachter: Studienbereich: Christian Lechner Dr. Georg Moser Informatik Datum: 6. Juni 2013 Inhaltsverzeichnis Inhaltsverzeichnis 1 Einführung in Datenbanken 1 1.1 Motivation....................................
MehrVorlesung Wissensentdeckung in Datenbanken
Gliederung Vorlesung Wissensentdeckung in Datenbanken Data Cube Katharina Morik, Claus Weihs 14.07.2009 1 Einführung 2 Aggregation in SQL, GROUP BY 3 Probleme mit GROUP BY 4 Der Cube-Operator 5 Implementierung
MehrAufgabe 9.1: Lösung: Block-Nested-Loop-Verbund Index-Nested-Loop-Verbund Sort-Merge-Verbund Hash-Verbund
1 Aufgabe 9.1: Sei p die Größe einer Seite, hier p = 4 kb. Sei b die Größe eines Blocks in Anzahl Seiten, hier b = 100. Die Größe des Datenbankpuffers, d.h. die zur Ausführung des Verbundes im Internspeicher
MehrIntegration, Migration und Evolution
14. Mai 2013 Programm für heute 1 2 Quelle Das Material zu diesem Kapitel stammt aus der Vorlesung Datenintegration & Datenherkunft der Universität Tübingen gehalten von Melanie Herschel im WS 2010/11.
MehrFUSE BY: Syntax und Semantik zur Informationsfusion in SQL
FUSE BY: Syntax und Semantik zur Informationsfusion in SQL Jens Bleiholder, Felix Naumann Humboldt-Universität zu Berlin {bleiho,naumann}@informatik.hu-berlin.de Abstract: Daten und Informationen heterogener
MehrUniversität Augsburg, Institut für Informatik WS 2009/2010 Prof. Dr. W. Kießling 06. Nov Dr. A. Huhn, F. Wenzel, M. Endres Lösungsblatt 2
Universität Augsburg, Institut für Informatik WS 2009/2010 Prof. Dr. W. Kießling 06. Nov. 2009 Dr. A. Huhn, F. Wenzel, M. Endres Lösungsblatt 2 Aufgabe 1: ER-Modellierung 1. Siehe Unterstreichungen in
MehrDas relationale Modell (Teil 1)
Vorlesung #2 Das relationale Modell (Teil 1) Fahrplan WS 2010/11 Feedback Vorlesung#1 Das relationale Modell Einordnung (wir überspringen die Modellierung, das kommt im 4. Semester Datenmanagement ) Definition,
MehrKapitel 1: Einführung 1.1 Datenbanken?
Kapitel 1: Einführung 1.1 Datenbanken? 1. Einführung 1.1. Datenbanken Grundlagen der Datenbanksysteme, WS 2012/13 29. Oktober 2012 Seite 1 1. Einführung 1.1. Datenbanken Willkommen! Studierenden-Datenbank
Mehr4. Objektrelationales Typsystem Kollektionstypen. Nested Table
Nested Table Bei einer Nested Table handelt es sich um eine Tabelle als Attributwert. Im Gegensatz zu Varray gibt es keine Beschränkung bei der Größe. Definition erfolgt auf einem Basistyp, als Basistypen
MehrKlausur Objektorientierte Datenbanken WS 2004/2005
Klausur Objektorientierte Datenbanken WS 2004/2005 Hinweise: Iwanowski 16.02.2005 Bearbeitungszeit: 60 Minuten Erlaubte Hilfsmittel: im Anhang, sonst keine Diese Klausur besteht aus 9 Aufgaben (Seiten
Mehr2. Architektur verteilter Datenbanksysteme
2. Architektur verteilter Datenbanksysteme Verteilte Datenbank, kurz DDB (engl. distributed database): eine Sammlung logisch zusammengehöriger Datenbanken, welche über Rechnerknoten ( Sites ) verteilt
MehrSQL. SQL: Structured Query Language. Früherer Name: SEQUEL. Standardisierte Anfragesprache für relationale DBMS: SQL-89, SQL-92, SQL-99
SQL Früherer Name: SEQUEL SQL: Structured Query Language Standardisierte Anfragesprache für relationale DBMS: SQL-89, SQL-92, SQL-99 SQL ist eine deklarative Anfragesprache Teile von SQL Vier große Teile:
MehrGrundlagen des relationalen Modells
Historische Entwicklung relationaler DBMS Grundlagen des relationalen Modells Seien D 1, D 2,..., D n Domänen (~Wertebereiche) Relation: R D 1 x... x D n Bsp.: Telefonbuch string x string x integer Tupel:
MehrKapitel 1: Einführung 1.1 Datenbanken?
1. Einführung 1.1. Datenbanken? Seite 1 Kapitel 1: Einführung 1.1 Datenbanken? 1. Einführung 1.1. Datenbanken? Seite 2 Willkommen! Studierenden-Datenbank Hans Eifrig hat die Matrikelnummer 1223. Seine
MehrAutomatisiertes Auffinden von Präfix- und Suffix-Inklusionsabhängigkeiten in relationalen Datenbankmanagementsystemen
Automatisiertes Auffinden von Präfix- und Suffix-Inklusionsabhängigkeiten in relationalen Datenbankmanagementsystemen Exposé für eine Diplomarbeit Jan Hegewald Betreut von Jana Bauckmann 7. März 2007 1
MehrEinsatz und Realisierung von Datenbanken. Prof. Alfons Kemper Lehrstuhl für Informatik III: Datenbanksysteme
Einsatz und Realisierung von Datenbanken Prof. Alfons Kemper Lehrstuhl für Informatik III: Datenbanksysteme kemper@in.tum.de Primärliteratur: Datenbanksysteme: Eine Einführung Alfons Kemper und Andre
MehrB*-BÄUME. Ein Index ist seinerseits wieder nichts anderes als eine Datei mit unpinned Records.
B*-Bäume 1 B*-BÄUME Beobachtung: Ein Index ist seinerseits wieder nichts anderes als eine Datei mit unpinned Records. Es gibt keinen Grund, warum man nicht einen Index über einem Index haben sollte, und
MehrDatenbankentwicklung
Datenbankentwicklung Berechnung und Präsentation von Daten Organisation der Daten in alleinstehende Tabellen Exklusiver Zugriff auf alle Informationen einer Tabelle Beschränkte Anzahl von Daten pro Tabellenblatt
MehrObjektorientierte Analyse (OOA) OOA-Pattern
OOA-Muster (Architektur Pattern) Ein Pattern (Entwurfsmuster) ist ein Problem mit seiner Lösung in einem Kontext. Der Kontext enthält in der Regel Zielkonflikte, die der Designer lösen muss, z.b. Performance
MehrEinsatz und Realisierung von Datenbanken. Prof. Alfons Kemper Lehrstuhl für Informatik III: Datenbanksysteme
Einsatz und Realisierung von Datenbanken Prof. Alfons Kemper Lehrstuhl für Informatik III: Datenbanksysteme kemper@in.tum.de Primärliteratur: Datenbanksysteme: Eine Einführung Alfons Kemper und Andre
MehrGrundlagen von Datenbanken
Agenda: Grundlagen von Datenbanken SS 2010 3. Relationale Algebra Prof. Dr. Stefan Böttcher Universität Paderborn mit Material von Prof. Dr. Gregor Engels Grundlagen von Datenbanken - SS 2010 - Prof. Dr.
MehrEin XML Dokument zeichnet sich im Wesentlichen durch seine baumartige Struktur aus:
RDF in wissenschaftlichen Bibliotheken 5HWULHYDODXI5') Momentan existiert noch keine standardisierte Anfragesprache für RDF Dokumente. Auf Grund der existierenden XML Repräsentation von RDF liegt es jedoch
MehrLogische Optimierung. Im Allgemeinen wird keine optimale Lösung erzielt, sondern nur eine Verbesserung. Logische Optimierung
Logische Optimierung Höhere, nichtprozedurale Abfragesprachen (SQL, QBE,...) verlangen keine Kenntnisse des Benutzers über die Implementierung, müssen aber in prozedurale Form (z. B. Relationenalgebra)
MehrKapitel DB:IV (Fortsetzung)
Kapitel DB:IV (Fortsetzung) IV. Logischer Datenbankentwurf mit dem relationalen Modell Das relationale Modell Integritätsbedingungen Umsetzung ER-Schema in relationales Schema DB:IV-45 Relational Design
MehrDas konzeptionelle Datenmodell
Das konzeptionelle Datenmodell Signifikanz der Datenmodellierung Anforderungsanalyse Effizienz der Anwendung. Redundanzfreiheit. Datenintegrität. Reibungsarme Umsetzung des Datenmodells in das physikalische
MehrInformationsintegration
Informationsintegration Schemaintegration Ulf Leser Wissensmanagement in der Bioinformatik Richtung Schemaintegration versus Anfragebearbeitung FDBS Schema integration Data source Data source Data source
MehrAbbildungen zwischen Schemata unterschiedlicher Datenmodelle
Abbildungen zwischen Schemata unterschiedlicher Datenmodelle Mastering the Information Explosion - Information Integration and Information Quality Susanne Braun 07.07.2006 1 Inhalt 1.Motivation 2.Die 5-Ebenen-Schema-Architektur
MehrData Cubes PG Wissensmangement Seminarphase
PG 402 - Wissensmangement Seminarphase 23.10.2001-25.10.2001 Hanna Köpcke Lehrstuhl für Künstliche Intelligenz Universität Dortmund Übersicht 1. Einführung 2. Aggregation in SQL, GROUP BY 3. Probleme mit
MehrTechniken des Data Merging in Integrationssystemen
Techniken des Data Merging in Integrationssystemen Jens Bleiholder Humboldt-Universität zu Berlin, Institut für Informatik bleiho@informatik.hu-berlin.de Zusammenfassung Die Integration von Daten aus heterogenen
MehrGraph-basierte Modellierung in Software-Werkzeugen
Graph-basierte Modellierung in Software-Werkzeugen 1 Inhalt Einleitung Modellierung mit Graphen Modellierung mit Graphklassen (Schemata und Constraints) Implementation von Graphen (Algorithmen und Anfragen)
MehrDas diesem Dokument zugrundeliegende Vorhaben wurde mit Mitteln des Bundesministeriums für Bildung und Forschung unter dem Förderkennzeichen
Das diesem Dokument zugrundeliegende Vorhaben wurde mit Mitteln des Bundesministeriums für Bildung und Forschung unter dem Förderkennzeichen 16OH21005 gefördert. Die Verantwortung für den Inhalt dieser
MehrInformatik II: Modellierung Prof. Dr. Martin Glinz. Kapitel 13. Metamodelle. Universität Zürich Institut für Informatik
Informatik II: Modellierung Prof. Dr. Martin Glinz Kapitel 13 Metamodelle Universität Zürich Institut für Informatik Inhalt 13.1 Grundlagen und Motivation 13.2 Ontologische Metamodelle 13.3 Linguistische
MehrKapitel 3: Entity-Relationship-Modell
Kapitel 3: Entity-Relationship-Modell Objekte und Beziehungen Objekte bilden die elementare Grundlage unserer Betrachtung. Objekte werden durch Tupel in Relationen repräsentiert und können durch Schlüsselwerte
Mehr8 Schlussfolgerungen
112 8 Schlussfolgerungen Die Zielsetzung der vorliegenden Arbeit wurde mit der Erstellung eines Referenzmodells als Vorschlag der Datenorganisation für den Bereich der Milcherzeugung unter Anwendung eines
MehrDomänen: Grundtypen, alle vordefiniert, z.b. INTEGER ~ integer NUMERIC (p,s) p: precision, s: scale (nach,) etc.
Kapitel 6 Relationale DB-Sprache SQL SEQUEL: Structured English Query Language, 70er Jahre SQL: System R, SQL/DS, TransBase, Oracle... ANSI Standards 1, 2, 3 6.1 Daten-Definitionssprache DDL Domänen: Grundtypen,
MehrGeoinformation Abbildung auf Tabellen
Folie 1 von 32 Geoinformation Abbildung auf Tabellen Folie 2 von 32 Abbildung auf Tabellen Übersicht Motivation des relationalen Datenmodells Von Objekten zu Tabellen Abbildung von Objekten Schlüssel Abbildung
MehrMedizininformatik Software Engineering
Vorlesung Software Engineering Inhaltsverzeichnis 1. Einleitung 2. Software und Medizinprodukt 3. Vorgehensmodelle 4. Strukturierter Entwurf von Echtzeitsystemen 4.1 Echzeit, was ist das? 4.2 Einführung
MehrInhalt. " DiaGen Historie und Beschreibung. " Architektur eines DiaGen-Editors. " Hypergraphen. " DiaGen-Editoren Komponenten
DIAGEN Sven Goeckels Seminar : Visuelle Sprachen Universität Bremen FB Informatik WS 2001/2002 Inhalt " DiaGen Historie und Beschreibung " " Hypergraphen " DiaGen-Editoren Komponenten? Modeler? Reducer?
MehrDATAFUSION IM MILCHVIEHSTALL
Forschen und Prüfen für die Landwirtschaft Josephinum Research DATAFUSION IM MILCHVIEHSTALL Smart Farming und Nachhaltigkeit: Chancen und Herausforderungen 4. Agroscope-Nachhaltigkeitstagung Franz Handler,
MehrExtraktion, Transformation, Laden (ETL)
Extraktion, Transformation, Laden (ETL) ETL-Prozeß Integrationsschritte Integrationsprobleme Konflikte und deren Klassifikation Behebung von Konflikten Data Cleaning Vorlesung Data-Warehouse-Technologien
MehrRelationales Datenbanksystem Oracle
Relationales Datenbanksystem Oracle 1 Relationales Modell Im relationalen Modell wird ein relationales Datenbankschema wie folgt beschrieben: RS = R 1 X 1 SC 1... R n X n SC n SC a a : i=1...n X i B Information
MehrKonzeptueller Entwurf
Konzeptueller Entwurf UML Klassendiagrame UML Assoziationen Entspricht Beziehungen Optional: Assoziationsnamen Leserichtung ( oder ), sonst bidirektional Rollennamen Kardinalitätsrestriktionen UML Kardinalitätsrestriktionen
MehrSemantische Datenintegration: Strategien zur Integration von Datenbanken
Semantische Datenintegration: Strategien zur Integration von Datenbanken Inhalt 1. Wiederholung Integrationskonflikte 2. Klassische Strategien zur Integration 1. Eng gekoppelte Ansätze 2. Lose gekoppelte
MehrMathematische Grundlagen
Mathematische rundlagen raphen und Operationen auf raphen Karin Haenelt 1 raphen Definitionen Operationen auf raphen raph-repräsentationen 2 Vorbemerkung Wenn hier von Knoten und Kanten gesprochen wird,
MehrExtraktion, Transformation, Laden (ETL)
Extraktion, Transformation, Laden (ETL) ETL-Prozeß Integrationsschritte Integrationsprobleme fi Konflikte und deren Klassifikation fi Behebung von Konflikten Data Cleaning VL Data Warehouses, WS 2000/2001
MehrDieser Foliensatz darf frei verwendet werden unter der Bedingung, dass diese Titelfolie nicht entfernt wird.
Thomas Studer Relationale Datenbanken: Von den theoretischen Grundlagen zu Anwendungen mit PostgreSQL Springer, 2016 ISBN 978-3-662-46570-7 Dieser Foliensatz darf frei verwendet werden unter der Bedingung,
MehrE-R-Modell zu Relationenschema
Raum: LF 230 Nächste Sitzung: 27./30. Oktober 2003 Aktuelle Informationen unter: http://www.is.informatik.uni-duisburg.de/teaching/lectures/dbp_ws03/index.html E-R-Modell zu Relationenschema Als zweiter
MehrADDISON-WESLEY PUBLISHING COMPANY
Jens-Peter Redlich CORBA 2.0 Praktische Einführung für C++ und Java Mit einem Geleitwort von Richard Mark Soley ADDISON-WESLEY PUBLISHING COMPANY Bonn Reading, Massachusetts Menlo Park, California New
MehrDatenbanken 1 Datenbanken SPO 2014 SPO 2007 Belegnummer Belegnummer
Datenbanken 1 Datenbanken SPO 2014 SPO 2007 Belegnummer 30.7312 Belegnummer 30.7302 Wintersemester 2017/18 (Bachelor) Materialien zur Vorlesung Inge Hochschule Darmstadt Fachbereich Informatik Motivation
MehrWintersemester 2016/ Matrikelnummer: Hinweise. Unterschrift
Fachbereich für Computerwissenschaften Prof. Dr. Nikolaus Augsten Jakob-Haringer-Str. 2 5020 Salzburg, Austria Telefon: +43 662 8044 6347 E-Mail: nikolaus.augsten@sbg.ac.at Datenbanken II Prüfung Wintersemester
MehrInnovationslabor Semantische Integration von Webdaten
Innovationslabor Semantische Integration von Webdaten Workflow-basierte Datenintegration und Objekt-Matching Dr. Andreas Thor http://dbs.uni-leipzig.de/format Workflow-basierte Datenintegration Ausgangspunkt
MehrGrundlagen zu Datenbanken zu Beginn der Jgst. 13
Grundlagen zu Datenbanken zu Beginn der Jgst. 13 Bereits bei der Planung einer Datenbank muss der Datenbankentwickler darauf achten, Nachteile für das spätere System zu vermeiden. Die Strukturen müssen
MehrAktuelles Schlagwort Semi-strukturierte Daten
Aktuelles Schlagwort Semi-strukturierte Daten François Bry, Michael Kraus, Dan Olteanu und Sebastian Schaffert Institut für Informatik, Universität München, Oettingenstraße 67, 80538 München, http://www.pms.informatik.uni-muenchen.de
MehrRelationale Datenbanken und SQL
Günter Matthiessen, Michael Unterstein Relationale Datenbanken und SQL Konzepte der Entwicklung und Anwendung yy ADDISON-WESLEY An imprint of Pearson Education München Boston San Francisco Harlow, England
Mehr