werden lokalen Schemaelemente restrukturiert und durch eine Betrachtung der Daten iterativ verfeinert. Die Bestimmung der Konfliktfreiheit der Daten k

Größe: px
Ab Seite anzeigen:

Download "werden lokalen Schemaelemente restrukturiert und durch eine Betrachtung der Daten iterativ verfeinert. Die Bestimmung der Konfliktfreiheit der Daten k"

Transkript

1 Werkzeugunterstützung für die visuelle Integration heterogener Datenbestände Ingolf Geist Otto von Guericke Universität Magdeburg Institut für Technische und Betriebliche Informationssysteme Postfach 4120, D Magdeburg, Germany geist@iti.cs.uni-magdeburg.de Zusammenfassung Während der Integration von heterogenen Datenbeständen müssen Heterogenitäten auf verschiedenen Ebenen aufgelöst werden, wobei Integrationskonflikte sowohl auf der Schemaebene als auch auf der Datenebene vorhanden sind. Somit wird für einen vollständigen Entwurf eine Behandlung von Schema und Datenkonflikten benötigt. Diese Arbeit stellt das Werkzeug VIbE vor, das aufbauend auf den Möglichkeiten der Multidatenbanksprache FraQL die Schemaintegration um die Behandlung von Datenkonflikten erweitert. Dieser Prozeß der Instanzkonfliktbehandlung wird hierbei als ein datenorientierter, interaktiver und iterativer Vorgang beschrieben, der durch die Visualisierung der Operationen, Daten und Konflikte unterstützt wird. 1 Einführung Die Integration heterogener Datenbestände ist immer noch ein aktuelles Problem. Hierbei existieren verschiedene Ansätze der Integration: virtuelle Integration mit Multidatenbanksprachen oder Föderierte Datenbanksystemen bzw. mediatorbasierte System oder physische Integration in einem Data Warehouse. In allen Fällen ist eine Integration der Schemata und der aktuell vorhandenen Instanzen notwendig. Einen Überblick über Konzepte und Verfahren zur Integration von Schemata wurden u.a. in den Arbeiten [BLN86] oder [Con97] gegeben. Diese Methoden beschäftigen sich mit der Restrukturierung und Abbildung lokaler Schemata in föderiertes Schema. Hierbei werden die verschiedenen Schemakonflikte gelöst, die aufgrund der Heterogenität der lokalen Komponentensysteme entstehen. Die Instanzintegration hingegen beschäftigt sich mit tatsächlich existierenden Dateninstanzen und versucht diese in das globale Schema zu integrieren. Ansätze zur Instanzintegration sind u.a. in [RR98] beschrieben. Hierfür müssen zwei Aufgaben gelöst werden: die Abbildung semantisch äquivalenter Datenbankobjekte zueinander und die Auflösung von Attributwertkonflikten. Die Attributwertkonflikte äußern sichinunterschiedlichen Werten in korrespondierenden Attributen semantisch äquivalenter Tupel und können durch unterschiedliche Repräsentationen oder Dateninkonsistenzen entstanden sein. Der Prozeß dieser Instanzintegration geht dabei von einem globalen Schema aus, das durch eine Schemaintegrationsmethode oder durch einen Top Down Entwurf erzeugt wurde, und erstellt eine Abbildung der lokalen Elemente auf das globale Schema. Während dieser Abbildung

2 werden lokalen Schemaelemente restrukturiert und durch eine Betrachtung der Daten iterativ verfeinert. Die Bestimmung der Konfliktfreiheit der Daten kann nur interakiv mit dem semantischen Hintergrundwissen des Entwerfers der Föderation erfolgen. Aufbauend auf diesen Überlegungen soll ein Werkzeug geschaffen werden, das die Schemaintegration um die Behandlung von Instanzkonflikten erweitert. Dieses Werkzeug muß einen Lese Zugriff auf die verschiedenen lokalen Datenquellen ermöglichen und Operationen zur Auflösung von Integrationskonflikten anbieten, welche abgeschlossen und orthogonal sind. Weiterhin ist eine Visualisierung dieser Operationen und der Daten sowie der auftretenden Konflikte notwendig. 2 Integration mit FraQL Eine Multidatenbanksprache kann die Grundlage für den erwähnten Ablauf des Prozesses bilden, da sie die notwendigen Operationen zur Restrukurierung der Typen und der Datenwerte mitbringt. In unserem Fall wurde die Multidatenbanksprache FraQL [SC99] gewählt, die eine Erweiterung von SQL darstellt. Diese Sprache ist als ein Teil eines föderierten Anfragesystems implementiert und kann über Adapter auf verschiedene Komponentensysteme zugreifen. Diese Adapter verbergen die System und Datenmodellheterogenität, indem sie die Daten der Datenquellen mit Hilfe von objektrelationalen Schemata darstellen. Das globale Schema FraQL besteht aus Objekttypen und globalen Relationen, die in Import und Integrationsrelationen unterschieden werden. Die Struktur der globalen Daten werden durch Objekttypen beschrieben, die aus einer Menge von Attributen mit ihren Wertebereichen bestehen. Diese Typen sind in einer Spezialisierungshierarchie organisiert. Eine Importrelation stellt eine Projektion auf einer lokalen Relation aus einem Komponentensystem dar und repräsentiert somit deren Daten auf der globalen Schicht. Für ihre Definition muß der globale Typ, die lokale Relation und eine eventuell nötige Abbildung der lokalen Attribute auf die globalen Attribute angegeben werden. Hierbei können zur Anpassung der Repräsentationen Umbenennungen sowie nutzerdefinierte Funktion und Abbildungstabellen benutzt werden. Somit lösen die Importrelationen Beschreibungskonflikte. Die weitere Integration erfolgt durch Integrationsrelationen, die Sichten auf globale Relationen sind, die mit Hilfe der Operationen von FraQL aufgebaut wurden. Hierbei unterstützt FraQL erweiterte Join bzw. Union Operationen sowie die Verwendung von Metadaten in Anfragen und die Standardoperationen von SQL. Dadurch können neben strukturellen und semantischen Konflikten auch Instanzkonflikte behandelt werden. Unterschiedlich vertikal partionierte korrespondierende Relationen stellen einen strukturellen Konflikt dar, der mit Hilfe der Verbundoperationen Join und OuterJoin gelöst werden kann. Hierbei erweitert FraQL diese Operatoren um die Angabe einer nutzerdefinierten Funktion in der reconciled by Klausel, die eine Auflösung von Datenkonflikten in gemeinsamen Nichtschlüselattributen ermöglicht. Bei Konflikten in den Schlüsselwerten muß entweder in der ON Klausel die Verbundbedinung verfeinert oder Beschreibungskonflikte in den Importrelationen gelöst werden. Die Vereinigungsoperation behandelt semantisch überlappende Relatione, wobei wiederum die Aufgaben der Tupelidentifikation und der Attributwertkonflikte auf der Datenebene existieren. In der On Klausel sind die Schlüsselattribute der Relationen anzugeben, hierbei muß der gemeinsame Schlüssel der beiden Relationen gefunden werden, um eine eindeutige Zuordnung der Tupel zu erreichen. Eine nutzerdefinierte Funktion behandelt Konflikte in Nichtschlüsselattribute. Sie wird äquivalent zu den Verbundoperationen in der reconciled by Klausel der

3 Operation angegeben. Eine weitere Art von Konflikte sind die Metadatenkonflikte. Diese äußern sich darin, daß korrespondierende Elemente einmal als Metadaten, zum Beispiel Attributnamen, modelliert sind und in einem zweiten Schema als Datenwerte. Dieser Umstand wurde u.a. in [KLK91] beschrieben. Zur Auflösung dieser Konflikte erlaubt FraQL die Nutzung von Metadaten in Anfragen und Variablensubstitution, die eine Abbildung von Metadaten in Datenwerte ermöglicht. Weitere strukturelle Konflikte und Möglichkeiten ihrer Auflösung sind in [KCGS95] beschrieben. Zusammenfassend ist zu sagen, daß FraQL die Grundlage für ein Entwurfswerkzeug zur Unterstützung der Instanzintegration liefert. Die Sprache ermöglicht einerseits die Restrukturierung der Schemata und zweitens die Lösung von Datenkonflikten, dabei sind ihre Operationen abgeschlossen und orthogonal. Weiterhin können die Integrationsschritte sofort durch die Ausführung der Anfrage ausgwertet werden. 3 Visuelle Integration Aufbauend auf den Möglichkeiten von FraQL wurde das visuelle Anfragewerkzeug VIbE geschaffen, daß einen interaktiven und iterativen Prozeß zur Unterstützung der Auflösung von Instanzkonflikten ermöglicht. Zunächst ist der Ausgangspunkt das bestehende globale Schema, das durch eine Schemaintegrationsmethode oder durch ein Top Down Verfahren erstellt wurde. Die Exportschemata der Datenquellen liefert die Multidatenbanksprache in einer objektrelationalen Form. Der Zugriff von VIbE auf FraQL erfolgt über die JDBC Schnittstelle, für die ein Treiber zur Verfügung steht. Das Ziel des Prozesses ist die Integration der Schemata und der Instanzen, für dessen Erreichung Heterogenitäten auf der Schema und Datenebene erkannt und aufgelöst werden müssen. Als Ausgangsidee der Visualisierung des Prozesses dient der Integrationsgraph. Dieser azyklische und gerichtete Graph beschreibt den Ablauf der Abbildung von lokalen Relationen auf die globale Relationen. Die Knoten stellen dabei die Relationen, Import und Integrationsrelationen, dar. Die Kanten zeigen, welche Relationen zum Aufbau einer Integrationsrelation benutzt wurden. Hierbei kann eine Relationen mehrere Relationen zum Aufbau benutzen bzw. von mehreren benötigt werden. Als Operationen zum Aufbau des Graphen sind zunächst die Erstellung einer Importrelation und die Erstellung einer Integrationsrelation zu nennen. Die Eingabe und Darstellung der Parameter der Operationen erfolgt durch Formulare. Bevor Integrationsrelationen erstellt werden können, ist die Erstellung von Importrelationen notwendig. Diese Erzeugung geschieht in drei Schritten: erstens Auswahl der globalen Relation (Name und Typ), zweitens Auswahl der lokalen Relation und drittens die Spezifizierung der Abbildung der Typen. Diese Zuordnung ist in der Abbildung 1 zu sehen. Diese Zuordnung geschieht durch das Zeichnen von Linien zwischen den korrespondierenden Attributen. Den Verbindungen können optional Umrechnungsfunktionen oder Abbildungstabellen hinzugefügt werden, um die verschiedene Repräsentationen der Attributwerte zu homogenisieren, aber am Beginn des Prozesses können nur offensichtliche Konflikte erkannt werden und die Abbildung muß während der Integration weiter verfeinert werden. Sind die ersten Relationen importiert, ist die Erstellung von Integrationsrelationen in dem Graphen möglich. Ein Integrationsbaum repräsentiert dabei die Sichtdefinition und zeigt damit die schrittweise Integration der Relation. Diese Darstellung ist eine Detaildarstellung des Integrationsgraphen. Die Knoten des Baumes repräsentieren globale Relationen oder Operatio-

4 Abbildung 1: Abbildung Import einer Relation nen, deren Ergebnisse ebenfalls Relationen sind. Die Kanten im Baum zeigen den Verlauf der Restrukturierung und Transformation der Daten. Die einzelnen Operationsknoten werden mit Hilfe von Formularen spezifiziert, die an die Konzepte von Query by Example [Zlo77] angelehnt sind. Als verschiedene Operationen wurden zunächst die Projektion und Selektion, der Verbund, die Vereinigung und die Metadatenbehandlung definiert. Diese Operationen benötigen eine bzw. zwei Relationen als Eingabe und liefern eine Relation als Ergebnis. Somit kann die Restrukturierung schrittweise vom Benutzer erstellt und dadurchkomplexe Integrationskonflikte in einfachere Teilprobleme aufgeteilt werden. Nachdem die Operationen spezifiziert wurden, kann eine iterative Verfeinerung stattfinden, indem die Anfrage der Operation von FraQL ausgeführt wird, die Daten analysiert werden und anschließend die Parameter der Operation angepaßt werden. Hierbei ist die Erkennung der Konflikte auf der Instanzebene wichtig, wobei im ersten Schritt die Schlüsselwerte zu betrachten sind. Eine nicht vollständige Zuordnung der Tupel kann bei bekannten extensionalen Beziehungen aus den Kardinalitäten der Ergebnisrelationen und der Ausgangsrelationen erkannt werden. Aus der Ansicht der Daten erstellt der Benutzer die geeigenete Lösung durch die Veränderung der Operationen in einem interaktive und iterativen Vorgang. Hierbei besteht die Möglichkeit der Anpassung der der benutzten Importrelationen, um einen Beschreibungkonflikt zu lösen oder die Änderung der Verbundbedingung bzw. der Vereinigungsoperation. Nach der eindeutigen Zuordnung der Tupel ist es möglich Konflikte in den Werten der Nichtschlüsselattributen zu erkennen und zu lösen. Dafür wird dem Benutzer eine Konfliktansicht gezeigt, mit dessen Hilfe er die Konflikte nach einer Join oder Union Operation erkennen kann. Diese Ansicht wird durch einen Verbund erzeugt und korrespondierende Attribute in einander zugeordneten Tupeln, die unterschiedliche Werte aufweisen, werden hervorgehoben. Hierdurch erkennt der Benutzer die Konflikte und kann zu den entsprechenden Werten in der Ergebnisrelation navigieren. Als Auflösungsmöglichkeit wird kann die Angabe einer Auflösungsfunktion in der Join oder Union Operation erfolgen, die durch den Benutzer in Java zu implementieren ist. Am Ende des Integrationsprozesses liegen die Abbildungsdaten im Katalog von FraQL und die globalen Anwendungen können die entstandenen Sichten nutzen.

5 4 Zusammenfasssung und Ausblick In dieser Arbeit wurde eine Möglichkeit beschrieben wie ein Werkzeug zur Unterstützung der Instanzintegration aussehen kann. Hierbei wird die Schemaintegration durch einen interaktiven und iterativen Prozeß ergänzt. Der Prototyp VIbE stellt mit der Multidatenbanksprache FraQL einen ersten Schritt für die Unterstützung der Instanzintegration dar. Zur Verbesserung der Interaktionsmöglichkeiten müssen einmal eine bessere Visualisierung geschaffen und ein stärkere Automatisierung implementiert werden. Als Erweiterungen sind Datenfehlererkennungsverfahren oder eine automatische Berechnung von Abbildungsfunktionen in bestimmten Fällen denkbar. Weiterhin ist durch eine Nutzung von Samplingmethoden eine Verbesserung der Interaktion und der Darstellung der Konflikte möglich. Hierbei arbeitet der Benutzer auf Samples der eigentlichen Daten und erreicht dort die Konfliktlösung, die anschließend auf die gesamte Menge angewendet und damit überprüft werden kann. Somit ist eine beispielgetrieben Integrationsmethode zur Unterstützung der Instanzkonflikte während des Entwurfes eines förderierten Systems möglich. Literatur [BLN86] [Con97] C Batini, M. Lenzerini, and S. B. Navathe. A Comparative Analysis of Methologies for Database Schema Integration. ACM Computing Surveys, 18(4): , December S. Conrad. Föderierte Datenbanksysteme: Konzepte der Datenintegration. Springer- Verlag, Berlin/Heidelberg, [KCGS95] W. Kim, I. Choi, S. Gala, and M. Scheevel. On Resolving Schematic Heterogeneity in Multidatabase Systems. pages ACM Press/ Addison Wesley Publishing, [KLK91] [RR98] [SC99] R. Krishnamurthy, W. Litwin, and W. Kent. Interoperability of Heterogenous Databases with Schematic Discrepancies. In Y. Kambayashi, M. Rusinkiewicz, and A. Sheth, editors, Proc. First Interational Workshop on Interoperability in Multidatabase Systems (IMS'91), pages IEEE, S. Ram and V. Ramesh. Schema Integration: Past, Present, and Future. In A. Elmagarmid, M. Rusinkiewicz, and A. Sheth, editors, Management of Heterogenous and Autonomous Database Systems, pages Morgan Kaufmann Publishers, San Francisco, K. Sattler and S. Conrad. Konfliktbehandlung in einer Anfragesprache für Datenbankföderationen. In R.-D. Kutsche, U. Leser, and J.Ch. Freytag, editors, 4. Workshop Föderierte Datenbanken", Berlin November 1999 (Proceedings), pages Technische Universität Berlin, Computer Science, Report No , [Zlo77] M. M. Zloof. Query by Example: a data base language. IBM Systems Journal, 16(4): , 1977.

Schema Mapping. Dr. Armin Roth arminroth.de. Dr. Armin Roth (arminroth.de) II Schema Mapping / 23

Schema Mapping. Dr. Armin Roth arminroth.de. Dr. Armin Roth (arminroth.de) II Schema Mapping / 23 Dr. Armin Roth arminroth.de 25.04.2013 Dr. Armin Roth (arminroth.de) II Schema Mapping 25.04.2013 1 / 23 Agenda 1 Wiederholung: Schema Matching / Integration 2 Schema Mapping Definitionen Beispiel Algorithmus

Mehr

Schemamerging und -mapping

Schemamerging und -mapping Schemamerging und -mapping Seminar Informationsqualität und -integration, 30.06.2006 Überblick Schemaintegration / Einleitung Ziele Integrationskonflikte Integrationstechniken Multidatenbankanfragesprachen

Mehr

Informationsintegration Beispiel

Informationsintegration Beispiel Informationsintegration Beispiel 17.4.2007 Felix Naumann Informationsintegration 2 Web Service A Web Service B Federated Database Systems Amit Sheth

Mehr

Aggregatfunktionen in der Relationenalgebra?

Aggregatfunktionen in der Relationenalgebra? Aggregatfunktionen in der Relationenalgebra? Dieter Sosna Aggregatfunktionen in der Relationenalgebra p.1/23 Gliederung Motivation Begriffe Definitionen Anwendungen Zusammenfassung Aggregatfunktionen in

Mehr

Konfliktbehandlung in einer Anfragesprache für Datenbankföderationen

Konfliktbehandlung in einer Anfragesprache für Datenbankföderationen Konfliktbehandlung in einer Anfragesprache für Datenbankföderationen Kai-Uwe Sattler Stefan Conrad Institut für Technische und Betriebliche Informationssysteme Universität Magdeburg Postfach 4120, 39016

Mehr

SchemaSQL. 11. Multidatenbanksprachen. SchemaSQL: Beispiel-Anfragen. SchemaSQL: Beispiel

SchemaSQL. 11. Multidatenbanksprachen. SchemaSQL: Beispiel-Anfragen. SchemaSQL: Beispiel 11. Multidatenbanksprachen Ziel: Globaler Zugriff auf mehrere (lokale) Datenbanken Lokale Datenbankschemata sind sichtbar. Benutzer darf eigene externe Schemata definieren. Multidatenbanksysteme (MDBS)

Mehr

II Heterogenität und Architekturen

II Heterogenität und Architekturen II Heterogenität und Dr. Armin Roth arminroth.de 24.04.2013 Dr. Armin Roth (arminroth.de) II Heterogenität und 24.04.2013 1 / 24 Agenda 1 Semantische Heterogenität 2 Architekturparadigmen PDMS Dr. Armin

Mehr

SchemaSQL Eine Multidatenbank Sprache. Volodymyr Biryuk

SchemaSQL Eine Multidatenbank Sprache. Volodymyr Biryuk SchemaSQL Eine Multidatenbank Sprache Volodymyr Biryuk Herausforderung Aufbau eines Multi-Datenbank-Systems (MDBS) Problem Autonomie Distribution Heterogenität Integration heterogener Datenquellen Art

Mehr

Daten-Definitionssprache (DDL) Bisher: Realwelt -> ERM -> Relationen-Modell -> normalisiertes Relationen-Modell. Jetzt: -> Formulierung in DDL

Daten-Definitionssprache (DDL) Bisher: Realwelt -> ERM -> Relationen-Modell -> normalisiertes Relationen-Modell. Jetzt: -> Formulierung in DDL Daten-Definitionssprache (DDL) Bisher: Realwelt -> ERM -> Relationen-Modell -> normalisiertes Relationen-Modell Jetzt: -> Formulierung in DDL Daten-Definitionssprache (DDL) DDL ist Teil von SQL (Structured

Mehr

Datenbanken. Schemaerweiterung zur Abbildung von Imperfekten Daten. Andreas Merkel

Datenbanken. Schemaerweiterung zur Abbildung von Imperfekten Daten. Andreas Merkel Seminar Impferfektion und Datenbanken Schemaerweiterung zur Abbildung von Imperfekten Daten Andreas Merkel Inhalt Einführung - Eigenschaften des relationalen Modells - Erweiterungsmöglichkeiten Zwei unterschiedliche

Mehr

Masterarbeit. Anfragebearbeitung in föderierten räumlichen Datenbanksystemen

Masterarbeit. Anfragebearbeitung in föderierten räumlichen Datenbanksystemen Fachgebiet Datenbanken und Informationssysteme Institut für Praktische Informatik Fakultät für Elektrotechnik und Informatik Universität Hannover Masterarbeit im Studiengang Informatik Anfragebearbeitung

Mehr

Algorithmen zur Berechnung der Transitiven Hülle einer Datenbankrelation

Algorithmen zur Berechnung der Transitiven Hülle einer Datenbankrelation Algorithmen zur Berechnung der Transitiven Hülle einer Datenbankrelation Daniel Reinhold Shenja Leiser 6. Februar 2006 2/28 Gliederung Einführung Transitive Hülle Definition Iterative Algorithmen 1. Naive

Mehr

Visualisierung in Informatik und Naturwissenschaften

Visualisierung in Informatik und Naturwissenschaften Visualisierung in Informatik und Naturwissenschaften Datenbankvisualisierung Sven Bernhard 12.06.1999 Datenbankvisualisierung Datenbanktheorie in 5 Minuten Visualisierung vs. Datenbanken Visualisierung

Mehr

3. Grundlagen relationaler Datenbanksysteme

3. Grundlagen relationaler Datenbanksysteme 3. Grundlagen relationaler Datenbanksysteme Hier nur kurze Rekapitulation, bei Bedarf nachlesen 3.1 Basiskonzepte des Relationenmodells 1 Darstellung der Miniwelt in Tabellenform (DB = Menge von Relationen

Mehr

Folien zum Textbuch. Kapitel 2: Planung, Entwicklung und Betrieb von IS. Teil 3: Modellierung von betrieblichen Informationssystemen

Folien zum Textbuch. Kapitel 2: Planung, Entwicklung und Betrieb von IS. Teil 3: Modellierung von betrieblichen Informationssystemen Folien zum Textbuch Kapitel 2: Planung, Entwicklung und Betrieb von IS Teil 3: Modellierung von betrieblichen Informationssystemen Textbuch-Seiten 185-208 WI Planung, Entwicklung und Betrieb von IS IS-Modellierung

Mehr

Relationen-Algebra. Prof. Dr. T. Kudraß 1

Relationen-Algebra. Prof. Dr. T. Kudraß 1 Relationen-Algebra Prof. Dr. T. Kudraß 1 Relationale Anfragesprachen Query Language (QL): Manipulation und Retrieval von Daten einer Datenbank Relationenmodell erlaubt einfache, mächtige Anfragesprachen

Mehr

Inhaltsverzeichnis. 1 Einleitung 1. 2 Aufbau von Data-Warehouse-Systemen 15. Lehner, Wolfgang Datenbanktechnologie für Data-Warehouse-Systeme 2003

Inhaltsverzeichnis. 1 Einleitung 1. 2 Aufbau von Data-Warehouse-Systemen 15. Lehner, Wolfgang Datenbanktechnologie für Data-Warehouse-Systeme 2003 1 Einleitung 1 1.1 Betriebswirtschaftlicher Ursprung des Data Warehousing 2 1.2 Statistischer Ursprung des Data Warehousing 5 1.3 Fòderativer Ursprung des Data Warehousing 7 1.4 Definition eines Data-Warehouse-Systems

Mehr

Webbasierte Informationssysteme

Webbasierte Informationssysteme SS 2004 Prof. Dr. Stefan Böttcher Universität Paderborn - SS 2004 - Prof. Dr. Stefan Böttcher Folie 1 Was ist eine relationale Datenbank? Menge von Relationen (=Tabellen) und Constraints (=Integritätsbedingungen)

Mehr

Kapitel DB:IV (Fortsetzung)

Kapitel DB:IV (Fortsetzung) Kapitel DB:IV (Fortsetzung) IV. Logischer Datenbankentwurf mit dem relationalen Modell Das relationale Modell Integritätsbedingungen Umsetzung ER-Schema in relationales Schema DB:IV-46 Relational Design

Mehr

Informationsintegration

Informationsintegration Informationsintegration Grundlegende Architekturen Ulf Leser Inhalt diese Vorlesung Klassifikation verteilter, autonomer, heterogener Systeme Weitere Klassifikationskriterien Schichtenaufbau integrierter

Mehr

5.2 Entity-Relationship-Modell

5.2 Entity-Relationship-Modell 5.2 Entity-Relationship-Modell Mod-5.8 Entity-Relationship-Modell, ER-Modell (P. Chen 1976): Kalkül zur Modellierung von Aufgabenbereichen mit ihren Objekten, Eigenschaften und Beziehungen. Weitergehende

Mehr

Datenbanken. Prof. Jürgen Sauer. Datenbanken. Skriptum zur Vorlesung im SS 2001

Datenbanken. Prof. Jürgen Sauer. Datenbanken. Skriptum zur Vorlesung im SS 2001 Prof. Jürgen Sauer Datenbanken Skriptum zur Vorlesung im SS 2001 Inhaltsverzeichnis 1. Typologie der Datenbanksysteme 1.1 Einführung: Grenzen der herkömmlichen Datenverarbeitung 1.2 Erläuterung von Begriffen

Mehr

Relationale Datenbanken

Relationale Datenbanken Ramon A. Mata-Toledo, Pauline K. Cushman Relationale Datenbanken Schaum's Repetitorien Übersetzung aus dem Amerikanischen von G&U Technische Dokumentation GmbH Z Die Autoren 9 Vorwort 9 1 Ein Überblick

Mehr

Structured Query Language (SQL) als standardisierte Anfragesprache für relationale Datenbanken

Structured Query Language (SQL) als standardisierte Anfragesprache für relationale Datenbanken Rückblick Structured Query Language (SQL) als standardisierte Anfragesprache für relationale Datenbanken Data Definition Language zur Schemadefinition (z.b. CREATE TABLE zum Anlegen von Tabellen) Data

Mehr

Schlüssel. Definition: Ein Schlüssel (key) einer Relation r(r) ist eine Til Teilmenge K von R, so dass für je zwei verschiedene Tupeln t 1

Schlüssel. Definition: Ein Schlüssel (key) einer Relation r(r) ist eine Til Teilmenge K von R, so dass für je zwei verschiedene Tupeln t 1 Schlüssel Definition: Ein Schlüssel (key) einer Relation r(r) ist eine Til Teilmenge K von R, so dass für je zwei verschiedene Tupeln t 1 und t 2 r gilt: - t 1 (K) t 2 (K) und - keine echte Teilmenge K'

Mehr

4. Relationenalgebra. Einleitung. Selektion und Projektion Mengenoperatoren. Verbundoperationen (Join) Division Beispielanfragen

4. Relationenalgebra. Einleitung. Selektion und Projektion Mengenoperatoren. Verbundoperationen (Join) Division Beispielanfragen Einleitung 4. Relationenalgebra Selektion und Projektion Mengenoperatoren Vereinigung, Durchschnitt, Differenz kartesisches Produkt Verbundoperationen (Join) Theta-Join natürlicher Verbund Semi-Join äußerer

Mehr

Das relationale Datenmodell

Das relationale Datenmodell Das relationale Datenmodell Konzepte Attribute, Relationenschemata, Datenbank-Schemata Konsistenzbedingungen Beispiel-Datenbank Seite 1 Einführung Zweck datenmäßige Darstellung von Objekten und Beziehungen

Mehr

DBMS für spezielle Anwendungen XML als Mittel der Datenbank-Interoperabilität

DBMS für spezielle Anwendungen XML als Mittel der Datenbank-Interoperabilität DBMS für spezielle Anwendungen XML als Mittel der Datenbank-Interoperabilität Seminarvortrag von D. Zimmermann 26-Februar-2004 Gliederung Datenbanken und Interoperabilität Begriffe Bedarf Ansätze XML als

Mehr

Informationsintegration I Einführung

Informationsintegration I Einführung Informationsintegration I Einführung Felix Naumann Integrierte Informationssysteme Anfrage Integriertes Informationssystem Oracle, DB2 Anwendung Dateisystem Web Service HTML Form Integriertes Info.-system

Mehr

2. Relationale Datenbanken

2. Relationale Datenbanken 2. Relationale Datenbanken Inhalt 2.1 Entity-Relationship-Modell 2.2 Relationales Modell 2.3 Relationale Entwurfstheorie 2.4 Relationale Algebra 2.5 Structured Query Language (SQL) 2 2.1 Entity-Relationship-Modell

Mehr

Datenbanken und Informationssysteme. Datenbanken und Informationssysteme

Datenbanken und Informationssysteme. Datenbanken und Informationssysteme Datenbanken und Informationssysteme Wolfgang Menzel: Natürlichsprachliche Systeme (NATS) Norbert Ritter: Datenbanken und Informationssysteme (IS) NATS Ziele der Vorlesung (1) Vermittlung von Grundlagen-

Mehr

Datenbanken und Informationssysteme

Datenbanken und Informationssysteme Datenbanken und Informationssysteme Wolfgang Menzel: Natürlichsprachliche Systeme (NATS) Norbert Ritter: Datenbanken und Informationssysteme (IS) NATS Ziele der Vorlesung (1) Vermittlung von Grundlagen-

Mehr

Datenintegration als automatisierter Prozess

Datenintegration als automatisierter Prozess Datenintegration als automatisierter Prozess Hauptseminar Tom Schöner tom.schoener@haw-hamburg.de Department Informatik, Informatik Master 12.06.2018 1 Inhaltsübersicht Einführung Thema und Fragestellungen

Mehr

Datenbanken: Relationales Modell und SQL. Dr. Matthias Uflacker, Stefan Klauck 23. April 2018

Datenbanken: Relationales Modell und SQL. Dr. Matthias Uflacker, Stefan Klauck 23. April 2018 Datenbanken: Relationales Modell und SQL Dr. Matthias Uflacker, Stefan Klauck 23. April 2018 Vorlesungsinhalte/-aufbau Phase 1 Einführung zu Unternehmensanwendungen (2 Vorlesungen) Grundlagen von spaltenorientierten

Mehr

Überblick Felix Naumann. Zugriffsrechte Zugriffsrechte erzeugen Zugriffsrechte prüfen Zugriffsrechte vergeben Zugriffsrechte entziehen

Überblick Felix Naumann. Zugriffsrechte Zugriffsrechte erzeugen Zugriffsrechte prüfen Zugriffsrechte vergeben Zugriffsrechte entziehen Datenbanksysteme I Zugriffskontrolle (kleiner Einschub) 18.1.2007 Felix Naumann Überblick 2 Zugriffsrechte Zugriffsrechte erzeugen Zugriffsrechte prüfen Zugriffsrechte vergeben Zugriffsrechte entziehen

Mehr

1. Einführung Seite 1. Kapitel 1: Einführung

1. Einführung Seite 1. Kapitel 1: Einführung 1. Einführung Seite 1 Kapitel 1: Einführung 1. Einführung Seite 2 Willkommen! Studierenden-Datenbank Hans Eifrig hat die Matrikelnummer 1223. Seine Adresse ist Seeweg 20. Er ist im zweiten Semester. Lisa

Mehr

Einführung in die Informatik II

Einführung in die Informatik II Einführung in die Informatik II Relationale Datenbanken und SQL Theorie und Anwendung Prof. Dr. Nikolaus Wulff Gründe für eine Datenbank Meist werden Daten nicht in XML-Dokumenten, sondern innerhalb einer

Mehr

Teil II: Architektur eines Data-Warehouse-Systems... 57

Teil II: Architektur eines Data-Warehouse-Systems... 57 O:/Wiley/Reihe_Dummies/9783527714476_Gerken/3d/ftoc.3d from 08.08.2018 14:02:02 Auf einen Blick Einleitung... 19 Teil I: Was ist ein Data Warehouse?... 25 Kapitel 1: Ein Beispiel zur Einführung..... 27

Mehr

7. XML-Datenbanksysteme und SQL/XML

7. XML-Datenbanksysteme und SQL/XML 7. XML-Datenbanksysteme und SQL/XML Native XML-DBS vs. XML-Erweiterungen von ORDBS Speicherung von XML-Dokumenten Speicherung von XML-Dokumenten als Ganzes Generische Dekomposition von XML-Dokumenten Schemabasierte

Mehr

Data Lakes: Lösung oder neue Herausforderung für Data-Integration

Data Lakes: Lösung oder neue Herausforderung für Data-Integration Data Lakes: Lösung oder neue Herausforderung für Big-Data Data-Integration Integration? PD Dr. Christoph Quix Fraunhofer-Institut für Angewandte Informationstechnik FIT Life Science Informatics Abteilungsleiter

Mehr

Vorlesung Wissensentdeckung in Datenbanken

Vorlesung Wissensentdeckung in Datenbanken Vorlesung Wissensentdeckung in Datenbanken Data Cube Katharina Morik, Uwe Ligges Informatik LS 8 22.04.2010 1 von 26 Gliederung 1 Einführung 2 Aggregation in SQL, GROUP BY 3 Probleme mit GROUP BY 4 Der

Mehr

Datenbanken. Seminararbeit. Einführung in das wissenschaftliche Arbeiten

Datenbanken. Seminararbeit. Einführung in das wissenschaftliche Arbeiten Seminararbeit vorgelegt von: Gutachter: Studienbereich: Christian Lechner Dr. Georg Moser Informatik Datum: 6. Juni 2013 Inhaltsverzeichnis Inhaltsverzeichnis 1 Einführung in Datenbanken 1 1.1 Motivation....................................

Mehr

Vorlesung Wissensentdeckung in Datenbanken

Vorlesung Wissensentdeckung in Datenbanken Gliederung Vorlesung Wissensentdeckung in Datenbanken Data Cube Katharina Morik, Claus Weihs 14.07.2009 1 Einführung 2 Aggregation in SQL, GROUP BY 3 Probleme mit GROUP BY 4 Der Cube-Operator 5 Implementierung

Mehr

Aufgabe 9.1: Lösung: Block-Nested-Loop-Verbund Index-Nested-Loop-Verbund Sort-Merge-Verbund Hash-Verbund

Aufgabe 9.1: Lösung: Block-Nested-Loop-Verbund Index-Nested-Loop-Verbund Sort-Merge-Verbund Hash-Verbund 1 Aufgabe 9.1: Sei p die Größe einer Seite, hier p = 4 kb. Sei b die Größe eines Blocks in Anzahl Seiten, hier b = 100. Die Größe des Datenbankpuffers, d.h. die zur Ausführung des Verbundes im Internspeicher

Mehr

Integration, Migration und Evolution

Integration, Migration und Evolution 14. Mai 2013 Programm für heute 1 2 Quelle Das Material zu diesem Kapitel stammt aus der Vorlesung Datenintegration & Datenherkunft der Universität Tübingen gehalten von Melanie Herschel im WS 2010/11.

Mehr

FUSE BY: Syntax und Semantik zur Informationsfusion in SQL

FUSE BY: Syntax und Semantik zur Informationsfusion in SQL FUSE BY: Syntax und Semantik zur Informationsfusion in SQL Jens Bleiholder, Felix Naumann Humboldt-Universität zu Berlin {bleiho,naumann}@informatik.hu-berlin.de Abstract: Daten und Informationen heterogener

Mehr

Universität Augsburg, Institut für Informatik WS 2009/2010 Prof. Dr. W. Kießling 06. Nov Dr. A. Huhn, F. Wenzel, M. Endres Lösungsblatt 2

Universität Augsburg, Institut für Informatik WS 2009/2010 Prof. Dr. W. Kießling 06. Nov Dr. A. Huhn, F. Wenzel, M. Endres Lösungsblatt 2 Universität Augsburg, Institut für Informatik WS 2009/2010 Prof. Dr. W. Kießling 06. Nov. 2009 Dr. A. Huhn, F. Wenzel, M. Endres Lösungsblatt 2 Aufgabe 1: ER-Modellierung 1. Siehe Unterstreichungen in

Mehr

Das relationale Modell (Teil 1)

Das relationale Modell (Teil 1) Vorlesung #2 Das relationale Modell (Teil 1) Fahrplan WS 2010/11 Feedback Vorlesung#1 Das relationale Modell Einordnung (wir überspringen die Modellierung, das kommt im 4. Semester Datenmanagement ) Definition,

Mehr

Kapitel 1: Einführung 1.1 Datenbanken?

Kapitel 1: Einführung 1.1 Datenbanken? Kapitel 1: Einführung 1.1 Datenbanken? 1. Einführung 1.1. Datenbanken Grundlagen der Datenbanksysteme, WS 2012/13 29. Oktober 2012 Seite 1 1. Einführung 1.1. Datenbanken Willkommen! Studierenden-Datenbank

Mehr

4. Objektrelationales Typsystem Kollektionstypen. Nested Table

4. Objektrelationales Typsystem Kollektionstypen. Nested Table Nested Table Bei einer Nested Table handelt es sich um eine Tabelle als Attributwert. Im Gegensatz zu Varray gibt es keine Beschränkung bei der Größe. Definition erfolgt auf einem Basistyp, als Basistypen

Mehr

Klausur Objektorientierte Datenbanken WS 2004/2005

Klausur Objektorientierte Datenbanken WS 2004/2005 Klausur Objektorientierte Datenbanken WS 2004/2005 Hinweise: Iwanowski 16.02.2005 Bearbeitungszeit: 60 Minuten Erlaubte Hilfsmittel: im Anhang, sonst keine Diese Klausur besteht aus 9 Aufgaben (Seiten

Mehr

2. Architektur verteilter Datenbanksysteme

2. Architektur verteilter Datenbanksysteme 2. Architektur verteilter Datenbanksysteme Verteilte Datenbank, kurz DDB (engl. distributed database): eine Sammlung logisch zusammengehöriger Datenbanken, welche über Rechnerknoten ( Sites ) verteilt

Mehr

SQL. SQL: Structured Query Language. Früherer Name: SEQUEL. Standardisierte Anfragesprache für relationale DBMS: SQL-89, SQL-92, SQL-99

SQL. SQL: Structured Query Language. Früherer Name: SEQUEL. Standardisierte Anfragesprache für relationale DBMS: SQL-89, SQL-92, SQL-99 SQL Früherer Name: SEQUEL SQL: Structured Query Language Standardisierte Anfragesprache für relationale DBMS: SQL-89, SQL-92, SQL-99 SQL ist eine deklarative Anfragesprache Teile von SQL Vier große Teile:

Mehr

Grundlagen des relationalen Modells

Grundlagen des relationalen Modells Historische Entwicklung relationaler DBMS Grundlagen des relationalen Modells Seien D 1, D 2,..., D n Domänen (~Wertebereiche) Relation: R D 1 x... x D n Bsp.: Telefonbuch string x string x integer Tupel:

Mehr

Kapitel 1: Einführung 1.1 Datenbanken?

Kapitel 1: Einführung 1.1 Datenbanken? 1. Einführung 1.1. Datenbanken? Seite 1 Kapitel 1: Einführung 1.1 Datenbanken? 1. Einführung 1.1. Datenbanken? Seite 2 Willkommen! Studierenden-Datenbank Hans Eifrig hat die Matrikelnummer 1223. Seine

Mehr

Automatisiertes Auffinden von Präfix- und Suffix-Inklusionsabhängigkeiten in relationalen Datenbankmanagementsystemen

Automatisiertes Auffinden von Präfix- und Suffix-Inklusionsabhängigkeiten in relationalen Datenbankmanagementsystemen Automatisiertes Auffinden von Präfix- und Suffix-Inklusionsabhängigkeiten in relationalen Datenbankmanagementsystemen Exposé für eine Diplomarbeit Jan Hegewald Betreut von Jana Bauckmann 7. März 2007 1

Mehr

Einsatz und Realisierung von Datenbanken. Prof. Alfons Kemper Lehrstuhl für Informatik III: Datenbanksysteme

Einsatz und Realisierung von Datenbanken. Prof. Alfons Kemper Lehrstuhl für Informatik III: Datenbanksysteme Einsatz und Realisierung von Datenbanken Prof. Alfons Kemper Lehrstuhl für Informatik III: Datenbanksysteme kemper@in.tum.de Primärliteratur: Datenbanksysteme: Eine Einführung Alfons Kemper und Andre

Mehr

B*-BÄUME. Ein Index ist seinerseits wieder nichts anderes als eine Datei mit unpinned Records.

B*-BÄUME. Ein Index ist seinerseits wieder nichts anderes als eine Datei mit unpinned Records. B*-Bäume 1 B*-BÄUME Beobachtung: Ein Index ist seinerseits wieder nichts anderes als eine Datei mit unpinned Records. Es gibt keinen Grund, warum man nicht einen Index über einem Index haben sollte, und

Mehr

Datenbankentwicklung

Datenbankentwicklung Datenbankentwicklung Berechnung und Präsentation von Daten Organisation der Daten in alleinstehende Tabellen Exklusiver Zugriff auf alle Informationen einer Tabelle Beschränkte Anzahl von Daten pro Tabellenblatt

Mehr

Objektorientierte Analyse (OOA) OOA-Pattern

Objektorientierte Analyse (OOA) OOA-Pattern OOA-Muster (Architektur Pattern) Ein Pattern (Entwurfsmuster) ist ein Problem mit seiner Lösung in einem Kontext. Der Kontext enthält in der Regel Zielkonflikte, die der Designer lösen muss, z.b. Performance

Mehr

Einsatz und Realisierung von Datenbanken. Prof. Alfons Kemper Lehrstuhl für Informatik III: Datenbanksysteme

Einsatz und Realisierung von Datenbanken. Prof. Alfons Kemper Lehrstuhl für Informatik III: Datenbanksysteme Einsatz und Realisierung von Datenbanken Prof. Alfons Kemper Lehrstuhl für Informatik III: Datenbanksysteme kemper@in.tum.de Primärliteratur: Datenbanksysteme: Eine Einführung Alfons Kemper und Andre

Mehr

Grundlagen von Datenbanken

Grundlagen von Datenbanken Agenda: Grundlagen von Datenbanken SS 2010 3. Relationale Algebra Prof. Dr. Stefan Böttcher Universität Paderborn mit Material von Prof. Dr. Gregor Engels Grundlagen von Datenbanken - SS 2010 - Prof. Dr.

Mehr

Ein XML Dokument zeichnet sich im Wesentlichen durch seine baumartige Struktur aus:

Ein XML Dokument zeichnet sich im Wesentlichen durch seine baumartige Struktur aus: RDF in wissenschaftlichen Bibliotheken 5HWULHYDODXI5') Momentan existiert noch keine standardisierte Anfragesprache für RDF Dokumente. Auf Grund der existierenden XML Repräsentation von RDF liegt es jedoch

Mehr

Logische Optimierung. Im Allgemeinen wird keine optimale Lösung erzielt, sondern nur eine Verbesserung. Logische Optimierung

Logische Optimierung. Im Allgemeinen wird keine optimale Lösung erzielt, sondern nur eine Verbesserung. Logische Optimierung Logische Optimierung Höhere, nichtprozedurale Abfragesprachen (SQL, QBE,...) verlangen keine Kenntnisse des Benutzers über die Implementierung, müssen aber in prozedurale Form (z. B. Relationenalgebra)

Mehr

Kapitel DB:IV (Fortsetzung)

Kapitel DB:IV (Fortsetzung) Kapitel DB:IV (Fortsetzung) IV. Logischer Datenbankentwurf mit dem relationalen Modell Das relationale Modell Integritätsbedingungen Umsetzung ER-Schema in relationales Schema DB:IV-45 Relational Design

Mehr

Das konzeptionelle Datenmodell

Das konzeptionelle Datenmodell Das konzeptionelle Datenmodell Signifikanz der Datenmodellierung Anforderungsanalyse Effizienz der Anwendung. Redundanzfreiheit. Datenintegrität. Reibungsarme Umsetzung des Datenmodells in das physikalische

Mehr

Informationsintegration

Informationsintegration Informationsintegration Schemaintegration Ulf Leser Wissensmanagement in der Bioinformatik Richtung Schemaintegration versus Anfragebearbeitung FDBS Schema integration Data source Data source Data source

Mehr

Abbildungen zwischen Schemata unterschiedlicher Datenmodelle

Abbildungen zwischen Schemata unterschiedlicher Datenmodelle Abbildungen zwischen Schemata unterschiedlicher Datenmodelle Mastering the Information Explosion - Information Integration and Information Quality Susanne Braun 07.07.2006 1 Inhalt 1.Motivation 2.Die 5-Ebenen-Schema-Architektur

Mehr

Data Cubes PG Wissensmangement Seminarphase

Data Cubes PG Wissensmangement Seminarphase PG 402 - Wissensmangement Seminarphase 23.10.2001-25.10.2001 Hanna Köpcke Lehrstuhl für Künstliche Intelligenz Universität Dortmund Übersicht 1. Einführung 2. Aggregation in SQL, GROUP BY 3. Probleme mit

Mehr

Techniken des Data Merging in Integrationssystemen

Techniken des Data Merging in Integrationssystemen Techniken des Data Merging in Integrationssystemen Jens Bleiholder Humboldt-Universität zu Berlin, Institut für Informatik bleiho@informatik.hu-berlin.de Zusammenfassung Die Integration von Daten aus heterogenen

Mehr

Graph-basierte Modellierung in Software-Werkzeugen

Graph-basierte Modellierung in Software-Werkzeugen Graph-basierte Modellierung in Software-Werkzeugen 1 Inhalt Einleitung Modellierung mit Graphen Modellierung mit Graphklassen (Schemata und Constraints) Implementation von Graphen (Algorithmen und Anfragen)

Mehr

Das diesem Dokument zugrundeliegende Vorhaben wurde mit Mitteln des Bundesministeriums für Bildung und Forschung unter dem Förderkennzeichen

Das diesem Dokument zugrundeliegende Vorhaben wurde mit Mitteln des Bundesministeriums für Bildung und Forschung unter dem Förderkennzeichen Das diesem Dokument zugrundeliegende Vorhaben wurde mit Mitteln des Bundesministeriums für Bildung und Forschung unter dem Förderkennzeichen 16OH21005 gefördert. Die Verantwortung für den Inhalt dieser

Mehr

Informatik II: Modellierung Prof. Dr. Martin Glinz. Kapitel 13. Metamodelle. Universität Zürich Institut für Informatik

Informatik II: Modellierung Prof. Dr. Martin Glinz. Kapitel 13. Metamodelle. Universität Zürich Institut für Informatik Informatik II: Modellierung Prof. Dr. Martin Glinz Kapitel 13 Metamodelle Universität Zürich Institut für Informatik Inhalt 13.1 Grundlagen und Motivation 13.2 Ontologische Metamodelle 13.3 Linguistische

Mehr

Kapitel 3: Entity-Relationship-Modell

Kapitel 3: Entity-Relationship-Modell Kapitel 3: Entity-Relationship-Modell Objekte und Beziehungen Objekte bilden die elementare Grundlage unserer Betrachtung. Objekte werden durch Tupel in Relationen repräsentiert und können durch Schlüsselwerte

Mehr

8 Schlussfolgerungen

8 Schlussfolgerungen 112 8 Schlussfolgerungen Die Zielsetzung der vorliegenden Arbeit wurde mit der Erstellung eines Referenzmodells als Vorschlag der Datenorganisation für den Bereich der Milcherzeugung unter Anwendung eines

Mehr

Domänen: Grundtypen, alle vordefiniert, z.b. INTEGER ~ integer NUMERIC (p,s) p: precision, s: scale (nach,) etc.

Domänen: Grundtypen, alle vordefiniert, z.b. INTEGER ~ integer NUMERIC (p,s) p: precision, s: scale (nach,) etc. Kapitel 6 Relationale DB-Sprache SQL SEQUEL: Structured English Query Language, 70er Jahre SQL: System R, SQL/DS, TransBase, Oracle... ANSI Standards 1, 2, 3 6.1 Daten-Definitionssprache DDL Domänen: Grundtypen,

Mehr

Geoinformation Abbildung auf Tabellen

Geoinformation Abbildung auf Tabellen Folie 1 von 32 Geoinformation Abbildung auf Tabellen Folie 2 von 32 Abbildung auf Tabellen Übersicht Motivation des relationalen Datenmodells Von Objekten zu Tabellen Abbildung von Objekten Schlüssel Abbildung

Mehr

Medizininformatik Software Engineering

Medizininformatik Software Engineering Vorlesung Software Engineering Inhaltsverzeichnis 1. Einleitung 2. Software und Medizinprodukt 3. Vorgehensmodelle 4. Strukturierter Entwurf von Echtzeitsystemen 4.1 Echzeit, was ist das? 4.2 Einführung

Mehr

Inhalt. " DiaGen Historie und Beschreibung. " Architektur eines DiaGen-Editors. " Hypergraphen. " DiaGen-Editoren Komponenten

Inhalt.  DiaGen Historie und Beschreibung.  Architektur eines DiaGen-Editors.  Hypergraphen.  DiaGen-Editoren Komponenten DIAGEN Sven Goeckels Seminar : Visuelle Sprachen Universität Bremen FB Informatik WS 2001/2002 Inhalt " DiaGen Historie und Beschreibung " " Hypergraphen " DiaGen-Editoren Komponenten? Modeler? Reducer?

Mehr

DATAFUSION IM MILCHVIEHSTALL

DATAFUSION IM MILCHVIEHSTALL Forschen und Prüfen für die Landwirtschaft Josephinum Research DATAFUSION IM MILCHVIEHSTALL Smart Farming und Nachhaltigkeit: Chancen und Herausforderungen 4. Agroscope-Nachhaltigkeitstagung Franz Handler,

Mehr

Extraktion, Transformation, Laden (ETL)

Extraktion, Transformation, Laden (ETL) Extraktion, Transformation, Laden (ETL) ETL-Prozeß Integrationsschritte Integrationsprobleme Konflikte und deren Klassifikation Behebung von Konflikten Data Cleaning Vorlesung Data-Warehouse-Technologien

Mehr

Relationales Datenbanksystem Oracle

Relationales Datenbanksystem Oracle Relationales Datenbanksystem Oracle 1 Relationales Modell Im relationalen Modell wird ein relationales Datenbankschema wie folgt beschrieben: RS = R 1 X 1 SC 1... R n X n SC n SC a a : i=1...n X i B Information

Mehr

Konzeptueller Entwurf

Konzeptueller Entwurf Konzeptueller Entwurf UML Klassendiagrame UML Assoziationen Entspricht Beziehungen Optional: Assoziationsnamen Leserichtung ( oder ), sonst bidirektional Rollennamen Kardinalitätsrestriktionen UML Kardinalitätsrestriktionen

Mehr

Semantische Datenintegration: Strategien zur Integration von Datenbanken

Semantische Datenintegration: Strategien zur Integration von Datenbanken Semantische Datenintegration: Strategien zur Integration von Datenbanken Inhalt 1. Wiederholung Integrationskonflikte 2. Klassische Strategien zur Integration 1. Eng gekoppelte Ansätze 2. Lose gekoppelte

Mehr

Mathematische Grundlagen

Mathematische Grundlagen Mathematische rundlagen raphen und Operationen auf raphen Karin Haenelt 1 raphen Definitionen Operationen auf raphen raph-repräsentationen 2 Vorbemerkung Wenn hier von Knoten und Kanten gesprochen wird,

Mehr

Extraktion, Transformation, Laden (ETL)

Extraktion, Transformation, Laden (ETL) Extraktion, Transformation, Laden (ETL) ETL-Prozeß Integrationsschritte Integrationsprobleme fi Konflikte und deren Klassifikation fi Behebung von Konflikten Data Cleaning VL Data Warehouses, WS 2000/2001

Mehr

Dieser Foliensatz darf frei verwendet werden unter der Bedingung, dass diese Titelfolie nicht entfernt wird.

Dieser Foliensatz darf frei verwendet werden unter der Bedingung, dass diese Titelfolie nicht entfernt wird. Thomas Studer Relationale Datenbanken: Von den theoretischen Grundlagen zu Anwendungen mit PostgreSQL Springer, 2016 ISBN 978-3-662-46570-7 Dieser Foliensatz darf frei verwendet werden unter der Bedingung,

Mehr

E-R-Modell zu Relationenschema

E-R-Modell zu Relationenschema Raum: LF 230 Nächste Sitzung: 27./30. Oktober 2003 Aktuelle Informationen unter: http://www.is.informatik.uni-duisburg.de/teaching/lectures/dbp_ws03/index.html E-R-Modell zu Relationenschema Als zweiter

Mehr

ADDISON-WESLEY PUBLISHING COMPANY

ADDISON-WESLEY PUBLISHING COMPANY Jens-Peter Redlich CORBA 2.0 Praktische Einführung für C++ und Java Mit einem Geleitwort von Richard Mark Soley ADDISON-WESLEY PUBLISHING COMPANY Bonn Reading, Massachusetts Menlo Park, California New

Mehr

Datenbanken 1 Datenbanken SPO 2014 SPO 2007 Belegnummer Belegnummer

Datenbanken 1 Datenbanken SPO 2014 SPO 2007 Belegnummer Belegnummer Datenbanken 1 Datenbanken SPO 2014 SPO 2007 Belegnummer 30.7312 Belegnummer 30.7302 Wintersemester 2017/18 (Bachelor) Materialien zur Vorlesung Inge Hochschule Darmstadt Fachbereich Informatik Motivation

Mehr

Wintersemester 2016/ Matrikelnummer: Hinweise. Unterschrift

Wintersemester 2016/ Matrikelnummer: Hinweise. Unterschrift Fachbereich für Computerwissenschaften Prof. Dr. Nikolaus Augsten Jakob-Haringer-Str. 2 5020 Salzburg, Austria Telefon: +43 662 8044 6347 E-Mail: nikolaus.augsten@sbg.ac.at Datenbanken II Prüfung Wintersemester

Mehr

Innovationslabor Semantische Integration von Webdaten

Innovationslabor Semantische Integration von Webdaten Innovationslabor Semantische Integration von Webdaten Workflow-basierte Datenintegration und Objekt-Matching Dr. Andreas Thor http://dbs.uni-leipzig.de/format Workflow-basierte Datenintegration Ausgangspunkt

Mehr

Grundlagen zu Datenbanken zu Beginn der Jgst. 13

Grundlagen zu Datenbanken zu Beginn der Jgst. 13 Grundlagen zu Datenbanken zu Beginn der Jgst. 13 Bereits bei der Planung einer Datenbank muss der Datenbankentwickler darauf achten, Nachteile für das spätere System zu vermeiden. Die Strukturen müssen

Mehr

Aktuelles Schlagwort Semi-strukturierte Daten

Aktuelles Schlagwort Semi-strukturierte Daten Aktuelles Schlagwort Semi-strukturierte Daten François Bry, Michael Kraus, Dan Olteanu und Sebastian Schaffert Institut für Informatik, Universität München, Oettingenstraße 67, 80538 München, http://www.pms.informatik.uni-muenchen.de

Mehr

Relationale Datenbanken und SQL

Relationale Datenbanken und SQL Günter Matthiessen, Michael Unterstein Relationale Datenbanken und SQL Konzepte der Entwicklung und Anwendung yy ADDISON-WESLEY An imprint of Pearson Education München Boston San Francisco Harlow, England

Mehr