Duplikaterkennung und Datenfusion

Größe: px
Ab Seite anzeigen:

Download "Duplikaterkennung und Datenfusion"

Transkript

1 Duplikaterkennung und Datenfusion Kolloquium Stuttgart, Felix Naumann Humboldt-Universität zu Berlin Humboldt-Universität zu Berlin Felix Naumann, Humboldt-Universität zu Berlin 2

2 Humboldt-Universität zu Berlin Wilhelm und Alexander von Humboldt Einheit von Lehre und Forschung Freiheit und Unabhängigkeit der Wissenschaft 29 Nobelpreisträger Mommsen, Hertz, Koch, Hahn, Planck, Einstein,... 38,000 Studenten, (1100 Informatik) 560 Professoren (-90) Felix Naumann, Humboldt-Universität zu Berlin 3 Forschungsgruppe Informationsintegration Leitung: Felix Naumann (naumann@informatik.hu-berlin.de) Mitarbeiter Jens Bleiholder (bleiho@informatik.hu-berlin.de) Informationsfusion in relationalen Daten Melanie Weis (mweis@informatik.hu-berlin.de) Objektidentifikation in XML Daten Affiliated Armin Roth (aroth@informatik.hu-berlin.de) Datenqualität in Peer--Management-Systemen Alexander Bilke (bilke@cs.tu-berlin.de) Matching Forschungsthemen Objektidentifikation Informationsfusion Optimierung Visualisierung Felix Naumann, Humboldt-Universität zu Berlin 4

3 Integrierte Informationssysteme Anfrage Integriertes Informationssystem Oracle, DB2 Anwendung Dateisystem Web Service HTML Form Integriertes Info.-system Felix Naumann, Humboldt-Universität zu Berlin 5 Beispiel der Informationsintegration Web Service A 1sec. <pub> <Titel> Federated base Systems </Titel> <Autoren> <Autor> Amit P. Sheth </Autor> <Autor> mes A. Larson </Autor> </Autoren> </pub> Web Service B 5sec. <publication> <title> Federated base Systems for Managing Distributed, Heterogeneous, and Autonomous bases </title> <auth> Scheth & Larson </auth> <year> 1990 </year> </publication> Identifikation Integration Optimierung Visualisierung Felix Naumann, Humboldt-Universität zu Berlin 6

4 5 min 3 min Teil 4 Teil 3 Teil 2 Teil 1 Teil 0 User Interface HumMer Humboldt Merger Import Query Execution Visualization Tables conversion XML Fusion RDB XML Duplicate Detection RDB XML transformation RDB2XML RDB2XML Graphical Query Builder SQL XQuery Query Optimization SQL XQuery XML2RDB XML2RDB DBMS... DBMS XML... XML Metadata Services Lineage Statistics Metadata Repository Mapping Matching Samples Felix Naumann, Humboldt-Universität zu Berlin 7 HumMer Der Humboldt Merger Felix Naumann, Humboldt-Universität zu Berlin 8

5 tische Heterogenität Männer( Id, Vorname, Nachname) Frauen( Id, Vorname, Nachname) Relation vs. Attribut Relation vs. Wert Person( Id, Vorname, Nachname,männlich, weiblich) Person( Id, Vorname, Nachname, Geschlecht) Attribut vs. Wert Felix Naumann, Humboldt-Universität zu Berlin 9 Mapping Beispiel ARTICLE artpk title pages AUTHOR artfk name PUBLICATION pubid title date author SELECT artpk AS pubid title AS title null AS date null AS author FROM ARTICLE UNION SELECT null AS pubid null AS title null AS date name AS author FROM AUTHOR Mit Clio Team: Howard Ho, Lucian Popa, Mauricio Hernandez, Felix Naumann, Humboldt-Universität zu Berlin 10

6 Mapping Beispiel ARTICLE artpk title pages AUTHOR artfk name SELECT FROM WHERE PUBLICATION pubid title date author artpk AS pubid title AS title null AS date name AS author ARTICLE, AUTHOR ARTICLE.artPK = AUTHOR.artFK Felix Naumann, Humboldt-Universität zu Berlin 11 Matching Motivation Große ta > 100 Tabellen, viele Attribute Bildschirm nicht lang genug Unübersichtliche ta Tiefe Schachtelungen Fremdschlüssel Bildschirm nicht breit genug Fremde ta Irreführende ta Fremdsprachliche ta Kryptische ta XML ta Mit Clio Team: Howard Ho Felix Naumann, Humboldt-Universität zu Berlin 12

7 Man beachte die Scrollbar! Man beachte die Schachtelungstiefe! Felix Naumann, Humboldt-Universität zu Berlin 13 Matching Klassifikation Matching basierend auf Namen der elemente (label-based) Darunterliegende Daten (instance-based) Struktur des s (structure-based) Mischformen, Meta-Matcher Kernalgorithmus des Matching: später Gegeben zwei ta mit Attributmengen A und B. Bilde Kreuzprodukt aller Attribute aus A und B. Für jedes Paar vergleiche Ähnlichkeit. Ähnlichste Paare sind Matches Felix Naumann, Humboldt-Universität zu Berlin 14

8 15 min 5 min 3 min Teil 4 Teil 3 Teil 2 Teil 1 Teil 0 User Interface HumMer Humboldt Merger Import Query Execution Visualization Tables conversion XML Fusion RDB XML Duplicate Detection RDB XML transformation RDB2XML RDB2XML Graphical Query Builder SQL XQuery Query Optimization SQL XQuery XML2RDB XML2RDB DBMS... DBMS XML... XML Metadata Services Lineage Statistics Metadata Repository Mapping Matching Samples Felix Naumann, Humboldt-Universität zu Berlin 15 Duplikaterkennung Erkennung mehrere (ähnlicher) Darstellungen des gleichen Objekts Auch Duplicate Detection Cleansing Record Linkage Domänenspezifische Algorithmen Adressdaten Mikrobiologische Daten Manchmal gibt es IDs Bücher: ISBN Personen: SSN / Personalausweisnummer Webseiten: URL Felix Naumann, Humboldt-Universität zu Berlin 16

9 Duplikaterkennung in XML Daten Vergleiche <author> Mit Subelementen (<publication>)? Wie tief? Vergleiche <publication> Mit parallelen Elementen (<year>)?, oder Daten? Kurz: Was ist ein Duplikat? Mit Melanie Weis Felix Naumann, Humboldt-Universität zu Berlin 17 DELPHI - Warehouse Duplikate [AC02] ID country USA United States Unitd States Token Ähnlichkeit 2 3 ID City New York Los Angeles Now York Los Angeles New York County_ID Los Angels 3 Gemeinsame Kinder Felix Naumann, Humboldt-Universität zu Berlin 18

10 XML Duplikate Input: XML Dokument, kein Output: Alle Duplikate im Dokument Zwei Elemente sind Duplikate falls: Gleiche oder ähnliche Eltern Gleicher Name (Tag) Gleiche Tiefe im Dokument Ähnliche Daten Ähnliche Kinder Ähnlichkeit: Basiert auf edit distance mit Schwellwert Felix Naumann, Humboldt-Universität zu Berlin 19 Der Algorithmus Extraction Graph Generation Filterung Duplikaterkennung Experimente auf sauberen Länderdaten, die mit vier Fehlerarten verschmutzt wurden. 260 Länder Similar Neighbor Detection Filtering Pairwise Element Comparison Außerdem: Filmdaten, CD Daten, usw. Clustering Felix Naumann, Humboldt-Universität zu Berlin 20

11 Algorithmus - Objektextraktion Extraction Graph Generation Similar Neighbor Detection Filtering Pairwise Element Comparison Clustering Ziel: Relevante Elemente extrahieren XQuery Resultat hat festes Unterscheidung: Elementdaten Kinddaten name Paris city att Tour Eiffel atts Element att Notre Dame name Paris city Children atts att Toure Eiffel lake Lac Leman Felix Naumann, Humboldt-Universität zu Berlin 21 Algorithmus Entdeckung ähnlicher Nachbarn Extraction Graph Generation Similar Neighbor Detection Filtering Pairwise Element Comparison Clustering Ziel: Finde ähnliche Daten zwischen Elementen Edit distance. Filter um Anzahl der Vergleiche zu minimieren: Längen-Filter Dreiecksungleichung Bag distance Notre Dame Tour Eiffel Lyon Paris Toure Eiffel Selektivität der Filter (in Reihenfolge): Längenfilter: 83 % Dreiecksungleichung: 23% Bag distance Filter: 97% >99% Felix Naumann, Humboldt-Universität zu Berlin 22

12 Algorithmus - Objektfilter Extraction Graph Generation Similar Neighbor Detection Filtering Pairwise Element Comparison Clustering Ziel: Anzahl der Vergleiche zwischen Objekten minimieren Elemente filtern, die nicht Duplikate sein können Obere Schranke für Ähnlichkeitsmaß Notre Dame Paris Lyon number of filtered objects % 20% 40% 60% 80% 100% duplicate percentage (dup) Tour Eiffel Toure Eiffel Maximum Observed Felix Naumann, Humboldt-Universität zu Berlin 23 Algorithmus Elementvergleich Extraction Graph Generation Similar Neighbor Detection Filtering Pairwise Element Comparison Clustering Ziel: Identifikation von Duplikaten Ähnlichkeitsmaß basiert auf Relevanz der gemeinsamen Daten Relevanz der nichtgemeinsamen Daten Schwellwert Notre Dame Paris Tour Eiffel Toure Eiffel Felix Naumann, Humboldt-Universität zu Berlin 24

13 Algorithmus Clustering Extraction Graph Generation Similar Neighbor Detection Filtering Pairwise Element Comparison Clustering Ziel: Bestimmung von Duplikatclustern Transitivität von ist Duplikat mit Transitive Hülle bilden Felix Naumann, Humboldt-Universität zu Berlin 25 Algorithmus Top-down Mittels Duplkate in Tiefe I werden Duplikate auf Stufe i+1 ermittelt. Extraction Graph Generation Filterung Similar Neighbor Detection Filtering Pairwise Element Comparison Clustering Duplikaterkennung Felix Naumann, Humboldt-Universität zu Berlin 26

14 Ausblick Weitere Experiment Filmdaten Skalierbarkeit Speicherbedarf Geschwindigkeit nutzen Vergleiche sparen (content model, maxoccurs) Datentypen Andere Ähnlichkeitsmaße Felix Naumann, Humboldt-Universität zu Berlin 27 Duplikaterkennung in XML Daten Felix Naumann, Humboldt-Universität zu Berlin 28

15 Duplikat-gesteuertes Matching Umgekehrte Idee Matching Herkömmliche Lösungen (siehe zuvor) Namen der elemente (label-based) Darunterliegende Daten (instance-based) Insbesondere Eigenschaften von Spalten Struktur des s (structure-based) Nun Finde Duplikate (trotz mangelnder ta) Korrespondenzen zwischen gleichen Attributwerten Mit Alexander Bilke Felix Naumann, Humboldt-Universität zu Berlin 29 Duplikat-gesteuertes Matching Duplikate Felix Naumann, Humboldt-Universität zu Berlin 30

16 15 min 15 min 5 min 3 min Teil 4 Teil 3 Teil 2 Teil 1 Teil 0 User Interface HumMer Humboldt Merger Import Query Execution Visualization Tables conversion XML Fusion RDB XML Duplicate Detection RDB XML transformation RDB2XML RDB2XML Graphical Query Builder SQL XQuery Query Optimization SQL XQuery XML2RDB XML2RDB DBMS... DBMS XML... XML Metadata Services Lineage Statistics Metadata Repository Mapping Matching Samples Felix Naumann, Humboldt-Universität zu Berlin 31 Daten Fusion amazon.de H. Melville $3.98 ID max length MIN CONCAT Herman Melville Moby Dick $5.99 bol.de Felix Naumann, Humboldt-Universität zu Berlin 32

17 Relationale Datenfusion Union Duplikat-Eliminierung Outer union (Codd 1979) Union bei heterogenen ta Minimum union (Ullmann 1989, Galindo-Legaria 1994) Eliminierung subsummierter Tupel Fusion Duplikatintegration Konfliktlösung Felix Naumann, Humboldt-Universität zu Berlin 33 Wie Union integriert Quelle 1(A,B,C) Quelle 2(A,B,C) a, b, c a, b, c a, b, c Elimination identischer Tupel a, b, c a, b, c a, b, - a, b, - a, b, c a, b, c a, b, d a, c, d Keine Elimination subsummierter Tupel Keine Konfliktlösung a, -, c a, b, - a, -, c a, b, - Keine Integration komplementärer Tupel Felix Naumann, Humboldt-Universität zu Berlin 34

18 Wie Outer Union integriert Quelle 1(A,B,C) Quelle 2(A,B,D) a, b, c a, b, d a, b, -, d a, b, -, d Keine Integr. komplement. Tupel a, b, - a, b, - a, b, -, - a, b, -, - a, b, -, - Elimination identischer Tupel a, b, c a, b, - a, b, -, - a, b, -, - Keine Elimination subsummierter Tupel a, b, c a, e, d a, e, -, d a, e, -, d Keine Konfliktlösung Felix Naumann, Humboldt-Universität zu Berlin 35 Wie Minimum Union integriert Quelle 1(A,B,C) Quelle 2(A,B,D) a, b, c a, b, d a, b, -, d a, b, -, d Keine Integr. komplement. Tupel a, b, - a, b, - a, b, -, - a, b, -, - a, b, -, - Elimination identischer Tupel a, b, c a, b, - a, b, -, - Elimination subsummierter Tupel a, b, c a, e, d a, e, -, d a, e, -, d Keine Konfliktlösung Felix Naumann, Humboldt-Universität zu Berlin 36

19 Wie Fusion integrieren sollte Quelle 1(A,B,C) Quelle 2(A,B,D) a, b, c a, b, d a, b, -, d a, b, c, d Integration komplement. Tupel a, b, - a, b, - a, b, -, - a, b, -, - a, b, -, - Elimination identischer Tupel a, b, c a, b, - a, b, -, - Elimination subsummierter Tupel a, b, c a, e, d a, e, -, d a, f( b,e), c, d Konfliktlösung Felix Naumann, Humboldt-Universität zu Berlin 37 Konfliktlösungsfunktionen Numerisch: SUM, AVG, MAX, MIN, Nicht-numerisch: MAXLENGTH, CONCAT, AnnCONCAT, Spezialisiert: RANDOM, COUNT, CHOOSE, FAVOR, MaxIQ, Domänen-spezifisch Felix Naumann, Humboldt-Universität zu Berlin 38

20 Fuse By Syntaxdiagramm.----, V >>--SELECT column > +--RESOLVE (column) `--RESOLVE (column, function)--' ` * '.--, V >--FROM---table--+-->.--, , V V >--FUSE BY--(-+---column--+-+-)--ON ORDER---column--+-->< ` ' Mit Jens Bleiholder Felix Naumann, Humboldt-Universität zu Berlin 39 Fuse By Semantik Idee: Gruppierung und Outer Union Konfliktlösungsfunktionen in den Gruppen Intuitives Default-Verhalten Verwendung von Coalesce Beseitigung von Unsicherheiten Entfernung doppelter Tupel Entfernung subsummierter Tupel Felix Naumann, Humboldt-Universität zu Berlin 40

21 Fuse By Anfragen SELECT * FROM Q1 FUSE BY (Name) SELECT * FROM Q1 FUSE BY () SELECT * FROM Q1, Q2 FUSE BY () Gruppierung mit Coalesce Aggregation Subsumption Minimum Union SELECT Name, RESOLVE(Alter, max), RESOLVE(Student, vote), RESOLVE(Ort), RESOLVE(Telefon) FROM Q1, Q2 FUSE BY (Name) ON ORDER Q2.Alter DESC Felix Naumann, Humboldt-Universität zu Berlin 41 FUSE BY Beispiel Name Alter Student Ort Name Alter Student Telefon Felix Melanie Jens Christoph Sven Sven Nein Hamburg Karlsruhe Berlin Berlin Berlin Melanie Jens Christoph Melanie Karsten Karsten Nein 030/ / /98765 SELECT Name, RESOLVE(Alter,max), RESOLVE(Student,vote), RESOLVE(Ort), RESOLVE(Telefon) FROM Q1, Q2 FUSE BY (Name) ON ORDER Q2.Alter DESC Name Felix Melanie Jens Christoph Sven Karsten Alter Felix Naumann, Humboldt-Universität zu Berlin Student Nein Ort Hamburg Karlsruhe Berlin Berlin Telefon 030/ /54321

22 2 min 15 min 15 min 5 min 3 min Teil 4 Teil 3 Teil 2 Teil 1 Teil 0 User Interface HumMer Humboldt Merger Import Query Execution Visualization Tables conversion XML Fusion RDB XML Duplicate Detection RDB XML transformation RDB2XML RDB2XML Graphical Query Builder SQL XQuery Query Optimization SQL XQuery XML2RDB XML2RDB DBMS... DBMS XML... XML Metadata Services Lineage Statistics Metadata Repository Mapping Matching Samples Felix Naumann, Humboldt-Universität zu Berlin 43 Anfrageoptimierung mit Merging π(name) π(name) σ(salary > 1000) MERGE MERGE σ(salary > 1000) σ(salary > 1000)... emp_1... emp_n emp_1... emp_n Korrektheit? Vollständigkeit? Effizienz? Felix Naumann, Humboldt-Universität zu Berlin 44

23 Optimierung Ein Paradigmenwechsel Festes Ergebnis Vollständig & korrekt Optimiere Kosten Zeit & Durchsatz Feste Kosten Preis, Geduld, Optimiere Ergebnis Inhalt, Qualität Felix Naumann, Humboldt-Universität zu Berlin 45 Visualisierung Ziele Darstellung integrierter Ergebnisse Viele Quellen Viele Operationen / Transformationen Nutzerfreundliche Darstellung Drill-Down Metadaten Kein kleinster gemeinsamer Nenner! Mit Claudia Lozek Felix Naumann, Humboldt-Universität zu Berlin 46

24 Metadaten der Integration Herkunft lineage Durch Operatoren hindurch Transformationen Aggregation / Integration Konflikte Datenqualität Ranking Metadata Visualization Merging Scrubbing Extraction Analysis S1 S Felix Naumann, Humboldt-Universität zu Berlin 47 Fragen? naumann@informatik.hu-berlin.de

25 Teil 4 Teil 3 Teil 2 Teil 1 Teil 0 User Interface HumMer Humboldt Merger Import Query Execution Visualization Tables conversion XML Fusion RDB XML Duplicate Detection RDB XML transformation RDB2XML RDB2XML Graphical Query Builder SQL XQuery Query Optimization SQL XQuery XML2RDB XML2RDB DBMS... DBMS XML... XML Metadata Services Lineage Statistics Metadata Repository Mapping Matching Samples Felix Naumann, Humboldt-Universität zu Berlin 49

Informationsintegration I Einführung

Informationsintegration I Einführung Informationsintegration I Einführung Felix Naumann Integrierte Informationssysteme Anfrage Integriertes Informationssystem Oracle, DB2 Anwendung Dateisystem Web Service HTML Form Integriertes Info.-system

Mehr

Informationsintegration Einführung. 14.4.2008 Felix Naumann

Informationsintegration Einführung. 14.4.2008 Felix Naumann Informationsintegration Einführung 14.4.2008 Felix Naumann Integrierte Informationssysteme 2 Anfrage Integriertes Informationssystem Oracle, DB2 Anwendung Dateisystem Web Service HTML Integriertes t Form

Mehr

Datenintegration. Kapitel 1: Einführung. Michael Hartung in Vertretung von Dr. Andreas Thor Wintersemester 2010/11

Datenintegration. Kapitel 1: Einführung. Michael Hartung in Vertretung von Dr. Andreas Thor Wintersemester 2010/11 Datenintegration Datenintegration Kapitel 1: Einführung Michael Hartung in Vertretung von Dr. Andreas Thor Wintersemester 2010/11 Universität Leipzig Institut für Informatik http://dbs.uni-leipzig.de 1

Mehr

Datenintegration. Kapitel 1: Einführung. Andreas Thor Sommersemester 2008. Inhalt

Datenintegration. Kapitel 1: Einführung. Andreas Thor Sommersemester 2008. Inhalt Datenintegration Datenintegration Kapitel 1: Einführung Andreas Thor Sommersemester 2008 Universität Leipzig Institut für Informatik http://dbs.uni-leipzig.de 1 Inhalt Begriffsdefinition Anwendungsgebiete

Mehr

Peer Data Management mit System P

Peer Data Management mit System P Peer Data Management mit System P Ilmenau, 17. Mai 2006 Felix Naumann Armin Roth naumann@informatik.hu-berlin.de aroth@informatik.hu-berlin.de Humboldt-Universität zu Berlin Überblick Arbeitsgruppe Informationsintegration

Mehr

Objektorientierte Datenbanken

Objektorientierte Datenbanken OODB 11 Slide 1 Objektorientierte Datenbanken Vorlesung 11 Sebastian Iwanowski FH Wedel OODB 11 Slide 2 Wesentliche Eigenschaften von Hibernate Transparente Persistenz Transitive Persistenz (Persistenz

Mehr

Duplikaterkennung - Motivation Masterseminar. Felix Naumann Hasso-Plattner-Institut

Duplikaterkennung - Motivation Masterseminar. Felix Naumann Hasso-Plattner-Institut Duplikaterkennung - Motivation Masterseminar 16.4.2008 Felix Naumann Hasso-Plattner-Institut Fachgebiet Informationssysteme Überblick 2 Datenqualität Datenfehler und ihre Ursachen Datenreinigung i Duplikaterkennung

Mehr

SQL. strukturierte Datenbankabfragesprache eine Datenbanksprache zur. Structured Query Language:

SQL. strukturierte Datenbankabfragesprache eine Datenbanksprache zur. Structured Query Language: SQL Structured Query Language: strukturierte Datenbankabfragesprache eine Datenbanksprache zur Definition, Abfrage und Manipulation von Daten in relationalen Datenbanken In der SQL-Ansicht arbeiten In

Mehr

SQL für Trolle. mag.e. Dienstag, 10.2.2009. Qt-Seminar

SQL für Trolle. mag.e. Dienstag, 10.2.2009. Qt-Seminar Qt-Seminar Dienstag, 10.2.2009 SQL ist......die Abkürzung für Structured Query Language (früher sequel für Structured English Query Language )...ein ISO und ANSI Standard (aktuell SQL:2008)...eine Befehls-

Mehr

Universität Augsburg, Institut für Informatik WS 2006/2007 Dr. W.-T. Balke 27. Nov. 2006 M. Endres, A. Huhn, T. Preisinger Lösungsblatt 5

Universität Augsburg, Institut für Informatik WS 2006/2007 Dr. W.-T. Balke 27. Nov. 2006 M. Endres, A. Huhn, T. Preisinger Lösungsblatt 5 Universität Augsburg, Institut für Informatik WS 2006/2007 Dr. W.-T. Balke 27. Nov. 2006 M. Endres, A. Huhn, T. Preisinger Lösungsblatt 5 Aufgabe 1: Projektion Datenbanksysteme I π A1,...,A n (π B1,...,B

Mehr

Entfernung von Duplikaten in Data Warehouses

Entfernung von Duplikaten in Data Warehouses Entfernung von Duplikaten in Data Warehouses Daniel Martens 11.09.2015, Informationsintegration, Seminar 1/41 Gliederung Problem & Motivation Domänen-unabhängige Verfahren Domänen-abhängige Verfahren DELPHI

Mehr

Seminar Data Cleansing

Seminar Data Cleansing Seminar Data Cleansing Felix Naumann Forschungsgruppe Informationsintegration Juniorprofessor: Felix Naumann Mitarbeiter Jens Bleiholder Melanie Weis (ab 1.11.) Themen Objektidentifikation Informationsintegration

Mehr

Informationsintegration Einführung. 10.4.2012 Felix Naumann

Informationsintegration Einführung. 10.4.2012 Felix Naumann Informationsintegration Einführung 10.4.2012 Felix Naumann Integrierte Informationssysteme 2 Anfrage Integriertes Informationssystem Oracle, DB2 Anwendung Dateisystem Web Service HTML Form Integriertes

Mehr

Vorlesung Suchmaschinen Semesterklausur Wintersemester 2013/14

Vorlesung Suchmaschinen Semesterklausur Wintersemester 2013/14 Universität Augsburg, Institut für Informatik Wintersemester 2013/14 Prof. Dr. W. Kießling 10. Oktober 2013 F. Wenzel, D. Köppl Suchmaschinen Vorlesung Suchmaschinen Semesterklausur Wintersemester 2013/14

Mehr

Techniken des Data Merging in Integrationssystemen

Techniken des Data Merging in Integrationssystemen Techniken des Data Merging in Integrationssystemen Jens Bleiholder Humboldt-Universität zu Berlin, Institut für Informatik bleiho@informatik.hu-berlin.de Zusammenfassung Die Integration von Daten aus heterogenen

Mehr

Nachtrag: Farben. Farbblindheit. (Light und Bartlein 2004)

Nachtrag: Farben. Farbblindheit. (Light und Bartlein 2004) Nachtrag: Farben Farbblindheit (Light und Bartlein 2004) 1 Vorgeschlagene Farbskalen (Light and Bartlein 2004) Farbkodierung metrisch skalierter Daten Unterscheide: 1. Sequential Data (ohne Betonung der

Mehr

SQL Intensivpraktikum SS 2008

SQL Intensivpraktikum SS 2008 SQL Intensivpraktikum SS 2008 Aggregation von Daten Arbeit mit Gruppen SQL1 basierend auf OAI-Kurs Copyright Oracle Corporation, 1998. All rights reserved. Gruppenfunktionen Gruppenfunktionen verarbeiten

Mehr

VL Informationsintegration Verteilung, Autonomie und Heterogenität. 25.10.2004 Felix Naumann. Aufbau eines Data Warehouse

VL Informationsintegration Verteilung, Autonomie und Heterogenität. 25.10.2004 Felix Naumann. Aufbau eines Data Warehouse VL Informationsintegration Verteilung, Autonomie und Heterogenität 25.10.2004 Felix Naumann Wiederholung: Data Warehouse Aufbau eines Data Warehouse Quelle: Ulf Leser, VL Data Warehouses 25.10.2004 Felix

Mehr

Informationsintegration II Data Cleansing 2 Duplikaterkennung

Informationsintegration II Data Cleansing 2 Duplikaterkennung Informationsintegration II Data Cleansing Duplikaterkennung 7.05.004 Felix Naumann Überblick Motivation und Data Cleansing Prozess Datenfehler Edit Distance als Ähnlichkeitsmaß Sorted-Neighborhood Methode

Mehr

Fachbereich Informatik Praktikum 1

Fachbereich Informatik Praktikum 1 Hochschule Darmstadt DATA WAREHOUSE SS2015 Fachbereich Informatik Praktikum 1 Prof. Dr. S. Karczewski Dipl. Inf. Dipl. Math. Y. Orkunoglu Datum: 14.April.2015 1. Kurzbeschreibung In diesem Praktikum geht

Mehr

Integration lokaler Daten in ifuice

Integration lokaler Daten in ifuice : Integration lokaler Daten in ifuice Bearbeiter: Sarah Gebhardt Betreuer: Andreas Thor Seite 1 Motivation Warum eine Integration lokaler Daten? Viele Infos im Web, aber andere Listen im Web, aber nicht

Mehr

Datenintegration & Datenherkunft Verteilung, Autonomie, und Heterogenität

Datenintegration & Datenherkunft Verteilung, Autonomie, und Heterogenität Datenintegration & Datenherkunft Verteilung, Autonomie, und Wintersemester 2010/11 Melanie Herschel melanie.herschel@uni-tuebingen.de Lehrstuhl für Datenbanksysteme, Universität Tübingen 1 Klassifikation

Mehr

4. Objektrelationales Mapping Grundlagen der Programmierung II (Java)

4. Objektrelationales Mapping Grundlagen der Programmierung II (Java) 4. Objektrelationales Mapping Grundlagen der Programmierung II (Java) Prof. Dr. Bernhard Humm Hochschule Darmstadt University of Applied Sciences Sommersemester 2006 Übersicht Grundlagen der Programmierung

Mehr

Einführung in SQL. Sprachumfang: Indizes. Datensätzen. Zugriffsrechten

Einführung in SQL. Sprachumfang: Indizes. Datensätzen. Zugriffsrechten Einführung in SQL Die Sprache SQL (Structured Query Language) ist eine Programmiersprache für relationale Datenbanksysteme, die auf dem ANSI-SQL-Standard beruht. SQL wird heute von fast jedem Datenbanksystem

Mehr

Mengenvergleiche: Alle Konten außer das, mit dem größten Saldo.

Mengenvergleiche: Alle Konten außer das, mit dem größten Saldo. Mengenvergleiche: Mehr Möglichkeiten als der in-operator bietet der θany und der θall-operator, also der Vergleich mit irgendeinem oder jedem Tupel der Unteranfrage. Alle Konten außer das, mit dem größten

Mehr

Vorlesung Datenbankmanagementsysteme

Vorlesung Datenbankmanagementsysteme Vorlesung Datenbankmanagementsysteme SQL zur Datenanalyse & Einführung Online Analytical Processing (OLAP) (auf Basis von Oracle) Vorlesung Datenbankmanagementsysteme SQL zur Datenanalyse M. Lange, S.

Mehr

Michaela Weiss 01. April 2015. Lerneinheit 4: Relationale Datenbanken am Beispiel von MySQL

Michaela Weiss 01. April 2015. Lerneinheit 4: Relationale Datenbanken am Beispiel von MySQL Michaela Weiss 01. April 2015 Lerneinheit 4: Relationale Datenbanken am Beispiel von MySQL Seite 2 Datenbanken Allgemeines: Datenbank(management)systeme ermöglichen die Speicherung großer Datenmengen Kennzeichen

Mehr

Projektseminar Texttechnologische Informationsmodellierung

Projektseminar Texttechnologische Informationsmodellierung Projektseminar Texttechnologische Informationsmodellierung XQuery Ziele der Sitzung Nach dieser Sitzung sollten Sie: XQuery als wesentlichen Standard zur Abfrage von in XML kodierten Daten kennen Mit Hilfe

Mehr

30. Juni 2006 - Technische Universität Kaiserslautern. Paul R. Schilling

30. Juni 2006 - Technische Universität Kaiserslautern. Paul R. Schilling 30. Juni 2006 - Technische Universität Kaiserslautern Paul R. Schilling ! " #$% & '( ( ) *+, - '. / 0 1 2("$ DATEN SIND ALLGEGENWÄRTIG Bill Inmon, father of data warehousing Unternehmen In einer vollkommenen

Mehr

RE.one. Self Service Information Management für die Fachabteilung

RE.one. Self Service Information Management für die Fachabteilung RE.one Self Service Information Management für die Fachabteilung Das Ziel Verwertbare Informationen aus Daten gewinnen Unsere Vision Daten Info Data Warehousing radikal vereinfachen in einem Tool Die Aufgabe

Mehr

Informatik 12 Datenbanken SQL-Einführung

Informatik 12 Datenbanken SQL-Einführung Informatik 12 Datenbanken SQL-Einführung Gierhardt Vorbemerkungen Bisher haben wir Datenbanken nur über einzelne Tabellen kennen gelernt. Stehen mehrere Tabellen in gewissen Beziehungen zur Beschreibung

Mehr

Datenbanksysteme I. Klausur zum Praktikum. Mehrere Professoren prüfen mit genau einem Beisitzer genau einen Studenten.

Datenbanksysteme I. Klausur zum Praktikum. Mehrere Professoren prüfen mit genau einem Beisitzer genau einen Studenten. Lehrstuhl für Datenbanken und Informationssysteme Wintersemester 1999/2000 Universität Augsburg, Institut für Informatik 25. Februar 2000 Prof. Dr. Werner Kießling A. Leubner, M. Wagner Datenbanksysteme

Mehr

Allgemeines. veröffentlicht unter http://www.profv.de/uni/ lizensiert unter. Creative Commons BY-SA 3.0. XQuery in MS SQL Server 2005

Allgemeines. veröffentlicht unter http://www.profv.de/uni/ lizensiert unter. Creative Commons BY-SA 3.0. XQuery in MS SQL Server 2005 Volker Grabsch 14. Januar 2008 Allgemeines veröffentlicht unter http://www.profv.de/uni/ lizensiert unter Creative Commons BY-SA 3.0 Quelle Dieser Vortrag basiert auf dem Paper XQuery Implementation in

Mehr

Einleitung Projektion Selektion Join Mengenop. Vollst.keit. Einleitung Projektion. Selektion Join. Vollst.keit. Einleitung Projektion Selektion Join

Einleitung Projektion Selektion Join Mengenop. Vollst.keit. Einleitung Projektion. Selektion Join. Vollst.keit. Einleitung Projektion Selektion Join Parsen der Anfrage (SQL) Transformation in eine Standardform (Relationenalgebra) Logische Optimierung Transformation in alternative Zugriffspläne, Physische Optimierung Ausführung des gewählten Zugriffsplans

Mehr

Einführung relationale Datenbanken. Themenblock: Erstellung eines Cube. Schlüssel. Relationenmodell Relationenname Attribut. Problem.

Einführung relationale Datenbanken. Themenblock: Erstellung eines Cube. Schlüssel. Relationenmodell Relationenname Attribut. Problem. Themenblock: Erstellung eines Cube Einführung relationale Datenbanken Problem Verwaltung großer Mengen von Daten Praktikum: Data Warehousing und Data Mining Idee Speicherung der Daten in Form von Tabellen

Mehr

Objektrelationale und erweiterbare Datenbanksysteme

Objektrelationale und erweiterbare Datenbanksysteme Objektrelationale und erweiterbare Datenbanksysteme Erweiterbarkeit SQL:1999 (Objekt-relationale Modellierung) In der Vorlesung werden nur die Folien 1-12 behandelt. Kapitel 14 1 Konzepte objekt-relationaler

Mehr

Themenblock: Erstellung eines Cube

Themenblock: Erstellung eines Cube Themenblock: Erstellung eines Cube Praktikum: Data Warehousing und Data Mining Einführung relationale Datenbanken Problem Verwaltung großer Mengen von Daten Idee Speicherung der Daten in Form von Tabellen

Mehr

Speicherung von XML in (objekt-)relationalen Datenbanken. Burkhard Schäfer

Speicherung von XML in (objekt-)relationalen Datenbanken. Burkhard Schäfer Speicherung von XML in (objekt-)relationalen Datenbanken Burkhard Schäfer Übersicht Motivation Anforderungen Ansätze modellorientiert strukturorientiert Zusammenfassung Motivation Warum XML in Datenbanken

Mehr

XML in der Oracle Datenbank "relational and beyond"

XML in der Oracle Datenbank relational and beyond XML in der Oracle Datenbank "relational and beyond" Ulrike Schwinn (Ulrike.Schwinn@oracle.com) Oracle Deutschland GmbH Oracle XML DB Ein Überblick 1-1 Agenda Warum XML in der Datenbank? Unterschiedliche

Mehr

Kapitel 3: Datenbanksysteme

Kapitel 3: Datenbanksysteme LUDWIG- MAXIMILIANS- UNIVERSITY MUNICH DEPARTMENT INSTITUTE FOR INFORMATICS Skript zur Vorlesung: Einführung in die Informatik: Systeme und Anwendungen Sommersemester 2015 Kapitel 3: Datenbanksysteme Vorlesung:

Mehr

SQL. Abfragesprache Datenmanipulation - DML

SQL. Abfragesprache Datenmanipulation - DML SQL Abfragesprache Datenmanipulation - DML SQL DML-Operationen DML = Data Manipulation Language Sprache zur Veränderung der Daten Operationen Daten selektieren Daten einfügen Daten ändern Daten löschen

Mehr

OWB Repository Individuelle Reports. Ute Middendorf metafinanz - Informationssysteme GmbH

OWB Repository Individuelle Reports. Ute Middendorf metafinanz - Informationssysteme GmbH OWB Repository Individuelle Reports Ute Middendorf metafinanz - Informationssysteme GmbH Wir fokussieren mit unseren Services die Herausforderungen des Marktes und verbinden Mensch und IT Facing the future

Mehr

7. Übung - Datenbanken

7. Übung - Datenbanken 7. Übung - Datenbanken Informatik I für Verkehrsingenieure Aufgaben inkl. Beispiellösungen 1. Aufgabe: DBS a Was ist die Kernaufgabe von Datenbanksystemen? b Beschreiben Sie kurz die Abstraktionsebenen

Mehr

StructuredQueryLanguage(SQL)

StructuredQueryLanguage(SQL) StructuredQueryLanguage(SQL) Themen: ErstelenundÄndernvonTabelen AbfragenvonDaten Einfügen,ÄndernundLöschenvonDaten Erstelennutzerde niertersichten(views) 2012Claßen,Kempa,Morcinek 1/23 SQL Historie System

Mehr

Transformation Lifecycle Management mit Nautilus

Transformation Lifecycle Management mit Nautilus Transformation Lifecycle Management mit Nautilus Melanie Herschel Universität Tübingen melanie.herschel@uni-tuebingen.de IBM Böblingen 17. Februar, 2011 1 Agenda Vorstellung (the past) Datenherkunft (the

Mehr

IV. Datenbankmanagement

IV. Datenbankmanagement Wirtschaftsinformatik 2 (PWIN) IV. Datenbankmanagement Kapitel 2: Datenmanipulationssprache SQL Wirtschaftsinformatik 2 (PWIN) SS 2009, Professur für Mobile Business & Multilateral Security 1 Agenda 1.

Mehr

SQL Tutorial. SQL - Tutorial SS 06. Hubert Baumgartner. INSO - Industrial Software

SQL Tutorial. SQL - Tutorial SS 06. Hubert Baumgartner. INSO - Industrial Software SQL Tutorial SQL - Tutorial SS 06 Hubert Baumgartner INSO - Industrial Software Institut für Rechnergestützte Automation Fakultät für Informatik Technische Universität Wien Inhalt des Tutorials 1 2 3 4

Mehr

TU München, Fakultät für Informatik Lehrstuhl III: Datenbanksysteme Prof. Alfons Kemper, Ph.D.

TU München, Fakultät für Informatik Lehrstuhl III: Datenbanksysteme Prof. Alfons Kemper, Ph.D. TU München, Fakultät für Informatik Lehrstuhl III: Datenbanksysteme Prof. Alfons Kemper, Ph.D. Blatt Nr. 7 Übung zur Vorlesung Grundlagen: Datenbanken im WS13/14 Henrik Mühe (muehe@in.tum.de) http://www-db.in.tum.de/teaching/ws1314/dbsys/exercises/

Mehr

A) Durchsuchen von Datenbanken im Internet durch Endnote

A) Durchsuchen von Datenbanken im Internet durch Endnote EINLEITUNG/ANWEISUNGEN ZU DIESEM TEXT Wir werden die obere Liste (File/ Edit usw.) benutzen, obwohl die meisten Funktionen auch möglich mit rechtem Mausklick, mit Kombinationen der Tastatur oder mit den

Mehr

Data Cube. Aggregation in SQL. Beispiel: Autoverkäufe. On-line Analytical Processing (OLAP) 1. Einführung. 2. Aggregation in SQL, GROUP BY

Data Cube. Aggregation in SQL. Beispiel: Autoverkäufe. On-line Analytical Processing (OLAP) 1. Einführung. 2. Aggregation in SQL, GROUP BY Data Cube On-line Analytical Processing (OLAP). Einführung Ziel: Auffinden interessanter Muster in großen Datenmengen 2. Aggregation in SQL, GROUP BY 3. Probleme mit GROUP BY 4. Der Cube-Operator! Formulierung

Mehr

Wirtschaftsinformatik 2

Wirtschaftsinformatik 2 Wirtschaftsinformatik 2 Prof. Dr. Dr. L. Schmidt-Thieme MSc. André Busche Übung 4 1. Übungsblatt 4 2. Allgemeines zu XML 25.05.12 2/ Übungsblatt 4 Allgemeiner Hinweis: in den nachfolgenden SQL-Kommandos

Mehr

AS Path-Prepending in the Internet And Its Impact on Routing Decisions

AS Path-Prepending in the Internet And Its Impact on Routing Decisions (SEP) Its Impact on Routing Decisions Zhi Qi ytqz@mytum.de Advisor: Wolfgang Mühlbauer Lehrstuhl für Netzwerkarchitekturen Background Motivation BGP -> core routing protocol BGP relies on policy routing

Mehr

Listener: Bei Oracle erfolgt die Steuerung (konventionell) via listener.ora (Listener Konfiguration), tnsnames.ora (Client Konfiguration)

Listener: Bei Oracle erfolgt die Steuerung (konventionell) via listener.ora (Listener Konfiguration), tnsnames.ora (Client Konfiguration) Protokoll 1: Listener: Bei Oracle erfolgt die Steuerung (konventionell) via listener.ora (Listener Konfiguration), tnsnames.ora (Client Konfiguration) Abschnitt 2.1 (Ausführungen zum Shutdown / Startup)

Mehr

Web-Technologien. Prof. Dr. rer. nat. Nane Kratzke SQL. Praktische Informatik und betriebliche Informationssysteme

Web-Technologien. Prof. Dr. rer. nat. Nane Kratzke SQL. Praktische Informatik und betriebliche Informationssysteme Handout zur Unit Web-Technologien SQL 1 Prof. Dr. rer. nat. Nane Kratzke Praktische Informatik und betriebliche Informationssysteme Raum: 17-0.10 Tel.: 0451 300 5549 Email: nane.kratzke@fh-luebeck.de (Praktische

Mehr

9. Einführung in Datenbanken

9. Einführung in Datenbanken 9. Einführung in Datenbanken 9.1 Motivation und einführendes Beispiel 9.2 Modellierungskonzepte der realen Welt 9.3 Anfragesprachen (Query Languages) 9.1 Motivation und einführendes Beispiel Datenbanken

Mehr

105.3 SQL-Datenverwaltung

105.3 SQL-Datenverwaltung LPI-Zertifizierung 105.3 SQL-Datenverwaltung Copyright ( ) 2009 by Dr. W. Kicherer. This work is licensed under the Creative Commons Attribution-Noncommercial-Share Alike 2.0 Germany License. To view a

Mehr

Einführung in SQL. 1. Grundlagen SQL. Structured Query Language. Viele Dialekte. Unterteilung: i. DDL (Data Definition Language)

Einführung in SQL. 1. Grundlagen SQL. Structured Query Language. Viele Dialekte. Unterteilung: i. DDL (Data Definition Language) Einführung in SQL 1. Grundlagen Structured Query Language Viele Dialekte Unterteilung: i. DDL (Data Definition Language) ii. iii. DML (Data Modifing Language) DRL (Data Retrival Language) 1/12 2. DDL Data

Mehr

Datenintegration Datenreinigung Duplikate Fusion Qualität

Datenintegration Datenreinigung Duplikate Fusion Qualität Datenintegration Datenreinigung Duplikate Fusion Qualität Ein Vortrag von Janett Niendorf im Rahmen der integrierten Lehrveranstaltung: Integration Heterogener Informationssysteme (HIS) / SS 2009 /Dr.

Mehr

Hochschule Karlsruhe Technik und Wirtschaft- 10.7.2013. Anhänge: Fakultät für Informatik und Wirtschaftsinformatik SS 2013 Prof. Schmidt.

Hochschule Karlsruhe Technik und Wirtschaft- 10.7.2013. Anhänge: Fakultät für Informatik und Wirtschaftsinformatik SS 2013 Prof. Schmidt. Fakultät für Informatik und Wirtschaftsinformatik SS 2013 Datenbanken und Informationssysteme II Szenario: Projektverwaltung. Es gibt Projekte, Projektleiter, Mitarbeiter und ihre Zuordnung zu Projekten.

Mehr

bersicht Datenbanken und Datawarehouses Datenbank Datenbanksysteme Niels Schršter

bersicht Datenbanken und Datawarehouses Datenbank Datenbanksysteme Niels Schršter bersicht Niels Schršter EinfŸhrung GROUP BY Roll UpÔs Kreuztabellen Cubes Datenbank Ansammlung von Tabellen, die einen ãausschnitt der WeltÒ fÿr eine Benutzergruppe beschreiben. Sie beschreiben die funktionalen

Mehr

Hadoop Demo HDFS, Pig & Hive in Action. Oracle DWH Konferenz 2014 Carsten Herbe

Hadoop Demo HDFS, Pig & Hive in Action. Oracle DWH Konferenz 2014 Carsten Herbe Hadoop Demo HDFS, Pig & Hive in Action Oracle DWH Konferenz 2014 Carsten Herbe Wir wollen eine semi-strukturierte Textdatei in Hadoop verarbeiten und so aufbereiten, dass man die Daten relational speichern

Mehr

SQL structured query language

SQL structured query language Umfangreiche Datenmengen werden üblicherweise in relationalen Datenbank-Systemen (RDBMS) gespeichert Logische Struktur der Datenbank wird mittels Entity/Realtionship-Diagrammen dargestellt structured query

Mehr

Kompaktes Datenbank-Wissen rund um die Datenbank-Programmierung mit Transact-SQL

Kompaktes Datenbank-Wissen rund um die Datenbank-Programmierung mit Transact-SQL UnternehmensDatenbanken im Netzwerk Teil 3: SQL Programmierung - Grundlagen SQL-Befehle Funktionen Operatoren Datentypen Datenbank erstellen Tabellen SQL-Abfragen Autor: Rainer Egewardt Copyright Kompaktes

Mehr

Übung Datenbanksysteme I Transaktionen, Selektivität und XML. Thorsten Papenbrock

Übung Datenbanksysteme I Transaktionen, Selektivität und XML. Thorsten Papenbrock Übung Datenbanksysteme I Transaktionen, Selektivität und XML Thorsten Papenbrock Übersicht: Übungsthemen 2 Transaktionen Selektivität XML Thorsten Papenbrock Übung Datenbanksysteme I JDBC Transaktionen:

Mehr

SQL Teil 2. SELECT Projektion Selektion Vereinigung, Schnitt, Differenz Verbund Komplexer SELECT-Ausdruck

SQL Teil 2. SELECT Projektion Selektion Vereinigung, Schnitt, Differenz Verbund Komplexer SELECT-Ausdruck SELECT Projektion Selektion Vereinigung, Schnitt, Differenz Verbund Fahren fort mit SQL Befehlen. Bilden Relationenalgebra auf SQL ab. So Umsetzung von Anfragen an die DB (bzw. Tabellen) möglich. SELECT

Mehr

Datenbanken Wintersemester 11/12. Prof. Dr. W. May

Datenbanken Wintersemester 11/12. Prof. Dr. W. May AG Datenbanken und Informationssysteme Institut für Informatik Universität Göttingen Datenbanken Wintersemester 11/12 Prof. Dr. W. May 3. Übungsblatt: SQL Besprechung voraussichtlich am 20/21.12.2011 Aufgabe

Mehr

Website-Suche mit OpenText Web Site Management. Frank Steffen - Senior Product Manager

Website-Suche mit OpenText Web Site Management. Frank Steffen - Senior Product Manager Website-Suche mit OpenText Web Site Management Frank Steffen - Senior Product Manager Inhalt Überblick Konzepte der Suchmaschinenanbindung Verity K2 Anbindung Der neue OT Search Engine Connector Federated

Mehr

Die SQL-Syntax für den Befehl CREATE TABLE sieht folgendermassen aus:

Die SQL-Syntax für den Befehl CREATE TABLE sieht folgendermassen aus: Einführung in MySQL SQL (Structured Query Language) ist eine Computersprache zum Speichern, Bearbeiten und Abfragen von Daten in relationalen Datenbanken. Eine relationale Datenbank kann man sich als eine

Mehr

Objektrelationale Datenbanken

Objektrelationale Datenbanken Vorlesung Datenbanksysteme vom 26.11.2008 Objektrelationale Datenbanken Konzepte objektrelationaler DBs SQL:1999 OO vs. OR Konzepte objektrelationaler Datenbanken Große Objekte (LOBs: Large Objects) Mengenwertige

Mehr

Implementierung der XPath-Anfragesprache für XML-Daten in RDBMS unter Ausnutzung des Nummerierungsschemas DLN

Implementierung der XPath-Anfragesprache für XML-Daten in RDBMS unter Ausnutzung des Nummerierungsschemas DLN Vorstellung der Diplomarbeit Implementierung der XPath-Anfragesprache für XML-Daten in RDBMS unter Ausnutzung des Nummerierungsschemas DLN Oberseminar Datenbanken WS 05/06 Diplomand: Oliver Schmidt Betreuer:

Mehr

Object Relational Mapping Layer

Object Relational Mapping Layer Object Relational Mapping Layer Views Controlers Business logic GUI OO-application logic Object-relational-Mapping Relational DBMS PHP (propel) 1/18 Propel - Persistance Layer OR-Mapper für PHP Portierung

Mehr

Datenintegration & Datenherkunft Varianten der Data Provenance

Datenintegration & Datenherkunft Varianten der Data Provenance Datenintegration & Datenherkunft Varianten der Data Provenance Wintersemester 2010/11 Melanie Herschel melanie.herschel@uni-tuebingen.de Lehrstuhl für Datenbanksysteme, Universität Tübingen 1 Arten des

Mehr

Agenda. Einführung MS SQL Server Integration Services (SSIS) Oracle Data Warehouse Builder (OWB) Zusammenfassung Quellen. Einführung SSIS OWB

Agenda. Einführung MS SQL Server Integration Services (SSIS) Oracle Data Warehouse Builder (OWB) Zusammenfassung Quellen. Einführung SSIS OWB Agenda Einführung MS SQL Server Integration Services () Oracle Data Warehouse Builder () Quellen 10.12.2009 Martin Tobies - DQ Tools 2 Agenda Einführung MS SQL Server Integration Services () Oracle Data

Mehr

Vorlesung Informatik II

Vorlesung Informatik II Vorlesung Informatik II Universität Augsburg Wintersemester 2011/2012 Prof. Dr. Bernhard Bauer Folien von: Prof. Dr. Robert Lorenz Lehrprofessur für Informatik 08. Exkurs: Datenbanken 1 Motivation Datenbanksysteme

Mehr

Data-Warehouse-Technologien

Data-Warehouse-Technologien Data-Warehouse-Technologien Prof. Dr.-Ing. Kai-Uwe Sattler 1 Prof. Dr. Gunter Saake 2 1 TU Ilmenau FG Datenbanken & Informationssysteme 2 Universität Magdeburg Institut für Technische und Betriebliche

Mehr

Taschenbuch der Wirtschaftsinformatik und Wirtschaftsmathematik

Taschenbuch der Wirtschaftsinformatik und Wirtschaftsmathematik Taschenbuch der Wirtschaftsinformatik und Wirtschaftsmathematik von Wolfgang König, Heinrich Rommelfanger, Dietrich Ohse, Oliver Wendt, Markus Hofmann, Michael Schwind, Klaus Schäfer, Helmut Kuhnle, Andreas

Mehr

Datenbanktechnologie mit praktischen Übungen in MySQL und PHP

Datenbanktechnologie mit praktischen Übungen in MySQL und PHP Datenbanktechnologie mit praktischen Übungen in MySQL und PHP Übung, Sommersemester 2013 29. April 2013 - MySQL 2 Sebastian Cuy sebastian.cuy@uni-koeln.de Aufgaben Anmerkungen Best practice: SQL Befehle

Mehr

XQuery Implementation in a Relational Database System

XQuery Implementation in a Relational Database System Humboldt Universität zu Berlin Institut für Informatik XQuery Implementation in a Relational Database System VL XML, XPath, XQuery: Neue Konzepte für Datenbanken Jörg Pohle, pohle@informatik.hu-berlin.de

Mehr

mit Musterlösungen Prof. Dr. Gerd Stumme, Dipl.-Inform. Christoph Schmitz 11. Juni 2007

mit Musterlösungen Prof. Dr. Gerd Stumme, Dipl.-Inform. Christoph Schmitz 11. Juni 2007 6. Übung zur Vorlesung Datenbanken im Sommersemester 2007 mit Musterlösungen Prof. Dr. Gerd Stumme, Dipl.-Inform. Christoph Schmitz 11. Juni 2007 Aufgabe 1: Rekursion Betrachten Sie die folgende Tabelle

Mehr

SQL:2003 Neue Konzepte

SQL:2003 Neue Konzepte SQL:2003 Neue Konzepte Universität Bonn Seminar Intelligente Datenbanken Prof. Dr. R. Manthey / Andreas Behrend 14. Juni 2005 Gereon Schüller schuelle@informatik.uni-bonn.de Quellen Eisenberg, Andrew et

Mehr

Kapitel 33. Der xml-datentyp. In diesem Kapitel: Der xml-datentyp 996 Abfragen aus xml-datentypen 1001 XML-Indizierung 1017 Zusammenfassung 1023

Kapitel 33. Der xml-datentyp. In diesem Kapitel: Der xml-datentyp 996 Abfragen aus xml-datentypen 1001 XML-Indizierung 1017 Zusammenfassung 1023 Kapitel 33 Der xml-datentyp In diesem Kapitel: Der xml-datentyp 996 Abfragen aus xml-datentypen 1001 XML-Indizierung 1017 Zusammenfassung 1023 995 996 Kapitel 33: Der xml-datentyp Eine der wichtigsten

Mehr

Institut für Informatik

Institut für Informatik Aufgaben für die 14. und 15. zur LV "Grundlagen der Informatik" Thema: Datenbanken ( ERM: Entity-Relationship-Modell und SQL: Structured Query Language ) sowie HTML (Hypertext Markup Language) -------------------------------------------------------------------------------------------------------------------------

Mehr

Fortgeschrittene OLAP Analysemodelle

Fortgeschrittene OLAP Analysemodelle Fortgeschrittene OLAP Analysemodelle Jens Kübler Imperfektion und erweiterte Konzepte im Data Warehousing 2 Grundlagen - Datenanalyse Systemmodell Datenmodell Eingaben System Schätzer Datentypen Datenoperationen

Mehr

PHP + MySQL. Die MySQL-Datenbank. Hochschule Karlsruhe Technik & Wirtschaft Internet-Technologien T3B250 SS2014 Prof. Dipl.-Ing.

PHP + MySQL. Die MySQL-Datenbank. Hochschule Karlsruhe Technik & Wirtschaft Internet-Technologien T3B250 SS2014 Prof. Dipl.-Ing. PHP + MySQL Die MySQL-Datenbank Zusammenspiel Apache, PHP, PHPMyAdmin und MySQL PHPMyAdmin Verwaltungstool Nutzer Datei.php oder Datei.pl Apache HTTP-Server PHP Scriptsprache Perl Scriptsprache MySQL Datenbank

Mehr

Software-Engineering Einführung

Software-Engineering Einführung Software-Engineering Einführung 7. Übung (04.12.2014) Dr. Gergely Varró, gergely.varro@es.tu-darmstadt.de Erhan Leblebici, erhan.leblebici@es.tu-darmstadt.de Tel.+49 6151 16 4388 ES Real-Time Systems Lab

Mehr

Ausgangspunkt. Datenintegration. Ziel. Konflikte. Architekturen. Transparenz

Ausgangspunkt. Datenintegration. Ziel. Konflikte. Architekturen. Transparenz Ausgangspunkt Datenintegration Web Informationssysteme Wintersemester 2002/2003 Donald Kossmann Daten liegen in verschiedenen Datenquellen (Extremfall: jede URL eigene Datenquelle) Mietautos bei www.hertz.com

Mehr

Fakultät für Informatik & Wirtschaftsinformatik DB & IS II - SS 2015. Metadaten

Fakultät für Informatik & Wirtschaftsinformatik DB & IS II - SS 2015. Metadaten Fakultät für Informatik & Wirtschaftsinformatik Metadaten Metadaten sind Daten über Daten Data-Dictionary speichert Informationen über die Struktur der Daten, z.b.: Tabellen, Spalten, Datentypen Primär-

Mehr

Seminar in der Seminarreihe Business Intelligence 1. OLAP und Datawarehousing

Seminar in der Seminarreihe Business Intelligence 1. OLAP und Datawarehousing Seminar in der Seminarreihe Business Intelligence 1 OLAP und Datawarehousing OLAP & Warehousing Die wichtigsten Produkte Die Gliederung Produkt Bewertung & Vergleiche Die Marktentwicklung Der aktuelle

Mehr

4. Structured Query Language (SQL)

4. Structured Query Language (SQL) 4. Structured Query Language (SQL) Rückblick Konzeptuelles Modell (ERM) können wir nun in (wenige) Relationen übersetzen Relationale Algebra gibt uns eine Sprache an die Hand, mit der wir Anfragen auf

Mehr

DATENBANKEN SQL UND SQLITE VON MELANIE SCHLIEBENER

DATENBANKEN SQL UND SQLITE VON MELANIE SCHLIEBENER DATENBANKEN SQL UND SQLITE VON MELANIE SCHLIEBENER INHALTSVERZEICHNIS 1. Datenbanken 2. SQL 1.1 Sinn und Zweck 1.2 Definition 1.3 Modelle 1.4 Relationales Datenbankmodell 2.1 Definition 2.2 Befehle 3.

Mehr

SQL-Vertiefung. VU Datenbanksysteme. Reinhard Pichler

SQL-Vertiefung. VU Datenbanksysteme. Reinhard Pichler SQL-Vertiefung VU Datenbanksysteme Reinhard Pichler Arbeitsbereich Datenbanken und Artificial Intelligence Institut für Informationssysteme Technische Universität Wien Wintersemester 2015/16 Gliederung

Mehr

EINLEITUNG/ANWEISUNGEN ZU DIESEM TEXT

EINLEITUNG/ANWEISUNGEN ZU DIESEM TEXT Autoren: Georgius Tsoussis, Amely Ovelhey EINLEITUNG/ANWEISUNGEN ZU DIESEM TEXT Ziele der Nutzung von EndNote: - Referenzen sammeln und verwalten - Referenzen in ein (Word-)Dokument einfügen (in-text-citation

Mehr

Web Data Management Systeme

Web Data Management Systeme Web Data Management Systeme Seminar: Web-Qualitätsmanagement Arne Frenkel Agenda Einführung Suchsysteme Suchmaschinen & Meta-Suchmaschinen W3QS WebSQL WebLog Information Integration Systems Ariadne TSIMMIS

Mehr

Ulrike Schwinn Dipl.-Math. Oracle Deutschland GmbH. Kultur und Informatik - Datenverwaltung 04.Juli 2007

Ulrike Schwinn Dipl.-Math. Oracle Deutschland GmbH. Kultur und Informatik - Datenverwaltung 04.Juli 2007 ,QVHUW3LFWXUH+HUH! 1LFKWUHODWLRQDOH'DWHQLQGHU2UDFOH'DWHQEDQN Ulrike Schwinn Dipl.-Math. Oracle Deutschland GmbH Kultur und Informatik - Datenverwaltung 04.Juli 2007 'DWHQRUJDQLVDWLRQ *HWUHQQWH'DWHQKDOWXQJ

Mehr

cs242: Data Warehousing cs243: Datenbanken für Fortgeschrittene FS 2012

cs242: Data Warehousing cs243: Datenbanken für Fortgeschrittene FS 2012 UNIVERSITÄT BASEL Prof. Dr. Heiko Schuldt Ihab Al Kabary, MSc Ilir Fetai, MSc Nenad Stojnić, MSc Ivan Giangreco, BSc cs242: Data Warehousing cs243: Datenbanken für Fortgeschrittene FS 2012 Übung DW-4 Abgabe:

Mehr

Hibernate Search. Unterstützung laufender Java Projekte. Perfect Match Rent-a-team Coaching on the project Inhouse Outsourcing

Hibernate Search. Unterstützung laufender Java Projekte. Perfect Match Rent-a-team Coaching on the project Inhouse Outsourcing Orientation in Objects GmbH Weinheimer Str. 68 68309 Mannheim Version: 1.0 www.oio.de info@oio.de Java, XML und Open Source seit 1998 ) Software Factory ) ) Object Rangers ) ) Competence Center) Schlüsselfertige

Mehr

Die bisher bereits bekannten Aggregatsfunktionen MIN, MAX, SUM, AVG, COUNT, VARIANCE und STDDEV wurden um FIRST und LAST erweitert.

Die bisher bereits bekannten Aggregatsfunktionen MIN, MAX, SUM, AVG, COUNT, VARIANCE und STDDEV wurden um FIRST und LAST erweitert. Betrifft Autor FIRST, LAST Markus Jägle (markus.jaegle@trivadis.com) Art der Info Technische Background Info (April 2002) Quelle Aus dem NF9i-Kurs, NF9i-Techno-Circle der Trivadis und Oracle9i Data Warehousing

Mehr