Schema Matching und Integration

Größe: px
Ab Seite anzeigen:

Download "Schema Matching und Integration"

Transkript

1 und Integration Dr. Armin Roth arminroth.de Dr. Armin Roth (arminroth.de) II Schema Matching und Integr / 26

2 Agenda 1 Schema Matching 2 Schema Integration Dr. Armin Roth (arminroth.de) II Schema Matching und Integr / 26

3 Schema Matching Problemstellung Gegeben: Zwei Datenbankinstanzen mit jeweiligem Schema Gesucht: Korrespondenzen zwischen Elementen der Schemata (und optional den Daten (data-schema interplay)) (a) Source (b) Target Schema ID/IDREF Boston Hosptial + Montreal Hospital ID/IDREF Schema * Patient * Admission Progress Treat ID MedCr# Name Hist Admission * * * * Pulmonary Coronary PatRef Symptom Treatment Event AdmDate DisDate Desc Problem Date ID InsName Policy# Enter Leave Patient Date Desc ing two Heterogeneous Peer DTDs. Every unlabeled Quelle: edge [BCH is labeled + 05] Dr. Armin Roth (arminroth.de) II Schema Matching und Integr / 26

4 Schema Matching Motivation Große Schemas > 100 Tabellen, viele Attribute Bildschirm nicht lang genug Unübersichtliche Schemas Tiefe Schachtelungen Fremdschlüssel Bildschirm nicht breit genug XML Schema Fremde Schemas Unbekannte Synonyme Irreführende Schemas Unbekannte Homonyme Fremdsprachliche Schemas Kryptische Schemas Attributnamen < 8 Zeichen Tabellennamen < 8 Zeichen Dr. Armin Roth (arminroth.de) II Schema Matching und Integr / 26

5 Komplexe Schemata Schema Matching Man beachte die Scrollbar! Man beachte die Schachtelungstiefe! Dr. Armin Roth (arminroth.de) II Schema Matching und Integr / 26

6 Schema Matching Ansätze [RB01] Dr. Armin Roth (arminroth.de) II Schema Matching und Integr / 26

7 Schema Matching Klassifikation Schema Matching basierend auf Namen der Schemaelemente (label-based) Darunterliegende Daten (instance-based) Struktur des Schemas (structure-based) Mischformen Dr. Armin Roth (arminroth.de) II Schema Matching und Integr / 26

8 Schema Matching Label-based Gegeben: Zwei Schemata mit Attributmengen A und B Kernidee: Bilde Kreuzprodukt aller Attribute aus A und B Für jedes Paar: vergleiche Ähnlichkeit bzgl. Attributnamen (Label) anhand Ähnlichkeitsmaß (z.b. Edit distance für Zeichenketten) Ähnlichste Paare sind Matches Probleme: Effizienz Auswahl der besten Matches (globales Matching) Synonyme und Homonyme werden nicht erkannt Dr. Armin Roth (arminroth.de) II Schema Matching und Integr / 26

9 Schema Matching Instance-based Gegeben: Zwei Schemata mit Attributmengen A und B (jeweils mit darunterliegenden Daten) Kernidee: Für jedes Attribut: extrahiere interessante Eigenschaften der Daten (z.b. Buchstabenverteilung, Länge) Bilde Kreuzprodukt aller Attribute aus A und B Für jedes Paar: vergleiche Ähnlichkeit bzgl. der Eigenschaften Probleme: Auswahl der Eigenschaften Menge der Daten: Sampling? Vergleichsmethode (z.b. Naive Bayes) Gewichtung (Maschinelles Lernen) Dr. Armin Roth (arminroth.de) II Schema Matching und Integr / 26

10 Instance-based Verfahren Konventionelle Lösung: Vertikal Vergleich von Spalten Attribute classification Beispiel: [NHT + 02] Andere Lösung: Horizontal Vergleich von Tupeln Duplicate detection (trotz fehlender Attribut-Korrespondenzen) Attribut-Matching auf Basis der Duplikate Beispiel: [BN05] Dr. Armin Roth (arminroth.de) II Schema Matching und Integr / 26

11 Schema Matching Structure-based Gegeben: Zwei Schemata mit Attributmengen A und B Kernidee: Nutze (komplexe) Struktur des Schemas aus Hierarchieebene Elementtyp (Attribut, Relation,...) Nachbarschaftsbeziehungen Dr. Armin Roth (arminroth.de) II Schema Matching und Integr / 26

12 Beispiel: Similarity Flooding [MGMR02] Gegeben initiale Ähnlichkeit zwischen Schemaelementen (z.b. durch edit distance oder Instanzanalyse) Lasse Ähnlichkeiten abfärben auf die Nachbarn Nachbarn sind durch Struktur definiert Sind alle Nachbarn von x und y ähnlich zueinander, sind (vielleicht) auch x und y ein match Analogie: Man flutet das Netzwerk der Ähnlichkeiten bis ein Gleichgewicht erreicht ist Dr. Armin Roth (arminroth.de) II Schema Matching und Integr / 26

13 Schema Matching Mischformen Hybrid Gleichzeitige Anwendung mehrerer Techniken Beispiel: Instance-based + Datentypvergleich Composite Repertoire bekannter Techniken (inkl. hybrider Techniken) Kombination dieser unabhängigen Verfahren Beispiel: durch Gewichtung Beispiel: durch automatisches Lernen (bestes Verfahren, beste Gewichtung) Dr. Armin Roth (arminroth.de) II Schema Matching und Integr / 26

14 Schema Matching Weitere Anwendungen Herkömmlich: Korrespondenzen finden Schlüssel - Fremdschlüssel finden (ähnliche Attribute innerhalb eines Schemas sind gute Kandidaten) Höher-stufige Korrespondenzen finden (Ähnlichkeiten von Tabellen durch Aggregation der Matches ihrer Attribute) Dr. Armin Roth (arminroth.de) II Schema Matching und Integr / 26

15 Schema Matching Erweiterungen n : 1 und 1 : n Matches Viele Kombinationsmöglichkeiten Viele Funktionen denkbar (die Quell- in Zielwerte transformieren) Parsingregeln Matching in komplexen Schemata (Ziel: Finde Mapping, nicht (nur) Korrespondenzen) Globales Matching Matching von Tabellen und Schemata, nicht nur Attribute Stable Marriage bzw. Maximum Weighted Matching A B C D Dr. Armin Roth (arminroth.de) II Schema Matching und Integr / 26

16 Schema Matching Stable Marriage Gegeben: n Frauen (Attribute in Schema A) und m Männer (Attribute in Schema B) Monogamie: Je eine Frau kann nur mit je einem Mann verheiratet sein (nur 1:1 Matches) Jede Frau hat eine Rangliste der Männer und umgekehrt. Zum Schema Matching: Attribut-Ähnlichkeit gemäß eines der vorigen Verfahren Rangliste (normalerweise) symmetrisch Gesucht: Paarung (globales Matching), so dass niemals gilt: f 1 heiratet m 1, f 2 heiratet m 2 aber f 1 bevorzugt m 2 und m 2 bevorzugt f 1 (instabil!) Dr. Armin Roth (arminroth.de) II Schema Matching und Integr / 26

17 Schema Matching Stable Marriage Männer (1-4) Frauen (A-D) 1: B, D, A, C A: 2, 1, 4, 3 2: C, A, D, B B: 4, 3, 1, 2 3: B, C, A, D C: 1, 4, 3, 2 4: D, A, C, B D: 2, 1, 4, 3 1 stellt Antrag an B, sie willigt ein : (1, B) 2 stellt Antrag an C, sie willigt ein : (1, B) (2, C) 3 stellt Antrag an B, sie willigt ein und verlässt 1: (2, C) (3, B) 1 stellt Antrag an D, sie willigt ein : (1, D) (2, C) (3, B) 4 stellt Antrag an D, sie lehnt ab: (1, D) (2, C) (3, B) 4 stellt Antrag an A, sie willigt ein : (1, D) (2, C) (3, B) (4, A) Dr. Armin Roth (arminroth.de) II Schema Matching und Integr / 26

18 Maximum Weighted Matching Alternative zu Stable Marriage Suche Matching mit maximalem Gewicht in bipartiten Graphen Bipartit: Knoten in zwei Klassen (Quelle & Ziel) Kanten nur zwischen Knoten verschiedener Klassen (Korrespondenzen) Maximiere Summe der einzelnen Gewichte/Ähnlichkeiten Dr. Armin Roth (arminroth.de) II Schema Matching und Integr / 26

19 Zusammenfassung Schema Matching Schema Matching basierend auf Namen der Schemaelemente (label-based) Darunterliegende Daten (instance-based) Struktur des Schemas (structure-based) Mischformen, Meta-Matcher Globales Matching Dr. Armin Roth (arminroth.de) II Schema Matching und Integr / 26

20 Agenda Schema Integration 1 Schema Matching 2 Schema Integration Dr. Armin Roth (arminroth.de) II Schema Matching und Integr / 26

21 Schema Integration Schemaintegration Gegeben: mehrere Quellschemata Gesucht: ein integriertes Schema, das bestmöglich auf Quellschemata abbildbar ist Bottom-up-Entwurf Dazu: gemeinsames Datenmodell (evtl. Transformation der Quellschemata) Ziele [BLN86]: Vollständigkeit Minimalität Korrektheit Verständlichkeit Dr. Armin Roth (arminroth.de) II Schema Matching und Integr / 26

22 Schema Integration Schemaintegration Vorgehen Halbautomatischer Prozess Schritte [BLN86]: Vorintegration: Schemaauswahl, binäres oder n-äres Integrieren Schemavergleich: Schema Matching, Semantische und strukturelle Konflikte Schemaangleichung: Schema Mapping Schemafusion und Umstrukturierung Dr. Armin Roth (arminroth.de) II Schema Matching und Integr / 26

23 Schema Integration Korrespondenzbasierte Schemaintegration [SPD92] Korrespondenzen zwischen Elementen der zu integrierenden Schemata. Attribute, Konzepte oder Pfade Korrespondenzen geben semantische Beziehung der Elemente an: Äquivalenz, Überlapping,, Disjunktion Integrationsregeln 1 Übernehme Elemente ohne Entsprechung in anderen Schemata 2 Äquivalente Elemente mit Vereinigung der beiden Attributmengen übernehmen 3 Beziehungen zwischen äquivalenten Elementen übernehmen 4 Pfade zwischen äquivalenten Elementen übernehmen 5 Äquivalenzen zwischen Klassen und Attributen als Beziehungen übernehmen Dr. Armin Roth (arminroth.de) II Schema Matching und Integr / 26

24 Schema tribute Integration filmstudio und s_name. Dies liegt daran, da unterschiedlichen Beziehungen zu Filmen stehen: In de 5.1on Schemaintegration fuehrt_regie wird gespeichert, 117 wo ein Film gedreh Schema Integration Beispiel Dieses Studio muss z.b. nicht mit dem Studio überein den folgenden Abschnitten erläutern wirdas zunächst die Rechte die Zielean einem Film besitzt (oder was auch im enerellen Vorgehensweisen bei der Schemaintegration. rechte zu integrierende Dann Schema darstellte). n wir zwei ausgewählte Ansätze der Schemaintegration vor. Integriertes Schema: werden wir anhand der Schemata in Abbildung 5.2 verdeut-. Quellschemata: Abbildung 5.2 Zwei heterogene Schemata als Input zur Schemaintegration der Schemaintegration Quelle: Ulf Leser, Felix Naumann. Informationsintegration. dpunkt Verlag, 2006 [NL06] tegration Dr. Armin mehrerer Roth (arminroth.de) heterogener Schemata II Schema hat mehrere MatchingZie- und Integr / 26

25 Literatur I Schema Integration [BCH + 05] [BLN86] [BN05] [Len02] Angela Bonifati, Qing (Elaine) Chang, Terence Ho, Laks V.S. Lakshmanan, and Rachel Pottinger. HePToX: Marrying XML and heterogeneity in your P2P databases. In Proc. of the Int. Conf. on Very Large Databases (VLDB), Demo paper. C. Batini, M. Lenzerini, and S.B. Navathe. A comparative analysis of methodologies for database schema integration. ACM Computing Surveys, 18(4): , Alexander Bilke and Felix Naumann. Schema matching using duplicates. In Proc. of the Int. Conf. on Data Engineering (ICDE), Maurizio Lenzerini. Data integration: A theoretical perspective. In Proc. of the Symposium on Principles of Database Systems (PODS), (optional, sehr theoretisch). Dr. Armin Roth (arminroth.de) II Schema Matching und Integr / 26

26 Literatur II Schema Integration [MGMR02] Sergey Melnik, Hector Garcia-Molina, and Erhard Rahm. Similarity flooding: A versatile graph matching algorithm and its application to schema matching. In Proc. of the Int. Conf. on Data Engineering (ICDE), [NHT + 02] [NL06] [RB01] [SPD92] Felix Naumann, Ching-Tien Ho, Xuqing Tian, Laura Haas, and Nimrod Megiddo. Attribute classification using feature analysis. In Proc. of the Int. Conf. on Data Engineering (ICDE), Felix Naumann and Ulf Leser. Informationsintegration. dpunkt.verlag, In German. E. Rahm and P.A. Bernstein. A survey of approaches to automatic schema matching. The VLDB Journal, 10(4): , S. Spaccapietra, C. Parent, and Y. Dupont. Model independent assertions for integration of heterogeneous schemas. The VLDB Jounal, 1(1):81 126, Dr. Armin Roth (arminroth.de) II Schema Matching und Integr / 26

Schema Mapping. Dr. Armin Roth arminroth.de. Dr. Armin Roth (arminroth.de) II Schema Mapping / 23

Schema Mapping. Dr. Armin Roth arminroth.de. Dr. Armin Roth (arminroth.de) II Schema Mapping / 23 Dr. Armin Roth arminroth.de 25.04.2013 Dr. Armin Roth (arminroth.de) II Schema Mapping 25.04.2013 1 / 23 Agenda 1 Wiederholung: Schema Matching / Integration 2 Schema Mapping Definitionen Beispiel Algorithmus

Mehr

Informationsintegration

Informationsintegration Informationsintegration Schemaintegration Ulf Leser Wissensmanagement in der Bioinformatik Richtung Schemaintegration versus Anfragebearbeitung FDBS Schema integration Data source Data source Data source

Mehr

Schema Matching. Fabian Panse. Universität Hamburg. Komplexe Informationssysteme

Schema Matching. Fabian Panse. Universität Hamburg. Komplexe Informationssysteme Komplexe Informationssysteme Fabian Panse panse@informatik.uni-hamburg.de Universität Hamburg Schema Matching Fabian Panse Schema Matching 2 Schema Matching Problemstellung Gegeben: Zwei Datenbankinstanzen

Mehr

Schema Matching. Fabian Panse. Universität Hamburg. Komplexe Informationssysteme

Schema Matching. Fabian Panse. Universität Hamburg. Komplexe Informationssysteme Komplexe Informationssysteme Fabian Panse panse@informatik.uni-hamburg.de Universität Hamburg Schema Matching Fabian Panse Schema Matching 2 Schema Matching Problemstellung Gegeben: Zwei Datenbankinstanzen

Mehr

Informationsintegration

Informationsintegration Informationsintegration Schema Matching Ulf Leser Inhalt dieser Vorlesung Schema Matching Labelbasiert Instanzbasiert Strukturbasiert Erweiterungen Globales Matching Ulf Leser: Informationsintegration

Mehr

Duplikaterkennung. Dr. Armin Roth arminroth.de. Dr. Armin Roth (arminroth.de) II Duplikaterkennung / 17

Duplikaterkennung. Dr. Armin Roth arminroth.de. Dr. Armin Roth (arminroth.de) II Duplikaterkennung / 17 Dr. Armin Roth arminroth.de 27.04.2013 Dr. Armin Roth (arminroth.de) II Duplikaterkennung 27.04.2013 1 / 17 Agenda 1 Wiederholung: Datenwertintegration 2 Duplikaterkennung Dr. Armin Roth (arminroth.de)

Mehr

Schema Mapping. Armin Roth 25.04.2013. arminroth.de. Armin Roth (arminroth.de) II Schema Mapping 25.04.2013 1 / 23

Schema Mapping. Armin Roth 25.04.2013. arminroth.de. Armin Roth (arminroth.de) II Schema Mapping 25.04.2013 1 / 23 Schema Mapping Armin Roth arminroth.de 25.04.2013 Armin Roth (arminroth.de) II Schema Mapping 25.04.2013 1 / 23 Agenda 1 Wiederholung: Schema Mapping 2 Logische Mappings 3 Erzeugung der Anfragen Armin

Mehr

Duplikaterkennung und Datenfusion

Duplikaterkennung und Datenfusion Duplikaterkennung und Datenfusion Kolloquium Stuttgart, 6.7.2004 Felix Naumann Humboldt-Universität zu Berlin Humboldt-Universität zu Berlin 22.04.2004 Felix Naumann, Humboldt-Universität zu Berlin 2 Humboldt-Universität

Mehr

Modellbasierter Entwurf föderierter Informationssysteme

Modellbasierter Entwurf föderierter Informationssysteme Diese Arbeit baut auf auf eine Reihe von Vorarbeiten bei der Fachgruppe Computergestützte Informationssysteme der TU Berlin und am Fraunhofer ISST, die sich mit dem komplexen Gebiet der Definition, Verwaltung

Mehr

Beyond Information Integration: Content Merging Forschungskolloquium CIS/ISST

Beyond Information Integration: Content Merging Forschungskolloquium CIS/ISST Beyond Information Integration: Content Merging Forschungskolloquium CIS/ISST Felix Naumann naumann@informatik.hu-berlin.de Einige Untertitel Content Merging Objekt/Data Fusion Data Amalgamation Data Consolidation

Mehr

Konzeptueller Entwurf

Konzeptueller Entwurf Konzeptueller Entwurf UML Klassendiagrame UML Assoziationen Entspricht Beziehungen Optional: Assoziationsnamen Leserichtung ( oder ), sonst bidirektional Rollennamen Kardinalitätsrestriktionen UML Kardinalitätsrestriktionen

Mehr

Informationsintegration Schema Mapping Felix Naumann

Informationsintegration Schema Mapping Felix Naumann Informationsintegration Schema Mapping 8.5.2012 Felix Naumann Erste Hälfte 2 Problemstellung Einführung in die Informationsintegration Szenarien der Informationsintegration Verteilung und Autonomie Heterogenität

Mehr

Aktuelles Schlagwort Semi-strukturierte Daten

Aktuelles Schlagwort Semi-strukturierte Daten Aktuelles Schlagwort Semi-strukturierte Daten François Bry, Michael Kraus, Dan Olteanu und Sebastian Schaffert Institut für Informatik, Universität München, Oettingenstraße 67, 80538 München, http://www.pms.informatik.uni-muenchen.de

Mehr

Automatisiertes Auffinden von Präfix- und Suffix-Inklusionsabhängigkeiten in relationalen Datenbankmanagementsystemen

Automatisiertes Auffinden von Präfix- und Suffix-Inklusionsabhängigkeiten in relationalen Datenbankmanagementsystemen Automatisiertes Auffinden von Präfix- und Suffix-Inklusionsabhängigkeiten in relationalen Datenbankmanagementsystemen Exposé für eine Diplomarbeit Jan Hegewald Betreut von Jana Bauckmann 7. März 2007 1

Mehr

Satz 324 Sei M wie oben. Dann gibt es für ein geeignetes k Konstanten c i > 0 und Permutationsmatrizen P i, i = 1,...

Satz 324 Sei M wie oben. Dann gibt es für ein geeignetes k Konstanten c i > 0 und Permutationsmatrizen P i, i = 1,... Satz 324 Sei M wie oben. Dann gibt es für ein geeignetes k Konstanten c i > 0 und Permutationsmatrizen P i, i = 1,..., k, so dass gilt M = k c i P i i=1 k c i = r. i=1 Diskrete Strukturen 7.1 Matchings

Mehr

Database Schema Matching

Database Schema Matching Database Schema Matching Einführung - Ansätze - Algorithmus Seminar : Semantisches Web und Agenten WS 2006/2007 Ovidiu Vela 1 Schema Matching - Definition Identifikation von inhaltlichen Zusammenhängen

Mehr

Rückblick: Datenbankentwurf

Rückblick: Datenbankentwurf Rückblick: Datenbankentwurf Entity-Relationship-Modell für konzeptuellen Entwurf Entitytypen (entity types) (z.b. Studenten) Beziehungstypen (relationships) (z.b. hören) Attribute beschreiben Gegenstände

Mehr

Datenvorverarbeitung von nominalen Daten für Data Mining

Datenvorverarbeitung von nominalen Daten für Data Mining Datenvorverarbeitung von nominalen Daten für Data Mining Entstanden 2004/2005 bei der T-Systems International GmbH unter Betreuung von Prof. Dr. J. Fürnkranz Seite 1 Gliederung Datenvorverarbeitung Prepared

Mehr

Ausgabe: Eine DBMS unabhängige high-level Repräsentation der Anforderungen, das "konzeptuelle Schema".

Ausgabe: Eine DBMS unabhängige high-level Repräsentation der Anforderungen, das konzeptuelle Schema. Phasen des Datenbanken-Designs Konzeptuelles Design Eingabe: Anforderungen Ausgabe: Eine DBMS unabhängige high-level Repräsentation der Anforderungen, das "konzeptuelle Schema". Qualität: Richtigkeit und

Mehr

Cognitive Systems Master thesis

Cognitive Systems Master thesis Cognitive Systems Master thesis Recherche Phase SS 2011 Gliederung 1. Einleitung 2. Analogie Modelle 2.1 SME 2.2 Ava 2.3 Lisa 3. Zusammenfassung 4. Ausblick 2 Einleitung Analogie Problemsituation wird

Mehr

Semantische Datenintegration: Strategien zur Integration von Datenbanken

Semantische Datenintegration: Strategien zur Integration von Datenbanken Semantische Datenintegration: Strategien zur Integration von Datenbanken Inhalt 1. Wiederholung Integrationskonflikte 2. Klassische Strategien zur Integration 1. Eng gekoppelte Ansätze 2. Lose gekoppelte

Mehr

Anwendung von Vektormodell und boolschem Modell in Kombination

Anwendung von Vektormodell und boolschem Modell in Kombination Anwendung von Vektormodell und boolschem Modell in Kombination Julia Kreutzer Seminar Information Retrieval Institut für Computerlinguistik Universität Heidelberg 12.01.2015 Motivation Welche Filme sind

Mehr

Algorithmen und Komplexität

Algorithmen und Komplexität Algorithmen und Komplexität Dynamische Programmierung Markus Ullrich Norbert Baum Fachbereich Informatik - IIb07 Hochschule Zittau/Görlitz 28. Mai 2009 1 / 29 Wie sieht es mit langen Ketten aus? A 1 A

Mehr

Einführung in die Informatik II

Einführung in die Informatik II Einführung in die Informatik II Relationale Datenbanken und SQL Theorie und Anwendung Prof. Dr. Nikolaus Wulff Gründe für eine Datenbank Meist werden Daten nicht in XML-Dokumenten, sondern innerhalb einer

Mehr

Data Lakes: Lösung oder neue Herausforderung für Data-Integration

Data Lakes: Lösung oder neue Herausforderung für Data-Integration Data Lakes: Lösung oder neue Herausforderung für Big-Data Data-Integration Integration? PD Dr. Christoph Quix Fraunhofer-Institut für Angewandte Informationstechnik FIT Life Science Informatics Abteilungsleiter

Mehr

Extraktion, Transformation, Laden (ETL)

Extraktion, Transformation, Laden (ETL) Extraktion, Transformation, Laden (ETL) ETL-Prozeß Integrationsschritte Integrationsprobleme Konflikte und deren Klassifikation Behebung von Konflikten Data Cleaning Vorlesung Data-Warehouse-Technologien

Mehr

Schema Matching Seminar WS 2007/08 Themen & Organisation. Prof. Felix Naumann, Alexander Albrecht, Frank Kaufer, Melanie Weis

Schema Matching Seminar WS 2007/08 Themen & Organisation. Prof. Felix Naumann, Alexander Albrecht, Frank Kaufer, Melanie Weis Schema Matching Seminar WS 2007/08 Themen & Organisation Prof. Felix Naumann, Alexander Albrecht, Frank Kaufer, Melanie Weis Hasso-Plattner-Institut, Potsdam 24. Oktober 2007 Seminarmodus - klassisch Großes

Mehr

Universität Leipzig Fakultät für Mathematik und Informatik Institut für Informatik. Übersicht über Crowdsourcing-Ansätze und Plattformen

Universität Leipzig Fakultät für Mathematik und Informatik Institut für Informatik. Übersicht über Crowdsourcing-Ansätze und Plattformen Universität Leipzig Fakultät für Mathematik und Informatik Institut für Informatik Übersicht über Crowdsourcing-Ansätze und Plattformen zur Beurteilung von Matchergebnissen Bachelorarbeit Leipzig, Nov,

Mehr

Item-based Collaborative Filtering

Item-based Collaborative Filtering Item-based Collaborative Filtering Paper presentation Martin Krüger, Sebastian Kölle 28.04.2011 Seminar Collaborative Filtering KDD Cup 2011: Aufgabenbeschreibung Track 1 Item-based Collaborative Filtering

Mehr

3. Das Relationale Datenmodell

3. Das Relationale Datenmodell 3. Das Relationale Datenmodell Das Relationale Datenmodell geht zurück auf Codd (1970): E. F. Codd: A Relational Model of Data for Large Shared Data Banks. Comm. of the ACM 13(6): 377-387(1970) DBMS wie

Mehr

Lernmodul 2 Topologie. Lernmodul 2: Geoobjekte und ihre Modellierung - Topologie

Lernmodul 2 Topologie. Lernmodul 2: Geoobjekte und ihre Modellierung - Topologie Folie 1 von 71 Lernmodul 2 Topologie Folie 2 von 71 Topologie Übersicht Topologie - Allgemeines Punktmengentopologie Nachbarschaft Beispiele zur Nachbarschaft Nähe, offene/geschlossene Menge Abschluß,

Mehr

Anomaly Detection and Visualization in Generative RBAC Models

Anomaly Detection and Visualization in Generative RBAC Models Christopher Schmutzler Anomaly Detection and Visualization in Generative RBAC Models Advisor: Prof. Dr.-Ing. habil. Winfried E. Kühnhauser 1. Motivation In vielen Unternehmen ist RBAC der Standard für

Mehr

Wahlalgorithmen auf beliebigen Netzstrukturen. Verteilte Algorithmen (VA), WS 2003/04 43

Wahlalgorithmen auf beliebigen Netzstrukturen. Verteilte Algorithmen (VA), WS 2003/04 43 Wahlalgorithmen Überblick/Problemstellung Wahlalgorithmen auf Ringstrukturen Beispiel TokenRing Wahlalgorithmen auf Baumstrukturen Wahlalgorithmen auf beliebigen Netzstrukturen Verteilte Algorithmen (VA),

Mehr

Workshop zur INSPIRE Datenharmonisierung

Workshop zur INSPIRE Datenharmonisierung Workshop zur INSPIRE Datenharmonisierung TO 4.: Erarbeitung einer prototypischen Umsetzung anhand der protected sites Datenharmonisierung mit HALE Datenvalidierung mit Oxygen Roland Grillmayer / Gebhard

Mehr

Motivation des DRIVE-Projektes (Derivation of Vector Models)

Motivation des DRIVE-Projektes (Derivation of Vector Models) Automatische Ableitung von Stadtplänen aus großmaßstäbigen Geodaten im Kontext des Projekts DRIVE Ingo Petzold, Dirk Burghardt Universität Zürich, Schweiz Matthias Bobzien Axes Systems, Deutschland/Schweiz

Mehr

Integration, Migration und Evolution

Integration, Migration und Evolution 14. Mai 2013 Programm für heute 1 2 Quelle Das Material zu diesem Kapitel stammt aus der Vorlesung Datenintegration & Datenherkunft der Universität Tübingen gehalten von Melanie Herschel im WS 2010/11.

Mehr

Vollständige Attributliste der Testdatensätze

Vollständige Attributliste der Testdatensätze Anhang U. Draisbach, Partitionierung zur effi zienten Duplikaterkennung in relationalen Daten, DOI 10.1007/978-3-8348-8289-9, Vieweg+Teubner Verlag Springer Fachmedien Wiesbaden 2012 Vollständige Attributliste

Mehr

DATAFUSION IM MILCHVIEHSTALL

DATAFUSION IM MILCHVIEHSTALL Forschen und Prüfen für die Landwirtschaft Josephinum Research DATAFUSION IM MILCHVIEHSTALL Smart Farming und Nachhaltigkeit: Chancen und Herausforderungen 4. Agroscope-Nachhaltigkeitstagung Franz Handler,

Mehr

AutoSPARQL. Let Users Query Your Knowledge Base

AutoSPARQL. Let Users Query Your Knowledge Base AutoSPARQL Let Users Query Your Knowledge Base Christian Olczak Seminar aus maschinellem Lernen WS 11/12 Fachgebiet Knowledge Engineering Dr. Heiko Paulheim / Frederik Janssen 07.02.2012 Fachbereich Informatik

Mehr

Algorithmen zur Berechnung der Transitiven Hülle einer Datenbankrelation

Algorithmen zur Berechnung der Transitiven Hülle einer Datenbankrelation Algorithmen zur Berechnung der Transitiven Hülle einer Datenbankrelation Daniel Reinhold Shenja Leiser 6. Februar 2006 2/28 Gliederung Einführung Transitive Hülle Definition Iterative Algorithmen 1. Naive

Mehr

Servicebasierte Datenintegration

Servicebasierte Datenintegration Präsentation zur Seminararbeit Christoph Aßmann Aßmann, Christoph Leipzig, 26.01.2010 Folie 1 Inhalt Begriffe Motivation Abgrenzung Grid Cloud OGSA: Architektur servicebasierter Grids Standardisierung

Mehr

Verbesserte Nutzbarkeit heterogener und verteilter Geodaten durch Semantische Interoperabilität

Verbesserte Nutzbarkeit heterogener und verteilter Geodaten durch Semantische Interoperabilität Verbesserte Nutzbarkeit heterogener und verteilter Geodaten durch Semantische Interoperabilität Eva Klien 7. Seminar GIS & Internet 15. bis 17. September 2004 UniBwMünchen Überblick Semantische Heterogenitätsprobleme

Mehr

In diesem Abschnitt wollen wir uns mit dem Thema XML Datenbank beschäftigen. Das Ziel ist, herauszufinden, was XML Datenbank überhaupt sind und was

In diesem Abschnitt wollen wir uns mit dem Thema XML Datenbank beschäftigen. Das Ziel ist, herauszufinden, was XML Datenbank überhaupt sind und was 1 In diesem Abschnitt wollen wir uns mit dem Thema XML Datenbank beschäftigen. Das Ziel ist, herauszufinden, was XML Datenbank überhaupt sind und was die wichtigsten Konzepte sind. Den Themenbereich XML

Mehr

Flüsse, Schnitte, Bipartite Graphen II

Flüsse, Schnitte, Bipartite Graphen II Flüsse, Schnitte, Bipartite Graphen II Jonathan Hacker 06.06.2016 Jonathan Hacker Flüsse, Schnitte, Bipartite Graphen II 06.06.2016 1 / 42 Gliederung Einführung Jonathan Hacker Flüsse, Schnitte, Bipartite

Mehr

Maximizing the Spread of Influence through a Social Network

Maximizing the Spread of Influence through a Social Network 1 / 26 Maximizing the Spread of Influence through a Social Network 19.06.2007 / Thomas Wener TU-Darmstadt Seminar aus Data und Web Mining bei Prof. Fürnkranz 2 / 26 Gliederung Einleitung 1 Einleitung 2

Mehr

Medizininformatik Software Engineering

Medizininformatik Software Engineering Vorlesung Software Engineering Inhaltsverzeichnis 1. Einleitung 2. Software und Medizinprodukt 3. Vorgehensmodelle 4. Strukturierter Entwurf von Echtzeitsystemen 4.1 Echzeit, was ist das? 4.2 Einführung

Mehr

Datenintegration. Kapitel 6: Schemamanagement. Dr. Michael Hartung Sommersemester 2013

Datenintegration. Kapitel 6: Schemamanagement. Dr. Michael Hartung Sommersemester 2013 Datenintegration Datenintegration Kapitel 6: Schemamanagement Dr. Michael Hartung Sommersemester 2013 Universität Leipzig Institut für Informatik http://dbs.uni-leipzig.de 1 Inhalt Schemaintegration Erzeugung

Mehr

Kapitel Andere dynamische Datenstrukturen

Kapitel Andere dynamische Datenstrukturen Institute of Operating Systems and Computer Networks Algorithms Group Kapitel 4.8-4.11 Andere dynamische Datenstrukturen Algorithmen und Datenstrukturen Wintersemester 2017/2018 Vorlesung#13, 12.12.2017

Mehr

Entfernung von Duplikaten in Data Warehouses

Entfernung von Duplikaten in Data Warehouses Entfernung von Duplikaten in Data Warehouses Daniel Martens 11.09.2015, Informationsintegration, Seminar 1/41 Gliederung Problem & Motivation Domänen-unabhängige Verfahren Domänen-abhängige Verfahren DELPHI

Mehr

Kapitel 3: Eigenschaften von Integrationssystemen. Einordnung von Integrationssystemen bzgl. Kriterien zur Beschreibung von Integrationssystemen

Kapitel 3: Eigenschaften von Integrationssystemen. Einordnung von Integrationssystemen bzgl. Kriterien zur Beschreibung von Integrationssystemen Datenintegration Datenintegration Kapitel 3: Eigenschaften von Integrationssystemen Andreas Thor Sommersemester 2008 Universität Leipzig Institut für Informatik http://dbs.uni-leipzig.de 1 Inhalt Einordnung

Mehr

1. Einführung Seite 1. Kapitel 1: Einführung

1. Einführung Seite 1. Kapitel 1: Einführung 1. Einführung Seite 1 Kapitel 1: Einführung 1. Einführung Seite 2 Willkommen! Studierenden-Datenbank Hans Eifrig hat die Matrikelnummer 1223. Seine Adresse ist Seeweg 20. Er ist im zweiten Semester. Lisa

Mehr

Anfragebearbeitung LaV und PDMS

Anfragebearbeitung LaV und PDMS Anfragebearbeitung LaV und PDMS Dr. Armin Roth arminroth.de 25.06.2012 Dr. Armin Roth (arminroth.de) II Anfragebearbeitung LaV, PDMS 25.06.2012 1 / 26 Agenda 1 Anfragebearbeitung Local-as-View Nutzung

Mehr

30. Juni 2006 - Technische Universität Kaiserslautern. Paul R. Schilling

30. Juni 2006 - Technische Universität Kaiserslautern. Paul R. Schilling 30. Juni 2006 - Technische Universität Kaiserslautern Paul R. Schilling ! " #$% & '( ( ) *+, - '. / 0 1 2("$ DATEN SIND ALLGEGENWÄRTIG Bill Inmon, father of data warehousing Unternehmen In einer vollkommenen

Mehr

Analoges Problemlösen

Analoges Problemlösen Analoges Problemlösen Hauptseminar Planen und Problemlösen Gliederung 1. Begriffsbestimmungen 2. Komponenten des Analogieprozesses im Detail 3. Voraussetzungen für Analoges Problemlösen 4. Fazit 5. Fragen

Mehr

Informationsintegration

Informationsintegration Informationsintegration Local-as-View Anfrageplanung Ulf Leser Inhalt dieser Vorlesung Anfragekorrespondenzen Formale Definition Korrespondenztypen und -arten GaV erklärt Local as View Query Containment

Mehr

Algorithmische Bioinformatik 1

Algorithmische Bioinformatik 1 Algorithmische Bioinformatik 1 Dr. Hanjo Täubig Lehrstuhl für Effiziente Algorithmen (Prof. Dr. Ernst W. Mayr) Institut für Informatik Technische Universität München Sommersemester 2009 Übersicht Paarweises

Mehr

Abstrakt zum Vortrag im Oberseminar. Graphdatenbanken. Gero Kraus HTWK Leipzig 14. Juli 2015

Abstrakt zum Vortrag im Oberseminar. Graphdatenbanken. Gero Kraus HTWK Leipzig 14. Juli 2015 Abstrakt zum Vortrag im Oberseminar Graphdatenbanken Gero Kraus HTWK Leipzig 14. Juli 2015 1 Motivation Zur Darstellung komplexer Beziehungen bzw. Graphen sind sowohl relationale als auch NoSQL-Datenbanken

Mehr

Diskrete Strukturen Kapitel 4: Graphentheorie (Grundlagen)

Diskrete Strukturen Kapitel 4: Graphentheorie (Grundlagen) WS 2015/16 Diskrete Strukturen Kapitel 4: Graphentheorie (Grundlagen) Hans-Joachim Bungartz Lehrstuhl für wissenschaftliches Rechnen Fakultät für Informatik Technische Universität München http://www5.in.tum.de/wiki/index.php/diskrete_strukturen_-_winter_15

Mehr

P2P DATENBANKEN. Anwendungen 1 WS 2009/2010. Julissa Cusi Juarez. Department Informatik

P2P DATENBANKEN. Anwendungen 1 WS 2009/2010. Julissa Cusi Juarez. Department Informatik P2P DATENBANKEN Anwendungen 1 WS 2009/2010 Julissa Cusi Juarez Department Informatik HAW Hamburg 02.12.2009 1 Agenda 1. Motivation 2. Klassische Datenbanksysteme 3. Verteilte Datenbanksysteme 4. Peer to

Mehr

3rd IQ Best Practice Day 2007

3rd IQ Best Practice Day 2007 1 3rd IQ Best Practice Day 2007 Klaus Koch, Torsten Kaup, Felix Michels, Daniel Elsner, Bernhard Kurpicz, Dirk Malzahn Schema Matching Automatische Erkennung semantisch gleicher Attribute Frankfurt am

Mehr

Algorithmen auf Sequenzen Paarweiser Sequenzvergleich: Alignments

Algorithmen auf Sequenzen Paarweiser Sequenzvergleich: Alignments Algorithmen auf Sequenzen Paarweiser Sequenzvergleich: Alignments Sven Rahmann Genominformatik Universitätsklinikum Essen Universität Duisburg-Essen Universitätsallianz Ruhr Einführung Bisher: Berechnung

Mehr

Nutzung maschinellen Lernens zur Extraktion von Paragraphen aus PDF-Dokumenten

Nutzung maschinellen Lernens zur Extraktion von Paragraphen aus PDF-Dokumenten Nutzung maschinellen Lernens zur Extraktion von Paragraphen aus PDF-Dokumenten Albert-Ludwigs-Universität zu Freiburg 13.09.2016 Maximilian Dippel max.dippel@tf.uni-freiburg.de Überblick I Einführung Problemstellung

Mehr

Extraktion, Transformation, Laden (ETL)

Extraktion, Transformation, Laden (ETL) Extraktion, Transformation, Laden (ETL) ETL-Prozeß Integrationsschritte Integrationsprobleme fi Konflikte und deren Klassifikation fi Behebung von Konflikten Data Cleaning VL Data Warehouses, WS 2000/2001

Mehr

Dieser Foliensatz darf frei verwendet werden unter der Bedingung, dass diese Titelfolie nicht entfernt wird.

Dieser Foliensatz darf frei verwendet werden unter der Bedingung, dass diese Titelfolie nicht entfernt wird. Thomas Studer Relationale Datenbanken: Von den theoretischen Grundlagen zu Anwendungen mit PostgreSQL Springer, 2016 ISBN 978-3-662-46570-7 Dieser Foliensatz darf frei verwendet werden unter der Bedingung,

Mehr

Das relationale Datenmodell

Das relationale Datenmodell Das relationale Datenmodell Konzepte Attribute, Relationenschemata, Datenbank-Schemata Konsistenzbedingungen Beispiel-Datenbank Seite 1 Einführung Zweck datenmäßige Darstellung von Objekten und Beziehungen

Mehr

ANALYTICS, RISK MANAGEMENT & FINANCE ARCHITECTURE. NoSQL Datenbanksysteme Übersicht, Abgrenzung & Charakteristik

ANALYTICS, RISK MANAGEMENT & FINANCE ARCHITECTURE. NoSQL Datenbanksysteme Übersicht, Abgrenzung & Charakteristik ARFA ANALYTICS, RISK MANAGEMENT & FINANCE ARCHITECTURE NoSQL Datenbanksysteme Übersicht, Abgrenzung & Charakteristik Ralf Leipner Domain Architect Analytics, Risk Management & Finance 33. Berner Architekten

Mehr

Datenintegration. Kapitel 0: Organisatorisches. Dr. Anika Groß Sommersemester 2016

Datenintegration. Kapitel 0: Organisatorisches. Dr. Anika Groß Sommersemester 2016 Datenintegration Datenintegration Kapitel 0: Organisatorisches Dr. Anika Groß Sommersemester 2016 Universität Leipzig Institut für Informatik http://dbs.uni-leipzig.de 1 Organisatorisches Termin: donnerstags,

Mehr

Detecting Near Duplicates for Web Crawling

Detecting Near Duplicates for Web Crawling Detecting Near Duplicates for Web Crawling Gurmeet Singh Manku et al., WWW 2007* * 16th international conference on World Wide Web Detecting Near Duplicates for Web Crawling Finde near duplicates in großen

Mehr

Systems of Distinct Representatives

Systems of Distinct Representatives Systems of Distinct Representatives Seminar: Extremal Combinatorics Peter Fritz Lehr- und Forschungsgebiet Theoretische Informatik RWTH Aachen Systems of Distinct Representatives p. 1/41 Gliederung Einführung

Mehr

Die einzelnen Vorgehensweisen werden wir uns im folgenden näher ansehen.

Die einzelnen Vorgehensweisen werden wir uns im folgenden näher ansehen. 1 In diesem Abschnitt werden wir uns mit der Fragestellung beschäftigen, wie man überhaupt vorgeht, um Datenmodelle zu erstellen. Ziel ist es ja, ein Datenmodell zu erstellen, in dem wir verstehen, welche

Mehr

Kapitel 2: Das Relationale Modell

Kapitel 2: Das Relationale Modell Ludwig Maximilians Universität München Institut für Informatik Lehr- und Forschungseinheit für Datenbanksysteme Skript zur Vorlesung Wintersemester 2006/2007 Kapitel 2: Das Relationale Modell Vorlesung:

Mehr

Teil III. Komplexitätstheorie

Teil III. Komplexitätstheorie Teil III Komplexitätstheorie 125 / 160 Übersicht Die Klassen P und NP Die Klasse P Die Klassen NP NP-Vollständigkeit NP-Vollständige Probleme Weitere NP-vollständige Probleme 127 / 160 Die Klasse P Ein

Mehr

Überblick Felix Naumann. Zugriffsrechte Zugriffsrechte erzeugen Zugriffsrechte prüfen Zugriffsrechte vergeben Zugriffsrechte entziehen

Überblick Felix Naumann. Zugriffsrechte Zugriffsrechte erzeugen Zugriffsrechte prüfen Zugriffsrechte vergeben Zugriffsrechte entziehen Datenbanksysteme I Zugriffskontrolle (kleiner Einschub) 18.1.2007 Felix Naumann Überblick 2 Zugriffsrechte Zugriffsrechte erzeugen Zugriffsrechte prüfen Zugriffsrechte vergeben Zugriffsrechte entziehen

Mehr

Anwendungen des Fréchet-Abstandes Das Constrained Free Space Diagram zur Analyse von Körperbewegungen

Anwendungen des Fréchet-Abstandes Das Constrained Free Space Diagram zur Analyse von Körperbewegungen Anwendungen des Fréchet-Abstandes Das Constrained Free Space Diagram zur Analyse von Körperbewegungen David Knötel Freie Universität Berlin, Institut für Informatik Seminar über Algorithmen Leitfaden Wiederholung

Mehr

Methodik. zur prozessübergreifenden Integration. der Digitalen Fabrik. der Rechts- und Wirtschaftswissenschaftlichen Fakultät

Methodik. zur prozessübergreifenden Integration. der Digitalen Fabrik. der Rechts- und Wirtschaftswissenschaftlichen Fakultät Methodik zur prozessübergreifenden Integration der Digitalen Fabrik in bestehende Unternehmensstrukturen der Rechts- und Wirtschaftswissenschaftlichen Fakultät des Fachbereichs Wirtschaftswissenschaften

Mehr

Globalübungsaufgabe1 (All Pair Shortest Path):

Globalübungsaufgabe1 (All Pair Shortest Path): Prof. aa r. Ir. G. Woeginger atenstrukturen und lgorithmen SS7 Tutoriumslösung - Übung 0 (bgabe 2.07.207) T. Hartmann,. Korzeniewski,. Tauer Globalübungsaufgabe (ll Pair Shortest Path): etrachten Sie den

Mehr

Anwendung der Föderationsarchitektur und generischen Suche

Anwendung der Föderationsarchitektur und generischen Suche Förderkennzeichen 01UG1610A bis J Anwendung der Föderationsarchitektur und generischen Suche Workshop 2: Daten sammeln, modellieren und durchsuchen mit DARIAH-DE DHd 2017 Bern, 13.02.2017 Datum 1 Ablauf

Mehr

Minimal spannende Bäume

Minimal spannende Bäume http://www.uni-magdeburg.de/harbich/ Minimal spannende Fakultät für Informatik Otto-von-Guericke-Universität 2 Inhalt Definition Wege Untergraphen Kantengewichtete Graphen Minimal spannende Algorithmen

Mehr

NoSQL Graphdatenbanken mit HyperGraphDB. Tage der Datenbanken Donnerstag, Ludger Schönfeld, B. Sc. ludger.schoenfeld[at]smail.fh-koeln.

NoSQL Graphdatenbanken mit HyperGraphDB. Tage der Datenbanken Donnerstag, Ludger Schönfeld, B. Sc. ludger.schoenfeld[at]smail.fh-koeln. NoSQL Graphdatenbanken mit HyperGraphDB Tage der Datenbanken Donnerstag, 20.06.2013 Ludger Schönfeld, B. Sc. ludger.schoenfeld[at]smail.fh-koeln.de Agenda 1. Einleitung/Motivation 2. Graphendatenbanken

Mehr

Speicherung von XML in (objekt-)relationalen Datenbanken. Burkhard Schäfer

Speicherung von XML in (objekt-)relationalen Datenbanken. Burkhard Schäfer Speicherung von XML in (objekt-)relationalen Datenbanken Burkhard Schäfer Übersicht Motivation Anforderungen Ansätze modellorientiert strukturorientiert Zusammenfassung Motivation Warum XML in Datenbanken

Mehr

Graphentheorie. Vorkurs Informatik WS 2016/2017. Dennis Aumiller

Graphentheorie. Vorkurs Informatik WS 2016/2017. Dennis Aumiller Vorkurs Informatik WS 2016/2017 Dennis Aumiller Aumiller@stud.uni-heidelberg.de 14.10.2016 Über das Thema Wo alles begann Leider keine gesonderte Vorlesung dafür oft als Teilthema in anderen Vorlesungen

Mehr

Datenbankmodelle und Datenbanksprachen

Datenbankmodelle und Datenbanksprachen Datenbankmodelle und Datenbanksprachen Dr.-Ing. Guy Vollmer FH Dortmund, FB Informatik Dienstag, 30. September 2008 1 Agenda 1. Einordnung des Themas 2. Datenbankmodelle Relationales Datenmodell 3. Datenbanksprachen

Mehr

1 Business-Intelligence-Architektur 1

1 Business-Intelligence-Architektur 1 D3kjd3Di38lk323nnm xi 1 Business-Intelligence-Architektur 1 1.1 Data Warehouse....................................... 1 1.2 OLAP und mehrdimensionale Datenbanken.................. 4 1.3 Architekturvarianten....................................

Mehr

Extraktion, Transformation, Laden (ETL)

Extraktion, Transformation, Laden (ETL) Extraktion, Transformation, Laden (ETL) ƒ ETL-Prozeß ƒ Integrationsschritte ƒ Integrationsprobleme Konflikte und deren Klassifikation Behebung von Konflikten ƒ Data Cleaning Vorlesung Data-Warehouse-Technologien

Mehr

Domain-independent. independent Duplicate Detection. Vortrag von Marko Pilop & Jens Kleine. SE Data Cleansing

Domain-independent. independent Duplicate Detection. Vortrag von Marko Pilop & Jens Kleine. SE Data Cleansing SE Data Cleansing Domain-independent independent Duplicate Detection Vortrag von Marko Pilop & Jens Kleine http://www.informatik.hu-berlin.de/~pilop/didd.pdf {pilop jkleine}@informatik.hu-berlin.de 1.0

Mehr

Vorlesung DBIS I (WS 2005/2006) Teil 4

Vorlesung DBIS I (WS 2005/2006) Teil 4 otivation Das Relationenmodell Vorlesung Prof. Johann Christoph Freytag, Ph.D. Institut für Informatik Humboldt-Universität zu Berlin WS 2005/2006 Ziel des Relationenmodells Hoher Grad an Datenunabhängigkeit

Mehr

CLICK TO EDIT MASTER TITLE STYLE

CLICK TO EDIT MASTER TITLE STYLE CLICK TO EDIT MASTER TITLE STYLE AUTOMATISCHE ERZEUGUNG VON BENUTZEROBERFLÄCHEN UND DATENHALTUNG FÜR DIE KONFIGURATION VON FELDGERÄTEN Diplomverteidigung Betreuer (Firma ubigrate): Dipl.-Inform. Falk Hartmann

Mehr

Anpassung von Data-Warehouse-Techniken für den Einsatz unsicherer Verkehrsdaten

Anpassung von Data-Warehouse-Techniken für den Einsatz unsicherer Verkehrsdaten Diplomvortrag Anpassung von Data-Warehouse-Techniken für den entstanden im Rahmen des OVID-Projektes Institut für Programmstrukturen und Datenorganisation Verantwortlicher Betreuer: Prof. Dr.-Ing. Klemens

Mehr

WS 2015/16 Diskrete Strukturen Kapitel 4: Graphen (Matchings)

WS 2015/16 Diskrete Strukturen Kapitel 4: Graphen (Matchings) WS 2015/16 Diskrete Strukturen Kapitel 4: Graphen (Matchings) Hans-Joachim Bungartz Lehrstuhl für wissenschaftliches Rechnen Fakultät für Informatik Technische Universität München http://www5.in.tum.de/wiki/index.php/diskrete_strukturen_-_winter_15

Mehr

Common Warehouse Metamodel und Imperfektion

Common Warehouse Metamodel und Imperfektion Common Warehouse Metamodel und Imperfektion Christoph Goebel Imperfektion und erweiterte Konzepte im Data Warehousing 2 Fragestellungen Welche Bedeutung haben Metadaten in der Information Supply Chain

Mehr

SimPDM Datenmodell im Kontext zu Teamcenter und PLMXML

SimPDM Datenmodell im Kontext zu Teamcenter und PLMXML SimPDM Datenmodell im Kontext zu Teamcenter und PLMXML Vergleichsstudie Datentransfer PDM SDM Böblingen, 20. November 2008 Dietmar Gausselmann Zoran Petrovic Ulrich Deisenroth Agenda Einleitung / Motivation

Mehr

zu E 1 der Form (0, 1) erfüllen.

zu E 1 der Form (0, 1) erfüllen. 1 Aufgabe 4.1: Sei B ein Beziehungstyp über den drei Entitätstypen E 1, E 2 und E 3. Sei ohne Beschränkung der Allgemeinheit die Beziehungskomplexität zu E 1 der Form (0, 1). Wir zeigen, dass B durch die

Mehr

Web Data Management Systeme

Web Data Management Systeme Web Data Management Systeme Seminar: Web-Qualitätsmanagement Arne Frenkel Agenda Einführung Suchsysteme Suchmaschinen & Meta-Suchmaschinen W3QS WebSQL WebLog Information Integration Systems Ariadne TSIMMIS

Mehr

Formale Grundlagen der Informatik

Formale Grundlagen der Informatik Formale Grundlagen der Informatik / 2015 1 Die Elemente einer (endlichen) Menge sollen den Elementen einer zweiten, gleichmächtigen Menge zugeordnet werden Problemstellung Bipartite Graphen Zuordnungsprobleme

Mehr

Optimierung. Optimierung. Vorlesung 9 Lineare Programmierung & Kombinatorische Optimierung Fabian Kuhn

Optimierung. Optimierung. Vorlesung 9 Lineare Programmierung & Kombinatorische Optimierung Fabian Kuhn Optimierung Vorlesung 9 Lineare Programmierung & Kombinatorische Optimierung 1 Assignment Problem (Zuordnungsproblem) Gewichtetes Perfektes Bipartites Matching agents Costs tasks Weise jedem Agenten genau

Mehr

Distributed Algorithms. Image and Video Processing

Distributed Algorithms. Image and Video Processing Chapter 6 Optical Character Recognition Distributed Algorithms for Übersicht Motivation Texterkennung in Bildern und Videos 1. Erkennung von Textregionen/Textzeilen 2. Segmentierung einzelner Buchstaben

Mehr

Maschinelles Lernen: Symbolische Ansätze

Maschinelles Lernen: Symbolische Ansätze Maschinelles Lernen: Symbolische Ansätze Wintersemester 2009/2010 Musterlösung für das 9. Übungsblatt Aufgabe 1: Decision Trees Gegeben sei folgende Beispielmenge: Age Education Married Income Credit?

Mehr

Kapitel 7: Formaler Datenbankentwurf

Kapitel 7: Formaler Datenbankentwurf 7. Formaler Datenbankentwurf Seite 1 Kapitel 7: Formaler Datenbankentwurf Die Schwierigkeiten der konzeptuellen Modellierung sind zu einem großen Teil dadurch begründet, dass sich die relevanten Strukturen

Mehr