Schema Matching und Integration
|
|
- Emil Ritter
- vor 7 Jahren
- Abrufe
Transkript
1 und Integration Dr. Armin Roth arminroth.de Dr. Armin Roth (arminroth.de) II Schema Matching und Integr / 26
2 Agenda 1 Schema Matching 2 Schema Integration Dr. Armin Roth (arminroth.de) II Schema Matching und Integr / 26
3 Schema Matching Problemstellung Gegeben: Zwei Datenbankinstanzen mit jeweiligem Schema Gesucht: Korrespondenzen zwischen Elementen der Schemata (und optional den Daten (data-schema interplay)) (a) Source (b) Target Schema ID/IDREF Boston Hosptial + Montreal Hospital ID/IDREF Schema * Patient * Admission Progress Treat ID MedCr# Name Hist Admission * * * * Pulmonary Coronary PatRef Symptom Treatment Event AdmDate DisDate Desc Problem Date ID InsName Policy# Enter Leave Patient Date Desc ing two Heterogeneous Peer DTDs. Every unlabeled Quelle: edge [BCH is labeled + 05] Dr. Armin Roth (arminroth.de) II Schema Matching und Integr / 26
4 Schema Matching Motivation Große Schemas > 100 Tabellen, viele Attribute Bildschirm nicht lang genug Unübersichtliche Schemas Tiefe Schachtelungen Fremdschlüssel Bildschirm nicht breit genug XML Schema Fremde Schemas Unbekannte Synonyme Irreführende Schemas Unbekannte Homonyme Fremdsprachliche Schemas Kryptische Schemas Attributnamen < 8 Zeichen Tabellennamen < 8 Zeichen Dr. Armin Roth (arminroth.de) II Schema Matching und Integr / 26
5 Komplexe Schemata Schema Matching Man beachte die Scrollbar! Man beachte die Schachtelungstiefe! Dr. Armin Roth (arminroth.de) II Schema Matching und Integr / 26
6 Schema Matching Ansätze [RB01] Dr. Armin Roth (arminroth.de) II Schema Matching und Integr / 26
7 Schema Matching Klassifikation Schema Matching basierend auf Namen der Schemaelemente (label-based) Darunterliegende Daten (instance-based) Struktur des Schemas (structure-based) Mischformen Dr. Armin Roth (arminroth.de) II Schema Matching und Integr / 26
8 Schema Matching Label-based Gegeben: Zwei Schemata mit Attributmengen A und B Kernidee: Bilde Kreuzprodukt aller Attribute aus A und B Für jedes Paar: vergleiche Ähnlichkeit bzgl. Attributnamen (Label) anhand Ähnlichkeitsmaß (z.b. Edit distance für Zeichenketten) Ähnlichste Paare sind Matches Probleme: Effizienz Auswahl der besten Matches (globales Matching) Synonyme und Homonyme werden nicht erkannt Dr. Armin Roth (arminroth.de) II Schema Matching und Integr / 26
9 Schema Matching Instance-based Gegeben: Zwei Schemata mit Attributmengen A und B (jeweils mit darunterliegenden Daten) Kernidee: Für jedes Attribut: extrahiere interessante Eigenschaften der Daten (z.b. Buchstabenverteilung, Länge) Bilde Kreuzprodukt aller Attribute aus A und B Für jedes Paar: vergleiche Ähnlichkeit bzgl. der Eigenschaften Probleme: Auswahl der Eigenschaften Menge der Daten: Sampling? Vergleichsmethode (z.b. Naive Bayes) Gewichtung (Maschinelles Lernen) Dr. Armin Roth (arminroth.de) II Schema Matching und Integr / 26
10 Instance-based Verfahren Konventionelle Lösung: Vertikal Vergleich von Spalten Attribute classification Beispiel: [NHT + 02] Andere Lösung: Horizontal Vergleich von Tupeln Duplicate detection (trotz fehlender Attribut-Korrespondenzen) Attribut-Matching auf Basis der Duplikate Beispiel: [BN05] Dr. Armin Roth (arminroth.de) II Schema Matching und Integr / 26
11 Schema Matching Structure-based Gegeben: Zwei Schemata mit Attributmengen A und B Kernidee: Nutze (komplexe) Struktur des Schemas aus Hierarchieebene Elementtyp (Attribut, Relation,...) Nachbarschaftsbeziehungen Dr. Armin Roth (arminroth.de) II Schema Matching und Integr / 26
12 Beispiel: Similarity Flooding [MGMR02] Gegeben initiale Ähnlichkeit zwischen Schemaelementen (z.b. durch edit distance oder Instanzanalyse) Lasse Ähnlichkeiten abfärben auf die Nachbarn Nachbarn sind durch Struktur definiert Sind alle Nachbarn von x und y ähnlich zueinander, sind (vielleicht) auch x und y ein match Analogie: Man flutet das Netzwerk der Ähnlichkeiten bis ein Gleichgewicht erreicht ist Dr. Armin Roth (arminroth.de) II Schema Matching und Integr / 26
13 Schema Matching Mischformen Hybrid Gleichzeitige Anwendung mehrerer Techniken Beispiel: Instance-based + Datentypvergleich Composite Repertoire bekannter Techniken (inkl. hybrider Techniken) Kombination dieser unabhängigen Verfahren Beispiel: durch Gewichtung Beispiel: durch automatisches Lernen (bestes Verfahren, beste Gewichtung) Dr. Armin Roth (arminroth.de) II Schema Matching und Integr / 26
14 Schema Matching Weitere Anwendungen Herkömmlich: Korrespondenzen finden Schlüssel - Fremdschlüssel finden (ähnliche Attribute innerhalb eines Schemas sind gute Kandidaten) Höher-stufige Korrespondenzen finden (Ähnlichkeiten von Tabellen durch Aggregation der Matches ihrer Attribute) Dr. Armin Roth (arminroth.de) II Schema Matching und Integr / 26
15 Schema Matching Erweiterungen n : 1 und 1 : n Matches Viele Kombinationsmöglichkeiten Viele Funktionen denkbar (die Quell- in Zielwerte transformieren) Parsingregeln Matching in komplexen Schemata (Ziel: Finde Mapping, nicht (nur) Korrespondenzen) Globales Matching Matching von Tabellen und Schemata, nicht nur Attribute Stable Marriage bzw. Maximum Weighted Matching A B C D Dr. Armin Roth (arminroth.de) II Schema Matching und Integr / 26
16 Schema Matching Stable Marriage Gegeben: n Frauen (Attribute in Schema A) und m Männer (Attribute in Schema B) Monogamie: Je eine Frau kann nur mit je einem Mann verheiratet sein (nur 1:1 Matches) Jede Frau hat eine Rangliste der Männer und umgekehrt. Zum Schema Matching: Attribut-Ähnlichkeit gemäß eines der vorigen Verfahren Rangliste (normalerweise) symmetrisch Gesucht: Paarung (globales Matching), so dass niemals gilt: f 1 heiratet m 1, f 2 heiratet m 2 aber f 1 bevorzugt m 2 und m 2 bevorzugt f 1 (instabil!) Dr. Armin Roth (arminroth.de) II Schema Matching und Integr / 26
17 Schema Matching Stable Marriage Männer (1-4) Frauen (A-D) 1: B, D, A, C A: 2, 1, 4, 3 2: C, A, D, B B: 4, 3, 1, 2 3: B, C, A, D C: 1, 4, 3, 2 4: D, A, C, B D: 2, 1, 4, 3 1 stellt Antrag an B, sie willigt ein : (1, B) 2 stellt Antrag an C, sie willigt ein : (1, B) (2, C) 3 stellt Antrag an B, sie willigt ein und verlässt 1: (2, C) (3, B) 1 stellt Antrag an D, sie willigt ein : (1, D) (2, C) (3, B) 4 stellt Antrag an D, sie lehnt ab: (1, D) (2, C) (3, B) 4 stellt Antrag an A, sie willigt ein : (1, D) (2, C) (3, B) (4, A) Dr. Armin Roth (arminroth.de) II Schema Matching und Integr / 26
18 Maximum Weighted Matching Alternative zu Stable Marriage Suche Matching mit maximalem Gewicht in bipartiten Graphen Bipartit: Knoten in zwei Klassen (Quelle & Ziel) Kanten nur zwischen Knoten verschiedener Klassen (Korrespondenzen) Maximiere Summe der einzelnen Gewichte/Ähnlichkeiten Dr. Armin Roth (arminroth.de) II Schema Matching und Integr / 26
19 Zusammenfassung Schema Matching Schema Matching basierend auf Namen der Schemaelemente (label-based) Darunterliegende Daten (instance-based) Struktur des Schemas (structure-based) Mischformen, Meta-Matcher Globales Matching Dr. Armin Roth (arminroth.de) II Schema Matching und Integr / 26
20 Agenda Schema Integration 1 Schema Matching 2 Schema Integration Dr. Armin Roth (arminroth.de) II Schema Matching und Integr / 26
21 Schema Integration Schemaintegration Gegeben: mehrere Quellschemata Gesucht: ein integriertes Schema, das bestmöglich auf Quellschemata abbildbar ist Bottom-up-Entwurf Dazu: gemeinsames Datenmodell (evtl. Transformation der Quellschemata) Ziele [BLN86]: Vollständigkeit Minimalität Korrektheit Verständlichkeit Dr. Armin Roth (arminroth.de) II Schema Matching und Integr / 26
22 Schema Integration Schemaintegration Vorgehen Halbautomatischer Prozess Schritte [BLN86]: Vorintegration: Schemaauswahl, binäres oder n-äres Integrieren Schemavergleich: Schema Matching, Semantische und strukturelle Konflikte Schemaangleichung: Schema Mapping Schemafusion und Umstrukturierung Dr. Armin Roth (arminroth.de) II Schema Matching und Integr / 26
23 Schema Integration Korrespondenzbasierte Schemaintegration [SPD92] Korrespondenzen zwischen Elementen der zu integrierenden Schemata. Attribute, Konzepte oder Pfade Korrespondenzen geben semantische Beziehung der Elemente an: Äquivalenz, Überlapping,, Disjunktion Integrationsregeln 1 Übernehme Elemente ohne Entsprechung in anderen Schemata 2 Äquivalente Elemente mit Vereinigung der beiden Attributmengen übernehmen 3 Beziehungen zwischen äquivalenten Elementen übernehmen 4 Pfade zwischen äquivalenten Elementen übernehmen 5 Äquivalenzen zwischen Klassen und Attributen als Beziehungen übernehmen Dr. Armin Roth (arminroth.de) II Schema Matching und Integr / 26
24 Schema tribute Integration filmstudio und s_name. Dies liegt daran, da unterschiedlichen Beziehungen zu Filmen stehen: In de 5.1on Schemaintegration fuehrt_regie wird gespeichert, 117 wo ein Film gedreh Schema Integration Beispiel Dieses Studio muss z.b. nicht mit dem Studio überein den folgenden Abschnitten erläutern wirdas zunächst die Rechte die Zielean einem Film besitzt (oder was auch im enerellen Vorgehensweisen bei der Schemaintegration. rechte zu integrierende Dann Schema darstellte). n wir zwei ausgewählte Ansätze der Schemaintegration vor. Integriertes Schema: werden wir anhand der Schemata in Abbildung 5.2 verdeut-. Quellschemata: Abbildung 5.2 Zwei heterogene Schemata als Input zur Schemaintegration der Schemaintegration Quelle: Ulf Leser, Felix Naumann. Informationsintegration. dpunkt Verlag, 2006 [NL06] tegration Dr. Armin mehrerer Roth (arminroth.de) heterogener Schemata II Schema hat mehrere MatchingZie- und Integr / 26
25 Literatur I Schema Integration [BCH + 05] [BLN86] [BN05] [Len02] Angela Bonifati, Qing (Elaine) Chang, Terence Ho, Laks V.S. Lakshmanan, and Rachel Pottinger. HePToX: Marrying XML and heterogeneity in your P2P databases. In Proc. of the Int. Conf. on Very Large Databases (VLDB), Demo paper. C. Batini, M. Lenzerini, and S.B. Navathe. A comparative analysis of methodologies for database schema integration. ACM Computing Surveys, 18(4): , Alexander Bilke and Felix Naumann. Schema matching using duplicates. In Proc. of the Int. Conf. on Data Engineering (ICDE), Maurizio Lenzerini. Data integration: A theoretical perspective. In Proc. of the Symposium on Principles of Database Systems (PODS), (optional, sehr theoretisch). Dr. Armin Roth (arminroth.de) II Schema Matching und Integr / 26
26 Literatur II Schema Integration [MGMR02] Sergey Melnik, Hector Garcia-Molina, and Erhard Rahm. Similarity flooding: A versatile graph matching algorithm and its application to schema matching. In Proc. of the Int. Conf. on Data Engineering (ICDE), [NHT + 02] [NL06] [RB01] [SPD92] Felix Naumann, Ching-Tien Ho, Xuqing Tian, Laura Haas, and Nimrod Megiddo. Attribute classification using feature analysis. In Proc. of the Int. Conf. on Data Engineering (ICDE), Felix Naumann and Ulf Leser. Informationsintegration. dpunkt.verlag, In German. E. Rahm and P.A. Bernstein. A survey of approaches to automatic schema matching. The VLDB Journal, 10(4): , S. Spaccapietra, C. Parent, and Y. Dupont. Model independent assertions for integration of heterogeneous schemas. The VLDB Jounal, 1(1):81 126, Dr. Armin Roth (arminroth.de) II Schema Matching und Integr / 26
Schema Mapping. Dr. Armin Roth arminroth.de. Dr. Armin Roth (arminroth.de) II Schema Mapping / 23
Dr. Armin Roth arminroth.de 25.04.2013 Dr. Armin Roth (arminroth.de) II Schema Mapping 25.04.2013 1 / 23 Agenda 1 Wiederholung: Schema Matching / Integration 2 Schema Mapping Definitionen Beispiel Algorithmus
MehrInformationsintegration
Informationsintegration Schemaintegration Ulf Leser Wissensmanagement in der Bioinformatik Richtung Schemaintegration versus Anfragebearbeitung FDBS Schema integration Data source Data source Data source
MehrSchema Matching. Fabian Panse. Universität Hamburg. Komplexe Informationssysteme
Komplexe Informationssysteme Fabian Panse panse@informatik.uni-hamburg.de Universität Hamburg Schema Matching Fabian Panse Schema Matching 2 Schema Matching Problemstellung Gegeben: Zwei Datenbankinstanzen
MehrSchema Matching. Fabian Panse. Universität Hamburg. Komplexe Informationssysteme
Komplexe Informationssysteme Fabian Panse panse@informatik.uni-hamburg.de Universität Hamburg Schema Matching Fabian Panse Schema Matching 2 Schema Matching Problemstellung Gegeben: Zwei Datenbankinstanzen
MehrInformationsintegration
Informationsintegration Schema Matching Ulf Leser Inhalt dieser Vorlesung Schema Matching Labelbasiert Instanzbasiert Strukturbasiert Erweiterungen Globales Matching Ulf Leser: Informationsintegration
MehrDuplikaterkennung. Dr. Armin Roth arminroth.de. Dr. Armin Roth (arminroth.de) II Duplikaterkennung / 17
Dr. Armin Roth arminroth.de 27.04.2013 Dr. Armin Roth (arminroth.de) II Duplikaterkennung 27.04.2013 1 / 17 Agenda 1 Wiederholung: Datenwertintegration 2 Duplikaterkennung Dr. Armin Roth (arminroth.de)
MehrSchema Mapping. Armin Roth 25.04.2013. arminroth.de. Armin Roth (arminroth.de) II Schema Mapping 25.04.2013 1 / 23
Schema Mapping Armin Roth arminroth.de 25.04.2013 Armin Roth (arminroth.de) II Schema Mapping 25.04.2013 1 / 23 Agenda 1 Wiederholung: Schema Mapping 2 Logische Mappings 3 Erzeugung der Anfragen Armin
MehrDuplikaterkennung und Datenfusion
Duplikaterkennung und Datenfusion Kolloquium Stuttgart, 6.7.2004 Felix Naumann Humboldt-Universität zu Berlin Humboldt-Universität zu Berlin 22.04.2004 Felix Naumann, Humboldt-Universität zu Berlin 2 Humboldt-Universität
MehrModellbasierter Entwurf föderierter Informationssysteme
Diese Arbeit baut auf auf eine Reihe von Vorarbeiten bei der Fachgruppe Computergestützte Informationssysteme der TU Berlin und am Fraunhofer ISST, die sich mit dem komplexen Gebiet der Definition, Verwaltung
MehrBeyond Information Integration: Content Merging Forschungskolloquium CIS/ISST
Beyond Information Integration: Content Merging Forschungskolloquium CIS/ISST Felix Naumann naumann@informatik.hu-berlin.de Einige Untertitel Content Merging Objekt/Data Fusion Data Amalgamation Data Consolidation
MehrKonzeptueller Entwurf
Konzeptueller Entwurf UML Klassendiagrame UML Assoziationen Entspricht Beziehungen Optional: Assoziationsnamen Leserichtung ( oder ), sonst bidirektional Rollennamen Kardinalitätsrestriktionen UML Kardinalitätsrestriktionen
MehrInformationsintegration Schema Mapping Felix Naumann
Informationsintegration Schema Mapping 8.5.2012 Felix Naumann Erste Hälfte 2 Problemstellung Einführung in die Informationsintegration Szenarien der Informationsintegration Verteilung und Autonomie Heterogenität
MehrAktuelles Schlagwort Semi-strukturierte Daten
Aktuelles Schlagwort Semi-strukturierte Daten François Bry, Michael Kraus, Dan Olteanu und Sebastian Schaffert Institut für Informatik, Universität München, Oettingenstraße 67, 80538 München, http://www.pms.informatik.uni-muenchen.de
MehrAutomatisiertes Auffinden von Präfix- und Suffix-Inklusionsabhängigkeiten in relationalen Datenbankmanagementsystemen
Automatisiertes Auffinden von Präfix- und Suffix-Inklusionsabhängigkeiten in relationalen Datenbankmanagementsystemen Exposé für eine Diplomarbeit Jan Hegewald Betreut von Jana Bauckmann 7. März 2007 1
MehrSatz 324 Sei M wie oben. Dann gibt es für ein geeignetes k Konstanten c i > 0 und Permutationsmatrizen P i, i = 1,...
Satz 324 Sei M wie oben. Dann gibt es für ein geeignetes k Konstanten c i > 0 und Permutationsmatrizen P i, i = 1,..., k, so dass gilt M = k c i P i i=1 k c i = r. i=1 Diskrete Strukturen 7.1 Matchings
MehrDatabase Schema Matching
Database Schema Matching Einführung - Ansätze - Algorithmus Seminar : Semantisches Web und Agenten WS 2006/2007 Ovidiu Vela 1 Schema Matching - Definition Identifikation von inhaltlichen Zusammenhängen
MehrRückblick: Datenbankentwurf
Rückblick: Datenbankentwurf Entity-Relationship-Modell für konzeptuellen Entwurf Entitytypen (entity types) (z.b. Studenten) Beziehungstypen (relationships) (z.b. hören) Attribute beschreiben Gegenstände
MehrDatenvorverarbeitung von nominalen Daten für Data Mining
Datenvorverarbeitung von nominalen Daten für Data Mining Entstanden 2004/2005 bei der T-Systems International GmbH unter Betreuung von Prof. Dr. J. Fürnkranz Seite 1 Gliederung Datenvorverarbeitung Prepared
MehrAusgabe: Eine DBMS unabhängige high-level Repräsentation der Anforderungen, das "konzeptuelle Schema".
Phasen des Datenbanken-Designs Konzeptuelles Design Eingabe: Anforderungen Ausgabe: Eine DBMS unabhängige high-level Repräsentation der Anforderungen, das "konzeptuelle Schema". Qualität: Richtigkeit und
MehrCognitive Systems Master thesis
Cognitive Systems Master thesis Recherche Phase SS 2011 Gliederung 1. Einleitung 2. Analogie Modelle 2.1 SME 2.2 Ava 2.3 Lisa 3. Zusammenfassung 4. Ausblick 2 Einleitung Analogie Problemsituation wird
MehrSemantische Datenintegration: Strategien zur Integration von Datenbanken
Semantische Datenintegration: Strategien zur Integration von Datenbanken Inhalt 1. Wiederholung Integrationskonflikte 2. Klassische Strategien zur Integration 1. Eng gekoppelte Ansätze 2. Lose gekoppelte
MehrAnwendung von Vektormodell und boolschem Modell in Kombination
Anwendung von Vektormodell und boolschem Modell in Kombination Julia Kreutzer Seminar Information Retrieval Institut für Computerlinguistik Universität Heidelberg 12.01.2015 Motivation Welche Filme sind
MehrAlgorithmen und Komplexität
Algorithmen und Komplexität Dynamische Programmierung Markus Ullrich Norbert Baum Fachbereich Informatik - IIb07 Hochschule Zittau/Görlitz 28. Mai 2009 1 / 29 Wie sieht es mit langen Ketten aus? A 1 A
MehrEinführung in die Informatik II
Einführung in die Informatik II Relationale Datenbanken und SQL Theorie und Anwendung Prof. Dr. Nikolaus Wulff Gründe für eine Datenbank Meist werden Daten nicht in XML-Dokumenten, sondern innerhalb einer
MehrData Lakes: Lösung oder neue Herausforderung für Data-Integration
Data Lakes: Lösung oder neue Herausforderung für Big-Data Data-Integration Integration? PD Dr. Christoph Quix Fraunhofer-Institut für Angewandte Informationstechnik FIT Life Science Informatics Abteilungsleiter
MehrExtraktion, Transformation, Laden (ETL)
Extraktion, Transformation, Laden (ETL) ETL-Prozeß Integrationsschritte Integrationsprobleme Konflikte und deren Klassifikation Behebung von Konflikten Data Cleaning Vorlesung Data-Warehouse-Technologien
MehrSchema Matching Seminar WS 2007/08 Themen & Organisation. Prof. Felix Naumann, Alexander Albrecht, Frank Kaufer, Melanie Weis
Schema Matching Seminar WS 2007/08 Themen & Organisation Prof. Felix Naumann, Alexander Albrecht, Frank Kaufer, Melanie Weis Hasso-Plattner-Institut, Potsdam 24. Oktober 2007 Seminarmodus - klassisch Großes
MehrUniversität Leipzig Fakultät für Mathematik und Informatik Institut für Informatik. Übersicht über Crowdsourcing-Ansätze und Plattformen
Universität Leipzig Fakultät für Mathematik und Informatik Institut für Informatik Übersicht über Crowdsourcing-Ansätze und Plattformen zur Beurteilung von Matchergebnissen Bachelorarbeit Leipzig, Nov,
MehrItem-based Collaborative Filtering
Item-based Collaborative Filtering Paper presentation Martin Krüger, Sebastian Kölle 28.04.2011 Seminar Collaborative Filtering KDD Cup 2011: Aufgabenbeschreibung Track 1 Item-based Collaborative Filtering
Mehr3. Das Relationale Datenmodell
3. Das Relationale Datenmodell Das Relationale Datenmodell geht zurück auf Codd (1970): E. F. Codd: A Relational Model of Data for Large Shared Data Banks. Comm. of the ACM 13(6): 377-387(1970) DBMS wie
MehrLernmodul 2 Topologie. Lernmodul 2: Geoobjekte und ihre Modellierung - Topologie
Folie 1 von 71 Lernmodul 2 Topologie Folie 2 von 71 Topologie Übersicht Topologie - Allgemeines Punktmengentopologie Nachbarschaft Beispiele zur Nachbarschaft Nähe, offene/geschlossene Menge Abschluß,
MehrAnomaly Detection and Visualization in Generative RBAC Models
Christopher Schmutzler Anomaly Detection and Visualization in Generative RBAC Models Advisor: Prof. Dr.-Ing. habil. Winfried E. Kühnhauser 1. Motivation In vielen Unternehmen ist RBAC der Standard für
MehrWahlalgorithmen auf beliebigen Netzstrukturen. Verteilte Algorithmen (VA), WS 2003/04 43
Wahlalgorithmen Überblick/Problemstellung Wahlalgorithmen auf Ringstrukturen Beispiel TokenRing Wahlalgorithmen auf Baumstrukturen Wahlalgorithmen auf beliebigen Netzstrukturen Verteilte Algorithmen (VA),
MehrWorkshop zur INSPIRE Datenharmonisierung
Workshop zur INSPIRE Datenharmonisierung TO 4.: Erarbeitung einer prototypischen Umsetzung anhand der protected sites Datenharmonisierung mit HALE Datenvalidierung mit Oxygen Roland Grillmayer / Gebhard
MehrMotivation des DRIVE-Projektes (Derivation of Vector Models)
Automatische Ableitung von Stadtplänen aus großmaßstäbigen Geodaten im Kontext des Projekts DRIVE Ingo Petzold, Dirk Burghardt Universität Zürich, Schweiz Matthias Bobzien Axes Systems, Deutschland/Schweiz
MehrIntegration, Migration und Evolution
14. Mai 2013 Programm für heute 1 2 Quelle Das Material zu diesem Kapitel stammt aus der Vorlesung Datenintegration & Datenherkunft der Universität Tübingen gehalten von Melanie Herschel im WS 2010/11.
MehrVollständige Attributliste der Testdatensätze
Anhang U. Draisbach, Partitionierung zur effi zienten Duplikaterkennung in relationalen Daten, DOI 10.1007/978-3-8348-8289-9, Vieweg+Teubner Verlag Springer Fachmedien Wiesbaden 2012 Vollständige Attributliste
MehrDATAFUSION IM MILCHVIEHSTALL
Forschen und Prüfen für die Landwirtschaft Josephinum Research DATAFUSION IM MILCHVIEHSTALL Smart Farming und Nachhaltigkeit: Chancen und Herausforderungen 4. Agroscope-Nachhaltigkeitstagung Franz Handler,
MehrAutoSPARQL. Let Users Query Your Knowledge Base
AutoSPARQL Let Users Query Your Knowledge Base Christian Olczak Seminar aus maschinellem Lernen WS 11/12 Fachgebiet Knowledge Engineering Dr. Heiko Paulheim / Frederik Janssen 07.02.2012 Fachbereich Informatik
MehrAlgorithmen zur Berechnung der Transitiven Hülle einer Datenbankrelation
Algorithmen zur Berechnung der Transitiven Hülle einer Datenbankrelation Daniel Reinhold Shenja Leiser 6. Februar 2006 2/28 Gliederung Einführung Transitive Hülle Definition Iterative Algorithmen 1. Naive
MehrServicebasierte Datenintegration
Präsentation zur Seminararbeit Christoph Aßmann Aßmann, Christoph Leipzig, 26.01.2010 Folie 1 Inhalt Begriffe Motivation Abgrenzung Grid Cloud OGSA: Architektur servicebasierter Grids Standardisierung
MehrVerbesserte Nutzbarkeit heterogener und verteilter Geodaten durch Semantische Interoperabilität
Verbesserte Nutzbarkeit heterogener und verteilter Geodaten durch Semantische Interoperabilität Eva Klien 7. Seminar GIS & Internet 15. bis 17. September 2004 UniBwMünchen Überblick Semantische Heterogenitätsprobleme
MehrIn diesem Abschnitt wollen wir uns mit dem Thema XML Datenbank beschäftigen. Das Ziel ist, herauszufinden, was XML Datenbank überhaupt sind und was
1 In diesem Abschnitt wollen wir uns mit dem Thema XML Datenbank beschäftigen. Das Ziel ist, herauszufinden, was XML Datenbank überhaupt sind und was die wichtigsten Konzepte sind. Den Themenbereich XML
MehrFlüsse, Schnitte, Bipartite Graphen II
Flüsse, Schnitte, Bipartite Graphen II Jonathan Hacker 06.06.2016 Jonathan Hacker Flüsse, Schnitte, Bipartite Graphen II 06.06.2016 1 / 42 Gliederung Einführung Jonathan Hacker Flüsse, Schnitte, Bipartite
MehrMaximizing the Spread of Influence through a Social Network
1 / 26 Maximizing the Spread of Influence through a Social Network 19.06.2007 / Thomas Wener TU-Darmstadt Seminar aus Data und Web Mining bei Prof. Fürnkranz 2 / 26 Gliederung Einleitung 1 Einleitung 2
MehrMedizininformatik Software Engineering
Vorlesung Software Engineering Inhaltsverzeichnis 1. Einleitung 2. Software und Medizinprodukt 3. Vorgehensmodelle 4. Strukturierter Entwurf von Echtzeitsystemen 4.1 Echzeit, was ist das? 4.2 Einführung
MehrDatenintegration. Kapitel 6: Schemamanagement. Dr. Michael Hartung Sommersemester 2013
Datenintegration Datenintegration Kapitel 6: Schemamanagement Dr. Michael Hartung Sommersemester 2013 Universität Leipzig Institut für Informatik http://dbs.uni-leipzig.de 1 Inhalt Schemaintegration Erzeugung
MehrKapitel Andere dynamische Datenstrukturen
Institute of Operating Systems and Computer Networks Algorithms Group Kapitel 4.8-4.11 Andere dynamische Datenstrukturen Algorithmen und Datenstrukturen Wintersemester 2017/2018 Vorlesung#13, 12.12.2017
MehrEntfernung von Duplikaten in Data Warehouses
Entfernung von Duplikaten in Data Warehouses Daniel Martens 11.09.2015, Informationsintegration, Seminar 1/41 Gliederung Problem & Motivation Domänen-unabhängige Verfahren Domänen-abhängige Verfahren DELPHI
MehrKapitel 3: Eigenschaften von Integrationssystemen. Einordnung von Integrationssystemen bzgl. Kriterien zur Beschreibung von Integrationssystemen
Datenintegration Datenintegration Kapitel 3: Eigenschaften von Integrationssystemen Andreas Thor Sommersemester 2008 Universität Leipzig Institut für Informatik http://dbs.uni-leipzig.de 1 Inhalt Einordnung
Mehr1. Einführung Seite 1. Kapitel 1: Einführung
1. Einführung Seite 1 Kapitel 1: Einführung 1. Einführung Seite 2 Willkommen! Studierenden-Datenbank Hans Eifrig hat die Matrikelnummer 1223. Seine Adresse ist Seeweg 20. Er ist im zweiten Semester. Lisa
MehrAnfragebearbeitung LaV und PDMS
Anfragebearbeitung LaV und PDMS Dr. Armin Roth arminroth.de 25.06.2012 Dr. Armin Roth (arminroth.de) II Anfragebearbeitung LaV, PDMS 25.06.2012 1 / 26 Agenda 1 Anfragebearbeitung Local-as-View Nutzung
Mehr30. Juni 2006 - Technische Universität Kaiserslautern. Paul R. Schilling
30. Juni 2006 - Technische Universität Kaiserslautern Paul R. Schilling ! " #$% & '( ( ) *+, - '. / 0 1 2("$ DATEN SIND ALLGEGENWÄRTIG Bill Inmon, father of data warehousing Unternehmen In einer vollkommenen
MehrAnaloges Problemlösen
Analoges Problemlösen Hauptseminar Planen und Problemlösen Gliederung 1. Begriffsbestimmungen 2. Komponenten des Analogieprozesses im Detail 3. Voraussetzungen für Analoges Problemlösen 4. Fazit 5. Fragen
MehrInformationsintegration
Informationsintegration Local-as-View Anfrageplanung Ulf Leser Inhalt dieser Vorlesung Anfragekorrespondenzen Formale Definition Korrespondenztypen und -arten GaV erklärt Local as View Query Containment
MehrAlgorithmische Bioinformatik 1
Algorithmische Bioinformatik 1 Dr. Hanjo Täubig Lehrstuhl für Effiziente Algorithmen (Prof. Dr. Ernst W. Mayr) Institut für Informatik Technische Universität München Sommersemester 2009 Übersicht Paarweises
MehrAbstrakt zum Vortrag im Oberseminar. Graphdatenbanken. Gero Kraus HTWK Leipzig 14. Juli 2015
Abstrakt zum Vortrag im Oberseminar Graphdatenbanken Gero Kraus HTWK Leipzig 14. Juli 2015 1 Motivation Zur Darstellung komplexer Beziehungen bzw. Graphen sind sowohl relationale als auch NoSQL-Datenbanken
MehrDiskrete Strukturen Kapitel 4: Graphentheorie (Grundlagen)
WS 2015/16 Diskrete Strukturen Kapitel 4: Graphentheorie (Grundlagen) Hans-Joachim Bungartz Lehrstuhl für wissenschaftliches Rechnen Fakultät für Informatik Technische Universität München http://www5.in.tum.de/wiki/index.php/diskrete_strukturen_-_winter_15
MehrP2P DATENBANKEN. Anwendungen 1 WS 2009/2010. Julissa Cusi Juarez. Department Informatik
P2P DATENBANKEN Anwendungen 1 WS 2009/2010 Julissa Cusi Juarez Department Informatik HAW Hamburg 02.12.2009 1 Agenda 1. Motivation 2. Klassische Datenbanksysteme 3. Verteilte Datenbanksysteme 4. Peer to
Mehr3rd IQ Best Practice Day 2007
1 3rd IQ Best Practice Day 2007 Klaus Koch, Torsten Kaup, Felix Michels, Daniel Elsner, Bernhard Kurpicz, Dirk Malzahn Schema Matching Automatische Erkennung semantisch gleicher Attribute Frankfurt am
MehrAlgorithmen auf Sequenzen Paarweiser Sequenzvergleich: Alignments
Algorithmen auf Sequenzen Paarweiser Sequenzvergleich: Alignments Sven Rahmann Genominformatik Universitätsklinikum Essen Universität Duisburg-Essen Universitätsallianz Ruhr Einführung Bisher: Berechnung
MehrNutzung maschinellen Lernens zur Extraktion von Paragraphen aus PDF-Dokumenten
Nutzung maschinellen Lernens zur Extraktion von Paragraphen aus PDF-Dokumenten Albert-Ludwigs-Universität zu Freiburg 13.09.2016 Maximilian Dippel max.dippel@tf.uni-freiburg.de Überblick I Einführung Problemstellung
MehrExtraktion, Transformation, Laden (ETL)
Extraktion, Transformation, Laden (ETL) ETL-Prozeß Integrationsschritte Integrationsprobleme fi Konflikte und deren Klassifikation fi Behebung von Konflikten Data Cleaning VL Data Warehouses, WS 2000/2001
MehrDieser Foliensatz darf frei verwendet werden unter der Bedingung, dass diese Titelfolie nicht entfernt wird.
Thomas Studer Relationale Datenbanken: Von den theoretischen Grundlagen zu Anwendungen mit PostgreSQL Springer, 2016 ISBN 978-3-662-46570-7 Dieser Foliensatz darf frei verwendet werden unter der Bedingung,
MehrDas relationale Datenmodell
Das relationale Datenmodell Konzepte Attribute, Relationenschemata, Datenbank-Schemata Konsistenzbedingungen Beispiel-Datenbank Seite 1 Einführung Zweck datenmäßige Darstellung von Objekten und Beziehungen
MehrANALYTICS, RISK MANAGEMENT & FINANCE ARCHITECTURE. NoSQL Datenbanksysteme Übersicht, Abgrenzung & Charakteristik
ARFA ANALYTICS, RISK MANAGEMENT & FINANCE ARCHITECTURE NoSQL Datenbanksysteme Übersicht, Abgrenzung & Charakteristik Ralf Leipner Domain Architect Analytics, Risk Management & Finance 33. Berner Architekten
MehrDatenintegration. Kapitel 0: Organisatorisches. Dr. Anika Groß Sommersemester 2016
Datenintegration Datenintegration Kapitel 0: Organisatorisches Dr. Anika Groß Sommersemester 2016 Universität Leipzig Institut für Informatik http://dbs.uni-leipzig.de 1 Organisatorisches Termin: donnerstags,
MehrDetecting Near Duplicates for Web Crawling
Detecting Near Duplicates for Web Crawling Gurmeet Singh Manku et al., WWW 2007* * 16th international conference on World Wide Web Detecting Near Duplicates for Web Crawling Finde near duplicates in großen
MehrSystems of Distinct Representatives
Systems of Distinct Representatives Seminar: Extremal Combinatorics Peter Fritz Lehr- und Forschungsgebiet Theoretische Informatik RWTH Aachen Systems of Distinct Representatives p. 1/41 Gliederung Einführung
MehrDie einzelnen Vorgehensweisen werden wir uns im folgenden näher ansehen.
1 In diesem Abschnitt werden wir uns mit der Fragestellung beschäftigen, wie man überhaupt vorgeht, um Datenmodelle zu erstellen. Ziel ist es ja, ein Datenmodell zu erstellen, in dem wir verstehen, welche
MehrKapitel 2: Das Relationale Modell
Ludwig Maximilians Universität München Institut für Informatik Lehr- und Forschungseinheit für Datenbanksysteme Skript zur Vorlesung Wintersemester 2006/2007 Kapitel 2: Das Relationale Modell Vorlesung:
MehrTeil III. Komplexitätstheorie
Teil III Komplexitätstheorie 125 / 160 Übersicht Die Klassen P und NP Die Klasse P Die Klassen NP NP-Vollständigkeit NP-Vollständige Probleme Weitere NP-vollständige Probleme 127 / 160 Die Klasse P Ein
MehrÜberblick Felix Naumann. Zugriffsrechte Zugriffsrechte erzeugen Zugriffsrechte prüfen Zugriffsrechte vergeben Zugriffsrechte entziehen
Datenbanksysteme I Zugriffskontrolle (kleiner Einschub) 18.1.2007 Felix Naumann Überblick 2 Zugriffsrechte Zugriffsrechte erzeugen Zugriffsrechte prüfen Zugriffsrechte vergeben Zugriffsrechte entziehen
MehrAnwendungen des Fréchet-Abstandes Das Constrained Free Space Diagram zur Analyse von Körperbewegungen
Anwendungen des Fréchet-Abstandes Das Constrained Free Space Diagram zur Analyse von Körperbewegungen David Knötel Freie Universität Berlin, Institut für Informatik Seminar über Algorithmen Leitfaden Wiederholung
MehrMethodik. zur prozessübergreifenden Integration. der Digitalen Fabrik. der Rechts- und Wirtschaftswissenschaftlichen Fakultät
Methodik zur prozessübergreifenden Integration der Digitalen Fabrik in bestehende Unternehmensstrukturen der Rechts- und Wirtschaftswissenschaftlichen Fakultät des Fachbereichs Wirtschaftswissenschaften
MehrGlobalübungsaufgabe1 (All Pair Shortest Path):
Prof. aa r. Ir. G. Woeginger atenstrukturen und lgorithmen SS7 Tutoriumslösung - Übung 0 (bgabe 2.07.207) T. Hartmann,. Korzeniewski,. Tauer Globalübungsaufgabe (ll Pair Shortest Path): etrachten Sie den
MehrAnwendung der Föderationsarchitektur und generischen Suche
Förderkennzeichen 01UG1610A bis J Anwendung der Föderationsarchitektur und generischen Suche Workshop 2: Daten sammeln, modellieren und durchsuchen mit DARIAH-DE DHd 2017 Bern, 13.02.2017 Datum 1 Ablauf
MehrMinimal spannende Bäume
http://www.uni-magdeburg.de/harbich/ Minimal spannende Fakultät für Informatik Otto-von-Guericke-Universität 2 Inhalt Definition Wege Untergraphen Kantengewichtete Graphen Minimal spannende Algorithmen
MehrNoSQL Graphdatenbanken mit HyperGraphDB. Tage der Datenbanken Donnerstag, Ludger Schönfeld, B. Sc. ludger.schoenfeld[at]smail.fh-koeln.
NoSQL Graphdatenbanken mit HyperGraphDB Tage der Datenbanken Donnerstag, 20.06.2013 Ludger Schönfeld, B. Sc. ludger.schoenfeld[at]smail.fh-koeln.de Agenda 1. Einleitung/Motivation 2. Graphendatenbanken
MehrSpeicherung von XML in (objekt-)relationalen Datenbanken. Burkhard Schäfer
Speicherung von XML in (objekt-)relationalen Datenbanken Burkhard Schäfer Übersicht Motivation Anforderungen Ansätze modellorientiert strukturorientiert Zusammenfassung Motivation Warum XML in Datenbanken
MehrGraphentheorie. Vorkurs Informatik WS 2016/2017. Dennis Aumiller
Vorkurs Informatik WS 2016/2017 Dennis Aumiller Aumiller@stud.uni-heidelberg.de 14.10.2016 Über das Thema Wo alles begann Leider keine gesonderte Vorlesung dafür oft als Teilthema in anderen Vorlesungen
MehrDatenbankmodelle und Datenbanksprachen
Datenbankmodelle und Datenbanksprachen Dr.-Ing. Guy Vollmer FH Dortmund, FB Informatik Dienstag, 30. September 2008 1 Agenda 1. Einordnung des Themas 2. Datenbankmodelle Relationales Datenmodell 3. Datenbanksprachen
Mehr1 Business-Intelligence-Architektur 1
D3kjd3Di38lk323nnm xi 1 Business-Intelligence-Architektur 1 1.1 Data Warehouse....................................... 1 1.2 OLAP und mehrdimensionale Datenbanken.................. 4 1.3 Architekturvarianten....................................
MehrExtraktion, Transformation, Laden (ETL)
Extraktion, Transformation, Laden (ETL) ƒ ETL-Prozeß ƒ Integrationsschritte ƒ Integrationsprobleme Konflikte und deren Klassifikation Behebung von Konflikten ƒ Data Cleaning Vorlesung Data-Warehouse-Technologien
MehrDomain-independent. independent Duplicate Detection. Vortrag von Marko Pilop & Jens Kleine. SE Data Cleansing
SE Data Cleansing Domain-independent independent Duplicate Detection Vortrag von Marko Pilop & Jens Kleine http://www.informatik.hu-berlin.de/~pilop/didd.pdf {pilop jkleine}@informatik.hu-berlin.de 1.0
MehrVorlesung DBIS I (WS 2005/2006) Teil 4
otivation Das Relationenmodell Vorlesung Prof. Johann Christoph Freytag, Ph.D. Institut für Informatik Humboldt-Universität zu Berlin WS 2005/2006 Ziel des Relationenmodells Hoher Grad an Datenunabhängigkeit
MehrCLICK TO EDIT MASTER TITLE STYLE
CLICK TO EDIT MASTER TITLE STYLE AUTOMATISCHE ERZEUGUNG VON BENUTZEROBERFLÄCHEN UND DATENHALTUNG FÜR DIE KONFIGURATION VON FELDGERÄTEN Diplomverteidigung Betreuer (Firma ubigrate): Dipl.-Inform. Falk Hartmann
MehrAnpassung von Data-Warehouse-Techniken für den Einsatz unsicherer Verkehrsdaten
Diplomvortrag Anpassung von Data-Warehouse-Techniken für den entstanden im Rahmen des OVID-Projektes Institut für Programmstrukturen und Datenorganisation Verantwortlicher Betreuer: Prof. Dr.-Ing. Klemens
MehrWS 2015/16 Diskrete Strukturen Kapitel 4: Graphen (Matchings)
WS 2015/16 Diskrete Strukturen Kapitel 4: Graphen (Matchings) Hans-Joachim Bungartz Lehrstuhl für wissenschaftliches Rechnen Fakultät für Informatik Technische Universität München http://www5.in.tum.de/wiki/index.php/diskrete_strukturen_-_winter_15
MehrCommon Warehouse Metamodel und Imperfektion
Common Warehouse Metamodel und Imperfektion Christoph Goebel Imperfektion und erweiterte Konzepte im Data Warehousing 2 Fragestellungen Welche Bedeutung haben Metadaten in der Information Supply Chain
MehrSimPDM Datenmodell im Kontext zu Teamcenter und PLMXML
SimPDM Datenmodell im Kontext zu Teamcenter und PLMXML Vergleichsstudie Datentransfer PDM SDM Böblingen, 20. November 2008 Dietmar Gausselmann Zoran Petrovic Ulrich Deisenroth Agenda Einleitung / Motivation
Mehrzu E 1 der Form (0, 1) erfüllen.
1 Aufgabe 4.1: Sei B ein Beziehungstyp über den drei Entitätstypen E 1, E 2 und E 3. Sei ohne Beschränkung der Allgemeinheit die Beziehungskomplexität zu E 1 der Form (0, 1). Wir zeigen, dass B durch die
MehrWeb Data Management Systeme
Web Data Management Systeme Seminar: Web-Qualitätsmanagement Arne Frenkel Agenda Einführung Suchsysteme Suchmaschinen & Meta-Suchmaschinen W3QS WebSQL WebLog Information Integration Systems Ariadne TSIMMIS
MehrFormale Grundlagen der Informatik
Formale Grundlagen der Informatik / 2015 1 Die Elemente einer (endlichen) Menge sollen den Elementen einer zweiten, gleichmächtigen Menge zugeordnet werden Problemstellung Bipartite Graphen Zuordnungsprobleme
MehrOptimierung. Optimierung. Vorlesung 9 Lineare Programmierung & Kombinatorische Optimierung Fabian Kuhn
Optimierung Vorlesung 9 Lineare Programmierung & Kombinatorische Optimierung 1 Assignment Problem (Zuordnungsproblem) Gewichtetes Perfektes Bipartites Matching agents Costs tasks Weise jedem Agenten genau
MehrDistributed Algorithms. Image and Video Processing
Chapter 6 Optical Character Recognition Distributed Algorithms for Übersicht Motivation Texterkennung in Bildern und Videos 1. Erkennung von Textregionen/Textzeilen 2. Segmentierung einzelner Buchstaben
MehrMaschinelles Lernen: Symbolische Ansätze
Maschinelles Lernen: Symbolische Ansätze Wintersemester 2009/2010 Musterlösung für das 9. Übungsblatt Aufgabe 1: Decision Trees Gegeben sei folgende Beispielmenge: Age Education Married Income Credit?
MehrKapitel 7: Formaler Datenbankentwurf
7. Formaler Datenbankentwurf Seite 1 Kapitel 7: Formaler Datenbankentwurf Die Schwierigkeiten der konzeptuellen Modellierung sind zu einem großen Teil dadurch begründet, dass sich die relevanten Strukturen
Mehr