Datenintegration Datenreinigung Duplikate Fusion Qualität

Größe: px
Ab Seite anzeigen:

Download "Datenintegration Datenreinigung Duplikate Fusion Qualität"

Transkript

1 Datenintegration Datenreinigung Duplikate Fusion Qualität Ein Vortrag von Janett Niendorf im Rahmen der integrierten Lehrveranstaltung: Integration Heterogener Informationssysteme (HIS) / SS 2009 /Dr. Ralf-D. Kutsche Gehalten am / Datenbanksysteme und Informationsmanagement Technische Universität Berlin

2 Verwendete Quellen Q1-Q6 Q1 Naumann, Leser: Informationsintegration - Architekturen und Methoden zur Integration verteilter und heterogener Datenquellen. dpunkt Verlag, Kap.8, 2006 Q2 Naumann: Vorlesung Informationsintegration. Wintersemester 2005/2006, gebiete/wbi/ii/folien Q3 Naumann: Halbkurs Informationsintegration. Wintersemester 2006/2007, gebiete/wbi/teaching/ archive/ws0607/hk_informationsintegration/ Q4 Neiling, Lenz (FU Berlin): Data Integration by Means of Object Identification in Information Systems. ECIS 2000 Proceedings, Paper 69, 2000 Q5 Neiling, Lenz (FU Berlin): Data fusion and object identification. In Int. Conf. on Advances in Infrastructure for Electronic Business, Science, and Education on the Internet. (SSGRR), 2000 Q6 Naumann, Bilke: Automatic Data Fusion with HumMer. In Proc. of the 31 st VLDB Conference, Trondheim, Norway, / 61

3 Verwendete Quellen Q7-Q12 Q7 Naumann: Beyond Information Integration - Content Merging. Forschungskolloquium CIS/ISST. HU Berlin publications/cis- Kolloquium.pdf Q8 Naumann, Bleiholder: Conflict Handling Strategies in an Integrated Information System. Technical Report HUB-IB-197. Informatik-Berichte, Berlin. Februar Q9 Batini, Scannapieco: Data Quality - Concepts, Methodologies and Techniques. Springer, 2006 Q10 Hinrichs: Datenqualitätsmanagement in Data Warehouse-Systemen. Dissertation, Universität Oldenburg, Kap.4, 2002 Q11 Wang, Strong: Beyond accuracy: What data quality means to data consumers. In Journal of Management Information Systems, 12(4), S. 5-33, 1996 Q12 Bauer, Günzel: Data Warehouse Systeme - Architektur, Entwicklung, Anwendung. 2 Aufl., dpunkt verlag, / 61

4 Weiterführende Literatur 8-14 Naumann, Bilke. Schema matching using duplicates. In Proc. of the International Conference on Data Engineering (ICDE), S , 2005 Wang, Ziad, Lee: Data Quality. Kluwer Academic Publishers, / 61

5 Daten(be)reinigung =Data Scrubbing: einfache Daten =Data Cleaning/ Data Cleansing: Tupel-übergreifend Normalisierung Konvertierung Referenztabellen Duplikat-Beseitigung Datenreinigung 5 / 61

6 Normalisierung Umwandlung in Großbuchstaben» JanEtt -> JANETT Autom. Rechtschreibprüfung Entfernung von Stopp-Wörtern» Der Brockhaus -> Brockhaus Stemming (Wortstamm bilden)» Filiale & Filialen -> Filial Abkürzungen ausschreiben» TUB -> Technische Universität Berlin Personennamen zerlegen Anrede, Titel, Vorname(n), Nachname Adressen zerlegen Strasse, Hausnr., Postfach, Plz, Land Standardformate angeben für Telefonnummern, Datum» 030/ > » 08/12/24 -> Datenreinigung 6 / 61

7 Konvertierung, Referenztabellen Konvertierung Bsp: Umrechnung von Einheiten» Lägenangaben: Kilometer -> Meile» Temperaturen: Grad Celsius-> Kelvin» Währungen: Aktuellen Wechselkurs für Währungen (ursprüngl. Wert abspeichern!) Referenztabellen Für exakte Wertabbildung von...» Städten, Ländern oder Produktnamen Datenreinigung 7 / 61

8 Daten(be)reinigung =Data Scrubbing: einfache Daten =Data Cleaning/ Data Cleansing: Tupel-übergreifend Normalisierung Konvertierung Referenztabellen Duplikat-Beseitigung Datenreinigung 8 / 61

9 Duplikate - Gliederung Terminologie der Duplikaterkennung Duplikaterkennung-Matrix Ähnlichkeitsmaße Edit-Distanz (ausführlich) Einführung Schwellwert Tastatur-Distanz Weitere Ähnlichkeitsmaße (String-basiert) Sorted Neighborhood Methode Effizienz: Laufzeitbetrachtung/ Partitionierung Weitere Ähnlichkeitsmaße (Tokenisierung,Tupel-basiert, Hybride) Tool für die Duplettenerkennung: HumMer Erweiterung der Mediator-Wrapper-Architektur um eine Komponente für die Objekt-Identifizierung Duplikate 9 / 61

10 Terminologie - Duplikaterkennung Duplikat (Duplette, Doppel): Eine Kopie eines Realwelt-Objektes. Duplikaterkennung: Auffinden der Kopien, die dasselbe (das Gleiche) Realwelt-Objekt repräsentieren. Synonyme der Duplikatenerkennung: Record Linkage (simpel strukturierte Daten) Object Identification (komplex-strukturierte Daten bspw. XML) Deduplication/ duplicate identification...record Matching, Entity Resolution file/record/field (50er, 60er) relation/tuple/attribute Duplikate 10 / 61

11 2x2 Möglichkeiten der Duplikaterkennung REALITÄT Tatsächlich Duplikat: ja nein Als Duplikat erkannt: ja S O F T W A R E nein true-positive false-negative false-positive true-negative Vgl. Quelle 1 Duplikate 11 / 61

12 Edit-Distanz (von Levensthein) Nach Vladimir Levensthein von 1965 Geeignet für einzelne Zeichenketten/ buchstabenweiser Vergleich Rekursiv berechenbar Minimale Anzahl an Edit-Operationen um einen String in einen anderen zu überführen. J U L I A K U L I O EditDistanz Edit-Operatoren: insert (i) delete (d) replace (r) match (m) Transkript: r-m-m-m-r Kosten jeweils mit 1 angesetzt im Bsp Duplikate 12 / 61

13 Ähnlichkeit berechnen J U L I A Ähnlichkeitsmaß / Similarity K String S 1 =JULIA, String S 2 =KULIO U Länge der Strings hier gleich : S 1 = S 2 =5 L I O EditDistanz bereits berechnet Similarity S 1, S 2 =1 EditDistanz S 1, S 2 Maximum S 1, S 2 2 Similarity JULIA, KULIO =1 Maximum 5,5 = => JULIA & KULIO ähneln sich zu 60%! Duplikate 13 / 61

14 Wie ähnlich sind die Wörter zu "JULIA"? Edit-Distanz Ähnlichkeit JULIA JULIAN JULIa JULI JULIUS KULIO JUSTIN JUSTUS GÜNTHER Duplikate Schwellwert Nicht-Duplikate Duplikate 14 / 61

15 Tastaturdistanz Edit-Distanz Ähnlichkeit JULIA KULIA Tippfehler (Duplikat) JULIO Jungsname (Kein Duplikat) Idee: Wahrscheinlichkeit eines Tippfehlers als Kostenmaß nutzen Wahrscheinlichkeit ist abhängig von dem Abstand der Buchstaben auf der Tastatur Duplikate / 61

16 String-basierte Ähnlichkeitsmaße Edit-Distanz Definiert als die minimale Anzahl an Edit-Operationen: ersetzen, löschen & einfügen, um einen String in einen anderen zu überführen Reihenfolgeabhängig und daher geeignet für Attribute und weniger für Tupel (Tupel als zs.gesetzter String möglich) SOUNDEX (Edit-basiert) Beachtet die Aussprache von Wörtern bei der Ähnlichkeitsbewertung Jaro-Winkler-Ähnlichkeit (Edit-basiert) Berücksichtigt Transpositionen einzelner Buchstaben» Reihenfolgevertauschung JULIA oder JULAI Geeignet für kurze Wörter Hamming-Distanz Zählt nicht-übereinstimmenden Bereiche in Strings oder numerischen Werten fester Länge» Plz <-> 10244, Distanz=1 Duplikate 16 / 61

17 Partitionierung\ Effizienz Prinzipielle Aufgabe der Duplikatenerkennung (Zsf.): Anwendung von Ähnlichkeitsmaßen auf Paare von Datensätzen Einteilung in die Gruppe der Duplikate gemäß Schwellwert Laufzeitbetrachtung: n²/2-n Vergleiche sind notwendig um n Datensätze mit jeden anderen Datensatz zu vergleichen Für eine Relation mit Tupeln sind 50 Mio. Vergleiche erforderlich Komplexitätsklasse O(n²) Für die meisten Anwendungen ist das zu hoch! Vermeidung von Tupelvergleichen! Unterteilung in Partitionen (auch überlappend) geschicktes Auswählen zu vergleichender Tupelpaare Duplikate 17 / 61

18 Exkurs: Komplexitätsklassen Ordnung O(1) O(log n) O(n) O(n*log n) O(n²) O(n³)... O(n c ), c>1 O(c n ), c>1 O(n!) Komplexitätsklasse Konstant Logarithmisch Linear Linear-Logarithmisch Quadratisch Kubisch Polynomial Exponentiell Faktoriell Duplikate 18 / 61

19 Sorted Neighborhood Methode Nach Stolfo und Hernandez 1995 Übersetzt sortierte Nachbarschaft, Tupel-basiert Auch bezeichnet als merge-purge Methode Phase I - Schlüsselbildung Domänenexperte wählt Schlüssel Schlüssel wird dargestellt als Sequenz der abgeleiteten Attribute Bsp: JULIA ROBERTS, Erste 3 Buchstaben des Vornames: JUL /Tokenisierung Erster Buchstabe des Nachnames: R Geburtsdatum vollständig: /Tokenisierung (Nachnamen häufiger falsch geschrieben als Vornamen) Phase II Sortierung Schlüssel alphabetisch sortieren Durch geeignete Schlüsselwahl liegen ähnliche Datensätze nah beieinander Duplikate Vgl. Quelle 1 19 / 61

20 Sorted Neighborhood Methode Phase III - Vergleich Fenstergröße w über n Datensätze wählen (1<w<=n) Fenster definiert die Nachbarschaft/ Partition Innerhalb des Fensters paarweiser Vergleich Fensterverschiebung nach Duplikateinordnung jeweils 1 Phase I Schlüsselbildung O(n)² Phase II Sortierung O(n*log n) Phase III Vergleich O(w*n) Insgesamt Laufzeit von O(w*n*log n) schneller! Ohne Partitionierung O(n²) Vgl. Quelle 1 Duplikate 20 / 61

21 Weitere (beim Namen gennant)... n-,bi-,q-gramme Smith-Waterman Jaccard-Ähnlichkeit für Token TFIDF Term Frequency/Inverse Document Frequency Hybride: Nutzung eines Primär- und Sekundär- Vergleichsmaßes Fragestellung bei der Auswahl des Vergleichmaßes:? Datenstruktur (komplex, semi-strukturiert, simpel)?? Attribut oder Tupel?? Zerlegbarkeit der Wörter sinnvol (Tokensisierung)?? Menge der Datensätze -(Partitionierung nötig)?? Gewünschte Genauigkeit (Ausblick: Datenqualität)? Duplikate 21 / 61

22 HumMer Humboldt Merger Vgl. Quelle 6 Duplikate 22 / 61

23 Erweiterung der Mediator-Wrapper-Architektur Objekt-Identifizierung (Identificator) als zusätzliche Komponente Duplikate Vgl. Quelle 4, 5 23 / 61

24 Wiederholung Mediator Ein Mediator ist eine Softwarekomponente, die Wissen über bestimmte Daten benutzt, um Informationen für höherwertige Anwendungen zu erzeugen Zwei Komponententypen Wrapper Zugriff auf Datenquellen Überwinden von technischer und struktureller Heterogenität Mediator Mehrwert erzeugen Überwindung von semantischer Heterogenität Lesender Zugriff Duplikate 24 / 61

25 Identificator-Komponente INPUT: gesammelte Records des Mediators aus Datenquellen A, B,.. OUTPUT: Verglichene Records, welche dasselbe Realwelt-Objekt repräsentieren Conversion: Ableitung (gemeinsamer) identifizierender Attribute aus den Datenquellen Comparison: Vergleich dieser Attribute für Paare von Elementen Classification: Klassifikation der Paare basierend auf den Vergleichswerten/ Duplikate oder Nicht-Duplikat? Duplikate Vgl. Quelle 4, 5 25 / 61

26 Beispiel Conversion Duplikate Vgl. Quelle 4, 5 26 / 61

27 Fusion In welchem Schritt wird die Fusion eingeleitet? Datenquellen Schritt 1: Schritt 2: Schritt 3: Schritt 4: Schema Matching Duplikaterkennung Datenfusion Visualisierung/Export Anwendung Vgl. Quelle 2 Fusion 27 / 61

28 Fusion Gleichheit (a,b,c) (a,b,c) (a,b,c) Subsumption (a,b,c) (a,b, ) (a,b,c) Komplementierung (a,,c) (a,b, ) (a,b,c) Quelle 1= (A,B,C) Quelle 2= (A,B,C) Schemagleichheit Konflikt (a,b,c) (a,b,d) (a,b,f(c,d)) Vgl. Quelle 7 Fusion 28 / 61

29 Beispiel Welche Tupel sind gleich?» Tupel 2 und 4 sind gleich Welche Tupel subsumieren sich?» Tupel 2 und 4 subsumieren Tupel 1» Tupel 2 und 4 subsumieren auch Tupel 3 Welche Tupel komlementieren sich gegenseitig?» Tupel 1 und 3 komplementieren sich Welche Tupel stehen in Konflikt zueinander?» Tupel 5 steht eindeutig in Konflikt mit jedem anderen» Anhängig von der Bedeutung der Null-Werte Film ID* Schauspieler Titel Jahr Sprache Tupel 1: 88 Julia Roberts Ocean's Eleven - Englisch Tupel 2: 88 Julia Roberts Ocean's Eleven 2001 Englisch Tupel 3: 88 Julia Roberts Englisch Tupel 4: 88 Julia Roberts Ocean's Eleven 2001 Englisch Tupel 5: 88 Julia Roberts Ocean's Eleven 2001 Deutsch *ID: Ergebnis der Duplikaterkennung Fusion 29 / 61

30 Exkurs: Bedeutung von Nullwerten 1 Unbekannt /Unknown 2 Nicht zulässig, Nicht anwendbar 3 Zurückgehalten (aus Sicherheitsgründen) 4 Unsicher 5 Unendlich 6 Fehlerhaft 7 Undefiniert 8 Nicht existent 9 Ignoriert Chris Date:» "Into the Unknown" » "NOT Is Not Not!"» "Oh No Not Nulls Again"» "Much Ado About Nothing" Fusion 30 / 61

31 Vereinigungsoperatoren Relationale Objekterkennung mit... Union Outer-Union Minimum-Outer-Union Join Full-Outer-Join Merge-Methode Aggregatsfunktionen Selbstdefinierte Aggregatsfunktionen Gruppierung Fusion 31 / 61

32 UNION - Beispiel Alle identischen Zeilen ausblenden... In SQL:» Select DISTINCT *» (oder UNION für mehrere Anfragen) Fusion 32 / 61

33 UNION Vereinigung zweier Relationen mit gleichem Schema Schemagleichheit ist gefordert! Gleiche Attribute, gleiche Attributtypen (bzw. kompatibel) Gleiche Tupel werden entfernt Problemlösung für unterschiedl. Schema: SchemaSQL (SQL-Erweiterung) Schema Mapping (1 Schritt davor) Fusion 33 / 61

34 Outer Union Codd 1979 Union für heterogene Schemata (Schema unterscheiden sich daher einfacher Union nicht anwendbar) Fehlende Attributwerte werden durch Null ersetzt In SQL Kann durch geeignete SQL-Anfragen simuliert werden (sofern beide Schemata bekannt) Quelle 1 A B C a b c a b - Quelle 2 A B D a b - a b d a e d Quelle 1= (A,B,C) Quelle 2= (A,B,D) Schemata ungleich Fusion 34 / 61

35 Outer Union Codd 1979 Union für heterogene Schemata (Schema unterscheiden sich daher einfacher Union nicht anwendbar) Fehlende Attributwerte werden durch Null ersetzt In SQL Kann durch geeignete SQL-Anfragen simuliert werden (sofern beide Schemata bekannt) Quelle 1 A B C a b c a b - Quelle 2 A B D a b - a b d a e d Quelle 1 Quelle 2 A B C D 1 a b c - 1 a b a b a b - d 2 a e - d Fusion 35 / 61

36 Minimum Union Ullmann 1989, Galindo-Legaria 1994 Nutzt Outer Union als Zwischenergebnis Entfernt subsumierte Tupel In SQL Umsetzung nicht trivial, da Entfernung von subsumierten Tupeln nicht mit einfachen SQL-Anfragen umsetzbar Quelle 1 Quelle 2 A B C D 1 a b c - 1 a b a b a b - d 2 a e - d Quelle 1 Quelle 2 A B C D 1 a b c - 1 a b a b a b - d 2 a e - d Subsumierte Tupel Fusion 36 / 61

37 Union-Operatoren im Vergleich Schema: Eliminierung identischer Tupel Eliminierung subsumierter Tupel Integration komplement. Tupel Konfliktlösung Union gleiches Schema Outer Union unterschiedl. Schemata Minimum Union unterschiedl. Schemata Merge Union unterschiedl. Schemata X X X X - - X X X X Ideal Fusion 37 / 61

38 Vereinigungsoperatoren Relationale Objekterkennung mit... Union Outer-Union Minimum-Outer-Union Join Full-Outer-Join Merge-Methode Vereinigen ist nicht gleich Fusion! Aggregatsfunktionen Selbstdefinierte Aggregatsfunktionen Gruppierung Fusion 38 / 61

39 Join Jedes Realweltobjekt wird durch ein Tupel repräsentiert (insofern kein Duplikat in Ausgangsrelation, sonst Vervielfachung) Keine Fusion von Widersprüchen sondern separate Spalten Leere Felder bleiben leer Fehlende Quelldaten Quelle 1 - Film Quelle 2 - Spielfilm In SQL:» Select *» From Film F, Spielfilm S» Where F.ID_Duplikat = S.ID_Duplikat? Fusion 39 / 61

40 Full Outer Join Ergebnis liefert alle Tupel der Ausgangsrelationen, unabhängig davon ob ein Join-Partner vorhanden war Fehlende Attribut-Werte werden mit Null aufgefüllt (vgl. Outer-Union) Gezielte Auswahl der Ergebnisse im Select -> es wird gewählt welche Datenquelle das Ergebnis liefern soll / Konflikte werden nicht gelöst Kann dazu führen das Werte Null bleiben obwohl Wert in anderer Datenquelle bekannt ist In SQL:» Select F.ID_Duplikat, F.Titel, S.Jahr, F.Genre, S.Studio» From Film F FULL OUTER JOIN Spielfilm S» ON F.ID_Duplikat = S.ID_Duplikat Auch möglich: Left Outer- und Right Outer Join mit Union verbinden Fusion 40 / 61

41 Merge Operator Greco et. Al schlagen Merge- Operator vor In SQL: SELECT F.ID_Duplikat, COALESCE(F.Titel,S.Titel), COALESCE(F.Jahr, S.Jahr), F.Genre, S.Studio FROM Film F LEFT OUTER JOIN Spielfilm S ON F.ID_Duplikat = S.ID_Duplikat UNION SELECT S.ID_Duplikat, COALESCE(S.Titel,F.Titel), COALESCE(S.Jahr, F.Jahr), F.Genre, S.Studio FROM Film F RIGHT OUTER JOIN Spielfilm S ON F.ID_Duplikat = S.ID_Duplikat COALESCE: wählt ersten Nicht-Nullwert aus den Eingabedaten Kann komplementierende Tupel ersetzen Duplikte mit Konflikten bleiben erhalten Fusion 41 / 61

42 Outer Join - Merge Quelle 1 - Film Quelle 2 - Spielfilm Ergebnis des Full Outer Joins Ergebnis des Merge Operators Fusion 42 / 61

43 Fusion Gleichheit (a,b,c) (a,b,c) (a,b,c) Subsumption (a,b,c) (a,b, ) (a,b,c) Komplementierung (a,,c) (a,b, ) (a,b,c) Konfliktlösung bisher unbefriedigend! Strategien? Quelle 1= (A,B,C) Quelle 2= (A,B,C) Schemagleichheit Konflikt (a,b,c) (a,b,d) (a,b,f(c,d)) Vgl. Quelle 7 Fusion 43 / 61

44 Strategien der Konfliktlösung Wie können Konflikte behandelt werden? Vgl. Quelle 8 Fusion 44 / 61

45 Conflict Ignorance Konflikte werden ignoriert, es findet keine Entscheidung statt Pass it on Alle Konfliktwerte in den Daten werden an den User oder die Applikation weitergegeben Consider all possibilities Alle Kombinationen für Werte (auch erzeugte, die in der Ausgangsquelle nicht vorlagen) beibehalten und aufzählen User entscheidet über possible worlds Vgl. Quelle 8 Fusion 45 / 61

46 Conflict avoidance Konflikte werden identifiziert und bewußt behandelt, nämlich indem sie vermieden werden Instanced-based: Take the information Existierende Informationen werden benutzt Nicht präsente Daten (Null-Werte) werden weggelassen Somit werden Unsicherheiten beseitigt (jedoch keine Konfliktbehandlung)» Benutzt Minimum Union» Benutzt Merger Operator Instanced-based: No Gossiping nur sichere Fakten verwenden und Unsicheres Wissen vermeiden zu benutzen Metadata-based: Trust your friends Quellen des Vertrauens verwenden Vgl. Quelle 8 Fusion 46 / 61

47 Conflict resolution Konkrete Werte und Quellen aus denen diese Werte stammen werden vorab betrachtet bevor eine Entscheidung für die Konfliktlösung getroffen wird, erhöhter Aufwand, aber Annährung an optimale Konfliktlösung Instanced-based, deciding: Cry with the wolves Korrekte Daten werden sich durchsetzen! Oft genutzte Werte nehmen, der Mehrheit wird gefolgt» Bsp.: Google Instanced-based, deciding: Roll the dice zufällig Werte auswählen aus der Gesamtheit aller Werte leicht umsetzbar, kein Aufwand Vgl. Quelle 8 Fusion 47 / 61

48 Conflict resolution Instanced-based, mediating: Meet in the middle Ein neuer Wert wird erzeugt als Mittel der in Konflikt stehenden Werte» Bsp.: Durschnitt numerischer Werte Metadata-based, deciding: Keep up to date Benutzt die aktuellesten Werte, Neuheiten Braucht Zeitstempel (evtl. seperates Attribut) In einem Datenstrom kann die Reihenfolge der einkommenden Tupel genutzt werden Vgl. Quelle 8 Fusion 48 / 61

49 Konfliktlösungsfunktionen Min, Max, Sum, Count, Avg, StdDev Random First, Last Longest, Shortest Choose(source) ChooseDepending(col, val) Vote Coalesce Group, Concat MostRecent MostAbstract, MostSpecific. Standard Aggregationsfunktionen Zufallswahl Nimmt ersten/letzten Wert, reihenfolgeabhängig Nimmt längsten/kürzesten Wert Quellenauswahl Wahl abhängig von val in col Mehrheitsentscheid Nimmt ersten nicht-null Wert Gruppiert, fügt zusammen Nimmt aktuellsten Wert Benutzt eine Taxonomie Vgl. Quelle 8 Fusion 49 / 61

50 FuSem Fusion Semantics erweitertes SQL FuseBy - Statement ConQuer, MatchJoin, und Merge Visialisierung mit Venn-Diagrammen Fusion 50 / 61

51 Offenes Problem: XML-Fusion Herausforderung I: Identifizieren der Objekte Vgl. Quelle 9 Fusion 51 / 61

52 Offenes Problem: XML-Fusion Herausforderung II: Flexibilität des Datenmodells Quelle 1 2 unterschiedliche DTDs (Document Type Definition) gegeben: <ELEMENT person1(nachname,vorname) (Nachname,Geburtstag)> Quelle 2 <ELEMENT person2(nachname,vorname,geburtstag)> Fusion 52 / 61

53 Tool DogmatiX DogmatiX - Tracks down Duplicates in XML Vergleicht Werte von XML-Elementen sowie deren Eltern, Kinder und Geschwister in der Baumstruktur Heuristiken werden benutzt um in Frage kommende Elemente bei der Duplikaterkennung einzuteilen Benutzt spezielles Ähnlichkeitsmaß, welches angepaßt ist an XML- Datenmodelle Projekt an der Uni Potsdam: Objektidentifikation in XML Fusion 53 / 61

54 Fehlerklassen Vgl. Quelle 1 Qualität 54 / 61

55 Datenqualität Auch: Informationsqualität = Fitness for use / Eignung für einen Zweck (Bsp: s versenden - Posteinwürfe) = User satisfaction / Kundenzufriedenheit Untersuchung nach Wang & Strong: Auswahl von 179 Kriterien Mitwirkung von 112 Studenten und 25 Industriepartnern Ergebnis: 15 Qualitäts-Kriterien in 4 Klassen zusammengefaßt Hinrichs: Datenqualitätsmanagement in Data Warehouse-Systemen. Dissertation Qualität 55 / 61

56 Qualität im DWH Def. Data Warehouse: Ein Data Warehouse ist eine physische Datenbank, die eine integrierte Sicht auf beliebige Daten zu Analysezwecken ermöglicht Vgl. Quelle 1, Seite 7 Qualität 56 / 61

57 Qualitätsmerkmale nach Hinrichs Vgl. Quelle 10 Qualität 57 / 61

58 Befragungsbeispiel Vgl. Quelle 11 Qualität 58 / 61

59 Qualitätsmerkmale nach Wang & Strong ' Vgl. Quelle 10 Qualität 59 / 61

60 Wer bewertet Qualität? S u b j e k t P r o z e s s O b j e k t A n f r a g e Datenquelle... Relevanz Glaubwürdigkeit... Verfügbarkeit Antwortzeit... Vollständigkeit Zeitnähe Vgl. Quelle 1 Qualität 60 / 61

61 Qualitätsmodelle Erweiterung von Datenmodellen für die Speicherung von Bewertungen attributbasiertes Modell nach Wang Für relationale Daten Jedes Attribut wird durch einen Qualitätsschlüssel erweitert Jeder Qualitätsschlüssel zeigt auf Bewertungen für den jeweiligen Attributwert Bewertungen können unterschiedliche Dimensionen haben (Genaugkeit, Relevanz,...) D²Q Modell nach Scannapieco et al. Graphbasiertes Datenmodell XML wird um Qualitätsdimensionen erweitert Anfragen zur Qualität eines Datenelements werden möglich Qualität 61 / 61

Datenqualität: allgemeiner Überblick Waldemar Braun. Seminar Datenqualität OvGU Magdeburg 03.12.2009

Datenqualität: allgemeiner Überblick Waldemar Braun. Seminar Datenqualität OvGU Magdeburg 03.12.2009 Datenqualität: allgemeiner Überblick Waldemar Braun Seminar Datenqualität OvGU Magdeburg Gliederung 1. Einleitung 2. Motivation 3. Definition 4. DQ-Probleme 5. DQ-Dimensionen 6. DQ-Modelle 7. Messen der

Mehr

Mengenvergleiche: Alle Konten außer das, mit dem größten Saldo.

Mengenvergleiche: Alle Konten außer das, mit dem größten Saldo. Mengenvergleiche: Mehr Möglichkeiten als der in-operator bietet der θany und der θall-operator, also der Vergleich mit irgendeinem oder jedem Tupel der Unteranfrage. Alle Konten außer das, mit dem größten

Mehr

Universität Augsburg, Institut für Informatik WS 2006/2007 Dr. W.-T. Balke 27. Nov. 2006 M. Endres, A. Huhn, T. Preisinger Lösungsblatt 5

Universität Augsburg, Institut für Informatik WS 2006/2007 Dr. W.-T. Balke 27. Nov. 2006 M. Endres, A. Huhn, T. Preisinger Lösungsblatt 5 Universität Augsburg, Institut für Informatik WS 2006/2007 Dr. W.-T. Balke 27. Nov. 2006 M. Endres, A. Huhn, T. Preisinger Lösungsblatt 5 Aufgabe 1: Projektion Datenbanksysteme I π A1,...,A n (π B1,...,B

Mehr

Data Cube. Aggregation in SQL. Beispiel: Autoverkäufe. On-line Analytical Processing (OLAP) 1. Einführung. 2. Aggregation in SQL, GROUP BY

Data Cube. Aggregation in SQL. Beispiel: Autoverkäufe. On-line Analytical Processing (OLAP) 1. Einführung. 2. Aggregation in SQL, GROUP BY Data Cube On-line Analytical Processing (OLAP). Einführung Ziel: Auffinden interessanter Muster in großen Datenmengen 2. Aggregation in SQL, GROUP BY 3. Probleme mit GROUP BY 4. Der Cube-Operator! Formulierung

Mehr

Die bisher bereits bekannten Aggregatsfunktionen MIN, MAX, SUM, AVG, COUNT, VARIANCE und STDDEV wurden um FIRST und LAST erweitert.

Die bisher bereits bekannten Aggregatsfunktionen MIN, MAX, SUM, AVG, COUNT, VARIANCE und STDDEV wurden um FIRST und LAST erweitert. Betrifft Autor FIRST, LAST Markus Jägle (markus.jaegle@trivadis.com) Art der Info Technische Background Info (April 2002) Quelle Aus dem NF9i-Kurs, NF9i-Techno-Circle der Trivadis und Oracle9i Data Warehousing

Mehr

Alignment-Verfahren zum Vergleich biologischer Sequenzen

Alignment-Verfahren zum Vergleich biologischer Sequenzen zum Vergleich biologischer Sequenzen Hans-Joachim Böckenhauer Dennis Komm Volkshochschule Zürich. April Ein biologisches Problem Fragestellung Finde eine Methode zum Vergleich von DNA-Molekülen oder Proteinen

Mehr

IV. Datenbankmanagement

IV. Datenbankmanagement Wirtschaftsinformatik 2 (PWIN) IV. Datenbankmanagement Kapitel 2: Datenmanipulationssprache SQL Wirtschaftsinformatik 2 (PWIN) SS 2009, Professur für Mobile Business & Multilateral Security 1 Agenda 1.

Mehr

SQL für Trolle. mag.e. Dienstag, 10.2.2009. Qt-Seminar

SQL für Trolle. mag.e. Dienstag, 10.2.2009. Qt-Seminar Qt-Seminar Dienstag, 10.2.2009 SQL ist......die Abkürzung für Structured Query Language (früher sequel für Structured English Query Language )...ein ISO und ANSI Standard (aktuell SQL:2008)...eine Befehls-

Mehr

TU München, Fakultät für Informatik Lehrstuhl III: Datenbanksysteme Prof. Alfons Kemper, Ph.D.

TU München, Fakultät für Informatik Lehrstuhl III: Datenbanksysteme Prof. Alfons Kemper, Ph.D. TU München, Fakultät für Informatik Lehrstuhl III: Datenbanksysteme Prof. Alfons Kemper, Ph.D. Blatt Nr. 7 Übung zur Vorlesung Grundlagen: Datenbanken im WS13/14 Henrik Mühe (muehe@in.tum.de) http://www-db.in.tum.de/teaching/ws1314/dbsys/exercises/

Mehr

7. Übung - Datenbanken

7. Übung - Datenbanken 7. Übung - Datenbanken Informatik I für Verkehrsingenieure Aufgaben inkl. Beispiellösungen 1. Aufgabe: DBS a Was ist die Kernaufgabe von Datenbanksystemen? b Beschreiben Sie kurz die Abstraktionsebenen

Mehr

SQL - Übungen Bearbeitung der Datenbank Personal (1)

SQL - Übungen Bearbeitung der Datenbank Personal (1) Bearbeitung der Datenbank Personal (1) 1. Abfragen einer einzigen Tabelle 1.1. Zeigen Sie alle Informationen an, die über die Kinder der Mitarbeiter gespeichert sind. 1.2. Zeigen Sie aus der Tabelle stelle

Mehr

Vorlesung Dokumentation und Datenbanken Klausur

Vorlesung Dokumentation und Datenbanken Klausur Dr. Stefan Brass 5. Februar 2002 Institut für Informatik Universität Giessen Vorlesung Dokumentation und Datenbanken Klausur Name: Geburtsdatum: Geburtsort: (Diese Daten werden zur Ausstellung des Leistungsnachweises

Mehr

Das SQL-Schlüsselwort ALL entspricht dem Allquantor der Prädikatenlogik

Das SQL-Schlüsselwort ALL entspricht dem Allquantor der Prädikatenlogik Beispielaufgaben Informationssysteme erstellt von Fabian Rump zur IS Vorlesung 2009/10 1 Multiple Choice Aussage richtig falsch Eine SQL-Abfrage beginnt immer mit dem Schlüsselwort SELECT Eine Datenbank

Mehr

Kurzanleitung. Toolbox. T_xls_Import

Kurzanleitung. Toolbox. T_xls_Import Kurzanleitung Toolbox T_xls_Import März 2007 UP GmbH Anleitung_T_xls_Import_1-0-5.doc Seite 1 Toolbox T_xls_Import Inhaltsverzeichnis Einleitung...2 Software Installation...2 Software Starten...3 Das Excel-Format...4

Mehr

Theoretische Grundlagen der Informatik

Theoretische Grundlagen der Informatik Theoretische Grundlagen der Informatik Vorlesung am 12.01.2012 INSTITUT FÜR THEORETISCHE 0 KIT 12.01.2012 Universität des Dorothea Landes Baden-Württemberg Wagner - Theoretische und Grundlagen der Informatik

Mehr

Datenbanksysteme 2 Frühjahr-/Sommersemester 2014 28. Mai 2014

Datenbanksysteme 2 Frühjahr-/Sommersemester 2014 28. Mai 2014 Lehrstuhl für Praktische Informatik III Prof. Dr. Guido Moerkotte Email: moer@db.informatik.uni-mannheim.de Marius Eich Email: marius.eich@uni-mannheim.de Datenbanksysteme 2 8. Übungsblatt Frühjahr-/Sommersemester

Mehr

Datenbanken Kapitel 2

Datenbanken Kapitel 2 Datenbanken Kapitel 2 1 Eine existierende Datenbank öffnen Eine Datenbank, die mit Microsoft Access erschaffen wurde, kann mit dem gleichen Programm auch wieder geladen werden: Die einfachste Methode ist,

Mehr

Aufbau des SELECT-Befehls. Im Folgenden werden zunächst Abfragen aus einer Tabelle vorgenommen.

Aufbau des SELECT-Befehls. Im Folgenden werden zunächst Abfragen aus einer Tabelle vorgenommen. Datenbankabfragen (Query) mit SQL (Structured Query Language) 1 Aufbau des SELECT-Befehls Im Folgenden werden zunächst Abfragen aus einer Tabelle vorgenommen. SQL-Syntax: SELECT spaltenliste FROM tabellenname

Mehr

Informatik 12 Datenbanken SQL-Einführung

Informatik 12 Datenbanken SQL-Einführung Informatik 12 Datenbanken SQL-Einführung Gierhardt Vorbemerkungen Bisher haben wir Datenbanken nur über einzelne Tabellen kennen gelernt. Stehen mehrere Tabellen in gewissen Beziehungen zur Beschreibung

Mehr

SQL SQL. SQL = Structured Query Language (SEQUEL) IBM San Jose Research Laboratory SYSTEM R. Grundlagen der Datenbanksysteme I

SQL SQL. SQL = Structured Query Language (SEQUEL) IBM San Jose Research Laboratory SYSTEM R. Grundlagen der Datenbanksysteme I SQL SQL = Structured Query Language (SEQUEL) IBM San Jose Research Laboratory SYSTEM R VII-1 Beispielrelationen Filiale ( Name Leiter Stadt Einlagen ) Konto ( KontoNr KundenNr FilialName Saldo ) Kredit

Mehr

3. Das Relationale Datenmodell

3. Das Relationale Datenmodell 3. Das Relationale Datenmodell Das Relationale Datenmodell geht zurück auf Codd (1970): E. F. Codd: A Relational Model of Data for Large Shared Data Banks. Comm. of the ACM 13(6): 377-387(1970) DBMS wie

Mehr

SQL. strukturierte Datenbankabfragesprache eine Datenbanksprache zur. Structured Query Language:

SQL. strukturierte Datenbankabfragesprache eine Datenbanksprache zur. Structured Query Language: SQL Structured Query Language: strukturierte Datenbankabfragesprache eine Datenbanksprache zur Definition, Abfrage und Manipulation von Daten in relationalen Datenbanken In der SQL-Ansicht arbeiten In

Mehr

Binäre Bäume. 1. Allgemeines. 2. Funktionsweise. 2.1 Eintragen

Binäre Bäume. 1. Allgemeines. 2. Funktionsweise. 2.1 Eintragen Binäre Bäume 1. Allgemeines Binäre Bäume werden grundsätzlich verwendet, um Zahlen der Größe nach, oder Wörter dem Alphabet nach zu sortieren. Dem einfacheren Verständnis zu Liebe werde ich mich hier besonders

Mehr

TimeSafe Leistungserfassung

TimeSafe Leistungserfassung Keep your time safe. TimeSafe Leistungserfassung Adressimport 1/8 Inhaltsverzeichnis Inhaltsverzeichnis... 2 1 Allgemeines... 3 1.1 Adressen in der TimeSafe Leistungserfassung... 3 1.2 Organisationen und/oder

Mehr

Data Quality Management: Abgleich großer, redundanter Datenmengen

Data Quality Management: Abgleich großer, redundanter Datenmengen Data Quality Management: Abgleich großer, redundanter Datenmengen Westendstr. 14 809 München Tel 089-5100 907 Fax 089-5100 9087 E-Mail Datras@Datras.de Redundanz und relationales Datenbankmodell Redundanz:

Mehr

DATENBANKEN SQL UND SQLITE VON MELANIE SCHLIEBENER

DATENBANKEN SQL UND SQLITE VON MELANIE SCHLIEBENER DATENBANKEN SQL UND SQLITE VON MELANIE SCHLIEBENER INHALTSVERZEICHNIS 1. Datenbanken 2. SQL 1.1 Sinn und Zweck 1.2 Definition 1.3 Modelle 1.4 Relationales Datenbankmodell 2.1 Definition 2.2 Befehle 3.

Mehr

Klausur Interoperabilität

Klausur Interoperabilität Klausur 21. Juni 2012 9.30 11.00 Uhr Workflow Systems and Technology Group Fakultät für Informatik Universität Wien Univ.-Prof. Dr. Stefanie Rinderle-Ma Allgemeine Hinweise: Die Bearbeitungszeit beträgt

Mehr

SDD System Design Document

SDD System Design Document SDD Software Konstruktion WS01/02 Gruppe 4 1. Einleitung Das vorliegende Dokument richtet sich vor allem an die Entwickler, aber auch an den Kunden, der das enstehende System verwenden wird. Es soll einen

Mehr

Allgemeines zu Datenbanken

Allgemeines zu Datenbanken Allgemeines zu Datenbanken Was ist eine Datenbank? Datensatz Zusammenfassung von Datenelementen mit fester Struktur Z.B.: Kunde Alois Müller, Hegenheimerstr. 28, Basel Datenbank Sammlung von strukturierten,

Mehr

Benutzer Verwalten. 1. Benutzer Browser

Benutzer Verwalten. 1. Benutzer Browser Benutzer Verwalten 1. Benutzer Browser Die Benutzer können vom Verwaltung Panel Benutzer Option Gruppe Benutzer, verwaltet werden. Diese Option öffnet ein Browser, der die Benutzer der CRM Applikation,

Mehr

Anforderungen an die HIS

Anforderungen an die HIS Anforderungen an die HIS Zusammengefasst aus den auf IBM Software basierenden Identity Management Projekten in NRW Michael Uebel uebel@de.ibm.com Anforderung 1 IBM Software Group / Tivoli Ein Feld zum

Mehr

Integration, Migration und Evolution

Integration, Migration und Evolution 14. Mai 2013 Programm für heute 1 2 Quelle Das Material zu diesem Kapitel stammt aus der Vorlesung Datenintegration & Datenherkunft der Universität Tübingen gehalten von Melanie Herschel im WS 2010/11.

Mehr

Programmieren I. Kapitel 7. Sortieren und Suchen

Programmieren I. Kapitel 7. Sortieren und Suchen Programmieren I Kapitel 7. Sortieren und Suchen Kapitel 7: Sortieren und Suchen Ziel: Varianten der häufigsten Anwendung kennenlernen Ordnung Suchen lineares Suchen Binärsuche oder Bisektionssuche Sortieren

Mehr

OPERATIONEN AUF EINER DATENBANK

OPERATIONEN AUF EINER DATENBANK Einführung 1 OPERATIONEN AUF EINER DATENBANK Ein Benutzer stellt eine Anfrage: Die Benutzer einer Datenbank können meist sowohl interaktiv als auch über Anwendungen Anfragen an eine Datenbank stellen:

Mehr

Data Warehousing. Sommersemester 2005. Ulf Leser Wissensmanagement in der Bioinformatik

Data Warehousing. Sommersemester 2005. Ulf Leser Wissensmanagement in der Bioinformatik Data Warehousing Sommersemester 2005 Ulf Leser Wissensmanagement in der Bioinformatik ... Der typische Walmart Kaufagent verwendet täglich mächtige Data Mining Werkzeuge, um die Daten der 300 Terabyte

Mehr

mit Musterlösungen Prof. Dr. Gerd Stumme, Dipl.-Inform. Christoph Schmitz 11. Juni 2007

mit Musterlösungen Prof. Dr. Gerd Stumme, Dipl.-Inform. Christoph Schmitz 11. Juni 2007 6. Übung zur Vorlesung Datenbanken im Sommersemester 2007 mit Musterlösungen Prof. Dr. Gerd Stumme, Dipl.-Inform. Christoph Schmitz 11. Juni 2007 Aufgabe 1: Rekursion Betrachten Sie die folgende Tabelle

Mehr

4. AUSSAGENLOGIK: SYNTAX. Der Unterschied zwischen Objektsprache und Metasprache lässt sich folgendermaßen charakterisieren:

4. AUSSAGENLOGIK: SYNTAX. Der Unterschied zwischen Objektsprache und Metasprache lässt sich folgendermaßen charakterisieren: 4. AUSSAGENLOGIK: SYNTAX 4.1 Objektsprache und Metasprache 4.2 Gebrauch und Erwähnung 4.3 Metavariablen: Verallgemeinerndes Sprechen über Ausdrücke von AL 4.4 Die Sprache der Aussagenlogik 4.5 Terminologie

Mehr

IBIS Professional. z Dokumentation zur Dublettenprüfung

IBIS Professional. z Dokumentation zur Dublettenprüfung z Dokumentation zur Dublettenprüfung Die Dublettenprüfung ist ein Zusatzpaket zur IBIS-Shopverwaltung für die Classic Line 3.4 und höher. Dubletten entstehen dadurch, dass viele Kunden beim Bestellvorgang

Mehr

Auswertung erstellen: Liste mit E-Mail-

Auswertung erstellen: Liste mit E-Mail- Anleitung Auswertung erstellen: Liste mit E-Mail-Adressen Auswertung erstellen: Liste mit E-Mail- Adressen Das Beispiel Sie möchten für den Versand eines Newletters per E-Mail eine Liste der in mention

Mehr

Datenstrukturen & Algorithmen

Datenstrukturen & Algorithmen Datenstrukturen & Algorithmen Matthias Zwicker Universität Bern Frühling 2010 Übersicht Binäre Suchbäume Einführung und Begriffe Binäre Suchbäume 2 Binäre Suchbäume Datenstruktur für dynamische Mengen

Mehr

Nachtrag: Farben. Farbblindheit. (Light und Bartlein 2004)

Nachtrag: Farben. Farbblindheit. (Light und Bartlein 2004) Nachtrag: Farben Farbblindheit (Light und Bartlein 2004) 1 Vorgeschlagene Farbskalen (Light and Bartlein 2004) Farbkodierung metrisch skalierter Daten Unterscheide: 1. Sequential Data (ohne Betonung der

Mehr

OP-LOG www.op-log.de

OP-LOG www.op-log.de Verwendung von Microsoft SQL Server, Seite 1/18 OP-LOG www.op-log.de Anleitung: Verwendung von Microsoft SQL Server 2005 Stand Mai 2010 1 Ich-lese-keine-Anleitungen 'Verwendung von Microsoft SQL Server

Mehr

Einführung. Vorlesungen zur Komplexitätstheorie: Reduktion und Vollständigkeit (3) Vorlesungen zur Komplexitätstheorie. K-Vollständigkeit (1/5)

Einführung. Vorlesungen zur Komplexitätstheorie: Reduktion und Vollständigkeit (3) Vorlesungen zur Komplexitätstheorie. K-Vollständigkeit (1/5) Einführung 3 Vorlesungen zur Komplexitätstheorie: Reduktion und Vollständigkeit (3) Univ.-Prof. Dr. Christoph Meinel Hasso-Plattner-Institut Universität Potsdam, Deutschland Hatten den Reduktionsbegriff

Mehr

In diesem Thema lernen wir die Grundlagen der Datenbanken kennen und werden diese lernen einzusetzen. Access. Die Grundlagen der Datenbanken.

In diesem Thema lernen wir die Grundlagen der Datenbanken kennen und werden diese lernen einzusetzen. Access. Die Grundlagen der Datenbanken. In diesem Thema lernen wir die Grundlagen der Datenbanken kennen und werden diese lernen einzusetzen. Access Die Grundlagen der Datenbanken kurspc15 Inhaltsverzeichnis Access... Fehler! Textmarke nicht

Mehr

Anbindung Borland CaliberRM

Anbindung Borland CaliberRM Anbindung Borland CaliberRM pure::variants - Das Werkzeug Einstieg intergrierbar in bestehende Softwareentwicklungsprozesse unabhängig von der genutzten Programmiersprache Anwendung automatische Auflösung

Mehr

Datenbanken Microsoft Access 2010

Datenbanken Microsoft Access 2010 Datenbanken Microsoft Access 2010 Abfragen Mithilfe von Abfragen kann ich bestimmte Informationen aus einer/mehrerer Tabellen auswählen und nur diese anzeigen lassen die Daten einer/mehrerer Tabellen sortieren

Mehr

Im Folgenden wird Ihnen an einem Beispiel erklärt, wie Sie Excel-Anlagen und Excel-Vorlagen erstellen können.

Im Folgenden wird Ihnen an einem Beispiel erklärt, wie Sie Excel-Anlagen und Excel-Vorlagen erstellen können. Excel-Schnittstelle Im Folgenden wird Ihnen an einem Beispiel erklärt, wie Sie Excel-Anlagen und Excel-Vorlagen erstellen können. Voraussetzung: Microsoft Office Excel ab Version 2000 Zum verwendeten Beispiel:

Mehr

Ein Schlüssel ist eine Menge von Attributen (also eines oder mehrere), die eine Datenzeile (Tupel) einer Tabelle eindeutig identifiziert

Ein Schlüssel ist eine Menge von Attributen (also eines oder mehrere), die eine Datenzeile (Tupel) einer Tabelle eindeutig identifiziert Maika Büschenfeldt Datenbanken: Skript 1 1. Was ist eine relationale Datenbank? In Datenbanken können umfangreiche Datenbestände strukturiert abgelegt werden. Das Konzept relationaler Datenbanken soll

Mehr

.htaccess HOWTO. zum Schutz von Dateien und Verzeichnissen mittels Passwortabfrage

.htaccess HOWTO. zum Schutz von Dateien und Verzeichnissen mittels Passwortabfrage .htaccess HOWTO zum Schutz von Dateien und Verzeichnissen mittels Passwortabfrage Stand: 21.06.2015 Inhaltsverzeichnis 1. Vorwort...3 2. Verwendung...4 2.1 Allgemeines...4 2.1 Das Aussehen der.htaccess

Mehr

Carl-Engler-Schule Karlsruhe Datenbank 1 (5)

Carl-Engler-Schule Karlsruhe Datenbank 1 (5) Carl-Engler-Schule Karlsruhe Datenbank 1 (5) Informationen zur Datenbank 1. Definition 1.1 Datenbank-Basis Eine Datenbank-Basis ist eine Sammlung von Informationen über Objekte (z.b Musikstücke, Einwohner,

Mehr

Datenbanken SQL Einführung Datenbank in MySQL einrichten mit PhpMyAdmin

Datenbanken SQL Einführung Datenbank in MySQL einrichten mit PhpMyAdmin Datenbanken SQL Einführung Datenbank in MySQL einrichten mit PhpMyAdmin PhpMyAdmin = grafsches Tool zur Verwaltung von MySQL-Datenbanken Datenbanken erzeugen und löschen Tabellen und Spalten einfügen,

Mehr

Access [basics] Gruppierungen in Abfragen. Beispieldatenbank. Abfragen gruppieren. Artikel pro Kategorie zählen

Access [basics] Gruppierungen in Abfragen. Beispieldatenbank. Abfragen gruppieren. Artikel pro Kategorie zählen Abfragen lassen sich längst nicht nur dazu benutzen, die gewünschten Felder oder Datensätze einer oder mehrerer Tabellen darzustellen. Sie können Daten auch nach bestimmten Kriterien zu Gruppen zusammenfassen

Mehr

Anleitung zur Verwendung der VVW-Word-Vorlagen

Anleitung zur Verwendung der VVW-Word-Vorlagen Anleitung zur Verwendung der VVW-Word-Vorlagen v1.0. Feb-15 1 1 Vorwort Sehr geehrte Autorinnen und Autoren, wir haben für Sie eine Dokumentenvorlage für Microsoft Word entwickelt, um Ihnen die strukturierte

Mehr

An integrated total solution for automatic job scheduling without user interaction

An integrated total solution for automatic job scheduling without user interaction An integrated total solution for automatic job scheduling without user interaction Multifunktional Der Job-Scheduler ist ein multifunktionaler Taskplaner welcher die Steuerzentrale zur regelmässigen Ausführung

Mehr

Stellen Sie bitte den Cursor in die Spalte B2 und rufen die Funktion Sverweis auf. Es öffnet sich folgendes Dialogfenster

Stellen Sie bitte den Cursor in die Spalte B2 und rufen die Funktion Sverweis auf. Es öffnet sich folgendes Dialogfenster Es gibt in Excel unter anderem die so genannten Suchfunktionen / Matrixfunktionen Damit können Sie Werte innerhalb eines bestimmten Bereichs suchen. Als Beispiel möchte ich die Funktion Sverweis zeigen.

Mehr

Options- und Freitext-Modul Update-Anleitung

Options- und Freitext-Modul Update-Anleitung Options- und Freitext-Modul Update-Anleitung Hinweis... 2 Update für Versionen kleiner als 1.2.4 auf 1.3.x... 3 Update für Versionen ab 1.2.4 auf 1.3.x... 6 Update für Versionen ab 1.3.x auf 2.x.x... 7

Mehr

https://webct.net.ethz.ch/script/dbsyst/scripts/student/serve_quiz_marked.pl?do_g...

https://webct.net.ethz.ch/script/dbsyst/scripts/student/serve_quiz_marked.pl?do_g... Seite 1 von 5 View Results Übung 3 User ID: unizh.ch_scherrer_larissa_733033363031363501 Attempt: 1 / 1 Out of: 16 Started: May 31, 2006 20:43 Finished: June 6, 2006 15:04 Time spent: 138 hr, 20 min.,

Mehr

Kurzanleitung zur Bereitstellung von Sachverhalten und Lösungen zum Universitätsrepetitorium auf dem Server unirep.rewi.hu-berlin.

Kurzanleitung zur Bereitstellung von Sachverhalten und Lösungen zum Universitätsrepetitorium auf dem Server unirep.rewi.hu-berlin. Humboldt-Universität zu Berlin Juristische Fakultät Kurzanleitung zur Bereitstellung von Sachverhalten und Lösungen zum Universitätsrepetitorium auf dem Server unirep.rewi.hu-berlin.de Stand: 1. Juni 2010

Mehr

Um ein solches Dokument zu erzeugen, muss eine Serienbriefvorlage in Word erstellt werden, das auf die von BüroWARE erstellte Datei zugreift.

Um ein solches Dokument zu erzeugen, muss eine Serienbriefvorlage in Word erstellt werden, das auf die von BüroWARE erstellte Datei zugreift. Briefe Schreiben - Arbeiten mit Word-Steuerformaten Ab der Version 5.1 stellt die BüroWARE über die Word-Steuerformate eine einfache Methode dar, Briefe sowie Serienbriefe mit Hilfe der Korrespondenzverwaltung

Mehr

Cayuga. A General Purpose Event Monotoring System. David Pfeiffer. 19. Juli 2007

Cayuga. A General Purpose Event Monotoring System. David Pfeiffer. 19. Juli 2007 Cayuga A General Purpose Event Monotoring System David Pfeiffer 19. Juli 2007 1 / 24 Themen 1 2 Aufbau Operatoren 3 Das Modell der Zustandsübergang Zustandstypen 4 Beispiel Kritik & Fragen 2 / 24 Was ist

Mehr

Klassifikation von Integrationskonflikten

Klassifikation von Integrationskonflikten Klassifikation von Integrationskonflikten Christiane Telöken 1 Inhaltsverzeichnis 1. Was bedeutet Integration? 2. Strukturelle Heterogenitätskonflikte 2.1 Konflikte bei bilateralen Korrespondenzen 2.2

Mehr

Berechnungen in Access Teil I

Berechnungen in Access Teil I in Access Teil I Viele Daten müssen in eine Datenbank nicht eingetragen werden, weil sie sich aus anderen Daten berechnen lassen. Zum Beispiel lässt sich die Mehrwertsteuer oder der Bruttopreis in einer

Mehr

AGROPLUS Buchhaltung. Daten-Server und Sicherheitskopie. Version vom 21.10.2013b

AGROPLUS Buchhaltung. Daten-Server und Sicherheitskopie. Version vom 21.10.2013b AGROPLUS Buchhaltung Daten-Server und Sicherheitskopie Version vom 21.10.2013b 3a) Der Daten-Server Modus und der Tresor Der Daten-Server ist eine Betriebsart welche dem Nutzer eine grosse Flexibilität

Mehr

Datenbanken: Relationales Datenbankmodell RDM

Datenbanken: Relationales Datenbankmodell RDM Das RDM wurde in den 70'er Jahren von Codd entwickelt und ist seit Mitte der 80'er Jahre definierter Standard für Datenbanksysteme! Der Name kommt vom mathematischen Konzept einer Relation: (Sind A, B

Mehr

Die Excel Schnittstelle - Pro Pack

Die Excel Schnittstelle - Pro Pack Die Excel Schnittstelle - Pro Pack Die Excel Pro Pack ist eine Erweiterung der normalen Excel Schnittstelle, die in der Vollversion von POSWare Bestandteil der normalen Lizenz und somit für alle Lizenznehmer

Mehr

Schritt 1 - Registrierung und Anmeldung

Schritt 1 - Registrierung und Anmeldung Schritt 1 - Registrierung und Anmeldung Anmeldung: Ihre Zugangsdaten haben Sie per EMail erhalten, bitte melden Sie sich mit diesen auf www.inthega-datenbank.de an. Bitte merken Sie sich die Zugangsdaten

Mehr

Einführung in die Java- Programmierung

Einführung in die Java- Programmierung Einführung in die Java- Programmierung Dr. Volker Riediger Tassilo Horn riediger horn@uni-koblenz.de WiSe 2012/13 1 Wichtig... Mittags Pommes... Praktikum A 230 C 207 (Madeleine) F 112 F 113 (Kevin) E

Mehr

ITF2XML. Transferservice. Version 1.0. infogrips GmbH, Zürich client10.doc, Revision 1.1. Tel.: 01 / 350 10 10 Fax: 01 / 350 10 19.

ITF2XML. Transferservice. Version 1.0. infogrips GmbH, Zürich client10.doc, Revision 1.1. Tel.: 01 / 350 10 10 Fax: 01 / 350 10 19. GmbH Obstgartenstrasse 7 Informationssysteme Engineering & Consulting CH-8035 Zürich Tel.: 01 / 350 10 10 Fax: 01 / 350 10 19 ITF2XML Transferservice Version 1.0 infogrips GmbH, Zürich client10.doc, Revision

Mehr

1 Konto für HBCI/FinTS mit Chipkarte einrichten

1 Konto für HBCI/FinTS mit Chipkarte einrichten 1 Konto für HBCI/FinTS mit Chipkarte einrichten Um das Verfahren HBCI/FinTS mit Chipkarte einzusetzen, benötigen Sie einen Chipkartenleser und eine Chipkarte. Die Chipkarte erhalten Sie von Ihrem Kreditinstitut.

Mehr

Einfache kryptographische Verfahren

Einfache kryptographische Verfahren Einfache kryptographische Verfahren Prof. Dr. Hagen Knaf Studiengang Angewandte Mathematik 26. April 2015 c = a b + a b + + a b 1 11 1 12 2 1n c = a b + a b + + a b 2 21 1 22 2 2n c = a b + a b + + a b

Mehr

Künstliches binäres Neuron

Künstliches binäres Neuron Künstliches binäres Neuron G.Döben-Henisch Fachbereich Informatik und Ingenieurwissenschaften FH Frankfurt am Main University of Applied Sciences D-60318 Frankfurt am Main Germany Email: doeben at fb2.fh-frankfurt.de

Mehr

Software-Engineering Einführung

Software-Engineering Einführung Software-Engineering Einführung 7. Übung (04.12.2014) Dr. Gergely Varró, gergely.varro@es.tu-darmstadt.de Erhan Leblebici, erhan.leblebici@es.tu-darmstadt.de Tel.+49 6151 16 4388 ES Real-Time Systems Lab

Mehr

Database Exchange Manager. Infinqa IT Solutions GmbH, Berlin Stralauer Allee 2 10245 Berlin Tel.:+49(0) 30 2900 8639 Fax.:+49(0) 30 2900 8695

Database Exchange Manager. Infinqa IT Solutions GmbH, Berlin Stralauer Allee 2 10245 Berlin Tel.:+49(0) 30 2900 8639 Fax.:+49(0) 30 2900 8695 Database Exchange Manager Replication Service- schematische Darstellung Replication Service- allgemeines Replikation von Daten von bzw. in ein SAP-System und einer relationalen DMS-Datenbank Kombination

Mehr

Fragenkatalog zum Kurs 1666 (Datenbanken in Rechnernetzen) Kurstext von SS 96

Fragenkatalog zum Kurs 1666 (Datenbanken in Rechnernetzen) Kurstext von SS 96 Fragenkatalog zum Kurs 1666 (Datenbanken in Rechnernetzen) Kurstext von SS 96 Dieser Fragenkatalog wurde aufgrund das Basistextes und zum Teil aus den Prüfungsprotokollen erstellt, um sich auf mögliche

Mehr

105.3 SQL-Datenverwaltung

105.3 SQL-Datenverwaltung LPI-Zertifizierung 105.3 SQL-Datenverwaltung Copyright ( ) 2009 by Dr. W. Kicherer. This work is licensed under the Creative Commons Attribution-Noncommercial-Share Alike 2.0 Germany License. To view a

Mehr

Schulungsunterlagen zur Version 3.3

Schulungsunterlagen zur Version 3.3 Schulungsunterlagen zur Version 3.3 Versenden und Empfangen von Veranstaltungen im CMS-System Jürgen Eckert Domplatz 3 96049 Bamberg Tel (09 51) 5 02 2 75 Fax (09 51) 5 02 2 71 Mobil (01 79) 3 22 09 33

Mehr

SQL Tutorial. SQL - Tutorial SS 06. Hubert Baumgartner. INSO - Industrial Software

SQL Tutorial. SQL - Tutorial SS 06. Hubert Baumgartner. INSO - Industrial Software SQL Tutorial SQL - Tutorial SS 06 Hubert Baumgartner INSO - Industrial Software Institut für Rechnergestützte Automation Fakultät für Informatik Technische Universität Wien Inhalt des Tutorials 1 2 3 4

Mehr

Entity-Relationship-Modell. Ein Studierender kann (oder muss) mehrere Vorlesungen hören. Eine Vorlesung wird i.a. von mehrerer Studierenden gehört.

Entity-Relationship-Modell. Ein Studierender kann (oder muss) mehrere Vorlesungen hören. Eine Vorlesung wird i.a. von mehrerer Studierenden gehört. Beziehungen Ein Studierender kann (oder muss) mehrere Vorlesungen hören. Eine Vorlesung wird i.a. von mehrerer Studierenden gehört. Eine Vorlesung wird von genau einem Dozenten gelesen. Ein Dozent kann

Mehr

Mai 2006. Hauptseminar: Nichtrelationale Datenbanken Historisch-Kulturwissenschaftliche Informationsverarbeitung Universität zu Köln

Mai 2006. Hauptseminar: Nichtrelationale Datenbanken Historisch-Kulturwissenschaftliche Informationsverarbeitung Universität zu Köln Hauptseminar: Nichtrelationale Historisch-Kulturwissenschaftliche Informationsverarbeitung Universität zu Köln Mai 2006 Was ist eine Datenbank? Erweiterung relationaler um eine Deduktionskomponente Diese

Mehr

Prozessbewertung und -verbesserung nach ITIL im Kontext des betrieblichen Informationsmanagements. von Stephanie Wilke am 14.08.08

Prozessbewertung und -verbesserung nach ITIL im Kontext des betrieblichen Informationsmanagements. von Stephanie Wilke am 14.08.08 Prozessbewertung und -verbesserung nach ITIL im Kontext des betrieblichen Informationsmanagements von Stephanie Wilke am 14.08.08 Überblick Einleitung Was ist ITIL? Gegenüberstellung der Prozesse Neuer

Mehr

Null-Werte in Relationalen Datenbanken

Null-Werte in Relationalen Datenbanken Seminar: Imperfektion in Datenbanken WS03/04 Null-Werte in Relationalen Datenbanken Thomas Bierhance Einführung Null-Werte in DBen sind notwendiges Übel, da... (1) das Wissen über die tatsächliche Welt

Mehr

SQL-Injection. Seite 1 / 16

SQL-Injection. Seite 1 / 16 SQL-Injection Seite 1 / 16 Allgemein: SQL (Structured Query Language) Datenbanksprache zur Definition von Datenstrukturen in Datenbanken Bearbeiten und Abfragen von Datensätzen Definition: SQL-Injection

Mehr

Dynamisches SQL. Folien zum Datenbankpraktikum Wintersemester 2009/10 LMU München

Dynamisches SQL. Folien zum Datenbankpraktikum Wintersemester 2009/10 LMU München Kapitel 4 Dynamisches SQL Folien zum Datenbankpraktikum Wintersemester 2009/10 LMU München 2008 Thomas Bernecker, Tobias Emrich unter Verwendung der Folien des Datenbankpraktikums aus dem Wintersemester

Mehr

Export-/Importanleitung für Citavi und EndNote

Export-/Importanleitung für Citavi und EndNote Export-/Importanleitung für Citavi und EndNote 1. Export aus Datenbanken und Bibliothekskatalogen Literaturdatenbanken und Bibliothekskataloge bieten Ihnen in der Regel die Möglichkeit an, gefundene Aufsätze

Mehr

Algorithmen & Datenstrukturen 1. Klausur

Algorithmen & Datenstrukturen 1. Klausur Algorithmen & Datenstrukturen 1. Klausur 7. Juli 2010 Name Matrikelnummer Aufgabe mögliche Punkte erreichte Punkte 1 35 2 30 3 30 4 15 5 40 6 30 Gesamt 180 1 Seite 2 von 14 Aufgabe 1) Programm Analyse

Mehr

Erstellen eines Formulars

Erstellen eines Formulars Seite 1 von 5 Word > Erstellen bestimmter Dokumente > Formen Erstellen von Formularen, die in Word ausgefüllt werden können Basierend auf einer Vorlage können Sie dieser Inhaltssteuerelemente und Hinweistext

Mehr

Im Original veränderbare Word-Dateien

Im Original veränderbare Word-Dateien Objekte einer Datenbank Microsoft Access Begriffe Wegen seines Bekanntheitsgrades und der großen Verbreitung auch in Schulen wird im Folgenden eingehend auf das Programm Access von Microsoft Bezug genommen.

Mehr

White Paper WinLine "Business Intelligence"

White Paper WinLine Business Intelligence White Paper WinLine "Business Intelligence" Seite 2 Inhaltsverzeichnis 1. WinLine "Business Intelligence"...3 1.1. Voraussetzung für die BI-Ausgabe...4 1.2. BI-Vorlagen...4 1.2.1. Erstellung einer Vorlage...4

Mehr

Objektorientierte Programmierung

Objektorientierte Programmierung Objektorientierte Programmierung 1 Geschichte Dahl, Nygaard: Simula 67 (Algol 60 + Objektorientierung) Kay et al.: Smalltalk (erste rein-objektorientierte Sprache) Object Pascal, Objective C, C++ (wiederum

Mehr

novapro Open Audittrail Report

novapro Open Audittrail Report novapro Open Audittrail Report Bedienungshandbuch 7001042001 Q11 Diese Beschreibung entspricht dem aktuellen Programmstand Version 1.0. Änderungen erfolgen zu jeder Zeit und ohne vorherige Ankündigung.

Mehr

Richtlinien für die Zitierweise am Institut für Angewandte Informatik und Formale Beschreibungsverfahren AIFB

Richtlinien für die Zitierweise am Institut für Angewandte Informatik und Formale Beschreibungsverfahren AIFB Richtlinien für die Zitierweise am Institut für Angewandte Informatik und Formale Beschreibungsverfahren AIFB Inhaltsverzeichnis 1. Hinweise zur Zitierweise und zum Literaturverzeichnis... 2 1.1. Allgemeine

Mehr

CBLOCK: An Automatic Blocking Mechanism for Large-Scale De-duplication Tasks. Cathleen Ramson, Stefan Lehmann LSDD SS 2013 25.04.

CBLOCK: An Automatic Blocking Mechanism for Large-Scale De-duplication Tasks. Cathleen Ramson, Stefan Lehmann LSDD SS 2013 25.04. CBLOCK: An Automatic Blocking Mechanism for Large-Scale De-duplication Tasks Cathleen Ramson, Stefan Lehmann LSDD SS 2013 25.04.2013 Gliederung 2 Motivation Ziel Algorithmen Zusammenfassung Bewertung Motivation

Mehr

SCHRITT FÜR SCHRITT ZU IHRER VERSCHLÜSSELTEN E-MAIL

SCHRITT FÜR SCHRITT ZU IHRER VERSCHLÜSSELTEN E-MAIL SCHRITT FÜR SCHRITT ZU IHRER VERSCHLÜSSELTEN E-MAIL www.klinik-schindlbeck.de info@klinik-schindlbeck.de Bitte beachten Sie, dass wir nicht für die Sicherheit auf Ihrem Endgerät verantwortlich sein können.

Mehr

Kapitel I: Registrierung im Portal

Kapitel I: Registrierung im Portal Kapitel I: Registrierung im Portal Um zu unserem Portal zu gelangen, rufen Sie bitte die folgende Internetseite auf: www.arag-forderungsmanagement.de Bei Ihrem ersten Besuch des ARAG Portals ist es notwendig,

Mehr

Urlaubsregel in David

Urlaubsregel in David Urlaubsregel in David Inhaltsverzeichnis KlickDown Beitrag von Tobit...3 Präambel...3 Benachrichtigung externer Absender...3 Erstellen oder Anpassen des Anworttextes...3 Erstellen oder Anpassen der Auto-Reply-Regel...5

Mehr

2. Datenbank-Programmierung

2. Datenbank-Programmierung 2. Datenbank-Programmierung SQL ist eingeschränkt bezüglich der algorithmischen Mächtigkeit, z.b. Berechnung einer transitiven Hülle ist in Standard-SQL nicht möglich. Die Einschränkung ist von Bedeutung

Mehr

Suche schlecht beschriftete Bilder mit Eigenen Abfragen

Suche schlecht beschriftete Bilder mit Eigenen Abfragen Suche schlecht beschriftete Bilder mit Eigenen Abfragen Ist die Bilderdatenbank über einen längeren Zeitraum in Benutzung, so steigt die Wahrscheinlichkeit für schlecht beschriftete Bilder 1. Insbesondere

Mehr

1 Mathematische Grundlagen

1 Mathematische Grundlagen Mathematische Grundlagen - 1-1 Mathematische Grundlagen Der Begriff der Menge ist einer der grundlegenden Begriffe in der Mathematik. Mengen dienen dazu, Dinge oder Objekte zu einer Einheit zusammenzufassen.

Mehr

Moodle-Kurzübersicht Kurse Sichern und Zurücksetzen

Moodle-Kurzübersicht Kurse Sichern und Zurücksetzen Moodle-Kurzübersicht Kurse Sichern und Zurücksetzen elearning.hs-lausitz.de Inhaltsverzeichnis: 1. Kurse Zurücksetzen 2. Kurse Sichern 3. Kurse Wiederherstellen Weitere Hilfe finden Sie unter www.hs-lausitz.de/studium/elearning.html

Mehr

Excel Pivot-Tabellen 2010 effektiv

Excel Pivot-Tabellen 2010 effektiv 7.2 Berechnete Felder Falls in der Datenquelle die Zahlen nicht in der Form vorliegen wie Sie diese benötigen, können Sie die gewünschten Ergebnisse mit Formeln berechnen. Dazu erzeugen Sie ein berechnetes

Mehr