Duplikaterkennung Felix Naumann
|
|
- Ilse Kerstin Holzmann
- vor 8 Jahren
- Abrufe
Transkript
1 Duplikaterkennung Felix Naumann
2 Quality 2 Even though quality cannot be defined, you know what it is. Robert Pirsig
3 Zoom in die Informationsqualität 3 1 Fitness for use 15 Accuracy, Objectivity, Believability, Reputation, Accessibility, Security, Relevance, Value-Added, Timeliness, Completeness, Amount of Data, Interpretability, Understandability, Consistency, Concise Representation Dimensions
4 Nachkommastellen 4
5 Deutsche Namen 5
6 Schwierige Namen 6
7 Falsche Duplikate 7
8 Unternehmensduplikate 8
9 Datenqualität: Probleme 9 Repräsentation Widersprüche Ref. Integrität KUNDE KNr Name Geb.datum Alter Geschlecht Telefon PLZ 1234 Kuhn, Mark m Anne Will f Eindeutigkeit 1235 Mark Kuhn m ADRESSE PLZ Ort Fehlende Werte Duplikate Schreibfehler Potsdam Postdam BRD Falsche Werte
10 Klassifikation von Datenfehlern 10 Datenfehler Einzelne Datenquelle Integrierte Datenquellen Schemaebene Datenebene Schemaebene Datenebene Unzulässiger Wert Attributabhängigkeit verletzt Eindeutigkeit verletzt Referentielle Integrität verletzt Fehlende Werte Schreibfehler Falsche Werte Falsche Referenz Kryptische Werte Eingebettete Werte Falsche Zuordnung Widersprüchliche Werte Transpositionen Duplikate Datenkonflikte Strukturelle Heterogenität Semantische Heterogenität Schematisch Heterogenität Widersprüchliche Werte Unterschiedliche Repräsentationen Unterschiedliche Einheiten Unterschiedliche Genauigkeit Unterschiedliche Aggregationsebenen Duplikate
11 DQ-Probleme: Auswirkungen 11 Fehlerhafte Warenpreise in Artikel-DB des US-Einzelhandels Kosten für Konsumenten 2.5 Mrd $ 80% der Barcode-Scan-Fehler zulasten der Konsumenten US-Finanzbehörde 1992: knapp Steuererstattungsbescheide unzustellbar 50-80% der Einträge im US- Vorstrafenregister ungenau, unvollständig oder fehlerhaft US-Post: von Massen- Postsendungen bis zu aufgrund von Adressfehlern unzustellbar
12 Hilfsmittel 12 Gesunder Menschenverstand Text-Editor Datenbanken und SQL ( Bordmittel ) Programmiersprachen Selbstentwickelte Tools Kommerzielle Tools Referenzdaten Orts- und PLZ-Verzeichnisse, Straßenverzeichnisse Namensverzeichnisse
13 Gesunder Menschenverstand 13
14 Standardisierung 14 Adressen Str. Straße, Ch. Chaussee, usw. R.-Breitscheid-Str. 72 a Rudolf-Breitscheid.-Str. 72A 128 Schreibweisen für Frankfurt am Main Frankfurt a.m., Frankfurt/M Frankfurt, Frankfurt a. Main, Namen Dr. Ing. h.c. F. Porsche AG Hewlett-Packard Development Company, L.P. Numerische Daten = 10T EURO = 10k EUR = ,00 = 10,000.- Telefonnummern Geburtsdaten
15 Strukturierung Personen 15 Anrede Titel Vorname Nachname Herr Prof. Dr. Peter Meier Anrede Titel Vorname Nachname Herr Prof. Dr. Peter Meier Anrede Titel Vorname Nachname Herr Prof. Dr. Peter und Marie Meier Anrede Titel Vorname Nachname Herr Prof. Dr. Peter Meier Frau Marie Meier
16 Strukturierung Straßen 16 Straße HNR Hauptstr. 7 Hauptstr. 7A Weg 17 Straße des 17. Juni 23
17 Versteckter Mehrwert 17 Quelle: Joachim Schmid, FUZZY! Informatik AG
18 Überblick 18 Das Problem der Duplikaterkennung Ähnlichkeitsmaße Edit Distance et al. Algorithmen Naiv Blocking Sorted-Neighborhood Methode Naive, Multipass Effizient Evaluierung
19 Wie entstehen Duplikate? 19 Original Zugestellt
20 Wie entstehen Duplikate? 20
21 21
22 Duplikaterkennung 22 Duplikaterkennung ist das Finden mehrerer Repräsentationen desselben Realweltobjekts. Problem 1: Repräsentationen sind nicht identisch. Fuzzy duplicates Lösung: Ähnlichkeitsmaße Wert- und Datensatzvergleiche Domänenunabhängig oder -abhängig Problem 2: Die Datenmenge ist groß. Quadratischer Aufwand: Jedes Paar muss verglichen werden. Lösung: Algorithmen Z.B. Vergleiche durch Partitionierung vermeiden
23 Duplikaterkennung 23 R 1 R 2 R 1 R 2 Ähnlichkeitsmaß Algorithmus Duplikate? Nicht- Duplikate
24 Wirkungen von Duplikaten 24 Mehrfache Zusendung von Katalogen Rechnungen werden doppelt bezahlt Banken Überschreiten des Kreditlimits wird nicht erkannt Lagerhaltung / Einkauf Zu niedriger Lagerbestand einzelner Waren wird ausgewiesen. Kein Ausnutzen von Mengenrabatten bei Bestellungen Gesamtumsatz eines Kunden bleibt unbekannt. Mehraufwand in der IT Sinkende Kundenzufriedenheit Potenziale und Gefahren nicht erkannt Inkorrekte Kennzahlen Kunde Umsatz BMW BaMoWe Bayerische Motorenwerke
25 Duplikaterkennung hat viele Duplikate 25 Household matching Dubletten Duplicate detection Mixed and split citation problem Match Object identification Record linkage Deduplication Entity resolution Identity uncertainty Hardening soft databases Object consolidation Fuzzy match Entity clustering Approximate match Reference reconciliation Merge/purge Householding Reference matching
26 Duplikaterkennung 26 Duplikaterkennung Identität Ähnlichkeitsmaß Algorithmus Evaluation Relational XML DWH Partitionierung Beziehungen Clustering / Lernen Precision/ Recall Effizienz Domänenunabhängig Domänenabhängig Filter Inkrementell / Suche Edit-basiert Token-basiert Regeln Datentypen Relationship-aware
27 Überblick 27 Das Problem der Duplikaterkennung Ähnlichkeitsmaße Edit Distance et al. Algorithmen Naiv Blocking Sorted-Neighborhood Methode Naive, Multipass Effizient Evaluierung
28 Overview Similarity Measures Jaccard 28 Damerau- Levenshtein Hamming Jaro-Winkler Levenshtein Jaro Words / n-grams Dice Smith- Waterman Edit-based Token-based Cosine Similarity Smith- Waterman-Gotoh Similarity Measures Monge-Elkan Dates Numerical attributes Domaindependent Rules Soundex Phonetic Kölner Phonetik Hybrid Metaphone Soft TF-IDF Double Metaphone
29 Overview Similarity Measures Jaccard 29 Damerau- Levenshtein Hamming Jaro-Winkler Levenshtein Jaro Words / n-grams Dice Smith- Waterman Edit-based Token-based Cosine Similarity Smith- Waterman-Gotoh Similarity Measures Monge-Elkan Dates Numerical attributes Domaindependent Rules Soundex Phonetic Kölner Phonetik Hybrid Metaphone Soft TF-IDF Double Metaphone
30 Levenshtein Distance 30 Minimum number of character insertions, deletions, and replacements necessary to transform s 1 into s 2 Computation based on dynamic programming 1. Initialize matrix M of size ( s 1 +1) x ( s 2 +1) 2. Fill matrix: M M i,0 i, j = i M M i 1, j 1 = 1+ min 0, j = j ( M, M, M ) i 1, j i, j 1 i 1, j 1 if s 1, i = s 2, j otherwise 3. Levenshtei ndist = M s1, s2 Levenshtein Similarity: sim Levenshtein = 1 LevenshteinDist max( s 1, s 2 )
31 M i,0 = i M 0, j = j Levenshtein Distance M i, j = M i 1, j 1 1+ min ( M, M, M ) i 1, j i, j 1 i 1, j 1 if s 1, i = s 2, j otherwise 31 J O N E S J O N E S J O N E S J 1 J J O 2 O 2 O H 3 H 3 H N 4 N 4 N S 5 S 5 S O 6 O 6 O N 7 N 7 N sim Levenshtein = 1 LevenshteinDist max( s 1, s 2 ) s 1 s 2 Levenshtein Distance sim Levenshtein Jones Johnson Paul Pual Paul Jones Jones, Paul 11 0
32 Damerau Levenshtein distance 32 Similar to Levenshtein distance, but considers additionally transposed characters M M i,0 i, j = = i M 1+ M i 1, j 1 0, j M M min M M = j i 1, j i, j 1,, i 1, j 1 i 2, j 2 if s 1, i = s 2, j 1 and s 1, i 1 = s 2, j if s 1, i = s 2, j otherwise s 1 s 2 Levenshtein Distance sim Levenshtein Jones Johnson Paul Pual Paul Jones Jones, Paul 11 0
33 Jaro 33 Search for common characters m: number of matching characters sim 1 m m = + jaro 3 s s m t m t : half the number of transpositions Search range matching characters: ( s, s ) max Example: s 1 P A U L s 1 J O N E S s 2 P U A L s 2 J O H N S O N m = 4 sim jaro 2 t = = = m = 4 sim jaro 0 t = = =
34 Jaro-Winkler 34 Extension of Jaro distance, considering a common prefix if sim jaro 0.7 : sim otherwise : sim jarowinkler jarowinkler = sim = sim jaro jaro + l p (1 sim jaro ) l : length of common prefix up to a maximum of 4 characters p : constant scaling factor for how much the score is adjusted upwards for having common prefixes (typically p=0.1) Example: s 1 sim = PAUL jaro l = 1 p = 0.1 sim = 0.92 jarowinkler s 2 = PUAL = ( ) = s 1 sim = JONES jaro l = 2 p = 0.1 sim = 0.79 jarowinkler s 2 = JOHNSON = ( ) =
35 Overview Similarity Measures Jaccard 35 Damerau- Levenshtein Hamming Jaro-Winkler Levenshtein Jaro Words / n-grams Dice Smith- Waterman Edit-based Token-based Cosine Similarity Smith- Waterman-Gotoh Similarity Measures Monge-Elkan Dates Numerical attributes Domaindependent Rules Soundex Phonetic Kölner Phonetik Hybrid Metaphone Soft TF-IDF Double Metaphone
36 Token-based Similarity Measures 36 Tokens ( Paul Jones ) Words / Terms ( Paul Jones ) n-grams ( _P, Pa, au, ul, l_, _J, Jo, on, ne, es, s_ ) Token similarity Jaccard coefficient sim Jaccard tokenize( s = tokenize( s 1 1 ) ) tokenize( s tokenize( s 2 2 ) ) Dice's coefficient 2 tokenize( s1) tokenize( s sim Dice = tokenize( s ) + tokenize( s ) ) s 1 s 2 Jaccard Dice Jones Johnson Paul Pual Paul Jones Jones, Paul
37 Overview Similarity Measures Jaccard 37 Damerau- Levenshtein Hamming Jaro-Winkler Levenshtein Jaro Words / n-grams Dice Smith- Waterman Edit-based Token-based Cosine Similarity Smith- Waterman-Gotoh Similarity Measures Monge-Elkan Dates Numerical attributes Domaindependent Rules Soundex Phonetic Kölner Phonetik Hybrid Metaphone Soft TF-IDF Double Metaphone
38 38 Soundex Soundex codes a last name based on the way a last name sounds 1. Retain first letter of the name and drop all other occurrences of A, E, H, I, O, U, W, Y 2. Replace consonants with digits 3. Two adjacent letters with the same number are coded as a single number 4. Continue until you have one letter and three numbers. If you run out of letters, fill in 0s until there are three numbers If a surname has a prefix, such as Van, Con, De, Di, La, or Le, code both with and without the prefix Digit Letters 1 B, F, P, V 2 C, G, J, K, Q, S, X, Z 3 D, T 4 L 5 M, N 6 R Example PAUL: PUAL: JONES: P400 P400 J520 JOHNSON: J525 Jenkins, Jansen, Jameson
39 39 Kölner Phonetik Like Soundex, but especially for German last names Letters get different codes based on the context Code length is not restricted Multiple occurrences of the same code and 0 are removed Example PAUL: 15 PUAL: 15 JONES: 68 JOHNSON:686 Letter Context Code A, E, I, J, O, U, Y 0 H - B P not before H D, T not before C, S, Z 2 F, V, W P G, K, Q C before H in the initial sound before A, H, K, L, O, Q, R, U, X before A, H, K, O, Q, U, X but not after S, Z X not after C, K, Q 48 L 5 M, N 6 R 7 S, Z C after S, Z D, T before C, S, Z X in the initial sound, but not before A, H, K, L, O, Q, R, U, X not before A, H, K, O, Q, U, X after C, K, Q
40 Overview Similarity Measures Jaccard 40 Damerau- Levenshtein Hamming Jaro-Winkler Levenshtein Jaro Words / n-grams Dice Smith- Waterman Edit-based Token-based Cosine Similarity Smith- Waterman-Gotoh Similarity Measures Monge-Elkan Dates Numerical attributes Domaindependent Rules Soundex Phonetic Kölner Phonetik Hybrid Metaphone Soft TF-IDF Double Metaphone
41 Monge-Elkan 41 Find best match for each token sim MongeElkan s1 s 1 2 = max sim' s j= 1 1 i= 1 ( s, s ) 1, i 2, j s = number of tokensin s sim' = in ternal similarity function ( e. g. Smith Waterman) Example: s 1 = Paul Jones s 2 = Jones, Paul = ( ) = Monge-Elkan is not symmetric: sim' = JaroWinkler sim MongeElkan 1 2 s 1 = aaa xaa yaa s 1 = aaa xaa yaa s 2 = aaa s 2 = aaa xxx yyy
42 Overview Similarity Measures Jaccard 42 Damerau- Levenshtein Hamming Jaro-Winkler Levenshtein Jaro Words / n-grams Dice Smith- Waterman Edit-based Token-based Cosine Similarity Smith- Waterman-Gotoh Similarity Measures Monge-Elkan Dates Numerical attributes Domaindependent Rules Soundex Phonetic Kölner Phonetik Hybrid Metaphone Soft TF-IDF Double Metaphone
43 Domain-dependent Similarity Measures 43 Data Types Special similarity for dates Special similarity for numerical attributes... Rules [Hernandez Stolfo 1998], [Lee et al. 2000] Given two records, r1 and r2. IF last name of r1 = last name of r2, AND first names differ slightly, AND address of r1 = address of r2 THEN r1 is equivalent to r2.
44 Classification 44 Pairwise classification 1. Use 1-n similarity functions to calculate attribute similarities 2. Aggregate attribute similarities to an overall similarity 3. Compare overall similarity with threshold Thresholds Attribute similarity thresholds Overall similarity thresholds Java Libraries Sim Metrics: Second String:
45 Überblick 45 Das Problem der Duplikaterkennung Ähnlichkeitsmaße Edit Distance et al. Algorithmen Naiv & Blocking Sorted-Neighborhood Methode Naive, Multipass Effizient Evaluierung
46 Naiver Algorithmus 46 Zwei geschachtelte Schleifen Java SQL SELECT C1.*, genid(c1,c2) FROM R as C1, R as C2 WHERE sim(c1,c2) > theta
47 Record Pairs as Matrix
48 Number of comparisons: All pairs comparisons
49 Reflexivity of Similarity comparisons
50 Symmetry of Similarity comparisons
51 Complexity 51 Still: Too many comparisons customers => comparisons (n ² n) / 2 Each comparison is expensive (complex similarity measures). Idea: Avoid comparisons by heuristics Filtering of records Partitionierung
52 Partitioning / Blocking 52 Partition the records (horizontally) and compare pairs of records only within a partition. Partitioning by first two zip-digits Ca. 100 partitions in Germany Ca. 100 customers per partition => comparisons Partition by first letter of surname Idea: Partition multiple times by different criteria. Source: wikipedia.de Then apply transitive closure on discovered duplicates.
53 Records sorted by ZIP comparisons
54 54
55 Blocking by ZIP comparisons
56 Blocking / Gruppierung / Partitionierung 56 Die Kunst: Geeignete Kriterien finden Gruppiere nach Stadt Gruppiere nach erstem Buchstaben des Nachnamen Gruppiere nach PLZ und Vorname Jede Gruppe sollte in den Hauptspeicher passen Gruppierungskriterium sollten möglichst fehlerfreie Attribute sein Praktisch: Sortierung mit SQL (nicht GROUP BY) Weiter: Mehrere Durchläufe mit unterschiedlichen Kriterien
57 Überblick 57 Das Problem der Duplikaterkennung Ähnlichkeitsmaße Edit Distance et al. Algorithmen Naiv & Blocking Sorted-Neighborhood Methode Naive, Multipass Effizient Evaluierung
58 Die Sorted Neighborhood Methode 58 Input: Tabelle mit N Tuplen Ähnlichkeitsmaß (basierend auf Edit distance) Output: Klassen (clusters) der äquivalenten Tupel (= Duplikate) Problem: Viele Tupel Vergleich eines jeden Tupelpaares zu aufwendig (Effizienz). Tabelle passt nicht in den Speicher (Skalierbarkeit).
59 Sorted Neighborhood 59 Idee Daten geschickt partitionieren. Nur innerhalb dieser Partitionen Duplikate suchen. Algorithmus nach [HS98] 1. Create Key: Schlüssel mittels relevanter Feldern erzeugen. Sequenz einer Teilmenge von Attributen oder der Teilketten innerhalb der Attribute. Effektivität des Algorithmus ist von Schlüsselauswahl abhängig. Schlüssel ist nur virtuell und nicht eindeutig. Wird nur für Sortierung benutzt. 2. Sort: Daten nach dem Schlüssel sortieren. 3. Merge: Fenster (der Größe w) über sortierte Tupel schieben. Nur Tupel innerhalb des Fensters miteinander vergleichen.
60 Sorted Neighborhood Methode [HS98] ID 17 Key MSKAD98 ID Title Year Genre Mask of Zorro 1998 Adventure 18 Addams Family 1991 Comedy 25 Rush Hour 1998 Comedy 31 Matrix 1999 Sci-Fi 52 Return of Dschafar 1994 Children 113 Adams Family 1991 Comedie 207 Return of Djaffar 1995 Children Create key DDMCO91 RSHCO98 MTRSC99 RTRCH94 DMSCO91 RTRCH95 2. Sort classify(18,113) duplicates classify(52,207) duplicates ID Key 18 DDMCO DMSCO91 17 MSKAD98 31 MTRSC99 25 RSHCO98 52 RTRCH RTRCH95 Merge 3. ID Key DDMCO91 DMSCO91 MSKAD98 MTRSC99 RSHCO98 RTRCH94 RTRCH95
61 SNM by ZIP (window size 4) comparisons
62 Sorted Neighborhood Aufwand 62 Aufwand N : Anzahl der Tupel, w: Fenstergröße (window) Theoretisch: O(N) + O(N logn) + O(w N) = O(N logn) bei w < logn; O(wN) sonst Praktisch: Drei Läufe über die Daten auf der Festplatte
63 Sorted Neighborhood Aufwand 63 Kommentare Wahl des Schlüssels Formulierung durch Experten Aufwändig Schwer vergleichbare Ergebnisse Für Effektivität entscheidend Wahl der Fenstergröße w = N : O(N²) max. accuracy & max. Zeit w= 2 : O(N) min. accuracy & min. Zeit Entscheidung ob ein Duplikat vorliegt, ist eine komplexe Berechnung (edit distance).
64 Sorted Neighborhood Multipass Verfahren 64 Problematische Schlüsselwahl Beispiel: Schlüssel beginnt mit ID r 1 : und r 2 : Problemlösung 1: Vergrößerung des Fensters: w N Problemlösung 2: Multipass Verfahren
65 Sorted Neighborhood Multipass Verfahren 65 Mehrmalige Durchführung von Sorted Neighborhood Methode mit verschiedenen Schlüsseln w relativ klein Transitive Hülle auf Ergebnissen jedes Durchgangs: Equivalent(a, b) && Equivalent (b, c) Equivalent (a, c) Dadurch werde neue Duplikate gefunden.
66 Überblick 66 Das Problem der Duplikaterkennung Ähnlichkeitsmaße Edit Distance et al. Algorithmen Naiv & Blocking Sorted-Neighborhood Methode Naive, Multipass Effizient Evaluierung
67 Precision & Recall 67 Data set False negatives True duplicates Precision = True positives Declared duplicates True positives False positives True negatives Declared duplicates Recall = True positives True duplicates F-Measure = 2 Precision Recall Precision + Recall
68 Arithmetisches Mittel ( Durchschnitt ) vs. Harmonisches Mittel ( F-Maß ) z = ½ (x + y) z = 2 (x y) / (x + y) 68
69 69 From Creating probabilistic databases from duplicated data Oktie Hassanzadeh Renée J. Miller (VLDBJ)
70 Duplikaterkennung Zielkonflikte 70 Precision Ähnlichkeitsschwellwert Recall Effizienz
71 Datenfusion 71 amazon.de H. Melville $3.98 ID max_length MIN CONCAT Herman Melville Moby Dick $5.99 bol.de
Duplikaterkennung - Motivation Masterseminar. Felix Naumann Hasso-Plattner-Institut
Duplikaterkennung - Motivation Masterseminar 16.4.2008 Felix Naumann Hasso-Plattner-Institut Fachgebiet Informationssysteme Überblick 2 Datenqualität Datenfehler und ihre Ursachen Datenreinigung i Duplikaterkennung
MehrWorkshop Datenreinigung Duplikaterkennung Felix Naumann
Workshop Datenreinigung Duplikaterkennung 11.10.2011 Felix Naumann Überblick 2 Das Problem der Duplikaterkennung Ähnlichkeitsmaße Edit Distance et al. Algorithmen Naiv Blocking Sorted-Neighborhood Methode
MehrDatenqualität und Datenreinigung
Datenqualität und Datenreinigung FGBS Herbsttreffen 10. November 2011 Felix Naumann Hasso-Plattner-Institut Fachgebiet Informationssysteme Überblick 2 Datenqualität Datenfehler und ihre Ursachen Datenreinigung
MehrInformationsqualität Antrittsvorlesung am
Informationsqualität Antrittsvorlesung am 26.4.2007 Felix Naumann Hasso-Plattner-Institut Fachgebiet Informationssysteme Überblick 2 Informationsqualität Informationsintegration Duplikaterkennung Ähnlichkeit
MehrDuplikaterkennung. Dr. Armin Roth arminroth.de. Dr. Armin Roth (arminroth.de) II Duplikaterkennung / 17
Dr. Armin Roth arminroth.de 27.04.2013 Dr. Armin Roth (arminroth.de) II Duplikaterkennung 27.04.2013 1 / 17 Agenda 1 Wiederholung: Datenwertintegration 2 Duplikaterkennung Dr. Armin Roth (arminroth.de)
MehrDatenbanksysteme 2 Frühjahr-/Sommersemester 2014 28. Mai 2014
Lehrstuhl für Praktische Informatik III Prof. Dr. Guido Moerkotte Email: moer@db.informatik.uni-mannheim.de Marius Eich Email: marius.eich@uni-mannheim.de Datenbanksysteme 2 8. Übungsblatt Frühjahr-/Sommersemester
MehrInformationsextraktion
Informationsextraktion Bestimmte Anwendungen bei der semantischen Verarbeitung erfordern keine tiefe linguistische Analyse mit exakter Disambiguierung (= eine einzige und korrekte Lesart). Hierzu gehört
MehrPreisliste für The Unscrambler X
Preisliste für The Unscrambler X english version Alle Preise verstehen sich netto zuzüglich gesetzlicher Mehrwertsteuer (19%). Irrtümer, Änderungen und Fehler sind vorbehalten. The Unscrambler wird mit
Mehrmiditech 4merge 4-fach MIDI Merger mit :
miditech 4merge 4-fach MIDI Merger mit : 4 x MIDI Input Port, 4 LEDs für MIDI In Signale 1 x MIDI Output Port MIDI USB Port, auch für USB Power Adapter Power LED und LOGO LEDs Hochwertiges Aluminium Gehäuse
MehrDie bisher bereits bekannten Aggregatsfunktionen MIN, MAX, SUM, AVG, COUNT, VARIANCE und STDDEV wurden um FIRST und LAST erweitert.
Betrifft Autor FIRST, LAST Markus Jägle (markus.jaegle@trivadis.com) Art der Info Technische Background Info (April 2002) Quelle Aus dem NF9i-Kurs, NF9i-Techno-Circle der Trivadis und Oracle9i Data Warehousing
MehrIV. Datenbankmanagement
Wirtschaftsinformatik 2 (PWIN) IV. Datenbankmanagement Kapitel 2: Datenmanipulationssprache SQL Wirtschaftsinformatik 2 (PWIN) SS 2009, Professur für Mobile Business & Multilateral Security 1 Agenda 1.
MehrSQL. strukturierte Datenbankabfragesprache eine Datenbanksprache zur. Structured Query Language:
SQL Structured Query Language: strukturierte Datenbankabfragesprache eine Datenbanksprache zur Definition, Abfrage und Manipulation von Daten in relationalen Datenbanken In der SQL-Ansicht arbeiten In
MehrDatenqualität: allgemeiner Überblick Waldemar Braun. Seminar Datenqualität OvGU Magdeburg 03.12.2009
Datenqualität: allgemeiner Überblick Waldemar Braun Seminar Datenqualität OvGU Magdeburg Gliederung 1. Einleitung 2. Motivation 3. Definition 4. DQ-Probleme 5. DQ-Dimensionen 6. DQ-Modelle 7. Messen der
MehrUniversität Augsburg, Institut für Informatik WS 2006/2007 Dr. W.-T. Balke 27. Nov. 2006 M. Endres, A. Huhn, T. Preisinger Lösungsblatt 5
Universität Augsburg, Institut für Informatik WS 2006/2007 Dr. W.-T. Balke 27. Nov. 2006 M. Endres, A. Huhn, T. Preisinger Lösungsblatt 5 Aufgabe 1: Projektion Datenbanksysteme I π A1,...,A n (π B1,...,B
Mehr105.3 SQL-Datenverwaltung
LPI-Zertifizierung 105.3 SQL-Datenverwaltung Copyright ( ) 2009 by Dr. W. Kicherer. This work is licensed under the Creative Commons Attribution-Noncommercial-Share Alike 2.0 Germany License. To view a
MehrKurzanleitung um Transponder mit einem scemtec TT Reader und der Software UniDemo zu lesen
Kurzanleitung um Transponder mit einem scemtec TT Reader und der Software UniDemo zu lesen QuickStart Guide to read a transponder with a scemtec TT reader and software UniDemo Voraussetzung: - PC mit der
MehrDBS ::: SERIE 5. Join Right Semi- Join Left Semi-Join Projektion Selektion Fremdschlüssel. Kreuzprodukt
DBS ::: SERIE 5 Die Relation produkt enthält Hersteller, Modellnummer und Produktgattung (pc, laptop oder drucker aller Produkte. Die Modellnummer ist (der Einfachheit halber eindeutig für alle Hersteller
MehrInformationsintegration Große Datenräume in Web-basierten Umgebungen
Informationsintegration Große Datenräume in Web-basierten Umgebungen Felix Naumann Humboldt-Universität zu Berlin naumann@informatik.hu-berlin.de Einige Untertitel Content Merging Objekt Fusion Datenintegration
MehrWAS IST DER KOMPARATIV: = The comparative
DER KOMPATATIV VON ADJEKTIVEN UND ADVERBEN WAS IST DER KOMPARATIV: = The comparative Der Komparativ vergleicht zwei Sachen (durch ein Adjektiv oder ein Adverb) The comparative is exactly what it sounds
MehrORM & OLAP. Object-oriented Enterprise Application Programming Model for In-Memory Databases. Sebastian Oergel
ORM & OLAP Object-oriented Enterprise Application Programming Model for In-Memory Databases Sebastian Oergel Probleme 2 Datenbanken sind elementar für Business-Anwendungen Gängiges Datenbankparadigma:
MehrInformationsintegration II Data Cleansing 2 Duplikaterkennung
Informationsintegration II Data Cleansing Duplikaterkennung 7.05.004 Felix Naumann Überblick Motivation und Data Cleansing Prozess Datenfehler Edit Distance als Ähnlichkeitsmaß Sorted-Neighborhood Methode
Mehrjuergen.vogt@uni-ulm.de
Benutzerregistrierung für SciFinder on WWW Mitglieder, auch Studenten, der Universität Ulm können SciFinder Scholar für nicht-kommerzielle Zwecke nutzen. Allerdings ist der Zugang personalisiert. Damit
MehrSQL für Trolle. mag.e. Dienstag, 10.2.2009. Qt-Seminar
Qt-Seminar Dienstag, 10.2.2009 SQL ist......die Abkürzung für Structured Query Language (früher sequel für Structured English Query Language )...ein ISO und ANSI Standard (aktuell SQL:2008)...eine Befehls-
MehrCBLOCK: An Automatic Blocking Mechanism for Large-Scale De-duplication Tasks. Cathleen Ramson, Stefan Lehmann LSDD SS 2013 25.04.
CBLOCK: An Automatic Blocking Mechanism for Large-Scale De-duplication Tasks Cathleen Ramson, Stefan Lehmann LSDD SS 2013 25.04.2013 Gliederung 2 Motivation Ziel Algorithmen Zusammenfassung Bewertung Motivation
MehrALP I. Funktionale Programmierung
ALP I Funktionale Programmierung Sortieren und Suchen (Teil 1) WS 2012/2013 Suchen 8 False unsortiert 21 4 16 7 19 11 12 7 1 5 27 3 8 False sortiert 2 4 6 7 9 11 12 18 21 24 27 36 Suchen in unsortierten
MehrSQL Tutorial. SQL - Tutorial SS 06. Hubert Baumgartner. INSO - Industrial Software
SQL Tutorial SQL - Tutorial SS 06 Hubert Baumgartner INSO - Industrial Software Institut für Rechnergestützte Automation Fakultät für Informatik Technische Universität Wien Inhalt des Tutorials 1 2 3 4
MehrMengenvergleiche: Alle Konten außer das, mit dem größten Saldo.
Mengenvergleiche: Mehr Möglichkeiten als der in-operator bietet der θany und der θall-operator, also der Vergleich mit irgendeinem oder jedem Tupel der Unteranfrage. Alle Konten außer das, mit dem größten
MehrGeometrie und Bedeutung: Kap 5
: Kap 5 21. November 2011 Übersicht Der Begriff des Vektors Ähnlichkeits Distanzfunktionen für Vektoren Skalarprodukt Eukidische Distanz im R n What are vectors I Domininic: Maryl: Dollar Po Euro Yen 6
MehrSuchmaschinen. Universität Augsburg, Institut für Informatik SS 2014 Prof. Dr. W. Kießling 23. Mai 2014 Dr. M. Endres, F. Wenzel Lösungsblatt 6
Universität Augsburg, Institut für Informatik SS 2014 Prof. Dr. W. Kießling 23. Mai 2014 Dr. M. Endres, F. Wenzel Lösungsblatt 6 Aufgabe 1: Pareto mit SV-Semantik Suchmaschinen Pareto Definition: x < P
MehrKlausur BWL V Investition und Finanzierung (70172)
Klausur BWL V Investition und Finanzierung (70172) Prof. Dr. Daniel Rösch am 13. Juli 2009, 13.00-14.00 Name, Vorname Anmerkungen: 1. Bei den Rechenaufgaben ist die allgemeine Formel zur Berechnung der
MehrFür AX 4.0, den letzten Hotfix rollup einspielen. Der Hotfix wurde das erste Mal im Hotfix rollup 975357 eingeschlossen:
I. DOCTYPE-Deklaration Die INDEX.XML-Datei, die beim GDPdU-Export erstellt wird, beinhaltet eine DOCTYPE-Deklaration, die inkorrekterweise als Kommentar herausgegeben wird:
MehrAlgorithms & Datastructures Midterm Test 1
Algorithms & Datastructures Midterm Test 1 Wolfgang Pausch Heiko Studt René Thiemann Tomas Vitvar
MehrKlausur Interoperabilität
Klausur 21. Juni 2012 9.30 11.00 Uhr Workflow Systems and Technology Group Fakultät für Informatik Universität Wien Univ.-Prof. Dr. Stefanie Rinderle-Ma Allgemeine Hinweise: Die Bearbeitungszeit beträgt
MehrCarMedia. Bedienungsanleitung Instruction manual. AC-Services Albert-Schweitzer-Str.4 68766 Hockenheim www.ac-services.eu info@ac-services.
CarMedia Bedienungsanleitung Instruction manual AC-Services Albert-Schweitzer-Str.4 68766 Hockenheim www.ac-services.eu info@ac-services.eu DE Inhaltsverzeichnis 1. Allgemeine Hinweise... 3 2. CarMedia...
MehrEnglish. Deutsch. niwis consulting gmbh (https://www.niwis.com), manual NSEPEM Version 1.0
English Deutsch English After a configuration change in the windows registry, you have to restart the service. Requirements: Windows XP, Windows 7, SEP 12.1x With the default settings an event is triggered
MehrNoSQL mit Postgres 15. Juni 2015
Tag der Datenbanken 15. Juni 2015 Dipl.-Wirt.-Inform. Agenda l Vorstellung l Marktübersicht l Warum PostgreSQL? l Warum NoSQL? l Beispielanwendung Seite: 2 Vorstellung Dipl.-Wirt.-Inform. [1990] Erste
MehrDATENBANKEN SQL UND SQLITE VON MELANIE SCHLIEBENER
DATENBANKEN SQL UND SQLITE VON MELANIE SCHLIEBENER INHALTSVERZEICHNIS 1. Datenbanken 2. SQL 1.1 Sinn und Zweck 1.2 Definition 1.3 Modelle 1.4 Relationales Datenbankmodell 2.1 Definition 2.2 Befehle 3.
MehrEinfache Arrays. Annabelle Klarl. Einführung in die Informatik Programmierung und Softwareentwicklung
Annabelle Klarl Zentralübung zur Vorlesung Einführung in die Informatik: http://www.pst.ifi.lmu.de/lehre/wise-13-14/infoeinf WS13/14 Action required now 1. Smartphone: installiere die App "socrative student"
MehrAufbau des SELECT-Befehls. Im Folgenden werden zunächst Abfragen aus einer Tabelle vorgenommen.
Datenbankabfragen (Query) mit SQL (Structured Query Language) 1 Aufbau des SELECT-Befehls Im Folgenden werden zunächst Abfragen aus einer Tabelle vorgenommen. SQL-Syntax: SELECT spaltenliste FROM tabellenname
MehrDas SQL-Schlüsselwort ALL entspricht dem Allquantor der Prädikatenlogik
Beispielaufgaben Informationssysteme erstellt von Fabian Rump zur IS Vorlesung 2009/10 1 Multiple Choice Aussage richtig falsch Eine SQL-Abfrage beginnt immer mit dem Schlüsselwort SELECT Eine Datenbank
MehrProgrammieren I. Kapitel 7. Sortieren und Suchen
Programmieren I Kapitel 7. Sortieren und Suchen Kapitel 7: Sortieren und Suchen Ziel: Varianten der häufigsten Anwendung kennenlernen Ordnung Suchen lineares Suchen Binärsuche oder Bisektionssuche Sortieren
MehrInformatik 12 Datenbanken SQL-Einführung
Informatik 12 Datenbanken SQL-Einführung Gierhardt Vorbemerkungen Bisher haben wir Datenbanken nur über einzelne Tabellen kennen gelernt. Stehen mehrere Tabellen in gewissen Beziehungen zur Beschreibung
MehrAxis Zertifizierungsprogramm Wie melde ich mich bei Prometric für die Axis Zertifizierungsprüfung an?
Axis Zertifizierungsprogramm Wie melde ich mich bei Prometric für die Axis Zertifizierungsprüfung an? 1. Wählen Sie auf der Seite www.axis.com den Bereich Training aus. 2. Ganz unten auf der Seite finden
MehrDer SAS DataStep und die Prozedur SQL. 2014 Cellent Finance Solutions GmbH 05.06.2014 Seite: 1
Der SAS DataStep und die Prozedur SQL 2014 Cellent Finance Solutions GmbH 05.06.2014 Seite: 1 Zahlen und Fakten auf einen Blick Firmensitz: Geschäftsstellen: Branchenerfahrung: Umsatz: Anzahl Mitarbeiter:
Mehrhttps://portal.microsoftonline.com
Sie haben nun Office über Office365 bezogen. Ihr Account wird in Kürze in dem Office365 Portal angelegt. Anschließend können Sie, wie unten beschrieben, die Software beziehen. Congratulations, you have
MehrKünstliches binäres Neuron
Künstliches binäres Neuron G.Döben-Henisch Fachbereich Informatik und Ingenieurwissenschaften FH Frankfurt am Main University of Applied Sciences D-60318 Frankfurt am Main Germany Email: doeben at fb2.fh-frankfurt.de
MehrMichaela Weiss 01. April 2015. Lerneinheit 4: Relationale Datenbanken am Beispiel von MySQL
Michaela Weiss 01. April 2015 Lerneinheit 4: Relationale Datenbanken am Beispiel von MySQL Seite 2 Datenbanken Allgemeines: Datenbank(management)systeme ermöglichen die Speicherung großer Datenmengen Kennzeichen
Mehrmit Musterlösungen Prof. Dr. Gerd Stumme, Dipl.-Inform. Christoph Schmitz 11. Juni 2007
6. Übung zur Vorlesung Datenbanken im Sommersemester 2007 mit Musterlösungen Prof. Dr. Gerd Stumme, Dipl.-Inform. Christoph Schmitz 11. Juni 2007 Aufgabe 1: Rekursion Betrachten Sie die folgende Tabelle
MehrSQL und MySQL. Kristian Köhntopp
SQL und MySQL Kristian Köhntopp Wieso SQL? Datenbanken seit den frühen 1950er Jahren: Hierarchische Datenbanken Netzwerkdatenbanken Relationale Datenbanken = SQL Relational? 10 9 8 7 6 f(y) := y = x r(y)
MehrVorlesung Algorithmische Geometrie. Streckenschnitte. Martin Nöllenburg 19.04.2011
Vorlesung Algorithmische Geometrie LEHRSTUHL FÜR ALGORITHMIK I INSTITUT FÜR THEORETISCHE INFORMATIK FAKULTÄT FÜR INFORMATIK Martin Nöllenburg 19.04.2011 Überlagern von Kartenebenen Beispiel: Gegeben zwei
Mehr7. Übung - Datenbanken
7. Übung - Datenbanken Informatik I für Verkehrsingenieure Aufgaben inkl. Beispiellösungen 1. Aufgabe: DBS a Was ist die Kernaufgabe von Datenbanksystemen? b Beschreiben Sie kurz die Abstraktionsebenen
MehrDer Wetterbericht für Deutschland. Read the weather reports and draw the correct weather symbols for each town.
Der Wetterbericht für Deutschland Read the weather reports and draw the correct weather symbols for each town. Es ist sehr heiß in Berlin und es donnert und blitzt in Frankfurt. Es ist ziemlich neblig
MehrHIR Method & Tools for Fit Gap analysis
HIR Method & Tools for Fit Gap analysis Based on a Powermax APML example 1 Base for all: The Processes HIR-Method for Template Checks, Fit Gap-Analysis, Change-, Quality- & Risk- Management etc. Main processes
MehrSoftwareprojektpraktikum Maschinelle Übersetzung
Softwareprojektpraktikum Maschinelle Übersetzung Jan-Throsten Peter, Andreas Guta {peter,guta}@i6.informatik.rwth-aachen.de Vorbesprechung 3. Aufgabe 6. Mai 2014 Human Language Technology and Pattern Recognition
MehrHochschule Karlsruhe Technik und Wirtschaft- 10.7.2013. Anhänge: Fakultät für Informatik und Wirtschaftsinformatik SS 2013 Prof. Schmidt.
Fakultät für Informatik und Wirtschaftsinformatik SS 2013 Datenbanken und Informationssysteme II Szenario: Projektverwaltung. Es gibt Projekte, Projektleiter, Mitarbeiter und ihre Zuordnung zu Projekten.
MehrAbfrage-Befehle in MySQL -diverse Funktionen -
Abfrage-Befehle in MySQL -diverse Funktionen - Berechnungen mit MySQL -Einführung Ich liebe Funktionen! Es sollen die Projektbezeichnung, der Auftragswert, die Mehrwertsteuer und der Bruttobetrag für jedes
MehrNumber of Maximal Partial Clones
Number of Maximal Partial Clones KARSTEN SCHÖLZEL Universität Rostoc, Institut für Mathemati 26th May 2010 c 2010 UNIVERSITÄT ROSTOCK MATHEMATISCH-NATURWISSENSCHAFTLICHE FAKULTÄT, INSTITUT FÜR MATHEMATIK
MehrFelder. November 5, 2014
Felder Universität Bielefeld AG Praktische Informatik November 5, 2014 Felder: Datenstrukturen mit konstantem Zugriff Felder nennt man auch, Vektoren, Matrizen,... Konstanter Zugriff heisst: Zugriff auf
MehrConstraint-Algorithmen in Kürze - Mit der Lösung zur Path-Consistency-Aufgabe 9
Constraint-Algorithmen in Kürze - Mit der Lösung zur Path-Consistency-Aufgabe 9 Prof. Dr. W. Conen Version 1.0c Januar 2009 Genereller Ablauf der Suche Gegeben: Variablen X, Domains D, Constraints R (explizit
MehrMap Reduce on Hadoop Seminar SS09. Similarity Join. Tim Felgentreff, Andrina Mascher
Map Reduce on Hadoop Seminar SS09 Similarity Join Tim Felgentreff, Andrina Mascher Gliederung 2!! Aufgabe!! Demo!! Algorithmus!! Performance!! Veränderte Aufgabenstellung:!! Vergleich mit 1 Seite!! Ausblick!!
MehrIntroduction to Python. Introduction. First Steps in Python. pseudo random numbers. May 2016
to to May 2016 to What is Programming? All computers are stupid. All computers are deterministic. You have to tell the computer what to do. You can tell the computer in any (programming) language) you
MehrDatenbanktechnologie mit praktischen Übungen in MySQL und PHP
Datenbanktechnologie mit praktischen Übungen in MySQL und PHP Übung, Sommersemester 2013 22. April 2013 - MySQL Sebastian Cuy sebastian.cuy@uni-koeln.de Datenbanken Was sind eigentlich Datenbanken? Eine
MehrMIN oder MAX Bildung per B*Tree Index Hint
E-Mail: rainer@lambertz-c.de Internet: http://www.lambertz-c.de MIN oder MAX Bildung per B*Tree Index Hint Zugegeben, der Trick Min- oder Maximalwerte per Index Hint zu ermitteln ist nicht neu. Gewöhnlich
MehrÜberblick. Lineares Suchen
Komplexität Was ist das? Die Komplexität eines Algorithmus sei hierbei die Abschätzung des Aufwandes seiner Realisierung bzw. Berechnung auf einem Computer. Sie wird daher auch rechnerische Komplexität
MehrKonzept zur Push Notification/GCM für das LP System (vormals BDS System)
Konzept zur Push Notification/GCM für das LP System (vormals BDS System) Wir Push Autor: Michael Fritzsch Version: 1.0 Stand: 04. Februar 2015 Inhalt 1. Was ist eine Push Notification? 2. Wofür steht GCM?
MehrDatenbanken SQL Einführung Datenbank in MySQL einrichten mit PhpMyAdmin
Datenbanken SQL Einführung Datenbank in MySQL einrichten mit PhpMyAdmin PhpMyAdmin = grafsches Tool zur Verwaltung von MySQL-Datenbanken Datenbanken erzeugen und löschen Tabellen und Spalten einfügen,
MehrSQL: statische Integrität
SQL: statische Integrität.1 SQL: statische Integrität Im allgemeinen sind nur solche Instanzen einer Datenbank erlaubt, deren Relationen die der Datenbank bekannten Integritätsbedingungen erfüllen. Integritätsbedingungen
MehrAlgorithmen und Datenstrukturen
Algorithmen und Datenstrukturen Dipl. Inform. Andreas Wilkens 1 Organisatorisches Freitag, 05. Mai 2006: keine Vorlesung! aber Praktikum von 08.00 11.30 Uhr (Gruppen E, F, G, H; Vortestat für Prototyp)
MehrAssoziation und Aggregation
Assoziation und Aggregation Martin Wirsing in Zusammenarbeit mit Matthias Hölzl, Nora Koch 05/03 2 Ziele Verstehen der Begriffe Assoziation und Aggregation Implementierung von Assoziationen in Java schreiben
Mehrif ($rows == 0) { save_new(); } }
Page 212, Listing index.php There is: Must be: // Prüfen, ob nicht Seite aktualisiert // wurde mit z.b. F5. der gleiche // Eintrag soll nicht mehrmals // gespeichert werden können $sql_check = "SELECT
MehrProzedurale Datenbank- Anwendungsprogrammierung
Idee: Erweiterung von SQL um Komponenten von prozeduralen Sprachen (Sequenz, bedingte Ausführung, Schleife) Bezeichnung: Prozedurale SQL-Erweiterung. In Oracle: PL/SQL, in Microsoft SQL Server: T-SQL.
MehrModellierung und Programmierung 1
Modellierung und Programmierung 1 Prof. Dr. Sonja Prohaska Computational EvoDevo Group Institut für Informatik Universität Leipzig 19. November 2015 Gültigkeitsbereich (Scope) von Variablen { int m; {
MehrObjektrelationale Datenbanken
Vorlesung Datenbanksysteme vom 26.11.2008 Objektrelationale Datenbanken Konzepte objektrelationaler DBs SQL:1999 OO vs. OR Konzepte objektrelationaler Datenbanken Große Objekte (LOBs: Large Objects) Mengenwertige
MehrExercise (Part II) Anastasia Mochalova, Lehrstuhl für ABWL und Wirtschaftsinformatik, Kath. Universität Eichstätt-Ingolstadt 1
Exercise (Part II) Notes: The exercise is based on Microsoft Dynamics CRM Online. For all screenshots: Copyright Microsoft Corporation. The sign ## is you personal number to be used in all exercises. All
MehrD-BAUG Informatik I. Exercise session: week 1 HS 2018
1 D-BAUG Informatik I Exercise session: week 1 HS 2018 Java Tutorials 2 Questions? expert.ethz.ch 3 Common questions and issues. expert.ethz.ch 4 Need help with expert? Mixed expressions Type Conversions
MehrKlausurteilnehmer. Wichtige Hinweise. Note: Klausur Informatik Programmierung, 17.09.2012 Seite 1 von 8 HS OWL, FB 7, Malte Wattenberg.
Klausur Informatik Programmierung, 17.09.2012 Seite 1 von 8 Klausurteilnehmer Name: Matrikelnummer: Wichtige Hinweise Es sind keinerlei Hilfsmittel zugelassen auch keine Taschenrechner! Die Klausur dauert
MehrContents. Interaction Flow / Process Flow. Structure Maps. Reference Zone. Wireframes / Mock-Up
Contents 5d 5e 5f 5g Interaction Flow / Process Flow Structure Maps Reference Zone Wireframes / Mock-Up 5d Interaction Flow (Frontend, sichtbar) / Process Flow (Backend, nicht sichtbar) Flow Chart: A Flowchart
MehrDipl. Inf. Dipl. Math. Y. Orkunoglu Datum: 11.09.2009
Hochschule Darmstadt DATENBANKEN Fachbereich Informatik Praktikum 3 Dipl. Inf. Dipl. Math. Y. Orkunoglu Datum: 11.09.2009 PL/SQL Programmierung Anwendung des Cursor Konzepts und Stored Procedures Und Trigger
MehrDatenbanktechnologie mit praktischen Übungen in MySQL und PHP
Datenbanktechnologie mit praktischen Übungen in MySQL und PHP Übung, Sommersemester 2013 13. Mai 2013 - MySQL 4 Sebastian Cuy sebastian.cuy@uni-koeln.de Aufgaben Aufgabe 1 Installieren Sie XAMPP (http://www.apachefriends.org/de/xampp.html)
MehrNachtrag: Farben. Farbblindheit. (Light und Bartlein 2004)
Nachtrag: Farben Farbblindheit (Light und Bartlein 2004) 1 Vorgeschlagene Farbskalen (Light and Bartlein 2004) Farbkodierung metrisch skalierter Daten Unterscheide: 1. Sequential Data (ohne Betonung der
MehrWerbemittel-Spezifikationen
Werbemittel-Spezifikationen Ein Angebot der Ein Angebot der Inhalt Allgemeines Seite 3 Allgemeine Flash-Spezifikationen Seite 4 Flash FunctionsforTracking Seite 5 Flash Functions for Expandable Banners
MehrIch liebe Java && Ich liebe C# Rolf Borst
Ich liebe Java && Ich liebe C# Rolf Borst Java oder C#? Einführung public class Einfuehrung { private int gesamtzahl = 0; /* Ermittelt die Anzahl der geraden und durch drei teilbaren Zahlen */ public String
MehrÜbungsblatt 8- Lösungsvorschlag
Universität Innsbruck - Institut für Informatik Prof. Günther Specht, R.Binna, N.Krismer, M. Tschuggnall 30. November 2012 Proseminar Datenbanksysteme Übungsblatt 8- Lösungsvorschlag Aufgabe 1 (Trigger)
MehrA) Durchsuchen von Datenbanken im Internet durch Endnote
EINLEITUNG/ANWEISUNGEN ZU DIESEM TEXT Wir werden die obere Liste (File/ Edit usw.) benutzen, obwohl die meisten Funktionen auch möglich mit rechtem Mausklick, mit Kombinationen der Tastatur oder mit den
MehrSQL SQL. SQL = Structured Query Language (SEQUEL) IBM San Jose Research Laboratory SYSTEM R. Grundlagen der Datenbanksysteme I
SQL SQL = Structured Query Language (SEQUEL) IBM San Jose Research Laboratory SYSTEM R VII-1 Beispielrelationen Filiale ( Name Leiter Stadt Einlagen ) Konto ( KontoNr KundenNr FilialName Saldo ) Kredit
MehrPriorities (time independent and time dependent) Different service times of different classes at Type-1 nodes -
E.6 Approximate Analysis of Non-product-Form Queueing Networks Non exponentially distributed service times Priorities (time independent and time dependent) Different service times of different classes
MehrReferenzielle Integrität SQL
Referenzielle Integrität in SQL aus Referential Integrity Is Important For Databases von Michael Blaha (Modelsoft Consulting Corp) VII-45 Referenzielle Integrität Definition: Referenzielle Integrität bedeutet
MehrSemantische Integrität (auch: Konsistenz) der in einer Datenbank gespeicherten Daten als wichtige Anforderung
6. Datenintegrität Motivation Semantische Integrität (auch: Konsistenz) der in einer Datenbank gespeicherten Daten als wichtige Anforderung nur sinnvolle Attributwerte (z.b. keine negativen Semester) Abhängigkeiten
MehrAufbau eines IT-Servicekataloges am Fallbeispiel einer Schweizer Bank
SwissICT 2011 am Fallbeispiel einer Schweizer Bank Fritz Kleiner, fritz.kleiner@futureways.ch future ways Agenda Begriffsklärung Funktionen und Aspekte eines IT-Servicekataloges Fallbeispiel eines IT-Servicekataloges
MehrUWC 8801 / 8802 / 8803
Wandbedieneinheit Wall Panel UWC 8801 / 8802 / 8803 Bedienungsanleitung User Manual BDA V130601DE UWC 8801 Wandbedieneinheit Anschluss Vor dem Anschluss ist der UMM 8800 unbedingt auszuschalten. Die Übertragung
MehrData Quality Management: Abgleich großer, redundanter Datenmengen
Data Quality Management: Abgleich großer, redundanter Datenmengen Westendstr. 14 809 München Tel 089-5100 907 Fax 089-5100 9087 E-Mail Datras@Datras.de Redundanz und relationales Datenbankmodell Redundanz:
MehrData Mining-Modelle und -Algorithmen
Data Mining-Modelle und -Algorithmen Data Mining-Modelle und -Algorithmen Data Mining ist ein Prozess, bei dem mehrere Komponenten i n- teragieren. Sie greifen auf Datenquellen, um diese zum Training,
Mehr10.6 Programmier-Exits für Workitems
10.6 Programmier-Exits für Workitems 279 10.6 Programmier-Exits für Workitems 10.6.1 Das Interface IF_SWF_IFS_WORKITEM_EXIT Am Schritt einer Workflow-Definition im Reiter»Programmier-Exits«können verschiedene
MehrMagic Figures. We note that in the example magic square the numbers 1 9 are used. All three rows (columns) have equal sum, called the magic number.
Magic Figures Introduction: This lesson builds on ideas from Magic Squares. Students are introduced to a wider collection of Magic Figures and consider constraints on the Magic Number associated with such
MehrMySQL Installation. AnPr
Name Klasse Datum 1 Allgemeiner Aufbau Relationale Datenbank Management Systeme (RDBMS) werden im Regelfall als Service installiert. Der Zugriff kann über mehrere Kanäle durchgeführt werden, wobei im Regelfall
MehrUniversität Leipzig Institut für Informatik Auffinden von Dubletten in ECommerce Datenbeständen
Universität Leipzig Institut für Informatik Auffinden von Dubletten in ECommerce Datenbeständen Hanna Köpcke AG 3: Objekt Matching Agenda Problemstellung FEVER-System - Manuell definierte Match-Strategien
MehrKlausur Datenbanken Wintersemester 2004/2005 Prof. Dr. Wolfgang May 10. Februar 2004, 11-13 Uhr Bearbeitungszeit: 90 Minuten
Klausur Datenbanken Wintersemester 2004/2005 Prof. Dr. Wolfgang May 10. Februar 2004, 11-13 Uhr Bearbeitungszeit: 90 Minuten Vorname: Nachname: Matrikelnummer: Bei der Klausur sind keine Hilfsmittel (Skripten,
MehrNormalformen: Sinn und Zweck
Normalformen: Sinn und Zweck Redundanz und Inkonsistenz vermeiden Anomalien vermeiden Verlustlose Zerlegungen finden Abhängigkeiten bewaren NF2 und NF3 behandeln das Verhältnis zwischen Schlüsselund Nichtschlüssel-
Mehr