Warum Informationsintegration?

Größe: px
Ab Seite anzeigen:

Download "Warum Informationsintegration?"

Transkript

1 Frühjahrsemester 2013 CS243 Datenbanken Kapitel 3: Informationsintegration* H. Schuldt * Folien basieren zum Teil auf Unterlagen von Dr. Diego Milano Aus Kapitel 1: Warum Informationsintegration? A Data Warehouse is a subject-oriented, integrated, non-volatile, and time variant collection of data in support of managements decisions Integration muss auf verschiedenen Ebenen stattfinden Intensionale Ebene Integration auf Schemaebene wird auch als Schemaintegration bezeichnet Extensionale Ebene Integration auf Instanzebene wird auch als Datenintegration oder Data Cleaning bezeichnet FS 2013 Datenbanken (CS243) Informationsintegration 3-2 1

2 Data Warehousing & Informationsintegration Operationale Datenbanksysteme Externe Systeme... OLTP... Informationsintegration Data Warehouse OLAP FS 2013 Datenbanken (CS243) Informationsintegration 3-3 Informationsintegration Ziel der Integration Mehrere Datenquellen einem Benutzer so zu präsentieren, als wäre es nur eine einzige Datenquelle Mögliche Probleme Heterogenität der beteiligten Datenquellen Daten werden physisch verteilt gespeichert Redundanz: identische Duplikate vs. widersprüchliche Daten Autonome Systeme Einzelne Schemata können sich ändern Integration muss dann jeweils erneut durchgeführt werden FS 2013 Datenbanken (CS243) Informationsintegration 3-4 2

3 Architekturen Wiederholung aus cs241 / cs261: Architektur eines DBMS A 1 A 2 A 3 A 4 A 5 Anwendungen Ext. Schema 1 Ext. Schema 2 Ext. Schema 3 Externe Ebene Logische Datenunabhängigkeit Logisches Schema Konzeptuelle (logische) Ebene Physische Datenunabhängigkeit Internes Schema Interne (physische) Ebene FS 2013 Datenbanken (CS243) Informationsintegration 3-5 Virtuelle Integration Daten bleiben in den beteiligten Quellsystemen Die Extension des integrierten Datenbestandes ist nicht materialisiert Daten werden bei jedem Zugriff zusammengeführt Anfragen an das globale Schema werden durch Daten aus den lokalen Quellen bedient Integriertes (globales) Schema lokales Schema 1 Externes Schema 1 Logisches Schema 1... lokales Schema n Externes Schema n Logisches Schema n Extension 1 Internes Schema 1 Internes Schema n Extension n DBMS 1 DBMS n FS 2013 Datenbanken (CS243) Informationsintegration 3-6 3

4 Virtuelle Integration Eigenschaften Vorteile Updates, die auf den lokalen Quellen durchgeführt werden, sind sofort in der (virtuellen) integrierten DB sichtbar Keine Redundanz und damit auch keine Konflikte durch Synchronisation mehrerer Extensionen Nachteile Constraints auf dem globalen Schema können nicht oder nur mit grossem Aufwand umgesetzt und erzwungen werden Die Bearbeitung von Anfragen kann sehr aufwändig und ineffizient sein (abhängig von der Komplexität der Abbildung von lokalen auf globale Schemata) Das Propagieren von Updates vom globalen Schema zu den lokalen Schemata kann komplex (oder sogar nicht eindeutig) sein Ø vgl. Änderungsoperationen auf Views (cs241/cs261) Problematische Behandlung von Inkonsistenzen über mehrere lokale Extensionen FS 2013 Datenbanken (CS243) Informationsintegration 3-7 Materialisierte Integration Daten werden zusätzlich in das integrierte System kopiert Es gibt also eine weitere Extension (die des integrierten Schemas) Anfragen an das globale Schema werden durch diese Extension bedient Typische Konfiguration von Data Warehouses Integrierter Datenbestand Integriertes (globales) Schema lokales Schema 1 lokales Schema n Externes Schema 1 Logisches Schema 1... Externes Schema n Logisches Schema n Extension 1 Internes Schema 1 Internes Schema n Extension n DBMS 1 DBMS n FS 2013 Datenbanken (CS243) Informationsintegration 3-8 4

5 Materialisierte Integration Eigenschaften Vorteile Anfragen können aus dem integrierten Datenbestand bedient werden (effektiver als bei der virtuellen Integration) Komplexe Transformationen zwischen lokalen Schemata und globalem Schema können einfacher angewandt werden Einmalige Integration (bzw. zu wohldefinierten Zeitunkten), nicht bei jeder Anfrage Globales Schema kann signifikant von lokalen Schemata abweichen Nachteile Bei lokalen Updates sind lokale Datenbestände und integrierter Datenbestand nicht mehr synchron (Ø evtl. widersprüchliche Daten). Periodische Auffrischungen des integrierten Datenbestands nötig Grössere Speicheranforderungen durch Replikation FS 2013 Datenbanken (CS243) Informationsintegration 3-9 Heterogenität Syntaktische Heterogenität: Unterschiede in der Darstellung gleicher Sachverhalte (z.b. UNICODE vs. ASCII, little endian vs. big endian, 42 vs. zweiundvierzig) Datenmodellheterogenität: Verwendung unterschiedlicher Datenmodelle für die Darstellung gleicher Sachverhalte (siehe Kapitel 2) Flat files, XML, verschiedene Datenbanktypen, proprietäre Elemente in Datenmodellen z.b. relationales Datenmodell vs. objektorientiertes Datenmodell, d.h. Modellierung von Person als Relation oder als Klasse FS 2013 Datenbanken (CS243) Informationsintegration

6 Heterogenität Strukturelle Heterogenität: Unterschiede in der Repräsentation von Information Zwei Schemata sind unterschiedlich, obwohl sie den gleichen Ausschnitt aus der realen Welt erfassen, z.b. Person (Name, Adresse) vs. Person (Vorname, Nachname, Strasse, Hausnummer, Ort, PLZ) Verschiedene Repräsentation derselben Information, z.b. Speicherung des Preises einer Ware in, CHF, $, oder Andere Ursache: Normalisierung von Relationen Optimierung für bestimmte Arten von Joins, etc. FS 2013 Datenbanken (CS243) Informationsintegration 3-11 Heterogenität Schematische Heterogenität Sonderfall der strukturellen Heterogenität Verwendung unterschiedlicher Elemente des Datenmodells zur Modellierung derselben Sachverhalte, z.b. Modellierung eines Sachverhalts als Attribut oder als eigenständige Relation FS 2013 Datenbanken (CS243) Informationsintegration

7 Heterogenität Semantische Heterogenität: Unterschiede der Bedeutung der verwendeten Begriffe und Konzepte die korrekte Interpretation hängt dabei zumeist vom Kontext ab z.b. Homonyme Bank (Name, Bilanzvolumen,...) vs. Bank (Ort, Anzahl_Sitzplätze,...) z.b. Synonyme Bank (Name, Bilanzvolumen,...) vs. Geldinstitut (Bezeichnung, Gewinn,...) z.b. Hypernyme Sportler (Name, Verein,...) vs. Fussballer (Name, Verein,...) Nicht oder nur partiell kompatible Domänen, z.b. Student (MatNr, Name, ) und Student (MatNr, Name, ) wobei eine Relation alle Basler Studierenden enthält, die andere alle Informatik-Studierenden FS 2013 Datenbanken (CS243) Informationsintegration Schemaintegration Präzisierung des Integrationsproblems auf intensionaler Ebene Gegeben sind n (in der Regel heterogene) Quellschemata L 1,, L n Integration dieser n heterogenen Schemata erfordert Identifikation von Korrespondenzen (Gemeinsamkeiten) zwischen diesen Quellschemata Entwurf eines integrierten globalen Schemas, das von den n Quellschemata abstrahiert (und das evtl. Auf bestimmte Anwendungen zugeschnitten ist, wie z.b. analytische Anfragen im Data Warehousing) Die formale Spezifikation von Abbildungsvorschriften zwischen den einzelnen Quellschemata und dem integrierten Schema Schemaintegration ist eine komplexe intellektuelle Entwurfsaufgabe Es gibt vereinzelte Werkzeuge für die (zumindest semi-automatische) Unterstützung der Schemaintegration jedoch in den meisten Fällen im Status von Forschungsprototypen Schemaintegration erfordert sowohl Kenntnisse im Datenbankentwurf als auch spezielle Kenntnisse über die Anwendungswelt, um die zu integrierenden Schemata zu verstehen FS 2013 Datenbanken (CS243) Informationsintegration

8 Wrapper-basierte Architekturen Ein Wrapper ist eine Software, die ein anderes Softwaresystem einkapselt und andere als die ursprünglich vorhandenen Schnittstellen nach aussen anbietet Technische Unterschiede werden verborgen In gewissem Masse können dadurch auch Unterschiede der verwendeten Datenmodelle verborgen werden (alle Quellen werden in einheitlicher Repräsentation dargestellt) Kanonisches Modell Wrapper Wrapper Wrapper Wrapper Altanwendung? RDBMS OODBMS XML <author id="mf"> <first->max</first> <last>frisch</last> </author> <book> <title> </title> </book> FS 2013 Datenbanken (CS243) Informationsintegration 3-15 Schemaintegration Integriertes (globales) Schema Schema- Abbildung... lokales Schema L 1 lokales Schema L n DBMS 1 DBMS n FS 2013 Datenbanken (CS243) Informationsintegration

9 Mediator Ein Mediator interagiert mit den einzelnen Wrappern und stellt eine vereinheitlichte globale Sicht über den lokalen Schemata zur Verfügung Mediator Schema-Abbildung Wrapper Wrapper Wrapper Wrapper Altanwendung? RDBMS OODBMS XML <author id="mf"> <first->max</first> <last>frisch</last> </author> <book> <title> </title> </book> FS 2013 Datenbanken (CS243) Informationsintegration 3-17 Schemaintegration: Schritte 1. Analyse, Normalisierung und Abstraktion Verwendung einer gemeinsamen Sprache / Repräsentation zur konzeptuellen Modellierung (z.b. ER) 2. Auswahl einer Integrationsstrategie Festlegen, wie (und in welcher Reihenfolge) Schemata verglichen werden 3. Schema Matching Beziehungen zwischen lokalen Schemata identifizieren 4. Schema Alignment Konflikte (durch Heterogenität) zwischen beteiligten Schemata auflösen 5. Schema Fusion Globales Schema erstellen Ø Ergebnis ist eine paarweise Abbildung zwischen den lokalen Schemata und dem globalen Schema FS 2013 Datenbanken (CS243) Informationsintegration

10 Schritt 1: Analyse Ein vertieftes Verständnis der lokalen Datenquellen (zunächst unabhängig voneinander) erwerben Ergebnis ist ein konzeptuelles Schema in der Sprache, die für alle lokalen datenquellen gewählt wird Diese Aktivität besteht oftmals aus dem Re-Engineering des konzeptuellen Schemas Im Gegensatz zur Abbildung ERM ins Relationenmodell ist in der Analyse zumeist nur die logische Repräsentation (oder evtl. sogar nur das physische Schema) gegeben, aus dem dann die konzeptuelle Repräsentation wieder abgeleitet werden muss Ergebnis: genau und vollständiges (und dokumentiertes) konzeptuelles Schema der lokalen Datenquelle FS 2013 Datenbanken (CS243) Informationsintegration 3-19 Probleme der Analysephase Informationen über die Anwendungswelt sind unter Umständen nur schwer zu bekommen Geschäftsregeln nicht explizit formuliert bzw. nicht zugänglich Wichtigste Informationsquellen in der Praxis: lokale Domänenexperten Analog ist es zumeist auch schwierig, Informationssysteme eines Unternehmens zu verstehen Altsysteme ohne Datenbank, sondern mit proprietären Dateiformaten Selbst bei der Verwendung von Datenbanken Keine oder ungenügende Dokumentation, d.h., die Daten sind oftmals die einzige Dokumentation Keine oder ungenügende Normalisierung Integritätsbedingungen nicht dokumentiert, zum Teil nicht einmal in der Datenbank erzwungen (bestenfalls in der Anwendung implementiert) Gewachsene Systeme (d.h. Schema wurde mehrfach erweitert, ergänzt, modifiziert) und ist damit nur schwer verständlich FS 2013 Datenbanken (CS243) Informationsintegration

11 Analyse, Normalisierung, Abstraktion CREATE TABLE product( cat_desc VARCHAR(255), cat_name VARCHAR(255), cat_code INTEGER, prod_desc VARCHAR(255), prod_name VARCHAR(255), prod_code INTEGER PRIMARY KEY ); cat_desc cat_name cat_code Product Normalisierung und Korrektur: Das Ausgangsschema ist nicht normalisiert und stellt die Beziehungen der Anwendungswelt nicht korrekt dar. prod_desc prod_name prod_code CREATE TABLE category( cat_desc VARCHAR(255), cat_name VARCHAR(255), cat_code INTEGER PRIMARY_KEY, ); Product (1,1) Description/String Name/String Code / integer CREATE TABLE product( prod_desc VARCHAR(255), prod_name VARCHAR(255), prod_code INTEGER PRIMARY KEY cat_code INTEGER REFERENCES category(cat_code) ); belongs_to (0,n) Category Description / String Name/String Code / String FS 2013 Datenbanken (CS243) Informationsintegration 3-21 Schritt 2: Integrationsstrategie Der Vergleich vieler verschiedener Schemata in einem Schritt ist nicht immer möglich bzw. nicht sehr effizient (gerade bei grossen, sehr heterogenen Schemata) Unterschiedliche Ansätze, um strukturiert vorzugehen: Integration process binary n-ary ladder balanced single step iterative FS 2013 Datenbanken (CS243) Informationsintegration

12 Schritt 3: Schema Matching Vergleichende Analyse der unterschiedlichen konzeptuellen Schemata mit dem Ziel gemeinsame Konzepte (und Beziehungen zwischen diesen Konzepten) zu identifizieren Unterschiede wie z.b. strukturelle und semantische Konflikte festzustellen Abhängigkeiten zwischen (Teil-)Schemata zu identifizieren (um Teilschemata zusammen zu führen) FS 2013 Datenbanken (CS243) Informationsintegration 3-23 Strukturelle Konflikte Beispiel: Book ist ein gemeinsames Konzept Publisher und die Beziehung zu Book besitzen einen strukturellen Konflikt in einem Modell als Attribut repräsentiert, im anderen als Entitätstyp Book Title ISBN Title ISBN Book published_by Publisher Publisher_address Publisher Address Name FS 2013 Datenbanken (CS243) Informationsintegration

13 Semantische Konflikte Die Attribute Age und Birthdate modellieren zwei semantisch unterschiedliche Konzepte Allerdings gibt es eine offensichtliche Beziehung zwischen diesen Konzepten, so dass der Konflikt einfach aufgelöst werden kann Die Auflösung des Konflikts erfordert die Restrukturierung eines der beiden Schemata, um die Konzepte zu vereinheitlichen das bedeutet, dass eines der beiden konzeptuellen Schemata transformiert werden muss diese Transformation muss dann auch auf der Extension ausgeführt werden Birthdate SSN Citizen Age SSN Citizen FS 2013 Datenbanken (CS243) Informationsintegration 3-25 Semantische Konflikte Homonyme: zwei Konzepte besitzen denselben Namen, aber unterschiedliche Bedeutungen Synonyme: zwei Konzepte haben dieselbe Bedeutung, aber unterschiedliche Namen Äquivalent, aber linguistischer Konflikt Æ Synonyme inkompatibel Employee Worker Teacher Object (1,1) (1,1) (1,1) (1,1) assigned_to assigned_to teaches instance_of (1,n) (1,n) (1,n) (1,n) Department Department Class Class identisch Nicht äquivalent Æ Homonyme FS 2013 Datenbanken (CS243) Informationsintegration

14 Vergleich von Schemata Identität: ein Konzept ist zweimal auf gleiche Art und Weise modelliert sowohl aus struktureller als auch aus semantischer Sicht Äquivalenz: zwei Konzepte besitzen dieselbe Semantik, es gibt jedoch strukturelle Konflikte (strukturelle Unterschiede) Vergleichbarkeit: Konzepte sind mit unterschiedlicher Struktur und Semantik modelliert, stellen aber denselben Ausschnitt aus der Anwendungswelt dar Inkompatibilität: Der Ausschnitt aus der Anwendungswelt unterscheidet sich. Die entstehenden Konflikte sind nicht (oder nur sehr schwer) zu beheben FS 2013 Datenbanken (CS243) Informationsintegration 3-27 Beispiel: Unterschiedliche, aber vergleichbare Schemata Employee Employee (1,1) (1,1) participates_in assigned_to (1,n) (1,n) Project Department (1,1) belongs_to (1,n) Department FS 2013 Datenbanken (CS243) Informationsintegration

15 Beispiel: nicht vergleichbare Schemata Die Semantik der beiden Schemata scheint gleich zu sein Allerdings sind die Kardinalitäten unterschiedlich, so dass damit auch die Schemata inkompatibel sind Professor Name Professor Name (0,1) (2,n) teaches teaches (1,n) (1,n) Course Course_ID Course Course_ID FS 2013 Datenbanken (CS243) Informationsintegration 3-29 Beziehungen zwischen (Teil-)Schemata Schema i Schema k Title ISBN Book Book Title ISBN published_by written_by Address Name Publisher works_for Author Address Name FS 2013 Datenbanken (CS243) Informationsintegration

16 Schritt 4: Schema Alignment Ziel dieses Schritts ist es, sie Konflikte aufzulösen, die im vorigen Schritt identifiziert wurden Hierzu müssen die lokalen Schemata transformiert werden Ändern von Entitätstypen (Namen und Typen von Attributen) Ändern von Beziehungen zwischen Entitätstypen / funktionale Abhängigkeiten Ändern von Kardinalitäten / Integritätsbedingungen Dabei ist zu beachten: Nicht alle Konflikte lassen sich auflösen, da Informationen auf widersprüchliche Arten darstellt sein können In diesem Fall müssen Domänenexperten (Anwendungsexperten) entscheiden, welche Sicht der Anwendungswelt sie im integrierten Schema unterstützen möchten Im Zweifelsfall werden solche Schemata bevorzugt, die die spätere Anwendung (z.b. Data Warehousing-Anfragen) besser unterstützen FS 2013 Datenbanken (CS243) Informationsintegration 3-31 Schritt 5: Schema Fusion Aufeinander angeglichene ( aligned ) Schemata werden in einem einzigen integrierten Schema zusammen geführt Je nach Wahl in Schritt 2 kann das für alle Schemata auf einmal passieren, oder inkrementell Vorgehen Gemeinsame Konzepte werden zusammengeführt (z.b. Erweiterung der Attributliste) Unterschiedliche Konzepte werden zunächst unabhängig voneinander in das integrierte Schema eingebracht, allerdings mit dem Ziel, falls möglich Beziehungen zwischen (bisher disjunkten) Teilen zu identifizieren und in das integrierte Schema aufzunehmen FS 2013 Datenbanken (CS243) Informationsintegration

17 Alignment und Fusion Beide Schritte werden in der Praxis verzahnt und iterativ ausgeführt Konflikte zwischen zwei lokalen Schemata werden aufgelöst Ein initiales integriertes Schema wird erstellt Nach und nach wird das integrierte Schema mit weiteren lokalen Schemata fusioniert Ergebnis Integriertes Schema (unter Berücksichtigung aller lokaler Schemata) Schema-Abbildung (Mapping) FS 2013 Datenbanken (CS243) Informationsintegration 3-33 Schema-Abbildung (Mapping) Eine Schema-Abbildung besteht aus zwei Teilen einer Menge von Korrespondenzen zwischen Elementen (Attributen, Entitätstypen, Beziehungen) zweier Schemata Einer Beschreibung des Integrationsprozesses Korrespondenzen zwischen Attributen werden auch als Wertkorrespondenzen bezeichnet daraus abgeleitet werden Korrespondenzen zwischen Entitätstypen und Beziehungen (auch Schemakorrespondenzen genannt) Je nach Heterogenitätsgrad der zu integrierenden lokalen Schemata lassen sich Abbildungen mehr oder weniger gut formal beschreiben Ein Mapping beschreibt sowohl die nötigen Anpassungen auf intensionaler Ebene als auch die Transformationen, die auf extensionaler Ebene nötig werden Ziel ist es, jedes Konzept in jedem lokalen Schema durch eine Kette von Abbildungen in das globale Schema zu überführen FS 2013 Datenbanken (CS243) Informationsintegration

18 3.2 Datenintegration Nach der Integration der Schemata (intensionale Ebene) müssen in einem nächsten Schritt in der Regel auch die eigentlichen Daten (extensionale Ebene) integriert werden. Man spricht hier auch von Datenintegration Dazu gehört das Identifizieren von Datensätzen, die dasselbe Objekt der realen Welt darstellen (d.h. Datensätzen, die in zwei oder mehreren lokalen Datenbanken auftreten) Bei der Datenintegration müssen oftmals inkonsistente und/oder nicht vollständige Daten repariert werden. Man spricht hier auch von Datenbereinigung (Data Cleaning) Duplikaterkennung: welche (unterschiedlichen) Daten gehören zu demselben Objekt? Inkonsistente Daten: in zwei oder mehreren lokalen Datenbanken werden dieselben Objekte unterschiedlich gespeichert (z.b. durch fehlerhafte Daten, veraltete Daten, falsch formatierte Daten, etc.) Inkomplette Daten: durch die Schemaintegration können Teile von Datensätzen aus lokalen Quellen fehlen und müssen komplettiert werden FS 2013 Datenbanken (CS243) Informationsintegration 3-35 Vergleich von Extensionen Auch wenn nach der Integration auf intensionaler Ebene die Schemata von Datenbanken übereinstimmen, muss bei der Integration auf extensionaler Ebene überprüft werden, welche Datensätze evtl. gemeinsam sind, und welche Daten in die integrierte Datenbank überführt werden Student (MatNr, Name, Studiengang, Wohnort) Studierende aus Basel Informatik- Studierende Student (MatNr, Name, Studiengang, Wohnort) FS 2013 Datenbanken (CS243) Informationsintegration

19 Semantische Duplikate Unterschiedliche Datensätze repräsentieren das gleiche Objekt der realen Welt auf inkonsistente Art (d.h. produzieren einen Konflikt) In einzelnen Quellen: fehlerhafte Tupel Bundesrat Name Vorname Departement Berset Alain EDI Widmer-Schlumpf Eveline EJPD Vor der Integration müssen Daten bereinigt werden, um nach der Integration potentielle semantische Duplikate zu verhindern FS 2013 Datenbanken (CS243) Informationsintegration 3-37 Semantische Duplikate Mögliche semantische Duplikate in unterschiedlichen Quellen (nach der Integration), z.b. Verschiedene Wertebereiche für IDs Bundesrat ID Name Vorname Departement DL Leuthard Doris UVEK EW Widmer-Schlumpf Eveline EFD Bundesrat ID Name Vorname Departement 02 Leuthard Doris UVEK 04 Widmer-Schlumpf Eveline EFD Unterschiedliche Werte (Fehler oder Inkonsistenzen) Bundesrat ID Name Vorname Departement 02 Leuthard Doris UVEK 04 Widmer-Schlumpf Eveline EFD Bundesrat ID Name Vorname Departement 02 Leuthard Doris EVD 04 Widmer-Schlumpf Eveline EJPD FS 2013 Datenbanken (CS243) Informationsintegration

20 Inkorrekte Daten Inkorrekte Daten können aus mehreren Gründen entstehen Durch Eingabefehler / Anwendungsfehler Bundesrat Name Vorname Departement Leuthard Doris UVEK Widmer-Schlumpff Evelyn EFD Durch nicht-erzwungene Integritätsbedingungen (zu jedem Zeitpunkt kann nur ein Departement geleitet werden) Bundesrat Name Vorname Departement Widmer-Schlumpf Eveline EJPD Widmer-Schlumpf Eveline EFD Änderungen in der realen Welt Bundesrat Name Vorname Departement Leuthard Doris EVD Widmer-Schlumpf Eveline EJPD FS 2013 Datenbanken (CS243) Informationsintegration 3-39 Data Cleaning Unter Data Cleaning versteht man das Auffinden und Bereinigen von Fehlern in der Ausprägung einer Datenbank In der Praxis ist dies ein komplexes Problem Unterschiedliche Arten von Inkonsistenzen Erkennung erfordert zumeist vertieftes Anwendungswissen; generische Lösungen sind nur begrenzt möglich Oftmals muss man zur Erkennung und Behebung auch verstehen, welche Sicht auf die reale Welt für eine Datenbank die richtige ist (was ist Bestandteil der Datenbank, was nicht?) Bereinigte Daten sind in einer Vielzahl von Anwendungen essentiell Data Warehousing Data Mining Datenanalyse FS 2013 Datenbanken (CS243) Informationsintegration

21 Cleaning-Prozess Data Cleaning erfordert die systematische Bereinigung von Datenquellen, in mehreren Schritten 1. Daten analysieren sowohl das Schema als auch (Beispiel-)Daten Daten zunächst umwandeln, um die nachfolgenden Schritte zu vereinfachen, z.b. Attribute aufsplitten Nachschlagen in Wörterbüchern (dictionary lookup), zur Fehlerkorrektur Standardisierte Darstellung 2. Datenbereinigung (Transformationen): iterative Folge von unterschiedlichen Schritten Datentransformation entwerfen Datentransformation anwenden Datentransformation verifizieren (und evtl. wieder rückgängig machen) Gerade dieser iterative Prozess wird von vielen Werkzeugen nicht oder nur ungenügend unterstützt FS 2013 Datenbanken (CS243) Informationsintegration 3-41 Vorverarbeitung Attribute aufsplitten Bundesrat Name Leuthard, Doris Widmer-Schlumpf, Eveline Departement UVEK EFD Bundesrat Name Vorname Departement Leuthard Doris UVEK Widmer-Schlumpf Eveline EFD Normalisierung Normalisierung von Datumsangaben (z.b. festgelegte Zeitzone, GMT, UTC, PST, ) Normalisierung von Preisen (Festlegen einer Referenzwährung) Normalisierung von Masseinheiten (m, cm, ft, ) Item Price ipad HTC One Item Price ipad HTC One 275 CHF FS 2013 Datenbanken (CS243) Informationsintegration

22 Vorverarbeitung Standardisierung, z.b. einheitliche Gross-/Kleinschreibung einheitliche Datumsformate, z.b. YYYY-MM-DD vs. DD.MM.YYYY Abkürzungen und Akronyme ausschreiben unterschiedliche Schreibweisen vereinheitlichen wie z.b. ß vs. ss Bundesrat Name Vorname Departement Leuthard Doris UVEK Widmer-Schlumpf Eveline EFD Berset A. Eidgenössisches Departement des Innern Bundesrat Name Vorname Departement Leuthard Doris Eidgenössisches Departement für Umwelt, Verkehr, Energie und Kommunikation Widmer-Schlumpf Eveline Eidgenössisches Finanzdepartement Berset Alain Eidgenössisches Departement des Innern FS 2013 Datenbanken (CS243) Informationsintegration 3-43 Dictionary Lookup Verwendung von Wörterbüchern: Nachschlagen in Datenbanken mit hoher (evtl. garantierter) Datenqualität zum Auffinden und Korrigieren von Fehlern Name Vorname Kanton Leuthard Doris AG Widmer-Schlumpf Eveline GR Berset Allan FR Kantone FS 2013 Datenbanken (CS243) Informationsintegration

23 Ähnlichkeits- bzw. Distanzfunktionen Für einen Dictionary Lookup muss man die Werte der integrierten Datenbank mit den Werten aus dem Dictionary vergleichen, um den/die ähnlichsten Eintrag/Einträge zu finden Benötigt wird ein Distanzmass bzw. ein Ähnlichkeitsmass zu Berechnung Die besten Distanz-/Ähnlichkeitsmasse sind domänenspezifisch, lassen sich daher nicht generisch angeben Weit verbreitete generische Distanzmasse sind auf spezielle Datentypen zugeschnitten Für binäre Werte / Codes: Hamming-Distanz Für Zeichenketten Phonetische Distanzmasse (z.b. Soundex) String Edit Distance (Levenshtein-Distanz) N-Gramme FS 2013 Datenbanken (CS243) Informationsintegration 3-45 Hamming-Distanz Bezeichnet die Anzahl der unterschiedlichen Zeichen in Codes fester Länge Sei S ein endliches Alphabet und x = (x 1, x 2,, x n ) sowie y = (y 1, y 2,, y n ) Worte aus S, d.h. x, y œ S n Dann gilt für die Hamming-Distanz: D(x,y) = S 1 x i y i mit i = 1,, n Beispiel: FS 2013 Datenbanken (CS243) Informationsintegration

24 Phonetische Suche Basieren auf Indexierung von Worten gemäss ihrer Aussprache Homophone (unterschiedlich geschriebene, aber gleich oder ähnlich ausgesprochene Worte) erhalten denselben Index, werden daher als ähnlich angesehen Der am weitesten verbreitete Algorithmus zur phonetischen Suche ist Soundex (andere sind z.b. NYSIIS oder Metaphone) In Soundex wird ein Wort auf einen vierstelligen Code abgebildet, bestehend aus einem Buchstaben und drei Ziffern Erster Buchstabe: Anfangsbuchstabe des Wortes Drei Ziffern: kodieren die restlichen Konsonanten. Ähnlich klingende Konsonanten werden auf denselben Wert abgebildet, z.b. {B, F, P, V} 1 Nach dritter Stelle wird abgebrochen bzw. bei kurzen Worten mit 0 aufgefüllt Beispiel: Soundex ist auch in den gängigen DBMS (wie z.b. MS SQL, Oracle) verfügbar FS 2013 Datenbanken (CS243) Informationsintegration 3-47 String Edit Distance (Levenshtein-Distanz) Definiert als Distanzmass zweier Strings und bezeichnet die minimale Anzahl an atomaren Änderungsoperationen (Einfügen, Löschen, Ersetzen) von Zeichen, um von einem String zum anderen zu gelangen Beispiele Varianten der String Edit Distance Häufig auftretende Fehler (wie verdrehte Buchstabenfolgen) werden zusammen betrachtet und als einer Änderungsoperation angesehen Blockweise Betrachtung von Buchstaben, anstelle einzelner Buchstaben (für die Anwendung auf ganze Sätze) Das Verfahren ist sehr aufwändig: O(m n), wobei m und n die Längen der zu vergleichenden Strings sind FS 2013 Datenbanken (CS243) Informationsintegration

25 N-Gramme Zu analysierende Wörter werden in Fragmente (in der Regel einzelne Buchstaben) zerlegt. Danach werden jeweils n aufeinanderfolgende Fragmente zu N-Grammen zusammen gefasst N-Gramme werden sehr häufig in der Computerlinguistik (aber z.b. auch in der Gensequenzanalyse) verwendet Ausser auf Buchstaben können N-Gramme auch für Phoneme, Silben oder ganze Wörter verwendet werden Beispiel: Trigramme (N = 3) FS 2013 Datenbanken (CS243) Informationsintegration 3-49 Jaccard-Distanz Die Jaccard-Distanz J d wird häufig zusammen mit N-Grammen verwendet Gibt das gemeinsame Auftreten von Elementen in zwei Mengen A und B an (hier: gemeinsame N-Gramme zweier Wörter) Definition: seien A und B zwei Mengen, dann ist A B A» B - A B J d (A, B) = 1- J(A, B) = 1- = A» B A» B Beispiel: N-Gramme werden für die String-Ähnlichkeit oft auch verwendet, um (englische) Strings in einen dimensionalen Vektorraum (Dimensionen: aaa, aab,, zzz) abzubilden. In diesem Vektorraum wird dann u.a. die Kosinus-Distanz als Ähnlichkeitsmass eingesetzt. FS 2013 Datenbanken (CS243) Informationsintegration

26 Objekterkennung und Konfliktauflösung In der Phase Objekterkennung und Konfliktauflösung (Reconciliation) geht es darum, semantische Duplikate in der Extension zu identifizieren und allfällige Konflikte zwischen diesen semantischen Duplikaten zu eliminieren 1. Welche Tupel repräsentieren dasselbe Objekt (= semantische Duplikate) 2. Alle semantischen Duplikate werden durch ein einziges, konsolidiertes Tupel ersetzt Beispiel Bundesrat Name Vorname Departement Widmer-Schlumpff Eveline EFD Leuthard Doris UVEK Widmer-Schlumpf Eveline EJPD FS 2013 Datenbanken (CS243) Informationsintegration 3-51 Ähnlichkeit von Tupeln Wie beim Vergleich einzelner Attribute benötigt man auch ein Ähnlichkeitsmass für den Vergleich kompletter Tupel Tupel als ein String betrachten (Attribute konkatenieren) und bekannte String-Ähnlichkeiten anwenden (aber: hohe Komplexität, ausserdem auch grosse Nachteile bei fehlenden Attributen) Gewichtetes Mittel der Ähnlichkeitswerte der einzelnen Attribute Ähnlichkeit, falls gewichtetes Mittel > Schwellwert Vorgegebene Regeln (ebenfalls über die paarweise Ähnlichkeit einzelner Tupel), z.b. D(t 1, t 2 ) = true, falls (t 1.Name º t 2.Name) (t 1.Vorname = t 2.Vorname) FS 2013 Datenbanken (CS243) Informationsintegration

27 Similarity Join Um semantische Duplikate in einer Relation zu finden muss man alle Paare von Tupel vergleichen (= Similarity Join) Dies entspricht einem Selbst-Join, allerdings müssen Join-Partner nicht über die Gleichheit der gemeinsamen Attribute sondern über ihre Ähnlichkeit ausgewählt werden Naiver Ansatz bei Relation mit N Tupeln O(N 2 ) Ähnlichkeitsvergleiche (Berechnung des kartesischen Produkts) Aber: Tupel-Vergleiche sind teuer dieser Ansatz ist für grosse N nicht verwendbar FS 2013 Datenbanken (CS243) Informationsintegration 3-53 Approximative Similarity Join Unterschiedliche Verfahren versuchen die Berechnung von Similarity Joins zu approximieren, um die Kosten für die Berechnung zu reduzieren Tupel, die zu keinen anderen Tupel unähnlich sind, von Berechnung ausschliessen Nur aussichtsreiche Ähnlichkeitsvergleiche durchführen Diese Verfahren approximieren, da im Vergleich zum naiven Ansatz ähnliche Tupel übersehen werden können FS 2013 Datenbanken (CS243) Informationsintegration

Fachbericht zum Thema: Anforderungen an ein Datenbanksystem

Fachbericht zum Thema: Anforderungen an ein Datenbanksystem Fachbericht zum Thema: Anforderungen an ein Datenbanksystem von André Franken 1 Inhaltsverzeichnis 1 Inhaltsverzeichnis 1 2 Einführung 2 2.1 Gründe für den Einsatz von DB-Systemen 2 2.2 Definition: Datenbank

Mehr

Mai 2006. Hauptseminar: Nichtrelationale Datenbanken Historisch-Kulturwissenschaftliche Informationsverarbeitung Universität zu Köln

Mai 2006. Hauptseminar: Nichtrelationale Datenbanken Historisch-Kulturwissenschaftliche Informationsverarbeitung Universität zu Köln Hauptseminar: Nichtrelationale Historisch-Kulturwissenschaftliche Informationsverarbeitung Universität zu Köln Mai 2006 Was ist eine Datenbank? Erweiterung relationaler um eine Deduktionskomponente Diese

Mehr

Datenbanken. Prof. Dr. Bernhard Schiefer. bernhard.schiefer@fh-kl.de http://www.fh-kl.de/~schiefer

Datenbanken. Prof. Dr. Bernhard Schiefer. bernhard.schiefer@fh-kl.de http://www.fh-kl.de/~schiefer Datenbanken Prof. Dr. Bernhard Schiefer bernhard.schiefer@fh-kl.de http://www.fh-kl.de/~schiefer Wesentliche Inhalte Begriff DBS Datenbankmodelle Datenbankentwurf konzeptionell, logisch und relational

Mehr

Handbuch ECDL 2003 Basic Modul 5: Datenbank Grundlagen von relationalen Datenbanken

Handbuch ECDL 2003 Basic Modul 5: Datenbank Grundlagen von relationalen Datenbanken Handbuch ECDL 2003 Basic Modul 5: Datenbank Grundlagen von relationalen Datenbanken Dateiname: ecdl5_01_00_documentation_standard.doc Speicherdatum: 14.02.2005 ECDL 2003 Basic Modul 5 Datenbank - Grundlagen

Mehr

1 Mathematische Grundlagen

1 Mathematische Grundlagen Mathematische Grundlagen - 1-1 Mathematische Grundlagen Der Begriff der Menge ist einer der grundlegenden Begriffe in der Mathematik. Mengen dienen dazu, Dinge oder Objekte zu einer Einheit zusammenzufassen.

Mehr

3. Das Relationale Datenmodell

3. Das Relationale Datenmodell 3. Das Relationale Datenmodell Das Relationale Datenmodell geht zurück auf Codd (1970): E. F. Codd: A Relational Model of Data for Large Shared Data Banks. Comm. of the ACM 13(6): 377-387(1970) DBMS wie

Mehr

7. Übung - Datenbanken

7. Übung - Datenbanken 7. Übung - Datenbanken Informatik I für Verkehrsingenieure Aufgaben inkl. Beispiellösungen 1. Aufgabe: DBS a Was ist die Kernaufgabe von Datenbanksystemen? b Beschreiben Sie kurz die Abstraktionsebenen

Mehr

WS 2002/03. Prof. Dr. Rainer Manthey. Institut für Informatik III Universität Bonn. Informationssysteme. Kapitel 1. Informationssysteme

WS 2002/03. Prof. Dr. Rainer Manthey. Institut für Informatik III Universität Bonn. Informationssysteme. Kapitel 1. Informationssysteme Informationssysteme Informationssysteme WS 2002/03 Prof. Dr. Rainer Manthey Institut für Informatik III Universität Bonn 2002 Prof. Dr. Rainer Manthey Informationssysteme 1 DB und/oder IS: terminologischer

Mehr

Modul Datenbanksysteme 2 Prüfung skizzenhaft SS Aug. 2007. Name: Note:

Modul Datenbanksysteme 2 Prüfung skizzenhaft SS Aug. 2007. Name: Note: 1 Modul Datenbanksysteme 2 Prüfung skizzenhaft SS Aug. 2007 Name: Note: Nr. Aufgaben Max. Punkte Erreichte Punkte 1 Grundlagen ~ 10% Vgl. Hinweis unten 2 Integrität, Procedures, Triggers, Sichten ~ 20%

Mehr

Business Intelligence Praktikum 1

Business Intelligence Praktikum 1 Hochschule Darmstadt Business Intelligence WS 2013-14 Fachbereich Informatik Praktikumsversuch 1 Prof. Dr. C. Wentzel Dipl. Inf. Dipl. Math. Y. Orkunoglu Datum: 14.10.2013 Business Intelligence Praktikum

Mehr

Datenübernahme von HKO 5.9 zur. Advolux Kanzleisoftware

Datenübernahme von HKO 5.9 zur. Advolux Kanzleisoftware Datenübernahme von HKO 5.9 zur Advolux Kanzleisoftware Die Datenübernahme (DÜ) von HKO 5.9 zu Advolux Kanzleisoftware ist aufgrund der von Update zu Update veränderten Datenbank (DB)-Strukturen in HKO

Mehr

Data Warehouse Definition (1) http://de.wikipedia.org/wiki/data-warehouse

Data Warehouse Definition (1) http://de.wikipedia.org/wiki/data-warehouse Data Warehouse Definition (1) http://de.wikipedia.org/wiki/data-warehouse Ein Data-Warehouse bzw. Datenlager ist eine zentrale Datensammlung (meist eine Datenbank), deren Inhalt sich aus Daten unterschiedlicher

Mehr

Präsentation zum Thema XML Datenaustausch und Integration

Präsentation zum Thema XML Datenaustausch und Integration Sebastian Land Präsentation zum Thema XML Datenaustausch und Integration oder Warum eigentlich XML? Gliederung der Präsentation 1. Erläuterung des Themas 2. Anwendungsbeispiel 3. Situation 1: Homogene

Mehr

Mengenvergleiche: Alle Konten außer das, mit dem größten Saldo.

Mengenvergleiche: Alle Konten außer das, mit dem größten Saldo. Mengenvergleiche: Mehr Möglichkeiten als der in-operator bietet der θany und der θall-operator, also der Vergleich mit irgendeinem oder jedem Tupel der Unteranfrage. Alle Konten außer das, mit dem größten

Mehr

Schlüssel bei temporalen Daten im relationalen Modell

Schlüssel bei temporalen Daten im relationalen Modell Schlüssel bei temporalen Daten im relationalen Modell Gesine Mühle > Präsentation > Bilder zum Inhalt zurück weiter 322 Schlüssel im relationalen Modell Schlüssel bei temporalen Daten im relationalen Modell

Mehr

30. Juni 2006 - Technische Universität Kaiserslautern. Paul R. Schilling

30. Juni 2006 - Technische Universität Kaiserslautern. Paul R. Schilling 30. Juni 2006 - Technische Universität Kaiserslautern Paul R. Schilling ! " #$% & '( ( ) *+, - '. / 0 1 2("$ DATEN SIND ALLGEGENWÄRTIG Bill Inmon, father of data warehousing Unternehmen In einer vollkommenen

Mehr

Universität Augsburg, Institut für Informatik WS 2006/2007 Dr. W.-T. Balke 27. Nov. 2006 M. Endres, A. Huhn, T. Preisinger Lösungsblatt 5

Universität Augsburg, Institut für Informatik WS 2006/2007 Dr. W.-T. Balke 27. Nov. 2006 M. Endres, A. Huhn, T. Preisinger Lösungsblatt 5 Universität Augsburg, Institut für Informatik WS 2006/2007 Dr. W.-T. Balke 27. Nov. 2006 M. Endres, A. Huhn, T. Preisinger Lösungsblatt 5 Aufgabe 1: Projektion Datenbanksysteme I π A1,...,A n (π B1,...,B

Mehr

Zeichen bei Zahlen entschlüsseln

Zeichen bei Zahlen entschlüsseln Zeichen bei Zahlen entschlüsseln In diesem Kapitel... Verwendung des Zahlenstrahls Absolut richtige Bestimmung von absoluten Werten Operationen bei Zahlen mit Vorzeichen: Addieren, Subtrahieren, Multiplizieren

Mehr

Primzahlen und RSA-Verschlüsselung

Primzahlen und RSA-Verschlüsselung Primzahlen und RSA-Verschlüsselung Michael Fütterer und Jonathan Zachhuber 1 Einiges zu Primzahlen Ein paar Definitionen: Wir bezeichnen mit Z die Menge der positiven und negativen ganzen Zahlen, also

Mehr

Kapitel 4 Die Datenbank Kuchenbestellung Seite 1

Kapitel 4 Die Datenbank Kuchenbestellung Seite 1 Kapitel 4 Die Datenbank Kuchenbestellung Seite 1 4 Die Datenbank Kuchenbestellung In diesem Kapitel werde ich die Theorie aus Kapitel 2 Die Datenbank Buchausleihe an Hand einer weiteren Datenbank Kuchenbestellung

Mehr

Allgemeines zu Datenbanken

Allgemeines zu Datenbanken Allgemeines zu Datenbanken Was ist eine Datenbank? Datensatz Zusammenfassung von Datenelementen mit fester Struktur Z.B.: Kunde Alois Müller, Hegenheimerstr. 28, Basel Datenbank Sammlung von strukturierten,

Mehr

Elexis-BlueEvidence-Connector

Elexis-BlueEvidence-Connector Elexis-BlueEvidence-Connector Gerry Weirich 26. Oktober 2012 1 Einführung Dieses Plugin dient dazu, den Status Hausarztpatient zwischen der BlueEvidence- Anwendung und Elexis abzugleichen. Das Plugin markiert

Mehr

Aufgabe 1: [Logische Modellierung]

Aufgabe 1: [Logische Modellierung] Aufgabe 1: [Logische Modellierung] a) Entwerfen Sie für das von Ihnen entworfene Modell aus Aufgabe 2 des 1. Übungsblattes ein Star-Schema. b) Entwerfen Sie für das vorangegangene Modell einen Teil eines

Mehr

Barrierefreie Webseiten erstellen mit TYPO3

Barrierefreie Webseiten erstellen mit TYPO3 Barrierefreie Webseiten erstellen mit TYPO3 Alternativtexte Für jedes Nicht-Text-Element ist ein äquivalenter Text bereitzustellen. Dies gilt insbesondere für Bilder. In der Liste der HTML 4-Attribute

Mehr

OP-LOG www.op-log.de

OP-LOG www.op-log.de Verwendung von Microsoft SQL Server, Seite 1/18 OP-LOG www.op-log.de Anleitung: Verwendung von Microsoft SQL Server 2005 Stand Mai 2010 1 Ich-lese-keine-Anleitungen 'Verwendung von Microsoft SQL Server

Mehr

Software Engineering Klassendiagramme Assoziationen

Software Engineering Klassendiagramme Assoziationen Software Engineering Klassendiagramme Assoziationen Prof. Adrian A. Müller, PMP, PSM 1, CSM Fachbereich Informatik und Mikrosystemtechnik 1 Lesen von Multiplizitäten (1) Multiplizitäten werden folgendermaßen

Mehr

Auto-Provisionierung tiptel 30x0 mit Yeastar MyPBX

Auto-Provisionierung tiptel 30x0 mit Yeastar MyPBX Allgemeines Auto-Provisionierung tiptel 30x0 mit Yeastar MyPBX Stand 21.11.2014 Die Yeastar MyPBX Telefonanlagen unterstützen die automatische Konfiguration der tiptel 3010, tiptel 3020 und tiptel 3030

Mehr

Übungsblatt 4. Aufgabe 7: Datensicht Fachkonzept (Klausur SS 2002, 1. Termin)

Übungsblatt 4. Aufgabe 7: Datensicht Fachkonzept (Klausur SS 2002, 1. Termin) Übungsblatt 4 Aufgabe 7: Datensicht Fachkonzept (Klausur SS 2002, 1. Termin) Die Saartal Linien beauftragen Sie mit dem Entwurf der Datenstrukturen für ein Informationssystem. Dieses soll zur Verwaltung

Mehr

Fragenkatalog zum Kurs 1666 (Datenbanken in Rechnernetzen) Kurstext von SS 96

Fragenkatalog zum Kurs 1666 (Datenbanken in Rechnernetzen) Kurstext von SS 96 Fragenkatalog zum Kurs 1666 (Datenbanken in Rechnernetzen) Kurstext von SS 96 Dieser Fragenkatalog wurde aufgrund das Basistextes und zum Teil aus den Prüfungsprotokollen erstellt, um sich auf mögliche

Mehr

Motivation. Formale Grundlagen der Informatik 1 Kapitel 5 Kontextfreie Sprachen. Informales Beispiel. Informales Beispiel.

Motivation. Formale Grundlagen der Informatik 1 Kapitel 5 Kontextfreie Sprachen. Informales Beispiel. Informales Beispiel. Kontextfreie Kontextfreie Motivation Formale rundlagen der Informatik 1 Kapitel 5 Kontextfreie Sprachen Bisher hatten wir Automaten, die Wörter akzeptieren Frank Heitmann heitmann@informatik.uni-hamburg.de

Mehr

In diesem Thema lernen wir die Grundlagen der Datenbanken kennen und werden diese lernen einzusetzen. Access. Die Grundlagen der Datenbanken.

In diesem Thema lernen wir die Grundlagen der Datenbanken kennen und werden diese lernen einzusetzen. Access. Die Grundlagen der Datenbanken. In diesem Thema lernen wir die Grundlagen der Datenbanken kennen und werden diese lernen einzusetzen. Access Die Grundlagen der Datenbanken kurspc15 Inhaltsverzeichnis Access... Fehler! Textmarke nicht

Mehr

2.5.2 Primärschlüssel

2.5.2 Primärschlüssel Relationale Datenbanken 0110 01101110 01110 0110 0110 0110 01101 011 01110 0110 010 011011011 0110 01111010 01101 011011 0110 01 01110 011011101 01101 0110 010 010 0110 011011101 0101 0110 010 010 01 01101110

Mehr

EinfÅhrung in die objektorientiere Programmierung (OOP) unter Delphi 6.0. EDV Kurs 13/2

EinfÅhrung in die objektorientiere Programmierung (OOP) unter Delphi 6.0. EDV Kurs 13/2 EinfÅhrung in die objektorientiere Programmierung (OOP) unter Delphi 6.0 EDV Kurs 13/2 Inhaltsverzeichnis 1 Objekte... 1 2 Klassen... 3 2.1 Beziehungen zwischen Klassen... 4 2.1.1 Vererbung... 4 2.1.2

Mehr

Vorlesung Dokumentation und Datenbanken Klausur

Vorlesung Dokumentation und Datenbanken Klausur Dr. Stefan Brass 5. Februar 2002 Institut für Informatik Universität Giessen Vorlesung Dokumentation und Datenbanken Klausur Name: Geburtsdatum: Geburtsort: (Diese Daten werden zur Ausstellung des Leistungsnachweises

Mehr

Kapitalerhöhung - Verbuchung

Kapitalerhöhung - Verbuchung Kapitalerhöhung - Verbuchung Beschreibung Eine Kapitalerhöhung ist eine Erhöhung des Aktienkapitals einer Aktiengesellschaft durch Emission von en Aktien. Es gibt unterschiedliche Formen von Kapitalerhöhung.

Mehr

Programmiersprachen und Übersetzer

Programmiersprachen und Übersetzer Programmiersprachen und Übersetzer Sommersemester 2010 19. April 2010 Theoretische Grundlagen Problem Wie kann man eine unendliche Menge von (syntaktisch) korrekten Programmen definieren? Lösung Wie auch

Mehr

Grundbegriffe der Informatik

Grundbegriffe der Informatik Grundbegriffe der Informatik Einheit 15: Reguläre Ausdrücke und rechtslineare Grammatiken Thomas Worsch Universität Karlsruhe, Fakultät für Informatik Wintersemester 2008/2009 1/25 Was kann man mit endlichen

Mehr

Klassifikation von Integrationskonflikten

Klassifikation von Integrationskonflikten Klassifikation von Integrationskonflikten Christiane Telöken 1 Inhaltsverzeichnis 1. Was bedeutet Integration? 2. Strukturelle Heterogenitätskonflikte 2.1 Konflikte bei bilateralen Korrespondenzen 2.2

Mehr

Datenbanken 16.1.2008. Die Entwicklung der Datenbanksysteme ist eng an die der Hardware gekoppelt und wird wie jene in Generationen eingeteilt:

Datenbanken 16.1.2008. Die Entwicklung der Datenbanksysteme ist eng an die der Hardware gekoppelt und wird wie jene in Generationen eingeteilt: Datenbanksysteme Entwicklung der Datenbanksysteme Die Entwicklung der Datenbanksysteme ist eng an die der Hardware gekoppelt und wird wie jene in Generationen eingeteilt: 1. Generation: In den fünfziger

Mehr

Carl-Christian Kanne. Einführung in Datenbanken p.1/513

Carl-Christian Kanne. Einführung in Datenbanken p.1/513 Einführung in Datenbanken Carl-Christian Kanne Einführung in Datenbanken p.1/513 Kapitel 1 Einführung Einführung in Datenbanken p.2/513 Einführung Was ist ein Datenbanksystem (DBS)? Ein System zum Speichern

Mehr

SQL - Übungen Bearbeitung der Datenbank Personal (1)

SQL - Übungen Bearbeitung der Datenbank Personal (1) Bearbeitung der Datenbank Personal (1) 1. Abfragen einer einzigen Tabelle 1.1. Zeigen Sie alle Informationen an, die über die Kinder der Mitarbeiter gespeichert sind. 1.2. Zeigen Sie aus der Tabelle stelle

Mehr

etutor Benutzerhandbuch XQuery Benutzerhandbuch Georg Nitsche

etutor Benutzerhandbuch XQuery Benutzerhandbuch Georg Nitsche etutor Benutzerhandbuch Benutzerhandbuch XQuery Georg Nitsche Version 1.0 Stand März 2006 Versionsverlauf: Version Autor Datum Änderungen 1.0 gn 06.03.2006 Fertigstellung der ersten Version Inhaltsverzeichnis:

Mehr

1. Man schreibe die folgenden Aussagen jeweils in einen normalen Satz um. Zum Beispiel kann man die Aussage:

1. Man schreibe die folgenden Aussagen jeweils in einen normalen Satz um. Zum Beispiel kann man die Aussage: Zählen und Zahlbereiche Übungsblatt 1 1. Man schreibe die folgenden Aussagen jeweils in einen normalen Satz um. Zum Beispiel kann man die Aussage: Für alle m, n N gilt m + n = n + m. in den Satz umschreiben:

Mehr

4. BEZIEHUNGEN ZWISCHEN TABELLEN

4. BEZIEHUNGEN ZWISCHEN TABELLEN 4. BEZIEHUNGEN ZWISCHEN TABELLEN Zwischen Tabellen können in MS Access Beziehungen bestehen. Durch das Verwenden von Tabellen, die zueinander in Beziehung stehen, können Sie Folgendes erreichen: Die Größe

Mehr

Stellungnahme. E-Government-Standards Seite 1 von 6. Dokument:...eCH-0108. Version:...1.0 ech-kategorie:...standard. Datum der Eingabe:...04.05.

Stellungnahme. E-Government-Standards Seite 1 von 6. Dokument:...eCH-0108. Version:...1.0 ech-kategorie:...standard. Datum der Eingabe:...04.05. E-Government-Standards Seite 1 von 6 Stellungnahme Dokument:...eCH-0108 Version:...1.0 ech-kategorie:...standard Datum der Eingabe:...04.05.2010 Koordinaten Vernehmlassungsteilnehmer/In: Organisation:

Mehr

Theoretische Grundlagen der Informatik WS 09/10

Theoretische Grundlagen der Informatik WS 09/10 Theoretische Grundlagen der Informatik WS 09/10 - Tutorium 6 - Michael Kirsten und Kai Wallisch Sitzung 13 02.02.2010 Inhaltsverzeichnis 1 Formeln zur Berechnung Aufgabe 1 2 Hamming-Distanz Aufgabe 2 3

Mehr

mit Musterlösungen Prof. Dr. Gerd Stumme, Dipl.-Inform. Christoph Schmitz 11. Juni 2007

mit Musterlösungen Prof. Dr. Gerd Stumme, Dipl.-Inform. Christoph Schmitz 11. Juni 2007 6. Übung zur Vorlesung Datenbanken im Sommersemester 2007 mit Musterlösungen Prof. Dr. Gerd Stumme, Dipl.-Inform. Christoph Schmitz 11. Juni 2007 Aufgabe 1: Rekursion Betrachten Sie die folgende Tabelle

Mehr

Objektrelationale Datenbanken

Objektrelationale Datenbanken Vorlesung Datenbanksysteme vom 26.11.2008 Objektrelationale Datenbanken Konzepte objektrelationaler DBs SQL:1999 OO vs. OR Konzepte objektrelationaler Datenbanken Große Objekte (LOBs: Large Objects) Mengenwertige

Mehr

Integration verteilter Datenquellen in GIS-Datenbanken

Integration verteilter Datenquellen in GIS-Datenbanken Integration verteilter Datenquellen in GIS-Datenbanken Seminar Verteilung und Integration von Verkehrsdaten Am IPD Lehrstuhl für Systeme der Informationsverwaltung Sommersemester 2004 Christian Hennings

Mehr

A1.7: Entropie natürlicher Texte

A1.7: Entropie natürlicher Texte A1.7: Entropie natürlicher Texte Anfang der 1950er Jahre hat Claude E. Shannon die Entropie H der englischen Sprache mit einem bit pro Zeichen abgeschätzt. Kurz darauf kam Karl Küpfmüller bei einer empirischen

Mehr

Abschluss Version 1.0

Abschluss Version 1.0 Beschreibung Der Abschluss wird normalerweise nur einmal jährlich durchgeführt. Dieses Tech-Note soll helfen, diesen doch seltenen aber periodisch notwendigen Vorgang problemlos durchzuführen. Abschlussvarianten

Mehr

Vermeiden Sie es sich bei einer deutlich erfahreneren Person "dranzuhängen", Sie sind persönlich verantwortlich für Ihren Lernerfolg.

Vermeiden Sie es sich bei einer deutlich erfahreneren Person dranzuhängen, Sie sind persönlich verantwortlich für Ihren Lernerfolg. 1 2 3 4 Vermeiden Sie es sich bei einer deutlich erfahreneren Person "dranzuhängen", Sie sind persönlich verantwortlich für Ihren Lernerfolg. Gerade beim Einstig in der Programmierung muss kontinuierlich

Mehr

2 Evaluierung von Retrievalsystemen

2 Evaluierung von Retrievalsystemen 2. Evaluierung von Retrievalsystemen Relevanz 2 Evaluierung von Retrievalsystemen Die Evaluierung von Verfahren und Systemen spielt im IR eine wichtige Rolle. Gemäß der Richtlinien für IR der GI gilt es,...

Mehr

Zahlensysteme: Oktal- und Hexadezimalsystem

Zahlensysteme: Oktal- und Hexadezimalsystem 20 Brückenkurs Die gebräuchlichste Bitfolge umfasst 8 Bits, sie deckt also 2 8 =256 Möglichkeiten ab, und wird ein Byte genannt. Zwei Bytes, also 16 Bits, bilden ein Wort, und 4 Bytes, also 32 Bits, formen

Mehr

Business Intelligence Praktikum 1

Business Intelligence Praktikum 1 Hochschule Darmstadt Business Intelligence SS 2014 Fachbereich Informatik Praktikumsversuch 1 Prof. Dr. C. Wentzel Dipl. Inf. Dipl. Math. Y. Orkunoglu Datum: 07.05.2014 Business Intelligence Praktikum

Mehr

ER-Modellierung am Beispiel der Universitätsdatenbank aus der DBIS-Vorlesung

ER-Modellierung am Beispiel der Universitätsdatenbank aus der DBIS-Vorlesung ER-Modellierung am Beispiel der Universitätsdatenbank aus der DBIS-Vorlesung Datenbank-Praktikum SS 2010 Prof. Dr. Georg Lausen Florian Schmedding ER-Modell: Wiederholung Entitäten E Beziehungen B Attribute

Mehr

Das System sollte den Benutzer immer auf dem Laufenden halten, indem es angemessenes Feedback in einer angemessenen Zeit liefert.

Das System sollte den Benutzer immer auf dem Laufenden halten, indem es angemessenes Feedback in einer angemessenen Zeit liefert. Usability Heuristiken Karima Tefifha Proseminar: "Software Engineering Kernkonzepte: Usability" 28.06.2012 Prof. Dr. Kurt Schneider Leibniz Universität Hannover Die ProSeminar-Ausarbeitung beschäftigt

Mehr

Datenidentifikation und -synchronisation: Grundlage zur Erfüllung der Qualitätsanforderungen beim Datenaustausch zwischen Systemen

Datenidentifikation und -synchronisation: Grundlage zur Erfüllung der Qualitätsanforderungen beim Datenaustausch zwischen Systemen Datenidentifikation und -synchronisation: Grundlage zur Erfüllung der Qualitätsanforderungen beim Datenaustausch zwischen Systemen Jürg Simonett Luzern, 26. März 2015 Datenaustausch zwischen Systemen Synchronisation

Mehr

Software-Engineering Einführung

Software-Engineering Einführung Software-Engineering Einführung 7. Übung (04.12.2014) Dr. Gergely Varró, gergely.varro@es.tu-darmstadt.de Erhan Leblebici, erhan.leblebici@es.tu-darmstadt.de Tel.+49 6151 16 4388 ES Real-Time Systems Lab

Mehr

Um zusammenfassende Berichte zu erstellen, gehen Sie folgendermaßen vor:

Um zusammenfassende Berichte zu erstellen, gehen Sie folgendermaßen vor: Ergebnisreport: mehrere Lehrveranstaltungen zusammenfassen 1 1. Ordner anlegen In der Rolle des Berichterstellers (siehe EvaSys-Editor links oben) können zusammenfassende Ergebnisberichte über mehrere

Mehr

Informationsblatt Induktionsbeweis

Informationsblatt Induktionsbeweis Sommer 015 Informationsblatt Induktionsbeweis 31. März 015 Motivation Die vollständige Induktion ist ein wichtiges Beweisverfahren in der Informatik. Sie wird häufig dazu gebraucht, um mathematische Formeln

Mehr

SharePoint Demonstration

SharePoint Demonstration SharePoint Demonstration Was zeigt die Demonstration? Diese Demonstration soll den modernen Zugriff auf Daten und Informationen veranschaulichen und zeigen welche Vorteile sich dadurch in der Zusammenarbeit

Mehr

6. Bayes-Klassifikation. (Schukat-Talamazzini 2002)

6. Bayes-Klassifikation. (Schukat-Talamazzini 2002) 6. Bayes-Klassifikation (Schukat-Talamazzini 2002) (Böhm 2003) (Klawonn 2004) Der Satz von Bayes: Beweis: Klassifikation mittels des Satzes von Bayes (Klawonn 2004) Allgemeine Definition: Davon zu unterscheiden

Mehr

Fachdidaktik der Informatik 18.12.08 Jörg Depner, Kathrin Gaißer

Fachdidaktik der Informatik 18.12.08 Jörg Depner, Kathrin Gaißer Fachdidaktik der Informatik 18.12.08 Jörg Depner, Kathrin Gaißer Klassendiagramme Ein Klassendiagramm dient in der objektorientierten Softwareentwicklung zur Darstellung von Klassen und den Beziehungen,

Mehr

Klaus Schild, XML Clearinghouse 2003. Namensräume

Klaus Schild, XML Clearinghouse 2003. Namensräume Namensräume Lernziele Namenskonflikte Warum lösen im World Wide Web einfache Präfixe dieses Problem nicht? Wie lösen globale Namensräume das Problem? Wie werden sie in XML-Dokumenten benutzt? Was sind

Mehr

Theoretische Informatik SS 04 Übung 1

Theoretische Informatik SS 04 Übung 1 Theoretische Informatik SS 04 Übung 1 Aufgabe 1 Es gibt verschiedene Möglichkeiten, eine natürliche Zahl n zu codieren. In der unären Codierung hat man nur ein Alphabet mit einem Zeichen - sagen wir die

Mehr

Die Downloadarea ist nur noch bedingt mit den bestehenden Dingen befüllt, wird aber nicht mehr aktualisiert.

Die Downloadarea ist nur noch bedingt mit den bestehenden Dingen befüllt, wird aber nicht mehr aktualisiert. Das Marketingtool. Bedienungsanleitung. Das Marketingtool, das Sie bereits seit einiger Zeit kennen, wurde nun auf eine aktuelle Version angeglichen. Die Funktionen bleiben alle dieselben, lediglich wurde

Mehr

Klassenentwurf. Wie schreiben wir Klassen, die leicht zu verstehen, wartbar und wiederverwendbar sind? Objektorientierte Programmierung mit Java

Klassenentwurf. Wie schreiben wir Klassen, die leicht zu verstehen, wartbar und wiederverwendbar sind? Objektorientierte Programmierung mit Java Objektorientierte Programmierung mit Java Eine praxisnahe Einführung mit BlueJ Klassenentwurf Wie schreiben wir Klassen, die leicht zu verstehen, wartbar und wiederverwendbar sind? 1.0 Zentrale Konzepte

Mehr

Data Quality Management: Abgleich großer, redundanter Datenmengen

Data Quality Management: Abgleich großer, redundanter Datenmengen Data Quality Management: Abgleich großer, redundanter Datenmengen Westendstr. 14 809 München Tel 089-5100 907 Fax 089-5100 9087 E-Mail Datras@Datras.de Redundanz und relationales Datenbankmodell Redundanz:

Mehr

Agile Vorgehensmodelle in der Softwareentwicklung: Scrum

Agile Vorgehensmodelle in der Softwareentwicklung: Scrum C A R L V O N O S S I E T Z K Y Agile Vorgehensmodelle in der Softwareentwicklung: Scrum Johannes Diemke Vortrag im Rahmen der Projektgruppe Oldenburger Robot Soccer Team im Wintersemester 2009/2010 Was

Mehr

Erstellen einer PostScript-Datei unter Windows XP

Erstellen einer PostScript-Datei unter Windows XP Erstellen einer PostScript-Datei unter Windows XP Sie möchten uns Ihre Druckvorlage als PostScript-Datei einreichen. Um Fehler in der Herstellung von vorneherein auszuschließen, möchten wir Sie bitten,

Mehr

Kurzanleitung zur Bereitstellung von Sachverhalten und Lösungen zum Universitätsrepetitorium auf dem Server unirep.rewi.hu-berlin.

Kurzanleitung zur Bereitstellung von Sachverhalten und Lösungen zum Universitätsrepetitorium auf dem Server unirep.rewi.hu-berlin. Humboldt-Universität zu Berlin Juristische Fakultät Kurzanleitung zur Bereitstellung von Sachverhalten und Lösungen zum Universitätsrepetitorium auf dem Server unirep.rewi.hu-berlin.de Stand: 1. Juni 2010

Mehr

183.580, WS2012 Übungsgruppen: Mo., 22.10.

183.580, WS2012 Übungsgruppen: Mo., 22.10. VU Grundlagen digitaler Systeme Übung 2: Numerik, Boolesche Algebra 183.580, WS2012 Übungsgruppen: Mo., 22.10. Aufgabe 1: Binäre Gleitpunkt-Arithmetik Addition & Subtraktion Gegeben sind die Zahlen: A

Mehr

Ihre Interessentendatensätze bei inobroker. 1. Interessentendatensätze

Ihre Interessentendatensätze bei inobroker. 1. Interessentendatensätze Ihre Interessentendatensätze bei inobroker Wenn Sie oder Ihre Kunden die Prozesse von inobroker nutzen, werden Interessentendatensätze erzeugt. Diese können Sie direkt über inobroker bearbeiten oder mit

Mehr

Lizenzierung von System Center 2012

Lizenzierung von System Center 2012 Lizenzierung von System Center 2012 Mit den Microsoft System Center-Produkten lassen sich Endgeräte wie Server, Clients und mobile Geräte mit unterschiedlichen Betriebssystemen verwalten. Verwalten im

Mehr

BASIS Karten, WEA-Katalog, Projektierung, Objekte etc.

BASIS Karten, WEA-Katalog, Projektierung, Objekte etc. Das Basismodul enthält diese Elemente: 1. Projektsteuerung / -management 3. Kartenhandling-System 2. Windenergieanlagen-Katalog 4. Projektierung und objektorientierte Dateneingabe Die Projektsteuerung

Mehr

Die Excel Schnittstelle - Pro Pack

Die Excel Schnittstelle - Pro Pack Die Excel Schnittstelle - Pro Pack Die Excel Pro Pack ist eine Erweiterung der normalen Excel Schnittstelle, die in der Vollversion von POSWare Bestandteil der normalen Lizenz und somit für alle Lizenznehmer

Mehr

SWE5 Übungen zu Software-Engineering

SWE5 Übungen zu Software-Engineering 1 Übungen zu Software-Engineering 1) Klassen und Objekte 2) Telefonanlage 3) Objekt- und Klassendiagramme 4) Assoziationen 5) Telefonanlage (Erweiterung) 6) Fahrzeuge 7) Familien 2 Aufgabe 1: Klassen und

Mehr

PowerPoint 2010 Mit Folienmastern arbeiten

PowerPoint 2010 Mit Folienmastern arbeiten PP.002, Version 1.1 07.04.2015 Kurzanleitung PowerPoint 2010 Mit Folienmastern arbeiten Der Folienmaster ist die Vorlage für sämtliche Folien einer Präsentation. Er bestimmt das Design, die Farben, die

Mehr

robotron*e count robotron*e sales robotron*e collect Anmeldung Webkomponente Anwenderdokumentation Version: 2.0 Stand: 28.05.2014

robotron*e count robotron*e sales robotron*e collect Anmeldung Webkomponente Anwenderdokumentation Version: 2.0 Stand: 28.05.2014 robotron*e count robotron*e sales robotron*e collect Anwenderdokumentation Version: 2.0 Stand: 28.05.2014 Seite 2 von 5 Alle Rechte dieser Dokumentation unterliegen dem deutschen Urheberrecht. Die Vervielfältigung,

Mehr

SQL für Trolle. mag.e. Dienstag, 10.2.2009. Qt-Seminar

SQL für Trolle. mag.e. Dienstag, 10.2.2009. Qt-Seminar Qt-Seminar Dienstag, 10.2.2009 SQL ist......die Abkürzung für Structured Query Language (früher sequel für Structured English Query Language )...ein ISO und ANSI Standard (aktuell SQL:2008)...eine Befehls-

Mehr

Whitebox-Tests: Allgemeines

Whitebox-Tests: Allgemeines -Tests: Allgemeines Andere Bezeichnungen Logic driven, Strukturelles Der Tester entwickelt Testfälle aus einer Betrachtung der Ablauflogik des Programms unter Berücksichtigung der Spezifikation Intuitiv

Mehr

Ablaufbeschreibung für das neu Aufsetzen von Firebird und Interbase Datenbanken mit der IBOConsole

Ablaufbeschreibung für das neu Aufsetzen von Firebird und Interbase Datenbanken mit der IBOConsole Lavid-F.I.S. Ablaufbeschreibung für das neu Aufsetzen von Firebird und Interbase Datenbanken mit der Lavid Software GmbH Dauner Straße 12, D-41236 Mönchengladbach http://www.lavid-software.net Support:

Mehr

Reporting Services und SharePoint 2010 Teil 1

Reporting Services und SharePoint 2010 Teil 1 Reporting Services und SharePoint 2010 Teil 1 Abstract Bei der Verwendung der Reporting Services in Zusammenhang mit SharePoint 2010 stellt sich immer wieder die Frage bei der Installation: Wo und Wie?

Mehr

Dipl. Inf. Dipl. Math. Y. Orkunoglu Datum: 11.09.2009

Dipl. Inf. Dipl. Math. Y. Orkunoglu Datum: 11.09.2009 Hochschule Darmstadt DATENBANKEN Fachbereich Informatik Praktikum 3 Dipl. Inf. Dipl. Math. Y. Orkunoglu Datum: 11.09.2009 PL/SQL Programmierung Anwendung des Cursor Konzepts und Stored Procedures Und Trigger

Mehr

Binäre Bäume. 1. Allgemeines. 2. Funktionsweise. 2.1 Eintragen

Binäre Bäume. 1. Allgemeines. 2. Funktionsweise. 2.1 Eintragen Binäre Bäume 1. Allgemeines Binäre Bäume werden grundsätzlich verwendet, um Zahlen der Größe nach, oder Wörter dem Alphabet nach zu sortieren. Dem einfacheren Verständnis zu Liebe werde ich mich hier besonders

Mehr

Data Warehouse ??? Ein Data Warehouse ist keine von der Stange zu kaufende Standardsoftware, sondern immer eine unternehmensindividuelle

Data Warehouse ??? Ein Data Warehouse ist keine von der Stange zu kaufende Standardsoftware, sondern immer eine unternehmensindividuelle ??? Zusammenfassung, Ergänzung, Querverbindungen, Beispiele A.Kaiser; WU-Wien MIS 188 Data Warehouse Ein Data Warehouse ist keine von der Stange zu kaufende Standardsoftware, sondern immer eine unternehmensindividuelle

Mehr

Mit der Maus im Menü links auf den Menüpunkt 'Seiten' gehen und auf 'Erstellen klicken.

Mit der Maus im Menü links auf den Menüpunkt 'Seiten' gehen und auf 'Erstellen klicken. Seite erstellen Mit der Maus im Menü links auf den Menüpunkt 'Seiten' gehen und auf 'Erstellen klicken. Es öffnet sich die Eingabe Seite um eine neue Seite zu erstellen. Seiten Titel festlegen Den neuen

Mehr

Task: Nmap Skripte ausführen

Task: Nmap Skripte ausführen Task: Nmap Skripte ausführen Inhalt Einfache Netzwerkscans mit NSE Ausführen des Scans Anpassung der Parameter Einleitung Copyright 2009-2015 Greenbone Networks GmbH Herkunft und aktuellste Version dieses

Mehr

Vgl. Kapitel 4 aus Systematisches Requirements Engineering, Christoph Ebert https://www.sws.bfh.ch/studium/cas/swe-fs13/protected/re/re_buch.

Vgl. Kapitel 4 aus Systematisches Requirements Engineering, Christoph Ebert https://www.sws.bfh.ch/studium/cas/swe-fs13/protected/re/re_buch. Vgl. Kapitel 4 aus Systematisches Requirements Engineering, Christoph Ebert https://www.sws.bfh.ch/studium/cas/swe-fs13/protected/re/re_buch.pdf Nachdem die Projekt-Vision und die Stakeholder bekannt sind,

Mehr

Inhalt. 1 Übersicht. 2 Anwendungsbeispiele. 3 Einsatzgebiete. 4 Systemanforderungen. 5 Lizenzierung. 6 Installation.

Inhalt. 1 Übersicht. 2 Anwendungsbeispiele. 3 Einsatzgebiete. 4 Systemanforderungen. 5 Lizenzierung. 6 Installation. Inhalt 1 Übersicht 2 Anwendungsbeispiele 3 Einsatzgebiete 4 Systemanforderungen 5 Lizenzierung 6 Installation 7 Key Features 1. Übersicht Der MIK.etl.connector ist ein ETL-Tool - die Abkürzung steht für

Mehr

Kapitel 7: Formaler Datenbankentwurf

Kapitel 7: Formaler Datenbankentwurf 7. Formaler Datenbankentwurf Seite 1 Kapitel 7: Formaler Datenbankentwurf Die Schwierigkeiten der konzeptuellen Modellierung sind zu einem großen Teil dadurch begründet, dass sich die relevanten Strukturen

Mehr

Updatehinweise für die Version forma 5.5.5

Updatehinweise für die Version forma 5.5.5 Updatehinweise für die Version forma 5.5.5 Seit der Version forma 5.5.0 aus 2012 gibt es nur noch eine Office-Version und keine StandAlone-Version mehr. Wenn Sie noch mit der alten Version forma 5.0.x

Mehr

4. Jeder Knoten hat höchstens zwei Kinder, ein linkes und ein rechtes.

4. Jeder Knoten hat höchstens zwei Kinder, ein linkes und ein rechtes. Binäre Bäume Definition: Ein binärer Baum T besteht aus einer Menge von Knoten, die durch eine Vater-Kind-Beziehung wie folgt strukturiert ist: 1. Es gibt genau einen hervorgehobenen Knoten r T, die Wurzel

Mehr

Einführung. Informationssystem als Abbild der realen Welt

Einführung. Informationssystem als Abbild der realen Welt Was ist ein Datenbanksystem? Anwendungsgrundsätze Betrieb von Datenbanksystemen Entwicklung von Datenbanksystemen Seite 1 Informationssystem als Abbild der realen Welt Modellierung (Abstraktion) Sachverhalte

Mehr

OPERATIONEN AUF EINER DATENBANK

OPERATIONEN AUF EINER DATENBANK Einführung 1 OPERATIONEN AUF EINER DATENBANK Ein Benutzer stellt eine Anfrage: Die Benutzer einer Datenbank können meist sowohl interaktiv als auch über Anwendungen Anfragen an eine Datenbank stellen:

Mehr

Hinweise zum Ausfüllen der Zeiterfassung

Hinweise zum Ausfüllen der Zeiterfassung Hinweise zum Ausfüllen der Zeiterfassung Generelle Hinweise zu Excel Ab Version VSA 4.50 wird die dezimale Schreibweise für Zeiteingaben verwendet. Die Zeiterfassung, die Sie erhalten haben wurde für Excel

Mehr

Inhalt. 1 Einleitung AUTOMATISCHE DATENSICHERUNG AUF EINEN CLOUDSPEICHER

Inhalt. 1 Einleitung AUTOMATISCHE DATENSICHERUNG AUF EINEN CLOUDSPEICHER AUTOMATISCHE DATENSICHERUNG AUF EINEN CLOUDSPEICHER Inhalt 1 Einleitung... 1 2 Einrichtung der Aufgabe für die automatische Sicherung... 2 2.1 Die Aufgabenplanung... 2 2.2 Der erste Testlauf... 9 3 Problembehebung...

Mehr

Educase. Release Notes 1.7: Neue Funktionen und Verbesserungen. Base-Net Informatik AG Wassergrabe 14 CH-6210 Sursee

Educase. Release Notes 1.7: Neue Funktionen und Verbesserungen. Base-Net Informatik AG Wassergrabe 14 CH-6210 Sursee Educase Release Notes 1.7: Neue Funktionen und Verbesserungen Version: 1.0 Datum: 01.12.2015 08:34 Ersteller: Andreas Renggli Status: Abgeschlossen Base-Net Informatik AG Wassergrabe 14 CH-6210 Sursee

Mehr