Matching (Duplikaterkennung)

Größe: px
Ab Seite anzeigen:

Download "Matching (Duplikaterkennung)"

Transkript

1 REGIONALES RECHENZENTRUM ERLANGEN [RRZE] Matching (Duplikaterkennung) The Big Picture Krasimir Zhelev

2 Agenda Vorbereitungsarbeiten Erweitertes Matching Matching Prozess Mapping & Normalisierung Partitionierung Verarbeitung Ergebnis-Klassifizierung Überprüfung Zusätzliche Funktionalität Präventives Matching Aufräumarbeiten Fazit 2

3 MATCHING IST WIE LIEBE Der Reiseführer Per Anhalter durch die Galaxis sagt zum Thema Liebe: Wenn möglich vermeiden!

4 VORBEREITUNGSARBEITEN Unser wichtigstes Kapital sind Daten!

5 Vorbereitungsarbeiten Interne Daten bereinigen Altlasten entfernen Attributwerte aufräumen Zusammenführen Quellsystemdaten bereinigen Altlasten entfernen Attributwerte aufräumen Zusammenführen Datenanalyse Statistisch Kardinalität Dateneingaberoutinen kennenlernen 5

6 ERWEITERTES MATCHING Die 90er sind vorbei

7 Überblick Quellsystem A Quellsystem B M IdM Quellsystem C linking and/or aggregating data from the same or various sources that refers to the same entity in the case where no unique entities identifiers are avaialable M = Matching 7

8 Der Matching Prozess Quellsystem Mapping Normalisierung Partitionierung MDH Überprüfung Klassifizierung M Verarbeitung MDH = Matching Datenhaltung 8

9 Mapping & Normalisierung Mapping Attributgruppen Priorisierung Pro System Innerhalb des Systems Normalisierung Standard Routinen Spezifische Routinen Wert-Mapping Tabellen Synchronisation Re-Normalisierung M IdM 9

10 Partitionierung Datendistribution Pre-Matching Smith-Waterman Algorithmus Tag-Link-Token Algorithmus Schnelle Algorithmen Einstellbare Koeffizienten Rainbow Tabellen Matching Cache/Lock Vor der Partitionierung Behandelt Parallelität und Verzögerungen Bis das Objekt gefunden wird oder bis zum Timeout 10

11 Verarbeitung Komplexe Algorithmen ChapmanOrderedNameCompound QGramsDistanceWunch Gewichtet Pro Attributwert - Datendistribution Pro Quellsystem Pro Attributtyp Schwellwerte Pro Quellsystem Pro Attributtyp Flexibel 11

12 Klassifizierung Matched (Rejected) Confirmed Match Confirmed Reject Manual Mehrere passende Objekte mit den gleichen Koeffizienten Große Diskrepanz zwischen Partitionierung und Verarbeitung Cache Match Error 12

13 Überprüfung Oberfläche Verbinden Zusammenführen Trennen Resync Datenüberblick Quellsystem vs. IdM Sicht Datenzusammenhänge Protokollierung Datenversionierung Kontakt mit Sachbearbeitern 13

14 ZUSÄTZLICHE FUNKTIONALITÄT Jetzt sind wir aber fertig nicht so eilig

15 Präventives Matching Vorbeugen ist besser als Heilen! Besserer Treffer Wiederverwendbare Datensätze Fälschlich angelegte Einträge Klassifizierung der Fälle Zielobjekt matcht nicht mehr Zielobjekt ist unter dem Schwellwert Anderes Zielobjekt matcht besser Zielobjekt matcht gleich mehrere Objekte Verarbeitung Blockieren (mit/ohne Timeout) Instruktionen zur Freigabe 15

16 Aufräumarbeiten Fast-Rematch Sofortige Übersicht - bei Abruf Ähnlich zur Partitionierung Relevant für die System-Betreiber Oberfläche Full-Rematch Am Wochenende Jeder mit Jedem zeitaufwändig Relevant für die Service-Theken Mit aktuellem Zustand Oberfläche 16

17 FAZIT Jetzt sind wir fertig!

18 Fazit Sollte vermieden werden wo möglich Ist eine Never ending story" Zeitaufwändig Sowohl die Implementierung Als auch der Betrieb (Tagesgeschäft) ABER es zahlt sich aus 18

19 Fazit Matching ist nicht kompliziert Verschafft bessere Kundensicht Sollte präventiv eingesetzt werden Sichert das wichtigste für ein IdM-System Datenkonsistenz Datenvollständigkeit Man lernt seine Daten kennen (und lieben) 19

20 KONTAKT Tel: / IRL: Raum 1.020, RRZE, Martensstr. 1, Erlangen Ablösung eines IdM-Systems F. Tröger

21 REGIONALES RECHENZENTRUM ERLANGEN [RRZE] Vielen Dank für Ihre Aufmerksamkeit! Regionales RechenZentrum Erlangen [RRZE] Martensstraße 1, Erlangen Krasimir Zhelev

ZKI Arbeitskreis Verzeichnisdienste. Frühjahr März 2016 an der Philipps-Universität Marburg

ZKI Arbeitskreis Verzeichnisdienste. Frühjahr März 2016 an der Philipps-Universität Marburg ZKI Arbeitskreis Verzeichnisdienste Frühjahr 2016 14. - 15. März 2016 an der Philipps-Universität Marburg Eröffnung, Organisatorisches Unser letztes Treffen 01./02.10.2015 in Heidelberg Cloud Computing

Mehr

REGIONALES RECHENZENTRUM ERLANGEN [ RRZE] Datenbanken. RRZE-Campustreffen, Stefan Roas / Ali Güclü Ercin, RRZE

REGIONALES RECHENZENTRUM ERLANGEN [ RRZE] Datenbanken. RRZE-Campustreffen, Stefan Roas / Ali Güclü Ercin, RRZE REGIONALES RECHENZENTRUM ERLANGEN [ RRZE] Datenbanken RRZE-Campustreffen, 04.02.2016 Stefan Roas / Ali Güclü Ercin, RRZE 0 Agenda Gegenwärtiger Stand der IdM-Anbindung der Datenbanken Typen von Datenbank-Kennungen

Mehr

CALYPSO ein Python-Skript zum generischen Datenabgleich

CALYPSO ein Python-Skript zum generischen Datenabgleich CALYPSO ein Python-Skript zum generischen Datenabgleich Manuel Haim, HRZ Uni Marburg ZKI-Arbeitskreis Verzeichnisdienste 12.08.2016 in Ulm Datenabgleich per Skript, das heißt... Programmiersprache wählen

Mehr

REGIONALES RECHENZENTRUM ERLANGEN [ RRZE ] Datenbanken. RRZE-Campustreffen, Silvana Reinert und Ali Güclü Ercin, RRZE

REGIONALES RECHENZENTRUM ERLANGEN [ RRZE ] Datenbanken. RRZE-Campustreffen, Silvana Reinert und Ali Güclü Ercin, RRZE REGIONALES RECHENZENTRUM ERLANGEN [ RRZE ] Datenbanken RRZE-Campustreffen, 22.01.2015 Silvana Reinert und Ali Güclü Ercin, RRZE Agenda 1. Datenbank-Dienstleistungen des RRZE Überblick über die aktuell

Mehr

NHibernate vs. Entity Framework

NHibernate vs. Entity Framework Manfred Steyer CAMPUS 02 softwarearchitekt.at NHibernate vs. Entity Framework Ziele NHibernate und Entity Framework sowie deren Unterschiede kennen lernen 1 Agenda Kriterien Beispiel mit EF Beispiel mit

Mehr

Fehlertoleranz und Robustheit von ETL-Prozessen Wie gestalten wir Abläufe möglichst widerstandsfähig. Christian Borghardt I BI Consultant

Fehlertoleranz und Robustheit von ETL-Prozessen Wie gestalten wir Abläufe möglichst widerstandsfähig. Christian Borghardt I BI Consultant Fehlertoleranz und Robustheit von ETL-Prozessen Wie gestalten wir Abläufe möglichst widerstandsfähig Christian Borghardt I BI Consultant Über uns areto consulting gmbh Echter Business Intelligence Spezialist

Mehr

Fehlerbehandlung mittels DML Error Logging

Fehlerbehandlung mittels DML Error Logging Fehlerbehandlung mittels DML Error Logging Andreas Buckenhofer Daimler TSS GmbH Ulm Schlüsselworte DML Error Logging, DBMS_ERRLOG, LOGGING / NOLOGGING, Direct Path Einleitung Eine satzbasierte Verarbeitung

Mehr

Der Antrag auf Kundenkennung aus der Sicht von RRZE-Kontaktpersonen

Der Antrag auf Kundenkennung aus der Sicht von RRZE-Kontaktpersonen REGIONALES RECHENZENTRUM ERLANGEN [ RRZE ] Der Antrag auf Kundenkennung aus der Sicht von RRZE-Kontaktpersonen RRZE-Campustreffen, 11.12.2014 Hendrik Eggers, RRZE Agenda Das Identity Management System

Mehr

Data Mining auf Datenströmen Andreas M. Weiner

Data Mining auf Datenströmen Andreas M. Weiner Technische Universität Kaiserslautern Fachbereich Informatik Lehrgebiet Datenverwaltungssysteme Integriertes Seminar Datenbanken und Informationssysteme Sommersemester 2005 Thema: Data Streams Andreas

Mehr

3rd IQ Best Practice Day 2007

3rd IQ Best Practice Day 2007 1 3rd IQ Best Practice Day 2007 Klaus Koch, Torsten Kaup, Felix Michels, Daniel Elsner, Bernhard Kurpicz, Dirk Malzahn Schema Matching Automatische Erkennung semantisch gleicher Attribute Frankfurt am

Mehr

Das Web-Frontend WAID. und andere Entwicklungen im Rahmen des Erlanger IdM-Projekts (IDMone)

Das Web-Frontend WAID. und andere Entwicklungen im Rahmen des Erlanger IdM-Projekts (IDMone) Das Web-Frontend WAID und andere Entwicklungen im Rahmen des Erlanger IdM-Projekts (IDMone) WAID & CO Web-Frontend WAID Web Administration for IDentity management und andere Entwicklungen Matching Personen

Mehr

Einsatz der Plugins Workflow, Kontakte und UnivIS

Einsatz der Plugins Workflow, Kontakte und UnivIS REGIONALES RECHENZENTRUM ERLANGEN [RRZE] Einsatz der Plugins Workflow, Kontakte und UnivIS RRZE-Campustreffen, 18.05.2017 Karin Kimpan, Astrid Semm, Wolfgang Wiese, RRZE MEHRSPRACHIGE WEBSITES Verknüpfung

Mehr

FACHHOCHSCHULE MANNHEIM

FACHHOCHSCHULE MANNHEIM Objektorientierte Programmierung 3. Vorlesung Prof. Dr. Peter Knauber FACHHOCHSCHULE MANNHEIM Hochschule für Technik und Gestaltung Wiederholung: Begriffsübersicht Strukturierte vs. objektorientierte Programmierung

Mehr

Metadatenmanagement Die ETH-Bibliothek beschreitet neue Wege

Metadatenmanagement Die ETH-Bibliothek beschreitet neue Wege Metadatenmanagement Die ETH-Bibliothek beschreitet neue Wege Judith Bissegger & Barbara Wittwer, ETH-Bibliothek Zürich Kongress BIS Luzern, 1. September 2016 Judith Bissegger & Barbara Wittwer, ETH-Bibliothek

Mehr

Web Single Sign-On (WebSSO)

Web Single Sign-On (WebSSO) REGIONALES RECHENZENTRUM ERLANGEN [ RRZE] Web Single Sign-On (WebSSO) RRZE-Campustreffen, 28.04.2016 Frank Tröger, RRZE Agenda 1. Einführung Was ist WebSSO? 2. Historie Wie hat sich das WebSSO an der FAU

Mehr

Produktinformation DaVinci Developer

Produktinformation DaVinci Developer Produktinformation DaVinci Developer Inhaltsverzeichnis 1 DaVinci Developer - Entwurf von AUTOSAR Softwarekomponenten... 3 1.1 Die Vorteile von DaVinci Developer im Überblick... 3 1.2 Anwendungsgebiete...

Mehr

Entscheidungsbäume. Minh-Khanh Do Erlangen,

Entscheidungsbäume. Minh-Khanh Do Erlangen, Entscheidungsbäume Minh-Khanh Do Erlangen, 11.07.2013 Übersicht Allgemeines Konzept Konstruktion Attributwahl Probleme Random forest E-Mail Filter Erlangen, 11.07.2013 Minh-Khanh Do Entscheidungsbäume

Mehr

FAUbox Neues vom Sync & Share-Dienst der FAU

FAUbox Neues vom Sync & Share-Dienst der FAU REGIONALES RECHENZENTRUM ERLANGEN [RRZE] FAUbox Neues vom Sync & Share-Dienst der FAU RRZE-Campustreffen, 01.06.2017 Dr. P. Rygus, RRZE Agenda Statistiken Änderungen seit letztem Jahr Bekannte Fehler Roadmap

Mehr

Viel aus wenig: Enterprise-DWH mit Basic ETL

Viel aus wenig: Enterprise-DWH mit Basic ETL Viel aus wenig: Enterprise-DWH mit Basic ETL Jörg Menker Leiter Competence-Center DWH-Architektur & Frontends Nürnberg, 28.10.2011 MT AG Agenda Warehouse Builder Feature Groups Enterprise-DWH mit Basic

Mehr

Syntax. Ausgabe *Ü12. *1. corr it25 with alter li_re kontakt.

Syntax. Ausgabe *Ü12. *1. corr it25 with alter li_re kontakt. Syntax *Ü2. *. corr it25 with alter li_re kontakt. *2. regression var=it25 alter li_re kontakt/statistics /dependent=it25 /enter. regression var=it25 li_re kontakt/statistics /dependent=it25 /enter. *3.

Mehr

Declarative Data Cleaning

Declarative Data Cleaning Declarative Data Cleaning Vortragsgrundlage: Helena Galhardas, Daniela Florescu, Dennis Shasha, Eric Simon, Cristian Augustin Saita: Declarative Data Cleaning: Language, Model, and Algorithms, in VLDB

Mehr

Softwareentwicklungspraktikum Sommersemester 2007. Feinentwurf

Softwareentwicklungspraktikum Sommersemester 2007. Feinentwurf Softwareentwicklungspraktikum Sommersemester 2007 Feinentwurf Auftraggeber Technische Universität Braunschweig

Mehr

REGIONALES RECHENZENTRUM ERLANGEN [ RRZE] Datenbanken. RRZE-Campustreffen, 11.06.2015 Stefan Roas und Ali Güclü Ercin, RRZE

REGIONALES RECHENZENTRUM ERLANGEN [ RRZE] Datenbanken. RRZE-Campustreffen, 11.06.2015 Stefan Roas und Ali Güclü Ercin, RRZE REGIONALES RECHENZENTRUM ERLANGEN [ RRZE] Datenbanken RRZE-Campustreffen, 11.06.2015 Stefan Roas und Ali Güclü Ercin, RRZE Agenda 1. Datenbankdienstleistungen des RRZE Überblick über die aktuell vorhandenen

Mehr

Nutzung maschinellen Lernens zur Extraktion von Paragraphen aus PDF-Dokumenten

Nutzung maschinellen Lernens zur Extraktion von Paragraphen aus PDF-Dokumenten Nutzung maschinellen Lernens zur Extraktion von Paragraphen aus PDF-Dokumenten Albert-Ludwigs-Universität zu Freiburg 13.09.2016 Maximilian Dippel max.dippel@tf.uni-freiburg.de Überblick I Einführung Problemstellung

Mehr

<Insert Picture Here> Data Migration als Kernprozess bei der Implementierung der E-Business Suite

<Insert Picture Here> Data Migration als Kernprozess bei der Implementierung der E-Business Suite Data Migration als Kernprozess bei der Implementierung der E-Business Suite F.Espeter Oracle Consulting Deutschland Inhalt Überblick über den Datamigrationsprozess in der Oracle Implementierungsmethode

Mehr

Development of geo-data analysis methods - from data enrichment to. communication

Development of geo-data analysis methods - from data enrichment to. communication Development of geo-data analysis methods - from data enrichment to advanced visualization and communication Mathias Jahnke Arbeitsgruppe Automation in Kartographie, Photogrammetrie und GIS 27.09.2010 Dresden

Mehr

Thunderbird-Plugin zur Erkennung anhangverdächtiger s

Thunderbird-Plugin zur Erkennung anhangverdächtiger  s Masterarbeit Vortrag 27.11.2008 Thunderbird-Plugin zur Erkennung anhangverdächtiger E-Mails Marco Ghiglieri Prof. Dr. Johannes Fürnkranz 18.12.08 Knowledge Engineering Masterarbeit Marco Ghiglieri 1 Agenda

Mehr

Aufbau und Bestandteile von Formularen. Oracle Forms. Erstellen eines neuen Blocks (1) Starten von Oracle Forms

Aufbau und Bestandteile von Formularen. Oracle Forms. Erstellen eines neuen Blocks (1) Starten von Oracle Forms Oracle Forms Oracle Forms ist eine Applikation für den Entwurf und die Erstellung Forms-basierender Anwendungen. Diese Forms umfassen Dateneingabe-Formulare Datenabfrage-Formulare Browser-Formulare Oracle

Mehr

Inhaltsverzeichnis. vii.

Inhaltsverzeichnis. vii. vii 1 Einführung in Data-Warehouse-Systeme 1 1.1 Anwendungsszenario Getränkemarkt 2 1.2 OLTP versus OLAP 4 1.2.1 OLAP-versus OLTP-Transaktionen 5 1.2.2 Vergleich von OLTP und OLAP 6 1.2.3 Abgrenzung: DBMS-Techniken

Mehr

Veranstaltung Pr.-Nr.: Datenmodellierung. Veronika Waue WS 07/08. Phasenschema der Datenbankentwicklung (grob) Informationsanalyse

Veranstaltung Pr.-Nr.: Datenmodellierung. Veronika Waue WS 07/08. Phasenschema der Datenbankentwicklung (grob) Informationsanalyse Veranstaltung Pr.-Nr.: 101023 Datenmodellierung Veronika Waue WS 07/08 Phasenschema der Datenbankentwicklung (grob) Informationsanalyse Konzeptualisierung und Visualisierung (z.b. mittels ERD) (Normalisiertes)

Mehr

Datenbankendienstleistungen und Tools

Datenbankendienstleistungen und Tools REGIONALES RECHENZENTRUM ERLANGEN [RRZE] Datenbankendienstleistungen und Tools RRZE-Campustreffen, 10.07.2014 Abteilung Datenbanken und Verfahren Agenda Wer sind wir? Welche Datenbanksysteme bieten wir

Mehr

konzeptionelles DB-Design

konzeptionelles DB-Design konzeptionelles DB-Design was ist das? Systemunabhängige Darstellung des Datenmodells Was ist bei allen möglichen Datenbanksystemen gleich --> Systemtheorie Informationen über Objekte (Dinge) mit Attributen

Mehr

Relaunch IdM-Portal der FAU mit dem neuen FAU-Adressbuch

Relaunch IdM-Portal der FAU mit dem neuen FAU-Adressbuch REGIONALES RECHENZENTRUM ERLANGEN [RRZE] Relaunch IdM-Portal der FAU mit dem neuen FAU-Adressbuch RRZE-Campustreffen, 09.07.2015 Frank Tröger, RRZE Agenda Identity Management der FAU Aktuelle Zahlen Relaunch

Mehr

Der Weg zur Europäischen Patient Summary

Der Weg zur Europäischen Patient Summary Der Weg zur Europäischen Patient Summary Kathrin Morawetz Isabella Weber ehealth Summit Austria Wien, 24.05.2013 Hintergrund Erhöhte Mobilität Wahlfreiheit bei Versorgung Spezialisierung der Dienstleister

Mehr

MapReduce. Jens Dörre. Universität Passau Projekt MAPREDUCEFOUNDATION. Funktionale Programmierung

MapReduce. Jens Dörre. Universität Passau Projekt MAPREDUCEFOUNDATION. Funktionale Programmierung MapReduce Jens Dörre Universität Passau Projekt MAPREDUCEFOUNDATION Funktionale Programmierung Jens Dörre (Uni Passau) MapReduce Funktionale Programmierung 1 / 25 Gliederung 1 MapReduce allgemein 2 MapReduce

Mehr

OpenFlow-Überblick zum Stand der Technik

OpenFlow-Überblick zum Stand der Technik REGIONALES RECHENZENTRUM ERLANGEN [RRZE] OpenFlow-Überblick zum Stand der Technik Bülent Arslan 60. DFN-Betriebstagung, Berlin, 11. März 2014 Gliederung Einführung Technik Traditionelle Technik OpenFlow

Mehr

DPM_flowcharts.doc Page F-1 of 9 Rüdiger Siol :28

DPM_flowcharts.doc Page F-1 of 9 Rüdiger Siol :28 Contents F TOOLS TO SUPPORT THE DOCUMENTATION... F-2 F.1 GRAPHIC SYMBOLS AND THEIR APPLICATION (DIN 66 001)... F-2 F.1.1 Flow of control... F-3 F.1.2 Terminators and connectors... F-4 F.1.3 Lines, arrows

Mehr

Benutzer- und Referenzhandbuch

Benutzer- und Referenzhandbuch Benutzer- und Referenzhandbuch MobileTogether Client User & Reference Manual All rights reserved. No parts of this work may be reproduced in any form or by any means - graphic, electronic, or mechanical,

Mehr

SQL Developer Unit Tests

SQL Developer Unit Tests Perry Pakull Principal Consultant Trivadis AG BASEL BERN BRUGG LAUSANNE ZÜRICH DÜSSELDORF FRANKFURT A.M. FREIBURG I.BR. HAMBURG MÜNCHEN STUTTGART WIEN 1 @PerryPakull Principal Consultant Trivadis AG in

Mehr

Reguläre Ausdrücke. Felix Döring, Felix Wittwer 14. November Python-Kurs

Reguläre Ausdrücke. Felix Döring, Felix Wittwer 14. November Python-Kurs Reguläre Ausdrücke Felix Döring, Felix Wittwer 14. November 2016 Python-Kurs Gliederung 1. Grundlagen 2. Matching Regeln Sonderzeichen Zusammengesetzte Regex Spezielle Sequenzen 3. Methoden 4. reqular

Mehr

Tuning the Mobile Server

Tuning the Mobile Server DOAG Konferenz 20. - 22.11.2012 Tuning the Mobile Server Philipp Loer ppl@ordix.de www.ordix.de Agenda Einleitung Grundlagen Performance-Optimierung Fazit Tuning the Mobile Server, Philipp Loer, DOAG 2012

Mehr

H Mcast Future Internet made in Hamburg?

H Mcast Future Internet made in Hamburg? H Mcast Future Internet made in Hamburg? Thomas Schmidt (HAW Hamburg) schmidt@informatik.haw-hamburg.de Forschungsschwerpunkt: IMS Interagierende Multimediale Systeme 1 Prof. Dr. Thomas Schmidt http://www.haw-hamburg.de/inet

Mehr

Digitales Controlling die Zukunft ist Heute. Markus Zorn & Miriam Hirs 26. September 2017

Digitales Controlling die Zukunft ist Heute. Markus Zorn & Miriam Hirs 26. September 2017 Digitales Controlling die Zukunft ist Heute Markus Zorn & Miriam Hirs 26. September 2017 Agenda Digitales Controlling: Fiktion oder Realität Der Weg ins digitale Controlling Kompetenzanforderungen der

Mehr

Werkzeuge für Datenbank Handwerker: IBM Data Studio und IBM Optim QWT

Werkzeuge für Datenbank Handwerker: IBM Data Studio und IBM Optim QWT Werkzeuge für Datenbank Handwerker: IBM Data Studio und IBM Optim QWT Neue Technologien effizient nutzen Ehningen, 3. Juli 2014 Rodney Krick rk@aformatik.de aformatik Training & Consulting GmbH & Co. KG

Mehr

ZENTRALER INFORMATIKDIENST DER JOHANNES KEPLER UNIVERSITÄT LINZ Abteilung Kundendienste und Dezentrale Systeme. PPP für Windows 3.

ZENTRALER INFORMATIKDIENST DER JOHANNES KEPLER UNIVERSITÄT LINZ Abteilung Kundendienste und Dezentrale Systeme. PPP für Windows 3. ZENTRALER INFORMATIKDIENST DER JOHANNES KEPLER UNIVERSITÄT LINZ Abteilung Kundendienste und Dezentrale Systeme URL dieser Anleitung: http://software.edvz.uni-linz.ac.at/kundend/win3x.html PPP für Windows

Mehr

Wissensentdeckung in Datenbanken

Wissensentdeckung in Datenbanken Wissensentdeckung in Datenbanken SQL, Häufige Mengen Nico Piatkowski und Uwe Ligges 11.05.2017 1 von 16 Überblick Was bisher geschah... Modellklassen Verlustfunktionen Numerische Optimierung Regularisierung

Mehr

Hibernate und Elasticsearch Von 0 auf 100 in 40 Minuten

Hibernate und Elasticsearch Von 0 auf 100 in 40 Minuten 1 Hibernate und Elasticsearch Von 0 auf 100 in 40 Minuten Gunnar Morling, Red Hat 2 Gunnar Morling Opensource-Softwareentwickler bei Red Hat Div. Hibernate-Projekte Spec Lead für Bean Validation 2.0 Andere

Mehr

OpenOffice - Base G. Laner 1

OpenOffice - Base G. Laner 1 OpenOffice - Base G. Laner 1 BASE - OpenOffice Erstellen einer Datenbank Einteilung einer Datenbank in TABELLEN, die FELDER enthalten, die einem bestimmten DATENTYP zugeordnet sind. Die einzelnen Datensätze

Mehr

Westfalia Bedienungsanleitung. Nr

Westfalia Bedienungsanleitung. Nr Westfalia Bedienungsanleitung Nr. 108610 Bedienungsanleitung Edelstahl Sicherheits-Brennbehälter Artikel Nr. 10 99 83 Sicherheitshinweise Der Sicherheits-Brennbehälter ist zur Verwendung in dem Westfalia

Mehr

Domain-independent. independent Duplicate Detection. Vortrag von Marko Pilop & Jens Kleine. SE Data Cleansing

Domain-independent. independent Duplicate Detection. Vortrag von Marko Pilop & Jens Kleine. SE Data Cleansing SE Data Cleansing Domain-independent independent Duplicate Detection Vortrag von Marko Pilop & Jens Kleine http://www.informatik.hu-berlin.de/~pilop/didd.pdf {pilop jkleine}@informatik.hu-berlin.de 1.0

Mehr

On a Sunday Morning summary

On a Sunday Morning summary On a Sunday Morning summary Connect the English sentences and their German translation Verbinde die englischen Sätze mit ihrer deutschen Übersetzung The hedgehog was standing at the door of his house He

Mehr

Datenversionierung in Business-Anwendungen

Datenversionierung in Business-Anwendungen Datenversionierung in Business-Anwendungen Java-Forum Stuttgart Juli 2015 Dr. Karl-Heinz Wichert Arturas Gusevas Typische Anforderungen Auditing: Wer hat wann was geändert? Historie: Frühere Zustände der

Mehr

Inhaltsverzeichnis. Vorwort Kapitel 1 Einleitung... 15

Inhaltsverzeichnis. Vorwort Kapitel 1 Einleitung... 15 Vorwort..................................................... 13 Kapitel 1 Einleitung.......................................... 15 Kapitel 2 SQL der Standard relationaler Datenbanken... 19 2.1 Die Geschichte................................

Mehr

Mai 2010 GIS PORTAL. ProtocolManager 2.0. Programmieranleitung

Mai 2010 GIS PORTAL. ProtocolManager 2.0. Programmieranleitung Mai 2010 GIS PORTAL ProtocolManager 2.0 Programmieranleitung AED-SICAD Aktiengesellschaft Postfach 83 07 54 81707 München www.aed-sicad.de Ihre Anregungen Wir nehmen gerne Ihre Rückmeldungen und Anregungen

Mehr

Schönen guten Tag und herzlichen Dank für die Einladung. Zu Beginn: Was sind Ihre Erwartungen an uns und diesen Vortrag?

Schönen guten Tag und herzlichen Dank für die Einladung. Zu Beginn: Was sind Ihre Erwartungen an uns und diesen Vortrag? Schönen guten Tag und herzlichen Dank für die Einladung. Zu Beginn: Was sind Ihre Erwartungen an uns und diesen Vortrag? Ziel: Wir wollen ein ernstes Thema etwas unterhaltsam angehen. IT / EDV Bermuda

Mehr

Übung PL/SQL Trigger Lösungen

Übung PL/SQL Trigger Lösungen Übung PL/SQL Trigger Lösungen 1) Gebe das aktuelle Datum aus. Wofür steht dual? Ändere das Datum für Deine aktuelle Session auf das Format Jahr (4 Stellen) Monat (2 Stellen) Tag (2 Stellen)[Leerzeichen]Stunde

Mehr

Künstliche Neuronale Netze

Künstliche Neuronale Netze Fakultät Informatik, Institut für Technische Informatik, Professur für VLSI-Entwurfssysteme, Diagnostik und Architektur Künstliche Neuronale Netze Hauptseminar Martin Knöfel Dresden, 16.11.2017 Gliederung

Mehr

8. Mai Humboldt-Universität zu Berlin. LingPipe. Mark Kibanov und Maik Lange. Index. Allgemeine Infos. Features

8. Mai Humboldt-Universität zu Berlin. LingPipe. Mark Kibanov und Maik Lange. Index. Allgemeine Infos. Features Humboldt-Universität zu Berlin 8. Mai 2008 1 2 logistic regression 3 Benutzer 4 Fazit 5 Quellen Was ist? is a suite of Java libraries for the linguistic analysis of human. Was ist? is a suite of Java libraries

Mehr

1.3 Charakteristische Eigenschaften von objektorientierten Systemen

1.3 Charakteristische Eigenschaften von objektorientierten Systemen 1.3 Charakteristische Eigenschaften von objektorientierten Systemen Einkapselung (Encapsulation) Geheimhaltungsprinzip (Information / Implementation hiding) Persistenz (State retention) Objektidentität

Mehr

Inhaltsverzeichnis. Vorwort 13. Kapitel 1 Einleitung 15

Inhaltsverzeichnis. Vorwort 13. Kapitel 1 Einleitung 15 Vorwort 13 Kapitel 1 Einleitung 15 Kapitel 2 SQL-der Standard relationaler Datenbanken... 19 2.1 Die Geschichte 19 2.2 Die Bestandteile 20 2.3 Die Verarbeitung einer SQL-Anweisung 22 2.4 Die Struktur von

Mehr

Datenbanken Unit 9: OLAP, OLTP und objektrelationale Datenbanken

Datenbanken Unit 9: OLAP, OLTP und objektrelationale Datenbanken Datenbanken Unit 9: OLAP, OLTP und objektrelationale Datenbanken 31. V. 2016 Outline 1 Organisatorisches 2 SQL 3 OLTP, OLAP, SAP, and Data Warehouse OLTP and OLAP SAP 4 Objekt-relationale Datenbanken Beispiel

Mehr

Datenbanken Grundlagen und Design

Datenbanken Grundlagen und Design Frank Geisler Datenbanken Grundlagen und Design 3., aktualisierte und erweiterte Auflage mitp Vorwort 15 Teil I Grundlagen 19 i Einführung in das Thema Datenbanken 21 i.i Warum ist Datenbankdesign wichtig?

Mehr

Christoph Broschinski, <broschinski@uni bielefeld.de>

Christoph Broschinski, <broschinski@uni bielefeld.de> Normalisierung von Lizenzinformationen in OAI Metadaten: Ein Beitrag zur Verbesserung der Open Access Statusanzeige in wissenschaftlichen Suchmaschinen Christoph Broschinski,

Mehr

NoSQL Datenbanken EIN ÜBERBLICK ÜBER NICHT-RELATIONALE DATENBANKEN UND DEREN POTENTIALE IM ALLGEMEINEN UND IN DER INDUSTRIE

NoSQL Datenbanken EIN ÜBERBLICK ÜBER NICHT-RELATIONALE DATENBANKEN UND DEREN POTENTIALE IM ALLGEMEINEN UND IN DER INDUSTRIE NoSQL Datenbanken EIN ÜBERBLICK ÜBER NICHT-RELATIONALE DATENBANKEN UND DEREN POTENTIALE IM ALLGEMEINEN UND IN DER INDUSTRIE Was bedeutet NoSQL? Ein Sammelbegriff für alternative Datenbanklösungen, die

Mehr

Global Staging Area - Implementierung einer zentralen Datendrehscheibe

Global Staging Area - Implementierung einer zentralen Datendrehscheibe Global Staging Area - Implementierung einer zentralen Datendrehscheibe Sven Bosinger its-people 1 1 Vorstellung Mythen Partitionierung Anwendungsfall Ansätze Umbau Ergebnisse Sven Bosinger Solution Architect

Mehr

Vollständig generisches DWH für kleine und mittelständische Unternehmen

Vollständig generisches DWH für kleine und mittelständische Unternehmen Vollständig generisches DWH für kleine und mittelständische Unternehmen Marc Werner Freiberufler Berlin Schlüsselworte: Wirtschaftlichkeit, Kostenreduzierung, Metadaten, Core Data Warehouse, Slowly Changing

Mehr

CoBox - Mehrsprachige Apex-Anwendung zur Mitarbeiterkommunikation. Alexander Elsas Goethe-Universität Frankfurt

CoBox - Mehrsprachige Apex-Anwendung zur Mitarbeiterkommunikation. Alexander Elsas Goethe-Universität Frankfurt CoBox - Mehrsprachige Apex-Anwendung zur Mitarbeiterkommunikation Alexander Elsas Goethe-Universität Frankfurt CoBox Im Rahmen von sog. Code-of-Conduct-Vereinbarungen verpflichten sich Unternehmen zu einer

Mehr

GERICHTETER GEWICHTETER GRAPH DESIGNDOKUMENT

GERICHTETER GEWICHTETER GRAPH DESIGNDOKUMENT User Requirements GERICHTETER GEWICHTETER GRAPH DESIGNDOKUMENT Softwareentwicklung Praktikum, Übungsbeispiel 1 Gruppe 18 Andreas Hechenblaickner [0430217] Daniela Kejzar [0310129] Andreas Maller [0431289]

Mehr

Data Cubes PG Wissensmangement Seminarphase

Data Cubes PG Wissensmangement Seminarphase PG 402 - Wissensmangement Seminarphase 23.10.2001-25.10.2001 Hanna Köpcke Lehrstuhl für Künstliche Intelligenz Universität Dortmund Übersicht 1. Einführung 2. Aggregation in SQL, GROUP BY 3. Probleme mit

Mehr

Statistics, Data Analysis, and Simulation SS 2015

Statistics, Data Analysis, and Simulation SS 2015 Mainz, June 11, 2015 Statistics, Data Analysis, and Simulation SS 2015 08.128.730 Statistik, Datenanalyse und Simulation Dr. Michael O. Distler Dr. Michael O. Distler

Mehr

Generelle Planung Generische Entwicklung Planungen (Ausblick 2017/2018)

Generelle Planung Generische Entwicklung Planungen (Ausblick 2017/2018) Generelle Planung Generische Entwicklung Planungen (Ausblick 2017/2018) Vorsicht! Auf Italienisch! Wer sich verloren fühlt, HIER lesen! Generelle Planung Generische Entwicklung Planungen (Ausblick 2017/2018)

Mehr

Ein Ansatz zum modellgetriebenen Integrationstest von EJB-basierten Informationssystemen

Ein Ansatz zum modellgetriebenen Integrationstest von EJB-basierten Informationssystemen 1 / 30 Ein Ansatz zum modellgetriebenen Integrationstest von EJB-basierten Informationssystemen Zwischenvortrag zur Diplomarbeit Steffen Conrad (235183) Research Group Software Construction RWTH Aachen

Mehr

eps Network Services HMI-Alarme

eps Network Services HMI-Alarme 09/2005 HMI-Alarme eps Network Services HMI-Alarme Diagnoseanleitung Gültig für: Software Softwarestand eps Network Services 4.1 eps Network Services, Diagnoseanleitung (DA) - Ausgabe 09/2005 1 HMI-Alarme

Mehr

Analyse und praktischer Vergleich von neuen Access- Layer-Technologien in modernen Webanwendungen unter Java. Oliver Kalz

Analyse und praktischer Vergleich von neuen Access- Layer-Technologien in modernen Webanwendungen unter Java. Oliver Kalz Analyse und praktischer Vergleich von neuen Access- Layer-Technologien in modernen Webanwendungen unter Java Oliver Kalz Agenda Grundlagen Objektpersistenz Objektrelationales Mapping Performance Fazit

Mehr

file:///c:/users/wpzsco/appdata/local/temp/tmp373d.tmp.htm

file:///c:/users/wpzsco/appdata/local/temp/tmp373d.tmp.htm Seite 1 von 5 Besucherinformation und -lenkung: Typ 09 Wegweiser Typenbeschreibungen File Geodatabase Table Thumbnail Not Available Tags Infrastruktur, Besucherinformation, Besucherlenkung, Schild, Standort,

Mehr

OR-Mapping. WS2008/2009 DBIS/Dr. Karsten Tolle

OR-Mapping. WS2008/2009 DBIS/Dr. Karsten Tolle OR-Mapping Zwei Paradigmen treffen aufeinander Gegensätze OO vs. Relational: Stichwort: O/R Impedance Mismatch Person Tabellen mit Schlüssel und Fremdschlusselbeziehungen. Abt-Nr. beschäftigt Pk-Nr Name

Mehr

Studiengang Informatik der FH Gießen-Friedberg. Sequenz-Alignment. Jan Schäfer. WS 2006/07 Betreuer: Prof. Dr. Klaus Quibeldey-Cirkel

Studiengang Informatik der FH Gießen-Friedberg. Sequenz-Alignment. Jan Schäfer. WS 2006/07 Betreuer: Prof. Dr. Klaus Quibeldey-Cirkel Studiengang Informatik der FH Gießen-Friedberg Sequenz-Alignment Jan Schäfer WS 2006/07 Betreuer: Prof. Dr. Klaus Quibeldey-Cirkel Überblick Einführung Grundlagen Wann ist das Merkmal der Ähnlichkeit erfüllt?

Mehr

Willkommen zur Vorlesung Komplexitätstheorie

Willkommen zur Vorlesung Komplexitätstheorie Willkommen zur Vorlesung Komplexitätstheorie WS 2011/2012 Friedhelm Meyer auf der Heide V11, 16.1.2012 1 Themen 1. Turingmaschinen Formalisierung der Begriffe berechenbar, entscheidbar, rekursiv aufzählbar

Mehr

Profilbezogene informatische Bildung in den Klassenstufen 9 und 10. Schwerpunktthema Daten und Datenbanken

Profilbezogene informatische Bildung in den Klassenstufen 9 und 10. Schwerpunktthema Daten und Datenbanken Profilbezogene informatische Bildung in den Klassenstufen 9 und 10 Schwerpunktthema Robby Buttke Fachberater für Informatik RSA Chemnitz Fachliche Einordnung Phasen relationaler Modellierung Fachlichkeit

Mehr

Web Data Management Systeme

Web Data Management Systeme Web Data Management Systeme Seminar: Web-Qualitätsmanagement Arne Frenkel Agenda Einführung Suchsysteme Suchmaschinen & Meta-Suchmaschinen W3QS WebSQL WebLog Information Integration Systems Ariadne TSIMMIS

Mehr

Identity Management an den hessischen Hochschulen

Identity Management an den hessischen Hochschulen Identity Management an den hessischen Hochschulen HeBIS Verbundkonferenz 26.9.2017, Frankfurt Dr. Thomas Risse 4. Oktober 2017 1 Wie alles begann Bibliothek E-Mail Benutzer Nachteile Viele Accounts Aufwendige

Mehr

Linked Lists The Role of Locking

Linked Lists The Role of Locking Clara Lüling, Stephan Bittner Linked Lists The Role of Locking Verkettete Liste - Die Rolle des Sperrens Gliederung Linked Lists The Role of Locking 1. Verkettete Listen 2. Algorithmen 1. Coarse-Grained

Mehr

Webmaster-Campustreffen

Webmaster-Campustreffen REGIONALES RECHENZENTRUM ERLANGEN [ RRZE ] Webmaster-Campustreffen 21. Mai 2015 ROLLOUT DES FAU-DESIGNS Rollout neuer Designs - Aktueller Umsetzungsstand und Zeitplanung Umsetzung (bisher) Relaunch www.fau.de

Mehr

From HiL to Test Vehicle:

From HiL to Test Vehicle: From HiL to Test Vehicle: Reuse of test cases with same test automation Agenda: Trailer Presentation Agenda: Movie about Tool Questions After presentation Live Demo Vehicle Meeting point: ETAS Stand 1642

Mehr

Was wird in öfftl. Performanztests wie dem Fingerprint Verification Competition getestet? Uwe Reinbacher

Was wird in öfftl. Performanztests wie dem Fingerprint Verification Competition getestet? Uwe Reinbacher Was wird in öfftl. Performanztests wie dem Fingerprint Verification Competition getestet? Uwe Reinbacher 1 Fingerprint Verification Competition Was ist die FVC? FVC2000 FVC2002 FVC2004 FVC2006 FVC ongoing

Mehr

Duplikaterkennung. Dr. Armin Roth arminroth.de. Dr. Armin Roth (arminroth.de) II Duplikaterkennung / 17

Duplikaterkennung. Dr. Armin Roth arminroth.de. Dr. Armin Roth (arminroth.de) II Duplikaterkennung / 17 Dr. Armin Roth arminroth.de 27.04.2013 Dr. Armin Roth (arminroth.de) II Duplikaterkennung 27.04.2013 1 / 17 Agenda 1 Wiederholung: Datenwertintegration 2 Duplikaterkennung Dr. Armin Roth (arminroth.de)

Mehr

Status IDMone. 20.02.2008 Sitzung BRZL AK MetaDir, Bamberg Dr. Peter Rygus

Status IDMone. 20.02.2008 Sitzung BRZL AK MetaDir, Bamberg Dr. Peter Rygus Status IDMone 20.02.2008 Sitzung BRZL AK MetaDir, Bamberg Dr. Peter Rygus IDMone: Stand der Arbeiten (1) Erstellt wurden Konzepte für DIT-Struktur User Application arbeitet auf einem Replikat des Meta-

Mehr

GPU-friendly multi-view stereo reconstruction using surfel representation and graph cuts

GPU-friendly multi-view stereo reconstruction using surfel representation and graph cuts GPU-friendly multi-view stereo reconstruction using surfel representation and graph cuts Rico Jonschkowski Seminar 3D Rekonstruktion SoSe 2011 Verantstalter: Prof. Raúl Rojas, Fabian Wiesel FU Berlin,

Mehr

Fehlertolerante Ladeprozesse gegen schlaflose Nächte

Fehlertolerante Ladeprozesse gegen schlaflose Nächte Fehlertolerante Ladeprozesse gegen schlaflose Nächte Dani Schnider Principal Consultant 19. September 2012 Mitten in der Nacht bricht die ETL-Verarbeitung ab, weil ein falscher oder unvollständiger Datensatz

Mehr

Datenmanagement Übung 5

Datenmanagement Übung 5 Datenmanagement Übung 5 Normalisierung (1.-3. NF) AUFGABE 1 1 Definitionen 1. NF Eine Relation befindet sich in 1. NF, wenn jeder Attributwert atomar ist und alle Nicht-Schlüsselattribute funktional vom

Mehr

Hinweise für die Praxis. Georeferenzierung von Registern und sonstigen Datensätzen nach 14 EGovG und 12 EGovG BW (E-Government-Gesetz)

Hinweise für die Praxis. Georeferenzierung von Registern und sonstigen Datensätzen nach 14 EGovG und 12 EGovG BW (E-Government-Gesetz) Hinweise für die Praxis Georeferenzierung von Registern und sonstigen Datensätzen nach 14 EGovG und 12 EGovG BW (E-Government-Gesetz) Grundsätzliches zur Georeferenzierung Elektronisch geführte Register

Mehr

Zwischenbericht Diplomarbeit Entwicklung einer Laufzeitumgebung für Komponenten mit Ressourcenanforderungen

Zwischenbericht Diplomarbeit Entwicklung einer Laufzeitumgebung für Komponenten mit Ressourcenanforderungen Zwischenbericht Diplomarbeit Entwicklung einer Laufzeitumgebung für Komponenten mit Ressourcenanforderungen Brit Engel Überblick Beschreibung Aufgabenstellung Entwurf der Komponenten Verwaltung Funktionsbereiche

Mehr

Ich benötige eine Lösung für eine Aufgabe Software-Entwicklung im Auftrag

Ich benötige eine Lösung für eine Aufgabe Software-Entwicklung im Auftrag REGIONALES RECHENZENTRUM ERLANGEN [ RRZE ] Ich benötige eine Lösung für eine Aufgabe Software-Entwicklung im Auftrag RRZE-Campustreffen, 04.12.2014 Dr. P. Reiß, H. Eggers, RRZE 1 Agenda Wer sind wir? Vom

Mehr

Kapitel V. V. Ensemble Methods. Einführung Bagging Boosting Cascading

Kapitel V. V. Ensemble Methods. Einführung Bagging Boosting Cascading Kapitel V V. Ensemble Methods Einführung Bagging Boosting Cascading V-1 Ensemble Methods c Lettmann 2005 Einführung Bewertung der Generalisierungsfähigkeit von Klassifikatoren R (c) wahre Missklassifikationsrate

Mehr

Skalierbarkeit von Serversystemen Was tun, damit das technische Korsett mein Business nicht einschnürt?

Skalierbarkeit von Serversystemen Was tun, damit das technische Korsett mein Business nicht einschnürt? Skalierbarkeit von Serversystemen Was tun, damit das technische Korsett mein Business nicht einschnürt? Dipl.-Inform. Thomas Witzenrath 21.01.2014 Tralios IT GmbH www.tralios.de Über mich Dipl.-Inform.

Mehr

SimPDM Datenmodell im Kontext zu Teamcenter und PLMXML

SimPDM Datenmodell im Kontext zu Teamcenter und PLMXML SimPDM Datenmodell im Kontext zu Teamcenter und PLMXML Vergleichsstudie Datentransfer PDM SDM Böblingen, 20. November 2008 Dietmar Gausselmann Zoran Petrovic Ulrich Deisenroth Agenda Einleitung / Motivation

Mehr

PostgreSQL in großen Installationen

PostgreSQL in großen Installationen PostgreSQL in großen Installationen Cybertec Schönig & Schönig GmbH Hans-Jürgen Schönig Wieso PostgreSQL? - Die fortschrittlichste Open Source Database - Lizenzpolitik: wirkliche Freiheit - Stabilität,

Mehr

Algorithmen und Datenstrukturen 1

Algorithmen und Datenstrukturen 1 Algorithmen und Datenstrukturen 1 6. Vorlesung Martin Middendorf / Universität Leipzig Institut für Informatik middendorf@informatik.uni-leipzig.de studla@bioinf.uni-leipzig.de Merge-Sort Anwendbar für

Mehr