Universität Leipzig Institut für Informatik Auffinden von Dubletten in ECommerce Datenbeständen

Save this PDF as:
 WORD  PNG  TXT  JPG

Größe: px
Ab Seite anzeigen:

Download "Universität Leipzig Institut für Informatik Auffinden von Dubletten in ECommerce Datenbeständen"

Transkript

1 Universität Leipzig Institut für Informatik Auffinden von Dubletten in ECommerce Datenbeständen Hanna Köpcke AG 3: Objekt Matching

2 Agenda Problemstellung FEVER-System - Manuell definierte Match-Strategien - Trainingsbasierte Match-Strategien - Evaluierung Anwendungsszenarien Zusammenfassung

3 Erkennung von Dubletten (Objekt-Matching) Identifikation semantisch äquivalenter Objekte - z.b. zur Eliminierung, Fusion oder zum Datenvergleich - kritischer Schritt für hohe Datenqualität derzeit v.a. für strukturierte (relationale) Daten Quelle1: Kontakt KID Name Strasse Stadt Frau 11 Kristen Schmid Hanse Pl 2 Berlin 1 24 Christian Schmied Hanse Str 2 Berlin 0 Quelle2: Kunde Kdnr Nachname Vorname Geschl Adresse Telefon 11 Schmid Chris M Hansestr. 2, Bentwich 493 Schmid Kris L. W Hansa-Platz 2, Berlin

4 Dubletten in Ecommerce Webdaten

5 Herausforderungen Sehr ähnliche Attributwerte (Title, Beschreibung, Preis,..) für ähnliche aber unterschiedliche Produkte Heterogene Repräsentationen für das gleiche Produkt Geringe Datenqualität - Fehlende Angaben - Fehlerhafte Angaben Inakustik Star Lautsprecherkabel Inakustik Star Lautsprecherkabel Star Lautsprecherkabel 2 x 2,5 mm², transparent, Länge 10m Star Lautsprecherkabel 2 x 1,5 mm², transparent, Länge 10m Nikon Blitzgerät SB-900 = NIKON Speedlight SB-900 Leitzahl Blitzausleuchtung Brennweite mm

6 Objekt-Matching-Ansätze Zahlreiche Forschungsansätze und -prototypen sowie kommerzielle Lösungen Zumeist Nutzung von Ähnlichkeiten von Attributwerten - z.b. gemäß String-Ähnlichkeitsmaßen Probleme - Effektive Kombination mehrerer Match-Verfahren - Hoher Tuning-Aufwand für Konfigurierung (z.b. Auswahl relevanter Attribute, Ähnlichkeitsschwellwerte, Gewichtung einzelner Verfahren) - Laufzeit für große Datenmengen

7 FEVER Framework FEVER = Framework for EValuating Entity Resolution - System zur Definition, Konfigurierung und Evaluierung von Objekt-Matching (entity resolution )-Strategien Wesentliche Merkmale: - Flexible Kombination mehrerer Match-Verfahren im Rahmen von Objekt-Matching-Workflows - Semi-automatische Parameter-Konfigurierung, z.b. für Ähnlichkeitsschwellwerte - Unterstützung trainingsbasierter Match-Verfahren zur Reduzierung des manuellen Tuningaufwands - Vergleichende Analyse alternativer Verfahren

8 FEVER Architektur GUI Workflow Definition Optimization Workflow Execution Engine Preprocessing Blocking Matcher Combination Data Services Operator Library

9 Match Workflow Vorverarbeitung Blocking zur Reduzierung des Suchraumes - z.b. durch Clustering, Sorted Neighborhood Attribut-Matcher sowie Kontext-Matcher - zahlreiche Ähnlichkeitsfunktionen und externe Implementierungen Quelle 1 Quelle 2 Preprocess Preprocess Blocking Matcher 1 Matcher 2 Merge

10 Trainingsbasierte Strategien Nutzung von Trainingsdaten um effektive Kombination von Matchern und deren Konfigurierung zu bestimmen (supervised learning) In FEVER unterstützte Lernverfahren: - Entscheidungsbaum, Logistische Regression, SVM - Mehrheits-Lerner Produkttitel Preis Ä<80% Ä 80% Hersteller >50% 50% Ä<60% Ä 60%... +

11 Evaluation 4 Matchaufgaben mit 7 Datenquellen - bibliographisch: DBLP-ACM - E-Commerce: Abt-Buy DBLP-Google Scholar (GS) Amazon - GP bis zu 64,000 Objekte pro Quelle Perfektes Ergebnis bekannt - Manuell bestimmt bzw. über UPCs für Produktdaten Vergleich zwischen - kommerziellem Match-Ansatz mit Parameteroptimierung und trainingsbasierten Ansätzen

12 Tuning des kommerziellen Match-Ansatzes Bibliografisch ECommerce DBLP-ACM DBLP-Scholar Abt-Buy Amazon-GP 1 attribute 2 attributes 2 attributes (tuned)

13 Ergebnisse Matching von Publikationen

14 Ergebnisse Matching von Produkten

15 Anwendungsszenarien Integration und Aufbereitung unternehmensinterner und externer Daten (Webdaten) für weitergehende Analysen, z.b. für - Customer Relationship Management - Kundenbewertung analysieren - Erstellung von Konkurrenzanalysen (Produkt, Preis, Anbieter, Zielgruppen) Preisentwicklung -

16 Zusammenfassung Flexible Kombination mehrerer Match-Verfahren Semi-automatische Parameter-Konfigurierung, auch für externe Matchansätze Unterstützung trainingsbasierter Match-Verfahren zur Reduzierung des manuellen Tuningaufwands Gute Effektivität für bibliografische Probleme - F-Measure > 91% E-Commerce Daten deutlich schwieriger - F-Measure 77-86% Vergleich mit kommerzieller Lösung - Bis zu 15% höhere Performanz (F-Measure)

17 Vielen Dank für Ihre Aufmerksamkeit!

Innovationslabor Semantische Integration von Webdaten

Innovationslabor Semantische Integration von Webdaten Innovationslabor Semantische Integration von Webdaten Workflow-basierte Datenintegration und Objekt-Matching Dr. Andreas Thor http://dbs.uni-leipzig.de/format Workflow-basierte Datenintegration Ausgangspunkt

Mehr

Innovationslabor Semantische Integration von Webdaten

Innovationslabor Semantische Integration von Webdaten Innovationslabor Semantische Integration von Webdaten Prof. Dr. Erhard Rahm http://dbs.uni-leipzig.de/format Programmablauf Überblicksvortrag Prof. Rahm Feedback / Diskussion Vorstellung der Prototypen

Mehr

Suchdienste für Dokumente

Suchdienste für Dokumente Wer aufhört zu werben, um Geld zu sparen, kann ebenso seine Uhr anhalten, um Zeit zu sparen. (Henry Ford, 1863-1947) Suchdienste für Dokumente Vergleich von Ansätzen zur Suche, Navigation und Präsentation

Mehr

Continuous Information Quality Assessment in Stream Based Smart City Frameworks

Continuous Information Quality Assessment in Stream Based Smart City Frameworks Continuous Information Quality Assessment in Stream Based Smart City Frameworks 19. VDE/ITG Fachtagung Mobilkommunikation Osnabrück, 22.05.2014 Thorben Iggena Tel.: +49 541/969-2723 E-Mail: t.iggena@hs-osnabrueck.de

Mehr

Meeting the Challenges of Integrating Large and Diverse Geographic Databases

Meeting the Challenges of Integrating Large and Diverse Geographic Databases Meeting the Challenges of Integrating Large and Diverse Geographic Databases M. Sc. Michael Schäfers schaefers@dbs.uni-hannover.de 04. März 2014 Agenda: 1 Motivation: Räumliche Datenintegration 2 3 Take-Home-Message:

Mehr

Citizen Data Science. Balázs Bárány. 29. April 2016. Linuxwochen Wien 2016

Citizen Data Science. Balázs Bárány. 29. April 2016. Linuxwochen Wien 2016 Citizen Data Science Balázs Bárány Linuxwochen Wien 2016 29. April 2016 Inhalt Einführung: Data Science Werkzeuge und Methoden Citizen Data Science Daten holen Daten verstehen Daten-Vorverarbeitung Prädiktive

Mehr

Sechster ProSTEP Benchmark Teil 2: PDM Data Exchange

Sechster ProSTEP Benchmark Teil 2: PDM Data Exchange Sechster ProSTEP Benchmark Teil 2: PDM Data Exchange Erster Benchmark für den PDM-Datenaustausch im STEP-Format Der Austausch von CAD-Modellen mit Hilfe des neutralen Datenaustauschformats entsprechend

Mehr

Datenintegration für Big Data. Prof. Dr. Erhard Rahm. http://dbs.uni-leipzig.de

Datenintegration für Big Data. Prof. Dr. Erhard Rahm. http://dbs.uni-leipzig.de Datenintegration für Big Data Prof. Dr. Erhard Rahm http://dbs.uni-leipzig.de 1 2 Massives Wachstum an Daten Gartner: pro Tag werden 2.5 Exabytes an Daten generiert 90% aller Daten weltweit wurden in den

Mehr

Integration, Migration und Evolution

Integration, Migration und Evolution 14. Mai 2013 Programm für heute 1 2 Quelle Das Material zu diesem Kapitel stammt aus der Vorlesung Datenintegration & Datenherkunft der Universität Tübingen gehalten von Melanie Herschel im WS 2010/11.

Mehr

Semantische Datenintegration: von der Theorie zur Anwendung

Semantische Datenintegration: von der Theorie zur Anwendung Semantische Datenintegration: von der Theorie zur Anwendung Prof. Dr. Heiner Stuckenschmidt Institut für Enterprise Systems Name und Datum www.uni-mannheim.de Seite 1 Teil I: Grundlagen Das Problem der

Mehr

Datenidentifikation und -synchronisation: Grundlage zur Erfüllung der Qualitätsanforderungen beim Datenaustausch zwischen Systemen

Datenidentifikation und -synchronisation: Grundlage zur Erfüllung der Qualitätsanforderungen beim Datenaustausch zwischen Systemen Datenidentifikation und -synchronisation: Grundlage zur Erfüllung der Qualitätsanforderungen beim Datenaustausch zwischen Systemen Jürg Simonett Luzern, 26. März 2015 Datenaustausch zwischen Systemen Synchronisation

Mehr

Diplomarbeit: GOMMA: Eine Plattform zur flexiblen Verwaltung und Analyse von Ontologie Mappings in der Bio-/Medizininformatik

Diplomarbeit: GOMMA: Eine Plattform zur flexiblen Verwaltung und Analyse von Ontologie Mappings in der Bio-/Medizininformatik Diplomarbeit: GOMMA: Eine Plattform zur flexiblen Verwaltung und Analyse von Ontologie Mappings in der Bio-/Medizininformatik Bearbeiter: Shuangqing He Betreuer: Toralf Kirsten, Michael Hartung Universität

Mehr

Informationsflut bewältigen - Textmining in der Praxis

Informationsflut bewältigen - Textmining in der Praxis Informationsflut bewältigen - Textmining in der Praxis Christiane Theusinger Business Unit Data Mining & CRM Solutions SAS Deutschland Ulrich Reincke Manager Business Data Mining Solutions SAS Deutschland

Mehr

Seminar Informationsintegration und Informationsqualität. Dragan Sunjka. 30. Juni 2006

Seminar Informationsintegration und Informationsqualität. Dragan Sunjka. 30. Juni 2006 Seminar Informationsintegration und Informationsqualität TU Kaiserslautern 30. Juni 2006 Gliederung Autonomie Verteilung führt zu Autonomie... Intra-Organisation: historisch Inter-Organisation: Internet

Mehr

Web Mining und Farming

Web Mining und Farming Web Mining und Farming Shenwei Song Gliederung Übersicht über Web Mining und Farming Web Mining Klassifikation des Web Mining Wissensbasierte Wrapper-Induktion Web Farming Übersicht über Web-Farming-Systeme

Mehr

Insight 2011. Anforderungsanalyse für SOA Services. Dr. Gregor Scheithauer OPITZ CONSULTING München GmbH Björn Hardegen MID GmbH

Insight 2011. Anforderungsanalyse für SOA Services. Dr. Gregor Scheithauer OPITZ CONSULTING München GmbH Björn Hardegen MID GmbH Insight 2011 Anforderungsanalyse für SOA Services bei einer deutsche Behörde Dr. Gregor Scheithauer OPITZ CONSULTING München GmbH Björn Hardegen MID GmbH Nürnberg, 29. November 2011 MID Insight 2011 Seite

Mehr

Evaluation von Open-Source-Software für System Dynamics hinsichtlich deren Integrierbarkeit

Evaluation von Open-Source-Software für System Dynamics hinsichtlich deren Integrierbarkeit Evaluation von Open-Source-Software für System Dynamics hinsichtlich deren Integrierbarkeit Axel Hummel 1, Heiko Kern 1, Christian Böhme 2, René Keßler 2 und Arndt Döhler 2 1 Betriebliche Informationssysteme,

Mehr

Matching von Produktdaten. Wie Sie mit Hilfe lernender Match-Algorithmen eine saubere Datenbasis schaffen.

Matching von Produktdaten. Wie Sie mit Hilfe lernender Match-Algorithmen eine saubere Datenbasis schaffen. Matching von Produktdaten Wie Sie mit Hilfe lernender Match-Algorithmen eine saubere Datenbasis schaffen. Matching von Produktdaten 2 Einleitung Ob Online-Shop oder Markenhersteller - Unternehmen zahlreicher

Mehr

Einführung Software Domänenspezifische Anpassung Demo Ausblick. ERM mit OntoWiki. Andreas Nareike

Einführung Software Domänenspezifische Anpassung Demo Ausblick. ERM mit OntoWiki. Andreas Nareike Entwicklung eines Electronic Resource Management Systems für Bibliotheken auf Basis von Linked Data Technologien Institut für Informatik, UB Leipzig Universität Leipzig DINI AG KIM Workshop, 15 April 2014

Mehr

Inhaltsverzeichnis. 1. Fragestellung

Inhaltsverzeichnis. 1. Fragestellung Inhaltsverzeichnis 1. Fragestellung... 1 2. Herleitung zum Thema... 1 3. Das Entity Relationship Modell (ERM)... 2 4. Praktisches Beispiel zum ERM... 7 5. Anhang...Fehler! Textmarke nicht definiert. 1.

Mehr

Big Data im Call Center: Kundenbindung verbessern, Antwortzeiten verkürzen, Kosten reduzieren! 25.02.2016 Sascha Bäcker Dr.

Big Data im Call Center: Kundenbindung verbessern, Antwortzeiten verkürzen, Kosten reduzieren! 25.02.2016 Sascha Bäcker Dr. Big Data im Call Center: Kundenbindung verbessern, Antwortzeiten verkürzen, Kosten reduzieren! 25.02.2016 Sascha Bäcker Dr. Florian Johannsen AGENDA 1. Big Data Projekt der freenet Group Dr. Florian Johannsen

Mehr

MATCHING VON PRODUKTDATEN IN DER CLOUD

MATCHING VON PRODUKTDATEN IN DER CLOUD MATCHING VON PRODUKTDATEN IN DER CLOUD Dr. Andreas Thor Universität Leipzig 15.12.2011 Web Data Integration Workshop 2011 Cloud Computing 2 Cloud computing is using the internet to access someone else's

Mehr

Tiefgreifende Prozessverbesserung und Wissensmanagement durch Data Mining

Tiefgreifende Prozessverbesserung und Wissensmanagement durch Data Mining Tiefgreifende Prozessverbesserung und Wissensmanagement durch Data Mining Ausgangssituation Kaizen Data Mining ISO 9001 Wenn andere Methoden an ihre Grenzen stoßen Es gibt unzählige Methoden, die Abläufe

Mehr

Redaktionelles Arbeiten auf Basis von Big-Data Methoden aus der Rundfunk/Fernseh-Perspektive

Redaktionelles Arbeiten auf Basis von Big-Data Methoden aus der Rundfunk/Fernseh-Perspektive Redaktionelles Arbeiten auf Basis von Big-Data Methoden aus der Rundfunk/Fernseh-Perspektive Institut für Rundfunktechnik, 17. Februar 2014 Norbert Pillmayer, BU-Leiter Software Solutions, NorCom Information

Mehr

Data Mining mit RapidMiner

Data Mining mit RapidMiner Motivation Data Mining mit RapidMiner CRISP: DM-Prozess besteht aus unterschiedlichen Teilaufgaben Datenvorverarbeitung spielt wichtige Rolle im DM-Prozess Systematische Evaluationen erfordern flexible

Mehr

ML-Werkzeuge und ihre Anwendung

ML-Werkzeuge und ihre Anwendung Kleine Einführung: und ihre Anwendung martin.loesch@kit.edu (0721) 608 45944 Motivation Einsatz von maschinellem Lernen erfordert durchdachtes Vorgehen Programmieren grundlegender Verfahren aufwändig fehlerträchtig

Mehr

Antrittsvortrag Masterarbeit Evaluation einer gemeinsamen Oberfläche für Saros/E und Saros/I mit Testframework

Antrittsvortrag Masterarbeit Evaluation einer gemeinsamen Oberfläche für Saros/E und Saros/I mit Testframework Antrittsvortrag Masterarbeit Evaluation einer gemeinsamen Oberfläche für Saros/E und Saros/I mit Testframework Christian Cikryt Freie Universität Berlin 15.01.2015 Überblick Startpunkt Bisheriger Wegabschnitt

Mehr

Wo r k f l o ws i m C3- Gr i d Pr o j ek t

Wo r k f l o ws i m C3- Gr i d Pr o j ek t Wo r k f l o ws i m C3- Gr i d Pr o j ek t Analyse, Scheduling und Bearbeitung Christian Grimme 05.03.08 Gl i ed er u n g C3- Grid, ein Überblick Workflows im C3- Grid Beschreibung von Workflows Task-

Mehr

e-business - Patterns Stefan Brauch (sb058) -- Julian Stoltmann (js057)

e-business - Patterns Stefan Brauch (sb058) -- Julian Stoltmann (js057) e-business - Patterns Stefan Brauch (sb058) -- Julian Stoltmann (js057) 1 e-business Patterns??? e-business Patterns Architekturen, die sich über die Zeit bewährt haben. Pattern-Fundgrube web-basierte

Mehr

Ein Erfahrungsbericht beim Einsatz von generierenden Ansätzen im Vergleich zu generischen Lösungen

Ein Erfahrungsbericht beim Einsatz von generierenden Ansätzen im Vergleich zu generischen Lösungen Ein Erfahrungsbericht beim Einsatz von generierenden Ansätzen im Vergleich zu generischen Lösungen Tom Krauß Agenda Begriffsdefinition Verfahren Praktische Beispiele Vergleich und Bewertung Begriffsklärung

Mehr

Einführung Architektur - Prinzipien. Ronald Winnemöller Arbeitsgruppe VCB Regionales Rechenzentrum Universität Hamburg

Einführung Architektur - Prinzipien. Ronald Winnemöller Arbeitsgruppe VCB Regionales Rechenzentrum Universität Hamburg Einführung Architektur - Prinzipien Ronald Winnemöller Arbeitsgruppe VCB Regionales Rechenzentrum Universität Hamburg Agenda 1. Was ist GOLEM? (I) 2. Funktionen und Architektur 3. Komponenten 4. Single

Mehr

Entwicklung eines Electronic Resource Management Systems für Bibliotheken auf Basis von Linked Data Technologien

Entwicklung eines Electronic Resource Management Systems für Bibliotheken auf Basis von Linked Data Technologien Entwicklung eines Electronic Resource Management Systems für Bibliotheken auf Basis von Linked Data Technologien Lydia Unterdörfel, Björn Muschall Wissenschaftskommunikation im Semantischen Web (EFRE)

Mehr

Integration verteilter Datenquellen in GIS-Datenbanken

Integration verteilter Datenquellen in GIS-Datenbanken Integration verteilter Datenquellen in GIS-Datenbanken Seminar Verteilung und Integration von Verkehrsdaten Am IPD Lehrstuhl für Systeme der Informationsverwaltung Sommersemester 2004 Christian Hennings

Mehr

Suchmaschinen. Anwendung RN Semester 7. Christian Koczur

Suchmaschinen. Anwendung RN Semester 7. Christian Koczur Suchmaschinen Anwendung RN Semester 7 Christian Koczur Inhaltsverzeichnis 1. Historischer Hintergrund 2. Information Retrieval 3. Architektur einer Suchmaschine 4. Ranking von Webseiten 5. Quellenangabe

Mehr

Einteilung von Datenbanken

Einteilung von Datenbanken Datenbanksysteme (c) A.Kaiser; WU-Wien 1 Einteilung von Datenbanken 1. formatierte Datenbanken 2. unformatierte Datenbanken Information Retrieval Systeme 2 Wozu Datenbanken? Speicherung und Verwaltung

Mehr

Praxisbeispiel Blended Learning Kurs M153 Datenmodelle entwickeln und umsetzen

Praxisbeispiel Blended Learning Kurs M153 Datenmodelle entwickeln und umsetzen Praxisbeispiel Blended Learning Kurs M153 Datenmodelle entwickeln und umsetzen wurde am 3. April 2004 als Innovatives Bildungsprojekt Schweiz am Blended Learning Forum ausgezeichnet. Walter Schnider KPP

Mehr

Business Intelligence und Geovisualisierung in der Gesundheitswirtschaft

Business Intelligence und Geovisualisierung in der Gesundheitswirtschaft Business Intelligence und Geovisualisierung in der Gesundheitswirtschaft Prof. Dr. Anett Mehler-Bicher Fachhochschule Mainz, Fachbereich Wirtschaft Prof. Dr. Klaus Böhm health&media GmbH 2011 health&media

Mehr

Text-Mining: Einführung

Text-Mining: Einführung Text-Mining: Einführung Claes Neuefeind Fabian Steeg 22. April 2010 Organisatorisches Was ist Text-Mining? Definitionen Anwendungsbeispiele Textuelle Daten Aufgaben u. Teilbereiche Literatur Kontakt Sprechstunde:

Mehr

Data Mining mit RapidMiner. Fakultät Informatik Lehrstuhl für Künstliche Intelligenz

Data Mining mit RapidMiner. Fakultät Informatik Lehrstuhl für Künstliche Intelligenz Data Mining mit RapidMiner Fakultät Informatik Motivation CRISP: DM-Prozess besteht aus unterschiedlichen Teilaufgaben Datenvorverarbeitung spielt wichtige Rolle im DM-Prozess Systematische Evaluationen

Mehr

Regelbasiertes Routing unstrukturierter Daten

Regelbasiertes Routing unstrukturierter Daten Regelbasiertes Routing unstrukturierter Daten Mittwoch, 16. September 2015, Developer Academy Thomas Nitzsche, Sales Engineer Regelbasiertes Routing unstrukturierter Daten Überblick Ziel: Regelbasiertes

Mehr

Moderne Methoden der KI: Maschinelles Lernen

Moderne Methoden der KI: Maschinelles Lernen Moderne Methoden der KI: Maschinelles Lernen Prof. Dr.Hans-Dieter Burkhard Vorlesung Entscheidungsbäume Darstellung durch Regeln ID3 / C4.5 Bevorzugung kleiner Hypothesen Overfitting Entscheidungsbäume

Mehr

Text Mining Praktikum. Durchführung: Andreas Niekler Email: aniekler@informatik.uni-leipzig.de Zimmer: Paulinum (P) 818

Text Mining Praktikum. Durchführung: Andreas Niekler Email: aniekler@informatik.uni-leipzig.de Zimmer: Paulinum (P) 818 Text Mining Praktikum Durchführung: Andreas Niekler Email: aniekler@informatik.uni-leipzig.de Zimmer: Paulinum (P) 818 Rahmenbedingungen Gruppen von 2- (max)4 Personen Jede Gruppe erhält eine Aufgabe Die

Mehr

A Domain Specific Language for Project Execution Models

A Domain Specific Language for Project Execution Models A Domain Specific Language for Project Execution Models Eugen Wachtel, Marco Kuhrmann, Georg Kalus Institut für Informatik Software & Systems Engineering Inhalt Einführung und Hintergrund Problembereiche

Mehr

DAFFODIL : Nutzerorientiertes Zugangssystem für heterogene Digitale Bibliotheken

DAFFODIL : Nutzerorientiertes Zugangssystem für heterogene Digitale Bibliotheken DAFFODIL : Nutzerorientiertes Zugangssystem für heterogene Digitale Bibliotheken C.-P. Klas N. Fuhr S. Kriewel A. Schaefer G. Fischer Informatik 2005 Outline Motivation Strategische Unterstützung Höhere

Mehr

indato Berner Architekten Treffen No. 1 Das Berner Architekten Treffen

indato Berner Architekten Treffen No. 1 Das Berner Architekten Treffen Das Berner Architekten Treffen Das Berner Architekten Treffen ist eine Begegnungsplattform für an Architekturfragen interessierte Informatikfachleute. Durch Fachvorträge aus der Praxis und Gelegenheiten

Mehr

On the Consistency of Spatial Semantic Integrity Constraints. Konsistenzprüfung von räumlichen semantischen Integritätsregeln.

On the Consistency of Spatial Semantic Integrity Constraints. Konsistenzprüfung von räumlichen semantischen Integritätsregeln. On the Consistency of Spatial Semantic Integrity Constraints Konsistenzprüfung von räumlichen semantischen Problemstellung Geographische Daten werden immer häufiger dezentral gehalten und mithilfe vernetzter

Mehr

Sicherheitsprofile Software as a Service. Sichere Nutzung von Cloud-Diensten

Sicherheitsprofile Software as a Service. Sichere Nutzung von Cloud-Diensten Sicherheitsprofile Software as a Service Sichere Nutzung von Cloud-Diensten Referat B22 Informationssicherheit und Digitalisierung it-sa 2014, Nürnberg Was ist ein Sicherheitsprofil Das Sicherheitsprofil

Mehr

erfolgreich steuern Datenqualität rä dpunkt.verlag Ldwi Praxislösungen für Business-Intelligence-Projekte Rüdiger Eberlein Edition TDWI

erfolgreich steuern Datenqualität rä dpunkt.verlag Ldwi Praxislösungen für Business-Intelligence-Projekte Rüdiger Eberlein Edition TDWI Detlef Apel Wolfgang Behme Rüdiger Eberlein Christian Merighi Datenqualität erfolgreich steuern Praxislösungen für Business-Intelligence-Projekte 3., überarbeitete und erweiterte Auflage Edition TDWI rä

Mehr

Property-Graph-Databases. 20 Jahre praktische Erfahrung

Property-Graph-Databases. 20 Jahre praktische Erfahrung Property-Graph-Databases 20 Jahre praktische Erfahrung Agenda Was sind die Bausteine der Property- Graph-Database Aspekte der Architektur und der Implementierung Möglichkeiten, Vor- und Nachteile von PG-

Mehr

Oracle Scorecard & Strategy Management

Oracle Scorecard & Strategy Management Oracle Scorecard & Strategy Management Björn Ständer ORACLE Deutschland B.V. & Co. KG München Schlüsselworte: Oracle Scorecard & Strategy Management; OSSM; Scorecard; Business Intelligence; BI; Performance

Mehr

Vom Geschäftsprozess zum Workflow

Vom Geschäftsprozess zum Workflow Jakob Freund Klaus Götzer Vom Geschäftsprozess zum Workflow Ein Leitfaden für die Praxis HANSER Inhalt 1 Einleitung 1 1.1 Die Geschichte der Prozesse 1 1.2 Aktuelle Herausforderungen 2 1.3 Business Process

Mehr

Prüfung SS 2005. Computational. Engineering

Prüfung SS 2005. Computational. Engineering Prüfung SS 2005 Computational Engineering 90 min Prof. Dr.-Ing. K. Wöllhaf Anmerkungen: Aufgabenblätter auf Vollständigkeit überprüfen Nur Blätter mit Namen und Matr.Nr. werden korrigiert. Keine rote Farbe

Mehr

Datenqualität erfolgreich steuern

Datenqualität erfolgreich steuern Edition TDWI Datenqualität erfolgreich steuern Praxislösungen für Business-Intelligence-Projekte von Detlef Apel, Wolfgang Behme, Rüdiger Eberlein, Christian Merighi 3., überarbeitete und erweiterte Auflage

Mehr

BPM: Integrierte Prozesse im ecommerce

BPM: Integrierte Prozesse im ecommerce BPM: Integrierte Prozesse im ecommerce Vom Geschäftsprozess bis zur lauffähigen Applikation. Thomas Grömmer Head of Business Process Solutions Ulf Ackermann Consultant Business Process Solutions Solution

Mehr

Data Mining mit Rapidminer im Direktmarketing ein erster Versuch. Hasan Tercan und Hans-Peter Weih

Data Mining mit Rapidminer im Direktmarketing ein erster Versuch. Hasan Tercan und Hans-Peter Weih Data Mining mit Rapidminer im Direktmarketing ein erster Versuch Hasan Tercan und Hans-Peter Weih Motivation und Ziele des Projekts Anwendung von Data Mining im Versicherungssektor Unternehmen: Standard

Mehr

Instandhaltung. Jakob Krause, Sebastian Cech. TU Dresden - Fakultät Informatik

Instandhaltung. Jakob Krause, Sebastian Cech. TU Dresden - Fakultät Informatik Ein Prototyp zur zustandsorientierten Instandhaltung Jakob Krause, Sebastian Cech TU Dresden - Fakultät Informatik Gliederung 1. Motivation 2. Der Prognoseprozess 3. Die Frameworkarchitektur 4. Implementierung

Mehr

Implementierung einer GUI für ANTS

Implementierung einer GUI für ANTS Lehrstuhl Netzarchitekturen und Netzdienste Institut für Informatik Technische Universität München Implementierung einer GUI für ANTS Florian Wohlfart Abschlusspräsentation Bachelorarbeit Überblick Einleitung:

Mehr

Fragebogen. zur Erschließung und Sicherung von Online-Dokumenten. Auswahl von elektronischen Publikationen

Fragebogen. zur Erschließung und Sicherung von Online-Dokumenten. Auswahl von elektronischen Publikationen Fragebogen zur Erschließung und Sicherung von Online-Dokumenten I. Angaben zum Ansprechpartner Nachname Vorname Institution E-Mail-Adresse II. Auswahl von elektronischen Publikationen 1a) Wertet Ihre Institution

Mehr

Seminar Datenbanksysteme

Seminar Datenbanksysteme Seminar Datenbanksysteme Recommender System mit Text Analysis für verbesserte Geo Discovery Eine Präsentation von Fabian Senn Inhaltsverzeichnis Geodaten Geometadaten Geo Discovery Recommendation System

Mehr

WEKA A Machine Learning Interface for Data Mining

WEKA A Machine Learning Interface for Data Mining WEKA A Machine Learning Interface for Data Mining Frank Eibe, Mark Hall, Geoffrey Holmes, Richard Kirkby, Bernhard Pfahringer, Ian H. Witten Reinhard Klaus Losse Künstliche Intelligenz II WS 2009/2010

Mehr

Werkstattbericht: Doktorandenerfassung und -berichtswesen an der Universität Konstanz

Werkstattbericht: Doktorandenerfassung und -berichtswesen an der Universität Konstanz Werkstattbericht: Doktorandenerfassung und -berichtswesen an der Sebastian Vogt Mannheim, 26. März 2015 Struktur des Vortrags Erfassungsmanagement Registrierungsverfahren für DoktorandInnen und Verwaltungsworkflow

Mehr

SAS als Basis einer Registrierungsdatenbank: Die Alternative zu Access

SAS als Basis einer Registrierungsdatenbank: Die Alternative zu Access SAS als Basis einer Registrierungsdatenbank: Die Alternative zu Access Nick Martinussen Lisbeth Samsoe Schmidt Alsak Harbo Poulsen Henrik Lind Gregersen Joachim Schüz Institute of Cancer Epidemiology Danish

Mehr

Allgemeines zu Datenbanken

Allgemeines zu Datenbanken Allgemeines zu Datenbanken Was ist eine Datenbank? Datensatz Zusammenfassung von Datenelementen mit fester Struktur Z.B.: Kunde Alois Müller, Hegenheimerstr. 28, Basel Datenbank Sammlung von strukturierten,

Mehr

Gliederung. Zusammenfassung. Inhaltsverzeichnis. 1 Einführung i

Gliederung. Zusammenfassung. Inhaltsverzeichnis. 1 Einführung i Gliederung Zusammenfassung v Abstract vii Gliederung ix Inhaltsverzeichnis xiii 1 Einführung i 2 Einordnung und Relevanz der Arbeit 3 2.1 Die Begriffe ganzheitlich", integriert" und Framework" 3 2.2 Relevanz

Mehr

APTs: Sind gezielte Angriffe normal? Jürgen Eckel Eckel.J@ikarus.at Helene Hochrieser Hochrieser.H@ikarus.at

APTs: Sind gezielte Angriffe normal? Jürgen Eckel Eckel.J@ikarus.at Helene Hochrieser Hochrieser.H@ikarus.at APTs: Sind gezielte Angriffe normal? Jürgen Eckel Eckel.J@ikarus.at Helene Hochrieser Hochrieser.H@ikarus.at Welche Anomalien können gefunden werden? Wie lässt sich anormales Verhalten extrahieren? Zeithorizont

Mehr

Intelligente Informationssysteme CoreMedia Smart Content Technology. Grundlagen

Intelligente Informationssysteme CoreMedia Smart Content Technology. Grundlagen Intelligente Informationssysteme CoreMedia Smart Content Technology Grundlagen Gunar Fiedler CAU Kiel, Institut für Informatik und Praktische Mathematik Arbeitsgruppe Technologie der Informationssysteme

Mehr

Studierenden-Kennzahlen im Griff dank flexiblem Reporting und Ad-hoc-Analysen

Studierenden-Kennzahlen im Griff dank flexiblem Reporting und Ad-hoc-Analysen Praxistag für die öffentliche Verwaltung 2012 Titel Präsentation Studierenden-Kennzahlen im Griff dank flexiblem Reporting und Ad-hoc-Analysen Referenten-Info Gerhard Tschantré, Leiter Controllerdienste

Mehr

Anforderungsanalyse für SOA Services

Anforderungsanalyse für SOA Services Anforderungsanalyse für SOA Services mittels BPMN 2.0 und UML Björn Hardegen b.hardegen@mid.de Dr. Gregor Scheithauer gregor.scheithauer@opitz consulting.com München, 29.02.2012 I N H A L T 1. Herausforderungen

Mehr

BARC-Intensivseminar Auswahl von Enterprise-Content- Management-Lösungen. Martin Böhn

BARC-Intensivseminar Auswahl von Enterprise-Content- Management-Lösungen. Martin Böhn BARC-Intensivseminar Auswahl von Enterprise-Content- -Lösungen Würzburg, 07. Mai 2007 Martin Böhn Wiesenweg 31 D-97084 Würzburg +49-931-8806510 www.barc.de Seminaragenda 1 Begrüßung, und Vorstellung, Erwartungen

Mehr

Aufbau von Integrationsprojekten von WfbM-Trägern Von der ersten Idee zum erfolgreichen Businessplan

Aufbau von Integrationsprojekten von WfbM-Trägern Von der ersten Idee zum erfolgreichen Businessplan Aufbau von Integrationsprojekten von WfbM-Trägern Von der ersten Idee zum erfolgreichen Businessplan Helmut.Volkenandt @ faf-gmbh.de Nürnberg 14. März 2013 Philosophie Integrationsprojekte sind Unternehmen

Mehr

Integration lokaler Daten in ifuice

Integration lokaler Daten in ifuice : Integration lokaler Daten in ifuice Bearbeiter: Sarah Gebhardt Betreuer: Andreas Thor Seite 1 Motivation Warum eine Integration lokaler Daten? Viele Infos im Web, aber andere Listen im Web, aber nicht

Mehr

Mining High-Speed Data Streams

Mining High-Speed Data Streams Mining High-Speed Data Streams Pedro Domingos & Geoff Hulten Departement of Computer Science & Engineering University of Washington Datum : 212006 Seminar: Maschinelles Lernen und symbolische Ansätze Vortragender:

Mehr

30. Juni 2006 - Technische Universität Kaiserslautern. Paul R. Schilling

30. Juni 2006 - Technische Universität Kaiserslautern. Paul R. Schilling 30. Juni 2006 - Technische Universität Kaiserslautern Paul R. Schilling ! " #$% & '( ( ) *+, - '. / 0 1 2("$ DATEN SIND ALLGEGENWÄRTIG Bill Inmon, father of data warehousing Unternehmen In einer vollkommenen

Mehr

Business Intelligence und Natural Intelligence für die kommunikative Führung

Business Intelligence und Natural Intelligence für die kommunikative Führung Business Intelligence und Natural Intelligence für die kommunikative Führung Prof. DI Dr. Reinhard Riedl Wissensmanagement ist eine Schimäre Warum? Die Motivation zum Teilen fehlt Das intellektuelles Kapital

Mehr

Logistikmanagement aus Kundensicht, ein unterschätztes Potenzial

Logistikmanagement aus Kundensicht, ein unterschätztes Potenzial Logistikmanagement aus Kundensicht, ein unterschätztes Potenzial INHALTSVERZEICHNIS INHALT MANAGEMENT DES NETZWERKS LOGISTIKPROZESSE TRANSPARENZ INOS JG CONSULTING Management des Supply-Netzwerks Logistikprozesse

Mehr

Kompatibilitätsmatrix zum Diversity Management im Projekt

Kompatibilitätsmatrix zum Diversity Management im Projekt Kompatibilitätsmatrix zum Diversity Management im Projekt Seite 1 Agenda 1. Einleitung 2. Vielfalt im Projekt 3. Grundlagen Aufbau Schritt 1: Eigenschaftenmatrix Schritt 2: Kompatibilitätsermittlung Schritt

Mehr

BEISPIELKLAUSUR Softwareentwicklung:

BEISPIELKLAUSUR Softwareentwicklung: Prof. Dr. Andreas Fink Institut für Informatik Fakultät für Wirtschafts- und Sozialwissenschaften Helmut-Schmidt-Universität / Universität der Bundeswehr Hamburg BEISPIELKLAUSUR Softwareentwicklung: Objektorientierte

Mehr

Prof. Dr.-Ing. Rainer Schmidt 1

Prof. Dr.-Ing. Rainer Schmidt 1 Prof. Dr.-Ing. Rainer Schmidt 1 Business Analytics und Big Data sind Thema vieler Veröffentlichungen. Big Data wird immer häufiger bei Google als Suchbegriff verwendet. Prof. Dr.-Ing. Rainer Schmidt 2

Mehr

Software Engineering Projekt WS2003/2004 ELF. Persistenz. Serge Didier Bedime 28.11.03

Software Engineering Projekt WS2003/2004 ELF. Persistenz. Serge Didier Bedime 28.11.03 Persistenz -1- Einführung Konventionelle Dateiverwaltung Datenbanksystem() Xindice als Datenbankbeispiel Zusammenfassung -2- Einführung Definition I Persistence ist the property of an object through which

Mehr

Prototypenentwicklung zur Identifikation gleichartiger Nachrichtenticker am Beispiel des Gashandels

Prototypenentwicklung zur Identifikation gleichartiger Nachrichtenticker am Beispiel des Gashandels Prototypenentwicklung zur Identifikation gleichartiger Nachrichtenticker am Beispiel des Gashandels TDWI Konferenz München, 24.06.2014 M.Sc.Susann Dreikorn Institut für Wirtschaftsinformatik, 2014 Agenda

Mehr

Lean Six Sigma als Instrument für die Messung von ITIL -Prozessen

Lean Six Sigma als Instrument für die Messung von ITIL -Prozessen Informatik Anja Theisen Lean Six Sigma als Instrument für die Messung von ITIL -Prozessen Studienarbeit UNIVERSITÄT DUISBURG-ESSEN Seminararbeit zum Thema Lean Six Sigma als Instrument für die Messung

Mehr

Profilbezogene informatische Bildung in den Klassenstufen 9 und 10. Schwerpunktthema Daten und Datenbanken

Profilbezogene informatische Bildung in den Klassenstufen 9 und 10. Schwerpunktthema Daten und Datenbanken Profilbezogene informatische Bildung in den Klassenstufen 9 und 10 Schwerpunktthema Robby Buttke Fachberater für Informatik RSA Chemnitz Fachliche Einordnung Phasen relationaler Modellierung Fachlichkeit

Mehr

Moderne Informationsarchitektur mit Drupal

Moderne Informationsarchitektur mit Drupal Moderne Informationsarchitektur mit Drupal Hochschule Bonn-Rhein-Sieg Relaunch der Website Jutta Horstmann Dipl. Inf., Dipl. Pol. Data in Transit GmbH Geschäftsführerin Agenda Vorstellung Data in Transit

Mehr

Prozessunterstützung durch BPR-, BPM- und Workflow-Systeme

Prozessunterstützung durch BPR-, BPM- und Workflow-Systeme Prozessunterstützung durch BPR-, BPM- und Workflow-Systeme 27. April 2004 München Brigitte Stuckenberger Business Process Management verbindet technische und fachliche Sicht auf Geschäftsprozesse Unternehmensberatungen,

Mehr

wirtschaftsinformatik im hauptstudium:

wirtschaftsinformatik im hauptstudium: wirtschaftsinformatik im hauptstudium: einführung in erp 03/2000 martin finkbeiner 1 inhalt theoretische grundlagen erp am beispiel sap r/3 praktische anwendung eines r/3 moduls mit uebungen 03/2000 martin

Mehr

Kanton Zürich Direktion der Justiz und des Innern. Massnahmen. Kantonale Integrationsbeauftragte, Julia Morais

Kanton Zürich Direktion der Justiz und des Innern. Massnahmen. Kantonale Integrationsbeauftragte, Julia Morais Kanton Zürich Direktion der Justiz Massnahmen Kantonale Integrationsbeauftragte, Julia Morais 3'000 Asylgewährungen und vorläufige Aufnahmen im Kanton Zürich, 2002-2014 2'500 2'000 1'500 1'000 500 0 2002

Mehr

Cognitive Systems Master thesis

Cognitive Systems Master thesis Cognitive Systems Master thesis Recherche Phase SS 2011 Gliederung 1. Einleitung 2. Analogie Modelle 2.1 SME 2.2 Ava 2.3 Lisa 3. Zusammenfassung 4. Ausblick 2 Einleitung Analogie Problemsituation wird

Mehr

DIE DATEN IM ZENTRUM: SAS DATA MANAGEMENT

DIE DATEN IM ZENTRUM: SAS DATA MANAGEMENT DIE DATEN IM ZENTRUM: SAS DATA RAINER STERNECKER SOLUTIONS ARCHITECT SAS INSTITUTE SOFTWARE GMBH Copyr i g ht 2013, SAS Ins titut e Inc. All rights res er ve d. NEUE WEGE GEHEN SAS DATA GOVERNANCE & QUALITY

Mehr

Qualitätssicherung bei der mobilen Datenerfassung

Qualitätssicherung bei der mobilen Datenerfassung Qualitätssicherung bei der mobilen Datenerfassung Stephan Mäs Arbeitsgemeinschaft GIS Universität der Bundeswehr München http://www.unibw.de/bauv11/geoinformatik/agis 9. Seminar GIS & Internet 13.-15.

Mehr

RapidMiner als Werkzeug für die textorientierten Geisteswissenschaften Katharina Morik

RapidMiner als Werkzeug für die textorientierten Geisteswissenschaften Katharina Morik technische universität RapidMiner als Werkzeug für die textorientierten Geisteswissenschaften Katharina Morik Name Autor Ort und Datum Informatik: Linguistik: Methoden + Verfahren Forschungsfragen, Anforderungen

Mehr

Modernes Immobilien- und Infrastrukturmanagement in Schweizer Spitälern. Vorstellung der SAP-Lösung der Spital Thurgau. innovation@work vom 20.05.

Modernes Immobilien- und Infrastrukturmanagement in Schweizer Spitälern. Vorstellung der SAP-Lösung der Spital Thurgau. innovation@work vom 20.05. Modernes Immobilien- und Infrastrukturmanagement in Schweizer Spitälern Vorstellung der SAP-Lösung der Spital Thurgau innovation@work vom Agenda 1. Vorstellung Spital Thurgau 2. Ausgangslage des Projektes

Mehr

SAP SharePoint Integration. e1 Business Solutions GmbH

SAP SharePoint Integration. e1 Business Solutions GmbH SAP SharePoint Integration e1 Business Solutions GmbH Inhalt Duet Enterprise Überblick Duet Enterprise Use Cases Duet Enterprise Technologie Duet Enterprise Entwicklungs-Prozess Duet Enterprise Vorteile

Mehr

Bibliothekarische Fortbildung in Deutschland.

Bibliothekarische Fortbildung in Deutschland. Herbsttagung des Arbeitskreises kritischer BibliothekarInnen im Renner-Institut, Wien Fortbildung auf neuen Wegen Bibliothekarische Fortbildung: Strukturen - Defizite - Kooperation 23. - 25. November 2001

Mehr

Datenbanken. Erstellen des Semantischen Modells. Manuel Friedrich. Schiller-Gymnasium Hof

Datenbanken. Erstellen des Semantischen Modells. Manuel Friedrich. Schiller-Gymnasium Hof Datenbanken Erstellen des Semantischen Modells Die Objektorientierte Sichtweise! Die Objektorientierte Sichtweise! Alles ist ein Objekt! Mensch Lehrgang Produkt Kunde Lieferant Beispiel Kreis Linienfarbe

Mehr

Bestandskundenmanagement Wo drückt bei Ihnen der Schuh?

Bestandskundenmanagement Wo drückt bei Ihnen der Schuh? Bestandskundenmanagement Wo drückt bei Ihnen der Schuh? best-reactions GmbH Hirschberger Straße 33 D 90559 Burgthann Alle Rechte vorbehalten HRB 23679, Amtsgericht Nürnberg Geschäftsführer Alexander P.

Mehr

Community-orientierte Informationssystementwicklung in den Geisteswissenschaften

Community-orientierte Informationssystementwicklung in den Geisteswissenschaften IT in den Kultur- und Geisteswissenschaften Community-orientierte Informationssystementwicklung in den Geisteswissenschaften,, Hamburg, den 26.3.2004 I5-SKJ-2603-1/18 Agenda Forschungskolleg als Ausgangspunkt

Mehr

Bessere Daten durch Stammdatenmanagement

Bessere Daten durch Stammdatenmanagement make connections share ideas be inspired Bessere Daten durch Stammdatenmanagement Mit SAS MDM, bessere Stammdaten für operativen Systeme make connections share ideas be inspired Overview Mit SAS MDM bessere

Mehr

Vorlesungsplan. Von Naïve Bayes zu Bayesischen Netzwerk- Klassifikatoren. Naïve Bayes. Bayesische Netzwerke

Vorlesungsplan. Von Naïve Bayes zu Bayesischen Netzwerk- Klassifikatoren. Naïve Bayes. Bayesische Netzwerke Vorlesungsplan 17.10. Einleitung 24.10. Ein- und Ausgabe 31.10. Reformationstag, Einfache Regeln 7.11. Naïve Bayes, Entscheidungsbäume 14.11. Entscheidungsregeln, Assoziationsregeln 21.11. Lineare Modelle,

Mehr

Mobile und drahtlose Kommunikation in der Logistik: Von Sensornetzen zu Satellitennetzen

Mobile und drahtlose Kommunikation in der Logistik: Von Sensornetzen zu Satellitennetzen Mobile und drahtlose Kommunikation in der Logistik: Von Sensornetzen zu Satellitennetzen Dr.-Ing. Andreas Timm-Giel Universität Bremen MRC, tzi, ikom, FB1, ComNets, SFB 637 Otto-Hahn-Allee NW1 S2260, 28359

Mehr

CBLOCK: An Automatic Blocking Mechanism for Large-Scale De-duplication Tasks. Cathleen Ramson, Stefan Lehmann LSDD SS 2013 25.04.

CBLOCK: An Automatic Blocking Mechanism for Large-Scale De-duplication Tasks. Cathleen Ramson, Stefan Lehmann LSDD SS 2013 25.04. CBLOCK: An Automatic Blocking Mechanism for Large-Scale De-duplication Tasks Cathleen Ramson, Stefan Lehmann LSDD SS 2013 25.04.2013 Gliederung 2 Motivation Ziel Algorithmen Zusammenfassung Bewertung Motivation

Mehr