BigData Wie wichtig ist die Datenqualität bei der Analyse und Auswertung von großen Daten Praxisbeispiel. Christin Otto



Ähnliche Dokumente
BSV Ludwigsburg Erstellung einer neuen Internetseite

Fragen und Antworten

Prof. Dr.-Ing. Rainer Schmidt 1

THEMA: "SAS STORED PROCESSES - SCHNELL GEZAUBERT" HELENE SCHMITZ

SDD System Design Document

ERP-Evaluation systematisch und sicher zum optimalen ERP-System

Change Management. Hilda Tellioğlu, Hilda Tellioğlu

Elternumfrage Kita und Reception. Campus Hamburg

ANLEITUNG PREMIUM-PROFIL

Das Markenrecht Das Markengesetz schützt Marken und geschäftliche Bezeichnungen gegen Benutzung durch Dritte.

Anleitung zur Excel-Anwendung Basisprämienberechnung

Buchungsleitfaden Jahresabschluss nach 4 Abs.3 EStG

Delta Audit - Fragenkatalog ISO 9001:2014 DIS

Was meinen die Leute eigentlich mit: Grexit?

Mitarbeiterbefragung zur Führungsqualität und Mitarbeitermotivation in Ihrem Betrieb

Stud.IP. Inhalt. Rechenzentrum. Vorgehen zur Eintragung in Veranstaltungen / Gruppen. Stand: Januar 2015

TeamSphere. Die Geo-Wissensdatenbank. Entwickelt von

Wir machen neue Politik für Baden-Württemberg

Vgl. Kapitel 5 aus Systematisches Requirements Engineering, Christoph Ebert

Anleitung über den Umgang mit Schildern

Checkliste zur qualitativen Nutzenbewertung

Bedienungsanleitung für den Online-Shop

Mitarbeiterbefragung als PE- und OE-Instrument

AGROPLUS Buchhaltung. Daten-Server und Sicherheitskopie. Version vom b

Zusatzmodul Lagerverwaltung

FAMILIENSTAND ALLEINERZIEHENDE MÜTTER

Big Data Projekte richtig managen!

Ihr Mandant möchte einen neuen Gesellschafter aufnehmen. In welcher Höhe wäre eine Vergütung inklusive Tantieme steuerrechtlich zulässig?

Hilfe zur Urlaubsplanung und Zeiterfassung

Betriebswirtschaftliches Beratungstool für Steuerberater Ziele, Inhalte und Struktur

Anhang. 3. Was denken Sie: An wen richtet sich das Lernprogramm für Psycholinguistik? zu nicht nicht zu

Informationsbroschüre über die Nutzung des otop Hilfsmittel-Marktplatzes

Info-Veranstaltung zur Erstellung von Zertifikaten

Positionspapier Big Data

das usa team Ziegenberger Weg Ober-Mörlen Tel Fax: mail: lohoff@dasusateam.de web:

Gästeverwaltung. Gästestammdaten. Gäste verwalten. Hotelsoftware für Klein- und Mittelbetriebe

White Paper - Umsatzsteuervoranmeldung Österreich ab 01/2012

Linked Open Data (LOD) in der Landwirtschaft. Workshop Anwendungsbeispiele nach Themen I

Corporate Websites MEHRSPRACHIGE MULTICHANNEL-PROJEKTE MIT WORKFLOWS. 18. und 19. September DMEXCO Michael Steinfort, comspace.

Wie erreiche ich was?

SCHRITT 1: Öffnen des Bildes und Auswahl der Option»Drucken«im Menü»Datei«...2. SCHRITT 2: Angeben des Papierformat im Dialog»Drucklayout«...

Wie kommt der Strom zu uns?

GRS SIGNUM Product-Lifecycle-Management

Informationen zum Ambulant Betreuten Wohnen in leichter Sprache

Wir nehmen Aufgaben und Ideen wahr. Wir suchen Lösungen zu Ideen.

Karten-Freischaltung mit dem UNLOCK MANAGER

Skills-Management Investieren in Kompetenz

Antwort auf Bieteranfrage 2: Diese Annahme ist richtig.

Unterrichtsmaterialien in digitaler und in gedruckter Form. Auszug aus:

pro4controlling - Whitepaper [DEU] Whitepaper zur CfMD-Lösung pro4controlling Seite 1 von 9

Unterrichtseinheit»Der Weg eines Straßenkindes«

REACH-CLP-Helpdesk. Zulassung in der Lieferkette. Matti Sander, Bundesanstalt für Arbeitsschutz und Arbeitsmedizin

Word 2010 Schnellbausteine

INNOVATIONEN UND QUALIFIZIERUNG WAS SAGEN BETRIEBSRÄTE?

Neue Wege im Reporting Design mit Hilfe von Eye Tracking Analysen

Planung, Fakturierung und Controlling aus einem System. Jobperfekt 2. Die Lösung für alle Agenturen

Formica 2.0: Montageauftrag erfassen: Auftragsgruppe

sage Office Line und cobra: die ideale Kombination!

ORCA Software GmbH Kunstmühlstraße 16 D Rosenheim Telefon +49(0) Fax +49(0)

Content Management Datenbanken, Schnittstellen

WAS finde ich WO im Beipackzettel

Rechnung wählen Lernstandserfassung

- Google als Suchmaschine richtig nutzen -

FIS: Projektdaten auf den Internetseiten ausgeben

Mit dem Tool Stundenverwaltung von Hanno Kniebel erhalten Sie die Möglichkeit zur effizienten Verwaltung von Montagezeiten Ihrer Mitarbeiter.

Haushaltstellen bewirtschaften

TV-Inhalte Lehrerinformation

Welchen Weg nimmt Ihr Vermögen. Unsere Leistung zu Ihrer Privaten Vermögensplanung. Wir machen aus Zahlen Werte

Meine Entscheidung zur Wiederaufnahme der Arbeit

Ein Vorwort, das Sie lesen müssen!

IFZM. Die KASKO für Investmentfonds

Nr. 12-1/Dezember 2005-Januar A 12041

Landes-Arbeits-Gemeinschaft Gemeinsam Leben Gemeinsam Lernen Rheinland-Pfalz e.v.

Ablauf Vorstellungsgespräch

Verkaufen Sie doch wo Sie wollen. Ihr einfacher Weg zu mehr Umsatz und dauerhaft steigendem Erfolg im E-Business

Studie zum Einsatz und Nutzen von strategischem IT-Benchmarking. Katharina Ebner Prof. Dr. Stefan Smolnik

Business Intelligence in NRW

AMAN. Vergleich der verschiendenen RedSYS- Instanzeninstallationsmöglichkeiten

Benutzung des NAM. Starten Sie Ihren Browser und rufen Sie folgende Adresse auf:

Arbeit zur Lebens-Geschichte mit Menschen mit Behinderung Ein Papier des Bundesverbands evangelische Behindertenhilfe e.v.

Wozu Identitäts- und Berechtigungsmanagement? Alle Wege führen zum IAM.

-Inhalte an cobra übergeben

Reglement über den Integrierten Aufgaben- und Finanzplan (IAFP-Reglement)

Zukunft der WfbM Positionspapier des Fachausschusses IV

iq digital quarterly #1 Content Marketing

Projektanleitung zum

Dokumentation. Prüfungen sind zu dokumentieren: elektronische Systeme Prüfplaketten Prüfbücher. DIN VDE Abschn. 6

Servicequalität mit Kennzahlen steuern Wozu braucht es da einen Service-Katalog?

NEWS von HZ.optimax-R39 Version 2012 SP1 Softwareneuerungen und Erweiterungen

White Paper. Konfiguration und Verwendung des Auditlogs Winter Release

Einleitung: Frontend Backend

Umgang mit Schaubildern am Beispiel Deutschland surft

Modellbildungssysteme: Pädagogische und didaktische Ziele

Das neue MyHammer Profil

IBIS Professional. z Dokumentation zur Dublettenprüfung

Verifizierung neuer bzw. geänderter -adressen in den Anwender- und/oder Benutzerstammdaten

Patch-Management. Leibniz-Akademie Hannover Wirtschaftsinformatik B. Sc. Praxisreflexion im Bereich Management im SS 2011

Projekt - Zeiterfassung

Der schnelle Weg zu Ihrer eigenen App

Version smarter mobile(zu finden unter Einstellungen, Siehe Bild) : Gerät/Typ(z.B. Panasonic Toughbook, Ipad Air, Handy Samsung S1):

Transkript:

BigData Wie wichtig ist die qualität bei der Analyse und Auswertung von großen Praxisbeispiel Christin Otto

Was ist Big Data? Der Big Data Prozess Sammlung und Speicherung von Analyse der zum Gewinn von Informationen Anwendung der Informationen zum Fällen von Entscheidungen 2

Was ist Big Data? Der Big Data Prozess Sammlung und Speicherung von Analyse der zum Gewinn von Informationen Anwendung der Informationen zum Fällen von Entscheidungen Big Data Dimensionen Masse Vielfalt Geschwindigkeit Sehr viele in unterschiedlichen Formaten die sich schnell vervielfältigen. 3

Was ist Big Data? Der Big Data Prozess Sammlung und Speicherung von Analyse der zum Gewinn von Informationen Anwendung der Informationen zum Fällen von Entscheidungen Big Data Dimensionen Masse Vielfalt Geschwindigkeit Sehr viele in unterschiedlichen Formaten die sich schnell vervielfältigen qualität jedoch trotzdem korrekt sein sollen. 4

Was ist Big Data? Der Big Data Prozess Sammlung und Speicherung von Analyse der zum Gewinn von Informationen Anwendung der Informationen zum Fällen von Entscheidungen Big Data Dimensionen Masse Vielfalt Geschwindigkeit Sehr viele in unterschiedlichen Formaten die sich schnell vervielfältigen qualität Bleibt häufig auf der Strecke jedoch trotzdem korrekt sein sollen. 5

Was ist Big Data? Der Big Data Prozess Sammlung und Speicherung von Analyse der zum Gewinn von Informationen Anwendung der Informationen zum Fällen von Entscheidungen Big Data Dimensionen Masse Vielfalt Geschwindigkeit Sehr viele in unterschiedlichen Formaten die sich schnell vervielfältigen qualität Bleibt häufig auf der Strecke jedoch trotzdem korrekt sein sollen. 6

Was ist Big Data? Der Big Data Prozess Sammlung und Speicherung von Analyse der zum Gewinn von Informationen Anwendung der Informationen zum Fällen von Entscheidungen Big Data Dimensionen Masse Vielfalt Geschwindigkeit Sehr viele in unterschiedlichen Formaten die sich schnell vervielfältigen qualität Bleibt häufig auf der Strecke jedoch trotzdem korrekt sein sollen. 7

Was ist Big Data? Der Big Data Prozess Sammlung und Speicherung von Analyse der zum Gewinn von Informationen Anwendung der Informationen zum Fällen von Entscheidungen Big Data Dimensionen Masse Vielfalt Geschwindigkeit Sehr viele in unterschiedlichen Formaten die sich schnell vervielfältigen qualität Bleibt häufig auf der Strecke jedoch trotzdem korrekt sein sollen. 8

Was ist Big Data? Der Big Data Prozess Sammlung und Speicherung von Analyse der zum Gewinn von Informationen Anwendung der Informationen zum Fällen von Entscheidungen Big Data Dimensionen Masse Vielfalt Geschwindigkeit Sehr viele in unterschiedlichen Formaten die sich schnell vervielfältigen qualität Bleibt häufig auf der Strecke jedoch trotzdem korrekt sein sollen. 9

Was ist Big Data? Der Big Data Prozess Sammlung und Speicherung von Analyse der zum Gewinn von Informationen Anwendung der Informationen zum Fällen von Entscheidungen Big Data Dimensionen Masse Vielfalt Geschwindigkeit Sehr viele in unterschiedlichen Formaten die sich schnell vervielfältigen qualität Bleibt häufig auf der Strecke jedoch trotzdem korrekt sein sollen. 10

Was ist Big Data? Der Big Data Prozess Sammlung und Speicherung von Analyse der zum Gewinn von Informationen Anwendung der Informationen zum Fällen von Entscheidungen Big Data Dimensionen Masse Vielfalt Geschwindigkeit Sehr viele in unterschiedlichen Formaten die sich schnell vervielfältigen qualität Klappt das so einfach? jedoch trotzdem korrekt sein sollen. 11

Die flut Was ist eigentlich viel? Every two days now we create as much information as we did from the dawn of civilization up until 2003. Eric Schmidt 2010 12

13

Was nicht passieren sollte 14

Praxisbeispiel Wirtschaftskriminalität Zeitnahe Analyse Großer zeitraum Compliance Management Laufende Kontrolle der entstehenden mengen auf Unregelmäßigkeiten und Verstöße Forensische analyse Analyse der in der Vergangenheit entstandenen mengen nach Bekanntwerden wirtschaftskrimineller Handlungen Aktuelle Aufdecken wirtschaftskrimineller Handlungen Strukturierte und unstrukturierte Nachweis der wirtschaftskriminellen Handlungen Vermeiden größerer Schäden Valide Analyse der Handlungsmuster zum Beheben der Schwachstellen Relevante 15

Bundeslagebild Wirtschaftskriminalität 2013 16

Statistiken des Bundeskartellamts 17

Guidelines EU-Kartellverfahren Anforderung: Vollständige, korrekte und pünktliche Lieferung der Warum werden im Kartellverfahren angefragt? Sammlung quantitativer Informationen Preise, Umsatz, Kapazitäten Markteintritts- und Marktaustrittsentscheidungen Wozu werden diese Informationen verwendet? Darstellung der Marktsituation und der Wettbewerbsdynamiken im kartellrelevanten Zeitraum Grundlage für statistische Analysen Welche werden angefragt? zu Kosten, Aufträgen, Preisen, Absatz, Kapazitäten, Produkteigenschaften, Lieferungen, Kundeneigenschaften, Details zu Ausschreibungen und Angeboten, Geschäftsstrategien, Konkurrenten Welche quellen dürfen verwendet werden? Unternehmensinterne und von dritten Beteiligten aus der Fachpresse von unabhängigen Beratern/Gutachtern oder Studien 18

Guidelines EU-Kartellverfahren Probleme Wo finden sich die jeweils geforderten? Welche Systeme? Strukturierte/unstrukturierte? Trennung der relevanten von nicht relevanten? Wie können die extrahiert werden? mengen? Systeme (SAP- und weitere)? Verwendbare Formate Speicherung und Kapazitäten SOLLTE eigentlich jedes Unternehmen liefern können!!! Ist aber nicht der Fall: qualität Sind die tatsächlich vollständig und korrekt? Welche wurden genau wann, wie und wo erzeugt? Werden alle aufgezeichnet? Wo gibt es womöglich Lücken? 19

Beispiel: Vorgehen bei der Kartellanalyse Eingrenzung Einstieg mit eines Geschäftsjahrs Ausschließlich zu Verkäufen an deutsche Kunden Besonderheit: Unterscheidung in neues und gebrauchtes Material Kartellrelevanz Vorgabe und Differenzierung kartellrelevanter Produktgruppen Vorgabe konkret nicht kartellrelevanter Produktgruppen Ein Delta ist immer vorhanden Zuordnung Zuordnung der Produktpalette zur jeweiligen Produktgruppe (Basis: Artikeltext) SCHWIERIG! Knackpunkt qualität! Aufbau eines Thesaurus zur Beschreibung jeder Produktgruppe in ihrer Vielfalt Ziel Einordnung der in Fallklassen Verringerung der menge Erleichterung der Untersuchungsarbeit 20

Schwierigkeit: Zuordnung der Produktgruppen Semantische und syntaktische Ähnlichkeit Artikellisten, Handbücher Zuordnung der Produktgruppen mithilfe des Thesaurus Abkürzungen Phasenweise Erweiterung des Thesaurus Analyse der nicht zugeordneten Artikel Thesaurus Ergebnis: - menge zur weiteren Analyse je kartellrelevanter Produktgruppe - Thesaurus zur Anwendung auf weitere im kartellrelevanten Zeitraum 21

Vielen Dank für Ihre Aufmerksamkeit 22