dacore Datenbanksysteme AG Neue Konzepte zur Optimierung der Auslastungsplanung und Big Data im Informationsmanagement

Ähnliche Dokumente
Agenda. IT-Symposium Secure Enterprise Search. Suchen und finden mit Suchmaschinen. Oracle SES Überblick

SUCHMASCHINEN XAPIAN. Michael Strzempek FH Wiesbaden, 5. Juni 2008

Apache Lucene. Mach s wie Google! Bernd Fondermann freier Software Architekt bernd.fondermann@brainlounge.de berndf@apache.org

Elasticsearch in Forschungsinfrastrukturen der Sozial- und Bibliothekswissenschaften Cloud-skalierbare Suche in Volltexten und strukturierten Daten

Alternativen zur OpenText Suche. 29. OpenText Web Solutions Anwendertagung Mannheim, 18. Juni 2012 Sebastian Henne

Neuerungen Analysis Services

Maßgeschneiderte Suchmaschinen

NI-TDM-Datenformat. Komfortables Arbeiten mit TDM-Dateien in LabVIEW

Professionelles CMS mit ZOPE und ZMS. Niels Dettenbach - Content Management mit ZMS

Übersicht. Grundidee des Indexing Lucene Wichtige Methoden und Klassen Lucene Indizierungsbeispiele Lucene Suchbeispiele Lucene QueryParser Syntax

Peter Dikant mgm technology partners GmbH. Echtzeitsuche mit Hadoop und Solr

Scandio SEBOL Search

intergator - Intelligente Suche in archivierten und anderen Daten

Case Study Bechtle AG. Javier Salas. Geschäftsführer

Neue Ansätze der Softwarequalitätssicherung

Informationsflut bewältigen - Textmining in der Praxis

Literaturverwaltungs- programme: Zotero

Kombinierte Power von Open-Source: Pazpar2 und Solr auf dem Slavistik-Portal"

VCM Solution Software

Anforderungen mobiler Routenplaner an Datenbanksysteme

miless Der Dokumentenserver auf dem Campus Essen der Universität Duisburg-Essen

Filme präsentieren im Internet Möglichkeiten und Grenzen der Online-Präsentation

Integration lokaler Daten in ifuice

Content-Management- Systeme (CMS) Inhaltsverwaltungssystem, Redaktionssystem

Industrie 4.0 und Smart Data

Jakarta Lucene. Eine Java-Bibliothek zur Suchindex-Erstellung. Seminararbeit Tilman Schneider

Hersteller: collaboration Factory AG Aktuelle Version: 4.26 Website:

Apache Solr. Apache Solr. ALD:HS WiSe 2011/2012. Einleitung. Features. Implementation. Verwaltung. Benutzung

Antwortzeitverhalten von Online Storage Services im Vergleich

ANALYTICS, RISK MANAGEMENT & FINANCE ARCHITECTURE. NoSQL Datenbanksysteme Übersicht, Abgrenzung & Charakteristik

Kompaktseminare Das MS Access 2010 Kursprogramm

Data Mining mit RapidMiner

Führungsmittelsatz - Anleitung -

SAS CONTEXTUAL ANALYSIS IN ACTION ERFAHRUNGEN AUS EINEM EIN SELBSTVERSUCH

Archivierung für MS Exchange

Best Practice: Integration von RedDot mit Livelink DM im Intranet/Extranet

Datenbanken. Produkte Dienstleistungen Referenzen

Storage-Trends am LRZ. Dr. Christoph Biardzki

Forschunsprojekte und Independent Coursework. Prof. Dr. Christian Herta 29. Januar 2013

SharePoint 2013 als Wissensplattform

Website-Suche mit OpenText Web Site Management. Frank Steffen - Senior Product Manager

Themenschwerpunkt Social SEO

Data Mining-Modelle und -Algorithmen

Systemvoraussetzungen

Data Mining im Internet

Die Analyse großer Datensätze mittels freier Datenbanksysteme Dr Dirk Meusel

Data Warehousing 0-1. DBS-Module

Workshop Was nicht passt, wird passend gemacht? tekom, Frühjahrstagung 2014 Augsburg, icms GmbH

dacore Datenbanksysteme AG Entwicklungen, Innovationen und Ausblicke

Planung auf Aufbau von SharePoint-Suchinfrastrukturen

Typo3 Handbuch Redaktion: Peter W. Bernecker Tel.: 069 / pw.bernecker@ev medienhaus.de Stand: 6. Oktober 2014

Auf dem grünen Weg - neue Aufgaben und Funktionen einer SSG-, Hochschul- und Landesbibliothek

Semestralklausur zur Vorlesung. Web Mining. Prof. J. Fürnkranz Technische Universität Darmstadt Sommersemester 2004 Termin:

COI-BUSINESSFLOW FILESYSTEM IMPORTER MODUL INFORMATION

Von der Dokumenten- zur Informationserfassung Matthias Segschneider softgate gmbh

Dokumentenserver: Praxisfragen

Präsentation Start+ Die Software für Ihre Projektorganisation und Dokumentenverwaltung

dacore Datenbanksysteme AG Entwicklungen, Innovationen und Ausblicke

APPS für Thecus NAS FTPManager

NSi AutoStore Neue und erweiterte Funktionen in AutoStore 6.0. Dokumentenbasierte Unternehmenslösungen

Das Informations-Cockpit für die Geschäftsführung Fileserver, Exchange, ERP, Sharepoint und mehr

Die folgenden Features gelten für alle isquare Spider Versionen:

Christoph Broschinski, bielefeld.de>

SharePoint Search Workshop

Innovative Dienstleistungen fördern: Verhandlung erweiterter Nutzungsszenarien für elektronische Medien

Make It Easy Ein Tool zur automatisierten Auswertung und Analyse für einen automatisierten Simulationsprozess

Die 7 Module des ECDL (Syllabus 5.0)

OPEN SOURCE ALS CHANCE FÜR UNTERNEHMEN

Was, Wie und Wo? Informationsmanagement im Prüffeld

Visuelle Suche in Digitalen Filmarchiven Visual Search in Digital Film Archives. Visuelle Exploration Digitaler Bibliothken

Modellierung eines Epidemie- Frühwarnsystems mit. Nicolas With Master Seminar WS 2012/13

swissbib Ein Metakatalog für die Schweizer Bibliotheken

Was hier fehlt? Enterprise Search mit der Intelligenz von Google. Jetzt von Kapsch.

Maschinelle Sachgruppenvergabe. Ein Projekt wird zur Routine.

EFFEKTIVE TEAM-UND PROJEKTARBEIT MIT

MySQL Queries on "Nmap Results"

Analyse der Patientenströme von Zuweisern an Spitäler

EFFEKTIVE TEAM-UND PROJEKTARBEIT MIT

Würfelturm-Editor. Neele Halbur, Helge Spieker InformatiCup März 2013

Starttermin beliebig Dauer 3-6 Monate

MCP Managing Conference Proceedings

Freebase Eine Datenbank mit RDF-Tripeln zu Personen, Orten, Dingen( )

Suchmaschinen und ihre Architektur. Seminar: Angewandtes Information Retrieval Referat von Michael Wirz

Gut zu wissen... Lorenz Keller Server Technologies Competence Center Nord

White Paper Office Add-In & Exchange

Was Google nicht findet gibt es nicht

Release Notes für Mindbreeze InSpire. Version 2015 Summer Release

Neue Funktionen in Efficy 2012 Summer

Einführung. Rechnerarchitekturen Entwicklung und Ausführung von Programmen Betriebssysteme

OPEN DATA SACHSTAND DER UMSETZUNG BEI DER STADT FRANKFURT AM MAIN

ASAM ODS 6.0 next technology

Suchmaschinen. Anwendung RN Semester 7. Christian Koczur

InLoox PM Web App Produktpräsentation

MoNav & OSRM Ein Jahr später

FABIS CRM Korrespondenz & -, Dokumenten-Management. FABIS basic 5.0


Whitepaper Bessere Suchergebnisse für PDF-Dokumente mit Foxit PDF IFiIter Server

Big Data in der Forschung

Microsoft Office von 1983 bis heute

Transkript:

dacore Datenbanksysteme AG Neue Konzepte zur Optimierung der Auslastungsplanung und Big Data im Informationsmanagement

dacore Datenbanksysteme AG Neue Konzepte zur Optimierung der Auslastungsplanung Die Problemstellung Die Ressourcenplanung ist von vielen äußeren Faktoren abhängig Es läuft immer irgendwas anders als eingeplant Prüflinge kommen später Tests dauern länger... oder es gibt Probleme mit den Anlagen Es ist schwer im vornherein die Auslastung der nächste Zeit abzuschätzen Geplanter Start? Ende 2010 dacore Datenbanksysteme AG www.dacore-dbs.com März 2016 Seite 2

dacore Datenbanksysteme AG Ein neuer Ansatz: Predict Schauen wir uns das Problem etwas genauer an Die Verschiebungen treffen uns nie unerwartet ( Ja, sowas dachte ich mir schon fast ) Ähnliche Verzögerungen treten immer wieder auf ( Das war beim letzten mal auch schon so ) Müssen wir eigentlich wirklich für jedes DUT den genauen Teststart kennen oder interessiert uns nicht eigentlich etwas anderes Wie wird die Auslastung in nächster Zeit sein? Werde ich Tests aus Kapagründen nicht rechtzeitig bedienen können? 2010 dacore Datenbanksysteme AG www.dacore-dbs.com März 2016 Seite 3

dacore Datenbanksysteme AG Ein neuer Ansatz: Predict Vorhandene (Alt-)Daten Klassifizierung Modellbildung Auslastungsplanung / Ressourcenplanung Vorhersage basierend auf Auftragslage 2010 dacore Datenbanksysteme AG www.dacore-dbs.com März 2016 Seite 4

dacore Datenbanksysteme AG Klassifikation Gute Datenlage in TestLabPlus Viele Tests Metadaten zu den Tests (Hersteller, Prüfdauer,...) Dokumentation aller Verzögerungen Data Mining und maschinelles Lernen einsetzen! Klassifikation 2010 dacore Datenbanksysteme AG www.dacore-dbs.com März 2016 Seite 5

dacore Datenbanksysteme AG Modellbildung Versicherungsmathematik ( survival analysis ) liefert ideale Grundlage Mathematische Modelle existieren Algorithmen zum fitting & sampling vorhanden Verfahren sind erprobt und robust Schätzen der Modellparameter 2010 dacore Datenbanksysteme AG www.dacore-dbs.com März 2016 Seite 6

dacore Datenbanksysteme AG Vorhersage Vorhersagen mit Hilfe des Modells Wie hoch ist die Wahrscheinlichkeit für bestimmte Events? Wie robust ist meine Planung? Automatische robuste Planung durch Simulation Besser hier einplanen? Geplanter Start? Ende Geplanter Start Ende 2010 dacore Datenbanksysteme AG www.dacore-dbs.com März 2016 Seite 7

Wahrscheinlichkeit für einzelne Tests Wahrscheinlichkeit dacore Datenbanksysteme AG Optimierte Planung Auslastung an Tag x Tag x 2010 dacore Datenbanksysteme AG www.dacore-dbs.com März 2016 Seite 8

dacore Datenbanksysteme AG Optimierte Planung Erwartete Auslastung im nächsten Monat y[, 1] 0 2 4 6 8 10 12 5 10 15 20 25 30 time 2010 dacore Datenbanksysteme AG www.dacore-dbs.com März 2016 Seite 9

dacore Datenbanksysteme AG Optimierte Planung Einsatzmöglichkeiten Nur Tests mit hoher Wahrscheinlichkeit in der Planung Visualisierung der Wahrscheinlichkeit in der Planung Automatische robuste Planung durch Simulation Vorhersage der Auslastung in der nächsten Zeit 2010 dacore Datenbanksysteme AG www.dacore-dbs.com März 2016 Seite 10

Big Data... im Informationsmanagement 2010 dacore Datenbanksysteme AG www.dacore-dbs.com März 2016 Seite 11

Big Data... im Informationsmanagement Die Problemstellung im Informationsmanagmenet Informationen liegen in verschiedenen Dokumenten in verschiedenen Systemen mehr oder weniger strukturiert In Ordnerstrukturen selbst sind Metainformationen enthalten, z.b. in Ordnernamen Andere Systeme enthalten andere Metainformationen (Empfänger/Sender bei Emails, Spalten bei Datenbanken,...) Eine Suche in allen Systemen ist nicht praktikabel und teilweise nur schwer möglich (auf Netzlaufwerken z.b.) 2010 dacore Datenbanksysteme AG www.dacore-dbs.com März 2016 Seite 12

Big Data Motivation Lookup 2010 dacore Datenbanksysteme AG www.dacore-dbs.com März 2016 Seite 13

Big Data Motivation Lookup Die Idee Daten verfügbar machen, indem man sie durchsuchbar macht ( Was man nicht findet, ist nicht da ) Dateien auf Netzlaufwerken Emails Daten aus Datenbanksystemen... 2010 dacore Datenbanksysteme AG www.dacore-dbs.com März 2016 Seite 14

Big Data Funktionsweise einer Suchmaschine Inverser Index Indizierung Suche 2010 dacore Datenbanksysteme AG www.dacore-dbs.com März 2016 Seite 15

Big Data Funktionsweise einer Suchmaschine Die Indizierung Crawlen Textextraktion Indizierung Wortverarbeitung 2010 dacore Datenbanksysteme AG www.dacore-dbs.com März 2016 Seite 16

Big Data Funktionsweise einer Suchmaschine - Crawlen Mechanismen Permanentes Crawlen Zeitgesteuertes Crawlen Vorhandene Connectoren Netzlaufwerk Datenbanken Exchange/Mail Server Erweiterung mit weiteren Crawlern problemlos möglich Netzlaufwerke Datenbanken Exchange Server... Core 2010 dacore Datenbanksysteme AG www.dacore-dbs.com März 2016 Seite 17

Big Data Funktionsweise einer Suchmaschine - Textextraktion Extraktion des Volltexts aus (fast) allen gängigen Formaten Office (Word, Excel, Powerpoint,...) Pdf Open Office... Erweiterung für Spezialformate möglich Volltextextraktion aus (HTML-)Emails Extraktion von Metadaten Autor Bearbeitungsdatum MIME-Type 2010 dacore Datenbanksysteme AG www.dacore-dbs.com März 2016 Seite 18

Big Data Funktionsweise einer Suchmaschine - Wortverarbeitung Tokenisieren Normalisierung Stop Word Filter Lemmatisierung / Stemming Ggf. weitere Filter 2010 dacore Datenbanksysteme AG www.dacore-dbs.com März 2016 Seite 19

Big Data Funktionsweise einer Suchmaschine - Indizierung Die Suche basiert auf einem inversen Index Effiziente Datenstruktur auf Basis von Apache Lucene Zusätzliche Speicherung von Positionsdaten 2010 dacore Datenbanksysteme AG www.dacore-dbs.com März 2016 Seite 20

Big Data Die Suchanfrage Aktuelles Testsystem bei Dacore enthält ca. 860.000 Dokumente Komplette Indizierung dauert ca. 2 Tage Inverser Index ist ca. 100GB groß Suchanfragen dauern ca. 20-200ms Benutzung wie google, komplexe Queries möglich Parsing / Wortverarbeitung Inverser Index 2010 dacore Datenbanksysteme AG www.dacore-dbs.com März 2016 Seite 21

Big Data Die Weboberfläche 2010 dacore Datenbanksysteme AG www.dacore-dbs.com März 2016 Seite 22

Ausblicke Big Data, Lookup und Prediction Analyse von Echtdaten zur Vorhersage von Trends zur Auslastungsplanung Erweiterung / Verbesserung der Suche Erweiterung der Connectoren Integration von TestLabPlus in die Suche MessdatenManagement Ausbau des Prototypen Importer für gängige Messdatenformate Basis Auswertealgorithmen 2010 dacore Datenbanksysteme AG www.dacore-dbs.com März 2016 Seite 23

Vielen Dank für Ihre Aufmerksamkeit! dacore Datenbanksysteme AG Hauptstr. 106b D-90562 Heroldsberg info@dacore-dbs.com www.dacore-dbs.com