Living Lab Big Data Konzeption einer Experimentierplattform



Ähnliche Dokumente
Big Data Informationen neu gelebt

MapReduce und Datenbanken Thema 15: Strom bzw. Onlineverarbeitung mit MapReduce

C09: Einsatz SAP BW im Vergleich zur Best-of-Breed-Produktauswahl

Trends im Markt für Business Intelligence. Patrick Keller, Senior Analyst & Prokurist CeBIT 2016

Herausforderungen des Enterprise Endpoint Managements

June Automic Hadoop Agent. Data Automation - Hadoop Integration

SQL on Hadoop für praktikables BI auf Big Data.! Hans-Peter Zorn und Dr. Dominik Benz, Inovex Gmbh

Lead Architects Forum Architekten im Dialog zu ILOG BRMS Moderation: Lars Klein, S&D

Copyr i g ht 2014, SAS Ins titut e Inc. All rights res er ve d. HERZLICH WILLKOMMEN ZUR VERANSTALTUNG HADOOP

Prof. Dr. Norbert Pohlmann, Institut für Internet Sicherheit - if(is), Fachhochschule Gelsenkirchen. Lage der IT-Sicherheit im Mittelstand

Apache HBase. A BigTable Column Store on top of Hadoop

MO 27. Aug. 2007, 17:00 UHR JAVA FRAMEWORKS TIPPS VON PROFI-GÄRTNERN GEGEN WILDWUCHS

SMART Newsletter Education Solutions April 2015

Analyse von unstrukturierten Daten. Peter Jeitschko, Nikolaus Schemel Oracle Austria

Test zur Bereitschaft für die Cloud

Erfahrungen mit Hartz IV- Empfängern

Was macht Layer2 eigentlich? Erfahren Sie hier ein wenig mehr über uns.

INDIVIDUELLE SOFTWARELÖSUNGEN CUSTOMSOFT CS GMBH

Welcome to the Club!

Universität Zürich Informatikdienste. SpamAssassin. Spam Assassin Go Koordinatorenmeeting 27. April

Prof. Dr.-Ing. Rainer Schmidt 1

Copyr i g ht 2014, SAS Ins titut e Inc. All rights res er ve d. HERZLICH WILLKOMMEN ZUR VERANSTALTUNG VISUAL ANALYTICS

Look Inside: desite. modellorientiertes Arbeiten im Bauwesen. B.I.M.

Weiterbildung zum Smart Homer Berater

Anleitung für die Teilnahme an den Platzvergaben "Studio II, Studio IV und Studio VI" im Studiengang Bachelor Architektur SS15

MHP Real-Time Business Solution Ihre Lösung zur Harmonisierung und Analyse polytechnischer Messdaten

Was ist Analyse? Hannover, CeBIT 2014 Patrick Keller

SOA im Zeitalter von Industrie 4.0

Industrie 4.0 in Deutschland

Big Data Mythen und Fakten

Summer Workshop Mehr Innovationskraft mit Change Management

Big Data Kundendaten im 2015 Michael Gisiger Wortgefecht Training & Beratung

Fit for Fair-Training. Unternehmensberatung. Mit Weitblick & System!

Erfolgreiche Realisierung von grossen Softwareprojekten

Vertrauen in Medien und politische Kommunikation die Meinung der Bürger

Grundlagen Software Engineering

Erziehung, Bildung und Betreuung. Ergebnisse einer repräsentativen Befragung junger Eltern

Prozessbewertung und -verbesserung nach ITIL im Kontext des betrieblichen Informationsmanagements. von Stephanie Wilke am

FDW Werbung im Kino e.v. präsentiert. ein Produkt der MediaRes GmbH & aproxima Weimar GmbH

Überblick Produkte. ORACLE AS 10g R3 JAVA Programming. (5 Tage)

Überblick und Vergleich von NoSQL. Datenbanksystemen

Web-Marketing und Social Media

BI in der Cloud eine valide Alternative Überblick zum Leistungsspektrum und erste Erfahrungen

Projekt AALuis- Ambient Assisted Living user interfaces Die Businessaspekte und die businessrelevante Einbeziehung von End-AnwenderInnen

Prozessoptimierung in der Markt- und Medienforschung bei der Deutschen Welle (DW) mit Big Data Technologien. Berlin, Mai 2013

Marketing (elektronischer Ressourcen an wissenschaftlichen Bibliotheken)

Das Zettabyte. CeBIT Dr. Wolfgang Martin Analyst, ibond Partner und Ventana Research Advisor

Erfassung von Umgebungskontext und Kontextmanagement

SIG Big Data in der Connect User Group


Internetbasierte Mitfahrbörse als JOOMLA basierte Komponente

Location based Content Delivery oder was das ibeacon-rudel im Zoo zu suchen hat

«DIE INFORMATIONSWELT MUSS EINFACHER UND AGILER WERDEN!» SCHNELLE, FLEXIBLE UND KOSTENGÜNSTIGE BUSINESS INTELLIGENCEund BIG DATA-LÖSUNGEN

Probleme kann man nie mit derselben Denkweise lösen, durch die sie entstanden sind. Albert Einstein BERATUNG

FRAGEBOGEN ANWENDUNG DES ECOPROWINE SELBSTBEWERTUNG-TOOLS

»d!conomy«die nächste Stufe der Digitalisierung

Umgang mit Daten in der Medizinischen Forschung Bedeutung von Datenbrücken

Neue Medien in der Erwachsenenbildung

Fragebogen ISONORM 9241/110-S

Medien der Zukunft 2020

Herstellung eines SIP Einsatz Package Handler

vinsight BIG DATA Solution

Wir testen mobile Apps und Webseiten. Wir nennen das Crowdtesting. Mobile Strategie Deutscher Unternehmen 2014 Zusammenfassung der Studienergebnisse

IGT-Richtlinie 01: Anforderungen an Smarthome-Systeme

Workflow Systeme mit der Windows Workflow Foundation

Wiki als strukturierte Datenbasis Die Web-App»Orte jüdischer Geschichte«und andere Praxisbeispiele

TRACK II Datenmanagement Strategien & Big Data Speicherkonzepte BI Operations Erfolgsfaktoren für einen effizienten Data Warehouse Betrieb

Social Media bei der Kreissparkasse Ludwigsburg

Erfahrungsbericht Agile Entwicklung einer BI Anwendung für das Meldewesen

Interoperabilität und Informationssicherheit mit SGAM 2. LIESA Kongress, Saarbrücken, 30. September 2015

Der Weg zur eigenen App

Neue Arbeitswelten Bürokultur der Zukunft

Next Generation CMS. API zu ihrem Content

Autorisierung. Sicherheit und Zugriffskontrolle & Erstellen einer Berechtigungskomponente

Big & Smart Data. bernard.bekavac@htwchur.ch

Installation des CMS-Systems Contao auf einem Windows-Rechner mit XAMPP

Agilität auf Unternehmensebene - Was hält uns davon ab?

UpToNet xrm und Mobiles Büro Kommunikation intelligent steuern

Fragebogen für Bewerber des DEKRA Award

Engagement der Industrie im Bereich Cyber Defense. Blumenthal Bruno Team Leader Information Security RUAG Defence Aarau, 25.

Open Source als de-facto Standard bei Swisscom Cloud Services

Worum geht es in diesem Projekt?

Innovation gestalten - von ABAP zur SAP HANA Cloud Platform

Anforderungen an die HIS

Der Business Model Contest THE VENTURE. inklusive Praxisbeispiel Carsharing- Geschäftsmodelle

GEVITAS Farben-Reaktionstest

Inside. IT-Informatik. Die besseren IT-Lösungen.

Institut für Informatik

Leitfaden Social Media in der Hamburgischen Verwaltung

Workshop für ZGV-Mitglieder zum Thema Software as a Service bzw. SOFLEX Software flexibel mieten

ANALYTICS, RISK MANAGEMENT & FINANCE ARCHITECTURE. NoSQL Datenbanksysteme Übersicht, Abgrenzung & Charakteristik

MetaNavigation der effizienteste Weg maximalen Mehrwert aus BI Metadaten zu ziehen

LANDKREIS LÜNEBURG LKLG. NAVO als strategische E-Government- Komponente am Beispiel von»elterngeld Online«

IT-SICHERHEIT IM UNTERNEHMEN Mehr Sicherheit für Ihre Entscheidung

Das Projekt wird durchgeführt von den Bezirksregierungen in Nordrhein- Westfalen in ihrer Funktion als Fachstelle für die öffentlichen Bibliotheken

Einführung in Big Data und Hadoop (mit verschiedenen Live Demos) Eintägiges Intensivseminar

Deutliche Mehrheit der Bevölkerung für aktive Sterbehilfe

Institut für Computational Engineering ICE. N ä h e r d ra n a m S ys t e m d e r Te c h n i k d e r Z u ku n f t. w w w. n t b.

Content Management System mit INTREXX 2002.

Transkript:

Living Lab Big Data Konzeption einer Experimentierplattform Dr. Michael May Berlin, 10.12.2012 Fraunhofer-Institut für Intelligente Analyseund Informationssysteme IAIS www.iais.fraunhofer.de

Agenda n Ziele des Living Lab Big Data n Living Lab Big Data Architektur n Living Lab Big Data Anwendungen n Ausblick

Ausgangslage n Viele Anwenderunternehmen sind in der Orientierungsphase n Vorstellungen von Big Data in Unternehmen oft diffus, sowohl zu n Einsatzmöglichkeiten als auch zu n vorhandenen Techniken n Ergebnisse Befragung und Zukunftsworkshops: n Hoher Bedarf an Best Practices, Training, Schulung (95% der Befragten) n Infrastruktur und Datenmanagement sind für sich genommen zu abstrakt, Lösungspotentiale zu bewerten

Im Kontext von Big Data sind bereits viele Open-Source Projekte verfügbar (eine Auswahl)

Big Data Anwendungen setzen auf eine Kombination von Tools aus verschiedenen Technologiekategorien

NoSQL Datenbanken Verteilte nichtrelationale und schemafreie Datenbanken Key/Value Graph BigTable/Columnar Document

Im Kontext von Big Data sind bereits viele Anbieter am Markt (eine Auswahl)

Barrieren n Die Auswahl der richtigen Technologie ist eine Herausforderung n keine Standardisierung n unterschiedlicher Entwicklungsstand n unzureichende Dokumentation n uneinheitliche Terminologie, n Kaum Vergleichsmöglichkeiten, Benchmarks n Kaum Personal mit Erfahrung vorhanden n Anbieter reagieren mit Out of the Box -Lösungen (z.b. Appliance) n Hohe Kosten als Einstiegshürde

Ziele des Living Labs n Lern- und Experimentierumgebung für Unternehmen n Technik anfassbar machen, Einstiegshürden herabsetzen n Teil eines Schulungskonzeptes Data Science n Präsentation von Big-Data-Problemlösungen am Beispiel einer durchgängigen Anwendung des gesamten Technologie-Stacks n Verschiedene öffentlich verfügbare Big-Data-Datenbestände werden eingespielt und stehen zum Testen zur Verfügung. n Analyseverfahren für Big Data, die im Rahmen des THESEUS-Programms zum Thema Smart Semantics (Quote und Eat&Drink) entwickelt wurden n Hardwareinfrastruktur steht nicht im Fokus n Vorwettbewerblich, herstellerneutral, erweiterbar

Agenda n Ziele des Living Lab Big Data n Living Lab Big Data Architektur n Living Lab Big Data Anwendungen n Ausblick

Design Living Lab n Nicht eine einzelne Technologie (z.b. Hadoop, NoSQL), sondern eine Big Data Architektur, die flexibel genug ist, n verschiedenste Einsatzzwecke in verschiedensten Branchen abzudecken n es in den einzelnen Komponenten erlaubt, Technologien gegeneinander auszutauschen und z.b. auch eine individuelle Entscheidung zwischen OpenSource und kommerziellen Angeboten zu treffen n Erst wenn man in Architekturen denkt, erschließen sich Stärken und Schwächen existierender Technologien

«Lambda Architecture» Quelle: Nathan Marz. Big Data: Principles and Best Practices of Scalable Realtime Data Systems. 2013

Living Lab - Architektur Serving Layer

Agenda n Ziele des Living Lab Big Data n Living Lab Big Data Architektur n Living Lab Big Data Anwendungen n Ausblick

Big Data Experimentierplattform Technologie zum Anfassen im Rahmen des Schulungsmoduls Data Scientist Big Data Batch-Anwendung Analyse von Kundenfeedback Realtime-Anwendung Big Data Themenmonitor 6 Milliarden Webseiten (Q1/2012) ~ 20TB nur Text Ausgewählte Technologien Anwendungsfälle Big Data Datensatz

Anwendungsfall: Monitoring von Themen

Batch Layer - Zyklus von Stunden oder Tagen Hadoop HDFS Map Reduce - Cascading Smart Semantic Components mime-type detection mime-type filter text + title extraction hash duplicate detection { "name" : "Leibniz Rechenzentrum", "kind" : "F +E", "language" : "de,en", "url" : "http://www.lrz.de/", "lat" : 39.145271, "lon" : -75.418762, "keywords" : [ { "key" : "Big Data", "count" : 2 }, { "key" : "Hadoop", "count" : 2 } ], "time" : "2012-12-07T11:57+0100" }.. Voldemort language detection lang. filter ('de','en') keyword extraction geo-location

Speed Layer Streaming Storm Bolt Sequence Smart Semantic Components mime-type detection mime-type filter text + title extraction language detection Lang. filter ('de', 'en') keyword extraction geo-location { "name" : "Fraunhofer IAIS", "language" : "de,en", "url" : "http://www.iais.fraunhofer.de/", "lat" : 50.74899, "lon" 7.20575, "keywords" : [ {"key" : "MapReduce", "count" : 7 }, {"key" : "Big Data", "count" : 64}, {"key" : "Hadoop", "count" : 6 } ], "time" : "2012-12-07T11:57+0100", "kind" : "F+E" } ------------------------------------..,{ "url" : "http://www.iais.fraunhofer.de/ sitemap.html", "keywords" : [ "Big Data" ], "institutionurl" : "www.iais.fraunhofer.de", "title" : "Sitemap", "lang" : "de" }, { "url" : "http://www.iais.fraunhofer.de/ 4858.html", "keywords" : [ "MapReduce", "Big Data" ], "institutionurl" : "www.iais.fraunhofer.de", "title" : "Integrated Data Mining", "lang" : "de },

Anwendungsfall: Kundenfeedbackanalyse App Eat&Drink

Living Lab Use Case 2 Workflow

Living Lab Technologiealternativen Oracle Exadata

Living Lab Technologiealternativen ParStream

Living Lab Technologiealternativen Teradata Aster

Living Lab Technologiealternativen DB2 IBM Infosphere Stream

Living Lab Technologiealternativen MapR Filesystem MapR MapReduce

Living Lab Technologiealternativen Cloudera HDFS Cloudera MapReduce

Living Lab Technologiealternativen Apache Drill

Agenda n Ziele des Living Lab Big Data n Living Lab Big Data Architektur n Living Lab Big Data Anwendungen n Ausblick

Wie kann das Living Lab genutzt werden? n Zielgruppe: Data Scientists, Analysten, Entwickler n Teil des Schulungskonzeptes Data Scientist Big Data Management n Schulungsmodul n Individuelle Workshops n Bring your own Data n In-House-Installation möglich

Geplante Data Scientist Schulungen von Fraunhofer IAIS Big Data Management Data Scientist Natural Language Processing (NLP) Data Scientist Big Data Analytics Basics Data Scientist Visual Analytics 2-3 Tage 2 Tage 2 Tage Ab März 2013 Ab Oktober 2012 Ab Februar 2013 2 Tage Ab Februar 2013

Nächste Schritte n Diskussion von Referenzarchitekturen im Arbeitskreis Big Data der BITKOM n Gespräche mit Anbietern n Public-Private-Partnership n Living Lab Big Data@CEBIT 2013

Zusammenfassung n Das Living Lab macht Big Data anfassbar n Ziel: Orientierung, Best Practices, Schulung n Zentrales Architekturkonzept: Lambda Architektur n Basiert auf Open-Source-Komponenten n Durch kommerzielle Komponenten teilweise substituierbar n Erlaubt Exploration von Alternativen n Herstellerunabhängig, vorwettbewerblich