Big & Smart Data. bernard.bekavac@htwchur.ch



Ähnliche Dokumente
Data. Guido Oswald Solution Switzerland. make connections share ideas be inspired

Prof. Dr.-Ing. Rainer Schmidt 1

SWOT Analyse zur Unterstützung des Projektmonitorings

BERECHNUNG DER FRIST ZUR STELLUNGNAHME DES BETRIEBSRATES BEI KÜNDIGUNG

8 Juli Transparenz durch Governance Data Governance als kritischer Erfolgsfaktor für Predictive Analytics

Mehr Umsatz durch Übersetzungen? Geht das?

Anleitung über den Umgang mit Schildern

Blumen-bienen-Bären Academy. Kurzanleitung für Google Keyword Planer + Google Trends

Big, Bigger, CRM: Warum Sie auch im Kundenmanagement eine Big-Data-Strategie brauchen

Wie Projektziele gemessen werden können oder wie man Indikatoren entwickeln kann?

Repräsentative Umfrage zur Beratungsqualität im deutschen Einzelhandel (Auszug)

Erfahrungen mit Hartz IV- Empfängern

Online-Werbung. Welche Möglichkeiten der Online-Annoncen gibt es? Google AdWords und Co.

Anleitung für den Euroweb-Newsletter

Spiel und Spaß im Freien. Arbeitsblat. Arbeitsblatt 1. Zeichnung: Gisela Specht. Diese Vorlage darf für den Unterricht fotokopiert werden.

Abitur 2007 Mathematik GK Stochastik Aufgabe C1

Whitepaper. Produkt: combit Relationship Manager 7. combit Relationship Manager -rückläufer Script. combit GmbH Untere Laube Konstanz

Was ich als Bürgermeister für Lübbecke tun möchte

meinpflegedienst.com Release Notes 3.4

Anleitung Redmine. Inhalt. Seite 1 von 11. Anleitung Redmine

Grundsätze für das Online-Marketing der TMB

TOP. wird ein wichtiges Jahr für BIG (Business Intelligence Growth) DER BUSINESS INTELLIGENCE TRENDS FÜR DAS JAHR 2013

Professionelle Seminare im Bereich MS-Office

SCHRITT 1: Öffnen des Bildes und Auswahl der Option»Drucken«im Menü»Datei«...2. SCHRITT 2: Angeben des Papierformat im Dialog»Drucklayout«...

Version smarter mobile(zu finden unter Einstellungen, Siehe Bild) : Gerät/Typ(z.B. Panasonic Toughbook, Ipad Air, Handy Samsung S1):

Suchergebnisdarstellung in Google, Bing, Cuil, etc. Christina Ficsor

Frühstück. Frühstück an Werktagen? Es frühstücken an einem normalen Werktag üblicherweise. jeden Tag ab und zu gar nicht *) % % %

Wie Sie beliebig viele PINs, die nur aus Ziffern bestehen dürfen, mit einem beliebigen Kennwort verschlüsseln: Schritt 1

THE KNOWLEDGE PEOPLE. CompanyFlyer.indd :48:05

BEO-SANKTIONSPRÜFUNG Eine Einführung zum Thema Sanktionsprüfung und eine Übersicht zur BEO-Lösung.

Datenübernahme aus Profi-Cash

Sichere Netlog-Einstellungen

Prüfungszeiten für den Studiengang Bachelor of Science in Psychologie

Umstieg auf Microsoft Exchange in der Fakultät 02

Thermodynamik Primärenergie

e LEARNING Kurz-Anleitung zum Erstellen eines Wikis 1. Wiki erstellen

Die Invaliden-Versicherung ändert sich

IT-SICHERHEIT IM UNTERNEHMEN Mehr Sicherheit für Ihre Entscheidung

8 Gründe.. WARUM IHR UNTERNEHMEN ENGLISCHSPRACHIGE MITARBEITER BRAUCHT

GEFUNDEN WERDEN. WAS GOOGLE GUT FINDET CONLABZ GMBH, TIMO HERBORN + DANIEL SCHMIDT

1 WEB ANALYTICS: PROFESSIONELLE WEB-ANALYSEN UND REPORTING FÜR IHR ONLINE MARKETING.

Freunde, Fans und Faszinationen: Das Potenzial von Social Media

Der virtuelle Arbeitsmarkt in Deutschland Q2-2015

Übungen Programmieren 1 Felix Rohrer. Übungen

Meet the Germans. Lerntipp zur Schulung der Fertigkeit des Sprechens. Lerntipp und Redemittel zur Präsentation oder einen Vortrag halten

So erstellen Sie nützliche Beschreibungen zu Ihren Tradingdaten

Leichte-Sprache-Bilder

Angaben zu einem Kontakt...1 So können Sie einen Kontakt erfassen...4 Was Sie mit einem Kontakt tun können...7

Individuelles Qualifikationsprofil für

Archiv - Berechtigungen

Themenbereich "Bestattungskosten"

Datenexport aus JS - Software

Drei Fragen zum Datenschutz im. Nico Reiners

Makigami, Prozessmapping und Wertstromdesign. erstellt von Stefan Roth

Hilfe zur ekim. Inhalt:

Väter in Familienunternehmen Die Ursachenstiftung Oktober 2012

Linearen Gleichungssysteme Anwendungsaufgaben

36. SonntagsBlick Langlaufplausch 2015 Anleitung für eine Gruppenanmeldung

EIN C.A.F.E. FÜR DEN DATENSCHUTZ

Handbucherweiterung Zuschlag

Leit-Bild der Sonnenhofschule

Grafiksatz fertige Buttons blue

Installation und Bedienung von vappx unter ios

Was meinen die Leute eigentlich mit: Grexit?

Agentur für Werbung & Internet. Schritt für Schritt: -Konfiguration mit Apple Mail

Folgen KMU dem Megatrend Mobile-Business?

Der Wert von Lebensmitteln Umfragen im Auftrag des BMELV

Fragebogen für eine qualitative/quantitative Befragung zur Mediencommunity 2.0 aus Sicht der Lernenden

Kaufkräftige Zielgruppen gewinnen

Dow Jones am im 1-min Chat

Installation und Bedienung von vappx unter Android

Projekt- Management. Landesverband der Mütterzentren NRW. oder warum Horst bei uns Helga heißt

Verkaufen Sie doch wo Sie wollen. Ihr einfacher Weg zu mehr Umsatz und dauerhaft steigendem Erfolg im E-Business

Fachdidaktik der Informatik Jörg Depner, Kathrin Gaißer

FULFILLMENT VON ALLYOUNEED

UpToNet DMS Posteingang

40-Tage-Wunder- Kurs. Umarme, was Du nicht ändern kannst.

Lausanne, den XX yyyyy Sehr geehrte Frau/ Herr,

TTS - TinyTimeSystem. Unterrichtsprojekt BIBI

6. Bayes-Klassifikation. (Schukat-Talamazzini 2002)

36. SonntagsBlick Langlaufplausch 2015 Anleitung für die Online-Anmeldung

Anwendungsbeispiele Buchhaltung

Anleitung für die Teilnahme an den Platzvergaben "Studio II, Studio IV und Studio VI" im Studiengang Bachelor Architektur SS15

Gezielt über Folien hinweg springen

Internet Explorer Version 6

Jeder in Deutschland soll ab Mitte 2016 ein Konto eröffnen können.

1. Weniger Steuern zahlen

Unterrichtsmaterialien in digitaler und in gedruckter Form. Auszug aus:

COMPUTERKURS FÜR SENIOREN. Rainer Blaschke, Anita Sepin Okt/Nov 2013

Landes-Arbeits-Gemeinschaft Gemeinsam Leben Gemeinsam Lernen Rheinland-Pfalz e.v.

Gehen Sie Ihren Weg zielgenau! Existenzgründung Unternehmenskauf Nachfolge - Expansion Neuausrichtung

Layoutmodelle. Steffen Schwientek Große Klostergasse Friedberg schwientek@web.de Web :schlaukopp.org

Auslotung der Gefühle & Wünsche von Eltern und SchülerInnen zum Schuljahr 2011/2012

PK-Website: Besuche & Seitenaufrufe 2010 und 2011

Studieren- Erklärungen und Tipps

3. Neuen Newsbeitrag erstellen Klicken Sie auf das Datensatzsymbol mit dem +, damit Sie einen neuen Newsbeitrag erstellen können.

Würfelt man dabei je genau 10 - mal eine 1, 2, 3, 4, 5 und 6, so beträgt die Anzahl. der verschiedenen Reihenfolgen, in denen man dies tun kann, 60!.

Zahlenwinkel: Forscherkarte 1. alleine. Zahlenwinkel: Forschertipp 1

Transkript:

Big & Smart Data Prof. Dr. Bernard Bekavac Schweizerisches Institut für Informationswissenschaft SII Studienleiter Bachelor of Science in Information Science bernard.bekavac@htwchur.ch Quiz An welchem Wochentag wird in den USA am meisten nach dem Begriff "hangover" gesucht? Montag Dienstag Mittwoch hangover Donnerstag Freitag Samstag 1

Google trends: "hangover" Google trends: "hangover" 2

Übersicht Ist Data Science ein (oder das) "Big Thema"? Was ist Big Data? Was macht man damit? Ist das Thema wirklich so relevant? Was ist Smart Data? Exkurs: California / Gold Rush 3

Exkurs: California / Data Rush Exkurs: California / Data Rush 4

Exkurs: ischool, Berkeley, Spring 2012 Thought Leaders in Data Science and Analytics Spring, 2012, University of California, Berkeley Exkurs: ischool, Berkeley, Spring 2012 5

Übersicht Ist Data Science ein (oder das) "Big Thema" Was ist Big Data? Was macht man damit? Ist das Thema wirklich so relevant? Was ist Smart Data? Definition Big Data Als Big Data werden besonders große Datenmengen bezeichnet, die mit Hilfe von Standard-Datenbanken und Daten-Management-Tools nicht oder nur unzureichend verarbeitet werden können. Problematisch sind hierbei vor allem die Erfassung, die Speicherung, die Suche, Verteilung, Analyse und Visualisierung von grossen Datenmengen. Das Volumen dieser Datenmengen geht in die Terabytes, Petabytes, Exabytes und Zettabytes. de.wikipedia.org 6

Big Data Petabytes/Exabytes an Daten Millionen/Milliarden von Benutzern Milliarden/Trilliarden an Datensätzen Unstrukturiert Fehlender Kontext Quelle: DOMO Inc. Big Data 10 Millionen Datenquellen Datenproduktion 14h/Tag an mehr als 7 Monaten/Jahr 6 Petabytes im Jahr CERN 7

Big Data Analyse: Google prediction Hong Kong Tourism Board Monthly visitor arrival summary Google Trends Travel by category Monatliche Besucherstatistiken mit 4-wöchiger Verzögerung Angabe von Herkunftsländern Daten von 2004-2008 Big Data Analyse: Google prediction Besucherstatistiken vs. Google Trends (aus Choi/Varian 2009) 8

Big Data Analyse: Google prediction Big Data alleine reicht nicht aus! (Statistische) Analysen notwendig und geeignete Modellbildung (für jeden Anwendungsfall) Bsp.: Verwendung des Seasonal Autoregressive Models (AR) yt = b1yt-1 + b12yt-12 + b0xt + et yt = Besucher aus einem bestimmten Land im Monat t xt = Google Trends index (Hong Kong) für die ersten zwei Wochen im selben Monat liefert Vorhersagen für reale Besuche 6 Wochen im Voraus Big Data Analyse: Google prediction Besucherstatistiken vs. Google Prediction (aus Choi/Varian 2009) 9

Big Data Analyse: Visualisierung Wikipedia Visualisierung Wattenberg, Viégas, Hollenbach, 2007 Big Data Analyse: Visualisierung de.guttenplag.wikia.com 10

Übersicht Ist Data Science ein (oder das) "Big Thema"? Was ist Big Data? Was macht man damit? Ist das Thema wirklich so relevant? Was ist Smart Data? Ist Big Data wirklich so relevant? Studie der Zeitschrift Information Week (09/2012) Befragung von 257 Unternehmen (USA/Kanda) > 50 Mitarbeiter (75% > 500) > 500 TB (13% > 10 PB) 50% haben einen Umsatz > 100 Millionen US$, 28% > 1 Milliarde 11

Ist Big Data wirklich so relevant? Ergebnisse der Studie: > 50% der Unternehmen analysieren nur einen geringen Teil (< 100 TB) der gespeicherten Daten Die Datenqualität ist bei den meisten Unternehmen nicht sichergestellt (z.b. Daten aus Geolokalisierung, keine Qualitätsanalyse, keine Stichproben o.ä.) Mobile Endgeräte werden überschätzt Ist Big Data wirklich so relevant? Ergebnisse der Studie: "tools over people" (meist Hadoop, NoSQL, Splunk) Es gibt kaum Experten auf dem Arbeitsmarkt ("The sexy job in the next 10 years will be statisticians" - Hal Varian, Google Inc.) Output / Effizienz der Analysen fraglich 12

Übersicht Ist Data Science ein (oder das) "Big Thema"? Was ist Big Data? Was macht man damit? Ist das Thema wirklich so relevant? Was ist Smart Data? Definition Smart Data wikipedia.org 13

Smart Data, intuitiv Daten "erklären" sich selbst Daten sind mit ihrer Bedeutung (Semantik) versehen Auf Basis formaler Beschreibungen der Semantik (OWL, RDF etc.) ist eine automatisierte Verarbeitung der Daten möglich (SPARQL) Daten werden auf Basis von URI/HTTP (offen) vernetzt Vielen Dank für Ihre Aufmerksamkeit und viel Spass bei den nachfolgenden Vorträgen 14