Big-Data-Analysen: Möglichkeiten, Herausforderungen und Gefahren
|
|
- Christian Brauer
- vor 8 Jahren
- Abrufe
Transkript
1 Foto: Anita Ritenour CC BY 2.0 Erfurt, 2.Juli 2014 Big-Data-Analysen: Möglichkeiten, Herausforderungen und Gefahren Kai-Uwe Sattler! Ilmenau!
2 Was sind Big Data? Foto: Scott Ableman CC BY-NC-ND 2.0 2
3 Big Data Big Data = zu groß für herkömmliche Methoden, wie z.b. SQL-Datenbanken, Statistik, Quelle: Gartner Newsroom Google Trends 3
4 Die 3Vs von Big Data Variety Text, Photo, Video XML RDBMS MB Batch Intervall Realtime ZB PB Velocity Volume Quelle: META Group
5 Warum Big Data? Verfügbarkeit großer Datenmengen! Weblogs, Soziale Netze, IP und Mobilfunk, Umweltsensorik und Surveillance, Tracking (Warenbewegung, Fitness, )! Verknüpfung verschiedener Daten: persönliche Daten und Beziehungen, Interessen, Aufenthaltsorte,! verfügbare Speicherplatz- und Verarbeitungskapazität! Hardware-Preisverfall, Data Center und Cloud Computing, 5
6 Warum Big Data? neuer Markt! IT-Lösungen für Big Data (Cloud Computing, MapReduce, In-Memory- Computing, NoSQL, Data Mining, )! Data as a Service, Data Broker! Mustersuche und Vorhersagemodelle! typisches Verhalten: Produktempfehlungen beim Shopping, Fraud Detection (Kreditkarten),! Vorhersage von Verhalten, Ereignissen: Aktienkurse, Grippefälle, 6 Foto: 401(K) 2012 CC-BY-SA 2.0 Quelle: Google Flu Trends
7 Datenaufkommen Google: 20 PB Daten pro Tag, 35 h Video- Uploads pro Minute! Valve Steam: 20 PB Content pro Monat! CERN s LHC: 15 PB Daten pro Jahr Studie von EMC 2011:! 1,8 Zettabyte Daten ( )! Verdopplung alle 2 Jahre als DVD-Stapel: km! als Filme: 200 Mrd. Filme mit 47 Millionen Jahre Spielzeit Studie Deutsche Telekom zu vernetzten Fahrzeugen:! 5 GB pro Fahrzeug und Monat (ca. 40. Mill. Fahrzeuge in D) 7 Quelle: Foto:
8 Techniken zur Analyse von Big Data Foto: Sergei Golyshev CC BY-NC-SA 2.0 8
9 Data Mining semi-automatische Extraktion von gültigen, potentiell nützlichen und bisher unbekannten Wissen aus Daten! deskriptive Verfahren: Extraktion von Mustern oder Parametern, die Daten beschreiben! Korrelationen, Cluster, Anomalien, Trajektorien,! prädiktive Verfahren: Nutzung von Merkmalen zur Vorhersage unbekannter oder zukünftiger Werte anderer Merkmale Foto: Paul Lowry CC BY 2.0 9
10 Data Mining: Clustering Ziel: Gruppierung von ähnlichen Objekten! Alter Einkommen Ähnlichkeitsmaß! Dimensionsauswahl! Anwendung:! Kundensegmentierung! Erstellung von Profilen! Alter Zusammenfassung ähnlicher Dokumente 10 Einkommen
11 Data Mining: Frequent Itemsets Ziel: Aufdeckung statistischer Zusammenhänge zwischen Variablen! Ableitung von Assoziationsregeln! Anwendungen:! Warenkorbanalyse! Kunde Artikel #1 Bier, Pringles #2 Bier, Milch, Pringles #3 Bier, Milka, Pringles #4 Bier, Milka, Cola Wenn jemand Bier kauft, dann kauft er auch Pringles! Ko-Lokation von Ereignissen! Muster in Graphen 11
12 Data Mining: Klassifikation Ziel: Zuordnung von Objekten zu verschiedenen vorgegebenen Klassen, d.h. Vorhersage von Merkmalen (Klassenzuordnung) anhand anderer Merkmale! Ableitung des Klassifikationsmodells aus einer Trainingsmenge! Beispiel: Entscheidungsbaum Kunde Schulden 12 hoch ja Einkommen nein Einkommen niedrig nein Schulden Wohneigentum ja ja ja Wohneigentum Kreditwürdig 1 nein hoch ja ja 2 nein niedrig nein nein 3 ja hoch nein nein nein nein
13 Analyse sozialer Netzwerke Daten mit persönlichen Profilen und Bekanntschaftsbeziehungen (Facebook, Twitter, , )! Ziele: Identifikation von! Hubs, Communities,! Anwendungen:! People You May Know! Recruiting! kollaboratives Filtern! Netzwerkanalyse: Diffusionsmechanismen, Anna Luca Martin Leon Quelle: LinkedIn InMaps Fabian Laura Kevin 13
14 Erstellung von Bewegungsprofilen Generierung geoferenzierter Daten durch! Navigationssysteme, GPS-Tracker, Smartphones (Mobilfunk, GPS), Fitness-Tracker,! Nutzung für! Region of Interest #ID; Zeit; Ort 42; 15:00; 51.9, ; 15:05, 51.9, , 15:06, 52.2, 9.8! =1h Verkehrs- und Routenplanung, lokationsbasierte Dienste, Dauer zum Ziel, Häufige Orte 14
15 Herausforderungen Datenvolumen:! 10 Mrd. Webseiten a 20 KB = 200 TB! Computer mit 50 MB/s Disk IO, 200 Disks! Lesen der Daten = 1085 h = 45 Tage! aber: mit 200 Maschinen nur 5 h!! Heterogenität der Daten:! Struktur: verschiedene Formate (Dateien, Texte, Bilder, Videos, Datenbanken)! Inhalt: verschiedene Repräsentationen gleicher Sachverhalte (z.b. für die gleiche Person)! Dynamik:! Sensordaten: schmutzig, zeitlich begrenzt gültig, potentiell unendlich lange Ströme Foto: Maria Ly CC BY-SA
16 Datenparallele Verarbeitung Zerlegung der Daten in Partitionen! verteilte und parallele Verarbeitung der Partitionen Foto: Yahoo! Skalierbarkeit der Algorithmen für Server! Umgang mit Fehlern (etwa durch Ausfälle) 16
17 Datenparallele Verarbeitung mit MapReduce Programmierparadigma für datenparallele Verarbeitung! von Google entwickelt! verfügbar u.a. im Rahmen von Apache Hadoop! Einsatzbereich:! große Mengen (schwach) strukturierter Daten! Cluster-Umgebung aus Commodity Hardware für kosteneffiziente Skalierung! Plattform für verschiedene Projekte: HDFS, Pig, Hive, Spark 17
18 MapReduce: Prinzip Extrahieren, Filtern, Transformieren, Aggregieren, Eingabe inp 1 inp 2 inp n [Schlüssel, Datensatz] map map map map [Schlüssel, Datensatz] shuffle & sort [Schlüssel, Datensätze] reduce reduce reduce f(datensätze) Ergebnis out 1 out 2 18
19 Big-Data-Analyse als Prozess Datenakquisition Extraktion & Bereinigung Integration & Aggregation Modellbildung & Analyse Auswahl und Erfassung der Daten, Online-Filterung Informations-/Featureextraktion, Behandlung von Datenfehlern, Verbesserung der Datenqualität Transformation, Behandlung von Heterogenitäten, Verdichtung Datenanalyse, Data Mining Interpretation Bewertung und Interpretation der Ergebnisse 19
20 Möglichkeiten und Risiken Foto: andy_c CC BY
21 Möglichkeiten: esciences Beispiel Sloan Digital Sky Survey:! Kartierung von 25% des Himmels mit Spektroskopie! >1000 wiss. Artikel basierend auf Datenanalyse datengetriebene Forschung in den Naturwissenschaften: Astronomie, Ozeanographie, Genforschung,! teilweise 25-50% des Budgets für Cyber-Infrastruktur! The quest for knowledge used to begin with grand theories. Now it begins with massive amount of data. Welcome to the Petabyte Age. Datenexploration als 4. Paradigma Quelle: 21
22 Möglichkeiten: ebusiness Produktempfehlungen auf Shopping- Sites durch Warenkorbanalyse Fraud Detection: Erkennung von Kreditkartenmissbrauch! Beispiel Mastercard: jährlicher Schaden von ca. 8 Mrd. $, 65 Mrd. Transaktionen/ Jahr, > Regeln Produktgestaltung! Herr Müller nutzt seine Kreditkarte nur am Wochenende zum Tanken. Beispiel Netflix: 33 Mill. Kunden, 30 Mill. Abspielvorgängen, 3 Mill. Suchen, 4 Mill. Bewertungen täglich! Nutzung für Planung neuer Serien basierend auf Kunden 22
23 Möglichkeiten: Prozessoptimierung Beispiel UPS Analyse von Sensordaten der Fahrzeuge! ORION = On-Road Integrated Optimization and Navigation! Streckenoptimierung, Vorhersage der Ankunftszeiten! Einsparung von 85 Mill. Meilen / Jahr (Quelle: Wired) 23 Quelle: Wikipedia B A D 4 E G 5 H 7 C 2 F
24 Risiken: Signal vs. Rauschen Datenaufkommen Rauschen Signal heute siehe auch spurious tail (N. Taleb): Vergrößerung der Stichprobe verstärkt Rolle des Rauschens / des Zufalls 24
25 Risiken: Privacy Aufdecken von Identitäten durch Verknüpfung und Analyse von Daten! AOL Search Data Leak 2006! Veröffentlichung von 20 Mill. Suchanfragen! Identifikation einzelner Personen anhand ihrer Suchhistorie: Thelma Arnold, User927,! Data Broker Report, FTC Mai 2014! Beispiel Acxiom: umfassende Daten von über 700 Mill. Kunden weltweit, bis zu Datenpunkte pro Kunde! Dienste: Marketing, Risikobewertung (Kreditwürdigkeit, Identitäts-/ Missbrauchserkennung), Personensuche! Datensammlung aus verschiedensten Quellen (inkl. Offline-Daten) ohne Wissen der Kunden, fehlende Transparenz! falsche Risikobewertung, Datenmissbrauch 25
26 Risiken: Filterblase Personalisierung von Suchergebnissen, Nachrichten,! Ranking/Filterung von Suchergebnissen bei Suchmaschinen durch Signale wie Suchhistorie, Nutzung von Ergebnissen, Ads,! Risiko der intellektuellen Isolierung durch Einschränkung/ Ranking der Suchergebnisse If you like this, you like that. Facebook-Experiment mit Manipulation von Newsfeeds! Filterung der Nachrichten von Nutzern! Einfluss positiver/negativer Nachrichten 26
27 Fazit und Ausblick Big Data als Herausforderung für Datenmanagement und Datenanalyse! geschätztes Marktvolumen: $ 50 Mrd. in 2017 (Quelle: Wikibon)! neue Disziplinen (Data Sciences) und Märkte (Data Broker)! Technologien nicht selbstbeschränkend; daher Regeln und Transparenz erforderlich 27 Foto: Dolina Wiedzy CC BY-NC 2.0
Risiken bei der Analyse sehr großer Datenmengen. Dr. Thomas Hoppe
Risiken bei der Analyse sehr großer Datenmengen Dr. Thomas Hoppe Datenaufbereitung Datenanalyse Data Mining Data Science Big Data Risiken der Analyse Sammlung Integration Transformation Fehlerbereinigung
MehrBig Data in der Forschung
Big Data in der Forschung Dominik Friedrich RWTH Aachen Rechen- und Kommunikationszentrum (RZ) Gartner Hype Cycle July 2011 Folie 2 Was ist Big Data? Was wird unter Big Data verstanden Datensätze, die
MehrBig Data Mythen und Fakten
Big Data Mythen und Fakten Mario Meir-Huber Research Analyst, IDC Copyright IDC. Reproduction is forbidden unless authorized. All rights reserved. About me Research Analyst @ IDC Author verschiedener IT-Fachbücher
MehrBig Data: Nutzen und Anwendungsszenarien. CeBIT 2014 Dr. Carsten Bange, Gründer und Geschäftsführer BARC
Big Data: Nutzen und Anwendungsszenarien CeBIT 2014 Dr. Carsten Bange, Gründer und Geschäftsführer BARC Big Data steht für den unaufhaltsamen Trend, dass immer mehr Daten in Unternehmen anfallen und von
MehrDatenanalyse im Web. Einführung in das Thema. Prof. Dr. Ingo Claÿen. Beispiele für Daten im Web. Extraktion und Aggregation von Informationen
Datenanalyse im Web Einführung in das Thema Prof. Dr. Ingo Claÿen Hochschule für Technik und Wirtschaft Berlin Beispiele für Daten im Web Extraktion und Aggregation von Informationen Datenanalyse im Web
MehrBig Data Informationen neu gelebt
Seminarunterlage Version: 1.01 Copyright Version 1.01 vom 21. Mai 2015 Dieses Dokument wird durch die veröffentlicht. Copyright. Alle Rechte vorbehalten. Alle Produkt- und Dienstleistungs-Bezeichnungen
MehrETL in den Zeiten von Big Data
ETL in den Zeiten von Big Data Dr Oliver Adamczak, IBM Analytics 1 1 Review ETL im Datawarehouse 2 Aktuelle Herausforderungen 3 Future of ETL 4 Zusammenfassung 2 2015 IBM Corporation ETL im Datawarehouse
MehrProf. Dr.-Ing. Rainer Schmidt 1
Prof. Dr.-Ing. Rainer Schmidt 1 Business Analytics und Big Data sind Thema vieler Veröffentlichungen. Big Data wird immer häufiger bei Google als Suchbegriff verwendet. Prof. Dr.-Ing. Rainer Schmidt 2
MehrProzessoptimierung in der Markt- und Medienforschung bei der Deutschen Welle (DW) mit Big Data Technologien. Berlin, Mai 2013
Prozessoptimierung in der Markt- und Medienforschung bei der Deutschen Welle (DW) mit Big Data Technologien Berlin, Mai 2013 The unbelievable Machine Company? 06.05.13 The unbelievable Machine Company
MehrAPTs: Sind gezielte Angriffe normal? Jürgen Eckel Eckel.J@ikarus.at Helene Hochrieser Hochrieser.H@ikarus.at
APTs: Sind gezielte Angriffe normal? Jürgen Eckel Eckel.J@ikarus.at Helene Hochrieser Hochrieser.H@ikarus.at Welche Anomalien können gefunden werden? Wie lässt sich anormales Verhalten extrahieren? Zeithorizont
MehrPositionspapier Big Data
TeleTrusT-interner Workshop Berlin, 05.06.2014 Positionspapier Big Data Oliver Dehning, antispameurope GmbH Leiter der AG Cloud Security Definition Big Data Big Data bezeichnet große Datenmengen (Volume)
MehrBig & Smart Data. bernard.bekavac@htwchur.ch
Big & Smart Data Prof. Dr. Bernard Bekavac Schweizerisches Institut für Informationswissenschaft SII Studienleiter Bachelor of Science in Information Science bernard.bekavac@htwchur.ch Quiz An welchem
MehrApache HBase. A BigTable Column Store on top of Hadoop
Apache HBase A BigTable Column Store on top of Hadoop Ich bin... Mitch Köhler Selbstständig seit 2010 Tätig als Softwareentwickler Softwarearchitekt Student an der OVGU seit Oktober 2011 Schwerpunkte Client/Server,
MehrWie wichtig ist Social Media Marketing für mein Google Ranking?
Wie wichtig ist Social Media Marketing für mein Google Ranking? 1 Kurzvorstellung adisfaction Fullservice-Digital-Agentur Büros in Meerbusch und Zürich Gegründet 2002, 20 Mitarbeiter Searchmetrics Pionier
MehrEXASOL Anwendertreffen 2012
EXASOL Anwendertreffen 2012 EXAPowerlytics Feature-Architektur EXAPowerlytics In-Database Analytics Map / Reduce Algorithmen Skalare Fkt. Aggregats Fkt. Analytische Fkt. Hadoop Anbindung R LUA Python 2
MehrData. Guido Oswald Solution Architect @SAS Switzerland. make connections share ideas be inspired
make connections share ideas be inspired Data Guido Oswald Solution Architect @SAS Switzerland BIG Data.. Wer? BIG Data.. Wer? Wikipedia sagt: Als Big Data werden besonders große Datenmengen bezeichnet,
MehrMapReduce und Datenbanken Thema 15: Strom bzw. Onlineverarbeitung mit MapReduce
MapReduce Jan Kristof Nidzwetzki MapReduce 1 / 17 Übersicht 1 Begriffe 2 Verschiedene Arbeiten 3 Ziele 4 DEDUCE: at the intersection of MapReduce and stream processing Beispiel 5 Beyond online aggregation:
MehrErfolgreich suchen im Internet
Erfolgreich suchen im Internet Steffen-Peter Ballstaedt 05.10.2015 Statistik Weltweit: etwa 1 Milliarde Websites BRD: 15 Millionen Websites Das Internet verdoppelt sich alle 5,32 Jahre Die häufigste Aktivität
MehrExploration und Klassifikation von BigData
Exploration und Klassifikation von BigData Inhalt Einführung Daten Data Mining: Vorbereitungen Clustering Konvexe Hülle Fragen Google: Riesige Datenmengen (2009: Prozessieren von 24 Petabytes pro Tag)
MehrTechnische Aspekte einer Videosuchmaschine. Björn Wilmsmann, CEO - MetaSieve GmbH
Technische Aspekte einer Videosuchmaschine Björn Wilmsmann, CEO - MetaSieve GmbH 1 Über MetaSieve http://www.metasieve.com Softwareentwicklung Internet Software Spezialisiert auf Suchmaschinentechnologie
MehrSEODisc: Ansatz zur Erkennung von SEO-Attacken
: Ansatz zur Erkennung von SEO-Attacken Matthias Meyer 21. März 2011 TU Dortmund, G Data 1 / 18 Inhaltsverzeichnis 1 Einleitung Was ist SEO? SEO aus Angreifersicht SEO Techniken 2 Verfolgter Lösungsansatz
MehrData Mining-Modelle und -Algorithmen
Data Mining-Modelle und -Algorithmen Data Mining-Modelle und -Algorithmen Data Mining ist ein Prozess, bei dem mehrere Komponenten i n- teragieren. Sie greifen auf Datenquellen, um diese zum Training,
MehrWeb-Marketing und Social Media
Web-Marketing und Social Media Trends & Hypes Stephan Römer 42DIGITAL GmbH Web-Marketing und Social - stephan.roemer@42digital.de - Berlin, 05/2013 - Seite 1 K u r z v i t a Studierter Medieninformatiker
MehrAnalyse von unstrukturierten Daten. Peter Jeitschko, Nikolaus Schemel Oracle Austria
Analyse von unstrukturierten Daten Peter Jeitschko, Nikolaus Schemel Oracle Austria Evolution von Business Intelligence Manuelle Analyse Berichte Datenbanken (strukturiert) Manuelle Analyse Dashboards
MehrWeb Information Retrieval. Zwischendiskussion. Überblick. Meta-Suchmaschinen und Fusion (auch Rank Aggregation) Fusion
Web Information Retrieval Hauptseminar Sommersemester 2003 Thomas Mandl Überblick Mehrsprachigkeit Multimedialität Heterogenität Qualität, semantisch, technisch Struktur Links HTML Struktur Technologische
MehrMöglichkeiten für bestehende Systeme
Möglichkeiten für bestehende Systeme Marko Filler Bitterfeld, 27.08.2015 2015 GISA GmbH Leipziger Chaussee 191 a 06112 Halle (Saale) www.gisa.de Agenda Gegenüberstellung Data Warehouse Big Data Einsatz-
MehrBIG DATA Die Bewältigung riesiger Datenmengen
BIG DATA Die Bewältigung riesiger Datenmengen Peter Mandl Institut für Geographie und Regionalforschung der AAU GIS Day 2012, 13.11.2012, Klagenfurt Was sind BIG DATA? Enorm große Datenmengen, Datenflut
MehrMining High-Speed Data Streams
Mining High-Speed Data Streams Pedro Domingos & Geoff Hulten Departement of Computer Science & Engineering University of Washington Datum : 212006 Seminar: Maschinelles Lernen und symbolische Ansätze Vortragender:
MehrEMC. Data Lake Foundation
EMC Data Lake Foundation 180 Wachstum unstrukturierter Daten 75% 78% 80% 71 EB 106 EB 133 EB Weltweit gelieferte Gesamtkapazität Unstrukturierte Daten Quelle März 2014, IDC Structured vs. Unstructured
MehrWie Web 2.0 und Suche zusammenwachsen. Prof. Dr. Dirk Lewandowski dirk.lewandowski@haw-hamburg.de
Wie Web 2.0 und Suche zusammenwachsen Prof. Dr. Dirk Lewandowski dirk.lewandowski@haw-hamburg.de Web search: Always different, always the same AltaVista 1996 1 http://web.archive.org/web/19961023234631/http://altavista.digital.com/
MehrSenioren in der digitalen Welt Prof. Dr. Johanna Wanka Bundesministerin für Bildung und Forschung Prof. Dieter Kempf BITKOM-Präsident
Senioren in der digitalen Welt Prof. Dr. Johanna Wanka Bundesministerin für Bildung und Forschung Prof. Dieter Kempf BITKOM-Präsident Berlin, 12. Dezember 2014 Viele Senioren haben Computer-Grundkenntnisse
MehrSeminar Business Intelligence Teil II. Data Mining & Knowledge Discovery
Seminar Business Intelligence Teil II Data Mining & Knowledge Discovery Was ist Data Mining? Sabine Queckbörner Was ist Data Mining? Data Mining Was ist Data Mining? Nach welchen Mustern wird gesucht?
MehrTeam Collaboration im Web 2.0
Team Collaboration im Web 2.0 barcampmitteldeutschland Team Collaboration im Web 2.0 Focus Social Bookmarking Torsten Lunze Team Collaboration in Web 2.0 Motivation Collaboration in verschiedenen Technologien
MehrBig Data Herausforderungen und Chancen für Controller. ICV Jahrestagung, 19.05.2014 Dr. Carsten Bange, Gründer und Geschäftsführer BARC
Big Data Herausforderungen und Chancen für Controller ICV Jahrestagung, 19.05.2014 Dr. Carsten Bange, Gründer und Geschäftsführer BARC BARC: Expertise für datengetriebene Organisationen Beratung Strategie
MehrANALYSIEREN VON SOCIAL MEDIA AKTIVITÄTEN
ANALYSIEREN VON SOCIAL MEDIA AKTIVITÄTEN PROFI-Webcast 10.03.2015 Dr. Michael Kosmowski Software-Architekt Tel.: 0721 46 46 46 64 44 E-Mail: m.kosmowski@profi-ag.de AGENDA Was passiert bei unseren Kunden?
MehrBIG UNIVERSITÄTSRECHENZENTRUM
UNIVERSITÄTS RECHENZENTRUM LEIPZIG BIG DATA @ UNIVERSITÄTSRECHENZENTRUM Forschung und Entwicklung Entwicklung eines E-Science-Angebots für die Forschenden an der Universität Leipzig Stefan Kühne Axel Ngonga
MehrFreunde, Fans und Faszinationen: Das Potenzial von Social Media
Freunde, Fans und Faszinationen: Das Potenzial von Social Media Claus Fesel, DATEV eg PEAK, 5. Symposium für Verbundgruppen und Franchisesysteme Berlin, 10.05.2011 Social Media 13.05.2011 Social Media
MehrKommunikation. Sitzung 01 04./11. Dezember 2015
Kommunikation Sitzung 01 04./11. Dezember 2015 Unser Vorhaben Kommunikationsmodell Überblick über Netzwerk-Topologien Server-Client-Modell Internet Was ist Informatik eigentlich? Kunstwort aus Information
MehrGoogle Search: Trends 2014. Aktuelle Herausforderungen für die Suchmaschinenoptimierung Referent: Andreas Armbruster, Geschäftsführer seonative GmbH
Google Search: Trends 2014 Aktuelle Herausforderungen für die Suchmaschinenoptimierung Referent: Andreas Armbruster, Geschäftsführer seonative GmbH Jahrgang 1979 Diplom-WiWi (Uni Ulm) Unternehmensgründung
MehrDIGITALE GESCHÄFTSANBAHNUNG
DIGITALE GESCHÄFTSANBAHNUNG WORKSHOP 09.10.2014 BREMEN ROLAND BÖHME SENIOR CONSULTANT www.udg.de/heimsheim Die UDG Heimsheim bietet 360 Performance Marketing Relevante Besucher & Verbesserung der Conversionrate
MehrBig, Bigger, CRM: Warum Sie auch im Kundenmanagement eine Big-Data-Strategie brauchen
Big, Bigger, CRM: Warum Sie auch im Kundenmanagement eine Big-Data-Strategie brauchen 01000111101001110111001100110110011001 Volumen 10 x Steigerung des Datenvolumens alle fünf Jahre Big Data Entstehung
MehrApache Lucene. Mach s wie Google! Bernd Fondermann freier Software Architekt bernd.fondermann@brainlounge.de berndf@apache.org
Apache Lucene Mach s wie Google! Bernd Fondermann freier Software Architekt bernd.fondermann@brainlounge.de berndf@apache.org 1 Apache Apache Software Foundation Software free of charge Apache Software
MehrWas ist Analyse? Hannover, CeBIT 2014 Patrick Keller
Was ist? Hannover, CeBIT 2014 Patrick Keller Business Application Research Center Historie 1994: Beginn der Untersuchung von Business-Intelligence-Software am Lehrstuhl Wirtschaftsinformatik der Universität
MehrJune 2015. Automic Hadoop Agent. Data Automation - Hadoop Integration
June 2015 Automic Hadoop Agent Data Automation - Hadoop Integration + Aufbau der Hadoop Anbindung + Was ist eigentlich ist MapReduce? + Welches sind die Stärken von Hadoop + Welches sind die Schwächen
MehrVerborgene Schätze heben
Verborgene Schätze heben Data Mining mit dem Microsoft SQL Server Martin Oesterer Leiter Vertrieb HMS Analytical Software GmbH Data Mining. Was ist eigentlich wichtig? Data Mining ist: die Extraktion von
MehrGeneralisierung von großen Datenbeständen am Beispiel der Gebäudegeneralisierung mit CHANGE
Institut für Kartographie und Geoinformatik Leibniz Universität Hannover Generalisierung von großen Datenbeständen am Beispiel der Gebäudegeneralisierung mit CHANGE Frank Thiemann, Thomas Globig Frank.Thiemann@ikg.uni-hannover.de
Mehr25.09.2014. Zeit bedeutet eine Abwägung von Skalierbarkeit und Konsistenz
1 2 Dies ist ein Vortrag über Zeit in verteilten Anwendungen Wir betrachten die diskrete "Anwendungszeit" in der nebenläufige Aktivitäten auftreten Aktivitäten in einer hochgradig skalierbaren (verteilten)
Mehr3 MILLIARDEN GIGABYTE AM TAG ODER WELCHE KAPAZITÄTEN MÜSSEN NETZE TRAGEN?
3 MILLIARDEN GIGABYTE AM TAG ODER WELCHE KAPAZITÄTEN MÜSSEN NETZE TRAGEN? Udo Schaefer Berlin, den 10. November 2011 DIE NETZE UND IHRE NUTZUNG Berechnungsgrundlage 800 Millionen Facebook Nutzer Transport
MehrDIE KRAFT DER E-MAIL ZEHN FAKTEN ZUM DEUTSCHEN E-MAIL-MARKT
DIE KRAFT DER E-MAIL ZEHN FAKTEN ZUM DEUTSCHEN E-MAIL-MARKT 1 1994 1995 1996 1997 1998 1999 2000 2001 2002 2003 2004 2005 2006 2007 2008 2009 2010 2011 2012 2013 2014 2015 Mails pro Jahr in Deutschland
MehrData Mining: Einige Grundlagen aus der Stochastik
Data Mining: Einige Grundlagen aus der Stochastik Hagen Knaf Studiengang Angewandte Mathematik Hochschule RheinMain 21. Oktober 2015 Vorwort Das vorliegende Skript enthält eine Zusammenfassung verschiedener
MehrCopyr i g ht 2014, SAS Ins titut e Inc. All rights res er ve d. HERZLICH WILLKOMMEN ZUR VERANSTALTUNG VISUAL ANALYTICS
HERZLICH WILLKOMMEN ZUR VERANSTALTUNG VISUAL ANALYTICS AGENDA VISUAL ANALYTICS 9:00 09:30 Das datengetriebene Unternehmen: Big Data Analytics mit SAS die digitale Transformation: Handlungsfelder für IT
MehrMATCHING VON PRODUKTDATEN IN DER CLOUD
MATCHING VON PRODUKTDATEN IN DER CLOUD Dr. Andreas Thor Universität Leipzig 15.12.2011 Web Data Integration Workshop 2011 Cloud Computing 2 Cloud computing is using the internet to access someone else's
MehrIntelligent Traveller Early Situation Awareness itesa
Intelligent Traveller Early Situation Awareness itesa Dr. Martin Skorsky, Senior Researcher 22. Juni 2015 1 1 Intelligent Traveller Early Situation Awareness Automatischen Alarmsystems, das Reisende in
MehrSuchmaschinenoptimierung. Grundlagen zur Optimierung der eigenen Internetseite
Suchmaschinenoptimierung Grundlagen zur Optimierung der eigenen Internetseite Gliederung Überblick Arbeitsweise von Suchmaschinen Internetseiten optimieren No-Gos Praxis Ein Überblick Suchmaschinen Google
MehrData Mining Anwendungen und Techniken
Data Mining Anwendungen und Techniken Knut Hinkelmann DFKI GmbH Entdecken von Wissen in banken Wissen Unternehmen sammeln ungeheure mengen enthalten wettbewerbsrelevantes Wissen Ziel: Entdecken dieses
MehrBig Data Modewort oder echter Mehrwert. freenet Group Dr. Florian Johannsen
Big Data Modewort oder echter Mehrwert freenet Group Dr. Florian Johannsen freenet Group 2 Titel der Präsentation 07.07.2015 Mobilfunkgeschäft der freenet Group Austausch von Daten und Informationen Im
MehrExpertenumfrage 2015 Was sind die Trends im Online Marketing?
Expertenumfrage 2015 Was sind die Trends im Online Marketing? Panel: Marketer N =113 Date: 8/2015 Q1: Was sind aus Ihrer Sicht derzeit die wichtigsten Trends im Online Marketing?* Customer-Journey-Analyse
MehrService CASES. Praxis-Beispiele zur Gestaltung eines echten Kundennutzens. Volume 18
S Praxis-Beispiele zur Gestaltung eines echten Kundennutzens Volume 18 Banken Privatkunden/Geschäftskunden. Die digitale Bank Fidor (www.fidor.de) richtet sich mit ihrem Angebot an Privat- und Geschäftskunden.
Mehr2 Grundsätze der Datenbeschaffung im Bewerbungsverfahren
M erkblatt O nline-recherchen über Stellenbewerber 1 Ziel und Adressaten des Merkblatts Dieses Merkblatt informiert darüber, in welchen Fällen ein öffentliches Organ als Arbeitgeberin im Bewerbungsverfahren
MehrINHALTSVERZEICHNIS Allgemeine Beschreibung... 3 Verwendung der Webseite... 4 Abbildungsverzeichnis... 12
ONLINE-HILFE INHALTSVERZEICHNIS 1 Allgemeine Beschreibung... 3 2... 4 2.1 Angemeldeter Benutzer... 4 2.2 Gast... 10 Abbildungsverzeichnis... 12 1 ALLGEMEINE BESCHREIBUNG Die Webseite "" ist eine Informationsplattform
MehrQualitätsberichte im MS Word-Format
Qualitätsberichte im MS Word-Format StatSoft GmbH und STATISTICA 9.1 auf dem Forum der Control 2010 www.statsoft.de StatSoft (Europe) GmbH 2010 Michael Busch Inhalt StatSoft STATISTICA Anwendungen in der
MehrRandy Whited. Wie man ohne Papier auskommt eine Anleitung für Anfänger. 2014 Intellectual Reserve, Inc. Alle Rechte vorbehalten.
Wie man ohne Papier auskommt eine Anleitung für Anfänger Randy Whited Wo fängt man an? kleine Schri1e planen kombinieren Ordnung ist der Schlüssel Grundsätzliches zur Digitalisierung Pixel: Bildpunkt Auflösung
Mehr- Google als Suchmaschine richtig nutzen -
- Google als Suchmaschine richtig nutzen - Google ist die wohl weltweit bekannteste und genutzte Suchmaschine der Welt. Google indexiert und aktualisiert eingetragene Seiten in bestimmten Intervallen um
MehrOnline Marketing. Neue Wege, bekannt zu werden. Was Sie tun können. Optimieren Sie Ihre Internetseite. Social Networks. Wirklich notwendig?
Online Marketing. Neue Wege, bekannt zu werden. Was Sie tun können. Optimieren Sie Ihre Internetseite. Social Networks. Wirklich notwendig? www.webcontact.de 1 Was ist Online-Marketing? Wikipedia: Online-Marketing
MehrDatenschutzkonforme Anonymisierung von Datenverkehr auf einem Vermittlungssystem Christoph Mayer - Studienarbeit -
Datenschutzkonforme Anonymisierung von Datenverkehr auf einem Vermittlungssystem - Studienarbeit - Ziel der Arbeit sicher flexibel schnell Anonymisierung von Datenverkehr erweiterbar verbreitetes Format
Mehr»d!conomy«die nächste Stufe der Digitalisierung
»d!conomy«die nächste Stufe der Digitalisierung Prof. Dieter Kempf, BITKOM-Präsident Oliver Frese, Vorstandsmitglied Deutsche Messe AG Hannover, 15. März 2015 Digitalisierung in Unternehmen Einsatz von
MehrWeb Mining und Farming
Web Mining und Farming Shenwei Song Gliederung Übersicht über Web Mining und Farming Web Mining Klassifikation des Web Mining Wissensbasierte Wrapper-Induktion Web Farming Übersicht über Web-Farming-Systeme
MehrGoogle findet Teilen gut? Eine empirische Studie zum Einfluss von Facebook- Shares und Co. auf das organische Ranking von Suchmaschinen
Google findet Teilen gut? Eine empirische Studie zum Einfluss von Facebook- Shares und Co. auf das organische Ranking von Suchmaschinen Christin Hildebrandt / Christina Schumann / Jens Wolling Agenda Einführung
MehrWindows Server 2012 R2 Essentials & Hyper-V
erklärt: Windows Server 2012 R2 Essentials & Hyper-V Windows Server 2012 R2 Essentials bietet gegenüber der Vorgängerversion die Möglichkeit, mit den Boardmitteln den Windows Server 2012 R2 Essentials
MehrNeue Ansätze der Softwarequalitätssicherung
Neue Ansätze der Softwarequalitätssicherung Googles MapReduce-Framework für verteilte Berechnungen am Beispiel von Apache Hadoop Universität Paderborn Fakultät für Elektrotechnik, Informatik und Mathematik
MehrDer Begriff Cloud. Eine Spurensuche. Patric Hafner 29.06.2012. geops
Der Begriff Cloud Eine Spurensuche Patric Hafner geops 29.06.2012 Motivation Der größte Hype der IT-Branche Hype heißt sowohl Rummel als auch Schwindel slashdot.org The cloud represents a foundational
MehrZugriffsmechanismen und Standards für adaptive, personalisierte Dienste im Internet
Zugriffsmechanismen und Standards für adaptive, personalisierte Dienste im Internet Vorstellung des Konzeptes für die Doktorarbeit von Wolfgang Wiese Überblick 1. Einführung 2. Anforderungen bzw. Lastenheft
MehrInformationsflut bewältigen - Textmining in der Praxis
Informationsflut bewältigen - Textmining in der Praxis Christiane Theusinger Business Unit Data Mining & CRM Solutions SAS Deutschland Ulrich Reincke Manager Business Data Mining Solutions SAS Deutschland
MehrSocial SEO Intelligente Verknüpfung von Suchmaschinen und Social Media
Social SEO Intelligente Verknüpfung von Suchmaschinen und Social Media Dipl. jur. oec. Felix Beilharz Social Signals sind das neue SEO Gold Searchmetrics DIM Deutsches Institut für Marketing Search + Your
MehrSOA im Zeitalter von Industrie 4.0
Neue Unterstützung von IT Prozessen Dominik Bial, Consultant OPITZ CONSULTING Deutschland GmbH Standort Essen München, 11.11.2014 OPITZ CONSULTING Deutschland GmbH 2014 Seite 1 1 Was ist IoT? OPITZ CONSULTING
MehrReferent Thomas Kaiser Gründer & Geschäftsführer cyberpromote GmbH tel: 089/81 89 81 710 thomas.kaiser@cyberpromote.com. Stand C124 SEO 2014
Referent Thomas Kaiser Gründer & Geschäftsführer cyberpromote GmbH tel: 089/81 89 81 710 thomas.kaiser@cyberpromote.com SEO 2014 Stand C124 Was nicht geht, kann man nicht verkaufen Was man verkaufen kann,
MehrOperational Big Data effektiv nutzen TIBCO LogLogic. Martin Ulmer, Tibco LogLogic Deutschland
Operational Big Data effektiv nutzen TIBCO LogLogic Martin Ulmer, Tibco LogLogic Deutschland LOGS HINTERLASSEN SPUREN? Wer hat wann was gemacht Halten wir interne und externe IT Richtlinien ein Ist die
MehrINFORMATION LIFECYCLE AKTUELLE TRENDS IM INPUT MANAGEMENT CENIT EIM IT-TAG 13. JUNI 2013 IN STUTTGART LARS LAMPE
INFORMATION LIFECYCLE AKTUELLE TRENDS IM INPUT MANAGEMENT CENIT EIM IT-TAG 13. JUNI 2013 IN STUTTGART LARS LAMPE AM ANFANG WAR DAS PAPIER Der Papyrus Westcar(Altes Museum, Berlin) aus der 13. Dynastie
MehrEinrichten des Elektronischen Postfachs
Einrichten des Elektronischen Postfachs Für die Einrichtung des Elektronischen Postfachs melden Sie sich wie gewohnt in unserem Online-Banking auf www.sparkasse-unnakamen.de an. Wechseln Sie über Postfach
MehrSoftware Defined Storage Storage Transformation in der Praxis. April 2015 22
Software Defined Storage Storage Transformation in der Praxis Copyright 2014 EMC Corporation. All rights reserved. April 2015 22 TRANSFORMATION DER IT ZUM SERVICE PROVIDER STORAGE AS A SERVICE HYBRID CLOUD
MehrSocial Media Effects 2010
Social Media Effects 2010 Zielsetzung und Nutzen dieser Studie Die künftig in regelmäßigen Abständen durchgeführte Studie soll Kunden und Agenturen künftig die Möglichkeit geben den Social Media Markt
MehrBetter Backlinking Semantische Kategorisierung von Websites
Better Backlinking Semantische Kategorisierung von Websites Stephan Sommer-Schulz info@nerdbynature.net Inhaltsübersicht 1. Ziel: Kategorisierung 2. Backlinks 3. Kategorien - Auswahl 4. Semantische Verfahren
MehrOPEN GOVERNMENT: MEHR TRANSPARENZ UND PARTIZIPATION DURCH ANALYTICS ANDREAS NOLD STATEGISCHE GESCHÄFTSENTWICKLUNG SAS D-A-CH
OPEN GOVERNMENT: MEHR TRANSPARENZ UND PARTIZIPATION DURCH ANALYTICS ANDREAS NOLD STATEGISCHE GESCHÄFTSENTWICKLUNG SAS D-A-CH BEISPIEL FLUGHAFEN BERLIN-BRANDENBURG Offizielle Webseite des Flughafens https://ber.piratenfraktion-berlin.de/projekt/
MehrVitamine für Ihr Business. Internet-Partner der Wirtschaft
Vitamine für Ihr Business Der Vorfilm... Was wir für unsere Kunden tun... tun wir seit 1996. Wir betreiben Ihre Services. DC Berlin 1 auf Die Cloud für Unternehmen - ebusiness auf Wolke sieben? eigener
MehrDie Wahlpflichtfächer. Operations Research Statistik/Ökonometrie. Optimierung linearer Modelle Statistische Analyseverfahren
Die Wahlpflichtfächer Operations Research Statistik/Ökonometrie Modellierung ökonomischer Sachverhalte mit mathematischen Mitteln Einsatz statistischer Modelle zur Erfassung und zur Auswertung von Daten
MehrWohin fließen meine Daten?!
Wohin fließen meine Daten?! Probleme und Herausforderungen sozialer Netzwerke im Internet 24. Februar 2010 1/15 Motivation (A)soziale Netzwerke: Facebook, StudiVZ, SchuelerVZ usw. Warum ist man überhaupt
MehrPlanung auf Aufbau von SharePoint-Suchinfrastrukturen
Building & Connecting Know-how 16.-17. Februar 2011, München Planung auf Aufbau von SharePoint-Suchinfrastrukturen Fabian Moritz SharePoint MVP Partner: Veranstalter: Aufbau von Suchplattformen Planung
MehrHOW TO CREATE A FACEBOOK PAGE.
FAME FACT FIRST IN SOCIALTAINMENT SOCIAL MEDIA INSIGHTS KOSTENLOSE REPORTS, WHITEPAPERS UND WERTVOLLE LINKS HOW TO CREATE A FACEBOOK PAGE. famefact track by track GmbH, Schönhauser Allee 48, 10437 Berlin,
MehrWeb Services stellen eine Integrationsarchitektur dar, die die Kommunikation zwischen verschiedenen Anwendungen
9 3 Web Services 3.1 Überblick Web Services stellen eine Integrationsarchitektur dar, die die Kommunikation zwischen verschiedenen Anwendungen mit Hilfe von XML über das Internet ermöglicht (siehe Abb.
MehrWie Google Webseiten bewertet. François Bry
Wie Google Webseiten bewertet François Bry Heu6ge Vorlesung 1. Einleitung 2. Graphen und Matrizen 3. Erste Idee: Ranking als Eigenvektor 4. Fragen: Exisi6ert der Eigenvektor? Usw. 5. Zweite Idee: Die Google
MehrCisco gestern heute morgen
Cisco gestern heute morgen Dorothe Brohl Strategic Account Manager September 2015 2 3 4 5 6 7 8 9 10 11 Q1 CY15 12 13 Die größte Unterstützung: unsere Kunden 5.0 4.33 4.33 4.30 4.33 4.37 4.37 4.36 4.41
MehrSelbsthilfe und neue Medien - Chance oder Risiko?
Workshop 3 Selbsthilfe und neue Medien - Chance oder Risiko? Stefan Werner, Die PARITÄTISCHE BuntStiftung Marcel Kabel, Der PARITÄTISCHE Sachsen-Anhalt Gliederung 1. Einleitung, Vorstellung und Ziel des
MehrSicherheitsanalyse von Private Clouds
Sicherheitsanalyse von Private Clouds Alex Didier Essoh und Dr. Clemens Doubrava Bundesamt für Sicherheit in der Informationstechnik 12. Deutscher IT-Sicherheitskongress 2011 Bonn, 10.05.2011 Agenda Einleitung
MehrVorhersage mit CA CleverPath Predictive Analysis Server. Laszlo Mihalka Senior Consultant Laszlo.Mihalka@ca.com
Vorhersage mit CA CleverPath Predictive Analysis Server Laszlo Mihalka Senior Consultant Laszlo.Mihalka@ca.com Agenda Herausforderung CP PAS Neugents Modelle Mustererkennung Tools CA World 1 Herausforderung
MehrDatenschutz und Datensicherheit wie zahlt sich das für mein Unternehmen aus?
Datenschutz und Datensicherheit wie zahlt sich das für mein Unternehmen aus?...genauer: wie vermeide ich die Datenpannen von Telekom, Bahn & Co! Ihre Referentin: Andrea 'Princess' Wardzichowski Chaos Computer
MehrSorgfalt im Umgang mit Identitätskennungen (fürs Zertifikat)
Sorgfalt im Umgang mit Identitätskennungen (fürs Zertifikat) Daniel Muster daniel.muster@it-rm.ch www.it-rm.ch 28. Nov. 2014 Copyright D. Muster, 8048 ZH Einleitung Begriff: Identitätskennung besteht aus
MehrGEFUNDEN WERDEN. WAS GOOGLE GUT FINDET CONLABZ GMBH, WWW.CONLABZ.DE TIMO HERBORN + DANIEL SCHMIDT
GEFUNDEN WERDEN. WAS GOOGLE GUT FINDET CONLABZ GMBH, WWW.CONLABZ.DE TIMO HERBORN + DANIEL SCHMIDT conlabz für hartmann//koch ONLINE-MARKETING AUS DER WÜSTE IN DIE INNENSTADT...oder: Wie werden Angebote
MehrRedaktionelles Arbeiten auf Basis von Big-Data Methoden aus der Rundfunk/Fernseh-Perspektive
Redaktionelles Arbeiten auf Basis von Big-Data Methoden aus der Rundfunk/Fernseh-Perspektive Institut für Rundfunktechnik, 17. Februar 2014 Norbert Pillmayer, BU-Leiter Software Solutions, NorCom Information
Mehr