BIG DATA FÜR IT-ENTSCHEIDER RIESIGE DATENMENGEN UND MODERNE TECHNOLOGIEN GEWINNBRINGEND NUTZEN. EXTRA: Mit kostenlosem E-Book

Größe: px
Ab Seite anzeigen:

Download "BIG DATA FÜR IT-ENTSCHEIDER RIESIGE DATENMENGEN UND MODERNE TECHNOLOGIEN GEWINNBRINGEND NUTZEN. EXTRA: Mit kostenlosem E-Book"

Transkript

1 BIG DATA FÜR IT-ENTSCHEIDER pavlo BARON RIESIGE DATENMENGEN UND MODERNE TECHNOLOGIEN GEWINNBRINGEND NUTZEN EXTRA: Mit kostenlosem E-Book

2 Inhalt Vorwort... XI 1 Management Summary Was? Meinklassisches Business istkonkurrenzlos, nichtwahr? Derheimliche Markteroberer: Amazon Derklare Fall:Google DerzunehmendeLebensinhalt:Facebook NachrichtenquelleNr.1:Twitter Diewilden Kleinen Dasunscheinbare Orakel: Prismatic Derstille Mitlauscher:Boundary BigData istdasneueöl, nichtwahr? Technologie stehtimvordergrund, nichtwahr? DieEssenzvonDatenistangewendete Information Die BigData -Schmerzenund-Symptome Die3V s ganzeinfach,oder? Velocity Volume Variety Daslokale Denken:Business-Verbesserung Bessere Angebotedurch mehrwissen Menschenzusammenbringen... 27

3 VI Inhalt Das kostenbewusstedenken:kostenreduktion Geld mit günstiger Maschinerie und geeigneten Technologien sparen Kostendurch Analysedrücken Die Wachsamkeit: Die Gefahren aus dem bösen Internet Enterprise-LevelStalking Fraud Detection Das globale Denken:Weltverbesserung Öffentlichen Verkehr endlich funktionsfähigmachen Precogs implementieren Wie? TypischefalscheHoffnungen Große Datensind wiealleanderen Daten,nichtwahr? Tools machenes fürmich,nichtwahr? MeineProzesse müssensich nichtändern,nichtwahr? AngewandteWissenschaftistderentscheidendeMarktvorteil Mathepauken IhrStaff dieeinzig sinnvolleinvestition Ich kann Big Data mit normalen Entwicklern, nicht wahr? Also, alleentwicklerzurückindieschuleschicken? Dieneuen Berufsgruppen Polyglott,aufjederEbene Big Data -Schmerzenlassen sicherzeugen Alles protokollieren, wasnutzertun Nutzersolangewiemöglich beimonline-angebot halten Nutzeranregen, mehrzutununddaten zuhinterlassen Soziale Netzwerkeanzapfen Crowdsourcing Wissen,wer woist IT-Strategieim BigData -Licht Daten bzw. Informationen sind gemeinsame Sprache von Business undit Datensind IhrGold... 63

4 Inhalt VII Wiewerden Datenklassischerweise behandelt? Wiewerden große, chaotischedatenbehandelt? Wie leitet man Informationen aus vielen und chaotischen Datenab? WiehältmanUnmengenchaotischerDatensauber? Wiekombiniert manmehrere Datenquellen? Wasbedeutet es,datenzentriert zuarbeiten? Statistikenlügennicht Der entscheidende Unterschied zwischen schnell und gleich DieMachtderSuche DieMachtderEmpfehlung DieMachtdesBildes IT-Instrumente richtig nutzen oder richtige Instrumente nutzen Commodity Hardware nutzen Alles ausdertechnikherauspressen Dortinden Wolken DieOpen SourceWelthatklardieNasevorn BigData -Perspektiven Wiespeichertman große Datenmengen? DerschwierigeWegderRDBMS Tipps undtricks DerPreis derverteilung Undnochein paarrandthemen Wiebereitet mangroße Datenmengen auf? Wiestellt mangroße Datenmengen bereit? Wieanalysiert mangroße DateninEchtzeit? Wievisualisiert man große Datenmengen? Von derhandin denmund SegenfürEuropa, FluchfürBig Data:Datenschutz Womit? Willkommen imzooder BigData -Technologien Einigetheoretische Grundlagen Verteilte Systemebzw.verteilteDataStores

5 VIII Inhalt Hashing unddelta-tracking Replikation undredundanz Objekteversionieren Sharding HerrderRinge Anti-EntropyundGarbageCollection Infrastrukturinformationenaktuell halten CAP nichtdiekappe EventualConsistency Cachingbzw.In-Memory-Datenhaltung Graphen ein Sonderfall Analytics sinddas AundO.Aberwomit machen? Was istnosql? Key/Value Stores DocumentStores In-Memory Stores Graphen,malwieder einsonderfall undnochweitere HundertStores Undwasistmit dercloud? Was istnewsql? Wokommen klassische RDBMSinsSpiel Was istmapreduce? Und welche Programmiersprache ist nun die beste für Big Data? Kann/mussich alles mit Javamachen? IstJavaScriptnichtetwanurfürScript-Kiddies? AnalysevonLogs Time-Series-Daten UmgangmitCommodity Hardware Wiekannich esrichtigflottmachen? Wasist (Fast-)Echtzeit? Diesuperschnelle Technik Suche,IndexundSecondary Index Die AntwortderDinosaurier: dieappliances Kannichdas alles miteinemeinzigen Tool machen?

6 Inhalt IX 4.16 Visualisierung Wohinmit meinen aktuellen Errungenschaften? Wohinmitmeiner Enterprise-Architektur? Wohinmitmeinem Enterprise-Datenmodell? Wohinmitmeinem MDM? Wohinmitmeinem Enterprise-Technologie-Stack? Wohinmitmeiner SOA? Wohinmitmeiner BI-Lösung? WohinmitderCloud? Ist Big Data alsohadoop mit einemschussmongodb? Way Forward Aktuelle Trends NoSQLundderRest derwelt Hadoop undderrest derwelt Hauptspeicher und Plattenspeicher werden immer billiger DieMonsterwachenauf Wiestarteichmit BigData? IchhabeschonBig Data.Wiemacheichweiter? ROI,TCOunddergleichen undworauf es ankommt Woundwiekannichmich weiterinformieren? Persönlicher Blick indiefernezukunft Stichwortverzeichnis...211

7 3 Wie? Jetzt habe ich des Langen und Breiten darüber referiert, was Sie alles mit Big Data machen können und sollten. Doch ich bin noch gar nicht darauf eingegangen, wie Sie es anstellen können, was die limitierenden Faktoren sind, was Sie bzw. Ihre Mitarbeiter auf der wissenschaftlichen und der technischen Seiten wissen sollten bzw. wie Sie Ihr Team darauf ein- und aufstellen sollen. Wenn Sie aus beliebigen Daten Informationen extrahieren wollen, müssen Sie sich darauf einstellen, wissenschaftliche Arbeit zu leisten. Es geht nicht um akademische Arbeit. Aber es hat damit viel mehr zu tun als ein paar Tabellen im RDBMS Ihrer Wahl zu befüllen und darauf ein paar SQL-Abfragen zu fahren. Sie arbeiten mit Text, und dieser ist generell unstrukturiert. Sie arbeiten mit Menschen, und diese sind noch unstrukturierter. Sie arbeiten mit Ursachen, Zeitfenstern, Abhängigkeitsgraphen, Beziehungsgraphen etc. pp. Bei der Technik sieht es auch nicht viel einfacher aus. Es gibt keine Kiste, die Ihnen das von mir in diesem Buch Beschriebene abnehmen kann, damit Sie es einfach haben. Und wenn Sie weiter auf die Kostenbremse drücken wollen bzw. müssen, müssen Sie mehr in die Umsetzung investieren. Ich weiß, hier steht OpEx vs. CapEx im Raum, doch nach meiner absolut harten Meinung ist die beste Investition Menschen, ihre Köpfe und Fähigkeiten, und nicht vermeintlich wasserdichte Verträge mit Generalisten und den Herstellern vermeintlich goldener Hämmer und Allzweckwaffen. Big Data bedeutet Investition in Köpfe und eigens gebaute Lösungen, basierend auf wissenschaftlichen Aspekten, Ansätzen und entsprechender Technik. Es bedeutet Verlagerung von CapEx ins OpEx, jedoch wenn Sie es raffiniert anstellen, gleichen sich die beiden aus. Denn ich behaupte an dieser Stelle einfach mal, dass es das Ziel eines jeden Unternehmens ist, Geld zu erwirtschaften, und nicht Geld zu sparen. Beides tut sich in den Büchern natürlich ähnlich, doch ich habe in meiner Laufbahn auch das eine oder andere Unternehmen er-

8 36 3 Wie? lebt, welches das Sparen zum Selbstzweck und dem Mittelpunkt der Tätigkeit erklärt hat. Big Data kann Ihnen aus einer solchen Situation heraushelfen und Ihnen einmalige Marktvorteile und -chancen verschaffen. Und in diesem Kapitel versuche ich, Ihnen die dafür notwendigen Mittel aufzuzeigen. 3.1 Typische falsche Hoffnungen Oh ja, das ist fast schon mein Lieblingsthema. Wenn ich richtig sarkastisch werde, kommt dabei ein sehr böser Talk heraus, in dem die Leute nicht wirklich wissen, ob sie lachen oder weinen sollen 1. Mir ist es dabei wichtig, dass sie lernen und umdenken. Der Rest ist Brutto. Es ist erstaunlich, mit welcher Hartnäckigkeit sich ITs dieser Welt daran halten, nichts zu verändern. Das Prinzip Never touch a running system ist so dermaßen fehlinterpretiert worden, dass jedwede Veränderung mit schierer Angst empfangen und mit Dingen wie Wir sollten unsere Mitarbeiter nicht mit Neuem überlasten wegargumentiert wird. Dabei gewinnen immer die Unternehmen, die etwas wagen. Der Wille, den eigenen Staff permanent dumm zu halten oder für dumm zu verkaufen, ist unmenschlich und führt nur dazu, dass die Guten wegziehen und nur das Mittelmaß übrigbleibt. Meiner Meinung nach eine sehr enttäuschende Situation. So auch bei Big Data. Die sofortige Hoffnung ist, etwas Einfaches zu bekommen, was man nicht lernen, wofür man aber die Mitarbeiter zertifizieren kann. Und dass man alles mit den herkömmlichen Produkten herkömmlicher Anbieter lösen kann, damit man keine neuen Verträge verhandeln muss. Dabei leben diese gerade davon, dass die ITs Angst vor Veränderung haben. Und davon, dass dort immer noch die alte Garde regiert, die nichts anderes kennt und auch nicht kennen will, die nach Möglichkeit einen Cobol-ESB kaufen würde. Weil es ist ja Cobol, es läuft schon seit Jahrzehnten. Wenn ESB, dann halt in bewährter Technologie. Ok, ich schweife ab. Lassen Sie mich ein paar typische Hoffnungen beschreiben, die nicht nur falsch, sondern auch trügerisch sind. 1

9 3.1 Typische falsche Hoffnungen Große Daten sind wie alle anderen Daten, nicht wahr? Ich werde oft mit der Frage bzw. der Diskussion konfrontiert: Was ist der Unterschied zwischen Big Data, Medium Data und Small Data? Mittlerweile lache ich nicht mehr laut darüber, weil diese Frage zu oft aufgeworfen wird. Mittlerweile habe ich eine Standardantwort parat, um die Diskussion frühzeitig abzubrechen bzw. in eine konstruktive Richtung zu lenken. Hier ist sie. Daten lassen sich, im Gegensatz zu manchen Gliedmaßen, nicht größentechnisch vergleichen oder in Schubladen stecken. Es sind nicht die Daten, deren Größe Sie vergleichen müssen, sondern der Aufwand, den Sie betreiben müssen, um Informationen zu gewinnen, Daten aufzubereiten und bereitzustellen. Ich hatte z.b. einen Fall, bei dem es um lächerliche Datenmengen ging, die problemlos auf einen alten USB-Stick gepasst hätten. Man erwartete allerdings simultane Zugriffszahlen im zweifachen Millionenbereich pro Sekunde. Und unzählige unterschiedliche Datenformate und Strukturen. Ist das Medium? Oder Small? Nein, das ist definitiv Big, nur nicht aus der Mengenperspektive betrachtet. Die Arbeit mit Big Data erfordert sehr viel Wissen und Wachsamkeit dem Neuen gegenüber. Die Silos-Denke muss verschwinden, da man datenzentriert arbeitet. Daten umspannen das gesamte Unternehmen, hier gibt es keine künstlichen Grenzen. Es zählt nur die Geschwindigkeit und die Qualität, mit der man aus Daten wertvolle Informationen gewinnt und mit der man diese Informationen gewinnbringend verwendet. Wenn man das Technologische betrachtet, so bringt Big Data ganz klar eines mit sich: moderne, anwendungsfallspezifische und dafür optimierte Technologien. Im Kapitel Womit? gehe ich tiefer auf dieses Thema ein. Ganz wichtig ist an dieser Stelle die Denkweise. Wenn Ihre Wohnung für Ihre Familie zu klein wird, mieten oder kaufen Sie eine Neue, nicht wahr? Oder versuchen Sie, die Wände zu den Nachbarn zu durchbrechen, um sich Platz zu schaffen? Nein, das tunsienicht.selbst,wennsieanihrenbalkonnocheinenanbauklatschen,hat dieser extrem limitierte Kapazität, sollte er je durchs Genehmigungsverfahren kommen. Genauso funktioniert es auch mit der Technik. Ihre aktuelle Technik wurde zu einer Zeit gebaut, in der Speicher Platte, Hauptspeicher etc. extrem limitierende, teure Ressourcen waren. Da hatnoch jedes Byte gezählt, was den Erfolg von Cobol und ISAM erklärt. Aber heutzutage sieht die Welt ganz anders aus. Ihr iphone könnte theoretisch eine komplette Mission zum Mars abwickeln, und Sie könnten parallel noch Spiele darauf spielen. Moderne Technologien haben das erkannt und nutzen diese Tatsache aus. Sie nutzen die Maschine aus. Sie skalieren mit der Technologie, nicht (nur) per

10 38 3 Wie? Vertrag. Oder haben Sie nicht etwa das Problem, dass Ihr aktueller Datenbank- Cluster nur noch um einen Bruchteil des Möglichen besser skaliert, wenn Sie eine weitere, extrem teure Kiste anmieten oder kaufen und darauf die Dinosaurier-Anbieter-Software laufen lassen? Allerdings haben moderne Technologien ihren Preis: Sie arbeiten sehr nah an der Maschine und am Netz, und sie verlangen von Ihren Ingenieuren dasselbe. Und viel Wissen. Und eine gute theoretische Basis. Diese ist sehr selten geworden in der abstrakten Welt der O/RM-Frameworks und Enterprise- Architekturen Tools machen es für mich, nicht wahr? Ja, es ist in der Tat sehr populär geworden, blind auf Tools und die damit verbundenen Verträge und Zertifikate zu vertrauen. Zertifizierung zu einem Tool- Meister scheint die IT eines Unternehmens vor allen Eventualitäten zu schützen, und wenn da alle Stricke reißen, kann man sich auf den Vertrag mit dem Anbieter beziehen und gleich über Pönalen sprechen. Open Source Tools scheinen in großen Unternehmen vor allem aus dem Grunde seltener zu punkten, weil dahinter keine Zertifizierungsprogramme, Trainings und Vertragspartner stehen. Seinerzeit waren Vertragsdächer für Open Source Software sehr populär die Firmen, die im Ernstfall dafür geradestanden. Und in der neuen bunten Welt der modernen Technologien kommen gerade die Firmen in die klassischen Unternehmen, die dieses Modell mit ihren Open Source Produkten unterstützen. Nur: Open Source oder nicht ein Tool ist nur so klug wie derjenige, der es bedient. Computer können nicht für Menschen denken und Tools somit auch nicht. Im Falle von Big Data ist das Denken vor allem analytischer Natur, und egal welche Tools man nutzt, die analytischen Verfahren müssen von Menschen beschrieben, trainiert und dem Rechner bzw. dem Tool beigebracht werden. In den Kapiteln Wie? und Womit? werden Sie darüber noch einiges lesen. Im Prinzip unterscheiden sich die modernen Tools im Kontext von Big Data wenig von den alten Tools, wenn es um die analytische Seite geht. Die Technik ist eine andere, klar. Aber es dreht sich nach wie vor alles um Statistik, Machine Learning und Wahrscheinlichkeit. Aus der Sicht der Technik verhält es sich allerdings auch nicht sonderlich anders: Man muss sich mit der Technik auskennen. Ein richtig guter Autofahrer (und der bin ich z.b. nicht) kennt sich mit den Details seines Fahrzeugs aus, unabhängig davon, ob er einen uralten Cadillac oder einen topmodernen Benz

11 3.1 Typische falsche Hoffnungen 39 fährt. Die Prinzipien sind ähnlich, und im Falle von Problemen sind die Indikatoren auch ähnlich. Tools alleine machen Ihr Data nicht zum Big Data, und sie lösen auch nicht automatisch Ihre Probleme. Sie müssen sich weiterhin mit ihnen beschäftigen, und das so tief wie möglich, um aus ihnen das Maximum herauszuholen. Selbst wenn die glänzenden Marketing-Folien etwas anderes versprechen Meine Prozesse müssen sich nicht ändern, nicht wahr? Ach, Prozesse. Das altbewährte Schild, hinter dem man sich lange und erfolgreich verstecken kann, ohne wirklich innovativ sein zu müssen und überhaupt an dem eigentlichen Geschäftsziel zu arbeiten. Wenn irgendwas schlecht läuft, sind als Erstes die Prozesse dran sie müssen ja falsch sein, sondern würde alles richtig funktionieren. Was gäbe ich nicht alles dafür, auch nur einmal in meinem IT-Leben einen Papierprozess zu sehen, der auch in Wirklichkeit funktioniert! Nein, nicht per Selbstsuggestion und Verdrängung von Tatsachen. In Wirklichkeit heißt in Wirklichkeit. Getragen und stark vertreten von allen Akteuren. Habe ich noch nie gesehen. Warum? Weil Prozesse unnatürlich sind. Menschen sind Chaoten, und was sie im Privatleben sind, können sie in ihrem Berufsleben nicht ganz bzw. gar nicht ablegen. Der beste Prozess ist immer der, den sich eine Gruppe von Menschen selbst zurechtlegt. Für einen Manager sieht es nach Anarchie aus, doch wenn es festgelegte, minimale Handlungsregeln gibt, ist das keine Anarchie, sondern eine natürliche Ordnung. Klar, das passt einem Mikromanager dann nicht mehr ganz, wenn er nicht bei jeder auf CC steht, sodass er die anderen immer daran erinnert. Ich habe mir bei solchen Managern gerne den Spaß gemacht, jede aus meinem Spam-Ordner per CC an sie weiterzuleiten. Ich habe die Policy erfüllt, nicht wahr? Wird der Prozess von oben aufgezwungen, ist er zum Papierprozessdasein verurteilt und wird stets erfolgreich umgangen. Und Big Data -Prozess ist überhaupt ein Oxymoron. Es geht um teils chaotische Daten, die bekämpft werden müssen, und das mit allen Mitteln. Der einzige Prozess, der dem standhält, ist das natürliche, geordnete Chaos. Wie das, was ich auf meinem Tisch habe. Meiner Gattin gefällt es gar nicht, doch ich weiß ganz genau, wo was ist. Werden die Sachen geordnet, weiß ich nichts mehr. Ihr Prozess ändert sich mit Ihrer Denkweise, mit Ihrer Sicht auf die Daten. Sie werden eins mit Ihnen ich meine Ihre IT natürlich. Sie werden nur die al-

12 Stichwortverzeichnis A Abstraktion 43 Schicht 43 Service43, 99, 104, 133, 185 Analyse 9, 31 33, 40, 57, 70, 72, 75, 76, 86, 102, 111, 166, 178, 189, 194, 196, 198, 206 Aggregate 101 Aggregation 168, 199 Algorithmus 40, 50, 69, 94, 101, 115, 178, 199, 203 Effizienz94, 135 FalseNegative119 False Positive 119 Feature73 Machine Learning 6, 38, 41, 45, 69, 149, 179, 200, 206 Accuracy 48, 70 Error Rate 48 Klassifizierung 41, 113 Supervised Machine Learning 41 Unsupervised Machine Learning 41 Mathematik 40 42, 48, 67, 73, 149 Natural Language Processing 6, 41, 45, 69, 112, 151, 178, 185 Document Classification 42 Sentiment Analysis 42, 114 Trigramm112 Prognose 40, 41, 57, 70 Sample103, 150 Statistik 38, 40, 64, 69, 149, 199, 206 Wahrscheinlichkeit 38, 40, 70 Anbieter 8, 196, gen 155 Akamai32 Basho153 BITKOM207 Cloudera164 Coursera 46, 206 DataSift 57 DataStax 153 EMC160 Gnip57 HortonWorks 164 Loggly 167 MapR164 NeoTechnology158 Oracle197, 199 Postgres 199 Splunk167 VMware157 Anwendungsfall 29, 93, 109, 115, 158, 196, 200 Überwachung33 CERN101 Filterung71 FraudDetection31 Klick-Zähler 52 Library of Congress 105 Logs 45, 50, 54, 158, 168, 169, 179, 200 Meinungsbildung 57 Routen-Optimierung 33 Spracherkennung 70, 112 Time-Series 157, 158, 168, 169 Tracking61, 120, 199, 200

13 212 Stichwortverzeichnis Videostrom33 Zahlungsverkehr95 B Best Practices 72, 164 Betriebssystem 43, 45, 146, 174 Business Intelligence 2, 29, 59, 74, 186, 196, 198, 202 DWH187 ETL198 Mining 187 OLAP187 C Caching 68 Cache-Miss 144 Kohärenz 145 Write-Behind-Cache 92, 144 Write-Through-Cache 92, 144 CAP 93, 138, 140 APSystem141 CPSystem139 Partition Tolerance 139 Cloud 8, 28, 86, 94, 96, 154, 159, 170, 176, 188, 196, 205 AWS100 CloudFront 99 EC286, 100, 103 Riak-CS154, 196 S386, 96, 154, 196 CRM 26, 158, 183 D Datenbank 38, 49, 64, 66, 72, 77, 78, 92, 104, 130, 139, 150, 152, 156, 161, 165, 166, 168, 178, 194, 195, 198, 202 Backup96, 121 Chunk164 Column 154 Graphendatenbank195 HDFS115 Infrastruktur178 Konsistenz 121, 139, 140 NewSQL160, 194, 198 NoSQL66, 72, 88, 123, 151, 159, 160, 168, 178, 184, 194, 198, 204, 207 DocumentStore72, 155, 159, 198 Graphendatenbank158, 179, 198 In-Memory Store 68, 146, 156, 197, 198 Key/Value Store 72, 152, 175, 184, 199 Partitioning 91, 130 RDBMS67, 72, 89, 123, 126, 131, 147, 151, 155, 158, 161, 178, 194, 195, 198 Read44 Relation198 Schlüssel 130, 152, 155 Auto-Increment 122 Hashwert78, 94, 119, 122, 136, 199 ID78, 94 UUID 119, 122 Stored Procedure 90 Version126 MVCC130 Siblings137, 153 Tombstone137 Write44, 122, 137, 139, 153, 164 E Enterprise-Architektur 91, 181 F Framework 38, 43, 48, 70, 90, 195 O/RM38, 90 G Graph 148, 157 Knoten148 Pfad148 Traversieren 148 H Hardware 28, 83, 85, 86, 170, 197 Ausfall94, 96 Cluster38, 83, 87, 93, 96, 118, 134, 138, 149, 163 Commodity Hardware 28, 67, 83, 84, 170, 209 CPU85, 146, 171 Firewall107 FPGA175 GPU175

14 Stichwortverzeichnis 213 Hauptspeicher 37, 71, 197, 198 HDD172 I/O171 Infrastruktur92, 134 DMZ107 Kapazität 37 Knoten93, 122, 124, 129, 137, 153 Maschinerie 28 Netzwerk 43, 85, 103, 158, 171, 173 Backpressure 118 Physik84 Platte 37, 67, 71, 85, 119, 146, 171, 198 RAID170 Rechnerarchitektur 43 SSD 171 Virtualisierung 86 I Industrie 194 Öffentlicher Verkehr 32 Ad-Tech22 Bank8, 13, 31, 54, 95 Gambling32 High Frequency Trading 22, 76 Immobilien 12 Krankenhaus75 Online-Spiele 31 Partnervermittlung 31 Telekommunikation 15, 79, 169 CDR59, 169 Traveling76 Versicherung 8, 10, 13, 31, 58, 60 K Kosten 28, 35, 83, 85, 198, 204 CapEx35, 204 Investition 35, 162, 203 OpEx35, 204 ROI203 TCO203 L Location 57, 59, 60, 112, 199 IP-Adresse 56, 59, 87 Locking 127 Optimistic Locking 127, 143 Pessimistic Locking 127 M MapReduce 6, 162, 187, 196 In-Database-MapReduce 154, 162 Split196 Marketing 42, 73, 200 Cross-Selling 55 Werbung26, 59 Modell 64, 89, 92, 152 Relation67, 68, 89 Join 68 Schema68 N New Economy 43 Amazon8, 22, 86, 99, 189 Boundary 18 Facebook 2, 13, 22, 26, 54, 66, 108 Foursquare 60 Google 11, 22, 66, 73, 77, 83, 88, 94, 106, 112, 154, 207 Instagram14 LinkedIn47, 207 Netflix100, 190 Prismatic17, 207 Qype60 Simple 54 Square16 Startup14, 16, 33, 88, 103, 194 Twitter 6, 15, 22, 30, 55, 66, 88, 95, 110, 112, 206 Vimeo 99 Yahoo88 YouTube99 P Prozess 39, 44, 181 Configuration Management 87 Continuous Delivery 43, 87 DevOps43, 185 Manipulationssicherheit 43 Qualitätssicherung 43

15 214 Stichwortverzeichnis Rollentrennung 43 Vieraugenprinzip 43 Q Query 160, 195 CQL195 CRUD64, 88 Cypher195 SQL35, 195 Queue 102, 104, 111, 118, 175 JMS111 Publish/Subscribe 102 S Schmerzen 11, 12, 22, 50, 57, 83, 89 Alarm101 Anomalie101, 103 Aufbereitung 97 Batch102, 168, 169, 179, 189, 196, 197, 200, 202 Bottleneck 104, 128, 133 Datenmenge37, 80, 91, 97, 176, 196 Datensicherheit 105, 107 Anonymous 107 Lulzssec 107 Datenverlust126 Echtzeit100, 169, 173, 194 Fast-Echtzeit 71, 72, 102, 166, 168, 172, 174, 179, 187, 197, 202 Latenz95, 139, 161 Performance45, 85, 90, 103, 150 Single Point of Error 128 Single Point of Failure 119, 133, 164 SocialHacking107 Symptome 50 Transformation103 Variety23, 25 Velocity 23 Verfügbarkeit95, 99, 139, 161 Volume 23, 24 Schnittstelle 196 JDBC195 Protocol Buffers 154, 184, 195 REST104, 154, 158, 184, 195 Service62 SpringData195 Thrift 184, 195 SOA 62, 185 Soziale Netzwerke 12, 25, 26, 31, 55, 70, 88, 110, 200, 207 Staff DataScientist45, 48, 202 DBA93, 130, 162, 177 Team35 Strategie 2, 21, 47, 61, 87, 196 Business25 Business-IT-Alignment 205 Buy204, 209 Closed Source 88 Community 27, 88, 204 Crowdsourcing58, 60, 104 Datenschutz56, 59, 105, 108 Datenzentriertheit 2, 10, 14 Empfehlungssysteme 2, 9, 79, 208 Entscheidungsunterstützungssysteme 2, 34, 193, 208 Expertise41 Forschung46, 59 Full-Stack 45, 205 Gamification 14, 53, 108, 201 Human Business 203 Information 1, 21, 31, 35, 37, 41, 50, 57, 59, 62, 69, 70, 74, 198, 200, 202, 203 Innovation 2, 11, 105, 199, 204 Make204, 209 Marktvorteil36, 40, 84 Master Data Management 64, 182 MechanicalSympathy44 Open Source 38, 47, 87, 112, 153, 175, 204 Perspektive 27, 89, 207 Policy 39, 96, 203 Polyglott49, 151, 167, 190 Qualitätssteigerung 46 Scale-Up161 Technologie 20, 28, 37, 43, 44, 49, 68, 72, 94, 110, 117, 166, 176, 181, 185, 197, 198 Transparenz 54 Trial-And-Error 40 UserExperience53

16 Stichwortverzeichnis 215 Visualisierung 80, 151, 167, 180, 188, 191, 206 Dashboard102, 183 Wissenschaft 12, 40, 41, 47, 69, 150, 206 Suchfunktion 77, 90 Secondary Index 154, 175 Trefferliste 77 T Tool 38, 109, 117, 150, 177 Akka 174 Appliance 43, 176, 197, 201, 205 Bash49 BerkleyDB 159 C10K-Server 174 Cascalog206 Cassandra 153, 195 Clojure48, 166 Corpora70, 112 Couchbase156 CouchDB155, 184 D3180 Disco6, 115, 162 DiscoDB164 ElasticSearch176 Erlang49, 115, 155, 166, 169, 174, 185 ESB36, 43, 98, 104 F#48 Funktionale Programmierung 48 Greenplum 160 Hadoop 2, 6, 49, 88, 102, 115, 116, 151, 162, 164, 168, 184, 191, 196, 201 HBase164 HDFS164, 184, 196 Hive165, 168 IPython178, 180 Java48, 49, 111, 150, 158, 166, 175 JavaScript 49, 81, 104, 111, 166, 167 JSON104, 111, 115 Julia150 jvectormap 81 JVM49, 115, 155, 158, 174, 196, 197 LingPipe 151 Lucene175 Mahout 151 MATLAB150 memcached 174 MongoDB2, 6, 49, 155, 165, 184, 191, 198, 201 MySQL49, 178 Neo4j6, 158, 169, 195 Nginx6, 174 NLTK112, 151 Node.js167, 174 NuoDB160 Octave150 OpenNLP151 Oracle Loader for Hadoop 88, 196 OrientDB159 Perl49 Pig165, 168 Python48, 49, 110, 150, 166, 180, 185 R48, 49, 150, 166, 178 RabbitMQ 6, 155, 185 Redis6, 157, 169, 174 Riak6, 153, 159, 184, 196 Ruby166 SAPHANA159, 197 Scala48, 49, 166 Sensor75 Solr 176 Storm168, 174, 206 Tool-Chain 109 Tweepy 110 VoltDB 160 XML174 ZeroMQ 175 Transaktion 91, 118, 140 ACID91, 140, 160, 161 BASE140 Zweiphasen-Commit 91 Trend 102, 106, 194 U Uhrzeit 94, 118, 153 Atomuhr 128 NTP128 Zeitstempel 48, 91, 94, 127, 168 V Version 155

17 216 Stichwortverzeichnis Verteilte Systeme 6, 44, 48, 49, 95, 102, 117, 122, 198 Anti-Entropy 137 Asynchrone Kommunikation 118 Callback 95 Clock128 Complex Event Processing 101, 167, 168, 174 Consens119 Consistent Hashing 134, 136, 147 Content Delivery Network 99, 175 Data Locality 86, 115, 196 Dynamo153 Event95, 101, 168 Eventual Consistency 95, 141, 154 Fault-Tolerance 44 Garbage Collection 137 Gossip 138, 153 Heartbeat119 HintedHandoff139 HintedHandoff124, 140, 153 Kompensation 95, 118 Konsistenz 9, 95 Merkle-Tree 120, 153 Message 95 Parallelität 44, 49, 145 Polling 95 Prozessor 97, 115, 163 Quorum119, 125 SloppyQuorum125, 136 Redundanz147 Rehashing 133 Replikation96, 121, 122, 147, 202 LazyReplication122 Master/Master148, 161 Master/Slave 122, 148, 157, 158, 161 OperationTransfer121 State Transfer 121 Ring134, 153 Session 142 Sharding 91, 130, 136, 147, 149, 156 Snapshot96, 187 Split-Brain-Effekt 119 Timeout 118 VectorClock129, 136, 153 Voting 119 Worker 163

Stichwortverzeichnis. Pavlo Baron. Big Data für IT-Entscheider. Riesige Datenmengen und moderne Technologien gewinnbringend nutzen

Stichwortverzeichnis. Pavlo Baron. Big Data für IT-Entscheider. Riesige Datenmengen und moderne Technologien gewinnbringend nutzen Stichwortverzeichnis Pavlo Baron Big Data für IT-Entscheider Riesige Datenmengen und moderne Technologien gewinnbringend nutzen ISBN (Buch): 978-3-446-43339-7 ISBN (E-Book): 978-3-446-43392-2 Weitere Informationen

Mehr

Inhaltsverzeichnis. Pavlo Baron. Big Data für IT-Entscheider. Riesige Datenmengen und moderne Technologien gewinnbringend nutzen

Inhaltsverzeichnis. Pavlo Baron. Big Data für IT-Entscheider. Riesige Datenmengen und moderne Technologien gewinnbringend nutzen Inhaltsverzeichnis Pavlo Baron Big Data für IT-Entscheider Riesige Datenmengen und moderne Technologien gewinnbringend nutzen ISBN (Buch): 978-3-446-43339-7 ISBN (E-Book): 978-3-446-43392-2 Weitere Informationen

Mehr

Pavlo Baron. Big Data. für IT-Entscheider. Riesige Datenmengen. und moderne Technologien. gewinnbringend nutzen HANSER

Pavlo Baron. Big Data. für IT-Entscheider. Riesige Datenmengen. und moderne Technologien. gewinnbringend nutzen HANSER Pavlo Baron Big Data für IT-Entscheider Riesige Datenmengen und moderne Technologien gewinnbringend nutzen HANSER Inhalt Vorwort XI 1 Management Summary 1 2 Was? 7 2.1 Mein klassisches Business ist konkurrenzlos,

Mehr

Vorwort. Pavlo Baron. Big Data für IT-Entscheider. Riesige Datenmengen und moderne Technologien gewinnbringend nutzen. ISBN (Buch): 978-3-446-43339-7

Vorwort. Pavlo Baron. Big Data für IT-Entscheider. Riesige Datenmengen und moderne Technologien gewinnbringend nutzen. ISBN (Buch): 978-3-446-43339-7 Vorwort Pavlo Baron Big Data für IT-Entscheider Riesige Datenmengen und moderne Technologien gewinnbringend nutzen ISBN (Buch): 978-3-446-43339-7 ISBN (E-Book): 978-3-446-43392-2 Weitere Informationen

Mehr

BIG DATA FÜR IT-ENTSCHEIDER RIESIGE DATENMENGEN UND MODERNE TECHNOLOGIEN GEWINNBRINGEND NUTZEN. EXTRA: Mit kostenlosem E-Book

BIG DATA FÜR IT-ENTSCHEIDER RIESIGE DATENMENGEN UND MODERNE TECHNOLOGIEN GEWINNBRINGEND NUTZEN. EXTRA: Mit kostenlosem E-Book BIG DATA FÜR IT-ENTSCHEIDER pavlo BARON RIESIGE DATENMENGEN UND MODERNE TECHNOLOGIEN GEWINNBRINGEND NUTZEN EXTRA: Mit kostenlosem E-Book Baron Big Data für IT-Entscheider CHV Newsletterhinweis Computer

Mehr

Überblick und Vergleich von NoSQL. Datenbanksystemen

Überblick und Vergleich von NoSQL. Datenbanksystemen Fakultät Informatik Hauptseminar Technische Informationssysteme Überblick und Vergleich von NoSQL Christian Oelsner Dresden, 20. Mai 2011 1 1. Einführung 2. Historisches & Definition 3. Kategorien von

Mehr

Big Data Mythen und Fakten

Big Data Mythen und Fakten Big Data Mythen und Fakten Mario Meir-Huber Research Analyst, IDC Copyright IDC. Reproduction is forbidden unless authorized. All rights reserved. About me Research Analyst @ IDC Author verschiedener IT-Fachbücher

Mehr

ANALYTICS, RISK MANAGEMENT & FINANCE ARCHITECTURE. NoSQL Datenbanksysteme Übersicht, Abgrenzung & Charakteristik

ANALYTICS, RISK MANAGEMENT & FINANCE ARCHITECTURE. NoSQL Datenbanksysteme Übersicht, Abgrenzung & Charakteristik ARFA ANALYTICS, RISK MANAGEMENT & FINANCE ARCHITECTURE NoSQL Datenbanksysteme Übersicht, Abgrenzung & Charakteristik Ralf Leipner Domain Architect Analytics, Risk Management & Finance 33. Berner Architekten

Mehr

Big-Data-Technologien - Überblick - Prof. Dr. Jens Albrecht

Big-Data-Technologien - Überblick - Prof. Dr. Jens Albrecht Big-Data-Technologien - Überblick - Quelle: http://www.ingenieur.de/panorama/fussball-wm-in-brasilien/elektronischer-fussball-smartphone-app-helfen-training Big-Data-Anwendungen im Unternehmen Logistik

Mehr

NoSQL HANSER. Einstieg in die Web 2.0 Datenbanken. Stefan Edlich Achim Friedland Jens Hampe Benjamin Brauer Markus Brückner

NoSQL HANSER. Einstieg in die Web 2.0 Datenbanken. Stefan Edlich Achim Friedland Jens Hampe Benjamin Brauer Markus Brückner Stefan Edlich Achim Friedland Jens Hampe Benjamin Brauer Markus Brückner NoSQL Einstieg in die Web 2.0 Datenbanken 2., akutalisierte und erweiterte Auflage HANSER Geleitwort Vorwort Vorwort zur 2. Auflage

Mehr

Storage-Trends am LRZ. Dr. Christoph Biardzki

Storage-Trends am LRZ. Dr. Christoph Biardzki Storage-Trends am LRZ Dr. Christoph Biardzki 1 Über das Leibniz-Rechenzentrum (LRZ) Seit 50 Jahren Rechenzentrum der Bayerischen Akademie der Wissenschaften IT-Dienstleister für Münchner Universitäten

Mehr

Big Data Informationen neu gelebt

Big Data Informationen neu gelebt Seminarunterlage Version: 1.01 Copyright Version 1.01 vom 21. Mai 2015 Dieses Dokument wird durch die veröffentlicht. Copyright. Alle Rechte vorbehalten. Alle Produkt- und Dienstleistungs-Bezeichnungen

Mehr

Dokumentenorientierte Datenbanken - MongoDB

Dokumentenorientierte Datenbanken - MongoDB Dokumentenorientierte Datenbanken - MongoDB Jan Hentschel Ultra Tendency UG Übersicht Dokumente sind unabhängige Einheiten Bessere Performance (zusammengehörige Daten werden gemeinsam gelesen) Objektmodell

Mehr

Algorithmen. Consistent Hashing Bloom Filter MapReduce. Distributed Hash Tables. Einführung 1

Algorithmen. Consistent Hashing Bloom Filter MapReduce. Distributed Hash Tables. Einführung 1 Algorithmen Consistent Hashing Bloom Filter MapReduce Distributed Hash Tables Einführung 1 Consistent Hashing Problem: Wie finde ich den Speicherort für ein Objekt in einem verteilten System mit n Knoten?

Mehr

Analyse von unstrukturierten Daten. Peter Jeitschko, Nikolaus Schemel Oracle Austria

Analyse von unstrukturierten Daten. Peter Jeitschko, Nikolaus Schemel Oracle Austria Analyse von unstrukturierten Daten Peter Jeitschko, Nikolaus Schemel Oracle Austria Evolution von Business Intelligence Manuelle Analyse Berichte Datenbanken (strukturiert) Manuelle Analyse Dashboards

Mehr

Peter Dikant mgm technology partners GmbH. Echtzeitsuche mit Hadoop und Solr

Peter Dikant mgm technology partners GmbH. Echtzeitsuche mit Hadoop und Solr Peter Dikant mgm technology partners GmbH Echtzeitsuche mit Hadoop und Solr ECHTZEITSUCHE MIT HADOOP UND SOLR PETER DIKANT MGM TECHNOLOGY PARTNERS GMBH WHOAMI peter.dikant@mgm-tp.com Java Entwickler seit

Mehr

NoSQL. Was Architekten beachten sollten. Dr. Halil-Cem Gürsoy adesso AG. Architekturtag @ SEACON 2012 Hamburg

NoSQL. Was Architekten beachten sollten. Dr. Halil-Cem Gürsoy adesso AG. Architekturtag @ SEACON 2012 Hamburg NoSQL Was Architekten beachten sollten Dr. Halil-Cem Gürsoy adesso AG Architekturtag @ SEACON 2012 Hamburg 06.06.2012 Agenda Ein Blick in die Welt der RDBMS Klassifizierung von NoSQL-Datenbanken Gemeinsamkeiten

Mehr

Einführung in CouchDB

Einführung in CouchDB Einführung in CouchDB Zurücklehnen und entspannen! http://slog.io Thomas Schrader (@slogmen) 12/2010 Übersicht Bestandsaufnahme Ansatz Geschichte Technologien Features Skalierbarkeit Kurz & Gut Fazit Relationale

Mehr

The R(E)volution of Data Stores

The R(E)volution of Data Stores The R(E)volution of Data Stores Willkommen Schön, dass sie in diese Session kommen, ich bin Dominik Wagenknecht NoSQL Initiative Lead Technology Architect Accenture Wien Mobil: +43 676 8720 33921 dominik.wagenknecht@accenture.com

Mehr

Stefan Edlich Achim Friedland Jens Rampe Benjamin Brauer. NoSQL. Einstieg in die Welt nichtrelationaler Web 2.0 Datenbanken HANSER

Stefan Edlich Achim Friedland Jens Rampe Benjamin Brauer. NoSQL. Einstieg in die Welt nichtrelationaler Web 2.0 Datenbanken HANSER Stefan Edlich Achim Friedland Jens Rampe Benjamin Brauer NoSQL Einstieg in die Welt nichtrelationaler Web 2.0 Datenbanken HANSER Geleitwort 1 Vorwort 1 1 Einführung 1 1.1 Historie 1 1.2 Definition und

Mehr

SimpleVOC-Yetanother. Bausteine für eine Key/Value- Datenbank

SimpleVOC-Yetanother. Bausteine für eine Key/Value- Datenbank SimpleVOC-Yetanother Memcached? Bausteine für eine Key/Value- Datenbank SimpleVOC Yet another memcached? Bausteine für eine Key/Value Datenbank. Theorie (Martin Schönert) Praxis (Frank Celler) Eine Weisheit

Mehr

Seminar WS 2012/13. S. Chaudhuri et al, CACM, Aug. 2011. Parallel DBS vs. Open Platforms for Big Data, e.g. HaDoop Near-Realtime OLAP

Seminar WS 2012/13. S. Chaudhuri et al, CACM, Aug. 2011. Parallel DBS vs. Open Platforms for Big Data, e.g. HaDoop Near-Realtime OLAP Seminar WS 2012/13 S. Chaudhuri et al, CACM, Aug. 2011 Parallel DBS vs. Open Platforms for Big Data, e.g. HaDoop Near-Realtime OLAP 2 Vorkonfigurierte, komplette Data Warehouse-Installation Mehrere Server,

Mehr

Echtzeiterkennung von Cyber-Angriffen auf IT-Infrastrukturen. Frank Irnich SAP Deutschland

Echtzeiterkennung von Cyber-Angriffen auf IT-Infrastrukturen. Frank Irnich SAP Deutschland Echtzeiterkennung von Cyber-Angriffen auf IT-Infrastrukturen Frank Irnich SAP Deutschland SAP ist ein globales Unternehmen... unser Fokusgebiet... IT Security für... 1 globales Netzwerk > 70 Länder, >

Mehr

Seminar Cloud Data Management WS09/10. Tabelle1 Tabelle2

Seminar Cloud Data Management WS09/10. Tabelle1 Tabelle2 Seminar Cloud Data Management WS09/10 Tabelle1 Tabelle2 1 Einführung DBMS in der Cloud Vergleich verschiedener DBMS Beispiele Microsoft Azure Amazon RDS Amazon EC2 Relational Databases AMIs Was gibt es

Mehr

Big Data. Mit DVD. Was ist wichtig im Hadoop-Ökosystem? Hadoop 2 als universelle Data Processing Platform

Big Data. Mit DVD. Was ist wichtig im Hadoop-Ökosystem? Hadoop 2 als universelle Data Processing Platform Mit DVD Jobs im Wandel: Was für Informatiker bedeutet 2/2015 Auf der Heft-DVD Über 8 GByte Software für Entwickler Multimedia: 5 Videos zur Hoch leistungsdatenbank EXASolution Hadoop: Cloudera s Distribution

Mehr

NoSQL-Databases. Präsentation für Advanced Seminar "Computer Engineering", Matthias Hauck, matthias.hauck@stud.uni-heidelberg.de

NoSQL-Databases. Präsentation für Advanced Seminar Computer Engineering, Matthias Hauck, matthias.hauck@stud.uni-heidelberg.de NoSQL-Databases Präsentation für Advanced Seminar "Computer Engineering", Matthias Hauck, matthias.hauck@stud.uni-heidelberg.de Klassische SQL-Datenbanken Anwendungsgebiet: Geschäftsanwendungen Behördenanwendungen

Mehr

Big Data Management Thema 14: Cassandra

Big Data Management Thema 14: Cassandra Thema 14: Cassandra Jan Kristof Nidzwetzki Thema 14: Cassandra 1 / 25 Übersicht 1 Grundlagen Überblick Geschichte Datenmodel 2 Architektur Der logische Ring Persistenz der Daten Tunable Consistency Read

Mehr

Clouds. Erwartungen der Nutzer. Wolkig bis Heiter. (c) 2013, Peter Sturm, Universität Trier. Er ist verwöhnt! Er ist nicht dankbar!

Clouds. Erwartungen der Nutzer. Wolkig bis Heiter. (c) 2013, Peter Sturm, Universität Trier. Er ist verwöhnt! Er ist nicht dankbar! Clouds Wolkig bis Heiter Erwartungen der Nutzer Er ist verwöhnt! Verfügbarkeit Viele Anwendungen Intuitive Interfaces Hohe Leistung Er ist nicht dankbar! Mehr! Mehr! Mehr! Moore 1 Erwartungen der Entwickler

Mehr

Erfahrungsbericht: Umstieg von RDBMS auf Big Data-Technologien

Erfahrungsbericht: Umstieg von RDBMS auf Big Data-Technologien Wir unternehmen IT. Erfahrungsbericht: Umstieg von RDBMS auf Big Data-Technologien Karlsruhe, 30.09.2015 $id thgreiner Thorsten Greiner Teamleiter Software Development ConSol* Software GmbH, Düsseldorf

Mehr

NoSQL-Datenbanken und Hadoop im Zusammenspiel mit dem Data Warehouse

NoSQL-Datenbanken und Hadoop im Zusammenspiel mit dem Data Warehouse NoSQL-Datenbanken und Hadoop im Zusammenspiel mit dem Data Warehouse Carsten Czarski Oracle Deutschland B.V. & Co KG Big Data Betrachten von Daten die bislang nicht betrachtet wurden

Mehr

Hans-Peter Zorn Inovex GmbH. Wer gewinnt das SQL-Rennen auf der Hadoop-Strecke?

Hans-Peter Zorn Inovex GmbH. Wer gewinnt das SQL-Rennen auf der Hadoop-Strecke? Hans-Peter Zorn Inovex GmbH Wer gewinnt das SQL-Rennen auf der Hadoop-Strecke? War nicht BigData das gleiche NoSQL? Data Lake = Keine Struktur? flickr/matthewthecoolguy Oder gar ein Hadump? flickr/autohistorian

Mehr

BIG DATA HYPE ODER CHANCE

BIG DATA HYPE ODER CHANCE BIG DATA HYPE ODER CHANCE 1 Fuchs Dominik 16.05.2014 Fahrplan 2 Begriff Big Data Die 3 V s Fallbeispiel Google Was? Wie? Womit? Fazit & Ausblick in die Zukunft Der Begriff Big Data 3 Datenmengen, die zu

Mehr

Cloud-Provider im Vergleich. Markus Knittig @mknittig

Cloud-Provider im Vergleich. Markus Knittig @mknittig Cloud-Provider im Vergleich Markus Knittig @mknittig As Amazon accumulated more and more services, the productivity levels in producing innovation and value were dropping primarily because the engineers

Mehr

In-Memory & Real-Time Hype vs. Realität: Maßgeschneiderte IBM Business Analytics Lösungen für SAP-Kunden

In-Memory & Real-Time Hype vs. Realität: Maßgeschneiderte IBM Business Analytics Lösungen für SAP-Kunden In-Memory & Real-Time Hype vs. Realität: Maßgeschneiderte IBM Business Analytics Lösungen für SAP-Kunden Jens Kaminski ERP Strategy Executive IBM Deutschland Ungebremstes Datenwachstum > 4,6 Millarden

Mehr

ETL in den Zeiten von Big Data

ETL in den Zeiten von Big Data ETL in den Zeiten von Big Data Dr Oliver Adamczak, IBM Analytics 1 1 Review ETL im Datawarehouse 2 Aktuelle Herausforderungen 3 Future of ETL 4 Zusammenfassung 2 2015 IBM Corporation ETL im Datawarehouse

Mehr

Oracle BI&W Referenz Architektur Big Data und High Performance Analytics

Oracle BI&W Referenz Architektur Big Data und High Performance Analytics DATA WAREHOUSE Oracle BI&W Referenz Architektur Big Data und High Performance Analytics Alfred Schlaucher, Oracle Scale up Unternehmensdaten zusammenfassen Noch mehr Informationen

Mehr

Albert HAYR Linux, IT and Open Source Expert and Solution Architect. Open Source professionell einsetzen

Albert HAYR Linux, IT and Open Source Expert and Solution Architect. Open Source professionell einsetzen Open Source professionell einsetzen 1 Mein Background Ich bin überzeugt von Open Source. Ich verwende fast nur Open Source privat und beruflich. Ich arbeite seit mehr als 10 Jahren mit Linux und Open Source.

Mehr

Mit In-Memory Technologie zu neuen Business Innovationen. Stephan Brand, VP HANA P&D, SAP AG May, 2014

Mit In-Memory Technologie zu neuen Business Innovationen. Stephan Brand, VP HANA P&D, SAP AG May, 2014 Mit In-Memory Technologie zu neuen Business Innovationen Stephan Brand, VP HANA P&D, SAP AG May, 2014 SAP Medical Research Insights : Forschung und Analyse in der Onkologie SAP Sentinel : Entscheidungsunterstützung

Mehr

Apache Lucene. Mach s wie Google! Bernd Fondermann freier Software Architekt bernd.fondermann@brainlounge.de berndf@apache.org

Apache Lucene. Mach s wie Google! Bernd Fondermann freier Software Architekt bernd.fondermann@brainlounge.de berndf@apache.org Apache Lucene Mach s wie Google! Bernd Fondermann freier Software Architekt bernd.fondermann@brainlounge.de berndf@apache.org 1 Apache Apache Software Foundation Software free of charge Apache Software

Mehr

vfabric-daten Big Data Schnell und flexibel

vfabric-daten Big Data Schnell und flexibel vfabric-daten Big Data Schnell und flexibel September 2012 2012 VMware Inc. All rights reserved Im Mittelpunkt: Daten Jeden Morgen wache ich auf und frage mich: Wie kann ich den Datenfluss optimieren,

Mehr

NoSQL. Einblick in die Welt nicht-relationaler Datenbanken. Christoph Föhrdes. UnFUG, SS10 17.06.2010

NoSQL. Einblick in die Welt nicht-relationaler Datenbanken. Christoph Föhrdes. UnFUG, SS10 17.06.2010 NoSQL Einblick in die Welt nicht-relationaler Datenbanken Christoph Föhrdes UnFUG, SS10 17.06.2010 About me Christoph Föhrdes AIB Semester 7 IRC: cfo #unfug@irc.ghb.fh-furtwangen.de netblox GbR (http://netblox.de)

Mehr

Oracle Big Data Technologien Ein Überblick

Oracle Big Data Technologien Ein Überblick Oracle Big Data Technologien Ein Überblick Ralf Lange Global ISV & OEM Sales NoSQL: Eine kurze Geschichte Internet-Boom: Erste Ansätze selbstgebauter "Datenbanken" Google stellt "MapReduce"

Mehr

Big Data im Call Center: Kundenbindung verbessern, Antwortzeiten verkürzen, Kosten reduzieren! 25.02.2016 Sascha Bäcker Dr.

Big Data im Call Center: Kundenbindung verbessern, Antwortzeiten verkürzen, Kosten reduzieren! 25.02.2016 Sascha Bäcker Dr. Big Data im Call Center: Kundenbindung verbessern, Antwortzeiten verkürzen, Kosten reduzieren! 25.02.2016 Sascha Bäcker Dr. Florian Johannsen AGENDA 1. Big Data Projekt der freenet Group Dr. Florian Johannsen

Mehr

HA Architekturen mit MySQL

HA Architekturen mit MySQL HA Architekturen mit MySQL DOAG SIG Database MySQL, Hannover, 19. May 2011 Oli Sennhauser Senior MySQL Consultant, FromDual GmbH oli.sennhauser@fromdual.com http://www.fromdual.com www.fromdual.com 1 FromDual

Mehr

Big Data Plattformen für polystrukturierte Daten neue Chancen und Herausforderungen

Big Data Plattformen für polystrukturierte Daten neue Chancen und Herausforderungen Big Data Plattformen für polystrukturierte Daten neue Chancen und Herausforderungen Oracle DWH-Konferenz 21. März 2012 Dr. Carsten Bange Gründer & Geschäftsführer BARC Big Data bietet Methoden und Technologien

Mehr

Big Data Anwendungen Chancen und Risiken

Big Data Anwendungen Chancen und Risiken Big Data Anwendungen Chancen und Risiken Dr. Kurt Stockinger Studienleiter Data Science, Dozent für Informatik Zürcher Hochschule für Angewandte Wissenschaften Big Data Workshop Squeezing more out of Data

Mehr

EMC. Data Lake Foundation

EMC. Data Lake Foundation EMC Data Lake Foundation 180 Wachstum unstrukturierter Daten 75% 78% 80% 71 EB 106 EB 133 EB Weltweit gelieferte Gesamtkapazität Unstrukturierte Daten Quelle März 2014, IDC Structured vs. Unstructured

Mehr

DATA WAREHOUSE. Big Data Alfred Schlaucher, Oracle

DATA WAREHOUSE. Big Data Alfred Schlaucher, Oracle DATA WAREHOUSE Big Data Alfred Schlaucher, Oracle Scale up Unternehmensdaten zusammenfassen Noch mehr Informationen aus Unternehmens- Daten ziehen! Datenmengen, Performance und Kosten Daten als Geschäftsmodell

Mehr

SQL on Hadoop für praktikables BI auf Big Data.! Hans-Peter Zorn und Dr. Dominik Benz, Inovex Gmbh

SQL on Hadoop für praktikables BI auf Big Data.! Hans-Peter Zorn und Dr. Dominik Benz, Inovex Gmbh SQL on Hadoop für praktikables BI auf Big Data! Hans-Peter Zorn und Dr. Dominik Benz, Inovex Gmbh War nicht BigData das gleiche NoSQL? 2 Wie viele SQL Lösungen für Hadoop gibt es mittlerweile? 3 ! No SQL!?

Mehr

Big Data Hype und Wirklichkeit Bringtmehrauchmehr?

Big Data Hype und Wirklichkeit Bringtmehrauchmehr? Big Data Hype und Wirklichkeit Bringtmehrauchmehr? Günther Stürner, Vice President Sales Consulting 1 Copyright 2011, Oracle and/or its affiliates. All rights Überschrift 2 Copyright 2011, Oracle and/or

Mehr

NoSQL für Anwendungen

NoSQL für Anwendungen NoSQL für Anwendungen Hochschule Mannheim Fakultät für Informatik Cluster Grid Computing Seminar SS 2012 Lemmy Tauer (729400) lemmy.coldlemonade.tauer@gmail.com NoSQL CAP / ACID / Kompromisse Key-Value

Mehr

Data. Guido Oswald Solution Architect @SAS Switzerland. make connections share ideas be inspired

Data. Guido Oswald Solution Architect @SAS Switzerland. make connections share ideas be inspired make connections share ideas be inspired Data Guido Oswald Solution Architect @SAS Switzerland BIG Data.. Wer? BIG Data.. Wer? Wikipedia sagt: Als Big Data werden besonders große Datenmengen bezeichnet,

Mehr

Architektur von Cassandra

Architektur von Cassandra Seminar: NoSQL Wintersemester 201/2014 Cassandra Zwischenpräsentation 1 Ablauf Replica Partitioners Snitches Besteht aus mehrere Knoten Jeder Knoten kann (Lesen, Schreib. oder Löschen) Verwendet Hash Algorithm

Mehr

Oracle Data Warehouse Mit Big Data neue Horizonte für das Data Warehouse ermöglichen

Oracle Data Warehouse Mit Big Data neue Horizonte für das Data Warehouse ermöglichen DATA WAREHOUSE Oracle Data Warehouse Mit Big Data neue Horizonte für das Data Warehouse ermöglichen Alfred Schlaucher, Detlef Schroeder DATA WAREHOUSE Themen Big Data Buzz Word oder eine neue Dimension

Mehr

Persönlichkeiten bei bluehands

Persönlichkeiten bei bluehands Persönlichkeiten bei Technologien bei Skalierbare Anwendungen mit Windows Azure GmbH & co.mmunication KG am@.de; posts..de/am 1 2 3 4 5 6 7 8 9 Immer mehr Mehr Performance Mehr Menge Mehr Verfügbarkeit

Mehr

Soziotechnische Informationssysteme

Soziotechnische Informationssysteme Soziotechnische Informationssysteme 8. NoSQL Relationale Datenbank NoSQL Datenbank Relationale Datenbank? NoSQL Datenbank RDBM 2 Warum? Skalierbarkeit Riesige Datenmengen Performanz und Elastizität Auslastung

Mehr

NoSQL & Big Data. NoSQL Databases and Big Data. NoSQL vs SQL DBs. NoSQL DBs - Überblick. Datenorientierte Systemanalyse. Gerhard Wohlgenannt

NoSQL & Big Data. NoSQL Databases and Big Data. NoSQL vs SQL DBs. NoSQL DBs - Überblick. Datenorientierte Systemanalyse. Gerhard Wohlgenannt NoSQL & Big Data Datenorientierte Systemanalyse NoSQL Databases and Big Data Gerhard Wohlgenannt Die besprochenen Systeme haben nicht den Anspruch und das Ziel DBS zu ersetzen, sondern für gewisse Anwendungsfälle

Mehr

NoSQL Databases and Big Data

NoSQL Databases and Big Data Datenorientierte Systemanalyse NoSQL Databases and Big Data Gerhard Wohlgenannt NoSQL & Big Data Die besprochenen Systeme haben nicht den Anspruch und das Ziel DBS zu ersetzen, sondern für gewisse Anwendungsfälle

Mehr

Java Forum Stuttgart 2013 Kai.Spichale@adesso.de twitter.com/kspichale spichale.blogspot.de

Java Forum Stuttgart 2013 Kai.Spichale@adesso.de twitter.com/kspichale spichale.blogspot.de NoSQL für Java-Entwickler Java Forum Stuttgart 2013 Kai.Spichale@adesso.de twitter.com/kspichale spichale.blogspot.de 23.06.2013 Agenda Datengröße Key-value Stores 1. Wide Column 2. Cassandra Document

Mehr

Aktuelle SE Praktiken für das WWW

Aktuelle SE Praktiken für das WWW Aktuelle SE Praktiken für das WWW SQL vs. NoSQL W. Mark Kubacki 23.06.2010 Gliederung Zusammenfassung Entstehungsgeschichte SQL vs. NoSQL Systemarchitekturen und Wachstumsmuster SQL NoSQL Überblick und

Mehr

Textanalyse mit UIMA und Hadoop.!! Hans-Peter Zorn data2day, Karlsruhe, 27.11.2014

Textanalyse mit UIMA und Hadoop.!! Hans-Peter Zorn data2day, Karlsruhe, 27.11.2014 Textanalyse mit UIMA und Hadoop Hans-Peter Zorn data2day, Karlsruhe, 27.11.2014 Über mich seit 2014: Big Data Scientist @ Inovex 2011-2013: TU Darmstadt, UKP Lab Etablierung der Hadoop-Infrastruktur Unterstützung

Mehr

Hadoop. Eine Open-Source-Implementierung von MapReduce und BigTable. von Philipp Kemkes

Hadoop. Eine Open-Source-Implementierung von MapReduce und BigTable. von Philipp Kemkes Hadoop Eine Open-Source-Implementierung von MapReduce und BigTable von Philipp Kemkes Hadoop Framework für skalierbare, verteilt arbeitende Software Zur Verarbeitung großer Datenmengen (Terra- bis Petabyte)

Mehr

Performance Tuning & Scale-Out mit MySQL

Performance Tuning & Scale-Out mit MySQL Performance Tuning & Scale-Out mit MySQL Erfa-Gruppe Internet Briefing 2. März 2010 Oli Sennhauser Senior MySQL Consultant, FromDual oli.sennhauser@fromdual.com www.fromdual.com 1 Inhalt Allgemeines zu

Mehr

Prof. Dr.-Ing. Rainer Schmidt 1

Prof. Dr.-Ing. Rainer Schmidt 1 Prof. Dr.-Ing. Rainer Schmidt 1 Business Analytics und Big Data sind Thema vieler Veröffentlichungen. Big Data wird immer häufiger bei Google als Suchbegriff verwendet. Prof. Dr.-Ing. Rainer Schmidt 2

Mehr

Einführung in Hadoop

Einführung in Hadoop Einführung in Hadoop Inhalt / Lern-Ziele Übersicht: Basis-Architektur von Hadoop Einführung in HDFS Einführung in MapReduce Ausblick: Hadoop Ökosystem Optimierungen Versionen 10.02.2012 Prof. Dr. Christian

Mehr

Spark, Impala und Hadoop in der Kreditrisikoberechnung

Spark, Impala und Hadoop in der Kreditrisikoberechnung Spark, Impala und Hadoop in der Kreditrisikoberechnung Big Data In-Memory-Technologien für mittelgroße Datenmengen TDWI München, 22. Juni 2015 Joschka Kupilas, Data Scientist, Adastra GmbH 2 Inhalt Vorwort

Mehr

Thementisch Anwendungsgebiete und

Thementisch Anwendungsgebiete und Thementisch Anwendungsgebiete und b Erfolgsgeschichten KMUs und Big Data Wien 08. Juni 2015 Hermann b Stern, Know-Center www.know-center.at Know-Center GmbH Know-Center Research Center for Data-driven

Mehr

Oracle 10g revolutioniert Business Intelligence & Warehouse

Oracle 10g revolutioniert Business Intelligence & Warehouse 10g revolutioniert Business Intelligence & Warehouse Marcus Bender Strategisch Technische Unterstützung (STU) Hamburg 1-1 BI&W Market Trends DWH werden zu VLDW Weniger Systeme, mehr Daten DWH werden konsolidiert

Mehr

big data @ work Chancen erkennen, Risiken verstehen von Thomas Davenport, Thomas H. Davenport, Péter Horváth 1. Auflage

big data @ work Chancen erkennen, Risiken verstehen von Thomas Davenport, Thomas H. Davenport, Péter Horváth 1. Auflage big data @ work Chancen erkennen, Risiken verstehen von Thomas Davenport, Thomas H. Davenport, Péter Horváth 1. Auflage Verlag Franz Vahlen München 2014 Verlag Franz Vahlen im Internet: www.vahlen.de ISBN

Mehr

Wide Column Stores. Felix Bruckner Mannheim, 15.06.2012

Wide Column Stores. Felix Bruckner Mannheim, 15.06.2012 Wide Column Stores Felix Bruckner Mannheim, 15.06.2012 Agenda Einführung Motivation Grundlagen NoSQL Grundlagen Wide Column Stores Anwendungsfälle Datenmodell Technik Wide Column Stores & Cloud Computing

Mehr

Möglichkeiten für bestehende Systeme

Möglichkeiten für bestehende Systeme Möglichkeiten für bestehende Systeme Marko Filler Bitterfeld, 27.08.2015 2015 GISA GmbH Leipziger Chaussee 191 a 06112 Halle (Saale) www.gisa.de Agenda Gegenüberstellung Data Warehouse Big Data Einsatz-

Mehr

Caching. Hintergründe, Patterns &" Best Practices" für Business Anwendungen

Caching. Hintergründe, Patterns & Best Practices für Business Anwendungen Caching Hintergründe, Patterns &" Best Practices" für Business Anwendungen Michael Plöd" Senacor Technologies AG @bitboss Business-Anwendung!= Twitter / Facebook & co. " / kæʃ /" bezeichnet in der EDV

Mehr

25.09.2014. Zeit bedeutet eine Abwägung von Skalierbarkeit und Konsistenz

25.09.2014. Zeit bedeutet eine Abwägung von Skalierbarkeit und Konsistenz 1 2 Dies ist ein Vortrag über Zeit in verteilten Anwendungen Wir betrachten die diskrete "Anwendungszeit" in der nebenläufige Aktivitäten auftreten Aktivitäten in einer hochgradig skalierbaren (verteilten)

Mehr

Willkommen zum Azure Sales Scenario Training

Willkommen zum Azure Sales Scenario Training Azure Sales Training Willkommen zum Azure Sales Scenario Training Übung macht den Meister. Das gilt auch in Situationen, in denen man Kunden von der Nützlichkeit von Microsoft Azure überzeugen möchte.

Mehr

Eine Einführung in Apache CouchDB. Java-Forum Stuttgart 2011

Eine Einführung in Apache CouchDB. Java-Forum Stuttgart 2011 Eine Einführung in Apache CouchDB Java-Forum Stuttgart 2011 Johannes Schneider, cedarsoft GmbH js@cedarsoft.com http://blog.cedarsoft.com http://cedarsoft.com Vielen Dank CouchDB The VERY Basics Vorerfahrung?

Mehr

Erst Lesen dann Kaufen

Erst Lesen dann Kaufen Erst Lesen dann Kaufen ebook Das Geheimnis des Geld verdienens Wenn am Ende des Geldes noch viel Monat übrig ist - so geht s den meisten Leuten. Sind Sie in Ihrem Job zufrieden - oder würden Sie lieber

Mehr

on Azure mit HDInsight & Script Ac2ons

on Azure mit HDInsight & Script Ac2ons Willkommen beim #GAB 2015! on Azure mit HDInsight & Script Ac2ons Lokale Sponsoren: HansPeter Grahsl Netconomy Entwickler & Berater FH CAMPUS 02 Twi9er: @hpgrahsl Überblick Inhalte Was ist HDInsight? Wozu

Mehr

NoSQL-Datenbanken. Kapitel 1: Einführung. Lars Kolb Sommersemester 2014. Universität Leipzig http://dbs.uni-leipzig.de 1-1

NoSQL-Datenbanken. Kapitel 1: Einführung. Lars Kolb Sommersemester 2014. Universität Leipzig http://dbs.uni-leipzig.de 1-1 NoSQL-Datenbanken Kapitel 1: Einführung Lars Kolb Sommersemester 2014 Universität Leipzig http://dbs.uni-leipzig.de 1-1 Inhaltsverzeichnis NoSQL-Datenbanken Motivation und Definition Kategorisierung, Eigenschaften

Mehr

Oracle Big Data Technologien Ein Überblick

Oracle Big Data Technologien Ein Überblick Oracle Big Data Technologien Ein Überblick Jürgen Vester Oracle Deutschland B.V. & Co KG Um was geht es bei Big Data? Bei Big Data sprechen wir eine Klasse von Daten an, die in der

Mehr

Umsetzung von BI-Lösungen mit Unterstützung einer Suchmaschine. TDWI Stuttgart 15.04.2015 Tobias Kraft, exensio GmbH

Umsetzung von BI-Lösungen mit Unterstützung einer Suchmaschine. TDWI Stuttgart 15.04.2015 Tobias Kraft, exensio GmbH Umsetzung von BI-Lösungen mit Unterstützung einer Suchmaschine TDWI Stuttgart 15.04.2015 Tobias Kraft, exensio GmbH Suchmaschinen Elasticsearch BI-Stack mit Elasticsearch Use Cases Pharmabranche 2 Funktionen

Mehr

IT-Monitoring braucht Sicherheit Sicherheit braucht Monitoring. Günther Klix op5 GmbH - Area Manager D/A/CH

IT-Monitoring braucht Sicherheit Sicherheit braucht Monitoring. Günther Klix op5 GmbH - Area Manager D/A/CH IT-Monitoring braucht Sicherheit Sicherheit braucht Monitoring Günther Klix op5 GmbH - Area Manager D/A/CH Technische Anforderungen an IT Immer komplexere & verteiltere Umgebungen zunehmend heterogene

Mehr

Datenbanksysteme Kapitel 6: Neue Konzepte der Datenbanktechnologie

Datenbanksysteme Kapitel 6: Neue Konzepte der Datenbanktechnologie Datenbanksysteme Kapitel 6: Neue Konzepte der Datenbanktechnologie Prof. Dr. Peter Chamoni Mercator School of Management Lehrstuhl für Wirtschaftsinformatik, insb. Business Intelligence Prof. Dr. Peter

Mehr

IBM Netezza Data Warehouse Appliances - schnelle Analysen mit hohen Datenmengen

IBM Netezza Data Warehouse Appliances - schnelle Analysen mit hohen Datenmengen IBM Netezza Data Warehouse Appliances - schnelle Analysen mit hohen Datenmengen Nahezu 70% aller Data Warehouse Anwendungen leiden unter Leistungseinschränkungen der unterschiedlichsten Art. - Gartner

Mehr

Agenda. (1) Einleitung (2) neo4j. (3) Beispiel + Demo

Agenda. (1) Einleitung (2) neo4j. (3) Beispiel + Demo Agenda (1) Einleitung (2) neo4j (1) neo4j Embedded (2) neo4j Server (REST-Interface) (3) Cypher Query Language (4) High Availability Cluster (3) Beispiel + Demo 2 Einleitung 3 Einleitung: Geschichte 1960er:

Mehr

Scaling Rails. Jonathan Weiss, 02.09.2009 Peritor GmbH

Scaling Rails. Jonathan Weiss, 02.09.2009 Peritor GmbH Scaling Rails Jonathan Weiss, 02.09.2009 Peritor GmbH Scaling Rails 2 Scaling Rails 3 Rails 4 Performance Wikipedia: Das Wort Leistung (engl. Performance) wird in der Informatik verwendet, um das Vermögen

Mehr

001 Gibt es einen roten Faden, den man aus der Beobachtung der letzten Jahrzehnte aus der Open Source Kultur ableiten kann?

001 Gibt es einen roten Faden, den man aus der Beobachtung der letzten Jahrzehnte aus der Open Source Kultur ableiten kann? 001 Liebe Veranstaltungsteilnehmer ich heiße sie herzlich willkommen und bedanke mich bei Gernot Gauper, dass ich jetzt mit Ihnen über mein Herzensthema "Open Source" sprechen darf. Gibt es einen roten

Mehr

Was ist die Cloud? CCW interner Vortrag für Themenabend Erstellt: Mai 2012, Heiko Ehmsen Dauer: ca. 30 Minuten. Inhalt

Was ist die Cloud? CCW interner Vortrag für Themenabend Erstellt: Mai 2012, Heiko Ehmsen Dauer: ca. 30 Minuten. Inhalt Was ist die Cloud? CCW interner Vortrag für Themenabend Erstellt: Mai 2012, Heiko Ehmsen Dauer: ca. 30 Minuten Inhalt 1. Einführung Geschichte 2. Grundidee der Cloud-Technik (Virtualisierung, Skalierbarkeit,

Mehr

MySQL High Availability. DOAG 2013 Datenbank. 14. Mai 2013, Düsseldorf. Oli Sennhauser

MySQL High Availability. DOAG 2013 Datenbank. 14. Mai 2013, Düsseldorf. Oli Sennhauser MySQL High Availability DOAG 2013 Datenbank 14. Mai 2013, Düsseldorf Oli Sennhauser Senior MySQL Berater, FromDual GmbH oli.sennhauser@fromdual.com 1 / 23 Über FromDual GmbH FromDual bietet neutral und

Mehr

Was passiert mit meiner Cloud, wenn es regnet?

Was passiert mit meiner Cloud, wenn es regnet? Was passiert mit meiner Cloud, wenn es regnet? 5 dumme Fragen über die Cloud, die ganz schön clever sind Einfach. Anders. cloud.de Inhalt Vorwort 1. Wo ist die Cloud? 03 04 2. Gibt es nur eine Cloud, aus

Mehr

Rein relationale DB in Prod? Datenbanken in produktiven Einsatz? SQL + NoSQL DB in Prod? (MongoDB, Redis, CouchDB, Cassandra)

Rein relationale DB in Prod? Datenbanken in produktiven Einsatz? SQL + NoSQL DB in Prod? (MongoDB, Redis, CouchDB, Cassandra) 1 Rein relationale DB in Prod? Datenbanken in produktiven Einsatz? 2 SQL + NoSQL DB in Prod? (MongoDB, Redis, CouchDB, Cassandra) 3 DB-Cluster in der Cloud? NoSQL?!? SQL Normalformen Come as you are Warum

Mehr

Step 0: Bestehende Analyse-Plattform

Step 0: Bestehende Analyse-Plattform Die Themen 09:30-09:45 Einführung in das Thema (Oracle) 09:45-10:15 Hadoop in a Nutshell (metafinanz) 10:15-10:45 Hadoop Ecosystem (metafinanz) 10:45-11:00 Pause 11:00-11:30 BigData Architektur-Szenarien

Mehr

Deploy Early oder die richtigen. Zutaten für Ihren Relaunch

Deploy Early oder die richtigen. Zutaten für Ihren Relaunch Deploy Early oder die richtigen Zutaten für Ihren Relaunch Plug & Play Web Applikationen 2016 Paradigma #1 Nutze Vorfertigung! HTML/CSS-Frameworks Responsive Design Logo Button Action Screen Tablet Landscape

Mehr

Apache Hadoop. Distribute your data and your application. Bernd Fondermann freier Software Architekt bernd.fondermann@brainlounge.de berndf@apache.

Apache Hadoop. Distribute your data and your application. Bernd Fondermann freier Software Architekt bernd.fondermann@brainlounge.de berndf@apache. Apache Hadoop Distribute your data and your application Bernd Fondermann freier Software Architekt bernd.fondermann@brainlounge.de berndf@apache.org Apache The Apache Software Foundation Community und

Mehr

Citizen Data Science. Balázs Bárány. 29. April 2016. Linuxwochen Wien 2016

Citizen Data Science. Balázs Bárány. 29. April 2016. Linuxwochen Wien 2016 Citizen Data Science Balázs Bárány Linuxwochen Wien 2016 29. April 2016 Inhalt Einführung: Data Science Werkzeuge und Methoden Citizen Data Science Daten holen Daten verstehen Daten-Vorverarbeitung Prädiktive

Mehr

Trends im Markt für Business Intelligence. Patrick Keller, Senior Analyst & Prokurist CeBIT 2016

Trends im Markt für Business Intelligence. Patrick Keller, Senior Analyst & Prokurist CeBIT 2016 Trends im Markt für Business Intelligence Patrick Keller, Senior Analyst & Prokurist CeBIT 2016 18.03.2016 BARC 2016 2 IT Meta-Trends 2016 Digitalisierung Consumerization Agilität Sicherheit und Datenschutz

Mehr

Oracle EngineeredSystems

Oracle EngineeredSystems Oracle EngineeredSystems Überblick was es alles gibt Themenübersicht Überblick über die Engineered Systems von Oracle Was gibt es und was ist der Einsatzzweck? Wann machen diese Systeme Sinn? Limitationen

Mehr

Wird BIG DATA die Welt verändern?

Wird BIG DATA die Welt verändern? Wird BIG DATA die Welt verändern? Frankfurt, Juni 2013 Dr. Wolfgang Martin Analyst und Mitglied im Boulder BI Brain Trust Big Data Entmythisierung von Big Data. Was man über Big Data wissen sollte. Wie

Mehr

Apache HBase. A BigTable Column Store on top of Hadoop

Apache HBase. A BigTable Column Store on top of Hadoop Apache HBase A BigTable Column Store on top of Hadoop Ich bin... Mitch Köhler Selbstständig seit 2010 Tätig als Softwareentwickler Softwarearchitekt Student an der OVGU seit Oktober 2011 Schwerpunkte Client/Server,

Mehr

Big Data. Hype oder Chance? Sebastian Kraubs

Big Data. Hype oder Chance? Sebastian Kraubs Big Data Hype oder Chance? Sebastian Kraubs Heute reden alle über Big Data Quellen: http://blogs.sybase.com/sybaseiq/2011/09/big-data-big-opportunity/ und McKinsey Studie 2011 Anwendungen Daten Technologien

Mehr