BIG DATA CAN BE MORE THAN A FASHIONABLE SLOGAN: Think big Daten nachhaltig und verantwortungsvoll zu nutzen, scheint eine der größten Herausforderungen der Zukunft zu werden. Die Unternehmen sehen sich dabei zusehends in der Zwickmühle zwischen Big Data und Open Data, Datenschutz und Datensicherheit. TEXT: CHRISTIAN PLESCHBERGER Welche wirtschaftlichen, aber auch gesellschaftspolitischen Auswirkungen zieht Datability nach sich? Wie können Klein- und Mittelbetriebe daraus einen Nutzen ziehen? Und welche Chancen und Gefahren ergeben sich durch die Auswertung der immer größeren Datenberge? Fragen wie diese standen im Mittelpunkt eines Diskussionsabends der APA-E-Business-Community am 27. Februar 2014 im Wiener Haus der Musik. Die Datenberge verdoppeln sich im digitalen Zeitalter von Jahr zu Jahr. Daraus könnten neue Geschäftsmodelle entstehen. Die Herausforderung besteht nun darin, die Daten nachhaltig und verantwortungsvoll zu nutzen, waren sich die Experten einig. Die derzeit als am wichtigsten eingeschätzten Anwendungsgebiete seien die Branchen Energie und Gesundheit. Durch smarte Stromzähler können beispielsweise IN ALLER KÜRZE Die Datenberge verdoppeln sich im digitalen Zeitalter von Jahr zu Jahr. Daraus könnten neue Geschäftsmodelle entstehen. Die Herausforderung besteht nun darin, die Daten nachhaltig und verantwortungsvoll zu nutzen. Unternehmen sehen sich dabei vielfach in der Zwickmühle zwischen Big Data und Open Data, Datenschutz und Datensicherheit. Verbrauchsdaten mit externen Daten - etwa dem Wetter - kombiniert werden, um den Versorgern eine optimale Energieverteilung zu ermöglichen, so Allan Hanbury vom Institut für Softwaretechnik und Interaktive Systeme der Technischen Universität (TU) Wien. Im Gesundheitsbereich habe die Analyse von Patientendaten seinen Ausführungen zufolge gezeigt, dass das Medikament Vioxx die Herzinfarktrate erhöht, wodurch laut Schätzungen der Gesundheitsbehörde FDA allein in den USA mindestens 26.000 Personen gestorben sind. Konsequenz: Das Medikament wurde vom Markt genommen. Die Analyse von großen Datenmengen könne also auch gesellschaftliche Vorteile bringen, so Hanbury. Der Austausch von Daten sei aber noch kompliziert. Auf viele vorhandene Datensätze, die zu relevanten Auswirkungen führen könnten, bestehe kein Zugriff. Noch sind wir von der Vision eines Daten-Ökosystems weit entfernt, sagte der Experte. Die Probleme würden schon im Unternehmen beginnen, wo es schwierig sei, historisch gewachsene Quellen zusammenzuführen. Aber auch Firmen, die innovative Apps entwickeln wollen, hätten oft Probleme, auf die notwendigen Daten zuzugreifen. Veränderte Geisteshaltung notwendig Um aus Open Data und Big Data resultierende Potenziale zu realisieren und dennoch Risiken zu vermeiden, seien 28 AUSGABE 2/2014
IT CAN BECOME A RECIPE FOR A COMPETITIVE EUROPE Neelie Kroes EU-Kommissarin für die Digitale Agenda Allen Hanbury TU Wien Noch sind wir von der Vision eines Daten-Ökosystems weit entfernt. eine veränderte Geisteshaltung, neue Arbeitsprozesse und neuartige Schutzmaßnahmen erforderlich, ergänzte Ulrike Goose, Leiterin des Bereichs Information Technology der A1 Telekom Austria AG. Zum großen Thema entwickle sich ihrer Einschätzung nach der Lebenszyklus der Daten, also wann man Daten archiviert oder löscht. Früher hat man sich da keine Gedanken gemacht, bei neuen Daten wird das jetzt gleich mitgedacht, so Goose. Auch sei eine Kategorisierung von Daten innerhalb eines Unternehmens bezüglich ihrer Offenheit und ihrer Nutzung unabdingbar. Big Data und Open Data stellen zusammen einen weiteren Paradigmenwechsel dar, der neue, datengetriebene Innovationen ermöglicht, erklärte die Managerin. Zudem gelte es, Nutzer transparent an der Monetarisierung der Daten zu beteiligen und das Vertrauen in die ethische Verwendung sicherzustellen. Die Essenz der ausgewerteten Daten erhöhe zumeist die Vertraulichkeit. Deshalb müsse eine Balance zwischen Sicherheitsmechanismen und der Benutzerfreundlichkeit gefunden werden, meint Thomas Mann von Kapsch, der auch die Schulung der Mitarbeiter unterstrich: Ein 50-seitiges Regelwerk per E-Mail zu verschicken, sei keine gute Idee. Kapsch setze beispielsweise auf E-Learning-basierte Systeme. Auf dem Vormarsch sieht er mobile Datenanwendungen: Beispielsweise könnten für die Routenoptimierung beim Außendienst weitere externe Daten ergänzt werden, so Mann. Kritik an der Datensammlung mancher Unternehmen äußerte Oliver Krizek, CEO der Navax Unternehmensgruppe: Viele Firmen sammeln Unmengen und nutzen sie dann nicht. Neben so manchen Perlen gibt es schließlich auch jede Menge Schrott. Qualität gehe vor Quantität. Die Nase vorne haben diejenigen, die sich auf das Wesentliche konzentrieren und anschließend rasch und flexibel die gewonnenen Erkenntnisse umsetzen und ausprobieren, sagte Krizek. Hochwertige Analysesoftware sei heute schließlich nicht mehr Privileg großer Konzerne, sondern auch für kleinere Unternehmen leistbar. Von fairer Umsetzung profitieren beide Seiten Gerade Österreichs kleinstrukturierte Wirtschaft hat bei Big Data gute Chancen, auch aufgrund des Ausbildungsniveaus, pflichtete Gerhard Laga, Leiter des E-Centers der Wirtschaftskammer Österreich (WKO) und Organisator des E-Day, bei. Klein- und Mittelunternehmen seien allerdings auf kreative Dienstleister angewiesen. Wichtig dabei ist der Datenschutz, um Vertrauen zu schaffen. In diesem Bereich macht sich auch ein starkes Nord-/Südgefälle in Europa bemerkbar, so Laga. Oft hätten aber beide Seiten etwas von Datenanalysen. Wird das fair umgesetzt, ist auch die Akzeptanz besser, sagt der Experte. Der Boom bei Smartphones und Tablet-PCs habe auch das Thema Mobilität vorangetrieben und dazu geführt, dass Daten nicht lokal, sondern im Netz abgespeichert werden, hielt Christian Knull, Product Manager der NextiraOne Austria GmbH, last but not least fest. Beliebt bei den Mitarbeitern sind etwa Dropbox und Co, was aber ein Sicherheitsrisiko für sensible Daten berge. Die Unternehmen sollten den Usern diese Services allerdings nicht ersatzlos streichen, sondern ihnen vielmehr Alternativen bieten, die sicher und benutzerfreundlich sind. Balance zwischen Sicherheit und Benutzerfreundlichkeit V.l.n.r.: Gerhard Laga (WKO), Oliver Krizek (Navax), Ingrid Rehusch (Moderation), Thomas Mann (Kapsch), Ulrike Goose (A1) und Christian Knull (NextiraOne) APA-Fotoservice/Preiss AUSGABE 2 /2014 29
Denn wir wissen nicht, wofür wir sie noch brauchen können Im Q1-Interview spricht Oracle Österreich Countryleader Martin Winkler über die Bedeutung von Big Data als dem wirtschaftlichen Rohstoff der Zukunft. Er erklärt, was Unternehmen brauchen, damit sie die richtigen Informationen zum richtigen Zeitpunkt abrufen können, und welche Rolle Standards für Informationssicherheit im Zusammenhang mit dem Thema Big Data spielen. INTERVIEW: CHRISTIAN PLESCHBERGER Herr Winkler, ist Big Data aus Ihrer Sicht ein Technologie- oder ein Business-Thema? Big Data ist vor allem ein Business-Thema. Die Kunst, ein erfolgreiches Big-Data-Projekt umzusetzen, besteht darin, die bereits vorhandenen Technologielösungen zu einer passenden Architektur zusammenzufügen, sie mit den richtigen Daten zu befüllen und die richtigen Auswertungs-Prozesse zu finden. Die Job-Rolle von Data-Scientists, also von Mitarbeitern, die über fundierte mathematisch-statistische Kenntnisse verfügen und die nach den entsprechenden Mustern die IN ALLER KÜRZE Big Data ist weniger ein Technologie- als vielmehr ein Business- Thema. Die Kunst, Big-Data-Projekte erfolgreich umzusetzen besteht darin, die bereits vorhandenen Technologielösungen zu einer passenden Architektur zusammenzufügen, sie mit den richtigen Daten zu befüllen und die richtigen Auswertungs-Prozesse zu finden. Vor diesem Hintergrund gewinnt der Beruf des Data-Scientists, also des Mitarbeiters mit entsprechendem mathematischstatistischem Wissen, zunehmend an Bedeutung. ZUR PERSON Martin Winkler ist seit Juli 2009 Country Manager von Oracle Österreich. Seine Karriere begann der Absolvent der Montan-Universität Leoben bei IBM. Nach einem zweijährigen Zwischenstopp bei Xerox Austria, wo er zuletzt als Direktor Xerox Global Services für die Länder Österreich und Schweiz tätig war, wechselte er 2007 als Sales Director im Bereich Technology Solutions zu Oracle Österreich. 30 AUSGABE 2/2014
wertvollen Big-Data-Auswertungen designen, wird deshalb künftig an Bedeutung gewinnen. Die Technologie dazu ist auf der Software-Seite mit Tools wie Hadoop, NoSQL, MapReduce, Hive, Flume oder Endeca Information Discovery vorhanden. Mit traditionellen Software-, Storage- oder Scale-up-Architekturen ist der Big-Data- Ansatz zu vertretbaren Kosten allerdings nicht realisierbar. Sind große Datenmengen tatsächlich der wirtschaftliche Rohstoff der Zukunft, wie vielfach behauptet wird? Dort wo Big-Data-Lösungen heute bereits im Einsatz sind, erweisen sie sich als zuverlässiges Analyseinstrument. Big-Data-Ansätze sind immer statistische Modelle. Ihre Zuverlässigkeit steigt mit der Datenmenge. Daher geht der Trend in Unternehmen immer stärker in die Richtung, keine Daten mehr zu löschen, egal ob sie strukturiert oder unstrukturiert sind. Die günstigen Speicherkosten tragen das Ihre dazu bei. So gesehen, lautet die Antwort eindeutig: Ja, Big Data ist der wirtschaftliche Rohstoff der Zukunft. Big-Data-Analysen sind in Zukunft sicher die Grundlage für viele Unternehmensentscheidungen. Datability war das Leitthema der diesjährigen Cebit. Der Ausdruck resultiert aus der Kombination des Begriffs Big Data mit den Möglichkeiten seiner nachhaltigen und verantwortungsvollen Nutzung abgeleitet von den englischen Wörtern ability, sustainability, responsibility. Aber ist das nicht ein Widerspruch in sich? Da im Big-Data-Konzept ganz nach dem Motto: Wir wissen ja nicht, wofür wir die Daten noch gebrauchen können keine Daten mehr gelöscht werden, werden Personen zum Beispiel durch die Kombination von Konsumverhalten, GPS-Location, Zeitstempel und Kommunikationsverhalten alles nur Metadaten, wohlgemerkt leichter identifizierbar. Aus diesem Grund verlangt Big Data nach einem verantwortungsvollen Umgang mit den Daten. Der rasche und einfache Zugang zu diesen kombinierten Informationen verlangt nach entsprechenden Regeln. Das ist allerdings kein primäres IT Thema. Datability ist damit ein gesellschaftspolitisches Thema. Aber sind die gigantischen Datenmengen nicht ohnedies nutzloser und teurer Junk, wenn sie nicht in einem vernünftigen Zeitrahmen in Informationen umgewandelt werden, wie es Karl Michael Göschka, Privatdozent an der TU Wien, im Rahmen der IDC Roadshow formulierte? AUSGABE 2 /2014 31
Ja! Big Data ist der wirtschaftliche Rohstoff der Zukunft. Big-Data-Analysen bilden in der Zukunft sicher die Grundlage für viele Unternehmensentscheidungen. Nicht unbedingt. Die Sache ist differenzierter zu betrachten. Wie zuvor bereits gesagt: Wir wissen ja nicht, wofür wir die Daten noch gebrauchen können. Anders als beim klassischen Datawarehouse-Ansatz stehen beim Big- Data-Ansatz zum Zeitpunkt des Daten-Sammelns noch nicht alle Anwendungsfälle für Auswertungen fest. In der Technik-Sprache bezeichnet man das als Schema-on-Read versus Schema-on-Write. Soll heißen, beim klassischen Datawarehouse muss die Datenstruktur definiert sein, bevor es mit den Daten befüllt wird. Dementsprechend starr ist sie auch. Beim Big-Data-Ansatz werden die Daten ohne vorheriges Schema in einem Hadoop File System oder, nach einem simplen Key-Value-Prinzip, in einer NoSQL-Datenbank abgespeichert und erst zur Abfragezeit deshalb auch: Schema-on-Read zum Beispiel mittels MapReduce* in eine auswertbare Struktur gebracht. Dieser Ansatz ist viel flexibler und vor allem um Größenordnungen schneller. Der eigentliche Knackpunkt ist allerdings das Umwandeln von Daten in verwertbare Informationen. Das erfolgt primär durch das Know-how der Mitarbeiter im Unternehmen. Die Technologie für Big-Data-Analysen ist hier praktisch nur Mittel zum Zweck. Was brauchen Unternehmen konkret, damit sie die richtigen Informationen zum richtigen Zeitpunkt abrufen können? Zu allererst die Daten, entweder in strukturierter Form in Datenbanken oder als Datawarehouse oder in unstrukturierter Form. Zweitens das Know-how, welche Daten relevante Informationen ergeben. Vor allem aber brauchen sie die richtigen Mitarbeiter, die in der Lage sind, in dem Heuhaufen von Daten die richtigen Nadeln zu finden. Und daneben natürlich auch noch eine flexible IT- Architektur, die diesen Mitarbeitern solche Auswertungen ermöglicht. Big Data wird bei den KMUs sicherlich ankommen, sobald sich Big- Data-Services als Cloud-Lösungen oder über entsprechende Dienstleister etabliert haben. Derzeit setzen ihnen vor allem die personellen Ressourcen Stichwort: Data-Scientists wie auch der Aufwand, die richtigen Daten zu sammeln, noch Grenzen in Bezug auf die Nutzung des Big-Data- Konzeptes. Welchen konkreten Nutzen dürfen sich Verbraucher von Big Data erwarten? Es gibt da eine ganze Reihe von Ansätzen. Zielgenauere Angebote zum Beispiel, gesteigerte Servicequalität, neue wissenschaftliche Erkenntnisse zu Krankheiten und Medikationen oder die Real-Time-Steuerung von Verkehrsflüssen in Abhängigkeit von Wetter, Zeit und Verkehrsaufkommen, um nur einige wenige Beispiele zu nennen. Die Wahrung des Datenschutzes sowie der Privatsphäre muss dabei allerdings stets gesichert sein. Sie geben mir damit das Stichwort für meine Schlussfrage: Welche Rolle spielt Ihrer Ansicht nach die ISO 27001 in Verbindung mit dem Thema Big Data? Standards für Informationssicherheit sind in meinen Augen einer der zentralen Eckpfeiler für Big-Data-Lösungen, die von den Menschen auch angenommen werden. Da immer mehr Daten gesammelt und verarbeitet werden, werden die damit einhergehenden Zugriffs-Mechanismen und der damit verbundene Datenschutz zu zentralen Fragen. Herr Winkler, vielen Dank für das Interview! *) MapReduce ist ein vom Unternehmen Google Inc. eingeführtes Programmiermodell für nebenläufige Berechnungen über (mehrere Petabyte) große Datenmengen auf Computerclustern. 32 AUSGABE 2/2014