Bernd Fondermann brainlounge. Blaue oder rote Pille: SQL oder MapReduce?

Größe: px
Ab Seite anzeigen:

Download "Bernd Fondermann brainlounge. Blaue oder rote Pille: SQL oder MapReduce?"

Transkript

1 Bernd Fondermann brainlounge Blaue oder rote Pille: SQL oder MapReduce?

2 TODOs pills on all pages upd source code 1

3 Blaue oder rote Pille - SQL oder MapReduce? Bernd Fondermann, BigDataCon/JAX

4 Rote oder blaue Pille? "You take the blue pill - the story ends, you wake up in your bed and believe whatever you want to believe. You take the red pill - you stay in Wonderland and I show you how deep the rabbithole goes." Morpheus, The Matrix 3

5 SQL - Die Blaue Pille 4

6 SQL - Die Blaue Pille SQL gibt es schon ewig 4

7 SQL - Die Blaue Pille SQL gibt es schon ewig solide Allzweckwaffe 4

8 SQL - Die Blaue Pille SQL gibt es schon ewig solide Allzweckwaffe in vielen Teams und Unternehmen eingeführt 4

9 SQL - Die Blaue Pille SQL gibt es schon ewig solide Allzweckwaffe in vielen Teams und Unternehmen eingeführt in Design, Development & Betrieb 4

10 SQL - Die Blaue Pille SQL gibt es schon ewig solide Allzweckwaffe in vielen Teams und Unternehmen eingeführt in Design, Development & Betrieb für alle denkbaren Datenmodelle 4

11 SQL - Die Blaue Pille SQL gibt es schon ewig solide Allzweckwaffe in vielen Teams und Unternehmen eingeführt in Design, Development & Betrieb für alle denkbaren Datenmodelle breite Unterstützung 4

12 SQL - Die Blaue Pille SQL gibt es schon ewig solide Allzweckwaffe in vielen Teams und Unternehmen eingeführt in Design, Development & Betrieb für alle denkbaren Datenmodelle breite Unterstützung die Invariante in unserer IT Landschaft 4

13 SQL - Die Blaue Pille SQL gibt es schon ewig solide Allzweckwaffe in vielen Teams und Unternehmen eingeführt in Design, Development & Betrieb für alle denkbaren Datenmodelle breite Unterstützung die Invariante in unserer IT Landschaft Frage nach Ersatz stellt sich gar nicht 4

14 SQL - Grundkonzepte 5

15 SQL - Grundkonzepte organisiert Daten in Tabellen, Zeilen, Spalten 5

16 SQL - Grundkonzepte organisiert Daten in Tabellen, Zeilen, Spalten Spalten streng typisiert 5

17 SQL - Grundkonzepte organisiert Daten in Tabellen, Zeilen, Spalten Spalten streng typisiert Primary Key über eine (wenige) Spalten 5

18 SQL - Grundkonzepte organisiert Daten in Tabellen, Zeilen, Spalten Spalten streng typisiert Primary Key über eine (wenige) Spalten strenge Referenzierung über Tabellengrenzen 5

19 SQL - Grundkonzepte organisiert Daten in Tabellen, Zeilen, Spalten Spalten streng typisiert Primary Key über eine (wenige) Spalten strenge Referenzierung über Tabellengrenzen Indizierung von beliebigen Spalten 5

20 SQL - Grundkonzepte organisiert Daten in Tabellen, Zeilen, Spalten Spalten streng typisiert Primary Key über eine (wenige) Spalten strenge Referenzierung über Tabellengrenzen Indizierung von beliebigen Spalten ausgebufftes Transaktionshandling 5

21 implizite Beschränkungen 6

22 implizite Beschränkungen Spalten streng typisiert 6

23 implizite Beschränkungen Spalten streng typisiert Prüfung und Codec bei Read/Write 6

24 implizite Beschränkungen Spalten streng typisiert Prüfung und Codec bei Read/Write Evolution des Schemas schwierig 6

25 implizite Beschränkungen Spalten streng typisiert Prüfung und Codec bei Read/Write Evolution des Schemas schwierig Primary Key über eine oder wenige Spalten 6

26 implizite Beschränkungen Spalten streng typisiert Prüfung und Codec bei Read/Write Evolution des Schemas schwierig Primary Key über eine oder wenige Spalten Insert: PK-Check 6

27 implizite Beschränkungen Spalten streng typisiert Prüfung und Codec bei Read/Write Evolution des Schemas schwierig Primary Key über eine oder wenige Spalten Insert: PK-Check strenge Referenzierung über Tabellengrenzen 6

28 implizite Beschränkungen Spalten streng typisiert Prüfung und Codec bei Read/Write Evolution des Schemas schwierig Primary Key über eine oder wenige Spalten Insert: PK-Check strenge Referenzierung über Tabellengrenzen R/W tangieren mehrere Tabellen 6

29 implizite Beschränkungen Spalten streng typisiert Prüfung und Codec bei Read/Write Evolution des Schemas schwierig Primary Key über eine oder wenige Spalten Insert: PK-Check strenge Referenzierung über Tabellengrenzen R/W tangieren mehrere Tabellen Indizierung von beliebigen Spalten 6

30 implizite Beschränkungen Spalten streng typisiert Prüfung und Codec bei Read/Write Evolution des Schemas schwierig Primary Key über eine oder wenige Spalten Insert: PK-Check strenge Referenzierung über Tabellengrenzen R/W tangieren mehrere Tabellen Indizierung von beliebigen Spalten Write lösen Index Update aus 6

31 implizite Beschränkungen Spalten streng typisiert Prüfung und Codec bei Read/Write Evolution des Schemas schwierig Primary Key über eine oder wenige Spalten Insert: PK-Check strenge Referenzierung über Tabellengrenzen R/W tangieren mehrere Tabellen Indizierung von beliebigen Spalten Write lösen Index Update aus ausgebufftes Transaktionshandling 6

32 implizite Beschränkungen Spalten streng typisiert Prüfung und Codec bei Read/Write Evolution des Schemas schwierig Primary Key über eine oder wenige Spalten Insert: PK-Check strenge Referenzierung über Tabellengrenzen R/W tangieren mehrere Tabellen Indizierung von beliebigen Spalten Write lösen Index Update aus ausgebufftes Transaktionshandling verschiedene Arten von Locking 6

33 No Go Areas für SQL-DBs 7

34 No Go Areas für SQL-DBs Verteilen einer Tabelle über Rechnergrenzen 7

35 No Go Areas für SQL-DBs Verteilen einer Tabelle über Rechnergrenzen Verteilen von DBs über Rechnergrenzen 7

36 No Go Areas für SQL-DBs Verteilen einer Tabelle über Rechnergrenzen Verteilen von DBs über Rechnergrenzen Entkopplung von Schreiben & Lesen 7

37 No Go Areas für SQL-DBs Verteilen einer Tabelle über Rechnergrenzen Verteilen von DBs über Rechnergrenzen Entkopplung von Schreiben & Lesen Ausfalltoleranz 7

38 No Go Areas für SQL-DBs Verteilen einer Tabelle über Rechnergrenzen Verteilen von DBs über Rechnergrenzen Entkopplung von Schreiben & Lesen Ausfalltoleranz Grösse einer Tabelle 7

39 Was ist Hadoop? HDFS Verteiltes Filesystem redundant, hoch-skalierbar MapReduce parallele Datenverarbeitung Verfügbarkeit: "design-for-failure" Durchsatz: parallele Zugriffe 8

40 Voraussetzungen: Datenmenge "Big Data" bei nur 1 Block Input nur 1 Mapper-Prozess wenig Mapper => Management Overhead ungerechtfertigt 20 Maschinen à 8 Cores => 114 parallele Tasks => 7,2 GB 9

41 Voraussetzungen: Ablaufumgebung Ergebnisse im Minutenbereich Start-Latenz abhängig von Job-JAR Jeder Task eine neue JVM pro Cluster mind. 1 Maschine für Hadoop-Verwaltung pro Worker-Maschine 1-2 Cores for Hadoop-Verwaltung Jobabbrüche nicht tolerierbar not-invented-here komplexes Scheduling und Rollbacks hohe Verfügbarkeit Fehlertoleranz 10

42 Voraussetzungen: Problemstellung muss mit Map/Reduce formulierbar sein Daten sind partitionierbar semistrukturierte Daten Code greift nicht online auf andere Systeme zu Mapper können autark laufen 11

43 Voraussetzungen: Kultur 12

44 Voraussetzungen: Kultur Alle muss mitziehen, offen für Paradigmenwechsel 12

45 Voraussetzungen: Kultur Alle muss mitziehen, offen für Paradigmenwechsel Entwickler 12

46 Voraussetzungen: Kultur Alle muss mitziehen, offen für Paradigmenwechsel Entwickler DBAs 12

47 Voraussetzungen: Kultur Alle muss mitziehen, offen für Paradigmenwechsel Entwickler DBAs Beschaffung 12

48 Voraussetzungen: Kultur Alle muss mitziehen, offen für Paradigmenwechsel Entwickler DBAs Beschaffung Betrieb 12

49 The Pink Pill Antworten im Millisekunden-Bereich kein Read/Write Lock keine JOINS MapReduce verfügbar Zugriff mittels PK skalierbar, verfügbar wie Hadoop strenge Konsistenz => 13

50 Hadoop Datenmodell keine Indizes kein Schema Reads & Writes blockieren nicht Datenstrukturen über Hadoop-eigene Serialisierung Files Text, CSV, XML, Logs, Binärformate z.b. als Stream von Key/Value-Paaren 14

51 Map/Reduce Pattern Input Map Reduce Output Node Code Daten Node Großes Problem Node Code Daten Code Teil- Ergebnis Großes Problem Code Sehr viele Daten Node Code Daten Code Node Teil- Ergebnis End- Ergebnis Code Node Daten Code Node Teil- Ergebnis 15

52 MapReduce Nodes Jobtracker: MapReduce Master, SPoF startet, verteilt & koordiniert Tasks Tasktracker: bei den Datanodes koordiniert Worker auf seinem Node Worker eigene JVMs führen Mapper- & Reducer- Code aus 16

53 MapReduce 17

54 MapShuffleReduce 17

55 MapReduce - Phasen Algorithmus hat zwei Hauptphasen 1. "Map", 2. "Reduce" Zwischenphase "Shuffle" Das Programm kommt zu den Daten 18

56 MapReduce - Map-Phase JAR-Upload MR-Framework versorgt Map-Phase mit "Records" Map erzeugt Key/Value Paare Mapper Node Daten in: "ID75932"->"CN= out: "com.hadoop.www"->75932, " "->" 19

57 MapReduce - Shuffle-Phase Alle Values zu einem Map-Key werden zusammenkopiert Sortierung nach Key Verteilung auf die Reduce-Tasks Node Daten Node Daten Node Daten Node Daten Node Daten 20

58 MapReduce - Reduce-Phase Alle Values zu einem Map-Key werden demselben Reduce-Task übergeben Reduce verarbeitet weiter: Node Sortieren Reducer Daten Aggregieren Schreiben in generisches Datenformat (Index) JAR-Upload auch als Zwischenergebnis für nächsten MR-Job 21

59 Data Processing MapReduce MR-Job HDFS Split Map +Sort Combine Map Out Hadoop Client Big Data File 22

60 Data Processing MapReduce Map Out Shuffle + Sort Reduce (#=4) HDFS 23

61 MapReduce Pattern 24

62 MapReduce Pattern Input lesen: RecordReader 24

63 MapReduce Pattern Input lesen: RecordReader in: Input1 24

64 MapReduce Pattern Input lesen: RecordReader in: Input1 out: (Key1, Value1) 24

65 MapReduce Pattern Input lesen: RecordReader in: Input1 out: (Key1, Value1) Mapper 24

66 MapReduce Pattern Input lesen: RecordReader in: Input1 out: (Key1, Value1) Mapper in: (Key1, Value1) 24

67 MapReduce Pattern Input lesen: RecordReader in: Input1 out: (Key1, Value1) Mapper in: (Key1, Value1) out: (Key2, Value2) 24

68 MapReduce Pattern Input lesen: RecordReader in: Input1 out: (Key1, Value1) Mapper in: (Key1, Value1) out: (Key2, Value2) Reducer 24

69 MapReduce Pattern Input lesen: RecordReader in: Input1 out: (Key1, Value1) Mapper in: (Key1, Value1) out: (Key2, Value2) Reducer in: (Key2, Set<Value2>) 24

70 MapReduce Pattern Input lesen: RecordReader in: Input1 out: (Key1, Value1) Mapper in: (Key1, Value1) out: (Key2, Value2) Reducer in: (Key2, Set<Value2>) out: (Key3, Value3) 24

71 MapReduce Pattern Input lesen: RecordReader in: Input1 out: (Key1, Value1) Mapper in: (Key1, Value1) out: (Key2, Value2) Reducer in: (Key2, Set<Value2>) out: (Key3, Value3) RecordWriter 24

72 MapReduce Pattern Input lesen: RecordReader in: Input1 out: (Key1, Value1) Mapper in: (Key1, Value1) out: (Key2, Value2) Reducer in: (Key2, Set<Value2>) out: (Key3, Value3) RecordWriter in: (Key3, Value3) 24

73 MapReduce Pattern Input lesen: RecordReader in: Input1 out: (Key1, Value1) Mapper in: (Key1, Value1) out: (Key2, Value2) Reducer in: (Key2, Set<Value2>) out: (Key3, Value3) RecordWriter in: (Key3, Value3) out: Output4 24

74 MapReduce Beispieljob semi-strukturierten Daten analysieren Daten aus SSL Zertifikaten Domainnamen extrahieren Ähnlichkeiten feststellen 12,52 GB rohe Daten 6 Knoten Quad Core HT (8 virtuelle Cores) 8 GB RAM max. 32 parallele Tasks 25

75 MapReduce Beispieljob CSV File Map Datenquelle: 26

76 MapReduce Beispieljob Map CSV File Zeilen-Split Datenquelle: 26

77 MapReduce Beispieljob Map CSV File Zeilen-Split csv[14] Datenquelle: 26

78 MapReduce Beispieljob Map CSV File Zeilen-Split csv[14] CN=(.*) Datenquelle: 26

79 MapReduce Beispieljob Map CSV File Zeilen-Split csv[14] CN=(.*) X=genKey(CN) Datenquelle: 26

80 MapReduce Beispieljob Map CSV File Zeilen-Split csv[14] CN=(.*) X=genKey(CN) Datenquelle: emit(x,cn) 26

81 semi-strukturierter Input \N, " ", "SHA1 Fingerprint=9E:80:0E:0F:92:9F:8D:FA:B6:7D:74:2A:A3:90:05:BD:94:B4:8F:DF", " ", " ", " C=US, ST=UT, L=Salt Lake City, O=The USERTRUST Network, OU= CN=UTN-USERFirst-Hardware", "Yes", "Yes", "/ssl-data/sslscanner7/85.x.x.x/85.x.x.50/ results", "00:9b:d5:c1:87:4a:0f:81: :fd:c0", " sha1withrsaencryption", " C=DE/postalCode=85521, ST=Bayern, L=Ottobrunn/streetAddress=Rathausplatz 2, O=Kulturkreis Ottobrunn e.v., OU=vhs-ottobrunn.de, OU=Authorized by United SSL, OU=Comodo InstantSSL, CN= \N,\N,\N,\N," rsaencryption"," (0x10001)",\N,"1", " Jul 18 23:59: GMT"," Jul 13 00:00: GMT", " 3 (0x2)", " \N,\N,\N,\N,\N,\N,\N,\N,\N,\N,\N,\N,\N,\N,\N,"A1:72:5F:26:1B:28:98:43:95:5D:07:37:D5:85:96:9D:4B:D2:C3:45",\N,"(critical) FALSE",\N, " :Policy: :CPS=== "URI=== ANDALSO URI=== Hardware.crl", "TLS Web Server Authentication, TLS Web Client Authentication",\N,\N, "(critical) Digital Signature, Key Encipherment",\N,\N,\N,\N, "DNS=== DNS:vhs-ottobrunn.de",\N, "C5:7D:0F:7A:A7:A8:C0:29:0C:60:33:46:F3:31:37:0D:71:B5:04:DA", \N,\N,\N," ", " :00:00"," :59:59",\N," :00:00"," :59:59" Datenquelle: 27

82 semi-strukturierter Input \N, " ", "SHA1 Fingerprint=9E:80:0E:0F:92:9F:8D:FA:B6:7D:74:2A:A3:90:05:BD:94:B4:8F:DF", " ", " ", " C=US, ST=UT, L=Salt Lake City, O=The USERTRUST Network, OU= CN=UTN-USERFirst-Hardware", "Yes", "Yes", "/ssl-data/sslscanner7/85.x.x.x/85.x.x.50/ results", "00:9b:d5:c1:87:4a:0f:81: :fd:c0", " sha1withrsaencryption", " C=DE/postalCode=85521, ST=Bayern, L=Ottobrunn/streetAddress=Rathausplatz 2, O=Kulturkreis Ottobrunn e.v., OU=vhs-ottobrunn.de, OU=Authorized by United SSL, OU=Comodo InstantSSL, CN= \N,\N,\N,\N," rsaencryption"," (0x10001)",\N,"1", " Jul 18 23:59: GMT"," Jul 13 00:00: GMT", " 3 (0x2)", " \N,\N,\N,\N,\N,\N,\N,\N,\N,\N,\N,\N,\N,\N,\N,"A1:72:5F:26:1B:28:98:43:95:5D:07:37:D5:85:96:9D:4B:D2:C3:45",\N,"(critical) " C=DE/postalCode=85521, ST=Bayern, L=Ottobrunn/ FALSE",\N, streetaddress=rathausplatz 2, O=Kulturkreis Ottobrunn e.v., " :Policy: :CPS=== OU=vhs-ottobrunn.de, OU=Authorized by United SSL, "URI=== ANDALSO URI=== Hardware.crl", OU=Comodo InstantSSL, CN= "TLS Web Server Authentication, TLS Web Client Authentication",\N,\N, "(critical) Digital Signature, Key Encipherment",\N,\N,\N,\N, "DNS=== DNS:vhs-ottobrunn.de",\N, "C5:7D:0F:7A:A7:A8:C0:29:0C:60:33:46:F3:31:37:0D:71:B5:04:DA", \N,\N,\N," ", " :00:00"," :59:59",\N," :00:00"," :59:59" Datenquelle: 27

83 semi-strukturierter Input \N, " ", "SHA1 Fingerprint=9E:80:0E:0F:92:9F:8D:FA:B6:7D:74:2A:A3:90:05:BD:94:B4:8F:DF", " ", " ", " C=US, ST=UT, L=Salt Lake City, O=The USERTRUST Network, OU= CN=UTN-USERFirst-Hardware", "Yes", "Yes", "/ssl-data/sslscanner7/85.x.x.x/85.x.x.50/ results", "00:9b:d5:c1:87:4a:0f:81: :fd:c0", " sha1withrsaencryption", " C=DE/postalCode=85521, ST=Bayern, L=Ottobrunn/streetAddress=Rathausplatz 2, O=Kulturkreis Ottobrunn e.v., OU=vhs-ottobrunn.de, OU=Authorized by United SSL, OU=Comodo InstantSSL, CN= \N,\N,\N,\N," rsaencryption"," (0x10001)",\N,"1", CN= " Jul 18 23:59: GMT"," Jul 13 00:00: GMT", " 3 (0x2)", " \N,\N,\N,\N,\N,\N,\N,\N,\N,\N,\N,\N,\N,\N,\N,"A1:72:5F:26:1B:28:98:43:95:5D:07:37:D5:85:96:9D:4B:D2:C3:45",\N,"(critical) " C=DE/postalCode=85521, ST=Bayern, L=Ottobrunn/ FALSE",\N, streetaddress=rathausplatz 2, O=Kulturkreis Ottobrunn e.v., " :Policy: :CPS=== OU=vhs-ottobrunn.de, OU=Authorized by United SSL, "URI=== ANDALSO URI=== Hardware.crl", OU=Comodo InstantSSL, CN= "TLS Web Server Authentication, TLS Web Client Authentication",\N,\N, "(critical) Digital Signature, Key Encipherment",\N,\N,\N,\N, "DNS=== DNS:vhs-ottobrunn.de",\N, "C5:7D:0F:7A:A7:A8:C0:29:0C:60:33:46:F3:31:37:0D:71:B5:04:DA", \N,\N,\N," ", " :00:00"," :59:59",\N," :00:00"," :59:59" Datenquelle: 27

84 semi-strukturierter Input \N, " ", "SHA1 Fingerprint=9E:80:0E:0F:92:9F:8D:FA:B6:7D:74:2A:A3:90:05:BD:94:B4:8F:DF", " ", " ", " C=US, ST=UT, L=Salt Lake City, O=The USERTRUST Network, OU= CN=UTN-USERFirst-Hardware", "Yes", "Yes", "/ssl-data/sslscanner7/85.x.x.x/85.x.x.50/ results", "00:9b:d5:c1:87:4a:0f:81: :fd:c0", " sha1withrsaencryption", " C=DE/postalCode=85521, ST=Bayern, L=Ottobrunn/streetAddress=Rathausplatz vhs-ottobrunn 2, O=Kulturkreis Ottobrunn e.v., OU=vhs-ottobrunn.de, OU=Authorized by United SSL, OU=Comodo InstantSSL, CN= \N,\N,\N,\N," rsaencryption"," (0x10001)",\N,"1", CN= " Jul 18 23:59: GMT"," Jul 13 00:00: GMT", " 3 (0x2)", " \N,\N,\N,\N,\N,\N,\N,\N,\N,\N,\N,\N,\N,\N,\N,"A1:72:5F:26:1B:28:98:43:95:5D:07:37:D5:85:96:9D:4B:D2:C3:45",\N,"(critical) " C=DE/postalCode=85521, ST=Bayern, L=Ottobrunn/ FALSE",\N, streetaddress=rathausplatz 2, O=Kulturkreis Ottobrunn e.v., " :Policy: :CPS=== OU=vhs-ottobrunn.de, OU=Authorized by United SSL, "URI=== ANDALSO URI=== Hardware.crl", OU=Comodo InstantSSL, CN= "TLS Web Server Authentication, TLS Web Client Authentication",\N,\N, "(critical) Digital Signature, Key Encipherment",\N,\N,\N,\N, "DNS=== DNS:vhs-ottobrunn.de",\N, "C5:7D:0F:7A:A7:A8:C0:29:0C:60:33:46:F3:31:37:0D:71:B5:04:DA", \N,\N,\N," ", " :00:00"," :59:59",\N," :00:00"," :59:59" Datenquelle: 27

85 MapReduce Beispieljob Reduce (X,CN1..CNn) Datenquelle: 28

86 MapReduce Beispieljob Reduce (X,CN1..CNn) n>1 Datenquelle: 28

87 MapReduce Beispieljob Reduce (X,CN1..CNn) n>1 R=concat(CNi) Datenquelle: 28

88 MapReduce Beispieljob Reduce (X,CN1..CNn) n>1 R=concat(CNi) emit(r) Datenquelle: 28

89 MR: Domainnamen in SSL-Zertifikaten analysieren 29

90 MR: Domainnamen in SSL-Zertifikaten analysieren FileReader: CSV File lesen 29

91 MR: Domainnamen in SSL-Zertifikaten analysieren FileReader: CSV File lesen out: Text onelineofcsv 29

92 MR: Domainnamen in SSL-Zertifikaten analysieren FileReader: CSV File lesen out: Text onelineofcsv Mapper: Domainnamen extrahieren & analysieren 29

93 MR: Domainnamen in SSL-Zertifikaten analysieren FileReader: CSV File lesen out: Text onelineofcsv Mapper: Domainnamen extrahieren & analysieren in: LongWritable filepointer, Text onelineofcsv 29

94 MR: Domainnamen in SSL-Zertifikaten analysieren FileReader: CSV File lesen out: Text onelineofcsv Mapper: Domainnamen extrahieren & analysieren in: LongWritable filepointer, Text onelineofcsv out: Text key, Text fqdn 29

95 MR: Domainnamen in SSL-Zertifikaten analysieren FileReader: CSV File lesen out: Text onelineofcsv Mapper: Domainnamen extrahieren & analysieren in: LongWritable filepointer, Text onelineofcsv out: Text key, Text fqdn Reducer: passende Domains ausgeben 29

96 MR: Domainnamen in SSL-Zertifikaten analysieren FileReader: CSV File lesen out: Text onelineofcsv Mapper: Domainnamen extrahieren & analysieren in: LongWritable filepointer, Text onelineofcsv out: Text key, Text fqdn Reducer: passende Domains ausgeben in: Text key, Iterator<Text> fqdniterator 29

97 MR: Domainnamen in SSL-Zertifikaten analysieren FileReader: CSV File lesen out: Text onelineofcsv Mapper: Domainnamen extrahieren & analysieren in: LongWritable filepointer, Text onelineofcsv out: Text key, Text fqdn Reducer: passende Domains ausgeben in: Text key, Iterator<Text> fqdniterator out: Text key, Text resultfordomain 29

98 MR: Domainnamen in SSL-Zertifikaten analysieren FileReader: CSV File lesen out: Text onelineofcsv Mapper: Domainnamen extrahieren & analysieren in: LongWritable filepointer, Text onelineofcsv out: Text key, Text fqdn Reducer: passende Domains ausgeben in: Text key, Iterator<Text> fqdniterator out: Text key, Text resultfordomain RecordWriter: Ergebnisse 29

99 MR: Domainnamen in SSL-Zertifikaten analysieren FileReader: CSV File lesen out: Text onelineofcsv Mapper: Domainnamen extrahieren & analysieren in: LongWritable filepointer, Text onelineofcsv out: Text key, Text fqdn Reducer: passende Domains ausgeben in: Text key, Iterator<Text> fqdniterator out: Text key, Text resultfordomain RecordWriter: Ergebnisse in: Text key, Text resultfordomain 29

100 MR: Domainnamen in SSL-Zertifikaten analysieren FileReader: CSV File lesen out: Text onelineofcsv Mapper: Domainnamen extrahieren & analysieren in: LongWritable filepointer, Text onelineofcsv out: Text key, Text fqdn Reducer: passende Domains ausgeben in: Text key, Iterator<Text> fqdniterator out: Text key, Text resultfordomain RecordWriter: Ergebnisse in: Text key, Text resultfordomain out: TextFile 29

101 Source-Code Mapper 30

102 Source-Code Reducer IDE... 31

103 Job Demo 32

104 Job Statistiken ca. 1:40 Min. Laufzeit 29 Mapper, 1 Reducer Cluster-Durchsatz: 1 GBit/sec Input-Daten 33

105 Anhaltspunkte für Wechsel zu MapReduce 34

106 Anhaltspunkte für Wechsel zu MapReduce Laufzeit eines Batch-Job zu lang 34

107 Anhaltspunkte für Wechsel zu MapReduce Laufzeit eines Batch-Job zu lang Job nur auf verdichteten Daten möglich 34

108 Anhaltspunkte für Wechsel zu MapReduce Laufzeit eines Batch-Job zu lang Job nur auf verdichteten Daten möglich Ausführung auf gespiegeltem System 34

109 Anhaltspunkte für Wechsel zu MapReduce Laufzeit eines Batch-Job zu lang Job nur auf verdichteten Daten möglich Ausführung auf gespiegeltem System aufwändige selbstgestrickte Batchverarbeitung 34

110 MapReduce erweitert das Data-Processing- Repertoire mit neuen Möglichkeiten über SQL 35

Neue Ansätze der Softwarequalitätssicherung

Neue Ansätze der Softwarequalitätssicherung Neue Ansätze der Softwarequalitätssicherung Googles MapReduce-Framework für verteilte Berechnungen am Beispiel von Apache Hadoop Universität Paderborn Fakultät für Elektrotechnik, Informatik und Mathematik

Mehr

Peter Dikant mgm technology partners GmbH. Echtzeitsuche mit Hadoop und Solr

Peter Dikant mgm technology partners GmbH. Echtzeitsuche mit Hadoop und Solr Peter Dikant mgm technology partners GmbH Echtzeitsuche mit Hadoop und Solr ECHTZEITSUCHE MIT HADOOP UND SOLR PETER DIKANT MGM TECHNOLOGY PARTNERS GMBH WHOAMI peter.dikant@mgm-tp.com Java Entwickler seit

Mehr

Apache Hadoop. Distribute your data and your application. Bernd Fondermann freier Software Architekt bernd.fondermann@brainlounge.de berndf@apache.

Apache Hadoop. Distribute your data and your application. Bernd Fondermann freier Software Architekt bernd.fondermann@brainlounge.de berndf@apache. Apache Hadoop Distribute your data and your application Bernd Fondermann freier Software Architekt bernd.fondermann@brainlounge.de berndf@apache.org Apache The Apache Software Foundation Community und

Mehr

Hadoop. Eine Open-Source-Implementierung von MapReduce und BigTable. von Philipp Kemkes

Hadoop. Eine Open-Source-Implementierung von MapReduce und BigTable. von Philipp Kemkes Hadoop Eine Open-Source-Implementierung von MapReduce und BigTable von Philipp Kemkes Hadoop Framework für skalierbare, verteilt arbeitende Software Zur Verarbeitung großer Datenmengen (Terra- bis Petabyte)

Mehr

Hadoop aus IT-Operations Sicht Teil 1 Hadoop-Grundlagen

Hadoop aus IT-Operations Sicht Teil 1 Hadoop-Grundlagen Hadoop aus IT-Operations Sicht Teil 1 Hadoop-Grundlagen Brownbag am Freitag, den 26.07.2013 Daniel Bäurer inovex GmbH Systems Engineer Wir nutzen Technologien, um unsere Kunden glücklich zu machen. Und

Mehr

MapReduce. www.kit.edu. Johann Volz. IPD Snelting, Lehrstuhl Programmierparadigmen

MapReduce. www.kit.edu. Johann Volz. IPD Snelting, Lehrstuhl Programmierparadigmen MapReduce Johann Volz IPD Snelting, Lehrstuhl Programmierparadigmen KIT Universität des Landes Baden-Württemberg und nationales Großforschungszentrum in der Helmholtz-Gemeinschaft www.kit.edu Wozu MapReduce?

Mehr

PostgreSQL in großen Installationen

PostgreSQL in großen Installationen PostgreSQL in großen Installationen Cybertec Schönig & Schönig GmbH Hans-Jürgen Schönig Wieso PostgreSQL? - Die fortschrittlichste Open Source Database - Lizenzpolitik: wirkliche Freiheit - Stabilität,

Mehr

NCDiff Testmanagement leicht gemacht

NCDiff Testmanagement leicht gemacht Testmanagement leicht gemacht Nagler & Company Thomas Gebhard & Anton Garra Complexity Die stetige Anpassung an neue Anforderungen der IT und das Bestreben Marktgegebenheiten zu folgen oder voraus zu sein,

Mehr

Well-Balanced. Performance Tuning

Well-Balanced. Performance Tuning Well-Balanced Real Application Cluster Performance Tuning Über mich virtual7 GmbH Jürgen Bouché Zeppelinstraße 2 76185 Karlsruhe Tel.: +49 (721) 6190170 Fax.: +49 (721) 61901729 Email: jbouche@heine.de

Mehr

ANALYTICS, RISK MANAGEMENT & FINANCE ARCHITECTURE. NoSQL Datenbanksysteme Übersicht, Abgrenzung & Charakteristik

ANALYTICS, RISK MANAGEMENT & FINANCE ARCHITECTURE. NoSQL Datenbanksysteme Übersicht, Abgrenzung & Charakteristik ARFA ANALYTICS, RISK MANAGEMENT & FINANCE ARCHITECTURE NoSQL Datenbanksysteme Übersicht, Abgrenzung & Charakteristik Ralf Leipner Domain Architect Analytics, Risk Management & Finance 33. Berner Architekten

Mehr

June 2015. Automic Hadoop Agent. Data Automation - Hadoop Integration

June 2015. Automic Hadoop Agent. Data Automation - Hadoop Integration June 2015 Automic Hadoop Agent Data Automation - Hadoop Integration + Aufbau der Hadoop Anbindung + Was ist eigentlich ist MapReduce? + Welches sind die Stärken von Hadoop + Welches sind die Schwächen

Mehr

Besprechung Übung 1 & Vorstellung Übung 2

Besprechung Übung 1 & Vorstellung Übung 2 Besprechung Übung 1 & Vorstellung Übung 2 Software Qualität, FS09 06.04.2009 Reinhard Stoiber Übung 1 Ergebnisse: grossteils gut Subversion (svn+ssh) auf Windows Server 2003 Bereitete Probleme mit Schreibrechten

Mehr

3. Stud.IP-Entwickler-Workshop 2. Juni 2006 Workshop 3c: Stud.IP-Enterprise-Edition André Noack, Frank Elsner

3. Stud.IP-Entwickler-Workshop 2. Juni 2006 Workshop 3c: Stud.IP-Enterprise-Edition André Noack, Frank Elsner 3. Stud.IP-Entwickler-Workshop 2. Juni 2006 Workshop 3c: Stud.IP-Enterprise-Edition André Noack, Frank Elsner Gliederung Das Problem: Skalierbarkeit LAMP Tuning Mehr als ein Server Stud.IP und shared nothing

Mehr

Bibliografische Informationen digitalisiert durch http://d-nb.info/995021198

Bibliografische Informationen digitalisiert durch http://d-nb.info/995021198 Auf einen Blick 1 Einleitung 15 2 Datenbankentwurf 23 3 Datenbankdefinition 43 4 Datensätze einfügen (INSERT INTO) 95 5 Daten abfragen (SELECT) 99 6 Daten aus mehreren Tabellen abfragen (JOIN) 143 7 Unterabfragen

Mehr

PICALIKE API DOKUMENTATION

PICALIKE API DOKUMENTATION PICALIKE API DOKUMENTATION 2 INDEX EINFÜHRUNG PICALIKE 3 ABLAUF 3 VORAUSSETZUNG 4 PFLICHTFELDER 4 WEITERE FELDER 4 API 5 ÄHNLICHKEITSSUCHE 5 RECOMMENDOR 5 WEITERE EINSTELLUNGEN 6 KONTAKT 7 3 EINFÜHRUNG

Mehr

Generalisierung von großen Datenbeständen am Beispiel der Gebäudegeneralisierung mit CHANGE

Generalisierung von großen Datenbeständen am Beispiel der Gebäudegeneralisierung mit CHANGE Institut für Kartographie und Geoinformatik Leibniz Universität Hannover Generalisierung von großen Datenbeständen am Beispiel der Gebäudegeneralisierung mit CHANGE Frank Thiemann, Thomas Globig Frank.Thiemann@ikg.uni-hannover.de

Mehr

Xesar. Die vielfältige Sicherheitslösung

Xesar. Die vielfältige Sicherheitslösung Xesar Die vielfältige Sicherheitslösung Xesar Die professionelle Lösung für Ihr Unternehmen Xesar Sicher und flexibel Xesar ist das vielseitige elektronische Schließsystem aus dem Hause EVVA. Komplexe

Mehr

Einführung in Hadoop

Einführung in Hadoop Einführung in Hadoop Inhalt / Lern-Ziele Übersicht: Basis-Architektur von Hadoop Einführung in HDFS Einführung in MapReduce Ausblick: Hadoop Ökosystem Optimierungen Versionen 10.02.2012 Prof. Dr. Christian

Mehr

Apache HBase. A BigTable Column Store on top of Hadoop

Apache HBase. A BigTable Column Store on top of Hadoop Apache HBase A BigTable Column Store on top of Hadoop Ich bin... Mitch Köhler Selbstständig seit 2010 Tätig als Softwareentwickler Softwarearchitekt Student an der OVGU seit Oktober 2011 Schwerpunkte Client/Server,

Mehr

Grundlagen der Videotechnik. Redundanz

Grundlagen der Videotechnik. Redundanz Grundlagen der Videotechnik Redundanz Redundanz beruht auf: - statistischen Abhängigkeiten im Signal, - Information, die vorher schon gesendet wurde - generell eine Art Gedächtnis im Signal Beispiel: Ein

Mehr

Data Quality Management: Abgleich großer, redundanter Datenmengen

Data Quality Management: Abgleich großer, redundanter Datenmengen Data Quality Management: Abgleich großer, redundanter Datenmengen Westendstr. 14 809 München Tel 089-5100 907 Fax 089-5100 9087 E-Mail Datras@Datras.de Redundanz und relationales Datenbankmodell Redundanz:

Mehr

Open Source GIS - das alternative geogovernment

Open Source GIS - das alternative geogovernment Open Source GIS - das alternative geogovernment Dr. Horst Düster Leiter Abteilung SO!GIS Koordination Kanton Solothurn horst.duester@bd.so.ch www.sogis.so.ch Open Source (freie Software) Was ist freie

Mehr

MapReduce und Datenbanken Thema 15: Strom bzw. Onlineverarbeitung mit MapReduce

MapReduce und Datenbanken Thema 15: Strom bzw. Onlineverarbeitung mit MapReduce MapReduce Jan Kristof Nidzwetzki MapReduce 1 / 17 Übersicht 1 Begriffe 2 Verschiedene Arbeiten 3 Ziele 4 DEDUCE: at the intersection of MapReduce and stream processing Beispiel 5 Beyond online aggregation:

Mehr

Mercurial. or how I learned to stop worrying and love the merge. Ted Naleid IAIK

Mercurial. or how I learned to stop worrying and love the merge. Ted Naleid IAIK Mercurial or how I learned to stop worrying and love the merge Ted Naleid Inhalt Einleitung Vergleich SVN / Mercurial Mercurial verstehen Zusammenarbeit mit Mercurial Demo Mercurial - Intro Entwickelt

Mehr

Webalizer HOWTO. Stand: 18.06.2012

Webalizer HOWTO. Stand: 18.06.2012 Webalizer HOWTO Stand: 18.06.2012 Copyright 2003 by manitu. Alle Rechte vorbehalten. Alle verwendeten Bezeichnungen dienen lediglich der Kennzeichnung und können z.t. eingetragene Warenzeichen sein, ohne

Mehr

SQL on Hadoop für praktikables BI auf Big Data.! Hans-Peter Zorn und Dr. Dominik Benz, Inovex Gmbh

SQL on Hadoop für praktikables BI auf Big Data.! Hans-Peter Zorn und Dr. Dominik Benz, Inovex Gmbh SQL on Hadoop für praktikables BI auf Big Data! Hans-Peter Zorn und Dr. Dominik Benz, Inovex Gmbh War nicht BigData das gleiche NoSQL? 2 Wie viele SQL Lösungen für Hadoop gibt es mittlerweile? 3 ! No SQL!?

Mehr

MS SQL Server: Index Management. Stephan Arenswald 10. Juli 2008

MS SQL Server: Index Management. Stephan Arenswald 10. Juli 2008 MS SQL Server: Index Management Stephan Arenswald 10. Juli 2008 Agenda 1. Einführung 2. Grundlagen Tabellen 3. Grundlagen Indexe 4. Indextypen 5. Index-Erstellung 6. Indexe und Constraints 7. Und Weiter...?

Mehr

Systemvoraussetzungen:

Systemvoraussetzungen: Systemvoraussetzungen: Allgemein Der rechnungsmanager ist eine moderne Softwarelösung, welche mit geringen Systemvoraussetzungen betrieben werden kann. Die Anwendung besteht u.a. aus den Modulen Server-Dienste

Mehr

Die wichtigsten Hadoop-Komponenten für Big Data mit SAS

Die wichtigsten Hadoop-Komponenten für Big Data mit SAS Webinar@Lunchtime Die wichtigsten Hadoop-Komponenten für Big Data mit SAS Herzlich Willkommen bei Webinar@Lunchtime Moderation Anne K. Bogner-Hamleh SAS Institute GmbH Education Consultant Xing-Profil:

Mehr

Sichere email mit OpenPGP und S/MIME

Sichere email mit OpenPGP und S/MIME Sichere email mit OpenPGP und S/MIME Eine Kurzeinführung von Django http://dokuwiki.nausch.org Inhalt Ausgangssituation (mit Beispielen) Zielbild Lösungsansätze (im Grundsatz) OpenPGP

Mehr

Hilfe zur Konfiguration der Software Smart-eShop & Smart-Admin-Bereich

Hilfe zur Konfiguration der Software Smart-eShop & Smart-Admin-Bereich Hilfe zur Konfiguration der Software Smart-eShop & Smart-Admin-Bereich Füllen Sie die leeren Felder mit entsprechenden Daten aus, achten Sie dabei auf korrekte Eingabe Ihrer Daten. Berücksichtigen Sie

Mehr

Risikomanagement bei PPP Projekten: Erfahrungen aus Deutschland

Risikomanagement bei PPP Projekten: Erfahrungen aus Deutschland Verein PPP Schweiz Risikomanagement bei PPP Projekten: Erfahrungen aus Deutschland Veranstaltung des Verein PPP Schweiz am14.05.2014 in Bern Vortrag von Peter Walter Landrat a.d., Vorsitzender Verein PPP

Mehr

Digitale Zertifikate

Digitale Zertifikate Digitale Zertifikate Zertifikate und Schlüssel verteilen SECARDEO GmbH Die SECARDEO GmbH ist ein Anbieter von Unternehmenslösungen mit digitalen Zertifikaten. SECARDEO bietet dazu seit der Gründung 2001

Mehr

Matrix42. Use Case - Sicherung und Rücksicherung persönlicher Einstellungen über Personal Backup. Version 1.0.0. 23. September 2015 - 1 -

Matrix42. Use Case - Sicherung und Rücksicherung persönlicher Einstellungen über Personal Backup. Version 1.0.0. 23. September 2015 - 1 - Matrix42 Use Case - Sicherung und Rücksicherung persönlicher Version 1.0.0 23. September 2015-1 - Inhaltsverzeichnis 1 Einleitung 3 1.1 Beschreibung 3 1.2 Vorbereitung 3 1.3 Ziel 3 2 Use Case 4-2 - 1 Einleitung

Mehr

MapReduce-Konzept. Thomas Findling, Thomas König

MapReduce-Konzept. Thomas Findling, Thomas König MapReduce - Konzept 1 Inhalt 1. Motivation 2. Einführung MapReduce Google Rechenzentren Vergleich MapReduce und Relationale DBS 3. Hadoop Funktionsweise Input / Output Fehlerbehandlung 4. Praxis-Beispiel

Mehr

Übung 1 mit C# 6.0 MATTHIAS RONCORONI

Übung 1 mit C# 6.0 MATTHIAS RONCORONI Übung 1 mit C# 6.0 MATTHIAS RONCORONI Inhalt 2 1. Überblick über C# 2. Lösung der Übung 1 3. Code 4. Demo C# allgemein 3 aktuell: C# 6.0 mit.net-framework 4.6: Multiparadigmatisch (Strukturiert, Objektorientiert,

Mehr

Algorithmen II Vorlesung am 15.11.2012

Algorithmen II Vorlesung am 15.11.2012 Algorithmen II Vorlesung am 15.11.2012 Kreisbasen, Matroide & Algorithmen INSTITUT FÜR THEORETISCHE INFORMATIK PROF. DR. DOROTHEA WAGNER KIT Universität des Landes Baden-Württemberg und Algorithmen nationales

Mehr

Systemvoraussetzungen: DOMUS NAVI für DOMUS 1000 Stand 09/15

Systemvoraussetzungen: DOMUS NAVI für DOMUS 1000 Stand 09/15 Systemvoraussetzungen: DOMUS NAVI für DOMUS 1000 Stand 09/15 Benötigen Sie Unterstützung* oder haben essentielle Fragen? Kundenbetreuung Tel.: +49 [0] 89 66086-230 Fax: +49 [0] 89 66086-235 e-mail: domusnavi@domus-software.de

Mehr

Allgemeines zu Datenbanken

Allgemeines zu Datenbanken Allgemeines zu Datenbanken Was ist eine Datenbank? Datensatz Zusammenfassung von Datenelementen mit fester Struktur Z.B.: Kunde Alois Müller, Hegenheimerstr. 28, Basel Datenbank Sammlung von strukturierten,

Mehr

Viele Bilder auf der FA-Homepage

Viele Bilder auf der FA-Homepage Viele Bilder auf der FA-Homepage Standardmäßig lassen sich auf einer FA-Homepage nur 2 Bilder mit zugehörigem Text unterbringen. Sollen es mehr Bilder sein, muss man diese als von einer im Internet

Mehr

Info-Veranstaltung zur Erstellung von Zertifikaten

Info-Veranstaltung zur Erstellung von Zertifikaten Info-Veranstaltung zur Erstellung von Zertifikaten Prof. Dr. Till Tantau Studiengangsleiter MINT Universität zu Lübeck 29. Juni 2011 Gliederung Zertifikate Wer, Wann, Was Ablauf der Zertifikaterstellung

Mehr

SOLISYON GMBH TOBIAS GRUBER BEN WEISSMAN. Analyse von Dimensions-Schlüsselfehlern bei der Aufbereitung von SSAS Datenbanken

SOLISYON GMBH TOBIAS GRUBER BEN WEISSMAN. Analyse von Dimensions-Schlüsselfehlern bei der Aufbereitung von SSAS Datenbanken WEITER BLICKEN. MEHR ERKENNEN. BESSER ENTSCHEIDEN. Analyse von Dimensions-Schlüsselfehlern bei der Aufbereitung von SSAS Datenbanken SOLISYON GMBH TOBIAS GRUBER BEN WEISSMAN ANALYSE VON OLAP-AUFBEREITUNGSFEHLERN

Mehr

Indizierungs- und Suchlogs. Version 2015

Indizierungs- und Suchlogs. Version 2015 Indizierungs- und Suchlogs Version 2015 Status: 13. März 2015 Copyright Mindbreeze GmbH, A-4020 Linz, 2015. Alle Rechte vorbehalten. Alle verwendeten Hard- und Softwarenamen sind Handelsnamen und/oder

Mehr

In diesem Thema lernen wir die Grundlagen der Datenbanken kennen und werden diese lernen einzusetzen. Access. Die Grundlagen der Datenbanken.

In diesem Thema lernen wir die Grundlagen der Datenbanken kennen und werden diese lernen einzusetzen. Access. Die Grundlagen der Datenbanken. In diesem Thema lernen wir die Grundlagen der Datenbanken kennen und werden diese lernen einzusetzen. Access Die Grundlagen der Datenbanken kurspc15 Inhaltsverzeichnis Access... Fehler! Textmarke nicht

Mehr

Vorlesung Text und Data Mining S9 Text Clustering. Hans Hermann Weber Univ. Erlangen, Informatik

Vorlesung Text und Data Mining S9 Text Clustering. Hans Hermann Weber Univ. Erlangen, Informatik Vorlesung Text und Data Mining S9 Text Clustering Hans Hermann Weber Univ. Erlangen, Informatik Document Clustering Überblick 1 Es gibt (sehr viele) verschiedene Verfahren für das Bilden von Gruppen Bei

Mehr

Behebung des sog. Heartbleed-Bugs (CVE-2014-0160) in der Krypto-Bibliothek OpenSSL.

Behebung des sog. Heartbleed-Bugs (CVE-2014-0160) in der Krypto-Bibliothek OpenSSL. NCP Volume License Server (Win32/64) Service Release: 1.03 Build 004 Datum: Juli 2014 Open SSL Heartbleed-Bugs (CVE-2014-0160) Behebung des sog. Heartbleed-Bugs (CVE-2014-0160) in der Krypto-Bibliothek

Mehr

Hadoop. Simon Prewo. Simon Prewo

Hadoop. Simon Prewo. Simon Prewo Hadoop Simon Prewo Simon Prewo 1 Warum Hadoop? SQL: DB2, Oracle Hadoop? Innerhalb der letzten zwei Jahre hat sich die Datenmenge ca. verzehnfacht Die Klassiker wie DB2, Oracle usw. sind anders konzeptioniert

Mehr

Big Data Informationen neu gelebt

Big Data Informationen neu gelebt Seminarunterlage Version: 1.01 Copyright Version 1.01 vom 21. Mai 2015 Dieses Dokument wird durch die veröffentlicht. Copyright. Alle Rechte vorbehalten. Alle Produkt- und Dienstleistungs-Bezeichnungen

Mehr

Folgende Voraussetzungen für die Konfiguration müssen erfüllt sein: - Ein Bootimage ab Version 7.4.4. - Optional einen DHCP Server.

Folgende Voraussetzungen für die Konfiguration müssen erfüllt sein: - Ein Bootimage ab Version 7.4.4. - Optional einen DHCP Server. 1. Dynamic Host Configuration Protocol 1.1 Einleitung Im Folgenden wird die Konfiguration von DHCP beschrieben. Sie setzen den Bintec Router entweder als DHCP Server, DHCP Client oder als DHCP Relay Agent

Mehr

Seminar Informationsintegration und Informationsqualität. Dragan Sunjka. 30. Juni 2006

Seminar Informationsintegration und Informationsqualität. Dragan Sunjka. 30. Juni 2006 Seminar Informationsintegration und Informationsqualität TU Kaiserslautern 30. Juni 2006 Gliederung Autonomie Verteilung führt zu Autonomie... Intra-Organisation: historisch Inter-Organisation: Internet

Mehr

SUB-ID- VERWALTUNG MIT GPP SETUP-GUIDE FÜR PUBLISHER

SUB-ID- VERWALTUNG MIT GPP SETUP-GUIDE FÜR PUBLISHER SUB-ID- VERWALTUNG MIT GPP SETUP-GUIDE FÜR PUBLISHER INHALTSVERZEICHNIS Inhaltsverzeichnis... 2 Symbolverzeichnis... 3 Was ist GPP?... 4 Parameternamen... 4 Parameterformat und -größe... 4 Unterstützte

Mehr

Ein Blick voraus. des Autors von C++: Bjarne Stroustrup. 04.06.2005 Conrad Kobsch

Ein Blick voraus. des Autors von C++: Bjarne Stroustrup. 04.06.2005 Conrad Kobsch Ein Blick voraus des Autors von C++: Bjarne Stroustrup 04.06.2005 Conrad Kobsch Inhalt Einleitung Rückblick Nur eine Übergangslösung? Was würde C++ effektiver machen? Quelle 2 Einleitung Wo steht C++,

Mehr

MapReduce in der Praxis

MapReduce in der Praxis MapReduce in der Praxis Rolf Daniel Seminar Multicore Programmierung 09.12.2010 1 / 53 Agenda Einleitung 1 Einleitung 2 3 Disco Hadoop BOOM 4 2 / 53 1 Einleitung 2 3 Disco Hadoop BOOM 4 3 / 53 Motivation

Mehr

W-Rechnung und Statistik für Ingenieure Übung 11

W-Rechnung und Statistik für Ingenieure Übung 11 W-Rechnung und Statistik für Ingenieure Übung 11 Christoph Kustosz (kustosz@statistik.tu-dortmund.de) Mathematikgebäude Raum 715 Christoph Kustosz (kustosz@statistik.tu-dortmund.de) W-Rechnung und Statistik

Mehr

Online-Dateienablage und Datenaustauschdienst Box.net Stand: September 2011

Online-Dateienablage und Datenaustauschdienst Box.net Stand: September 2011 Online-Dateienablage und Datenaustauschdienst Box.net Stand: September 2011 Jan Oesch, PHBern, Institut Sekundarstufe II Der Datenaustauschdienst Box.net eignet sich besonders für den regelmässigen Austausch

Mehr

TSM Information für Administratoren Include-Exclude-Listen

TSM Information für Administratoren Include-Exclude-Listen TSM Information für Administratoren Include-Exclude-Listen Das Backup-Team Daniel Stanek stanek@rz.rwth-aachen.de RWTH Aachen zentrale Konfigurationsdatei dsm.sys / dsm.opt /opt/tivoli/tsm/client/ba/bin/dsm.sys

Mehr

Datenbanken Microsoft Access 2010

Datenbanken Microsoft Access 2010 Datenbanken Microsoft Access 2010 Abfragen Mithilfe von Abfragen kann ich bestimmte Informationen aus einer/mehrerer Tabellen auswählen und nur diese anzeigen lassen die Daten einer/mehrerer Tabellen sortieren

Mehr

http://webbasics.ch/webbearbeitung/hostpoint/

http://webbasics.ch/webbearbeitung/hostpoint/ Hostpoint Angebot (#Angebot) Anmeldung (#Anmeldung) Control Panel (Services / Domains / Admin) (#controlpanel) Server (E-Mail / Webseiten / Explorer) (#server) externer Webeditor / FTP (#editor) CMS /

Mehr

Transaction Validation for XML Documents based on XPath

Transaction Validation for XML Documents based on XPath Transaction Validation for XML Documents based on XPath @ Informatik 2002, m-dbis Stefan Böttcher Adelhard Türling Universität Paderborn Überblick Transaktionen für XML - Daten & mobile Clients Motivation

Mehr

Anleitung für die Teilnahme an den Platzvergaben "Studio II, Studio IV und Studio VI" im Studiengang Bachelor Architektur SS15

Anleitung für die Teilnahme an den Platzvergaben Studio II, Studio IV und Studio VI im Studiengang Bachelor Architektur SS15 Anleitung für die Teilnahme an den Platzvergaben "Studio II, Studio IV und Studio VI" im Studiengang Bachelor Architektur SS15 1 Bitte melden Sie sich über das Campusmanagementportal campus.studium.kit.edu

Mehr

Lokale Installation von DotNetNuke 4 ohne IIS

Lokale Installation von DotNetNuke 4 ohne IIS Lokale Installation von DotNetNuke 4 ohne IIS ITM GmbH Wankelstr. 14 70563 Stuttgart http://www.itm-consulting.de Benjamin Hermann hermann@itm-consulting.de 12.12.2006 Agenda Benötigte Komponenten Installation

Mehr

ETL in den Zeiten von Big Data

ETL in den Zeiten von Big Data ETL in den Zeiten von Big Data Dr Oliver Adamczak, IBM Analytics 1 1 Review ETL im Datawarehouse 2 Aktuelle Herausforderungen 3 Future of ETL 4 Zusammenfassung 2 2015 IBM Corporation ETL im Datawarehouse

Mehr

1 Application Compatibility Toolkit (ACT) 5.6

1 Application Compatibility Toolkit (ACT) 5.6 1 Application Compatibility Toolkit (ACT) 5.6 Systemvoraussetzungen: SQL Server 2005/2008 (auch Express) ACT 5.6 besteht aus zwei Tools: Der Compatibility Manager ermittelt Informationen, die Auswirkungen

Mehr

1. Einführung. 2. Alternativen zu eigenen Auswertungen. 3. Erstellen eigener Tabellen-Auswertungen

1. Einführung. 2. Alternativen zu eigenen Auswertungen. 3. Erstellen eigener Tabellen-Auswertungen 1. Einführung Über die Tabellen-Auswertungen können Sie eigene Auswertungen nach Ihren Wünschen erstellen. Diese Auswertungen werden immer anhand der aktuellen Daten aus orgamax ermittelt, Sie können also

Mehr

Konfiguration des Novell GroupWise Connectors

Konfiguration des Novell GroupWise Connectors Konfiguration des Novell GroupWise Connectors Installation und Konfiguration Version 2013 Spring Release Status: 09. März 2013 Copyright Mindbreeze Software GmbH, A-4020 Linz, 2013. Alle Rechte vorbehalten.

Mehr

Professionelle Seminare im Bereich MS-Office

Professionelle Seminare im Bereich MS-Office Der Name BEREICH.VERSCHIEBEN() ist etwas unglücklich gewählt. Man kann mit der Funktion Bereiche zwar verschieben, man kann Bereiche aber auch verkleinern oder vergrößern. Besser wäre es, die Funktion

Mehr

Metadateneditoren für ArcGIS

Metadateneditoren für ArcGIS Metadateneditoren für ArcGIS Matthias Schenker Geoinformatik AG Zürich, Schweiz Inhalt Metadaten in ArcGIS Erweiterung des bestehenden ISO-Editors Einbinden eigener Editoren Import und Export von bestehenden

Mehr

Datenbanken für Online Untersuchungen

Datenbanken für Online Untersuchungen Datenbanken für Online Untersuchungen Im vorliegenden Text wird die Verwendung einer MySQL Datenbank für Online Untersuchungen beschrieben. Es wird davon ausgegangen, dass die Untersuchung aus mehreren

Mehr

Florian Hopf www.florian-hopf.de @fhopf. elasticsearch. Bern 07.10.2015

Florian Hopf www.florian-hopf.de @fhopf. elasticsearch. Bern 07.10.2015 Florian Hopf www.florian-hopf.de @fhopf elasticsearch. Bern 07.10.2015 Agenda Suche Verteilung Elasticsearch und Java Aggregationen Zentralisiertes Logging Suche Installation # download archive wget https://download.elastic.co/elasticsearch

Mehr

Das SIARD Format und die zugehörige Tool-Landschaft

Das SIARD Format und die zugehörige Tool-Landschaft Das SIARD Format und die zugehörige Tool-Landschaft Arbeitskreis Archivierung von Unterlagen aus digitalen Systemen 17. Tagung im Staatsarchiv Dresden 13./14. März 2013 Inhaltsübersicht Langzeitarchivierung

Mehr

Perzentile mit Hadoop ermitteln

Perzentile mit Hadoop ermitteln Perzentile mit Hadoop ermitteln Ausgangspunkt Ziel dieses Projektes war, einen Hadoop Job zu entwickeln, der mit Hilfe gegebener Parameter Simulationen durchführt und aus den Ergebnissen die Perzentile

Mehr

mobilepoi 0.91 Demo Version Anleitung Das Software Studio Christian Efinger Erstellt am 21. Oktober 2005

mobilepoi 0.91 Demo Version Anleitung Das Software Studio Christian Efinger Erstellt am 21. Oktober 2005 Das Software Studio Christian Efinger mobilepoi 0.91 Demo Version Anleitung Erstellt am 21. Oktober 2005 Kontakt: Das Software Studio Christian Efinger ce@efinger-online.de Inhalt 1. Einführung... 3 2.

Mehr

1. Übungsblatt. Besprechung: 27.10 (Gruppe A), 3.11 (Gruppe B)

1. Übungsblatt. Besprechung: 27.10 (Gruppe A), 3.11 (Gruppe B) DATENBANKEN IN DER PRAXIS: DATA WAREHOUSING Wintersemester 2015/2016 Prof. Dr. Jens Teubner DBIS Group Übung: Dr. Cornelia Tadros ISSI Group Allgemeine Hinweise 1. Übungsblatt Besprechung: 27.10 (Gruppe

Mehr

Spark, Impala und Hadoop in der Kreditrisikoberechnung

Spark, Impala und Hadoop in der Kreditrisikoberechnung Spark, Impala und Hadoop in der Kreditrisikoberechnung Big Data In-Memory-Technologien für mittelgroße Datenmengen TDWI München, 22. Juni 2015 Joschka Kupilas, Data Scientist, Adastra GmbH 2 Inhalt Vorwort

Mehr

Big Data Kundendaten im 2015 Michael Gisiger Wortgefecht Training & Beratung

Big Data Kundendaten im 2015 Michael Gisiger Wortgefecht Training & Beratung Big Data Kundendaten im 2015 Social Media für Medienunternehmen Trendtagung am Agenda Kurze Vorstellung Big Data was ist das genau? Case: DW Nutzungsdaten und -analysen von Videos im Web 2 Vorstellung

Mehr

MSXFORUM - Exchange Server 2003 > SMTP Konfiguration von Exchange 2003

MSXFORUM - Exchange Server 2003 > SMTP Konfiguration von Exchange 2003 Page 1 of 8 SMTP Konfiguration von Exchange 2003 Kategorie : Exchange Server 2003 Veröffentlicht von webmaster am 25.02.2005 SMTP steht für Simple Mail Transport Protocol, welches ein Protokoll ist, womit

Mehr

Schnellste Realtime Segmentierung weltweit

Schnellste Realtime Segmentierung weltweit Schnellste Realtime Segmentierung weltweit powered by 1 Über Webtrekk Gegründet 2004 in Berlin Einer der führenden europäischen Webanalyseanbieter 45 Mitarbeiter 2 2nd only to Omniture 3 Referenzen Kunden

Mehr

XSLT Vortrag. 2. Beispiel XML. 3. Anwendungsmöglichkeiten von XSLT 4. XHTML

XSLT Vortrag. 2. Beispiel XML. 3. Anwendungsmöglichkeiten von XSLT 4. XHTML XSLT Vortrag 1. Was ist XSLT? XSLT ist eine Transformationssprache für XML Dokumente. XSLT war wahrscheinlich die erste XML basierte Programmiersprache. XSLT ist von der Struktur her Template-Matching,

Mehr

t r Lineare Codierung von Binärbbäumen (Wörter über dem Alphabet {, }) Beispiel code( ) = code(, t l, t r ) = code(t l ) code(t r )

t r Lineare Codierung von Binärbbäumen (Wörter über dem Alphabet {, }) Beispiel code( ) = code(, t l, t r ) = code(t l ) code(t r ) Definition B : Menge der binären Bäume, rekursiv definiert durch die Regeln: ist ein binärer Baum sind t l, t r binäre Bäume, so ist auch t =, t l, t r ein binärer Baum nur das, was durch die beiden vorigen

Mehr

Handbuch Fischertechnik-Einzelteiltabelle V3.7.3

Handbuch Fischertechnik-Einzelteiltabelle V3.7.3 Handbuch Fischertechnik-Einzelteiltabelle V3.7.3 von Markus Mack Stand: Samstag, 17. April 2004 Inhaltsverzeichnis 1. Systemvorraussetzungen...3 2. Installation und Start...3 3. Anpassen der Tabelle...3

Mehr

Copyright 2014 Delta Software Technology GmbH. All Rights reserved.

Copyright 2014 Delta Software Technology GmbH. All Rights reserved. Karlsruhe, 21. Mai 2014 Softwareentwicklung - Modellgetrieben und trotzdem agil Daniela Schilling Delta Software Technology GmbH The Perfect Way to Better Software Modellgetriebene Entwicklung Garant für

Mehr

Kapitel 33. Der xml-datentyp. In diesem Kapitel: Der xml-datentyp 996 Abfragen aus xml-datentypen 1001 XML-Indizierung 1017 Zusammenfassung 1023

Kapitel 33. Der xml-datentyp. In diesem Kapitel: Der xml-datentyp 996 Abfragen aus xml-datentypen 1001 XML-Indizierung 1017 Zusammenfassung 1023 Kapitel 33 Der xml-datentyp In diesem Kapitel: Der xml-datentyp 996 Abfragen aus xml-datentypen 1001 XML-Indizierung 1017 Zusammenfassung 1023 995 996 Kapitel 33: Der xml-datentyp Eine der wichtigsten

Mehr

Predictive Modeling Markup Language. Thomas Morandell

Predictive Modeling Markup Language. Thomas Morandell Predictive Modeling Markup Language Thomas Morandell Index Einführung PMML als Standard für den Austausch von Data Mining Ergebnissen/Prozessen Allgemeine Struktur eines PMML Dokuments Beispiel von PMML

Mehr

XAMPP-Systeme. Teil 3: My SQL. PGP II/05 MySQL

XAMPP-Systeme. Teil 3: My SQL. PGP II/05 MySQL XAMPP-Systeme Teil 3: My SQL Daten Eine Wesenseigenschaft von Menschen ist es, Informationen, in welcher Form sie auch immer auftreten, zu ordnen, zu klassifizieren und in strukturierter Form abzulegen.

Mehr

Beratung. Results, no Excuses. Consulting. Lösungen. Grown from Experience. Ventum Consulting. SQL auf Hadoop Oliver Gehlert. 2014 Ventum Consulting

Beratung. Results, no Excuses. Consulting. Lösungen. Grown from Experience. Ventum Consulting. SQL auf Hadoop Oliver Gehlert. 2014 Ventum Consulting Beratung Results, no Excuses. Consulting Lösungen Grown from Experience. Ventum Consulting SQL auf Hadoop Oliver Gehlert 1 Ventum Consulting Daten und Fakten Results, no excuses Fachwissen Branchenkenntnis

Mehr

SCHNELLEINSTIEG FÜR HOSTED EXCHANGE BASIC / PREMIUM

SCHNELLEINSTIEG FÜR HOSTED EXCHANGE BASIC / PREMIUM SCHNELLEINSTIEG FÜR HOSTED EXCHANGE BASIC / PREMIUM Inhaltsverzeichnis SCHNELLEINSTIEG FÜR HOSTED EXCHANGE BASIC / PREMIUM... 1 SCHNELLEINSTIEG FÜR HOSTED EXCHANGE... 3 WAS KANN HOSTED EXCHANGE BASIC /

Mehr

Entwicklungen bei der Linux Clustersoftware

Entwicklungen bei der Linux Clustersoftware Quo vadis Linux-HA? Entwicklungen bei der Linux Clustersoftware Michael Schwartzkopff misch@schwartzkopff.org (c) Michael Schwartzkopff, 2010 1 / 19 Linux Clustersoftware Linux Virtual Server Bietet Skalierbarkeit...

Mehr

Informationssystemanalyse Lebenszyklusmodelle 3 1. Lebenszyklusmodelle sollen hauptsächlich drei Aufgaben erfüllen:

Informationssystemanalyse Lebenszyklusmodelle 3 1. Lebenszyklusmodelle sollen hauptsächlich drei Aufgaben erfüllen: Informationssystemanalyse Lebenszyklusmodelle 3 1 Aufgaben von Lebenszyklusmodellen Lebenszyklusmodelle sollen hauptsächlich drei Aufgaben erfüllen: Definition der Tätigkeiten im Entwicklungsprojekt Zusicherung

Mehr

R. Brinkmann http://brinkmann-du.de Seite 1 30.11.2013 Schriftliche Übung Mathematik Stochastik II (Nachschreiber) Jan. 2007

R. Brinkmann http://brinkmann-du.de Seite 1 30.11.2013 Schriftliche Übung Mathematik Stochastik II (Nachschreiber) Jan. 2007 R. Brinkmann http://brinkmann-du.de Seite 1 30.11.2013 Schriftliche Übung Mathematik Stochastik II (Nachschreiber) Jan. 2007 SG15/25D NAME: Lösungen 1. In einer Packung sind Glühbirnen, davon sind zwei

Mehr

C.M.I. Control and Monitoring Interface. Zusatzanleitung: Datentransfer mit CAN over Ethernet (COE) Version 1.08

C.M.I. Control and Monitoring Interface. Zusatzanleitung: Datentransfer mit CAN over Ethernet (COE) Version 1.08 C.M.I. Version 1.08 Control and Monitoring Interface Zusatzanleitung: Datentransfer mit CAN over Ethernet (COE) de LAN LAN Beschreibung der Datentransfermethode Mit dieser Methode ist es möglich, analoge

Mehr

Advoware mit VPN Zugriff lokaler Server / PC auf externe Datenbank

Advoware mit VPN Zugriff lokaler Server / PC auf externe Datenbank Advoware mit VPN Zugriff lokaler Server / PC auf externe Datenbank Die Entscheidung Advoware über VPN direkt auf dem lokalen PC / Netzwerk mit Zugriff auf die Datenbank des zentralen Servers am anderen

Mehr

Veröffentlichen von Apps, Arbeitsblättern und Storys. Qlik Sense 2.0.6 Copyright 1993-2015 QlikTech International AB. Alle Rechte vorbehalten.

Veröffentlichen von Apps, Arbeitsblättern und Storys. Qlik Sense 2.0.6 Copyright 1993-2015 QlikTech International AB. Alle Rechte vorbehalten. Veröffentlichen von Apps, Arbeitsblättern und Storys Qlik Sense 2.0.6 Copyright 1993-2015 QlikTech International AB. Alle Rechte vorbehalten. Copyright 1993-2015 QlikTech International AB. Alle Rechte

Mehr

Pressemeldung 09/2012

Pressemeldung 09/2012 Pressemeldung 09/2012 Bonn, den 13.09.2012 Einer für alles!!! : Die innovative Allzweckwaffe agindo DATA DISPENSER löst nahezu jedes Schnittstellen-Problem Die agindo GmbH mit Sitz in Bonn, einer der führenden

Mehr

Anwendungsbeispiele Sign Live! Secure Mail Gateway

Anwendungsbeispiele Sign Live! Secure Mail Gateway Anwendungsbeispiele Sign Live! Secure Mail Gateway Kritik, Kommentare & Korrekturen Wir sind ständig bemüht, unsere Dokumentation zu optimieren und Ihren Bedürfnissen anzupassen. Ihre Anregungen sind uns

Mehr

Informationen zum neuen Studmail häufige Fragen

Informationen zum neuen Studmail häufige Fragen 1 Stand: 15.01.2013 Informationen zum neuen Studmail häufige Fragen (Dokument wird bei Bedarf laufend erweitert) Problem: Einloggen funktioniert, aber der Browser lädt dann ewig und zeigt nichts an Lösung:

Mehr

WICHTIGER HINWEIS FÜR HÄNDLER UND SERVICE-WERKSTÄTTEN:

WICHTIGER HINWEIS FÜR HÄNDLER UND SERVICE-WERKSTÄTTEN: Sehr geehrter Kunde, ruwido erweitert seine Serviceleistungen für den Sektor seiner Symphony Ersatzfernbedienungen sowie der bisher für ASWO/ESPO hergestellten COM genius Ersatzfernbedienungen mit einem

Mehr

Scanning, Inputmanagement, Data Capture Neue Wege für Metadaten mit PDF/A-3

Scanning, Inputmanagement, Data Capture Neue Wege für Metadaten mit PDF/A-3 Scanning mit PDF/A-3 Scanning, Inputmanagement, Data Capture Neue Wege für Metadaten mit PDF/A-3 PDF Association A PDF Association Presentation 2012 by PDF Association 1 Gescannte Dokumente in PDF/A Thema:

Mehr

LimeSurvey Fragetypen

LimeSurvey Fragetypen Page 1 of 6 LimeSurvey Fragetypen LimeSurvey bietet eine Vielzahl von Fragetypen und es kann verwirrend sein, den richtigen Typ für eine Umfrage auszuwählen. Im folgenden werden alle von LimeSurvey unterstützten

Mehr

MS Excel 2010 Kompakt

MS Excel 2010 Kompakt MS Excel 00 Kompakt FILTERN Aus einem großen Datenbestand sollen nur jene Datensätze (Zeilen) angezeigt werden, die einem bestimmten Eintrag eines Feldes (Spalte) entsprechen. Excel unterstützt Filterungen

Mehr

Property-Graph-Databases. 20 Jahre praktische Erfahrung

Property-Graph-Databases. 20 Jahre praktische Erfahrung Property-Graph-Databases 20 Jahre praktische Erfahrung Agenda Was sind die Bausteine der Property- Graph-Database Aspekte der Architektur und der Implementierung Möglichkeiten, Vor- und Nachteile von PG-

Mehr