Data Mining in der Cloud
|
|
|
- Sabine Ursler
- vor 10 Jahren
- Abrufe
Transkript
1 Data Mining in der Cloud von Jan-Christoph Meier Hamburg,
2 Ablauf Einführung Verwandte Arbeiten Fazit / Ausblick Literatur 2
3 Ablauf Einführung Verwandte Arbeiten Fazit / Ausblick Literatur 3
4 Was ist Data Mining? Extrahieren von Wissen aus großen Mengen von Daten Alternativ auch: Knowledge Discovery from Data Siehe AW1 - Datenanalyse mit Data Mining Bild aus [2] Seite 6 4
5 Warum Data Mining in der Cloud? Data Mining Algorithmen arbeiten auf großen Datenmengen, für deren Analyse viel Rechenleistung benötigt wird. Rechenleistung kann kostengünstig angemietet und je nach Bedarf skaliert werden. Optimal wäre ein System, das auf beliebig großen Datenmengen operieren und auf beliebig viele Rechner skaliert werden kann. 5
6 Hadoop Java-Framework, das es ermöglicht, Algorithmen parallel auf beliebig vielen Rechnern auszuführen. Die Algorithmen müssen nach dem MapReduce-Paradigma implementiert sein. Hadoop implementiert ein verteiltes Dateisystem (Hadoop distributed filesystem HDFS). Koordiniert die Ausführung der Algorithmen und die Verfügbarkeit der Daten. Ermöglicht die Verarbeitung großer Datenmengen (Bigdata). Kann in der Cloud betrieben werden, z.b. Amazon AWS 6
7 Hadoop - Architektur NameNode / Jobtracker DataNode TaskTracker DataNode TaskTracker DataNode TaskTracker Map Map Map Reduce Reduce Reduce 7
8 Hadoop - Architektur Java-Pogramm als JAR-Datei NameNode / Jobtracker DataNode TaskTracker DataNode TaskTracker DataNode TaskTracker Map Map Map Reduce Reduce Reduce 8
9 Hadoop - Bewertung Vorteile Algorithmen können einfach parallelisiert und auf verschiedenen Rechnern ausgeführt werden. Es muss sich nicht um die Partitionierung der Daten und die Parallelisierung der Algorithmen gekümmert werden. Nachteile Algorithmen müssen nach dem MapReduce-Paradigma implementiert sein. Verteilung kann Overhead bedeuten, falls nur auf kleinen Daten operiert werden soll. 9
10 MapReduce Schematik des Algorithmus Map Daten Map Map Reduce Ergebnis Map Datenstrukturen Map Reduce Input <k1, v1> <k2, list(v2)> Output list(<k2, v2>) list(<k3, v3>) Aus: Hadoop in Action [4] Seite 12 10
11 MapReduce - Beispiel Zählen der Häufigkeiten von Elementen in Transaktionen T1: a1, a2, a3 T2: a1, a3 Aufruf des Mappers für jede Transaktion: map( T1, a1, a2, a3 ) -> [ (a1: 1), (a2: 1), (a3: 1) ] map( T2, a1, a3 ) -> [ (a1: 1), (a3: 1) ] Aufruf des Reducers: reduce( a1, [ 1, 1 ] ) -> [ (a1, 2) ] reduce( a2, [ 1 ] ) -> [ (a2, 1) ] reduce( a3, [ 1, 1 ] ) -> [ (a3, 2) ] Input Output Map Reduce <k1, v1> <k2, list(v2)> list(<k2, v2>) list(<k3, v3>) Aus: Hadoop in Action [4] Seite 12 11
12 Motivation - Vereinfacht Finden von Eigenschaften / Strukturen in Proteinsequenzen Proteinsequenz: Kette von Aminosäuren Aminosäuren haben verschiedene Eigenschaften 12
13 Motivation - Beispiel Proteinsequenz: MVDEQVAVEHGTVSHTISREEDGVVHERVLASGERVEVFYKAPAPRPREGRA Chemische Eigenschaften von Aminosäuren: hydrophob / -phil volume charge Alanin Ala A phob small n Arginin Arg R phil large + Asparagin Asn N phil small n Asparaginsäure Asp D phil small - Cystein Cys C phob small n Glutamin Gln Q phil medium n
14 Ziele Finden einer Korrelation von Struktur und Eigenschaften in einer Vielzahl von Proteinsequenzen mithilfe von Data Mining Algorithmen. Analyse unter Verwendung eines Hadoop-Clusters. 14
15 Ablauf Einführung Verwandte Arbeiten Fazit / Ausblick Literatur 15
16 Apache Mahout Data Mining Framework Master Informatik Haw Hamburg 16 Datenanalyse mit Data Mining
17 Apache Mahout Implementiert verschiedene Data Mining Algorithmen Clustering Pattern Mining Machine Learning uvm. 17
18 Apache Mahout (2) Die Algorithmen in Mahout... sind nach dem MapReduce-Paradigma implementiert können in einem Hadoop-Cluster ausgeführt werden operieren auf beliebig großen Datenmengen - Gigabyte, Terabyte, Petabyte Umdenken: Methoden haben keine Parameter oder Rückgabewerte, es wird auf serialisierten Daten im Dateisystem operiert. Die Algorithmen sind so generisch implementiert, dass sie mit wenig Aufwand auf beliebige Problemstellungen angewandt werden können 18
19 Apache Mahout - Bewertung Vorteile Bietet ein breites Spektrum an Data Mining Algorithmen. Algorithmen können auf einem Hadoop-Cluster ausgeführt werden. Beliebig große Eingabedaten sind möglich. Nachteile Die Eingabedaten müssen in ein kompatibles Datenformat konvertiert werden. 19
20 Parallel K-Means Clustering Based on MapReduce Weizhong Zhao, Huifang Ma, Qing He Lecture Notes in Computer Science, 2009 Volume 5931/2009, Master Informatik Haw Hamburg 20 Datenanalyse mit Data Mining
21 K-Means Algorithmus Clustering Algorithmus Partitioniert eine Menge von Objekten in verschiedene Teilmengen. Die Objekte innerhalb der Teilmengen sind ähnlich. Die Teilmengen unterscheiden sich. 21
22 K-Means Algorithmus - Ablauf Eingabe Parameter: D Dataset, das n Objekte enthält k Anzahl der Cluster Ablauf 1. Es werden k Objekte aus D zufällig gewählt, diese stellen die Cluster- Mittelpunkte dar. 2. wiederhole: 3. Weise jedem Objekt einen der Cluster-Mittelpunkte zu, der dem Objekt am ähnlichsten ist. Neue Cluster werden gebildet. 4. Erzeuge für jedes Cluster einen neuen Mittelpunkt, der durch Bildung des Mittelwertes berechnet wird. 5. bis sich die Cluster-Mittelpunkte nicht mehr ändern 22
23 K-Means Algorithmus - Beispiel Quelle: Mahout in Action [3] Seite
24 K-Means auf MapReduce Aufwändigste Operation: In jeder Iteration muss der Abstand zwischen den n Objekten und k Cluster-Mittelpunkten berechnet werden. Der Abstand muss in jeder Iteration n * k häufig berechnet werden. Ansatz: Mapper-Funktion berechnet den Abstand zu den Cluster-Mittelpunkten. Reducer-Funktion bestimmt neue Cluster-Mittelpunkte Die einzelnen Mapper und Reducer können parallel ausgeführt werden. 24
25 K-Means auf MapReduce Im Detail Cluster-Mittelpunkte werden global gespeichert. Map-Funktion Wird für jedes Objekt aufgerufen und berechnet den Abstand zu allen Cluster-Mittelpunkten. Der Cluster-Mittelpunkt, der dem Objekt am nächsten ist, wird zurückgegeben. Map Cluster Mittelpunkte Map Map Map 25
26 K-Means auf MapReduce Im Detail Combine-Funktion Führt eine Vorberechnung nach mehreren Aufrufen der Map-Funktion durch. Zählt die Anzahl der Objekte in einem Cluster. Summiert die Objekte auf, bereitet die Mittelwertsberechung für die Reduce-Funktion vor. Map Map Map Map Combine Combine Reduce 26
27 K-Means auf MapReduce Im Detail Reduce-Funktion Berechnet den Mittelwert für die einzelnen Cluster und bestimmt somit die neuen Mittelpunkte Quelle: Mahout in Action [3] Seite
28 Parallel K-Means Clustering Based on MapReduce - Bewertung Vorteile Einfach zu implementierender Clustering-Algorithmus. Nachteile Es muss die Anzahl k der Cluster als Parameter mitgegeben werden. Für die Eingabedaten muss eine optimale Funktion zur Berechnung der Ähnlichkeiten (Abstand zum Cluster-Mittelpunkt) gefunden werden. 28
29 Pfp: parallel fp-growth for query recommendation Haoyuan Li, Yi Wang, Dong Zhang, Ming Zhang, and Edward Y. Chang Proceedings of the 2008 ACM conference on Recommender systems, 2008 Master Informatik Haw Hamburg 29 Datenanalyse mit Data Mining
30 Frequent-Pattern-Tree Algorithmus Findet in beliebig vielen Transaktionen Elemente, die häufig gemeinsam auftreten. Ablauf in 3 Schritten: Bestimmen der Häufigkeiten (Support) der Elemente in den Transaktionen. Erzeugen eines Frequent-Pattern-Trees. Analyse des FP-Trees: Bestimmen der Elemente, die häufig gemeinsam auftreten. 30
31 FP-Tree Algorithmus (2) TID Elemente mit Support >= 3 1 f, c, a, m, p 2 f, c, a, b, m 3 f, b 4 c, b, p 5 f, c, a, m, p f:4 Root c:1 c:3 b:1 b:1 a:3 p:1 m:2 b:1 p:2 m:1 31
32 FP-Tree Algorithmus (2) TID Elemente mit Support >= 3 1 f, c, a, m, p 2 f, c, a, b, m 3 f, b 4 c, b, p 5 f, c, a, m, p f:4 Root c:1 c:3 b:1 b:1 a:3 p:1 m:2 b:1 p:2 m:1 32
33 FP-Tree Algorithmus (2) TID Elemente mit Support >= 3 1 f, c, a, m, p 2 f, c, a, b, m 3 f, b 4 c, b, p 5 f, c, a, m, p f:4 Root c:1 c:3 b:1 b:1 a:3 p:1 m:2 b:1 p:2 m:1 Ergebnis: support(cp) = 3 33
34 Parallel FP-Growth auf MapReduce Arbeitet in 5 Schritten, die teilweise als MapReduce-Jobs ausgeführt werden: MapReduce 1. Partitionierung der Daten MapReduce 2. Berechnung der Häufigkeiten 3. Gruppieren der Elemente MapReduce 4. Erzeugung eines FP-Trees MapReduce 5. Aggregieren der Ergebnisse 34
35 Parallel FP-Growth auf MapReduce Im Detail Schritt 1: Partitionierung der Daten Transaktionen in der Datenbank werden auf n Rechner verteilt. Schritt 2: Häufigkeiten der Elemente berechnen (Support) Es werden mit einem MapReduce-Job die Support-Werte für alle Elemente der Transaktionen berechnet. Das Ergebnis wird in der Frequency-Liste (F-List) gespeichert. 1. Partitionierung der Daten 2. Berechnung der Häufigkeiten 3. Gruppieren der Elemente 4. Erzeugung eines FP-Trees 5. Aggregieren der Ergebnisse 35
36 Parallel FP-Growth auf MapReduce Im Detail Schritt 3: Gruppieren der Elemente Die Liste mit den Häufigkeiten der Elemente wird in Gruppen aufgeteilt. Jede Gruppe erhält eine eindeutige Gruppen-ID. Die Gruppen dienen dazu, die Transaktionen eindeutig zu partitionieren. Schritt 4: FP-Tree erzeugen Map: Jedem Mapper wird ein Teil der Transaktionen übergeben. Der Mapper ordnet die Transaktionen den Gruppen von Schritt 3 zu. Gibt Gruppe und eine Liste mit Transaktionen zurück. Reduce: Erhält eine Gruppe und mehrere der Gruppe zugeordnete Transaktionen, erzeugt einen FP-Tree und berechnet ein lokales Ergebnis für die Confidence. 36
37 Parallel FP-Growth auf MapReduce Im Detail Schritt 5: Aggregieren der Ergebnisse Die im vorherigen Schritt gewonnenen Werte für die häufig gemeinsam auftretenden Elemente werden aggregiert und zu einem Gesamtergebnis zusammengefasst. 1. Partitionierung der Daten 2. Berechnung der Häufigkeiten 3. Gruppieren der Elemente 4. Erzeugung eines FP-Trees 5. Aggregieren der Ergebnisse 37
38 Pfp: parallel fp-growth for query recommendation - Bewertung Vorteile Algorithmus benötigt nur wenige Parameter. Liefert eine andere Sichtweise auf die Daten als der Clustering- Algorithmus. Nachteile Elemente werden ausschließlich anhand der Häufigkeit selektiert, weitere Eigenschaften werden nicht betrachtet. 38
39 Ablauf Einführung Verwandte Arbeiten Fazit / Ausblick Literatur 39
40 Fazit Durch MapReduce können die Algorithmen auf beliebig viele CPU-Cores skaliert werden und auf großen Datenmengen operieren. Mahout bietet ein breites Spektrum an Algorithmen, die eingesetzt werden können, um effizient Data Mining durchzuführen. Die durch die Algorithmen gelieferten Ergebnisse müssen veranschaulicht werden, damit sie interpretiert werden können. Mögliche Probleme: Verifikation der Ergebnisse schwierig. An welcher Stelle ist die Analyse abgeschlossen? 40
41 Ausblick Projekt 1 und Projekt 2 Eine Infrastruktur wird aufgebaut, um verschiedene Data Mining Algorithmen auf Proteinsequenzen anzuwenden: MySQL Datenbank Steuerung und Visualisierung über ein Webinterface Import der Proteinsequenzen Hadoop distributed filesystem (hdfs) MapReduce MapReduce Export der Ergebnisse MapReduce... und eigens entwickelte MapReduce-Programme 41
42 Ablauf Einführung Verwandte Arbeiten Fazit Literatur 42
43 Literatur [1] Parallel K-Means Clustering Based on MapReduce Weizhong Zhao, Huifang Ma, Qing He Lecture Notes in Computer Science, Volume 5931/2009, Seiten [2] Data Mining, Concepts and Techniques Jiawei Han, Micheline Kamber, Jian Pei Morgan Kaufmann 2011 [3] Mahout in Action Sean Owen, Robin Anil, Ted Dunning, Ellen Friedman Manning 2011 [4] Hadoop in Action Chuck Lam Manning 2010 [5] MapReduce: Simplified Data Processing on Large Clusters Jeffrey Dean, Sanjay Ghemawat OSDI'04, Sixth Symposium on Operating System Design and Implementation, Dezember
44 Literatur (2) [6] Pfp: parallel fp-growth for query recommendation Haoyuan Li, Yi Wang, Dong Zhang, Ming Zhang, and Edward Y. Chang Proceedings of the 2008 ACM conference on Recommender systems, 2008, Seiten
45 Ende Vielen Dank für die Aufmerksamkeit! Fragen? 45
Ausarbeitung AW2 SS2012. Jan-Christoph Meier Data Mining in der Cloud
Ausarbeitung AW2 SS2012 Jan-Christoph Meier Data Mining in der Cloud Fakultät Technik und Informatik Department Informatik Faculty of Engineering and Computer Science Department of Computer Science Inhaltsverzeichnis
Exploration und Klassifikation von BigData
Exploration und Klassifikation von BigData Inhalt Einführung Daten Data Mining: Vorbereitungen Clustering Konvexe Hülle Fragen Google: Riesige Datenmengen (2009: Prozessieren von 24 Petabytes pro Tag)
Datenanalyse mit Data Mining
Datenanalyse mit Data Mining von Jan-Christoph Meier Hamburg, 19.01.2012 1 Ablauf Motivation Speicherung der Daten für das Data Mining Data Mining Algorithmen Ausblick auf die Masterarbeit Konferenzen
Prof. Dr.-Ing. Rainer Schmidt 1
Prof. Dr.-Ing. Rainer Schmidt 1 Business Analytics und Big Data sind Thema vieler Veröffentlichungen. Big Data wird immer häufiger bei Google als Suchbegriff verwendet. Prof. Dr.-Ing. Rainer Schmidt 2
Data Mining-Modelle und -Algorithmen
Data Mining-Modelle und -Algorithmen Data Mining-Modelle und -Algorithmen Data Mining ist ein Prozess, bei dem mehrere Komponenten i n- teragieren. Sie greifen auf Datenquellen, um diese zum Training,
Generalisierung von großen Datenbeständen am Beispiel der Gebäudegeneralisierung mit CHANGE
Institut für Kartographie und Geoinformatik Leibniz Universität Hannover Generalisierung von großen Datenbeständen am Beispiel der Gebäudegeneralisierung mit CHANGE Frank Thiemann, Thomas Globig [email protected]
Wasserfall-Ansätze zur Bildsegmentierung
Wasserfall-Ansätze zur Bildsegmentierung von Philipp Jester Seminar: Bildsegmentierung und Computer Vision 16.01.2006 Überblick 1. Problemstellung 2. Wiederholung: Wasserscheiden-Ansätze 3. Der Wasserfall-Ansatz
MapReduce und Datenbanken Thema 15: Strom bzw. Onlineverarbeitung mit MapReduce
MapReduce Jan Kristof Nidzwetzki MapReduce 1 / 17 Übersicht 1 Begriffe 2 Verschiedene Arbeiten 3 Ziele 4 DEDUCE: at the intersection of MapReduce and stream processing Beispiel 5 Beyond online aggregation:
Abamsoft Finos im Zusammenspiel mit shop to date von DATA BECKER
Abamsoft Finos im Zusammenspiel mit shop to date von DATA BECKER Abamsoft Finos in Verbindung mit der Webshopanbindung wurde speziell auf die Shop-Software shop to date von DATA BECKER abgestimmt. Mit
Software Engineering. Zur Architektur der Applikation Data Repository. Franz-Josef Elmer, Universität Basel, HS 2015
Software Engineering Zur Architektur der Applikation Data Repository Franz-Josef Elmer, Universität Basel, HS 2015 Software Engineering: Mit acht bewährten Praktiken zu gutem Code 2 Schichtarchitektur
Einführung in Hadoop
Einführung in Hadoop Inhalt / Lern-Ziele Übersicht: Basis-Architektur von Hadoop Einführung in HDFS Einführung in MapReduce Ausblick: Hadoop Ökosystem Optimierungen Versionen 10.02.2012 Prof. Dr. Christian
Neue Ansätze der Softwarequalitätssicherung
Neue Ansätze der Softwarequalitätssicherung Googles MapReduce-Framework für verteilte Berechnungen am Beispiel von Apache Hadoop Universität Paderborn Fakultät für Elektrotechnik, Informatik und Mathematik
Inhalt. 1 Einleitung AUTOMATISCHE DATENSICHERUNG AUF EINEN CLOUDSPEICHER
AUTOMATISCHE DATENSICHERUNG AUF EINEN CLOUDSPEICHER Inhalt 1 Einleitung... 1 2 Einrichtung der Aufgabe für die automatische Sicherung... 2 2.1 Die Aufgabenplanung... 2 2.2 Der erste Testlauf... 9 3 Problembehebung...
Backup der Progress Datenbank
Backup der Progress Datenbank Zeitplandienst (AT): Beachten Sie bitte: Die folgenden Aktionen können nur direkt am Server, vollzogen werden. Mit Progress 9.1 gibt es keine Möglichkeit über die Clients,
Professionelle Seminare im Bereich MS-Office
Der Name BEREICH.VERSCHIEBEN() ist etwas unglücklich gewählt. Man kann mit der Funktion Bereiche zwar verschieben, man kann Bereiche aber auch verkleinern oder vergrößern. Besser wäre es, die Funktion
Datenanalyse - Schnittstellendesign
Datenanalyse - Schnittstellendesign Der Plan ist es eine Schnittstelle zu konstruieren, die aus Future Wertpapier- und Kontotransaktionen eine Wertpapiertransaktion generiert, die bereits den aus dem Geschäft
Würfelt man dabei je genau 10 - mal eine 1, 2, 3, 4, 5 und 6, so beträgt die Anzahl. der verschiedenen Reihenfolgen, in denen man dies tun kann, 60!.
040304 Übung 9a Analysis, Abschnitt 4, Folie 8 Die Wahrscheinlichkeit, dass bei n - maliger Durchführung eines Zufallexperiments ein Ereignis A ( mit Wahrscheinlichkeit p p ( A ) ) für eine beliebige Anzahl
Data Mining: Einige Grundlagen aus der Stochastik
Data Mining: Einige Grundlagen aus der Stochastik Hagen Knaf Studiengang Angewandte Mathematik Hochschule RheinMain 21. Oktober 2015 Vorwort Das vorliegende Skript enthält eine Zusammenfassung verschiedener
BASIS Karten, WEA-Katalog, Projektierung, Objekte etc.
Das Basismodul enthält diese Elemente: 1. Projektsteuerung / -management 3. Kartenhandling-System 2. Windenergieanlagen-Katalog 4. Projektierung und objektorientierte Dateneingabe Die Projektsteuerung
Ihre Interessentendatensätze bei inobroker. 1. Interessentendatensätze
Ihre Interessentendatensätze bei inobroker Wenn Sie oder Ihre Kunden die Prozesse von inobroker nutzen, werden Interessentendatensätze erzeugt. Diese können Sie direkt über inobroker bearbeiten oder mit
Seminar Informationsintegration und Informationsqualität. Dragan Sunjka. 30. Juni 2006
Seminar Informationsintegration und Informationsqualität TU Kaiserslautern 30. Juni 2006 Gliederung Autonomie Verteilung führt zu Autonomie... Intra-Organisation: historisch Inter-Organisation: Internet
Vorlesung Text und Data Mining S9 Text Clustering. Hans Hermann Weber Univ. Erlangen, Informatik
Vorlesung Text und Data Mining S9 Text Clustering Hans Hermann Weber Univ. Erlangen, Informatik Document Clustering Überblick 1 Es gibt (sehr viele) verschiedene Verfahren für das Bilden von Gruppen Bei
Häufige Item-Mengen: die Schlüssel-Idee. Vorlesungsplan. Apriori Algorithmus. Methoden zur Verbessung der Effizienz von Apriori
Vorlesungsplan 17.10. Einleitung 24.10. Ein- und Ausgabe 31.10. Reformationstag, Einfache Regeln 7.11. Naïve Bayes, Entscheidungsbäume 14.11. Entscheidungsregeln, Assoziationsregeln 21.11. Lineare Modelle,
Lizenzierung von System Center 2012
Lizenzierung von System Center 2012 Mit den Microsoft System Center-Produkten lassen sich Endgeräte wie Server, Clients und mobile Geräte mit unterschiedlichen Betriebssystemen verwalten. Verwalten im
Hadoop. Eine Open-Source-Implementierung von MapReduce und BigTable. von Philipp Kemkes
Hadoop Eine Open-Source-Implementierung von MapReduce und BigTable von Philipp Kemkes Hadoop Framework für skalierbare, verteilt arbeitende Software Zur Verarbeitung großer Datenmengen (Terra- bis Petabyte)
Einrichten einer Festplatte mit FDISK unter Windows 95/98/98SE/Me
Einrichten einer Festplatte mit FDISK unter Windows 95/98/98SE/Me Bevor Sie die Platte zum ersten Mal benutzen können, muss sie noch partitioniert und formatiert werden! Vorher zeigt sich die Festplatte
Projektgruppe Algorithmen für die Cloud-unterstützte 3-D-Darstellung auf mobilen Endgeräten
Projektgruppe Algorithmen für die Cloud-unterstützte 3-D-Darstellung auf mobilen Endgeräten WS 2011/2012 bis SS 2012 11. Juli 2011 Benjamin Eikel Matthias Fischer Projektgruppe Algorithmen für die Cloud-unterstützte
Zeichen bei Zahlen entschlüsseln
Zeichen bei Zahlen entschlüsseln In diesem Kapitel... Verwendung des Zahlenstrahls Absolut richtige Bestimmung von absoluten Werten Operationen bei Zahlen mit Vorzeichen: Addieren, Subtrahieren, Multiplizieren
Eine Anwendung mit InstantRails 1.7
Eine Anwung mit InstantRails 1.7 Beschrieben wird das Anlegen einer einfachen Rails-Anwung, die ohne Datenbank auskommt. Schwerpunktmäßig wird auf den Zusammenhang von Controllern, Views und der zugehörigen
EXASOL Anwendertreffen 2012
EXASOL Anwendertreffen 2012 EXAPowerlytics Feature-Architektur EXAPowerlytics In-Database Analytics Map / Reduce Algorithmen Skalare Fkt. Aggregats Fkt. Analytische Fkt. Hadoop Anbindung R LUA Python 2
Virtueller Seminarordner Anleitung für die Dozentinnen und Dozenten
Virtueller Seminarordner Anleitung für die Dozentinnen und Dozenten In dem Virtuellen Seminarordner werden für die Teilnehmerinnen und Teilnehmer des Seminars alle für das Seminar wichtigen Informationen,
Suche schlecht beschriftete Bilder mit Eigenen Abfragen
Suche schlecht beschriftete Bilder mit Eigenen Abfragen Ist die Bilderdatenbank über einen längeren Zeitraum in Benutzung, so steigt die Wahrscheinlichkeit für schlecht beschriftete Bilder 1. Insbesondere
3. Stored Procedures und PL/SQL
3. Stored Procedures und PL/SQL Wenn eine Anwendung auf einer Client-Maschine läuft, wird normalerweise jede SQL-Anweisung einzeln vom Client an den Server gesandt, und jedes Ergebnistupel wird einzeln
Informatik für Schüler, Foliensatz 23 Konstruktor, String-Methode und Heldenklassse
rof. G. Kemnitz Institut für Informatik, Technische Universität Clausthal 25. Mai 2009 1/10 Informatik für Schüler, Foliensatz 23 Konstruktor, String-Methode und Heldenklassse Prof. G. Kemnitz Institut
Apache HBase. A BigTable Column Store on top of Hadoop
Apache HBase A BigTable Column Store on top of Hadoop Ich bin... Mitch Köhler Selbstständig seit 2010 Tätig als Softwareentwickler Softwarearchitekt Student an der OVGU seit Oktober 2011 Schwerpunkte Client/Server,
OPERATIONEN AUF EINER DATENBANK
Einführung 1 OPERATIONEN AUF EINER DATENBANK Ein Benutzer stellt eine Anfrage: Die Benutzer einer Datenbank können meist sowohl interaktiv als auch über Anwendungen Anfragen an eine Datenbank stellen:
Geodatenmanagement und -harmonisierung mit GeoKettle
Geodatenmanagement und -harmonisierung mit GeoKettle Agenda Kurze Vorstellung der WhereGroup Was ist GeoKettle Beschreibung des Anwendungsbeispiels GeoKettle in action Ergebnis Fazit Die WhereGroup Dienstleister
Handbuch. NAFI Online-Spezial. Kunden- / Datenverwaltung. 1. Auflage. (Stand: 24.09.2014)
Handbuch NAFI Online-Spezial 1. Auflage (Stand: 24.09.2014) Copyright 2016 by NAFI GmbH Unerlaubte Vervielfältigungen sind untersagt! Inhaltsangabe Einleitung... 3 Kundenauswahl... 3 Kunde hinzufügen...
Das große ElterngeldPlus 1x1. Alles über das ElterngeldPlus. Wer kann ElterngeldPlus beantragen? ElterngeldPlus verstehen ein paar einleitende Fakten
Das große x -4 Alles über das Wer kann beantragen? Generell kann jeder beantragen! Eltern (Mütter UND Väter), die schon während ihrer Elternzeit wieder in Teilzeit arbeiten möchten. Eltern, die während
Informatik 12 Datenbanken SQL-Einführung
Informatik 12 Datenbanken SQL-Einführung Gierhardt Vorbemerkungen Bisher haben wir Datenbanken nur über einzelne Tabellen kennen gelernt. Stehen mehrere Tabellen in gewissen Beziehungen zur Beschreibung
ACDSee Pro 2. ACDSee Pro 2 Tutorials: Übertragung von Fotos (+ Datenbank) auf einen anderen Computer. Über Metadaten und die Datenbank
Tutorials: Übertragung von Fotos (+ ) auf einen anderen Computer Export der In dieser Lektion erfahren Sie, wie Sie am effektivsten Fotos von einem Computer auf einen anderen übertragen. Wenn Sie Ihre
Fachdidaktik der Informatik 18.12.08 Jörg Depner, Kathrin Gaißer
Fachdidaktik der Informatik 18.12.08 Jörg Depner, Kathrin Gaißer Klassendiagramme Ein Klassendiagramm dient in der objektorientierten Softwareentwicklung zur Darstellung von Klassen und den Beziehungen,
Informatik 2 Labor 2 Programmieren in MATLAB Georg Richter
Informatik 2 Labor 2 Programmieren in MATLAB Georg Richter Aufgabe 3: Konto Um Geldbeträge korrekt zu verwalten, sind zwecks Vermeidung von Rundungsfehlern entweder alle Beträge in Cents umzuwandeln und
Prozessoptimierung in der Markt- und Medienforschung bei der Deutschen Welle (DW) mit Big Data Technologien. Berlin, Mai 2013
Prozessoptimierung in der Markt- und Medienforschung bei der Deutschen Welle (DW) mit Big Data Technologien Berlin, Mai 2013 The unbelievable Machine Company? 06.05.13 The unbelievable Machine Company
iphone-kontakte zu Exchange übertragen
iphone-kontakte zu Exchange übertragen Übertragen von iphone-kontakten in ein Exchange Postfach Zunächst muss das iphone an den Rechner, an dem es üblicherweise synchronisiert wird, angeschlossen werden.
IMS - Learning Design
IMS - Learning Design Ein Vortrag zum Thema Learning Design von Maayan Weiss Inhalt Was ist IMS Learning Design? Kurzer Einblick Welche Lücken gibt es im e-learning? Was hat IMS-LD zu bieten. Wie sieht
Referenzen Typo3. Blog der Internetagentur Irma Berscheid-Kimeridze Stand: Juni 2015
der Internetagentur Irma Berscheid-Kimeridze Stand: Juni 2015 Aktuelle Entwicklungen der Internetagentur Irma Berscheid-Kimeridze sollten auf der Webseite der Agentur dargestellt werden. Werkzeug der Wahl
Wir arbeiten mit Zufallszahlen
Abb. 1: Bei Kartenspielen müssen zu Beginn die Karten zufällig ausgeteilt werden. Wir arbeiten mit Zufallszahlen Jedesmal wenn ein neues Patience-Spiel gestartet wird, muss das Computerprogramm die Karten
Kontaktlos bezahlen mit Visa
Visa. Und das Leben läuft leichter Kurzanleitung für Beschäftigte im Handel Kontaktlos bezahlen mit Visa Was bedeutet kontaktloses Bezahlen? Immer mehr Kunden können heute schon kontaktlos bezahlen! Statt
Grundlagen von Python
Einführung in Python Grundlagen von Python Felix Döring, Felix Wittwer November 17, 2015 Scriptcharakter Programmierparadigmen Imperatives Programmieren Das Scoping Problem Objektorientiertes Programmieren
Zahlenwinkel: Forscherkarte 1. alleine. Zahlenwinkel: Forschertipp 1
Zahlenwinkel: Forscherkarte 1 alleine Tipp 1 Lege die Ziffern von 1 bis 9 so in den Zahlenwinkel, dass jeder Arm des Zahlenwinkels zusammengezählt das gleiche Ergebnis ergibt! Finde möglichst viele verschiedene
Hadoop aus IT-Operations Sicht Teil 1 Hadoop-Grundlagen
Hadoop aus IT-Operations Sicht Teil 1 Hadoop-Grundlagen Brownbag am Freitag, den 26.07.2013 Daniel Bäurer inovex GmbH Systems Engineer Wir nutzen Technologien, um unsere Kunden glücklich zu machen. Und
Übungen zur Softwaretechnik
Technische Universität München Fakultät für Informatik Lehrstuhl IV: Software & Systems Engineering Markus Pister, Dr. Bernhard Rumpe WS 2002/2003 Lösungsblatt 9 17. Dezember 2002 www4.in.tum.de/~rumpe/se
Ein Scan basierter Seitenangriff auf DES
Ein Scan basierter Seitenangriff auf DES Seminar Codes & Kryptographie SS04 Tobias Witteler 29.06.2004 Struktur des Vortrags 1. Einführung / Motivation 2. Struktur von DES 3. Die Attacke Begriffsklärung:
Import und Export von Übergängern
Import und Export von Übergängern SibankPLUS bietet Ihnen eine komfortable Schnittstelle, um den Wechsel der Schüler nach der Stufe 4 von der Grundschule auf eine weiterführende Schule zu verarbeiten.
Inkrementelles Backup
Inkrementelles Backup Im Gegensatz zu einer kompletten Sicherung aller Daten werden bei einer inkrementellen Sicherung immer nur die Dateien gesichert, die seit der letzten inkrementellen Sicherung neu
Java Enterprise Architekturen Willkommen in der Realität
Java Enterprise Architekturen Willkommen in der Realität Ralf Degner ([email protected]), Dr. Frank Griffel ([email protected]) Techniker Krankenkasse Häufig werden Mehrschichtarchitekturen
June 2015. Automic Hadoop Agent. Data Automation - Hadoop Integration
June 2015 Automic Hadoop Agent Data Automation - Hadoop Integration + Aufbau der Hadoop Anbindung + Was ist eigentlich ist MapReduce? + Welches sind die Stärken von Hadoop + Welches sind die Schwächen
extreme Programming (XP) Hermann Götz Sergij Paholchak Agenda Was ist XP? Grundprinzipien Der Entwicklungsprozess Die Projektplanung Praktiken Vorteile und Nachteile Wann macht XP Sinn für ein Projekt?
Kommunikations-Management
Tutorial: Wie importiere und exportiere ich Daten zwischen myfactory und Outlook? Im vorliegenden Tutorial lernen Sie, wie Sie in myfactory Daten aus Outlook importieren Daten aus myfactory nach Outlook
WinWerk. Prozess 6a Rabatt gemäss Vorjahresverbrauch. KMU Ratgeber AG. Inhaltsverzeichnis. Im Ifang 16 8307 Effretikon
WinWerk Prozess 6a Rabatt gemäss Vorjahresverbrauch 8307 Effretikon Telefon: 052-740 11 11 Telefax: 052-740 11 71 E-Mail [email protected] Internet: www.winwerk.ch Inhaltsverzeichnis 1 Ablauf der Rabattverarbeitung...
Welche Lagen können zwei Geraden (im Raum) zueinander haben? Welche Lagen kann eine Gerade bezüglich einer Ebene im Raum einnehmen?
Welche Lagen können zwei Geraden (im Raum) zueinander haben? Welche Lagen können zwei Ebenen (im Raum) zueinander haben? Welche Lagen kann eine Gerade bezüglich einer Ebene im Raum einnehmen? Wie heiÿt
4D Server v12 64-bit Version BETA VERSION
4D Server v12 64-bit Version BETA VERSION 4D Server v12 unterstützt jetzt das Windows 64-bit Betriebssystem. Hauptvorteil der 64-bit Technologie ist die rundum verbesserte Performance der Anwendungen und
ACHTUNG: Es können gpx-dateien und mit dem GP7 aufgezeichnete trc-dateien umgewandelt werden.
Track in Route umwandeln ACHTUNG: Ein Track kann nur dann in eine Route umgewandelt werden, wenn der Track auf Wegen gefahren wurde. Ein Querfeldein-Track kann nicht in eine Route umgewandelt werden, da
UpToNet DMS Posteingang
UpToNet DMS Posteingang Das papierlose Büro wird Realität Der UpToNet DMS Posteingang Frisch aus unserer Entwicklungsabteilung bekommt unser UpToNet ein neues Modul zur Seite gestellt, den UpToNet Posteingang.
Die nachfolgende Anleitung zeigt die Vorgehensweise unter Microsoft Windows Vista.
Schritt für Schritt Anleitung zur Einrichtung Ihrer neuen Festplatte Die nachfolgende Anleitung zeigt die Vorgehensweise unter Microsoft Windows Vista. Schließen Sie Ihre Festplatte an Ihrem Computer an.
Programmierkurs Java
Programmierkurs Java Dr. Dietrich Boles Aufgaben zu UE16-Rekursion (Stand 09.12.2011) Aufgabe 1: Implementieren Sie in Java ein Programm, das solange einzelne Zeichen vom Terminal einliest, bis ein #-Zeichen
AutoCAD 2007 - Dienstprogramm zur Lizenzübertragung
AutoCAD 2007 - Dienstprogramm zur Lizenzübertragung Problem: Um AutoCAD abwechselnd auf mehreren Rechnern einsetzen zu können konnte man bis AutoCAD 2000 einfach den Dongle umstecken. Seit AutoCAD 2000i
Mitarbeiterbefragung als PE- und OE-Instrument
Mitarbeiterbefragung als PE- und OE-Instrument 1. Was nützt die Mitarbeiterbefragung? Eine Mitarbeiterbefragung hat den Sinn, die Sichtweisen der im Unternehmen tätigen Menschen zu erkennen und für die
Web Services stellen eine Integrationsarchitektur dar, die die Kommunikation zwischen verschiedenen Anwendungen
9 3 Web Services 3.1 Überblick Web Services stellen eine Integrationsarchitektur dar, die die Kommunikation zwischen verschiedenen Anwendungen mit Hilfe von XML über das Internet ermöglicht (siehe Abb.
SJ OFFICE - Update 3.0
SJ OFFICE - Update 3.0 Das Update auf die vorherige Version 2.0 kostet netto Euro 75,00 für die erste Lizenz. Das Update für weitere Lizenzen kostet jeweils netto Euro 18,75 (25%). inkl. Programmsupport
Der Support für Windows Server 2003 endet endgültig alles was Ihnen dann noch bleibt ist diese Broschüre.
Der Support für Windows Server 2003 endet endgültig alles was Ihnen dann noch bleibt ist diese Broschüre. 14. Juli 2015. Der Tag, an dem in Ihrem Unternehmen das Licht ausgehen könnte. An diesem Tag stellt
Anforderungen an die HIS
Anforderungen an die HIS Zusammengefasst aus den auf IBM Software basierenden Identity Management Projekten in NRW Michael Uebel [email protected] Anforderung 1 IBM Software Group / Tivoli Ein Feld zum
WinWerk. Prozess 4 Akonto. KMU Ratgeber AG. Inhaltsverzeichnis. Im Ifang 16 8307 Effretikon
Prozess 4 Akonto WinWerk 8307 Effretikon Telefon: 052-740 11 11 Telefax: 052 740 11 71 E-Mail [email protected] Internet: www.winwerk.ch Inhaltsverzeichnis 1 Akonto... 2 1.1 Allgemein... 2 2 Akontobeträge
Zuschauer beim Berlin-Marathon
Zuschauer beim Berlin-Marathon Stefan Hougardy, Stefan Kirchner und Mariano Zelke Jedes Computerprogramm, sei es ein Betriebssystem, eine Textverarbeitung oder ein Computerspiel, ist aus einer Vielzahl
Wollen Sie einen mühelosen Direkteinstieg zum Online Shop der ÖAG? Sie sind nur einen Klick davon entfernt!
Wollen Sie einen mühelosen Direkteinstieg zum Online Shop der ÖAG? Sie sind nur einen Klick davon entfernt! Sehr geehrte(r) Geschäftspartner(in), Um Ihre Transaktionen schneller durchzuführen, bieten wir
Handbuch Offline-Abgleich
Handbuch Offline-Abgleich Inhalt Handbuch Offline-Abgleich...1 Einleitung...3 Voraussetzungen...3 Aufruf des Offline-Abgleichs...3 Übersichtsseite...3 Wahl einer Liste...3 Wahl des Offline Abgleichs...4
Auftragsbearbeitung 3.1
Auftragsbearbeitung / Bearbeitung bestehender Aufträge Automatische / manuelle Soll/Ist-Aufteilung (Stempelungen) Auf Aufträge kann über das Programm 15.2.1 gestempelt werden (PC in der Werkstatt auf dem
Anleitung Captain Logfex 2013
Anleitung Captain Logfex 2013 Inhalt: 1. Installationshinweise 2. Erste Schritte 3. Client-Installation 4. Arbeiten mit Logfex 5. Gruppenrichtlinien-Einstellungen für die Windows-Firewall 1. Installationshinweis:
Umstieg auf Microsoft Exchange in der Fakultät 02
Umstieg auf Microsoft Exchange in der Fakultät 02 Der IT-Steuerkreis der Hochschule München hat am am 26.07.12 einstimmig beschlossen an der Hochschule München ein neues Groupware-System auf der Basis
Bedienungsanleitung: Onlineverifizierung von qualifiziert signierten PDF-Dateien
Sie haben von der VR DISKONTBANK GmbH ein signiertes PDF-Dokument (i.d.r. eine Zentralregulierungsliste mit dem Status einer offiziellen Rechnung) erhalten und möchten nun die Signatur verifizieren, um
V 2 B, C, D Drinks. Möglicher Lösungsweg a) Gleichungssystem: 300x + 400 y = 520 300x + 500y = 597,5 2x3 Matrix: Energydrink 0,7 Mineralwasser 0,775,
Aufgabenpool für angewandte Mathematik / 1. Jahrgang V B, C, D Drinks Ein gastronomischer Betrieb kauft 300 Dosen Energydrinks (0,3 l) und 400 Liter Flaschen Mineralwasser und zahlt dafür 50, Euro. Einen
Wir unterscheiden folgende drei Schritte im Design paralleler Algorithmen:
1 Parallele Algorithmen Grundlagen Parallele Algorithmen Grundlagen Wir unterscheiden folgende drei Schritte im Design paralleler Algorithmen: Dekomposition eines Problems in unabhängige Teilaufgaben.
Grundlagen der Theoretischen Informatik, SoSe 2008
1. Aufgabenblatt zur Vorlesung Grundlagen der Theoretischen Informatik, SoSe 2008 (Dr. Frank Hoffmann) Lösung von Manuel Jain und Benjamin Bortfeldt Aufgabe 2 Zustandsdiagramme (6 Punkte, wird korrigiert)
Gesicherte Prozeduren
Gesicherte Prozeduren Wenn eine Anwendung auf einer Client-Maschine läuft, wird normalerweise jede SQL-Anweisung einzeln vom Client an den Server gesandt, und jedes Ergebnistupel wird einzeln zurückgeliefert.
Virtuelle Fotografie (CGI)
(CGI) Vorteile und Beispiele Das ist (k)ein Foto. Diese Abbildung ist nicht mit einer Kamera erstellt worden. Was Sie sehen basiert auf CAD-Daten unserer Kunden. Wir erzeugen damit Bilder ausschließlich
15 Optimales Kodieren
15 Optimales Kodieren Es soll ein optimaler Kodierer C(T ) entworfen werden, welcher eine Information (z.b. Text T ) mit möglichst geringer Bitanzahl eindeutig überträgt. Die Anforderungen an den optimalen
Installation von Office 365 auf einem privaten PC
Installation von Office 365 auf einem privaten PC Schülerinnen und Schüler des Stiftsgymnasiums haben die Möglichkeit, auf Ihren privaten PCs kostenlos Microsoft Office 365 zu installieren. Dieser Anleitung
peer-to-peer Dateisystem Synchronisation
Ziel Realisierungen Coda Ideen Fazit Literatur peer-to-peer Dateisystem Synchronisation Studiendepartment Informatik Hochschule für Angewandte Wissenschaften Hamburg 30. November 2007 Ziel Realisierungen
In diesem Tutorial lernen Sie, wie Sie einen Termin erfassen und verschiedene Einstellungen zu einem Termin vornehmen können.
Tutorial: Wie erfasse ich einen Termin? In diesem Tutorial lernen Sie, wie Sie einen Termin erfassen und verschiedene Einstellungen zu einem Termin vornehmen können. Neben den allgemeinen Angaben zu einem
Informatik für Schüler, Foliensatz 21 Objektorientierte Programmierung
rof. G. Kemnitz Institut für Informatik, Technische Universität Clausthal 23. April 2009 1/14 Informatik für Schüler, Foliensatz 21 Objektorientierte Programmierung Prof. G. Kemnitz Institut für Informatik,
... ... Sicherheitseinstellungen... 2 Pop-up-Fenster erlauben... 3
Browsereinstellungen Um die Know How! Lernprogramm nutzen zu können, sind bei Bedarf unterschiedliche Einstellungen in Ihren Browsern nötig. Im Folgenden finden Sie die Beschreibung für unterschiedliche
Online-Prüfungs-ABC. ABC Vertriebsberatung GmbH Bahnhofstraße 94 69151 Neckargemünd
Online-Prüfungs-ABC ABC Vertriebsberatung GmbH Bahnhofstraße 94 69151 Neckargemünd Telefon Support: 0 62 23 / 86 55 55 Telefon Vertrieb: 0 62 23 / 86 55 00 Fax: 0 62 23 / 80 55 45 (c) 2003 ABC Vertriebsberatung
Klausur WS 2006/07 Programmiersprache Java Objektorientierte Programmierung II 15. März 2007
Fachhochschule Bonn-Rhein-Sieg University of Applied Sciences Fachbereich Informatik Prof. Dr. Peter Becker Klausur WS 2006/07 Programmiersprache Java Objektorientierte Programmierung II 15. März 2007
Synchronisations- Assistent
TimePunch Synchronisations- Assistent Benutzerhandbuch Gerhard Stephan Softwareentwicklung -und Vertrieb 25.08.2011 Dokumenten Information: Dokumenten-Name Benutzerhandbuch, Synchronisations-Assistent
Lineargleichungssysteme: Additions-/ Subtraktionsverfahren
Lineargleichungssysteme: Additions-/ Subtraktionsverfahren W. Kippels 22. Februar 2014 Inhaltsverzeichnis 1 Einleitung 2 2 Lineargleichungssysteme zweiten Grades 2 3 Lineargleichungssysteme höheren als
Information Systems Engineering Seminar
Information Systems Engineering Seminar Algorithmische Prüfung der Planarität eines Graphen Marcel Stüttgen, 22.10.2012 FH AACHEN UNIVERSITY OF APPLIED SCIENCES 1 Planarität - Definition Ein Graph heißt
