Institut für Informatik Wissensmanagement in der Bioinformatik. SE Geospatial Information Retrieval WS 2008/2009 Betreuer: Prof. Dr.

Größe: px
Ab Seite anzeigen:

Download "Institut für Informatik Wissensmanagement in der Bioinformatik. SE Geospatial Information Retrieval WS 2008/2009 Betreuer: Prof. Dr."

Transkript

1 Institut für Informatik Wissensmanagement in der Bioinformatik SE Geospatial Information Retrieval WS 2008/2009 Betreuer: Prof. Dr. Ulf Leser MapReduce Stefan Bethge (508219) Astrid Rheinländer (195327)

2 Selbständigkeitserklärung Hiermit erklären wir, dass wir die vorliegende Arbeit selbständig und nur unter Zuhilfenahme der angegebenen Quellen und Hilfsmittel verfasst haben. Berlin, 31. März 2009 Stefan Bethge Astrid Rheinländer

3 Inhaltsverzeichnis 1 Einleitung Googles MapReduce Cluster-Architektur Programmiermodell Ausführung im Map-Reduce-Framework Fehlerbehandlung Performance Anwendungen und Implementationen MapReduceMerge Kritik Fazit Literatur

4 1 Einleitung Im November 2008 meldete Google Inc. im rmeneigenen Weblog, dass mit einem MapReduce-basierten, parallelen Sortierverfahren der TB-Sort-Benchmark 1 auf 68 Sekunden eingestellt werden konnte. [Cza08] Google verbesserte die bis dato beste Laufzeit einer ebenfalls parallelen Implementierung auf dem quelloenen MapReduce-Framework Hadoop 2 um den Faktor 3 bei einer vergleichbaren Gröÿe des Rechnerverbunds (Cluster). Der Eintrag im Weblog berichtete weiterhin, dass mit der MapReduce-Implementierung ein Petabyte (10 15 Datensätze à 100 Byte) innerhalb von 6 Stunden sortiert werden konnten. Das Datenvolumen entspricht ungefähr dem 12-fachen aller durch die U.S. Library of Congress archivierten Webseiten. Die Sortierung groÿer Datenmengen ist nur ein Beispiel für den Einsatz von MapReduce, weitere Anwendungsfelder liegen in der Datenextraktion, dem Machine Learning oder im Bereich statistischer Analysen. Interessante Fragestellungen sind z.b. Wie häug wird eine bestimmte URL im Web angefragt? Welche Worte werden besonders häug auf Web-Seiten erwähnt? Welche Begrie werden in Suchanfragen häug benutzt? MapReduce ist also weniger eine geschickte Implementierung eines verteilten Sortieralgorithmus', sondern vielmehr ein Programmiermodell, das die parallele Verarbeitung datenintensiver Aufgaben auf Clusternetzwerken erleichtert. Die Stärke von MapReduce liegt in der Einführung einer neuen Abstraktionsebene, die die technisch komplexen Aspekte der parallelen Programmierung wie Lastund Datenverteilung oder Fehlertoleranz innerhalb eines Frameworks vor dem Benutzer verbirgt. Ein Benutzer, der gegen die Schnittstellen des Frameworks programmiert, muss sich nur noch mit der Frage Was soll berechnet werden? und nicht mehr mit Wie erfolgt die Parallelverarbeitung? befassen. Diese Seminararbeit soll das Konzept von MapReduce erläutern. Kapitel 2 stellt das Programmiermodell und Google's MapReduce-Framework [DG04] vor. Es wird gezeigt, wie MapReduce-Programme innerhalb Googles Cluster-Architektur verarbeitet werden, darüber hinaus werden ausgewählte Aspekte zur Fehlerbehandlung und Performance-Steigerung näher betrachtet. In Kapitel 3 werden Einsatzbereiche und MapReduce-Implementierungen abseits von Google vorgestellt. Kapitel 4 behandelt die Weiterentwicklung Map-Reduce-Merge [YDHP07], die die Verarbeitung heterogener Datenmengen ermöglicht. Kapitel 5 geht auf kritische Stimmen zu MapReduce ein, in Kapitel 6 wird diese Kritik eingeordnet und um ein eigenes Fazit erweitert. 1 Der Terabyte-Sort-Benchmark wurde 1998 von Jim Gray entwickelt und zielt auf die vollständige Sortierung von Datensätzen à 100 Byte. Das erste, schnellste Sortierverfahren benötigte 1998 für diese Aufgabe 2,5 Stunden. Ab April 2009 wird der TB-Sort-Benchmark von einen 100-TB-Sort-Benchmark abgelöst [NS99]. 2 freie MapReduce-Implementation, 3

5 2 Googles MapReduce 2.1 Cluster-Architektur Googles Clusterarchitektur ist ein Vertreter von Shared-Nothing-Architekturen 3. Am treendsten lässt sich ein Google-Cluster mit Masse statt Klasse beschreiben statt aus wenigen, teuren Hochleistungsservern besteht ein Cluster aus mehreren tausend Standard-PCs. Jeder Knoten verfügt über zwei x86 Prozessoren, 4-8 GB Hauptspeicher und zwei 160 GB IDE-Festplatten. Die Knoten sind untereinander über ein Gigabit-Ethernet vernetzt, als Betriebssystem dient Linux. Das Dateisystem Google File System (GFS) ist eine Eigenentwicklung, das für die charakteristischen Information-Retrieval-Aufgaben und die Arbeit in einer Clusterarchitektur abgestimmt wurde [GGL03]. Im GFS werden die Daten verteilt in groÿen, teilweise im Gigabyte-Bereich liegenden Dateien gespeichert, die häugsten Dateioperationen sind Lesen (Read) und Anhängen (Append), eher selten nden Lösch- oder Überschreibeoperationen (Delete, Rewrite) statt. Die Dateien werden durch logische Abbildungen in MB groÿe Teile (Chunks) zerlegt und physisch verteilt auf verschiedenen Servern im Cluster gespeichert. Für jeden Chunk existieren innerhalb eines Clusters mindestens 3 Kopien, damit der Ausfall von Knoten schnell kompensiert werden kann. Darüber hinaus verfügt jeder GFS-Cluster über einen ausgezeichneten Knoten, der ausschlieÿlich Metadaten zu den Dateien (Name, Gröÿe Speicherorte und Anzahl der Chunks, aktuell zugreifende Prozesse... ) speichert und den Dateizugri koordiniert. Googles Clusterarchitektur hat im Vergleich zu Hochleistungsservern einen sehr guten Rechenleistung-pro-Dollar-Schlüssel. Sie ist leicht skalierbar und bei Ausfällen können Knoten sehr leicht ausgetauscht werden. Nachteilig ist, dass Knotenausfälle häug aus verschiedensten Gründen (Netzwerkpartitionierung, Festplattendefekte, allgemeiner Verschleiÿ) auftreten und die Bandbreite des Netzwerks einen potentiellen Bottleneck darstellen. Strategien, um mit diesen Problemen innerhalb von MapReduce umzugehen, werden in den Abschnitten 2.5 und 2.6 dargestellt. 2.2 Programmiermodell Ein MapReduce-Framework bietet dem Benutzer eine Implementationsschnittstelle mit genau zwei selbst zu denierenden Phasen, map und reduce. Map und 3 Mit Shared Nothing wird eine Architektur für verteilte Systeme bezeichnet, in der jeder Knoten zugewiesene Aufgaben autonom mittels eigener Systemkomponenten wie Prozessoren, Hauptspeicher und Festplatten bearbeiten kann. Jeder Knoten verfügt über eine eigene Kopie des auszuführenden Programms und kann Aufgaben an nicht ausgelastete, im Netzwerk erreichbare Knoten abgeben. Neben Shared Nothing unterscheidet man zwischen Shared Memory bzw. Shared Disk und Shared Everything [OV99]. 4

6 reduce stammen ursprünglich aus der funktionalen Programmierung, sie erfüllen dort folgende Aufgaben: Map wendet eine benutzerdenierte, unäre Funktion auf jedes Element der Eingabesequenz an, das Resultat ist widerum eine Sequenz. Reduce verarbeitet eine Eingabesequenz mit einer benutzerdenierten, binären Funktion zu einem einzelnen Ausgabewert. Innerhalb des MapReduce-Programmiermodells haben map und reduce eine generischere Semantik. Die Map-Phase verarbeitet eine Menge von Schlüssel-Wert- Paaren durch eine benutzerdenierte map-methode, in der die konkrete Verarbeitung eines Schlüssel-Wert-Paares speziziert wird. Das Resultat ist eine Sammlung von Schlüssel-Wert-Paaren. Daran schlieÿt die Reduce-Phase an, die auf Basis der Schlüssel durch eine benutzerdenierte reduce-methode aggregierte Endergebnisse produziert. In der Regel produziert die Reduce-Phase ein Ergebnis pro Schlüssel. Beispiel 1: (Word Count) Für eine gegebene Dokumentmenge soll die Anzahl der Vorkommen aller Wörter mit MapReduce gezählt werden. Dazu speziziert der Benutzer die map- und reduce-phasen wie folgt (Pseudocode): map(string document-id, String document){ for each word w in document do { output(w, 1); } } reduce(string word, List values) { int result = 0; for each v in values do { result = result + v; } output (word, result); } Für Word Count wird der Map-Phase eine Menge von Schlüssel-Wert-Paaren, jeweils bestehend aus einer Dokument-ID als Schlüssel und einem Dokument als Wert übergeben. map wird auf jedes Paar angewandt, d.h. ein Dokument wird sequentiell geparst und für jedes gesehene Wort wird ein Paar (Wort, 1) ausgegeben. In der Reduce-Phase werden alle (Wort, 1)-Paare anhand des Wortes gruppiert weiterverarbeitet. reduce summiert für jedes Wort die Menge der Einsen auf und gibt jeweils ein Schlüssel-Wert-Paar der Form (Wort, Anzahl) aus. Abbildung 1 zeigt die Abarbeitung des Word Count-Progamms für zwei Dokumente aus Benutzersicht. Die Details der Ausführung und Parallelisierung 5

7 bleiben transparent, das MapReduce-Framework übernimmt u. a. die Schlüsselgenerierung, die Partitionierung und Verteilung der Eingabedaten auf Mapund Reduce-Prozesse sowie die Gruppierung der Zwischenergebnisse anhand des Schlüssels. Abbildung 1. WordCount für zwei Dokumente aus Sicht des Benutzers 2.3 Ausführung im Map-Reduce-Framework In diesem Abschnitt wird die Ausführung einer MapReduce-Aufgabe am Beispiel des Word Counts erläutert. Innerhalb des Benutzerprogramms wurden map und reduce wie in Beispiel 1 speziziert, es erfolgt ein Aufruf der MapReduce-Bibliothek mit den entsprechenden Eingabedaten. Ab diesem Zeitpunkt ist das Benutzerprogramm blockiert, das Map-Reduce-Framework übernimmt die Kontrolle und arbeitet folgende Schritte sukzessive ab. Abbildung 2 liefert einen Überblick über die Ausführung innerhalb des Frameworks. 1. Das Framework partitioniert die Eingabedaten, die Dokumentmenge, in M Chunks zu je 16 bis 64 MB und generiert für jeden Chunk einen Schlüssel. Sofern die Eingabedaten im GFS vorliegen, wird die Partitionierung übersprungen, da die Chunkgröÿen des GFS mit den von MapReduce benötigten Gröÿen kompatibel sind. Zur Wahl der Chunkgröÿen s. a. Abschnitt 2.5. Alle verfügbaren Knoten im Cluster werden nun für die Ausführung der folgenden MapReduce-Aufgabe vorbereitet, der Programmcode zur Ausführung von map und reduce wird auf die entsprechenden Knoten kopiert und geladen. 2. Das Framework wählt einen Knoten zur Koordinierung von MapReduce (Master), dies ist i. d. R. der Knoten, auf dem das Programm des Benutzers gestartet wurde. Alle weiteren Knoten (Worker) werden konkrete Map- oder 6

8 Abbildung 2. Überblick über die Ausführung eines MapReduce-Programms Reduce-Berechnungen (Jobs) ausführen. Der Master verwaltet alle Jobs und verteilt diese zusammen mit Schlüssel-Chunk-Paaren auf die Worker. Die Verteilung erfolgt kostenbasiert anhand der aktuellen Auslastung eines Workers und nach der physischen Nähe der zu bearbeitenden Chunks (siehe Abschnitt 2.5). Zudem speichert der Master für jeden Job den aktuellen Status (wartend, wird ausgeführt, fertig) und Identität des zugeordneten Workers. 3. Ein Map-Worker führt nun auf jedem Schlüssel-Chunk-Paar die benutzerdenierte map-methode aus und puert die Ergebnisse zunächst im eigenen Hauptspeicher. In unserem Beispiel wird für jedes Wort ein Paar (Wort, 1) als Zwischenergebnis gepuert. 4. In regelmäÿigen Abständen werden die gepuerten Schlüssel-Wert-Paare partitioniert auf die lokalen Festplatten der Worker geschrieben. Die Partitionierung erfolgt mit einer beliebigen Partitionierungsfunktion in R Partitionen, wobei R der Anzahl der folgenden Reduce-Jobs entspricht (siehe Abschnitt 2.5). Die Partitionierung garantiert, dass innerhalb eines Reduce-Jobs alle vorliegenden Daten für einen Schlüssel verarbeitet werden. Terminiert ein Map-Job, so werden die Informationen zur lokalen Speicherung (Speicherort, Dateiname, -gröÿe) an den Masterknoten gemeldet. 7

9 5. Jedem Reduce-Worker wird pro Reduce-Job eine Partition r R zugewiesen, Informationen zu den lokalen Speicherorten von r werden durch den Master inkrementell an die Reduce-Worker gesendet. Mit Hilfe von RPCs 4 wird r von den entsprechenden Map-Workern gelesen und anschlieÿend anhand des temporären Schlüssels sortiert 5. Im Fall des Word Counts erfolgt die Sortierung auf Basis der Worte. 6. Der Reduce-Worker iteriert über die sortierten Eingabepaare und wendet reduce auf jedes Eingabepaar an, für den Word Count wird für jeden Term die Liste der Einsen aufsummiert. Pro Partition legt der Reduce-Worker im GFS eine Ausgabedatei an und die Paare (Term, Summe) werden jeweils an diese Datei angehängt. 7. Nachdem alle Map- und Reduce-Jobs terminiert haben, weckt der Master das aufrufende Programm wieder auf. Der Benutzer hat nun Zugri auf die Ausgabe und kann diese weiter verarbeiten. 2.4 Fehlerbehandlung Sowohl [Cza08] als auch [DG08] erwähnen, dass Fehler oder Knotenausfälle bei MapReduce sehr häug auftreten, so ist z.b. während des Petabyte-Sortierexperiments in jedem Durchlauf mindestens ein Knoten ausgefallen. An dieser Stelle werden die wichtigsten Fehlerfälle und deren Behandlung innerhalb des MapReduce-Frameworks vorgestellt. Ausfall des Masterknotens: Der Master ist innerhalb von MapReduce der Single Point of Failure, da bei dessen Ausfall die Jobs zwischen den Map- und Reduce-Workern nicht mehr koordiniert werden können. In diesem Fall bricht die Abarbeitung ab und der Benutzer muss MapReduce erneut starten. Ein alternativer Ausführungsmodus des Frameworks sieht vor, dass der Master regelmäÿig Sicherungspunkte seiner Datenstrukturen in das globale GFS schreibt. Die Berechnung kann im Fehlerfall dann ab dem letzten Sicherungspunkt fortgesetzt werden. Master-Fehler sind i. A. unkritisch, da MapReduce meist im Rahmen analytischer Aufgaben eingesetzt wird. Ausfall eines Workers: Der Ausfall von Workern wird vom Master regelmäÿig durch eine ping-basierte 6 4 RPC (Remote Procedure Call) bezeichnet eine Technik zur Realisierung von Interprozesskommunikation, die den Aufruf von Funktionen in anderen Adressräumen ermöglicht. Die Semantik für den Empfang von Nachrichten in MapReduce entspricht At Most Once [BN97]. 5 Eine Sortierung ist immer dann notwendig, wenn pro Reduce-Job mehrere Schlüssel verarbeitet werden. 6 Ping überprüft die Erreichbarkeit von Hosts im Netzwerk. Dazu wird ein ICMP- Echo-Request-Paket an die Adresse des Zielhost gesendet, der Host antwortet mit 8

10 Routine überprüft. Falls ein Worker A nicht innerhalb einer denierten Zeitbeschränkung antwortet, erhält er den Status nicht verfügbar. Alle zu A zugewiesenen Jobs mit Status wartend oder ausführend werden erneut in die Warteschlange der Jobs eingereiht und auf andere Worker verteilt. Gleiches gilt für Map-Jobs, die A bereits abgeschlossen hat, da die Zwischenergebnisse nur auf den lokalen Festplatten von A und nicht im GFS verfügbar sind. Abgeschlossene Reduce-Jobs müssen dagegen nicht erneut ausgeführt werden, da deren Ergebnisse bereits im GFS vorliegen. Fehler im Programmcode des Benutzers: Die Fehlerlokalisierung und dessen Beseitigung kann in verteilten Umgebungen recht aufwendig und kostenintensiv werden. Für diesen Zweck existiert ein optionaler Ausführungsmodus, in dem die Map- und Reduce-Phasen sequentiell auf einer einzelnen Maschine ausführt werden können. Bei Fehlern in Fremdbibliotheken oder bei problematischen Datensätzen, die einen Programmabbruch provozieren, werden diese Teile der Eingabe registriert und beim nächsten Bearbeitungsversuch in MapReduce übersprungen. 2.5 Performance Backup-Tasks: Wie bereits erwähnt kommt es häuger zu Problemen bei einigen der benutzten Knoten. So werden Festplatten fehlerhaft und es werden automatische Fehlerkorrekturen nötig oder es müssen fehlerhafte Sektoren übersprungen werden und der Zugri wird stark verlangsamt. Andere Prozesse oder MapReduce-Tasks können parallel auf einer Maschine laufen und so die verfügbaren Resourcen einschränken. Daher benötigen Tasks auf diesen Knoten wesentlich länger als vergleichbare Tasks auf anderen Knoten. Um diesem natürlichen Problem entgegen zu wirken, werden Backup-Tasks benutzt: Nachdem ein überwiegender Teil der normalen Tasks abgeschlossen ist, betrachtet der Masterknoten die verbleibenden Knoten als Stragglers, also Nachzügler, die den gesamten MapReduce-Lauf aufhalten. Die auf diesen Maschinen bearbeiteten Tasks werden weiteren, bereits fertigen Knoten ein weiteres Mal zugeordnet und die Ausgabe des jeweils zuerst fertigen Tasks wird weitergeleitet, der andere Task abgebrochen. Dadurch lässt sich der Zeitaufwand um etwa 30% verringern [DG08]. Locality: Um Netzwerkbandbreite einzusparen, lässt sich ausnutzen, dass das GFS alle Daten über die lokalen Festplatten der Worker verteilt, üblicherweise drei Kopien auf verschiedene Maschinen. Der Master versucht nun, die Tasks auf genau die Worker zu verteilen, auf deren Festplatten die jeweils benötigten Eingabedaten vorliegen. Ist dies nicht möglich, wird versucht, zumindest einen Worker in der Nähe, also im selben Rack bzw. am selben Switch, auszuwählen. So ist es einem ICMP-Echo-Reply-Paket. Falls das Ziel nicht erreichbar ist, antwortet der zuständige Router mit Host unerreichbar. 9

11 in vielen Fällen nicht nötig, Eingabedaten erneut über das Netzwerk zu übertragen. In Abbildung 3 ist ein Beispielfall dargestellt. Task a, b und c werden jeweils auf Worker 1, 2 bzw. 3 verteilt, so dass die notwendigen Daten jeweils lokal vorliegen. Es gibt jedoch einen weiteren Task, der auf den Daten c operieren soll. Im Beispiel sind keine weiteren Worker vorhanden, die die Daten c lokal gespeichert haben, daher wird der Task einem freiem Worker in der Nähe der Daten zugeordnet, Worker 3. Dieser bezieht die nötigen Daten über eine Netzwerkverbindung. Abbildung 3. Beispiel für eine Locality-Optimierung Anzahl der Map- und Reduce-Jobs: Die Anzahl der Map- und Reduce-Jobs sollte in jedem Fall gröÿer sein als die Anzahl der involvierten Worker. Jeder Worker bearbeitet dann viele kleine anstelle weniger groÿer Aufgaben. Dies erweist sich als vorteilhaft bei der dynamischen Lastbalancierung und bei Worker-Ausfällen. Fällt ein Worker aus, so erzeugen die vielen kleinen anhängigen Jobs auf den Ersatzworkern wenig zusätzliche Last. Die Anzahl der Map-Jobs M hängt von der Gröÿe der Eingabedaten und der Größe der Eingabedaten Chunkgröÿe ab und ergibt sich aus M = Chunkgröße. Die Anzahl der Reduce-Jobs R beträgt ein kleines Vielfaches der Anzahl der involvierten Worker. Dean und Ghemawat beschreiben M = und R = bei Workern als typische Gröÿenordnungen für MapReduce-Aufgaben [DG04]. 10

12 3 Anwendungen und Implementationen MapReduce ist insbesondere für Datamining, lexikalische Analysen, maschinelles Übersetzen und Lernen und für Tokenerstellung und Indexierung entwickelt worden. Neben diesen Anwendungen, wie sie insbesondere bei der Verarbeitung von riesigen Datenmengen bei Google, Yahoo oder Anderen aufkommen, wird MapReduce auch verstärkt in weniger pragmatischen Bereichen eingesetzt. Darunter benden sich wissenschaftliche Anwendungen in der Teilchenphysik (HEP, k-means Clustering) und Astronomie [EP08]. Sehr ähnlich der Implementation von Google ist Hadoop aufgebaut, welches, anders als Googles Implementation, unter einer Open-Source-Lizenz verfügbar ist. Es wird als Top-Level-Projekt bei der Apache Software Foundation entwickelt und wird maÿgeblich von Yahoo für sehr ähnliche Aufgaben wie MapReduce bei Google eingesetzt. Google selbst hat bereits bemerkt, dass es unvorteilhaft ist, map- und reduce-funktionen direkt anzugeben und forscht daher daran, parallele Analyseprobleme mit einer höhen Programmiersprache zu lösen, welche unter dem Namen Sawzall entwickelt wird. 7 Auch für für Hadoop wird ein ähnliches Projekt unter dem Namen Pig 8 entwickelt. Weiterhin werden verschiedene Datenbanksysteme um MapReduce zur parallelen Datenverarbeitung ergänzt oder auch neue, teils relationale, Systeme auf MapReduce aufgebaut. CouchDB 9 ist ein noch sehr junges Projekt, das ein dokumentbasiertes Datenbanksystem implementiert, welches für parallele Berechnung automatisch MapReduce benutzt. Die beiden kommerziellen, parallelen Datenbanksysteme Greenplum 10 und Aster Data ncluster 11 wurden erst kürzlich um eine jeweils proprietäre MapReduce-Implementation ergänzt. Anders als bei CouchDB müssen diese bei beiden direkt durch Angeben der Map- und Reduce-Funktionen benutzt werden. Andere Open-Source-Projekte sind Hive 12, welches Hadoop um eine SQL-ähnliche Sprache erweitert und Cloudbase 13, welches Hadoop um ANSI-kompatibles SQL erweitert, so dass es kompatibel zu bestehenden Werkzeugen z.b. für Datamining bleibt. 4 MapReduceMerge Mit dem von Google vorgestellten MapReduce lassen sich viele Probleme ezient und einfach parallel implementieren. Insbesondere die Verarbeitung von in

13 Beziehung stehenden, heterogenen Datensätzen, wie sie z.b. bei Algorithmen für die relationalen Algebra vorkommen, werden jedoch durch die Beschränkung auf Map- und Reduce-Funktionen sehr erschwert. Ein Paar von Map- und Reduce- Funktionen ist jeweils immer nur auf ein bestimmtes Datenformat angepasst, erwartet also bestimmt Eingabedaten und berechnet bestimmte Ausgabedaten in einer Art Schema. MapReduceMerge ist eine Erweiterung von MapReduce, die genau aus diesem Grund eine weitere Merge-Phase einführt [YDHP07]. Dabei werden die nach Schlüsseln gruppierten Wert-Paare zweier unabhängiger Paare von Map- und Reduce-Funktionen einer ebenfalls vom Benutzer spezizierten Merge-Funktion übergeben und zusammen verarbeitet. normales MapReduce: map : (k 1, v 1 ) [(k 2, v 2 )] reduce : (k 2, [v 2 ]) [v 3 ] MapReduceMerge: 2 Sets von map und reduce: map 1 : (k 1, v 1 ) α [(k 2, v 2 )] α reduce 1 : (k 2, [v 2 ]) α (k 2, [v3]) α map 2 : (k 4, v 4 ) β [(k 5, v 5 )] β reduce 2 : (k 5, [v 5 ]) β (k 5, [v 6 ]) β merge der Ausgaben: merge : ((k 2, [v 3 ]) α, (k 5, [v 6 ]) β ) [(k 6, v 7 )] γ α, β und γ bezeichnen das Format der jeweiligen Zwischenwerte. Die beiden Stränge α und β werden beim Mergen in das Format γ überführt. In Abbildung 4 ist als typisches Beispiel ein Sort-Merge-Join dargestellt, der allein mit MapReduce schwierig umzusetzen ist. Angestellte und Abteilungen werden zuerst einzeln verarbeitet um jeweils Boni zu berechnen. Die linke Seite wird aufsummiert und Bonusanpassungen für die Abteilung bestimmt. Die Datensätze haben dabei zwei unterschiedliche Formate. Das Framework sortiert die Reduce-Ausgaben anhand ihrer Schlüsselnamen. Der im Normalfall verwendete Hash-Partitionierungsalgorithmus von MapReduceMerge ist für die Sortierung ungeeignet und wird durch eine einfachen Bereichspartitionierung ersetzt. Im Merge-Schritt ndet auch der Merge-Schritt des Algorithmus statt. Die Merge- Funktion erhält Reduce-Ausgaben über den gleichen Schlüsselbereich, iteriert über diese verschränkt und berechnet dabei die endgültigen Boni. Für die Umsetzung relationalen Algebra sind neben einem Join-Algorithmus weitere Operatoren umzusetzen: Projektion: eine einfache Map-Funktion, die jedes Tupel auf ein Schema projiziert 12

14 Abbildung 4. Sort-Merge Join mit MapReduceMerge[YDHP07] Selektion: lternde Map-, Reduce- oder Merge-Funktion, je nach Selektionsbedingung Kartesisches Produkt: die Merge-Funktion bekommt eine Partition des ersten Reducers und alle Partitionen des zweiten Reducers und iteriert dann verschachtelt über beide Vereinigung: beide Mapper haben die gleiche Bereichs-Partitionierung, die Merge-Funktion erhält von beiden Reducern Schlüssel über den gleichen Wertebereich um darin Duplikate zu entfernen Dierenz: ähnlich wie Vereinigung, die Merge-Funktion iteriert über sortierte Eingaben und entfernt gleiche Werten 5 Kritik David J. DeWitt und Michael Stonebreaker veröentlichten einen Blogeintrag [DS08] über MapReduce und die Ansichten der Autoren. MapReduce wird darin vor allem im Vergleich mit relationalen Datenbankmanagementsystemen betrachtet und dahingehend als a giant step backwards 13

15 bezeichnet. Ein MapReduce-Programmierer schreibe ähnlich wie in den 1970ern ein Codasyl-Programmierer Algorithmen für die direkte Datenmanipulation, was ähnlich wie das Benutzen von Assembler statt einer Hochsprache sei. MapReduce besitze im Gegensatz zu vielen relationalen Datenbanksystemen keine Schema- Unterstützung und damit auch keine Optimierungen wie B-Trees oder Indizes. MapReduce sollte zumindest ursprünglich jedoch nicht zur Datenspeicherung oder Archivierung genutzt werden sondern möglichst schnell sehr groÿe Datenmengen verarbeiten und dabei sehr hohe Ausfallwahrscheinlichkeiten tolerieren. Andererseits arbeitet MapReduce anders als eine benutzerdenierte Funktion (User Dened Function, UDF ) in einem Datenbanksystem in der Tat ohne Indizes, es werden immer alle Daten verarbeitet. Eine UDF kann auch einen kleineren relevanten Teil der Daten verarbeiten. Bei einem MapReduce-System muss also von Hand dafür gesorgt werden, dass die Eingabedaten relevant sind. Die Neuartigkeit der Verfahrensweise wird angezeifelt. Neben einigen wissenschaftlichen Veröentlichungen, u. a. auch von DeWitt selbst, wird Teradata als kommerzielles System genannt, das alle Prinzipien von MapReduce bereits seit 20 Jahren implementiert. Dabei beachten die Autoren jedoch nicht, dass MapReduce hauptsächlich wegen der zu geringen Fehlertoleranz bestehender paralleler Systeme entwickelt wurde, heben die gute Fehlertoleranz an anderer Stelle jedoch hervor. Zudem bemängeln DeWitt und Stonebreaker das Fehlen grundlegender relationaler Datenbankkonzepte wie Transaktionen, referentielle Integrität und Sichten. Diese sind jedoch für ein ausschlieÿlich verarbeitendes System gänzlich unerheblich bzw. nicht anwendbar. Insbesondere bei der Analyse von Daten werden diese meist sequentiell gelesen und es müssen alle Eingabedaten verarbeitet werden. Ein Groÿteil der Kritikpunkte ist so möglicherweise viel mehr als Wegweiser für Projekte geeignet, die auf MapReduce aufbauen und damit parallele Datenbankmanagementsysteme implementieren. 6 Fazit MapReduce ist kein paralleles DBMS, ist aber zur Datenverarbeitung in einigen Bereichen aufgrund von hoher Performanz und Skalierbarkeit besser geeignet. Zudem ist es durch die hohe Fehlertoleranz möglich, sehr viel günstigere Knoten in einem Rechnerverbund zu nutzen und dadurch Kosten zu sparen. Im Gegensatz zu existierenden parallelen Systemen ist die Installation und Wartung vereinfacht. Für Firmen wie Google und Yahoo hat sich MapReduce oenbar bewährt. In Zukunft werden bereits begonnene auf MapReduce aufbauende Entwicklungen wie Pig, Sawzall, Cloudbase und andere in der Praxis eingesetzt werden und es muss sich herausstellen, welche Stärken sie gegenüber herkömmlichen parallelen System behaupten können. 14

16 7 Literatur [BN97] Philip A. Bernstein and Eric Newcomer. Principles of transaction processing. Morgan Kaufmann, 5 edition, [Cza08] Grzegorz Czajkowski. Sorting 1PB with MapReduce, November [DG04] Jerey Dean and Sanjay Ghemawat. MapReduce: simplied data processing on large clusters. In Proceedings of the 6th conference on Symposium on Opearting Systems Design & Implementation - Volume 6, San Francisco, [DG08] CA, USENIX Association. Jerey Dean and Sanjay Ghemawat. MapReduce: simplied data processing on large clusters. Communications of the ACM, 51(1):107113, [DS08] David DeWitt and Michael Stonebreaker. MapReduce: a major step backwards - the database column [EP08] Jaliya Ekanayake and Shrideep Pallickara. Mapreduce for data intensive scientic analysis, [GGL03] Sanjay Ghemawat, Howard Gobio, and Shun-Tak Leung. The google le system. SIGOPS Operating Systems Review, 37(5):2943, [NS99] Chris Nyberg and Mehul Shah. Sort benchmark home page [OV99] M. Tamer Özsu and Patrick Valduriez. Principles of distributed database systems. Prentice Hall, [YDHP07] Hung-Chih Yang, Ali Dasdan, Ruey-Lung Hsiao, and D. Scott Parker. Mapreduce-merge: simplied relational data processing on large clusters. In Proceedings of the 2007 ACM SIGMOD international conference on Management of data, pages , Beijing, China, ACM. 15

MapReduce. www.kit.edu. Johann Volz. IPD Snelting, Lehrstuhl Programmierparadigmen

MapReduce. www.kit.edu. Johann Volz. IPD Snelting, Lehrstuhl Programmierparadigmen MapReduce Johann Volz IPD Snelting, Lehrstuhl Programmierparadigmen KIT Universität des Landes Baden-Württemberg und nationales Großforschungszentrum in der Helmholtz-Gemeinschaft www.kit.edu Wozu MapReduce?

Mehr

IBM Software Demos Tivoli Provisioning Manager for OS Deployment

IBM Software Demos Tivoli Provisioning Manager for OS Deployment Für viele Unternehmen steht ein Wechsel zu Microsoft Windows Vista an. Doch auch für gut vorbereitete Unternehmen ist der Übergang zu einem neuen Betriebssystem stets ein Wagnis. ist eine benutzerfreundliche,

Mehr

Fachbericht zum Thema: Anforderungen an ein Datenbanksystem

Fachbericht zum Thema: Anforderungen an ein Datenbanksystem Fachbericht zum Thema: Anforderungen an ein Datenbanksystem von André Franken 1 Inhaltsverzeichnis 1 Inhaltsverzeichnis 1 2 Einführung 2 2.1 Gründe für den Einsatz von DB-Systemen 2 2.2 Definition: Datenbank

Mehr

Binäre Bäume. 1. Allgemeines. 2. Funktionsweise. 2.1 Eintragen

Binäre Bäume. 1. Allgemeines. 2. Funktionsweise. 2.1 Eintragen Binäre Bäume 1. Allgemeines Binäre Bäume werden grundsätzlich verwendet, um Zahlen der Größe nach, oder Wörter dem Alphabet nach zu sortieren. Dem einfacheren Verständnis zu Liebe werde ich mich hier besonders

Mehr

OPERATIONEN AUF EINER DATENBANK

OPERATIONEN AUF EINER DATENBANK Einführung 1 OPERATIONEN AUF EINER DATENBANK Ein Benutzer stellt eine Anfrage: Die Benutzer einer Datenbank können meist sowohl interaktiv als auch über Anwendungen Anfragen an eine Datenbank stellen:

Mehr

Anleitung über den Umgang mit Schildern

Anleitung über den Umgang mit Schildern Anleitung über den Umgang mit Schildern -Vorwort -Wo bekommt man Schilder? -Wo und wie speichert man die Schilder? -Wie füge ich die Schilder in meinen Track ein? -Welche Bauteile kann man noch für Schilder

Mehr

Einrichten einer Festplatte mit FDISK unter Windows 95/98/98SE/Me

Einrichten einer Festplatte mit FDISK unter Windows 95/98/98SE/Me Einrichten einer Festplatte mit FDISK unter Windows 95/98/98SE/Me Bevor Sie die Platte zum ersten Mal benutzen können, muss sie noch partitioniert und formatiert werden! Vorher zeigt sich die Festplatte

Mehr

Kapiteltests zum Leitprogramm Binäre Suchbäume

Kapiteltests zum Leitprogramm Binäre Suchbäume Kapiteltests zum Leitprogramm Binäre Suchbäume Björn Steffen Timur Erdag überarbeitet von Christina Class Binäre Suchbäume Kapiteltests für das ETH-Leitprogramm Adressaten und Institutionen Das Leitprogramm

Mehr

Outlook. sysplus.ch outlook - mail-grundlagen Seite 1/8. Mail-Grundlagen. Posteingang

Outlook. sysplus.ch outlook - mail-grundlagen Seite 1/8. Mail-Grundlagen. Posteingang sysplus.ch outlook - mail-grundlagen Seite 1/8 Outlook Mail-Grundlagen Posteingang Es gibt verschiedene Möglichkeiten, um zum Posteingang zu gelangen. Man kann links im Outlook-Fenster auf die Schaltfläche

Mehr

Theoretische Informatik SS 04 Übung 1

Theoretische Informatik SS 04 Übung 1 Theoretische Informatik SS 04 Übung 1 Aufgabe 1 Es gibt verschiedene Möglichkeiten, eine natürliche Zahl n zu codieren. In der unären Codierung hat man nur ein Alphabet mit einem Zeichen - sagen wir die

Mehr

Lokale Installation von DotNetNuke 4 ohne IIS

Lokale Installation von DotNetNuke 4 ohne IIS Lokale Installation von DotNetNuke 4 ohne IIS ITM GmbH Wankelstr. 14 70563 Stuttgart http://www.itm-consulting.de Benjamin Hermann hermann@itm-consulting.de 12.12.2006 Agenda Benötigte Komponenten Installation

Mehr

SDD System Design Document

SDD System Design Document SDD Software Konstruktion WS01/02 Gruppe 4 1. Einleitung Das vorliegende Dokument richtet sich vor allem an die Entwickler, aber auch an den Kunden, der das enstehende System verwenden wird. Es soll einen

Mehr

Handbuch zur Anlage von Turnieren auf der NÖEV-Homepage

Handbuch zur Anlage von Turnieren auf der NÖEV-Homepage Handbuch zur Anlage von Turnieren auf der NÖEV-Homepage Inhaltsverzeichnis 1. Anmeldung... 2 1.1 Startbildschirm... 3 2. Die PDF-Dateien hochladen... 4 2.1 Neue PDF-Datei erstellen... 5 3. Obelix-Datei

Mehr

Robot Karol für Delphi

Robot Karol für Delphi Robot Karol für Delphi Reinhard Nitzsche, OSZ Handel I Version 0.1 vom 24. Januar 2003 Zusammenfassung Nach der Einführung in die (variablenfreie) Programmierung mit Robot Karol von Freiberger und Krško

Mehr

Übung: Verwendung von Java-Threads

Übung: Verwendung von Java-Threads Übung: Verwendung von Java-Threads Ziel der Übung: Diese Übung dient dazu, den Umgang mit Threads in der Programmiersprache Java kennenzulernen. Ein einfaches Java-Programm, das Threads nutzt, soll zum

Mehr

Anleitung mtan (SMS-Authentisierung) mit SSLVPN.TG.CH

Anleitung mtan (SMS-Authentisierung) mit SSLVPN.TG.CH Amt für Informatik Anleitung mtan (SMS-Authentisierung) mit SSLVPN.TG.CH Anleitung vom 12. September 2009 Version: 1.0 Ersteller: Ressort Sicherheit Zielgruppe: Benutzer von SSLVPN.TG.CH Kurzbeschreib:

Mehr

Lineargleichungssysteme: Additions-/ Subtraktionsverfahren

Lineargleichungssysteme: Additions-/ Subtraktionsverfahren Lineargleichungssysteme: Additions-/ Subtraktionsverfahren W. Kippels 22. Februar 2014 Inhaltsverzeichnis 1 Einleitung 2 2 Lineargleichungssysteme zweiten Grades 2 3 Lineargleichungssysteme höheren als

Mehr

Neue Ansätze der Softwarequalitätssicherung

Neue Ansätze der Softwarequalitätssicherung Neue Ansätze der Softwarequalitätssicherung Googles MapReduce-Framework für verteilte Berechnungen am Beispiel von Apache Hadoop Universität Paderborn Fakultät für Elektrotechnik, Informatik und Mathematik

Mehr

KURZANLEITUNG CLOUD OBJECT STORAGE

KURZANLEITUNG CLOUD OBJECT STORAGE KURZANLEITUNG CLOUD OBJECT STORAGE Version 1.12 01.07.2014 SEITE _ 2 INHALTSVERZEICHNIS 1. Einleitung... Seite 03 2. Anmelden am Cloud&Heat Dashboard... Seite 04 3. Anlegen eines Containers... Seite 05

Mehr

Professionelle Seminare im Bereich MS-Office

Professionelle Seminare im Bereich MS-Office Der Name BEREICH.VERSCHIEBEN() ist etwas unglücklich gewählt. Man kann mit der Funktion Bereiche zwar verschieben, man kann Bereiche aber auch verkleinern oder vergrößern. Besser wäre es, die Funktion

Mehr

Er musste so eingerichtet werden, dass das D-Laufwerk auf das E-Laufwerk gespiegelt

Er musste so eingerichtet werden, dass das D-Laufwerk auf das E-Laufwerk gespiegelt Inhaltsverzeichnis Aufgabe... 1 Allgemein... 1 Active Directory... 1 Konfiguration... 2 Benutzer erstellen... 3 Eigenes Verzeichnis erstellen... 3 Benutzerkonto erstellen... 3 Profil einrichten... 5 Berechtigungen

Mehr

Web Services stellen eine Integrationsarchitektur dar, die die Kommunikation zwischen verschiedenen Anwendungen

Web Services stellen eine Integrationsarchitektur dar, die die Kommunikation zwischen verschiedenen Anwendungen 9 3 Web Services 3.1 Überblick Web Services stellen eine Integrationsarchitektur dar, die die Kommunikation zwischen verschiedenen Anwendungen mit Hilfe von XML über das Internet ermöglicht (siehe Abb.

Mehr

Abamsoft Finos im Zusammenspiel mit shop to date von DATA BECKER

Abamsoft Finos im Zusammenspiel mit shop to date von DATA BECKER Abamsoft Finos im Zusammenspiel mit shop to date von DATA BECKER Abamsoft Finos in Verbindung mit der Webshopanbindung wurde speziell auf die Shop-Software shop to date von DATA BECKER abgestimmt. Mit

Mehr

Einfügen von Bildern innerhalb eines Beitrages

Einfügen von Bildern innerhalb eines Beitrages Version 1.2 Einfügen von Bildern innerhalb eines Beitrages Um eigene Bilder ins Forum einzufügen, gibt es zwei Möglichkeiten. 1.) Ein Bild vom eigenem PC wird auf den Webspace von Baue-die-Bismarck.de

Mehr

Objektorientierte Programmierung für Anfänger am Beispiel PHP

Objektorientierte Programmierung für Anfänger am Beispiel PHP Objektorientierte Programmierung für Anfänger am Beispiel PHP Johannes Mittendorfer http://jmittendorfer.hostingsociety.com 19. August 2012 Abstract Dieses Dokument soll die Vorteile der objektorientierten

Mehr

Speicher in der Cloud

Speicher in der Cloud Speicher in der Cloud Kostenbremse, Sicherheitsrisiko oder Basis für die unternehmensweite Kollaboration? von Cornelius Höchel-Winter 2013 ComConsult Research GmbH, Aachen 3 SYNCHRONISATION TEUFELSZEUG

Mehr

Installation SQL- Server 2012 Single Node

Installation SQL- Server 2012 Single Node Installation SQL- Server 2012 Single Node Dies ist eine Installationsanleitung für den neuen SQL Server 2012. Es beschreibt eine Single Node Installation auf einem virtuellen Windows Server 2008 R2 mit

Mehr

Übungen zur Softwaretechnik

Übungen zur Softwaretechnik Technische Universität München Fakultät für Informatik Lehrstuhl IV: Software & Systems Engineering Markus Pister, Dr. Bernhard Rumpe WS 2002/2003 Lösungsblatt 9 17. Dezember 2002 www4.in.tum.de/~rumpe/se

Mehr

1 topologisches Sortieren

1 topologisches Sortieren Wolfgang Hönig / Andreas Ecke WS 09/0 topologisches Sortieren. Überblick. Solange noch Knoten vorhanden: a) Suche Knoten v, zu dem keine Kante führt (Falls nicht vorhanden keine topologische Sortierung

Mehr

Zuschauer beim Berlin-Marathon

Zuschauer beim Berlin-Marathon Zuschauer beim Berlin-Marathon Stefan Hougardy, Stefan Kirchner und Mariano Zelke Jedes Computerprogramm, sei es ein Betriebssystem, eine Textverarbeitung oder ein Computerspiel, ist aus einer Vielzahl

Mehr

Fragenkatalog zum Kurs 1666 (Datenbanken in Rechnernetzen) Kurstext von SS 96

Fragenkatalog zum Kurs 1666 (Datenbanken in Rechnernetzen) Kurstext von SS 96 Fragenkatalog zum Kurs 1666 (Datenbanken in Rechnernetzen) Kurstext von SS 96 Dieser Fragenkatalog wurde aufgrund das Basistextes und zum Teil aus den Prüfungsprotokollen erstellt, um sich auf mögliche

Mehr

Wichtige Hinweise zu den neuen Orientierungshilfen der Architekten-/Objektplanerverträge

Wichtige Hinweise zu den neuen Orientierungshilfen der Architekten-/Objektplanerverträge Wichtige Hinweise zu den neuen Orientierungshilfen der Architekten-/Objektplanerverträge Ab der Version forma 5.5 handelt es sich bei den Orientierungshilfen der Architekten-/Objektplanerverträge nicht

Mehr

Step by Step Webserver unter Windows Server 2003. von Christian Bartl

Step by Step Webserver unter Windows Server 2003. von Christian Bartl Step by Step Webserver unter Windows Server 2003 von Webserver unter Windows Server 2003 Um den WWW-Server-Dienst IIS (Internet Information Service) zu nutzen muss dieser zunächst installiert werden (wird

Mehr

mysql - Clients MySQL - Abfragen eine serverbasierenden Datenbank

mysql - Clients MySQL - Abfragen eine serverbasierenden Datenbank mysql - Clients MySQL - Abfragen eine serverbasierenden Datenbank In den ersten beiden Abschnitten (rbanken1.pdf und rbanken2.pdf) haben wir uns mit am Ende mysql beschäftigt und kennengelernt, wie man

Mehr

Agile Vorgehensmodelle in der Softwareentwicklung: Scrum

Agile Vorgehensmodelle in der Softwareentwicklung: Scrum C A R L V O N O S S I E T Z K Y Agile Vorgehensmodelle in der Softwareentwicklung: Scrum Johannes Diemke Vortrag im Rahmen der Projektgruppe Oldenburger Robot Soccer Team im Wintersemester 2009/2010 Was

Mehr

Hilfe zur Dokumentenverwaltung

Hilfe zur Dokumentenverwaltung Hilfe zur Dokumentenverwaltung Die Dokumentenverwaltung von Coffee-CRM ist sehr mächtig und umfangreich, aber keine Angst die Bedienung ist kinderleicht. Im Gegensatz zur Foto Galeria können Dokumente

Mehr

SICHERN DER FAVORITEN

SICHERN DER FAVORITEN Seite 1 von 7 SICHERN DER FAVORITEN Eine Anleitung zum Sichern der eigenen Favoriten zur Verfügung gestellt durch: ZID Dezentrale Systeme März 2010 Seite 2 von 7 Für die Datensicherheit ist bekanntlich

Mehr

! " # $ " % & Nicki Wruck worldwidewruck 08.02.2006

!  # $  % & Nicki Wruck worldwidewruck 08.02.2006 !"# $ " %& Nicki Wruck worldwidewruck 08.02.2006 Wer kennt die Problematik nicht? Die.pst Datei von Outlook wird unübersichtlich groß, das Starten und Beenden dauert immer länger. Hat man dann noch die.pst

Mehr

Web-Kürzel. Krishna Tateneni Yves Arrouye Deutsche Übersetzung: Stefan Winter

Web-Kürzel. Krishna Tateneni Yves Arrouye Deutsche Übersetzung: Stefan Winter Krishna Tateneni Yves Arrouye Deutsche Übersetzung: Stefan Winter 2 Inhaltsverzeichnis 1 Web-Kürzel 4 1.1 Einführung.......................................... 4 1.2 Web-Kürzel.........................................

Mehr

12. Dokumente Speichern und Drucken

12. Dokumente Speichern und Drucken 12. Dokumente Speichern und Drucken 12.1 Überblick Wie oft sollte man sein Dokument speichern? Nachdem Sie ein Word Dokument erstellt oder bearbeitet haben, sollten Sie es immer speichern. Sie sollten

Mehr

MailUtilities: Remote Deployment - Einführung

MailUtilities: Remote Deployment - Einführung MailUtilities: Remote Deployment - Einführung Zielsetzung Die Aufgabe von Remote Deployment adressiert zwei Szenarien: 1. Konfiguration der MailUtilities von einer Workstation aus, damit man das Control

Mehr

Bereich METIS (Texte im Internet) Zählmarkenrecherche

Bereich METIS (Texte im Internet) Zählmarkenrecherche Bereich METIS (Texte im Internet) Zählmarkenrecherche Über die Zählmarkenrecherche kann man nach der Eingabe des Privaten Identifikationscodes einer bestimmten Zählmarke, 1. Informationen zu dieser Zählmarke

Mehr

Urlaubsregel in David

Urlaubsregel in David Urlaubsregel in David Inhaltsverzeichnis KlickDown Beitrag von Tobit...3 Präambel...3 Benachrichtigung externer Absender...3 Erstellen oder Anpassen des Anworttextes...3 Erstellen oder Anpassen der Auto-Reply-Regel...5

Mehr

Lizenzen auschecken. Was ist zu tun?

Lizenzen auschecken. Was ist zu tun? Use case Lizenzen auschecken Ihr Unternehmen hat eine Netzwerk-Commuterlizenz mit beispielsweise 4 Lizenzen. Am Freitag wollen Sie Ihren Laptop mit nach Hause nehmen, um dort am Wochenende weiter zu arbeiten.

Mehr

Dokumentation zum Spielserver der Software Challenge

Dokumentation zum Spielserver der Software Challenge Dokumentation zum Spielserver der Software Challenge 10.08.2011 Inhaltsverzeichnis: Programmoberfläche... 2 Ein neues Spiel erstellen... 2 Spielfeldoberfläche... 4 Spielwiederholung laden... 5 Testdurchläufe...

Mehr

Windows 7: Neue Funktionen im praktischen Einsatz - Die neue Taskleiste nutzen

Windows 7: Neue Funktionen im praktischen Einsatz - Die neue Taskleiste nutzen Windows 7: Neue Funktionen im praktischen Einsatz - Die neue Taskleiste nutzen Das können wir Ihnen versprechen: An der neuen Taskleiste in Windows 7 werden Sie sehr viel Freude haben. Denn diese sorgt

Mehr

Partitionieren in Vista und Windows 7/8

Partitionieren in Vista und Windows 7/8 Partitionieren in Vista und Windows 7/8 Windows Vista und Windows 7 können von Haus aus Festplatten partitionieren. Doch die Funktion ist etwas schwer zu entdecken, denn sie heißt "Volume verkleinern".

Mehr

Was ist PDF? Portable Document Format, von Adobe Systems entwickelt Multiplattformfähigkeit,

Was ist PDF? Portable Document Format, von Adobe Systems entwickelt Multiplattformfähigkeit, Was ist PDF? Portable Document Format, von Adobe Systems entwickelt Multiplattformfähigkeit, Wie kann ein PDF File angezeigt werden? kann mit Acrobat-Viewern angezeigt werden auf jeder Plattform!! (Unix,

Mehr

Algorithmen und Datenstrukturen

Algorithmen und Datenstrukturen Algorithmen und Datenstrukturen Dipl. Inform. Andreas Wilkens 1 Organisatorisches Freitag, 05. Mai 2006: keine Vorlesung! aber Praktikum von 08.00 11.30 Uhr (Gruppen E, F, G, H; Vortestat für Prototyp)

Mehr

Der große VideoClip- Wettbewerb von Media Markt.

Der große VideoClip- Wettbewerb von Media Markt. Der große VideoClip- Wettbewerb von Media Markt. Zeig was du drauf hast! Am 1. Juli startet eine Aktion, wie sie die Schweiz noch nicht gesehen hat. Unter dem Motto Zeig was Du drauf hast! suchen wir den

Mehr

Das große ElterngeldPlus 1x1. Alles über das ElterngeldPlus. Wer kann ElterngeldPlus beantragen? ElterngeldPlus verstehen ein paar einleitende Fakten

Das große ElterngeldPlus 1x1. Alles über das ElterngeldPlus. Wer kann ElterngeldPlus beantragen? ElterngeldPlus verstehen ein paar einleitende Fakten Das große x -4 Alles über das Wer kann beantragen? Generell kann jeder beantragen! Eltern (Mütter UND Väter), die schon während ihrer Elternzeit wieder in Teilzeit arbeiten möchten. Eltern, die während

Mehr

MORE Profile. Pass- und Lizenzverwaltungssystem. Stand: 19.02.2014 MORE Projects GmbH

MORE Profile. Pass- und Lizenzverwaltungssystem. Stand: 19.02.2014 MORE Projects GmbH MORE Profile Pass- und Lizenzverwaltungssystem erstellt von: Thorsten Schumann erreichbar unter: thorsten.schumann@more-projects.de Stand: MORE Projects GmbH Einführung Die in More Profile integrierte

Mehr

Stellen Sie bitte den Cursor in die Spalte B2 und rufen die Funktion Sverweis auf. Es öffnet sich folgendes Dialogfenster

Stellen Sie bitte den Cursor in die Spalte B2 und rufen die Funktion Sverweis auf. Es öffnet sich folgendes Dialogfenster Es gibt in Excel unter anderem die so genannten Suchfunktionen / Matrixfunktionen Damit können Sie Werte innerhalb eines bestimmten Bereichs suchen. Als Beispiel möchte ich die Funktion Sverweis zeigen.

Mehr

Upgrade auf die Standalone Editionen von Acronis Backup & Recovery 10. Technische Informationen (White Paper)

Upgrade auf die Standalone Editionen von Acronis Backup & Recovery 10. Technische Informationen (White Paper) Upgrade auf die Standalone Editionen von Acronis Backup & Recovery 10 Technische Informationen (White Paper) Inhaltsverzeichnis 1. Über dieses Dokument... 3 2. Überblick... 3 3. Upgrade Verfahren... 4

Mehr

ITF2XML. Transferservice. Version 1.1. Tel.: 044 / 350 10 10 Fax: 044 / 350 10 19. CH-8005 Zürich

ITF2XML. Transferservice. Version 1.1. Tel.: 044 / 350 10 10 Fax: 044 / 350 10 19. CH-8005 Zürich GmbH Technoparkstrasse 1 Informationssysteme Engineering & Consulting CH-8005 Zürich Tel.: 044 / 350 10 10 Fax: 044 / 350 10 19 ITF2XML Transferservice Version 1.1 infogrips GmbH, 2001-2014 06.01.2014

Mehr

Virtueller Seminarordner Anleitung für die Dozentinnen und Dozenten

Virtueller Seminarordner Anleitung für die Dozentinnen und Dozenten Virtueller Seminarordner Anleitung für die Dozentinnen und Dozenten In dem Virtuellen Seminarordner werden für die Teilnehmerinnen und Teilnehmer des Seminars alle für das Seminar wichtigen Informationen,

Mehr

FORUM HANDREICHUNG (STAND: AUGUST 2013)

FORUM HANDREICHUNG (STAND: AUGUST 2013) FORUM HANDREICHUNG (STAND: AUGUST 2013) Seite 2, Forum Inhalt Ein Forum anlegen... 3 Forumstypen... 4 Beiträge im Forum schreiben... 5 Beiträge im Forum beantworten... 6 Besondere Rechte der Leitung...

Mehr

FrontDoor/Monitor mehr sehen von FrontDoor

FrontDoor/Monitor mehr sehen von FrontDoor FrontDoor/Monitor mehr sehen von FrontDoor BYTEBAR.EU NEHMEN SIE SICH MEHR HERAUS Haben Sie schon einmal mit Ihrem Laptop direkt den Massenspeicher ausgelesen? FrontDoor/Monitor macht dies noch angenehmer.

Mehr

PHPNuke Quick & Dirty

PHPNuke Quick & Dirty PHPNuke Quick & Dirty Dieses Tutorial richtet sich an all die, die zum erstenmal an PHPNuke System aufsetzen und wirklich keine Ahnung haben wie es geht. Hier wird sehr flott, ohne grosse Umschweife dargestellt

Mehr

Primzahlen und RSA-Verschlüsselung

Primzahlen und RSA-Verschlüsselung Primzahlen und RSA-Verschlüsselung Michael Fütterer und Jonathan Zachhuber 1 Einiges zu Primzahlen Ein paar Definitionen: Wir bezeichnen mit Z die Menge der positiven und negativen ganzen Zahlen, also

Mehr

Durchführung der Datenübernahme nach Reisekosten 2011

Durchführung der Datenübernahme nach Reisekosten 2011 Durchführung der Datenübernahme nach Reisekosten 2011 1. Starten Sie QuickSteuer Deluxe 2010. Rufen Sie anschließend über den Menüpunkt /Extras/Reisekosten Rechner den QuickSteuer Deluxe 2010 Reisekosten-Rechner,

Mehr

Lizenzierung von System Center 2012

Lizenzierung von System Center 2012 Lizenzierung von System Center 2012 Mit den Microsoft System Center-Produkten lassen sich Endgeräte wie Server, Clients und mobile Geräte mit unterschiedlichen Betriebssystemen verwalten. Verwalten im

Mehr

BELIEBIG GROßE TAPETEN

BELIEBIG GROßE TAPETEN MODERNERES DESIGN 2 HTML-AUSGABEN 3 GESCHWINDIGKEIT 3 BELIEBIG GROßE TAPETEN 3 MULTIGRAMME 3 AUSGABEPFADE 3 INTEGRIERTER FORMELEDITOR 4 FEHLERBEREINIGUNGEN 5 ARBEITSVERZEICHNISSE 5 POWERPOINT 5 HINWEIS

Mehr

Handbuch. NAFI Online-Spezial. Kunden- / Datenverwaltung. 1. Auflage. (Stand: 24.09.2014)

Handbuch. NAFI Online-Spezial. Kunden- / Datenverwaltung. 1. Auflage. (Stand: 24.09.2014) Handbuch NAFI Online-Spezial 1. Auflage (Stand: 24.09.2014) Copyright 2016 by NAFI GmbH Unerlaubte Vervielfältigungen sind untersagt! Inhaltsangabe Einleitung... 3 Kundenauswahl... 3 Kunde hinzufügen...

Mehr

Man liest sich: POP3/IMAP

Man liest sich: POP3/IMAP Man liest sich: POP3/IMAP Gliederung 1. Einführung 1.1 Allgemeiner Nachrichtenfluss beim Versenden von E-Mails 1.2 Client und Server 1.2.1 Client 1.2.2 Server 2. POP3 2.1 Definition 2.2 Geschichte und

Mehr

Informatik 12 Datenbanken SQL-Einführung

Informatik 12 Datenbanken SQL-Einführung Informatik 12 Datenbanken SQL-Einführung Gierhardt Vorbemerkungen Bisher haben wir Datenbanken nur über einzelne Tabellen kennen gelernt. Stehen mehrere Tabellen in gewissen Beziehungen zur Beschreibung

Mehr

CMS.R. Bedienungsanleitung. Modul Cron. Copyright 10.09.2009. www.sruttloff.de CMS.R. - 1 - Revision 1

CMS.R. Bedienungsanleitung. Modul Cron. Copyright 10.09.2009. www.sruttloff.de CMS.R. - 1 - Revision 1 CMS.R. Bedienungsanleitung Modul Cron Revision 1 Copyright 10.09.2009 www.sruttloff.de CMS.R. - 1 - WOZU CRON...3 VERWENDUNG...3 EINSTELLUNGEN...5 TASK ERSTELLEN / BEARBEITEN...6 RECHTE...7 EREIGNISSE...7

Mehr

Favoriten sichern. Sichern der eigenen Favoriten aus dem Webbrowser. zur Verfügung gestellt durch: ZID Dezentrale Systeme.

Favoriten sichern. Sichern der eigenen Favoriten aus dem Webbrowser. zur Verfügung gestellt durch: ZID Dezentrale Systeme. Favoriten sichern Sichern der eigenen Favoriten aus dem Webbrowser zur Verfügung gestellt durch: ZID Dezentrale Systeme Februar 2015 Seite 2 von 20 Inhaltsverzeichnis Einleitung... 3 Mozilla Firefox...

Mehr

Beschreibung und Bedienungsanleitung. Inhaltsverzeichnis: Abbildungsverzeichnis: Werkzeug für verschlüsselte bpks. Dipl.-Ing.

Beschreibung und Bedienungsanleitung. Inhaltsverzeichnis: Abbildungsverzeichnis: Werkzeug für verschlüsselte bpks. Dipl.-Ing. www.egiz.gv.at E-Mail: post@egiz.gv.at Telefon: ++43 (316) 873 5514 Fax: ++43 (316) 873 5520 Inffeldgasse 16a / 8010 Graz / Austria Beschreibung und Bedienungsanleitung Werkzeug für verschlüsselte bpks

Mehr

Bedienungsanleitung. Stand: 26.05.2011. Copyright 2011 by GEVITAS GmbH www.gevitas.de

Bedienungsanleitung. Stand: 26.05.2011. Copyright 2011 by GEVITAS GmbH www.gevitas.de GEVITAS-Sync Bedienungsanleitung Stand: 26.05.2011 Copyright 2011 by GEVITAS GmbH www.gevitas.de Inhalt 1. Einleitung... 3 1.1. Installation... 3 1.2. Zugriffsrechte... 3 1.3. Starten... 4 1.4. Die Menü-Leiste...

Mehr

Inhalt. 1 Einleitung AUTOMATISCHE DATENSICHERUNG AUF EINEN CLOUDSPEICHER

Inhalt. 1 Einleitung AUTOMATISCHE DATENSICHERUNG AUF EINEN CLOUDSPEICHER AUTOMATISCHE DATENSICHERUNG AUF EINEN CLOUDSPEICHER Inhalt 1 Einleitung... 1 2 Einrichtung der Aufgabe für die automatische Sicherung... 2 2.1 Die Aufgabenplanung... 2 2.2 Der erste Testlauf... 9 3 Problembehebung...

Mehr

3 ORDNER UND DATEIEN. 3.1 Ordner

3 ORDNER UND DATEIEN. 3.1 Ordner Ordner und Dateien PC-EINSTEIGER 3 ORDNER UND DATEIEN Themen in diesem Kapitel: Erstellung von Ordnern bzw Dateien Umbenennen von Datei- und Ordnernamen Speicherung von Daten 3.1 Ordner Ordner sind wie

Mehr

Ihre Interessentendatensätze bei inobroker. 1. Interessentendatensätze

Ihre Interessentendatensätze bei inobroker. 1. Interessentendatensätze Ihre Interessentendatensätze bei inobroker Wenn Sie oder Ihre Kunden die Prozesse von inobroker nutzen, werden Interessentendatensätze erzeugt. Diese können Sie direkt über inobroker bearbeiten oder mit

Mehr

Kommunikations-Management

Kommunikations-Management Tutorial: Wie importiere und exportiere ich Daten zwischen myfactory und Outlook? Im vorliegenden Tutorial lernen Sie, wie Sie in myfactory Daten aus Outlook importieren Daten aus myfactory nach Outlook

Mehr

Computerarithmetik ( )

Computerarithmetik ( ) Anhang A Computerarithmetik ( ) A.1 Zahlendarstellung im Rechner und Computerarithmetik Prinzipiell ist die Menge der im Computer darstellbaren Zahlen endlich. Wie groß diese Menge ist, hängt von der Rechnerarchitektur

Mehr

Anbindung des eibport an das Internet

Anbindung des eibport an das Internet Anbindung des eibport an das Internet Ein eibport wird mit einem lokalen Router mit dem Internet verbunden. Um den eibport über diesen Router zu erreichen, muss die externe IP-Adresse des Routers bekannt

Mehr

mobilepoi 0.91 Demo Version Anleitung Das Software Studio Christian Efinger Erstellt am 21. Oktober 2005

mobilepoi 0.91 Demo Version Anleitung Das Software Studio Christian Efinger Erstellt am 21. Oktober 2005 Das Software Studio Christian Efinger mobilepoi 0.91 Demo Version Anleitung Erstellt am 21. Oktober 2005 Kontakt: Das Software Studio Christian Efinger ce@efinger-online.de Inhalt 1. Einführung... 3 2.

Mehr

OP-LOG www.op-log.de

OP-LOG www.op-log.de Verwendung von Microsoft SQL Server, Seite 1/18 OP-LOG www.op-log.de Anleitung: Verwendung von Microsoft SQL Server 2005 Stand Mai 2010 1 Ich-lese-keine-Anleitungen 'Verwendung von Microsoft SQL Server

Mehr

Bedienungsanleitung für den SecureCourier

Bedienungsanleitung für den SecureCourier Bedienungsanleitung für den SecureCourier Wo kann ich den SecureCourier nach der Installation auf meinem Computer finden? Den SecureCourier finden Sie dort, wo Sie mit Dateien umgehen und arbeiten. Bei

Mehr

Zeichen bei Zahlen entschlüsseln

Zeichen bei Zahlen entschlüsseln Zeichen bei Zahlen entschlüsseln In diesem Kapitel... Verwendung des Zahlenstrahls Absolut richtige Bestimmung von absoluten Werten Operationen bei Zahlen mit Vorzeichen: Addieren, Subtrahieren, Multiplizieren

Mehr

Gesetzliche Aufbewahrungspflicht für E-Mails

Gesetzliche Aufbewahrungspflicht für E-Mails Gesetzliche Aufbewahrungspflicht für E-Mails sind Sie vorbereitet? Vortragsveranstaltung TOP AKTUELL Meins und Vogel GmbH, Plochingen Dipl.-Inf. Klaus Meins Dipl.-Inf. Oliver Vogel Meins & Vogel GmbH,

Mehr

Formular»Fragenkatalog BIM-Server«

Formular»Fragenkatalog BIM-Server« Formular»Fragenkatalog BIM-Server«Um Ihnen so schnell wie möglich zu helfen, benötigen wir Ihre Mithilfe. Nur Sie vor Ort kennen Ihr Problem, und Ihre Installationsumgebung. Bitte füllen Sie dieses Dokument

Mehr

20. Algorithmus der Woche Online-Algorithmen: Was ist es wert, die Zukunft zu kennen? Das Ski-Problem

20. Algorithmus der Woche Online-Algorithmen: Was ist es wert, die Zukunft zu kennen? Das Ski-Problem 20. Algorithmus der Woche Online-Algorithmen: Was ist es wert, die Zukunft zu kennen? Das Ski-Problem Autor Susanne Albers, Universität Freiburg Swen Schmelzer, Universität Freiburg In diesem Jahr möchte

Mehr

Apache HBase. A BigTable Column Store on top of Hadoop

Apache HBase. A BigTable Column Store on top of Hadoop Apache HBase A BigTable Column Store on top of Hadoop Ich bin... Mitch Köhler Selbstständig seit 2010 Tätig als Softwareentwickler Softwarearchitekt Student an der OVGU seit Oktober 2011 Schwerpunkte Client/Server,

Mehr

Leichte-Sprache-Bilder

Leichte-Sprache-Bilder Leichte-Sprache-Bilder Reinhild Kassing Information - So geht es 1. Bilder gucken 2. anmelden für Probe-Bilder 3. Bilder bestellen 4. Rechnung bezahlen 5. Bilder runterladen 6. neue Bilder vorschlagen

Mehr

Installation und Inbetriebnahme von SolidWorks

Installation und Inbetriebnahme von SolidWorks Inhaltsverzeichnis FAKULTÄT FÜR INGENIEURWISSENSCHAFTEN I Prof. Dr.-Ing. Frank Lobeck Installation und Inbetriebnahme von SolidWorks Inhaltsverzeichnis Inhaltsverzeichnis... I 1. Einleitung... 1 2. Installation...

Mehr

USB-Stick mit SecurStick ohne Administratorrechte verschlüsseln

USB-Stick mit SecurStick ohne Administratorrechte verschlüsseln USB-Stick mit SecurStick ohne Administratorrechte verschlüsseln Diese Anleitung zeigt, wie man mit SecurStick Daten auf einem USB-Stick (oder einem anderen Datenträger) verschlüsseln und entschlüsslen

Mehr

EasyWk DAS Schwimmwettkampfprogramm

EasyWk DAS Schwimmwettkampfprogramm EasyWk DAS Schwimmwettkampfprogramm Arbeiten mit OMEGA ARES 21 EasyWk - DAS Schwimmwettkampfprogramm 1 Einleitung Diese Präsentation dient zur Darstellung der Zusammenarbeit zwischen EasyWk und der Zeitmessanlage

Mehr

Grundlagen verteilter Systeme

Grundlagen verteilter Systeme Universität Augsburg Insitut für Informatik Prof. Dr. Bernhard Bauer Wolf Fischer Christian Saad Wintersemester 08/09 Übungsblatt 3 12.11.08 Grundlagen verteilter Systeme Lösungsvorschlag Aufgabe 1: a)

Mehr

1 Mathematische Grundlagen

1 Mathematische Grundlagen Mathematische Grundlagen - 1-1 Mathematische Grundlagen Der Begriff der Menge ist einer der grundlegenden Begriffe in der Mathematik. Mengen dienen dazu, Dinge oder Objekte zu einer Einheit zusammenzufassen.

Mehr

Umstellung News-System auf cms.sn.schule.de

Umstellung News-System auf cms.sn.schule.de Umstellung News-System auf cms.sn.schule.de Vorbemerkungen Hinweis: Sollten Sie bisher noch kein News-System verwendet haben, nutzen Sie die Anleitung unter http://cms.sn.schule.de/admin/handbuch/grundlagen/page/25/

Mehr

FastViewer Remote Edition 2.X

FastViewer Remote Edition 2.X FastViewer Remote Edition 2.X Mit der FastViewer Remote Edition ist es möglich beliebige Rechner, unabhängig vom Standort, fernzusteuern. Die Eingabe einer Sessionnummer entfällt. Dazu muß auf dem zu steuernden

Mehr

Handbuch zum Excel Formular Editor

Handbuch zum Excel Formular Editor Handbuch zum Excel Formular Editor Mit diesem Programm können Sie die Zellen von ihrer Excel Datei automatisch befüllen lassen. Die Daten können aus der Coffee Datenbank, oder einer weiteren Excel Datendatei

Mehr

Nutzung von GiS BasePac 8 im Netzwerk

Nutzung von GiS BasePac 8 im Netzwerk Allgemeines Grundsätzlich kann das GiS BasePac Programm in allen Netzwerken eingesetzt werden, die Verbindungen als Laufwerk zu lassen (alle WINDOWS Versionen). Die GiS Software unterstützt nur den Zugriff

Mehr

NAS 251 Einführung in RAID

NAS 251 Einführung in RAID NAS 251 Einführung in RAID Ein Speicher-Volume mit RAID einrichten A S U S T O R - K o l l e g Kursziele Nach Abschluss dieses Kurses sollten Sie: 1. Ü ber ein grundlegendes Verständnis von RAID und seinen

Mehr

Access [basics] Rechnen in Berichten. Beispieldatenbank. Datensatzweise berechnen. Berechnung im Textfeld. Reporting in Berichten Rechnen in Berichten

Access [basics] Rechnen in Berichten. Beispieldatenbank. Datensatzweise berechnen. Berechnung im Textfeld. Reporting in Berichten Rechnen in Berichten Berichte bieten die gleichen Möglichkeit zur Berechnung von Werten wie Formulare und noch einige mehr. Im Gegensatz zu Formularen bieten Berichte die Möglichkeit, eine laufende Summe zu bilden oder Berechnungen

Mehr

Konfiguration VLAN's. Konfiguration VLAN's IACBOX.COM. Version 2.0.1 Deutsch 01.07.2014

Konfiguration VLAN's. Konfiguration VLAN's IACBOX.COM. Version 2.0.1 Deutsch 01.07.2014 Konfiguration VLAN's Version 2.0.1 Deutsch 01.07.2014 In diesem HOWTO wird die Konfiguration der VLAN's für das Surf-LAN der IAC-BOX beschrieben. Konfiguration VLAN's TITEL Inhaltsverzeichnis Inhaltsverzeichnis...

Mehr

Ein Leitfaden für Anfänger unter Zuhilfenahme frei verfügbarer Software! (bei z.b. Google Microsoft Powertoys suchen, oder diesen Link verwenden )

Ein Leitfaden für Anfänger unter Zuhilfenahme frei verfügbarer Software! (bei z.b. Google Microsoft Powertoys suchen, oder diesen Link verwenden ) Wie erstelle ich Fotogalerien? Wie kann ich die auf meiner Homepage präsentieren? Ein Leitfaden für Anfänger unter Zuhilfenahme frei verfügbarer Software! Die ist eine Lösung für Windows XP Diese Lösung

Mehr