Fakultät für Wirtschaftswissenschaften. Data Mining

Größe: px
Ab Seite anzeigen:

Download "Fakultät für Wirtschaftswissenschaften. Data Mining"

Transkript

1 Fakultät für Wirtschaftswissenschaften Data Mining Untersuchung der Umfragedaten der Direktstudenten im Bereich Wirtschaft der Hochschule Wismar mit der Open-Source Software Knime Zur Veranstaltung Business Intelligence der Hochschule Wismar eingereicht von: Sina-Maria Viehhofer geboren am 27. Dezember 1985 in Höxter Matrikelnummer: Sophie Wieckowski geboren am 31. Januar 1990 in Rostock Matrikelnummer: Betreuer: Prof. Dr. Jürgen Cleve Wismar, den

2 I. Inhaltsverzeichnis I. Inhaltsverzeichnis... II II. Abbildungsverzeichnis...III III. Tabellenverzeichnis... IV IV. Abkürzungsverzeichnis... V 1. Einleitung Datenvorbereitung Vollständigkeit Konsistenz Genauigkeit Data Mining Klassifikation k-nearest Neighbor Entscheidungsbaumverfahren Naive Bayes Clustering Assoziationsanalyse Abschließende Bewertung...19 V. Literaturverzeichnis... VIII VI. Anhang... IX VII. Ehrenwörtliche Erklärung... XI II

3 II. Abbildungsverzeichnis Abbildung 1: Workflow k-nearest Neighbor... 6 Abbildung 2: Workflow knn Erweiterung... 6 Abbildung 3: Workflow Entscheidungsbaumverfahren... 8 Abbildung 4: Workflow Naive Bayes...13 Abbildung 5: Accuracy Statistics...13 Abbildung 6: Workflow k-means-algorithmus...15 Abbildung 7: Workflow Assoziationsregeln...16 III

4 III. Tabellenverzeichnis Tabelle 1: Fehlende Werte... 3 Tabelle 2: Ermittelte Werte mit Wahrscheinlichkeiten... 3 Tabelle 3: Vergleich Entscheidungsbaumverfahren... 9 Tabelle 4: Zielattribute Entscheidungsbaum...10 Tabelle 5: Ergebnisse Association Rule Learner...18 Tabelle 6: Vergleich der Algorithmen nach durchschnittlicher Fehlerfreiheit...19 IV

5 IV. Abkürzungsverzeichnis BI DS Fr KNIME WS WG Business Intelligence Datensatz Frage KoNstanz Information MinEr Wahrscheinlichkeit Wohngemeinschaft V

6 1. Einleitung Besonders seit der europäischen Wirtschaftskrise hat Business Intelligence (BI) für die Unternehmen an Bedeutung zugenommen um die Vielzahl der vorliegenden Informationen effektiv und langfristig sicherzustellen. Ziel des BI ist es hierbei vorliegende Daten und Informationen aufzubereiten um Entscheidungen zu erleichtern und zu verbessern. Eine häufig angewandte Methode des BI ist das Data Mining. Es [ ] beinhaltet [ ] die Extraktion und Entdeckung von implizitem, bisher nicht bekanntem und potenziell nützlichem Wissen aus Daten 1. Auch wenn keine einheitliche Definition von Data Mining vorliegt, ist das Ziel des Data Mining Strukturen und Muster in der vorliegenden Datenmenge zu erkennen und zu analysieren. Dieses Ziel bestand ebenfalls in dem studentischen Projekt des Moduls Business Intelligence. Hierfür wurde ein Fragebogen für Direktstudenten des Fachbereichs Wirtschaft der Hochschule Wismar erstellt. Die Umfrage erfolgte mit der Software Stud.IP, welche in Hochschulen, Bildungseinrichtungen, Behörden und Unternehmen als Lern-, Informations- und Projekt-Management-System eingesetzt wird. Insgesamt haben 234 Studenten an der Umfrage teilgenommen. Aufgabe war es Data Mining mit den erhaltenden Daten mithilfe der Software KNIME durchzuführen. Hierfür wurde zunächst die Datenmenge vorbereitet indem Ausreißer oder fehlende Daten ermittelt und behoben wurden. Die Vorgehensweise sowie vorgenommene Änderungen an der Datenmenge werden im zweiten Kapitel näher beschrieben. Darauffolgende wurden verschiedene Verfahren des Data Mining durchgeführt. Angewandt wurden die Algorithmen k-nearest Neighbor, Apriori, k-means, Naive Bayes, C4.5, Gini-Index und Gain-Ratio wessen Workflows und Ergebnisse in dem dritten Kapitel vorgestellt werden. Eine Bewertung der unterschiedlichen Algorithmen und Ergebnisse erfolgt abschließend in Kapitel vier. 1 Frawley, W.; Piatetsky-Shapiro, G.; Matheus, C. (1991): Knowledge Discovery in Databases An Overview, S.20; in: Petersohn, H. (2005), S. 8 1

7 2. Datenvorbereitung Die Phase der Datenvorbereitung ist in einem Data Mining-Projekt die, die die meisten Ressourcen bindet, da sie sehr zeitaufwendig ist. Die Daten müssen sorgfältig selektiert und gegebenenfalls bereinigt und ergänzt werden, so dass eine geeignete Datenbasis für die Analyse zur Verfügung steht. 2 Zu Beginn des Projekts ist kollektiv ein Fragebogen erstellt worden, bei dem bereits auf geeignete Fragen und Antwortmöglichkeiten geachtet worden ist, so dass nur eine sehr geringe Form der Datenselektion durchgeführt werden muss. Es ist im Verlauf der Umfrage ein Fehler aufgetreten, so dass eine Kann-Frage nach der Finanzierung des Autos fälschlicherweise als eine Muss-Frage angegeben war. Da auch mit Hilfe der weiteren Fragen dieser Fehler nicht bereinigt werden konnte ist diese Frage aus den Datensätzen (DS) entfernt worden. Weiterhin sind im Vorwege die Daten von drei unterschiedlichen Speicherungen zusammengeführt worden. Die Datenvorverarbeitung stellt die Qualität der Daten in Frage. So wird eine Datenbereinigung durchgeführt, in der mit geeigneten Maßnahmen eine möglichst hohe Qualität im Zieldatenbestand erreicht werden soll. Die Datenqualität hat eine hohe Bedeutung für die Durchführung von Analyseverfahren und der Interpretierbarkeit der Ergebnisse. Ausreißer oder fehlende Werte können die Ergebnisse stark verzerren. Im Folgenden werden daher kurz die Aktionen aufgeführt, die zur Bereinigung der Daten angewandt worden sind Vollständigkeit Die Vollständigkeit der Daten ist verhältnismäßig schnell und einfach zu überprüfen. Für diesen Schritt sind die Daten auf fehlende Datensätze untersucht worden. Es gibt einige sogenannte Kann-Fragen in denen keine Antworten eingetragen werden müssen und dies auch korrekt ist. Andere Fragen hingegen erwarten eine Antwort und aufgrund menschlicher Eingabefehler sind hier keine Angaben gemacht worden. Es gibt verschiedene Möglichkeiten fehlende Werte zu ergänzen, wie zum Beispiel die Eingabe eines Nullwerts oder die häufigste Ausprägung dieses Attributs. In diesem Fall ist jedoch entschieden worden bereits ein Data Mining-Verfahren anzuwenden. Mit Hilfe des Verfahrens k-nearest Neighbor können die Attributausprägungen ermittelt und der Umgang mit Knime geübt werden. 2 Gabriel, R.; Gluchowski, P.; Pastwa, A. (2009) S. 128 f. 2

8 Es sind folgende fehlende Werte in den Rohdaten identifiziert worden: Frage 13 Frage 15 Frage 23 Datensatz Datensatz Datensatz 64 Datensatz 110 Datensatz 170 Tabelle 1: Fehlende Werte Im Anhang dieser Projektarbeit ist eine Auflistung der Fragen mit der Nummerierung zu finden. Bei den Fragen 13 und 23 handelt es sich um eine Angabe im Anschluss auf eine zuvor gestellt Frage. Zum Beispiel umfasst Frage 13 die Angabe, wie viele Stunden jemand arbeiten geht, wenn zuvor angegeben worden ist, dass derjenige arbeitet. Frage 15 hingegen ist eine unabhängige Frage bezüglich des zur Verfügung stehenden Budgets. Hier ist anzunehmen, dass eventuell bewusst keine Angaben gemacht worden sind. Da bei dieser Frage die meisten fehlenden Werte vorliegen und eine logische Abhängigkeit zur Frage 13 bestehen könnte, werden im ersten Schritt die Werte für Frage 13 ermittelt. Im Anschluss sind mit Hilfe des gleichen Verfahrens die weiteren fehlenden Werte ermittelt worden. Eine nähere Erläuterung des Verfahrens k-nearest Neighbor erfolgt im folgenden Kapitel. Datensatz Ergebnis Fr.13 WS Ergebnis Fr. 15 WS Ergebnis Fr. 23 WS % % 1 41% % % % % Tabelle 2: Ermittelte Werte mit Wahrscheinlichkeiten Es gibt keine klare Richtlinie, bei welcher Wahrscheinlichkeit das ermittelte Ergebnis sinnvoll ist. Bei Frage 13 ist die Ausprägung zum Beispiel 5, jedoch auch die am häufigsten genannte Antwort. Circa 45 Prozent aller Beteiligten gehen nicht zusätzlich arbeiten, so dass die Werte trotz einer geringen Wahrscheinlichkeit plausibel sind. Auch wenn eine manuelle Anpassung der Werte immer eine gewisse Verfälschung des 3

9 Datenbestandes darstellt, ist diese Vorgehensweise sinnvoll, so dass für weitere Analysen so viele Datensätze wie möglich zur Verfügung stehen Konsistenz Die vervollständigte Datenbasis muss hinsichtlich ihrer Konsistenz untersucht werden. Es müssen Widersprüche untereinander identifiziert und wenn möglich bereinigt werden. Bei der Betrachtung der Daten ist aufgefallen, dass es bei der Frage ob es sich um ein Erststudium handelt oder nicht scheinbar zu Missverständnissen bei den Teilnehmern gekommen ist. Es ist davon ausgegangen worden, dass ein aufbauender Masterstudiengang als Erststudium angesehen wird. Bei der Betrachtung jedoch zum Beispiel des Datensatzes 8 ist zu sehen, dass als Studiengang Master Wirtschaftsrecht angegeben worden ist und als Erststudium Bachelor Wirtschaftsrecht. Bei der Frage ob es sich um ein Erststudium handelt verneint der Teilnehmer dies jedoch. In diesem Fall wird angenommen, dass der Befragte die Fragestellung missverstanden hat und der Wert auf eine Null (Erststudium = ja) geändert. Dieser Fehler tritt weiterhin bei den Datensätzen: 58,106,111,152,183 auf. Die Datensätze 92,104 und 229 verneinen die Frage nach dem Erststudium geben jedoch auch kein vorherigen Studiengang an. In diesem Fall werden die Daten mit dem Hinweis keine Angabe ergänzt. Eine weitere Fehlerquelle besteht in den Angaben zu der Frage nach der Semesterzahl. Unter der Fragestellung wird das aktuelle Fachsemester verstanden, welches scheinbar nicht immer korrekt angegeben worden ist. Es ist gemäß der Hochschulverordnung nicht möglich, in einem Masterstudiengang sich im neunten Fachsemester zu befinden. Dieses Missverständnis tritt bei den Datensätzen: 29, 61, 91, 111, 165, 176 und 193 auf. Die Datensätze 61, 165 und 193 können aufgrund ihres Studienganges jedoch identifiziert werden und manuell auf 1=2 Fachsemester abgeändert werden. Die Datensätze 29, 111 und 176 werden markiert und für weitere Analysen als fehlerhaft vorgemerkt Genauigkeit Genauigkeit ist ein weiteres Kriterium nach dem die Datenbasis beurteilt werden sollte. Unter der Genauigkeit der Daten versteht man den Detaillierungsgrad oder auch Granularität. Für die vorliegende Aufgabenstellung ist es erforderlich einige Fragestellungen zusammenzufassen um so eine geringere Detaillierung zu erreichen. Eine Reduzierung der Fragestellungen erfolgt bei den Fragen 6, 7, 13, 14, 22, 23, 24, 25. 4

10 Fragen 6+7 Erststudium und vorheriger Studiengang zusammengefasst, aber für numerische Auswertung die Frage nach dem Erststudium beibehalten Frage nach der Arbeit und der Stundenanzahl zusammengefasst und die Antwortmöglichkeit keine Arbeit ergänzt Frage nach einem Fernseher und der Stundenanzahl zusammengefasst und die Antwortmöglichkeit kein Fernseher ergänzt Frage nach Videospielen und der Stundenanzahl zusammengefasst und die Antwortmöglichkeit kein Spieler ergänzt Eine weitere Reduzierung der Fragen kann bei den Multiple-Choice-Fragen erfolgen. Die Frage 16 bezieht sich auf die Wohnverhältnisse. Die Datensätze 1,3,140 und 206 haben jeweils WG und Mietwohnung als Antworten gegeben. Diese beiden Antwortmöglichkeiten werden zu einer neuen zusammengefasst WG in Mietwohnung. Es liegen weiterhin Doppelnennungen bei dem DS 29 und 66 vor. Hier wurden als Zweitnennung die Eltern angegeben. Da mit dieser Frage die Wohnverhältnisse in Wismar in Erfahrung gebracht werden sollten, wird beim DS 29 nur die Antwort Mietwohnung und beim DS 66 nur Wohnheim übernommen. Eine zusätzliche Datentransformation ist bei den Fragen nach der Zufriedenheit der Lebenssituation und nach der Anzahl der Wochenenden in Wismar. In diesen Fällen müssen die ordinalen Angaben in numerische Werte umgewandelt werden. Im Anschluss muss keine weitere Transformation vorgenommen werden, da mit KNIME die Daten als Excel Tabelle eingelesen werden können und je nach Analyse direkt im Workflow in numerisch oder ordinal umgewandelt werden können. 3. Data Mining Im Folgenden werden Verfahren der Data Mining-Anwendungsbereiche Klassifikation, Segmentierung (Clustering) und Assoziation näher beschrieben und dessen Ergebnisse vorgestellt Klassifikation Die Klassifikation kommt zum Einsatz wenn die Gruppen bzw. Klassen bereits vorgegeben sind, in welche die unterschiedlichen Merkmale mittels unterschiedlicher Verfahren zugeordnet werden sollen. Aus den Ergebnissen können anschließend Verhaltensregeln abgeleitet werden k-nearest Neighbor 3 Vgl. Gabriel, R.; Gluchowski, P.; Pastwa, A. (2009) S. 15 5

11 Das Verfahren k-nearest Neighbor gehört zu den instanzbasierten Verfahren. Es stellt eine Klassifikation der Daten dar indem fehlende Objekte bzw. Merkmalsausprägungen anhand ihrer Nachbarn ermittelt werden. Mithilfe von Distanzfunktionen werden die Ähnlichkeiten der Attributwerte berechnet und zur Vorhersage des neuen Objekts herangezogen. Es werden die k-ähnlichsten Daten betrachtet um die Klasse des fehlenden Objektes zu ermitteln. Die Anzahl der zu betrachtenden Werte (k) muss zuvor angegeben werden. Dieses Verfahren ist in dieser Projektarbeit bereits genutzt worden um fehlende Werte zu ermitteln. Hierfür ist folgender Workflow erstellt worden. Abbildung 1: Workflow k-nearest Neighbor Nach dem Einlesen der Daten wurden die Spalten herausgefiltert, die neben den zu ermittelnden weiterhin fehlende Werte aufweisen. Mit dem Row Splitter-Node werden die Zeilen in denen die Werte fehlen, gefiltert sodass zu ihnen mit Hilfe des K Nearest Neighbor-Nodes die ähnlichsten Datensätze gefunden werden können- In den vorliegenden Fällen ist ein k=8 ausgewählt worden. Weiterhin können mit Hilfe dieses Algorithmus auch größere Mengen von fehlenden Attributen ermittelt werden. Zur Prüfung der Treffergenauigkeit ist ein erweiterter Workflow erstellt worden. Abbildung 2: Workflow knn Erweiterung 6

12 Mithilfe dieses Workflows ist es möglich eine Trainingsmenge von 80 Prozent aller Datensätze festzulegen und die ermittelten Werte anhand der Testdaten zu überprüfen. Auch hier zeigt sich deutlich, dass die Multiple-Choice-Fragen sehr genau ermittelt werden können. In Summe ergibt sich eine Treffergenauigkeit von circa 61 Prozent. Es ist hervorzuheben, dass bei der Vorhersage neben den Multiple-Choice-Fragen vor allem die Attribute Alter, Erststudium und Leistung prognostiziert worden sind. Diese Betrachtung zeigt sich bei der Einbeziehung der Anzahl der Merkmalsausprägungen. So ist eine Treffergenauigkeit von 50 Prozent bei zwei Merkmalsausprägungen nicht sehr gut, wohingegen bei sechs Merkmalsausprägungen die 50 Prozent schon eine sehr gute Genauigkeit darstellt Entscheidungsbaumverfahren Ein Entscheidungsbaum besteht aus einer Vielzahl von Knoten, welche durch sogenannte Kanten verbunden und hierarisch angeordnet sind. Zu Beginn eines Baumes stellt ein Knoten zunächst alle Objekte welche untersucht werden dar und wird nach Attributausprägungen mit dem größten Informationsgehalt zerlegt. Diese Zerlegung erfolgt solange bis ein Knoten ausschließlich ein Objekt darstellt. Entscheidungsbaumverfahren können dabei unterschieden werden zwischen Klassifikations- und Regressionsbäumen, welche jeweils unterschiedliche Algorithmen für die Erstellung eines Baumes verwenden. In dieser Projektarbeit wurden Entscheidungsbäume mithilfe des Decision Tree Learner-Node und J48-Node in Knime erstellt. Der Decision Tree Learner verwendet für die Erstellung eines Baumes zum einen den Gini-Index und zum anderen, je nach Auswahl in den Einstellungen, das Gain-Ratio. Der Gini-Index nimmt einen Wert von null bei Gleichverteilung und einen Wert von 1 bei Ungleichverteilung an. Das Gain-Ratio wählt hingegen einen Schwellenwert aus um die betrachteten Objekte über bzw. unter diesen aufzuteilen. Weiterhin besteht die Möglichkeit mit dem Decision Tree Learner eine nachträgliche Optimierung durchzuführen, welche zunächst vorhandene Kanten und Knoten für eine Vereinfachung des Baumes entfernt. Das J48-Node verwendet den C4.5-Algorithmus von Ross Quinlan welcher versucht einen Baum durch zuvor durchgeführte Tests möglichst einfach, d.h. ohne großen Rechenauswand zu erstellen. 4 Um eine gemeinsame Ausgangsbasis der Daten zu generieren wurden J48 und der Decision Tree Learner in einem Workflow in Knime zusammengefasst. 4 Vgl. Petersohn, H. (2005) S. 136 ff. 7

13 Abbildung 3: Workflow Entscheidungsbaumverfahren Die Daten werden mit dem Partitioning in eine Trainings- und eine Testmenge im Verhältnis 80:20 aufgespalten. Daraufhin werden die Bäume zunächst nach den unterschiedlichen Verfahren erstellt und anschließend mit dem Predictor optimiert indem die Daten klassifiziert werden. Da bei dem Decision Tree Learner in den Einstellungen vor der Erstellung eines Baumes der anzuwendende Algorithmus ausgewählt werden muss, werden die Ergebnisse des Gini-Index und des Gain-Ratio zuvor miteinander verglichen. Hierfür wurden Bäume von fünf Attributen mit dem jeweiligen Algorithmus erstellt und dessen Prozentsatz der richtig vorhergesagten Werte verglichen. Das Ergebnis dieses Vergleiches war, dass das Gain- Ratio in 60 Prozent der Fälle mehr Werte korrekt vorhergesagt hat, als der Gini-Index. Anschließend wurden Bäume für die gleichen zuvor angewandten fünf Attribute mit und ohne nachträgliche Optimierung erstellt und anschließend wieder der Prozentsatz der richtig prognostizierten Werte verglichen. Dieser Vergleich ergab, dass eine nachträgliche Optimierung nur in 40 Prozent der Fälle eine Verbesserung der richtig prognostizierten Werte ergab. 8

14 Fehlerfreiheit in Prozent Attribut Gini-Index Gain-Ratio-Kriterium Mit nachträglicher Optimierung Studiengang 47,727 50,588 46,154 Semester 54,118 48,889 47,312 Geschlecht 56,818 61,176 60,227 Alter 60 65,517 65,957 Ausbildung 69,663 67,391 70,213 Tabelle 3: Vergleich Entscheidungsbaumverfahren Aufgrund dieser Ergebnisse wurden die Entscheidungsbäume, welche mit dem Decision Tree Learner erzeugt wurden, mit dem Gain-Ratio und ohne nachträgliche Optimierung erstellt. Anschließend werden für alle Attribute Bäume jeweils mit dem Decision Tree Learner und J48 erstellt und erneut die richtig prognostizierten Prozentwerte miteinander verglichen, mit dem Ziel die unterschiedlichen Algorithmen miteinander zu vergleichen und einen für bestmögliche Ergebnisse auszuwählen. Hierbei stellte sich heraus, dass das Verfahren mit dem Gain-Ratio weniger Bäume mit einem richtigen prognostizierten Prozentwert größer 50 Prozentwert erzeugen konnte, als der C4.5 Algorithmus. Weiterhin fiel auf, dass die richtig vorhergesagten Werte des C4.5 höher ausfielen, als die des Gain-Ratio. Aus diesem Grund wurden die Ergebnisse der Bäume näher betrachtet die mit J48-Node, also dem C4.5 Algorithmus erstellt wurden. Näher betrachtet werden alle Ergebnisse welche einen Fehlerfreiheits-Prozentwert von größer oder gleich 80 Prozent besitzen. Dies bedeutet, dass die erzeugte Regel auf fast jeden Befragten der jeweilig betrachteten Gruppe zutrifft. Hieraus ergeben sich neun Zielattribute, welcher in folgender Tabelle aufgeführt sind. 9

15 Attribut Fehlerfreiheit in Prozent Erststudium 90,425 Studium an der Hochschule Wismar aufgrund der Empfehlung 84,043 Studium an der Hochschule Wismar aufgrund im Fragebogen nicht aufgeführter Gründe 96,17 Zur Hochschule mit der Bahn 95,745 Zur Hochschule mit dem Bus 94,681 Zur Hochschule mit dem Auto 81,915 Zur Hochschule mit dem Motorrad 98,936 Fortbewegung in Wismar mit dem Bus 92,553 Fortbewegung in Wismar mit dem Fahrrad 86,17 Tabelle 4: Zielattribute Entscheidungsbaum Aus den Bäumen der jeweiligen Zielattribute ergaben sich folgende sinnvolle Regeln: Zielattribut: Erststudium 1. WENN gerade nicht das Erststudium absolviert wird UND ein Budget von Euro/Monat zur Verfügung steht UND Videospiele 1-10 Stunden/Woche gespielt werden DANN wurde ein Erststudium im Studiengang Verfahrens- und Umwelttechnik absolviert. 2. WENN gerade nicht das Erststudium absolviert wird UND ein Budget größer Euro/Monat zur Verfügung steht DANN wurde ein Erststudium im Studiengang Jura absolviert. 3. WENN gerade nicht das Erststudium absolviert wird UND ein Budget größer Euro/Monat zur Verfügung steht DANN wurde ein Erststudium im Studiengang Lehramt absolviert. 4. WENN gerade nicht das Erststudium absolviert wird UND ein Budget größer 1100 Euro/Monat zur Verfügung steht DANN wurde ein Erststudium im Studiengang Betriebswirtschaftslehre absolviert. Bei näherer Betrachtung der Datensätze fällt auf, dass lediglich ein Datensatz mit dem Erststudium Jura, ein Datensatz mit Lehramt und jeweils zwei Datensätze mit dem Erststudium Betriebswirtschaftslehre und Verfahrens- und Umwelttechnik vorliegen. Daraus lässt sich schließen, dass die erstellten Regeln in Bezug auf das zuvor durchgeführtes Erststudium der Befragten nicht aussagekräftig sind. 10

16 Bei dem zweiten Zielattribut mit einer Fehlerfreiheit von größer 80 Prozent Studium an der Hochschule Wismar aufgrund der Empfehlung wird von Knime gar kein Baum gebildet. Das heißt, dass kein logischer Zusammenhang mit anderen Datensätzen zu diesem Zielattribut gebildet werden kann. Zielattribut: Studium an der Hochschule Wismar aufgrund im Fragebogen nicht aufgeführter Gründe 1. WENN Wohnortnähe, Ruf der Hochschule, Studiengang und Empfehlung keine Gründe bei der Entscheidung für ein Studium an der Hochschule Wismar sind UND Finanzielle Gründe einen Grund bei der Entscheidung für ein Studium an der Hochschule Wismar darstellt UND die Person 26 oder älter Jahre alt ist DANN wurde die Entscheidung an der Hochschule Wismar zu studieren aufgrund anderer, nicht im Fragebogen aufgeführter Gründe getroffen. 2. WENN der Ruf der Hochschule und der Studiengang Gründe bei der Entscheidung für ein Studium an der Hochschule Wismar sind UND die Person sich mit dem Fahrrad in Wismar fortbewegt UND im ersten, dritten oder höheren Semester ist DANN wurde die Entscheidung an der Hochschule Wismar zu studieren aufgrund anderer, nicht im Fragebogen aufgeführter Gründe getroffen. Gleich dem zweiten Attribut wird auch bei dem vierten Attribut Zur Hochschule mit der Bahn kein Baum gebildet, was erneut bedeutet, dass kein logischer Zusammenhang mit anderen Datensätzen zu diesem Zielattribut gebildet werden kann. Zielattribut: Zur Hochschule mit dem Bus 1. WENN sich die Person mit dem Bus innerhalb Wismars fortbewegt UND das Studium Stunden/Woche in Anspruch nimmt DANN fährt die Person mit dem Bus zur Hochschule. Zielattribut: Zur Hochschule mit dem Auto 1. WENN sich die Person weder mit dem Bus, dem Fahrrad oder zu Fuß innerhalb Wismars fortbewegt UND die Person eine Wohnfläche von kleiner 10m² oder gleich bzw. größer 21m² für sich alleine zur Verfügung hat DANN fährt die Person mit dem Auto zur Hochschule. Gleich dem zweiten und viertem Attribut wird auch bei dem siebten Attribut Zur Hochschule mit dem Motorrad kein Baum gebildet, was erneut bedeutet, dass kein logischer Zusammenhang mit anderen Datensätzen zu diesem Zielattribut gebildet werden kann. 11

17 Zielattribut: Fortbewegung in Wismar mit dem Bus 1. WENN die Person mit dem Bus zur Hochschule fährt DANN bewegt sich die Person auch mit dem Bus innerhalb Wismars fort. Zielattribut: Fortbewegung in Wismar mit dem Fahrrad 1. WENN die Person weder mit dem Fahrrad noch mit dem Auto zur Hochschule fährt UND denkt, dass der Zeitaufwand je Woche für das Studium ausreichend ist UND die Person wegen Gründen, welche nicht im Fragebogen aufgeführt sind, sich für ein Studium an der Hochschule Wismar entschieden hat DANN bewegt sich die Person mit dem Fahrrad innerhalb Wismars fort. 2. WENN die Person weder mit dem Fahrrad noch mit dem Auto zur Hochschule fährt UND denkt, dass der Zeitaufwand je Woche für das Studium ausreichend ist UND sich die Person mit dem Bus innerhalb Wismars bewegt DANN bewegt sich die Person auch mit dem Fahrrad innerhalb Wismars fort Naive Bayes Naive Bayes ist ein Verfahren der Klassifikation, welches auf einem wahrscheinlichkeitsbasierten Ansatz beruht. Das heißt, dass ein Objekt der Klasse zugeordnet wird, zu der es mit der größten Wahrscheinlichkeit gehört. Voraussetzung für dieses Verfahren ist die Annahme, dass alle Attribute voneinander unabhängig sind. Es wird vorerst davon ausgegangen, dass keine direkten Abhängigkeiten bestehen. 12

18 Abbildung 4: Workflow Naive Bayes Der Workflow für dieses Verfahren beginnt ebenfalls mit dem Einlesen der Daten und der Umwandlung. Die vorliegenden Daten werden daraufhin in eine Trainings- und Testmenge unterteilt. Mit dem Naive Bayes Learner-Node wird nun für ein angegebenes Attribut die Werte bestimmt und mit Hilfe des Naive Bayes Predictor diese mit den Testdaten gegenübergestellt. Der Naive Bayes Learner ordnet bei diesem Vorgehen die Datensätze in die Klassen ein, zu denen sie anhand ihrer relativen Häufigkeiten zugeordnet werden können. Der Scorer dient zur Zusammenfassung der Daten und gibt in einer Confusion Matrix Auskunft über die richtigen und falschen Vorhersagen. Weiterhin gibt es die Möglichkeit sich die Accuracy Statistics anzeigen zu lassen, in der gegenübergestellt wird, welche Werte korrekt positiv oder negativ vorhergesagt worden sind. Das heißt, wenn ein Datensatz bei dem gewählten Attribut eine 3 aufweist und das Modell eine 3 vorhergesagt hat ist dies true positive. Mit Hilfe dieser Darstellung lässt sich ermitteln, wie hoch die Genauigkeit ist, in dem die Treffergenauigkeit (Accuracy) einfach abgelesen werden kann. Abbildung 5: Accuracy Statistics Auch bei diesem Verfahren wird in einem ersten Schritt die gesamte Datenmenge ohne Änderungen herangezogen. Die Daten werden in einem Verhältnis von 20:80 in eine Testund Trainingsmenge unterteilt. Die erste Durchführung dieses Verfahrens bezogen auf die Zufriedenheit der Lebenssituation führt zu einer Treffergenauigkeit von circa 44 Prozent. 13

19 Bei einer Erhöhung der Trainingsdaten können nur minimale bis keine Verbesserungen erzielt werden, so dass diese Voreinstellung keine Ergebnisveränderung nach sich zieht. Der Naive Bayes-Algorithmus beruht auf der Annahme, dass die Attribute unabhängig voneinander sind. Werden die bereits gewonnenen Erkenntnisse aus dem Apriori- Verfahren 5 berücksichtigt, wird deutlich, dass jedoch zwischen den Antwortmöglichkeiten der Multiple-Choice-Fragen durchaus eine Abhängigkeit besteht, da hier Konfidenzen von 1 ermittelt worden sind. Aufgrund dessen ist es sinnvoll, den bestehenden Workflow um einen Column Filter-Node zu erweitern um diese Attribute auszuschließen. Unter Ausschluss dieser Spalten ergibt sich ein leicht verbessertes Ergebnis von ca. 46 Prozent. Bei weiterer Anwendung dieses Verfahrens zeigte sich deutlich, dass eine sehr gute Treffergenauigkeit dann gegeben ist, wenn es sich um Attribute mit nur zwei Merkmalsausprägungen handelt, wie es bei den ja/nein Fragen der Fall ist. Dies führt bei einer einfachen Betrachtung der Treffergenauigkeit zu einer Verfälschung des Bildes, da eine Vorhersage von beispielsweise sechs Merkmalsausprägungen deutlich komplexer ist als bei einer Frage mit den Antwortmöglichkeiten ja/nein. Setzt man nun die ermittelte Treffergenauigkeit ins Verhältnis zu den Merkmalsausprägungen ergibt sich, dass dieses Verfahren ebenfalls am zuverlässigsten die Fragen nach dem Erststudium und der Leistung ermitteln konnte. Dieses Ergebnis lässt sich damit erklären, dass bei der Frage ob es sich um ein Erststudium handelt über 90 Prozent diese Frage mit Ja beantwortet haben. Auch die Antwortmöglichkeiten der Frage nach der Leistung beschränken sich mit über 80 Prozent auf gut und okay Clustering Der k-means-algorithmus zählt zu den Segmentierungsverfahren des Data Mining. Mit diesem Verfahren wird, wie der Begriff bereits deutlich macht, die Datenmenge in möglichst sinnvolle Klassen eingeteilt um unteranderem die anschließende Analyse der Daten zu erleichtern. Der k-means-algorithmus gehört dabei zu den häufigsten angewandten Algorithmen des Clustering und zerlegt dabei die Datenmenge in eine zuvor festgelegte Anzahl von Clustern. K-Means ist ein partitionierendes Verfahren, welches voraussetzt, dass jedes Cluster mindestens ein Objekt enthält und jedes Objekt genau einem Cluster zugeordnet ist. Für das Clustern mit k-means wurde der folgend dargestellte Workflow in KNIME erstellt. 5 Diese Ergebnisse werden im weiteren Verlauf der Arbeit noch vorgestellt 14

20 Abbildung 6: Workflow k-means-algorithmus Zunächst wurden die vorliegenden Daten mithilfe des Partitioning in eine Trainings- und eine Testmenge im Verhältnis 80:20 unterteilt. Anschließend erfolgte die Verknüpfung mit dem Algorithmus k-means, bei welchem die Anzahl der zu bildenden Cluster sowie die maximale Anzahl der Iterationsschritte festgelegt wurden. Die Ergebnisse wurden anschließend mithilfe des Scatter Plot und des Scorer visualisiert mit der Erkenntnis, dass keine aussagekräftige Ergebnisse bei unterschiedlich betrachteten Attributen und unterschiedlichen Clusteranzahl entstanden. Dies zeigt, dass sich für die vorliegende Datenmenge das Verfahren des k-means-clustering nicht eignet. Attribute, welche sinnvoll klassifiziert werden könnten wie beispielsweise das Alter, sind bereits bei der Erstellung der Umfrage in Klassen zusammengefasst worden Assoziationsanalyse Eine weitere Methode des Data Mining sind Assoziatationsanalysen. Mit diesen Analysen sollen Zusammenhänge zwischen Attributen dargestellt werden. Zusammenhänge können mit Hilfe von Wenn-Dann Regeln formuliert werden und geben Auskunft darüber, welche Merkmalsausprägungen gleichzeitig auftreten. Geeignete Kennzahlen, die die Stärke der Zusammenhänge aufweisen, stellen die Konfidenz und der Support dar. Die Relevanz einer Regel kann über den Support ausgedrückt werden. Er stellt die relative Häufigkeit der Regel an der Gesamtmenge dar. Betrachtet man nur die Menge der Attribute, die in einer Regel zusammengefasst worden sind und die Schnittmenge dieser Attribute spricht man von der Konfidenz. Der Zusammenhang der betrachteten Attribute ist somit umso stärker, je höher die Konfidenz ist. 15

21 In Knime gibt es verschiedene Nodes, die solche Assoziationsanalysen durchführen können. Zum einen gibt es den Apriori-Node und den Association Rule Learner-Node. Für die Erkennung von Zusammenhängen ist folgender Workflow erstellt worden: Abbildung 7: Workflow Assoziationsregeln Es sind verschiedene Vorgehensweisen getestet worden, die jedoch auf der gleichen Datenbasis beruhen. So sind die Datensätze nach dem Einlesen der Tabelle in eine nominale Form umgewandelt worden, so dass der Apriori-Algorithmus angewendet werden kann. In einem ersten Schritt sind alle Attribute mit Hilfe des Apriori-Node auf Zusammenhänge überprüft worden. Die Apriori-Node bietet die Möglichkeit Regeln zu erstellen, die innerhalb zuvor festgelegter Grenzen bezüglich der Konfidenz und des Supports liegen. Weiterhin muss eine Anzahl an zu erstellenden Regeln in der Voreinstellung angegeben werden. Bei einer allgemeinen Betrachtung der Zusammenhänge können auch Regeln aufgestellt werden, die zwar korrekt aber irrelevant sind. Um diesen Fall einzugrenzen können mit Hilfe eines Spaltefilters die Attribute ausgeschlossen werden, deren Zusammenhang für die weitere Betrachtung nicht von Interessen sind. Neben dem Apriori-Node bietet Knime weiterhin den Association Rule Learner-Node an, welcher auch den Apriori-Algorithmus verwendet. In diesem Fall ist es jedoch notwendig zuvor einen Bitvektor zu erstellen, welcher wiederum nur mit numerischen Daten arbeiten kann, sodass die Daten wieder in numerische Werte umgewandelt werden mussten um schließlich Assoziationsregeln erstellen zu können. Es sollen nun die verschiedenen Ergebnisse betrachtet werden, die mit Hilfe unterschiedlicher Verfahren ermittelt worden sind. 16

22 In einem ersten Schritt sind alle Attribute miteinander ins Verhältnis gesetzt worden unter der Prämisse, dass maximal 10 Regeln erstellt werden und eine minimale Konfidenz von 0,8 gegeben sein muss. In dieser Betrachtung ist deutlich geworden, dass die Multiple-Choice-Fragen die stärksten Zusammenhänge aufweisen, da hier direkte Abhängigkeiten bestehen. 1. Alter=21-25 finanz. Unterstützung=ja (109 DS) ==> Erststudium=ja conf:(0.97) 2. Geschlecht=weiblich Videospiele=kein Spieler (101 DS) ==> Erststudium=ja conf:(0.97) 3. Leistung=gut Mit Leistung zufrieden=ja (106 DS ==>Erststudium=ja conf:(0.96) 4. Leistung=gut ==> Erststudium=ja conf:(0.96) 5. Geschlecht=weiblich (129 DS) ==> Erststudium=ja conf:(0.96) 6. Alter=21-25 Ausbildung=nein (101 DS) ==> Erststudium=ja conf:(0.96) 7. Ausbildung=ja (110 DS) ==> Erststudium=ja conf:(0.95) 8. Videospiele=kein Spieler (152 DS) ==> Erststudium=ja conf:(0.95) 9. Alter=21-25 (146 DS) ==> Erststudium=ja conf:(0.95) 10. finanzunterstützung=ja (141 DS) ==> Erststudium=ja conf:(0.95) Es lässt sich aus diesen Assoziationsregeln zum Beispiel deutlich ein Zusammenhang zwischen dem Alter und dem Erststudium Multiple-Choice-Fragen erkennen. Es sind jedoch auch weiterhin Regeln erstellt worden, welche korrekt sind, jedoch keine Aufschlüsse bringen, wie Regel 5 mit dem Zusammenhang zwischen dem Geschlecht und dem Erststudium. Weiterhin ist es wenig sinnvoll einen Bezug zu der Frage nach dem Erststudium herstellen zu lassen, da diese Frage über 90 Prozent der Befragten mit Ja beantwortet haben. Blendet man in einem weiteren Schritt die Atrribute Geschlecht und Erststudium einmal aus ergeben sich weitere interessante Zusammenhänge. 1. Alter=21-25 Bafög=nein Mit Leistung zufrieden=ja ausreichend?=ja (38 DS) ==> finanz. Unterstützung=ja (37 DS) conf:(0.97) 2. Ausbildung=nein Arbeitsmarkt=gut Bafög=nein (37 DS) ==> finanz. Unterstützung=ja (36 DS) conf:(0.97) 3. Ausbildung=nein finanz Unterstützung=ja Wochenenden=Alle (36 DS) ==> Alter=21-25 (35 DS) conf:(0.97) 4. Alter=21-25 Ausbildung=nein Bafög=nein Sport=ja (36 DS) ==> finanz. Unterstützung=ja (35 DS) conf:(0.97) 17

23 5. Alter=21-25 Bafög=ja Leistung=gut Mit Leistung zufrieden=ja (39 DS) ==>finanz. Unterstützung=ja (37 DS) conf:(0.95) 6. Wunschstudienort=ja Leistung=gut Zeitbedarf=20-30h (38 DS) ==>Mit Leistung zufrieden=ja (36 DS) conf:(0.95) Unter dieser Betrachtung zeigt sich deutlich ein starker Zusammenhang zwischen dem Empfang von Bafög und der finanziellen Unterstützung von den Eltern. Weiterhin zeigt sich, dass die Merkmalsausprägung mit der Leistung zufrieden = ja und einer Leistung von gut häufig zusammen auftreten. Die Problematik des Apriori-Algorithmus in Zusammenhang mit den vorliegenden Daten besteht darin, dass anders als bei einer Warenkorbanalyse zu jedem Datensatz bei allen Attributen eine Antwort vorliegt. So ist es selbstverständlich, dass circa. die Hälfte aller Datensätze bei der Frage nach dem Geschlecht männlich angekreuzt hat. Unter der Anwendung Association Rule Learner ergeben sich folgende Ergebnisse. Tabelle 5: Ergebnisse Association Rule Learner Diese Auswertung bietet den Vorteil, dass anhand des Supports zu erkennen ist, wie das Verhältnis der Item sets, der Menge der Attribute, zu der Gesamtmenge ist. Es wird jedoch keine direkte Merkmalsausprägung der Attribute angegeben. 18

24 4. Abschließende Bewertung Für die Untersuchung der Umfragedaten der Direktstudenten im Bereich Wirtschaft an der Hochschule Wismar wurden unterschiedliche Verfahren des Data Mining mit der Software Knime angewendet. Die Ergebnisse der Verfahren bzw. Algorithmen k-means, NaiveBayes, k-nearest Neighbor und der Algorithmus C4.5 fielen verschieden aus. In der folgenden Tabelle sind die fehlerfreien, das heißt jeweils richtig prognostizierte Werte der Verfahren im Durchschnitt gegenübergestellt. Algorithmus Durchschnittliche Fehlerfreiheit in Prozent k-means 0 k-nearest Neighbor 61 NaiveBayes 63 C Apriori ---- Tabelle 6: Vergleich der Algorithmen nach durchschnittlicher Fehlerfreiheit Wie in der Tabelle zu erkennen, hat das Entscheidungsbaumverfahren mit 67 Prozent unter Anwendung des C4.5-Algorithmus die höchste durchschnittliche Fehlerfreiheit bei der Datenprognose. Zu erwähnen ist bei diesem Ergebnis jedoch, dass überwiegend Attribute eine Fehlerfreiheit größer 80 Prozent besitzen, bei welchen Ausprägungen vorhergesagt werden, welche nur wenige Daten aufweisen. Weiterhin ist bei der Anwendung des J48-Node aufgefallen, dass viele verschiedene Einstellungen vorgenommen werden können, welche durchgehend unterschiedliche Bäume erzeugten, welche wiederum in ihrer Baumstruktur in keiner Weise miteinander vergleichbar waren. Ebenfalls ist es mit diesem Node nicht möglich Angaben über die Anzahl der Item sets zur erfahren. So wurde zwar ein Baum zu dem Zielattribut Erststudium mit einer Fehlerfreiheit von 95 Prozent erzeugt, doch waren hiervon die Attributausprägungen lediglich zwei Mal im Datensatz vorhanden, welcher zu einem nicht aussagekräftigen Ergebnis führt. Positiv zu dem J48-Node sowie dem Entscheidungsbaumverfahren im Allgemeinen ist jedoch zu nennen, dass die Ergebnisse übersichtlich und leicht verständlich dargestellt werden. Die zweithöchste Fehlerfreiheit besitzt der Naive Bayes-Algorithmus. Hier ist zu erwähnen, dass die Ermittlung der Fehlerfreiheit leicht, die Distanz zwischen den prognostizierten und tatsächlichen Werten hingegen nur manuell zu ermitteln ist. Dem Naive Bayes-Algorithmus folgt mit einer Fehlerfreiheit von 61 Prozent der k-nearest Neighbor-Algorithmus. Dieser wurde in dieser Projektarbeit unter anderem für die Datenvorbereitung, im engeren Sinne für die Ermittlung fehlender Daten verwendet. 19

25 Negativ aufgefallen ist bei diesem Node, dass der k-wert zuvor in den Einstellungen angegeben werden muss, also der beste k-wert manuell durch ausprobieren zuvor zu ermitteln ist. Positiv zu dem K Nearest Neighbor-Node ist zu nennen, dass die Wahrscheinlichkeiten der jeweiligen Attributausprägungen unter Classified Data angegeben werden. Eine Fehlerfreiheit von null Prozent wurde durchgängig bei dem k-means-algorithmus angezeigt, aus dem Grund dass eine Berechnung der Fehlerfreiheit beim Clustering nicht erfolgen kann. Die Ergebnisse jedoch waren nicht sinnvoll und aussagekräftig. Bereits im View des Scatter Plots war deutlich zu erkennen, dass einzelne Attribute keinem konkreten Cluster zugeordnet werden konnten. Im Allgemeinen ist die Cluster-Analyse gut für die Datenvereinfachung geeignet, da somit zuvor nicht bestehende Klassen gebildet werden können. Jedoch wurden in diesem Projekt bereits sinnvolle Attributausprägungen wie beispielsweise das Alter im Fragebogen gruppiert. Negativ zu dem k-means-node in Knime ist zu nennen, dass ausschließlich Medianwerte der Attribute in den jeweiligen Clustern angegeben werden, nicht die konkreten Attribute welche mit einbezogen wurden. Keinen Wert für die Fehlerfreiheit lieferte das Apriori-Node. Hier kann lediglich die Konfidenz der einzelnen Regeln angezeigt werden. Diesbezüglich ist jedoch zu sagen, dass der Apriori-Algorithmus ein zuverlässiges Verfahren darstellt, da ein Support zu den jeweiligen Regeln von 95 Prozent bestand. Einige Regeln erreichten sogar eine Konfidenz von 100 Prozent, waren jedoch in der nachträglichen Interpretation ohne Sinn. Negativ ist zu dem Apriori-Node zu nennen, dass mit dem Association Rule Learner keine Attributausprägungen der jeweiligen Regeln ersichtlich waren und somit keine konkrete Aussage über die Zusammenhänge möglich ist. Gleich dem J48 -Node ist die Darstellung der Ergebnisse zwar leicht verständlich, doch wurden auch hier keine Angaben über die Item sets, d.h. die Anzahl der Datensätze der verwendeten Attributausprägungen, abgebildet. Zusammenfassend ist zu sagen, dass einige interessante Zusammenhänge der Datensätze mit den jeweiligen Verfahren in Knime ermittelt werden konnten. Um aussagekräftige Ergebnisse zu erzielen, ist eine Konzentration auf wenige gezielte Attribute notwendig. Bei der Analyse der Umfragedaten ist jedoch kein auffallend starker Zusammenhang zwischen Attributen deutlich geworden. Demnach wurde nicht deutlich auf welche Attribute die Konzentration für eine nähere Untersuchung gelegt werden sollte. 20

26 Literaturverzeichnis V. Literaturverzeichnis Gabriel, Roland/ Gluchowski, Peter/ Pastwa, Alexander (2009): Data Warehouse & Data Mining; W3L-Verlag: Herdecke, Witten Petersohn, Helge (2005): Data Mining: Verfahren, Prozesse, Anwendungsarchitektur; Oldenbourg Verlag: München, Wien VIII

27 Anhang VI. Anhang Frage In welchem Studiengang studierst Du?: In welchem Semester?: Geschlecht: Alter: Numerierung 1. Studiengang 2. Semester 3. Geschlecht 4. Alter Hast Du vor dem Studium eine Berufsausbildung abgeschlossen?: 5. Ausbildung Ist dies Dein Erststudium?: 6. Erststudium (numerisch) Was hast du im Erststudium studiert? Warum studierst Du in Wismar? Ist Wismar Dein Wunschstudienort?: Wie schätzt Du Deine Möglichkeiten auf dem Arbeitsmarkt nach abgeschlossenem Studium ein?: Erhältst Du BAföG?: Erhältst Du finanzielle Unterstützung von Deinen Eltern?: Wie viele Stunden gehst Du pro Woche arbeiten?: Wie hoch ist Dein monatliches Budget? Wie viele finanzielle Mittel stehen Dir monatlich zur Verfügung (inkl. aller Kosten)?: In welchen Wohnverhältnissen lebst Du?: Erststudium (nominal) 8.1. Ruf der Hochschule 8.2. Empfehlung 8.3. Wohnortnähe 8.4. Finanzielle Gründe 8.5. Studiengangsbedingt 8.6. Andere Gründe 9. Wunschstudienort 10. Arbeitsmarkt 11. Bafög 12. finanz Unterstützung 13. Arbeitszeit 15. Budget 16. Wohnverhältnis Wie viele m² in Deiner Wohnung stehen Dir alleine zur Verfügung?: 17. Wohnfläche Wie würdest Du Deine Leistung im Studium einschätzen?: Bist Du damit zufrieden?: Wie viel Zeit nimmt das Studium in der Woche in Anspruch (inkl. Lehrveranstaltungen)?: Denkst Du, dass das ausreichend ist?: Wie viele Stunden schaust Du in der Woche Fernsehen?: Wenn Ja, wie viele Stunden in der Woche?: Wie viele Wochenenden verbringst Du in Wismar? Treibst Du regelmäßig Sport?: Wie kommst Du zur Hochschule? Wie bewegst Du Dich **in** Wismar? 18. Leistung 19. Mit Leistung zufrieden 20. Zeitbedarf 21. ausreichend? 22. Fernseher 23. Videospiele 24. Wochenenden 25. Sport 26.1.Bahn Bus Auto Motorrad Fahrrad zu Fuß Anders Wismar Bus Wismar Auto Wismar Fahrrad Wismar zu Fuß IX

28 Wie zufrieden bist Du derzeit mit Deiner Lebenssituation als Student? Wismar Anders 28. Lebenssituation X

29 Ehrenwörtliche Erklärung VII. Ehrenwörtliche Erklärung Wir erklären hiermit ehrenwörtlich, dass wir die vorliegende Arbeit selbstständig angefertigt haben. Die aus fremden Quellen direkt oder indirekt übernommenen Gedanken sind als solche kenntlich gemacht. Es wurden keine anderen als die angegebenen Stellen und Hinweisen verwandt. Alle Quellen, die dem World Wide Web entnommen oder in einer sonstigen digitalen Form verwendet wurden, sind der Arbeit beigefügt. Der Durchführung einer elektronischen Plagiatsprüfung stimmen wir hiermit zu. Die eingereichte Datei entspricht der eingereichten Druckfassung. Die vorliegende Arbeit wurde bisher keiner anderen Prüfungsbehörde vorgelegt und auch noch nicht veröffentlicht. Wismar, den Sophie Wieckowski Sina-Maria Viehhofer XI

Data Mining Bericht. Analyse der Lebenssituation der Studenten. der Hochschule Wismar. Zur Veranstaltung. Business Intelligence

Data Mining Bericht. Analyse der Lebenssituation der Studenten. der Hochschule Wismar. Zur Veranstaltung. Business Intelligence Data Mining Bericht Analyse der Lebenssituation der Studenten der Hochschule Wismar Zur Veranstaltung Business Intelligence Eingereicht von: Mohamed Oukettou 108 208 Maxim Beifert 118 231 Vorgelegt von:

Mehr

Data Mining in KNIME

Data Mining in KNIME Fakultät für Wirtschaftswissenschaften Studiengang Master Digitale Logistik und Management Seminararbeit Data Mining in KNIME zur Veranstaltung Business Intelligence WS 2012/2013 Eingereicht von: Christian

Mehr

Dokumentation Datamining

Dokumentation Datamining Hochschule Wismar University of Applied Sciences Technology, Business and Design Fakultät für Ingenieurwissenschaften, Bereich EuI Dokumentation Datamining Eingereicht am: 13. Mai 2012 von: Karsten Diepelt

Mehr

DISKUSSIONSBEITRÄGE DER FAKULTÄT FÜR BETRIEBSWIRTSCHAFTSLEHRE MERCATOR SCHOOL OF MANAGEMENT UNIVERSITÄT DUISBURG-ESSEN. Nr. 374

DISKUSSIONSBEITRÄGE DER FAKULTÄT FÜR BETRIEBSWIRTSCHAFTSLEHRE MERCATOR SCHOOL OF MANAGEMENT UNIVERSITÄT DUISBURG-ESSEN. Nr. 374 DISKUSSIONSBEITRÄGE DER FAKULTÄT FÜR BETRIEBSWIRTSCHAFTSLEHRE MERCATOR SCHOOL OF MANAGEMENT UNIVERSITÄT DUISBURG-ESSEN Nr. 374 Eignung von Verfahren der Mustererkennung im Process Mining Sabrina Kohne

Mehr

Professionelle Seminare im Bereich MS-Office

Professionelle Seminare im Bereich MS-Office Der Name BEREICH.VERSCHIEBEN() ist etwas unglücklich gewählt. Man kann mit der Funktion Bereiche zwar verschieben, man kann Bereiche aber auch verkleinern oder vergrößern. Besser wäre es, die Funktion

Mehr

Erfolg und Vermögensrückgänge angefertigt im Rahmen der Lehrveranstaltung Nachrichtentechnik von: Eric Hansen, eric-hansen@gmx.de am: 07.09.

Erfolg und Vermögensrückgänge angefertigt im Rahmen der Lehrveranstaltung Nachrichtentechnik von: Eric Hansen, eric-hansen@gmx.de am: 07.09. Abstract zum Thema Handelssysteme Erfolg und Vermögensrückgänge angefertigt im Rahmen der Lehrveranstaltung Nachrichtentechnik von: Eric Hansen, eric-hansen@gmx.de am: 07.09.01 Einleitung: Handelssysteme

Mehr

geben. Die Wahrscheinlichkeit von 100% ist hier demnach nur der Gehen wir einmal davon aus, dass die von uns angenommenen

geben. Die Wahrscheinlichkeit von 100% ist hier demnach nur der Gehen wir einmal davon aus, dass die von uns angenommenen geben. Die Wahrscheinlichkeit von 100% ist hier demnach nur der Vollständigkeit halber aufgeführt. Gehen wir einmal davon aus, dass die von uns angenommenen 70% im Beispiel exakt berechnet sind. Was würde

Mehr

Dieses erste Kreisdiagramm, bezieht sich auf das gesamte Testergebnis der kompletten 182 getesteten Personen. Ergebnis

Dieses erste Kreisdiagramm, bezieht sich auf das gesamte Testergebnis der kompletten 182 getesteten Personen. Ergebnis Datenanalyse Auswertung Der Kern unseres Projektes liegt ganz klar bei der Fragestellung, ob es möglich ist, Biere von und geschmacklich auseinander halten zu können. Anhand der folgenden Grafiken, sollte

Mehr

Welche Unterschiede gibt es zwischen einem CAPAund einem Audiometrie- Test?

Welche Unterschiede gibt es zwischen einem CAPAund einem Audiometrie- Test? Welche Unterschiede gibt es zwischen einem CAPAund einem Audiometrie- Test? Auch wenn die Messungsmethoden ähnlich sind, ist das Ziel beider Systeme jedoch ein anderes. Gwenolé NEXER g.nexer@hearin gp

Mehr

Lineargleichungssysteme: Additions-/ Subtraktionsverfahren

Lineargleichungssysteme: Additions-/ Subtraktionsverfahren Lineargleichungssysteme: Additions-/ Subtraktionsverfahren W. Kippels 22. Februar 2014 Inhaltsverzeichnis 1 Einleitung 2 2 Lineargleichungssysteme zweiten Grades 2 3 Lineargleichungssysteme höheren als

Mehr

Handbuch ECDL 2003 Basic Modul 5: Datenbank Grundlagen von relationalen Datenbanken

Handbuch ECDL 2003 Basic Modul 5: Datenbank Grundlagen von relationalen Datenbanken Handbuch ECDL 2003 Basic Modul 5: Datenbank Grundlagen von relationalen Datenbanken Dateiname: ecdl5_01_00_documentation_standard.doc Speicherdatum: 14.02.2005 ECDL 2003 Basic Modul 5 Datenbank - Grundlagen

Mehr

Im Folgenden wird Ihnen an einem Beispiel erklärt, wie Sie Excel-Anlagen und Excel-Vorlagen erstellen können.

Im Folgenden wird Ihnen an einem Beispiel erklärt, wie Sie Excel-Anlagen und Excel-Vorlagen erstellen können. Excel-Schnittstelle Im Folgenden wird Ihnen an einem Beispiel erklärt, wie Sie Excel-Anlagen und Excel-Vorlagen erstellen können. Voraussetzung: Microsoft Office Excel ab Version 2000 Zum verwendeten Beispiel:

Mehr

Um zusammenfassende Berichte zu erstellen, gehen Sie folgendermaßen vor:

Um zusammenfassende Berichte zu erstellen, gehen Sie folgendermaßen vor: Ergebnisreport: mehrere Lehrveranstaltungen zusammenfassen 1 1. Ordner anlegen In der Rolle des Berichterstellers (siehe EvaSys-Editor links oben) können zusammenfassende Ergebnisberichte über mehrere

Mehr

Access Verbrecherdatenbank Teil 3

Access Verbrecherdatenbank Teil 3 Access Verbrecherdatenbank Teil 3 Allgemeines Im letzten Teil des Lehrgangs zu Microsoft Access erfährst du, wie man aus einer Datenbank Informationen herausfiltert, indem an Filter und Abfragen anwendet.

Mehr

Auswerten mit Excel. Viele Video-Tutorials auf Youtube z.b. http://www.youtube.com/watch?v=vuuky6xxjro

Auswerten mit Excel. Viele Video-Tutorials auf Youtube z.b. http://www.youtube.com/watch?v=vuuky6xxjro Auswerten mit Excel Viele Video-Tutorials auf Youtube z.b. http://www.youtube.com/watch?v=vuuky6xxjro 1. Pivot-Tabellen erstellen: In der Datenmaske in eine beliebige Zelle klicken Registerkarte Einfügen

Mehr

Ohne Fehler geht es nicht Doch wie viele Fehler sind erlaubt?

Ohne Fehler geht es nicht Doch wie viele Fehler sind erlaubt? Ohne Fehler geht es nicht Doch wie viele Fehler sind erlaubt? Behandelte Fragestellungen Was besagt eine Fehlerquote? Welche Bezugsgröße ist geeignet? Welche Fehlerquote ist gerade noch zulässig? Wie stellt

Mehr

Auszug aus der Auswertung der Befragung zur Ermittlung der IT-Basiskompetenz

Auszug aus der Auswertung der Befragung zur Ermittlung der IT-Basiskompetenz Auszug aus der Auswertung der Befragung zur Ermittlung der IT-Basiskompetenz Wir arbeiten in Strukturen von gestern mit Methoden von heute an Problemen von morgen, vorwiegend mit Menschen, die die Strukturen

Mehr

3. Verpackungskünstler. Berechnungen am Quader, Umgang mit Termen, räumliche Vorstellung

3. Verpackungskünstler. Berechnungen am Quader, Umgang mit Termen, räumliche Vorstellung Berechnungen am Quader, Umgang mit Termen, räumliche Vorstellung Päckchen, die man verschenken möchte, werden gerne mit Geschenkband verschnürt. Dazu wird das Päckchen auf seine größte Seite gelegt, wie

Mehr

euro-bis Import von Bestellungen aus Buch- und Aboauskunft Stand 22.02.2007

euro-bis Import von Bestellungen aus Buch- und Aboauskunft Stand 22.02.2007 euro-bis Import von Bestellungen aus Buch- und Aboauskunft Stand 22.02.2007 INHALTSVERZEICHNIS Konfiguration... 3 Buch- und Aboauskunft... 3 euro-bis... 3 Aufträge einlesen... 5 Kundendaten prüfen... 6

Mehr

Kulturelle Evolution 12

Kulturelle Evolution 12 3.3 Kulturelle Evolution Kulturelle Evolution Kulturelle Evolution 12 Seit die Menschen Erfindungen machen wie z.b. das Rad oder den Pflug, haben sie sich im Körperbau kaum mehr verändert. Dafür war einfach

Mehr

Abamsoft Finos im Zusammenspiel mit shop to date von DATA BECKER

Abamsoft Finos im Zusammenspiel mit shop to date von DATA BECKER Abamsoft Finos im Zusammenspiel mit shop to date von DATA BECKER Abamsoft Finos in Verbindung mit der Webshopanbindung wurde speziell auf die Shop-Software shop to date von DATA BECKER abgestimmt. Mit

Mehr

Datensicherung. Beschreibung der Datensicherung

Datensicherung. Beschreibung der Datensicherung Datensicherung Mit dem Datensicherungsprogramm können Sie Ihre persönlichen Daten problemlos Sichern. Es ist möglich eine komplette Datensicherung durchzuführen, aber auch nur die neuen und geänderten

Mehr

Multicheck Schülerumfrage 2013

Multicheck Schülerumfrage 2013 Multicheck Schülerumfrage 2013 Die gemeinsame Studie von Multicheck und Forschungsinstitut gfs-zürich Sonderauswertung ICT Berufsbildung Schweiz Auswertung der Fragen der ICT Berufsbildung Schweiz Wir

Mehr

Begriffsbestimmung CRISP-DM-Modell Betriebswirtschaftliche Einsatzgebiete des Data Mining Web Mining und Text Mining

Begriffsbestimmung CRISP-DM-Modell Betriebswirtschaftliche Einsatzgebiete des Data Mining Web Mining und Text Mining Gliederung 1. Einführung 2. Grundlagen Data Mining Begriffsbestimmung CRISP-DM-Modell Betriebswirtschaftliche Einsatzgebiete des Data Mining Web Mining und Text Mining 3. Ausgewählte Methoden des Data

Mehr

6. Bayes-Klassifikation. (Schukat-Talamazzini 2002)

6. Bayes-Klassifikation. (Schukat-Talamazzini 2002) 6. Bayes-Klassifikation (Schukat-Talamazzini 2002) (Böhm 2003) (Klawonn 2004) Der Satz von Bayes: Beweis: Klassifikation mittels des Satzes von Bayes (Klawonn 2004) Allgemeine Definition: Davon zu unterscheiden

Mehr

Studieren- Erklärungen und Tipps

Studieren- Erklärungen und Tipps Studieren- Erklärungen und Tipps Es gibt Berufe, die man nicht lernen kann, sondern für die man ein Studium machen muss. Das ist zum Beispiel so wenn man Arzt oder Lehrer werden möchte. Hat ihr Kind das

Mehr

Kurzeinführung Moodle

Kurzeinführung Moodle Kurzeinführung Moodle 1. Einstieg, Kursinhalte, Datei-Download Nachdem Sie sich erfolgreich registriert und eingeloggt haben, gelangen Sie zu Ihrer Hauptseite. Aktivieren Sie Meine Startsteite um Ihren/Ihre

Mehr

Die Beschreibung bezieht sich auf die Version Dreamweaver 4.0. In der Version MX ist die Sitedefinition leicht geändert worden.

Die Beschreibung bezieht sich auf die Version Dreamweaver 4.0. In der Version MX ist die Sitedefinition leicht geändert worden. In einer Website haben Seiten oft das gleiche Layout. Speziell beim Einsatz von Tabellen, in denen die Navigation auf der linken oder rechten Seite, oben oder unten eingesetzt wird. Diese Anteile der Website

Mehr

Verband der TÜV e. V. STUDIE ZUM IMAGE DER MPU

Verband der TÜV e. V. STUDIE ZUM IMAGE DER MPU Verband der TÜV e. V. STUDIE ZUM IMAGE DER MPU 2 DIE MEDIZINISCH-PSYCHOLOGISCHE UNTERSUCHUNG (MPU) IST HOCH ANGESEHEN Das Image der Medizinisch-Psychologischen Untersuchung (MPU) ist zwiespältig: Das ist

Mehr

Excel Pivot-Tabellen 2010 effektiv

Excel Pivot-Tabellen 2010 effektiv 7.2 Berechnete Felder Falls in der Datenquelle die Zahlen nicht in der Form vorliegen wie Sie diese benötigen, können Sie die gewünschten Ergebnisse mit Formeln berechnen. Dazu erzeugen Sie ein berechnetes

Mehr

Schnelle Antwort, gute klare Beratung. Ich bin wirklich sehr zufrieden. Auswertung der Mandantenbefragung 2007

Schnelle Antwort, gute klare Beratung. Ich bin wirklich sehr zufrieden. Auswertung der Mandantenbefragung 2007 Schnelle Antwort, gute klare Beratung. Ich bin wirklich sehr zufrieden. Auswertung der Mandantenbefragung 2007 Juli 2007 DGB Rechtsschutz GmbH Seite 1 Inhaltsangabe Vorbemerkung und allgemeine Hinweise

Mehr

Das große ElterngeldPlus 1x1. Alles über das ElterngeldPlus. Wer kann ElterngeldPlus beantragen? ElterngeldPlus verstehen ein paar einleitende Fakten

Das große ElterngeldPlus 1x1. Alles über das ElterngeldPlus. Wer kann ElterngeldPlus beantragen? ElterngeldPlus verstehen ein paar einleitende Fakten Das große x -4 Alles über das Wer kann beantragen? Generell kann jeder beantragen! Eltern (Mütter UND Väter), die schon während ihrer Elternzeit wieder in Teilzeit arbeiten möchten. Eltern, die während

Mehr

Zahlen auf einen Blick

Zahlen auf einen Blick Zahlen auf einen Blick Nicht ohne Grund heißt es: Ein Bild sagt mehr als 1000 Worte. Die meisten Menschen nehmen Informationen schneller auf und behalten diese eher, wenn sie als Schaubild dargeboten werden.

Mehr

Schritt für Schritt zur Krankenstandsstatistik

Schritt für Schritt zur Krankenstandsstatistik Schritt für Schritt zur Krankenstandsstatistik Eine Anleitung zur Nutzung der Excel-Tabellen zur Erhebung des Krankenstands. Entwickelt durch: Kooperationsprojekt Arbeitsschutz in der ambulanten Pflege

Mehr

Berechnung der Erhöhung der Durchschnittsprämien

Berechnung der Erhöhung der Durchschnittsprämien Wolfram Fischer Berechnung der Erhöhung der Durchschnittsprämien Oktober 2004 1 Zusammenfassung Zur Berechnung der Durchschnittsprämien wird das gesamte gemeldete Prämienvolumen Zusammenfassung durch die

Mehr

Auswertung des Fragebogens zum CO2-Fußabdruck

Auswertung des Fragebogens zum CO2-Fußabdruck Auswertung des Fragebogens zum CO2-Fußabdruck Um Ähnlichkeiten und Unterschiede im CO2-Verbrauch zwischen unseren Ländern zu untersuchen, haben wir eine Online-Umfrage zum CO2- Fußabdruck durchgeführt.

Mehr

3. GLIEDERUNG. Aufgabe:

3. GLIEDERUNG. Aufgabe: 3. GLIEDERUNG Aufgabe: In der Praxis ist es für einen Ausdruck, der nicht alle Detaildaten enthält, häufig notwendig, Zeilen oder Spalten einer Tabelle auszublenden. Auch eine übersichtlichere Darstellung

Mehr

LEITFADEN ZUR SCHÄTZUNG DER BEITRAGSNACHWEISE

LEITFADEN ZUR SCHÄTZUNG DER BEITRAGSNACHWEISE STOTAX GEHALT UND LOHN Stollfuß Medien LEITFADEN ZUR SCHÄTZUNG DER BEITRAGSNACHWEISE Stand 09.12.2009 Seit dem Januar 2006 hat der Gesetzgeber die Fälligkeit der SV-Beiträge vorgezogen. So kann es vorkommen,

Mehr

Werbemittelverwaltung

Werbemittelverwaltung Werbemittelverwaltung 1 Inhaltsverzeichnis Werbemittelverwaltung...1 Ihr Nutzen...3 Notwendige Stammdateneinstellungen...4 Das Anlegen einer Gruppe:... 4 Das Anlegen der Gruppeneinträge (Auswahl):... 4

Mehr

Mitarbeiterbefragung als PE- und OE-Instrument

Mitarbeiterbefragung als PE- und OE-Instrument Mitarbeiterbefragung als PE- und OE-Instrument 1. Was nützt die Mitarbeiterbefragung? Eine Mitarbeiterbefragung hat den Sinn, die Sichtweisen der im Unternehmen tätigen Menschen zu erkennen und für die

Mehr

AUF LETZTER SEITE DIESER ANLEITUNG!!!

AUF LETZTER SEITE DIESER ANLEITUNG!!! BELEG DATENABGLEICH: Der Beleg-Datenabgleich wird innerhalb des geöffneten Steuerfalls über ELSTER-Belegdaten abgleichen gestartet. Es werden Ihnen alle verfügbaren Belege zum Steuerfall im ersten Bildschirm

Mehr

FlowFact Alle Versionen

FlowFact Alle Versionen Training FlowFact Alle Versionen Stand: 29.09.2005 Rechnung schreiben Einführung Wie Sie inzwischen wissen, können die unterschiedlichsten Daten über verknüpfte Fenster miteinander verbunden werden. Für

Mehr

AZK 1- Freistil. Der Dialog "Arbeitszeitkonten" Grundsätzliches zum Dialog "Arbeitszeitkonten"

AZK 1- Freistil. Der Dialog Arbeitszeitkonten Grundsätzliches zum Dialog Arbeitszeitkonten AZK 1- Freistil Nur bei Bedarf werden dafür gekennzeichnete Lohnbestandteile (Stundenzahl und Stundensatz) zwischen dem aktuellen Bruttolohnjournal und dem AZK ausgetauscht. Das Ansparen und das Auszahlen

Mehr

1 topologisches Sortieren

1 topologisches Sortieren Wolfgang Hönig / Andreas Ecke WS 09/0 topologisches Sortieren. Überblick. Solange noch Knoten vorhanden: a) Suche Knoten v, zu dem keine Kante führt (Falls nicht vorhanden keine topologische Sortierung

Mehr

Zeichen bei Zahlen entschlüsseln

Zeichen bei Zahlen entschlüsseln Zeichen bei Zahlen entschlüsseln In diesem Kapitel... Verwendung des Zahlenstrahls Absolut richtige Bestimmung von absoluten Werten Operationen bei Zahlen mit Vorzeichen: Addieren, Subtrahieren, Multiplizieren

Mehr

Seite 1 von 14. Cookie-Einstellungen verschiedener Browser

Seite 1 von 14. Cookie-Einstellungen verschiedener Browser Seite 1 von 14 Cookie-Einstellungen verschiedener Browser Cookie-Einstellungen verschiedener Browser, 7. Dezember 2015 Inhaltsverzeichnis 1.Aktivierung von Cookies... 3 2.Cookies... 3 2.1.Wofu r braucht

Mehr

EasyWk DAS Schwimmwettkampfprogramm

EasyWk DAS Schwimmwettkampfprogramm EasyWk DAS Schwimmwettkampfprogramm Arbeiten mit OMEGA ARES 21 EasyWk - DAS Schwimmwettkampfprogramm 1 Einleitung Diese Präsentation dient zur Darstellung der Zusammenarbeit zwischen EasyWk und der Zeitmessanlage

Mehr

Das RSA-Verschlüsselungsverfahren 1 Christian Vollmer

Das RSA-Verschlüsselungsverfahren 1 Christian Vollmer Das RSA-Verschlüsselungsverfahren 1 Christian Vollmer Allgemein: Das RSA-Verschlüsselungsverfahren ist ein häufig benutztes Verschlüsselungsverfahren, weil es sehr sicher ist. Es gehört zu der Klasse der

Mehr

TECHNISCHE INFORMATION LESSOR LOHN/GEHALT BEITRAGSNACHWEIS-AUSGLEICH BUCH.-BLATT MICROSOFT DYNAMICS NAV

TECHNISCHE INFORMATION LESSOR LOHN/GEHALT BEITRAGSNACHWEIS-AUSGLEICH BUCH.-BLATT MICROSOFT DYNAMICS NAV MICROSOFT DYNAMICS NAV Inhaltsverzeichnis TECHNISCHE INFORMATION: Einleitung... 3 LESSOR LOHN/GEHALT Beschreibung... 3 Prüfung der Ausgleichszeilen... 9 Zurücksetzen der Ausgleichsroutine... 12 Vorgehensweise

Mehr

Schulberichtssystem. Inhaltsverzeichnis

Schulberichtssystem. Inhaltsverzeichnis Schulberichtssystem Inhaltsverzeichnis 1. Erfassen der Schüler im SBS...2 2. Erzeugen der Export-Datei im SBS...3 3. Die SBS-Datei ins FuxMedia-Programm einlesen...4 4. Daten von FuxMedia ins SBS übertragen...6

Mehr

etutor Benutzerhandbuch XQuery Benutzerhandbuch Georg Nitsche

etutor Benutzerhandbuch XQuery Benutzerhandbuch Georg Nitsche etutor Benutzerhandbuch Benutzerhandbuch XQuery Georg Nitsche Version 1.0 Stand März 2006 Versionsverlauf: Version Autor Datum Änderungen 1.0 gn 06.03.2006 Fertigstellung der ersten Version Inhaltsverzeichnis:

Mehr

Tipp III: Leiten Sie eine immer direkt anwendbare Formel her zur Berechnung der sogenannten "bedingten Wahrscheinlichkeit".

Tipp III: Leiten Sie eine immer direkt anwendbare Formel her zur Berechnung der sogenannten bedingten Wahrscheinlichkeit. Mathematik- Unterrichts- Einheiten- Datei e. V. Klasse 9 12 04/2015 Diabetes-Test Infos: www.mued.de Blutspenden werden auf Diabetes untersucht, das mit 8 % in der Bevölkerung verbreitet ist. Dabei werden

Mehr

Kapitel 3 Frames Seite 1

Kapitel 3 Frames Seite 1 Kapitel 3 Frames Seite 1 3 Frames 3.1 Allgemeines Mit Frames teilt man eine HTML-Seite in mehrere Bereiche ein. Eine Seite, die mit Frames aufgeteilt ist, besteht aus mehreren Einzelseiten, die sich den

Mehr

50. Mathematik-Olympiade 2. Stufe (Regionalrunde) Klasse 11 13. 501322 Lösung 10 Punkte

50. Mathematik-Olympiade 2. Stufe (Regionalrunde) Klasse 11 13. 501322 Lösung 10 Punkte 50. Mathematik-Olympiade. Stufe (Regionalrunde) Klasse 3 Lösungen c 00 Aufgabenausschuss des Mathematik-Olympiaden e.v. www.mathematik-olympiaden.de. Alle Rechte vorbehalten. 503 Lösung 0 Punkte Es seien

Mehr

«/Mehrere Umfragen in einer Umfrage durchführen» Anleitung

«/Mehrere Umfragen in einer Umfrage durchführen» Anleitung QuickStart «/Mehrere Umfragen in einer Umfrage durchführen» Anleitung Mehrere Umfragen in einer Umfrage durchführen Mögliches Szenario oder wann Sie davon Gebrauch machen können Sie führen regelmässig

Mehr

Task: Nmap Skripte ausführen

Task: Nmap Skripte ausführen Task: Nmap Skripte ausführen Inhalt Einfache Netzwerkscans mit NSE Ausführen des Scans Anpassung der Parameter Einleitung Copyright 2009-2015 Greenbone Networks GmbH Herkunft und aktuellste Version dieses

Mehr

OECD Programme for International Student Assessment PISA 2000. Lösungen der Beispielaufgaben aus dem Mathematiktest. Deutschland

OECD Programme for International Student Assessment PISA 2000. Lösungen der Beispielaufgaben aus dem Mathematiktest. Deutschland OECD Programme for International Student Assessment Deutschland PISA 2000 Lösungen der Beispielaufgaben aus dem Mathematiktest Beispielaufgaben PISA-Hauptstudie 2000 Seite 3 UNIT ÄPFEL Beispielaufgaben

Mehr

Partitionieren in Vista und Windows 7/8

Partitionieren in Vista und Windows 7/8 Partitionieren in Vista und Windows 7/8 Windows Vista und Windows 7 können von Haus aus Festplatten partitionieren. Doch die Funktion ist etwas schwer zu entdecken, denn sie heißt "Volume verkleinern".

Mehr

Zahlenwinkel: Forscherkarte 1. alleine. Zahlenwinkel: Forschertipp 1

Zahlenwinkel: Forscherkarte 1. alleine. Zahlenwinkel: Forschertipp 1 Zahlenwinkel: Forscherkarte 1 alleine Tipp 1 Lege die Ziffern von 1 bis 9 so in den Zahlenwinkel, dass jeder Arm des Zahlenwinkels zusammengezählt das gleiche Ergebnis ergibt! Finde möglichst viele verschiedene

Mehr

Inkrementelles Backup

Inkrementelles Backup Inkrementelles Backup Im Gegensatz zu einer kompletten Sicherung aller Daten werden bei einer inkrementellen Sicherung immer nur die Dateien gesichert, die seit der letzten inkrementellen Sicherung neu

Mehr

eduvote Ein Umfragesystem für Lehrveranstaltungen - PowerPoint Add-In -

eduvote Ein Umfragesystem für Lehrveranstaltungen - PowerPoint Add-In - eduvote Ein Umfragesystem für Lehrveranstaltungen - PowerPoint Add-In - Übersicht: Nach dem Herunterladen und Ausführen des Installationsprogamms für das eduvote PowerPoint Add-In befindet sich rechts

Mehr

Eine der Aktien hat immer einen höheren Gewinn als die andere Aktie. Ihre Aufgabe ist es diese auszuwählen.

Eine der Aktien hat immer einen höheren Gewinn als die andere Aktie. Ihre Aufgabe ist es diese auszuwählen. Instruktionen am Anfang von Experiment 1 (auf Papier ausgeteilt: grünmarkierte Textstellen zeigen den Instruktionstext in der jeweiligen Bedingung an; Kommentare sind gelb markiert.) Stellen Sie sich vor,

Mehr

Ust.-VA ab 01.01.2013. Release 1.0.0

Ust.-VA ab 01.01.2013. Release 1.0.0 Ust.-VA ab 01.01.2013 Release 1.0.0 2012 myfactory International GmbH Seite 1 von 9 Ohne ausdrückliche schriftliche Erlaubnis dürfen weder das Handbuch noch Auszüge daraus mit mechanischen oder elektronischen

Mehr

Du hast hier die Möglichkeit Adressen zu erfassen, Lieferscheine & Rechnungen zu drucken und Deine Artikel zu verwalten.

Du hast hier die Möglichkeit Adressen zu erfassen, Lieferscheine & Rechnungen zu drucken und Deine Artikel zu verwalten. Bedienungsanleitung Professionell aussehende Rechnungen machen einen guten Eindruck vor allem wenn du gerade am Beginn deiner Unternehmung bist. Diese Vorlage ist für den Beginn und für wenige Rechnungen

Mehr

Ohne den gewerkschaftlichen Rechtsschutz hätte ich meine Rechte nicht durchsetzen können.

Ohne den gewerkschaftlichen Rechtsschutz hätte ich meine Rechte nicht durchsetzen können. Ohne den gewerkschaftlichen Rechtsschutz hätte ich meine Rechte nicht durchsetzen können. Auswertung der Mandantenbefragung 2009 Kurzfassung November 2009 DGB Rechtsschutz GmbH Seite 1 Inhaltsangabe Vorbemerkung

Mehr

A1.7: Entropie natürlicher Texte

A1.7: Entropie natürlicher Texte A1.7: Entropie natürlicher Texte Anfang der 1950er Jahre hat Claude E. Shannon die Entropie H der englischen Sprache mit einem bit pro Zeichen abgeschätzt. Kurz darauf kam Karl Küpfmüller bei einer empirischen

Mehr

Überprüfung der digital signierten E-Rechnung

Überprüfung der digital signierten E-Rechnung Überprüfung der digital signierten E-Rechnung Aufgrund des BMF-Erlasses vom Juli 2005 (BMF-010219/0183-IV/9/2005) gelten ab 01.01.2006 nur noch jene elektronischen Rechnungen als vorsteuerabzugspflichtig,

Mehr

Kostenstellen verwalten. Tipps & Tricks

Kostenstellen verwalten. Tipps & Tricks Tipps & Tricks INHALT SEITE 1.1 Kostenstellen erstellen 3 13 1.3 Zugriffsberechtigungen überprüfen 30 2 1.1 Kostenstellen erstellen Mein Profil 3 1.1 Kostenstellen erstellen Kostenstelle(n) verwalten 4

Mehr

Anleitung zur Online-Bewerbung für die Lehramtsstudiengänge

Anleitung zur Online-Bewerbung für die Lehramtsstudiengänge CampusCenter Alsterterrasse 1 20354 Hamburg Tel.: 040-42838-7000 Anleitung zur Online-Bewerbung für die Lehramtsstudiengänge Bewerbungsbeispiel: Lehramt an Gymnasien (BA und MA) Wichtiger Hinweis: Sie

Mehr

Anleitung zur Datensicherung und -rücksicherung in der VR-NetWorld Software

Anleitung zur Datensicherung und -rücksicherung in der VR-NetWorld Software Anleitung zur Datensicherung und -rücksicherung in der VR-NetWorld Software Damit Sie bei einer Neuinstallation auf Ihren alten Datenbestand zurückgreifen können, empfehlen wir die regelmäßige Anlage von

Mehr

Inhaltsverzeichnis SEITE 1. Der User Guide in drei Schritten 2. Erste Schritte 2. Wieviel habe ich gearbeitet verdient? 5

Inhaltsverzeichnis SEITE 1. Der User Guide in drei Schritten 2. Erste Schritte 2. Wieviel habe ich gearbeitet verdient? 5 Inhaltsverzeichnis Der User Guide in drei Schritten 2 Erste Schritte 2 Wieviel habe ich gearbeitet verdient? 5 Verwaltung meines eigenen Kontos 6 SEITE 1 Allgemeines Dieses Benutzerhandbuch erklärt die

Mehr

Ihr Weg in die Suchmaschinen

Ihr Weg in die Suchmaschinen Ihr Weg in die Suchmaschinen Suchmaschinenoptimierung Durch Suchmaschinenoptimierung kann man eine höhere Platzierung von Homepages in den Ergebnislisten von Suchmaschinen erreichen und somit mehr Besucher

Mehr

Erfahrungen mit Hartz IV- Empfängern

Erfahrungen mit Hartz IV- Empfängern Erfahrungen mit Hartz IV- Empfängern Ausgewählte Ergebnisse einer Befragung von Unternehmen aus den Branchen Gastronomie, Pflege und Handwerk Pressegespräch der Bundesagentur für Arbeit am 12. November

Mehr

Kinderarmut. 1. Kapitel: Kinderarmut in der Welt

Kinderarmut. 1. Kapitel: Kinderarmut in der Welt Kinderarmut 1. Kapitel: Kinderarmut in der Welt Armut gibt es überall auf der Welt und Armut ist doch sehr unterschiedlich. Armut? Was ist das? Woher kommt das? wieso haben die einen viel und die anderen

Mehr

reimus.net GmbH RS-Bilanzanalyse Handbuch zum Excel-Tool

reimus.net GmbH RS-Bilanzanalyse Handbuch zum Excel-Tool reimus.net GmbH RS-Bilanzanalyse Handbuch zum Excel-Tool Inhaltsverzeichnis Abbildungsverzeichnis... 2 Detailbeschreibung... 3 Eingabemaske Bilanz... 4 Eingabemaske Gewinn- und Verlustrechnung... 5 Eingabemaske

Mehr

4 Aufzählungen und Listen erstellen

4 Aufzählungen und Listen erstellen 4 4 Aufzählungen und Listen erstellen Beim Strukturieren von Dokumenten und Inhalten stellen Listen und Aufzählungen wichtige Werkzeuge dar. Mit ihnen lässt sich so ziemlich alles sortieren, was auf einer

Mehr

Handbuch Offline-Abgleich

Handbuch Offline-Abgleich Handbuch Offline-Abgleich Inhalt Handbuch Offline-Abgleich...1 Einleitung...3 Voraussetzungen...3 Aufruf des Offline-Abgleichs...3 Übersichtsseite...3 Wahl einer Liste...3 Wahl des Offline Abgleichs...4

Mehr

Funktionsbeschreibung. Lieferantenbewertung. von IT Consulting Kauka GmbH

Funktionsbeschreibung. Lieferantenbewertung. von IT Consulting Kauka GmbH Funktionsbeschreibung Lieferantenbewertung von IT Consulting Kauka GmbH Stand 16.02.2010 odul LBW Das Modul LBW... 3 1. Konfiguration... 4 1.1 ppm... 4 1.2 Zertifikate... 5 1.3 Reklamationsverhalten...

Mehr

Guide DynDNS und Portforwarding

Guide DynDNS und Portforwarding Guide DynDNS und Portforwarding Allgemein Um Geräte im lokalen Netzwerk von überall aus über das Internet erreichen zu können, kommt man um die Themen Dynamik DNS (kurz DynDNS) und Portweiterleitung(auch

Mehr

Meet the Germans. Lerntipp zur Schulung der Fertigkeit des Sprechens. Lerntipp und Redemittel zur Präsentation oder einen Vortrag halten

Meet the Germans. Lerntipp zur Schulung der Fertigkeit des Sprechens. Lerntipp und Redemittel zur Präsentation oder einen Vortrag halten Meet the Germans Lerntipp zur Schulung der Fertigkeit des Sprechens Lerntipp und Redemittel zur Präsentation oder einen Vortrag halten Handreichungen für die Kursleitung Seite 2, Meet the Germans 2. Lerntipp

Mehr

Folgeanleitung für Klassenlehrer

Folgeanleitung für Klassenlehrer Folgeanleitung für Klassenlehrer 1. Das richtige Halbjahr einstellen Stellen sie bitte zunächst das richtige Schul- und Halbjahr ein. Ist das korrekte Schul- und Halbjahr eingestellt, leuchtet die Fläche

Mehr

Daten sammeln, darstellen, auswerten

Daten sammeln, darstellen, auswerten Vertiefen 1 Daten sammeln, darstellen, auswerten zu Aufgabe 1 Schulbuch, Seite 22 1 Haustiere zählen In der Tabelle rechts stehen die Haustiere der Kinder aus der Klasse 5b. a) Wie oft wurden die Haustiere

Mehr

Unterrichtsmaterialien in digitaler und in gedruckter Form. Auszug aus: Übungsbuch für den Grundkurs mit Tipps und Lösungen: Analysis

Unterrichtsmaterialien in digitaler und in gedruckter Form. Auszug aus: Übungsbuch für den Grundkurs mit Tipps und Lösungen: Analysis Unterrichtsmaterialien in digitaler und in gedruckter Form Auszug aus: Übungsbuch für den Grundkurs mit Tipps und Lösungen: Analysis Das komplette Material finden Sie hier: Download bei School-Scout.de

Mehr

Was ist clevere Altersvorsorge?

Was ist clevere Altersvorsorge? Was ist clevere Altersvorsorge? Um eine gute Altersvorsorge zu erreichen, ist es clever einen unabhängigen Berater auszuwählen Angestellte bzw. Berater von Banken, Versicherungen, Fondsgesellschaften und

Mehr

ONLINE-AKADEMIE. "Diplomierter NLP Anwender für Schule und Unterricht" Ziele

ONLINE-AKADEMIE. Diplomierter NLP Anwender für Schule und Unterricht Ziele ONLINE-AKADEMIE Ziele Wenn man von Menschen hört, die etwas Großartiges in ihrem Leben geleistet haben, erfahren wir oft, dass diese ihr Ziel über Jahre verfolgt haben oder diesen Wunsch schon bereits

Mehr

Fachbericht zum Thema: Anforderungen an ein Datenbanksystem

Fachbericht zum Thema: Anforderungen an ein Datenbanksystem Fachbericht zum Thema: Anforderungen an ein Datenbanksystem von André Franken 1 Inhaltsverzeichnis 1 Inhaltsverzeichnis 1 2 Einführung 2 2.1 Gründe für den Einsatz von DB-Systemen 2 2.2 Definition: Datenbank

Mehr

Fragebogen: Abschlussbefragung

Fragebogen: Abschlussbefragung Fragebogen: Abschlussbefragung Vielen Dank, dass Sie die Ameise - Schulung durchgeführt haben. Abschließend möchten wir Ihnen noch einige Fragen zu Ihrer subjektiven Einschätzung unseres Simulationssystems,

Mehr

Stellen Sie bitte den Cursor in die Spalte B2 und rufen die Funktion Sverweis auf. Es öffnet sich folgendes Dialogfenster

Stellen Sie bitte den Cursor in die Spalte B2 und rufen die Funktion Sverweis auf. Es öffnet sich folgendes Dialogfenster Es gibt in Excel unter anderem die so genannten Suchfunktionen / Matrixfunktionen Damit können Sie Werte innerhalb eines bestimmten Bereichs suchen. Als Beispiel möchte ich die Funktion Sverweis zeigen.

Mehr

1 Mathematische Grundlagen

1 Mathematische Grundlagen Mathematische Grundlagen - 1-1 Mathematische Grundlagen Der Begriff der Menge ist einer der grundlegenden Begriffe in der Mathematik. Mengen dienen dazu, Dinge oder Objekte zu einer Einheit zusammenzufassen.

Mehr

Anwendungshinweise zur Anwendung der Soziometrie

Anwendungshinweise zur Anwendung der Soziometrie Anwendungshinweise zur Anwendung der Soziometrie Einführung Die Soziometrie ist ein Verfahren, welches sich besonders gut dafür eignet, Beziehungen zwischen Mitgliedern einer Gruppe darzustellen. Das Verfahren

Mehr

Konzepte der Informatik

Konzepte der Informatik Konzepte der Informatik Vorkurs Informatik zum WS 2011/2012 26.09. - 30.09.2011 17.10. - 21.10.2011 Dr. Werner Struckmann / Christoph Peltz Stark angelehnt an Kapitel 1 aus "Abenteuer Informatik" von Jens

Mehr

LSF-Anleitung für Studierende

LSF-Anleitung für Studierende LSF-Anleitung für Studierende 1. Veranstaltungen Beim Anklicken der Option Veranstaltung finden Sie unter der Navigationsleiste: Vorlesungsverzeichnis Suche nach Veranstaltungen Stundenpläne Stundenpläne

Mehr

Tevalo Handbuch v 1.1 vom 10.11.2011

Tevalo Handbuch v 1.1 vom 10.11.2011 Tevalo Handbuch v 1.1 vom 10.11.2011 Inhalt Registrierung... 3 Kennwort vergessen... 3 Startseite nach dem Login... 4 Umfrage erstellen... 4 Fragebogen Vorschau... 7 Umfrage fertigstellen... 7 Öffentliche

Mehr

Dein Sprung in die Zukunft. Ausbildung und duales Studium bei Airbus. Anleitung zur Online-Bewerbung

Dein Sprung in die Zukunft. Ausbildung und duales Studium bei Airbus. Anleitung zur Online-Bewerbung Dein Sprung in die Zukunft. Ausbildung und duales Studium bei Airbus Anleitung zur Online-Bewerbung Wie bereite ich meine Online-Bewerbung vor? Du brauchst für die Bewerbung alle wichtigen Daten zu deiner

Mehr

Folgeanleitung für Fachlehrer

Folgeanleitung für Fachlehrer 1. Das richtige Halbjahr einstellen Folgeanleitung für Fachlehrer Stellen sie bitte zunächst das richtige Schul- und Halbjahr ein. Ist das korrekte Schul- und Halbjahr eingestellt, leuchtet die Fläche

Mehr

E@SY WEB LEBEN: Beratungseinstieg über Risikoklassen Leitfaden

E@SY WEB LEBEN: Beratungseinstieg über Risikoklassen Leitfaden Geschäftspartner Risikoklassen April 2013 INFOS & FAKTEN E@SY WEB LEBEN: Beratungseinstieg über Risikoklassen Leitfaden Beratungscockpit Wenn Sie sich erfolgreich in E@SY WEB LEBEN angemeldet haben, gelangen

Mehr

Primzahlen und RSA-Verschlüsselung

Primzahlen und RSA-Verschlüsselung Primzahlen und RSA-Verschlüsselung Michael Fütterer und Jonathan Zachhuber 1 Einiges zu Primzahlen Ein paar Definitionen: Wir bezeichnen mit Z die Menge der positiven und negativen ganzen Zahlen, also

Mehr

Handbuch Fischertechnik-Einzelteiltabelle V3.7.3

Handbuch Fischertechnik-Einzelteiltabelle V3.7.3 Handbuch Fischertechnik-Einzelteiltabelle V3.7.3 von Markus Mack Stand: Samstag, 17. April 2004 Inhaltsverzeichnis 1. Systemvorraussetzungen...3 2. Installation und Start...3 3. Anpassen der Tabelle...3

Mehr

Private Vorsorge für den Pflegefall

Private Vorsorge für den Pflegefall Private Vorsorge für den Pflegefall Bericht der IW Consult GmbH Köln, 10. August 2012 Institut der deutschen Wirtschaft Köln Consult GmbH Konrad-Adenauer-Ufer 21 50668 Köln Postanschrift: Postfach 10 19

Mehr