1 Predictive Analytics mit Random Forest

Größe: px
Ab Seite anzeigen:

Download "1 Predictive Analytics mit Random Forest"

Transkript

1 Predictive Analytics Demokratie im Wald 1

2 Agenda 1. Predictive Analytics Übersicht 2. Random Forest Grundkonzepte und Anwendungsfelder 3. Entscheidungsbaum Classification and Regression Tree (CART) 4. Bagging die Idee hinter dem Erfolg von Random Forest 5. Random Forest die Klassifikationsmethode im Detail 6. Random Forest Anwendungsbeispiele 7. Zusammenfassung 8. Quellen 9. Geplante nächste Termine 10.Themensammlung und -bewertung 3

3 Predictive Analytics??? Was ist Predictive Analytics? 4

4 Predictive Analytics Zwei Kinder Paradoxon Problem Eine Familie hat zwei Kinder, eins davon ist ein Junge. Wie hoch ist die Wahrscheinlichkeit, dass das zweite Kind auch ein Junge ist? Die meisten antworten: P = 1 2 Richtige Antwort: P = 1 3 Erläuterung Älteres Kind Junge Mädchen Junge Mädchen Jüngeres Kind Mädchen Junge Junge Mädchen 1 3 5

5 Predictive Analytics Geburtstagparadoxon Problem Wie hoch ist die Wahrscheinlichkeit, dass in einem Raum von n=50 Personen mindestens zwei am selben Tag im Jahr Geburtstag feiern? Richtiger Antwort P = 97% Erläuterung Es ist einfacher die Gegenwahrscheinlichkeit zu berechnen, also die Wahrscheinlichkeit, dass 50 Personen alle an unterschiedlichen Tagen Geburtstag haben. 1 - P = Ergebnis für verschiedene Anzahlen von Personen = 0.03 = 3% n P 2.7% 11.7% 41.1% 50.7% 70.6% 89.1% 97% 99.4% 99.9% 6

6 Predictive Analytics Verschiedene Definitionen i Was verstehen wir unter Data Mining ist der Prozess des Entdeckens bedeutsamer neuer Zusammenhänge, Muster und Trends durch die Analyse (großer) Datensätze mittels Mustererkennung sowie statistischer und mathematischer Verfahren (Erick Brethenoux, Gartner Group). An intrinsic feature of time series is that, typically, adjacent observations are dependent. The nature of this dependence among observations of a time series is of considerable practical interest. Time Series Analysis ist concerned with techniques for the analysis of this dependence. (George E.P. Box, PHD, Professor Emeritus of Statistics at the University of Wisconsin-Madison) Predictive Analytics generiert aus Daten operative Aktionen, indem verlässliche Schlüsse zur aktuellen Situation und zukünftigen Ereignissen erkannt bzw. prognostiziert werden. (Gartner Group) 7

7 Predictive Analytics Blickt in die Zukunft! i Predictive Analytics richtet den Blick in die Zukunft! Reporting und OLAP Predictive Analytics Vergangenheit Gegenwart Zukunft Aufgabe Kundenwert Betrugserkennung Kündigeranalysen Cross-Selling Kundenakquisition Umsatzplanung Reporting und OLAP (Vergangenheit und Gegenwart) TOP 10-Kunden des letzten Jahres Erkannte Betrugsfälle des letzten Jahres Kündigungen des letzten Jahres Produkt-Verkaufszahlen des letzten Jahres Wie war die Antwortquote der Mailing- Aktion? Tägliche Verkaufsmenge im Schnitt Predictive Analytics (Zukunft) Zukünftige TOP-Kunden Liste auffälliger Kunden / Vorgänge mit erhöhter Betrugswahrscheinlichkeit Kunden mit erhöhter Kündigungsbereitschaft Kunden mit hoher Kaufwahrscheinlichkeit für ein Produkt Kunden (-profile), bei denen eine erhöhte Response-Rate zu erwarten ist Welche Verkaufsmengen sind zukünftig zu erwarten? 8

8 Predictive Analytics Verfahren i Zahlreiche statistische Verfahren Lineare Regression Logistische Regression Neuronale Netze Diskriminanzanalyse Entscheidungswald Support Vector Machine ARIMA oder GARCH Assoziationsanalyse State Space Modell Smoothing Splines Ungerichteter Markov-Graph 9

9 Agenda 1. Predictive Analytics Übersicht 2. Random Forest Grundkonzepte und Anwendungsfelder 3. Entscheidungsbaum Classification and Regression Tree (CART) 4. Bagging die Idee hinter dem Erfolg von Random Forest 5. Random Forest die Klassifikationsmethode im Detail 6. Random Forest Anwendungsbeispiele 7. Zusammenfassung 8. Quellen 9. Geplante nächste Termine 10.Themensammlung und -bewertung 10

10 Random Forest Grundkonzepte Wird der Kunde seinen Vertrag kündigen? Baum 1 Baum 2 Baum 3 Baum 4 Baum 5 Baum 6 Was ist Random Forest? Ja Nein Ja Ja Nein Ja Random Forest Bagging Ja Entscheidungsbaum 11

11 Random Forest Anwendungsfelder Random Forest kann alle Arten von Inputmerkmalen (stetige und kategoriale) verarbeiten, z.b die Anzahl der Kinder eines Kunden, der jährliche Verdienst des Kunden, usw ist sowohl für Klassifikation (kategoriale Zielvariable z.b. eine 0-1 Variable) als auch für Regression (stetige Zielvariable z.b. die Einkaufsmenge eines Kunden) geeignet Keine Annahme über die Verteilung der Daten Keine Transformation notwendig Random Forest kann in folgenden Feldern angewandt werden Gesichtserkennung Betrugserkennung Krebsfrüherkennung Vorhersage vom Verursacher der Umweltverschmutzung Kreditrisiko und Scoring Churn Analyse Assoziationsanalyse usw 12

12 Agenda 1. Predictive Analytics Übersicht 2. Random Forest Grundkonzepte und Anwendungsfelder 3. Entscheidungsbaum Classification and Regression Tree (CART) 4. Bagging die Idee hinter dem Erfolg von Random Forest 5. Random Forest die Klassifikationsmethode im Detail 6. Random Forest Anwendungsbeispiele 7. Zusammenfassung 8. Quellen 9. Geplante nächste Termine 10.Themensammlung und -bewertung 13

13 Entscheidungsbaum - Terminologie Wurzelknoten oder Wurzel Splitvariable Region Knoten Endknoten oder Blatt 14

14 Entscheidungsbaum für Regression Gegeben N Beobachtungen (x i, y i ) für i = 1,2,, N p Merkmale, sodass x i = (x i1, x i2,, x ip ) eine Zielvariable Y in jede entstandene Region, wir modellieren die Zielvariable mit einer Konstante für jedes Merkmal j und Aufteilungspunkt s definiere und Finde Splitvariable j und Aufteilungspunkt (Splitpunkt) s, sodass folgender Ausdruck gelöst wird Aufteilung der Knote in zwei Tochterknoten und Fortsetzung des Algorithmus 15

15 Entscheidungsbaum für Klassifikation Zwei Unterschiede zur Regression 1. Ordne in jedem Blatt zu der am meisten vertretenden Klasse 2. Quadratische Fehler für einen Split ist nicht mehr geeignet. Stattdessen benutze Fehlklassifikationsrate (Gini-Index, Cross-Entropy, usw. ) Allgemeine Best Practices 1. Setze den Split-Prozess solange fort, bis eine minimale Anzahl von Beobachtungen in Blättern erreicht wird. 2. Benutze ein Kosten-Komplexitätskriterium, um einen Kompromiss zwischen Anpassungsgüte und Tiefe zu finden Dies heißt Pruning 16

16 Agenda 1. Predictive Analytics Übersicht 2. Random Forest Grundkonzepte und Anwendungsfelder 3. Entscheidungsbaum Classification and Regression Tree (CART) 4. Bagging die Idee hinter dem Erfolg von Random Forest 5. Random Forest die Klassifikationsmethode im Detail 6. Random Forest Anwendungsbeispiele 7. Zusammenfassung 8. Quellen 9. Geplante nächste Termine 10.Themensammlung und -bewertung 17

17 Bagging Begriffserklärung Gegeben einen Datensatz mit N Beobachtungen Eine Bootstrap-Stichprobe des Datensatzes bekommt man, indem man eine Stichprobe der gleichen Länge mit Zurücklegen aus dem originalen Datensatz zieht Bagging verwendet das gleiche Modell für B Bootstrap-Versionen des originalen Datensatzes und berechnet den Mittelwert aus den Vorhersagen der B Modelle verringert hierdurch die Variabilität der Vorhersage (siehe nächste Folie) funktioniert besser mit Vorhersagen, die keine Bias (Verzerrung = in der Statistik die Differenz zwischen dem Erwartungswert einer Statistik und dem zu schätzenden Wert) vorweisen aber eine große Varianz besitzen. Z.B. Entscheidungsbäume 18

18 Bagging Warum funktioniert das? Seien θ 1, θ 2,, θ B unabhängigen Vorhersagen von einem Wert θ, jeweils mit Varianz σ 2 Var 1 B B θ i i=1 B = 1 B 2 Var(θ i i=1 ) = σ2 B B 0 Also die Variabilität in der Vorhersage hat sich verbessert und verschwindet mit der Anzahl von Bootstrap-Stichproben Im Falle vom Random Forest müssen die Entscheidungsbäume unkorrelliert sein. Dies geschieht durch Randomisierung, daher das Wort Random in dem Namen 19

19 Agenda 1. Predictive Analytics Übersicht 2. Random Forest Grundkonzepte und Anwendungsfelder 3. Entscheidungsbaum Classification and Regression Tree (CART) 4. Bagging die Idee hinter dem Erfolg von Random Forest 5. Random Forest die Klassifikationsmethode im Detail 6. Random Forest Anwendungsbeispiele 7. Zusammenfassung 8. Quellen 9. Geplante nächste Termine 10.Themensammlung und -bewertung 20

20 Random Forest Definitionen i Random Forest ist... ein statistisches Verfahren in der Kategorie der Ensemble-Techniken, das eine große Menge von unkorrelierten Entscheidungsbäumen durch Randomisierung erzeugt, die auf Bootstrap-Stichproben des originalen Datensatzes trainiert werden und dadurch effizient die Varianz der Vorhersage reduziert. 21

21 Random Forest Randomisierung und Anzahl von Bäumen Die Randomisierung wird dadurch erzielt, dass für jeden Split eine zufällige Menge m aus den p Input-Merkmalen als mögliche Split-Variable gezogen wird Die Zahl m soll vom Anwender gewählt werden. Übliche Werte sind m = p für Klassifikation und m = p 3 für Regression aus den Daten mit Kreuzvalidierung ermittelt werden Die Wahl der Anzahl B von Entscheidungsbäumen soll ebenso durch Kreuzvalidierung erfolgen 22

22 Random Forest K-fache Kreuzvalidierung Kreuzvalidierung ist die häufigste benutzte Methode, um die Anpassungsgüte eines Modells zu beurteilen Algorithmus einer K-fache Kreuzvalidierung 1. Teile den Train-Datensatz in K fast gleich große, nicht überlappende Teilemengen auf 2. Nimm eine Teilmenge zur Seite (Validierungsteilmenge), trainiert das Modell auf die übrigen Daten und benutze die Validierungsteilmenge, um das Modell zu testen 3. Jede Teilmenge muss einmal als Validierungsteilmenge benutzt werden, sodass das Modell insgesamt K-Mal trainiert wird Wenn man N Beobachtungen hat, heißt eine N-fache Kreuzvalidierung auch Leave-oneout Kreuzvalidierung Best Practice empfiehlt eine 10-fache Kreuzvalidierung 5-fache Kreuzvalidierung Train Train Validierung Train Train 23

23 Random Forest Out-of-bag und Einfluss von Merkmalen Die Beobachtungen, die nicht in einer Bootstrap-Stichprobe auftauchen sind out-of-bag Eine Out-of-bag-Fehlerrate kann für jede Beobachtung über den gesamten Wald berechnet werden und kann deshalb als leave-one-out-fehlerrate gesehen werden Fazit : Im Gegensatz zu den meisten Modellen kann eine Kreuzvalidierung schon während der Anpassung von Random Forest durchgeführt werden Für jeden Split kann man für den Split-Merkmal die Verbesserung in dem Split- Kriterium berechnen. Der Einfluss von einem Merkmal wird als die Summe der Verbesserungen in dem Split-Kriterium über den gesamten Wald hinweg berechnet Liste der wichtigsten Merkmale 24

24 Agenda 1. Predictive Analytics Übersicht 2. Random Forest Grundkonzepte und Anwendungsfelder 3. Entscheidungsbaum Classification and Regression Tree (CART) 4. Bagging die Idee hinter dem Erfolg von Random Forest 5. Random Forest die Klassifikationsmethode im Detail 6. Random Forest Anwendungsbeispiele 7. Zusammenfassung 8. Quellen 9. Geplante nächste Termine 10.Themensammlung und -bewertung 25

25 Fall 1: Erkennung echter und gefälschter Schweizer Franken Die 1000-Schweizer Franken Banknoten der zweiten Banknotenserie 1911 wurden erstmals am ausgeben. Diese Banknoten waren ungewöhnlich lange im Umlauf und daher ein begehrtes Objekt für Fälscher Zwei Datensätze: Lern- und Testdatensatz Lerndatensatz : 60 falsche und 60 echte Banknoten zur Entwicklung des Modells Testdatensatz : 40 falsche und 40 echte Banknoten zum Testen unseres entwickelten Modells Zwei Klassen : Echten und falschen Banknoten 26

26 Fall 1: Falsche Banknoten von den echten unterscheiden Merkmale 1. length : Länge der Banknote 2. lheight : Höhe der Banknote, auf der linken Seite gemessen 3. rheight : Höhe der Banknote, auf der rechten Seite gemessen 4. lmargin : Abstand vom inneren Rahmen zur unteren Grenze 5. umargin : Abstand vom inneren Rahmen zur oberen Grenze 6. diagonal : Länge der Diagonale 27

27 Fall 1: Verteilung der Variablen in den zwei Klassen echt falsch Train Test Die Trennfähigkeit der Variablen ist unterschiedlich. lmargin trennt z.b. besser als length Die Verteilung in beiden Klassen in fast gleich 28

28 Fehlerrate (in %) Fall 1: Kreuzvalidierung 1. Eine 10-fache Kreuzvalidierung empfiehlt die Anwendung von 1100 Bäumen für den Wald 2. Eine Kreuzvalidierung mit 1100 Bäumen und m = 2, 3 und 4 suggeriert den Wert m = 2 5-fache und 10-fache Kreuzvalidierung Anzahl der Bäume im Wald 29

29 Fall 1: Banknoten - Ergebnisse der Klassifikation Lerndatensatz Testdatensatz Wahre Klasse Wahre Klasse Echt Falsch Echt Falsch Prognose Echt 58 2 Falsch 2 58 Prognose Echt 39 2 Falsch 1 38 Im Testdatensatz 39 der 40 echten Banknoten wurden als echt erkannt (True Positiv) 1 der 40 echten wurde als falsch erkannt (False Negativ) 2 der 40 falschen Banknoten wurden als echt zugeordnet (False Positiv) 38 der 40 falschen Banknoten wurden als falsch erkannt (True Negativ) 30

30 Fall 2: Big Data Regression mit simulierten Daten 1 Million Beobachtungen von 11 simulierten Variablen 9 ersten Variablen V 1 - V 9 sind uniformverteilt, wobei vari zufällige Werte zwischen 0 und 10i nimmt. Z.B. V 7 liegt zufällig zwischen 0 und 70 V 10 ist auch uniformverteilt zwischen 1 und 100 V 11 ist binomialverteilt mit Wahrscheinlichkeit 0.7, d.h. eine binäre ( Ja-Nein ) Variable mit der Wahrscheinlichkeit von Ja gleich 0.7 Die Zielvariable y ist mit folgender Gleichung simuliert worden y = V V 2V 3 10 V V V ln V V 8 + V 9 6e V I(V 11 = Ja) 8ln (V 10 ) 31

31 Fall 2: Big Data Verteilung der Daten Simulierte Daten werden in zwei Datenmengen geteilt: Beobachtungen zum Lernen und Beobachtungen zum Testen Auszug von Beobachtungen aus dem Traindatensatz y y y y y y y y y y Es scheint keine Struktur in den Daten zu geben 32

32 Häufigkeit Fall 2: Big Data Verteilung der Zielvariable Zielvariable Minimum 1. Quartile Median Mittelwert Standardabweichung Varianz 3. Quartile Maximum

33 Fall 2: Big Data Modellierung Achtung Traindatensatz ist zu groß, um eine hohe Anzahl von Bäumen im Wald zu trainieren Mögliche Lösungen 1. Kleine Bootstrap-Stichproben ziehen 2. Den Algorithmus von Random Forest parallelisieren 3. Beide erste Lösungen implementieren ( ) Unser Ansatz 1. Wir fahren mit Lösung 1. fort 2. Keine Kreuzvalidierung zum Vergleich der Modelle wird durchgeführt 3. Modelle werden mit dem out-of-bag-fehler verglichen 34

34 Fall 2: Big Data Ergebnisse Nr Anzahl Bäume Umfang B- Stichprobe Lernzeit in Sekunden OOB- Fehler Erklärte Varianz PMAE % % % % % % % 2.40 OOB = Out-of-bag PMAE = Predicted Mean Absolute Error = mittlere absolute Fehler der Prognose Die Güte des Modells steigt mit dem Umfang der Bootstrap-Stichprobe Das Modell verbessert sich auch mit wachsender Anzahl der Bäume im Wald Das beste Modell ist Modell 6 35

35 Agenda 1. Predictive Analytics Übersicht 2. Random Forest Grundkonzepte und Anwendungsfelder 3. Entscheidungsbaum Classification and Regression Tree (CART) 4. Bagging die Idee hinter dem Erfolg von Random Forest 5. Random Forest die Klassifikationsmethode im Detail 6. Random Forest Anwendungsbeispiele 7. Zusammenfassung 8. Quellen 9. Geplante nächste Termine 10.Themensammlung und -bewertung 36

36 Zusammenfassung Random Forest ist ein Ensemble-Verfahren, das die Mächtigkeit von Bagging benutzt und mehrere Entscheidungsbäume mittelt Random Forest ist ein sehr populäres statistisches Mittel, weil es sich zu jedem Datentyp und sowohl zu Regression als auch zu Klassifikation eignet Entscheidungsbäume schnell zu trainieren sind es komplexe nicht-lineare Strukturen modellieren kann es sich aufgrund der Unabhängigkeit der Bäume einfach parallelisieren lässt es automatisch Kreuzvalidierung beim Lernen durchführt es auch für unüberwachtes Lernen benutzt werden kann Jeder Parameter von Random Forest lässt sich optimal durch Kreuzvalidierung wählen Es gibt zahlreiche Implementierungen von Random Forest z.b. In R die Funktion randomforest im gleichnamigen Paket In SAS Enterprise Miner proc Forest oder proc HPForest In Weka und Fortran 77 37

37 Quellen 1. Hastie, Trevor et al (2009). The elements of statistical learning. Springer, second edition 2. Berk, Richard A. (2008). Statistical Learning from a Regression Perspective. Springer Series in Statistics. New York: Springer-Verlag 3. URL: 4. URL: 38

38 Vielen Dank für Ihre Aufmerksamkeit Dr. Arsene Ntiwa Foudjo XBI-APS Telefon:

Vorlesungsplan. Von Naïve Bayes zu Bayesischen Netzwerk- Klassifikatoren. Naïve Bayes. Bayesische Netzwerke

Vorlesungsplan. Von Naïve Bayes zu Bayesischen Netzwerk- Klassifikatoren. Naïve Bayes. Bayesische Netzwerke Vorlesungsplan 17.10. Einleitung 24.10. Ein- und Ausgabe 31.10. Reformationstag, Einfache Regeln 7.11. Naïve Bayes, Entscheidungsbäume 14.11. Entscheidungsregeln, Assoziationsregeln 21.11. Lineare Modelle,

Mehr

PPC und Data Mining. Seminar aus Informatik LV-911.039. Michael Brugger. Fachbereich der Angewandten Informatik Universität Salzburg. 28.

PPC und Data Mining. Seminar aus Informatik LV-911.039. Michael Brugger. Fachbereich der Angewandten Informatik Universität Salzburg. 28. PPC und Data Mining Seminar aus Informatik LV-911.039 Michael Brugger Fachbereich der Angewandten Informatik Universität Salzburg 28. Mai 2010 M. Brugger () PPC und Data Mining 28. Mai 2010 1 / 14 Inhalt

Mehr

Korrelation (II) Korrelation und Kausalität

Korrelation (II) Korrelation und Kausalität Korrelation (II) Korrelation und Kausalität Situation: Seien X, Y zwei metrisch skalierte Merkmale mit Ausprägungen (x 1, x 2,..., x n ) bzw. (y 1, y 2,..., y n ). D.h. für jede i = 1, 2,..., n bezeichnen

Mehr

4. Erstellen von Klassen

4. Erstellen von Klassen Statistik mit Tabellenkalkulation 4. Erstellen von Klassen Mit einem einfachen Befehl lässt sich eine Liste von Zahlen auf die Häufigkeit der einzelnen Werte untersuchen. Verwenden Sie dazu den Befehl

Mehr

15.3 Bedingte Wahrscheinlichkeit und Unabhängigkeit

15.3 Bedingte Wahrscheinlichkeit und Unabhängigkeit 5.3 Bedingte Wahrscheinlichkeit und Unabhängigkeit Einführendes Beispiel ( Erhöhung der Sicherheit bei Flugreisen ) Die statistische Wahrscheinlichkeit, dass während eines Fluges ein Sprengsatz an Bord

Mehr

Data Mining: Einige Grundlagen aus der Stochastik

Data Mining: Einige Grundlagen aus der Stochastik Data Mining: Einige Grundlagen aus der Stochastik Hagen Knaf Studiengang Angewandte Mathematik Hochschule RheinMain 21. Oktober 2015 Vorwort Das vorliegende Skript enthält eine Zusammenfassung verschiedener

Mehr

Melanie Kaspar, Prof. Dr. B. Grabowski 1

Melanie Kaspar, Prof. Dr. B. Grabowski 1 7. Hypothesentests Ausgangssituation: Man muss sich zwischen 2 Möglichkeiten (=Hypothesen) entscheiden. Diese Entscheidung soll mit Hilfe von Beobachtungen ( Stichprobe ) getroffen werden. Die Hypothesen

Mehr

Unterrichtsmaterialien in digitaler und in gedruckter Form. Auszug aus: Übungsbuch für den Grundkurs mit Tipps und Lösungen: Analysis

Unterrichtsmaterialien in digitaler und in gedruckter Form. Auszug aus: Übungsbuch für den Grundkurs mit Tipps und Lösungen: Analysis Unterrichtsmaterialien in digitaler und in gedruckter Form Auszug aus: Übungsbuch für den Grundkurs mit Tipps und Lösungen: Analysis Das komplette Material finden Sie hier: Download bei School-Scout.de

Mehr

W-Rechnung und Statistik für Ingenieure Übung 11

W-Rechnung und Statistik für Ingenieure Übung 11 W-Rechnung und Statistik für Ingenieure Übung 11 Christoph Kustosz (kustosz@statistik.tu-dortmund.de) Mathematikgebäude Raum 715 Christoph Kustosz (kustosz@statistik.tu-dortmund.de) W-Rechnung und Statistik

Mehr

Statistische Thermodynamik I Lösungen zur Serie 1

Statistische Thermodynamik I Lösungen zur Serie 1 Statistische Thermodynamik I Lösungen zur Serie Zufallsvariablen, Wahrscheinlichkeitsverteilungen 4. März 2. Zwei Lektoren lesen ein Buch. Lektor A findet 2 Druckfehler, Lektor B nur 5. Von den gefundenen

Mehr

Lineargleichungssysteme: Additions-/ Subtraktionsverfahren

Lineargleichungssysteme: Additions-/ Subtraktionsverfahren Lineargleichungssysteme: Additions-/ Subtraktionsverfahren W. Kippels 22. Februar 2014 Inhaltsverzeichnis 1 Einleitung 2 2 Lineargleichungssysteme zweiten Grades 2 3 Lineargleichungssysteme höheren als

Mehr

Mining High-Speed Data Streams

Mining High-Speed Data Streams Mining High-Speed Data Streams Pedro Domingos & Geoff Hulten Departement of Computer Science & Engineering University of Washington Datum : 212006 Seminar: Maschinelles Lernen und symbolische Ansätze Vortragender:

Mehr

1.3 Die Beurteilung von Testleistungen

1.3 Die Beurteilung von Testleistungen 1.3 Die Beurteilung von Testleistungen Um das Testergebnis einer Vp zu interpretieren und daraus diagnostische Urteile ableiten zu können, benötigen wir einen Vergleichsmaßstab. Im Falle des klassischen

Mehr

Box-and-Whisker Plot -0,2 0,8 1,8 2,8 3,8 4,8

Box-and-Whisker Plot -0,2 0,8 1,8 2,8 3,8 4,8 . Aufgabe: Für zwei verschiedene Aktien wurde der relative Kurszuwachs (in % beobachtet. Aus den jeweils 20 Quartaldaten ergaben sich die folgenden Box-Plots. Box-and-Whisker Plot Aktie Aktie 2-0,2 0,8,8

Mehr

Binäre Bäume. 1. Allgemeines. 2. Funktionsweise. 2.1 Eintragen

Binäre Bäume. 1. Allgemeines. 2. Funktionsweise. 2.1 Eintragen Binäre Bäume 1. Allgemeines Binäre Bäume werden grundsätzlich verwendet, um Zahlen der Größe nach, oder Wörter dem Alphabet nach zu sortieren. Dem einfacheren Verständnis zu Liebe werde ich mich hier besonders

Mehr

Survival of the Fittest Wie statistische Modelle an Daten angepasst werden

Survival of the Fittest Wie statistische Modelle an Daten angepasst werden Tag der Mathematik 2009 Survival of the Fittest Wie statistische Modelle an Daten angepasst werden Thomas Kneib Fakultät für Mathematik und Naturwissenschaften Carl von Ossietzky Universität Oldenburg

Mehr

Zeichen bei Zahlen entschlüsseln

Zeichen bei Zahlen entschlüsseln Zeichen bei Zahlen entschlüsseln In diesem Kapitel... Verwendung des Zahlenstrahls Absolut richtige Bestimmung von absoluten Werten Operationen bei Zahlen mit Vorzeichen: Addieren, Subtrahieren, Multiplizieren

Mehr

Einfache statistische Auswertungen mit dem TI-Nspire

Einfache statistische Auswertungen mit dem TI-Nspire 1. Neues Dokument und darin eine neue Seite anlegen Als Typ 6: Lists & Spreadsheet wählen. Darin die Messwerte in einer Spalte erfassen. Dies ergibt die Urliste. Wenn mehrere Messwerte vorliegen, die diejenigen,

Mehr

Angewandte Ökonometrie, WS 2012/13, 1. Teilprüfung am 6.12.2012 - Lösungen. Das folgende Modell ist ein GARCH(1,1)-Modell:

Angewandte Ökonometrie, WS 2012/13, 1. Teilprüfung am 6.12.2012 - Lösungen. Das folgende Modell ist ein GARCH(1,1)-Modell: Angewandte Ökonometrie, WS 2012/13, 1. Teilprüfung am 6.12.2012 - Lösungen LV-Leiterin: Univ.Prof.Dr. Sylvia Frühwirth-Schnatter 1 Wahr oder falsch? 1. Das folgende Modell ist ein GARCH(1,1)-Modell: Y

Mehr

Klausur zur Vorlesung Multivariate Verfahren, SS 2006 6 Kreditpunkte, 90 min

Klausur zur Vorlesung Multivariate Verfahren, SS 2006 6 Kreditpunkte, 90 min Klausur, Multivariate Verfahren, SS 2006, 6 Kreditpunkte, 90 min 1 Prof. Dr. Fred Böker 08.08.2006 Klausur zur Vorlesung Multivariate Verfahren, SS 2006 6 Kreditpunkte, 90 min Gesamtpunkte: 39 Aufgabe

Mehr

Planen mit mathematischen Modellen 00844: Computergestützte Optimierung. Autor: Dr. Heinz Peter Reidmacher

Planen mit mathematischen Modellen 00844: Computergestützte Optimierung. Autor: Dr. Heinz Peter Reidmacher Planen mit mathematischen Modellen 00844: Computergestützte Optimierung Leseprobe Autor: Dr. Heinz Peter Reidmacher 11 - Portefeuilleanalyse 61 11 Portefeuilleanalyse 11.1 Das Markowitz Modell Die Portefeuilleanalyse

Mehr

QM: Prüfen -1- KN16.08.2010

QM: Prüfen -1- KN16.08.2010 QM: Prüfen -1- KN16.08.2010 2.4 Prüfen 2.4.1 Begriffe, Definitionen Ein wesentlicher Bestandteil der Qualitätssicherung ist das Prüfen. Sie wird aber nicht wie früher nach der Fertigung durch einen Prüfer,

Mehr

In konstanten Modellen wird davon ausgegangen, dass die zu prognostizierende Größe sich über die Zeit hinweg nicht verändert.

In konstanten Modellen wird davon ausgegangen, dass die zu prognostizierende Größe sich über die Zeit hinweg nicht verändert. Konstante Modelle: In konstanten Modellen wird davon ausgegangen, dass die zu prognostizierende Größe sich über die Zeit hinweg nicht verändert. Der prognostizierte Wert für die Periode T+i entspricht

Mehr

Erfolg und Vermögensrückgänge angefertigt im Rahmen der Lehrveranstaltung Nachrichtentechnik von: Eric Hansen, eric-hansen@gmx.de am: 07.09.

Erfolg und Vermögensrückgänge angefertigt im Rahmen der Lehrveranstaltung Nachrichtentechnik von: Eric Hansen, eric-hansen@gmx.de am: 07.09. Abstract zum Thema Handelssysteme Erfolg und Vermögensrückgänge angefertigt im Rahmen der Lehrveranstaltung Nachrichtentechnik von: Eric Hansen, eric-hansen@gmx.de am: 07.09.01 Einleitung: Handelssysteme

Mehr

geben. Die Wahrscheinlichkeit von 100% ist hier demnach nur der Gehen wir einmal davon aus, dass die von uns angenommenen

geben. Die Wahrscheinlichkeit von 100% ist hier demnach nur der Gehen wir einmal davon aus, dass die von uns angenommenen geben. Die Wahrscheinlichkeit von 100% ist hier demnach nur der Vollständigkeit halber aufgeführt. Gehen wir einmal davon aus, dass die von uns angenommenen 70% im Beispiel exakt berechnet sind. Was würde

Mehr

Wasserfall-Ansätze zur Bildsegmentierung

Wasserfall-Ansätze zur Bildsegmentierung Wasserfall-Ansätze zur Bildsegmentierung von Philipp Jester Seminar: Bildsegmentierung und Computer Vision 16.01.2006 Überblick 1. Problemstellung 2. Wiederholung: Wasserscheiden-Ansätze 3. Der Wasserfall-Ansatz

Mehr

Algorithmische Modelle als neues Paradigma

Algorithmische Modelle als neues Paradigma Algorithmische Modelle als neues Paradigma Axel Schwer Seminar über Philosophische Grundlagen der Statistik, WS 2010/11 Betreuer: Prof. Dr. Thomas Augustin München, den 28. Januar 2011 1 / 29 LEO BREIMAN

Mehr

Beispiel 48. 4.3.2 Zusammengesetzte Zufallsvariablen

Beispiel 48. 4.3.2 Zusammengesetzte Zufallsvariablen 4.3.2 Zusammengesetzte Zufallsvariablen Beispiel 48 Ein Würfel werde zweimal geworfen. X bzw. Y bezeichne die Augenzahl im ersten bzw. zweiten Wurf. Sei Z := X + Y die Summe der gewürfelten Augenzahlen.

Mehr

Methoden der Datenanalyse AI-basierte Decision Support Systeme WS 2006/07

Methoden der Datenanalyse AI-basierte Decision Support Systeme WS 2006/07 Regression Trees Methoden der Datenanalyse AI-basierte Decision Support Systeme WS 2006/07 Ao.Univ.Prof. Dr. Marcus Hudec marcus.hudec@univie.ac.at Institut für Scientific Computing, Universität Wien 2

Mehr

Begriffsbestimmung CRISP-DM-Modell Betriebswirtschaftliche Einsatzgebiete des Data Mining Web Mining und Text Mining

Begriffsbestimmung CRISP-DM-Modell Betriebswirtschaftliche Einsatzgebiete des Data Mining Web Mining und Text Mining Gliederung 1. Einführung 2. Grundlagen Data Mining Begriffsbestimmung CRISP-DM-Modell Betriebswirtschaftliche Einsatzgebiete des Data Mining Web Mining und Text Mining 3. Ausgewählte Methoden des Data

Mehr

Finanzwirtschaft. Teil II: Bewertung

Finanzwirtschaft. Teil II: Bewertung Sparpläne und Kreditverträge 1 Finanzwirtschaft Teil II: Bewertung Sparpläne und Kreditverträge Agenda Sparpläne und Kreditverträge 2 Endliche Laufzeit Unendliche Laufzeit Zusammenfassung Sparpläne und

Mehr

Tutorial: Homogenitätstest

Tutorial: Homogenitätstest Tutorial: Homogenitätstest Eine Bank möchte die Kreditwürdigkeit potenzieller Kreditnehmer abschätzen. Einerseits lebt die Bank ja von der Vergabe von Krediten, andererseits verursachen Problemkredite

Mehr

Künstliche Intelligenz Maschinelles Lernen

Künstliche Intelligenz Maschinelles Lernen Künstliche Intelligenz Maschinelles Lernen Stephan Schwiebert Sommersemester 2009 Sprachliche Informationsverarbeitung Institut für Linguistik Universität zu Köln Maschinelles Lernen Überwachtes Lernen

Mehr

EINMALEINS BEZIEHUNGSREICH

EINMALEINS BEZIEHUNGSREICH EINMALEINS BEZIEHUNGSREICH Thema: Übung des kleinen Einmaleins; operative Beziehungen erkunden Stufe: ab 2. Schuljahr Dauer: 2 bis 3 Lektionen Materialien: Kleine Einmaleinstafeln (ohne Farben), Punktefelder

Mehr

Umfrage der Klasse 8c zum Thema "Smartphones"

Umfrage der Klasse 8c zum Thema Smartphones Umfrage der Klasse 8c zum Thema "Smartphones" Gruppe Aylin, Antonia, Lisa, Vanessa Wir haben in den Wochen der Projektarbeit eine Umfrage gemacht, bei der wir insgesamt 25 Leute befragt haben. Zuvor hatten

Mehr

Konzepte der Informatik

Konzepte der Informatik Konzepte der Informatik Vorkurs Informatik zum WS 2011/2012 26.09. - 30.09.2011 17.10. - 21.10.2011 Dr. Werner Struckmann / Christoph Peltz Stark angelehnt an Kapitel 1 aus "Abenteuer Informatik" von Jens

Mehr

Statistik für Studenten der Sportwissenschaften SS 2008

Statistik für Studenten der Sportwissenschaften SS 2008 Statistik für Studenten der Sportwissenschaften SS 008 Aufgabe 1 Man weiß von Rehabilitanden, die sich einer bestimmten Gymnastik unterziehen, dass sie im Mittel µ=54 Jahre (σ=3 Jahre) alt sind. a) Welcher

Mehr

i x k k=1 i u i x i v i 1 0,2 24 24 0,08 2 0,4 30 54 0,18 3 0,6 54 108 0,36 4 0,8 72 180 0,60 5 1,0 120 300 1,00 2,22 G = 1 + 1 n 2 n i=1

i x k k=1 i u i x i v i 1 0,2 24 24 0,08 2 0,4 30 54 0,18 3 0,6 54 108 0,36 4 0,8 72 180 0,60 5 1,0 120 300 1,00 2,22 G = 1 + 1 n 2 n i=1 1. Aufgabe: Der E-Commerce-Umsatz (in Millionen Euro) der fünf größten Online- Shopping-Clubs liegt wie folgt vor: Club Nr. Umsatz 1 120 2 72 3 54 4 30 5 24 a) Bestimmen Sie den Ginikoeffizienten. b) Zeichnen

Mehr

Statistische Auswertung:

Statistische Auswertung: Statistische Auswertung: Die erhobenen Daten mittels der selbst erstellten Tests (Surfaufgaben) Statistics Punkte aus dem Punkte aus Surftheorietest Punkte aus dem dem und dem Surftheorietest max.14p.

Mehr

Güte von Tests. die Wahrscheinlichkeit für den Fehler 2. Art bei der Testentscheidung, nämlich. falsch ist. Darauf haben wir bereits im Kapitel über

Güte von Tests. die Wahrscheinlichkeit für den Fehler 2. Art bei der Testentscheidung, nämlich. falsch ist. Darauf haben wir bereits im Kapitel über Güte von s Grundlegendes zum Konzept der Güte Ableitung der Gütefunktion des Gauss im Einstichprobenproblem Grafische Darstellung der Gütefunktionen des Gauss im Einstichprobenproblem Ableitung der Gütefunktion

Mehr

Fortgeschrittene Statistik Logistische Regression

Fortgeschrittene Statistik Logistische Regression Fortgeschrittene Statistik Logistische Regression O D D S, O D D S - R A T I O, L O G I T T R A N S F O R M A T I O N, I N T E R P R E T A T I O N V O N K O E F F I Z I E N T E N, L O G I S T I S C H E

Mehr

4. Jeder Knoten hat höchstens zwei Kinder, ein linkes und ein rechtes.

4. Jeder Knoten hat höchstens zwei Kinder, ein linkes und ein rechtes. Binäre Bäume Definition: Ein binärer Baum T besteht aus einer Menge von Knoten, die durch eine Vater-Kind-Beziehung wie folgt strukturiert ist: 1. Es gibt genau einen hervorgehobenen Knoten r T, die Wurzel

Mehr

WS 2009/10. Diskrete Strukturen

WS 2009/10. Diskrete Strukturen WS 2009/10 Diskrete Strukturen Prof. Dr. J. Esparza Lehrstuhl für Grundlagen der Softwarezuverlässigkeit und theoretische Informatik Fakultät für Informatik Technische Universität München http://www7.in.tum.de/um/courses/ds/ws0910

Mehr

Stichprobenauslegung. für stetige und binäre Datentypen

Stichprobenauslegung. für stetige und binäre Datentypen Stichprobenauslegung für stetige und binäre Datentypen Roadmap zu Stichproben Hypothese über das interessierende Merkmal aufstellen Stichprobe entnehmen Beobachtete Messwerte abbilden Schluss von der Beobachtung

Mehr

Profil A 49,3 48,2 50,7 50,9 49,8 48,7 49,6 50,1 Profil B 51,8 49,6 53,2 51,1 51,1 53,4 50,7 50 51,5 51,7 48,8

Profil A 49,3 48,2 50,7 50,9 49,8 48,7 49,6 50,1 Profil B 51,8 49,6 53,2 51,1 51,1 53,4 50,7 50 51,5 51,7 48,8 1. Aufgabe: Eine Reifenfirma hat für Winterreifen unterschiedliche Profile entwickelt. Bei jeweils gleicher Geschwindigkeit und auch sonst gleichen Bedingungen wurden die Bremswirkungen gemessen. Die gemessenen

Mehr

Bauchgefühl oder kühle Berechnung Wer wird Fußball-Weltmeister 2014?

Bauchgefühl oder kühle Berechnung Wer wird Fußball-Weltmeister 2014? Bauchgefühl oder kühle Berechnung Wer wird Fußball-Weltmeister 2014? Prof. Dr. Michael Feindt Karlsruher Institut für Technologie (KIT) Founder and Chief Scientific Advisor, Blue Yonder Wer wird Weltmeister?

Mehr

Anmerkungen zur Übergangsprüfung

Anmerkungen zur Übergangsprüfung DM11 Slide 1 Anmerkungen zur Übergangsprüfung Aufgabeneingrenzung Aufgaben des folgenden Typs werden wegen ihres Schwierigkeitsgrads oder wegen eines ungeeigneten fachlichen Schwerpunkts in der Übergangsprüfung

Mehr

Einfache statistische Auswertungen mit dem Programm SPSS

Einfache statistische Auswertungen mit dem Programm SPSS Einfache statistische Auswertungen mit dem Programm SPSS Datensatz: fiktive_daten.sav Dipl. Päd. Anne Haßelkus Dr. Dorothea Dette-Hagenmeyer 11/2011 Überblick 1 Deskriptive Statistiken; Mittelwert berechnen...

Mehr

Theoretische Grundlagen der Informatik WS 09/10

Theoretische Grundlagen der Informatik WS 09/10 Theoretische Grundlagen der Informatik WS 09/10 - Tutorium 6 - Michael Kirsten und Kai Wallisch Sitzung 13 02.02.2010 Inhaltsverzeichnis 1 Formeln zur Berechnung Aufgabe 1 2 Hamming-Distanz Aufgabe 2 3

Mehr

Häufigkeitstabellen. Balken- oder Kreisdiagramme. kritischer Wert für χ2-test. Kontingenztafeln

Häufigkeitstabellen. Balken- oder Kreisdiagramme. kritischer Wert für χ2-test. Kontingenztafeln Häufigkeitstabellen Menüpunkt Data PivotTable Report (bzw. entsprechendes Icon): wähle Data Range (Zellen, die die Daten enthalten + Zelle mit Variablenname) wähle kategoriale Variable für Spalten- oder

Mehr

Data Mining und maschinelles Lernen

Data Mining und maschinelles Lernen Data Mining und maschinelles Lernen Einführung und Anwendung mit WEKA Caren Brinckmann 16. August 2000 http://www.coli.uni-sb.de/~cabr/vortraege/ml.pdf http://www.cs.waikato.ac.nz/ml/weka/ Inhalt Einführung:

Mehr

Auftragsbearbeitung 3.1

Auftragsbearbeitung 3.1 Auftragsbearbeitung / Bearbeitung bestehender Aufträge Automatische / manuelle Soll/Ist-Aufteilung (Stempelungen) Auf Aufträge kann über das Programm 15.2.1 gestempelt werden (PC in der Werkstatt auf dem

Mehr

Tangentengleichung. Wie lautet die Geradengleichung für die Tangente, y T =? Antwort:

Tangentengleichung. Wie lautet die Geradengleichung für die Tangente, y T =? Antwort: Tangentengleichung Wie Sie wissen, gibt die erste Ableitung einer Funktion deren Steigung an. Betrachtet man eine fest vorgegebene Stelle, gibt f ( ) also die Steigung der Kurve und somit auch die Steigung

Mehr

Dokumentation Datamining

Dokumentation Datamining Hochschule Wismar University of Applied Sciences Technology, Business and Design Fakultät für Ingenieurwissenschaften, Bereich EuI Dokumentation Datamining Eingereicht am: 13. Mai 2012 von: Karsten Diepelt

Mehr

Lernen von Entscheidungsbäumen. Volker Tresp Summer 2014

Lernen von Entscheidungsbäumen. Volker Tresp Summer 2014 Lernen von Entscheidungsbäumen Volker Tresp Summer 2014 1 Anforderungen an Methoden zum Datamining Schnelle Verarbeitung großer Datenmengen Leichter Umgang mit hochdimensionalen Daten Das Lernergebnis

Mehr

Repetitionsaufgaben Wurzelgleichungen

Repetitionsaufgaben Wurzelgleichungen Repetitionsaufgaben Wurzelgleichungen Inhaltsverzeichnis A) Vorbemerkungen B) Lernziele C) Theorie mit Aufgaben D) Aufgaben mit Musterlösungen 4 A) Vorbemerkungen Bitte beachten Sie: Bei Wurzelgleichungen

Mehr

Anhand des bereits hergeleiteten Models erstellen wir nun mit der Formel

Anhand des bereits hergeleiteten Models erstellen wir nun mit der Formel Ausarbeitung zum Proseminar Finanzmathematische Modelle und Simulationen bei Raphael Kruse und Prof. Dr. Wolf-Jürgen Beyn zum Thema Simulation des Anlagenpreismodels von Simon Uphus im WS 09/10 Zusammenfassung

Mehr

Mathematik. UND/ODER Verknüpfung. Ungleichungen. Betrag. Intervall. Umgebung

Mathematik. UND/ODER Verknüpfung. Ungleichungen. Betrag. Intervall. Umgebung Mathematik UND/ODER Verknüpfung Ungleichungen Betrag Intervall Umgebung Stefan Gärtner 004 Gr Mathematik UND/ODER Seite UND Verknüpfung Kommentar Aussage Symbolform Die Aussagen Hans kann schwimmen p und

Mehr

t r Lineare Codierung von Binärbbäumen (Wörter über dem Alphabet {, }) Beispiel code( ) = code(, t l, t r ) = code(t l ) code(t r )

t r Lineare Codierung von Binärbbäumen (Wörter über dem Alphabet {, }) Beispiel code( ) = code(, t l, t r ) = code(t l ) code(t r ) Definition B : Menge der binären Bäume, rekursiv definiert durch die Regeln: ist ein binärer Baum sind t l, t r binäre Bäume, so ist auch t =, t l, t r ein binärer Baum nur das, was durch die beiden vorigen

Mehr

AGROPLUS Buchhaltung. Daten-Server und Sicherheitskopie. Version vom 21.10.2013b

AGROPLUS Buchhaltung. Daten-Server und Sicherheitskopie. Version vom 21.10.2013b AGROPLUS Buchhaltung Daten-Server und Sicherheitskopie Version vom 21.10.2013b 3a) Der Daten-Server Modus und der Tresor Der Daten-Server ist eine Betriebsart welche dem Nutzer eine grosse Flexibilität

Mehr

Würfelt man dabei je genau 10 - mal eine 1, 2, 3, 4, 5 und 6, so beträgt die Anzahl. der verschiedenen Reihenfolgen, in denen man dies tun kann, 60!.

Würfelt man dabei je genau 10 - mal eine 1, 2, 3, 4, 5 und 6, so beträgt die Anzahl. der verschiedenen Reihenfolgen, in denen man dies tun kann, 60!. 040304 Übung 9a Analysis, Abschnitt 4, Folie 8 Die Wahrscheinlichkeit, dass bei n - maliger Durchführung eines Zufallexperiments ein Ereignis A ( mit Wahrscheinlichkeit p p ( A ) ) für eine beliebige Anzahl

Mehr

Wie Projektziele gemessen werden können oder wie man Indikatoren entwickeln kann?

Wie Projektziele gemessen werden können oder wie man Indikatoren entwickeln kann? Innovationstransferund Forschungsinstitut für berufliche Aus-und Weiterbildung SCHWERIN Wie Projektziele gemessen werden können oder wie man Indikatoren entwickeln kann? von Dr. Walter Gürth Workshop der

Mehr

Abschlussprüfung Realschule Bayern II / III: 2009 Haupttermin B 1.0 B 1.1

Abschlussprüfung Realschule Bayern II / III: 2009 Haupttermin B 1.0 B 1.1 B 1.0 B 1.1 L: Wir wissen von, dass sie den Scheitel hat und durch den Punkt läuft. Was nichts bringt, ist beide Punkte in die allgemeine Parabelgleichung einzusetzen und das Gleichungssystem zu lösen,

Mehr

Bevölkerung mit Migrationshintergrund an der Gesamtbevölkerung 2012

Bevölkerung mit Migrationshintergrund an der Gesamtbevölkerung 2012 Statistische Übersicht inkl. dem Vergleich zwischen und zur (Aus-)Bildungssituation von jungen Menschen mit und ohne Migrationshintergrund 1 in den Bundesländern nach dem Mikrozensus Erstellt im Rahmen

Mehr

Kapitel 7 und Kapitel 8: Gleichgewichte in gemischten Strategien. Einleitung. Übersicht Teil 2 2. Übersicht 3

Kapitel 7 und Kapitel 8: Gleichgewichte in gemischten Strategien. Einleitung. Übersicht Teil 2 2. Übersicht 3 Übersicht Teil 2 Kaitel 7 und Kaitel 8: Gleichgewichte in gemischten Strategien Übersicht Teil 2 2 Übersicht Einleitung Was ist eine gemischte Strategie? Nutzen aus gemischten Strategien Reaktionsfunktionen

Mehr

Abituraufgabe zur Stochastik, Hessen 2009, Grundkurs (TR)

Abituraufgabe zur Stochastik, Hessen 2009, Grundkurs (TR) Abituraufgabe zur Stochastik, Hessen 2009, Grundkurs (TR) Eine Firma stellt USB-Sticks her. Sie werden in der Fabrik ungeprüft in Packungen zu je 20 Stück verpackt und an Händler ausgeliefert. 1 Ein Händler

Mehr

Abitur 2007 Mathematik GK Stochastik Aufgabe C1

Abitur 2007 Mathematik GK Stochastik Aufgabe C1 Seite 1 Abiturloesung.de - Abituraufgaben Abitur 2007 Mathematik GK Stochastik Aufgabe C1 Eine Werbeagentur ermittelte durch eine Umfrage im Auftrag eines Kosmetikunternehmens vor Beginn einer Werbekampagne

Mehr

6.2 Scan-Konvertierung (Scan Conversion)

6.2 Scan-Konvertierung (Scan Conversion) 6.2 Scan-Konvertierung (Scan Conversion) Scan-Konvertierung ist die Rasterung von einfachen Objekten (Geraden, Kreisen, Kurven). Als Ausgabemedium dient meist der Bildschirm, der aus einem Pixelraster

Mehr

Professionelle Seminare im Bereich MS-Office

Professionelle Seminare im Bereich MS-Office Der Name BEREICH.VERSCHIEBEN() ist etwas unglücklich gewählt. Man kann mit der Funktion Bereiche zwar verschieben, man kann Bereiche aber auch verkleinern oder vergrößern. Besser wäre es, die Funktion

Mehr

R ist freie Software und kann von der Website. www.r-project.org

R ist freie Software und kann von der Website. www.r-project.org R R ist freie Software und kann von der Website heruntergeladen werden. www.r-project.org Nach dem Herunterladen und der Installation von R kann man R durch Doppelklicken auf das R-Symbol starten. R wird

Mehr

OECD Programme for International Student Assessment PISA 2000. Lösungen der Beispielaufgaben aus dem Mathematiktest. Deutschland

OECD Programme for International Student Assessment PISA 2000. Lösungen der Beispielaufgaben aus dem Mathematiktest. Deutschland OECD Programme for International Student Assessment Deutschland PISA 2000 Lösungen der Beispielaufgaben aus dem Mathematiktest Beispielaufgaben PISA-Hauptstudie 2000 Seite 3 UNIT ÄPFEL Beispielaufgaben

Mehr

Analog zu Aufgabe 16.1 werden die Daten durch folgenden Befehl eingelesen: > kredit<-read.table("c:\\compaufg\\kredit.

Analog zu Aufgabe 16.1 werden die Daten durch folgenden Befehl eingelesen: > kredit<-read.table(c:\\compaufg\\kredit. Lösung 16.3 Analog zu Aufgabe 16.1 werden die Daten durch folgenden Befehl eingelesen: > kredit

Mehr

STATISTIK. Erinnere dich

STATISTIK. Erinnere dich Thema Nr.20 STATISTIK Erinnere dich Die Stichprobe Drei Schüler haben folgende Noten geschrieben : Johann : 4 6 18 7 17 12 12 18 Barbara : 13 13 12 10 12 3 14 12 14 15 Julia : 15 9 14 13 10 12 12 11 10

Mehr

Tiefgreifende Prozessverbesserung und Wissensmanagement durch Data Mining

Tiefgreifende Prozessverbesserung und Wissensmanagement durch Data Mining Tiefgreifende Prozessverbesserung und Wissensmanagement durch Data Mining Ausgangssituation Kaizen Data Mining ISO 9001 Wenn andere Methoden an ihre Grenzen stoßen Es gibt unzählige Methoden, die Abläufe

Mehr

Verteilungsmodelle. Verteilungsfunktion und Dichte von T

Verteilungsmodelle. Verteilungsfunktion und Dichte von T Verteilungsmodelle Verteilungsfunktion und Dichte von T Survivalfunktion von T Hazardrate von T Beziehungen zwischen F(t), S(t), f(t) und h(t) Vorüberlegung zu Lebensdauerverteilungen Die Exponentialverteilung

Mehr

Data Mining mit der SEMMA Methodik. Reinhard Strüby, SAS Institute Stephanie Freese, Herlitz PBS AG

Data Mining mit der SEMMA Methodik. Reinhard Strüby, SAS Institute Stephanie Freese, Herlitz PBS AG Data Mining mit der SEMMA Methodik Reinhard Strüby, SAS Institute Stephanie Freese, Herlitz PBS AG Data Mining Data Mining: Prozeß der Selektion, Exploration und Modellierung großer Datenmengen, um Information

Mehr

Kapitel 5: Dynamisches Programmieren Gliederung

Kapitel 5: Dynamisches Programmieren Gliederung Gliederung 1. Grundlagen 2. Zahlentheoretische Algorithmen 3. Sortierverfahren 4. Ausgewählte Datenstrukturen 5. Dynamisches Programmieren 6. Graphalgorithmen 7. String-Matching 8. Kombinatorische Algorithmen

Mehr

Aufgabe 1: Nehmen Sie Stellung zu den folgenden Behauptungen (richtig/falsch mit stichwortartiger Begründung).

Aufgabe 1: Nehmen Sie Stellung zu den folgenden Behauptungen (richtig/falsch mit stichwortartiger Begründung). Aufgabe 1: Nehmen Sie Stellung zu den folgenden Behauptungen (richtig/falsch mit stichwortartiger Begründung). a) Die Anzahl der voneinander verschiedenen Beobachtungswerte eines statistischen Merkmals

Mehr

Finanzwirtschaft. Teil II: Bewertung

Finanzwirtschaft. Teil II: Bewertung Zeitwert des Geldes 1 Finanzwirtschaft Teil II: Bewertung Zeitwert des Geldes Zeitwert des Geldes 2 Bewertung & Zeitwert des Geldes Finanzwirtschaft behandelt die Bewertung von Real- und Finanzwerten.

Mehr

Stellen Sie bitte den Cursor in die Spalte B2 und rufen die Funktion Sverweis auf. Es öffnet sich folgendes Dialogfenster

Stellen Sie bitte den Cursor in die Spalte B2 und rufen die Funktion Sverweis auf. Es öffnet sich folgendes Dialogfenster Es gibt in Excel unter anderem die so genannten Suchfunktionen / Matrixfunktionen Damit können Sie Werte innerhalb eines bestimmten Bereichs suchen. Als Beispiel möchte ich die Funktion Sverweis zeigen.

Mehr

Studie über Umfassendes Qualitätsmanagement ( TQM ) und Verbindung zum EFQM Excellence Modell

Studie über Umfassendes Qualitätsmanagement ( TQM ) und Verbindung zum EFQM Excellence Modell Studie über Umfassendes Qualitätsmanagement ( TQM ) und Verbindung zum EFQM Excellence Modell (Auszug) Im Rahmen des EU-Projekts AnaFact wurde diese Umfrage von Frauenhofer IAO im Frühjahr 1999 ausgewählten

Mehr

Vorkurs Mathematik Übungen zu Polynomgleichungen

Vorkurs Mathematik Übungen zu Polynomgleichungen Vorkurs Mathematik Übungen zu en 1 Aufgaben Lineare Gleichungen Aufgabe 1.1 Ein Freund von Ihnen möchte einen neuen Mobilfunkvertrag abschließen. Es gibt zwei verschiedene Angebote: Anbieter 1: monatl.

Mehr

Primzahlen und RSA-Verschlüsselung

Primzahlen und RSA-Verschlüsselung Primzahlen und RSA-Verschlüsselung Michael Fütterer und Jonathan Zachhuber 1 Einiges zu Primzahlen Ein paar Definitionen: Wir bezeichnen mit Z die Menge der positiven und negativen ganzen Zahlen, also

Mehr

90-minütige Klausur Statistik für Studierende der Kommunikationswissenschaft

90-minütige Klausur Statistik für Studierende der Kommunikationswissenschaft Prof. Dr. Helmut Küchenhoff SS08 90-minütige Klausur Statistik für Studierende der Kommunikationswissenschaft am 22.7.2008 Anmerkungen Überprüfen Sie bitte sofort, ob Ihre Angabe vollständig ist. Sie sollte

Mehr

Das große ElterngeldPlus 1x1. Alles über das ElterngeldPlus. Wer kann ElterngeldPlus beantragen? ElterngeldPlus verstehen ein paar einleitende Fakten

Das große ElterngeldPlus 1x1. Alles über das ElterngeldPlus. Wer kann ElterngeldPlus beantragen? ElterngeldPlus verstehen ein paar einleitende Fakten Das große x -4 Alles über das Wer kann beantragen? Generell kann jeder beantragen! Eltern (Mütter UND Väter), die schon während ihrer Elternzeit wieder in Teilzeit arbeiten möchten. Eltern, die während

Mehr

Eine der Aktien hat immer einen höheren Gewinn als die andere Aktie. Ihre Aufgabe ist es diese auszuwählen.

Eine der Aktien hat immer einen höheren Gewinn als die andere Aktie. Ihre Aufgabe ist es diese auszuwählen. Instruktionen am Anfang von Experiment 1 (auf Papier ausgeteilt: grünmarkierte Textstellen zeigen den Instruktionstext in der jeweiligen Bedingung an; Kommentare sind gelb markiert.) Stellen Sie sich vor,

Mehr

Austausch- bzw. Übergangsprozesse und Gleichgewichtsverteilungen

Austausch- bzw. Übergangsprozesse und Gleichgewichtsverteilungen Austausch- bzw. Übergangsrozesse und Gleichgewichtsverteilungen Wir betrachten ein System mit verschiedenen Zuständen, zwischen denen ein Austausch stattfinden kann. Etwa soziale Schichten in einer Gesellschaft:

Mehr

Zusatzmodul Lagerverwaltung

Zusatzmodul Lagerverwaltung P.A.P.A. die kaufmännische Softwarelösung Zusatzmodul Inhalt Einleitung... 2 Definieren der Lager... 3 Zuteilen des Lagerorts... 3 Einzelartikel... 4 Drucken... 4 Zusammenfassung... 5 Es gelten ausschließlich

Mehr

Predictive Modeling Markup Language. Thomas Morandell

Predictive Modeling Markup Language. Thomas Morandell Predictive Modeling Markup Language Thomas Morandell Index Einführung PMML als Standard für den Austausch von Data Mining Ergebnissen/Prozessen Allgemeine Struktur eines PMML Dokuments Beispiel von PMML

Mehr

Finanzwirtschaft. Teil II: Bewertung. Zinssätze und Renten

Finanzwirtschaft. Teil II: Bewertung. Zinssätze und Renten Zinssätze und Renten 1 Finanzwirtschaft Teil II: Bewertung Zinssätze und Renten Agenda Zinssätze und Renten 2 Effektivzinsen Spot-Zinsen Forward-Zinsen Bewertung Kennziffern Zusammenfassung Zinssätze und

Mehr

Erfahrungen mit Hartz IV- Empfängern

Erfahrungen mit Hartz IV- Empfängern Erfahrungen mit Hartz IV- Empfängern Ausgewählte Ergebnisse einer Befragung von Unternehmen aus den Branchen Gastronomie, Pflege und Handwerk Pressegespräch der Bundesagentur für Arbeit am 12. November

Mehr

Kulturelle Evolution 12

Kulturelle Evolution 12 3.3 Kulturelle Evolution Kulturelle Evolution Kulturelle Evolution 12 Seit die Menschen Erfindungen machen wie z.b. das Rad oder den Pflug, haben sie sich im Körperbau kaum mehr verändert. Dafür war einfach

Mehr

Programmierkurs Java

Programmierkurs Java Programmierkurs Java Dr. Dietrich Boles Aufgaben zu UE16-Rekursion (Stand 09.12.2011) Aufgabe 1: Implementieren Sie in Java ein Programm, das solange einzelne Zeichen vom Terminal einliest, bis ein #-Zeichen

Mehr

Semestralklausur zur Vorlesung. Web Mining. Prof. J. Fürnkranz Technische Universität Darmstadt Sommersemester 2004 Termin: 22. 7.

Semestralklausur zur Vorlesung. Web Mining. Prof. J. Fürnkranz Technische Universität Darmstadt Sommersemester 2004 Termin: 22. 7. Semestralklausur zur Vorlesung Web Mining Prof. J. Fürnkranz Technische Universität Darmstadt Sommersemester 2004 Termin: 22. 7. 2004 Name: Vorname: Matrikelnummer: Fachrichtung: Punkte: (1).... (2)....

Mehr

Die Pareto Verteilung wird benutzt, um Einkommensverteilungen zu modellieren. Die Verteilungsfunktion ist

Die Pareto Verteilung wird benutzt, um Einkommensverteilungen zu modellieren. Die Verteilungsfunktion ist Frage Die Pareto Verteilung wird benutzt, um Einkommensverteilungen zu modellieren. Die Verteilungsfunktion ist k a F (x) =1 k>0,x k x Finden Sie den Erwartungswert und den Median der Dichte für a>1. (Bei

Mehr

Übungskomplex Felder (1) Eindimensionale Felder Mehrdimensionale Felder

Übungskomplex Felder (1) Eindimensionale Felder Mehrdimensionale Felder Übungskomplex Felder (1) Eindimensionale Felder Mehrdimensionale Felder Hinweise zur Übung Benötigter Vorlesungsstoff Ab diesem Übungskomplex wird die Kenntnis und praktische Beherrschung der Konzepte

Mehr

einfache Rendite 0 145 85 1 160 90 2 135 100 3 165 105 4 190 95 5 210 110

einfache Rendite 0 145 85 1 160 90 2 135 100 3 165 105 4 190 95 5 210 110 Übungsbeispiele 1/6 1) Vervollständigen Sie folgende Tabelle: Nr. Aktie A Aktie B Schlusskurs in Schlusskurs in 0 145 85 1 160 90 2 135 100 3 165 105 4 190 95 5 210 110 Arithmetisches Mittel Standardabweichung

Mehr

Formelsammlung zur Kreisgleichung

Formelsammlung zur Kreisgleichung zur Kreisgleichung Julia Wolters 6. Oktober 2008 Inhaltsverzeichnis 1 Allgemeine Kreisgleichung 2 1.1 Berechnung des Mittelpunktes und Radius am Beispiel..... 3 2 Kreis und Gerade 4 2.1 Sekanten, Tangenten,

Mehr

Kapiteltests zum Leitprogramm Binäre Suchbäume

Kapiteltests zum Leitprogramm Binäre Suchbäume Kapiteltests zum Leitprogramm Binäre Suchbäume Björn Steffen Timur Erdag überarbeitet von Christina Class Binäre Suchbäume Kapiteltests für das ETH-Leitprogramm Adressaten und Institutionen Das Leitprogramm

Mehr