Benchmark-Experimente

Größe: px
Ab Seite anzeigen:

Download "Benchmark-Experimente"

Transkript

1 Benchmark-Experimente Viktoria Sander Seminar: Modellwahlkriterien (WS 2009/2010) Viktoria Sander (WS 2009/2010) Benchmark-Experimente / 50

2 1 Einleitung 2 Ausgangssituation Annahmen Überwachtes Lernen 3 Testverfahren Experimentelle Designs Lagevergleiche Multiples Testproblem 4 Anwendungen Beispiel: Regression Beispiel: Klassifikation 5 Zusammenfassung und Ausblick 6 Literatur Viktoria Sander (WS 2009/2010) Benchmark-Experimente / 50

3 Ziel Einleitung Bewertung von Algorithmen in der Regel durch Punktschätzungen ihrer interessierenden Leistungen auf gegebenen Daten Berücksichtigung der Variabilität der Leistungen Ziel: Identifikation des besten Algorithmus Viktoria Sander (WS 2009/2010) Benchmark-Experimente / 50

4 Problemstellung Einleitung Ziel: Solider und flexibler Rahmen für den Vergleich von Algorithmen bei willkürlichen Lernproblemen Herangehensweise Ziehe auf unabhängige Weise eine Stichprobe aus einer wohldefinierten Verteilung einer bestimmten Leistungsmessung, die abhängig vom Datenerzeugungsprozess ist. Interessierende Hypothesen aus Benchmark-Studien können mittels statistischer Standardtestprozeduren überprüft werden. Viktoria Sander (WS 2009/2010) Benchmark-Experimente / 50

5 Annahmen Ausgangssituation Annahmen Grundlagen { } L b = z1 b,..., zb n seien B, (b = 1,...,B), u.i.v. Lernstichproben aus einigen Datenerzeugungsprozessen (DGP) mit jeweils n Beobachtungen Verfügbar für das zugrunde liegende Problem: K > 1 mögliche Kandidat-Algorithmen a k, (k = 1,...,K) Funktion a k ( L b ) basiert auf Beobachtungen aus L b a k ( L b ) auf L b basierende ZV mit Verteilung A k (abhängig vom DGP von L b ): a k ( L b ) A k (DGP), k = 1,..., K Viktoria Sander (WS 2009/2010) Benchmark-Experimente / 50

6 Annahmen Ausgangssituation Annahmen Güte/Leistung der Algorithmen Grundhypothese/Grundproblem p kb = p(a k, L b ) P k = P k (DGP) Interesse an den Leistungsverteilungen der einzelnen Algorithmen Leistungsverteilungen P k (DGP) der Algorithmen a k liefern K verschiedene Zufallsstichproben {p k1,..., p kb } mit jeweils B u.i.v. Beobachtungen Interessierende Nullhypothese: H 0 : P 1 =... = P K Viktoria Sander (WS 2009/2010) Benchmark-Experimente / 50

7 Annahmen Ausgangssituation Annahmen Optimalitätskriterium Algorithmus a k besser als a k bezüglich p und φ, falls φ(p k ) < φ(p k ) Lageparameter wie Erwartungswert φ(p k ) = E(P k ) meistens Grundlage solcher Kriterien Testproblem: H 0 : P k (z) = P k (z) vs. H 1 : P k (z) = P k (z ) mit 0 Alternativen durch gewähltes Optimalitätskriterium bedingt Ergebnis abhängig vom DGP Viktoria Sander (WS 2009/2010) Benchmark-Experimente / 50

8 Ausgangssituation Annahmen Wie kann dieses System zum Testen der Gleichheit von Algorithmen auf speziellen Fall überwachter Lernprobleme angewendet werden? Dazu: Konzentration auf häufig vorkommende Anwendungen Viktoria Sander (WS 2009/2010) Benchmark-Experimente / 50

9 Überwachtes Lernen Ausgangssituation Überwachtes Lernen Grundsätzliches Beobachtungen z der Lernstichprobe haben die Form z = (y, x) Ziel der Lernaufgabe: Konstruktion von Prognosen, die auf eingegebenen Variablen beruhen Algorithmus k konstruiert Funktion ŷ = a k (x L b ) Diskrepanz zwischen y und ŷ: L(y, ŷ) (skalare Verlustfunktion) Leistungsmessung p definiert durch Funktional µ von Verteilung der Verlustfunktion: p kb = p(a k, L b ) = µ(l(y, (a k (x L b ))) P k (DGP) mögliche Verlustfunktion: L(y, ŷ) = (y ŷ) 2 mögliche Wahlen für µ: Erwartungswert bzw. arithmetisches Mittel, Median, Supremum der Verlustfunktion Viktoria Sander (WS 2009/2010) Benchmark-Experimente / 50

10 Spezielle Probleme Ausgangssituation Überwachtes Lernen Verteilungen der Leistungsmessung P k (DGP) von Algorithmen a k (k = 1,...,K) hängt von Datenerzeugungsprozess ab Ziehen von Zufallsstichproben aus Leistungsverteilung hängt vom Wissen über den verfügbaren Datenerzeugungsprozess ab Unterscheide im überwachten Lernen zwischen zwei Situationen: Situation 1 Datenerzeugungsprozess ist bekannt Simulationsstudien mit künstlich erzeugten Daten ziehen von beliebig vielen Stichproben möglich Situation 2 Information über DGP durch eine endliche Lernstichprobe L repräsentiert empirische Verteilungsfunktion von L stellt komplettes Wissen über bereitgestellten DGP dar Viktoria Sander (WS 2009/2010) Benchmark-Experimente / 50

11 Spezielle Probleme Ausgangssituation Überwachtes Lernen Wie werden Zufallsstichproben aus Verteilung der Leistungsmessung P k (DGP) für Algorithmus a k gezogen? 3 Grundprobleme: DGP bekannt (Simulation) eine Lernstichprobe und eine Teststichprobe verfügbar (Wettbewerb) eine Lernstichprobe verfügbar (reale Welt) Viktoria Sander (WS 2009/2010) Benchmark-Experimente / 50

12 Simulation Ausgangssituation Überwachtes Lernen Gegeben: künstliche Daten einer Verteilungsfunktion Z, wobei z i Z (i = 1,...,n) Lernstichprobe L besteht somit aus n unabhängigen Beobachtungen aus Z (L Z n ) DGP = Z n L 1,..., L B Z Leistungsmessung Bewertung von jedem Algorithmus a k auf allen Lernstichproben L b (b = 1,...,B) Berechnung von p kb = p(a k, L b ) = µ(l(y, a k (x L b ))) Gewinnung von Zufallsstichprobe mit B Beobachtungen aus Verteilungsfunktion P k (Z n ) H 0 : P 1 (Z n ) =... = P K (Z n ) Viktoria Sander (WS 2009/2010) Benchmark-Experimente / 50

13 Simulation Ausgangssituation Überwachtes Lernen Wenn µ nicht analytisch berechnet werden kann: Approximation durch Ziehen von Teststichprobe T Z n bestehend aus m unabh. Beobachtungen aus Z und Berechnung von ˆp kb = ˆp(a k, L b ) = µ T (L(y, a k (x L b ))) µ T empirisches Analog zu µ für Testbeobachtungen z = (y, x) T Viktoria Sander (WS 2009/2010) Benchmark-Experimente / 50

14 Wettbewerb Ausgangssituation Überwachtes Lernen Gegeben: Lernstichprobe L Z n mit n Beobachtungen aus Verteilungsfunktion Z Ẑ n deckt vorhandenes Wissen über DGP ab Imitiere DGP durch Benutzen der empirischen Verteilungsfunktion Ẑ n der Lernstichprobe: DGP = Ẑn Möglichkeit, aus diesem DGP u.i.v. Zufallsstichproben zu ziehen (Bootstrap) Viktoria Sander (WS 2009/2010) Benchmark-Experimente / 50

15 Wettbewerb Ausgangssituation Überwachtes Lernen Leistungsmessung Zusätzliche Teststichprobe T Z m mit m Beobachtungen gegeben Leistung muss nur bzgl. T bewertet werden Erhalte Zufallsstichprobe von B Beobachtungen aus ˆP(Ẑ n ) durch Bootstrapping: L 1,..., L B Ẑ n ˆP ist Verteilungsfunktion der Leistungsmessung bzgl. T und wird berechnet durch ˆp kb = ˆp(a k, L b ) = µ T (L(y, a k (x L b ))) Hypothese: H 0 : ˆP 1 (Ẑn) =... = ˆP K (Ẑn) Beachte: Algorithmen möglicherweise nur bzgl. der jeweiligen Teststichprobe T gut Viktoria Sander (WS 2009/2010) Benchmark-Experimente / 50

16 Reale Welt Ausgangssituation Überwachtes Lernen Gegeben: eine einzige Lernstichprobe L Z n Erhalte B unabhängige Lernstichproben aus empirischer Verteilungsfunktion Leistungsmessung L 1,..., L B Ẑn = DGP ˆp kb = ˆp(a k, L b ) = ˆµ(L(y, a k (x L b ))) ˆµ geeignete Version von µ Viktoria Sander (WS 2009/2010) Benchmark-Experimente / 50

17 Reale Welt Ausgangssituation Überwachtes Lernen Frage: Wie soll ˆµ gewählt werden? 1 n groß L = {L, T } Wettbewerb µ T 2 n nicht groß genug 3 Möglichkeiten: Problem III-Lernen Problem III-OOB Problem III-CV Viktoria Sander (WS 2009/2010) Benchmark-Experimente / 50

18 Reale Welt Ausgangssituation Überwachtes Lernen Problem III-Lernen Idee: Simulation: Modelle durch Stichproben aus Z n angepasst und ihre Leistung durch Stichproben aus Z bewertet Hier: Stichproben aus Ẑn bzw. Ẑ Lernstichprobe L entspricht Teststichprobe Verwenden von µ T Insgesamt Für jedes Modell, dass durch eine Bootstrap-Stichprobe angepasst wird, wird die originale Lernstichprobe L als Teststichprobe T genutzt. Viktoria Sander (WS 2009/2010) Benchmark-Experimente / 50

19 Reale Welt Ausgangssituation Überwachtes Lernen Problem III-OOB Idee: Teststichprobe T aus out-of-bootstrap Beobachtungen Verwenden von µ T Insgesamt Für jede Bootstrap-Stichpronbe L b werden die out-of-bootstrap Beobachtungen L\L b als Teststichprobe genutzt. Viktoria Sander (WS 2009/2010) Benchmark-Experimente / 50

20 Reale Welt Ausgangssituation Überwachtes Lernen Problem III-CV Idee: Bootstrap-Stichprobe wird in k Felder geteilt Durchführung k-facher Kreuzvalidierung auf Bootstrap-Stichprobe Leistung ˆp kb als Durchschnitt der einzelnen Fehlerquoten Beobachtungen aus originaler Lernstichprobe, die Teil aus Lernund Testfeld sind, werden entfernt Wähle Kreuzvalidierungsschätzer ˆµ Insgesamt Teile L b in k Felder Leistung ˆp kb wird als Durchschnitt der Messungen aus jedem Feld definiert Viktoria Sander (WS 2009/2010) Benchmark-Experimente / 50

21 Reale Welt Ausgangssituation Überwachtes Lernen Zusammenfassung Information durch eine einzige Lernstichprobe keine Hypothesentests über theoretische Leistungsmessungen möglich Stattdessen: Empirische Leistungsmessung berechnen Hypothese: H 0 : ˆP 1 (Ẑ n ) =... = ˆP K (Ẑ n ) Viktoria Sander (WS 2009/2010) Benchmark-Experimente / 50

22 Allgemeines Testverfahren Wir wissen: Problem des Vergleichs von K Algorithmen bzgl. einer Leistungmessung kann auf das Problem des Vergleichs von K numerischen Verteilungsfunktionen bzw. ihrer Charakteristiken zurückgeführt werden. Nun: Vorstellung geeigneter Testverfahren für die wichtigsten Testprobleme in Benchmark-Studien Viktoria Sander (WS 2009/2010) Benchmark-Experimente / 50

23 Testverfahren Experimentelle Designs Grundsätzlich zwei experimentelle Desings möglich: 1 Unabhängiges K-Stichproben-Design: neu entworfene Stichproben unabhängig zwischen den Algorithmen 2 Abhängiges K-Stichproben-Design: Leistung aller K Algorithmen durch Gebrauch der gleichen Zufallsstichproben L 1,...,L B bewertet. Vergleich Unabhängiges K-Stichproben-Design statistisch komfortabler Aber: Algorithmen nie mit gleichen Lernstichproben versorgt Wähle abhängiges K-Stichproben-Design und vergleiche Algorithmen anhand der gleichen Reihe von Lernstichproben Viktoria Sander (WS 2009/2010) Benchmark-Experimente / 50

24 Testverfahren Lagevergleiche Nutze wohlbekannte Standardtestverfahren: unabhängige Stichproben nichtparametrischer Test parametrischer Test K = 2 Wilcoxon-Rangsummentest t-test für unabh. Stichproben K > 2 Kruskal-Wallis-Test F-Test (ANOVA) abhängige Stichproben nichtparametrischer Test parametrischer Test K = 2 Wilcoxon-Vorzeichen-Rangtest t-test für abh. Stichproben K > 2 FriedmanTest - Viktoria Sander (WS 2009/2010) Benchmark-Experimente / 50

25 Testverfahren Vergleich von Algorithmen Lagevergleiche Teststatistiken 2-Stichproben-t-Test für gepaarte Stichproben t = d B (B 1) 1 b (d b d) 2 abhängiges K-Stichproben-Design k T = (B 1 b ˆp kb (BK) 1 k,b ˆp kb) 2 k,b (ˆp kb K 1 k ˆp kb B 1 b ˆp kb + (BK) 1 k,b ˆp kb) 2 Verteilungsbestimmung über Permutationstest Viktoria Sander (WS 2009/2010) Benchmark-Experimente / 50

26 Testverfahren Lagevergleiche Achtung! Zweifel, ob parametrische Annahmen bzgl. der Leistungsverteilungen (wie Normalverteilung oder Symmetrie) jemals geeignet sind. Eventuell Verwendung asymptotischer Verteilungen der Teststatistiken, wo exakte Bestimmung der Verteilung schwierig ist Viktoria Sander (WS 2009/2010) Benchmark-Experimente / 50

27 Testverfahren Multiples Testproblem Situation: Globale Hypothese der Gleichheit von K > 2 Algorithmen kann in einem abhängige K-Stichproben-Design abgelehnt werden Interesse an Identifizierung der Algorithmen, welche für Ablehnung verantwortlich sind Paarvergleiche, die Gesamtniveau α einhalten Nutzen eines abgeschlossenen Testprinzips Bonferroni-Holm-Methode Viktoria Sander (WS 2009/2010) Benchmark-Experimente / 50

28 Testverfahren Multiples Testproblem Exkurs: Abgeschlossenes Testprinzip Gegeben seien n Elementarhypothesen H0 i, sowie alle möglichen Durchschnitte dieser Hypothesen Für alle diese Hypothesen existiert ein Niveau-α-Test Alle Hypothesen H j 0 Hi 0 werden abgelehnt Hi 0 wird abgelehnt H j 0 wird nicht verworfen Hi 0 für Hj 0 Hi 0 wird nicht verworfen Viktoria Sander (WS 2009/2010) Benchmark-Experimente / 50

29 Testverfahren Multiples Testproblem Exkurs: Abgeschlossenes Testprinzip Viktoria Sander (WS 2009/2010) Benchmark-Experimente / 50

30 Beispiele Anwendungen Ziel: Illustration der grundsätzlichen Konzepte anhand von Beispielen beaufsichtigter Klassifikation und Regression Dazu: 1 Poweruntersuchung von Tests bzgl. empirischer Leistungsmessungen in den Problemen I, II und III am Beispiel eines einzigen künstlichen DGP einer univariaten Regressionsbeziehung 2 Vergleich der Leistungen von LDA, QDA und k-nächste-nachbarn-methode bzgl. eines in R implementierten Datensatzes Viktoria Sander (WS 2009/2010) Benchmark-Experimente / 50

31 Ausgangssituation Anwendungen Beispiel: Regression DGP folgt univariater Regressionsbeziehung y = 2x + βx 2 + ε mit x aus uniformer Verteilung auf Intervall [0;5] und Fehlerterme unabhängig N(0, 1)-verteilt. Beobachtungsanzahl: n = 50 Ziel: Vergleich von zwei Vorhersagemodellen: 1 a 1 : einfache lineare Regression mit Input x 2 a 2 : einfache quadratische Regression mit Inputs x und x 2 Regressionskoeffizient β wird geschätzt Viktoria Sander (WS 2009/2010) Benchmark-Experimente / 50

32 Ausgangssituation Anwendungen Beispiel: Regression Messung der Diskrepanz zwischen y und ŷ = a k (x L) (k = 1,2) durch quadratische Verlustfunktion L(y, ŷ) = (y ŷ) 2 Grundsätzliches Interesse an Kontrolle, ob Algorithmus a 1 für β [0, 0.15] besser performt als Algorithmus a 2 Leistungsmessung sowie Stichprobennahme aus Leistungsverteilung hängen von Wissensgrad ab Simulation, Wettbewerb, reale Welt Viktoria Sander (WS 2009/2010) Benchmark-Experimente / 50

33 Simulation Anwendungen Beispiel: Regression DGP bekannt durch o.g. Gleichung Möglichkeit, viele Lernstichproben mit n = 50 Beobachtungen zu ziehen Beobachtung von L b ermöglicht Berechnung des mittleren quadratischen Fehlers der Vorhersagefunktionen a 1 ( L b ) bzw. a 2 ( L b ) Testproblem: H 0 : E(P 1 (Z n )) E(P 2 (Z n )) vs. H 1 : E(P 1 (Z n )) > E(P 2 (Z n )) Approximation von P k (Z n ) durch ˆP k (Z n ) durch Gebrauch einer Teststichprobe mit m = 2000 Beobachtungen Beurteilung der Güte der Approximation durch kleinere Teststichprobe mit m = 50 Viktoria Sander (WS 2009/2010) Benchmark-Experimente / 50

34 Wettbewerb Anwendungen Beispiel: Regression Gegeben: Lernstichprobe mit n = 50 und Teststichprobe mit m = 50 Beobachtungen DGP = Ẑ n und wiederholtes Ziehen von Stichproben aus empirischer Verteilungsfunktion durch Gebrauch von Bootstrap Viktoria Sander (WS 2009/2010) Benchmark-Experimente / 50

35 Reale Welt Anwendungen Beispiel: Regression Wissen über DGP durch eine einzige Lernstichprobe gegeben Wiederholtes Stichprobenziehen durch Bootstrap Betrachte nun Problem III-Learn, Problem III-OOB und Problem III-CV: Problem III-CV: Leistungsmessung durch 5-fache Kreuzvalidierung auf Bootstrap-Stichprobe, wobei Fehlerquoten gemittelt werden, um Gesamt-Fehlerquote zu erhalten. Problem III-OOB: Vergleiche Out-of-Bootstrap empirische Leistungsmessung des reale-welt-problems mit derjenigen des Wettbewerbsproblems: Hypothetische Lern- und Teststichprobe zu einer Lernstichprobe zusammenführen und mit Problem III-OOB fortfahren. Viktoria Sander (WS 2009/2010) Benchmark-Experimente / 50

36 Durchführung Anwendungen Beispiel: Regression B = 250 Lernstichproben entweder vom wahren DGP Z n (Simulation) oder von empirischer Leistungsfunktion Ẑn mit Bootstrap (Wettbewerb oder reale Welt) Bewertung beider Algorithmen anhand dieser Lernstichproben Teste Nullhypothese der Überlegenheit von a 1 durch verbundenen t-test für verschiedene β Geschätzte Power durch 5000 Simulationen Frage: Theoretischer mittlerer quadratischer Fehler von a 1 kleiner als von a 2? Gilt also H 0? Sind unterschiedliche Ergebnisse bzgl. der drei Situation vorhanden? Dazu: Untersuchung von Power-Kurven der Tests für verschiedene β in den Problemen I, II und III Viktoria Sander (WS 2009/2010) Benchmark-Experimente / 50

37 Anwendungen Beispiel: Regression Ergebnisse der Power-Untersuchungen β I I II III-Learn III-OOB III-OOB III-CV m = 2000 m = 50 n = Table: Power der Tests in den Situationen I, II und III für variierende β-werte Viktoria Sander (WS 2009/2010) Benchmark-Experimente / 50

38 Interpretation Anwendungen Beispiel: Regression β = 0 Problem I (m = 2000) bietet genaueste Approximation des Vergleichs der theoretischen Leistungsmessungen: β = 0: Hypothese kleinerer mittlerer quadratischer Fehler von a 1 wird nie abgelehnt β 0.1: Hypothese kleinerer mittlerer quadratischer Fehler von a 1 wird immer abgelehnt In übrigen Problemen würde man für β = 0 erwarten, dass nur wenige Verwerfungen auftreten (Wahrscheinlichkeit sollte α = 0.05 nicht überschreiten) gegeben für Probleme I, III-OOB und III-CV; nicht für Probleme II und III-Learn (Overfitting) In Situation III-OOB und III-CV geschätzte Power für β = 0 zwischen und liegt Viktoria Sander (WS 2009/2010) Benchmark-Experimente / 50

39 Interpretation Anwendungen Beispiel: Regression β > 0 Power-Kurven in allen Situationen flacher als in Situation I; Verfahren, die auf III-OOB und III-CV basieren jedoch ziemlich nah an Power-Kurve aus Problem I mit m = 50 Power-Kurve in Problem III für große β höher im Vergleich zu Problem II und Wert für β = 0 nah an 0.05 Definition eigener Teststichprobe scheint ungeeignet, wenn nur eine einzige Lernstichprobe verfügbar Viktoria Sander (WS 2009/2010) Benchmark-Experimente / 50

40 Zusammenfassung Anwendungen Beispiel: Regression wichtigste Resultate schärfste Unterscheidung der überlegenen Bereiche in Problem I möglich In Problem II und III-Learn Probleme wegen Overfitting Problem III-OOB und III-CV liefern gute empirische Tests mit hoher Power Statt sich auf Ergebnisse aus Problem II zu verlassen, ist manchmal Umwandlung in ein Problem III geeignet Viktoria Sander (WS 2009/2010) Benchmark-Experimente / 50

41 Anwendungen Beispiel: Klassifikation Ziel Vergleich der Leistungen von LDA, QDA, 5-nächste-Nachbarn- und 10-nächste-Nachbarn-Methode Identifikation möglicher signifikanter Unterschiede mittels vorgestellter Testmethoden Betrachtung des Datensatzes " Glass" Viktoria Sander (WS 2009/2010) Benchmark-Experimente / 50

42 Datensatz Anwendungen Beispiel: Klassifikation Daten Problem: Prognose der Glasart anhand der chemischen Zusammensetzung eines Glases Dazu: Betrachtung von 9 Merkmalen des Glases Gegeben: 214 Glase, ihre zugehörigen Kennzahlen, sowie ihre Klasseneinteilung in eine von 7 Klassen Variablen: Brechungsindex, Natrium, Magnesium, Aluminium, Silicon, Kalium, Calcium, Barium, Eisen Klassifikationsproblem motiviert durch kriminologische Untersuchung Häufigkeitsverteilung Klasse Viktoria Sander (WS 2009/2010) Benchmark-Experimente / 50

43 Anwendungen Beispiel: Klassifikation Vergleich der Klassifizierungsverfahren Leistungsmessungen B = 100 Lernstichproben 4 Algorithmen auf gleichen Datensatz abhängige Stichproben Ermittlung der Fehlklassifikationsraten mit 5-facher-Kreuzvalidierung Für QDA in einer Klasse zu wenig Beobachtungen vorhanden Leistungsverteilungen: Verfahren LDA 5-n-N 10-n-N Minimum x Median x x Maximum Viktoria Sander (WS 2009/2010) Benchmark-Experimente / 50

44 Anwendungen Beispiel: Klassifikation Vergleich der Klassifizierungsverfahren Figure: Leistungsverteilungen von LDA, 5-nächste-Nachbarn und 10-nächste Nachbarn auf " Glass" -Datensatz Viktoria Sander (WS 2009/2010) Benchmark-Experimente / 50

45 Anwendungen Beispiel: Klassifikation Vergleich der Klassifizierungsverfahren Testergebnisse: K > 2 Nullhypothese: Es liegen keine signifikanten Unterschiede zwischen den Leistungsverteilungen vor Permutationstest liefert: T = und als simuliertes Quantil q : T > q H 0 kann abgelehnt werden Friedman-Test liefert: p-wert = < 0.05 H 0 kann abgelehnt werden Tests kommen zum gleichen Ergebnis Signifikante Unterschiede zwischen LDA, 5-nächste-Nachbarn und 10-nächste-Nachbarn liegen vor Viktoria Sander (WS 2009/2010) Benchmark-Experimente / 50

46 Anwendungen Beispiel: Klassifikation Vergleich der Klassifizierungsverfahren Paarvergleiche Nullhypothese: µ i µ j 3 Tests Nutzen der Bonferroni-Holm-Methode Nach p-werten geordnete Testergebnisse: 1 t-test für verbundene Stichproben: Tests p-wert adjustiertes α Testentscheidung 10nN 5nN 6.30 * Lehne H 0 ab LDA 5nN 7.94 * Lehne H 0 ab LDA 10nN Lehne H 0 nicht ab 2 Wilcoxon-Vorzeichen-Rangtest Tests p-wert adjustiertes α Testentscheidung 10nN 5nN 1.94 * Lehne H 0 ab LDA 5nN 1.94 * Lehne H 0 ab LDA 10nN Lehne H 0 nicht ab Viktoria Sander (WS 2009/2010) Benchmark-Experimente / 50

47 Anwendungen Beispiel: Klassifikation Vergleich der Klassifizierungsverfahren Ergebnisse Kein Unterschied zwischen den Ergebnissen der parametrischen bzw. nichtparametrischen Tests QDA auf diesem Datensatz schlechtester Algorithmus Annahmen kleinerer mittlerer Fehlklassifikationsraten von LDA und 10nN gegenüber 5nN werden zum 5%-Niveau abgelehnt Annahme kleinerer mittlerer Fehlklassifikationsraten von LDA gegenüber 10nN wird nicht abgelehnt 5nN auf diesem Datensatz der beste Klassifikationsalgorithmus Viktoria Sander (WS 2009/2010) Benchmark-Experimente / 50

48 Zusammenfassung und Ausblick Zusammenfassung wichtigste Resultate Vergleich von K Algorithmen lässt sich auf Problem des Vergleichs von K Verteilungen zurückführen Statistische Standardtestprozeduren zum Vergleich von K Leistungsverteilungen nutzen Stichprobennahme und darauf basierende Leistungsmessung abhängig vom Wissen über Datenerzeugungsprozess Leistung eines Algorithmus abhängig von gegebenen Daten Kein Algorithmus ist allgemein der Beste! Viktoria Sander (WS 2009/2010) Benchmark-Experimente / 50

49 Ausblick Zusammenfassung und Ausblick interessante Ansätze Vergleich anderer Klassifizierungsverfahren (evtl. auf anderen Datensätzen) Einbeziehen der drei Situationen in Tests bzgl. Klassifizierungsverfahren und Vergleich der Power Evtl. Nutzen größerer Datensätze Viktoria Sander (WS 2009/2010) Benchmark-Experimente / 50

50 Literatur Hothorn, T., Leisch, F., Zeileis, A., Hornik, K. (2005): The Design and Analysis of Benchmark Experiments, Journal of Computational and Graphical Statistics 14(3), Rüger, B. (2002): Test- und Schätztheorie, Band II: Statistische Tests, Oldenbourg, München. R Development Core Team (2009): R - A language and environment for statistical computing, Version , R Foundation for Statistical Computing, Wien. Viktoria Sander (WS 2009/2010) Benchmark-Experimente / 50

9. Schätzen und Testen bei unbekannter Varianz

9. Schätzen und Testen bei unbekannter Varianz 9. Schätzen und Testen bei unbekannter Varianz Dr. Antje Kiesel Institut für Angewandte Mathematik WS 2011/2012 Schätzen und Testen bei unbekannter Varianz Wenn wir die Standardabweichung σ nicht kennen,

Mehr

Statistik II für Betriebswirte Vorlesung 2

Statistik II für Betriebswirte Vorlesung 2 PD Dr. Frank Heyde TU Bergakademie Freiberg Institut für Stochastik Statistik II für Betriebswirte Vorlesung 2 21. Oktober 2014 Verbundene Stichproben Liegen zwei Stichproben vor, deren Werte einander

Mehr

Bachelorabschlussseminar Dipl.-Kfm. Daniel Cracau

Bachelorabschlussseminar Dipl.-Kfm. Daniel Cracau 1 Einführung in die statistische Datenanalyse Bachelorabschlussseminar Dipl.-Kfm. Daniel Cracau 2 Gliederung 1.Grundlagen 2.Nicht-parametrische Tests a. Mann-Whitney-Wilcoxon-U Test b. Wilcoxon-Signed-Rank

Mehr

Melanie Kaspar, Prof. Dr. B. Grabowski 1

Melanie Kaspar, Prof. Dr. B. Grabowski 1 7. Hypothesentests Ausgangssituation: Man muss sich zwischen 2 Möglichkeiten (=Hypothesen) entscheiden. Diese Entscheidung soll mit Hilfe von Beobachtungen ( Stichprobe ) getroffen werden. Die Hypothesen

Mehr

Willkommen zur Vorlesung Statistik

Willkommen zur Vorlesung Statistik Willkommen zur Vorlesung Statistik Thema dieser Vorlesung: Varianzanalyse Prof. Dr. Wolfgang Ludwig-Mayerhofer Universität Siegen Philosophische Fakultät, Seminar für Sozialwissenschaften Prof. Dr. Wolfgang

Mehr

Tutorial: Homogenitätstest

Tutorial: Homogenitätstest Tutorial: Homogenitätstest Eine Bank möchte die Kreditwürdigkeit potenzieller Kreditnehmer abschätzen. Einerseits lebt die Bank ja von der Vergabe von Krediten, andererseits verursachen Problemkredite

Mehr

90-minütige Klausur Statistik für Studierende der Kommunikationswissenschaft

90-minütige Klausur Statistik für Studierende der Kommunikationswissenschaft Prof. Dr. Helmut Küchenhoff SS08 90-minütige Klausur Statistik für Studierende der Kommunikationswissenschaft am 22.7.2008 Anmerkungen Überprüfen Sie bitte sofort, ob Ihre Angabe vollständig ist. Sie sollte

Mehr

Güte von Tests. die Wahrscheinlichkeit für den Fehler 2. Art bei der Testentscheidung, nämlich. falsch ist. Darauf haben wir bereits im Kapitel über

Güte von Tests. die Wahrscheinlichkeit für den Fehler 2. Art bei der Testentscheidung, nämlich. falsch ist. Darauf haben wir bereits im Kapitel über Güte von s Grundlegendes zum Konzept der Güte Ableitung der Gütefunktion des Gauss im Einstichprobenproblem Grafische Darstellung der Gütefunktionen des Gauss im Einstichprobenproblem Ableitung der Gütefunktion

Mehr

Einige Statistische Tests für den Ein- Zwei- und k-stichprobenfall (Nach Sachs, Stat. Meth.)

Einige Statistische Tests für den Ein- Zwei- und k-stichprobenfall (Nach Sachs, Stat. Meth.) ue biostatistik: nichtparametrische testverfahren / ergänzung 1/6 h. Lettner / physik Statistische Testverfahren Einige Statistische Tests für den Ein- Zwei- und k-stichprobenfall (Nach Sachs, Stat. Meth.)

Mehr

Motivation. Wilcoxon-Rangsummentest oder Mann-Whitney U-Test. Wilcoxon Rangsummen-Test Voraussetzungen. Bemerkungen

Motivation. Wilcoxon-Rangsummentest oder Mann-Whitney U-Test. Wilcoxon Rangsummen-Test Voraussetzungen. Bemerkungen Universität Karlsruhe (TH) Forschungsuniversität gegründet 825 Wilcoxon-Rangsummentest oder Mann-Whitney U-Test Motivation In Experimenten ist die Datenmenge oft klein Daten sind nicht normalverteilt Dann

Mehr

Business Value Launch 2006

Business Value Launch 2006 Quantitative Methoden Inferenzstatistik alea iacta est 11.04.2008 Prof. Dr. Walter Hussy und David Tobinski UDE.EDUcation College im Rahmen des dokforums Universität Duisburg-Essen Inferenzstatistik Erläuterung

Mehr

Eine Einführung in R: Statistische Tests

Eine Einführung in R: Statistische Tests Eine Einführung in R: Statistische Tests Bernd Klaus, Verena Zuber Institut für Medizinische Informatik, Statistik und Epidemiologie (IMISE), Universität Leipzig http://www.uni-leipzig.de/ zuber/teaching/ws12/r-kurs/

Mehr

Profil A 49,3 48,2 50,7 50,9 49,8 48,7 49,6 50,1 Profil B 51,8 49,6 53,2 51,1 51,1 53,4 50,7 50 51,5 51,7 48,8

Profil A 49,3 48,2 50,7 50,9 49,8 48,7 49,6 50,1 Profil B 51,8 49,6 53,2 51,1 51,1 53,4 50,7 50 51,5 51,7 48,8 1. Aufgabe: Eine Reifenfirma hat für Winterreifen unterschiedliche Profile entwickelt. Bei jeweils gleicher Geschwindigkeit und auch sonst gleichen Bedingungen wurden die Bremswirkungen gemessen. Die gemessenen

Mehr

Die Optimalität von Randomisationstests

Die Optimalität von Randomisationstests Die Optimalität von Randomisationstests Diplomarbeit Elena Regourd Mathematisches Institut der Heinrich-Heine-Universität Düsseldorf Düsseldorf im Dezember 2001 Betreuung: Prof. Dr. A. Janssen Inhaltsverzeichnis

Mehr

Universität Bonn 28. Juli 2010 Fachbereich Rechts- und Wirtschaftswissenschaften Statistische Abteilung Prof. Dr. A. Kneip. KLAUSUR Statistik B

Universität Bonn 28. Juli 2010 Fachbereich Rechts- und Wirtschaftswissenschaften Statistische Abteilung Prof. Dr. A. Kneip. KLAUSUR Statistik B Universität Bonn 28. Juli 2010 Fachbereich Rechts- und Wirtschaftswissenschaften Statistische Abteilung Prof. Dr. A. Kneip Sommersemester 2010 KLAUSUR Statistik B Hinweise zur Bearbeitung: Bei allen Teilaufgaben

Mehr

W-Rechnung und Statistik für Ingenieure Übung 11

W-Rechnung und Statistik für Ingenieure Übung 11 W-Rechnung und Statistik für Ingenieure Übung 11 Christoph Kustosz (kustosz@statistik.tu-dortmund.de) Mathematikgebäude Raum 715 Christoph Kustosz (kustosz@statistik.tu-dortmund.de) W-Rechnung und Statistik

Mehr

Analog zu Aufgabe 16.1 werden die Daten durch folgenden Befehl eingelesen: > kredit<-read.table("c:\\compaufg\\kredit.

Analog zu Aufgabe 16.1 werden die Daten durch folgenden Befehl eingelesen: > kredit<-read.table(c:\\compaufg\\kredit. Lösung 16.3 Analog zu Aufgabe 16.1 werden die Daten durch folgenden Befehl eingelesen: > kredit

Mehr

Statistische Auswertung:

Statistische Auswertung: Statistische Auswertung: Die erhobenen Daten mittels der selbst erstellten Tests (Surfaufgaben) Statistics Punkte aus dem Punkte aus Surftheorietest Punkte aus dem dem und dem Surftheorietest max.14p.

Mehr

Data Mining: Einige Grundlagen aus der Stochastik

Data Mining: Einige Grundlagen aus der Stochastik Data Mining: Einige Grundlagen aus der Stochastik Hagen Knaf Studiengang Angewandte Mathematik Hochschule RheinMain 21. Oktober 2015 Vorwort Das vorliegende Skript enthält eine Zusammenfassung verschiedener

Mehr

Varianzanalyse ANOVA

Varianzanalyse ANOVA Varianzanalyse ANOVA Johannes Hain Lehrstuhl für Mathematik VIII Statistik 1/23 Einfaktorielle Varianzanalyse (ANOVA) Bisher war man lediglich in der Lage, mit dem t-test einen Mittelwertsvergleich für

Mehr

R ist freie Software und kann von der Website. www.r-project.org

R ist freie Software und kann von der Website. www.r-project.org R R ist freie Software und kann von der Website heruntergeladen werden. www.r-project.org Nach dem Herunterladen und der Installation von R kann man R durch Doppelklicken auf das R-Symbol starten. R wird

Mehr

Monte-Carlo-Simulationen mit Copulas. Kevin Schellkes und Christian Hendricks 29.08.2011

Monte-Carlo-Simulationen mit Copulas. Kevin Schellkes und Christian Hendricks 29.08.2011 Kevin Schellkes und Christian Hendricks 29.08.2011 Inhalt Der herkömmliche Ansatz zur Simulation logarithmischer Renditen Ansatz zur Simulation mit Copulas Test und Vergleich der beiden Verfahren Fazit

Mehr

Ein möglicher Unterrichtsgang

Ein möglicher Unterrichtsgang Ein möglicher Unterrichtsgang. Wiederholung: Bernoulli Experiment und Binomialverteilung Da der sichere Umgang mit der Binomialverteilung, auch der Umgang mit dem GTR und den Diagrammen, eine notwendige

Mehr

Einfache statistische Auswertungen mit dem Programm SPSS

Einfache statistische Auswertungen mit dem Programm SPSS Einfache statistische Auswertungen mit dem Programm SPSS Datensatz: fiktive_daten.sav Dipl. Päd. Anne Haßelkus Dr. Dorothea Dette-Hagenmeyer 11/2011 Überblick 1 Deskriptive Statistiken; Mittelwert berechnen...

Mehr

Grundlagen der Inferenzstatistik

Grundlagen der Inferenzstatistik Grundlagen der Inferenzstatistik (Induktive Statistik oder schließende Statistik) Dr. Winfried Zinn 1 Deskriptive Statistik versus Inferenzstatistik Die Deskriptive Statistik stellt Kenngrößen zur Verfügung,

Mehr

Gibt es einen Geschmacksunterschied zwischen Coca Cola und Cola Zero?

Gibt es einen Geschmacksunterschied zwischen Coca Cola und Cola Zero? Gibt es einen Geschmacksunterschied zwischen Coca Cola und Cola Zero? Manche sagen: Ja, manche sagen: Nein Wie soll man das objektiv feststellen? Kann man Geschmack objektiv messen? - Geschmack ist subjektiv

Mehr

Primzahlen und RSA-Verschlüsselung

Primzahlen und RSA-Verschlüsselung Primzahlen und RSA-Verschlüsselung Michael Fütterer und Jonathan Zachhuber 1 Einiges zu Primzahlen Ein paar Definitionen: Wir bezeichnen mit Z die Menge der positiven und negativen ganzen Zahlen, also

Mehr

Beurteilung der biometrischen Verhältnisse in einem Bestand. Dr. Richard Herrmann, Köln

Beurteilung der biometrischen Verhältnisse in einem Bestand. Dr. Richard Herrmann, Köln Beurteilung der biometrischen Verhältnisse in einem Bestand Dr. Richard Herrmann, Köln Beurteilung der biometrischen Verhältnisse in einem Bestand 1 Fragestellung Methoden.1 Vergleich der Anzahlen. Vergleich

Mehr

Forschungsstatistik I

Forschungsstatistik I Prof. Dr. G. Meinhardt. Stock, Nordflügel R. 0-49 (Persike) R. 0- (Meinhardt) Sprechstunde jederzeit nach Vereinbarung Forschungsstatistik I Dr. Malte Persike persike@uni-mainz.de WS 008/009 Fachbereich

Mehr

Lineargleichungssysteme: Additions-/ Subtraktionsverfahren

Lineargleichungssysteme: Additions-/ Subtraktionsverfahren Lineargleichungssysteme: Additions-/ Subtraktionsverfahren W. Kippels 22. Februar 2014 Inhaltsverzeichnis 1 Einleitung 2 2 Lineargleichungssysteme zweiten Grades 2 3 Lineargleichungssysteme höheren als

Mehr

Biostatistik, WS 2015/2016 Der zwei-stichproben-t-test

Biostatistik, WS 2015/2016 Der zwei-stichproben-t-test 1/29 Biostatistik, WS 2015/2016 Der zwei-stichproben-t-test (t-test für ungepaarte Stichproben) Matthias Birkner http://www.staff.uni-mainz.de/birkner/biostatistik1516/ 11.12.2015 2/29 Inhalt 1 t-test

Mehr

6. Bayes-Klassifikation. (Schukat-Talamazzini 2002)

6. Bayes-Klassifikation. (Schukat-Talamazzini 2002) 6. Bayes-Klassifikation (Schukat-Talamazzini 2002) (Böhm 2003) (Klawonn 2004) Der Satz von Bayes: Beweis: Klassifikation mittels des Satzes von Bayes (Klawonn 2004) Allgemeine Definition: Davon zu unterscheiden

Mehr

Willkommen zur Vorlesung Statistik (Master)

Willkommen zur Vorlesung Statistik (Master) Willkommen zur Vorlesung Statistik (Master) Thema dieser Vorlesung: Verteilungsfreie Verfahren Prof. Dr. Wolfgang Ludwig-Mayerhofer Universität Siegen Philosophische Fakultät, Seminar für Sozialwissenschaften

Mehr

Klausur Nr. 1. Wahrscheinlichkeitsrechnung. Keine Hilfsmittel gestattet, bitte alle Lösungen auf dieses Blatt.

Klausur Nr. 1. Wahrscheinlichkeitsrechnung. Keine Hilfsmittel gestattet, bitte alle Lösungen auf dieses Blatt. Klausur Nr. 1 2014-02-06 Wahrscheinlichkeitsrechnung Pflichtteil Keine Hilfsmittel gestattet, bitte alle Lösungen auf dieses Blatt. Name: 0. Für Pflicht- und Wahlteil gilt: saubere und übersichtliche Darstellung,

Mehr

Auswerten mit Excel. Viele Video-Tutorials auf Youtube z.b. http://www.youtube.com/watch?v=vuuky6xxjro

Auswerten mit Excel. Viele Video-Tutorials auf Youtube z.b. http://www.youtube.com/watch?v=vuuky6xxjro Auswerten mit Excel Viele Video-Tutorials auf Youtube z.b. http://www.youtube.com/watch?v=vuuky6xxjro 1. Pivot-Tabellen erstellen: In der Datenmaske in eine beliebige Zelle klicken Registerkarte Einfügen

Mehr

Zeichen bei Zahlen entschlüsseln

Zeichen bei Zahlen entschlüsseln Zeichen bei Zahlen entschlüsseln In diesem Kapitel... Verwendung des Zahlenstrahls Absolut richtige Bestimmung von absoluten Werten Operationen bei Zahlen mit Vorzeichen: Addieren, Subtrahieren, Multiplizieren

Mehr

Auswertung mit dem Statistikprogramm SPSS: 30.11.05

Auswertung mit dem Statistikprogramm SPSS: 30.11.05 Auswertung mit dem Statistikprogramm SPSS: 30.11.05 Seite 1 Einführung SPSS Was ist eine Fragestellung? Beispiel Welche statistische Prozedur gehört zu welcher Hypothese? Statistische Berechnungen mit

Mehr

Statistik für Studenten der Sportwissenschaften SS 2008

Statistik für Studenten der Sportwissenschaften SS 2008 Statistik für Studenten der Sportwissenschaften SS 008 Aufgabe 1 Man weiß von Rehabilitanden, die sich einer bestimmten Gymnastik unterziehen, dass sie im Mittel µ=54 Jahre (σ=3 Jahre) alt sind. a) Welcher

Mehr

4. Erstellen von Klassen

4. Erstellen von Klassen Statistik mit Tabellenkalkulation 4. Erstellen von Klassen Mit einem einfachen Befehl lässt sich eine Liste von Zahlen auf die Häufigkeit der einzelnen Werte untersuchen. Verwenden Sie dazu den Befehl

Mehr

Überblick über die Verfahren für Ordinaldaten

Überblick über die Verfahren für Ordinaldaten Verfahren zur Analyse ordinalskalierten Daten 1 Überblick über die Verfahren für Ordinaldaten Unterschiede bei unabhängigen Stichproben Test U Test nach Mann & Whitney H Test nach Kruskal & Wallis parametrische

Mehr

Webergänzung zu Kapitel 10

Webergänzung zu Kapitel 10 Webergänzung zu Kapitel 10 10.1.4 Varianzanalyse (ANOVA: analysis of variance) Im Kapitel 10 haben wir uns hauptsächlich mit Forschungsbeispielen beschäftigt, die nur zwei Ergebnissätze hatten (entweder

Mehr

Hauptprüfung Fachhochschulreife 2015. Baden-Württemberg

Hauptprüfung Fachhochschulreife 2015. Baden-Württemberg Baden-Württemberg: Fachhochschulreie 2015 www.mathe-augaben.com Hauptprüung Fachhochschulreie 2015 Baden-Württemberg Augabe 1 Analysis Hilsmittel: graikähiger Taschenrechner Beruskolleg Alexander Schwarz

Mehr

SEPA Lastschriften. Ergänzung zur Dokumentation vom 27.01.2014. Workshop Software GmbH Siemensstr. 21 47533 Kleve 02821 / 731 20 02821 / 731 299

SEPA Lastschriften. Ergänzung zur Dokumentation vom 27.01.2014. Workshop Software GmbH Siemensstr. 21 47533 Kleve 02821 / 731 20 02821 / 731 299 SEPA Lastschriften Ergänzung zur Dokumentation vom 27.01.2014 Workshop Software GmbH Siemensstr. 21 47533 Kleve 02821 / 731 20 02821 / 731 299 www.workshop-software.de Verfasser: SK info@workshop-software.de

Mehr

Statistik II für Betriebswirte Vorlesung 3

Statistik II für Betriebswirte Vorlesung 3 PD Dr. Frank Heyde TU Bergakademie Freiberg Institut für Stochastik Statistik II für Betriebswirte Vorlesung 3 5. November 2013 Beispiel: Aktiensplit (Aczel & Sounderpandan, Aufg. 14-28) Ein Börsenanalyst

Mehr

Lineare Gleichungssysteme

Lineare Gleichungssysteme Brückenkurs Mathematik TU Dresden 2015 Lineare Gleichungssysteme Schwerpunkte: Modellbildung geometrische Interpretation Lösungsmethoden Prof. Dr. F. Schuricht TU Dresden, Fachbereich Mathematik auf der

Mehr

Grundlagen der Datenanalyse am Beispiel von SPSS

Grundlagen der Datenanalyse am Beispiel von SPSS Grundlagen der Datenanalyse am Beispiel von SPSS Einführung Dipl. - Psych. Fabian Hölzenbein hoelzenbein@psychologie.uni-freiburg.de Einführung Organisatorisches Was ist Empirie? Was ist Statistik? Dateneingabe

Mehr

Grammatiken. Einführung

Grammatiken. Einführung Einführung Beispiel: Die arithmetischen Ausdrücke über der Variablen a und den Operationen + und können wie folgt definiert werden: a, a + a und a a sind arithmetische Ausdrücke Wenn A und B arithmetische

Mehr

Austausch- bzw. Übergangsprozesse und Gleichgewichtsverteilungen

Austausch- bzw. Übergangsprozesse und Gleichgewichtsverteilungen Austausch- bzw. Übergangsrozesse und Gleichgewichtsverteilungen Wir betrachten ein System mit verschiedenen Zuständen, zwischen denen ein Austausch stattfinden kann. Etwa soziale Schichten in einer Gesellschaft:

Mehr

2 Evaluierung von Retrievalsystemen

2 Evaluierung von Retrievalsystemen 2. Evaluierung von Retrievalsystemen Relevanz 2 Evaluierung von Retrievalsystemen Die Evaluierung von Verfahren und Systemen spielt im IR eine wichtige Rolle. Gemäß der Richtlinien für IR der GI gilt es,...

Mehr

q = 1 p = 0.8 0.2 k 0.8 10 k k = 0, 1,..., 10 1 1 0.8 2 + 10 0.2 0.8 + 10 9 1 2 0.22 1 = 0.8 8 [0.64 + 1.6 + 1.8] = 0.678

q = 1 p = 0.8 0.2 k 0.8 10 k k = 0, 1,..., 10 1 1 0.8 2 + 10 0.2 0.8 + 10 9 1 2 0.22 1 = 0.8 8 [0.64 + 1.6 + 1.8] = 0.678 Lösungsvorschläge zu Blatt 8 X binomialverteilt mit p = 0. und n = 10: a PX = = 10 q = 1 p = 0.8 0. 0.8 10 = 0, 1,..., 10 PX = PX = 0 + PX = 1 + PX = 10 10 = 0. 0 0.8 10 + 0. 1 0.8 9 + 0 1 10 = 0.8 8 [

Mehr

Verteilungsmodelle. Verteilungsfunktion und Dichte von T

Verteilungsmodelle. Verteilungsfunktion und Dichte von T Verteilungsmodelle Verteilungsfunktion und Dichte von T Survivalfunktion von T Hazardrate von T Beziehungen zwischen F(t), S(t), f(t) und h(t) Vorüberlegung zu Lebensdauerverteilungen Die Exponentialverteilung

Mehr

1.3 Die Beurteilung von Testleistungen

1.3 Die Beurteilung von Testleistungen 1.3 Die Beurteilung von Testleistungen Um das Testergebnis einer Vp zu interpretieren und daraus diagnostische Urteile ableiten zu können, benötigen wir einen Vergleichsmaßstab. Im Falle des klassischen

Mehr

Franz Kronthaler. Statistik angewandt. Datenanalyse ist (k)eine Kunst. Excel Edition. ^ Springer Spektrum

Franz Kronthaler. Statistik angewandt. Datenanalyse ist (k)eine Kunst. Excel Edition. ^ Springer Spektrum Franz Kronthaler Statistik angewandt Datenanalyse ist (k)eine Kunst Excel Edition ^ Springer Spektrum Inhaltsverzeichnis Teil I Basiswissen und Werkzeuge, um Statistik anzuwenden 1 Statistik ist Spaß 3

Mehr

Dokumentation. estat Version 2.0

Dokumentation. estat Version 2.0 Dokumentation estat Version 2.0 Installation Die Datei estat.xla in beliebiges Verzeichnis speichern. Im Menü Extras AddIns... Durchsuchen die Datei estat.xla auswählen. Danach das Auswahlhäkchen beim

Mehr

Übungen zur Veranstaltung Statistik 2 mit SPSS

Übungen zur Veranstaltung Statistik 2 mit SPSS Raum 22, Tel. 39 4 Aufgabe 5. Wird der neue Film MatchPoint von Woody Allen von weiblichen und männlichen Zuschauern gleich bewertet? Eine Umfrage unter 00 Kinobesuchern ergab folgende Daten: Altersgruppe

Mehr

2. Deskriptive Statistik 2.1. Häufigkeitstabellen, Histogramme, empirische Verteilungsfunktionen

2. Deskriptive Statistik 2.1. Häufigkeitstabellen, Histogramme, empirische Verteilungsfunktionen 4. Datenanalyse und Modellbildung Deskriptive Statistik 2-1 2. Deskriptive Statistik 2.1. Häufigkeitstabellen, Histogramme, empirische Verteilungsfunktionen Für die Auswertung einer Messreihe, die in Form

Mehr

Einführung. Vorlesungen zur Komplexitätstheorie: Reduktion und Vollständigkeit (3) Vorlesungen zur Komplexitätstheorie. K-Vollständigkeit (1/5)

Einführung. Vorlesungen zur Komplexitätstheorie: Reduktion und Vollständigkeit (3) Vorlesungen zur Komplexitätstheorie. K-Vollständigkeit (1/5) Einführung 3 Vorlesungen zur Komplexitätstheorie: Reduktion und Vollständigkeit (3) Univ.-Prof. Dr. Christoph Meinel Hasso-Plattner-Institut Universität Potsdam, Deutschland Hatten den Reduktionsbegriff

Mehr

Die Pareto Verteilung wird benutzt, um Einkommensverteilungen zu modellieren. Die Verteilungsfunktion ist

Die Pareto Verteilung wird benutzt, um Einkommensverteilungen zu modellieren. Die Verteilungsfunktion ist Frage Die Pareto Verteilung wird benutzt, um Einkommensverteilungen zu modellieren. Die Verteilungsfunktion ist k a F (x) =1 k>0,x k x Finden Sie den Erwartungswert und den Median der Dichte für a>1. (Bei

Mehr

Fortgeschrittene Statistik Logistische Regression

Fortgeschrittene Statistik Logistische Regression Fortgeschrittene Statistik Logistische Regression O D D S, O D D S - R A T I O, L O G I T T R A N S F O R M A T I O N, I N T E R P R E T A T I O N V O N K O E F F I Z I E N T E N, L O G I S T I S C H E

Mehr

Tangentengleichung. Wie lautet die Geradengleichung für die Tangente, y T =? Antwort:

Tangentengleichung. Wie lautet die Geradengleichung für die Tangente, y T =? Antwort: Tangentengleichung Wie Sie wissen, gibt die erste Ableitung einer Funktion deren Steigung an. Betrachtet man eine fest vorgegebene Stelle, gibt f ( ) also die Steigung der Kurve und somit auch die Steigung

Mehr

5 Zusammenhangsmaße, Korrelation und Regression

5 Zusammenhangsmaße, Korrelation und Regression 5 Zusammenhangsmaße, Korrelation und Regression 5.1 Zusammenhangsmaße und Korrelation Aufgabe 5.1 In einem Hauptstudiumsseminar des Lehrstuhls für Wirtschafts- und Sozialstatistik machten die Teilnehmer

Mehr

Einfache Varianzanalyse für abhängige

Einfache Varianzanalyse für abhängige Einfache Varianzanalyse für abhängige Stichproben Wie beim t-test gibt es auch bei der VA eine Alternative für abhängige Stichproben. Anmerkung: Was man unter abhängigen Stichproben versteht und wie diese

Mehr

Nichtparametrische statistische Verfahren

Nichtparametrische statistische Verfahren Nichtparametrische statistische Verfahren (im Wesentlichen Analyse von Abhängigkeiten) Kategorien von nichtparametrischen Methoden Beispiel für Rangsummentests: Wilcoxon-Test / U-Test Varianzanalysen 1-faktorielle

Mehr

Statistik II. Statistik II, SS 2001, Seite 1 von 5

Statistik II. Statistik II, SS 2001, Seite 1 von 5 Statistik II, SS 2001, Seite 1 von 5 Statistik II Hinweise zur Bearbeitung Hilfsmittel: - Taschenrechner (ohne Datenbank oder die Möglichkeit diesen zu programmieren) - Formelsammlung im Umfang von einer

Mehr

METHODENLEHRE I WS 2013/14 THOMAS SCHÄFER

METHODENLEHRE I WS 2013/14 THOMAS SCHÄFER METHODENLEHRE I WS 2013/14 THOMAS SCHÄFER DAS THEMA: INFERENZSTATISTIK IV INFERENZSTATISTISCHE AUSSAGEN FÜR ZUSAMMENHÄNGE UND UNTERSCHIEDE Inferenzstatistik für Zusammenhänge Inferenzstatistik für Unterschiede

Mehr

Stichprobenauslegung. für stetige und binäre Datentypen

Stichprobenauslegung. für stetige und binäre Datentypen Stichprobenauslegung für stetige und binäre Datentypen Roadmap zu Stichproben Hypothese über das interessierende Merkmal aufstellen Stichprobe entnehmen Beobachtete Messwerte abbilden Schluss von der Beobachtung

Mehr

Name (in Druckbuchstaben): Matrikelnummer: Unterschrift:

Name (in Druckbuchstaben): Matrikelnummer: Unterschrift: 20-minütige Klausur zur Vorlesung Lineare Modelle im Sommersemester 20 PD Dr. Christian Heumann Ludwig-Maximilians-Universität München, Institut für Statistik 2. Oktober 20, 4:5 6:5 Uhr Überprüfen Sie

Mehr

Approximation durch Taylorpolynome

Approximation durch Taylorpolynome TU Berlin Fakultät II - Mathematik und Naturwissenschaften Sekretariat MA 4-1 Straße des 17. Juni 10623 Berlin Hochschultag Approximation durch Taylorpolynome Im Rahmen der Schülerinnen- und Schüler-Uni

Mehr

Gemischte Modelle. Fabian Scheipl, Sonja Greven. SoSe 2011. Institut für Statistik Ludwig-Maximilians-Universität München

Gemischte Modelle. Fabian Scheipl, Sonja Greven. SoSe 2011. Institut für Statistik Ludwig-Maximilians-Universität München Gemischte Modelle Fabian Scheipl, Sonja Greven Institut für Statistik Ludwig-Maximilians-Universität München SoSe 2011 Inhalt Amsterdam-Daten: LMM Amsterdam-Daten: GLMM Blutdruck-Daten Amsterdam-Daten:

Mehr

Anhand des bereits hergeleiteten Models erstellen wir nun mit der Formel

Anhand des bereits hergeleiteten Models erstellen wir nun mit der Formel Ausarbeitung zum Proseminar Finanzmathematische Modelle und Simulationen bei Raphael Kruse und Prof. Dr. Wolf-Jürgen Beyn zum Thema Simulation des Anlagenpreismodels von Simon Uphus im WS 09/10 Zusammenfassung

Mehr

Lineare Gleichungssysteme

Lineare Gleichungssysteme Lineare Gleichungssysteme 1 Zwei Gleichungen mit zwei Unbekannten Es kommt häufig vor, dass man nicht mit einer Variablen alleine auskommt, um ein Problem zu lösen. Das folgende Beispiel soll dies verdeutlichen

Mehr

Formelsammlung zur Kreisgleichung

Formelsammlung zur Kreisgleichung zur Kreisgleichung Julia Wolters 6. Oktober 2008 Inhaltsverzeichnis 1 Allgemeine Kreisgleichung 2 1.1 Berechnung des Mittelpunktes und Radius am Beispiel..... 3 2 Kreis und Gerade 4 2.1 Sekanten, Tangenten,

Mehr

Ausarbeitung des Seminarvortrags zum Thema

Ausarbeitung des Seminarvortrags zum Thema Ausarbeitung des Seminarvortrags zum Thema Anlagepreisbewegung zum Seminar Finanzmathematische Modelle und Simulationen bei Raphael Kruse und Prof. Dr. Wolf-Jürgen Beyn von Imke Meyer im W9/10 Anlagepreisbewegung

Mehr

1 Einleitung. 1.1 Motivation und Zielsetzung der Untersuchung

1 Einleitung. 1.1 Motivation und Zielsetzung der Untersuchung 1 Einleitung 1.1 Motivation und Zielsetzung der Untersuchung Obgleich Tourenplanungsprobleme zu den am häufigsten untersuchten Problemstellungen des Operations Research zählen, konzentriert sich der Großteil

Mehr

AZK 1- Freistil. Der Dialog "Arbeitszeitkonten" Grundsätzliches zum Dialog "Arbeitszeitkonten"

AZK 1- Freistil. Der Dialog Arbeitszeitkonten Grundsätzliches zum Dialog Arbeitszeitkonten AZK 1- Freistil Nur bei Bedarf werden dafür gekennzeichnete Lohnbestandteile (Stundenzahl und Stundensatz) zwischen dem aktuellen Bruttolohnjournal und dem AZK ausgetauscht. Das Ansparen und das Auszahlen

Mehr

Unterrichtsmaterialien in digitaler und in gedruckter Form. Auszug aus: Übungsbuch für den Grundkurs mit Tipps und Lösungen: Analysis

Unterrichtsmaterialien in digitaler und in gedruckter Form. Auszug aus: Übungsbuch für den Grundkurs mit Tipps und Lösungen: Analysis Unterrichtsmaterialien in digitaler und in gedruckter Form Auszug aus: Übungsbuch für den Grundkurs mit Tipps und Lösungen: Analysis Das komplette Material finden Sie hier: Download bei School-Scout.de

Mehr

QM: Prüfen -1- KN16.08.2010

QM: Prüfen -1- KN16.08.2010 QM: Prüfen -1- KN16.08.2010 2.4 Prüfen 2.4.1 Begriffe, Definitionen Ein wesentlicher Bestandteil der Qualitätssicherung ist das Prüfen. Sie wird aber nicht wie früher nach der Fertigung durch einen Prüfer,

Mehr

Quantilsschätzung als Werkzeug zur VaR-Berechnung

Quantilsschätzung als Werkzeug zur VaR-Berechnung Quantilsschätzung als Werkzeug zur VaR-Berechnung Ralf Lister, Aktuar, lister@actuarial-files.com Zusammenfassung: Zwei Fälle werden betrachtet und die jeweiligen VaR-Werte errechnet. Im ersten Fall wird

Mehr

Korrelation - Regression. Berghold, IMI

Korrelation - Regression. Berghold, IMI Korrelation - Regression Zusammenhang zwischen Variablen Bivariate Datenanalyse - Zusammenhang zwischen 2 stetigen Variablen Korrelation Einfaches lineares Regressionsmodell 1. Schritt: Erstellung eines

Mehr

Korrelation (II) Korrelation und Kausalität

Korrelation (II) Korrelation und Kausalität Korrelation (II) Korrelation und Kausalität Situation: Seien X, Y zwei metrisch skalierte Merkmale mit Ausprägungen (x 1, x 2,..., x n ) bzw. (y 1, y 2,..., y n ). D.h. für jede i = 1, 2,..., n bezeichnen

Mehr

Lösungen zu Janssen/Laatz, Statistische Datenanalyse mit SPSS 1

Lösungen zu Janssen/Laatz, Statistische Datenanalyse mit SPSS 1 LÖSUNG 3A Lösungen zu Janssen/Laatz, Statistische Datenanalyse mit SPSS 1 Mit den Berechnungsfunktionen LG10(?) und SQRT(?) in "Transformieren", "Berechnen" können logarithmierte Werte sowie die Quadratwurzel

Mehr

Vorkurs Mathematik Übungen zu Polynomgleichungen

Vorkurs Mathematik Übungen zu Polynomgleichungen Vorkurs Mathematik Übungen zu en 1 Aufgaben Lineare Gleichungen Aufgabe 1.1 Ein Freund von Ihnen möchte einen neuen Mobilfunkvertrag abschließen. Es gibt zwei verschiedene Angebote: Anbieter 1: monatl.

Mehr

Microsoft Update Windows Update

Microsoft Update Windows Update Microsoft bietet mehrere Möglichkeit, Updates durchzuführen, dies reicht von vollkommen automatisch bis zu gar nicht. Auf Rechnern unserer Kunden stellen wir seit September 2006 grundsätzlich die Option

Mehr

Grundbegriffe der Informatik

Grundbegriffe der Informatik Grundbegriffe der Informatik Einheit 15: Reguläre Ausdrücke und rechtslineare Grammatiken Thomas Worsch Universität Karlsruhe, Fakultät für Informatik Wintersemester 2008/2009 1/25 Was kann man mit endlichen

Mehr

Klausur zur Vorlesung Multivariate Verfahren, SS 2006 6 Kreditpunkte, 90 min

Klausur zur Vorlesung Multivariate Verfahren, SS 2006 6 Kreditpunkte, 90 min Klausur, Multivariate Verfahren, SS 2006, 6 Kreditpunkte, 90 min 1 Prof. Dr. Fred Böker 08.08.2006 Klausur zur Vorlesung Multivariate Verfahren, SS 2006 6 Kreditpunkte, 90 min Gesamtpunkte: 39 Aufgabe

Mehr

Konzepte der Informatik

Konzepte der Informatik Konzepte der Informatik Vorkurs Informatik zum WS 2011/2012 26.09. - 30.09.2011 17.10. - 21.10.2011 Dr. Werner Struckmann / Christoph Peltz Stark angelehnt an Kapitel 1 aus "Abenteuer Informatik" von Jens

Mehr

Kontingenzkoeffizient (nach Pearson)

Kontingenzkoeffizient (nach Pearson) Assoziationsmaß für zwei nominale Merkmale misst die Unabhängigkeit zweier Merkmale gibt keine Richtung eines Zusammenhanges an 46 o jl beobachtete Häufigkeiten der Kombination von Merkmalsausprägungen

Mehr

Würfelt man dabei je genau 10 - mal eine 1, 2, 3, 4, 5 und 6, so beträgt die Anzahl. der verschiedenen Reihenfolgen, in denen man dies tun kann, 60!.

Würfelt man dabei je genau 10 - mal eine 1, 2, 3, 4, 5 und 6, so beträgt die Anzahl. der verschiedenen Reihenfolgen, in denen man dies tun kann, 60!. 040304 Übung 9a Analysis, Abschnitt 4, Folie 8 Die Wahrscheinlichkeit, dass bei n - maliger Durchführung eines Zufallexperiments ein Ereignis A ( mit Wahrscheinlichkeit p p ( A ) ) für eine beliebige Anzahl

Mehr

Überprüfung der Bildungsstandards in den Naturwissenschaften. Chemie Marcus Mössner

Überprüfung der Bildungsstandards in den Naturwissenschaften. Chemie Marcus Mössner Überprüfung der Bildungsstandards in den Naturwissenschaften Bildungsstandards im Fach Chemie für den Mittleren Bildungsabschluss (Beschluss vom 16.12.2004) Die Chemie untersucht und beschreibt die stoffliche

Mehr

Einführung in die Algebra

Einführung in die Algebra Prof. Dr. H. Brenner Osnabrück SS 2009 Einführung in die Algebra Vorlesung 13 Einheiten Definition 13.1. Ein Element u in einem Ring R heißt Einheit, wenn es ein Element v R gibt mit uv = vu = 1. DasElementv

Mehr

Messgeräte: Mess-System-Analyse und Messmittelfähigkeit

Messgeräte: Mess-System-Analyse und Messmittelfähigkeit Messgeräte: Mess-System-Analyse und Messmittelfähigkeit Andreas Berlin 14. Juli 2009 Bachelor-Seminar: Messen und Statistik Inhalt: 1 Aspekte einer Messung 2 Mess-System-Analyse 2.1 ANOVA-Methode 2.2 Maße

Mehr

Füllmenge. Füllmenge. Füllmenge. Füllmenge. Mean = 500,0029 Std. Dev. = 3,96016 N = 10.000. 485,00 490,00 495,00 500,00 505,00 510,00 515,00 Füllmenge

Füllmenge. Füllmenge. Füllmenge. Füllmenge. Mean = 500,0029 Std. Dev. = 3,96016 N = 10.000. 485,00 490,00 495,00 500,00 505,00 510,00 515,00 Füllmenge 2.4 Stetige Zufallsvariable Beispiel. Abfüllung von 500 Gramm Packungen einer bestimmten Ware auf einer automatischen Abfüllanlage. Die Zufallsvariable X beschreibe die Füllmenge einer zufällig ausgewählten

Mehr

Varianzanalyse (ANOVA: analysis of variance)

Varianzanalyse (ANOVA: analysis of variance) Varianzanalyse (AOVA: analysis of variance) Einfaktorielle VA Auf der Basis von zwei Stichproben wird bezüglich der Gleichheit der Mittelwerte getestet. Variablen müssen Variablen nur nominalskaliert sein.

Mehr

Klausur zu Methoden der Statistik I (mit Kurzlösung) Wintersemester 2007/2008. Aufgabe 1

Klausur zu Methoden der Statistik I (mit Kurzlösung) Wintersemester 2007/2008. Aufgabe 1 Lehrstuhl für Statistik und Ökonometrie der Otto-Friedrich-Universität Bamberg Prof. Dr. Susanne Rässler Klausur zu Methoden der Statistik I (mit Kurzlösung) Wintersemester 2007/2008 Aufgabe 1 Ihnen liegt

Mehr

PRAKTIKUM Experimentelle Prozeßanalyse 2. VERSUCH AS-PA-2 "Methoden der Modellbildung statischer Systeme" Teil 2 (für ausgewählte Masterstudiengänge)

PRAKTIKUM Experimentelle Prozeßanalyse 2. VERSUCH AS-PA-2 Methoden der Modellbildung statischer Systeme Teil 2 (für ausgewählte Masterstudiengänge) FACHGEBIET Systemanalyse PRAKTIKUM Experimentelle Prozeßanalyse 2 VERSUCH AS-PA-2 "Methoden der Modellbildung statischer Systeme" Teil 2 (für ausgewählte Masterstudiengänge) Verantw. Hochschullehrer: Prof.

Mehr

GEVITAS Farben-Reaktionstest

GEVITAS Farben-Reaktionstest GEVITAS Farben-Reaktionstest GEVITAS Farben-Reaktionstest Inhalt 1. Allgemeines... 1 2. Funktionsweise der Tests... 2 3. Die Ruhetaste und die Auslösetaste... 2 4. Starten der App Hauptmenü... 3 5. Auswahl

Mehr