Prinzip "Proportional Reduction of Error" (PRE)

Ähnliche Dokumente
Statistik. ist die Kunst, Daten zu gewinnen, darzustellen, zu analysieren und zu interpretieren um zu neuem Wissen zu gelangen.

Regressionsrechnung und Korrelationsrechnung

Einführung Fehlerrechnung

Spannweite, Median Quartilsabstand, Varianz und Standardabweichung.

2.2 Rangkorrelation nach Spearman

Zur Interpretation einer Beobachtungsreihe kann man neben der grafischen Darstellung weitere charakteristische Größen heranziehen.

Quellencodierung I: Redundanzreduktion, redundanzsparende Codes

Mehrdimensionale Häufigkeitsverteilungen (1)

Fehlerrechnung im Praktikum

Histogramm / Säulendiagramm

Lohnkosten pro Arbeitsstunde. Wie hoch sind die Lohnkosten pro Arbeitsstunde im Jahresdurchschnitt?

Einführung in die Stochastik 3. Übungsblatt

Regressionsgerade, lineares Modell:

Statistische Kennzahlen für die Streuung

Erzeugen und Testen von Zufallszahlen

Schiefe- und Konzentrationsmaße

Schiefe- und Konzentrationsmaße

Konzentrationsanalyse

Der Korrelationskoeffizient ist ein Maß für den linearen Zusammenhang zwischen zwei Variablen X und Y. Er ist durch folgende Formel charakterisiert:

Verdichtete Informationen

Korrelations- und Assoziationsmaße

Deskriptive Statistik2 Durchschnittswert (der arithmetische Mittelwert)

Sitzplatzreservierungsproblem

Formelzusammenstellung

Deskriptive Statistik und Explorative Datenanalyse

Ordnungsstatistiken und Quantile

Multiple Regression (1) - Einführung I -

Statistik. (Inferenzstatistik)

Aufgaben. 1. Gegeben seien folgende Daten einer statistischen Erhebung, bereits nach Größe sortiert (Rangliste):

Übungen zur Wahrscheinlichkeitsrechnung und Schliessenden Statistik

Sozialwissenschaftliche Methoden und Statistik I

1 Mathe Formeln Statistik und Wahrscheinlichkeitsrechnung

Lösungen. Häufigkeitsverteilung (Stabdiagramm) Aufgabe 1. Häufigkeit (h) Merkmal (x)

Geometrisches Mittel und durchschnittliche Wachstumsraten

2. Zusammenhangsanalysen: Korrelation und Regression

Lösungen zum Übungs-Blatt 7 Wahrscheinlichkeitsrechnung

Lösungen zum Übungs-Blatt 7 Wahrscheinlichkeitsrechnung

Deskriptive Statistik - Aufgabe 3

2 Regression, Korrelation und Kontingenz

REGRESSION. Marcus Hudec Christian Neumann. Eine anwendungsorientierte Einführung. Unterstützt von Institut für Statistik der Universität Wien

Allgemeine Prinzipien

4. Marshallsche Nachfragefunktionen Frage: Wie hängt die Nachfrage nach Gütern

Universitätslehrgang Sports Physiotherapy Einführung in die Statistik

Festverzinsliche Wertpapiere. Kurse und Renditen bei ganzzahligen Restlaufzeiten

Ein Maß für die Ungleichheit bzw. Heterogenität kategorialer Daten ist Simpsons normiertes D:

Grundlagen der Energietechnik Energiewirtschaft Kostenrechnung. Vorlesung EEG Grundlagen der Energietechnik

die Schadenhöhe ( = Risikoergebnis) des i-ten Versicherungsnehmers i 1,, n).

Hinweise zum Hochrechnungsverfahren für die Arbeit mit den Daten

Leitfaden zu den Indexkennzahlen der Deutschen Börse

Einführung in Statistik

Unter einer Rente versteht man eine regelmässige und konstante Zahlung

Maße zur Kennzeichnung der Form einer Verteilung (1)

Schiefe-, Wölbungs- und Konzentrationsmaße

Im Wöhlerdiagramm wird die Lebensdauer (Lastwechsel oder Laufzeit) eines Bauteils in Abhängigkeit von der Belastung dargestellt.

Alternative Darstellung des 2-Stichprobentests für Anteile. Beobachtete Response No Response Total absolut DCF CF

Eigenschaften der arithmetischen Mittel. Schätzer für die Varianz. Allgeimeines Method: Likelihood Funktion. Schätzer für die Wahrscheinlichkeit

= k. , mit k als Anzahl der Hypothesen A i und den Daten B. Bestimmtheitsmaß:!Determinationskoeffizient

6. Zusammenhangsmaße (Kovarianz und Korrelation)

Quantitative Methoden in der klinischen Epidemiologie

Wenn man mehrere Verbraucher in Reihe schaltet, so werden alle vom gleichen Strom durchflossen, siehe auch Abschnitt und Formel ( ).

Lorenz' sche Konzentrationskurve und Disparitätsindex nach Gini

Mathematik: Mag. Schmid Wolfgang & LehrerInnenteam Arbeitsblatt Semester ARBEITSBLATT 7-8 WAHRSCHEINLICHKEITSRECHNUNG UND STATISTIK

Lösungen. Lösung zu d):

(Markowitz-Portfoliotheorie)

Kommentierte Formelsammlung der deskriptiven und induktiven Statistik für Wirtschaftswissenschaftler

Asymptotische Normalverteilung nach dem zentralen Grenzwertsatz

Physikalische Messungen sind immer fehlerbehaftet! Der wahre Wert ist nicht ermittelbar. Der wahre Wert x ist nicht identisch mit dem Mittelwert

Beschreibung des Zusammenhangs zweier metrischer Merkmale. Streudiagramme Korrelationskoeffizienten Regression

3. Das Messergebnis. Was ist ein Messergebnis?

Test für Varianz. Test für Varianz. Test für Varianz. Die Kontingenztabelle. Statistik 2 4. Vorlesung. Wiederholung: zweidimensionales Datenmaterial

2. Mittelwerte (Lageparameter)

Deskriptive Statistik - Aufgabe 2

Z Z, kurz. Zählt die Reihenfolge der Buchstaben (ja/nein) Daraus ergeben sich wiederum vier Möglichkeiten, Wörter der Länge k zu bilden.

2. Die Elementarereignisse sind die Kombinationsmöglichkeiten von: Wappen = W und:

Grundlagen der Entscheidungstheorie

Thema 5: Reduzierte Datenanforderungen II: Naive Diversifikation

( ) ( ) ( ) ( ) è ø. P A Wahrscheinlichkeitsmaß. lim n. Dr. Christian Schwarz 4. KOMBINATORIK Permutationen

Messfehler, Fehlerberechnung und Fehlerabschätzung

Lösungen zu Übungs-Blatt 7 Klassische Wahrscheinlichkeit in Glücksspielen, Bedingte Wkt, Unabhängigkeit, Satz von Bayes

wird auch Spannweite bzw. Variationsbreite genannt ist definiert als die Differenz zwischen dem größten und kleinsten Messwert einer Verteilung:

Beschreibende Statistik Mittelwert

Grundgesetze der BOOLEschen Algebra und Rechenregeln

Formelsammlung für die Lehrveranstaltung Wirtschaftsmathematik / Statistik

Deskriptive Statistik behaftet.

Statistische Maßzahlen

Teil IV Musterklausuren (Univ. Essen) mit Lösungen

6. Zusammenhangsmaße (Kovarianz und Korrelation)

Übung Statistik II SS 2006 Musterlösung Arbeitsblatt 6

Mehrfachregression: Einfluss mehrerer Merkmale auf ein metrisches Merkmal. Designmatrix Bestimmtheitsmaß F-Test T-Test für einzelne Regressoren

Quantitative BWL 2. Teil: Finanzwirtschaft

1.4 Wellenlängenbestimmung mit dem Prismenspektrometer

Bachelorprüfung SS 2016

Regressions- und Korrelationsanalyse

Verteilungen und Schätzungen

1 Elementare Finanzmathematik

Finanzmathe. -Zinsrechnung November 2004 Anne Grund & Mathias Jahn Zinsrechnung 2

Die Binomialverteilung als Wahrscheinlichkeitsverteilung für die Schadenversicherung

4. Interpolation und Approximation

wahlberechtigte Personen der BRD zur Bundestagswahl zugelassene Parteien (SPD, CDU, Grüne, FDP)

Transkript:

Dr. Reate Prust: Eführug quattatve Forschugsmethode Bvarate Maße: Przp "Proportoal Reducto of Error" (PRE) E 1 - E Fehler be Regel 1 - Fehler be Regel = E 1 Fehler be Regel 1 Regel 1: Vorhersageregel ur mt der abhägge (zu erklärede) Varable Regel : Vorhersageregel mt Kets der uabhägge (erklärede) Varable Fehler: Falschvorhersage Alle PRE-Maße versuche Aussage der Form: Um wevel Prozet ka der Vorhersagefehler für de abhägge Varable durch de Esatz der Regel reduzert werde, d.h. durch de Kets der uabhägge Varable?

Dr. Reate Prust: Eführug quattatve Forschugsmethode Bvarate Maße: Überscht über de PRE-Maße λ (Lambda) η (Eta) r Regel 1 Modus der abh. Var. für alle UE (beste Vorhersage) AM der abh. Var. für alle UE (beste Vorhersage) AM der abh. Var. für alle UE (beste Vorhersage) Regel Bedgter Modus der abh. Var. (für jede Kategore der uabh. Var. getret) Bedgtes AM der abh. Var. (für jede Kategore der uabh. Var. getret) Wert der Regressosgerade für alle UE Fehler Azahl der UE mt falscher Vorhersage Summe der quadrerte Abwechuge der Vorhersagewerte vo de tatsächlche Werte Summe der quadrerte Abwechuge der Vorhersagewerte vo de tatsächlche Werte UE: Utersuchugsehet(e) AM: Arthmetsches Mttel

Dr. Reate Prust: Eführug quattatve Forschugsmethode Bespel Ergebsse bvarater Auswertug Berechug vo (Lambda) V1 Geschlecht V4 Fersehkosum 1 mälch weblch 1 sehr oft 0 5 5 oft 0 5 5 3 kaum 50 30 80 row 4 e 0 50 70 colum 110 90 00 Fehlerdefto: Azahl der Falschvorhersage Regel 1 (ohe uabh. Var.): Bester Schätzer st der Modus: h=3 Fehler E 1 = 5+5+70 = 10 Regel (mt uabh. Var.): Bester Schätzer st der bedgte Modus: h m = 3 ud h w = 4 (Modus der Subgruppe der mälche Persoe) (Modus der Subgruppe der weblche Persoe Fehler E = 0+0+0 + 5+5+30 = 100 = (E 1 - E ) / E 1 = (10-100) / 10 = 0.17, d.h. De Vorhersage für de abhägge Varable kote durch Kets der uabhägge Varable um 17 % verbessert werde. Lambda st da ubrauchbar, we de Vertelug der abhägge Varable sehr schef st, wel da häufg der Gesamtmodus mt de bedgte Mod de Subgruppe überestmmt. I dem Fall st Lambda Null, auch we offeschtlch e Zusammehag besteht so we m folgede Bespel

Dr. Reate Prust: Eführug quattatve Forschugsmethode Bespel Ergebsse bvarater Auswertug Problem: Lambda = 0 Verarbetete Fälle Fälle Gültg Fehled Gesamt N Prozet N Prozet N Prozet V87C Wochearbetsstude klass. * v55 98 99,4% 18,6% 946 100,0% V87C Wochearbetsstude klass. * v55 Kreuztabelle Gesamt,00 1,00 bs 0,00 0,5-39,5 3,00 40-40,5 4,00 41 ud mehr Azahl % vo v55 Azahl % vo v55 Azahl % vo v55 Azahl % vo v55 Azahl % vo v55 Azahl % vo v55 v55 1 MANN FRAU Gesamt 63 888 150 43,8% 59,8% 51,9% 10 103 113,7% 6,9% 3,9% 193 9 4 13,4% 15,4% 14,4% 117 339 15,4% 7,9% 11,6% 387 147 534 6,8% 9,9% 18,% 1444 1484 98 100,0% 100,0% 100,0% Lambda =,000 V =,99 C =,87

Dr. Reate Prust: Eführug quattatve Forschugsmethode Bespel Ergebsse bvarater Auswertug Berechug vo bzw. (Eta) Rego Stadt Lad 0 35 5 40 1 45 5 50 Kderzahl 10 10 0 3 5 45 50 4 5 35 40 100 100 00 Fehler: Summe der quadrerte Abwechuge zwsche Schätzwert ud tatsächlchem Wert Regel 1 (ohe uabh. Var.): Bester Schätzer st das AM: x = (040 + 150 + 0 + 350 + 440)/00 = De Berechug des Fehlers basert also auf de Abwechuge zwsche AM ud tatsächlchem Wert: E 1 = 40 (0-) + 50 (1-) + 0 (-) + 50 (3-) + 40 * (4-) = 40 Regel (mt uabh. Var.): Bester Schätzer st das bedgte AM, d.h. das AM de Subgruppe S ud L x S = (035 + 145 + 10 + 35 + 45 )/100 = 1 x L = (05 + 15 + 10 + 345 + 435)/100 = 3 E = 35 (0-1) + 45 (1-1) + 10 (-1) + 5 (3-1) + 5 * (4-1) + 5 (0-3) + 5 (1-3) + 10 (-3) + 45 (3-3) + 35 * (4-3) = 0 Eta = (E 1 - E ) / E 1 = (40-0) / 40 = 0.48; Eta = Eta = 0.69

Dr. Reate Prust: Eführug quattatve Forschugsmethode Bvarate Maße: r als PRE-Maß für zwe metrsche Varable Regel 1: Regel : Fehler: Vorhersage auf Bass des Mttelwertes: ȳ Vorhersage auf Bass der Regressosgerade: ŷ Summe der quadrerte Abwechuge zwsche Schätzwert ud tatsächlchem Wert E 1 : Summe aller quadrerte Abwechuge vo ȳ: Σ (y ȳ) E : Summe aller quadrerte Abwechuge vo der Regressosgerade: Σ (y ŷ ) r E1 E E 1 1 y) 1 1 y) yˆ ) r wrd als Determatoskoeffzet bzw. Bestmmthetsmaß bezechet. Es gbt de Atel der Varato der abhägge Varable a, der durch de uabhägge Varable erklärt wrd. Das Zusammehagsmaß r st r sg( b) r wobe sg(b) = 1, we de Regressosgerade stegt (also b > 0), sg(b) = -1, we se fällt (also b < 0). (sg: sgum=vorzeche) De Berechug der Regressosgerade erfolgt für e Bespel mt 15 Utersuchugsehete:

Regresso ud das PRE-Maß Pearso-R (oder r) E Bespel aus dem Datesatz Schülergewalt (1996): Hägt de Höhe des Taschegelds vom Alter der Schülere ud Schüler ab? Varable: V008: Alter V93a: Moatlches Taschegeld (Wevel Taschegeld hast Du zu Deer free Verfügug?... DM m Moat) Für de Berechuge wurde aus dem Datesatz per Zufall 15 SchülerIe ausgewählt: r bula V007 V008 V93a 100118 Sachse weblch 15 30 1086 Sachse mälch 14 5 118406 Sachse mälch 14 40 0007 Sachse weblch 15 55 16307 Sachse mälch 11 10 8307 Sachse mälch 13 45 30104 Sachse weblch 16 80 336111 Sachse mälch 1 0 366113 Sachse mälch 1 0 378904 Sachse weblch 13 50 386116 Sachse weblch 1 38808 Sachse mälch 14 0 44808 Sachse mälch 15 50 64003 Sachse weblch 16 70 64008 Sachse mälch 15 50 Streudagramm: Alter ud moatlches Taschegeld 60 40 0 0 Moatlches Taschegeld80 11 1 13 14 15 16 Alter Es fällt auf, dass de Pukte (vo Ausreßer abgesehe) ahe a eer Gerade lege

60 40 0 0 Moatlches Taschegeld80 11 1 13 14 15 16 Alter Frage: Lässt sch ee Geradeglechug ŷ = a + b * x so bestmme, dass de Gesamtabwechug der ezele Pukte vo der Gerade möglchst kle ausfällt? 60 40 0 0 Moatlches Taschegeld80 11 1 13 14 15 16 Alter Atwort: Ja, ud zwar de Gerade mt folgede Koeffzete

b 1 ( x 1 x)( y ( x x) y) ud a y b x Berechug der Koeffzete b ud a: Alter ( x ) T-Geld ) x x (x x ) y ȳ (x x ) (y ȳ) 15 30 1,0 1,44-6,47-7,76 14 5 0,0 0,04-11,47 -,9 14 40 0,0 0,04 3,53 0,71 15 55 1,0 1,44 18,53,4 11 10 -,80 7,84-6,47 74,11 13 45-0,80 0,64 8,53-6,83 16 80,0 4,84 43,53 95,77 1 0-1,80 3,4-36,47 65,64 1 0-1,80 3,4-16,47 9,64 13 50-0,80 0,64 13,53-10,83 1-1,80 3,4-14,47 6,04 14 0 0,0 0,04-36,47-7,9 15 50 1,0 1,44 13,53 16,4 16 70,0 4,84 33,53 73,77 15 50 1,0 1,44 13,53 16,4 Σ=07 Σ=547 Σ=0,00 Σ=34,40 Σ=0,00 Σ=385,40 x =13,80 ȳ=36,47 b ( x 1 x ) y ) 385,40 34,40 ( x x ) 1 11,0 a = ȳ b * x = 36,47 11,0 13,80 = -118,14 De Glechug der Regressosgerade ŷ = a + b * x lautet somt: ŷ = 118,14 + 11,0 * x Nu lässt sch auch der Fehler ( E ) bestmme:

Fehler 1 (ohe Kets der uabhägge Var.): Summe aller quadrerte Abwechuge zwsche de tatsächlche Werte ud dem AM der abhägge Varable 80 Fehler 1 60 y = 36,47 40 0 0 11 1 13 14 15 16 Fehler (mt Kets der uabhägge Var.): Summe aller quadrerte Abwechuge zwsche de tatsächlche Werte der abhägge Varable ud dem Wert der Regressosgerade Fehler 60 40 0 0 Moatlches Taschegeld80 11 1 13 14 15 16 Alter Ma seht, dass de Summe der sekrechte Abstäde m utere Bld kleer st als m obere. Um wevel kleer zegt folgede Rechug:

Berechug vo r bzw. r T.-Geld Alter y ȳ (y ȳ) ŷ (y ŷ ) (y ŷ ) 15 30-6,47 41,8 49,91-19,91 396,44 14 5-11,47 131,48 38,71-13,71 187,89 14 40 3,53 1,48 38,71 1,9 1,67 15 55 18,53 343,48 49,91 5,09 5,90 11 10-6,47 700,48 5,10 4,90 4,04 13 45 8,53 7,8 7,50 17,50 306,11 16 80 43,53 1895,15 61,11 18,89 356,67 1 0-36,47 139,8 16,30-16,30 65,70 1 0-16,47 71,15 16,30 3,70 13,69 13 50 13,53 183,15 7,50,50 506,08 1-14,47 09,8 16,30 5,70 3,49 14 0-36,47 139,8 38,71-38,71 1498,6 15 50 13,53 183,15 49,91 0,09 0,01 16 70 33,53 114,48 61,11 8,89 78,95 15 50 13,53 183,15 49,91 0,09 0,01 Σ=07 Σ=547 Σ=0,00 8011,73 Σ=0,00 3693,91 r E1 E E 1 1 y) 1 1 y) yˆ ) 8011,73 3693,91 8011,73 0,539 d.h. de Kets der uabhägge Varable Form der Regressosgerade, de de Bezehug zwsche de bede Varable beschrebt, hat de Vorhersage um 53,9 % verbessert gegeüber der Schätzug durch das AM der abhägge Varable. Aders formulert: Durch das Alter köe kapp 54 % der Varato der Taschegeldhöhe deser 15 SchülerIe aus Sachse erklärt werde. Das st sehr vel. Demetspreched zegt das Zusammehagsmaß ee sehr hohe Wert vo: r sg( b) r ( 1) 0,539 0,73 Für alle 3147 sächssche Telehmer ergbt sch allerdgs ur e r vo 0,75, also e mttlerer Zusammehag.