2.2 Rangkorrelation nach Spearman

Ähnliche Dokumente
Ordnungsstatistiken und Quantile

Asymptotische Normalverteilung nach dem zentralen Grenzwertsatz

Statistik. ist die Kunst, Daten zu gewinnen, darzustellen, zu analysieren und zu interpretieren um zu neuem Wissen zu gelangen.

Spannweite, Median Quartilsabstand, Varianz und Standardabweichung.

Klausur Statistik IV Sommersemester 2009

Korrelations- und Assoziationsmaße

Intervallschätzungen geben unter Berücksichtigung des Verteilungstyps von X einen Bereich an, der den Parameter mit vorgegebener Sicherheit enthält.

Einführung Fehlerrechnung

Physikalische Messungen sind immer fehlerbehaftet! Der wahre Wert ist nicht ermittelbar. Der wahre Wert x ist nicht identisch mit dem Mittelwert

Zur Interpretation einer Beobachtungsreihe kann man neben der grafischen Darstellung weitere charakteristische Größen heranziehen.

Im Wöhlerdiagramm wird die Lebensdauer (Lastwechsel oder Laufzeit) eines Bauteils in Abhängigkeit von der Belastung dargestellt.

Übungen zur Wahrscheinlichkeitsrechnung und Schliessenden Statistik

die Schadenhöhe ( = Risikoergebnis) des i-ten Versicherungsnehmers i 1,, n).

Prinzip "Proportional Reduction of Error" (PRE)

Erzeugen und Testen von Zufallszahlen

Leitfaden zu den Indexkennzahlen der Deutschen Börse

Einführung in die Stochastik 3. Übungsblatt

Lohnkosten pro Arbeitsstunde. Wie hoch sind die Lohnkosten pro Arbeitsstunde im Jahresdurchschnitt?

Alternative Darstellung des 2-Stichprobentests für Anteile. Beobachtete Response No Response Total absolut DCF CF

Grundgesetze der BOOLEschen Algebra und Rechenregeln

Schiefe- und Konzentrationsmaße

Der Approximationssatz von Weierstraß

Histogramm / Säulendiagramm

Regressionsrechnung und Korrelationsrechnung

Formelzusammenstellung

Quellencodierung I: Redundanzreduktion, redundanzsparende Codes

Statistik mit Excel und SPSS

6. Zusammenhangsmaße (Kovarianz und Korrelation)

Lösungen. Häufigkeitsverteilung (Stabdiagramm) Aufgabe 1. Häufigkeit (h) Merkmal (x)

( ) ( ) ( ) ( ) è ø. P A Wahrscheinlichkeitsmaß. lim n. Dr. Christian Schwarz 4. KOMBINATORIK Permutationen

2. Mittelwerte (Lageparameter)

Maße zur Kennzeichnung der Form einer Verteilung (1)

2. Die Elementarereignisse sind die Kombinationsmöglichkeiten von: Wappen = W und:

Verdichtete Informationen

Schiefe- und Konzentrationsmaße

1 Mathe Formeln Statistik und Wahrscheinlichkeitsrechnung

Schiefe-, Wölbungs- und Konzentrationsmaße

Unter einer Rente versteht man eine regelmässige und konstante Zahlung

Mehrdimensionale Häufigkeitsverteilungen (1)

Eigenschaften der arithmetischen Mittel. Schätzer für die Varianz. Allgeimeines Method: Likelihood Funktion. Schätzer für die Wahrscheinlichkeit

Deskriptive Statistik - Aufgabe 3

Sitzplatzreservierungsproblem

Grundlagen der Entscheidungstheorie

0,066 0,166 0,366 0,566 0,732 0,865 0, Für die Berechnung des Mittelwerts können wir hier schon Vorarbeit leisten, in dem wir rechnen.

Aufgaben. 1. Gegeben seien folgende Daten einer statistischen Erhebung, bereits nach Größe sortiert (Rangliste):

Lösungen. Lösung zu d):

Konzentrationsanalyse

Eigenwerteinschließungen I

FH D WS 2007/08 Prof. Dr. Horst Peters Dezember 2007

Universitätslehrgang Sports Physiotherapy Einführung in die Statistik

Teil IV Musterklausuren (Univ. Essen) mit Lösungen

Der Korrelationskoeffizient ist ein Maß für den linearen Zusammenhang zwischen zwei Variablen X und Y. Er ist durch folgende Formel charakterisiert:

2 Regression, Korrelation und Kontingenz

Einen Spieler interessiert nicht, wie er gewinnt, sondern ob und wie viel er gewinnt.

Ingrid A. Uhlemann (2015): Einführung in die Statistik für Kommunikationswissenschaftler. Online Anhang: Lösung der Übungsaufgaben Kapitel 5-8,

Lösungen zum Übungs-Blatt 7 Wahrscheinlichkeitsrechnung

Festverzinsliche Wertpapiere. Kurse und Renditen bei ganzzahligen Restlaufzeiten

Geometrisches Mittel und durchschnittliche Wachstumsraten

Übung Statistik II SS 2006 Musterlösung Arbeitsblatt 6

Die Binomialverteilung als Wahrscheinlichkeitsverteilung für die Schadenversicherung

= k. , mit k als Anzahl der Hypothesen A i und den Daten B. Bestimmtheitsmaß:!Determinationskoeffizient

Grundlagen der Energietechnik Energiewirtschaft Kostenrechnung. Vorlesung EEG Grundlagen der Energietechnik

Lösungen zum Übungs-Blatt 7 Wahrscheinlichkeitsrechnung

Standardnormalverteilung. Normalverteilung. Verteilungsfunktion. Intervallwahrscheinlichkeiten

Rekurrenz. Algorithmen rufen sich selbst (rekursiv) auf.

Formeln für Statistik und Wahrscheinlichkeitstheorie (Dutter)

Fehlerrechnung im Praktikum

Zahlensysteme. Dezimalsystem. Binär- oder Dualsystem. Hexadezimal- oder Sedezimalzahlen

2.3 Kontingenztafeln und Chi-Quadrat-Test

Beispielklausur BWL B Teil Marketing. 45 Minuten Bearbeitungszeit

Multiple Regression (1) - Einführung I -

Als Einstieg. Als Einstieg. Verteilungstests. Verteilungstests. Testverfahren. Grafische Verfahren

14. Folgen und Reihen, Grenzwerte

Mathematik: Mag. Schmid Wolfgang & LehrerInnenteam Arbeitsblatt Semester ARBEITSBLATT 7-8 WAHRSCHEINLICHKEITSRECHNUNG UND STATISTIK

WIB 2 Mathematik und Statistik Formelsammlung. Z Menge der ganzen Zahlen {...,-3,-2,-1,0,1,2,3,...}

Deskriptive Statistik - Aufgabe 2

Messfehler, Fehlerberechnung und Fehlerabschätzung

(Markowitz-Portfoliotheorie)

14. Folgen und Reihen, Grenzwerte

Statistische Kennzahlen für die Streuung

6. Zusammenhangsmaße (Kovarianz und Korrelation)

Investmentfonds. Kennzahlenberechnung. Performance Risiko- und Ertragsanalyse, Risikokennzahlen

Lorenz' sche Konzentrationskurve und Disparitätsindex nach Gini

Lösungen zu Übungs-Blatt 7 Klassische Wahrscheinlichkeit in Glücksspielen, Bedingte Wkt, Unabhängigkeit, Satz von Bayes

19. Amortisierte Analyse

Definitionen und Aussagen zu Potenzreihen

Abschlussprüfung zum/zur Finanzplaner/in mit eidg. Fachausweis. Formelsammlung. Autor: Iwan Brot

Abschlussprüfung zum/zur Finanzplaner/in mit eidg. Fachausweis. Formelsammlung. Autor: Iwan Brot

Wahrscheinlichkeitsrechnung und Statistik

Verteilungen und Schätzungen

Deskriptive Statistik2 Durchschnittswert (der arithmetische Mittelwert)

2. Zusammenhangsanalysen: Korrelation und Regression

Stochastik Formeln von Gerald Meier

4. Marshallsche Nachfragefunktionen Frage: Wie hängt die Nachfrage nach Gütern

Formelsammlung Statistik

Wahrscheinlichkeitsrechnung und Statistik - Zusamenfassung

Prof. Dr. B.Grabowski. Die Behauptung I folgt aus der Multiplikationsformel: )

Statistik. (Inferenzstatistik)

Übungsklausur zur Vorlesung Wahrscheinlichkeit und Regression Lösungen. Übungsklausur Wahrscheinlichkeit und Regression Die Lösungen

Transkript:

. Ragkorrelato ach Spearma Wr wolle desem Kaptel de Ragkorrelatoskoeffzete ach Spearma bereche. De erste Daterehe besteht aus Realseruge x, x,..., x der uabhägg ud detsch stetg vertelte Zufallsvarable X, X,..., X (de vertelt sd we X) ud de zwete Daterehe besteht aalog aus de Realseruge y, y,..., y der uabhägg ud detsch stetg vertelte Zufallsvarable Y, Y,..., Y (de vertelt sd we Y). Her geügt es, we das Dateveau mdestes ordal st. Auf der Bass des Ragkorrelatoskoeffzete ach Spearma ka ma ee Test mt de folgede Hypothese durchführe: H 0 : De Zufallsvarable X ud Y sd uabhägg gege H : De Zufallsvarable X ud Y sd abhägg Wr komme zu userem Bespel: v v 4 5 4 5 3,7 4,3,7 3 5, 5 De Output erhalte Se, we Se auf de Butto Zusammehäge utersuche klcke, wobe Se zuvor de Varable v ud v uter desem Meüpukt auswähle müsse. Daach köe Se Ragkorrelato ach Spearma wähle. Sete 8

Der Ragkorrelato ach Spearma Her sd de egegebee Date zu sehe: Spalte (x ) Rag(x ) Spalte (y ) Rag(y ) 4 3.5 5 4 4 3.5 5 4 3.7 4.3.7 3 5. 5 5 4 Stchprobeumfag 5 Korrelatoskoeffzet vo Spearma 0.9766935485 Prüfgröße d (Hotellg-Pabst-Statstk).5 E(D) 7.5 Var(D) 76 p-wert (approxmert () ) 0.0665 () Approxmerter p-wert für > 0. Der Korrelatoskoeffzet ach Spearma wrd we folgt berechet: Es werde für bede Daterehe separat Ragzahle vergebe. Daach wrd mt dese Ragzahle der Korrelatoskoeffzet ach Pearso berechet. Zur Durchführug des Tests ka astelle des Korrelatoskoeffzete ach Spearma auch de Hotellg-Pabst-Statstk verwedet werde, de etwas efacher über de Ragzahle berechet werde ka, we wr ute sehe werde. Sete 8

De Ragzahle für de erste Varable sd: 3,5, 3,5,,, 5 Für de zwete Varable: 4, 4,,, 4 Wr bereche de mttlere Rag, der für bede Varable glech st: r Rag(x ) Rag(y ) Der Korrelatoskoeffzet ach Spearma ergbt sch da durch: r S (Rag(x ) r)(rag(y (Rag(x ) r) ) r) (Rag(y ) r) Im Bespel st r = 3. Da der Ragkorrelatoskoeffzet ach Spearma m Bespel mt eem Wert vo r s = 0,976... recht groß st (deser ka Werte zwsche - ud aehme), lässt des ee postve Korrelato vermute. De Hotellg-Pabst-Statstk st gegebe durch: d (Rag(x ) Rag(y )) Im Bespel st d =,5. d wrd oft als Prüfgröße für de Test auf Korrelato verwedet. Sete 83

Es glt: E(D) ( )( ) / 6 Im Bespel glt: E(D) = 7,5 k )(s ) s k t s (s )(t ) De Werte s sd de absolute Häufgkete der Wert x (sehe Kaptel.5). I desem Bespel kommt de,7 ud 3,7 efach, de 4 doppelt ud de 5. efach vor. Somt st k s = 4, s =, s =, s 3 = ud s 4 =. De Werte t sd aalog de absolute Häufgkete der Wert y. I desem Bespel kommt de 3 ud de 4.3 efach ud de 5 drefach vor. Somt st k t = 3, t =, t = ud t 3 = 3. Es trete somt Bduge (mehrfach vorkommede Werte be eer Varable) auf. Komme alle Werte ur efach vor (be eer Varable), so etfalle de bede letzte Summade ud E(D) ( )( ) / 6. t (t Var(D) ( ( )( ) 3 k )(s ) s k t s (s Im Bespel glt: Var(D) = 76 / 36) 3 t (t )(t Nu ka de Prüfgröße z berechet werde, de Realserug eer asymptotsch stadardormalvertelte Zufallsvarable Z st: ) z d E(D) Var(D) Der approxmatve p-wert = (-F N(0,) ( z )). Im Output zum Bespel wrd herfür 0,0665 ausgegebe. Sete 84

We zu sehe st, köte de Nullhypothese der Uabhäggket auf eem Sgfkazveau vo 5% cht verworfe werde (de 0,0665 > 0,05), womt wr kee sgfkate Zusammehag zwsche de Messrehe achwese köe. Her sollte aber größer als 0 se. Be desem Stchprobeumfag sollt aber de exakte Vertelug verwedet werde. I Bücher (we z.b. [3], [8] ud [9]) fdet ma herzu Tabelle (falls kee Bduge vorhade sd, wobe ma dese auch Näherugswese verwede ka). Wolle wr u de exakte Vertelug zu desem Test bestmme. Dazu müsse für alle möglche Permutatoe der Ragzahle der Stchprobe de Prüfgröße d berechet werde. Es gbt her m Bespel also! 5! 60 t!... t!! k t Möglchkete, we wr de Ragzahle der erste Stchprobe permutere ud! s!... s k s 5! 0! 3! Möglchkete, we wr de Ragzahle der zwete Stchprobe permutere. Wr beötge also weger Recheschrtte be der Permutato der zwete Stchprobe. Somt gbt es 0 möglche Ragzahlekombatoe um r s oder d zu bereche. Es folge de möglche Werte für de Spearma-Ragkorrelatoskoeffzete ud daruter möglche Werte für d m Bespel mt de dazugehörge (absolute) Häufgkete be eer Permutato der Ragzahle der zwete Telstchprobe. Sete 85

r S Häufgket -0,80955-0,630893-0,45883-0,86770-0,946-0,4708 0,057354 0,946 3 0,86770 0,573539 0,80955 0,97663 d Häufgket,5 3,6 7,5,5 3,5 3 6,5 9,5,5,5 5,5 8,5 3,5 We wr us etzt och de zugehörge Dchte ausgebe lasse, köe wr ahad deser drekt erkee, zu welchem wr de Nullhypothese verwerfe köe oder aber auch cht. Dafür tele wr ewels de obere Häufgkete der Prüfgröße durch de Summe aller Häufgkete (also durch 0). Sete 86

d P(D = d) P(D d),5 0,05 0,05 3,5 0,05 0, 7,5 0, 0,,5 0, 0,3 3,5 0,5 0,45 6,5 0, 0,55 9,5 0,05 0,6,5 0,05 0,65,5 0, 0,75 5,5 0,05 0,8 8,5 0, 0,9 3,5 0, Bevor wr allerdgs zur Bewertug komme, wolle wr us grafsch veraschaulche, wewet sch de Normalvertelug a usere exakte Vertelug (ute als Treppefukto zu sehe, wobe de sekrechte Strche cht zur Fukto gehöre) aähert..0 0.8 0.6 0.4 0. 0 0 30 40 Sete 87

Wr habe weter obe ee Prüfgröße vo d =,5 berechet. Es glt P(D,5) = /0. P(D,5) =. Der zwesetge p-werte wäre damt P(D,5) = /0 = 0%. Somt köte ma de Nullhypothese erst auf eem Sgfkazveau vo 0% verwerfe. Umsetzug mt SAS: data dat; put x y; datales; 4 5 4 5 3.7 4.3.7 3 5. 5 ru; proc prt data=dat; proc corr data = dat ocorr spearma; var x y; ru; Sete 88

SAS-Output zur Prozedur CORR: De Prozedure CORR Varable: x y Efache Statstke Varable N Mttelwert Std.abwechug Meda Mmum Maxmum x 5 3.90000 0.8573 4.00000.70000 5.0000 y 5 4.46000 0.87063 5.00000 3.00000 5.00000 Spearmasche Korrelatoskoeffzete, N = 5 Prob > r uter H0: Rho=0 x y x.00000 0.9766 0.080 y 0.9766 0.080.00000 SAS berechet her ee adere p-wert über: p-wert = (- t ( t )) mt F t r ( ) s rs ud Ft als Vertelugsfukto der t-vertelug mt - Frehetsgrade. Sete 89