Tutorial: Rangkorrelation In vielen Sportarten gibt es mehr oder weniger ausgefeilte Methoden, nicht nur die momentanen Leistungen (der jetzige Wettkampf, das jetzige Rennen, das jetzige Spiel,..) der Ausübenden zu messen, sondern auch eine Bewertung über eine bestimmte Zeitdauer (eine oder mehrere Saisonen) abzugeben und damit eine Art Rangliste zu erstellen, wer oder welche Mannschaft insgesamt am besten abgeschnitten hat. Im vorliegenden Fall wurden 3 Tennisnachwuchsbetreuer über ihre Einschätzung der momentanen stärksten 10 Nachwuchsspieler eines Jahrganges befragt. Sie sollten angeben, wie die Spieler in zwei Jahren in der Rangliste verteilt sein werden. Die Gesamtbewertung der Nachwuchsbetreuer wurde mit dem aktuellen Stand zwei Jahre später verglichen. Ein einfaches Streudiagramm stellt die Daten übersichtlich dar:
Rangliste nach 2 Jahren 2 4 6 8 10 2 4 6 8 10 Bewertung der Trainer
Kann man aus dem Urteil der Betreuer auf die zukünftige Entwicklung eines Nachwuchsspielers schließen? Dazu wurde ein Rangkorrelationskoeffizient errechnet und getestet, ob dieser signifikant positiv ist. Spearmans rank correlation rho data: Bewertung and Rangliste S = 65, p-value = 0.03323 alternative hypothesis: true rho is greater than 0 sample estimates: rho 0.604
Welche der folgenden Aussagen über diesen Test sind richtig, welche falsch? 1. Die Alternativhypothese lautet: Der Spearman-Korrelationskoeffizient ist positiv. Der p-wert ist allerdings zu klein, um diese Hypothese anzunehmen. 2. Der p-wert liegt unter 5%, also ist die Einschätzung der Betreuer nicht schlecht. 3. Der Korrelationskoeffizient ist mit rund 0.6 nicht sehr hoch und daher nicht signifikant.
1. Die Alternativhypothese lautet: Der Spearman-Korrelationskoeffizient ist positiv. Der p-wert ist allerdings zu klein, um diese Hypothese anzunehmen. Falsch. Die Alternativhypothese ist richtig formuliert. Allerdings ist die Folgerung aus dem niedrigen p-wert faslch. 2. Der p-wert liegt unter 5%, also ist die Einschätzung der Betreuer nicht schlecht. Richtig. Da der p-wert unter 5% liegt, wird die Alternativhypothese angenommen. Sie besagt, dass der Korrelationskoeffizient (Spearman) positiv ist. Das bedeutet, dass die Einschätzung der Betreuer mit dem Stand nach 2 Jahren zusammenhängt. 3. Der Korrelationskoeffizient ist mit rund 0.6 nicht sehr hoch und daher nicht signifikant.
Falsch. Aus der Größe des Korrelationskoeffizienten kann und soll man nicht über dessen Signifikanz aussagen (Sonderfälle natürlich ausgeschlossen).
Es liegen ordinale Daten vor. Bei 10 Nachwuchsspielern (Beobachtungseinheiten) wurde die Einschätzung der Entwicklung von den Nachwuchsbetreuern (Variable: Bewertung) eingeholt und mit dem tatsächlichen Stand zwei Jahre später (Variable: Rangliste) verglichen. Beide Variablen geben den Platz einer Rangreihung an, sind somit klassische ordinale Daten. Obwohl die Rangplätze üblicherweise durch Zahlen angegeben werden, kann man nicht von metrischen Daten sprechen, da die Differenzen zwischen den Rangplätzen nicht direkt interpretierbar sind. Es soll der Zusammenhang zwischen den beiden Variablen bestimmt werden. Dazu gibt es das Konzept der Korrelation, bei dem die Stärke eines Zusammenhanges über die Angabe einer Zahl, des Korrelationskoeffizienten, erfogt. Bei meist verwendeten Korrelationskoeffizienten, dem Pearson-Korrelationskoeffizienten, sind aber metrische Variablen vorausgesetzt (neben weiteren Voraussetzungen). Für den Fall ordinaler Daten (oder den Fall, dass die weiteren Voraussetzungen für den Pearson-Korrelationskoeffizienten nicht erfüllt sind) kann der Rangkorrelationskoeffizient nach Spearman ein Ausweg sein.
Die Berechnung dieses Korrelationskoeffizienten beruht auf Rangplätzen, nicht auf den eigentlichen Werten der Variablen. Wie der Korrelationskoeffizient nach Pearson kann er Werte zwischen -1 und 1 annehmen. Die Extremwerte 1 (bzw. -1) werden angenommen, wenn die Rangreihung der einen Variablen genau dieselbe (bzw. genau die umgekehrte) Rangreihung wie die der anderen Variablen ergibt. Auch für den Korrelationskoeffizienten nach Spearman gibt es einen Test auf Signifikanz. Niedrige p-werte, gemessen am Signifikanzniveau, sprechen gegen die Nullhypothese, dass kein Zusammenhang besteht.