Tutorial: Anpassungstest An einem Institut gibt es vier UniversitätslehrerInnen, die auch Diplomarbeiten betreuen. Natürlich erfordert die Betreuung einer Diplomarbeit einiges an Arbeit und Zeit und vom Aspekt einer gleichmäßigen Aufteilung der Arbeiten her wäre es wünschenswert, wenn die Lehrenden des Instituts (in etwa) gleich mit der Betreuung von Diplomarbeiten belastet würden. Die Zahlen eines Studienjahres ergaben folgende Aufteilung:
Diplomarbeiten 0 5 10 15 Lehrende
Natürlich ist kaum zu erwarten, dass in der Aufteilung jede(r) Lehrende genau ein Viertel der Diplomarbeiten betreut hat. Aber lassen diese Daten schon den Schluss zu, dass in der Betreuung von Diplomarbeiten die Lehrenden des Instituts nicht gleich stark eingesetzt sind? Dazu wurde folgender Test gerechnet: Chi-squared test for given probabilities data: diplom X-squared = 4.8571, df = 3, p-value = 0.1826 Welche der folgenden Aussagen über diesen Test sind richtig, welche falsch?
1. Wie das Balkendiagramm schon zeigt sind starke Unterschiede in der Anzahl betreuter Diplomarbeiten zu beobachten. Das bedeutet, dass man die Hypothese einer gleichen Aufteilung der Diplomarbeiten auf die Lehrenden verwerfen muss. 2. Die Nullhypothese lautet: alle vier Lehrenden sind gleich in die Betreuung von Diplomarbeiten eingebunden. Bei einem Signifikanzniveau von 5% wird diese Hypothese beibehalten. 3. Die Nullhypothese lautet: die Lehrenden sind nicht gleich in die Betreuung von Diplomarbeiten eingebunden. Der errechnete p-wert ist größer als das Signifikanzniveau von 1%, daher wird diese Hypothese beibehalten.
1. Wie das Balkendiagramm schon zeigt sind starke Unterschiede in der Anzahl betreuter Diplomarbeiten zu beobachten. Das bedeutet, dass man die Hypothese einer gleichen Aufteilung der Diplomarbeiten auf die Lehrenden verwerfen muss. Falsch. Allein aus einer grafischen oder numerischen Beschreibung von Daten können keine Schlüsse auf die Grundgesamtheit gezogen werden. 2. Die Nullhypothese lautet: alle vier Lehrenden sind gleich in die Betreuung von Diplomarbeiten eingebunden. Bei einem Signifikanzniveau von 5% wird diese Hypothese beibehalten. Richtig. Die Nullhypothese ist richtig formuliert. Der Vergleich des p-wertes mit dem Signifikanzniveau führt zum Schluß, dass die Nullhypothese nicht verworfen wird.
3. Die Nullhypothese lautet: die Lehrenden sind nicht gleich in die Betreuung von Diplomarbeiten eingebunden. Der errechnete p-wert ist größer als das Signifikanzniveau von 1%, daher wird diese Hypothese beibehalten. Falsch. Die Nullhypothese ist falsch formuliert. In der richtigen Nullhypothese wird die Gleichverteilung der Diplomarbeiten auf die Lehrenden angenommen.
Es liegen kategoriale Daten vor. An mehreren Diplomarbeiten (Beobachtungseinheiten) wurde beobachtet, wer der/die Betreuer(in) war. Für die Variable: Betreuer(in) der Diplomarbeiten kommen somit die Namen der Lehrenden des Instituts in Frage. Eine einfache Auszählung dieser Daten kann in Tabellenform oder wie hier als Balkendiagramm präsentiert werden. Zur Überprüfung, ob alle Lehrenden gleich wahrscheinlich als Betreuer einer Diplomarbeit sind, wurde ein χ 2 -Test eingesetzt. Wie bei statistischen Tests üblich, wird einer Nullhypothese eine Alternativhypothese gegenüber gestellt. Hier lautet die Nullhypothese, dass alle Kategorien (die Lehrenden) gleich häufig vorkommen. Die Alternativhypothese ist die Verneinung der Nullhypothese, mindestens zwei Lehrende unterscheiden sich im Ausmaß der Diplomarbeitsbetreuung. Beim χ 2 -Test misst die Teststatistik die Abweichung der beobachteten Häufigkeiten (hier sind es die Zahlen 9 19 11 17) von den (falls die Nullhypothese gilt) erwarteten Häufigkeiten. Bei insgesamt 56 (9 + 19 + 11 + 17 = 56) Diplomarbeiten würde man erwarten, dass von jedem Lehrenden 14 Diplomarbeiten betreut wurden. Die Teststatistik für dieses Beispiel berechnet sich nach X 2 = (9 14)2 14 + (19 14)2 14 + (11 14)2 14 + (17 14)2 14 = 4.8571
Kleine Werte (nahe 0) sprechen eher für, große Werte gegen die Nullhypothese. Der Wert der Teststatistik (X-squared) findet sich im Output wieder. Die Verteilung der Teststatistik ist zumindest asymptotisch bekannt, es ist eine χ 2 -Verteilung mit 3 (Anzahl Lehrende - 1) Freiheitsgraden (im Output df=3). Man kann daher (zumindest asymptotisch) berechnen, wie wahrscheinlich Werte im Intervall [4.8571, ) sind; das ist gerade der p-wert (p-value) für diesen Test, er ist im ebenfalls im Output zu finden und beträgt 0.1826. Ist der p-wert kleiner als das gewählte Signifikanzniveau, wird die Nullhypothese verworfen, ansonsten beibehalten.