Statistik Jan Müller
Skalenniveau Nominalskala: Diese Skala basiert auf einem Satz von qualitativen Attributen. Es existiert kein Kriterium, nach dem die Punkte einer nominal skalierten Variablen anzuordnen sind. Lediglich der direkte Vergleich ("ist gleich" und "ist nicht gleich") ist möglich und erlaubt. Beispiele: Farben, Geschlecht. Ein nominal skaliertes Merkmal mit nur zwei Ausprägungsarten wird dichotomes Merkmal genannt. Ordinalskala: Diese Skala bezieht sich auf Messungen, die mit "größer", "kleiner" oder "gleich" geordnet werden können. Die Beobachtungen müssen nicht den gleichen Abstand aufweisen. Eine Ordinalskala erlaubt die Objekte in eine Reihenfolge zu bringen. Man bezeichnet die Ordinalskala deshalb manchmal auch als Rangskala. Beispiele: Schulnoten Intervallskala: Gleich unterteilte Einheiten entlang der Skala, ohne einen vordefinierten Nullpunkt. Beispiele: IQ Verhältnisskala: Gleich unterteilte Einheiten entlang einer Skala, mit einem wahren Nullpunkt. Beispiele: Geschwindigkeit. Für verhältnisskalierte Daten gilt, dass ein doppelt so hoher Zahlenwert auch einem doppelt so hohen Eigenschaftswert entspricht
Skalenniveau
Lagemaße
Normalverteilung
Streumaße - Standardabweichung Mittelwert ± s 68 % der Messpunkte Mittelwert ± 2s 95 % der Messpunkte Mittelwert ± 3s 99,7 % der Messpunkte
Schiefe Verteilung (skewed data)
Streumaße - Interquartilsabstand Abstand zwischen dem ersten und dem dritten Quartil. IQR enthält genau 50 % der Daten der Verteilung.
Streumaße - Spannweite Distanz zwischen dem größten und dem kleinsten Messwert Minimum und Maximum Werte mit ausgeben Wichtig um Eingabefehler erkennen
Streumaße - Variationskoeffizienten Standardabweichung zu wenig spezifisch (Standardabweichung von 5 bei einem Mittelwert von = 100 oder einem Mittelwert von = 3) Je kleiner desto besser Aber: unbrauchbar wenn der Mittelwert gegen Null geht.
Streumaße - Schiefe (Skewness) Eine Verteilung wird rechtsschief (bzw. linkssteil) genannt, wenn der Hauptanteil der Verteilung auf der linken Seite konzentriert ist. Für linksschiefe (bzw. rechtssteile) Verteilungen gilt dasselbe für die rechte Seite der Verteilung.
Streumaße - Kurtosis (Wölbung) Maß für die relative "Flachheit" einer Verteilung (im Vergleich zur Normalverteilung)
Statistische Grundlagen Signifikanz und p-wert Lateinischen significans (dt. deutlich) Ergebnis ist signifikant, wenn die Chance, dass dieses zufällig entstanden ist, gering ist. p-wert gibt die Aussagekraft von statistischen Tests wieder Ein niedriger p-wert für einen statistischen Test sollte zur Verwerfung der Nullhypothese führen
Testen auf Normalverteilung Shapiro-Wilk-Test Kolmogorow-Smirnow-Test Visuell: Histogramm mit Normalverteilung
Testen auf Normalverteilung Shapiro-Wilk-Test Geeignet zur Überprüfung von kleineren Stichproben (n<100) Geeignet bis 5000 Stichproben Nullhypothese wird in der Regel nicht abgelehnt, wenn der p-wert größer ist als das festgelegte Signifikanzniveau. Je kleiner der p-wert desto unwahrscheinlicher ist eine Normalverteilung Kolmogorow-Smirnow-Test Auch geeignet zur Überprüfung von kleinen Stichproben Geringe Trennschärfe
Testen auf Normalverteilung Visuell: Histogramm mit Normalverteilung
Testen auf Normalverteilung Beispiel: Unterliegt die maximale Sauerstoffaufnahme in der Bevölkerung einer Normalverteilung
Statistische Tests Zwei Gruppen o Verteilungsgebundene oder parametrische Tests und o verteilungsfreie oder nicht-parametrische Tests Parametrische Tests o Metrische Skalierung o parametrische Tests haben also eine höhere Power Nicht-parametrische Tests o Nicht verteilungsgebunden o Bei kleinen Stichproben anwendbar
Welcher Test bei welchen Daten Art der Daten Anzahl der Stichproben Abhängigkeit geeigneter Test 2 unabhängig t-test nach Student intervallskaliert, normalverteilt 2 abhängig t-test für abhängige Stichproben mehr als 2 unabhängig einfaktorielle Varianzanalyse mehr als 2 abhängig einfache Varianzanalyse mit Messwiederholungen intervallskaliert, nicht normalverteilt oder ordinalskaliert 2 unabhängig Mann-Whitney U-Test 2 abhängig Wilcoxon-Test mehr als 2 unabhängig Kruskal-Wallis H-Test mehr als 2 abhängig Friedman-Test
Parametrische Tests - t-test T-Test: prüft anhand der Mittelwerte zweier Stichproben, ob die Erwartungswerte zweier Grundgesamtheiten einander gleich sind, ggf. gegen die Alternative, dass sich die Mittelwerte unterscheiden. Unterscheiden sich die Mittelwerte zweier unabhängiger, normalverteiter Stichproben.
Parametrische Tests - t-test Beispiel: Unterscheidet sich die maximale Sauerstoffaufnahme von Männern und Frauen
Parametrische Tests - t-test bei gepaarten Stichproben T-Test: Paarweise verbundene Stichproben, die beispielsweise aus zwei Messungen an denselben Untersuchungseinheiten gewonnen wurden (Messwiederholung).
Parametrische Tests - t-test bei gepaarten Stichproben Beispiel: Sind Patienten mit angeborenem Herzfehler in ihrer Sauerstoffaufnahme im Vergleich zur Normalbevölkerung eingeschränkt?
Parametrische Tests - t-test bei gepaarten Stichproben Beispiel: Sind Patienten mit angeborenem Herzfehler in ihrer Sauerstoffaufnahme im Vergleich zur Normalbevölkerung eingeschränkt?
Nicht-parametrische Tests - Mann-Whitney-U-Test Nullhypothese: Die Wahrscheinlichkeit einer Beobachtung aus den beiden Grundgesamtheiten ist für jede der beiden Grundgesamtheiten gleich Berechnung: Stichproben werden gemeinsam sortiert und jeweils notiert welcher Messwert zu welcher Stichprobe gehört.
Nicht-parametrische Tests - Mann-Whitney-U-Test Beispiel: Unterscheiden sich Herzinsuffiziente Patienten von Herzgesunden in ihrer maximalen Sauerstoffaufnahme.
Nicht-parametrische Tests - Mann-Whitney-U-Test Beispiel: Unterscheiden sich Herzinsuffiziente Patienten von Herzgesunden in ihrer maximalen Sauerstoffaufnahme.
Nicht-parametrische Tests - Wilcoxon (paired) Test prüft anhand zweier gepaarter Stichproben die Gleichheit der zentralen Tendenzen der zugrunde liegenden (verbundenen) Grundgesamtheiten. Alternative zum t-test, falls für die zugrunde liegende Population keine Normalverteilung angenommen werden kann.
Nicht-parametrische Tests - Wilcoxon (paired) Test Beispiel: Verbessert sich die maximale Sauerstoffaufnahme nach Intervention
Nicht-parametrische Tests Wilcoxon (paired) Test Beispiel: Verbessert sich die maximale Sauerstoffaufnahme nach Intervention
Vergleich parametrische Tests - nicht-parametrische Tests Beispiel: t-test Mann-Whitney
Chi Quadrat Test bei ordinal skalierten Daten Beispiel: Unterscheiden sich zwei Gruppen bezüglich ihres Geschlechts
Beschreibung von Zusammenhängen (Korrelationen) Art der Daten geeigneter Test Intervallskaliert, normalverteilt Korrelation nach Pearson mind 1 Variable ist ordinalskaliert oder nicht normalverteilt Rangkorrelation nach Spearman oder Kendalls Tau beide Variablen sind dichotom Vierfelder-Korrelation (Chi Quadrat)
Beschreibung von Zusammenhängen (Korrelationen) Beispiel: Gibt es einen Zusammenhang zwischen der maximalen Sauerstoffaufnahme und der maximalen Wattleistung?
Beschreibung von Zusammenhängen (Korrelationen) Beispiel: Gibt es einen Zusammenhang zwischen der maximalen Sauerstoffaufnahme und der maximalen Wattleistung?
Beschreibung von Zusammenhängen Regression Beispiel: Welche Einflussfaktoren auf die Leistungsfähigkeit gibt es? Lineare Regression: o Variable: Alter, Geschlecht, Gewicht, Größe o Schrittweise o Vorwärts
Beschreibung von Zusammenhängen Regression Beispiel: Welche Einflussfaktoren auf die Leistungsfähigkeit gibt es?