Statistik. Jan Müller



Ähnliche Dokumente
Angewandte Statistik 3. Semester

fh management, communication & it Constantin von Craushaar fh-management, communication & it Statistik Angewandte Statistik

Parametrische vs. Non-Parametrische Testverfahren

Computergestützte Methoden. Master of Science Prof. Dr. G. H. Franke WS 07/08

FH- Management & IT. Constantin von Craushaar FH-Management & IT Statistik Angewandte Statistik (Übungen)

Deskription, Statistische Testverfahren und Regression. Seminar: Planung und Auswertung klinischer und experimenteller Studien

VS PLUS

Statistische Methoden in den Umweltwissenschaften

htw saar 1 EINFÜHRUNG IN DIE STATISTIK: BESCHREIBENDE STATISTIK

5. Lektion: Einfache Signifikanztests

Einführung in die Statistik für Politikwissenschaftler Sommersemester 2011

Statistik II: Grundlagen und Definitionen der Statistik

Sommersemester Marktforschung

VII. Inhaltsverzeichnis

Statistik II: Signifikanztests /1

Merkmalstypen Univ.-Prof. Dr. rer. nat. et med. habil. Andreas Faldum

Ermitteln Sie auf 2 Dezimalstellen genau die folgenden Kenngrößen der bivariaten Verteilung der Merkmale Weite und Zeit:

Analyse von Experimenten. Stefan Hanenberg (University of Duisburg-Essen)

UE Angewandte Statistik Termin 4 Gruppenvergleichstests

Herzlich willkommen zum Thema SPSS

Skalenniveaus =,!=, >, <, +, -

Methodik für Linguisten

Statistische Datenanalyse

'+4 Elisabeth Raab-Steiner / Michael Benesch. Der Fragebogen. Von der Forschungsidee zur SPSS-Auswertung. 4., aktualisierte und überarbeitete Auflage

ÜBUNGSAUFGABEN ZU INFERENZSTATISTIK II

Statistik und Wahrscheinlichkeitsrechnung

Einführung in die Statistik

Unterschiedshypothesen für maximal 2 Gruppen, wenn die Voraussetzungen für parametrische Verfahren nicht erfüllt sind

Inhaltsverzeichnis. 1 Über dieses Buch Zum Inhalt dieses Buches Danksagung Zur Relevanz der Statistik...

Glossar Biometrie / Statistik. Auszug für Fragebogen Fallzahlberechnung/-begründung

Karl Entacher. FH-Salzburg

Statistik II. IV. Hypothesentests. Martin Huber

Univ.-Prof. Dr. Georg Wydra

Test-Finder. Inhalt. Orientierung im Test-Chaos Dipl.-Psych. Dr. Guido Strunk

Statistische Methoden

Biostatistische Studienplanung. Dr. Matthias Kohl SIRS-Lab GmbH

Statistische Messdatenauswertung

TESTTHEORIE UND TESTKONSTRUKTION - PRAKTISCHE ANWENDUNG - TEIL 1

Anteile Häufigkeiten Verteilungen Lagemaße Streuungsmaße Merkmale von Verteilungen. Anteile Häufigkeiten Verteilungen

Was dieses E-Book enthält

Statistik für Human- und Sozialwissenschaftler

Werkzeuge der empirischen Forschung

Einführung in die Statistik

Begriffe zur Statistik-Vorlesung

Verfahren für metrische Variable

Inhaltsverzeichnis. Über die Autoren Einleitung... 21

Häufigkeitsauszählungen, zentrale statistische Kennwerte und Mittelwertvergleiche

Statistik im Klartext Für Psychologen, Wirtschaftsund Sozialwissenschaftler. Fabian Heimsch Rudolf Niederer Peter Zöfel

Online Statistik-Coaching

Wiederholung Statistik I. Statistik für SozialwissenschaftlerInnen II p.8

Einführung in die Statistik für Politikwissenschaftler Wintersemester 2011/2012

STATISTIK FÜR STATISTIK-AGNOSTIKER Teil 1 (wie mich)

Übersicht über verschiedene Signifikanztests und ihre Voraussetzungen

Statistik Prüfung 24. Jänner 2008

Inhaltsverzeichnis. II. Statistische Modelle und sozialwissenschaftliche Meßniveaus 16

Gibt es einen Zusammenhang zwischen Merkmalen? Korrelationen

Arbeitsbuch zur deskriptiven und induktiven Statistik

Biostatistik Erne Einfuhrung fur Biowissenschaftler

Prüfen von Unterschiedshypothesen für ordinale Variablen: Mann-Whitney Test und Ko

Statistische Tests funktionieren generell nach obigem Schema; der einzige Unterschied besteht in der unterschiedlichen Berechnung der Testgröße.

Statistische Grundlagen I

Bereiche der Statistik

Elisabeth Raab-Steiner/ Michael Benesch. Der Fragebogen. Von der Forschungsidee zur SPSS-Auswertung. 3., aktualisierte und überarbeitete Auflage

1.6 Der Vorzeichentest

Inhaltsverzeichnis Grundlagen aufigkeitsverteilungen Maßzahlen und Grafiken f ur eindimensionale Merkmale

Statistik für Naturwissenschaftler

7. Lösungen weitere Übungsaufgaben Statistik für Ingenieure WiSe 16/17

Statistische Tests zu ausgewählten Problemen

Prüfung aus Statistik 1 für SoziologInnen- Gruppe A

Variablen und Skalenniveaus

Welche der folgenden Aussagen sind richtig? (x aus 5) A Ein metrisches Merkmal, das überabzählbar viele Ausprägungen besitzt heißt diskret.

STATISTISCHE MUSTERANALYSE - DARSTELLUNGSVORSCHLAG

Inhaltsverzeichnis DESKRIPTIVE STATISTIK. 1 Grundlagen Grundbegriffe Skalen... 15

5. Seminar Statistik

Wiederholung. Statistik I. Sommersemester 2009

Statistik für das Psychologiestudium

Franz Kronthaler. Statistik angewandt. Datenanalyse ist (k)eine Kunst. mit dem R Commander. A Springer Spektrum

Hypothesentests mit SPSS

Lösungen zur Biomathe-Klausur Gruppe B Montag, den 16. Juli 2001

Biomathematik für Mediziner, Klausur WS 1999/2000 Seite 1

Inhaltsverzeichnis. Teil 1 Basiswissen und Werkzeuge, um Statistik anzuwenden

2. Deskriptive Statistik

Biomathematik für Mediziner

1 GRUNDLAGEN Grundbegriffe Skalen...15

I Einführung 1. 1 Über den Umgang mit Statistik 3

KATA LOGO Mathematik Statistik Roadmap: Von der Hypothese zum p-wert

ELEMENTARE EINFÜHRUNG IN DIE MATHEMATISCHE STATISTIK

Univariate Häufigkeitsverteilungen Kühnel, Krebs 2001: Statistik für die Sozialwissenschaften, S.41-66

Einführung in die Korrelationsrechnung

PROC MEANS. zum Berechnen statistischer Maßzahlen (für quantitative Merkmale)

Prüfungstutorat: Angewandte Methoden der Politikwissenschaft. Polito Seminar Carl Schweinitz

Statistik III Regressionsanalyse, Varianzanalyse und Verfahren bei Messwiederholung mit SPSS

Deskriptive Statistik

Transkript:

Statistik Jan Müller

Skalenniveau Nominalskala: Diese Skala basiert auf einem Satz von qualitativen Attributen. Es existiert kein Kriterium, nach dem die Punkte einer nominal skalierten Variablen anzuordnen sind. Lediglich der direkte Vergleich ("ist gleich" und "ist nicht gleich") ist möglich und erlaubt. Beispiele: Farben, Geschlecht. Ein nominal skaliertes Merkmal mit nur zwei Ausprägungsarten wird dichotomes Merkmal genannt. Ordinalskala: Diese Skala bezieht sich auf Messungen, die mit "größer", "kleiner" oder "gleich" geordnet werden können. Die Beobachtungen müssen nicht den gleichen Abstand aufweisen. Eine Ordinalskala erlaubt die Objekte in eine Reihenfolge zu bringen. Man bezeichnet die Ordinalskala deshalb manchmal auch als Rangskala. Beispiele: Schulnoten Intervallskala: Gleich unterteilte Einheiten entlang der Skala, ohne einen vordefinierten Nullpunkt. Beispiele: IQ Verhältnisskala: Gleich unterteilte Einheiten entlang einer Skala, mit einem wahren Nullpunkt. Beispiele: Geschwindigkeit. Für verhältnisskalierte Daten gilt, dass ein doppelt so hoher Zahlenwert auch einem doppelt so hohen Eigenschaftswert entspricht

Skalenniveau

Lagemaße

Normalverteilung

Streumaße - Standardabweichung Mittelwert ± s 68 % der Messpunkte Mittelwert ± 2s 95 % der Messpunkte Mittelwert ± 3s 99,7 % der Messpunkte

Schiefe Verteilung (skewed data)

Streumaße - Interquartilsabstand Abstand zwischen dem ersten und dem dritten Quartil. IQR enthält genau 50 % der Daten der Verteilung.

Streumaße - Spannweite Distanz zwischen dem größten und dem kleinsten Messwert Minimum und Maximum Werte mit ausgeben Wichtig um Eingabefehler erkennen

Streumaße - Variationskoeffizienten Standardabweichung zu wenig spezifisch (Standardabweichung von 5 bei einem Mittelwert von = 100 oder einem Mittelwert von = 3) Je kleiner desto besser Aber: unbrauchbar wenn der Mittelwert gegen Null geht.

Streumaße - Schiefe (Skewness) Eine Verteilung wird rechtsschief (bzw. linkssteil) genannt, wenn der Hauptanteil der Verteilung auf der linken Seite konzentriert ist. Für linksschiefe (bzw. rechtssteile) Verteilungen gilt dasselbe für die rechte Seite der Verteilung.

Streumaße - Kurtosis (Wölbung) Maß für die relative "Flachheit" einer Verteilung (im Vergleich zur Normalverteilung)

Statistische Grundlagen Signifikanz und p-wert Lateinischen significans (dt. deutlich) Ergebnis ist signifikant, wenn die Chance, dass dieses zufällig entstanden ist, gering ist. p-wert gibt die Aussagekraft von statistischen Tests wieder Ein niedriger p-wert für einen statistischen Test sollte zur Verwerfung der Nullhypothese führen

Testen auf Normalverteilung Shapiro-Wilk-Test Kolmogorow-Smirnow-Test Visuell: Histogramm mit Normalverteilung

Testen auf Normalverteilung Shapiro-Wilk-Test Geeignet zur Überprüfung von kleineren Stichproben (n<100) Geeignet bis 5000 Stichproben Nullhypothese wird in der Regel nicht abgelehnt, wenn der p-wert größer ist als das festgelegte Signifikanzniveau. Je kleiner der p-wert desto unwahrscheinlicher ist eine Normalverteilung Kolmogorow-Smirnow-Test Auch geeignet zur Überprüfung von kleinen Stichproben Geringe Trennschärfe

Testen auf Normalverteilung Visuell: Histogramm mit Normalverteilung

Testen auf Normalverteilung Beispiel: Unterliegt die maximale Sauerstoffaufnahme in der Bevölkerung einer Normalverteilung

Statistische Tests Zwei Gruppen o Verteilungsgebundene oder parametrische Tests und o verteilungsfreie oder nicht-parametrische Tests Parametrische Tests o Metrische Skalierung o parametrische Tests haben also eine höhere Power Nicht-parametrische Tests o Nicht verteilungsgebunden o Bei kleinen Stichproben anwendbar

Welcher Test bei welchen Daten Art der Daten Anzahl der Stichproben Abhängigkeit geeigneter Test 2 unabhängig t-test nach Student intervallskaliert, normalverteilt 2 abhängig t-test für abhängige Stichproben mehr als 2 unabhängig einfaktorielle Varianzanalyse mehr als 2 abhängig einfache Varianzanalyse mit Messwiederholungen intervallskaliert, nicht normalverteilt oder ordinalskaliert 2 unabhängig Mann-Whitney U-Test 2 abhängig Wilcoxon-Test mehr als 2 unabhängig Kruskal-Wallis H-Test mehr als 2 abhängig Friedman-Test

Parametrische Tests - t-test T-Test: prüft anhand der Mittelwerte zweier Stichproben, ob die Erwartungswerte zweier Grundgesamtheiten einander gleich sind, ggf. gegen die Alternative, dass sich die Mittelwerte unterscheiden. Unterscheiden sich die Mittelwerte zweier unabhängiger, normalverteiter Stichproben.

Parametrische Tests - t-test Beispiel: Unterscheidet sich die maximale Sauerstoffaufnahme von Männern und Frauen

Parametrische Tests - t-test bei gepaarten Stichproben T-Test: Paarweise verbundene Stichproben, die beispielsweise aus zwei Messungen an denselben Untersuchungseinheiten gewonnen wurden (Messwiederholung).

Parametrische Tests - t-test bei gepaarten Stichproben Beispiel: Sind Patienten mit angeborenem Herzfehler in ihrer Sauerstoffaufnahme im Vergleich zur Normalbevölkerung eingeschränkt?

Parametrische Tests - t-test bei gepaarten Stichproben Beispiel: Sind Patienten mit angeborenem Herzfehler in ihrer Sauerstoffaufnahme im Vergleich zur Normalbevölkerung eingeschränkt?

Nicht-parametrische Tests - Mann-Whitney-U-Test Nullhypothese: Die Wahrscheinlichkeit einer Beobachtung aus den beiden Grundgesamtheiten ist für jede der beiden Grundgesamtheiten gleich Berechnung: Stichproben werden gemeinsam sortiert und jeweils notiert welcher Messwert zu welcher Stichprobe gehört.

Nicht-parametrische Tests - Mann-Whitney-U-Test Beispiel: Unterscheiden sich Herzinsuffiziente Patienten von Herzgesunden in ihrer maximalen Sauerstoffaufnahme.

Nicht-parametrische Tests - Mann-Whitney-U-Test Beispiel: Unterscheiden sich Herzinsuffiziente Patienten von Herzgesunden in ihrer maximalen Sauerstoffaufnahme.

Nicht-parametrische Tests - Wilcoxon (paired) Test prüft anhand zweier gepaarter Stichproben die Gleichheit der zentralen Tendenzen der zugrunde liegenden (verbundenen) Grundgesamtheiten. Alternative zum t-test, falls für die zugrunde liegende Population keine Normalverteilung angenommen werden kann.

Nicht-parametrische Tests - Wilcoxon (paired) Test Beispiel: Verbessert sich die maximale Sauerstoffaufnahme nach Intervention

Nicht-parametrische Tests Wilcoxon (paired) Test Beispiel: Verbessert sich die maximale Sauerstoffaufnahme nach Intervention

Vergleich parametrische Tests - nicht-parametrische Tests Beispiel: t-test Mann-Whitney

Chi Quadrat Test bei ordinal skalierten Daten Beispiel: Unterscheiden sich zwei Gruppen bezüglich ihres Geschlechts

Beschreibung von Zusammenhängen (Korrelationen) Art der Daten geeigneter Test Intervallskaliert, normalverteilt Korrelation nach Pearson mind 1 Variable ist ordinalskaliert oder nicht normalverteilt Rangkorrelation nach Spearman oder Kendalls Tau beide Variablen sind dichotom Vierfelder-Korrelation (Chi Quadrat)

Beschreibung von Zusammenhängen (Korrelationen) Beispiel: Gibt es einen Zusammenhang zwischen der maximalen Sauerstoffaufnahme und der maximalen Wattleistung?

Beschreibung von Zusammenhängen (Korrelationen) Beispiel: Gibt es einen Zusammenhang zwischen der maximalen Sauerstoffaufnahme und der maximalen Wattleistung?

Beschreibung von Zusammenhängen Regression Beispiel: Welche Einflussfaktoren auf die Leistungsfähigkeit gibt es? Lineare Regression: o Variable: Alter, Geschlecht, Gewicht, Größe o Schrittweise o Vorwärts

Beschreibung von Zusammenhängen Regression Beispiel: Welche Einflussfaktoren auf die Leistungsfähigkeit gibt es?