Basiskurs Statistik und SPSS für Mediziner. Bernhard Haller Alexander Hapfelmeier Armin Ott Birgit Waschulzik
|
|
- Benedict Braun
- vor 6 Jahren
- Abrufe
Transkript
1 Institut für Medizinische Statistik und Epidemiologie Basiskurs Statistik und SPSS für Mediziner Bernhard Haller Alexander Hapfelmeier Armin Ott Birgit Waschulzik
2 Inhaltsverzeichnis 1. Grundlagen und Begriffe 3 2. Dateneingabe und aufbereitung Deskriptive Statistik Grafische Darstellung Bearbeitung der Daten in SPSS Prinzip des statistischen Testens Korrelation Regression Analyse von Überlebenszeiten Publikation der Ergebnisse 145 Basis-Kurs Statistik und SPSS für Mediziner 2
3 Grundlagen und -begriffe Basis-Kurs Statistik und SPSS für Mediziner 3
4 Statistische Einheiten / Merkmale / Ausprägungen Merkmalsträger/ Beobachtungseinheit Proband Patient Maus Merkmal Geschlecht Größe Gewicht Blutdruckwerte: Merkmalsausprägung männlich 172 cm 65 kg 124 / 82 mmhg Laborwerte: Kreatinin Glukose 78 μmol/l 4,2 mmol/l Basis-Kurs Statistik und SPSS für Mediziner 4
5 Merkmalstypen Merkmale quantitativ qualitativ stetig metrisch diskret ordinalskaliert nominalskaliert Ergebnis von Wägung oder Messung Ergebnis von Zählung Rangfolge möglich keine Rangfolge möglich Beispiele: BMI, Größe Überlebenszeit Anzahl Operationen Lymphknotenbefall TNM-Klassifik. Schweregrade Geschlecht, Tumorlokal. Richtiges Einordnen von Merkmalstypen ist wichtige Voraussetzung für die adäquate Anwendung statistischer Methoden! Basis-Kurs Statistik und SPSS für Mediziner 5
6 Statistische Einheiten / Merkmale / Ausprägungen Viele Auswertverfahren setzen unabhängige Beobachtungseinheiten voraus Meistens verletzt, wenn mehrere Beobachtungen pro Patient vorliegen Wiederholte Messungen im Zeitverlauf z.b. mehrere Läsionen/Augen/Organe/ eines Patienten Bewertung eines Patienten von mehreren Beurteilern In solchen Fällen müssen adäquate (komplexere) Verfahren angewandt werden Basis-Kurs Statistik und SPSS für Mediziner 6
7 Grundgesamtheit und Stichprobe Grundgesamtheit: Menge aller interessierenden statistischen Einheiten - z.b. alle Patienten mit einer bestimmten Indikation Stichprobe: (Zufällige) Auswahl einer Teilmenge aus dieser Grundgesamtheit Basis-Kurs Statistik und SPSS für Mediziner 7
8 Aufgaben der Statistik Deskriptive (beschreibende) Statistik Explorative (suchende) Statistik Induktive (schließende) Statistik Basis-Kurs Statistik und SPSS für Mediziner 8
9 Deskriptive Statistik Zusammenfassung in spezifische Kenngrößen (Lageparameter bzw. Häufigkeiten) Grafische Aufbereitung Präsentation von umfangreichem Datenmaterial Datenvalidierung (z.b. Identifikation von Falscheingaben) Reine Beschreibung der erhobenen Daten, keine Rückschlüsse über die Objekte der Erhebung hinaus möglich Basis-Kurs Statistik und SPSS für Mediziner 9
10 Explorative Statistik Suche nach Strukturen oder Besonderheiten in den Daten Generierung neuer Fragestellungen und Hypothesen Verwendung bei nicht exakt spezifizierten Fragestellungen Keine Rückschlüsse über die Erhebung hinaus möglich, jedoch häufig deutliche Hinweise bzw. empirische Evidenz Basis-Kurs Statistik und SPSS für Mediziner 10
11 Induktive Statistik Versuch, durch Einbeziehung von Wahrscheinlichkeitstheorie allgemeine Schlussfolgerungen für die Grundgesamtheit zu ziehen Sorgfältige Versuchsplanung nötig Fragestellungen und stochastische Modelle müssen a priori spezifiziert werden Schließen: Stichprobe Grundgesamtheit Schätzen: Plausibelster Parameter für Grundgesamtheit mit Maß bzgl. der Unsicherheit (KI) Testen: Prüfen von zuvor spezifizierten Hypothesen Basis-Kurs Statistik und SPSS für Mediziner 11
12 Dateneingabe und -aufbereitung Basis-Kurs Statistik und SPSS für Mediziner 12
13 Dateneingabe Eingabe einfacher Daten in Standardsoftware (z.b. MS Excel) Vorteile: Akzeptanz, meist Grundkenntnisse vorhanden, einfach zu bedienen, weit verbreitet, kompatibel Nachteile: fehleranfällig, keine Kontrollen, keine feste Struktur Eingabe komplexerer Daten in Datenbanksysteme (z.b. MS Access, spezielle Software), evtl. mit Eingabemaske Vorteile: geringere Fehlerquote, logische Abfragen möglich, Nachteile: komplex (evtl. Administrator und/oder Programmierer benötigt)! Strenge Anforderungen an Dateneingabe bei Studien nach AMG oder MPG Basis-Kurs Statistik und SPSS für Mediziner 13
14 Dateneingabe in Excel Feste Struktur zum Einlesen in Statistiksoftware (SPSS) erforderlich! Jede Beobachtungseinheit (Patient) eine Zeile Jedes erhobene Merkmal eine Spalte Zellenformat Standard immer beibehalten! Datum: (TT.MM.JJJJ) Quantitative Merkmale: nur die Zahlen eingeben (nicht: NA, <0.1, 74 kg, ) Nominale/ordinale Merkmale: Ausprägungen numerisch kodieren Fehlende Zellen frei lassen oder eindeutig kodieren (z.b. 9999) ID Therapiegruppe Alter Geschlecht OP-Datum Therapieerfolg Basis-Kurs Statistik und SPSS für Mediziner 14
15 SPSS - Datenansicht Zeigt Daten an Neue Daten können eingegeben werden Korrekt formatierte Datensätze können eingelesen werden (Excel,.txt, ) Basis-Kurs Statistik und SPSS für Mediziner 15
16 SPSS - Variablenansicht Eigenschaften der erhobenen Variablen können geändert werden: Variablenname Ausgegebener Name (Variablenlabel) Gruppennamen (Wertelabels) Messniveaus Definition fehlender Werte Basis-Kurs Statistik und SPSS für Mediziner 16
17 SPSS - Ausgabe Ergebnisse durchgeführter Operationen werden im Ausgabefenster angezeigt (Tabellen, Grafiken, ) Diese können bearbeitet & exportiert werden (z.b. als PDF, Excel-Datei, ) Basis-Kurs Statistik und SPSS für Mediziner 17
18 SPSS - Menüleiste Sämtliche Operationen werden über die Menüleiste gestartet. Wichtigste Punkte: Datei: Öffnen und Speichern von Daten Daten: Umstrukturieren des aktuellen Datensatzes, Auswahl relevanter Beobachtungen, Sortieren Transformieren: Berechnen neuer Variablen, Umkodieren bestehender Variablen Analysieren: Sämtliche Verfahren zur Analyse der Daten, deskriptive Statistiken, statistische Testverfahren, Regressionsmodelle, Diagramme: verschiedene Untermenüs zur Erstellung von Grafiken Basis-Kurs Statistik und SPSS für Mediziner 18
19 Deskriptive Statistik Basis-Kurs Statistik und SPSS für Mediziner 19
20 Quantitative Merkmale: Maßzahlen Lokalisationsmaße -> Lage: Arithmetisches Mittel Median Quantile Modus Dispersionsmaße -> Streuung: Spannweite Varianz Standardabweichung Variationskoeffizient Basis-Kurs Statistik und SPSS für Mediziner 20
21 Lokalisation (Lage): Mittelwert, Median Seien x 1,x 2,,x n die Merkmalsausprägungen eines Merkmals X von n Patienten Mittelwert: x 1 n n i 1 x i Median (teilt die Daten in zwei gleich große Hälften): geordnete Werte x (1),, x (n) : x (1) < x (2) < < x (n) ungerade Anzahl von Beobachtungen Median: = xn+1= x gerade Anzahl von Beobachtungen Median: = 1 2 (x n 2 + xn 2 +1) = x 0.5 Basis-Kurs Statistik und SPSS für Mediziner 21
22 Streuung: Spannweite, Quantile, Interquartilsabstand Minimum Spannweite Maximum x 0.25 x 0.75 x (1) x (2) x (3) x (n) X 25% IQR 75% 25% Spannweite = x max x min (range) Interquartilsabstand = x 0.75 x 0.25 (inter quartile range (IQR)) Basis-Kurs Statistik und SPSS für Mediziner 22
23 Streuung: Varianz, Standardabweichung In den Daten beobachtete Streuung: Varianz: S 2 n 1 2 n 1 i ( x i 1 x ) Standardabweichung: S S 2 Variationskoeffizient: V c S x Mittelwert und Standardabweichung implizieren symmetrische Verteilung Bei schiefer Verteilung Median und IQR oder Minimum / Maximum angeben Basis-Kurs Statistik und SPSS für Mediziner 23
24 Schätzung von Maßzahlen Symmetrische Verteilung: Analysieren Deskriptive Statistiken Deskriptive Statistik Optionen gewünschte Maßzahlen auswählen Alle Verteilungen: Analysieren Deskriptive Statistiken Häufigkeiten Statistiken gewünschte Maßzahlen auswählen Sehr flexibel: Analysieren Tabellen Benutzerdefinierte Tabellen Basis-Kurs Statistik und SPSS für Mediziner 24
25 Grafische Darstellung Beschreibung eines Merkmals Basis-Kurs Statistik und SPSS für Mediziner 25
26 Quantitative Merkmale (eindimensional) Grafik Diagrammerstellung Galerie Histogramm Boxplot Histogramm: Boxplot: Maximum* 75. Perzentil 50. Perz. (Median) 25. Perzentil Minimum* *Ausreißer und Extremwerte werden gesondert gekennzeichnet Basis-Kurs Statistik und SPSS für Mediziner 26
27 Qualitative Merkmale (eindimensional) Grafik Diagrammerstellung Galerie Balken Kreis/Polar Darstellung absoluter Anzahlen oder relativer Häufigkeiten (%) ordinales oder nominales Skalenniveau nur nominales Skalenniveau Basis-Kurs Statistik und SPSS für Mediziner 27
28 Eindimensionale Darstellung - Zusammenfassung quantitativ qualitativ Merkmalstyp - ordinalskaliert (mit Rangfolge) graphisch Histogramm Fehlerbalken (symm. Vtlg) Boxplot Säulendiagramm x s Maßzahlen (symm Vtlg.) Median (x min, x max / IQR) absolute bzw. relative Häufigkeiten - nominalskaliert (ohne Rangfolge) Kreisdiagramm Säulendiagramm absolute bzw. relative Häufigkeiten Basis-Kurs Statistik und SPSS für Mediziner 28
29 Grafische Darstellung Zusammenhang zweier Merkmale Basis-Kurs Statistik und SPSS für Mediziner 29
30 Zusammenhang zwischen zwei Merkmalen Folgende Kombinationen sind möglich: qualitativ qualitativ Geschlecht Therapie (A,B) Therapie Therapieerfolg qualitativ quantitativ Geschlecht Cholesterinspiegel Therapie Blutdruckänderung quantitativ quantitativ Alter Blutdruck Dosis Änderung Blutwert Basis-Kurs Statistik und SPSS für Mediziner 30
31 Qualitativ - qualitativ Analysieren Deskriptive Statistiken Kreuztabellen Zellen Prozentwerte Spaltenweise Grafik Diagrammerstellung Galerie Balken Beispiel: Diabetes und Therapie Tabelle und Säulendiagramm mit relativen Häufigkeiten (%). Die absoluten Häufigkeiten sind aufgrund der unterschiedlichen Fallzahlen in den Gruppen nicht vergleichbar! Basis-Kurs Statistik und SPSS für Mediziner 31
32 Qualitativ - quantitativ Analysieren Tabellen Benutzerdefinierte Tabellen Vergleich zweier Medikamente hinsichtlich Änderung des systolischen Blutdrucks innerhalb eines Jahres bei Patienten mit Bluthochdruck: Wenn sich der Median deutlich vom Mittelwert unterscheidet, deutet dies auf eine schiefe Verteilung hin (u.a. keine Normalverteilung). Basis-Kurs Statistik und SPSS für Mediziner 32
33 Qualitativ - quantitativ Grafik Diagrammerstellung Galerie Streu- /Punktdiagramm ungeeignet, da viele Punkte überdeckt werden gut geeignet, vor allem bei wenigen Beobachtungen Werte werden aber zum Teil gerundet Grafik Diagrammerstellung Galerie Streu-/Punktdiagramm Punktdiagramm Basis-Kurs Statistik und SPSS für Mediziner 33
34 Qualitativ - quantitativ Grafik Diagrammerstellung Galerie Boxplot Boxplot: gut geeignet, etabliert, schwierig bei sehr kleinen Fallzahlen Fehlerbalken (MW ± 2 Stdabw.): nur bei symmetrischen Verteilungen geeignet Grafik alte Dialogfelder Fehlerbalken Basis-Kurs Statistik und SPSS für Mediziner 34
35 Quantitativ quantitativ Beispiel: Blutdruck zu Beginn der Studie und Alter Grafik Diagrammerstellung Galerie Streu-/Punktdiagramm Basis-Kurs Statistik und SPSS für Mediziner 35
36 Verbundene Stichproben bei quantitativen Merkmalen Beispiel: Untersuchung der Wirkung eines Medikaments, z.b. eines Blutdrucksenkers. Einer Reihe von Personen wird der Blutdruck vor und nach der Medikamenteneinnahme gemessen. Medikamenteneinnahme Wert vorher Wert nachher Basis-Kurs Statistik und SPSS für Mediziner 36
37 Verbundene Stichproben bei quantitativen Merkmalen Darstellung der Messwerte des Blutdrucks vor Therapiebeginn und nach einem Jahr Darstellung der Differenzen Basis-Kurs Statistik und SPSS für Mediziner 37
38 Bearbeitung der Daten in SPSS Basis-Kurs Statistik und SPSS für Mediziner 38
39 Daten sortieren Durch einen Rechtsklick auf die Variable (hier ID) kann die Sortierreihenfolge ausgewählt werden. Basis-Kurs Statistik und SPSS für Mediziner 39
40 Neue Variablen berechnen Basis-Kurs Statistik und SPSS für Mediziner 40
41 Variablen umcodieren Beispiel: Alter in Altersklassen einteilen Basis-Kurs Statistik und SPSS für Mediziner 41
42 Datensatz nach Gruppen aufteilen Separate Auswertung für einzelne Gruppen (z.b. Geschlecht). Basis-Kurs Statistik und SPSS für Mediziner 42
43 Datensatz nach Gruppen aufteilen II Verschiedene Ausgaben möglich: Gruppen vergleichen Ausgabe nach Gruppen aufteilen Basis-Kurs Statistik und SPSS für Mediziner 43
44 Zeitdauer berechnen Differenz zwischen zwei Datumsvariablen berechnen Transformieren Assistent für Datum und Uhrzeit Basis-Kurs Statistik und SPSS für Mediziner 44
45 Zeitdauer berechnen II Basis-Kurs Statistik und SPSS für Mediziner 45
46 Zwei Datensätze zusammenfügen Neue Variablen aus einem anderen Datensatz zum bestehenden hinzufügen. ACHTUNG: Beide Datensätze müssen aufsteigend bzgl. der Schlüsselvariablen sortiert sein. Basis-Kurs Statistik und SPSS für Mediziner 46
47 Zwei Datensätze zusammenfügen II Beobachtungen werden hier anhand der Patienten-ID zugeordnet. Basis-Kurs Statistik und SPSS für Mediziner 47
48 Zwei Datensätze zusammenfügen - Ausgabe Datensatz enthält nun auch die Variable ernaehrung. Basis-Kurs Statistik und SPSS für Mediziner 48
49 Doppelte Fälle ermitteln Überprüfen, ob Beobachtungen bezüglich bestimmter Variablen identische Werte aufweisen um damit doppelte Beobachtungen auszuschließen. Basis-Kurs Statistik und SPSS für Mediziner 49
50 Doppelte Fälle ermitteln - Ausgabe Variable PrimaryFirst indiziert erste ( 1 ) und weitere ( 0 ) Beobachtung bzgl. der ausgewählten Variablen (hier ID). Basis-Kurs Statistik und SPSS für Mediziner 50
51 Fälle ausschließen Auswahl bestimmter Beobachtungen für die Auswertung. Beispiel: Auswahl der ersten Beobachtungen (PrimaryFirst=1) und somit Ausschluss der doppelten Beobachtungen (PrimaryFirst=0). Basis-Kurs Statistik und SPSS für Mediziner 51
52 Fälle ausschließen - Ausgabe Aus der Analyse ausgeschlossene Beobachtungen werden durchgestrichen dargestellt. Diese werden für die weiteren Auswertungen ignoriert. Basis-Kurs Statistik und SPSS für Mediziner 52
53 Variable als Datum definieren Als Variablentyp statt Numerisch, Datum und gewünschtes Format auswählen. Basis-Kurs Statistik und SPSS für Mediziner 53
54 Datumsvariable erstellen Aus drei separaten Variablen tag_0, monat_0, jahr_0 eine Datumsvariable erstellen Transformieren Assistent für Datum und Uhrzeit Basis-Kurs Statistik und SPSS für Mediziner 54
55 Datumsvariable erstellen II Basis-Kurs Statistik und SPSS für Mediziner 55
56 Maßzahlen im Überblick Maßzahlen Arithmetisches Mittel metrisch Skalenniveau (mindestens erforderlich) Eigenschaft - ausreißerempfindlich - Vorsicht bei schiefen Verteilungen! Median, Quantile ordinal - robust gegenüber Ausreißern Modus (Ausprägung mit den meisten Beobachtungen) nominal - wenig Aussagekraft - absolut unempfindlich gegenüber Ausreißern - Interpretationsprobleme bei mehrgipfligen Verteilungen Varianz, Standardabweichung metrisch - geeignet für symmetrische Verteilungen - Maß der Streuung um den Mittelwert Variationskoeffizient Verhältnisskala - unabhängig von Einheiten Quartilsabstand ordinal - einfache Berechnung - robust gegenüber Ausreißern Spannweite metrisch - um Messintervall festzulegen Standardfehler metrisch - Standardfehler des Mittelwerts Basis-Kurs Statistik und SPSS für Mediziner 56
57 Prinzip des statistischen Testens Basis-Kurs Statistik und SPSS für Mediziner 57
58 Testentscheidungen Entscheidung bzgl. der Stichprobe H 0 beibehalten H 0 verwerfen Situation in der Grundgesamtheit H 0 trifft zu Richtige Entscheidung Fehler 1. Art H 1 trifft zu Fehler 2. Art Richtige Entscheidung Es kann nie nachgewiesen werden, dass die Nullhypothese zutrifft! Alternativer Ansatz: Äquivalenztests Die Forschungshypothese muss stets als Alternativhypothese (H 1 ) formuliert werden. Basis-Kurs Statistik und SPSS für Mediziner 58
59 Entscheidungsregel p-wert: Ist die Wahrscheinlichkeit bei Gültigkeit der Nullhypothese, den beobachteten oder einen in Richtung der Alternative extremeren Unterschied/Effekt zu erhalten. Signifikanzniveau α: Zuvor spezifiziertes Level, das vom p-wert unterschritten werden muss um die Nullhypothese abzulehnen. Wann sollte nun die Nullhypothese abgelehnt werden? p < α H 0 ablehnen Ist es unwahrscheinlich, den beobachteten oder einen stärkeren Effekt unter H 0 zu erhalten, wird H 0 zugunsten von H 1 verworfen. Der p-wert gibt (umgangssprachlich) die Wahrscheinlichkeit (probability) an, dass der in einer Stichprobe beobachtete Unterschied rein zufällig (d.h. wenn kein Unterschied in der Grundgesamtheit vorliegt) aufgetreten sein könnte. Basis-Kurs Statistik und SPSS für Mediziner 59
60 Der Fehler 1. Art (α-fehler) Die Nullhypothese wird abgelehnt, obwohl sie eigentlich gültig ist. Kein Gruppenunterschied in der Grundgesamtheit Falscher Schluss aufgrund unglücklicher Stichprobe Meistens: α = 5% oder α = 1% Bei α = 5% tritt dies per Definition bei 5% aller Tests auf, bei denen es keinen Unterschied in der Grundgesamtheit gibt. Basis-Kurs Statistik und SPSS für Mediziner 60
61 Der Fehler 2. Art (β-fehler) Die Nullhypothese wird nicht verworfen, obwohl sie nicht zutrifft. Tatsächlich Gruppenunterschied in der Grundgesamtheit vorhanden Unterschied ist anhand der Stichprobe nicht nachweisbar Die Wahrscheinlichkeit für den Fehler 2. Art wird durch einen statistischen Test nicht kontrolliert (abhängig z.b. von Fallzahl) Fallzahlplanung / Power Wkt. des Eintretens hängt ab vom wahren Effekt in der GG, der Fallzahl, Basis-Kurs Statistik und SPSS für Mediziner 61
62 Power Die Power eines Tests gibt die Wahrscheinlichkeit an, einen in der Grundgesamtheit vorhandenen Unterschied in einer zufälligen Stichprobe (der Größe n) statistisch nachzuweisen. Je größer die Fallzahl desto höher die Power! Die Power kann demnach nur durch das Studiendesign (Anzahl der Patienten) beeinflusst werden! Power = 1 Fehler 2. Art Der Fehler 2. Art ist die Wahrscheinlichkeit, einen in der Grundgesamtheit tatsächlich vorhandenen Unterschied mit der vorliegenden Stichprobe nicht nachzuweisen (H 0 wird beibehalten obwohl H 1 wahr ist). Basis-Kurs Statistik und SPSS für Mediziner 62
63 Statistische Tests Ein statistischer Test ist lediglich eine Entscheidungshilfe, jedoch nie ein Nach- oder Beweis. Ein signifikantes Testergebnis bedeutet: wahrscheinlich nicht durch Zufall zu erklären. p > α bedeutet nicht, dass H 0 zutrifft, sondern lediglich, dass in den Daten keine ausreichende Evidenz gegen H 0 gefunden wurde. Absence of evidence is not evidence of absence (Altman & Bland, 1995) Es sollte stets die klinische Relevanz der Ergebnisse beurteilt werden. Auch statistisch signifikante Ergebnisse können klinisch irrelevant sein. Vor allem bei geringer Fallzahl können nicht signifikante Ergebnisse klinisch relevant sein. Diese sollten entsprechend beschrieben und diskutiert werden. Basis-Kurs Statistik und SPSS für Mediziner 63
64 Statistische Tests Nur Ergebnisse bzgl. a priori spezifizierter Hypothesen können sinnvoll interpretiert werden Erläuterung im Teil Studienplanung und interpretation (2. Kurstag) Nur wenn ein geeigneter Hypothesentest gewählt wurde, erhält man ein unverzerrtes Testergebnis sorgfältige Wahl des statistischen Test (Fragestellung, Annahmen, Voraussetzungen, ) Die statistischen Standardtests gehen von unabhängigen Beobachtungen aus: Unverbundene Tests: Jedes Individuum (Patient) geht nur mit einer Beobachtung in den Test ein Verbundene Tests: Jedes Individuum geht mit einem Paar an Beobachtungen in den Test ein Bei wiederholten Messungen / korrelierten Daten werden spezielle Verfahren benötigt (z.b. GEE-Modelle, gemischte Modelle). Basis-Kurs Statistik und SPSS für Mediziner 64
65 Einseitig vs. zweiseitig zweiseitig: H 0 : Parameter 1 = Parameter 2 H 1 : Parameter 1 Parameter 2 Ich interessiere mich dafür, ob überhaupt ein Unterschied vorliegt. Das Signifikanzniveau, z.b. 5%, wird auf beide möglichen Ausgänge Parameter 1 < Parameter 2 oder Parameter 1 > Parameter 2 aufgeteilt (jeweils 2,5%). einseitig: H 0 : Parameter 1 Parameter 2 H 1 : Parameter 1 > Parameter 2 Oder H 0 : Parameter 1 Parameter 2 H 1 : Parameter 1 < Parameter 2 Es kann das Signifikanzniveau in einer vorab festgelegten Richtung ausgeschöpft werden. Basis-Kurs Statistik und SPSS für Mediziner 65
66 Einseitige vs. zweiseitige Tests Der klassische Test ist immer zweiseitig. Um einseitig testen zu können, muss man im Vorfeld klar begründen, wieso ein Effekt in die andere Richtung ausgeschlossen werden kann. Bland JM, Altman DG (BMJ, 1994): Two sided tests should be used unless there is a very good reason for doing otherwise. One sided tests should never be used simply as a device to make a conventionally non-significant difference significant. Basis-Kurs Statistik und SPSS für Mediziner 66
67 Verbunden - unverbunden verbunden (abhängige Stichproben): Untersuchungen am selben Kollektiv (oft: vorher nachher Situationen) Änderung des Blutdrucks durch Einnahme von Medikamenten Änderung eines Schmerzscores durch OP Vergleich Intima Dicke linke und rechte Seite Oft nicht ausreichend, um z.b. einen Therapieeffekt zu beurteilen (keine Kontrolle) unverbunden (unabhängige Stichproben): Vergleiche von unterschiedlichen Kollektiven (Gruppenvergleiche) Vergleich von Rauchern und Nicht-Rauchern Vergleich von Männern und Frauen Vergleich von unterschiedlichen Therapien A, B und C Basis-Kurs Statistik und SPSS für Mediziner 67
68 Parametrisch nicht-parametrisch Parametrische Tests Es wird vorausgesetzt, dass die Daten einer speziellen Verteilung folgen (oft Normalverteilungsannahme)! Bsp: t-test, ANOVA (Varianzanalyse), Pearson Korrelationskoeffizient Nicht parametrische Tests (verteilungsfrei) kommen weitestgehend ohne Annahmen aus, es wird häufig mit Rangzahlen, statt den gemessenen Werten gerechnet (mindestens ordinales Skalenniveau erforderlich). Aber: geringere Power als parametrische Verfahren (mehr Patienten notwendig) Bsp: Mann-Whitney-U Test, Wilcoxon-Test, Spearman Korrelationskoeffizient Basis-Kurs Statistik und SPSS für Mediziner 68
69 Asymptotisch - exakt Asymptotische Tests: Testergebnisse (p-werte) besitzen nur Gültigkeit wenn asymptotische Annahmen (z.b. Verteilungsannahmen) hinreichend erfüllt sind: gegeben bei großen Stichprobenzahlen (n>30). Geringe Abweichungen von notwendigen Verteilungsannahmen können durch Erhöhung der Fallzahl kompensiert werden. Bsp: Chi 2 -Test, z-test Exakte Tests: Auch bei sehr kleinen Stichprobenumfängen gültig, bei denen Verteilungsannahmen nicht verifiziert werden können. Nachteil: rechenintensiv und geringere Power Bsp: Exakter Test nach Fisher, Permutationstests Basis-Kurs Statistik und SPSS für Mediziner 69
70 Übersicht über die wichtigsten Tests Merkmale quantitativ qualitativ Normalverteilung beliebige Verteilung Unverbunden (2 unabhängige Gruppen) 2 -Test, exakter Test nach Fisher (=Fisher-Test) t-test für unverbundene Stichproben Mann-Whitney U Test / Wilcoxon-Rangsummentest Unverbunden (3+ unabhängige Gruppen) 2 -Test Fisher-(Freeman-Halton-)Test Einfache Varianzanalyse Kruskal-Wallis-Test Verbunden (2 Messungen pro Indiv.) Vorzeichen-Test, McNemar-Test t-test für verbundene Stichproben Vorzeichen-Test, Wilcoxon-Vorzeichen-Rang-Test Verbunden (3+ Messungen pro Indiv.) Cochrans Q-Test Armitage Trend-Test Varianzanalyse für Messwiederholungen Friedman-Test Basis-Kurs Statistik und SPSS für Mediziner 70
71 Chi-Quadrat-Test, exakter Test nach Fisher Basis-Kurs Statistik und SPSS für Mediziner 71
72 Chi-Quadrat-Test Beispiel: Besteht zwischen zwei Medikamenten ein Unterschied bzgl. der 1-Jahres-Mortalität? (α=0,05) beobachtet ASPAC Heparin gesamt gestorben 9 (5,6%) 19 (12,6%) 28 (9,0%) nicht gestorben gesamt Idee: Die Häufigkeit von Todesfällen beträgt insgesamt 28/313 = 9%. Hätten beide Medikamente das gleiche Mortalitätsrisiko, wäre die erwartete Sterberate in beiden Gruppen ebenfalls gleich 9%. Basis-Kurs Statistik und SPSS für Mediziner 72
73 Chi-Quadrat-Test Vergleich erwarteter mit beobachteten Häufigkeiten: beobachtet erwartet (unter H 0 ) ASPAC Heparin gesamt gestorben 9 9%*162 = 14,5 19 9%*151 = 13,5 28 (9%) nicht gestorben ,5 = 147, ,5 = 137,5 285 gesamt Je stärker die beobachteten Werte von den erwarteten Werten abweichen, desto mehr spricht das für die Alternativhypothese. Basis-Kurs Statistik und SPSS für Mediziner 73
74 Chi-Quadrat-Test Indikation: Prüfung auf Assoziation zweier Merkmale Vergleich der Häufigkeitsverteilung kategorialer Merkmale bei unabhängigen Gruppen Voraussetzungen: Mindestens 80% der Zellen haben eine erwartete Häufigkeit 5 Kategoriale Variablen Beim Vergleich von mehr als zwei Gruppen lautet die Alternativhypothese: Mindestens eine Gruppe unterscheidet sich von mindestens einer anderen in ihrer Häufigkeitsverteilung. Basis-Kurs Statistik und SPSS für Mediziner 74
75 Exakter Test nach Fisher Falls Voraussetzung für Chi-Quadrat-Test nicht erfüllt? Exakter Test nach Fisher auch bei schwach besetzten Zellen gültig keine Verteilungsannahme (Permutationstest) sehr rechenintensiv (bei heutiger Rechenleistung im Regelfall nicht relevant) Basis-Kurs Statistik und SPSS für Mediziner 75
76 Exakter Test von Fisher - SPSS Chi-Quadrat-Test: Analysieren Deskriptive Statistiken Kreuztabellen Statistiken Chi-Quadrat auswählen Exakter Test von Fisher: zusätzlich Exakt Exakt auswählen Chi-Quadrat Fisher Basis-Kurs Statistik und SPSS für Mediziner 76
77 Test auf Normalverteilung (?) Basis-Kurs Statistik und SPSS für Mediziner 77
78 Kolmogorov-Smirnov-Test Analysieren Deskriptive Statistiken Explorative Datenanalyse Diagramme Normalverteilungsdiagramm mit Tests ankreuzen Es sei zu testen, ob der Hämoglobingehalt im Blut bei Frauen nicht normalverteilt ist. Die Stichprobenwerte von 10 Frauen ergaben: [g/dl] Nullhypothese: Die Daten folgen einer Normalverteilung. Interpretation: Man kann nicht nachweisen, dass die Verteilung von Hämoglobin von der Normalverteilung überzufällig abweicht. Basis-Kurs Statistik und SPSS für Mediziner 78
79 Kolmogorov-Smirnov-Test Dilemma: Geringe Power bei kleinen Fallzahlen (n<50) Abweichungen von der NV-Annahme können evtl. nicht nachgewiesen werden (p>0,05). Große Fallzahlen: Bereits bei geringen Abweichungen ergeben sich signifikante Unterschiede von der NV. Häufig gilt jedoch für asymptotische Testeigenschaften: Für n>30 geringe bis mäßige Abweichungen von der NV-Annahme nicht relevant Daher (insbesondere bei kleinen Stichproben): grafische Verfahren verwenden (z.b. Histogramm) Deskriptive Faustregeln beachten (bei NV gilt): Mittelwert Median Symmetrische Abweichung von Minimum und Maximum um den Mittelwert Symmetrische Abweichung der Quartile um den Mittelwert Basis-Kurs Statistik und SPSS für Mediziner 79
80 t-test Basis-Kurs Statistik und SPSS für Mediziner 80
81 t-test für unverbundene Stichproben Voraussetzung: - Die Daten in beiden Gruppen sind normalverteilt - Die beiden Gruppen sind unabhängig (z.b. verschiedene Patienten) Es existieren Varianten für gleiche (klassischer t-test) und ungleiche (Welch-Test) Varianzen in den beiden Gruppen. Hypothesen: H 0 : µ 1 = µ 2 die Mittelwerte in beiden Gruppen sind gleich H 1 : µ 1 µ 2 die Mittelwerte sind unterschiedlich Benötigt: Fallzahl in den beiden Gruppen (n 1, n 2 ) Mittelwerte in den beiden Gruppen ( x, y ) Standardabweichung oder Varianz in den beiden Gruppen (s 1, s 2 bzw. s 12, s 22 ) Basis-Kurs Statistik und SPSS für Mediziner 81
82 t-test für unverbundene Stichproben - Beispiel Beispiel Hämoglobingehalt bei Männern und Frauen: n Männer 10; x Männer 13,0; s Männer 0,90 n Frauen 10; x Frauen 12,5; s Frauen 0,55 Formulierung der Hypothesen: H 0 : Die Mittelwerte in beiden Gruppen sind gleich: µ M = µ F H 1 : Die Mittelwerte in beiden Gruppen unterscheiden sich: µ M µ F Festlegung der Irrtumswahrscheinlichkeit (für den Fehler 1. Art): α= 5% Basis-Kurs Statistik und SPSS für Mediziner 82
83 t-test für unverbundene Stichproben - SPSS Analysieren Mittelwerte vergleichen T-Test bei unabhängigen Stichproben Deskriptive Statistiken: t-test: Teststatistik (t): Differenz der Mittelwerte / Standardfehler der Differenz (Levene s Test - Test auf Gleichheit der Varianzen: p<0,05 zweite Zeile) Sig. (2-tailed): p-wert 95%-Konfidenzintervall für Differenz der Mittelwerte (0 nicht enthalten p<0,05) Basis-Kurs Statistik und SPSS für Mediziner 83
84 t-test für verbundene Stichproben Voraussetzungen Normalverteilung der Differenz der Paare Zu jedem Individuum existieren zwei Messungen (x und y) Hypothesen: H 0 : = 0 H 1 : 0 wobei Δ = x-y d.h. es wird getestet, ob eine signifikante Änderung der Werte beobachtet werden kann. Um die Wirksamkeit von Therapien zu überprüfen, ist immer eine Kontrollgruppe nötig, da auch andere Effekte (z.b. Zeit) eine Änderung der Werte hervorrufen können. Basis-Kurs Statistik und SPSS für Mediziner 84
85 t-test für verbundene Stichproben Beispiel Messwerte von Materialeigenschaften eines Implantats im Rohzustand (x) und nach Oberflächenbehandlung (y): i x i y i i =x i -y i 1 4,0 3,0 1,0 2 3,5 3,0 0,5 3 4,1 3,8 0,3 4 5,5 2,1 3,4 5 4,6 4,9-0,3 6 6,0 5,3 0,7 7 5,1 3,1 2,0 8 4,3 2,7 1,6 MW ( ) 4,6 3,5 1,15 s 1,16 Basis-Kurs Statistik und SPSS für Mediziner 85
86 t-test für verbundene Stichproben SPSS Analysieren Mittelwerte vergleichen T-Test bei verbundenen Stichproben Deskriptive Analysen t-test für verbundene Stichproben 95%-Konfidenzintervall für den Mittelwert der Differenz p-wert Basis-Kurs Statistik und SPSS für Mediziner 86
87 Verbundene vs. unverbundene Stichproben Vorteil verbundener Stichproben: Genauigkeitsgewinn durch Abschätzung der intra-individuellen Streuung Voraussetzungen schwächer: Normalverteilung für Differenz (häufig erfüllt) Nachteil verbundener Stichproben: Änderungen innerhalb der Gruppe durch viele Einflüsse möglich Fehlende Werte bei einer Messung führen zum Ausschluss der Beobachtungseinheit Carry-over Effekte möglich Basis-Kurs Statistik und SPSS für Mediziner 87
88 Erweiterungen des t-tests Mehr als zwei Gruppen (unverbunden) ANOVA (Varianzanalyse), einfaktoriell Mehr als zwei wiederholte Messungen (z.b. Zeitpunkte) ANOVA für Messwiederholungen Adjustierter t-test ANCOVA (Kovarianzanalyse, entspricht linearer Regression) Quantitative Einflussgröße Regressionsmodell Simultaner Einfluss mehrere Einflussgrößen Regressionsmodell Basis-Kurs Statistik und SPSS für Mediziner 88
89 Nichtparametrische Tests Basis-Kurs Statistik und SPSS für Mediziner 89
90 Nichtparametrische Tests Nichtparametrisch = verteilungsfrei KEINE Normalverteilungsannahme Es werden keine Originaldaten verwendet, sondern deren Ränge Quantitative UND ordinale Merkmalstypen Geringere Effizienz im Vergleich zu parametrischen Verfahren Keine interpretierbaren Effektschätzer und Konfidenzintervalle Basis-Kurs Statistik und SPSS für Mediziner 90
91 Überblick verteilungsfreie Verfahren verbundene Stichproben unverbundene Stichproben 2 Stichproben > 2 Stichproben 2 Stichproben > 2 Stichproben Vorzeichen-Test Wilcoxon-Test (Rang-Vorzeichen-Test) Friedman-Test Mann-Whitney-U Test / Wilcoxon-Test (Rangsummen-Test) Kruskal-Wallis-Test Basis-Kurs Statistik und SPSS für Mediziner 91
92 Mann-Whitney-U-Test / Wilcoxon-Rangsummentest Zwei unverbundene Stichproben Basierend auf Rängen Bei Vorliegen einer Normalverteilung: der t-test hat bei gegebener Fallzahl eine (etwas) größere Power als der Mann-Whitney-U-Test bzw. für den Mann-Whitney-U-Test ist eine größere Fallzahl nötig, um die gleiche Power zu erzielen H 0 : Die Beobachtungen der Gruppe A stammen aus der gleichen Verteilung wie die der Gruppe B (d.h. H 0 : P(X A > X B ) = 50%). Bei gleicher Form der Verteilungsfunktion entspricht dies einem Test auf Gleichheit der Mediane Basis-Kurs Statistik und SPSS für Mediziner 92
93 Mann-Whitney-U-Test Beispiel (Pocock) Treatment: Steroid-Behandlung bei schwangeren Frauen Zielgröße: Thrombozytenzahl bei den Neugeborenen (pro mm³) hier: keine Normalverteilung, keine Symmetrie ja nein Treatm ent m it S teroiden ohne S teroide lfd. N r. Throm bozytenzahl R ang Basis-Kurs Statistik und SPSS für Mediziner 93
94 Mann-Whitney-U-Test SPSS Analysieren Nichtparametrische Tests Alte Dialogfelder Zwei unabhängige Stichproben Bestimmung der Rangsummen Ausgabe des p-wertes p-wert Basis-Kurs Statistik und SPSS für Mediziner 94
95 Vorzeichen-Test (Sign-Test) Zwei verbundene Stichproben (x 1, y 1 ),...,(x n, y n ): gepaarte Stichprobe der Zufallsvariablen X und Y Annahmen Differenzen D i = Y i X i sind unabhängig P(X i = Y i ) = 0 (keine Bindungen) Testproblem: H 0 : P(X<Y) = P(X>Y) = 0.5 (Anteil pos./neg. Änderungen 50%) H 1 : P(X<Y) P(X>Y) (Anteil pos./neg. Änderungen unausgewogen) Basis-Kurs Statistik und SPSS für Mediziner 95
96 Vorzeichen-Test - Beispiel Gewicht vor Diät Nach Diät Delta Ti T=5 Delta: Differenz(nach-vor) T: 1, wenn Delta>0 0, wenn Delta<0 Basis-Kurs Statistik und SPSS für Mediziner 96
97 Vorzeichen-Test - SPSS Analysieren Nichtparametrische Tests Alte Dialogfelder Zwei verbundene Stichproben Vorzeichen Deskriptive Analysen: Koerpergewicht nach Diaet - Koerpergewicht vor Diaet Häufigkeiten Negative Differenzen Positive Differenzen Bindungen c b a N Gesamt 14 a. b. c. Koerpergewicht nach Diaet < Koerpergewicht vor D iaet Koerpergewicht nach Diaet > Koerpergewicht vor D iaet Koerpergewicht nach Diaet = Koerpergewicht vor D iaet Ausgabe des p-wertes: Exakte Signifikanz (2-seitig) Exakte Signifikanz (1-seitig) Punkt-Wahrscheinlichkeit Statistik für Test b Koerpe rgewi cht nach Diaet - Koerpe rgewi cht vor Diaet a,581,291,157 a. b. Verwende tete Binomia lve rteilung. Vorzeichentest Basis-Kurs Statistik und SPSS für Mediziner 97
98 Wilcoxon-Rang-Vorzeichen-Test (signed-rank test) Zwei verbundene Stichproben (gepaarte Beobachtungen) Zusätzliche Annahme: Verteilung der Differenzen ist stetig und symmetrisch um den Median Δ med. Paare mit Bindungen (x i =y i ) werden im Test ignoriert Testproblem: H 0 : Δ med = 0 H 1 : Δ med 0 Falls Annahmen für die entsprechenden Tests erfüllt: t-test für verbundene Stichproben ist effizienter als Wilcoxon-Rang-Vorzeichen- Test Wilcoxon-Rang-Vorzeichen-Test ist effizienter als einfacher Vorzeichentest Basis-Kurs Statistik und SPSS für Mediziner 98
99 Wilcoxon-Rang-Vorzeichen-Test - - Beispiel Gewicht vor Diät Nach Diät Delta Delta R( D ) 12 5, ,5 8 1,5 5,5 13 T Ti R( D ) 7 3 1,5 5,5 13 W + =30 Delta: Differenz Delta : Betrag der Differenz R( D ): Rang von Delta T: 1, wenn Delta>0 0, wenn Delta<0 Ti R( D ): Nur Ränge für T=1 werden gezählt W + : Summe dieser Ränge Basis-Kurs Statistik und SPSS für Mediziner 99
100 Wilcoxon-Rang-Vorzeichen-Test - - SPSS Analysieren Nichtparametrische Tests Alte Dialogfelder Zwei verbundene Stichproben Wilcoxon Deskriptive Statistiken Ausgabe der Teststatistik und des p-wertes Basis-Kurs Statistik und SPSS für Mediziner 100
101 Korrelation Basis-Kurs Statistik und SPSS für Mediziner 101
102 Korrelation Korrelationen werden berechnet, um die Stärke eines linearen (monotonen) Zusammenhangs zwischen zwei stetigen (ordinalen) Merkmalen X und Y zu erfassen. Beispiele: Es soll untersucht werden, 1. ob ein Zusammenhang zwischen Körpergröße und Gewicht besteht, 2. ob sich der Blutdruck/BMI mit dem Alter ändert, 3. ob mit einer höheren Tumorexpression auch ein schlechterer klinischer Score einhergeht. Basis-Kurs Statistik und SPSS für Mediziner 102
103 Korrelation - Beispiel Beispiel: Körperfettanteil, Größe, Gewicht und Hüftumfang wurden an 252 Männern erhoben. Ziel der Studie ist es, den Anteil von Körperfett durch einfach zu erhebende Surrogate möglichst genau abzuschätzen. Basis-Kurs Statistik und SPSS für Mediziner 103
104 Korrelation - Beispiel Grafik Diagrammerstellung Streu-/Punktdiagramm Basis-Kurs Statistik und SPSS für Mediziner 104
105 Pearson Korrelationskoeffizient r Voraussetzung: 2 normalverteilte (stetige) Variablen Vorsicht bei Ausreißern! r nach Spearman als robustes Maß Eigenschaften: Wertebereich: 1 bis +1 (symmetrisches Maß) Invariant gegenüber linearen Transformationen (z.b. egal ob Gewicht in Gramm oder Kilogramm) Interpretation: Misst die Stärke des linearen Zusammenhangs r = -1, r = 1: perfekter linearer Zusammenhang r 0: kein linearer Zusammenhang r > 0 (r < 0): gleichsinniger (gegensinniger) Zusammenhang Basis-Kurs Statistik und SPSS für Mediziner 105
106 Pearson Korrelationskoeffizient - Beispiel Analysieren Korrelation Bivariat Basis-Kurs Statistik und SPSS für Mediziner 106
107 Korrelation Anmerkungen Achtung! r=0,8 Viele verschiedene Zusammenhänge können den gleichen Korrelationskoeffizienten ergeben, aber trotzdem nicht den Trend der Punktwolke widerspiegeln. Problem: Es liegt kein linearer oder monotoner Zusammenhang vor. Ausreißer beeinflussen das Ergebnis. Die Daten sind nicht normalverteilt. Lösung: Korrelationskoeffizient nach Spearman Flexible Modellierung (Regression) Basis-Kurs Statistik und SPSS für Mediziner 107
108 Korrelationskoeffizient nach Spearman Voraussetzung: mind. ordinalskalierte Merkmale Eigenschaften: Basiert auf Rängen Robust gegenüber Ausreißern Interpretation: Maß für monotonen Zusammenhang Berechnung, Interpretation und Auswertung äquivalent zu Pearson Korrelationskoeffizient. Analysieren Korrelation Bivariat Spearman Basis-Kurs Statistik und SPSS für Mediziner 108
109 Stärke des Zusammenhangs Ausmaß des Korrelationskoeffizienten: 0.00 bis 0.19 kein / sehr schwacher 0.20 bis 0.39 schwacher Wenn r 0.40 bis 0.69 moderater Zusammenhang 0.70 bis 0.89 starker 0.90 bis 1.00 sehr starker Signifikanz des Korrelationskoeffizienten: Beurteilung zum Signifikanzniveau α (meist α = 0,05) Warnung: Tests dürfen in explorativen Studien nur als hypothesengenerierend verstanden werden. Für konfirmatorische Aussagen ist eine Korrektur für multiples Testen erforderlich. Basis-Kurs Statistik und SPSS für Mediziner 109
110 Korrelation Anmerkungen Korrelationskoeffizienten sind nicht anwendbar für nominale Variablen, auch wenn diese als Zahlen kodiert sind Korrelation Kausalität Bei komplexen Zusammenhängen folgt aus r = 0 nicht immer Unabhängigkeit der Variablen (z.b. U-förmiger Zusammenhang). Der Begriff Korrelation wird in der Statistik nicht allgemein für alle Arten von Assoziationstests verwendet. Wichtig: Betrag des Koeffizienten und p-wert sind gemeinsam zu interpretieren, denn: Bei großem n sind auch kleine r signifikant von 0 verschieden. Bei kleinem n können auch große r nicht signifikant sein. Basis-Kurs Statistik und SPSS für Mediziner 110
111 Regression Basis-Kurs Statistik und SPSS für Mediziner 111
112 Einfache lineare Regression ^ Die Geradengleichung y = a + bx stellt dabei die Regressionsgleichung dar. b quantifiziert den Zusammenhang zwischen Y und X. = Abweichung/Residuum: Die Parameter a und b werden so bestimmt, dass die Summe der quadrierten Abweichungen minimal wird Kleinste Quadrate Schätzer. b y ^ = vorhergesagter Y Wert a = Konstante/Intercept (Schnittpunkt der Regressionsgeraden mit y-achse bzw. y-wert der Regressionsgeraden bei x=0) b = Anstieg/Slope (Zu-/Abnahme von Y, wenn X um eine Einheit ansteigt) a 1 Basis-Kurs Statistik und SPSS für Mediziner 112
113 Einfache lineare Regression Beispiel Annahme: Körperfett steht in einer linearen Beziehung zum Brustumfang. Allgemeine Form der Geradengleichung: Geschätzter Körperfettanteil = a + b Brustumfang Basis-Kurs Statistik und SPSS für Mediziner 113
114 Einfache lineare Regression SPSS Grafik: Grafik Diagrammerstellung Streu-/Punktdiagramm Regressionsgreade: Doppelklick auf Grafik Elemente Anpassungslinie bei Gesamtsumme Basis-Kurs Statistik und SPSS für Mediziner 114
115 Einfache lineare Regression SPSS Analysieren Regression Linear Konstante (= a) Zielgröße Y Steigung (= b) Die Nullhypothese H 0 : b = 0, d.h. kein Zusammenhang, kann auf dem 5%-Signifikanzniveau abgelehnt werden. Geschätzter Körperfettanteil = -51, ,697 Brustumfang Basis-Kurs Statistik und SPSS für Mediziner 115
116 Einfache lineare Regression Beispiel Die aus den Daten geschätzte Regressionsgleichung kann benutzt werden, um Körperfett bei Männern abzuschätzen. z. B. für einen Mann mit 100 cm Brustumfang ergibt sich Geschätzter Körperfettanteil = -51, , [cm] = 0,185 = 18,5% Basis-Kurs Statistik und SPSS für Mediziner 116
117 Multiple lineare Regression In einer multiplen Regression lassen sich die Effekte mehrerer Variablen simultan bestimmen. Allgemeine Form der Geraden, um Körperfett aus mehreren Einflussgrößen zu bestimmen: Körperfett = b 0 + b 1 Brustumfang + b 2 Übergewicht + b 3 Adipositas Berechnung der Regressionskoeffizienten auf Basis der Daten ergibt: Körperfett = -31, ,480 Brustumfang + 3,864 Übergewicht + 6,290 Adipositas Basis-Kurs Statistik und SPSS für Mediziner 117
118 Multiple lineare Regression Interpretation Körperfett = -31, ,480 Brustumfang + 3,864 Übergewicht + 6,290 Adipositas Eine (theoretische) Person mit Brustumfang von 0 cm und BMI im Normalbereich hätte einen erwarteten Körperfettanteil von -31,45% Ein normalgewichtiger Mann mit einem Brustumfang von 100 cm hat einen erwarteten/vorhergesagten Körperfettanteil von -31, , = 8,55% Im Vergleich dazu hat ein adipöser Mann mit gleichem Brustumfang einen vorhergesagten Körperfettanteil von -31, , ,290 = 14,84% Basis-Kurs Statistik und SPSS für Mediziner 118
119 Gütemaß Wie gut beschreibt die Regressionsgerade die Daten? Wie genau kann die abhängige Größe durch das Modell vorhergesagt werden? Bestimmtheitsmaß (R 2 ) Interpretation: R² gibt an, wie viel Prozent der Streuung der abhängigen Variablen Y durch die Regressionsgerade erklärt werden kann. Es entspricht in der einfachen linearen Regression mit einer stetigen Einflussgröße dem quadrierten Pearson Korrelationskoeffizienten. Wertebereich: 0 bis 1 Basis-Kurs Statistik und SPSS für Mediziner 119
120 Gütemaß SPSS Modell I: Einflussgröße nur Brustumfang R 2 = 0,494 Modell II: Einflussgrößen Brustumfang, Übergewicht, Adipositas R 2 = 0,519 Basis-Kurs Statistik und SPSS für Mediziner 120
121 Lineare Regression: Annahmen Voraussetzungen für die Durchführung einer linearen Regression: Die Residuen müssen normalverteilt sein (nicht die Zielgröße) ( Histogramm der Residuen) Analysieren Regression linear Diagramme unter Diagramme der standardisierten Residuen Haken setzen bei Histogramm Basis-Kurs Statistik und SPSS für Mediziner 121
122 Analyse von Überlebenszeiten Basis-Kurs Statistik und SPSS für Mediziner 122
123 Typische Beispiele und Problemstellung Überlebenszeit oder 1, 2, 3,... Jahres-Überlebensrate - von Krebspatienten - nach Transplantationen Dauer bis zur Schmerzfreiheit nach Knieoperation Unterscheiden sich 2 oder mehr Gruppen hinsichtlich der Überlebenszeit? Überlebenszeit: Probleme: Zeitspanne T bis zum Eintreten eines bestimmten Ereignisses Ereigniszeiten unvollständig beobachtet Zensierungsproblematik z.b. Nachbeobachtungsperioden unterschiedlich lang, manche Patienten scheiden während der Studie aus Ereignis: Tod, Rezidiv, Remission,... Basis-Kurs Statistik und SPSS für Mediziner 123
124 Beobachtungsmuster Basis-Kurs Statistik und SPSS für Mediziner 124
125 Kaplan-Meier-Schätzer Basis-Kurs Statistik und SPSS für Mediziner 125
126 Kaplan-Meier-Schätzer Überlebenszeiten (in Monaten) von 30 Patienten in einer randomisierten Studie Therapie vs. Placebo: Therapie (n=15) Placebo (n=15) * * 7 90* * * * * 128* 181* * 141* 54 * lebend zum letzten Beobachtungszeitpunkt Lost to follow up (Studienabbruch) Frage: Wie groß ist die Überlebenswahrscheinlichkeit in den beiden Gruppen? Problem: Zensierungen/unterschiedlich lange Beobachtungsdauern Lösung: Kaplan-Meier-Schätzer Basis-Kurs Statistik und SPSS für Mediziner 126
127 Kaplan-Meier-Schätzer Idee: 1. Sortieren der Daten nach Ereigniszeiten. Die Ereignisse geben Beobachtungsintervalle vor. 2. Bestimmung der Personen unter Risiko zu jedem Zeitpunkt: Personen, die bis unmittelbar vor dem Zeitpunkt gelebt haben und Personen, die irgendwann nach diesem Zeitpunkt zensiert wurden. 3. Für jedes Zeitintervall Berechnung der (bedingten) Wahrscheinlichkeit, dass jemand, der bis zu Beginn des Intervalls gelebt hat, bis zum Ende des Intervalls überleben wird. 4. Berechnung der Überlebenswahrscheinlichkeit zu jedem Zeitpunkt als Produkt der bedingten Wahrscheinlichkeiten, jedes Zeitintervall zu überleben. Basis-Kurs Statistik und SPSS für Mediziner 127
128 Kaplan-Meier-Schätzer - Beispiel Berechnung am Beispiel Therapiegruppe Zeitpunkt Patienten unter Risiko Anzahl Ereignisse Wahrscheinlichkeit, Intervall zu überleben /15 14/ /14 14/15 13/ Kumulierte Überlebenswahrscheinlichkeit /12 14/15 13/14 11/ /11 14/15 13/14 11/12 10/11 Basis-Kurs Statistik und SPSS für Mediziner 128
129 Kaplan-Meier-Schätzung - SPSS Analysieren Überleben Kaplan-Meier Basis-Kurs Statistik und SPSS für Mediziner 129
130 Kaplan-Meier-Kurve Beispiel: Medianes Überleben Analysieren Überleben Kaplan-Meier Optionen unter Diagramme Überleben auswählen Basis-Kurs Statistik und SPSS für Mediziner 130
131 Kaplan-Meier-Kurve Beispiel: 10 Jahres Überleben Basis-Kurs Statistik und SPSS für Mediziner 131
132 Log-rank Test Basis-Kurs Statistik und SPSS für Mediziner 132
133 Log-rank Test Statistische Hypothesen: H 0 : kein Unterschied in der Verteilung der Überlebenszeiten zwischen Placebo und Therapiegruppe, d.h. Todesfälle treten in zufälliger Reihenfolge unabhängig von der Gruppenzugehörigkeit auf H 1 : Unterschied in der Verteilung der Überlebenszeiten zwischen Placebo und Therapiegruppe, d.h. Todesfälle treten in einer Gruppe früher als in der anderen Gruppe auf Voraussetzung: Kaplan-Meier-Kurven sollten sich nicht überschneiden Basis-Kurs Statistik und SPSS für Mediziner 133
134 Log-rank Test Idee: 1. Bestimmung der beobachteten Anzahl an Todesfällen in beiden Gruppen (beobachtete Ereignisse zum Ereigniszeitpunkt t j in den beiden Gruppen: d Aj und d Bj ). 2. Berechnung der unter H 0 erwarteten Anzahl von Todesfällen in beiden Gruppen zu den einzelnen Zeitpunkten t j (E(d Aj ), E(d Bj )) 3. Vergleich der beobachteten und erwarteten Anzahlen an Ereignissen einer Gruppe mittels der Log-rank-Teststatistik: U [ d j Aj E ( d Aj )] LR U 2 Var ( U ) Bei hinreichend großer Zahl der Ereignisse ist LR annähernd χ 2 -verteilt. Faustregel: insgesamt mindestens 30 Ereignisse über beide Gruppen Basis-Kurs Statistik und SPSS für Mediziner 134
135 Log-rank Test -- Beispiel Analysieren Überleben Kaplan-Meier Faktor vergleichen unter Teststatistiken Log-Rang auswählen Basis-Kurs Statistik und SPSS für Mediziner 135
136 Log-rank Test Cox-Regression Grenzen des Log-rank-Tests: Reiner Signifikanztest liefert keine Effektgrößen Lediglich Gruppenvergleiche möglich (nur eine binäre bzw. kategoriale Einflussgröße) Cox-Regression erweitert den Log-rank-Test Simultaner Effekt mehrerer Einflussgrößen Metrische Einflussgrößen Adjustierter Gruppenvergleich Hazard Ratio als Effektmaß Basis-Kurs Statistik und SPSS für Mediziner 136
137 Cox-Regression Basis-Kurs Statistik und SPSS für Mediziner 137
138 Cox-Regression - Hazardfunktion Zielgröße in der Cox-Regression: Hazardrate (Risikofunktion) h(t): h( t) lim t 0 P ( t T t t t T t) h(t) beschreibt die infinitesimale Wahrscheinlichkeit für ein Ereignis zum Zeitpunkt t, gegeben das Ereignis ist vor Zeitpunkt t noch nicht eingetreten, d.h. die Wahrscheinlichkeit, wenn ein Patient bis t überlebt hat, dass er unmittelbar zum Zeitpunkt t verstirbt. Basis-Kurs Statistik und SPSS für Mediziner 138
139 Cox-Regression (proportional hazards model) Cox-Modell: h(t) h (t) exp( β X β X β m X m ) Voraussetzung: Proportionale Hazardraten, d.h. Effekte verschiedener Variablen auf das Überleben sind über die Zeit konstant! Basis-Kurs Statistik und SPSS für Mediziner 139
140 Cox-Regression h(t) h (t) exp( β X β X β m X m ) h(t): Hazardrate h 0 (t): unspezifizierter Baseline-Hazard (beschreibt das Risiko, wenn alle Einflussgrößen gleich 0 sind) X 1,,X m : Werte der Einflussgrößen β 1,...,β m : Regressionskoeffizienten Basis-Kurs Statistik und SPSS für Mediziner 140
141 Cox Regression Hazard Ratio Zwei-Gruppen-Fall (0 vs. 1): HR=exp(β) Risikoverhältnis zwischen den beiden Gruppen Gruppenunterschied von primärem Interesse, weitere Einflussgrößen als adjustierende Variablen adjustiertes Risikoverhältnis zwischen den Gruppen Stetige Einflussgröße exp(β) beschreibt die relative Änderung des Risikos bei Änderung der Einflussgröße um eine Einheit z.b. exp(ß) = 1.12 Risikoanstieg von 12% exp(ß) = 0.80 Risikoreduktion um 20% exp(ß) = 1 kein Risikounterschied Basis-Kurs Statistik und SPSS für Mediziner 141
142 Cox-Regression Beispiel Randomisierte Studie mit 158 Patienten (74 mit Standardtherapie, 84 mit neuer Therapie) Weitere Einflussgrößen: Alter Geschlecht (1=männlich, 0=weiblich) Score für Gesundheitszustand (0 bis 100, hohe Werte sprechen für guten Zustand) Endpunkt: Zeit bis zum Tod / bis Zensierung Status (0=zensiert, 1=Ereignis) ID Beobachtete Zeit Status Therapie Geschlecht Alter Score Basis-Kurs Statistik und SPSS für Mediziner 142
143 Cox-Regression - SPSS Analysieren Überleben Cox-Regression (bei Optionen Konfidenzintervall für Exp(B) markieren) Variablen für Überlebenszeit und Status sowie Einflussgrößen definieren Output: B: Regressionskoeffizient Exp(B): geschätztes Risikoverhältnis CI for Exp(B): Konfidenzintervall für das Risikoverhältnis Sig.: p-wert Basis-Kurs Statistik und SPSS für Mediziner 143
144 Cox- Regression - SPSS In den beobachteten Daten führt die neue Therapie zu einer Verringerung des Risikos (B<0 bzw. Exp(B)<1) Risikoverhältnis (=HR) beträgt 0,556 Das Risiko unter der neuen Therapie beträgt das 0,556-fache des Risikos unter der Standardtherapie Verringerung des Risikos ist signifikant (p-wert<0,05 / HR von 1 ist nicht im Konfidenzintervall enthalten) Kein signifikanter Alters- und Geschlechtseffekt Signifikanter Einfluss des Scores. Ein Unterschied von einem Punkt spricht für eine Risikoänderung um den Faktor 0,987 Ein Unterschied von 10 Scorepunkten führt zu einer Risikoreduktion auf das 0,878-fache: exp(10 β) = exp(10 (-0,013)) = 0,878 Basis-Kurs Statistik und SPSS für Mediziner 144
Deskription, Statistische Testverfahren und Regression. Seminar: Planung und Auswertung klinischer und experimenteller Studien
Deskription, Statistische Testverfahren und Regression Seminar: Planung und Auswertung klinischer und experimenteller Studien Deskriptive Statistik Deskriptive Statistik: beschreibende Statistik, empirische
Inhaltsverzeichnis. Über die Autoren Einleitung... 21
Inhaltsverzeichnis Über die Autoren.... 7 Einleitung... 21 Über dieses Buch... 21 Was Sie nicht lesen müssen... 22 Törichte Annahmen über den Leser... 22 Wie dieses Buch aufgebaut ist... 23 Symbole, die
Ergebnisse VitA und VitVM
Ergebnisse VitA und VitVM 1 Basisparameter... 2 1.1 n... 2 1.2 Alter... 2 1.3 Geschlecht... 5 1.4 Beobachtungszeitraum (von 1. Datum bis letzte in situ)... 9 2 Extraktion... 11 3 Extraktionsgründe... 15
Ermitteln Sie auf 2 Dezimalstellen genau die folgenden Kenngrößen der bivariaten Verteilung der Merkmale Weite und Zeit:
1. Welche der folgenden Kenngrößen, Statistiken bzw. Grafiken sind zur Beschreibung der Werteverteilung des Merkmals Konfessionszugehörigkeit sinnvoll einsetzbar? A. Der Modalwert. B. Der Median. C. Das
Bereiche der Statistik
Bereiche der Statistik Deskriptive / Exploratorische Statistik Schließende Statistik Schließende Statistik Inferenz-Statistik (analytische, schließende oder konfirmatorische Statistik) baut auf der beschreibenden
5. Lektion: Einfache Signifikanztests
Seite 1 von 7 5. Lektion: Einfache Signifikanztests Ziel dieser Lektion: Du ordnest Deinen Fragestellungen und Hypothesen die passenden einfachen Signifikanztests zu. Inhalt: 5.1 Zwei kategoriale Variablen
Statistik II: Signifikanztests /1
Medien Institut : Signifikanztests /1 Dr. Andreas Vlašić Medien Institut (0621) 52 67 44 vlasic@medien-institut.de Gliederung 1. Noch einmal: Grundlagen des Signifikanztests 2. Der chi 2 -Test 3. Der t-test
Eigene MC-Fragen SPSS. 1. Zutreffend auf die Datenerfassung und Datenaufbereitung in SPSS ist
Eigene MC-Fragen SPSS 1. Zutreffend auf die Datenerfassung und Datenaufbereitung in SPSS ist [a] In der Variablenansicht werden für die betrachteten Merkmale SPSS Variablen definiert. [b] Das Daten-Editor-Fenster
Parametrische vs. Non-Parametrische Testverfahren
Parametrische vs. Non-Parametrische Testverfahren Parametrische Verfahren haben die Besonderheit, dass sie auf Annahmen zur Verteilung der Messwerte in der Population beruhen: die Messwerte sollten einer
fh management, communication & it Constantin von Craushaar fh-management, communication & it Statistik Angewandte Statistik
fh management, communication & it Folie 1 Überblick Grundlagen (Testvoraussetzungen) Mittelwertvergleiche (t-test,..) Nichtparametrische Tests Korrelationen Regressionsanalyse... Folie 2 Überblick... Varianzanalyse
12 Rangtests zum Vergleich zentraler Tendenzen
12 Rangtests zum Vergleich zentraler Tendenzen 12.1 Allgemeine Bemerkungen 12.2 Gepaarte Stichproben: Der Wilcoxon Vorzeichen- Rangtest 12.3 Unabhängige Stichproben: Der Wilcoxon Rangsummentest und der
Statistische Messdatenauswertung
Roland Looser Statistische Messdatenauswertung Praktische Einführung in die Auswertung von Messdaten mit Excel und spezifischer Statistik-Software für naturwissenschaftlich und technisch orientierte Anwender
Institut für Biometrie und klinische Forschung. WiSe 2012/2013
Klinische Forschung WWU Münster Pflichtvorlesung zum Querschnittsfach Epidemiologie, Biometrie und Med. Informatik Praktikum der Medizinischen Biometrie () WiSe /3 Univariate und bivariate Verfahren Univariate
3. Lektion: Deskriptive Statistik
Seite 1 von 5 3. Lektion: Deskriptive Statistik Ziel dieser Lektion: Du kennst die verschiedenen Methoden der deskriptiven Statistik und weißt, welche davon für Deine Daten passen. Inhalt: 3.1 Deskriptive
Vorlesung: Statistik II für Wirtschaftswissenschaft
Vorlesung: Statistik II für Wirtschaftswissenschaft Prof. Dr. Helmut Küchenhoff Institut für Statistik, LMU München Sommersemester 2017 Einführung 1 Wahrscheinlichkeit: Definition und Interpretation 2
Unterschiedshypothesen für maximal 2 Gruppen, wenn die Voraussetzungen für parametrische Verfahren nicht erfüllt sind
Schäfer A & Schöttker-Königer T, Statistik und quantitative Methoden für (2015) Arbeitsblatt 1 SPSS Kapitel 6 Seite 1 Unterschiedshypothesen für maximal 2 Gruppen, wenn die Voraussetzungen für parametrische
Arbeitsbuch zur deskriptiven und induktiven Statistik
Helge Toutenburg Michael Schomaker Malte Wißmann Christian Heumann Arbeitsbuch zur deskriptiven und induktiven Statistik Zweite, aktualisierte und erweiterte Auflage 4ü Springer Inhaltsverzeichnis 1. Grundlagen
Einführung in die Statistik für Politikwissenschaftler Sommersemester 2011
Einführung in die Statistik für Politikwissenschaftler Sommersemester 2011 Es können von den Antworten alle, mehrere oder keine Antwort(en) richtig sein. Nur bei einer korrekten Antwort (ohne Auslassungen
Schließende Statistik
Schließende Statistik Die schließende Statistik befasst sich mit dem Rückschluss von einer Stichprobe auf die Grundgesamtheit (Population). Die Stichprobe muss repräsentativ für die Grundgesamtheit sein.
Klassifikation von Signifikanztests
Klassifikation von Signifikanztests Nach Verteilungsannahmen: verteilungsabhängig: parametrischer [parametric] Test verteilungsunabhängig: nichtparametrischer [non-parametric] Test Bei parametrischen Tests
Klassifikation von Signifikanztests
Klassifikation von Signifikanztests nach Verteilungsannahmen: verteilungsabhängige = parametrische Tests verteilungsunabhängige = nichtparametrische Tests Bei parametrischen Tests werden im Modell Voraussetzungen
Statistik. Jan Müller
Statistik Jan Müller Skalenniveau Nominalskala: Diese Skala basiert auf einem Satz von qualitativen Attributen. Es existiert kein Kriterium, nach dem die Punkte einer nominal skalierten Variablen anzuordnen
htw saar 1 EINFÜHRUNG IN DIE STATISTIK: BESCHREIBENDE STATISTIK
htw saar 1 EINFÜHRUNG IN DIE STATISTIK: BESCHREIBENDE STATISTIK htw saar 2 Grundbegriffe htw saar 3 Grundgesamtheit und Stichprobe Ziel: Über eine Grundgesamtheit (Population) soll eine Aussage über ein
Angewandte Statistik 3. Semester
Angewandte Statistik 3. Semester Übung 5 Grundlagen der Statistik Übersicht Semester 1 Einführung ins SPSS Auswertung im SPSS anhand eines Beispieles Häufigkeitsauswertungen Grafiken Statistische Grundlagen
Statistisches Testen
Statistisches Testen Grundlegendes Prinzip Erwartungswert Bekannte Varianz Unbekannte Varianz Differenzen Anteilswert Chi-Quadrat Tests Gleichheit von Varianzen Prinzip des Statistischen Tests Konfidenzintervall
Statistische Tests (Signifikanztests)
Statistische Tests (Signifikanztests) [testing statistical hypothesis] Prüfen und Bewerten von Hypothesen (Annahmen, Vermutungen) über die Verteilungen von Merkmalen in einer Grundgesamtheit (Population)
Klausur in "Biomathematik" WS 2007 / 2008 Montag, den 28. Januar 2008
Klausur in "Biomathematik" WS 2007 / 2008 Montag, den 28. Januar 2008 Name: Matrikelnummer: Unterschrift: Aufgabe 1: Bei einer klinischen Therapiestudie wird bei allen Patienten der Wert eines quantitativen
Statistische Methoden in den Umweltwissenschaften
Statistische Methoden in den Umweltwissenschaften Korrelationsanalysen Kreuztabellen und χ²-test Themen Korrelation oder Lineare Regression? Korrelationsanalysen - Pearson, Spearman-Rang, Kendall s Tau
Übung 5 im Fach "Biometrie / Q1" Thema: Wilcoxon, Chi-Quadrat, multiples Testen
Universität Ulm, Institut für Epidemiologie und Medizinische Biometrie, D-89070 Ulm Institut für Epidemiologie und Medizinische Biometrie Leiter: Prof. Dr. D. Rothenbacher Schwabstr. 13, 89075 Ulm Tel.
Inhaltsverzeichnis Grundlagen aufigkeitsverteilungen Maßzahlen und Grafiken f ur eindimensionale Merkmale
1. Grundlagen... 1 1.1 Grundgesamtheit und Untersuchungseinheit................ 1 1.2 Merkmal oder statistische Variable........................ 2 1.3 Datenerhebung.........................................
Statistische Überlegungen: Eine kleine Einführung in das 1 x 1
Statistische Überlegungen: Eine kleine Einführung in das 1 x 1 PD Dr. Thomas Friedl Klinik für Frauenheilkunde und Geburtshilfe, Universitätsklinikum Ulm München, 23.11.2012 Inhaltsübersicht Allgemeine
Statistik II Übung 3: Hypothesentests
Statistik II Übung 3: Hypothesentests Diese Übung beschäftigt sich mit der Anwendung diverser Hypothesentests (zum Beispiel zum Vergleich der Mittelwerte und Verteilungen zweier Stichproben). Verwenden
Inhaltsverzeichnis. 1 Über dieses Buch Zum Inhalt dieses Buches Danksagung Zur Relevanz der Statistik...
Inhaltsverzeichnis 1 Über dieses Buch... 11 1.1 Zum Inhalt dieses Buches... 13 1.2 Danksagung... 15 2 Zur Relevanz der Statistik... 17 2.1 Beispiel 1: Die Wahrscheinlichkeit, krank zu sein, bei einer positiven
- Normalverteilung (Gaußverteilung) kann auf sehr viele Zufallsprozesse angewendet werden.
Normalverteilung und Standardnormalverteilung als Beispiel einer theoretischen Verteilung - Normalverteilung (Gaußverteilung) kann auf sehr viele Zufallsprozesse angewendet werden. - Stetige (kontinuierliche),
Online Statistik-Coaching
Online Statistik-Coaching Modul 3 Statistisches Testen - Auswahl der passenden Methode - Durchführung mit SPSS - Interpretation und Darstellung Dipl.-Math. Daniela Keller www.statistik-und-beratung.de
Biomathematik für Mediziner, Klausur WS 1999/2000 Seite 1
Biomathematik für Mediziner, Klausur WS 1999/2000 Seite 1 Aufgabe 1: Wieviele der folgenden Variablen sind quantitativ stetig? Schulnoten, Familienstand, Religion, Steuerklasse, Alter, Reaktionszeit, Fahrzeit,
Stichwortverzeichnis. Ausgleichsgerade 177 Ausreißer 13, 40
283 Stichwortverzeichnis a Alpha-Wert 76, 91 Alter 256 Alternativhypothese 68, 70 ANOVA siehe einfache Varianzanalyse, zweifache Varianzanalyse Anpassung 178 Anpassungstest siehe Chi-Quadrat-Anpassungstest
Einführung in die Statistik
Einführung in die Statistik Analyse und Modellierung von Daten Von Prof. Dr. Rainer Schlittgen 4., überarbeitete und erweiterte Auflage Fachbereich Materialwissenschaft! der Techn. Hochschule Darmstadt
Statistik II. IV. Hypothesentests. Martin Huber
Statistik II IV. Hypothesentests Martin Huber 1 / 41 Übersicht Struktur eines Hypothesentests Stichprobenverteilung t-test: Einzelner-Parameter-Test F-Test: Multiple lineare Restriktionen 2 / 41 Struktur
Deskriptive Statistik
Helge Toutenburg Christian Heumann Deskriptive Statistik Eine Einführung in Methoden und Anwendungen mit R und SPSS Siebte, aktualisierte und erweiterte Auflage Mit Beiträgen von Michael Schomaker 4ü Springer
Software oder Tabellen (nicht Thema dieser Veranstaltung).
p-wert p-wert Der p-wert ist die Wahrscheinlichkeit, dass die Testgröße den beobachteten Wert oder einen noch extremeren Wert (,,weiter weg von H 0 ) annimmt unter der Bedingung, dass H 0 wahr ist. Bemerkungen
Statistische Tests zu ausgewählten Problemen
Einführung in die statistische Testtheorie Statistische Tests zu ausgewählten Problemen Teil 4: Nichtparametrische Tests Statistische Testtheorie IV Einführung Beschränkung auf nichtparametrische Testverfahren
Wiederholung. Statistik I. Sommersemester 2009
Statistik I Sommersemester 2009 Statistik I (1/21) Daten/graphische Darstellungen Lage- und Streuungsmaße Zusammenhangsmaße Lineare Regression Wahrscheinlichkeitsrechnung Zentraler Grenzwertsatz Konfidenzintervalle
Franz Kronthaler. Statistik angewandt. Datenanalyse ist (k)eine Kunst. mit dem R Commander. A Springer Spektrum
Franz Kronthaler Statistik angewandt Datenanalyse ist (k)eine Kunst mit dem R Commander A Springer Spektrum Inhaltsverzeichnis Teil I Basiswissen und Werkzeuge, um Statistik anzuwenden 1 Statistik ist
Hypothesentests für Erwartungswert und Median. Statistik (Biol./Pharm./HST) FS 2015
Hypothesentests für Erwartungswert und Median Statistik (Biol./Pharm./HST) FS 2015 Normalverteilung X N μ, σ 2 X ist normalverteilt mit Erwartungswert μ und Varianz σ 2 pdf: pdf cdf:??? cdf 1 Zentraler
Dr. Maike M. Burda. Welchen Einfluss hat die Körperhöhe auf das Körpergewicht? Eine Regressionsanalyse. HU Berlin, Econ Bootcamp
Dr. Maike M. Burda Welchen Einfluss hat die Körperhöhe auf das Körpergewicht? Eine Regressionsanalyse. HU Berlin, Econ Bootcamp 8.-10. Januar 2010 BOOTDATA.GDT: 250 Beobachtungen für die Variablen... cm:
Glossar und Formelsammlung. Hazard Rate. Hazard Ratio =
Glossar und Formelsammlung Hazard Rate Die Hazard Rate steht für das Risiko, genau zum Zeitpunkt t ein Ereignis bei Überlebenszeitanalysen den Tod zu erleiden. Es handelt sich demnach um eine vom Zeitpunkt
Statistik II. IV. Hypothesentests. Martin Huber
Statistik II IV. Hypothesentests Martin Huber 1 / 22 Übersicht Weitere Hypothesentests in der Statistik 1-Stichproben-Mittelwert-Tests 1-Stichproben-Varianz-Tests 2-Stichproben-Tests Kolmogorov-Smirnov-Test
Statistik und Wahrscheinlichkeitsrechnung
Statistik und Wahrscheinlichkeitsrechnung 3. Vorlesung Dr. Jochen Köhler 1 Inhalte der heutigen Vorlesung Ziel: Daten Modellbildung Probabilistisches Modell Wahrscheinlichkeit von Ereignissen Im ersten
Werkzeuge der empirischen Forschung
Werkzeuge der empirischen Forschung I. Daten und Beschreibende Statistik 1. Einführung 2. Dateneingabe, Datentransformation, Datenbehandlung 3. Beschreibende Statistik II. Schließende Statistik 1 III.
Statistische Methoden in den Umweltwissenschaften
Statistische Methoden in den Umweltwissenschaften Stetige und diskrete Wahrscheinlichkeitsverteilungen Lageparameter Streuungsparameter Diskrete und stetige Zufallsvariablen Eine Variable (oder Merkmal
Statistik II: Grundlagen und Definitionen der Statistik
Medien Institut : Grundlagen und Definitionen der Statistik Dr. Andreas Vlašić Medien Institut (0621) 52 67 44 vlasic@medien-institut.de Gliederung 1. Hintergrund: Entstehung der Statistik 2. Grundlagen
Die mit * gekennzeichneten Abschnitte beinhalten Themen, die über die Anforderungen des Gegenstandskatalogs hinausgehen.
Die mit * gekennzeichneten Abschnitte beinhalten Themen, die über die Anforderungen des Gegenstandskatalogs hinausgehen. 1 Einleitung...1 1.1 Die Bedeutung der Statistik für die Medizin...1 1.2 Die medizinische
Diagnose und Prognose: Kurzfassung 4
Diagnose und Prognose: Kurzfassung 4 Ziele der 4. Vorlesung Inhaltliche Verbindung zwischen inhaltlicher Statistisches Konzept / Problemstellung Problemstellung und statistischem statistische Methode Konzept/Methode
1. Datei Informationen
1. Datei Informationen Datei vorbereiten (Daten, Variablen, Bezeichnungen und Skalentypen) > Datei Dateiinformation anzeigen Arbeitsdatei 2. Häufigkeiten Analysieren Deskriptive Statistik Häufigkeiten
Test auf den Erwartungswert
Test auf den Erwartungswert Wir interessieren uns für den Erwartungswert µ einer metrischen Zufallsgröße. Beispiele: Alter, Einkommen, Körpergröße, Scorewert... Wir können einseitige oder zweiseitige Hypothesen
Institut für Biometrie und klinische Forschung. WiSe 2012/2013
Klinische Forschung WWU Münster Pflichtvorlesung zum Querschnittsfach Epidemiologie, Biometrie und Med. Informatik Praktikum der Medizinischen Biometrie (3) Überblick. Deskriptive Statistik I 2. Deskriptive
Statistische Methoden in den Umweltwissenschaften
Statistische Methoden in den Umweltwissenschaften Post Hoc Tests A priori Tests (Kontraste) Nicht-parametrischer Vergleich von Mittelwerten 50 Ergebnis der ANOVA Sprossdichte der Seegräser 40 30 20 10
Trim Size: 176mm x 240mm Lipow ftoc.tex V1 - March 9, :34 P.M. Page 11. Über die Übersetzerin 9. Einleitung 19
Trim Size: 176mm x 240mm Lipow ftoc.tex V1 - March 9, 2016 6:34 P.M. Page 11 Inhaltsverzeichnis Über die Übersetzerin 9 Einleitung 19 Was Sie hier finden werden 19 Wie dieses Arbeitsbuch aufgebaut ist
5. Seminar Statistik
Sandra Schlick Seite 1 5. Seminar 5. Seminar Statistik 30 Kurztest 4 45 Testen von Hypothesen inkl. Übungen 45 Test- und Prüfverfahren inkl. Übungen 45 Repetitorium und Prüfungsvorbereitung 15 Kursevaluation
Übung 1 im Fach "Biometrie / Q1"
Universität Ulm, Institut für Epidemiologie und Medizinische Biometrie, D-89070 Ulm Institut für Epidemiologie und Medizinische Biometrie Leiter: Prof. Dr. D. Rothenbacher Schwabstr. 13, 89075 Ulm Tel.
SigmaStat Nina Becker, Christoph. Rothenwöhrer. Copyright 2004 Systat Software, Inc.
SigmaStat 3.11 Copyright 2004 Systat Software, Inc. http://www.systat.com Nina Becker, Christoph Rothenwöhrer Die Aufgabe der Statistik ist die Zusammenfassung von Daten, deren Darstellung, Analyse und
Einführung in die Statistik
Einführung in die Statistik Analyse und Modellierung von Daten von Prof. Dr. Rainer Schlittgen Universität Hamburg 12., korrigierte Auflage Oldenbourg Verlag München Inhaltsverzeichnis 1 Statistische Daten
Stichwortverzeichnis. Symbole
Stichwortverzeichnis Symbole 50ste Perzentil 119 A Absichern, Ergebnisse 203 Abzählbar unendliche Zufallsvariable 146 Alternativhypothese 237 238 formulieren 248 Anekdote 340 Annäherung 171, 191 Antwortquote
Einstieg in SPSS. Man kann auch für jede Ausprägung einer Variablen ein Wertelabel vergeben.
Einstieg in SPSS In SPSS kann man für jede Variable ein Label vergeben, damit in einer Ausgabe nicht der Name der Variable (der kryptisch sein kann) erscheint, sondern ein beschreibendes Label. Der Punkt
Hypothesentests mit SPSS
Beispiel für eine einfache Regressionsanalyse (mit Überprüfung der Voraussetzungen) Daten: bedrohfb_v07.sav Hypothese: Die Skalenwerte auf der ATB-Skala (Skala zur Erfassung der Angst vor terroristischen
1 Univariate Statistiken
1 Univariate Statistiken Im ersten Kapitel berechnen wir zunächst Kenngrößen einer einzelnen Stichprobe bzw. so genannte empirische Kenngrößen, wie beispielsweise den Mittelwert. Diese können, unter gewissen
Dr. Maike M. Burda. Welchen Einfluss hat die Körperhöhe auf das Körpergewicht? Eine Regressionsanalyse. HU Berlin, Econ Bootcamp 7.-9.
Dr. Maike M. Burda Welchen Einfluss hat die Körperhöhe auf das Körpergewicht? Eine Regressionsanalyse. HU Berlin, Econ Bootcamp 7.-9. Januar 2011 BOOTDATA11.GDT: 250 Beobachtungen für die Variablen...
Glossar Biometrie / Statistik. Auszug für Fragebogen Fallzahlberechnung/-begründung
Glossar Biometrie / Statistik A Äquivalenztest Der Äquivalenztest beurteilt die Gleichwertigkeit von Therapien. Beim Äquivalenztest werden als Hypothesen formuliert: Nullhypothese H 0 : Die Präparate sind
Forschungsstatistik I
Prof. Dr. G. Meinhardt 6. Stock, Taubertsberg 2 R. 06-206 (Persike) R. 06-214 (Meinhardt) Sprechstunde jederzeit nach Vereinbarung Forschungsstatistik I Dr. Malte Persike persike@uni-mainz.de http://psymet03.sowi.uni-mainz.de/
KLAUSUR IN BIOMATHEMATIK WS 2007/08 MONTAG, DEN 28. JANUAR 2008
KLAUSUR IN BIOMATHEMATIK WS 2007/08 MONTAG, DEN 28. JANUAR 2008 Name: Matrikelnummer: Unterschrift: Aufgabe 1: Welche der folgenden Aussagen ist falsch? A. Der Median ist weniger stark von Ausreißern beeinflusst
Hypothesen: Fehler 1. und 2. Art, Power eines statistischen Tests
ue biostatistik: hypothesen, fehler 1. und. art, power 1/8 h. lettner / physik Hypothesen: Fehler 1. und. Art, Power eines statistischen Tests Die äußerst wichtige Tabelle über die Zusammenhänge zwischen
VII. Inhaltsverzeichnis
VII Inhaltsverzeichnis Vorwort XIII Teil 1 Datentypen 1 Datentypen 3 1.1 Kommt es wirklich darauf an? 3 1.2 Daten auf einer Intervallskala 3 1.3 Daten auf einer Ordinalskala 4 1.4 Daten auf einer Nominalskala
Teil / Ein paar statistische Grundlagen 25. Kapitel 1 Was Statistik ist und Warum sie benötigt Wird 2 7
Inhaltsverzeichnis Einführung 21 Über dieses Buch 21 Törichte Annahmen über den Leser 22 Wie dieses Buch aufgebaut ist 23 Teil I: Ein paar statistische Grundlagen 23 Teil II: Die beschreibende Statistik
Einführung in Quantitative Methoden
Einführung in Quantitative Methoden Pantelis Christodoulides & Karin Waldherr 4. Juni 2014 Christodoulides / Waldherr Einführung in Quantitative Methoden 1/35 Ein- und Zweiseitige Hypothesen H 0 : p =
1 x 1 y 1 2 x 2 y 2 3 x 3 y 3... n x n y n
3.2. Bivariate Verteilungen zwei Variablen X, Y werden gemeinsam betrachtet (an jedem Objekt werden gleichzeitig zwei Merkmale beobachtet) Beobachtungswerte sind Paare von Merkmalsausprägungen (x, y) Beispiele:
Einführung in Quantitative Methoden
Einführung in Quantitative Methoden Karin Waldherr & Pantelis Christodoulides 11. Juni 2014 Waldherr / Christodoulides Einführung in Quantitative Methoden 1/46 Anpassungstests allgemein Gegeben: Häufigkeitsverteilung
UE Angewandte Statistik Termin 4 Gruppenvergleichstests
UE Angewandte Statistik Termin 4 Gruppenvergleichstests Martina Koller Institut für Pflegewissenschaft SoSe 2015 INHALT 1 Allgemeiner Überblick... 1 2 Normalverteilung... 2 2.1 Explorative Datenanalyse...
Epidemiologie / Biometrie
Wintersemester 2004 / 2005 Epidemiologie / Biometrie Robert Hochstrat 14. März 2005 Zusammenschrift der Übung zur Vorlesung aus dem WS 04/05 Rückfragen, Ergänzungen und Korrekturen an robert hochstrat@web.de
GRUNDPRINZIPIEN statistischen Testens
Fragestellungen beim Testen GRUNDPRINZIPIEN statistischen Testens. Vergleiche Unterscheidet sich die Stichprobenbeobachtung von einer vorher spezifizierten Erwartung ( Hypothese ) mit ausreichender Sicherheit?
Biostatistische Studienplanung. Dr. Matthias Kohl SIRS-Lab GmbH
Biostatistische Studienplanung Dr. Matthias Kohl SIRS-Lab GmbH Ausgangspunkt Fragestellung(en)/Hypothese(n): Hauptfragestellung: Grund für Durchführung der Studie Nebenfragestellung(en): Welche Fragestellungen
Inhaltsverzeichnis. Teil 1 Basiswissen und Werkzeuge, um Statistik anzuwenden
Inhaltsverzeichnis Teil 1 Basiswissen und Werkzeuge, um Statistik anzuwenden 1 Statistik ist Spaß 3 Warum Statistik? 3 Checkpoints 4 Daten 4 Checkpoints 7 Skalen - lebenslang wichtig bei der Datenanalyse
Inhaltsverzeichnis. Vorwort
V Vorwort XI 1 Zum Gebrauch dieses Buches 1 1.1 Einführung 1 1.2 Der Text in den Kapiteln 1 1.3 Was Sie bei auftretenden Problemen tun sollten 2 1.4 Wichtig zu wissen 3 1.5 Zahlenbeispiele im Text 3 1.6
Lösungen zu Janssen/Laatz, Statistische Datenanalyse mit SPSS 1. LÖSUNG 9A a.
LÖSUNG 9A a. Lösungen zu Janssen/Laatz, Statistische Datenanalyse mit SPSS 1 Das Regressionsmodell soll nur für Büropersonal angewendet werden Management- und Bewachungspersonal (MIND =0) soll nicht einbezogen
4.1. Verteilungsannahmen des Fehlers. 4. Statistik im multiplen Regressionsmodell Verteilungsannahmen des Fehlers
4. Statistik im multiplen Regressionsmodell In diesem Kapitel wird im Abschnitt 4.1 zusätzlich zu den schon bekannten Standardannahmen noch die Annahme von normalverteilten Residuen hinzugefügt. Auf Basis
Bitte am PC mit Windows anmelden!
Einführung in SPSS Plan für heute: Grundlagen/ Vorwissen für SPSS Vergleich der Übungsaufgaben Einführung in SPSS http://weknowmemes.com/generator/uploads/generated/g1374774654830726655.jpg Standardnormalverteilung
3 Grundlagen statistischer Tests (Kap. 8 IS)
3 Grundlagen statistischer Tests (Kap. 8 IS) 3.1 Beispiel zum Hypothesentest Beispiel: Betrachtet wird eine Abfüllanlage für Mineralwasser mit dem Sollgewicht µ 0 = 1000g und bekannter Standardabweichung
Konfidenzintervalle Grundlegendes Prinzip Erwartungswert Bekannte Varianz Unbekannte Varianz Anteilswert Differenzen von Erwartungswert Anteilswert
Konfidenzintervalle Grundlegendes Prinzip Erwartungswert Bekannte Varianz Unbekannte Varianz Anteilswert Differenzen von Erwartungswert Anteilswert Beispiel für Konfidenzintervall Im Prinzip haben wir
4.1. Nullhypothese, Gegenhypothese und Entscheidung
rof. Dr. Roland Füss Statistik II SS 8 4. Testtheorie 4.. Nullhypothese, Gegenhypothese und Entscheidung ypothesen Annahmen über die Verteilung oder über einzelne arameter der Verteilung eines Merkmals
Aufgaben zu Kapitel 8
Aufgaben zu Kapitel 8 Aufgabe 1 a) Berechnen Sie einen U-Test für das in Kapitel 8.1 besprochene Beispiel mit verbundenen n. Die entsprechende Testvariable punkte2 finden Sie im Datensatz Rangdaten.sav.
Statistik II Übung 3: Hypothesentests Aktualisiert am
Statistik II Übung 3: Hypothesentests Aktualisiert am 12.04.2017 Diese Übung beschäftigt sich mit der Anwendung diverser Hypothesentests (zum Beispiel zum Vergleich der Mittelwerte und Verteilungen zweier
Häufigkeitsauszählungen, zentrale statistische Kennwerte und Mittelwertvergleiche
Lehrveranstaltung Empirische Forschung und Politikberatung der Universität Bonn, WS 2007/2008 Häufigkeitsauszählungen, zentrale statistische Kennwerte und Mittelwertvergleiche 30. November 2007 Michael
Statistik für Naturwissenschaftler
Hans Walser Statistik für Naturwissenschaftler Haupt Verlag Bern Stuttgart Wien Inhaltsverzeichnis Vorwort 13 1 Beschreibende Statistik 15 1.1 Mittelwerte 15 1.1.1 Minimum der Abstände 15 1.1.2 Der Mediän
Die Funktion f wird als Regressionsfunktion bezeichnet.
Regressionsanalyse Mit Hilfe der Techniken der klassischen Regressionsanalyse kann die Abhängigkeit metrischer (intervallskalierter) Zielgrößen von metrischen (intervallskalierten) Einflussgrößen untersucht
3. Deskriptive Statistik
3. Deskriptive Statistik Eindimensionale (univariate) Daten: Pro Objekt wird ein Merkmal durch Messung / Befragung/ Beobachtung erhoben. Resultat ist jeweils ein Wert (Merkmalsausprägung) x i : - Gewicht
Hypothesentests für Erwartungswert und Median. für D-UWIS, D-ERDW, D-USYS und D-HEST SS15
Hypothesentests für Erwartungswert und Median für D-UWIS, D-ERDW, D-USYS und D-HEST SS15 Normalverteilung X N(μ, σ 2 ) : «X ist normalverteilt mit Erwartungswert μ und Varianz σ 2» pdf: f x = 1 2 x μ exp
Lösungen zur Biomathe-Klausur Gruppe A Montag, den 16. Juli 2001
Lösungen zur Biomathe-Klausur Gruppe A Montag, den 16. Juli 2001 1. Sensitivität und Spezifität In einer medizinischen Ambulanz haben 30 % der Patienten eine akute Appendizitis. 80 % dieser Patienten haben
10. Medizinische Statistik
10. Medizinische Statistik Projektplanung Deskriptive Statistik Inferenz-Statistik Literatur: Hüsler, J. und Zimmermann, H.: Statistische Prinzipien für medizinische Projekte, Verlag Hans Huber, 1993.
Übung 3 im Fach "Biometrie / Q1"
Universität Ulm, Institut für Epidemiologie und Medizinische Biometrie, D-89070 Ulm Institut für Epidemiologie und Medizinische Biometrie Leiter: Prof. Dr. D. Rothenbacher Schwabstr. 13, 89075 Ulm Tel.