Basiskurs Statistik und SPSS für Mediziner. Bernhard Haller Alexander Hapfelmeier Armin Ott Birgit Waschulzik

Transkript

1 Institut für Medizinische Statistik und Epidemiologie Basiskurs Statistik und SPSS für Mediziner Bernhard Haller Alexander Hapfelmeier Armin Ott Birgit Waschulzik

2 Inhaltsverzeichnis 1. Grundlagen und Begriffe 3 2. Dateneingabe und aufbereitung Deskriptive Statistik Grafische Darstellung Bearbeitung der Daten in SPSS Prinzip des statistischen Testens Korrelation Regression Analyse von Überlebenszeiten Publikation der Ergebnisse 145 Basis-Kurs Statistik und SPSS für Mediziner 2

3 Grundlagen und -begriffe Basis-Kurs Statistik und SPSS für Mediziner 3

4 Statistische Einheiten / Merkmale / Ausprägungen Merkmalsträger/ Beobachtungseinheit Proband Patient Maus Merkmal Geschlecht Größe Gewicht Blutdruckwerte: Merkmalsausprägung männlich 172 cm 65 kg 124 / 82 mmhg Laborwerte: Kreatinin Glukose 78 μmol/l 4,2 mmol/l Basis-Kurs Statistik und SPSS für Mediziner 4

5 Merkmalstypen Merkmale quantitativ qualitativ stetig metrisch diskret ordinalskaliert nominalskaliert Ergebnis von Wägung oder Messung Ergebnis von Zählung Rangfolge möglich keine Rangfolge möglich Beispiele: BMI, Größe Überlebenszeit Anzahl Operationen Lymphknotenbefall TNM-Klassifik. Schweregrade Geschlecht, Tumorlokal. Richtiges Einordnen von Merkmalstypen ist wichtige Voraussetzung für die adäquate Anwendung statistischer Methoden! Basis-Kurs Statistik und SPSS für Mediziner 5

6 Statistische Einheiten / Merkmale / Ausprägungen Viele Auswertverfahren setzen unabhängige Beobachtungseinheiten voraus Meistens verletzt, wenn mehrere Beobachtungen pro Patient vorliegen Wiederholte Messungen im Zeitverlauf z.b. mehrere Läsionen/Augen/Organe/ eines Patienten Bewertung eines Patienten von mehreren Beurteilern In solchen Fällen müssen adäquate (komplexere) Verfahren angewandt werden Basis-Kurs Statistik und SPSS für Mediziner 6

7 Grundgesamtheit und Stichprobe Grundgesamtheit: Menge aller interessierenden statistischen Einheiten - z.b. alle Patienten mit einer bestimmten Indikation Stichprobe: (Zufällige) Auswahl einer Teilmenge aus dieser Grundgesamtheit Basis-Kurs Statistik und SPSS für Mediziner 7

8 Aufgaben der Statistik Deskriptive (beschreibende) Statistik Explorative (suchende) Statistik Induktive (schließende) Statistik Basis-Kurs Statistik und SPSS für Mediziner 8

9 Deskriptive Statistik Zusammenfassung in spezifische Kenngrößen (Lageparameter bzw. Häufigkeiten) Grafische Aufbereitung Präsentation von umfangreichem Datenmaterial Datenvalidierung (z.b. Identifikation von Falscheingaben) Reine Beschreibung der erhobenen Daten, keine Rückschlüsse über die Objekte der Erhebung hinaus möglich Basis-Kurs Statistik und SPSS für Mediziner 9

10 Explorative Statistik Suche nach Strukturen oder Besonderheiten in den Daten Generierung neuer Fragestellungen und Hypothesen Verwendung bei nicht exakt spezifizierten Fragestellungen Keine Rückschlüsse über die Erhebung hinaus möglich, jedoch häufig deutliche Hinweise bzw. empirische Evidenz Basis-Kurs Statistik und SPSS für Mediziner 10

11 Induktive Statistik Versuch, durch Einbeziehung von Wahrscheinlichkeitstheorie allgemeine Schlussfolgerungen für die Grundgesamtheit zu ziehen Sorgfältige Versuchsplanung nötig Fragestellungen und stochastische Modelle müssen a priori spezifiziert werden Schließen: Stichprobe Grundgesamtheit Schätzen: Plausibelster Parameter für Grundgesamtheit mit Maß bzgl. der Unsicherheit (KI) Testen: Prüfen von zuvor spezifizierten Hypothesen Basis-Kurs Statistik und SPSS für Mediziner 11

12 Dateneingabe und -aufbereitung Basis-Kurs Statistik und SPSS für Mediziner 12

13 Dateneingabe Eingabe einfacher Daten in Standardsoftware (z.b. MS Excel) Vorteile: Akzeptanz, meist Grundkenntnisse vorhanden, einfach zu bedienen, weit verbreitet, kompatibel Nachteile: fehleranfällig, keine Kontrollen, keine feste Struktur Eingabe komplexerer Daten in Datenbanksysteme (z.b. MS Access, spezielle Software), evtl. mit Eingabemaske Vorteile: geringere Fehlerquote, logische Abfragen möglich, Nachteile: komplex (evtl. Administrator und/oder Programmierer benötigt)! Strenge Anforderungen an Dateneingabe bei Studien nach AMG oder MPG Basis-Kurs Statistik und SPSS für Mediziner 13

14 Dateneingabe in Excel Feste Struktur zum Einlesen in Statistiksoftware (SPSS) erforderlich! Jede Beobachtungseinheit (Patient) eine Zeile Jedes erhobene Merkmal eine Spalte Zellenformat Standard immer beibehalten! Datum: (TT.MM.JJJJ) Quantitative Merkmale: nur die Zahlen eingeben (nicht: NA, <0.1, 74 kg, ) Nominale/ordinale Merkmale: Ausprägungen numerisch kodieren Fehlende Zellen frei lassen oder eindeutig kodieren (z.b. 9999) ID Therapiegruppe Alter Geschlecht OP-Datum Therapieerfolg Basis-Kurs Statistik und SPSS für Mediziner 14

15 SPSS - Datenansicht Zeigt Daten an Neue Daten können eingegeben werden Korrekt formatierte Datensätze können eingelesen werden (Excel,.txt, ) Basis-Kurs Statistik und SPSS für Mediziner 15

16 SPSS - Variablenansicht Eigenschaften der erhobenen Variablen können geändert werden: Variablenname Ausgegebener Name (Variablenlabel) Gruppennamen (Wertelabels) Messniveaus Definition fehlender Werte Basis-Kurs Statistik und SPSS für Mediziner 16

17 SPSS - Ausgabe Ergebnisse durchgeführter Operationen werden im Ausgabefenster angezeigt (Tabellen, Grafiken, ) Diese können bearbeitet & exportiert werden (z.b. als PDF, Excel-Datei, ) Basis-Kurs Statistik und SPSS für Mediziner 17

18 SPSS - Menüleiste Sämtliche Operationen werden über die Menüleiste gestartet. Wichtigste Punkte: Datei: Öffnen und Speichern von Daten Daten: Umstrukturieren des aktuellen Datensatzes, Auswahl relevanter Beobachtungen, Sortieren Transformieren: Berechnen neuer Variablen, Umkodieren bestehender Variablen Analysieren: Sämtliche Verfahren zur Analyse der Daten, deskriptive Statistiken, statistische Testverfahren, Regressionsmodelle, Diagramme: verschiedene Untermenüs zur Erstellung von Grafiken Basis-Kurs Statistik und SPSS für Mediziner 18

19 Deskriptive Statistik Basis-Kurs Statistik und SPSS für Mediziner 19

20 Quantitative Merkmale: Maßzahlen Lokalisationsmaße -> Lage: Arithmetisches Mittel Median Quantile Modus Dispersionsmaße -> Streuung: Spannweite Varianz Standardabweichung Variationskoeffizient Basis-Kurs Statistik und SPSS für Mediziner 20

21 Lokalisation (Lage): Mittelwert, Median Seien x 1,x 2,,x n die Merkmalsausprägungen eines Merkmals X von n Patienten Mittelwert: x 1 n n i 1 x i Median (teilt die Daten in zwei gleich große Hälften): geordnete Werte x (1),, x (n) : x (1) < x (2) < < x (n) ungerade Anzahl von Beobachtungen Median: = xn+1= x gerade Anzahl von Beobachtungen Median: = 1 2 (x n 2 + xn 2 +1) = x 0.5 Basis-Kurs Statistik und SPSS für Mediziner 21

22 Streuung: Spannweite, Quantile, Interquartilsabstand Minimum Spannweite Maximum x 0.25 x 0.75 x (1) x (2) x (3) x (n) X 25% IQR 75% 25% Spannweite = x max x min (range) Interquartilsabstand = x 0.75 x 0.25 (inter quartile range (IQR)) Basis-Kurs Statistik und SPSS für Mediziner 22

23 Streuung: Varianz, Standardabweichung In den Daten beobachtete Streuung: Varianz: S 2 n 1 2 n 1 i ( x i 1 x ) Standardabweichung: S S 2 Variationskoeffizient: V c S x Mittelwert und Standardabweichung implizieren symmetrische Verteilung Bei schiefer Verteilung Median und IQR oder Minimum / Maximum angeben Basis-Kurs Statistik und SPSS für Mediziner 23

24 Schätzung von Maßzahlen Symmetrische Verteilung: Analysieren Deskriptive Statistiken Deskriptive Statistik Optionen gewünschte Maßzahlen auswählen Alle Verteilungen: Analysieren Deskriptive Statistiken Häufigkeiten Statistiken gewünschte Maßzahlen auswählen Sehr flexibel: Analysieren Tabellen Benutzerdefinierte Tabellen Basis-Kurs Statistik und SPSS für Mediziner 24

25 Grafische Darstellung Beschreibung eines Merkmals Basis-Kurs Statistik und SPSS für Mediziner 25

26 Quantitative Merkmale (eindimensional) Grafik Diagrammerstellung Galerie Histogramm Boxplot Histogramm: Boxplot: Maximum* 75. Perzentil 50. Perz. (Median) 25. Perzentil Minimum* *Ausreißer und Extremwerte werden gesondert gekennzeichnet Basis-Kurs Statistik und SPSS für Mediziner 26

27 Qualitative Merkmale (eindimensional) Grafik Diagrammerstellung Galerie Balken Kreis/Polar Darstellung absoluter Anzahlen oder relativer Häufigkeiten (%) ordinales oder nominales Skalenniveau nur nominales Skalenniveau Basis-Kurs Statistik und SPSS für Mediziner 27

28 Eindimensionale Darstellung - Zusammenfassung quantitativ qualitativ Merkmalstyp - ordinalskaliert (mit Rangfolge) graphisch Histogramm Fehlerbalken (symm. Vtlg) Boxplot Säulendiagramm x s Maßzahlen (symm Vtlg.) Median (x min, x max / IQR) absolute bzw. relative Häufigkeiten - nominalskaliert (ohne Rangfolge) Kreisdiagramm Säulendiagramm absolute bzw. relative Häufigkeiten Basis-Kurs Statistik und SPSS für Mediziner 28

29 Grafische Darstellung Zusammenhang zweier Merkmale Basis-Kurs Statistik und SPSS für Mediziner 29

30 Zusammenhang zwischen zwei Merkmalen Folgende Kombinationen sind möglich: qualitativ qualitativ Geschlecht Therapie (A,B) Therapie Therapieerfolg qualitativ quantitativ Geschlecht Cholesterinspiegel Therapie Blutdruckänderung quantitativ quantitativ Alter Blutdruck Dosis Änderung Blutwert Basis-Kurs Statistik und SPSS für Mediziner 30

31 Qualitativ - qualitativ Analysieren Deskriptive Statistiken Kreuztabellen Zellen Prozentwerte Spaltenweise Grafik Diagrammerstellung Galerie Balken Beispiel: Diabetes und Therapie Tabelle und Säulendiagramm mit relativen Häufigkeiten (%). Die absoluten Häufigkeiten sind aufgrund der unterschiedlichen Fallzahlen in den Gruppen nicht vergleichbar! Basis-Kurs Statistik und SPSS für Mediziner 31

32 Qualitativ - quantitativ Analysieren Tabellen Benutzerdefinierte Tabellen Vergleich zweier Medikamente hinsichtlich Änderung des systolischen Blutdrucks innerhalb eines Jahres bei Patienten mit Bluthochdruck: Wenn sich der Median deutlich vom Mittelwert unterscheidet, deutet dies auf eine schiefe Verteilung hin (u.a. keine Normalverteilung). Basis-Kurs Statistik und SPSS für Mediziner 32

33 Qualitativ - quantitativ Grafik Diagrammerstellung Galerie Streu- /Punktdiagramm ungeeignet, da viele Punkte überdeckt werden gut geeignet, vor allem bei wenigen Beobachtungen Werte werden aber zum Teil gerundet Grafik Diagrammerstellung Galerie Streu-/Punktdiagramm Punktdiagramm Basis-Kurs Statistik und SPSS für Mediziner 33

34 Qualitativ - quantitativ Grafik Diagrammerstellung Galerie Boxplot Boxplot: gut geeignet, etabliert, schwierig bei sehr kleinen Fallzahlen Fehlerbalken (MW ± 2 Stdabw.): nur bei symmetrischen Verteilungen geeignet Grafik alte Dialogfelder Fehlerbalken Basis-Kurs Statistik und SPSS für Mediziner 34

35 Quantitativ quantitativ Beispiel: Blutdruck zu Beginn der Studie und Alter Grafik Diagrammerstellung Galerie Streu-/Punktdiagramm Basis-Kurs Statistik und SPSS für Mediziner 35

36 Verbundene Stichproben bei quantitativen Merkmalen Beispiel: Untersuchung der Wirkung eines Medikaments, z.b. eines Blutdrucksenkers. Einer Reihe von Personen wird der Blutdruck vor und nach der Medikamenteneinnahme gemessen. Medikamenteneinnahme Wert vorher Wert nachher Basis-Kurs Statistik und SPSS für Mediziner 36

37 Verbundene Stichproben bei quantitativen Merkmalen Darstellung der Messwerte des Blutdrucks vor Therapiebeginn und nach einem Jahr Darstellung der Differenzen Basis-Kurs Statistik und SPSS für Mediziner 37

38 Bearbeitung der Daten in SPSS Basis-Kurs Statistik und SPSS für Mediziner 38

39 Daten sortieren Durch einen Rechtsklick auf die Variable (hier ID) kann die Sortierreihenfolge ausgewählt werden. Basis-Kurs Statistik und SPSS für Mediziner 39

40 Neue Variablen berechnen Basis-Kurs Statistik und SPSS für Mediziner 40

41 Variablen umcodieren Beispiel: Alter in Altersklassen einteilen Basis-Kurs Statistik und SPSS für Mediziner 41

42 Datensatz nach Gruppen aufteilen Separate Auswertung für einzelne Gruppen (z.b. Geschlecht). Basis-Kurs Statistik und SPSS für Mediziner 42

43 Datensatz nach Gruppen aufteilen II Verschiedene Ausgaben möglich: Gruppen vergleichen Ausgabe nach Gruppen aufteilen Basis-Kurs Statistik und SPSS für Mediziner 43

44 Zeitdauer berechnen Differenz zwischen zwei Datumsvariablen berechnen Transformieren Assistent für Datum und Uhrzeit Basis-Kurs Statistik und SPSS für Mediziner 44

45 Zeitdauer berechnen II Basis-Kurs Statistik und SPSS für Mediziner 45

46 Zwei Datensätze zusammenfügen Neue Variablen aus einem anderen Datensatz zum bestehenden hinzufügen. ACHTUNG: Beide Datensätze müssen aufsteigend bzgl. der Schlüsselvariablen sortiert sein. Basis-Kurs Statistik und SPSS für Mediziner 46

47 Zwei Datensätze zusammenfügen II Beobachtungen werden hier anhand der Patienten-ID zugeordnet. Basis-Kurs Statistik und SPSS für Mediziner 47

48 Zwei Datensätze zusammenfügen - Ausgabe Datensatz enthält nun auch die Variable ernaehrung. Basis-Kurs Statistik und SPSS für Mediziner 48

49 Doppelte Fälle ermitteln Überprüfen, ob Beobachtungen bezüglich bestimmter Variablen identische Werte aufweisen um damit doppelte Beobachtungen auszuschließen. Basis-Kurs Statistik und SPSS für Mediziner 49

50 Doppelte Fälle ermitteln - Ausgabe Variable PrimaryFirst indiziert erste ( 1 ) und weitere ( 0 ) Beobachtung bzgl. der ausgewählten Variablen (hier ID). Basis-Kurs Statistik und SPSS für Mediziner 50

51 Fälle ausschließen Auswahl bestimmter Beobachtungen für die Auswertung. Beispiel: Auswahl der ersten Beobachtungen (PrimaryFirst=1) und somit Ausschluss der doppelten Beobachtungen (PrimaryFirst=0). Basis-Kurs Statistik und SPSS für Mediziner 51

52 Fälle ausschließen - Ausgabe Aus der Analyse ausgeschlossene Beobachtungen werden durchgestrichen dargestellt. Diese werden für die weiteren Auswertungen ignoriert. Basis-Kurs Statistik und SPSS für Mediziner 52

53 Variable als Datum definieren Als Variablentyp statt Numerisch, Datum und gewünschtes Format auswählen. Basis-Kurs Statistik und SPSS für Mediziner 53

54 Datumsvariable erstellen Aus drei separaten Variablen tag_0, monat_0, jahr_0 eine Datumsvariable erstellen Transformieren Assistent für Datum und Uhrzeit Basis-Kurs Statistik und SPSS für Mediziner 54

55 Datumsvariable erstellen II Basis-Kurs Statistik und SPSS für Mediziner 55

56 Maßzahlen im Überblick Maßzahlen Arithmetisches Mittel metrisch Skalenniveau (mindestens erforderlich) Eigenschaft - ausreißerempfindlich - Vorsicht bei schiefen Verteilungen! Median, Quantile ordinal - robust gegenüber Ausreißern Modus (Ausprägung mit den meisten Beobachtungen) nominal - wenig Aussagekraft - absolut unempfindlich gegenüber Ausreißern - Interpretationsprobleme bei mehrgipfligen Verteilungen Varianz, Standardabweichung metrisch - geeignet für symmetrische Verteilungen - Maß der Streuung um den Mittelwert Variationskoeffizient Verhältnisskala - unabhängig von Einheiten Quartilsabstand ordinal - einfache Berechnung - robust gegenüber Ausreißern Spannweite metrisch - um Messintervall festzulegen Standardfehler metrisch - Standardfehler des Mittelwerts Basis-Kurs Statistik und SPSS für Mediziner 56

57 Prinzip des statistischen Testens Basis-Kurs Statistik und SPSS für Mediziner 57

58 Testentscheidungen Entscheidung bzgl. der Stichprobe H 0 beibehalten H 0 verwerfen Situation in der Grundgesamtheit H 0 trifft zu Richtige Entscheidung Fehler 1. Art H 1 trifft zu Fehler 2. Art Richtige Entscheidung Es kann nie nachgewiesen werden, dass die Nullhypothese zutrifft! Alternativer Ansatz: Äquivalenztests Die Forschungshypothese muss stets als Alternativhypothese (H 1 ) formuliert werden. Basis-Kurs Statistik und SPSS für Mediziner 58

59 Entscheidungsregel p-wert: Ist die Wahrscheinlichkeit bei Gültigkeit der Nullhypothese, den beobachteten oder einen in Richtung der Alternative extremeren Unterschied/Effekt zu erhalten. Signifikanzniveau α: Zuvor spezifiziertes Level, das vom p-wert unterschritten werden muss um die Nullhypothese abzulehnen. Wann sollte nun die Nullhypothese abgelehnt werden? p < α H 0 ablehnen Ist es unwahrscheinlich, den beobachteten oder einen stärkeren Effekt unter H 0 zu erhalten, wird H 0 zugunsten von H 1 verworfen. Der p-wert gibt (umgangssprachlich) die Wahrscheinlichkeit (probability) an, dass der in einer Stichprobe beobachtete Unterschied rein zufällig (d.h. wenn kein Unterschied in der Grundgesamtheit vorliegt) aufgetreten sein könnte. Basis-Kurs Statistik und SPSS für Mediziner 59

60 Der Fehler 1. Art (α-fehler) Die Nullhypothese wird abgelehnt, obwohl sie eigentlich gültig ist. Kein Gruppenunterschied in der Grundgesamtheit Falscher Schluss aufgrund unglücklicher Stichprobe Meistens: α = 5% oder α = 1% Bei α = 5% tritt dies per Definition bei 5% aller Tests auf, bei denen es keinen Unterschied in der Grundgesamtheit gibt. Basis-Kurs Statistik und SPSS für Mediziner 60

61 Der Fehler 2. Art (β-fehler) Die Nullhypothese wird nicht verworfen, obwohl sie nicht zutrifft. Tatsächlich Gruppenunterschied in der Grundgesamtheit vorhanden Unterschied ist anhand der Stichprobe nicht nachweisbar Die Wahrscheinlichkeit für den Fehler 2. Art wird durch einen statistischen Test nicht kontrolliert (abhängig z.b. von Fallzahl) Fallzahlplanung / Power Wkt. des Eintretens hängt ab vom wahren Effekt in der GG, der Fallzahl, Basis-Kurs Statistik und SPSS für Mediziner 61

62 Power Die Power eines Tests gibt die Wahrscheinlichkeit an, einen in der Grundgesamtheit vorhandenen Unterschied in einer zufälligen Stichprobe (der Größe n) statistisch nachzuweisen. Je größer die Fallzahl desto höher die Power! Die Power kann demnach nur durch das Studiendesign (Anzahl der Patienten) beeinflusst werden! Power = 1 Fehler 2. Art Der Fehler 2. Art ist die Wahrscheinlichkeit, einen in der Grundgesamtheit tatsächlich vorhandenen Unterschied mit der vorliegenden Stichprobe nicht nachzuweisen (H 0 wird beibehalten obwohl H 1 wahr ist). Basis-Kurs Statistik und SPSS für Mediziner 62

63 Statistische Tests Ein statistischer Test ist lediglich eine Entscheidungshilfe, jedoch nie ein Nach- oder Beweis. Ein signifikantes Testergebnis bedeutet: wahrscheinlich nicht durch Zufall zu erklären. p > α bedeutet nicht, dass H 0 zutrifft, sondern lediglich, dass in den Daten keine ausreichende Evidenz gegen H 0 gefunden wurde. Absence of evidence is not evidence of absence (Altman & Bland, 1995) Es sollte stets die klinische Relevanz der Ergebnisse beurteilt werden. Auch statistisch signifikante Ergebnisse können klinisch irrelevant sein. Vor allem bei geringer Fallzahl können nicht signifikante Ergebnisse klinisch relevant sein. Diese sollten entsprechend beschrieben und diskutiert werden. Basis-Kurs Statistik und SPSS für Mediziner 63

64 Statistische Tests Nur Ergebnisse bzgl. a priori spezifizierter Hypothesen können sinnvoll interpretiert werden Erläuterung im Teil Studienplanung und interpretation (2. Kurstag) Nur wenn ein geeigneter Hypothesentest gewählt wurde, erhält man ein unverzerrtes Testergebnis sorgfältige Wahl des statistischen Test (Fragestellung, Annahmen, Voraussetzungen, ) Die statistischen Standardtests gehen von unabhängigen Beobachtungen aus: Unverbundene Tests: Jedes Individuum (Patient) geht nur mit einer Beobachtung in den Test ein Verbundene Tests: Jedes Individuum geht mit einem Paar an Beobachtungen in den Test ein Bei wiederholten Messungen / korrelierten Daten werden spezielle Verfahren benötigt (z.b. GEE-Modelle, gemischte Modelle). Basis-Kurs Statistik und SPSS für Mediziner 64

65 Einseitig vs. zweiseitig zweiseitig: H 0 : Parameter 1 = Parameter 2 H 1 : Parameter 1 Parameter 2 Ich interessiere mich dafür, ob überhaupt ein Unterschied vorliegt. Das Signifikanzniveau, z.b. 5%, wird auf beide möglichen Ausgänge Parameter 1 < Parameter 2 oder Parameter 1 > Parameter 2 aufgeteilt (jeweils 2,5%). einseitig: H 0 : Parameter 1 Parameter 2 H 1 : Parameter 1 > Parameter 2 Oder H 0 : Parameter 1 Parameter 2 H 1 : Parameter 1 < Parameter 2 Es kann das Signifikanzniveau in einer vorab festgelegten Richtung ausgeschöpft werden. Basis-Kurs Statistik und SPSS für Mediziner 65

66 Einseitige vs. zweiseitige Tests Der klassische Test ist immer zweiseitig. Um einseitig testen zu können, muss man im Vorfeld klar begründen, wieso ein Effekt in die andere Richtung ausgeschlossen werden kann. Bland JM, Altman DG (BMJ, 1994): Two sided tests should be used unless there is a very good reason for doing otherwise. One sided tests should never be used simply as a device to make a conventionally non-significant difference significant. Basis-Kurs Statistik und SPSS für Mediziner 66

67 Verbunden - unverbunden verbunden (abhängige Stichproben): Untersuchungen am selben Kollektiv (oft: vorher nachher Situationen) Änderung des Blutdrucks durch Einnahme von Medikamenten Änderung eines Schmerzscores durch OP Vergleich Intima Dicke linke und rechte Seite Oft nicht ausreichend, um z.b. einen Therapieeffekt zu beurteilen (keine Kontrolle) unverbunden (unabhängige Stichproben): Vergleiche von unterschiedlichen Kollektiven (Gruppenvergleiche) Vergleich von Rauchern und Nicht-Rauchern Vergleich von Männern und Frauen Vergleich von unterschiedlichen Therapien A, B und C Basis-Kurs Statistik und SPSS für Mediziner 67

68 Parametrisch nicht-parametrisch Parametrische Tests Es wird vorausgesetzt, dass die Daten einer speziellen Verteilung folgen (oft Normalverteilungsannahme)! Bsp: t-test, ANOVA (Varianzanalyse), Pearson Korrelationskoeffizient Nicht parametrische Tests (verteilungsfrei) kommen weitestgehend ohne Annahmen aus, es wird häufig mit Rangzahlen, statt den gemessenen Werten gerechnet (mindestens ordinales Skalenniveau erforderlich). Aber: geringere Power als parametrische Verfahren (mehr Patienten notwendig) Bsp: Mann-Whitney-U Test, Wilcoxon-Test, Spearman Korrelationskoeffizient Basis-Kurs Statistik und SPSS für Mediziner 68

69 Asymptotisch - exakt Asymptotische Tests: Testergebnisse (p-werte) besitzen nur Gültigkeit wenn asymptotische Annahmen (z.b. Verteilungsannahmen) hinreichend erfüllt sind: gegeben bei großen Stichprobenzahlen (n>30). Geringe Abweichungen von notwendigen Verteilungsannahmen können durch Erhöhung der Fallzahl kompensiert werden. Bsp: Chi 2 -Test, z-test Exakte Tests: Auch bei sehr kleinen Stichprobenumfängen gültig, bei denen Verteilungsannahmen nicht verifiziert werden können. Nachteil: rechenintensiv und geringere Power Bsp: Exakter Test nach Fisher, Permutationstests Basis-Kurs Statistik und SPSS für Mediziner 69

70 Übersicht über die wichtigsten Tests Merkmale quantitativ qualitativ Normalverteilung beliebige Verteilung Unverbunden (2 unabhängige Gruppen) 2 -Test, exakter Test nach Fisher (=Fisher-Test) t-test für unverbundene Stichproben Mann-Whitney U Test / Wilcoxon-Rangsummentest Unverbunden (3+ unabhängige Gruppen) 2 -Test Fisher-(Freeman-Halton-)Test Einfache Varianzanalyse Kruskal-Wallis-Test Verbunden (2 Messungen pro Indiv.) Vorzeichen-Test, McNemar-Test t-test für verbundene Stichproben Vorzeichen-Test, Wilcoxon-Vorzeichen-Rang-Test Verbunden (3+ Messungen pro Indiv.) Cochrans Q-Test Armitage Trend-Test Varianzanalyse für Messwiederholungen Friedman-Test Basis-Kurs Statistik und SPSS für Mediziner 70

71 Chi-Quadrat-Test, exakter Test nach Fisher Basis-Kurs Statistik und SPSS für Mediziner 71

72 Chi-Quadrat-Test Beispiel: Besteht zwischen zwei Medikamenten ein Unterschied bzgl. der 1-Jahres-Mortalität? (α=0,05) beobachtet ASPAC Heparin gesamt gestorben 9 (5,6%) 19 (12,6%) 28 (9,0%) nicht gestorben gesamt Idee: Die Häufigkeit von Todesfällen beträgt insgesamt 28/313 = 9%. Hätten beide Medikamente das gleiche Mortalitätsrisiko, wäre die erwartete Sterberate in beiden Gruppen ebenfalls gleich 9%. Basis-Kurs Statistik und SPSS für Mediziner 72

73 Chi-Quadrat-Test Vergleich erwarteter mit beobachteten Häufigkeiten: beobachtet erwartet (unter H 0 ) ASPAC Heparin gesamt gestorben 9 9%*162 = 14,5 19 9%*151 = 13,5 28 (9%) nicht gestorben ,5 = 147, ,5 = 137,5 285 gesamt Je stärker die beobachteten Werte von den erwarteten Werten abweichen, desto mehr spricht das für die Alternativhypothese. Basis-Kurs Statistik und SPSS für Mediziner 73

74 Chi-Quadrat-Test Indikation: Prüfung auf Assoziation zweier Merkmale Vergleich der Häufigkeitsverteilung kategorialer Merkmale bei unabhängigen Gruppen Voraussetzungen: Mindestens 80% der Zellen haben eine erwartete Häufigkeit 5 Kategoriale Variablen Beim Vergleich von mehr als zwei Gruppen lautet die Alternativhypothese: Mindestens eine Gruppe unterscheidet sich von mindestens einer anderen in ihrer Häufigkeitsverteilung. Basis-Kurs Statistik und SPSS für Mediziner 74

75 Exakter Test nach Fisher Falls Voraussetzung für Chi-Quadrat-Test nicht erfüllt? Exakter Test nach Fisher auch bei schwach besetzten Zellen gültig keine Verteilungsannahme (Permutationstest) sehr rechenintensiv (bei heutiger Rechenleistung im Regelfall nicht relevant) Basis-Kurs Statistik und SPSS für Mediziner 75

76 Exakter Test von Fisher - SPSS Chi-Quadrat-Test: Analysieren Deskriptive Statistiken Kreuztabellen Statistiken Chi-Quadrat auswählen Exakter Test von Fisher: zusätzlich Exakt Exakt auswählen Chi-Quadrat Fisher Basis-Kurs Statistik und SPSS für Mediziner 76

77 Test auf Normalverteilung (?) Basis-Kurs Statistik und SPSS für Mediziner 77

78 Kolmogorov-Smirnov-Test Analysieren Deskriptive Statistiken Explorative Datenanalyse Diagramme Normalverteilungsdiagramm mit Tests ankreuzen Es sei zu testen, ob der Hämoglobingehalt im Blut bei Frauen nicht normalverteilt ist. Die Stichprobenwerte von 10 Frauen ergaben: [g/dl] Nullhypothese: Die Daten folgen einer Normalverteilung. Interpretation: Man kann nicht nachweisen, dass die Verteilung von Hämoglobin von der Normalverteilung überzufällig abweicht. Basis-Kurs Statistik und SPSS für Mediziner 78

79 Kolmogorov-Smirnov-Test Dilemma: Geringe Power bei kleinen Fallzahlen (n<50) Abweichungen von der NV-Annahme können evtl. nicht nachgewiesen werden (p>0,05). Große Fallzahlen: Bereits bei geringen Abweichungen ergeben sich signifikante Unterschiede von der NV. Häufig gilt jedoch für asymptotische Testeigenschaften: Für n>30 geringe bis mäßige Abweichungen von der NV-Annahme nicht relevant Daher (insbesondere bei kleinen Stichproben): grafische Verfahren verwenden (z.b. Histogramm) Deskriptive Faustregeln beachten (bei NV gilt): Mittelwert Median Symmetrische Abweichung von Minimum und Maximum um den Mittelwert Symmetrische Abweichung der Quartile um den Mittelwert Basis-Kurs Statistik und SPSS für Mediziner 79

80 t-test Basis-Kurs Statistik und SPSS für Mediziner 80

81 t-test für unverbundene Stichproben Voraussetzung: - Die Daten in beiden Gruppen sind normalverteilt - Die beiden Gruppen sind unabhängig (z.b. verschiedene Patienten) Es existieren Varianten für gleiche (klassischer t-test) und ungleiche (Welch-Test) Varianzen in den beiden Gruppen. Hypothesen: H 0 : µ 1 = µ 2 die Mittelwerte in beiden Gruppen sind gleich H 1 : µ 1 µ 2 die Mittelwerte sind unterschiedlich Benötigt: Fallzahl in den beiden Gruppen (n 1, n 2 ) Mittelwerte in den beiden Gruppen ( x, y ) Standardabweichung oder Varianz in den beiden Gruppen (s 1, s 2 bzw. s 12, s 22 ) Basis-Kurs Statistik und SPSS für Mediziner 81

82 t-test für unverbundene Stichproben - Beispiel Beispiel Hämoglobingehalt bei Männern und Frauen: n Männer 10; x Männer 13,0; s Männer 0,90 n Frauen 10; x Frauen 12,5; s Frauen 0,55 Formulierung der Hypothesen: H 0 : Die Mittelwerte in beiden Gruppen sind gleich: µ M = µ F H 1 : Die Mittelwerte in beiden Gruppen unterscheiden sich: µ M µ F Festlegung der Irrtumswahrscheinlichkeit (für den Fehler 1. Art): α= 5% Basis-Kurs Statistik und SPSS für Mediziner 82

83 t-test für unverbundene Stichproben - SPSS Analysieren Mittelwerte vergleichen T-Test bei unabhängigen Stichproben Deskriptive Statistiken: t-test: Teststatistik (t): Differenz der Mittelwerte / Standardfehler der Differenz (Levene s Test - Test auf Gleichheit der Varianzen: p<0,05 zweite Zeile) Sig. (2-tailed): p-wert 95%-Konfidenzintervall für Differenz der Mittelwerte (0 nicht enthalten p<0,05) Basis-Kurs Statistik und SPSS für Mediziner 83

84 t-test für verbundene Stichproben Voraussetzungen Normalverteilung der Differenz der Paare Zu jedem Individuum existieren zwei Messungen (x und y) Hypothesen: H 0 : = 0 H 1 : 0 wobei Δ = x-y d.h. es wird getestet, ob eine signifikante Änderung der Werte beobachtet werden kann. Um die Wirksamkeit von Therapien zu überprüfen, ist immer eine Kontrollgruppe nötig, da auch andere Effekte (z.b. Zeit) eine Änderung der Werte hervorrufen können. Basis-Kurs Statistik und SPSS für Mediziner 84

85 t-test für verbundene Stichproben Beispiel Messwerte von Materialeigenschaften eines Implantats im Rohzustand (x) und nach Oberflächenbehandlung (y): i x i y i i =x i -y i 1 4,0 3,0 1,0 2 3,5 3,0 0,5 3 4,1 3,8 0,3 4 5,5 2,1 3,4 5 4,6 4,9-0,3 6 6,0 5,3 0,7 7 5,1 3,1 2,0 8 4,3 2,7 1,6 MW ( ) 4,6 3,5 1,15 s 1,16 Basis-Kurs Statistik und SPSS für Mediziner 85

86 t-test für verbundene Stichproben SPSS Analysieren Mittelwerte vergleichen T-Test bei verbundenen Stichproben Deskriptive Analysen t-test für verbundene Stichproben 95%-Konfidenzintervall für den Mittelwert der Differenz p-wert Basis-Kurs Statistik und SPSS für Mediziner 86

87 Verbundene vs. unverbundene Stichproben Vorteil verbundener Stichproben: Genauigkeitsgewinn durch Abschätzung der intra-individuellen Streuung Voraussetzungen schwächer: Normalverteilung für Differenz (häufig erfüllt) Nachteil verbundener Stichproben: Änderungen innerhalb der Gruppe durch viele Einflüsse möglich Fehlende Werte bei einer Messung führen zum Ausschluss der Beobachtungseinheit Carry-over Effekte möglich Basis-Kurs Statistik und SPSS für Mediziner 87

88 Erweiterungen des t-tests Mehr als zwei Gruppen (unverbunden) ANOVA (Varianzanalyse), einfaktoriell Mehr als zwei wiederholte Messungen (z.b. Zeitpunkte) ANOVA für Messwiederholungen Adjustierter t-test ANCOVA (Kovarianzanalyse, entspricht linearer Regression) Quantitative Einflussgröße Regressionsmodell Simultaner Einfluss mehrere Einflussgrößen Regressionsmodell Basis-Kurs Statistik und SPSS für Mediziner 88

89 Nichtparametrische Tests Basis-Kurs Statistik und SPSS für Mediziner 89

90 Nichtparametrische Tests Nichtparametrisch = verteilungsfrei KEINE Normalverteilungsannahme Es werden keine Originaldaten verwendet, sondern deren Ränge Quantitative UND ordinale Merkmalstypen Geringere Effizienz im Vergleich zu parametrischen Verfahren Keine interpretierbaren Effektschätzer und Konfidenzintervalle Basis-Kurs Statistik und SPSS für Mediziner 90

91 Überblick verteilungsfreie Verfahren verbundene Stichproben unverbundene Stichproben 2 Stichproben > 2 Stichproben 2 Stichproben > 2 Stichproben Vorzeichen-Test Wilcoxon-Test (Rang-Vorzeichen-Test) Friedman-Test Mann-Whitney-U Test / Wilcoxon-Test (Rangsummen-Test) Kruskal-Wallis-Test Basis-Kurs Statistik und SPSS für Mediziner 91

92 Mann-Whitney-U-Test / Wilcoxon-Rangsummentest Zwei unverbundene Stichproben Basierend auf Rängen Bei Vorliegen einer Normalverteilung: der t-test hat bei gegebener Fallzahl eine (etwas) größere Power als der Mann-Whitney-U-Test bzw. für den Mann-Whitney-U-Test ist eine größere Fallzahl nötig, um die gleiche Power zu erzielen H 0 : Die Beobachtungen der Gruppe A stammen aus der gleichen Verteilung wie die der Gruppe B (d.h. H 0 : P(X A > X B ) = 50%). Bei gleicher Form der Verteilungsfunktion entspricht dies einem Test auf Gleichheit der Mediane Basis-Kurs Statistik und SPSS für Mediziner 92

93 Mann-Whitney-U-Test Beispiel (Pocock) Treatment: Steroid-Behandlung bei schwangeren Frauen Zielgröße: Thrombozytenzahl bei den Neugeborenen (pro mm³) hier: keine Normalverteilung, keine Symmetrie ja nein Treatm ent m it S teroiden ohne S teroide lfd. N r. Throm bozytenzahl R ang Basis-Kurs Statistik und SPSS für Mediziner 93

94 Mann-Whitney-U-Test SPSS Analysieren Nichtparametrische Tests Alte Dialogfelder Zwei unabhängige Stichproben Bestimmung der Rangsummen Ausgabe des p-wertes p-wert Basis-Kurs Statistik und SPSS für Mediziner 94

95 Vorzeichen-Test (Sign-Test) Zwei verbundene Stichproben (x 1, y 1 ),...,(x n, y n ): gepaarte Stichprobe der Zufallsvariablen X und Y Annahmen Differenzen D i = Y i X i sind unabhängig P(X i = Y i ) = 0 (keine Bindungen) Testproblem: H 0 : P(X<Y) = P(X>Y) = 0.5 (Anteil pos./neg. Änderungen 50%) H 1 : P(X<Y) P(X>Y) (Anteil pos./neg. Änderungen unausgewogen) Basis-Kurs Statistik und SPSS für Mediziner 95

96 Vorzeichen-Test - Beispiel Gewicht vor Diät Nach Diät Delta Ti T=5 Delta: Differenz(nach-vor) T: 1, wenn Delta>0 0, wenn Delta<0 Basis-Kurs Statistik und SPSS für Mediziner 96

97 Vorzeichen-Test - SPSS Analysieren Nichtparametrische Tests Alte Dialogfelder Zwei verbundene Stichproben Vorzeichen Deskriptive Analysen: Koerpergewicht nach Diaet - Koerpergewicht vor Diaet Häufigkeiten Negative Differenzen Positive Differenzen Bindungen c b a N Gesamt 14 a. b. c. Koerpergewicht nach Diaet < Koerpergewicht vor D iaet Koerpergewicht nach Diaet > Koerpergewicht vor D iaet Koerpergewicht nach Diaet = Koerpergewicht vor D iaet Ausgabe des p-wertes: Exakte Signifikanz (2-seitig) Exakte Signifikanz (1-seitig) Punkt-Wahrscheinlichkeit Statistik für Test b Koerpe rgewi cht nach Diaet - Koerpe rgewi cht vor Diaet a,581,291,157 a. b. Verwende tete Binomia lve rteilung. Vorzeichentest Basis-Kurs Statistik und SPSS für Mediziner 97

98 Wilcoxon-Rang-Vorzeichen-Test (signed-rank test) Zwei verbundene Stichproben (gepaarte Beobachtungen) Zusätzliche Annahme: Verteilung der Differenzen ist stetig und symmetrisch um den Median Δ med. Paare mit Bindungen (x i =y i ) werden im Test ignoriert Testproblem: H 0 : Δ med = 0 H 1 : Δ med 0 Falls Annahmen für die entsprechenden Tests erfüllt: t-test für verbundene Stichproben ist effizienter als Wilcoxon-Rang-Vorzeichen- Test Wilcoxon-Rang-Vorzeichen-Test ist effizienter als einfacher Vorzeichentest Basis-Kurs Statistik und SPSS für Mediziner 98

99 Wilcoxon-Rang-Vorzeichen-Test - - Beispiel Gewicht vor Diät Nach Diät Delta Delta R( D ) 12 5, ,5 8 1,5 5,5 13 T Ti R( D ) 7 3 1,5 5,5 13 W + =30 Delta: Differenz Delta : Betrag der Differenz R( D ): Rang von Delta T: 1, wenn Delta>0 0, wenn Delta<0 Ti R( D ): Nur Ränge für T=1 werden gezählt W + : Summe dieser Ränge Basis-Kurs Statistik und SPSS für Mediziner 99

100 Wilcoxon-Rang-Vorzeichen-Test - - SPSS Analysieren Nichtparametrische Tests Alte Dialogfelder Zwei verbundene Stichproben Wilcoxon Deskriptive Statistiken Ausgabe der Teststatistik und des p-wertes Basis-Kurs Statistik und SPSS für Mediziner 100

101 Korrelation Basis-Kurs Statistik und SPSS für Mediziner 101

102 Korrelation Korrelationen werden berechnet, um die Stärke eines linearen (monotonen) Zusammenhangs zwischen zwei stetigen (ordinalen) Merkmalen X und Y zu erfassen. Beispiele: Es soll untersucht werden, 1. ob ein Zusammenhang zwischen Körpergröße und Gewicht besteht, 2. ob sich der Blutdruck/BMI mit dem Alter ändert, 3. ob mit einer höheren Tumorexpression auch ein schlechterer klinischer Score einhergeht. Basis-Kurs Statistik und SPSS für Mediziner 102

103 Korrelation - Beispiel Beispiel: Körperfettanteil, Größe, Gewicht und Hüftumfang wurden an 252 Männern erhoben. Ziel der Studie ist es, den Anteil von Körperfett durch einfach zu erhebende Surrogate möglichst genau abzuschätzen. Basis-Kurs Statistik und SPSS für Mediziner 103

104 Korrelation - Beispiel Grafik Diagrammerstellung Streu-/Punktdiagramm Basis-Kurs Statistik und SPSS für Mediziner 104

105 Pearson Korrelationskoeffizient r Voraussetzung: 2 normalverteilte (stetige) Variablen Vorsicht bei Ausreißern! r nach Spearman als robustes Maß Eigenschaften: Wertebereich: 1 bis +1 (symmetrisches Maß) Invariant gegenüber linearen Transformationen (z.b. egal ob Gewicht in Gramm oder Kilogramm) Interpretation: Misst die Stärke des linearen Zusammenhangs r = -1, r = 1: perfekter linearer Zusammenhang r 0: kein linearer Zusammenhang r > 0 (r < 0): gleichsinniger (gegensinniger) Zusammenhang Basis-Kurs Statistik und SPSS für Mediziner 105

106 Pearson Korrelationskoeffizient - Beispiel Analysieren Korrelation Bivariat Basis-Kurs Statistik und SPSS für Mediziner 106

107 Korrelation Anmerkungen Achtung! r=0,8 Viele verschiedene Zusammenhänge können den gleichen Korrelationskoeffizienten ergeben, aber trotzdem nicht den Trend der Punktwolke widerspiegeln. Problem: Es liegt kein linearer oder monotoner Zusammenhang vor. Ausreißer beeinflussen das Ergebnis. Die Daten sind nicht normalverteilt. Lösung: Korrelationskoeffizient nach Spearman Flexible Modellierung (Regression) Basis-Kurs Statistik und SPSS für Mediziner 107

108 Korrelationskoeffizient nach Spearman Voraussetzung: mind. ordinalskalierte Merkmale Eigenschaften: Basiert auf Rängen Robust gegenüber Ausreißern Interpretation: Maß für monotonen Zusammenhang Berechnung, Interpretation und Auswertung äquivalent zu Pearson Korrelationskoeffizient. Analysieren Korrelation Bivariat Spearman Basis-Kurs Statistik und SPSS für Mediziner 108

109 Stärke des Zusammenhangs Ausmaß des Korrelationskoeffizienten: 0.00 bis 0.19 kein / sehr schwacher 0.20 bis 0.39 schwacher Wenn r 0.40 bis 0.69 moderater Zusammenhang 0.70 bis 0.89 starker 0.90 bis 1.00 sehr starker Signifikanz des Korrelationskoeffizienten: Beurteilung zum Signifikanzniveau α (meist α = 0,05) Warnung: Tests dürfen in explorativen Studien nur als hypothesengenerierend verstanden werden. Für konfirmatorische Aussagen ist eine Korrektur für multiples Testen erforderlich. Basis-Kurs Statistik und SPSS für Mediziner 109

110 Korrelation Anmerkungen Korrelationskoeffizienten sind nicht anwendbar für nominale Variablen, auch wenn diese als Zahlen kodiert sind Korrelation Kausalität Bei komplexen Zusammenhängen folgt aus r = 0 nicht immer Unabhängigkeit der Variablen (z.b. U-förmiger Zusammenhang). Der Begriff Korrelation wird in der Statistik nicht allgemein für alle Arten von Assoziationstests verwendet. Wichtig: Betrag des Koeffizienten und p-wert sind gemeinsam zu interpretieren, denn: Bei großem n sind auch kleine r signifikant von 0 verschieden. Bei kleinem n können auch große r nicht signifikant sein. Basis-Kurs Statistik und SPSS für Mediziner 110

111 Regression Basis-Kurs Statistik und SPSS für Mediziner 111

112 Einfache lineare Regression ^ Die Geradengleichung y = a + bx stellt dabei die Regressionsgleichung dar. b quantifiziert den Zusammenhang zwischen Y und X. = Abweichung/Residuum: Die Parameter a und b werden so bestimmt, dass die Summe der quadrierten Abweichungen minimal wird Kleinste Quadrate Schätzer. b y ^ = vorhergesagter Y Wert a = Konstante/Intercept (Schnittpunkt der Regressionsgeraden mit y-achse bzw. y-wert der Regressionsgeraden bei x=0) b = Anstieg/Slope (Zu-/Abnahme von Y, wenn X um eine Einheit ansteigt) a 1 Basis-Kurs Statistik und SPSS für Mediziner 112

113 Einfache lineare Regression Beispiel Annahme: Körperfett steht in einer linearen Beziehung zum Brustumfang. Allgemeine Form der Geradengleichung: Geschätzter Körperfettanteil = a + b Brustumfang Basis-Kurs Statistik und SPSS für Mediziner 113

114 Einfache lineare Regression SPSS Grafik: Grafik Diagrammerstellung Streu-/Punktdiagramm Regressionsgreade: Doppelklick auf Grafik Elemente Anpassungslinie bei Gesamtsumme Basis-Kurs Statistik und SPSS für Mediziner 114

115 Einfache lineare Regression SPSS Analysieren Regression Linear Konstante (= a) Zielgröße Y Steigung (= b) Die Nullhypothese H 0 : b = 0, d.h. kein Zusammenhang, kann auf dem 5%-Signifikanzniveau abgelehnt werden. Geschätzter Körperfettanteil = -51, ,697 Brustumfang Basis-Kurs Statistik und SPSS für Mediziner 115

116 Einfache lineare Regression Beispiel Die aus den Daten geschätzte Regressionsgleichung kann benutzt werden, um Körperfett bei Männern abzuschätzen. z. B. für einen Mann mit 100 cm Brustumfang ergibt sich Geschätzter Körperfettanteil = -51, , [cm] = 0,185 = 18,5% Basis-Kurs Statistik und SPSS für Mediziner 116

117 Multiple lineare Regression In einer multiplen Regression lassen sich die Effekte mehrerer Variablen simultan bestimmen. Allgemeine Form der Geraden, um Körperfett aus mehreren Einflussgrößen zu bestimmen: Körperfett = b 0 + b 1 Brustumfang + b 2 Übergewicht + b 3 Adipositas Berechnung der Regressionskoeffizienten auf Basis der Daten ergibt: Körperfett = -31, ,480 Brustumfang + 3,864 Übergewicht + 6,290 Adipositas Basis-Kurs Statistik und SPSS für Mediziner 117

118 Multiple lineare Regression Interpretation Körperfett = -31, ,480 Brustumfang + 3,864 Übergewicht + 6,290 Adipositas Eine (theoretische) Person mit Brustumfang von 0 cm und BMI im Normalbereich hätte einen erwarteten Körperfettanteil von -31,45% Ein normalgewichtiger Mann mit einem Brustumfang von 100 cm hat einen erwarteten/vorhergesagten Körperfettanteil von -31, , = 8,55% Im Vergleich dazu hat ein adipöser Mann mit gleichem Brustumfang einen vorhergesagten Körperfettanteil von -31, , ,290 = 14,84% Basis-Kurs Statistik und SPSS für Mediziner 118

119 Gütemaß Wie gut beschreibt die Regressionsgerade die Daten? Wie genau kann die abhängige Größe durch das Modell vorhergesagt werden? Bestimmtheitsmaß (R 2 ) Interpretation: R² gibt an, wie viel Prozent der Streuung der abhängigen Variablen Y durch die Regressionsgerade erklärt werden kann. Es entspricht in der einfachen linearen Regression mit einer stetigen Einflussgröße dem quadrierten Pearson Korrelationskoeffizienten. Wertebereich: 0 bis 1 Basis-Kurs Statistik und SPSS für Mediziner 119

120 Gütemaß SPSS Modell I: Einflussgröße nur Brustumfang R 2 = 0,494 Modell II: Einflussgrößen Brustumfang, Übergewicht, Adipositas R 2 = 0,519 Basis-Kurs Statistik und SPSS für Mediziner 120

121 Lineare Regression: Annahmen Voraussetzungen für die Durchführung einer linearen Regression: Die Residuen müssen normalverteilt sein (nicht die Zielgröße) ( Histogramm der Residuen) Analysieren Regression linear Diagramme unter Diagramme der standardisierten Residuen Haken setzen bei Histogramm Basis-Kurs Statistik und SPSS für Mediziner 121

122 Analyse von Überlebenszeiten Basis-Kurs Statistik und SPSS für Mediziner 122

123 Typische Beispiele und Problemstellung Überlebenszeit oder 1, 2, 3,... Jahres-Überlebensrate - von Krebspatienten - nach Transplantationen Dauer bis zur Schmerzfreiheit nach Knieoperation Unterscheiden sich 2 oder mehr Gruppen hinsichtlich der Überlebenszeit? Überlebenszeit: Probleme: Zeitspanne T bis zum Eintreten eines bestimmten Ereignisses Ereigniszeiten unvollständig beobachtet Zensierungsproblematik z.b. Nachbeobachtungsperioden unterschiedlich lang, manche Patienten scheiden während der Studie aus Ereignis: Tod, Rezidiv, Remission,... Basis-Kurs Statistik und SPSS für Mediziner 123

124 Beobachtungsmuster Basis-Kurs Statistik und SPSS für Mediziner 124

125 Kaplan-Meier-Schätzer Basis-Kurs Statistik und SPSS für Mediziner 125

126 Kaplan-Meier-Schätzer Überlebenszeiten (in Monaten) von 30 Patienten in einer randomisierten Studie Therapie vs. Placebo: Therapie (n=15) Placebo (n=15) * * 7 90* * * * * 128* 181* * 141* 54 * lebend zum letzten Beobachtungszeitpunkt Lost to follow up (Studienabbruch) Frage: Wie groß ist die Überlebenswahrscheinlichkeit in den beiden Gruppen? Problem: Zensierungen/unterschiedlich lange Beobachtungsdauern Lösung: Kaplan-Meier-Schätzer Basis-Kurs Statistik und SPSS für Mediziner 126

127 Kaplan-Meier-Schätzer Idee: 1. Sortieren der Daten nach Ereigniszeiten. Die Ereignisse geben Beobachtungsintervalle vor. 2. Bestimmung der Personen unter Risiko zu jedem Zeitpunkt: Personen, die bis unmittelbar vor dem Zeitpunkt gelebt haben und Personen, die irgendwann nach diesem Zeitpunkt zensiert wurden. 3. Für jedes Zeitintervall Berechnung der (bedingten) Wahrscheinlichkeit, dass jemand, der bis zu Beginn des Intervalls gelebt hat, bis zum Ende des Intervalls überleben wird. 4. Berechnung der Überlebenswahrscheinlichkeit zu jedem Zeitpunkt als Produkt der bedingten Wahrscheinlichkeiten, jedes Zeitintervall zu überleben. Basis-Kurs Statistik und SPSS für Mediziner 127

128 Kaplan-Meier-Schätzer - Beispiel Berechnung am Beispiel Therapiegruppe Zeitpunkt Patienten unter Risiko Anzahl Ereignisse Wahrscheinlichkeit, Intervall zu überleben /15 14/ /14 14/15 13/ Kumulierte Überlebenswahrscheinlichkeit /12 14/15 13/14 11/ /11 14/15 13/14 11/12 10/11 Basis-Kurs Statistik und SPSS für Mediziner 128

129 Kaplan-Meier-Schätzung - SPSS Analysieren Überleben Kaplan-Meier Basis-Kurs Statistik und SPSS für Mediziner 129

130 Kaplan-Meier-Kurve Beispiel: Medianes Überleben Analysieren Überleben Kaplan-Meier Optionen unter Diagramme Überleben auswählen Basis-Kurs Statistik und SPSS für Mediziner 130

131 Kaplan-Meier-Kurve Beispiel: 10 Jahres Überleben Basis-Kurs Statistik und SPSS für Mediziner 131

132 Log-rank Test Basis-Kurs Statistik und SPSS für Mediziner 132

133 Log-rank Test Statistische Hypothesen: H 0 : kein Unterschied in der Verteilung der Überlebenszeiten zwischen Placebo und Therapiegruppe, d.h. Todesfälle treten in zufälliger Reihenfolge unabhängig von der Gruppenzugehörigkeit auf H 1 : Unterschied in der Verteilung der Überlebenszeiten zwischen Placebo und Therapiegruppe, d.h. Todesfälle treten in einer Gruppe früher als in der anderen Gruppe auf Voraussetzung: Kaplan-Meier-Kurven sollten sich nicht überschneiden Basis-Kurs Statistik und SPSS für Mediziner 133

134 Log-rank Test Idee: 1. Bestimmung der beobachteten Anzahl an Todesfällen in beiden Gruppen (beobachtete Ereignisse zum Ereigniszeitpunkt t j in den beiden Gruppen: d Aj und d Bj ). 2. Berechnung der unter H 0 erwarteten Anzahl von Todesfällen in beiden Gruppen zu den einzelnen Zeitpunkten t j (E(d Aj ), E(d Bj )) 3. Vergleich der beobachteten und erwarteten Anzahlen an Ereignissen einer Gruppe mittels der Log-rank-Teststatistik: U [ d j Aj E ( d Aj )] LR U 2 Var ( U ) Bei hinreichend großer Zahl der Ereignisse ist LR annähernd χ 2 -verteilt. Faustregel: insgesamt mindestens 30 Ereignisse über beide Gruppen Basis-Kurs Statistik und SPSS für Mediziner 134

135 Log-rank Test -- Beispiel Analysieren Überleben Kaplan-Meier Faktor vergleichen unter Teststatistiken Log-Rang auswählen Basis-Kurs Statistik und SPSS für Mediziner 135

136 Log-rank Test Cox-Regression Grenzen des Log-rank-Tests: Reiner Signifikanztest liefert keine Effektgrößen Lediglich Gruppenvergleiche möglich (nur eine binäre bzw. kategoriale Einflussgröße) Cox-Regression erweitert den Log-rank-Test Simultaner Effekt mehrerer Einflussgrößen Metrische Einflussgrößen Adjustierter Gruppenvergleich Hazard Ratio als Effektmaß Basis-Kurs Statistik und SPSS für Mediziner 136

137 Cox-Regression Basis-Kurs Statistik und SPSS für Mediziner 137

138 Cox-Regression - Hazardfunktion Zielgröße in der Cox-Regression: Hazardrate (Risikofunktion) h(t): h( t) lim t 0 P ( t T t t t T t) h(t) beschreibt die infinitesimale Wahrscheinlichkeit für ein Ereignis zum Zeitpunkt t, gegeben das Ereignis ist vor Zeitpunkt t noch nicht eingetreten, d.h. die Wahrscheinlichkeit, wenn ein Patient bis t überlebt hat, dass er unmittelbar zum Zeitpunkt t verstirbt. Basis-Kurs Statistik und SPSS für Mediziner 138

139 Cox-Regression (proportional hazards model) Cox-Modell: h(t) h (t) exp( β X β X β m X m ) Voraussetzung: Proportionale Hazardraten, d.h. Effekte verschiedener Variablen auf das Überleben sind über die Zeit konstant! Basis-Kurs Statistik und SPSS für Mediziner 139

140 Cox-Regression h(t) h (t) exp( β X β X β m X m ) h(t): Hazardrate h 0 (t): unspezifizierter Baseline-Hazard (beschreibt das Risiko, wenn alle Einflussgrößen gleich 0 sind) X 1,,X m : Werte der Einflussgrößen β 1,...,β m : Regressionskoeffizienten Basis-Kurs Statistik und SPSS für Mediziner 140

141 Cox Regression Hazard Ratio Zwei-Gruppen-Fall (0 vs. 1): HR=exp(β) Risikoverhältnis zwischen den beiden Gruppen Gruppenunterschied von primärem Interesse, weitere Einflussgrößen als adjustierende Variablen adjustiertes Risikoverhältnis zwischen den Gruppen Stetige Einflussgröße exp(β) beschreibt die relative Änderung des Risikos bei Änderung der Einflussgröße um eine Einheit z.b. exp(ß) = 1.12 Risikoanstieg von 12% exp(ß) = 0.80 Risikoreduktion um 20% exp(ß) = 1 kein Risikounterschied Basis-Kurs Statistik und SPSS für Mediziner 141

142 Cox-Regression Beispiel Randomisierte Studie mit 158 Patienten (74 mit Standardtherapie, 84 mit neuer Therapie) Weitere Einflussgrößen: Alter Geschlecht (1=männlich, 0=weiblich) Score für Gesundheitszustand (0 bis 100, hohe Werte sprechen für guten Zustand) Endpunkt: Zeit bis zum Tod / bis Zensierung Status (0=zensiert, 1=Ereignis) ID Beobachtete Zeit Status Therapie Geschlecht Alter Score Basis-Kurs Statistik und SPSS für Mediziner 142

143 Cox-Regression - SPSS Analysieren Überleben Cox-Regression (bei Optionen Konfidenzintervall für Exp(B) markieren) Variablen für Überlebenszeit und Status sowie Einflussgrößen definieren Output: B: Regressionskoeffizient Exp(B): geschätztes Risikoverhältnis CI for Exp(B): Konfidenzintervall für das Risikoverhältnis Sig.: p-wert Basis-Kurs Statistik und SPSS für Mediziner 143

144 Cox- Regression - SPSS In den beobachteten Daten führt die neue Therapie zu einer Verringerung des Risikos (B<0 bzw. Exp(B)<1) Risikoverhältnis (=HR) beträgt 0,556 Das Risiko unter der neuen Therapie beträgt das 0,556-fache des Risikos unter der Standardtherapie Verringerung des Risikos ist signifikant (p-wert<0,05 / HR von 1 ist nicht im Konfidenzintervall enthalten) Kein signifikanter Alters- und Geschlechtseffekt Signifikanter Einfluss des Scores. Ein Unterschied von einem Punkt spricht für eine Risikoänderung um den Faktor 0,987 Ein Unterschied von 10 Scorepunkten führt zu einer Risikoreduktion auf das 0,878-fache: exp(10 β) = exp(10 (-0,013)) = 0,878 Basis-Kurs Statistik und SPSS für Mediziner 144