Basiskurs Statistik und SPSS für Mediziner. Bernhard Haller Alexander Hapfelmeier Armin Ott Birgit Waschulzik

Größe: px
Ab Seite anzeigen:

Download "Basiskurs Statistik und SPSS für Mediziner. Bernhard Haller Alexander Hapfelmeier Armin Ott Birgit Waschulzik"

Transkript

1 Institut für Medizinische Statistik und Epidemiologie Basiskurs Statistik und SPSS für Mediziner Bernhard Haller Alexander Hapfelmeier Armin Ott Birgit Waschulzik

2 Inhaltsverzeichnis 1. Grundlagen und Begriffe 3 2. Dateneingabe und aufbereitung Deskriptive Statistik Grafische Darstellung Bearbeitung der Daten in SPSS Prinzip des statistischen Testens Korrelation Regression Analyse von Überlebenszeiten Publikation der Ergebnisse 145 Basis-Kurs Statistik und SPSS für Mediziner 2

3 Grundlagen und -begriffe Basis-Kurs Statistik und SPSS für Mediziner 3

4 Statistische Einheiten / Merkmale / Ausprägungen Merkmalsträger/ Beobachtungseinheit Proband Patient Maus Merkmal Geschlecht Größe Gewicht Blutdruckwerte: Merkmalsausprägung männlich 172 cm 65 kg 124 / 82 mmhg Laborwerte: Kreatinin Glukose 78 μmol/l 4,2 mmol/l Basis-Kurs Statistik und SPSS für Mediziner 4

5 Merkmalstypen Merkmale quantitativ qualitativ stetig metrisch diskret ordinalskaliert nominalskaliert Ergebnis von Wägung oder Messung Ergebnis von Zählung Rangfolge möglich keine Rangfolge möglich Beispiele: BMI, Größe Überlebenszeit Anzahl Operationen Lymphknotenbefall TNM-Klassifik. Schweregrade Geschlecht, Tumorlokal. Richtiges Einordnen von Merkmalstypen ist wichtige Voraussetzung für die adäquate Anwendung statistischer Methoden! Basis-Kurs Statistik und SPSS für Mediziner 5

6 Statistische Einheiten / Merkmale / Ausprägungen Viele Auswertverfahren setzen unabhängige Beobachtungseinheiten voraus Meistens verletzt, wenn mehrere Beobachtungen pro Patient vorliegen Wiederholte Messungen im Zeitverlauf z.b. mehrere Läsionen/Augen/Organe/ eines Patienten Bewertung eines Patienten von mehreren Beurteilern In solchen Fällen müssen adäquate (komplexere) Verfahren angewandt werden Basis-Kurs Statistik und SPSS für Mediziner 6

7 Grundgesamtheit und Stichprobe Grundgesamtheit: Menge aller interessierenden statistischen Einheiten - z.b. alle Patienten mit einer bestimmten Indikation Stichprobe: (Zufällige) Auswahl einer Teilmenge aus dieser Grundgesamtheit Basis-Kurs Statistik und SPSS für Mediziner 7

8 Aufgaben der Statistik Deskriptive (beschreibende) Statistik Explorative (suchende) Statistik Induktive (schließende) Statistik Basis-Kurs Statistik und SPSS für Mediziner 8

9 Deskriptive Statistik Zusammenfassung in spezifische Kenngrößen (Lageparameter bzw. Häufigkeiten) Grafische Aufbereitung Präsentation von umfangreichem Datenmaterial Datenvalidierung (z.b. Identifikation von Falscheingaben) Reine Beschreibung der erhobenen Daten, keine Rückschlüsse über die Objekte der Erhebung hinaus möglich Basis-Kurs Statistik und SPSS für Mediziner 9

10 Explorative Statistik Suche nach Strukturen oder Besonderheiten in den Daten Generierung neuer Fragestellungen und Hypothesen Verwendung bei nicht exakt spezifizierten Fragestellungen Keine Rückschlüsse über die Erhebung hinaus möglich, jedoch häufig deutliche Hinweise bzw. empirische Evidenz Basis-Kurs Statistik und SPSS für Mediziner 10

11 Induktive Statistik Versuch, durch Einbeziehung von Wahrscheinlichkeitstheorie allgemeine Schlussfolgerungen für die Grundgesamtheit zu ziehen Sorgfältige Versuchsplanung nötig Fragestellungen und stochastische Modelle müssen a priori spezifiziert werden Schließen: Stichprobe Grundgesamtheit Schätzen: Plausibelster Parameter für Grundgesamtheit mit Maß bzgl. der Unsicherheit (KI) Testen: Prüfen von zuvor spezifizierten Hypothesen Basis-Kurs Statistik und SPSS für Mediziner 11

12 Dateneingabe und -aufbereitung Basis-Kurs Statistik und SPSS für Mediziner 12

13 Dateneingabe Eingabe einfacher Daten in Standardsoftware (z.b. MS Excel) Vorteile: Akzeptanz, meist Grundkenntnisse vorhanden, einfach zu bedienen, weit verbreitet, kompatibel Nachteile: fehleranfällig, keine Kontrollen, keine feste Struktur Eingabe komplexerer Daten in Datenbanksysteme (z.b. MS Access, spezielle Software), evtl. mit Eingabemaske Vorteile: geringere Fehlerquote, logische Abfragen möglich, Nachteile: komplex (evtl. Administrator und/oder Programmierer benötigt)! Strenge Anforderungen an Dateneingabe bei Studien nach AMG oder MPG Basis-Kurs Statistik und SPSS für Mediziner 13

14 Dateneingabe in Excel Feste Struktur zum Einlesen in Statistiksoftware (SPSS) erforderlich! Jede Beobachtungseinheit (Patient) eine Zeile Jedes erhobene Merkmal eine Spalte Zellenformat Standard immer beibehalten! Datum: (TT.MM.JJJJ) Quantitative Merkmale: nur die Zahlen eingeben (nicht: NA, <0.1, 74 kg, ) Nominale/ordinale Merkmale: Ausprägungen numerisch kodieren Fehlende Zellen frei lassen oder eindeutig kodieren (z.b. 9999) ID Therapiegruppe Alter Geschlecht OP-Datum Therapieerfolg Basis-Kurs Statistik und SPSS für Mediziner 14

15 SPSS - Datenansicht Zeigt Daten an Neue Daten können eingegeben werden Korrekt formatierte Datensätze können eingelesen werden (Excel,.txt, ) Basis-Kurs Statistik und SPSS für Mediziner 15

16 SPSS - Variablenansicht Eigenschaften der erhobenen Variablen können geändert werden: Variablenname Ausgegebener Name (Variablenlabel) Gruppennamen (Wertelabels) Messniveaus Definition fehlender Werte Basis-Kurs Statistik und SPSS für Mediziner 16

17 SPSS - Ausgabe Ergebnisse durchgeführter Operationen werden im Ausgabefenster angezeigt (Tabellen, Grafiken, ) Diese können bearbeitet & exportiert werden (z.b. als PDF, Excel-Datei, ) Basis-Kurs Statistik und SPSS für Mediziner 17

18 SPSS - Menüleiste Sämtliche Operationen werden über die Menüleiste gestartet. Wichtigste Punkte: Datei: Öffnen und Speichern von Daten Daten: Umstrukturieren des aktuellen Datensatzes, Auswahl relevanter Beobachtungen, Sortieren Transformieren: Berechnen neuer Variablen, Umkodieren bestehender Variablen Analysieren: Sämtliche Verfahren zur Analyse der Daten, deskriptive Statistiken, statistische Testverfahren, Regressionsmodelle, Diagramme: verschiedene Untermenüs zur Erstellung von Grafiken Basis-Kurs Statistik und SPSS für Mediziner 18

19 Deskriptive Statistik Basis-Kurs Statistik und SPSS für Mediziner 19

20 Quantitative Merkmale: Maßzahlen Lokalisationsmaße -> Lage: Arithmetisches Mittel Median Quantile Modus Dispersionsmaße -> Streuung: Spannweite Varianz Standardabweichung Variationskoeffizient Basis-Kurs Statistik und SPSS für Mediziner 20

21 Lokalisation (Lage): Mittelwert, Median Seien x 1,x 2,,x n die Merkmalsausprägungen eines Merkmals X von n Patienten Mittelwert: x 1 n n i 1 x i Median (teilt die Daten in zwei gleich große Hälften): geordnete Werte x (1),, x (n) : x (1) < x (2) < < x (n) ungerade Anzahl von Beobachtungen Median: = xn+1= x gerade Anzahl von Beobachtungen Median: = 1 2 (x n 2 + xn 2 +1) = x 0.5 Basis-Kurs Statistik und SPSS für Mediziner 21

22 Streuung: Spannweite, Quantile, Interquartilsabstand Minimum Spannweite Maximum x 0.25 x 0.75 x (1) x (2) x (3) x (n) X 25% IQR 75% 25% Spannweite = x max x min (range) Interquartilsabstand = x 0.75 x 0.25 (inter quartile range (IQR)) Basis-Kurs Statistik und SPSS für Mediziner 22

23 Streuung: Varianz, Standardabweichung In den Daten beobachtete Streuung: Varianz: S 2 n 1 2 n 1 i ( x i 1 x ) Standardabweichung: S S 2 Variationskoeffizient: V c S x Mittelwert und Standardabweichung implizieren symmetrische Verteilung Bei schiefer Verteilung Median und IQR oder Minimum / Maximum angeben Basis-Kurs Statistik und SPSS für Mediziner 23

24 Schätzung von Maßzahlen Symmetrische Verteilung: Analysieren Deskriptive Statistiken Deskriptive Statistik Optionen gewünschte Maßzahlen auswählen Alle Verteilungen: Analysieren Deskriptive Statistiken Häufigkeiten Statistiken gewünschte Maßzahlen auswählen Sehr flexibel: Analysieren Tabellen Benutzerdefinierte Tabellen Basis-Kurs Statistik und SPSS für Mediziner 24

25 Grafische Darstellung Beschreibung eines Merkmals Basis-Kurs Statistik und SPSS für Mediziner 25

26 Quantitative Merkmale (eindimensional) Grafik Diagrammerstellung Galerie Histogramm Boxplot Histogramm: Boxplot: Maximum* 75. Perzentil 50. Perz. (Median) 25. Perzentil Minimum* *Ausreißer und Extremwerte werden gesondert gekennzeichnet Basis-Kurs Statistik und SPSS für Mediziner 26

27 Qualitative Merkmale (eindimensional) Grafik Diagrammerstellung Galerie Balken Kreis/Polar Darstellung absoluter Anzahlen oder relativer Häufigkeiten (%) ordinales oder nominales Skalenniveau nur nominales Skalenniveau Basis-Kurs Statistik und SPSS für Mediziner 27

28 Eindimensionale Darstellung - Zusammenfassung quantitativ qualitativ Merkmalstyp - ordinalskaliert (mit Rangfolge) graphisch Histogramm Fehlerbalken (symm. Vtlg) Boxplot Säulendiagramm x s Maßzahlen (symm Vtlg.) Median (x min, x max / IQR) absolute bzw. relative Häufigkeiten - nominalskaliert (ohne Rangfolge) Kreisdiagramm Säulendiagramm absolute bzw. relative Häufigkeiten Basis-Kurs Statistik und SPSS für Mediziner 28

29 Grafische Darstellung Zusammenhang zweier Merkmale Basis-Kurs Statistik und SPSS für Mediziner 29

30 Zusammenhang zwischen zwei Merkmalen Folgende Kombinationen sind möglich: qualitativ qualitativ Geschlecht Therapie (A,B) Therapie Therapieerfolg qualitativ quantitativ Geschlecht Cholesterinspiegel Therapie Blutdruckänderung quantitativ quantitativ Alter Blutdruck Dosis Änderung Blutwert Basis-Kurs Statistik und SPSS für Mediziner 30

31 Qualitativ - qualitativ Analysieren Deskriptive Statistiken Kreuztabellen Zellen Prozentwerte Spaltenweise Grafik Diagrammerstellung Galerie Balken Beispiel: Diabetes und Therapie Tabelle und Säulendiagramm mit relativen Häufigkeiten (%). Die absoluten Häufigkeiten sind aufgrund der unterschiedlichen Fallzahlen in den Gruppen nicht vergleichbar! Basis-Kurs Statistik und SPSS für Mediziner 31

32 Qualitativ - quantitativ Analysieren Tabellen Benutzerdefinierte Tabellen Vergleich zweier Medikamente hinsichtlich Änderung des systolischen Blutdrucks innerhalb eines Jahres bei Patienten mit Bluthochdruck: Wenn sich der Median deutlich vom Mittelwert unterscheidet, deutet dies auf eine schiefe Verteilung hin (u.a. keine Normalverteilung). Basis-Kurs Statistik und SPSS für Mediziner 32

33 Qualitativ - quantitativ Grafik Diagrammerstellung Galerie Streu- /Punktdiagramm ungeeignet, da viele Punkte überdeckt werden gut geeignet, vor allem bei wenigen Beobachtungen Werte werden aber zum Teil gerundet Grafik Diagrammerstellung Galerie Streu-/Punktdiagramm Punktdiagramm Basis-Kurs Statistik und SPSS für Mediziner 33

34 Qualitativ - quantitativ Grafik Diagrammerstellung Galerie Boxplot Boxplot: gut geeignet, etabliert, schwierig bei sehr kleinen Fallzahlen Fehlerbalken (MW ± 2 Stdabw.): nur bei symmetrischen Verteilungen geeignet Grafik alte Dialogfelder Fehlerbalken Basis-Kurs Statistik und SPSS für Mediziner 34

35 Quantitativ quantitativ Beispiel: Blutdruck zu Beginn der Studie und Alter Grafik Diagrammerstellung Galerie Streu-/Punktdiagramm Basis-Kurs Statistik und SPSS für Mediziner 35

36 Verbundene Stichproben bei quantitativen Merkmalen Beispiel: Untersuchung der Wirkung eines Medikaments, z.b. eines Blutdrucksenkers. Einer Reihe von Personen wird der Blutdruck vor und nach der Medikamenteneinnahme gemessen. Medikamenteneinnahme Wert vorher Wert nachher Basis-Kurs Statistik und SPSS für Mediziner 36

37 Verbundene Stichproben bei quantitativen Merkmalen Darstellung der Messwerte des Blutdrucks vor Therapiebeginn und nach einem Jahr Darstellung der Differenzen Basis-Kurs Statistik und SPSS für Mediziner 37

38 Bearbeitung der Daten in SPSS Basis-Kurs Statistik und SPSS für Mediziner 38

39 Daten sortieren Durch einen Rechtsklick auf die Variable (hier ID) kann die Sortierreihenfolge ausgewählt werden. Basis-Kurs Statistik und SPSS für Mediziner 39

40 Neue Variablen berechnen Basis-Kurs Statistik und SPSS für Mediziner 40

41 Variablen umcodieren Beispiel: Alter in Altersklassen einteilen Basis-Kurs Statistik und SPSS für Mediziner 41

42 Datensatz nach Gruppen aufteilen Separate Auswertung für einzelne Gruppen (z.b. Geschlecht). Basis-Kurs Statistik und SPSS für Mediziner 42

43 Datensatz nach Gruppen aufteilen II Verschiedene Ausgaben möglich: Gruppen vergleichen Ausgabe nach Gruppen aufteilen Basis-Kurs Statistik und SPSS für Mediziner 43

44 Zeitdauer berechnen Differenz zwischen zwei Datumsvariablen berechnen Transformieren Assistent für Datum und Uhrzeit Basis-Kurs Statistik und SPSS für Mediziner 44

45 Zeitdauer berechnen II Basis-Kurs Statistik und SPSS für Mediziner 45

46 Zwei Datensätze zusammenfügen Neue Variablen aus einem anderen Datensatz zum bestehenden hinzufügen. ACHTUNG: Beide Datensätze müssen aufsteigend bzgl. der Schlüsselvariablen sortiert sein. Basis-Kurs Statistik und SPSS für Mediziner 46

47 Zwei Datensätze zusammenfügen II Beobachtungen werden hier anhand der Patienten-ID zugeordnet. Basis-Kurs Statistik und SPSS für Mediziner 47

48 Zwei Datensätze zusammenfügen - Ausgabe Datensatz enthält nun auch die Variable ernaehrung. Basis-Kurs Statistik und SPSS für Mediziner 48

49 Doppelte Fälle ermitteln Überprüfen, ob Beobachtungen bezüglich bestimmter Variablen identische Werte aufweisen um damit doppelte Beobachtungen auszuschließen. Basis-Kurs Statistik und SPSS für Mediziner 49

50 Doppelte Fälle ermitteln - Ausgabe Variable PrimaryFirst indiziert erste ( 1 ) und weitere ( 0 ) Beobachtung bzgl. der ausgewählten Variablen (hier ID). Basis-Kurs Statistik und SPSS für Mediziner 50

51 Fälle ausschließen Auswahl bestimmter Beobachtungen für die Auswertung. Beispiel: Auswahl der ersten Beobachtungen (PrimaryFirst=1) und somit Ausschluss der doppelten Beobachtungen (PrimaryFirst=0). Basis-Kurs Statistik und SPSS für Mediziner 51

52 Fälle ausschließen - Ausgabe Aus der Analyse ausgeschlossene Beobachtungen werden durchgestrichen dargestellt. Diese werden für die weiteren Auswertungen ignoriert. Basis-Kurs Statistik und SPSS für Mediziner 52

53 Variable als Datum definieren Als Variablentyp statt Numerisch, Datum und gewünschtes Format auswählen. Basis-Kurs Statistik und SPSS für Mediziner 53

54 Datumsvariable erstellen Aus drei separaten Variablen tag_0, monat_0, jahr_0 eine Datumsvariable erstellen Transformieren Assistent für Datum und Uhrzeit Basis-Kurs Statistik und SPSS für Mediziner 54

55 Datumsvariable erstellen II Basis-Kurs Statistik und SPSS für Mediziner 55

56 Maßzahlen im Überblick Maßzahlen Arithmetisches Mittel metrisch Skalenniveau (mindestens erforderlich) Eigenschaft - ausreißerempfindlich - Vorsicht bei schiefen Verteilungen! Median, Quantile ordinal - robust gegenüber Ausreißern Modus (Ausprägung mit den meisten Beobachtungen) nominal - wenig Aussagekraft - absolut unempfindlich gegenüber Ausreißern - Interpretationsprobleme bei mehrgipfligen Verteilungen Varianz, Standardabweichung metrisch - geeignet für symmetrische Verteilungen - Maß der Streuung um den Mittelwert Variationskoeffizient Verhältnisskala - unabhängig von Einheiten Quartilsabstand ordinal - einfache Berechnung - robust gegenüber Ausreißern Spannweite metrisch - um Messintervall festzulegen Standardfehler metrisch - Standardfehler des Mittelwerts Basis-Kurs Statistik und SPSS für Mediziner 56

57 Prinzip des statistischen Testens Basis-Kurs Statistik und SPSS für Mediziner 57

58 Testentscheidungen Entscheidung bzgl. der Stichprobe H 0 beibehalten H 0 verwerfen Situation in der Grundgesamtheit H 0 trifft zu Richtige Entscheidung Fehler 1. Art H 1 trifft zu Fehler 2. Art Richtige Entscheidung Es kann nie nachgewiesen werden, dass die Nullhypothese zutrifft! Alternativer Ansatz: Äquivalenztests Die Forschungshypothese muss stets als Alternativhypothese (H 1 ) formuliert werden. Basis-Kurs Statistik und SPSS für Mediziner 58

59 Entscheidungsregel p-wert: Ist die Wahrscheinlichkeit bei Gültigkeit der Nullhypothese, den beobachteten oder einen in Richtung der Alternative extremeren Unterschied/Effekt zu erhalten. Signifikanzniveau α: Zuvor spezifiziertes Level, das vom p-wert unterschritten werden muss um die Nullhypothese abzulehnen. Wann sollte nun die Nullhypothese abgelehnt werden? p < α H 0 ablehnen Ist es unwahrscheinlich, den beobachteten oder einen stärkeren Effekt unter H 0 zu erhalten, wird H 0 zugunsten von H 1 verworfen. Der p-wert gibt (umgangssprachlich) die Wahrscheinlichkeit (probability) an, dass der in einer Stichprobe beobachtete Unterschied rein zufällig (d.h. wenn kein Unterschied in der Grundgesamtheit vorliegt) aufgetreten sein könnte. Basis-Kurs Statistik und SPSS für Mediziner 59

60 Der Fehler 1. Art (α-fehler) Die Nullhypothese wird abgelehnt, obwohl sie eigentlich gültig ist. Kein Gruppenunterschied in der Grundgesamtheit Falscher Schluss aufgrund unglücklicher Stichprobe Meistens: α = 5% oder α = 1% Bei α = 5% tritt dies per Definition bei 5% aller Tests auf, bei denen es keinen Unterschied in der Grundgesamtheit gibt. Basis-Kurs Statistik und SPSS für Mediziner 60

61 Der Fehler 2. Art (β-fehler) Die Nullhypothese wird nicht verworfen, obwohl sie nicht zutrifft. Tatsächlich Gruppenunterschied in der Grundgesamtheit vorhanden Unterschied ist anhand der Stichprobe nicht nachweisbar Die Wahrscheinlichkeit für den Fehler 2. Art wird durch einen statistischen Test nicht kontrolliert (abhängig z.b. von Fallzahl) Fallzahlplanung / Power Wkt. des Eintretens hängt ab vom wahren Effekt in der GG, der Fallzahl, Basis-Kurs Statistik und SPSS für Mediziner 61

62 Power Die Power eines Tests gibt die Wahrscheinlichkeit an, einen in der Grundgesamtheit vorhandenen Unterschied in einer zufälligen Stichprobe (der Größe n) statistisch nachzuweisen. Je größer die Fallzahl desto höher die Power! Die Power kann demnach nur durch das Studiendesign (Anzahl der Patienten) beeinflusst werden! Power = 1 Fehler 2. Art Der Fehler 2. Art ist die Wahrscheinlichkeit, einen in der Grundgesamtheit tatsächlich vorhandenen Unterschied mit der vorliegenden Stichprobe nicht nachzuweisen (H 0 wird beibehalten obwohl H 1 wahr ist). Basis-Kurs Statistik und SPSS für Mediziner 62

63 Statistische Tests Ein statistischer Test ist lediglich eine Entscheidungshilfe, jedoch nie ein Nach- oder Beweis. Ein signifikantes Testergebnis bedeutet: wahrscheinlich nicht durch Zufall zu erklären. p > α bedeutet nicht, dass H 0 zutrifft, sondern lediglich, dass in den Daten keine ausreichende Evidenz gegen H 0 gefunden wurde. Absence of evidence is not evidence of absence (Altman & Bland, 1995) Es sollte stets die klinische Relevanz der Ergebnisse beurteilt werden. Auch statistisch signifikante Ergebnisse können klinisch irrelevant sein. Vor allem bei geringer Fallzahl können nicht signifikante Ergebnisse klinisch relevant sein. Diese sollten entsprechend beschrieben und diskutiert werden. Basis-Kurs Statistik und SPSS für Mediziner 63

64 Statistische Tests Nur Ergebnisse bzgl. a priori spezifizierter Hypothesen können sinnvoll interpretiert werden Erläuterung im Teil Studienplanung und interpretation (2. Kurstag) Nur wenn ein geeigneter Hypothesentest gewählt wurde, erhält man ein unverzerrtes Testergebnis sorgfältige Wahl des statistischen Test (Fragestellung, Annahmen, Voraussetzungen, ) Die statistischen Standardtests gehen von unabhängigen Beobachtungen aus: Unverbundene Tests: Jedes Individuum (Patient) geht nur mit einer Beobachtung in den Test ein Verbundene Tests: Jedes Individuum geht mit einem Paar an Beobachtungen in den Test ein Bei wiederholten Messungen / korrelierten Daten werden spezielle Verfahren benötigt (z.b. GEE-Modelle, gemischte Modelle). Basis-Kurs Statistik und SPSS für Mediziner 64

65 Einseitig vs. zweiseitig zweiseitig: H 0 : Parameter 1 = Parameter 2 H 1 : Parameter 1 Parameter 2 Ich interessiere mich dafür, ob überhaupt ein Unterschied vorliegt. Das Signifikanzniveau, z.b. 5%, wird auf beide möglichen Ausgänge Parameter 1 < Parameter 2 oder Parameter 1 > Parameter 2 aufgeteilt (jeweils 2,5%). einseitig: H 0 : Parameter 1 Parameter 2 H 1 : Parameter 1 > Parameter 2 Oder H 0 : Parameter 1 Parameter 2 H 1 : Parameter 1 < Parameter 2 Es kann das Signifikanzniveau in einer vorab festgelegten Richtung ausgeschöpft werden. Basis-Kurs Statistik und SPSS für Mediziner 65

66 Einseitige vs. zweiseitige Tests Der klassische Test ist immer zweiseitig. Um einseitig testen zu können, muss man im Vorfeld klar begründen, wieso ein Effekt in die andere Richtung ausgeschlossen werden kann. Bland JM, Altman DG (BMJ, 1994): Two sided tests should be used unless there is a very good reason for doing otherwise. One sided tests should never be used simply as a device to make a conventionally non-significant difference significant. Basis-Kurs Statistik und SPSS für Mediziner 66

67 Verbunden - unverbunden verbunden (abhängige Stichproben): Untersuchungen am selben Kollektiv (oft: vorher nachher Situationen) Änderung des Blutdrucks durch Einnahme von Medikamenten Änderung eines Schmerzscores durch OP Vergleich Intima Dicke linke und rechte Seite Oft nicht ausreichend, um z.b. einen Therapieeffekt zu beurteilen (keine Kontrolle) unverbunden (unabhängige Stichproben): Vergleiche von unterschiedlichen Kollektiven (Gruppenvergleiche) Vergleich von Rauchern und Nicht-Rauchern Vergleich von Männern und Frauen Vergleich von unterschiedlichen Therapien A, B und C Basis-Kurs Statistik und SPSS für Mediziner 67

68 Parametrisch nicht-parametrisch Parametrische Tests Es wird vorausgesetzt, dass die Daten einer speziellen Verteilung folgen (oft Normalverteilungsannahme)! Bsp: t-test, ANOVA (Varianzanalyse), Pearson Korrelationskoeffizient Nicht parametrische Tests (verteilungsfrei) kommen weitestgehend ohne Annahmen aus, es wird häufig mit Rangzahlen, statt den gemessenen Werten gerechnet (mindestens ordinales Skalenniveau erforderlich). Aber: geringere Power als parametrische Verfahren (mehr Patienten notwendig) Bsp: Mann-Whitney-U Test, Wilcoxon-Test, Spearman Korrelationskoeffizient Basis-Kurs Statistik und SPSS für Mediziner 68

69 Asymptotisch - exakt Asymptotische Tests: Testergebnisse (p-werte) besitzen nur Gültigkeit wenn asymptotische Annahmen (z.b. Verteilungsannahmen) hinreichend erfüllt sind: gegeben bei großen Stichprobenzahlen (n>30). Geringe Abweichungen von notwendigen Verteilungsannahmen können durch Erhöhung der Fallzahl kompensiert werden. Bsp: Chi 2 -Test, z-test Exakte Tests: Auch bei sehr kleinen Stichprobenumfängen gültig, bei denen Verteilungsannahmen nicht verifiziert werden können. Nachteil: rechenintensiv und geringere Power Bsp: Exakter Test nach Fisher, Permutationstests Basis-Kurs Statistik und SPSS für Mediziner 69

70 Übersicht über die wichtigsten Tests Merkmale quantitativ qualitativ Normalverteilung beliebige Verteilung Unverbunden (2 unabhängige Gruppen) 2 -Test, exakter Test nach Fisher (=Fisher-Test) t-test für unverbundene Stichproben Mann-Whitney U Test / Wilcoxon-Rangsummentest Unverbunden (3+ unabhängige Gruppen) 2 -Test Fisher-(Freeman-Halton-)Test Einfache Varianzanalyse Kruskal-Wallis-Test Verbunden (2 Messungen pro Indiv.) Vorzeichen-Test, McNemar-Test t-test für verbundene Stichproben Vorzeichen-Test, Wilcoxon-Vorzeichen-Rang-Test Verbunden (3+ Messungen pro Indiv.) Cochrans Q-Test Armitage Trend-Test Varianzanalyse für Messwiederholungen Friedman-Test Basis-Kurs Statistik und SPSS für Mediziner 70

71 Chi-Quadrat-Test, exakter Test nach Fisher Basis-Kurs Statistik und SPSS für Mediziner 71

72 Chi-Quadrat-Test Beispiel: Besteht zwischen zwei Medikamenten ein Unterschied bzgl. der 1-Jahres-Mortalität? (α=0,05) beobachtet ASPAC Heparin gesamt gestorben 9 (5,6%) 19 (12,6%) 28 (9,0%) nicht gestorben gesamt Idee: Die Häufigkeit von Todesfällen beträgt insgesamt 28/313 = 9%. Hätten beide Medikamente das gleiche Mortalitätsrisiko, wäre die erwartete Sterberate in beiden Gruppen ebenfalls gleich 9%. Basis-Kurs Statistik und SPSS für Mediziner 72

73 Chi-Quadrat-Test Vergleich erwarteter mit beobachteten Häufigkeiten: beobachtet erwartet (unter H 0 ) ASPAC Heparin gesamt gestorben 9 9%*162 = 14,5 19 9%*151 = 13,5 28 (9%) nicht gestorben ,5 = 147, ,5 = 137,5 285 gesamt Je stärker die beobachteten Werte von den erwarteten Werten abweichen, desto mehr spricht das für die Alternativhypothese. Basis-Kurs Statistik und SPSS für Mediziner 73

74 Chi-Quadrat-Test Indikation: Prüfung auf Assoziation zweier Merkmale Vergleich der Häufigkeitsverteilung kategorialer Merkmale bei unabhängigen Gruppen Voraussetzungen: Mindestens 80% der Zellen haben eine erwartete Häufigkeit 5 Kategoriale Variablen Beim Vergleich von mehr als zwei Gruppen lautet die Alternativhypothese: Mindestens eine Gruppe unterscheidet sich von mindestens einer anderen in ihrer Häufigkeitsverteilung. Basis-Kurs Statistik und SPSS für Mediziner 74

75 Exakter Test nach Fisher Falls Voraussetzung für Chi-Quadrat-Test nicht erfüllt? Exakter Test nach Fisher auch bei schwach besetzten Zellen gültig keine Verteilungsannahme (Permutationstest) sehr rechenintensiv (bei heutiger Rechenleistung im Regelfall nicht relevant) Basis-Kurs Statistik und SPSS für Mediziner 75

76 Exakter Test von Fisher - SPSS Chi-Quadrat-Test: Analysieren Deskriptive Statistiken Kreuztabellen Statistiken Chi-Quadrat auswählen Exakter Test von Fisher: zusätzlich Exakt Exakt auswählen Chi-Quadrat Fisher Basis-Kurs Statistik und SPSS für Mediziner 76

77 Test auf Normalverteilung (?) Basis-Kurs Statistik und SPSS für Mediziner 77

78 Kolmogorov-Smirnov-Test Analysieren Deskriptive Statistiken Explorative Datenanalyse Diagramme Normalverteilungsdiagramm mit Tests ankreuzen Es sei zu testen, ob der Hämoglobingehalt im Blut bei Frauen nicht normalverteilt ist. Die Stichprobenwerte von 10 Frauen ergaben: [g/dl] Nullhypothese: Die Daten folgen einer Normalverteilung. Interpretation: Man kann nicht nachweisen, dass die Verteilung von Hämoglobin von der Normalverteilung überzufällig abweicht. Basis-Kurs Statistik und SPSS für Mediziner 78

79 Kolmogorov-Smirnov-Test Dilemma: Geringe Power bei kleinen Fallzahlen (n<50) Abweichungen von der NV-Annahme können evtl. nicht nachgewiesen werden (p>0,05). Große Fallzahlen: Bereits bei geringen Abweichungen ergeben sich signifikante Unterschiede von der NV. Häufig gilt jedoch für asymptotische Testeigenschaften: Für n>30 geringe bis mäßige Abweichungen von der NV-Annahme nicht relevant Daher (insbesondere bei kleinen Stichproben): grafische Verfahren verwenden (z.b. Histogramm) Deskriptive Faustregeln beachten (bei NV gilt): Mittelwert Median Symmetrische Abweichung von Minimum und Maximum um den Mittelwert Symmetrische Abweichung der Quartile um den Mittelwert Basis-Kurs Statistik und SPSS für Mediziner 79

80 t-test Basis-Kurs Statistik und SPSS für Mediziner 80

81 t-test für unverbundene Stichproben Voraussetzung: - Die Daten in beiden Gruppen sind normalverteilt - Die beiden Gruppen sind unabhängig (z.b. verschiedene Patienten) Es existieren Varianten für gleiche (klassischer t-test) und ungleiche (Welch-Test) Varianzen in den beiden Gruppen. Hypothesen: H 0 : µ 1 = µ 2 die Mittelwerte in beiden Gruppen sind gleich H 1 : µ 1 µ 2 die Mittelwerte sind unterschiedlich Benötigt: Fallzahl in den beiden Gruppen (n 1, n 2 ) Mittelwerte in den beiden Gruppen ( x, y ) Standardabweichung oder Varianz in den beiden Gruppen (s 1, s 2 bzw. s 12, s 22 ) Basis-Kurs Statistik und SPSS für Mediziner 81

82 t-test für unverbundene Stichproben - Beispiel Beispiel Hämoglobingehalt bei Männern und Frauen: n Männer 10; x Männer 13,0; s Männer 0,90 n Frauen 10; x Frauen 12,5; s Frauen 0,55 Formulierung der Hypothesen: H 0 : Die Mittelwerte in beiden Gruppen sind gleich: µ M = µ F H 1 : Die Mittelwerte in beiden Gruppen unterscheiden sich: µ M µ F Festlegung der Irrtumswahrscheinlichkeit (für den Fehler 1. Art): α= 5% Basis-Kurs Statistik und SPSS für Mediziner 82

83 t-test für unverbundene Stichproben - SPSS Analysieren Mittelwerte vergleichen T-Test bei unabhängigen Stichproben Deskriptive Statistiken: t-test: Teststatistik (t): Differenz der Mittelwerte / Standardfehler der Differenz (Levene s Test - Test auf Gleichheit der Varianzen: p<0,05 zweite Zeile) Sig. (2-tailed): p-wert 95%-Konfidenzintervall für Differenz der Mittelwerte (0 nicht enthalten p<0,05) Basis-Kurs Statistik und SPSS für Mediziner 83

84 t-test für verbundene Stichproben Voraussetzungen Normalverteilung der Differenz der Paare Zu jedem Individuum existieren zwei Messungen (x und y) Hypothesen: H 0 : = 0 H 1 : 0 wobei Δ = x-y d.h. es wird getestet, ob eine signifikante Änderung der Werte beobachtet werden kann. Um die Wirksamkeit von Therapien zu überprüfen, ist immer eine Kontrollgruppe nötig, da auch andere Effekte (z.b. Zeit) eine Änderung der Werte hervorrufen können. Basis-Kurs Statistik und SPSS für Mediziner 84

85 t-test für verbundene Stichproben Beispiel Messwerte von Materialeigenschaften eines Implantats im Rohzustand (x) und nach Oberflächenbehandlung (y): i x i y i i =x i -y i 1 4,0 3,0 1,0 2 3,5 3,0 0,5 3 4,1 3,8 0,3 4 5,5 2,1 3,4 5 4,6 4,9-0,3 6 6,0 5,3 0,7 7 5,1 3,1 2,0 8 4,3 2,7 1,6 MW ( ) 4,6 3,5 1,15 s 1,16 Basis-Kurs Statistik und SPSS für Mediziner 85

86 t-test für verbundene Stichproben SPSS Analysieren Mittelwerte vergleichen T-Test bei verbundenen Stichproben Deskriptive Analysen t-test für verbundene Stichproben 95%-Konfidenzintervall für den Mittelwert der Differenz p-wert Basis-Kurs Statistik und SPSS für Mediziner 86

87 Verbundene vs. unverbundene Stichproben Vorteil verbundener Stichproben: Genauigkeitsgewinn durch Abschätzung der intra-individuellen Streuung Voraussetzungen schwächer: Normalverteilung für Differenz (häufig erfüllt) Nachteil verbundener Stichproben: Änderungen innerhalb der Gruppe durch viele Einflüsse möglich Fehlende Werte bei einer Messung führen zum Ausschluss der Beobachtungseinheit Carry-over Effekte möglich Basis-Kurs Statistik und SPSS für Mediziner 87

88 Erweiterungen des t-tests Mehr als zwei Gruppen (unverbunden) ANOVA (Varianzanalyse), einfaktoriell Mehr als zwei wiederholte Messungen (z.b. Zeitpunkte) ANOVA für Messwiederholungen Adjustierter t-test ANCOVA (Kovarianzanalyse, entspricht linearer Regression) Quantitative Einflussgröße Regressionsmodell Simultaner Einfluss mehrere Einflussgrößen Regressionsmodell Basis-Kurs Statistik und SPSS für Mediziner 88

89 Nichtparametrische Tests Basis-Kurs Statistik und SPSS für Mediziner 89

90 Nichtparametrische Tests Nichtparametrisch = verteilungsfrei KEINE Normalverteilungsannahme Es werden keine Originaldaten verwendet, sondern deren Ränge Quantitative UND ordinale Merkmalstypen Geringere Effizienz im Vergleich zu parametrischen Verfahren Keine interpretierbaren Effektschätzer und Konfidenzintervalle Basis-Kurs Statistik und SPSS für Mediziner 90

91 Überblick verteilungsfreie Verfahren verbundene Stichproben unverbundene Stichproben 2 Stichproben > 2 Stichproben 2 Stichproben > 2 Stichproben Vorzeichen-Test Wilcoxon-Test (Rang-Vorzeichen-Test) Friedman-Test Mann-Whitney-U Test / Wilcoxon-Test (Rangsummen-Test) Kruskal-Wallis-Test Basis-Kurs Statistik und SPSS für Mediziner 91

92 Mann-Whitney-U-Test / Wilcoxon-Rangsummentest Zwei unverbundene Stichproben Basierend auf Rängen Bei Vorliegen einer Normalverteilung: der t-test hat bei gegebener Fallzahl eine (etwas) größere Power als der Mann-Whitney-U-Test bzw. für den Mann-Whitney-U-Test ist eine größere Fallzahl nötig, um die gleiche Power zu erzielen H 0 : Die Beobachtungen der Gruppe A stammen aus der gleichen Verteilung wie die der Gruppe B (d.h. H 0 : P(X A > X B ) = 50%). Bei gleicher Form der Verteilungsfunktion entspricht dies einem Test auf Gleichheit der Mediane Basis-Kurs Statistik und SPSS für Mediziner 92

93 Mann-Whitney-U-Test Beispiel (Pocock) Treatment: Steroid-Behandlung bei schwangeren Frauen Zielgröße: Thrombozytenzahl bei den Neugeborenen (pro mm³) hier: keine Normalverteilung, keine Symmetrie ja nein Treatm ent m it S teroiden ohne S teroide lfd. N r. Throm bozytenzahl R ang Basis-Kurs Statistik und SPSS für Mediziner 93

94 Mann-Whitney-U-Test SPSS Analysieren Nichtparametrische Tests Alte Dialogfelder Zwei unabhängige Stichproben Bestimmung der Rangsummen Ausgabe des p-wertes p-wert Basis-Kurs Statistik und SPSS für Mediziner 94

95 Vorzeichen-Test (Sign-Test) Zwei verbundene Stichproben (x 1, y 1 ),...,(x n, y n ): gepaarte Stichprobe der Zufallsvariablen X und Y Annahmen Differenzen D i = Y i X i sind unabhängig P(X i = Y i ) = 0 (keine Bindungen) Testproblem: H 0 : P(X<Y) = P(X>Y) = 0.5 (Anteil pos./neg. Änderungen 50%) H 1 : P(X<Y) P(X>Y) (Anteil pos./neg. Änderungen unausgewogen) Basis-Kurs Statistik und SPSS für Mediziner 95

96 Vorzeichen-Test - Beispiel Gewicht vor Diät Nach Diät Delta Ti T=5 Delta: Differenz(nach-vor) T: 1, wenn Delta>0 0, wenn Delta<0 Basis-Kurs Statistik und SPSS für Mediziner 96

97 Vorzeichen-Test - SPSS Analysieren Nichtparametrische Tests Alte Dialogfelder Zwei verbundene Stichproben Vorzeichen Deskriptive Analysen: Koerpergewicht nach Diaet - Koerpergewicht vor Diaet Häufigkeiten Negative Differenzen Positive Differenzen Bindungen c b a N Gesamt 14 a. b. c. Koerpergewicht nach Diaet < Koerpergewicht vor D iaet Koerpergewicht nach Diaet > Koerpergewicht vor D iaet Koerpergewicht nach Diaet = Koerpergewicht vor D iaet Ausgabe des p-wertes: Exakte Signifikanz (2-seitig) Exakte Signifikanz (1-seitig) Punkt-Wahrscheinlichkeit Statistik für Test b Koerpe rgewi cht nach Diaet - Koerpe rgewi cht vor Diaet a,581,291,157 a. b. Verwende tete Binomia lve rteilung. Vorzeichentest Basis-Kurs Statistik und SPSS für Mediziner 97

98 Wilcoxon-Rang-Vorzeichen-Test (signed-rank test) Zwei verbundene Stichproben (gepaarte Beobachtungen) Zusätzliche Annahme: Verteilung der Differenzen ist stetig und symmetrisch um den Median Δ med. Paare mit Bindungen (x i =y i ) werden im Test ignoriert Testproblem: H 0 : Δ med = 0 H 1 : Δ med 0 Falls Annahmen für die entsprechenden Tests erfüllt: t-test für verbundene Stichproben ist effizienter als Wilcoxon-Rang-Vorzeichen- Test Wilcoxon-Rang-Vorzeichen-Test ist effizienter als einfacher Vorzeichentest Basis-Kurs Statistik und SPSS für Mediziner 98

99 Wilcoxon-Rang-Vorzeichen-Test - - Beispiel Gewicht vor Diät Nach Diät Delta Delta R( D ) 12 5, ,5 8 1,5 5,5 13 T Ti R( D ) 7 3 1,5 5,5 13 W + =30 Delta: Differenz Delta : Betrag der Differenz R( D ): Rang von Delta T: 1, wenn Delta>0 0, wenn Delta<0 Ti R( D ): Nur Ränge für T=1 werden gezählt W + : Summe dieser Ränge Basis-Kurs Statistik und SPSS für Mediziner 99

100 Wilcoxon-Rang-Vorzeichen-Test - - SPSS Analysieren Nichtparametrische Tests Alte Dialogfelder Zwei verbundene Stichproben Wilcoxon Deskriptive Statistiken Ausgabe der Teststatistik und des p-wertes Basis-Kurs Statistik und SPSS für Mediziner 100

101 Korrelation Basis-Kurs Statistik und SPSS für Mediziner 101

102 Korrelation Korrelationen werden berechnet, um die Stärke eines linearen (monotonen) Zusammenhangs zwischen zwei stetigen (ordinalen) Merkmalen X und Y zu erfassen. Beispiele: Es soll untersucht werden, 1. ob ein Zusammenhang zwischen Körpergröße und Gewicht besteht, 2. ob sich der Blutdruck/BMI mit dem Alter ändert, 3. ob mit einer höheren Tumorexpression auch ein schlechterer klinischer Score einhergeht. Basis-Kurs Statistik und SPSS für Mediziner 102

103 Korrelation - Beispiel Beispiel: Körperfettanteil, Größe, Gewicht und Hüftumfang wurden an 252 Männern erhoben. Ziel der Studie ist es, den Anteil von Körperfett durch einfach zu erhebende Surrogate möglichst genau abzuschätzen. Basis-Kurs Statistik und SPSS für Mediziner 103

104 Korrelation - Beispiel Grafik Diagrammerstellung Streu-/Punktdiagramm Basis-Kurs Statistik und SPSS für Mediziner 104

105 Pearson Korrelationskoeffizient r Voraussetzung: 2 normalverteilte (stetige) Variablen Vorsicht bei Ausreißern! r nach Spearman als robustes Maß Eigenschaften: Wertebereich: 1 bis +1 (symmetrisches Maß) Invariant gegenüber linearen Transformationen (z.b. egal ob Gewicht in Gramm oder Kilogramm) Interpretation: Misst die Stärke des linearen Zusammenhangs r = -1, r = 1: perfekter linearer Zusammenhang r 0: kein linearer Zusammenhang r > 0 (r < 0): gleichsinniger (gegensinniger) Zusammenhang Basis-Kurs Statistik und SPSS für Mediziner 105

106 Pearson Korrelationskoeffizient - Beispiel Analysieren Korrelation Bivariat Basis-Kurs Statistik und SPSS für Mediziner 106

107 Korrelation Anmerkungen Achtung! r=0,8 Viele verschiedene Zusammenhänge können den gleichen Korrelationskoeffizienten ergeben, aber trotzdem nicht den Trend der Punktwolke widerspiegeln. Problem: Es liegt kein linearer oder monotoner Zusammenhang vor. Ausreißer beeinflussen das Ergebnis. Die Daten sind nicht normalverteilt. Lösung: Korrelationskoeffizient nach Spearman Flexible Modellierung (Regression) Basis-Kurs Statistik und SPSS für Mediziner 107

108 Korrelationskoeffizient nach Spearman Voraussetzung: mind. ordinalskalierte Merkmale Eigenschaften: Basiert auf Rängen Robust gegenüber Ausreißern Interpretation: Maß für monotonen Zusammenhang Berechnung, Interpretation und Auswertung äquivalent zu Pearson Korrelationskoeffizient. Analysieren Korrelation Bivariat Spearman Basis-Kurs Statistik und SPSS für Mediziner 108

109 Stärke des Zusammenhangs Ausmaß des Korrelationskoeffizienten: 0.00 bis 0.19 kein / sehr schwacher 0.20 bis 0.39 schwacher Wenn r 0.40 bis 0.69 moderater Zusammenhang 0.70 bis 0.89 starker 0.90 bis 1.00 sehr starker Signifikanz des Korrelationskoeffizienten: Beurteilung zum Signifikanzniveau α (meist α = 0,05) Warnung: Tests dürfen in explorativen Studien nur als hypothesengenerierend verstanden werden. Für konfirmatorische Aussagen ist eine Korrektur für multiples Testen erforderlich. Basis-Kurs Statistik und SPSS für Mediziner 109

110 Korrelation Anmerkungen Korrelationskoeffizienten sind nicht anwendbar für nominale Variablen, auch wenn diese als Zahlen kodiert sind Korrelation Kausalität Bei komplexen Zusammenhängen folgt aus r = 0 nicht immer Unabhängigkeit der Variablen (z.b. U-förmiger Zusammenhang). Der Begriff Korrelation wird in der Statistik nicht allgemein für alle Arten von Assoziationstests verwendet. Wichtig: Betrag des Koeffizienten und p-wert sind gemeinsam zu interpretieren, denn: Bei großem n sind auch kleine r signifikant von 0 verschieden. Bei kleinem n können auch große r nicht signifikant sein. Basis-Kurs Statistik und SPSS für Mediziner 110

111 Regression Basis-Kurs Statistik und SPSS für Mediziner 111

112 Einfache lineare Regression ^ Die Geradengleichung y = a + bx stellt dabei die Regressionsgleichung dar. b quantifiziert den Zusammenhang zwischen Y und X. = Abweichung/Residuum: Die Parameter a und b werden so bestimmt, dass die Summe der quadrierten Abweichungen minimal wird Kleinste Quadrate Schätzer. b y ^ = vorhergesagter Y Wert a = Konstante/Intercept (Schnittpunkt der Regressionsgeraden mit y-achse bzw. y-wert der Regressionsgeraden bei x=0) b = Anstieg/Slope (Zu-/Abnahme von Y, wenn X um eine Einheit ansteigt) a 1 Basis-Kurs Statistik und SPSS für Mediziner 112

113 Einfache lineare Regression Beispiel Annahme: Körperfett steht in einer linearen Beziehung zum Brustumfang. Allgemeine Form der Geradengleichung: Geschätzter Körperfettanteil = a + b Brustumfang Basis-Kurs Statistik und SPSS für Mediziner 113

114 Einfache lineare Regression SPSS Grafik: Grafik Diagrammerstellung Streu-/Punktdiagramm Regressionsgreade: Doppelklick auf Grafik Elemente Anpassungslinie bei Gesamtsumme Basis-Kurs Statistik und SPSS für Mediziner 114

115 Einfache lineare Regression SPSS Analysieren Regression Linear Konstante (= a) Zielgröße Y Steigung (= b) Die Nullhypothese H 0 : b = 0, d.h. kein Zusammenhang, kann auf dem 5%-Signifikanzniveau abgelehnt werden. Geschätzter Körperfettanteil = -51, ,697 Brustumfang Basis-Kurs Statistik und SPSS für Mediziner 115

116 Einfache lineare Regression Beispiel Die aus den Daten geschätzte Regressionsgleichung kann benutzt werden, um Körperfett bei Männern abzuschätzen. z. B. für einen Mann mit 100 cm Brustumfang ergibt sich Geschätzter Körperfettanteil = -51, , [cm] = 0,185 = 18,5% Basis-Kurs Statistik und SPSS für Mediziner 116

117 Multiple lineare Regression In einer multiplen Regression lassen sich die Effekte mehrerer Variablen simultan bestimmen. Allgemeine Form der Geraden, um Körperfett aus mehreren Einflussgrößen zu bestimmen: Körperfett = b 0 + b 1 Brustumfang + b 2 Übergewicht + b 3 Adipositas Berechnung der Regressionskoeffizienten auf Basis der Daten ergibt: Körperfett = -31, ,480 Brustumfang + 3,864 Übergewicht + 6,290 Adipositas Basis-Kurs Statistik und SPSS für Mediziner 117

118 Multiple lineare Regression Interpretation Körperfett = -31, ,480 Brustumfang + 3,864 Übergewicht + 6,290 Adipositas Eine (theoretische) Person mit Brustumfang von 0 cm und BMI im Normalbereich hätte einen erwarteten Körperfettanteil von -31,45% Ein normalgewichtiger Mann mit einem Brustumfang von 100 cm hat einen erwarteten/vorhergesagten Körperfettanteil von -31, , = 8,55% Im Vergleich dazu hat ein adipöser Mann mit gleichem Brustumfang einen vorhergesagten Körperfettanteil von -31, , ,290 = 14,84% Basis-Kurs Statistik und SPSS für Mediziner 118

119 Gütemaß Wie gut beschreibt die Regressionsgerade die Daten? Wie genau kann die abhängige Größe durch das Modell vorhergesagt werden? Bestimmtheitsmaß (R 2 ) Interpretation: R² gibt an, wie viel Prozent der Streuung der abhängigen Variablen Y durch die Regressionsgerade erklärt werden kann. Es entspricht in der einfachen linearen Regression mit einer stetigen Einflussgröße dem quadrierten Pearson Korrelationskoeffizienten. Wertebereich: 0 bis 1 Basis-Kurs Statistik und SPSS für Mediziner 119

120 Gütemaß SPSS Modell I: Einflussgröße nur Brustumfang R 2 = 0,494 Modell II: Einflussgrößen Brustumfang, Übergewicht, Adipositas R 2 = 0,519 Basis-Kurs Statistik und SPSS für Mediziner 120

121 Lineare Regression: Annahmen Voraussetzungen für die Durchführung einer linearen Regression: Die Residuen müssen normalverteilt sein (nicht die Zielgröße) ( Histogramm der Residuen) Analysieren Regression linear Diagramme unter Diagramme der standardisierten Residuen Haken setzen bei Histogramm Basis-Kurs Statistik und SPSS für Mediziner 121

122 Analyse von Überlebenszeiten Basis-Kurs Statistik und SPSS für Mediziner 122

123 Typische Beispiele und Problemstellung Überlebenszeit oder 1, 2, 3,... Jahres-Überlebensrate - von Krebspatienten - nach Transplantationen Dauer bis zur Schmerzfreiheit nach Knieoperation Unterscheiden sich 2 oder mehr Gruppen hinsichtlich der Überlebenszeit? Überlebenszeit: Probleme: Zeitspanne T bis zum Eintreten eines bestimmten Ereignisses Ereigniszeiten unvollständig beobachtet Zensierungsproblematik z.b. Nachbeobachtungsperioden unterschiedlich lang, manche Patienten scheiden während der Studie aus Ereignis: Tod, Rezidiv, Remission,... Basis-Kurs Statistik und SPSS für Mediziner 123

124 Beobachtungsmuster Basis-Kurs Statistik und SPSS für Mediziner 124

125 Kaplan-Meier-Schätzer Basis-Kurs Statistik und SPSS für Mediziner 125

126 Kaplan-Meier-Schätzer Überlebenszeiten (in Monaten) von 30 Patienten in einer randomisierten Studie Therapie vs. Placebo: Therapie (n=15) Placebo (n=15) * * 7 90* * * * * 128* 181* * 141* 54 * lebend zum letzten Beobachtungszeitpunkt Lost to follow up (Studienabbruch) Frage: Wie groß ist die Überlebenswahrscheinlichkeit in den beiden Gruppen? Problem: Zensierungen/unterschiedlich lange Beobachtungsdauern Lösung: Kaplan-Meier-Schätzer Basis-Kurs Statistik und SPSS für Mediziner 126

127 Kaplan-Meier-Schätzer Idee: 1. Sortieren der Daten nach Ereigniszeiten. Die Ereignisse geben Beobachtungsintervalle vor. 2. Bestimmung der Personen unter Risiko zu jedem Zeitpunkt: Personen, die bis unmittelbar vor dem Zeitpunkt gelebt haben und Personen, die irgendwann nach diesem Zeitpunkt zensiert wurden. 3. Für jedes Zeitintervall Berechnung der (bedingten) Wahrscheinlichkeit, dass jemand, der bis zu Beginn des Intervalls gelebt hat, bis zum Ende des Intervalls überleben wird. 4. Berechnung der Überlebenswahrscheinlichkeit zu jedem Zeitpunkt als Produkt der bedingten Wahrscheinlichkeiten, jedes Zeitintervall zu überleben. Basis-Kurs Statistik und SPSS für Mediziner 127

128 Kaplan-Meier-Schätzer - Beispiel Berechnung am Beispiel Therapiegruppe Zeitpunkt Patienten unter Risiko Anzahl Ereignisse Wahrscheinlichkeit, Intervall zu überleben /15 14/ /14 14/15 13/ Kumulierte Überlebenswahrscheinlichkeit /12 14/15 13/14 11/ /11 14/15 13/14 11/12 10/11 Basis-Kurs Statistik und SPSS für Mediziner 128

129 Kaplan-Meier-Schätzung - SPSS Analysieren Überleben Kaplan-Meier Basis-Kurs Statistik und SPSS für Mediziner 129

130 Kaplan-Meier-Kurve Beispiel: Medianes Überleben Analysieren Überleben Kaplan-Meier Optionen unter Diagramme Überleben auswählen Basis-Kurs Statistik und SPSS für Mediziner 130

131 Kaplan-Meier-Kurve Beispiel: 10 Jahres Überleben Basis-Kurs Statistik und SPSS für Mediziner 131

132 Log-rank Test Basis-Kurs Statistik und SPSS für Mediziner 132

133 Log-rank Test Statistische Hypothesen: H 0 : kein Unterschied in der Verteilung der Überlebenszeiten zwischen Placebo und Therapiegruppe, d.h. Todesfälle treten in zufälliger Reihenfolge unabhängig von der Gruppenzugehörigkeit auf H 1 : Unterschied in der Verteilung der Überlebenszeiten zwischen Placebo und Therapiegruppe, d.h. Todesfälle treten in einer Gruppe früher als in der anderen Gruppe auf Voraussetzung: Kaplan-Meier-Kurven sollten sich nicht überschneiden Basis-Kurs Statistik und SPSS für Mediziner 133

134 Log-rank Test Idee: 1. Bestimmung der beobachteten Anzahl an Todesfällen in beiden Gruppen (beobachtete Ereignisse zum Ereigniszeitpunkt t j in den beiden Gruppen: d Aj und d Bj ). 2. Berechnung der unter H 0 erwarteten Anzahl von Todesfällen in beiden Gruppen zu den einzelnen Zeitpunkten t j (E(d Aj ), E(d Bj )) 3. Vergleich der beobachteten und erwarteten Anzahlen an Ereignissen einer Gruppe mittels der Log-rank-Teststatistik: U [ d j Aj E ( d Aj )] LR U 2 Var ( U ) Bei hinreichend großer Zahl der Ereignisse ist LR annähernd χ 2 -verteilt. Faustregel: insgesamt mindestens 30 Ereignisse über beide Gruppen Basis-Kurs Statistik und SPSS für Mediziner 134

135 Log-rank Test -- Beispiel Analysieren Überleben Kaplan-Meier Faktor vergleichen unter Teststatistiken Log-Rang auswählen Basis-Kurs Statistik und SPSS für Mediziner 135

136 Log-rank Test Cox-Regression Grenzen des Log-rank-Tests: Reiner Signifikanztest liefert keine Effektgrößen Lediglich Gruppenvergleiche möglich (nur eine binäre bzw. kategoriale Einflussgröße) Cox-Regression erweitert den Log-rank-Test Simultaner Effekt mehrerer Einflussgrößen Metrische Einflussgrößen Adjustierter Gruppenvergleich Hazard Ratio als Effektmaß Basis-Kurs Statistik und SPSS für Mediziner 136

137 Cox-Regression Basis-Kurs Statistik und SPSS für Mediziner 137

138 Cox-Regression - Hazardfunktion Zielgröße in der Cox-Regression: Hazardrate (Risikofunktion) h(t): h( t) lim t 0 P ( t T t t t T t) h(t) beschreibt die infinitesimale Wahrscheinlichkeit für ein Ereignis zum Zeitpunkt t, gegeben das Ereignis ist vor Zeitpunkt t noch nicht eingetreten, d.h. die Wahrscheinlichkeit, wenn ein Patient bis t überlebt hat, dass er unmittelbar zum Zeitpunkt t verstirbt. Basis-Kurs Statistik und SPSS für Mediziner 138

139 Cox-Regression (proportional hazards model) Cox-Modell: h(t) h (t) exp( β X β X β m X m ) Voraussetzung: Proportionale Hazardraten, d.h. Effekte verschiedener Variablen auf das Überleben sind über die Zeit konstant! Basis-Kurs Statistik und SPSS für Mediziner 139

140 Cox-Regression h(t) h (t) exp( β X β X β m X m ) h(t): Hazardrate h 0 (t): unspezifizierter Baseline-Hazard (beschreibt das Risiko, wenn alle Einflussgrößen gleich 0 sind) X 1,,X m : Werte der Einflussgrößen β 1,...,β m : Regressionskoeffizienten Basis-Kurs Statistik und SPSS für Mediziner 140

141 Cox Regression Hazard Ratio Zwei-Gruppen-Fall (0 vs. 1): HR=exp(β) Risikoverhältnis zwischen den beiden Gruppen Gruppenunterschied von primärem Interesse, weitere Einflussgrößen als adjustierende Variablen adjustiertes Risikoverhältnis zwischen den Gruppen Stetige Einflussgröße exp(β) beschreibt die relative Änderung des Risikos bei Änderung der Einflussgröße um eine Einheit z.b. exp(ß) = 1.12 Risikoanstieg von 12% exp(ß) = 0.80 Risikoreduktion um 20% exp(ß) = 1 kein Risikounterschied Basis-Kurs Statistik und SPSS für Mediziner 141

142 Cox-Regression Beispiel Randomisierte Studie mit 158 Patienten (74 mit Standardtherapie, 84 mit neuer Therapie) Weitere Einflussgrößen: Alter Geschlecht (1=männlich, 0=weiblich) Score für Gesundheitszustand (0 bis 100, hohe Werte sprechen für guten Zustand) Endpunkt: Zeit bis zum Tod / bis Zensierung Status (0=zensiert, 1=Ereignis) ID Beobachtete Zeit Status Therapie Geschlecht Alter Score Basis-Kurs Statistik und SPSS für Mediziner 142

143 Cox-Regression - SPSS Analysieren Überleben Cox-Regression (bei Optionen Konfidenzintervall für Exp(B) markieren) Variablen für Überlebenszeit und Status sowie Einflussgrößen definieren Output: B: Regressionskoeffizient Exp(B): geschätztes Risikoverhältnis CI for Exp(B): Konfidenzintervall für das Risikoverhältnis Sig.: p-wert Basis-Kurs Statistik und SPSS für Mediziner 143

144 Cox- Regression - SPSS In den beobachteten Daten führt die neue Therapie zu einer Verringerung des Risikos (B<0 bzw. Exp(B)<1) Risikoverhältnis (=HR) beträgt 0,556 Das Risiko unter der neuen Therapie beträgt das 0,556-fache des Risikos unter der Standardtherapie Verringerung des Risikos ist signifikant (p-wert<0,05 / HR von 1 ist nicht im Konfidenzintervall enthalten) Kein signifikanter Alters- und Geschlechtseffekt Signifikanter Einfluss des Scores. Ein Unterschied von einem Punkt spricht für eine Risikoänderung um den Faktor 0,987 Ein Unterschied von 10 Scorepunkten führt zu einer Risikoreduktion auf das 0,878-fache: exp(10 β) = exp(10 (-0,013)) = 0,878 Basis-Kurs Statistik und SPSS für Mediziner 144

Deskription, Statistische Testverfahren und Regression. Seminar: Planung und Auswertung klinischer und experimenteller Studien

Deskription, Statistische Testverfahren und Regression. Seminar: Planung und Auswertung klinischer und experimenteller Studien Deskription, Statistische Testverfahren und Regression Seminar: Planung und Auswertung klinischer und experimenteller Studien Deskriptive Statistik Deskriptive Statistik: beschreibende Statistik, empirische

Mehr

Inhaltsverzeichnis. Über die Autoren Einleitung... 21

Inhaltsverzeichnis. Über die Autoren Einleitung... 21 Inhaltsverzeichnis Über die Autoren.... 7 Einleitung... 21 Über dieses Buch... 21 Was Sie nicht lesen müssen... 22 Törichte Annahmen über den Leser... 22 Wie dieses Buch aufgebaut ist... 23 Symbole, die

Mehr

Ergebnisse VitA und VitVM

Ergebnisse VitA und VitVM Ergebnisse VitA und VitVM 1 Basisparameter... 2 1.1 n... 2 1.2 Alter... 2 1.3 Geschlecht... 5 1.4 Beobachtungszeitraum (von 1. Datum bis letzte in situ)... 9 2 Extraktion... 11 3 Extraktionsgründe... 15

Mehr

Ermitteln Sie auf 2 Dezimalstellen genau die folgenden Kenngrößen der bivariaten Verteilung der Merkmale Weite und Zeit:

Ermitteln Sie auf 2 Dezimalstellen genau die folgenden Kenngrößen der bivariaten Verteilung der Merkmale Weite und Zeit: 1. Welche der folgenden Kenngrößen, Statistiken bzw. Grafiken sind zur Beschreibung der Werteverteilung des Merkmals Konfessionszugehörigkeit sinnvoll einsetzbar? A. Der Modalwert. B. Der Median. C. Das

Mehr

Bereiche der Statistik

Bereiche der Statistik Bereiche der Statistik Deskriptive / Exploratorische Statistik Schließende Statistik Schließende Statistik Inferenz-Statistik (analytische, schließende oder konfirmatorische Statistik) baut auf der beschreibenden

Mehr

5. Lektion: Einfache Signifikanztests

5. Lektion: Einfache Signifikanztests Seite 1 von 7 5. Lektion: Einfache Signifikanztests Ziel dieser Lektion: Du ordnest Deinen Fragestellungen und Hypothesen die passenden einfachen Signifikanztests zu. Inhalt: 5.1 Zwei kategoriale Variablen

Mehr

Statistik II: Signifikanztests /1

Statistik II: Signifikanztests /1 Medien Institut : Signifikanztests /1 Dr. Andreas Vlašić Medien Institut (0621) 52 67 44 vlasic@medien-institut.de Gliederung 1. Noch einmal: Grundlagen des Signifikanztests 2. Der chi 2 -Test 3. Der t-test

Mehr

Eigene MC-Fragen SPSS. 1. Zutreffend auf die Datenerfassung und Datenaufbereitung in SPSS ist

Eigene MC-Fragen SPSS. 1. Zutreffend auf die Datenerfassung und Datenaufbereitung in SPSS ist Eigene MC-Fragen SPSS 1. Zutreffend auf die Datenerfassung und Datenaufbereitung in SPSS ist [a] In der Variablenansicht werden für die betrachteten Merkmale SPSS Variablen definiert. [b] Das Daten-Editor-Fenster

Mehr

Parametrische vs. Non-Parametrische Testverfahren

Parametrische vs. Non-Parametrische Testverfahren Parametrische vs. Non-Parametrische Testverfahren Parametrische Verfahren haben die Besonderheit, dass sie auf Annahmen zur Verteilung der Messwerte in der Population beruhen: die Messwerte sollten einer

Mehr

fh management, communication & it Constantin von Craushaar fh-management, communication & it Statistik Angewandte Statistik

fh management, communication & it Constantin von Craushaar fh-management, communication & it Statistik Angewandte Statistik fh management, communication & it Folie 1 Überblick Grundlagen (Testvoraussetzungen) Mittelwertvergleiche (t-test,..) Nichtparametrische Tests Korrelationen Regressionsanalyse... Folie 2 Überblick... Varianzanalyse

Mehr

12 Rangtests zum Vergleich zentraler Tendenzen

12 Rangtests zum Vergleich zentraler Tendenzen 12 Rangtests zum Vergleich zentraler Tendenzen 12.1 Allgemeine Bemerkungen 12.2 Gepaarte Stichproben: Der Wilcoxon Vorzeichen- Rangtest 12.3 Unabhängige Stichproben: Der Wilcoxon Rangsummentest und der

Mehr

Statistische Messdatenauswertung

Statistische Messdatenauswertung Roland Looser Statistische Messdatenauswertung Praktische Einführung in die Auswertung von Messdaten mit Excel und spezifischer Statistik-Software für naturwissenschaftlich und technisch orientierte Anwender

Mehr

Institut für Biometrie und klinische Forschung. WiSe 2012/2013

Institut für Biometrie und klinische Forschung. WiSe 2012/2013 Klinische Forschung WWU Münster Pflichtvorlesung zum Querschnittsfach Epidemiologie, Biometrie und Med. Informatik Praktikum der Medizinischen Biometrie () WiSe /3 Univariate und bivariate Verfahren Univariate

Mehr

3. Lektion: Deskriptive Statistik

3. Lektion: Deskriptive Statistik Seite 1 von 5 3. Lektion: Deskriptive Statistik Ziel dieser Lektion: Du kennst die verschiedenen Methoden der deskriptiven Statistik und weißt, welche davon für Deine Daten passen. Inhalt: 3.1 Deskriptive

Mehr

Vorlesung: Statistik II für Wirtschaftswissenschaft

Vorlesung: Statistik II für Wirtschaftswissenschaft Vorlesung: Statistik II für Wirtschaftswissenschaft Prof. Dr. Helmut Küchenhoff Institut für Statistik, LMU München Sommersemester 2017 Einführung 1 Wahrscheinlichkeit: Definition und Interpretation 2

Mehr

Unterschiedshypothesen für maximal 2 Gruppen, wenn die Voraussetzungen für parametrische Verfahren nicht erfüllt sind

Unterschiedshypothesen für maximal 2 Gruppen, wenn die Voraussetzungen für parametrische Verfahren nicht erfüllt sind Schäfer A & Schöttker-Königer T, Statistik und quantitative Methoden für (2015) Arbeitsblatt 1 SPSS Kapitel 6 Seite 1 Unterschiedshypothesen für maximal 2 Gruppen, wenn die Voraussetzungen für parametrische

Mehr

Arbeitsbuch zur deskriptiven und induktiven Statistik

Arbeitsbuch zur deskriptiven und induktiven Statistik Helge Toutenburg Michael Schomaker Malte Wißmann Christian Heumann Arbeitsbuch zur deskriptiven und induktiven Statistik Zweite, aktualisierte und erweiterte Auflage 4ü Springer Inhaltsverzeichnis 1. Grundlagen

Mehr

Einführung in die Statistik für Politikwissenschaftler Sommersemester 2011

Einführung in die Statistik für Politikwissenschaftler Sommersemester 2011 Einführung in die Statistik für Politikwissenschaftler Sommersemester 2011 Es können von den Antworten alle, mehrere oder keine Antwort(en) richtig sein. Nur bei einer korrekten Antwort (ohne Auslassungen

Mehr

Schließende Statistik

Schließende Statistik Schließende Statistik Die schließende Statistik befasst sich mit dem Rückschluss von einer Stichprobe auf die Grundgesamtheit (Population). Die Stichprobe muss repräsentativ für die Grundgesamtheit sein.

Mehr

Klassifikation von Signifikanztests

Klassifikation von Signifikanztests Klassifikation von Signifikanztests Nach Verteilungsannahmen: verteilungsabhängig: parametrischer [parametric] Test verteilungsunabhängig: nichtparametrischer [non-parametric] Test Bei parametrischen Tests

Mehr

Klassifikation von Signifikanztests

Klassifikation von Signifikanztests Klassifikation von Signifikanztests nach Verteilungsannahmen: verteilungsabhängige = parametrische Tests verteilungsunabhängige = nichtparametrische Tests Bei parametrischen Tests werden im Modell Voraussetzungen

Mehr

Statistik. Jan Müller

Statistik. Jan Müller Statistik Jan Müller Skalenniveau Nominalskala: Diese Skala basiert auf einem Satz von qualitativen Attributen. Es existiert kein Kriterium, nach dem die Punkte einer nominal skalierten Variablen anzuordnen

Mehr

htw saar 1 EINFÜHRUNG IN DIE STATISTIK: BESCHREIBENDE STATISTIK

htw saar 1 EINFÜHRUNG IN DIE STATISTIK: BESCHREIBENDE STATISTIK htw saar 1 EINFÜHRUNG IN DIE STATISTIK: BESCHREIBENDE STATISTIK htw saar 2 Grundbegriffe htw saar 3 Grundgesamtheit und Stichprobe Ziel: Über eine Grundgesamtheit (Population) soll eine Aussage über ein

Mehr

Angewandte Statistik 3. Semester

Angewandte Statistik 3. Semester Angewandte Statistik 3. Semester Übung 5 Grundlagen der Statistik Übersicht Semester 1 Einführung ins SPSS Auswertung im SPSS anhand eines Beispieles Häufigkeitsauswertungen Grafiken Statistische Grundlagen

Mehr

Statistisches Testen

Statistisches Testen Statistisches Testen Grundlegendes Prinzip Erwartungswert Bekannte Varianz Unbekannte Varianz Differenzen Anteilswert Chi-Quadrat Tests Gleichheit von Varianzen Prinzip des Statistischen Tests Konfidenzintervall

Mehr

Statistische Tests (Signifikanztests)

Statistische Tests (Signifikanztests) Statistische Tests (Signifikanztests) [testing statistical hypothesis] Prüfen und Bewerten von Hypothesen (Annahmen, Vermutungen) über die Verteilungen von Merkmalen in einer Grundgesamtheit (Population)

Mehr

Klausur in "Biomathematik" WS 2007 / 2008 Montag, den 28. Januar 2008

Klausur in Biomathematik WS 2007 / 2008 Montag, den 28. Januar 2008 Klausur in "Biomathematik" WS 2007 / 2008 Montag, den 28. Januar 2008 Name: Matrikelnummer: Unterschrift: Aufgabe 1: Bei einer klinischen Therapiestudie wird bei allen Patienten der Wert eines quantitativen

Mehr

Statistische Methoden in den Umweltwissenschaften

Statistische Methoden in den Umweltwissenschaften Statistische Methoden in den Umweltwissenschaften Korrelationsanalysen Kreuztabellen und χ²-test Themen Korrelation oder Lineare Regression? Korrelationsanalysen - Pearson, Spearman-Rang, Kendall s Tau

Mehr

Übung 5 im Fach "Biometrie / Q1" Thema: Wilcoxon, Chi-Quadrat, multiples Testen

Übung 5 im Fach Biometrie / Q1 Thema: Wilcoxon, Chi-Quadrat, multiples Testen Universität Ulm, Institut für Epidemiologie und Medizinische Biometrie, D-89070 Ulm Institut für Epidemiologie und Medizinische Biometrie Leiter: Prof. Dr. D. Rothenbacher Schwabstr. 13, 89075 Ulm Tel.

Mehr

Inhaltsverzeichnis Grundlagen aufigkeitsverteilungen Maßzahlen und Grafiken f ur eindimensionale Merkmale

Inhaltsverzeichnis Grundlagen aufigkeitsverteilungen Maßzahlen und Grafiken f ur eindimensionale Merkmale 1. Grundlagen... 1 1.1 Grundgesamtheit und Untersuchungseinheit................ 1 1.2 Merkmal oder statistische Variable........................ 2 1.3 Datenerhebung.........................................

Mehr

Statistische Überlegungen: Eine kleine Einführung in das 1 x 1

Statistische Überlegungen: Eine kleine Einführung in das 1 x 1 Statistische Überlegungen: Eine kleine Einführung in das 1 x 1 PD Dr. Thomas Friedl Klinik für Frauenheilkunde und Geburtshilfe, Universitätsklinikum Ulm München, 23.11.2012 Inhaltsübersicht Allgemeine

Mehr

Statistik II Übung 3: Hypothesentests

Statistik II Übung 3: Hypothesentests Statistik II Übung 3: Hypothesentests Diese Übung beschäftigt sich mit der Anwendung diverser Hypothesentests (zum Beispiel zum Vergleich der Mittelwerte und Verteilungen zweier Stichproben). Verwenden

Mehr

Inhaltsverzeichnis. 1 Über dieses Buch Zum Inhalt dieses Buches Danksagung Zur Relevanz der Statistik...

Inhaltsverzeichnis. 1 Über dieses Buch Zum Inhalt dieses Buches Danksagung Zur Relevanz der Statistik... Inhaltsverzeichnis 1 Über dieses Buch... 11 1.1 Zum Inhalt dieses Buches... 13 1.2 Danksagung... 15 2 Zur Relevanz der Statistik... 17 2.1 Beispiel 1: Die Wahrscheinlichkeit, krank zu sein, bei einer positiven

Mehr

- Normalverteilung (Gaußverteilung) kann auf sehr viele Zufallsprozesse angewendet werden.

- Normalverteilung (Gaußverteilung) kann auf sehr viele Zufallsprozesse angewendet werden. Normalverteilung und Standardnormalverteilung als Beispiel einer theoretischen Verteilung - Normalverteilung (Gaußverteilung) kann auf sehr viele Zufallsprozesse angewendet werden. - Stetige (kontinuierliche),

Mehr

Online Statistik-Coaching

Online Statistik-Coaching Online Statistik-Coaching Modul 3 Statistisches Testen - Auswahl der passenden Methode - Durchführung mit SPSS - Interpretation und Darstellung Dipl.-Math. Daniela Keller www.statistik-und-beratung.de

Mehr

Biomathematik für Mediziner, Klausur WS 1999/2000 Seite 1

Biomathematik für Mediziner, Klausur WS 1999/2000 Seite 1 Biomathematik für Mediziner, Klausur WS 1999/2000 Seite 1 Aufgabe 1: Wieviele der folgenden Variablen sind quantitativ stetig? Schulnoten, Familienstand, Religion, Steuerklasse, Alter, Reaktionszeit, Fahrzeit,

Mehr

Stichwortverzeichnis. Ausgleichsgerade 177 Ausreißer 13, 40

Stichwortverzeichnis. Ausgleichsgerade 177 Ausreißer 13, 40 283 Stichwortverzeichnis a Alpha-Wert 76, 91 Alter 256 Alternativhypothese 68, 70 ANOVA siehe einfache Varianzanalyse, zweifache Varianzanalyse Anpassung 178 Anpassungstest siehe Chi-Quadrat-Anpassungstest

Mehr

Einführung in die Statistik

Einführung in die Statistik Einführung in die Statistik Analyse und Modellierung von Daten Von Prof. Dr. Rainer Schlittgen 4., überarbeitete und erweiterte Auflage Fachbereich Materialwissenschaft! der Techn. Hochschule Darmstadt

Mehr

Statistik II. IV. Hypothesentests. Martin Huber

Statistik II. IV. Hypothesentests. Martin Huber Statistik II IV. Hypothesentests Martin Huber 1 / 41 Übersicht Struktur eines Hypothesentests Stichprobenverteilung t-test: Einzelner-Parameter-Test F-Test: Multiple lineare Restriktionen 2 / 41 Struktur

Mehr

Deskriptive Statistik

Deskriptive Statistik Helge Toutenburg Christian Heumann Deskriptive Statistik Eine Einführung in Methoden und Anwendungen mit R und SPSS Siebte, aktualisierte und erweiterte Auflage Mit Beiträgen von Michael Schomaker 4ü Springer

Mehr

Software oder Tabellen (nicht Thema dieser Veranstaltung).

Software oder Tabellen (nicht Thema dieser Veranstaltung). p-wert p-wert Der p-wert ist die Wahrscheinlichkeit, dass die Testgröße den beobachteten Wert oder einen noch extremeren Wert (,,weiter weg von H 0 ) annimmt unter der Bedingung, dass H 0 wahr ist. Bemerkungen

Mehr

Statistische Tests zu ausgewählten Problemen

Statistische Tests zu ausgewählten Problemen Einführung in die statistische Testtheorie Statistische Tests zu ausgewählten Problemen Teil 4: Nichtparametrische Tests Statistische Testtheorie IV Einführung Beschränkung auf nichtparametrische Testverfahren

Mehr

Wiederholung. Statistik I. Sommersemester 2009

Wiederholung. Statistik I. Sommersemester 2009 Statistik I Sommersemester 2009 Statistik I (1/21) Daten/graphische Darstellungen Lage- und Streuungsmaße Zusammenhangsmaße Lineare Regression Wahrscheinlichkeitsrechnung Zentraler Grenzwertsatz Konfidenzintervalle

Mehr

Franz Kronthaler. Statistik angewandt. Datenanalyse ist (k)eine Kunst. mit dem R Commander. A Springer Spektrum

Franz Kronthaler. Statistik angewandt. Datenanalyse ist (k)eine Kunst. mit dem R Commander. A Springer Spektrum Franz Kronthaler Statistik angewandt Datenanalyse ist (k)eine Kunst mit dem R Commander A Springer Spektrum Inhaltsverzeichnis Teil I Basiswissen und Werkzeuge, um Statistik anzuwenden 1 Statistik ist

Mehr

Hypothesentests für Erwartungswert und Median. Statistik (Biol./Pharm./HST) FS 2015

Hypothesentests für Erwartungswert und Median. Statistik (Biol./Pharm./HST) FS 2015 Hypothesentests für Erwartungswert und Median Statistik (Biol./Pharm./HST) FS 2015 Normalverteilung X N μ, σ 2 X ist normalverteilt mit Erwartungswert μ und Varianz σ 2 pdf: pdf cdf:??? cdf 1 Zentraler

Mehr

Dr. Maike M. Burda. Welchen Einfluss hat die Körperhöhe auf das Körpergewicht? Eine Regressionsanalyse. HU Berlin, Econ Bootcamp

Dr. Maike M. Burda. Welchen Einfluss hat die Körperhöhe auf das Körpergewicht? Eine Regressionsanalyse. HU Berlin, Econ Bootcamp Dr. Maike M. Burda Welchen Einfluss hat die Körperhöhe auf das Körpergewicht? Eine Regressionsanalyse. HU Berlin, Econ Bootcamp 8.-10. Januar 2010 BOOTDATA.GDT: 250 Beobachtungen für die Variablen... cm:

Mehr

Glossar und Formelsammlung. Hazard Rate. Hazard Ratio =

Glossar und Formelsammlung. Hazard Rate. Hazard Ratio = Glossar und Formelsammlung Hazard Rate Die Hazard Rate steht für das Risiko, genau zum Zeitpunkt t ein Ereignis bei Überlebenszeitanalysen den Tod zu erleiden. Es handelt sich demnach um eine vom Zeitpunkt

Mehr

Statistik II. IV. Hypothesentests. Martin Huber

Statistik II. IV. Hypothesentests. Martin Huber Statistik II IV. Hypothesentests Martin Huber 1 / 22 Übersicht Weitere Hypothesentests in der Statistik 1-Stichproben-Mittelwert-Tests 1-Stichproben-Varianz-Tests 2-Stichproben-Tests Kolmogorov-Smirnov-Test

Mehr

Statistik und Wahrscheinlichkeitsrechnung

Statistik und Wahrscheinlichkeitsrechnung Statistik und Wahrscheinlichkeitsrechnung 3. Vorlesung Dr. Jochen Köhler 1 Inhalte der heutigen Vorlesung Ziel: Daten Modellbildung Probabilistisches Modell Wahrscheinlichkeit von Ereignissen Im ersten

Mehr

Werkzeuge der empirischen Forschung

Werkzeuge der empirischen Forschung Werkzeuge der empirischen Forschung I. Daten und Beschreibende Statistik 1. Einführung 2. Dateneingabe, Datentransformation, Datenbehandlung 3. Beschreibende Statistik II. Schließende Statistik 1 III.

Mehr

Statistische Methoden in den Umweltwissenschaften

Statistische Methoden in den Umweltwissenschaften Statistische Methoden in den Umweltwissenschaften Stetige und diskrete Wahrscheinlichkeitsverteilungen Lageparameter Streuungsparameter Diskrete und stetige Zufallsvariablen Eine Variable (oder Merkmal

Mehr

Statistik II: Grundlagen und Definitionen der Statistik

Statistik II: Grundlagen und Definitionen der Statistik Medien Institut : Grundlagen und Definitionen der Statistik Dr. Andreas Vlašić Medien Institut (0621) 52 67 44 vlasic@medien-institut.de Gliederung 1. Hintergrund: Entstehung der Statistik 2. Grundlagen

Mehr

Die mit * gekennzeichneten Abschnitte beinhalten Themen, die über die Anforderungen des Gegenstandskatalogs hinausgehen.

Die mit * gekennzeichneten Abschnitte beinhalten Themen, die über die Anforderungen des Gegenstandskatalogs hinausgehen. Die mit * gekennzeichneten Abschnitte beinhalten Themen, die über die Anforderungen des Gegenstandskatalogs hinausgehen. 1 Einleitung...1 1.1 Die Bedeutung der Statistik für die Medizin...1 1.2 Die medizinische

Mehr

Diagnose und Prognose: Kurzfassung 4

Diagnose und Prognose: Kurzfassung 4 Diagnose und Prognose: Kurzfassung 4 Ziele der 4. Vorlesung Inhaltliche Verbindung zwischen inhaltlicher Statistisches Konzept / Problemstellung Problemstellung und statistischem statistische Methode Konzept/Methode

Mehr

1. Datei Informationen

1. Datei Informationen 1. Datei Informationen Datei vorbereiten (Daten, Variablen, Bezeichnungen und Skalentypen) > Datei Dateiinformation anzeigen Arbeitsdatei 2. Häufigkeiten Analysieren Deskriptive Statistik Häufigkeiten

Mehr

Test auf den Erwartungswert

Test auf den Erwartungswert Test auf den Erwartungswert Wir interessieren uns für den Erwartungswert µ einer metrischen Zufallsgröße. Beispiele: Alter, Einkommen, Körpergröße, Scorewert... Wir können einseitige oder zweiseitige Hypothesen

Mehr

Institut für Biometrie und klinische Forschung. WiSe 2012/2013

Institut für Biometrie und klinische Forschung. WiSe 2012/2013 Klinische Forschung WWU Münster Pflichtvorlesung zum Querschnittsfach Epidemiologie, Biometrie und Med. Informatik Praktikum der Medizinischen Biometrie (3) Überblick. Deskriptive Statistik I 2. Deskriptive

Mehr

Statistische Methoden in den Umweltwissenschaften

Statistische Methoden in den Umweltwissenschaften Statistische Methoden in den Umweltwissenschaften Post Hoc Tests A priori Tests (Kontraste) Nicht-parametrischer Vergleich von Mittelwerten 50 Ergebnis der ANOVA Sprossdichte der Seegräser 40 30 20 10

Mehr

Trim Size: 176mm x 240mm Lipow ftoc.tex V1 - March 9, :34 P.M. Page 11. Über die Übersetzerin 9. Einleitung 19

Trim Size: 176mm x 240mm Lipow ftoc.tex V1 - March 9, :34 P.M. Page 11. Über die Übersetzerin 9. Einleitung 19 Trim Size: 176mm x 240mm Lipow ftoc.tex V1 - March 9, 2016 6:34 P.M. Page 11 Inhaltsverzeichnis Über die Übersetzerin 9 Einleitung 19 Was Sie hier finden werden 19 Wie dieses Arbeitsbuch aufgebaut ist

Mehr

5. Seminar Statistik

5. Seminar Statistik Sandra Schlick Seite 1 5. Seminar 5. Seminar Statistik 30 Kurztest 4 45 Testen von Hypothesen inkl. Übungen 45 Test- und Prüfverfahren inkl. Übungen 45 Repetitorium und Prüfungsvorbereitung 15 Kursevaluation

Mehr

Übung 1 im Fach "Biometrie / Q1"

Übung 1 im Fach Biometrie / Q1 Universität Ulm, Institut für Epidemiologie und Medizinische Biometrie, D-89070 Ulm Institut für Epidemiologie und Medizinische Biometrie Leiter: Prof. Dr. D. Rothenbacher Schwabstr. 13, 89075 Ulm Tel.

Mehr

SigmaStat Nina Becker, Christoph. Rothenwöhrer. Copyright 2004 Systat Software, Inc.

SigmaStat Nina Becker, Christoph. Rothenwöhrer. Copyright 2004 Systat Software, Inc. SigmaStat 3.11 Copyright 2004 Systat Software, Inc. http://www.systat.com Nina Becker, Christoph Rothenwöhrer Die Aufgabe der Statistik ist die Zusammenfassung von Daten, deren Darstellung, Analyse und

Mehr

Einführung in die Statistik

Einführung in die Statistik Einführung in die Statistik Analyse und Modellierung von Daten von Prof. Dr. Rainer Schlittgen Universität Hamburg 12., korrigierte Auflage Oldenbourg Verlag München Inhaltsverzeichnis 1 Statistische Daten

Mehr

Stichwortverzeichnis. Symbole

Stichwortverzeichnis. Symbole Stichwortverzeichnis Symbole 50ste Perzentil 119 A Absichern, Ergebnisse 203 Abzählbar unendliche Zufallsvariable 146 Alternativhypothese 237 238 formulieren 248 Anekdote 340 Annäherung 171, 191 Antwortquote

Mehr

Einstieg in SPSS. Man kann auch für jede Ausprägung einer Variablen ein Wertelabel vergeben.

Einstieg in SPSS. Man kann auch für jede Ausprägung einer Variablen ein Wertelabel vergeben. Einstieg in SPSS In SPSS kann man für jede Variable ein Label vergeben, damit in einer Ausgabe nicht der Name der Variable (der kryptisch sein kann) erscheint, sondern ein beschreibendes Label. Der Punkt

Mehr

Hypothesentests mit SPSS

Hypothesentests mit SPSS Beispiel für eine einfache Regressionsanalyse (mit Überprüfung der Voraussetzungen) Daten: bedrohfb_v07.sav Hypothese: Die Skalenwerte auf der ATB-Skala (Skala zur Erfassung der Angst vor terroristischen

Mehr

1 Univariate Statistiken

1 Univariate Statistiken 1 Univariate Statistiken Im ersten Kapitel berechnen wir zunächst Kenngrößen einer einzelnen Stichprobe bzw. so genannte empirische Kenngrößen, wie beispielsweise den Mittelwert. Diese können, unter gewissen

Mehr

Dr. Maike M. Burda. Welchen Einfluss hat die Körperhöhe auf das Körpergewicht? Eine Regressionsanalyse. HU Berlin, Econ Bootcamp 7.-9.

Dr. Maike M. Burda. Welchen Einfluss hat die Körperhöhe auf das Körpergewicht? Eine Regressionsanalyse. HU Berlin, Econ Bootcamp 7.-9. Dr. Maike M. Burda Welchen Einfluss hat die Körperhöhe auf das Körpergewicht? Eine Regressionsanalyse. HU Berlin, Econ Bootcamp 7.-9. Januar 2011 BOOTDATA11.GDT: 250 Beobachtungen für die Variablen...

Mehr

Glossar Biometrie / Statistik. Auszug für Fragebogen Fallzahlberechnung/-begründung

Glossar Biometrie / Statistik. Auszug für Fragebogen Fallzahlberechnung/-begründung Glossar Biometrie / Statistik A Äquivalenztest Der Äquivalenztest beurteilt die Gleichwertigkeit von Therapien. Beim Äquivalenztest werden als Hypothesen formuliert: Nullhypothese H 0 : Die Präparate sind

Mehr

Forschungsstatistik I

Forschungsstatistik I Prof. Dr. G. Meinhardt 6. Stock, Taubertsberg 2 R. 06-206 (Persike) R. 06-214 (Meinhardt) Sprechstunde jederzeit nach Vereinbarung Forschungsstatistik I Dr. Malte Persike persike@uni-mainz.de http://psymet03.sowi.uni-mainz.de/

Mehr

KLAUSUR IN BIOMATHEMATIK WS 2007/08 MONTAG, DEN 28. JANUAR 2008

KLAUSUR IN BIOMATHEMATIK WS 2007/08 MONTAG, DEN 28. JANUAR 2008 KLAUSUR IN BIOMATHEMATIK WS 2007/08 MONTAG, DEN 28. JANUAR 2008 Name: Matrikelnummer: Unterschrift: Aufgabe 1: Welche der folgenden Aussagen ist falsch? A. Der Median ist weniger stark von Ausreißern beeinflusst

Mehr

Hypothesen: Fehler 1. und 2. Art, Power eines statistischen Tests

Hypothesen: Fehler 1. und 2. Art, Power eines statistischen Tests ue biostatistik: hypothesen, fehler 1. und. art, power 1/8 h. lettner / physik Hypothesen: Fehler 1. und. Art, Power eines statistischen Tests Die äußerst wichtige Tabelle über die Zusammenhänge zwischen

Mehr

VII. Inhaltsverzeichnis

VII. Inhaltsverzeichnis VII Inhaltsverzeichnis Vorwort XIII Teil 1 Datentypen 1 Datentypen 3 1.1 Kommt es wirklich darauf an? 3 1.2 Daten auf einer Intervallskala 3 1.3 Daten auf einer Ordinalskala 4 1.4 Daten auf einer Nominalskala

Mehr

Teil / Ein paar statistische Grundlagen 25. Kapitel 1 Was Statistik ist und Warum sie benötigt Wird 2 7

Teil / Ein paar statistische Grundlagen 25. Kapitel 1 Was Statistik ist und Warum sie benötigt Wird 2 7 Inhaltsverzeichnis Einführung 21 Über dieses Buch 21 Törichte Annahmen über den Leser 22 Wie dieses Buch aufgebaut ist 23 Teil I: Ein paar statistische Grundlagen 23 Teil II: Die beschreibende Statistik

Mehr

Einführung in Quantitative Methoden

Einführung in Quantitative Methoden Einführung in Quantitative Methoden Pantelis Christodoulides & Karin Waldherr 4. Juni 2014 Christodoulides / Waldherr Einführung in Quantitative Methoden 1/35 Ein- und Zweiseitige Hypothesen H 0 : p =

Mehr

1 x 1 y 1 2 x 2 y 2 3 x 3 y 3... n x n y n

1 x 1 y 1 2 x 2 y 2 3 x 3 y 3... n x n y n 3.2. Bivariate Verteilungen zwei Variablen X, Y werden gemeinsam betrachtet (an jedem Objekt werden gleichzeitig zwei Merkmale beobachtet) Beobachtungswerte sind Paare von Merkmalsausprägungen (x, y) Beispiele:

Mehr

Einführung in Quantitative Methoden

Einführung in Quantitative Methoden Einführung in Quantitative Methoden Karin Waldherr & Pantelis Christodoulides 11. Juni 2014 Waldherr / Christodoulides Einführung in Quantitative Methoden 1/46 Anpassungstests allgemein Gegeben: Häufigkeitsverteilung

Mehr

UE Angewandte Statistik Termin 4 Gruppenvergleichstests

UE Angewandte Statistik Termin 4 Gruppenvergleichstests UE Angewandte Statistik Termin 4 Gruppenvergleichstests Martina Koller Institut für Pflegewissenschaft SoSe 2015 INHALT 1 Allgemeiner Überblick... 1 2 Normalverteilung... 2 2.1 Explorative Datenanalyse...

Mehr

Epidemiologie / Biometrie

Epidemiologie / Biometrie Wintersemester 2004 / 2005 Epidemiologie / Biometrie Robert Hochstrat 14. März 2005 Zusammenschrift der Übung zur Vorlesung aus dem WS 04/05 Rückfragen, Ergänzungen und Korrekturen an robert hochstrat@web.de

Mehr

GRUNDPRINZIPIEN statistischen Testens

GRUNDPRINZIPIEN statistischen Testens Fragestellungen beim Testen GRUNDPRINZIPIEN statistischen Testens. Vergleiche Unterscheidet sich die Stichprobenbeobachtung von einer vorher spezifizierten Erwartung ( Hypothese ) mit ausreichender Sicherheit?

Mehr

Biostatistische Studienplanung. Dr. Matthias Kohl SIRS-Lab GmbH

Biostatistische Studienplanung. Dr. Matthias Kohl SIRS-Lab GmbH Biostatistische Studienplanung Dr. Matthias Kohl SIRS-Lab GmbH Ausgangspunkt Fragestellung(en)/Hypothese(n): Hauptfragestellung: Grund für Durchführung der Studie Nebenfragestellung(en): Welche Fragestellungen

Mehr

Inhaltsverzeichnis. Teil 1 Basiswissen und Werkzeuge, um Statistik anzuwenden

Inhaltsverzeichnis. Teil 1 Basiswissen und Werkzeuge, um Statistik anzuwenden Inhaltsverzeichnis Teil 1 Basiswissen und Werkzeuge, um Statistik anzuwenden 1 Statistik ist Spaß 3 Warum Statistik? 3 Checkpoints 4 Daten 4 Checkpoints 7 Skalen - lebenslang wichtig bei der Datenanalyse

Mehr

Inhaltsverzeichnis. Vorwort

Inhaltsverzeichnis. Vorwort V Vorwort XI 1 Zum Gebrauch dieses Buches 1 1.1 Einführung 1 1.2 Der Text in den Kapiteln 1 1.3 Was Sie bei auftretenden Problemen tun sollten 2 1.4 Wichtig zu wissen 3 1.5 Zahlenbeispiele im Text 3 1.6

Mehr

Lösungen zu Janssen/Laatz, Statistische Datenanalyse mit SPSS 1. LÖSUNG 9A a.

Lösungen zu Janssen/Laatz, Statistische Datenanalyse mit SPSS 1. LÖSUNG 9A a. LÖSUNG 9A a. Lösungen zu Janssen/Laatz, Statistische Datenanalyse mit SPSS 1 Das Regressionsmodell soll nur für Büropersonal angewendet werden Management- und Bewachungspersonal (MIND =0) soll nicht einbezogen

Mehr

4.1. Verteilungsannahmen des Fehlers. 4. Statistik im multiplen Regressionsmodell Verteilungsannahmen des Fehlers

4.1. Verteilungsannahmen des Fehlers. 4. Statistik im multiplen Regressionsmodell Verteilungsannahmen des Fehlers 4. Statistik im multiplen Regressionsmodell In diesem Kapitel wird im Abschnitt 4.1 zusätzlich zu den schon bekannten Standardannahmen noch die Annahme von normalverteilten Residuen hinzugefügt. Auf Basis

Mehr

Bitte am PC mit Windows anmelden!

Bitte am PC mit Windows anmelden! Einführung in SPSS Plan für heute: Grundlagen/ Vorwissen für SPSS Vergleich der Übungsaufgaben Einführung in SPSS http://weknowmemes.com/generator/uploads/generated/g1374774654830726655.jpg Standardnormalverteilung

Mehr

3 Grundlagen statistischer Tests (Kap. 8 IS)

3 Grundlagen statistischer Tests (Kap. 8 IS) 3 Grundlagen statistischer Tests (Kap. 8 IS) 3.1 Beispiel zum Hypothesentest Beispiel: Betrachtet wird eine Abfüllanlage für Mineralwasser mit dem Sollgewicht µ 0 = 1000g und bekannter Standardabweichung

Mehr

Konfidenzintervalle Grundlegendes Prinzip Erwartungswert Bekannte Varianz Unbekannte Varianz Anteilswert Differenzen von Erwartungswert Anteilswert

Konfidenzintervalle Grundlegendes Prinzip Erwartungswert Bekannte Varianz Unbekannte Varianz Anteilswert Differenzen von Erwartungswert Anteilswert Konfidenzintervalle Grundlegendes Prinzip Erwartungswert Bekannte Varianz Unbekannte Varianz Anteilswert Differenzen von Erwartungswert Anteilswert Beispiel für Konfidenzintervall Im Prinzip haben wir

Mehr

4.1. Nullhypothese, Gegenhypothese und Entscheidung

4.1. Nullhypothese, Gegenhypothese und Entscheidung rof. Dr. Roland Füss Statistik II SS 8 4. Testtheorie 4.. Nullhypothese, Gegenhypothese und Entscheidung ypothesen Annahmen über die Verteilung oder über einzelne arameter der Verteilung eines Merkmals

Mehr

Aufgaben zu Kapitel 8

Aufgaben zu Kapitel 8 Aufgaben zu Kapitel 8 Aufgabe 1 a) Berechnen Sie einen U-Test für das in Kapitel 8.1 besprochene Beispiel mit verbundenen n. Die entsprechende Testvariable punkte2 finden Sie im Datensatz Rangdaten.sav.

Mehr

Statistik II Übung 3: Hypothesentests Aktualisiert am

Statistik II Übung 3: Hypothesentests Aktualisiert am Statistik II Übung 3: Hypothesentests Aktualisiert am 12.04.2017 Diese Übung beschäftigt sich mit der Anwendung diverser Hypothesentests (zum Beispiel zum Vergleich der Mittelwerte und Verteilungen zweier

Mehr

Häufigkeitsauszählungen, zentrale statistische Kennwerte und Mittelwertvergleiche

Häufigkeitsauszählungen, zentrale statistische Kennwerte und Mittelwertvergleiche Lehrveranstaltung Empirische Forschung und Politikberatung der Universität Bonn, WS 2007/2008 Häufigkeitsauszählungen, zentrale statistische Kennwerte und Mittelwertvergleiche 30. November 2007 Michael

Mehr

Statistik für Naturwissenschaftler

Statistik für Naturwissenschaftler Hans Walser Statistik für Naturwissenschaftler Haupt Verlag Bern Stuttgart Wien Inhaltsverzeichnis Vorwort 13 1 Beschreibende Statistik 15 1.1 Mittelwerte 15 1.1.1 Minimum der Abstände 15 1.1.2 Der Mediän

Mehr

Die Funktion f wird als Regressionsfunktion bezeichnet.

Die Funktion f wird als Regressionsfunktion bezeichnet. Regressionsanalyse Mit Hilfe der Techniken der klassischen Regressionsanalyse kann die Abhängigkeit metrischer (intervallskalierter) Zielgrößen von metrischen (intervallskalierten) Einflussgrößen untersucht

Mehr

3. Deskriptive Statistik

3. Deskriptive Statistik 3. Deskriptive Statistik Eindimensionale (univariate) Daten: Pro Objekt wird ein Merkmal durch Messung / Befragung/ Beobachtung erhoben. Resultat ist jeweils ein Wert (Merkmalsausprägung) x i : - Gewicht

Mehr

Hypothesentests für Erwartungswert und Median. für D-UWIS, D-ERDW, D-USYS und D-HEST SS15

Hypothesentests für Erwartungswert und Median. für D-UWIS, D-ERDW, D-USYS und D-HEST SS15 Hypothesentests für Erwartungswert und Median für D-UWIS, D-ERDW, D-USYS und D-HEST SS15 Normalverteilung X N(μ, σ 2 ) : «X ist normalverteilt mit Erwartungswert μ und Varianz σ 2» pdf: f x = 1 2 x μ exp

Mehr

Lösungen zur Biomathe-Klausur Gruppe A Montag, den 16. Juli 2001

Lösungen zur Biomathe-Klausur Gruppe A Montag, den 16. Juli 2001 Lösungen zur Biomathe-Klausur Gruppe A Montag, den 16. Juli 2001 1. Sensitivität und Spezifität In einer medizinischen Ambulanz haben 30 % der Patienten eine akute Appendizitis. 80 % dieser Patienten haben

Mehr

10. Medizinische Statistik

10. Medizinische Statistik 10. Medizinische Statistik Projektplanung Deskriptive Statistik Inferenz-Statistik Literatur: Hüsler, J. und Zimmermann, H.: Statistische Prinzipien für medizinische Projekte, Verlag Hans Huber, 1993.

Mehr

Übung 3 im Fach "Biometrie / Q1"

Übung 3 im Fach Biometrie / Q1 Universität Ulm, Institut für Epidemiologie und Medizinische Biometrie, D-89070 Ulm Institut für Epidemiologie und Medizinische Biometrie Leiter: Prof. Dr. D. Rothenbacher Schwabstr. 13, 89075 Ulm Tel.

Mehr