Klinische Forschung WWU Münster Pflichtvorlesung zum Querschnittsfach Epidemiologie, Biometrie und Med. Informatik Praktikum der Medizinischen Biometrie () Überblick. Deskriptive Statistik I - Grundlegende Begriffe - Häufigkeitstabellen - Grafische Darstellungen - Kenngrößen. Deskriptive Statistik II 3. Wahrscheinlichkeitsrechnung und Zufallsvariablen 4. Induktive Statistik Literatur Java-unterstützte Münsteraner Biometrie-Oberfläche (JUMBO) http://ibkf.uni-muenster.de, Lehre C. Weiß (8): Basiswissen Medizinische Statistik (mit Epidemiologie), www.springerlink.com. D.G. Altman (99, ): Practical Statistics for medical research. R.J. Lorenz (996): Grundbegriffe der Biometrie. Harms (998): Biomathematik, Statistik und Dokumentation. Deutsche Medizinische Wochenschrift, Serie Statistik http://www.thieme-connect.com/ejournals/toc/dmw/5 http://www.thieme-connect.com/ejournals/toc/dmw/874 http://www.thieme-connect.com/ejournals/toc/dmw/369 3
Überblick. Deskriptive Statistik I - Grundlegende Begriffe - Häufigkeitstabellen - Grafische Darstellungen - Kenngrößen. Deskriptive Statistik II 3. Wahrscheinlichkeitsrechnung und Zufallsvariablen 4. Induktive Statistik 4 Datentabelle Datenmatrix Beobachtungseinheit (Merkmalsträger) Merkmal Ausprägung (Wert) Nr. M M... M p... n. Deskriptive Statistik I Grundlegende Begriffe 5 Beispiel einer Datentabelle patnr gebdat sex groesse gewicht alter blutgru therap hb hb.3.968 6 75 37 A.4 9.5 5.5.97 6 8 34 B 9.4 9.6 3 9.4.97 75 59 36 A 7.9 9.6 4 3..96 86 9 45 3.9 9.9 5 8..956 65. 49 AB 3.3 9.6 6..968 9 79 38 9. 6.8 7 7.7.94 76 64 65 9.7 8.5 8 3..945 69 69 6 B 9.7 7.7 9 6..97 78. 37 AB 9.8 7. 7.9.95 55 55 56 A 8.9 4.6 Als Freitext eingegebene Diagnosen: MedDRA-Kodierung. Deskriptive Statistik I Grundlegende Begriffe 6
Klassifikation von Merkmalen Kategorien (begrifflich definiert) qualitativ (kategoriell) nominal Keine natürliche Anordnung ordinal Natürliche Anordnung Merkmale quantitativ (metrisch) diskret Zählen Vielfache einer Maßeinheit stetig Messen oder Wiegen Rechenoperationen +-*/. Deskriptive Statistik I Grundlegende Begriffe 7 Überblick. Deskriptive Statistik I - Grundlegende Begriffe - Häufigkeitstabellen - Grafische Darstellungen - Kenngrößen. Deskriptive Statistik II 3. Wahrscheinlichkeitsrechnung und Zufallsvariablen 4. Induktive Statistik 8 Absolute und relative Häufigkeitstabelle () Blutgruppe A B AB abs. H. 9 6 4 5 rel. H. 38% 4% % 8% %. Deskriptive Statistik I Häufigkeitstabellen 9
Absolute und relative Häufigkeitstabelle () Größe abs. H. rel. H. kumuliert [4, 55) [55, 7) [7, 85) [85, ) [, 5) 5 99 3 % 7% 66% 5% % % 8% 84% 99% % 5 %. Deskriptive Statistik I Häufigkeitstabellen Überblick. Deskriptive Statistik I - Grundlegende Begriffe - Häufigkeitstabellen - Grafische Darstellungen - Kenngrößen. Deskriptive Statistik II 3. Wahrscheinlichkeitsrechnung und Zufallsvariablen 4. Induktive Statistik Balkendiagramm 6 N = 5 4 % A B AB. Deskriptive Statistik I Grafische Darstellungen
Kreisdiagramm A 4% 38% B % AB 8% Relative Häufigkeit: Winkel bzw. Fläche des Segments. Deskriptive Statistik I Grafische Darstellungen 3 Histogramm () 7 6 5 4 % 3 [4-55) [55-7) [7-85) Größe [85- ) N = 5 [- 5). Deskriptive Statistik I Grafische Darstellungen 4 Histogramm () Größe abs. H rel. H Größe abs. H rel. H [4, 55) % [4, 5) % [55, 7) 5 7% [5, 6) 8 % [7, 85) 99 66% [6, 7) 8 5% [85, ) 3 5% [7, 8) 53 35% [, 5) % [8, 9) 58 39% 5 % [9, ) 7% [, ) % 5 %. Deskriptive Statistik I Grafische Darstellungen 5
Histogramm (3) % 7 6 5 4 3 5 4 3 % [4-55) [4-5) [5-6) [55-7) [6-7) [7-85) [7-8) [85- ) [8-9) [9- ) [- 5) [- ). Deskriptive Statistik I Grafische Darstellungen 6 Box-and-Whisker-Plot siehe unten. Deskriptive Statistik I Grafische Darstellungen 7 Überblick. Deskriptive Statistik I - Grundlegende Begriffe - Häufigkeitstabellen - Grafische Darstellungen - Kenngrößen. Deskriptive Statistik II 3. Wahrscheinlichkeitsrechnung und Zufallsvariablen 4. Induktive Statistik 8
Lage- und Streuungsmaße 6 7 77 8 9 77 +/- 4 Größe (cm). Deskriptive Statistik I Kenngrößen 9 Lagemaße 5 5 5 5 5 5. Deskriptive Statistik I Kenngrößen Streuungsmaße 4 6 8 4 6 8 4 6 8. Deskriptive Statistik I Kenngrößen
Lagemaße (arithmetischer) Mittelwert: Median: Q 5% a %-Quantil: Modalwert, Modus: x n Q a Minimum Q % n x i i typischer Merkmalswert häufigster Wert Maximum Q %. Deskriptive Statistik I Kenngrößen Streuungsmaße Varianz: Standardabweichung: s n s s Variationskoeffizient: CV [%] (einheitslos) x Spannweite: Max Min = Q % Q % s n i ( x i x) Interquartilabstand: Q 75% Q 5%. Deskriptive Statistik I Kenngrößen 3 Tabelle zulässiger Maßzahlen Merkmal zulässige zulässige Lagemaße Streuungsmaße nominal Modus (keine) ordinal Modus Minimum, Maximum Quantile diskret, (Modus) Spannweite stetig Quantile Interquartilabstand Mittelwert Quantildifferenzen Varianz Standardabweichung Variationskoeffizient. Deskriptive Statistik I Kenngrößen 4
Überblick. Deskriptive Statistik I - Grundlegende Begriffe - Häufigkeitstabellen - Grafische Darstellungen (Nachtrag) - Kenngrößen. Deskriptive Statistik II 3. Wahrscheinlichkeitsrechnung und Zufallsvariablen 4. Induktive Statistik 5 Box-and-Whisker-Plot (). Deskriptive Statistik I Grafische Darstellungen 3 Box-and-Whisker-Plot (). Deskriptive Statistik I Grafische Darstellungen 35
Box-and-Whisker-Plot (3) typische Merkmalswerte??. Deskriptive Statistik I Grafische Darstellungen 37 Box-and-Whisker-Plot (3). Deskriptive Statistik I Grafische Darstellungen 38 Box-and-Whisker-Plot (4) typischer Merkmalswert??. Deskriptive Statistik I Grafische Darstellungen 4
Box-and-Whisker-Plot (4). Deskriptive Statistik I Grafische Darstellungen 4 Aufgabe Welchen Merkmalstyp hat das Merkmal Körpergröße (in cm)?. qualitativ. nominal 3. ordinal 4. diskret 5. stetig % % % % % qualitativ nominal ordinal diskret stetig 4 Aufgabe Welche Maßzahlen bzw. grafischen Darstellungen eignen sich zur Analyse eines nominalen Merkmals?. Histogramm. Kreisdiagramm 3. Mittelwert (arithmetisches Mittel) 4. empirischer Median 5. empirische Standardabweichung % % % % % Histogramm Kreisdiagramm Mittelwert (arithmeti... empirischer Median 43 empirische Standard...
Aufgabe 3 Das folgende Histogramm zeigt die Verteilung des LDH-Wertes von 663 Patienten der AML-Studie. Welche Eigenschaft besitzt diese Verteilung?. linksschief. rechtsschief 3. symmetrisch 4. zweigipflig 5. rechtsgipflig linksschief % % % % % rechtsschief symmetrisch zweigipflig 44 rechtsgipflig Aufgabe 4 Als empirisches Lagemaß einer Stichprobe hat der Median den folgenden Vorteil gegenüber dem arithmetischen Mittelwert:. Bei unsymmetrischen Verteilungen kann der Mittelwert nicht bestimmt werden.. Der Median ist immer kleiner als der Mittelwert. 3. Der Median kann auch bei nominalen Merkmalen bestimmt werden. 4. Der Median ist robust gegenüber Ausreißern. 5. Der Median gibt nicht nur die Lage, sondern auch die Streuung der Daten wieder. Bei unsymmetri... % % % % % Der Median ist... Der Median kan... Der Median ist... 45 Der Median gib... Aufgabe 5 In einer Studie wird folgender Boxplot der Körpergröße in Abhängigkeit vom Geschlecht erstellt. Welche Aussage kann man anhand der Graphik ableiten? 75 5 m w. Es gibt keinen Unterschied zwischen beiden Gruppen.. 5 % der Männer sind kleiner oder gleich 6 cm. 3. 5 % der Frauen sind größer als 75 cm. 4. Am größten ist eine Frau. 5. Männer sind im Schnitt etwas größer als Frauen. Es gibt keinen... % % % % % 5 % der Männe... 5 % der Fraue... Am größten ist... 46 Männer sind im...