Die Statistik beschäftigt sich mit Massenerscheinungen, bei denen die dahinterstehenden Einzelereignisse meist zufällig sind. Statistik benutzt die Methoden der Wahrscheinlichkeitsrechnung. Fundamentalregeln: Statistischen Aussagen beziehen sich nie auf ein Einzelereignis, sondern nur auf Gesamtheiten vieler Ereignisse. Jede statistische Aussage ist mit einer prinzipiell unvermeidlichen Unsicherheit Deskriptive Statistik behaftet. 2 KAD 206.09.07 das erste Anwendungsgebiet der Statistik bestand in der Staatsbeschreibung (Völkszählung) Status = Zustand http://www.medizin.uni-koeln.de/kai/imsie/kursinfo/q/q-0-einfuehrung.pdf 3 Semmelweis (88-86) war der erste bekannte Arzt, der den Nutzen einer neuen Therapie mit statistischen Methoden belegte 4
Was messen Physiker, Arzt und Medizinstudent? Labormessergebnisse Pr.Buch, Biostatistik, Tabelle 3 6 Klassifizierung der Merkmale Skalentypen der metrischen Merkmale definierte Differenz, kein 0 Punkt Tage in einem Kalender diskret Intervallskala Temperatur in C kontinuierlich definiertes Verhältnis, 0 Punkt Anzahl der Zähne Verhältnisskala Temperatur in K 7 8
Element Grundgesamtheit (Population): Stichprobe:,,,,,,,,, *, / Auseinanderhalten Anordnung Differenz 9 Verhältnis Gesamtheit der Individuen (Elemente), deren Eigenschaften bei der Studie untersucht werden sollen. Die gesamte Menge der interessierenden Daten. N = unendlich Der für die Studie ausgewählte Teil der Population. n = endlich N >>n (Umfang) 0 die Stichprobenelemente sollen zufällig ausgewählt werden Zufall! Grundgesamtheit Stichprobe über die man etwas aussagen möchte Unsicherheit! Wie hoch ist die normale Pulsfrequenz (einer Population)? Merkmal: Pulsfrequenz zufällige Erhebung einiger Elementen der Population: Stichprobe Daten der Stichprobe liegen in Form einer Urliste vor: 66, 6, 89, 63, 66, 69, 7, 68, 8, 69, 78, 66, 64, 84, 74, 76, 69, 77, 74, 76 (Einheit: /), oder: deskriptive Statistik induktive Statistik (schließende St. analytische St.) Die Werte sollen geordnet und verdichtet werden.!? Stellen wir die Daten entlang einer Zahlengeraden dar! Die deskriptive Statistik ist die Vorstufe zur induktiven Statistik keine Daten wenige Daten viele Daten wenige Daten keine Daten 2 Pr.Buch Abb. 4
Verfeinern wir die Klassen noch weiter! Unterteilen wir die Zahlengerade in gleich breite Klassen (Intervalle) und zählen wir ab, wie viele Daten sich in den so erhaltenen Klassen befinden! n x Die Grenzwerte und die Breiten der Klassen sind willkürlich. Stellen wir diese Treppenfunktion dar! Pr.Buch Tabelle in Excel: =frequency(...) =Häufigkeit(...) 3 Die Fläche unter der Treppenfunktion zwischen und 60: 2 2 Die Gesamtfläche unter der Treppenfunktion: 20 = n, Anzahl der Messdaten in der Stichprobe 4 n x verteilung n n x absolute 20 Fläche unter der Kurve: n Fläche unter der Kurve: absolute (Histogramm) relative (Histogramm) relative n n 00 Jedes Rechteck entspricht einem Messwert. 6 Pr.Buch Abb.
Bestimmung der optimalen Klasseneinteilung empirische optimale Klassenanzahl m: m 2 2n empirische n vergrößert sich, die Klassenbreite x kann verkleinert werden Pr.Buch Abb. m 2n m 40 6.3 optimale Klassenbreite x: xmax x 89 6 min x x.2 m 6.3 7 theoretische Pr.Buch Abb. 6 Bei großen Stichproben ergibt die empirische Verteilungsfunktion eine sehr gute Näherung der theoretischen Verteilungsfunktion. (Die Stichprobe ist gleich der Grundgesamtheit.) 8 Beispiel: Biophysik Praktikum, Mikroskop Analyse von Häufigkeitsverteilungen homogene symmetrische Stichprobe: heterogene Stichprobe: homogene nichtsymmetrische Stichproben: linksschief rechtsschief 9 Vermutung: Gleichverteilung? Normalverteilung? Überlagerung von zwei Normalverteilungen?