Beschreibung eines Merkmals

Ähnliche Dokumente
Statistik Einführung // Beschreibende Statistik 2 p.2/61

Univariate Verteilungen

Parameter von Häufigkeitsverteilungen

Kennwerte Univariater Verteilungen

Streuungsmaße. Prof. Dr. Paul Reuber. Institut für Geographie. Seminar Methoden der empirischen Humangeographie

Umrechnung einer tatsächlichen Häufigkeitsverteilung in eine prozentuale Häufigkeitsverteilung

Reader Teil 1: Beschreibende Statistik

Sind Sie mit unserem Angebot zufrieden? ja nein weiß nicht

Weitere Lagemaße: Quantile/Perzentile I

Kapitel XI - Korrelationsrechnung

Jugendliche (18-24 Jahre) in Westdeutschland

Kursthemen 5. Sitzung. Lagemaße

Lage- und Streuungsmaße

Weitere Lagemaße: Quantile/Perzentile II. Weitere Lagemaße: Quantile/Perzentile I. Weitere Lagemaße: Quantile/Perzentile IV

Deskriptive Statistik

Formelsammlung. zur Klausur. Beschreibende Statistik

Statistik I für Studierende der Soziologie

2.2.1 Lagemaße. Exkurs: Quantile. und n. p n

Eindimensionale Darstellungen

(a) Richtig, die Varianz ist eine Summe quadratischer Größen.

3 Vergleich zweier unverbundener Stichproben

Kapitel 6 : Punkt und Intervallschätzer

Der Modus. Lageparameter. Beispiel (Einrichtungen) Beispiel (Lieblingsfarben) Modus. Untersuchungseinheiten U 1,...,U n. Merkmal X

Kennwerte eindimensionaler Häufigkeitsverteilungen Einführung

h i Deskriptive Statistik 1-dimensionale Daten Daten und Häufigkeiten Seite 1 Nominal Ordinal Metrisch (Kardinal) Metrisch - klassiert

2. Repetition relevanter Teilbereiche der Statistik

Übungen mit dem Applet erwartungstreu

Absolutskala: metrische Skala mit einem natürlichen Nullpunkt und einer natürlichen Einheit. (Z.B. Einwohnerzahl). Nicht alle Variablen lassen sich

Basiswissen Medizinische Statistik

Beschreibende Statistik Kenngrößen in der Übersicht (Ac)

= 3. = 14,38... = x neu x = 0, = 97,87...%. Wie verändert sich der arithmetische Mittelwert von 20 Zahlen, wenn...

x 1, x 2,..., x n ist eine Liste von n reellen Zahlen. Das arithmetische Mittel x der Zahlen ist x = x 1 + x x n n

Harmonisches Mittel. Streuungsmaße. Die mittlere Abweichung. Die Standardabweichung. Die Varianz. Statistik 3. Vorlesung, März 11, ,...

Wirksamkeit, Effizienz

h i :=h a i f i = h a i n Absolute Häufigkeit: Relative Häufigkeit: h 2 h 4 h 6 :=h der Elemente mit der Ausprägung i=6 zu der Anzahl n aller Werte

SBP Mathe Aufbaukurs 1. Absolute und relative Häufigkeit. Das arithmetische Mittel und seine Eigenschaften. Das arithmetische Mittel und Häufigkeit

Vl Statistische Prozess- und Qualitätskontrolle und Versuchsplanung Übung 5

Kapitel 2. Kapitel 1 Skalierungen. Graphische Darstellungen. Seite 1/5 Deskriptive Statistik. Aufgabe 1 Welche Skalenniveaus liegen vor?

4 Schwankungsintervalle Schwankungsintervalle 4.2

Übersicht: BS - 08 BS Häufigkeitsverteilung. Häufigkeitsverteilungen. Parametrisierung. unklassiert. eindimensional. klassiert.

Klausur vom

3 Grenzwerte. 3.1 Grenzwerte von Folgen

Die notwendigen Verteilungstabellen finden Sie z.b. hier:

6 Vergleich mehrerer unverbundener Stichproben

Statistik mit Excel Themen-Special. Peter Wies. 1. Ausgabe, Februar 2014 W-EX2013S

WISTA WIRTSCHAFTSSTATISTIK

Kapitel 5: Schließende Statistik

Vl Statistische Prozess und Qualitätskontrolle und Versuchsplanung Übung 3

1 Randomisierte Bestimmung des Medians

Mathematik 2 für Naturwissenschaften

Statistik Einführung // Konfidenzintervalle für einen Parameter 7 p.2/39

Ulrich Stein Fehlerrechnung

Statistik und Biometrie. Deskriptive Statistik I

14 Statistische Beziehungen zwischen nomi nalen Merkmalen

Tests statistischer Hypothesen

,,, xn. 3. Intervallschätzungen Zufallsstichproben und Stichprobenfunktionen Zufallsstichproben. Zufallsvariablen mit

Empirische Verteilungsfunktion

Lösungen zum Thema Folgen und Reihen

3. Einführung in die Statistik

Statistik. 5. Schließende Statistik: Typische Fragestellung anhand von Beispielen. Kapitel 5: Schließende Statistik

Wirksamkeit, Effizienz. Beispiel: Effizienz. Mittlerer quadratischer Fehler (MSE) Konsistenz im quadratischen Mittel

Reihen Arithmetische Reihen Geometrische Reihen. Datei Nr (Neu bearbeitet und erweitert) Juni Friedrich W. Buckel

Es werden 120 Schüler befragt, ob sie ein Handy besitzen. Das Ergebnis der Umfrage lautet: Von 120 Schülern besitzen 99 ein Handy.

Wirksamkeit, Effizienz

Wissenschaftliches Arbeiten Studiengang Energiewirtschaft

Mathematik 2 für Naturwissenschaften

Wahrscheinlichkeitstheorie und Statistik vom

Lehrstuhl für Empirische Wirtschaftsforschung und Ökonometrie Dr. Roland Füss Statistik II: Schließende Statistik SS 2007

15.4 Diskrete Zufallsvariablen

Unsere Daten. Konzentrationsmessung. Konzentrationskurve Summenkurve der Bierkonsumierung. Statistik 2. Vorlesung, Feb. 29, 2012

n 1,n 2,n 3,...,n k in der Stichprobe auftreten. Für die absolute Häufigkeit können wir auch die relative Häufigkeit einsetzen:

Folgen und Reihen. 23. Mai 2002

Messeinheit in gleichen Abständen (Punkteskala, kg, cm, Jahre) Kapitel 3: Deskription Reihenfolge Beschreibung der Daten: (sehr - eher -

a) Histogramm der Verteilung: Zunächst werden die gegebenen Messwerte in aufsteigender Reihenfolge sortiert:

= a n: Wurzelexponent x: Radikand oder Wurzelbasis a: Wurzelwert Bei der ersten Wurzel wird einfach das Wurzelzeichen weggelassen.

Wahrscheinlichkeit & Statistik Musterlösung Serie 13

WISTA WIRTSCHAFTSSTATISTIK

Grundsätzlich sollen Varianz bzw. Standardabweichung Maße dafür sein, wie stark eine Verteilung um ihren Erwartungswert streut.

4.1 Dezimalzahlen und Intervallschachtelungen. a) Reelle Zahlen werden meist als Dezimalzahlen dargestellt, etwa

Praktikum Vorbereitung Fertigungsmesstechnik Statistische Qualitätskontrolle

Konzentration und Disparität

Übungsaufgaben - Organisatorisches

Der Vergleich eines Stichprobenmittelwertes mit einem Populationsmittelwert

( ), der genau auf der Geraden ( ) 2 ( ) #( ) 8. Lineare Regression. = f i. Nach der Summe der kleinsten. mx i

, h(1) =, h(2) = c. a) Säulendiagramm siehe Tafel- oder Folienskizze b) Ermittlung von c: Die Summe der relativen Häufigkeiten muss 1 sein: c = 4 9

3 Folgen, Reihen, Grenzwerte 3.1 Zahlenfolgen. Beispiele: 1, 2, 3, 4, 5,. 1, 3, 5, 7, 9, 3, 6, 9, 12, 15, 2, 4, 8, 16, 32, 64, 10, 100, 1.000, 10.

Zusammenfassung: Folgen und Konvergenz

So lösen Sie die Gleichung für den Korrelationskoeffizienten

Prof. Dr. Roland Füss Statistik II SS 2008

Kleine Formelsammlung Beschreibende Statistik

Übungsaufgaben - Organisatorisches

Diskrete Wahrscheinlichkeitstheorie Wiederholungsklausur

FormelnfürdieAnzahlmöglicherQuadrateaufn*nSpielfeldern

Dritter Zirkelbrief: Ungleichungen

Normalverteilung. Voraussetzung und verwandte Themen. Einführung. Ziel und Nutzen. Grundlagen

Statistik und Wahrscheinlichkeitsrechnung

Arithmetische und geometrische Folgen. Die wichtigsten Theorieteile. und ganz ausführliches Training. Datei Nr

Statistische Maßzahlen. Statistik Vorlesung, 10. März, Beispiel. Der Median. Beispiel. Der Median für klassifizierte Werte.

Beispiel: p-wert bei Chi-Quadrat-Anpassungstest (Grafik) Auftragseingangsbeispiel, realisierte Teststatistik χ 2 = , p-wert: 0.

Transkript:

53 Beschreibug eies Merkmals.1 Methode der uivariable Statistik 5.2 Lagemaße 55.2.1 Arithmetisches Mittel 55.2.2 Media 56.2.3 Quartile ud Quatile 58.2. Modus 59.2.5 Geometrisches Mittel 60.2.6 Harmoisches Mittel 60.3 Streuugsmaße 61.3.1 Variaz ud Stadardabweichug 61.3.2 Variatioskoeffiziet 62.3.3 Spaweite 6.3. Weitere Streuugsmaße 6. Formmaße 65..1 Schiefe 65..2 Wölbug 67.5 Vergleich mehrerer Stichprobe 68.5.1 Beispiele für Gruppevergleiche 68.5.2 Grafische Darstelluge 68.5.3 Aforderuge a die Stichprobe 70.5. Ausblick auf die iduktive Statistik 71 C. Weiß, Basiswisse Mediziische Statistik, DOI 10.1007/978-3-62-3261-5_, Spriger-Verlag Berli Heidelberg 2013

5 Kapitel Beschreibug eies Merkmals» We ma de Kopf i der Saua hat ud die Füße im Kühlschrak, spreche Statistiker vo eier ageehme mittlere Temperatur. (Fraz Josef Strauß, Politiker, 1915 1988).1 Methode der uivariable Statistik I diesem Kapitel werde Methode vorgestellt, mit dee sich die charakteristische Eigeschafte eies eizele Merkmals beschreibe lasse. Diese Methode werde zusammefassed als»uivariable«statistik bezeichet. Sie sid abhägig vo der Art des jeweilige Merkmals, isbesodere vo desse Skaleiveau. I 7 Kap. 3 wurde Häufigkeite behadelt. Absolute ud relative Häufigkeite köe bei jedem Skaleiveau agegebe werde; bei ordiale ud quatitative Merkmale lasse sich außerdem kumulative Häufigkeite bereche. Diagramme biete eie Überblick bezüglich der Häufigkeitsverteilug eies Merkmals. Zur quatitative Aalyse eies Merkmals bedarf es darüber hiaus aussagekräftiger statistischer Kegröße (oder Maßzahle). Ma uterscheidet hierbei: Lagemaße (oder Lokatiosmaße): Sie iformiere, i welchem Bereich sich die Stichprobewerte kozetriere (7 Absch..2). Streuugsmaße (oder Dispersiosmaße): Sie gebe Auskuft über die Variabilität der Werte (7 Absch..3). Formmaße: Sie diee dazu, die Verteilugsform quatitativ zu beschreibe (7 Absch..). Abschließede Bemerkuge zum Vergleich mehrerer Stichprobe fide sich i 7 Absch..5. i i Die Date eier Stichprobe werde allgemei mit x 1,, x bezeichet. Diese Werte bilde die sog. Urliste. Die tiefgestellte Idizes gebe ormalerweise die Reihefolge a, i der die Date erhobe wurde; sie habe darüber hiaus keie Bedeutug. Die Zahl symbolisiert de Stichprobeumfag. Die Kegröße werde aus de Date der Stichprobe ermittelt ud diee als Schätzwerte für die etsprechede Parameter der Grudgesamtheit. Ma et sie deshalb empirische Größe.

.2 Lagemaße 55.2 Lagemaße.2.1 Arithmetisches Mittel Siehe auch 7 Ahag, Mathematische Abhadlug.1. Das bekateste Lagemaß ist der Mittelwert (arithmetisches Mittel oder Durchschitt). Er wird mit x (sprich: x quer) bezeichet ud ach folgeder Formel berechet: xi i x = = 1 Es werde also alle Stichprobewerte addiert ud dere Summe durch de Stichprobeumfag dividiert. Beispiel.1: Mittelwerte Vo de Merkmale der. Tab. 2.2 lasse sich Mittelwerte für die Körpergröße, das Körpergewicht ud die geschätzte Azahl vo Weibeere bereche. Für die mittlere Körpergröße erhält ma: x m = 181,63 cm (mäliche Studete, = 0) x w = 170,09 cm (weibliche Studete, = 35) x ges = 176,2 cm (alle Studete, = 75) Es fällt auf, dass die weibliche Studete im Durchschitt wesetlich kleier sid als ihre mäliche Kommilitoe. Ob dieser Uterschied ur zufällig bedigt ist oder ei Hiweis darauf, dass weibliche Studete geerell kleier sid, ka a dieser Stelle icht beurteilt werde. Die iduktive Statistik stellt Methode zur Verfügug, die eie Etscheidug diesbezüglich gestatte (7 Kap. 10). Der Mittelwert hat dieselbe Maßeiheit wie die Date der Stichprobe. Bei eiem kleie Stichprobeumfag bis = 10 sollte er mit ur eier zusätzliche Kommastelle agegebe werde; bis = 100 erscheie zwei Stelle ud erst ab = 1000 drei zusätzliche Stelle sivoll (auch we Tascherecher oder PCs wesetlich mehr Kommastelle bereche). Asoste täuscht ma eie höhere Messgeauigkeit vor, als i Wirklichkeit gegebe ist. Der Mittelwert ist sicherlich die bekateste Kegröße der deskriptive Statistik; allerdigs wird seie Bedeutug häufig überschätzt. Viele Aweder wisse icht, dass desse Berechug icht i jedem Fall sivoll ist ud adere Lagemaße existiere, die sich zur Beschreibug eier Verteilug evetuell besser eige. Ei Nachteil des Mittelwerts besteht dari, dass er vo Ausreißer stark beeiflusst wird ud daher bei schiefe Verteiluge ei verzerrtes Bild der Verteilug wiedergibt (7 Beispiel.3). (.1)

56 Kapitel Beschreibug eies Merkmals Aus der mathematische Herleitug geht hervor, dass der Mittelwert ur da berechet werde darf, we die Differez zwische zwei Auspräguge defiiert ist. Dies setzt quatitative Merkmale voraus. Ei Mittelwert, der eiem ordiale oder gar eiem omiale Merkmal zugeordet wird, ist icht sivoll iterpretierbar (7 Beispiel.). Ob ei Merkmal aäherd symmetrisch verteilt ist, ka ahad eier grafische Darstellug (z. B. Histogramm) oder am Wert der Schiefe beurteilt werde..2.2 Media Siehe auch 7 Ahag, Mathematische Abhadlug.2. Der empirische Media (oder Zetralwert) teilt die Stichprobewerte i zwei Hälfte: Die eie Hälfte der Date ist höchstes so groß wie der Media, die adere Hälfte ist midestes so groß. Um diese Kegröße, die üblicherweise mit x (sprich: x Schlage) bezeichet wird, zu ermittel, sid die Stichprobewerte der Größe ach zu sortiere. Die geordete Werte werde mit tiefgestellte, i Klammer gesetzte Idizes versehe, sodass gilt: x () 1 x( 2)... x( ) Demach ist x (1) der kleiste Wert der Stichprobe, also das Miimum (er wird auch als x mi bezeichet); x () oder x max ist der größte Wert, das Maximum. Die sortierte Stichprobewerte et ma Ragliste. Das dazugehörede Merkmal muss midestes ordialskaliert sei, da für omial skalierte Date keie atürliche Reihefolge gegebe ist. Der empirische Media x wird i Abhägigkeit vom Stichprobeumfag ach folgeder Formel ermittelt: x + 1 2 x = x + x + 2 2 1 2 fr ugerade fr gerade (.2) Aus 7 Formel (.2) folgt, dass x etweder ei Wert der Urliste ist (falls ugerade) oder der Durchschittswert der beide mittlere Werte (falls gerade). Deshalb hat der empirische Media dieselbe Maßeiheit wie die x i -Werte ud höchstes eie Stelle mehr ach dem Dezimalkomma.

.2 Lagemaße 57 Beispiel.2: Mediae Die Date i. Tab. 2.2 sid ach Geschlecht ud Körpergröße sortiert; deshalb lasse sich die Mediae leicht ermittel. Nach 7 Formel (.2) ergebe sich für die Körpergröße folgede Werte: x m = (x m(20) + x m(21) )/2 = 182,0 cm (mäliche Studete, = 0) x w = x w(18) = 170,0 cm (weibliche Studete, = 35) x ges = x ges(38) = 175,0 cm (alle Studete, = 75) Beim ordial skalierte Merkmal»Beurteilug homöopathischer Heilverfahre«bietet sich ebefalls die Agabe des Medias a. Er beträgt 2 (Rag 38, 7 Beispiel 3.3). Da bei ordial skalierte Date die Berechug des Mittelwerts icht statthaft ist, wird stattdesse gere der Media als Lagemaß beutzt. Ei weiterer Vorteil des Medias liegt dari, dass er gegeüber Ausreißer robust ist. Ausreißer bewirke, dass Mittelwert ud Media stark voeiader abweiche. I diese Fälle ist die Verteilug schief. We Mittelwert ud Media i etwa übereistimme, ist dies ei Hiweis darauf, dass die Verteilug symmetrisch ist. Ei Vergleich der beide Lagemaße liefert demach Hiweise auf die Form der zugrude liegede Verteilug. Beispiel.3: Vergleich Mittelwert ud Media Die postoperative Krakehausaufethaltsdauer vo vier Patiete ach Appedektomie betrug, 5, 5 ud 6 Tage. Bei eiem weitere Patiete trate Komplikatioe ei; er blieb 20 Tage im Krakehaus. Aus diese füf Werte ergibt sich eie mittlere Aufethaltsdauer vo 8 Tage; der Media beträgt dagege ur 5 Tage. Der Mittelwert wird wesetlich vom Ausreißer bestimmt; er gibt die tatsächliche Verhältisse verzerrt wieder. Der Media ist dagege vo diesem Ausreißer weitgehed ubeeiflusst. Beispiel.: Media bei ordial skaliertem Merkmal Wir betrachte das ordial skalierte Merkmal»Therapieerfolg«mit de Auspräguge 0 (Patiet verstorbe), 1 (Zustad verschlechtert), 2 (keie Veräderug eigetrete), 3 (Zustad verbessert) ud (Patiet vollstädig geheilt). We jeweils die eie Hälfte der Patiete verstorbe ud die adere vollstädig geheilt ist, besagt der Media x = 2, dass bei der Hälfte der Patiete keie Veräderug oder ei schlechterer Zustad eigetrete ist, währed bei der adere Hälfte der Zustad uverädert gebliebe ist oder sich gebessert hat. Es ist jedoch vollkomme silos, aus de Kodieruge eie Mittelwert vo 2 zu bereche ud zu behaupte,»keie Veräderug«sei der Durchschitt zwische»tot«ud»vollstädig geheilt«. Bei Überlebeszeitaalyse hat der Media de Vorteil, dass er bereits berechet werde ka, achdem die Hälfte der Studieteilehmer verstorbe ist. Um eie Mittelwert zu bereche, müsste ma de Tod aller Utersuchugseiheite abwar-

58 Kapitel Beschreibug eies Merkmals te. Bei Studie zur Dosisfidug eies Pharmakos etspricht der Media der Dosis, die bei der Hälfte der Utersuchugseiheite eie Effekt erkee lässt..2.3 Quartile ud Quatile Währed der Media die Stichprobe i zwei Hälfte eiteilt, uterteile die Quartile die Stichprobe i vier Viertel. Uteres oder 1. Quartil Q 1 : Es besagt, dass 25% der Stichprobewerte kleier als oder gleich Q 1 sid, währed demetspreched 75% der Werte größer als oder gleich Q 1 sid. Oberes oder 3. Quartil Q 3 : Aalog gilt, dass 75% der Werte maximal so groß wie Q 3 ud die Werte des restliche Viertels midestes so groß wie Q 3 sid. Mittleres oder 2. Quartil Q 2 : Es etspricht dem Media x. Eie weitere Verfeierug der Häufigkeitsverteilug gestatte die Quatile (oder Fraktile) x α, die für alle reelle Zahle α mit 0 < α < 1 defiiert sid. Ei α-quatil wird folgedermaße berechet: Ma ermittelt zuächst de Wert α. ud davo abhägig eie Ragzahl k ud das Quatil x α ach folgede Formel: Falls α. keie gaze Zahl ist, sei k die direkt auf α. folgede gaze Zahl ud x α = x ( k) (.3) Falls α. eie gaze Zahl ist, sei k = α. ud x( k) + x( k+ 1) x α = 2 (.) Spezielle Quatile sid der Media (α = 0,50) sowie die beide Quartile (α = 0,25 bzw. α = 0,75). Vo Dezile spricht ma, falls α = 0,1, 0,2,, 0,9; vo Perzetile bei 2-stellige Kommazahle α = 0,01,, 0,99. Media, Quartile ud alle sostige Quatile lasse sich über die empirische Verteilugsfuktio F(x) beschreibe ud grafisch abschätze (. Abb. 3.6). Aus dere Defiitio folgt ämlich, dass der Media der kleiste Wert ist, für de gilt: F(x ) 0,5. Aalog sid die beide Quartile ud die adere Perzetile defiiert. So lässt sich aus der Verteilugsfuktio für das Merkmal»Eistellug zu homöopathische Heilverfahre«(7 Beispiel 3.3), direkt etehme, dass der Wert 2 de Media, das utere Quartil ud +2 das 9. Dezil repräsetiere. Die Agabe eies Perzetils ka sehr hilfreich sei, um eie Messwert größemäßig eizuorde. So werde etwa i der Kiderheilkude die idividuelle Werte eies Kides bezüglich Größe, Gewicht oder Kopfumfag mit de altersgemäße

.2 Lagemaße 59 5%- ud 95%-Perzetile vergliche, um zu beurteile, ob es Auffälligkeite i der Etwicklug gibt. Beispiel.5: Quartile ud Dezile Wir bestimme mit Hilfe der Ragliste i. Tab. 2.2 eiige Quatile bezüglich der Körpergröße weiblicher Studete ach 7 Formel (.3): 1. Quartil: α. = 0,25. 35 = 8,75; also k = 9 ud Q 1 = x (9) = 168 cm 3. Quartil: α. = 0,75. 35 = 26,25; also k = 27 ud Q 3 = x (27) = 173 cm 9. Dezil: α. = 0,90. 35 = 31,5; also k = 32 ud x 0,90 = x (32) = 176 cm Daraus folgt, dass eie 16 cm große Studeti bezüglich ihrer Körpergröße im utere Viertel liegt, währed eie 180 cm große Kommilitoi de obere 10% agehört.!! Cave I der Literatur werde teilweise etwas adere Berechugsarte vorgeschlage, die jedoch ähliche Werte wie 7 Formel (.3) ud 7 Formel (.) liefer. I jedem Fall ist zu beachte, dass derlei Agabe ur bei eiem etspreched hohe Stichprobeumfag sivoll sid. Aufgrud der Berechugsvorschrifte ist jedes Quatil idetisch mit eiem Stichprobewert oder dem Durchschitt aus zwei beachbarte Werte..2. Modus Der Modus (auch Modalwert oder Dichtemittel geat) ist die Ausprägug mit der größte Häufigkeit. Er wird mit dem Buchstabe D (oder M) abgekürzt ud ka bei alle Skaleiveaus ermittelt werde. Bei Date, die i Klasse eigeteilt sid, gibt ma gere die modale Klasse a (das ist die Klasse mit der größte Besetzugszahl) ud bezeichet dere Mitte als Modus. Beispiel.6: Modalwerte Der Modus bei der Beurteilug homöopathischer Heilverfahre ist 0 (also eutral). Die etsprechede Häufigkeit ist 17 (23%). Die modale Klasse bei der Körpergröße der Studete ist theoretisch die. Klasse (167,5 cm; 172,5 cm) mit dem Modus 170 cm (7 Beispiel 3.2). Ahad der grafische Darstellug ist erkebar, ob die Verteilug eigipflig (uimodal), zweigipflig (bimodal) oder mehrgipflig (multimodal) ist. Zwei- ud mehrgipflige Verteiluge beobachtet ma i der Regel bei heterogee Populatioe, we sich mehrere Verteiluge überlappe. U-förmige Verteiluge sid durch zwei Modalwerte a ihre Räder ud eie Tiefpukt i der Mitte charakterisiert (. Abb..1e). Der Mittelwert eier solche Verteilug repräsetiert eie atypische Wert. Ei Beispiel ist das Merkmal»Eistellug zu homöopathische Heilmethode«. Es gibt i der

60 Kapitel Beschreibug eies Merkmals Gesamtbevölkerug viele Ablehede, viele Zustimmede, aber weig Neutrale mit Werte i der Mitte der Skala. Die Date i. Tab. 2.2 lege allerdigs ahe, dass die befragte Studete tedeziell eie egative Eistellug habe..2.5 Geometrisches Mittel*** Das geometrische Mittel wird bei relative Äderuge verwedet, bei dee sich der Uterschied zweier Merkmalswerte sivoller durch eie Quotiete als durch eie Differez beschreibe lässt. Dies ist der Fall bei Verdüugsreihe (z. B. bei Atikörpertiter i der Immuologie) oder Wachstumserscheiuge. We x i die relative Äderuge bezeiche (wobei x i > 0 ud dimesioslos), berechet sich das geometrische Mittel als: xg = x1 x (.5) Beispiel.7: Geometrisches Mittel Die Titer vo füf Kaichesere sid: 1/100, 1/200, 1/00, 1/800 ud 1/1000. Da berechet ma für das geometrische Mittel: 1 1 1 1 1 1 x G = 5 100 200 00 800 1000 36.2.6 Harmoisches Mittel*** Das harmoische Mittel diet als Lagemaß, we die Beobachtugswerte x i Quotiete sid, die sich bezüglich ihrer Neer uterscheide. Damit lässt sich etwa eie Durchschittsgeschwidigkeit oder eie durchschittliche Dichte bereche. Das harmoische Mittel ist defiiert als: xh = 1 i= 1xi (.6) Beispiel.8: Harmoisches Mittel Derselbe Weg s wird eimal mit der Geschwidigkeit v 1 = 20 km/h ud ei aderes Mal mit v 2 = 30 km/h zurückgelegt. Die Geschwidigkeite sid defiiert als Quotiete v 1 = s/t 1 bzw. v 2 = s/t 2 (wobei t 1 ud t 2 die beötigte Zeite darstelle). Zur Berechug der Durchschittsgeschwidigkeit verwedet ma das harmoische Mittel ach 7 Formel (.6): 2 v H = = 2 1 1 + 20 30

.3 Streuugsmaße 61.3 Streuugsmaße.3.1 Variaz ud Stadardabweichug Siehe auch 7 Ahag, Mathematische Abhadlug.3. Ei Mittelwert gibt zwar a, i welchem Bereich sich die Stichprobewerte kozetriere. Über die Eizelwerte sagt er jedoch weig aus, da diese mehr oder weiger stark vom Mittelwert abweiche (wie Fraz Josef Strauß durchaus richtig erkat hat). Deshalb ist es sivoll, ei Streuugsmaß azugebe, um die Variabilität der Date zu quatifiziere. Bei quatitative Merkmale ist der Mittelwert das am häufigste beutzte Lagemaß. Es liegt deshalb ahe, ei Streuugsmaß zu defiiere, das die Abweichuge der Stichprobewerte vom Mittelwert quatifiziert. Ei solches Maß ist die Variaz das ist die mittlere quadratische Abweichug der Date vom Mittelwert. We ma u (wie es ahelieged erscheit) die Variaz berechet, idem ma die Summe der Abstadsquadrate (x i x ) 2 durch dividiert, erhält ma die Variaz der Stichprobe. Allerdigs ist diese Stichprobevariaz im Durchschitt etwas kleier als die Variaz der Grudgesamtheit. Wie später (7 Absch. 8.2.3) gezeigt wird, erhält ma aus de Messwerte der Stichprobe eie optimale Schätzwert für die Variaz der Grudgesamtheit, we ma die empirische Variaz ach folgeder Formel ermittelt: ( x x) 2 x2 x 2 i i i= 1 i= 1 Var = = 1 1 Wege der quadratische Dimesio ist die Variaz schwer zu iterpretiere. Um ei Streuugsmaß mit gleicher Dimesio wie die der Stichprobedate zu erhalte, zieht ma die Wurzel aus der Variaz ud erhält die Stadardabweichug s: (.7) s = Var (.8) Die Stadardabweichug stellt ei Maß für die Homogeität bzw. Heterogeität der Stichprobe dar. Sie ist wie der Mittelwert ur bei quatitative Merkmale sivoll. Im Allgemeie ist diese Maßzahl positiv; ur im Extremfall we alle Werte idetisch sid ud die Stichprobe vollkomme homoge ist immt sie de Wert 0 a.

62 Kapitel Beschreibug eies Merkmals Beispiel.9: Stadardabweichuge Für die Stadardabweichuge der»körpergröße«berechet ma: s m = 6,1 cm (mäliche Studete, = 0) s w = 5,2 cm (weibliche Studete, = 35) s ges = 8,2 cm (alle Studete, = 75) Die»gemischte«Gruppe ist also bezüglich der Körpergröße wesetlich heterogeer als die beide Gruppe der mäliche ud der weibliche Studete. Es ist üblich, quatitative, aäherd symmetrisch verteilte Date durch de Mittelwert ud die Stadardabweichug i der Form x ± s uter Agabe des Stichprobeumfags zu charakterisiere, wie z. B. für die Körpergröße der mäliche Studete: x ± s = (181,63 ± 6,1) cm ( = 0). Die Stadardabweichug erlaubt folgede grobe Abschätzuge: Bei Normalverteiluge liege etwa 2/3 aller Werte zwische x s ud x + s; zwische de Greze x 2s ud x + 2s liege ugefähr 95% aller Werte. We ma vo eier Verteilug ur weiß, dass sie symmetrisch ud eigipflig ist, lässt sich agebe: Midestes 8/9 aller Werte liege ierhalb der Greze x ± 2s; 95% befide sich im Bereich x ± 3s. Geerell fidet ma bei alle (also auch bei schiefe) Verteiluge midestes 3/ aller Werte im Itervall x ± 2s ud 8/9 im Itervall x ± 3s. Außerdem ist die Stadardabweichug geeiget, um Eizelwerte größemäßig eizuorde ud Werte aus uterschiedliche Stichprobe zu vergleiche. Dies geschieht mit der z-trasformatio: xi x zi = s Damit erhält ma dimesioslose Werte, die agebe, um wie viele Stadardabweichuge ei Eizelwert vom Mittelwert abweicht. Ma würde beispielsweise die Körpergröße eies 180 cm große Studete als durchschittlich eischätze, seie Kommilitoi mit der gleiche Körpergröße als eher groß. Dies wird durch die trasformierte Werte z 1 = (180 181,63)/6,1 = 0,25 ud z 2 = (180 170,09)/5,2 = +1,90 bestätigt. (.9).3.2 Variatioskoeffiziet Siehe auch 7 Ahag, Mathematische Abhadlug.. Eie Stadardabweichug vo 6,1 cm bezoge auf die Körpergröße mälicher Studete mit eiem Durchschittswert vo 181,63 cm wiegt wesetlich weiger als dieselbe Stadardabweichug bezoge auf eie Gruppe vo Kleikider mit eier

http://www.spriger.com/978-3-62-3260-8