9. Logarithmische Normalverteilung

Ähnliche Dokumente
Vorkurs Mathematik für Informatiker 3 Logarithmen

Anleitung zum Applet

Demo-Text für LN-Funktionen ANALYSIS INTERNETBIBLIOTHEK FÜR SCHULMATHEMATIK. FRIEDRICH W. BUCKEL.

Statistik II. Statistische Tests. Statistik II

3. DER NATÜRLICHE LOGARITHMUS

Kapitel 2. Häufigkeitsverteilungen

Exponential- u. Logarithmusfunktionen. Funktionen. Exponentialfunktion u. Logarithmusfunktionen. Los geht s Klick auf mich!

Skript 7 Kreuztabellen und benutzerdefinierte Tabellen

Willkommen zur Vorlesung Statistik

Mathematik für Biologen

Abnahme der Intensität radioaktiver Strahlung mit der Entfernung von der Strahlungsquelle

Digitalisieren von Bildern

Statistik eindimensionaler Größen

Beispiel für Anwendung: z-tabelle kann genutzt werden, um z.b. Poissonverteilung näherungsweise zu integrieren. Beispiel: wie wahrscheinlich ist es

Biomathematik für Mediziner, Klausur SS 2001 Seite 1

Hypothesentest, ein einfacher Zugang mit Würfeln

1 Zahlen Anzahlen Reelle Zahlen Dokumentation von Messwerten Ausgewählte Übungsaufgaben...

Inhaltsverzeichnis. Teil 1 Basiswissen und Werkzeuge, um Statistik anzuwenden

Deskriptive Statistik 1 behaftet.

SPSS-Beispiel zum Kapitel 4: Deskriptivstatistische Evaluation von Items (Itemanalyse) und Testwertverteilungen

Für jede Unterrichtseinheit ist die Kompetenzentwicklung der Schülerinnen und Schüler in allen prozessbezogenen Kompetenzbereichen maßgebend.

Potenzen - Wurzeln - Logarithmen

Hochschule Bremerhaven Medizintechnik Mathcad Kapitel 6

Mittelwertvergleiche, Teil I: Zwei Gruppen

10. Klasse: Logarithmusfunktionen sind die Umkehrungen der Exponentialfunktionen. Umkehrungen beschreiben umgekehrte Zuordnungen.

- Eine typische Ausfallrate, wie sie bei vielen technischen Anwendungen zu sehen ist hat die Form einer Badewanne, deshalb nennt man diese Kurve auch

4. Kumulierte Häufigkeiten und Quantile

5 Kontinuierliches Wachstum

Computergestützte Methoden. Master of Science Prof. Dr. G. H. Franke WS 07/08

Exponentialgleichungen und Logarithmen

8. Statistik Beispiel Noten. Informationsbestände analysieren Statistik

3 log. 2 )+log(1/u) g) log(2ux) 1+ a. j) log

Statistische Auswertung in der Betriebsprüfung

Inhaltsverzeichnis 1 Rechnen 1.1 Die Zahlen 1.2 Zahlen darstellen 1.3 Addieren 1.4 Subtrahieren 1.5 Vereinfachen algebraischer Summen

Dr. I. Fahrner WiSe 2016/17 Fakultät Grundlagen Hochschule Esslingen Übungsblatt 2. Statistik

Funktionen lassen sich durch verschiedene Eigenschaften charakterisieren. Man nennt die Untersuchung von Funktionen auch Kurvendiskussion.

Wie beweise ich etwas? 9. Juli 2012

Potenzen, Potenzgesetze

Operations Research (OR) II

Mecklenburg - Vorpommern

CASIO ClassPad II von der Sek I bis zum Abitur

Statistik. Datenanalyse mit EXCEL und SPSS. Prof. Dr. Karlheinz Zwerenz. R.Oldenbourg Verlag München Wien. Von

3 Häufigkeitsverteilungen

Lineare Funktionen Geraden zeichnen Lage von Geraden Geradengleichung aufstellen

Stoffverteilungsplan Mathematik 6 auf der Grundlage der Kerncurricula 2005 Schnittpunkt 6 Klettbuch KGS Schneverdingen

Datei: AsGGL913.doc (Format von Word2000)

Beschreibende Statistik und der Übergang zur beurteilenden Statistik

BESONDERE LEISTUNGSFESTSTELLUNG 2006 MATHEMATIK

Zusammenhangsanalyse in Kontingenztabellen

Kapitel 38 Verteilungsdiagramme

Analytische Statistik II

Leistungsbeurteilung mit der 4.0 Skala Mathematik 7. Schulstufe

Korrelation und Regression

Strahlensätze anwenden. ähnliche Figuren erkennen und konstruieren. ähnliche Figuren mit Hilfe zentrischer Streckung konstruieren.

STOFFPLAN MATHEMATIK

Kapitel 5 Kenngrößen empirischer Verteilungen 5.1. Lagemaße. x mod (lies: x-mod) Wofür? Lageparameter. Modus/ Modalwert Zentrum. Median Zentralwert

Formeln in OpenOffice-Calc

EnzymeLab.

Mathematische und statistische Methoden I

Schulinterner Lehrplan des Gymnasiums Buxtehude Süd Klasse 8

Verteilungsfunktion und dquantile

Chi-Quadrat Verfahren

Monte-Carlo-Simulationen mit Copulas. Kevin Schellkes und Christian Hendricks

Labor Messtechnik Versuch 1 Temperatur

Messdatenaufbereitung mit Origin

DLP. Adolphe Kankeu Tamghe ALZAGK SEMINAR. Bremen, den 18. Januar Fachbereich Mathematik und Informatik 1 / 27

lim Der Zwischenwertsatz besagt folgendes:

Logarithmen näherungsweise berechnen

Standardisierte Vorgehensweisen und Regeln zur Gewährleistung von: Eindeutigkeit Schlussfolgerungen aus empirischen Befunden sind nur dann zwingend

Exponentialfunktion, Logarithmus

3 Vom Zählen zur Induktion

Wahrscheinlichkeitsrechnung und Statistik

Mathematik-Arbeitsblatt Klasse: Aufgabe 1 (5Z e) H2:I1:K Setze < oder > ein! a) c) e)

Kapitel 12 Stetige Zufallsvariablen Dichtefunktion und Verteilungsfunktion. stetig. Verteilungsfunktion

Funktion Das Skript erstellt ROC-Kurven mit Konfidenzbändern, berechnet (gewichtete) Cutoff-Punkte und (partial) Area under the Curve (AUC, pauc).

KGS Curriculum Mathematik Hauptschule Klasse 5

Hypothesenprüfung. Darüber hinaus existieren zahlreiche andere Testverfahren, die alle auf der gleichen Logik basieren

Arbeitsblatt Mathematik

Elektrotechnik Protokoll - Nichtlineare Widerstände

Erprobungsarbeit Mathematik

9. Kapitel: Grafische Darstellung quantitativer Informationen

Fachcurriculum Mathematik (G8) MPG Klassen 5 und 6. Bildungsplan Bildungsstandards für Mathematik. Kern- und Schulcurriculum Klassen 5 und 6

6 DATENBANKEN Datenbank. mit Spaltenüberschriften,

Produzierendes Gewerbe

Exponential- & Logarithmusfunktionen

Klausur zu Methoden der Statistik II (mit Kurzlösung) Sommersemester Aufgabe 1

Daraus ergibt sich: Eine Steigerung der Lokal-Magnitude um 1 entspricht einer Verzehnfachung des Ausschlags (denn 10 + M

Statistik. Jan Müller

Angewandte Statistik 3. Semester

von Fußböden (Systemböden)

Teil I.2 Lösen von Bestimmungsgleichungen

Mathematik leicht gemacht

Die Welt der Winkel Eine Anleitung zur Arbeit. Seite 1. Eine Anleitung zur Arbeit

Corinne Schenka Vorkurs Mathematik WiSe 2012/13. Die kleineren Zahlbereiche sind jeweils Teilmengen von größeren Zahlbereichen:

a 1 < a 2 <... < a k. 2 Häufigkeitsverteilungen 52

Lösungen zu Übung 1 (Kap. 1.5) Prof. Dr.B.Grabowski

Thüringer Kultusministerium

R. Brinkmann Seite Anwendungen der Exponentialfunktion

Transkript:

Seite 1 9. Logarithmische Normalverteilung 9 Logarithmische Normalverteilung 9.1 Transformationen 9. Logarithmische Transformation linksgipfelig verteilter Daten 9..1 Die logarithmische Skala 9.. Konstruktion einer logarithmischen Skala 9..3 Logarithmieren der Daten 9.3 Transformation rechtsgipfeliger Verteilungen 9.1 Transformationen In Kapitel 8 haben wir gesehen, dass vor einem Signifikanztest geklärt werden muss, ob die Daten normalverteilt sind. In Medizin und Biologie werden auch Daten erhoben, die nicht der Vorstellung von einer Normalverteilung entsprechen. Neben anderen Formen treten gelegentlich linksgipfelige Verteilungen auf. Um solche Daten Signifikanztesten unterziehen zu können, die Normalverteilung voraussetzen, können wir versuchen, sie so zu transformieren, dass die transformierten Daten normalverteilt sind. Zu einer Transformation müssen wir die Daten in irgendeiner Form rechnerisch bearbeiten, etwa indem wir sie mit einem Exponenten potenzieren oder radizieren. Welcher Algorithmus zum Erfolg, also dazu führt, dass die so bearbeiteten Daten dann normalverteilt sind, das hängt von der Datenstruktur ab und muss in der Regel empirisch geprüft werden. Wir wollen am Beispiel 1 eine solche Transformation durchführen. Beispiel 1 Nach Literaturangaben (Ramm, Hoffmann; Biomathematik, Enke-Verlag) ist die Anzahl der Leukozyten im menschlichen peripheren Blut linksgipfelig verteilt. In Ermangelung eines ausreichend großen Datenbestandes benutze wir hier einen fiktiven Datensatz von Leukozytenzahlen. Die Daten liegen klassiert mit der Klassenbreite,5 vor. Es soll geprüft werden, ob sie linksgipfelig verteilt sind. Wenn ja, dann sollen sie so transformiert werden, dass sie danach normalverteilt sind. KM 4.5 5. 5.5 6 6.5 7. 7.5 8. 8.5 9. 9.5 1. 1.5 11. 11.5 H 1 4 6 9 11 8 6 5 4 3 1 1 Tabelle 1, KM = Klassenmitte, alle Werte * 1 9 = Zellen/L; H = absolute Häufigkeit Wenn wir die absolute Häufigkeit der Leukozytenzahlen gegen die Klassenmitten auftragen, dann resultiert eine linksgipfelige Verteilung (Abb.1). Das gleiche Ergebnis würden wir mit den relativen Häufigkeiten erhalten. Die Verteilung ist asymmetrisch, es liegt also keine Normalverteilung vor. 1 linksgipfelige Verteilung Leukozytenwerte 1 8 absolute Häufigkeit 6 4 4. 6. 8. 1. 1. Abb. 1 *1^9 Zellen/L

Im Hinblick auf die mögliche Anwendung eines Signifikanztests wollen wir versuchen, die vorliegenden Daten so zu transformieren, das die transformierten Daten nomalverteilt sind. Seite 9.. Logarithmische Transformation links-gipfelig verteilter Daten Bei linksgipfelig verteilten Daten hat es sich als erfolgreich erwiesen, die Daten auf einer logarithmisch geteilten Abszisse oder die Logarithmen der Daten auf einer metrischen Abszisse aufzutragen. 9..1 Die logarithmische Skala Wir wollen die Daten zunächst in einem Koordinatensystem darstellen, dessen Abszisse logarithmisch geteilt ist. Dazu haben wir drei Möglichkeiten. 1. Wir nutzen die Erstellung einer logarithmischen Abszisse in einem Tabellenkalkulationssystem.. Wir verwenden das im Handel (Schleicher und Schüll) erhältliche halblogarithmische Netzpapier, dessen Abszisse über mehrere Zehnerpotenzen logarithmisch geteilt ist. Abb.. Abb. 3. Wir erstellen selber eine logarithmisch geteilte Abszisse. Zu Punkt 1. Mit dem Programm OpenOfficeCalc erhalten wir bei Gegenüberstellung der absoluten Häufigkeiten gegen die Zählwerte auf logarithmischer Abszisse die Darstellung in Abb.3. absolute Häufigkeit Log-Norm alverteilug logarithmische Abszisse 1 1 8 6 4 4. 5. 6.3 8. 1. Abb.3 * 1^9 Zellen/L Der in Abb.1 links liegende Gipfel ist deutlich zur Mitte verschoben. Die Graphik erscheint hinreichend symmetrisch um die Daten als logarithmisch normalverteilt ansehen zu können. Wir sprechen dann von einer log-normalverteilung und sagen dann Die Leukozytenzahlen sind log-normalverteilt. Zu Punkt. Die Darstellung auf dem handelsüblichen Netzpapier stellen wir hier nicht dar. Zu Punkt 3. Für den Fall, dass die Möglichkeiten 1 und ausfallen, zeigen wir hier, wie wir eine logarithmische Abszisse selber erstellen können. 9.. Konstruktion einer logarithmischen Skala Ganz einfach wäre es, die Skala von einem Rechenschieber, dessen Skalen logarithmisch geteilt sind, zu übertragen. Aber wer hat schon einen Rechenschieber? Also machen wir es mit dem Taschenrechner, dem PC oder einer Logarithmentafel. Wir verwenden Logarithmen zur Basis 1, die dekadischen oder Briggschen Logarithmen. Auf dem Taschenrechner können wir sie mit der Taste log aufrufen. (Die Taste ln generiert die

Seite 3 natürlichen Logarithmen, deren Basis die Eulersche Zahl e =,718... ist.) Wir gehen wie folgt vor: 1. Wir erstellen (am besten auf Millimeterpapier) eine metrisch äquidistant geteilte Hilfsskala mit den Zahlen bis 1 (Abb.4),1,,3,4,5,6,7,8,9 1 Abb.4. Dann generieren wir die Logarithmen für die Zahlen 1 bis 1 mit dem Taschenrechner. Sie stehen rot in der Tabelle. Zahl 1 3 4 5 6 7 8 9 1 log Zahl,31,477,6,699,778,845,93,954 1 Tabelle 3. Wir tragen die Zahlen 1 bis 1 über der äquidistanten Skala nach folgenden Angaben ein: Wir tragen die 1 über deren Logarithmus (= ) an der Skala ein. Die tragen wir über ihren Logarithmus,31 ein, und die 3 über,477 usw. Wenn die metrische Skalierung von bis 1 in Abb.5 mit dem Inkrement,1 unterteilt wäre, dann könnten wir die Zahlen sicherer Positionieren als in Abb.5. Da diese Unterteilung fehlt, können wir den Ort,477 für die 3 nur schätzen. Daher die Empfehlung für das Millimeterpapier. 1 3 4 5 6 7 8 9 1 Zahlen,1,,3,4,5,6,7,8,9 1 Logarithmen Abb.5 4. Wenn wir nun die untere Hilfsskala entfernen, dann bleibt eine Skala, auf der die Zahlen 1 bis 1 in logarithmischen Abständen aufgetragen sind. So entsteht Abb 6. Die Skala ist asymmetrisch und nicht äquidistant. Beachten Sie, dass die Abstände zwischen zwei Zahlen auch wieder logarithmisch geteilt sind. 1 3 4 5 6 7 8 9 1 Abb.6 Logarithmische Skala Auffällig an dieser Skala ist, dass der linke Teil gedehnt und der rechte gestaucht ist. Aus diesem Grunde wird eine linksgipfelige Kurve mehr oder weniger gut symmetrisiert, denn die Abstände der links von y max eng beieinander liegenden Werte werden etwas gestreckt und die rechts davon etwas gestaucht. Um Zwischenwerte eintragen zu können, müssen in entsprechender Weise die Logarithmen der Zwischenwerte ermittelt werden. Wie das geschieht, das zeigen wir hier für den Bereich 1 bis der Abb.6. Wie wir vorgehen, wenn an der logarithmischen Skala z.b. die Werte 1,1; 1,; 1,3... 1,9 eingetragen werden sollen, das zeigt die Abb. 7. Um die Zahlen 1,1 bis 1,9 besser positionieren zu können, haben wir die Strecke 1 bis 3 in Abb.7 etwas gespreizt. Wir tragen in Abb.7 die Zwischenwerte als Hilfsskala metrisch ein. Also zwischen und 3 die Werte,1;,;,3...,9. Bei Bedarf auch genauer. Dann ermitteln wir die Logarithmen für 1,1 bis 1,9 (Tabelle 3) und tragen sie in Abb.7 an der Skala ab.

Zahlen 1.1 1. 1.3 1.4 1.5 1.6 1.7 1.8 1.9 Seite 4 Logarithmen*1.41.79 1.14 1.46 1.76.4.3.55.79 Tabelle 3 1 3 4 5 6 7 8 9 1 Zahlen,1,,3,4,5,6,7,8,9 1 Logarithmen 1,1 1, 1,3 1,4 1,5 1,6 1,7 1,8 1,9,5,1,15,,5,3 Abb. 7 Entfernen wir nun die Logarithmen (Hilfsskala) unter der Abszisse, dann haben wir in Abb.8 eine logarithmische Skala über den Bereich bis,. Beachten Sie, dass die Abstände nicht metrisch gleich sind! 1 1,1 1, 1,3 1,4 1,5 1,6 1,7 1,8 1,9 Abb.8 In entsprechen der Weise könnten wir den Rest der Skala unterteilen. Die Klassenmitten in Beispiel 1 haben eine Spanne von 4,5 bis 11,5. Um sie auf der logarithmischen Abszisse aufzutragen, benötigen wir zwei Zehnerpotenzen, wozu wir zwei der soeben erstellten Skalen hintereinander zeichnen wie das die Abb.9 zeigt. 1 3 4 5 6 7 8 9 1 4 6 8 1 Abb.9 Um die Werte 4,5; 5,; 5,5; 6,5 bis 11,5 eintragen zu können, müssen die Abstände zwischen zwei Zahlen der Skala wie vorhin gezeigt wieder logarithmisch geteilt werden. Wir dürfen nicht den Fehler begehen, die Abstände metrisch zu teilen. Wir dürfen die 4,5 also nicht in der metrischen Mitte zwischen 4 und 5 eintragen. Wenn Sie sich die Mühe machen und eine Graphik mit der in Abb.9 gezeigten Abszisse erstellen, dann erhalten Sie den gleichen Kurvenverlauf wie in Abb.3. Damit haben wir jetzt zwar den graphischen Hinweis auf eine logarithmische Normalverteilung, aber noch keine Möglichkeit, die Daten einem Signifikanztest unterziehen zu können. Um normalverteilte Daten zu erhalten müssen wir die Originaldaten (Klassenmitten) logarithmieren. 9..3 Logarithmieren der Daten Zur logarithmischen Transformation müssen wir für die Daten - stellvertretend stehen hier die Klassenmitten - die Logarithmen ermitteln. In Anlehnung an die Transformation bei der Standardisierung der Normalverteilung bezeichnen wir die transformierten Werte mit dem Zeichen z. Bei logarithmischer Transformation gilt also z = log x. Die Logarithmen der Klassenmitten sind in der Tabelle 4 rot eingetragen.

Seite 5 [Würden wir mit nicht klassierten Werten sondern mit den Originalwerten arbeiten, so müsste die gesamte Berechnung mit den Logarithmen der Originaldaten durchgeführt werden.] KM 4.5 5. 5.5 6 6.5 7. 7.5 8. 8.5 9. 9.5 1. 1.5 11. 11.5 H 1 4 6 9 11 8 6 5 4 3 1 1 z = log KM Tabelle 4,653,699,74,778,813,845,875,93,99,954,978 1, 1,1 1,41 1,61 Wir tragen die absoluten Häufigkeiten gegen die Logarithmen der Klassenmitten auf einer metrischen Abszisse auf. Die Abb.1 zeigt die gleiche symmetrische Kurve wie Abb.3. Die Abstände der Daten links von y max. sind auseinander gezogen worden und die der Daten rechts davon sind etwas gestaucht. Selbstverständlich interpretieren wir das Ergebnis wie bei Abb.3. Mit den Logarithmen der Daten könnten wir nun einen t-test durchführen, was einem späteren Kapitel vorbehalten bleibt. absolute Häuf igkeit Logarithmische Normalverteilung Leukozytenw erte 1 1 8 6 4.6.7.8.9 1. 1.1 Logarithmen de Daten Abb.1 Beide Verfahren, die Darstellung der Daten auf logarithmischer Abszisse und die Darstellung der logarithmierten Daten auf metrischer Abszisse zeigen, dass die Leukozytenzahlen in Zellen/L logarithmisch normalverteilt sind. Als Grund für die bei vielen biologischen Daten vorkommende Logarithmische Normalverteilung wird in der Literatur angegeben, dass die Zufallseinwirkungen, die den Wert einer Variablen beeinflussen, nicht additiv wirken wie bei normalverteilten Daten, sondern oft multiplikativ. Für physiologisch Interessierte sei an das Weber-Fechnersche Gesetz erinnert. Und nun in Kurzfassung das Beispiel Die folgenden, wiederum fiktiven Daten sollen als Verteilungskurve dargestellt werden. Wenn die Verteilung linksgipfelig ist, dann soll geprüft werden, ob die Daten log-normalverteilt sind. Messwert in mm 1, 1,6 15,8, 5,1 31,6 39,8 5,1 63,1 79,1 1, absolute Häufigkeit 5 1 3 5 7 5 3 1 5 Tabelle 5 Nach Bearbeitung der Daten mit einem Tabellenkalkulationssystem erhalten wir die linksgipfelige Verteilung in Abb.11.

Seite 6 8 linksgipfelig 6 Häufigkeit 4 4 6 8 1 1 Messwerte Abb.11 Wir transformieren also die Messwerte logarithmisch und erhalten Tabelle 6. z = log Messwert in mm 1, 1,1 1,199 1,31 1,4 1,5 1,6 1,7 1,8 1,9, absolute Häufigkeit 5 1 3 5 7 5 3 1 5 Tabelle 6 Da wir mit diesen Werten eine symmetrische Kurve erhalten, gehen wir davon aus, dass die Daten Logarithmisch normalverteilt sind. 8 transformiert 6 absolute Häufigkeit 4.8 1 1. 1.4 1.6 1.8. log Messwert Abb.1 Eine Transformation empirisch gewonnener Daten führt nun nicht unbedingt zu dem gewünschten Erfolg wie bei unseren fiktiven Werten. Erscheinen uns die logarithmisch transformierten Daten einer Normalverteilung nicht hinreichend approximiert, so können wir versuchen, mit anderen Transformationen zum Erfolg zu kommen. Dabei muss ein wenig experimentiert werden um den optimalen Algorithmus zu finden. Versuchen Sie mal einen selbst erstellten, fiktiven linksgipfeligen Datensatz doppeltlogarithmisch zu transformieren (z = log (log x) oder mit einem reziproken Faktor (z = 1/x). Je nach Datenstruktur erhalten Sie damit auch eine approximierte Symmetrisierung der Kurve. 9.3 Transformation rechtsgipfliger Verteilungen Rechtsgipfelige Verteilungen kommen in Biologie und Medizin selten vor. Die entsprechende Transformation muss mit dem Ziel durchgeführt werden, dass der steile rechte Schenkel der Verteilung gestreckt wird und der linke gestaucht. Umkehrungen der eben genannten Verfahren können hier zum Ziel führen. Z.B. eine Potenztransformation mit z = x a wobei wir mit dem Wert für den Exponenten a experimentieren müssen. In der Literatur wird auch eine Reziproke Wurzeltransformation mit z = (1/x) angegeben, wobei hier der Wurzelexponent so variiert werden muss, bis gegebenenfalls ein verwertbares Ergebnis herauskommt. Auch hier könnten Sie mit selbst erstellten fiktiven Daten experimentieren. Die Daten können aber so verteilt sein, dass wir nicht zu einer Normalverteilung kommen.