Statistik und Biometrie. Deskriptive Statistik I

Ähnliche Dokumente
Kleine Formelsammlung Beschreibende Statistik

h i :=h a i f i = h a i n Absolute Häufigkeit: Relative Häufigkeit: h 2 h 4 h 6 :=h der Elemente mit der Ausprägung i=6 zu der Anzahl n aller Werte

Formelsammlung zur Statistik

Statistik Einführung // Beschreibende Statistik 2 p.2/61

Formelsammlung Statistik 29. Januar 2019

Weitere Lagemaße: Quantile/Perzentile I

Praktikum Vorbereitung Fertigungsmesstechnik Statistische Qualitätskontrolle

3. Einführung in die Statistik

Statistik und Wahrscheinlichkeitsrechnung

Fakultät für Wirtschafts- und Rechtswissenschaften

Kapitel VI. Einige spezielle diskrete Verteilungen

Aufgabe 5: Grundlagen Wahr keit, Satz von Bayes und Binomialverteilung

Parameter von Häufigkeitsverteilungen

Zufallsvariable. Die Wahrscheinlichkeitsverteilung p (probability function) ist definiert durch: p(x i ) := P (X = x i ),

Weitere Lagemaße: Quantile/Perzentile II. Weitere Lagemaße: Quantile/Perzentile I. Weitere Lagemaße: Quantile/Perzentile IV

2. Schätzverfahren 2.1 Punktschätzung wirtschaftlicher Kennzahlen. Allgemein: Punktschätzung eines Parameters:

Lehrstuhl für Empirische Wirtschaftsforschung und Ökonometrie Dr. Roland Füss Statistik II: Schließende Statistik SS 2007

Univariate Verteilungen

Dr. Jürgen Senger INDUKTIVE STATISTIK. Wahrscheinlichkeitstheorie, Schätz- und Testverfahren

Streuungsmaße. Prof. Dr. Paul Reuber. Institut für Geographie. Seminar Methoden der empirischen Humangeographie

Statistik I für Studierende der Soziologie

Formelsammlung. Deskriptive Statistik und Elementare Wahrscheinlichkeitsrechnung. Prof. Dr. Ralf Runde Statistik und Ökonometrie, Universität Siegen

Formelsammlung. PD Dr. C. Heumann

Übersicht: BS - 08 BS Häufigkeitsverteilung. Häufigkeitsverteilungen. Parametrisierung. unklassiert. eindimensional. klassiert.

Wissenschaftliches Arbeiten Studiengang Energiewirtschaft

x 1, x 2,..., x n ist eine Liste von n reellen Zahlen. Das arithmetische Mittel x der Zahlen ist x = x 1 + x x n n

= 3. = 14,38... = x neu x = 0, = 97,87...%. Wie verändert sich der arithmetische Mittelwert von 20 Zahlen, wenn...

Wahrscheinlichkeitstheorie und Statistik vom

Formelsammlung. zur Klausur. Beschreibende Statistik

Statistik mit Excel Themen-Special. Peter Wies. 1. Ausgabe, Februar 2014 W-EX2013S

Reader Teil 1: Beschreibende Statistik

Kapitel 5: Schließende Statistik

Statistik. 5. Schließende Statistik: Typische Fragestellung anhand von Beispielen. Kapitel 5: Schließende Statistik

Prof. Dr. Roland Füss Statistik II SS 2008

Umrechnung einer tatsächlichen Häufigkeitsverteilung in eine prozentuale Häufigkeitsverteilung

Statistik ) 217 Haushalte 3) 2) Anzahl der TV-Geräte ) 220 Personen, 96 Personen, 285 Personen 2) 6,6. 8,7 m 1 0,06

2. Repetition relevanter Teilbereiche der Statistik

2.2.1 Lagemaße. Exkurs: Quantile. und n. p n

14 Statistische Beziehungen zwischen nomi nalen Merkmalen

1) Wahrscheinlichkeitsbegriff und Rechnen mit Wahrscheinlichkeiten. P A = lim r N LI: ={ 1 LII: LIII: P A =1 P A

Das kollektive Risikomodell. 12. Mai 2009

Musterlösung für die Klausur zur Vorlesung Stochastik I im WiSe 2014/2015

Diskrete Wahrscheinlichkeitstheorie Wiederholungsklausur

Einführung in die Wahrscheinlichkeitstheorie Lösungen zum Wiederholungsblatt

Kapitel 6 : Punkt und Intervallschätzer

Harmonisches Mittel. Streuungsmaße. Die mittlere Abweichung. Die Standardabweichung. Die Varianz. Statistik 3. Vorlesung, März 11, ,...

Thema: Mittelwert einer Häufigkeitsverteilung. Welche Informationen kann der Mittelwert geben?

Formelsammlung. PD Dr. C. Heumann

Formelsammlung Mathematik

4 Schwankungsintervalle Schwankungsintervalle 4.2

Diskrete Zufallsvariablen

(a) Richtig, die Varianz ist eine Summe quadratischer Größen.

Beispiel: p-wert bei Chi-Quadrat-Anpassungstest (Grafik) Auftragseingangsbeispiel, realisierte Teststatistik χ 2 = , p-wert: 0.

Vl Statistische Prozess und Qualitätskontrolle und Versuchsplanung Übung 3

Sind Sie mit unserem Angebot zufrieden? ja nein weiß nicht

h i Deskriptive Statistik 1-dimensionale Daten Daten und Häufigkeiten Seite 1 Nominal Ordinal Metrisch (Kardinal) Metrisch - klassiert

Übungen mit dem Applet erwartungstreu

6 Vergleich mehrerer unverbundener Stichproben

Beispiel: p-wert bei Chi-Quadrat-Anpassungstest (Grafik) Auftragseingangsbeispiel, realisierte Teststatistik χ 2 = , p-wert: 0.

3 Kritischer Bereich zum Niveau α = 0.10: K = (χ 2 k 1;1 α, + ) = (χ2 5;0.90, + ) = (9.236, + ) 4 Berechnung der realisierten Teststatistik:

f X1 X 2 Momente: Eigenschaften: Var(aX + b) = a 2 Var(X) a, b R

Statistik und Wahrscheinlichkeitsrechnung

Statistik I Februar 2005

Eingangsprüfung Stochastik,

h a 2 b 1 h a1 b 2 h a1 b 1 h a1. h a 2. h.b1 h ij h 11 h 12 h 21 a b h. j h 1. h 2. h.1 a b h i. =h i1 h i2... h i m h. j =h 1j h 2j... h k j h.

Statistik und Wahrscheinlichkeitsrechnung

Ulrich Stein Fehlerrechnung

Kennwerte Univariater Verteilungen

1 Wahrscheilichkeitsrechug 1.1 Elemete der Megelehre Morgasche Formel A \ B = A [ B A [ B = A \ B Kommutativgesetz A \ B = B \ A A [ B = B [ A Assozia

s xy x i x y i y s xy = 1 n i=1 y 2 i=1 x 2 s 1 n x n i Streudiagramme empirische Kovarianz x=5,5 y=7,5

SBP Mathe Aufbaukurs 1. Absolute und relative Häufigkeit. Das arithmetische Mittel und seine Eigenschaften. Das arithmetische Mittel und Häufigkeit

1. Wahrscheinlichkeitsrechnung. 2. Diskrete Zufallsvariable. 3. Stetige Zufallsvariable. 4. Grenzwertsätze. 5. Mehrdimensionale Zufallsvariable

Lage- und Streuungsmaße

Vl Statistische Prozess- und Qualitätskontrolle und Versuchsplanung Übung 5

Klausur 3 Kurs 11ma3g Mathematik

Korrelationsanalyse zwischen kategorischen Merkmalen. Kontingenztabellen. Chi-Quadrat-Test

3.2 Wilcoxon Rangsummentest

( ), der genau auf der Geraden ( ) 2 ( ) #( ) 8. Lineare Regression. = f i. Nach der Summe der kleinsten. mx i

n 1,n 2,n 3,...,n k in der Stichprobe auftreten. Für die absolute Häufigkeit können wir auch die relative Häufigkeit einsetzen:

Statistik, Abschnitt (1) Gegeben sei der Stichprobenvektor (X 1,..., X n ). Die Stichprobenfunktion. ˆµ k := 1 n. Xi k (1) i=1.

3. Grundbegrie der Schätztheorie

Unsere Daten. Konzentrationsmessung. Konzentrationskurve Summenkurve der Bierkonsumierung. Statistik 2. Vorlesung, Feb. 29, 2012

Kontingenztabellen. Chi-Quadrat-Test. Korrelationsanalyse zwischen kategorischen Merkmalen. 1. Unabhängigkeitstest

Formelsammlung Grundzüge der Statistik für die Veranstaltungen Statistik I und Statistik II im Grundstudium

Stochastik - Lösung (BSc D-MAVT / BSc D-MATH / BSc D-MATL)

15.4 Diskrete Zufallsvariablen

Maximum Likelihood Version 1.6

Ökonometrie Formeln und Tabellen

Wirksamkeit, Effizienz

Kapitel 2. Kapitel 1 Skalierungen. Graphische Darstellungen. Seite 1/5 Deskriptive Statistik. Aufgabe 1 Welche Skalenniveaus liegen vor?

Zentraler Grenzwert Satz

Kursthemen 5. Sitzung. Lagemaße

8. Regressionsanalyse

Einführung in die Wahrscheinlichkeitstheorie Lösungsvorschläge zu Übungsblatt 5

Tests für beliebige Zufallsvariable

Kreuztabellenanalyse und Assoziationsmaße

Es werden 120 Schüler befragt, ob sie ein Handy besitzen. Das Ergebnis der Umfrage lautet: Von 120 Schülern besitzen 99 ein Handy.

Transkript:

Statistik ud Biometrie Deskriptive Statistik I

Spruch des Tages Traue keier Statistik, die du icht selbst gefaelscht hast

Wiederholug Merkmale Beobachtugseiheite sid Träger vo Merkmale

Wiederholug Die Aufgabe vo Merkmale

Deskriptive Statistik: qualitative Merkmale = Umfag der Stichprobe (ZB: Azahl der Persoe) A i = Ausprägug des Merkmals (i=1,2,,k) Absolute Häufigkeit i Relative Häufigkeit h i = i / Adjustierte Häufigkeit h i = i /(- o )

Deskriptive Statistik: qualitative Merkmale Beispiel 21 Tabelle 21: Urliste für das Merkmal Besserug ach Salbebehadlug Patiet Besserug Patiet Besserug Patiet Besserug Patiet Besserug 1 Gerig 7 Deutlich 13 Gerig 19 Deutlich 2 Deutlich 8 Deutlich 14 Gerig 20 Gerig 3 Gerig 9 Keie Agabe 4 Deutlich 10 Gerig 16 Keie Agabe 15 Keie 21 Keie Agabe 22 Gerig 5 Gerig 11 Keie 17 Gerig 23 Gerig 6 keie 12 Keie Agabe 18 deutlich 24 Deutlich

Deskriptive Statistik: qualitative Merkmale Tabelle 22: Häufigkeite für das Merkmal Besserug ach Salbebehadlug Besserug Absolute Häufigkeit Relative Häufigkeit Adjustierte relative Häufigkeit Keie 3 125% 15% Gerig 10 417% 50% Deutlich 7 292% 35% Keie Agabe 4 166% - Gesamt 24 100% 100%

Quatitativ diskretes Merkmal Beispiel 22 Tabelle 23: Häufigkeite für das quatitativ diskrete Merkmal Azahl der Nebewirkuge Azahl der Nebewirkuge absolute Häufigkeit relative Häufigkeit (%) absolute Häufigkeitssumme relative Häufigkeitssumme 0 209 418% 209 418% 1 122 244% 331 662% 2 108 216% 439 878% 3 44 88% 483 966% 4 13 26% 496 992% 5 0 00% 496 992% 6 4 08% 500 1000%

Graphische Darstellug eies quatitativ diskrete Merkmals Abbildug 24: Stabdiagramm für das Merkmal Azahl gemeldeter Nebewirkuge

Spruch des Tages Die Statistik ist wie eie Latere im Hafe Sie diet dem betrukee Seema mehr zum Halt als zur Erleuchtug Relative Häufigkeit ist etwas, daß relativ häufig passiert Mediziische Statistik Has J Trampisch,

Quatitativ stetiges Merkmal Beispiel 23 Tabelle 24: Häufigkeitsverteilug des klassierte stetige Merkmals Alter i Jahre Klasse Alter i Jahre Klassemitte Häufigkeite (absolut/relativ) 1 (45,55] 50 2 2/24=08 2 (55,65] 60 8 8/24=033 3 (65,75] 70 11 11/24=046 4 (75,85] 80 2 2/24=008 5 (85,95] 90 1 1/24=004 Summe ----- ------ 24 1

Statistische Maßzahle Lagemaß Falls ugerade x = x + ( ) 1 2 Verteilugsfuktio F F ( x ) (1) = 1 F ( x ) = = 1 ( )

Statistische Maßzahle Lagemaß Empirische Media (Quartil) Media vs Mittelwert: CK-Wert F ( x) 05 1Quartil x 025 3Quartil x 075

Statistische Maßzahle Beispiel 24 Lfd Nr i Größe (cm) emp Verteilugsfuktio 1 155 1/16 = 00625 2 158 3 158 3/16 = 01875 4 159 4/16 = 02500 5 162 5/16 = 03125 6 165 7 165 8 165 8/16= 05000 9 165 9/16 = 05625 10 166 11 166 11/16 = 06875 12 167 12/16=07500 13 170 14 170 14/16=08750 15 176 16 176 16/16=10000 Summe 2643 F( x)

Statisische Maßzahle Lfd Nr i Größe (cm) emp Verteilugsfuktio 1 155 1/14 = 0,0714 2 158 3 158 3/14 = 02143 4 159 4/14 = 02857 5 162 5/14 = 03571 6 165 6/14= 042857 7 165 7/14 = 05000 8 166 9 166 9/14 = 064286 10 167 10/14= 071429 11 170 11/14= 07857 12 170 12/14=085714 13 176 14 176 14/14=10000 Summe 2643

Statistische Maßzahle Lagemaß Lagemaße empirisches Miimum x mi = 155 empirisches 025-Quatil (1 Quartil) x 025 = 159 alterativ 05*(x (4) + x (5) ) =1605 empirischer Media (2 Quartil) : 165 alterativ x 05 =165 empirisches 075-Quatil (3 Quartil) x 075 = 167 alterativ 05*(x (12) + x (13) ) =1685 empirisches Maximum x max = 176 Mittelwert : 165

Spruch des Tages Mittelwert ud Streuug Ei Mesch, der vo Statistik hört, dekt dabei ur a Mittelwert Er glaubt icht dra ud ist dagege, ei Beispiel soll es gleich belege: Ei Jäger auf der Etejagd hat eie erste Schuß gewagt Der Schuß, zu hastig aus dem Rohr, lag eie gute Hadbreit' vor Der zweite Schuß mit lautem Krach lag eie gute Hadbreit' ach Der Jäger spricht gaz ubeschwert voll Glaube a de Mittelwert: Statistisch ist die Ete tot! Doch wär er klug ud ähme Schrot - dies sei gesagt ih zu belehre - er würde seie Chace mehre: Der Schuß geht ab, die Ete stürzt, weil Streuug ihr das Lebe kürzt!

Statistische Maßzahle Streumaß Variaz 2 σ 1 = i 1 i= 1 ( x x) 2 Stadartabweichug σ 2 = σ = i 1 1 i = 1 ( x x) 2

Statistische Maßzahle Beispiel 24 Lfd Nr i Größe (cm) ( x x) 2 1 155-101875 103785 2 158-71875 51660 3 158-71875 51660 4 159-61875 38285 5 162-31875 10160 6 165-01875 0035 x i x i 7 165-01875 0035 8 165-01875 0035 9 165-01875 0035 10 166 08125 0660 11 166 08125 0660 12 167 18125 3285 13 170 48125 23160 14 170 48125 23160 15 176 108125 116910 16 176 108125 116910 Summe 2643 00000 540437

Statistische Maßzahle Streumaß Streuugsmaße empirische Spaweite (Rage) R = x max -x mi = 21 empirischer Iterquartilsabstad q = x 075 - x 025 = 8 empirische Variaz: 2 σ = 360292 empirische Stadardabweichug: σ = 60024

B A Deskriptive Statistik II - Kotigeztafel B 1 B 2 B j B q Zeile summe A 1 11 12 1j 1q 1 A 2 21 22 2j 2q 2 A i i1 i2 ij iq i A p p1 p2 pj pq p Spalte summe 1 2 j q =

Beispiel 31 Kotigeztafel = 20 Patiete Merkmale Therapie (TAD/TAD, TAD/HAM), Therapieergebis (PR=Partial Remissio, ED = Early Death, NR= No Respoder, CR= Complete Remissio), Geschlecht ud Alter Ergebis Therapie CR PR NR ED Zeilesumme TAD/TAD Zeileprozet 8 80 1 10 1 10 0 0 10 100 TAD/HAM Zeileprozet 5 50 1 10 1 10 3 30 10 100 Spaltesumme Zeileprozet 13 65 2 10 2 10 3 15 20 100

Kotigeztafel Zum Vergleich = 140 Ergebis Therapie CR PR NR ED Zeile summe TAD/TAD Zeileprozet 48 6575 5 685 13 1781 7 959 73 100 TAD/HAM Zeileprozet 47 7015 3 448 12 1791 5 746 67 100 Spaltesume Zeileprozet 95 6786 8 571 25 1786 12 857 140 100

Regressio ud Korrelatio Beispiel 32 N=15 Patiete

Regressio ud Korrelatio a = i= 1 ( x x)( y y) i i= 1 b = y ax i ( x x) i 2 S = ( x x)( y y) xy i i i= 1 (KOVARIANZ) 2 2 1 Sxx = ( xi x) = xi xi i= 1 i= 1 i= 1 2 1 S = xy x y xy i i i i i= 1 i= 1 i= 1 (VARIANZ)

Nr RR dias (X) RR sys (Y) x 2 xy y 2 1 80 120 6400 9600 14400 2 70 115 4900 8050 13225 3 80 125 6400 10000 15625 4 70 110 4900 7700 12100 5 70 115 4900 8050 13225 6 80 130 6400 10400 16900 7 85 140 7225 11900 19600 8 75 120 5625 9000 14400 9 75 125 5625 9375 15625 10 90 150 8100 13500 22500 11 80 140 6400 11200 19600 12 70 135 4900 9450 18225 13 95 140 9025 13300 19600 14 75 130 5625 9750 16900 15 90 145 8100 13050 21025 Σ 1185 1940 94525 154325 252950 / 79 12933 630167 1028833 1686333

Regressio ud Korrelatio 2 1 2 1 2 S = x ( x ) = 94525 (1185) = 910 xx i i 15 1 1 S = xy ( x y) = 154325 ( 1185 1940) = 1065 xy i i i i 15 S xy 1065 a = = = 117033 b = y ax = 12933 117 79 = 368773 S 910 xx

Regressio ud Korrelatio

Regressio ud Korrelatio r = S S xx xy S yy r 2 2 xy = S xx S S yy

Regressio ud Korrelatio

Aalytische Statistik Wahrscheilichkeit p, Gegewahrscheilichkeit q Zufallsvariable x Wahrscheilichkeitsfuktio f(x) Verteilugsfuktio F(x) Erwartugswert µ Variaz σ 2

Kombiatorik Baumdiagramm Multiomialkoeffiziet Biomialkoeffiziet ( ) k ( 1) ( k + 1) = =! k! k!( k)!

Biomialverteilug Wie hoch ist die Wahrscheilichkeit, dass bei 10 mal Würfel 3 mal eie 6 erscheit? Die Eizelwahrscheilickeit ist p=1/6 Die Azahl der Möglichkeite um 3 mal eie 6 bei 10 Versuche ist 10 Die Gesamtwahrscheilichkeit ist 3 10 1 5 P( X = 3) = 3 6 6 3 120 0,00463 0,279 7 = 0,155

Biomialverteilug (10,1/6) p 0,35 0,3 0,25 0,2 0,15 0,1 0,05 0 0 1 2 3 4 5 6 7 8 9 10 k (10,1/6)

Biomialverteilug ( ) P( X = k) = k p (1 p) Erwartugswert ud Variaz E( X) = E Yi = EY ( i) = p i= 1 i= 1 k k V( X) = V Yi = VY ( i) = p (1 p) i= 1 i= 1

Poissoverteilug Voraussetzug: λ=*p, sehr groß, p sehr klei k Faktore λ k 1 k k ( 1) ( 2) ( k + 1) λ B (, pk, ) = ( k ) p(1 p) = k k! λ 1 k Faktore k λ λ ( 1) ( 2) ( k + 1) 1 = 1 k! λ 1 k k Faktore, lim = 0 1 2 k 1 k 1 1 1 1 k λ λ λ λ = 1 = e = P, k k k! λ k! 1 λ lim = e lim = 1 k k ( λ )

Poissoverteilug Beispiel 44 Die mittlere Azahl dem Kiderkrebsregister i Maiz gemeldeter Maligome betrug i de letzte zeh Jahre etwa 12 Fälle pro Jahr auf 100000 Kider Die Biomialverteilug mit =100000 ud p=12/100000 gibt a, wie groß die Wahrscheilichkeit ist, daß zb im kommede Jahr k=0,1,2, Fälle pro 100000 Kider gemeldet werde Die Wahrscheilichkeit für zb k=12 Fälle beträgt ach der Formel für die Biomialverteilug 011437478 Für die Poissoverteilug mit dem Parameter l = (12/100000)*100000 = 12 ergibt sich mit 011436792 ahezu der gleiche Wert