Statistik Vorlesug,. ärz, Statistische aßzahle Iformatio zu verdichte, Besoderheite hervorzuhebe ittelwerte Aufgabe: die Lage der Verteilug auf der Abszisse zu zeige. Der odus: derjeige Wert, der im Häufigste vorkommt. Bei icht klassifizierte Date ka ma es eifach ablese Bei klassifizierte Date es ist durch die folgede ormel gegebe: f o = xu + i wobei o=odus, f f + x u =Klasseutergreze der Klasse, i die der odus fällt f =Häufigkeit dieser Klasse. f - =Häufigkeit der vorhergehede Klasse. f + =Häufigkeit der achfolgede Klasse. i=klassebreite, es soll bei alle drei Klasse gleich sei Pukte Pukteverteilug (Statistikklausure,,) Azahl Azahl - b.u. - b.u. - b.u. o(): x u =, f =, f - =, f + =, i=, daraus o=+*9/= Pukte. o(): x u =, f =, f - =, f + =, i=, daraus o=+*/= Pukte. Es fällt immer i die häufigste Klasse (also zwische ud i ud ud für ). - b.u. Der edia Es ist das Wert, die der Größe ach geordete Reihe halbiert. Bei icht klassifizierte Date: a/ Azahl der Beobachtuge ist eie ugerade Zahl: es gibt ei eiziges Wert, der i der itte steht. : Umsatz-Werte i iliale:,,, 9, (t) Der edia ist: t b/ Azahl der Beobachtuge ist eie gerade Zahl: der edia ist die itte beide mittlere Werte. : Umsatz-Werte i iliale:,,, 9,, (t). Der edia ist: t. Der edia für klassifizierte Werte z = xu + f wobei z=edia, x u =Klasseutergreze der Klasse, i die der edia fällt (bei dere die kumulierte relative Hfgk. erstmal grösser als / wird). f u =Häufigkeit alle vorhergehede Klasse. f e =Häufigkeit der Eifallsklasse. i=klassebreite der Eifallsklasse. =Azahl der Beobachtuge. e u i Pukte Pukteverteilug (Statistikklausure,,) Azahl Azahl - b.u. - b.u. - b.u. e(): x u =, =, f u =, f e =, i=, daraus e=+*(-)/=9, Pukte. e(): x u =, =, f u =, f e =, i=, daraus e=+*(-)/= Pukte. Es fällt immer i die Eifallklasse. Bei assymetrische Verteiluge es ist besoders gut geeiget. Es ist icht empfidlich a Extremwerte (Ausreisser). - b.u.
Das arithmetische ittel Summe der Beobachtuge dividiert durch dere Azahl x + x + x +... + x x = Rechugserleichterug (awedbar we die selbe Werte mehrmals auftrete; auch für klassifizierte Date), gewogees arithmetische ittel: xf + xf +... + xkfk x = wobei die erkmalausprägug x i war mit Häufigkeit f i beobachtet, f + f + f +...+ f k = (bei klassifizierte Date x i ist die Klassemitte). Pukte Pukteverteilug (Statistikklausure,,) Azahl Azahl - b.u. - b.u. - b.u. Arithm. ittel (): (*+*+*+*)/=, Pukte. Arithm. ittel (): (*+*+*+*)/=, Pukte. ür symmetrische Verteiluge liege die ittelwerte ahe zueiader. - b.u. Adere ittelwerte Geometrisches ittel: x x... x Gut geeiget zur berechug durchschittliche Äderug: y y = y y : alls die Lebeshaltugskoste habe vo bis um % erhöht, da ist die durchschittliche jährliche Steigerug,9% weil, / =,9 y y y... y Harmoisches ittel Wobei w, w,... w k sid die gewichte (w + w + w +...+ w k =) : wir habe km mit eier Geschwidigkeit vo km/h, ud eie adere km mit eier Geschwidigkeit vo km/h gefahre. User Durchschittgeschwidigkeit lautet Also x h = km/h xh = w wk +... + x x = x h k,, + Streuugsmaße Diese gebe die Abweichug der Eizelwerte vo ihrem ittelwert Die Spaweite: die Differez zwische dem größte ud dem kleiste vorkommede erkmalswert (bei klassifizierte Date die Differez zwische der Obergreze der größte Klasse ud der Utergreze der kleiste Klasse). (Statistik-Pukte) Pukte - b.u. - b.u. - b.u. - b.u. Azahl Spaweite: -= Pukte. Die mittlere Abweichug Das arithmetische ittel der absolute Betrage der Abweichuge aller Beobachtuge vom arithmetische ittel. x + x + x +... + x d = ür klassifizierte Date: x f+ x f +... + xk fk d = (=f +f +...+f k, x i ist die Klassemitte). (Statistik-Pukte) Pukte - b.u. - b.u. - b.u. - b.u. Azahl 9 Arithm. ittel: Pukte. Die mittlere Abweichug: ( - + + - + - +9 - )/=, Pukte.
Die Variaz Das arithmetische ittel der Abweichugsquadrate aller Beobachtuge vom arithmetische ittel. ( x + ( x + ( x +... + ( x x ο = ür klassifizierte Date: ) ( x f + ( x f +... + ( xk fk ο = (Statistik-Pukte) Pukte - b.u. - b.u. - b.u. - b.u. Azahl 9 Arithm. ittel: Pukte. Die Variaz: ((-) + +(-) +(-) +9(-) )/=9, Pukte. Die Stadardabweichug Quadratwurzel aus der Variaz : für Statistik-Note i σ=9, Pukte (es gibt die Abweichug, die Variaz ist mathematisch iteressat). Variatioskoeffiziet (Relative Streuug): σ V = x Zeigt das Verhältis zwische Stadardabweichug ud Arithmetisches ittel (i Prozet). Je grösser, desto höher ist die Streuug (uabhägig vo dem Eiheit). ür Statistik-Note V=9/=,%. Symmetrie Histogramm vo Pukte ür symmetrische Verteiluge, odus=edia=arithm. ittel P Histogramm vo Wartezeite i ür likssteile Verteiluge, odus<edia<arithm. ittel Pearso-Schiefemaß Zur Utersuchug vo symmetrie Pe=(Arithm.ittel-odus)/Std.Abw. Bedeutug: Pe<-,: starke assymmetrie (Rechtssteil) -, Pe<-, schwache assymmetrie (Rechtssteil) -, Pe -,: (ahezu) symmetrisch,<pe,: schwache assymmetrie (Likssteil), <Pe: starke assymmetrie (Likssteil) e Histogramm vo Pukte odus=, Arithm. ittel=,, Std.Abw=,, Pe=-, P Histogramm vo Wartezeite i odus=, Arithm. ittel=,, Std.Abw=,, Pe=, ehrdimesioales Datematerial Beobachtuge, jeder hat Werte für m erkmaler, also jeder besteht aus m erkmalauspräguge. z.b. wir otiere die Grösse ud das Umsatz verschiedee iliale (m=). Beobachtugswerte vo erkmal X (Grösse): x, x, x, x Beobachtugswerte vo erkmal Y (Umsatz): y, y, y, y Die Paare x i, y i häge zusamme (gehöre zu de selbe iliale), also die Reihefolge ist wichtig!
Die Kotigeztabelle Geeiget auch für omialskalierte Date (a, a, a k sid die erkmalauspräguge für erkmal, ud b, b, b m sid die erkmalauspräguge für erkmal ) b b b m a h, h, h,m a k h k, h k, h k,m wobei h i,j gibt die Häufigkeit diejeige Beobachtuge, die mit (a i,b j ) idetisch sid (gemeisame Häufigkeite). Radhäufigkeite h,j = h,j + h,j + +h k,j die Azahl alle Beobachtuge, die bezüglich der zweite erkmals die Ausprägug b j aufweise (auf der Kotigeztabelle ka ma diese i die letzte Zeile auftrage), sowie h l, = h l, + h l, + +h l,m ist die Azahl alle Beobachtuge, die bezüglich der erste erkmals die Ausprägug a l aufweise (auf der Kotigeztabelle ka ma diese i die letzte Spalte auftrage). Grü Brau Aufgabe: wir habe Studete die Augefarbe ud die Haarfarbe aufgeschriebe. Bereche wir die Kotigeztabelle ud die Radhäufigkeite. (Bl,Br), (Br,S), (G,Br),(G,S),(Bl,Bd),(Br,Br),(G,Br) (Bl,Bd), (Br,Bd), (G,Br),(G,Br),(Bl,Bd),(Bl,Br),(Br,S) (Bl,Br), (G,S), (G,Bd),(G,Br),(Bl,Bd),(Br,S) Auge/Haar Radhfg für Haarfarbe Blod Brau 9 Radhfg für Augefarbe = Bedigte relative Häufigkeit Verteilug (Reihe alle Relative Häufigkeite): Häufigkeit/. (: Azahl alle Beobachtuge). Die Summe ist immer! Verteilug der Augefarbe: Radhfg/= h l, /. Verteilug der erste erkmals bei gegebeer Ausprägug (z.b. b ) des zweite erkmals. : bereche wir die bedigte Verteilug für die Augefarbe bei gegebeer Haarfarbe (Bl): Haar/Auge Blod / Grü / Es ist hier h i,j /h,j für i=,...,k (: Azahl alle Beobachtuge). Brau / Auge/ Haar Bedigte relative Häufigkeit/ Verteilug der zweite erkmals bei gegebeer Ausprägug (z.b. b ) der erste erkmals. Bereche wir die bedigte Verteilug für die Haarfarbe bei gegebeer Augefarbe (Bl): Blod / Brau / Verteilug (Reihe alle Relative Häufigkeite): Häufigkeit/. (: Azahl alle Beobachtuge i die Zeile). Es ist hier h i,j /h,j für i=,...,k Uabhägigkeit Die bedigte Verteilug ist die selbe, als die ubedigte (Radverteilug): h i j /h i =h j / für alle Paare (i,j). : Geschlecht vs. Note Haufigkeite Relative Haufigkeite Schlechte N Gute Note aelich Weiblich Also: die erkmale sid uabhägig Schlechte N Gute Note aelich,, Weiblich,, Bedigte Vert. Schlechte N Gute Note alls maelich / / alls weiblich / / Radvert. (alle),,
Abhägigkeit Beipiel aus Studete-Date User, die Verteiluge: Auge/Haar Blod Brau /=, /9=, Grü /=, /9=, Die zwei Verteiluge: sid verschiede, also die erkmale sid abhägig Höhe Geschl. - - - Brau /=, /9=, -9 Radhfg für Augefarbe / 9/ (Bei Klassegreze die Date wurde zu de iedrigere Klasse zugeordet) Quatifizierug der Abhägigkeit Chi-Quadrat Statistik: ( h = ij E χ E ij ) i, j ij wo E ij ist die erwartete Häufigkeit der Ereigis (a i,b j ) uter der uabhägigkeit, also Eij = hi. h. j / Der Cramer-Zahl: χ mi{ ( k );( m ) } Es ist für uabhägige Date. C. Je grösser, desto starker ist die Zusammehag zwische die erkmale. aximales Wert. Es ist gültig auch für Nomialskalierte Date! A/H Grü Brau Summe, Hilfstabelle Beobachtete Blod Brau 9 Sum Erwartete Grü Brau Summe / / Chi-Sq= (-,) /,+ (-,) /,+ (-,) /,+ (-,) /,+ (-,) /,+ (-) /+ (-,) /,+ (-,) /,+ (-,) /,=,, =, A/H Blod / Brau / / / 9 / / / Es zeigt ei mittelstarke Zusammehag zwische Haar- ud Augefarbe. Sum ür die Studete-Date Beobachtuge Erwartuge H G G - -,, - -,, - -,9, -9-9,9, Daraus chi-sq=, ud die Cramér-Zahl lautet, =, Es zeigt eie starke Zusammeag