Statistik I. Christian Reinboth, Dipl.-Wi.Inf.(FH)

Größe: px
Ab Seite anzeigen:

Download "Statistik I. Christian Reinboth, Dipl.-Wi.Inf.(FH)"

Transkript

1 Statistik I Bachelorstudiegag Betriebswirtschaftslehre Bachelorstudiegag Wirtschaftsigeieurwese Seite 1

2 Statistik Wesetliche Kursihalte (1) Kurzvorstellug Orgaisatorisches Bücher ud Software Grudlage Statistik I Grudbegriffe Skaleiveaus Variabletype Erhebugsarte Repräsetativität Häufigkeite Absolute Häufigkeite Relative Häufigkeite Klassierug vo Date Empirische Verteilugsfuktio Lagemaße / Maße der zetrale Tedez Arithmetisches Mittel Media Perzetile (Quatile / Quartile) Modalwert / Modus Geometrisches Mittel Harmoisches Mittel Streuugsmaße Spaweite Iterquartilsabstad (Empirische) Variaz Stadardabweichug Variatioskoeffiziet Schiefe ud Wölbug Symmetrische, liks- ud rechtssteile Verteiluge Mometekoeffiziet Quartilskoeffiziet Kurtosis / Ezeß Grafische Darstellug Balke-/Kreisdiagramme Stem-ad-Leaf-Plots Streudiagramme Histogramme Bo-Plots Ekurs: Wie objektiv sid grafische Darstelluge? Seite 2

3 Statistik Wesetliche Kursihalte (2) Zuammehagsmaße Kotigeztabelle Spearma Kedall B-P-K Wie sid Korrelatioe richtig zu iterpretiere? Umgag mit fehlede Werte ud Ausreißer Lieare Regressiosaalyse Aalysevoraussetzuge Formulierug des Modells Statistik II Berechug des Modells Meth. d. kl. Quadrate Gleichugsaufstellug Iterpretatio der Koeff. Bewertug der Modellgüte Wahrscheilichkeitslehre Wesetliche Grudbegriffe Wahrscheilichkeitsbegriff Ekurs: Ve-Diagramme Aiome vo Kolmogoroff Baum-/Pfaddiagramme Additiossatz Multiplikatiossatz Theorem vo Bayes Zufallsvariable Ekurs: Der Zufallsbegriff Diskrete Zufallsvariable Stetige Zufallsvariable Diskrete Verteiluge vo Zufallsvariable Gleichverteilug Biomialverteilug Poisso-Verteilug Hypergeom. Verteilug Seite 3

4 Statistik Wesetliche Kursihalte (3) Stetige Verteiluge vo Zufallsvariable Gleichverteilug Normalverteilug Chi 2 -Verteilug t-verteilug Verteilugsapproimatio Kofidezitervalle Prizipieller Aufbau Kofidezitervall um μ Kofidezitervall um σ Kofidezitervall um p Statistische Testverfahre Chi²-Test T-Test K-S-A Festlegug der erforderliche Stichprobegröße Spaß zum Schluss: Das Ziegeproblem Klausurvorbereitug Übugsaufgabe Probeklausur Fragestude Seite 4

5 Kurzvorstellug Arbeit, Forschug ud Lehre MDKK GmbH Arbeit bei der HarzOptics GmbH Arbeit a der Hochschule Harz Bisherige Lehrerfahrug - A-Istitut der HS Harz (seit 2007) - Gegrüdet 2006, 4 Mitarbeiter/ie - Etwicklug optischer Messverfahre zur Qualitätssicherug i der Luftfahrt - Projektierug des Breitbadausbaus im Auftrag vo Kreise ud Kommue - Ferlehrgag Techische Optik - Seit 2010 Forschug im Bereich AAL ud Telepflege, seit 2013 Fudraisig - IHK-Forschugspreis Platz Hugo-Jukers-Preis Platz Hugo-Jukers-Preis NoAE Iovatio Award 2011/ Lehrbeauftragter a der HS Harz vo 2006 bis 2010 ud seit 2015 (Statistik, Marktforschug, SPSS, HTML, BIS ud strategisches Iformatiosmaagemet) - Dozet für die Harzer Hochschulgruppe (2007 bis 2008) sowie a der Sterwarte St. Adreasberg / VHS Goslar (seit 2011) Seite 5

6 Mei zetrales Forschugsthema Umweltfreudliche Beleuchtugsplaug Ieraumsimulatio mit DIALu (Sterwarte Sakt Adreasberg) Außeraumsimulatio mit DIALu (Ortsteil Freiheit i Osterode) Seite 6

7 Orgaisatorisches Wie wird dieser Kurs ablaufe? Beherrschug der Grudbegriffe vo Statistik ud Wahrscheilichkeitslehre Sichere deskriptive Aalyse vo Date Grudketisse über statistische Testverfahre ud (uivariarte) lieare Regressiosaalyse Vorlesug mit eigestreute Übuge Übugsaufgabe zur eigestädige Vorbereitug der Abschlussprüfug Klausure über 60 ud 120 Miute Seite 7

8 Empfohlee Literatur (Weitere Hiweise i der Modulbeschreibug) I. Rößler & A. Ugerer: Statistik für Wirtschaftswisseschaftler. Eie awedugsorietierte Darstellug, Spriger-Verlag, 4. Auflage, Luemburg, 2014, ISBN: G. Bourier: Beschreibede Statistik. Praisorietierte Eiführug mit Aufgabe ud Lösuge, Gabler-Verlag, 9. Auflage, Wiesbade, 2011, ISBN: C. Reiboth: Iduktive Statistik Übugsaufgabe mit Musterlösuge, ebook, GRIN-Verlag für wisseschaftliche Tete, 75 Seite, Müche, 2013, ISBN: Seite 8

9 Was ist SPSS? Statistical Package for Social Scieces SPSS ist eies der marktführede Softwareprodukte für statistische Aalyse i der Sozial- ud Gesudheitswisseschaft sowie i der Markt- ud Meiugsforschug Es wurde 1983 vo SPSS Ic., eier Ausgrüdug der Staford Uiversity, etwickelt Der Name wechselte mehrfach vo Statistical Package for Social Scieces über Superior Performig Software System ud Predictive Aalysis Software (PASW) bis zu IBM SPSS STATISTICS seit der Überahme vo SPSS Ic. durch IBM i Seite 9

10 Softwarealterative zu SPSS Für Übuge am heimische Recher PAST PSPP NSDstat - Paleotological Statistics Software Package for Educatio ad Data Aalysis (Uiversities of Copehage ad Oslo) - Ope Source- Nachbau vo SPSS - Idetische Fuktioe ud Bedieug, Look & Feel ist sehr gut vergleichbar - Etwickelt durch de Norwegia Social Sciece Data Service (Stat. Budesamt) - I Deutschlad vertriebe durch GESIS (Leibiz-Istitut für Sozialwisseschafte) date-aalysiere/software/sdstat/ Seite 10

11 Softwarealterative zu SPSS Für Übuge am heimische Recher Software URL System(e) PSPP Alle PAST Wi, Mac SSP GarySmith/StatSite/ssp.html Wi, Mac SOFA Alle SciLab Alle FreeMat Alle Gumeric Liu Seite 11

12 Teil I Grudlage Seite 12

13 Kurze Eiordug der Statistik Diverse Teilgebiete wie z.b. Aalysis, Algebra, Logik Mathematik Stochastik deskriptiv Wahrscheilichkeitstheorie eplorativ Statistik iduktiv Erhebug, Zusammefassug, Darstellug ud Aalyse vo Date sowie Methode zum Ziehe vo Schlüsse auf Grudlage vo Date - Tobias Heller Seite 13

14 Kurze Eiordug der Statistik Zusammefasse deskriptiv Darstelle Utersuche eplorativ Auffide (vo Gesetzmäßigkeite) Beschreibe Erkude Statistik Schätze Schlussfolger iduktiv Aalysiere Teste Seite 14

15 Kurze Eiordug der Statistik Streuugsmaße Lagemaße Ausreißeraalyse B-P-K deskriptiv Spearma eplorativ Histogramm Tabelle Kedall Bo-Plot Ausreißersuche Statistik Streudiagramm T-Test Regressio iduktiv K-S-A Chi²-Test Seite 15

16 Grudbegriffe der Statistik Wer eriert sich och? Grudgesamtheit / Populatio = Mege aller relevate statistische Eiheite Teilgesamtheit / Teilpopulatio = Betrachtete Teilmege eier Grudgesamtheit Stichprobe = Real utersuchte Teilmege eier Grudgesamtheit Statistische Eiheite = Eizele im Rahme eier Erhebug utersuchte Objekte Merkmal = Iteressierede Größe der statistische Eiheit (Variable) Ausprägug = kokreter Merkmalswert eier statistische Eiheit (Wert) Alle Studete a der HS Harz (davo) alle BWL-Studete (davo) geau 35 befragte Studete Alter Klaus Meier 23 Jahre Seite 16

17 Übug: Grudbegriffe der Statistik Eie Wohugsbaugesellschaft will aus der Mege aller ihrer Mieterie ud Mieter diejeige mit eiem Alter oberhalb vo 65 Jahre zum Thema seiorefreudliches Wohe befrage. Hierzu werde per Zufall 150 ältere Mieterie ud Mieter aus der Kudekartei herausgesucht ud ageschriebe. Gefragt wird uter aderem ach der persöliche Eischätzug vo barrierefreie Korridore, wobei lediglich eier der Befragte agab, dass diese für ih überhaupt icht vo Bedeutug sei. Grudgesamtheit: Teilgesamtheit: Stichprobe: Statistische Eiheit(e): Merkmal: Ausprägug: Seite 17

18 Übug: Grudbegriffe der Statistik Eie Wohugsbaugesellschaft will aus der Mege aller ihrer Mieterie ud Mieter diejeige mit eiem Alter oberhalb vo 65 Jahre zum Thema seiorefreudliches Wohe befrage. Hierzu werde per Zufall 150 ältere Mieterie ud Mieter aus der Kudekartei herausgesucht ud ageschriebe. Gefragt wird uter aderem ach der persöliche Eischätzug vo barrierefreie Korridore, wobei lediglich eier der Befragte agab, dass diese für ih überhaupt icht vo Bedeutug sei. Grudgesamtheit: Alle Mieterie ud Mieter der Wohugsbaugesellschaft Teilgesamtheit: Nur ältere Mieterie ud Mieter oberhalb vo 65 Jahre Stichprobe: 150 per Zufall selektierte ältere Mieterie ud Mieter Statistische Eiheit(e): Eizele befragte Mieterie ud Mieter Merkmal: Persöliche Eischätzug vo barrierefreie Korridore Ausprägug: Ist für Befragte überhaupt icht vo Bedeutug Seite 18

19 Statistische Skaleiveaus Welches Iformatiosiveau habe Date? Nomialskala Date sid ur Bezeichuge ohe Ragordug Feststellbar ist lediglich Gleichheit oder Ugleichheit Geschlecht, Telefoummer, Kotoummer, Geschmack Ordialskala Date köe i eie Ragordug gebracht werde Abstäde zwische Date sid aber icht iterpretierbar Schulote, Präferezragfolge, Diesträge, Zufriedeheite Itervallskala Date köe i eie Ragordug gebracht werde Abstäde zwische Date sid ebefalls iterpretierbar Temperature i Celsius oder Fahreheit, Jahreszahle Verhältisskala Wie Itervallskala ur mit atürlichem Nullpukt Temperature i Kelvi, Zeit, Streckeläge, Wassertiefe Seite 19

20 Diskrete ud stetige Variable Wie viele Auspräguge gibt es? Diskrete Variable ( zähle ) Edlich oder abzählbar uedlich viele Auspräguge Variable mit ur zwei Auspräguge sid dichotom Auge beim Würfel, Kiderzahl, Haarfarbe, Geschlecht, Berufe... Stetige Variable ( messe ) Alle Werte eies Itervalls sid mögliche Auspräguge Die Zahl möglicher Auspräguge ist somit uedlich Wassertiefe, Luftfeuchtigkeit, Wassertemperatur, Zeititervall... Quasi-stetige Variable ( ugeau messe ) Diskrete Variable mit sehr viele Auspräguge werde i der Prais oft wie stetige Variable behadelt (ud damit quasi-verstetigt ) Quasi-stetig sid auch stetige Variable, die ur diskret geau gemesse werde köe Nettoeikomme, Produktpreise... Seite 20

21 Skaleiveaus ud Variabletype Date Nomialskala meist diskret Ordialskala meist diskret Kardialskala / metrische Skala meist stetig keie Ragordug Beispiele Geschlecht Studiegag Familiestad Telefoummer Ragordug Keie iterpretierbare Abstäde Beispiele Schulote Steuerklasse Präferezrakigs Itervallskala (kei atürlicher Nullpukt) Verhältisskala (atürlicher Nullpukt) Ragordug Iterpretierbare Abstäde häufbar (mehrere Auspräguge) icht häufbar (ur eie Ausprägug) Beispiele Preis i EUR Abstad i cm Seite 21

22 Übug: Skaleiveaus ud Variabletype Wassertiefe eies Schwimmbeckes Telefoummer vo Versadkude Geschmacksrichtuge vo Speiseeis Schulote auf eier Skala vo 1 bis 6 Abstad zwische zwei Gebäude i cm Preis eies Neuwages i Euro ud Cet Haarfarbe vo Kudie im Friseursalo Temperatur eies glimmede Holzscheits Produktwertug auf eier Skala vo 1 bis 5 Studiumsote auf eier Skala vo 1,0 bis 5,0 Seite 22

23 Übug: Skaleiveaus ud Variabletype Wassertiefe eies Schwimmbeckes metrisch, stetig Telefoummer vo Versadkude omial, diskret Geschmacksrichtuge vo Speiseeis omial, diskret Schulote auf eier Skala vo 1 bis 6 ordial, diskret Abstad zwische zwei Gebäude i cm metrisch, stetig Preis eies Neuwages i Euro ud Cet metrisch, diskret Haarfarbe vo Kudie im Friseursalo omial, diskret Temperatur eies glimmede Holzscheits metrisch, stetig Produktwertug auf eier Skala vo 1 bis 5 ordial, diskret Studiumsote auf eier Skala vo 1,0 bis 5,0 ordial, diskret Seite 23

24 Methode der Dategewiug Gaz eu erhobee Date Frage: Wie werde Date erhobe? Bereits eistierede Date primärstatistisch sekudärstatistisch tertiärstatistisch Nur och aggregierte Date Methodik Ablauf Umfag Eperimet Erfassug Querschitt Lägsschitt Vollerhebug Teilerhebug Beobachtug Befragug müdlich schriftlich willkürlich zufällig bewusst Seite 24

25 Methode der Stichprobeziehug (1) Willkürliche Auswahl z.b. willkürliche Asprache vo Passatie ud Passate i eier Fußgägerzoe oder Teilehmerie ud Teilehmer eier Demo; ist größteteils wertlos, es sei de für qualitative Vorstudie Zufallsauswahl Eifache Zufallsstichprobe: Jedes Elemet der Grudgesamtheit hat die eakt gleiche Chace, i die Stichprobe aufgeomme zu werde (z.b. Zufallsauswahl aus eiem vollstädige Register aller Kude) Seite 25

26 Methode der Stichprobeziehug (2) Geschichtete Zufallsstichprobe: Durchführug mehrerer eifacher Zufallsstichprobe i disjukte Schichte der Grudgesamtheit (z.b. aus kiderlose Familie ud aus Familie mit Kider) Klumpestichprobe: Uterteilug eier Grudgesamtheit i atürliche Klumpe auf Basis eies eizele Merkmals ud aschließede Vollerhebug ierhalb dieser Klumpe (z.b. Utersuchug vo Plaquadrate auf eier Ladkarte) (Das Risiko bei diesem Verfahre besteht isbesodere i der irrtümliche Auswahl ichtrepräsetativer Klumpe) Seite 26

27 Methode der Stichprobeziehug (3) Bewusste Auswahl Quotestichprobe: Kostruktio eier Stichprobe, die ei bestimmtes Merkmal perfekt abbildet, auf Basis dieses Merkmals (z.b. Befragug vo Akademiker ud Nichtakademiker ach Bevölkerugsateile) (Das Problem bei diesem Verfahre besteht isbesodere im stetig schwidede Spielraum bei der Auswahl der letzte Fälle, die oft eie Vielzahl vo Merkmalsbediguge zu erfülle habe, daruter ggf. auch seltee oder umögliche Merkmalskombiatioe) Seite 27

28 Methode der Stichprobeziehug (4) Kozetratiosverfahre: Kozetratio auf besoders relevate Teilgesamtheite (z.b. vorragige Befragug vo Großkude i eier Kudebefragug, um dere Bedeutug widerzuspiegel) Auswahl typischer Fälle: (Möglichst objektive) Auswahl typischer Fälle (etwa typischer Kude, typischer Mitarbeiter oder typischer Studiereder) ud dere möglichst vollumfägliche Utersuchug Seite 28

29 Methode der Stichprobeziehug Frage: Wie werde Date erhobe? plalos bewusste Kostruktio willkürlich zufällig bewusst eifache Zufallsstichprobe Quoteauswahl geschichtete Zufallsstichprobe Klumpestichprobe Kozetratiosverfahre faire Zufallsauswahl Auswahl typischer Fälle Seite 29

30 Wa sid Date repräsetativ? Nicht immer stimmt die Behauptug... Eie Stichprobe ist repräsetativ, we sie alle für die Grudgesamtheit charakteristische Merkmale ud Merkmalskombiatioe getreu der reale relative Häufigkeite i der Grudgesamtheit aufweist, d.h. ei eaktes Merkmalsabbild der Grudgesamtheit darstellt Der Begriff hat eie hohe Suggestivwirkug ud wird i der Prais der Markt- ud Meiugsforschug leider sehr häufig zu Urecht verwedet Faustregel: Der Begriff sollte ur verwedet werde, we eie faire statistische Zufallsauswahl mit sehr hoher (idealerweise maimaler) Rücklaufquote aus eier klar defiierte Grudgesamtheit vorliegt Seite 30

31 Welcher Begriff ist och uklar? Grudgesamtheit Repräsetativität Klumpestichprobe Merkmal Vollerhebug Zufallsstichprobe Nomialskala Statistische Eiheit Quoteauswahl Ordialskala Ausprägug Willkürliche Auswahl Stichprobe Itervallskala Iduktive Statistik Eplorative Statistik Teilgesamtheit Verhältisskala Kardialskala Deskriptive Statistik Seite 31

32 Teil II Häufigkeite Seite 32

33 Absolute ud relative Häufigkeite Absolute Häufigkeit: Die Azahl a statistische Eiheite, die hisichtlich eies Merkmals die gleiche Ausprägug besitze (Ergebis eier eifache Zählug) Relative Häufigkeit: Die Azahl a statistische Eiheite, die hisichtlich eies Merkmals die gleiche Ausprägug besitze, im Verhältis zur Gesamtzahl der statistische Eiheite (d.h. der prozetuale Ateil der absolute Häufigkeit) Die Gesamtzahl aller absolute bzw. relative Häufigkeite (i eier Tabelle oder eier Grafik) wird als absolute bzw. relative Häufigkeitsverteilug bezeichet Beispiel: 25 Studierede werde ach ihrem Alter befragt. Vo diese 25 gebe 13 a, derzeit 24 Jahre alt zu sei. Die absolute Häufigkeit der Altersausprägug 24 liegt daher bei 13, die relative Häufigkeit dagege bei 0,52 bzw. 52% (13/25) Seite 33

34 Beispiel für eie Häufigkeitstabelle Ausprägug abs. Häufigkeit rel. Häufigkeit i % 20 Jahre 3 0,12 12,00% 21 Jahre 2 0,08 8,00% 22 Jahre 1 0,04 4,00% 23 Jahre 3 0,12 12,00% 24 Jahre 13 0,52 52,00% 25 Jahre 2 0,08 8,00% 26 Jahre 0 0,00 0,00% 27 Jahre 1 0,04 4,00% Σ Sid Häufigkeitstabelle 25 1,00 100,00% eher bei mehr oder eher bei weiger Auspräguge aussagekräftig? Seite 34

35 Bildug vo Klasse Liege i eiem Datesatz sehr viele Auspräguge vor, loht sich uter Umstäde eie Klassebildug, d.h. die Uterteilug der Date i Klasse (idealerweise gleicher Breite dazu i eiige Woche mehr) Bei der Klassebildug ist zu berücksichtige, dass eideutig defiiert werde muss, zu welcher Klasse die Elemete der jeweilige Klassegreze gehöre K g g ; K g, g ;... K g, g 1 0, j j1 j Warum liegt die Greze der zweite Klasse bei 28 statt 27 Jahre? Ausprägug abs. Häufigkeit rel. Häufigkeit i % [20 24) Jahre 9 0,36 36,00% [24 28) Jahre 16 0,64 64,00% Σ 25 1,00 100,00% Seite 35

36 Empirische Verteilugsfuktio Mit Hilfe der empirische Verteilugsfuktio lässt sich die Frage beatworte, welcher Ateil der Date eie Greze (icht) überschreitet bzw. uterschreitet: F() = Welcher Ateil der Date ist kleier oder gleich? ( höchstes ) (z.b.: Welcher Ateil der befragte Studierede ist höchstes 23 Jahre alt?) F( ) f ( a 1 )... 0 f ( a ) 1 j j für a1 fi für a j ud a j1 i1 für a k Für alle Werte kleier als die kleiste Ausprägug ist F() = 0 Für alle Werte größer als die größte Ausprägug ist F() = 1 Die empirische Verteilugsfuktio lässt sich grafisch (Treppediagramm) oder tabellarisch (Tabelle mit kumulierte absolute / relative Häufigkeite) darstelle Seite 36

37 Beispiel für eie Kumulatiostabelle Ausprägug kumulierte abs. Häufigkeit kumulierte rel. Häufigkeit kumulierte % 20 Jahre 3 0,12 12,00% 21 Jahre 5 0,20 20,00% 22 Jahre 6 0,24 24,00% 23 Jahre 9 0,36 36,00% 24 Jahre 22 0,88 88,00% 25 Jahre 24 0,96 96,00% 26 Jahre 24 0,96 96,00% 27 Jahre 25 1,00 100,00% Welcher Ateil der befragte Studierede ist höchstes 23 Jahre alt? Σ 25 1,00 100,00% Seite 37

38 Beispiel für ei Treppediagramm 100% 80% Ausprägug kumulierte % 60% 40% 20% 20 Jahre 12,00% 21 Jahre 20,00% 22 Jahre 24,00% 23 Jahre 36,00% 24 Jahre 88,00% 25 Jahre 96,00% 26 Jahre 96,00% 0% 27 Jahre 100,00% Jahre Seite 38

39 Übug: Reche mit der Verteilugsfuktio Frage: Welcher Ateil der befragte Studierede ist höchstes 23 Jahre alt? Lösugsmöglichkeit 1: Ablese aus der Kumulatiostabelle (36%) Lösugsmöglichkeit 2: Berechug mit der Verteilugsfuktio F( ) f ( a 1 )... 0 f ( a ) 1 j j für a1 fi für a j ud a j1 i1 für a k Seite 39

40 Übug: Reche mit der Verteilugsfuktio Frage: Welcher Ateil der befragte Studierede ist höchstes 23 Jahre alt? Lösugsmöglichkeit 1: Ablese aus der Kumulatiostabelle (36%) Lösugsmöglichkeit 2: Berechug mit der Verteilugsfuktio F( ) f ( a 1 )... 0 f ( a ) 1 j j für a1 fi für a j ud a j1 i1 für a k F(23) f (20) f (21) f (22) f (23) 0,12 0,08 0,04 0,12 0,36 36% Seite 40

41 Summefuktio Bei klassierte Date wird die empirische Verteilugsfuktio als stetige empirische Verteilugsfuktio oder als Summefuktio bezeichet F( ) F( g 0 g ) für für g i1 i1 i i1 di 1 * f für g g 0 k g i Aahme: Die Werte ierhalb jeder Klasse sid gleichmäßig verteilt (1) Zuächst wird der Wert der empirische Verteilugsfuktio bis zum Ede der Klasse berechet, die vor der Klasse liegt, welche de gesuchte Wert ethält (2) Aschließed wird die Differez zwische gesuchtem Wert ud uterer Klassegreze i der ächste Klasse berechet, durch die Klassebreite geteilt ud abschließed mit der relative Häufigkeit dieser Klasse multipliziert (3) Zum Schluss werde beide Summe miteiader addiert Seite 41

42 Übug: Reche mit der Summefuktio Frage: Welcher Ateil der befragte Studierede ist höchstes 25 Jahre alt? Ausprägug abs. Häufigkeit rel. Häufigkeit i % [20 24) Jahre 9 0,36 36,00% [24 28) Jahre 16 0,64 64,00% Σ 25 1,00 100,00% F( ) F( g ) 0 g für für g i1 i1 i i1 di 1 * f für g g 0 k g i Seite 42

43 Übug: Reche mit der Summefuktio Frage: Welcher Ateil der befragte Studierede ist höchstes 25 Jahre alt? Ausprägug abs. Häufigkeit rel. Häufigkeit i % [20 24) Jahre 9 0,36 36,00% [24 28) Jahre 16 0,64 64,00% Σ 25 1,00 100,00% F( g i 1) F(24) 0,36 Welche Abweichug gi * fi *0,64 di 4 0,16 ergibt sich zur Berechug mit uklassierte Date? 0,36 0,16 0,52 52% Seite 43

44 Teil III Eplorative Dateaalyse: Lagemaße / Maße der zetrale Tedez Seite 44

45 Lagemaße / Maße der zetrale Tedez Date Nomialskala meist diskret Ordialskala meist diskret Kardialskala / metrische Skala meist stetig Modus Media Quartile Quatile Perzetile Itervallskala (kei atürlicher Nullpukt) arithmetisches Mittel (ikl. gewichtet, getrimmt...) Lagemaße, die ei iedriges Skaleiveau voraussetze, köe problemlos für Datesätze mit eiem höhere Skaleiveau berechet werde Verhältisskala (atürlicher Nullpukt) geometrisches Mittel harmoisches Mittel Seite 45

46 Das arithmetische Mittel Das arithmetische Mittel ist das bekateste statistische Lagemaß (Stadardmittel) Es ka ur für metrisch skalierte Date berechet werde (Itervall-/Verhältisskala) Vorsicht: SPSS berechet das arithmetische Mittel auch für ichtmetrische Date Aweder/ie beötige daher Methodeketisse (typischer Fehler: Schulote) Liege vo eiem metrische Merkmal isgesamt Werte vor, berechet sich das arithmetische Mittel auf Basis dieser Formel: 1 i1 i Das arithmetische Mittel ist icht robust, d.h. empfidlich gegeüber Ausreißer: (1, 2, 3, 4) -> ( ) / 4 = 2,5 (1, 2, 3, 50) -> ( ) / 4 = 14 Ursache: Jeder Wert i der Verteilug beeiflusst das Mittel gleichermaße Seite 46

47 Übug: Arithmetisches Mittel Ausprägug abs. Häufigkeit rel. Häufigkeit i % 20 Jahre 3 0,12 12,00% 21 Jahre 2 0,08 8,00% 22 Jahre 1 0,04 4,00% 23 Jahre 3 0,12 12,00% 24 Jahre 13 0,52 52,00% 25 Jahre 2 0,08 8,00% 26 Jahre 0 0,00 0,00% 27 Jahre 1 0,04 4,00% Σ 25 1,00 100,00% 1 i1 i Seite 47

48 Übug: Arithmetisches Mittel Ausprägug abs. Häufigkeit rel. Häufigkeit i % 20 Jahre 3 0,12 12,00% 21 Jahre 2 0,08 8,00% 22 Jahre 1 0,04 4,00% 23 Jahre 3 0,12 12,00% 24 Jahre 13 0,52 52,00% 25 Jahre 2 0,08 8,00% 26 Jahre 0 0,00 0,00% 27 Jahre 1 0,04 4,00% Σ 25 1,00 100,00% 1 i1 i ( ) ,28 Seite 48

49 Arithmetisches Mittel bei klassierte Date Das arithmetische Mittel lässt sich auch bei klassierte Date auf Basis der relative Häufigkeite (f i ) sowie der Klassemitte (m i ) bereche g m k 1 * f1... m f * fk mi * i1 f i Welche Abweichug ergibt sich zur Berechug mit uklassierte Date? Ausprägug abs. Häufigkeit rel. Häufigkeit i % [20 24) Jahre 9 0,36 36,00% [24 28) Jahre 16 0,64 64,00% Σ 25 1,00 100,00% g ( 22*0,36) (26*0,64) 7,92 16,64 24,56 Seite 49

50 Getrimmtes arithmetisches Mittel Trete i eiem Datesatz eizele besoders große oder kleie Werte auf (sogeate Ausreißer), verzerre diese das arithmetische Mittel erheblich Möglich ist i diese Fälle etweder ei Ausweiche auf ei aderes Maß der zetrale Tedez oder die Berechug des getrimmte arithmetische Mittels Hierfür werde beispielsweise die 2% oder 5% der jeweils größte ud kleiste Werte aus dem Datesatz etfert, bevor das arithmetische Mittel berechet wird Nachteil: Da icht ur die Ausreißer etfert werde, soder die Trimmug symmetrisch erfolgt, ka es zur Etferug icht-etremer Werte komme Seite 50

51 Der Media Der Media ist derjeige Wert, der i der Mitte der geordete Verteilug liegt Die Berechug des Medias setzt daher midestes ordialskalierte Date voraus Bei eier ugerade Azahl a Werte wird der mittlere Wert der geordete Verteilug gewählt med 1 ( ) 2 Bei eier gerade Azahl a Werte wird das arithmetische Mittel der mittlere Werte gewählt med 1 2 ( ( ) ( 1) 2 2 ) Der Media ist äußerst robust, d.h. er wird vo Ausreißer kaum beeiflusst: (1, 2, 3, 4) -> Media: 2,5 (1, 2, 3, 50) -> Media: 2,5 Ursache: Nur zwei Werte (bzw. ei Wert) gehe i die Berechug ei Seite 51

52 Übug: Media Ausprägug abs. Häufigkeit rel. Häufigkeit i % 20 Jahre 3 0,12 12,00% 21 Jahre 2 0,08 8,00% 22 Jahre 1 0,04 4,00% 23 Jahre 3 0,12 12,00% 24 Jahre 13 0,52 52,00% 25 Jahre 2 0,08 8,00% 26 Jahre 0 0,00 0,00% 27 Jahre 1 0,04 4,00% Σ 25 1,00 100,00% ugerade Azahl a Werte (25): med 1 ( ) 2 Seite 52

53 Übug: Media Ausprägug abs. Häufigkeit rel. Häufigkeit i % 20 Jahre 3 0,12 12,00% 21 Jahre 2 0,08 8,00% 22 Jahre 1 0,04 4,00% 23 Jahre 3 0,12 12,00% 24 Jahre 13 0,52 52,00% 25 Jahre 2 0,08 8,00% 26 Jahre 0 0,00 0,00% 27 Jahre 1 0,04 4,00% Σ 25 1,00 100,00% med 25 1 ( ) Lässt sich dieses Ergebis auch direkt aus der Tabelle ablese? 20; 20; 20; 21; 21; 22; 23; 23; 23; 24; 24; 24; 24; 24; 24; 24; 24; 24; 24; 24; 24; 24; 25; 25; 27 Seite 53

54 Die Perzetilwerte Perzetilwerte sid Werte, uterhalb derer ei defiierter Ateil aller Werte liegt Für die Perzetilberechug müsse midestes ordialskalierte Date vorliege Der bekateste Perzetilwert ist das 50%-Perzetil der bereits bekate Media Häufig erfolgt eie Vierteilug des Wertebereichs mit de sogeate Quartile: 25%-Perzetil (25% aller Werte liege uterhalb dieses Wertes, 75% liege oberhalb) 50%-Perzetil Media (50% aller Werte liege uter- bzw. oberhalb dieses Wertes) 75%-Perzetil (75% aller Werte liege uterhalb dieses Wertes, 25% liege oberhalb) Die Quartile spiele u.a. für die Bildug vo Bo-Plots (Greze der Bo) sowie für die Uterscheidug i Ausreißer ud Etremwerte (IQR) eie Rolle Wie der Media sid auch die restliche Perzetile robust gegeüber Ausreißer Seite 54

55 Die Perzetilwerte Die Berechug vo Perzetilwerte erfolgt gemäß folgeder Formel(): Ergibt ( * p) keie gazzahlige Wert, ist k die auf ( * p) folgede gaze Zahl p (k ) Ergibt ( * p) eie gazzahlige Wert, etspricht k dem Ergebis vo ( * p) p 1 2 ( ( k ) ( k 1) ) (1) Der gewüschte Perzetilwert (z.b. 0,25 für das 25%-Perzetil) wird mit der Azahl der Werte im Datesatz () multipliziert. I viele Fälle kommt dabei ei ugerader Wert heraus, der auf de ächsthöhere Wert (k) aufzurude ist. Der gesuchte Perzetilwert etspricht i diese Fälle dem k-te Wert im Datesatz. (2) Für de Fall, dass sich bei der Multiplikatio vo ud p doch eimal eie gerade Zahl (k) ergebe sollte, wird das arithmetische Mittel des k-te Wertes im Datesatz ud des auf de k-te Wert folgede Wertes im Datesatz berechet. Seite 55

56 Perzetilwerte ud Bo-Plots Bo-Plots biete eie Verteilugsüberblick ud gestatte Verteilugsvergleiche Wesetliche Kostruktiosgröße ist der Iterquartilsabstad (IQR = 0,75 0,25 ) * Etremwert Ausreißer Größter Nicht-Ausreißer Oberes Quartil 7 IQR 4 IQR IQR Media Uteres Quartil Kleister Nicht-Ausreißer 42 Ausreißer Seite 56

57 Übug: Quartile Ausprägug abs. Häufigkeit rel. Häufigkeit i % 20 Jahre 3 0,12 12,00% 21 Jahre 2 0,08 8,00% 22 Jahre 1 0,04 4,00% 23 Jahre 3 0,12 12,00% 24 Jahre 13 0,52 52,00% 25 Jahre 2 0,08 8,00% 26 Jahre 0 0,00 0,00% 27 Jahre 1 0,04 4,00% Σ 25 1,00 100,00% Bei der Multiplikatio vo ud p ergebe sich ausschließlich icht gazzahlige Werte, daher gilt: p (k ) 0,25 = 0,50 = 0,75 = Seite 57

58 Übug: Quartile Ausprägug abs. Häufigkeit rel. Häufigkeit i % 20 Jahre 3 0,12 12,00% 21 Jahre 2 0,08 8,00% 22 Jahre 1 0,04 4,00% 23 Jahre 3 0,12 12,00% 24 Jahre 13 0,52 52,00% 25 Jahre 2 0,08 8,00% 26 Jahre 0 0,00 0,00% 27 Jahre 1 0,04 4,00% Σ 25 1,00 100,00% 0,25 0,50 0, ; 20; 20; 21; 21; 22; 23; 23; 23; 24; 24; 24; 24; 24; 24; 24; 24; 24; 24; 24; 24; 24; 25; 25; 27 20; 20; 20; 21; 21; 22; 23; 23; 23; 24; 24; 24; 24; 24; 24; 24; 24; 24; 24; 24; 24; 24; 25; 25; 27 20; 20; 20; 21; 21; 22; 23; 23; 23; 24; 24; 24; 24; 24; 24; 24; 24; 24; 24; 24; 24; 24; 25; 25; Seite 58

59 Der Modus Der Modus (oder Modalwert) ist der i de Date am häufigste auftretede Wert Bei klassierte Date etspricht der Modus die Klassemitte der Klasse mit de meiste Fälle (dies gilt allerdigs ur beim Vorliege gleichbreiter Klasse) Der Modus eiget sich vor allem für diskrete Date (Puktwahrscheilichkeit) Er wird v.a. für omialskalierte Date gebildet, für die sich kei aderes Lagemaß eiget Bei metrisch skalierte Date ka der Modus über gleichbreite Klasse gebildet werde (i dem Fall etspricht der Modus der Klassemitte der Klasse mit de meiste Werte) Vorteil: Der Modus ist ohe Rechug erkebar ud lässt sich leicht bestimme Nachteil: Der Modus ist ur iterpretierbar, we ei klares Maimum eistiert Achtug: Sid i eiem diskrete Datesatz mehrere Werte mit gleicher Häufigkeit vertrete, gibt SPSS ur de i der Häufigkeitstabelle zuoberst stehede Wert aus Seite 59

60 Modus ud Verteilugsform Uimodale Verteilug Bimodale Verteilug Multimodale Verteilug Seite 60

61 Übug: Modus Ausprägug abs. Häufigkeit rel. Häufigkeit i % 20 Jahre 3 0,12 12,00% 21 Jahre 2 0,08 8,00% 22 Jahre 1 0,04 4,00% 23 Jahre 3 0,12 12,00% 24 Jahre 13 0,52 52,00% 25 Jahre 2 0,08 8,00% 26 Jahre 0 0,00 0,00% 27 Jahre 1 0,04 4,00% Σ 25 1,00 100,00% mod 24 Warum? Seite 61

62 Zusammefassug der Lagemaße Lagemaße beschreibe das Zetrum eier Verteilug Arithmetisches Mittel Sogeates Stadardmittel Nicht robust gegeüber Ausreißer Date müsse stets metrisch skaliert sei 1 i1 i Getrimmtes arithmetisches Mittel Arithmetisches Mittel ach Etferug eiiger Raddate Trimmug der Date erfolgt stets beidseitig symmetrisch Die Trimmug des Mittels mildert Ausreißereffekte ab 1 i1 i Seite 62

63 Zusammefassug der Lagemaße Media Mittlerer Wert der geordete Verteilug Vo Ausreißer praktisch icht beeiflussbar Date müsse midestes ordialskaliert sei Für gerade ud ugerade eistiere zwei Formel med med 1 ( ) ( ( ) ( 1) 2 2 ) Perzetile Verallgemeierug des Medias Astelle vo 50% werde adere Prozetzahle gewählt I der Prais spiele vor allem Quatile ud Quartile eie Rolle Für gazzahlige ud icht gazzahlige (p) eistiere zwei Formel p (k ) p 1 2 ( ( k ) ( k 1) ) Seite 63

64 Zusammefassug der Lagemaße Modus Am häufigste auftreteder Wert i de Date Ka scho für omialskalierte Werte berechet werde Nur sivoll, we ei eizeles, klares Maimum vorliegt mod ama Geometrisches Mittel Lagemaß für relative Veräderuge (Wachstum) I solche Fälle das eizig zulässiges Lagemaß Faktore köe uterschiedlich gewichtet werde Harmoisches Mittel Kommt bei Quotiete zum Eisatz (Geschwidigkeite...) Ka aalog zum geometrische Mittel gewichtet werde... geom 1 har i1 1 i Seite 64

65 Das SPSS-Aalyseproblem SPSS führt JEDE Aalyse uabhägig vo de Voraussetzuge durch!...also auch die Berechug des arithmetische Mittels... aus Schulote... aus Geschlechter... aus Kotoummer... aus Telefoummer... aus Präferezräge Bei komplee Verfahre sid och weit schlimmere Vergehe dekbar Die fachliche Ketisse der Aweder/ie sid daher etscheided Darum: KEINE Aalyse ohe vorherige Prüfug der Voraussetzuge! Seite 65

66 Übug: Maße der zetrale Tedez Bereche: Arith. Mittel, um 5% getrimmtes arith. Mittel, Media ud Modus Schulote Azahl Schulote Azahl Bereche: Arith. Mittel, um 5% getrimmtes arith. Mittel, Media ud Modus Alter Azahl Alter Azahl Seite 66

67 Übug: Maße der zetrale Tedez Bereche: Arith. Mittel, um 5% getrimmtes arith. Mittel, Media ud Modus Schulote Azahl Schulote Azahl med mod 3 3 Bereche: Arith. Mittel, um 5% getrimmtes arith. Mittel, Media ud Modus Alter Azahl Alter Azahl ,79 get 34,80 med mod 35,50 37,00 Sagt der Modus etwas aus? Seite 67

68 Teil IV Eplorative Dateaalyse: Streuugsmaße Seite 68

69 Wozu werde Streuugsmaße beötigt? Mitarbeiter Abt. A Eikomme Mitarbeiter Abt. B Eikomme MA ,00 Euro MA ,00 Euro MA ,00 Euro MA ,00 Euro Sollte ma die Mittelwerte direkt miteiader vergleiche? MA ,00 Euro MA ,00 Euro MA ,00 Euro MA ,00 Euro MA ,00 Euro MA ,00 Euro MA ,00 Euro MA ,00 Euro Summe ,00 Euro Summe ,00 Euro Arithmetisches Mittel 2.561,67 Euro Arithmetisches Mittel 2.761,67 Euro Seite 69

70 Die Spaweite Die Spaweite ist als der absolute Abstad zwische dem jeweils kleiste (Miimum) ud größte (Maimum) Wert im utersuchte Datesatz defiiert Die Spaweite ist als Streuugsmaß i de meiste Fälle ugeüged, da sie soweit vorhade etrem stark vo Ausreißer beeiflusst wird Eistiere a beide Verteilugsräder Ausreißer, wird der Wert der Spaweite tatsächlich sogar ausschließlich (!) durch diese bestimmt (1, 2, 3, 4, 5) -> Spaweite: 4 (1, 2, 3, 4, 50) -> Spaweite: 49 Seite 70

71 Der Iterquartilsabstad Der Iterquartilsabstad (IQR = Iter Quartile Rage) ist defiiert als der Abstad zwische dem obere (75%) ud dem utere Quartil (25%) Da die Quartile bekatlich icht vo Ausreißer beeiflusst werde, köe ist der IQR als Streuugsmaß deutlich robuster als die Spaweite Quartile, Miimum ud Maimum bilde die Füf-Werte-Zusammefassug } IQR Seite 71

72 Variaz ud Stadardabweichug Die Variaz (bzw. empirische Variaz) ist das meistgeutzte Streuugsmaß Sie berechet sich als Summe der quadrierte Abweichuge der Eizelwerte (Ausgleich egativer ud positiver Abweichuge) vom arithmetische Mittel, geteilt durch die Gesamtzahl aller Werte s 2 1 i1 ( 1 ) 2 Bei der Berechug der Stichprobe-Variaz (SPSS) stehe die Freiheitsgrade im Neer Die Variaz wird immer kleier, je äher die Eizelwerte am arithmetische Mittel liege Sid alle Werte mit dem Mittel idetisch (keie Streuug), ergibt sich eie Nullvariaz Bei der Iterpretatio ist zu beachte, dass mit quadrierte Werte gerechet wird Auch die Variaz ist also i der quadrierte Eiheit dimesioiert (z.b. i ² statt i ) Die Stadardabweichug als Quadratwurzel der Variaz erleichtert die Iterpretatio Seite 72

73 Übug: Variaz ud Stadardabweichug Ausprägug abs. Häufigkeit rel. Häufigkeit i % 20 Jahre 3 0,12 12,00% 21 Jahre 2 0,08 8,00% 22 Jahre 1 0,04 4,00% 23 Jahre 3 0,12 12,00% 24 Jahre 13 0,52 52,00% 25 Jahre 2 0,08 8,00% 26 Jahre 0 0,00 0,00% 27 Jahre 1 0,04 4,00% Σ 25 1,00 100,00% s ( 1 )... ( ) i1 ( 1 ) 2 23,28 Seite 73

74 Übug: Variaz ud Stadardabweichug (20 23,28) 2 10, , ,9584 (20 23,28) 2 10, ,80 541,9584 2,8416 (25 23,28) (27 23,28) 71, , , s 2 2,8416 s 1,6857 Wie sid die Ergebisse zu iterpretiere? 71, , ,80 I welcher Eiheit stehe die Ergebisse? Seite 74

75 Streuugsmaße / Dispersiosparameter Streuugsmaße gebe Auskuft darüber, wie stark Date um das Zetrum eier Verteilug (Mittelwert) streue Empirische Variaz Mittlere quadrierte Abweichug vom arithmetische Mittel Ka daher ur für metrisch skalierte Date berechet werde Variaz ist icht robust, d.h. empfidlich gegeüber Ausreißer Die hier dargestellte Formel ist die vereifachte Rechevariate s 2 1 i1 2 i 2 Stadardabweichug Durch die Quadrierug ist die Variaz schwer iterpretierbar, da sie sich i Eiheite wie z.b. ² oder Stude² ausdrückt Die Stadardabweichug ist die positive Wurzel der Variaz s 2 s Seite 75

76 Streuugsmaße / Dispersiosparameter Variatioskoeffiziet Streuuge mit uterschiedliche Maßstäbe sid icht vergleichbar Beispiel: Währugsschwakuge i verschiedee Währuge Ist der Mittelwert positiv, köe die Date aber ormiert werde Der etstehede Variatioskoeffiziet gestattet direkte Vergleiche v s 0 Spaweite Differez zwische größtem ud kleistem Wert I die Berechug fließe also ur weige Date ei Differez wird dadurch massiv durch Ausreißer beeiflusst d s ma mi Seite 76

77 Streuugsmaße / Dispersiosparameter Iterquartilsabstad (IQR) Der IQR ist der Abstad zwische oberem ud uterem Quartil Er wird für Bo-Plot ud Füf-Werte-Zusammefassug beötigt IQR 0,75 0,25 Füf-Werte-Zusammefassug Hochkomprimierte Darstellug vo Streuug ud Lage eier Verteilug, bestehed aus dem Miimum, dem Maimum ud de drei Quartile mi 0,25; med ; 0,75; ; ma Seite 77

78 Übug: Streuugsmaße Bereche: Spaweite, IQR, Variaz ud Stadardabweichug Schulote Azahl Schulote Azahl Bereche: Spaweite, IQR, Variaz ud Stadardabweichug Alter Azahl Alter Azahl Seite 78

79 Übug: Streuugsmaße Bereche: Spaweite, IQR, Variaz ud Stadardabweichug Schulote Azahl Schulote Azahl IQR ( 3 2) 1 Bereche: Spaweite, IQR, Variaz ud Stadardabweichug Alter Azahl Alter Azahl d s (40 29) 11 IQR (38 32) 6 s 2 12,45 s 3,53 Seite 79

80 Teil V Eplorative Dateaalyse: Verteilugsmaße Seite 80

81 Schiefe ud Wölbug Verteiluge köe ach Schiefe uterschiede werde Symmetrische Verteiluge (spiegelbildlich) Likssteile ud rechtsschiefe Verteiluge Rechtssteile ud liksschiefe Verteiluge Zudem ka ach der Wölbug uterschiede werde Der Wölbugsgrad etspricht der Wölbug eier Normalverteilug Die Wölbug verläuft flacher als die Wölbug eier Normalverteilug Die Wölbug verläuft spitzer als die Wölbug eier Normalverteilug Quelle: Wikimedia Commos / User: Christia Schirm / Lizez: gemeifrei Seite 81

82 Schiefe ud Wölbug Mometekoeffiziet der Schiefe Abweichug der Verteilug vo der symmetrische Form Die Date müsse dabei midestes itervallskaliert sei Es ergebe sich positive Werte für likssteile Verteiluge ud egative Werte für rechtssteile Verteiluge sowie Werte ahe 0 für symmetrische Verteiluge g m s 3 m 3 m s i1 1 ( i1 ) ( i 3 ) 2 3 Quartilskoeffiziet der Schiefe Koeffiziet wird mit de Quartile gebildet Date müsse daher lediglich ordialskaliert sei Iterpretatio ist idetisch zum Mometekoeffiziet g 0,25 ( 0,75 med 0,75 ) ( med 0,25 0,25 Was passiert bei IQR=0? ) Wichtig: Beide Maßzahle für die Schiefe sid lediglich für uimodale Verteiluge sivoll iterpretierbar! Seite 82

83 Schiefe ud Wölbug Kurtosis / Ezeß Abweichug der Wölbug vo der eier Normalverteilug Es ergebe sich positive Werte für spitze Verteiluge ud egative Werte für flache Verteiluge Auch die Kurtosis ist ur bei eier uimodale Verteilug sivoll iterpretierbar g m s k 4 4 m s j1 1 ( i1 j ) ( i 4 ) 2 4 Seite 83

84 Lagemaße ud Bo-Plots Aus der Lage des Medias im Bo-Plot lässt ebefalls die Verteilugsform ablese Symmetrische Verteilug Likssteile Verteilug Rechtssteile Verteilug Seite 84

85 Lagemaße ud Verteilugsforme Lagemaß Modalwert Media / Perzetile Arithmetisches Mittel mi. Skaleiveau Nomialskaleiveau Ordialskaleiveau Metrisches Skaleiveau Verhältis der Lagemaße Form der Verteilug med mod Symmetrische Verteilug med mod Rechtssteile Verteilug med mod Likssteile Verteilug Seite 85

86 Übug: Quartilskoeffiziet ud Kurtosis Ausprägug abs. Häufigkeit rel. Häufigkeit i % 20 Jahre 3 0,12 12,00% 21 Jahre 2 0,08 8,00% 22 Jahre 1 0,04 4,00% 23 Jahre 3 0,12 12,00% 24 Jahre 13 0,52 52,00% 25 Jahre 2 0,08 8,00% 26 Jahre 0 0,00 0,00% 27 Jahre 1 0,04 4,00% Σ 25 1,00 100,00% g 0, m4 ( 0,75 med ) ( med 0,25) ( j ) m j1 g 4 k 3 4 0,75 s ,25 s ( ) i i1 Seite 86

87 Übug: Quartilskoeffiziet ud Kurtosis g g g 0,25 0,25 0,50 0,75 0,25 0,25 ( ,75 med 0,75 ) ( 0,25 (24 24) (24 23) med 0,25 ) Wie sid die Ergebisse zu iterpretiere? g k m 4 s 4 m s 4 4 g k m s 24,66 8, j1 1 *616,47 2, ( i1 j 8,07 ) ( i 0,55 4 ) ,66 Seite 87

88 Teil VI Eplorative Dateaalyse: Grafische Darstellugsforme Seite 88

89 Zu Begi eier Dateaalyse ist es sivoll, eie Überblick über die vorliegede Date zu bekomme Darstellug vo Lage ud Verteilug der Werte gibt es Auffälligkeite? Lagemaße: Arithmetisches Mittel, Media, Perzetile, Modus Streumaße: Spaweite, Iterquartilsabstad, Variaz, Stadardabweichug Grafische Darstellug: Balkediagramm, Kreisdiagramm, Streudiagramm, Bo-Plot Lasse sich etrem große oder kleie Werte (Ausreißer) idetifiziere? Sid außergewöhliche Umstäde oder Fehler die Ursache? Verzerre die Ausreißer die Ergebisse der weitere Aalyse? Ist es möglich, sie aus der weitere Aalyse auszuschließe? Seite 89

90 Zu Begi eier Dateaalyse Erfülle die Date die Voraussetzuge für weiterführede Verfahre? Liegt eie Normalverteilug vor? Liegt eie Gleichheit der Variaze vor? Alle agesprochee Fragestelluge falle i de Aufgabebereich der eplorative Dateaalyse, die wir i diesem Kurs keelere werde. Welche Verfahre im Rahme eier eplorative Dateaalyse abzuarbeite sid, ist icht eplizit festgelegt. Vielmehr gilt es, die geeigete Methode ud grafische Darstellugsforme aus dem Baukaste der eplorative Dateaalyse passed zu Date sowie zu Fragestelluge auszuwähle. Seite 90

91 Eie Verteilug überblicke Frage: Wie sieht die vorliegede Verteilug aus? grafisch Balkediagramme, Kreisdiagramme, Histogramme, Säulediagramme, Bo-Plots, Stem-ad-Leaf-Plots Lagemaße Arithmetisches Mittel, getrimmtes arithmetisches Mittel, Media, Perzetilwerte, Modus, geometrisches Mittel, harmoisches Mittel Streuugsmaße Variaz, Stadardabweichug, Variatioskoeffiziet, Spaweite, Iterquartilsabstad, Füf-Werte-Zusammefassug Verteilugsmaße Mometekoeffiziet der Schiefe, Quartilskoeffiziet der Schiefe, Kurtosis Seite 91

92 Grafische Darstellug uivariater Date Mögliche Darstellugsforme diskrete Merkmale weige Auspräguge stetige Merkmale viele Auspräguge Stabdiagramm Stem-ad-Leaf Säulediagramm Histogramm Balkediagramm Kreisdiagramm Bo-Plot P-P- & Q-Q-Plots Seite 92

93 Balke- ud Kreisdiagramme Seite 93

94 Säule- ud Balkediagramme Säule- ud Balkediagramme eige sich isbesodere für die Visualisierug diskreter Merkmale mit eier überschaubare Azahl a Auspräguge Stetige Merkmale sollte vor eier Diagrammerstellug klassiert werde SPSS gestattet die Darstellug relativer sowie absoluter Häufigkeite Seite 94

95 Kreisdiagramme Wie Balkediagramme eige sich Kreisdiagramme primär für die Visualisierug diskreter Merkmale mit eier überschaubare Azahl a Auspräguge Stetige Merkmale sollte vor eier Diagrammerstellug klassiert werde SPSS gestattet die Darstellug relativer sowie absoluter Häufigkeite Seite 95

96 Stem-ad-Leaf-Plots Die Stem-ad-Leaf-Plots (Stamm-Blatt-Diagramme) eige sich im Gegesatz zu Kreis- ud Balkediagramme vor allem zur Darstellug stetiger Merkmale Der große Vorteil gegeüber jeder adere grafische Darstellugsform ist, dass die Origialdate (zumidest bis zu eier gewisse Geauigkeit) och aus dem Diagramm abgelese werde köe Das Diagramm ist aufgebaut wie ei gekipptes Histogramm, d.h. flächeproportioal Der Stamm besteht aus der erste Ziffer, die Blätter aus der jeweils folgede Sehr große oder sehr kleie Zahle (Ausreißer) köe auf- oder abgerudet sowie als Etremwerte ausgewiese oder aus der Grafik gestriche werde Stem-ad-Leaf-Plots köe ebe Bo-Plots bemerkeswert gut dazu geutzt werde, um zwei Verteiluge miteiader zu vergleiche Seite 96

97 Stem-ad-Leaf-Plots Sigulärer Stem-ad-Leaf-Plot 2 Etremes Stem width: 10 Each leaf: 1 case(s) Datesatz A Datesatz B Vergleicheder Stem-ad-Leaf-Plot 3 Etremes 2 Etremes Stem width: 10 Each leaf: 1 case(s) Seite 97

98 Streudiagramme ud Streudiagramm-Matrize Seite 98

99 Streudiagramme Streudiagramme stelle die gemeisame Verteilug der Werte zweier Variable (bzw. dreier Variable i eiem 3D-Streudiagramm) dar, idem die etsprechede Werte beider Variable gegeeiader abgetrage werde Lage ud Verteilug der Wertepaare ermögliche Rückschlüsse auf mögliche Zusammehäge -> Eistieg i die ihaltliche Iterpretatio vo Datesätze Beispiel: Trete i der Tedez große Werte der eie Variable gepaart mit große Werte der adere Variable auf, so ka ei positiver Zusammehag vermutet werde (beispielsweise bei Werbeausgabe ud Verkaufszahle) Ei gefudeer Zusammehag ka icht i eie bestimmte Richtug iterpretiert werde, d.h. aus der Grafik ist icht abzulese, ob Variable A Variable B beeiflusst oder umgekehrt, bzw. ob lediglich ei Scheizusammehag besteht Seite 99

100 Streudiagramme Wie ist diese Grafik zu iterpretiere? Lasse sich Ausreißer idetifiziere? Seite 100

101 Streudiagramm-Matri Liegt ei multivariater Fall vor, d.h. solle für mehrere Variablepaare jeweils gemeisame Verteiluge dargestellt werde, ist astelle eier Reihe bivariater Streudiagramme ei gemeisames Streudiagramm i Form eier Matri sivoll Eie Streudiagramm-Matri gestattet de schelle Überblick über die Vielzahl aller mögliche Paarverteiluge ud ermöglicht das rasche Auffide symmetrischer oder aderweitig auffälliger Eizel-Streudiagramme Jedes eizele Streudiagramm taucht zweimal i der Matri auf (eimal oberhalb ud eimal uterhalb der Hauptdiagoale), wobei die jeweilige Achse der Diagramme miteiader vertauscht sid (Gehalt <> Afagsgehalt; Afagsgehalt <> Gehalt) Seite 101

102 Streudiagramm-Matri Lasse sich Ausreißer idetifiziere? Wie ist diese Grafik zu iterpretiere? Seite 102

103 Histogramme ud Bo-Plots Seite 103

104 Bo-Plots Bo-Plots biete eie Verteilugsüberblick ud gestatte Verteilugsvergleiche Sie stelle Lage ud Streuug dar ud diee zudem der Ausreißeridetifikatio * Etremwert Ausreißer Größter Nicht-Ausreißer Oberes Quartil 7 IQR 4 IQR IQR Media Uteres Quartil Kleister Nicht-Ausreißer 42 Ausreißer Seite 104

105 Bo-Plots Aus der Lage des Medias im Bo-Plot lässt sich die Form eier Verteilug ablese Symmetrische Verteilug Likssteile Verteilug Rechtssteile Verteilug Seite 105

106 Histogramme Ei Histogramm zeigt die Häufigkeitsverteilug itervallskalierter Merkmale Dabei wird vo ach der Größe geordete Date ausgegage, die i Klasse aufgeteilt werde, welche theoretisch icht die gleiche Breite besitze müsse (SPSS erstellt Histogramme stadardmäßig jedoch mit gleichbreite Klasse) Über jeder Klasse wird ei Rechteck kostruiert, desse Flächeihalt sich proportioal zur absolute bzw. relative Häufigkeit dieser Klasse verhält Die Visualisierug vo Date mittels Histogramme eiget sich primär für stetige Merkmale mit eier große Azahl a Auspräguge I SPSS ist zu beachte, dass maimal 21 Klasse gebildet werde köe Außerdem ka eie Normalverteilugskurve i das Histogramm eigebledet werde, aus der abgelese werde ka, wie eie Normalverteilug bei Date mit gleichem Mittelwert ud gleicher Streuug aussehe würde (Voraussetzugsprüfug) Seite 106

107 Histogramme Wie ist diese Grafik zu iterpretiere? Hadelt es sich um eie uimodale Verteilug? Seite 107

108 Grafische Darstellug multivariater Date Darstellugsforme Bivariate Darstellug Multivariate Darstellug 2D-Streudiagramme 3D-Streudiagramme Profildiagramme Streudiagramm-Matri Adrew s Fourier Cheroff-Gesichter Seite 108

109 Teil VII Zusammehagsaalyse / Korrelatioskoeffiziete Seite 109

110 Wie lasse sich Zusammehäge aufspüre? Für zwei Variable X ud Y ka da ei Zusammehag uterstellt werde (dieser muss aber real icht eistiere), we sie sich gleichmäßig veräder Gleichsiig = wird X größer wird Y größer; wird X kleier wird Y kleier Gegesiig = wird X größer wird Y kleier; wird X kleier wird Y größer Die Berechug vo Korrelatioskoeffiziete orietiert sich am Skaleiveau Nomialskaleiveau: Chi²-Koeffiziet Ordialskaleiveau: Spearma, Kedall Metrisches Skaleiveau: Bravais-Pearso Grudsätzlich immer möglich ist auch eie grafische Aalyse der Date Diskrete Date: Gruppierte Balkediagramme, Bedigte Balkediagramme Stetige Date: Zwei- ud dreidimesioale Streudiagramme, Scatterplot-Matri Seite 110

111 Aalyse bivariater Zusammehäge Frage: Liegt i eiem bivariate Datesatz ei Zusammehag vor? grafisch omialskaliert ordialskaliert metrisch stetig Streudiagramm Scatterplot-Matri Chi²-Koeffiziet Kokordazkoeffiziet ach Kedall Bravais-Pearso- Korrelatioskoeffiziet diskret Balkediagramme (gruppiert, bedigt) Ragkorrelatioskoeffiziet ach Spearma Seite 111

112 Seite 112 Der Bravais-Pearso-Korrelatioskoeffiziet Für metrisch skalierte Merkmale wird i de meiste Fälle der Bravais-Pearso- Korrelatioskoeffiziet berechet (obwohl auch adere Koeffiziete möglich sid) Bei der Iterpretatio zu beachte: Der Bravais-Pearso-Korrelatioskoeffiziet misst ausschließlich de lieare Zusammehag zwische zwei Variable Nicht-lieare (z.b. quadratische oder logarithmische) Zusammehäge werde somit icht aufgedeckt, auch we sie stark oder sogar vollkomme sei sollte i i i i i i i y y y y r * ) ( * * ) ( * * ) * (

113 Der Bravais-Pearso-Korrelatioskoeffiziet Der Koeffiziet r ka Werte zwische -1 ud +1 aehme Bei positive Werte liegt ei positiver Zusammehag vor, d.h. die Wertepaare liege auf eier steigede Gerade Bei egative Werte liegt ei egativer Zusammehag vor, d.h. die Wertepaare liege auf eier fallede Gerade Werte ahe Null deute darauf hi, dass keierlei lieare Korrelatio zwische de beide Variable vorliegt Iterpretatio des Betrags (!) vo r r = 0 = keie Korrelatio 0 < r < 0,5 = schwache Korrelatio 0,5 <= r < 0,8 = mittlere Korrelatio 0,8 <= r < 1 = starke Korrelatio r = 1 = perfekte Korrelatio Seite 113

114 Bravais-Pearso-Korrelatioskoeffiziet Quelle: WikiBooks / User: Philipedula / Lizez: GNU-Lizez für freie Dokumetatioe Seite 114

115 Seite 115 Empfohlee Hilfstabelle für die Berechug Nr. y 2 y 2 (*y) Σ i i i i i i i y y y y r * ) ( * * ) ( * * ) * (

116 Übug: B-P-K Befragte/r Größe (m) Gewicht (kg) 1 1, , , , , , , , , ,59 69 Seite 116

117 Seite 117 Übug: B-P-K? * * ) * ( 1 i i i y y? * ) ( i i? * ) ( i i y y Welche Größe müsse wir ermittel? Welche Hilfsgröße beötige wir? 10 77,7 1,707 y i i i i i i i y y y y r * ) ( * * ) ( * * ) * (

118 Übug: B-P-K Nr. y 2 y 2 (*y) 1 1, , ,2 2 1, , ,96 3 1, , ,12 4 1, , ,75 5 1, , ,64 6 1, , ,38 7 1, , ,86 8 1, , ,84 9 1, , , , , ,71 Σ 17, , ,67 Seite 118

119 Übug: B-P-K i1 ( i * y i ) * * y? y 1,707 77,7 (1,55*64) (1,68*72) 99,2 120, (1,73*77) (1,59*69) 133,21 109, ,67 (10*1,707*77,7) 1334,67 8,331 Seite 119

120 Seite 120 Übug: B-P-K? * ) ( i i? * ) ( i i y y , i i i i y 10 77,7 1,707 y 0, *1,707 29,2097 * ) ( i i 37, *77, * ) ( i i y y

121 Seite 121 Übug: B-P-K 0,8360 9,9651 8,331 0,2667*37,3644 8,331 * ) ( * * ) ( * * ) * ( r y y y y r i i i i i i i

122 Übug: B-P-K ,5 1,55 1,6 1,65 1,7 1,75 1,8 1,85 Seite 122

123 Spearma-Ragkorrelatioskoeffiziet Für ordialskalierte Merkmale biete sich zwei Zusammehagsmaße a: Der Ragkorrelatioskoeffiziet ach Spearma Der Kokordazkoeffiziet ach Kedall Der Ragkorrelatioskoeffiziet ach Spearma misst de mootoe Zusammehag zweier Variable rho 6* 1 2 ( d 2 i 1)* Für die Datepaare werde dabei ierhalb jeder Variable zuächst Räge gebildet Die kleiste Ausprägug vo X erhält de Wert 1, die zweitkleiste de Wert 2 etc. pp. Für Y wird idetisch vorgegage, auch hier erhält die kleiste Ausprägug die 1 etc. Aschließed werde die Ragdiffereze d der jeweilige Datepaare gebildet Auf Basis dieser Differezwerte lässt sich da der Ragkorrelatioskoeffiziet (ach obesteheder Formel) bereche Seite 123

124 Spearma-Ragkorrelatioskoeffiziet Die Ergebisse liege stets zwische -1 ud +1 rho > 0 = gleichsiiger mootoer Zusammehag (große X-Werte gehe mit große Y-Werte eiher ud umgekehrt) rho ~ 0 = es besteht kei mootoer Zusammehag (damit ka auch kei liearer bestehe!) rho < 0 = gegeseitiger mootoer Zusammehag (große X-Werte gehe mit kleie Y-Werte eiher ud umgekehrt) Wichtig: Das Verfahre liefert ur da geaue Resultate, we keie Ragplatzbiduge (die sogeate ties) auftrete Habe Beobachtuge idetische Werte, ordet ma alle idetische Date eie Durchschittsrag zu Seite 124

125 Übug: Spearma Befragte/r Größe (m) Gewicht (kg) 1 1, , , , , , , , , ,59 69 Seite 125

126 Übug: Spearma Nr. rg () y rg (y) d d 2 1 1, , , ,5 1,5 2,25 4 1,73 6, ,5 0,25 5 1, , , ,5-0,5 0,25 8 1, ,73 6, ,5 0, , Σ // // // // // 4 Seite 126

127 Übug: Spearma rho rho rho rho rho 1 1 6* ( ( ,024 0, )* 2 d 2 i 6*4 1)* Passt das Ergebis zum Streudiagramm? 50 1,5 1,55 1,6 1,65 1,7 1,75 1,8 1,85 Seite 127

128 Kokordazkoeffiziet ach Kedall Alterativ zu Spearma ka für Ordialdate auch Kedalls tau berechet werde Die Berechug beötigt die Azahl kokordater (K) ud diskordater (D) Paare Zur Bestimmug der Paare wird eie der Datereihe ach der Größe geordet Aschließed wird utersucht, iwieweit sich die zweite Datereihe mitsortiert hat Für jedes Datepaar aus de beide Datereihe (yi, yj) mit i < j gilt: ist yi < yj, so ist das Paar kokordat (K) ist yi > yj, so ist das Paar diskordat (D) ist yi = yj, so liegt eie Bidug vor (wird icht mitgezählt) tau 2*( K *( D) 1) Sid alle Paare etspreched utersucht worde, wird tau (Formel) berechet Auch hier gilt, dass das Ergebis ur Bestad hat, we keie Biduge auftrete Eiige weige Biduge köe igoriert werde, da sie das Ergebis kaum verzerre Seite 128

129 Kokordazkoeffiziet ach Kedall Die Ergebisse liege stets zwische -1 ud +1 tau > 0 = gleichsiiger mootoer Zusammehag (große X-Werte gehe mit große Y-Werte eiher ud umgekehrt) tau ~ 0 = es besteht kei mootoer Zusammehag (damit ka auch kei liearer bestehe!) tau < 0 = gegeseitiger mootoer Zusammehag (große X-Werte gehe mit kleie Y-Werte eiher ud umgekehrt) Bei der Iterpretatio vo Korrelatioskoeffiziete ist zu beachte: Sowohl mit Spearma als auch mit Kedall köe ur mootoe Zusammehäge idetifiziert werde, mit dem B-P-K ur lieare Ei iedriger Korrelatioskoeffiziet bedeutet daher icht, dass keie adere Korrelatio (z.b. eie logarithmische) i de Date zu fide ist Seite 129

130 Übug: Kedall Befragte/r Größe (m) Gewicht (kg) 1 1, , , , , , , , , ,59 69 Seite 130

131 Übug: Kedall Nr. rg () y rg (y) 9 K K D 1 1, D , , , , , , ,73 6, ,73 6, , , , Σ // // // // 43 1 Seite 131

132 Übug: Kedall K 43 tau 2*( K *( D) 1) D 1 10 Passt das Ergebis zum Streudiagramm? tau tau 2*(431) 10*(10 1) tau 0, ,5 1,55 1,6 1,65 1,7 1,75 1,8 1,85 Seite 132

133 Korrelatio ist icht gleich Kausalität Eie über eie Korrelatioskoeffiziete idetifizierte Korrelatio sollte äher utersucht, dabei jedoch iemals ihaltlich iterpretiert werde Grud dafür ist, dass eie Korrelatio icht otwedigerweise auf eiem Ursache-Wirkugs-Zusammehag beruht auch we es i viele Fälle leider äußerst verführerisch ist, diese Aahme zu treffe Tatsächlich ka es verschiedee Erkläruge für Korrelatioe gebe Eiseitiger Zusammehag: X beeiflusst Y bzw. Y beeiflusst X Beidseitiger Zusammehag: X ud Y beeiflusse sich gegeseitig Es hadelt sich um eie reie Zufallseffekt i de Date (Scheikorrelatio) Eie dritte Variable (Z) beeiflusst X ud Y gleichermaße (Scheikorrelatio) Ei klassisches Beispiel für eie Scheikorrelatio ist die Korrelatio zwische Storchezahl ud Geburtequote (verbude über die Variable Urbaisierug ) Seite 133

Statistik I für Studierende der Soziologie

Statistik I für Studierende der Soziologie Name: Matrikelummer: Formelsammlug zur Vorlesug Statistik I für Studierede der Soziologie Dr. Caroli Strobl & Gero Walter WS 2008/09 1 Eiführug 1.1 Orgaisatorisches 1.2 Grudbegriffe 1.2.1 Statistische

Mehr

Univariate Verteilungen

Univariate Verteilungen (1) Aalyse: "deskriptive Statistike" Aalysiere -> deskriptive Statistike -> deskriptive Statistik Keie tabellarische Darstellug der Häufigkeitsverteilug () Aalyse: "Häufigkeitsverteilug" Aalysiere -> deskriptive

Mehr

Statistik Einführung // Beschreibende Statistik 2 p.2/61

Statistik Einführung // Beschreibende Statistik 2 p.2/61 Statistik Eiführug Beschreibede Statistik Kapitel Statistik WU Wie Gerhard Derfliger Michael Hauser Jörg Leeis Josef Leydold Güter Tirler Rosmarie Wakolbiger Statistik Eiführug // Beschreibede Statistik

Mehr

Absolutskala: metrische Skala mit einem natürlichen Nullpunkt und einer natürlichen Einheit. (Z.B. Einwohnerzahl). Nicht alle Variablen lassen sich

Absolutskala: metrische Skala mit einem natürlichen Nullpunkt und einer natürlichen Einheit. (Z.B. Einwohnerzahl). Nicht alle Variablen lassen sich Grudbegrie Die beschreibede Statistik (deskriptive Statistik) ist eie systematische Zusammestellug vo Zahle ud Date zur Beschreibug bestimmter Zustäde, Etwickluge oder Phäomee. Die beschreibede Statistik

Mehr

Reader Teil 1: Beschreibende Statistik

Reader Teil 1: Beschreibende Statistik Dr. Katharia Best Sommersemester 2011 14. April 2011 Reader Teil 1: Beschreibede Statistik WiMa-Praktikum Um Date darzustelle ud eie Übersicht über die Struktur der Date zu erstelle, stellt die beschreibede

Mehr

2.2.1 Lagemaße. Exkurs: Quantile. und n. p n

2.2.1 Lagemaße. Exkurs: Quantile. und n. p n Ekurs: Quatile Ausgagspukt : Geordete Urliste Jeder Wert p, mit 0 < p

Mehr

Umrechnung einer tatsächlichen Häufigkeitsverteilung in eine prozentuale Häufigkeitsverteilung

Umrechnung einer tatsächlichen Häufigkeitsverteilung in eine prozentuale Häufigkeitsverteilung .3. Prozetuale Häufigkeitsverteilug (HV) Die prozetuale Häufigkeitsverteilug erlaubt de Vergleich vo Auswertuge, dee uterschiedliche Stichprobegröße zugrude liege. Es köe auch uterschiedliche Stichprobegröße

Mehr

Parameter von Häufigkeitsverteilungen

Parameter von Häufigkeitsverteilungen Kapitel 3 Parameter vo Häufigkeitsverteiluge 3. Mittelwerte Mo Der Modus (:= häufigster Wert, Abk.: Mo) ist der Merkmalswert mit der größte Häufigkeit, falls es eie solche gibt. Er sollte ur bei eigipflige

Mehr

Weitere Lagemaße: Quantile/Perzentile I

Weitere Lagemaße: Quantile/Perzentile I 3 Auswertug vo eidimesioale Date Lagemaße 3.3 Weitere Lagemaße: Quatile/Perzetile I Für jede Media x med gilt: Midestes 50% der Merkmalswerte sid kleier gleich x med ud ebeso midestes 50% größer gleich

Mehr

Kennwerte Univariater Verteilungen

Kennwerte Univariater Verteilungen Kewerte Uivariater Verteiluge Kewerte Beschreibug vo Verteiluge durch eie (oder weige) Werte Werde auch als Parameter oder Maße vo Verteiluge bezeichet Ma uterscheidet: Lagemaße oder auch Maße der zetrale

Mehr

Deskriptive Statistik

Deskriptive Statistik Deskriptive Statistik I der beschreibede Statistik werde Methode behadelt, mit dere Hilfe ma Date übersichtlich darstelle ud kezeiche ka. Die Urliste (=Date i der Reihefolge ihrer Erhebug) ist meist umfagreich

Mehr

h i :=h a i f i = h a i n Absolute Häufigkeit: Relative Häufigkeit: h 2 h 4 h 6 :=h der Elemente mit der Ausprägung i=6 zu der Anzahl n aller Werte

h i :=h a i f i = h a i n Absolute Häufigkeit: Relative Häufigkeit: h 2 h 4 h 6 :=h der Elemente mit der Ausprägung i=6 zu der Anzahl n aller Werte . Wer Rechtschreibfehler fidet, darf sie behalte. Rechefehler werde zurückgeomme. Absolute Häufigkeit: h Wie viele Elemete weise diese bestimmte Wert (= diese bestimmte Ausprägug) auf? > Azahl h der Elemete

Mehr

Weitere Lagemaße: Quantile/Perzentile II. Weitere Lagemaße: Quantile/Perzentile I. Weitere Lagemaße: Quantile/Perzentile IV

Weitere Lagemaße: Quantile/Perzentile II. Weitere Lagemaße: Quantile/Perzentile I. Weitere Lagemaße: Quantile/Perzentile IV 3 Auswertug vo eidimesioale Date Lagemaße 3.3 Weitere Lagemaße: Quatile/Perzetile I 3 Auswertug vo eidimesioale Date Lagemaße 3.3 Weitere Lagemaße: Quatile/Perzetile II Für jede Media x med gilt: Midestes

Mehr

Jugendliche (18-24 Jahre) in Westdeutschland

Jugendliche (18-24 Jahre) in Westdeutschland Modus Beispiel: Modus Jugedliche (8-4 Jahre) i Westdeutschlad Parameter oder Kewerte eier Häufigkeitsverteilug sid Kegröße, mit dere Hilfe die Verteilug z.t. oder vollstädig rekostruiert werde ka D West

Mehr

Formelsammlung. zur Klausur. Beschreibende Statistik

Formelsammlung. zur Klausur. Beschreibende Statistik Formelsammlug zur Klausur Beschreibede Statistik Formelsammlug Beschreibede Statistik. Semester 004/005 Statistische Date Qualitative Date Nomial skalierte Merkmalsauspräguge (Uterscheidugsmerkmale) köe

Mehr

Übungen mit dem Applet erwartungstreu

Übungen mit dem Applet erwartungstreu Übuge mit dem Applet erwartugstreu Visualisierug vo erwartugstreu Begriffe ud statischer Hitergrud. Visualisieruge mit dem Applet..3. Zufallsstreuug der Eizelwerte...3. Mittelwerte 3.3 Variaz. 4.4 Variaz

Mehr

Kapitel XI - Korrelationsrechnung

Kapitel XI - Korrelationsrechnung Istitut für Volkswirtschaftslehre (ECON) Lehrstuhl für Ökoometrie ud Statistik Kapitel XI - Korrelatiosrechug Deskriptive Statistik Prof. Dr. W.-D. Heller Hartwig Seska Carlo Siebeschuh Aufgabe der Korrelatiosrechug

Mehr

Harmonisches Mittel. Streuungsmaße. Die mittlere Abweichung. Die Standardabweichung. Die Varianz. Statistik 3. Vorlesung, März 11, ,...

Harmonisches Mittel. Streuungsmaße. Die mittlere Abweichung. Die Standardabweichung. Die Varianz. Statistik 3. Vorlesung, März 11, ,... Statistik. Vorlesug, März, 9 Harmoisches Mittel xh = w wk +... + x x k Wobei w, w,... w k sid die gewichte (w + w + w +...+ w k = Beispiel: wir habe km mit eier Geschwidigkeit vo km/h, ud eie adere km

Mehr

Sind Sie mit unserem Angebot zufrieden? ja nein weiß nicht

Sind Sie mit unserem Angebot zufrieden? ja nein weiß nicht STATISTIK Eiführug Statistik kommt vom italieische Wort statistica, was so viel wie Staatsma bedeutet. Früher verwedete ma de Begriff ur für eie Auswertug vo Date (Klima, Bevölkerug, Bräuche,...) eies

Mehr

Formelsammlung zur Statistik

Formelsammlung zur Statistik Darstellug uivariater Date Formelsammlug zur Statistik Urliste x i : x 1,... x, aufsteiged geordete Urliste x (i) Die k (verschiedee) Auspräguge: a 1

Mehr

Kennwerte eindimensionaler Häufigkeitsverteilungen Einführung

Kennwerte eindimensionaler Häufigkeitsverteilungen Einführung Kewerte eidimesioaler Häufigkeitsverteiluge Eiführug Statistische Kewerte vo Verteiluge sid umerische Maße mit der Fuktio, zusammefassed eie Eidruck vo 1) dem Schwerpukt, ) der Variabilität ud 3) der Form

Mehr

Klausur vom

Klausur vom UNIVERSITÄT KOBLENZ LANDAU INSTITUT FÜR MATHEMATIK Dr. Domiik Faas Stochastik Witersemester 00/0 Klausur vom 7.0.0 Aufgabe 3+.5+.5=6 Pukte Bei eier Umfrage wurde 60 Hotelbesucher ach ihrer Zufriedeheit

Mehr

s xy x i x y i y s xy = 1 n i=1 y 2 i=1 x 2 s 1 n x n i Streudiagramme empirische Kovarianz x=5,5 y=7,5

s xy x i x y i y s xy = 1 n i=1 y 2 i=1 x 2 s 1 n x n i Streudiagramme empirische Kovarianz x=5,5 y=7,5 Streudiagramme für metrisch skalierte Variable paarweise Messwerte (x,y) x 5 7 y 7 5 7 5 5 7 Aussage zu Zusammehäge. empirische Kovariaz Stadardabweichug der WertPAARE x i x y Wert x Mittelwert aller x

Mehr

(a) Richtig, die Varianz ist eine Summe quadratischer Größen.

(a) Richtig, die Varianz ist eine Summe quadratischer Größen. Aufgabe 1 (10 Pukte) Welche der folgede Aussage sid richtig? (a) Richtig, die Variaz ist eie Summe quadratischer Größe. (b) Falsch, die Abweichug ordialer Merkmale vom Media ist icht defiiert - also auch

Mehr

n 1,n 2,n 3,...,n k in der Stichprobe auftreten. Für die absolute Häufigkeit können wir auch die relative Häufigkeit einsetzen:

n 1,n 2,n 3,...,n k in der Stichprobe auftreten. Für die absolute Häufigkeit können wir auch die relative Häufigkeit einsetzen: 61 6.2 Grudlage der mathematische Statistik 6.2.1 Eiführug i die mathematische Statistik I der mathematische Statistik behadel wir Masseerscheiuge. Wir habe es deshalb im Regelfall mit eier große Zahl

Mehr

( ), der genau auf der Geraden ( ) 2 ( ) #( ) 8. Lineare Regression. = f i. Nach der Summe der kleinsten. mx i

( ), der genau auf der Geraden ( ) 2 ( ) #( ) 8. Lineare Regression. = f i. Nach der Summe der kleinsten. mx i 8. Lieare Regressio 8.1. Die Methode der kleiste Quadrate Regressiosgerade bzw. Ausgleichsgerade sid eie Auswertug vo statistische Messdate. Ziel dieses Verfahres ist es, Beziehuge zwische zwei Merkmale

Mehr

So lösen Sie die Gleichung für den Korrelationskoeffizienten

So lösen Sie die Gleichung für den Korrelationskoeffizienten 8. Lieare Regressio 8.1. Die Methode der kleiste Quadrate Regressiosgerade bzw. Ausgleichsgerade sid eie Auswertug vo statistische Messdate. Dabei sid Datepukte ( x 1, y 1 ),( x 2, y 2 ), ( x, y ) gegebe.

Mehr

Streuungsmaße. Prof. Dr. Paul Reuber. Institut für Geographie. Seminar Methoden der empirischen Humangeographie

Streuungsmaße. Prof. Dr. Paul Reuber. Institut für Geographie. Seminar Methoden der empirischen Humangeographie Streuugsmaße Istitut für Geographie Streuugswerte (Streuugsmaße) Die Diskussio um die Mittelwerte hat die Vorteile dieser statistische Kewerte gezeigt, aber bereits, isbesodere beim arithmetische Mittel,

Mehr

6 Vergleich mehrerer unverbundener Stichproben

6 Vergleich mehrerer unverbundener Stichproben 6 Vergleich mehrerer uverbudeer Stichprobe 6.1 Die eifaktorielle Variazaalyse Die eifaktorielle Variazaalyse diet der Utersuchug des Eiflusses eier kategorieller (bzw. ichtmetrischer) Variable, die die

Mehr

Mathematik 2 für Naturwissenschaften

Mathematik 2 für Naturwissenschaften Has Walser Mathematik für Naturwisseschafte Modul 0 Regressiosgerade ud Korrelatio Has Walser: Modul 0, Regressiosgerade ud Korrelatio ii Ihalt Die Regressiosgerade.... Problemstellug.... Berechug der

Mehr

Skript zum Modul Statistik

Skript zum Modul Statistik Skript zum Modul 4 - Statistik 5 Kozetratiosmaße Zusätzlich zu de Lageparameter (Sitzug 3), die markate Pukte (z.b. Media, Modus, Mittelwert) beschreibe ud de Streuugsparameter (Sitzug 4), die de Charakter

Mehr

Kleine Formelsammlung Beschreibende Statistik

Kleine Formelsammlung Beschreibende Statistik Kleie Formelsammlug Beschreibede Statistik Prof. Dr. Philipp Sibbertse Wirtschaftswisseschaftliche Fakultät Leibiz Uiversität Haover Ihaltsverzeichis 1 Lage- ud Streuugsmaße 2 1.1 Der Media...................................

Mehr

SBP Mathe Aufbaukurs 1. Absolute und relative Häufigkeit. Das arithmetische Mittel und seine Eigenschaften. Das arithmetische Mittel und Häufigkeit

SBP Mathe Aufbaukurs 1. Absolute und relative Häufigkeit. Das arithmetische Mittel und seine Eigenschaften. Das arithmetische Mittel und Häufigkeit SBP Mathe Aufbaukurs 1 # 0 by Clifford Wolf # 0 Atwort Diese Lerkarte sid sorgfältig erstellt worde, erhebe aber weder Aspruch auf Richtigkeit och auf Vollstädigkeit. Das Lere mit Lerkarte fuktioiert ur

Mehr

3. Einführung in die Statistik

3. Einführung in die Statistik 3. Eiführug i die Statistik Grudlegedes Modell zu Date: uabhägige Zufallsgröße ; : : : ; mit Verteilugsfuktio F bzw. Eizelwahrscheilichkeite p ; : : : ; p r i de Aweduge: kokrete reale Auspräguge ; : :

Mehr

Unsere Daten. Konzentrationsmessung. Konzentrationskurve Summenkurve der Bierkonsumierung. Statistik 2. Vorlesung, Feb. 29, 2012

Unsere Daten. Konzentrationsmessung. Konzentrationskurve Summenkurve der Bierkonsumierung. Statistik 2. Vorlesung, Feb. 29, 2012 Statisti. Vorlesug, Feb. 9, Usere Date Höhe Gewicht 5 5 Coctails 5 7 75 5 7 cm Gewicht Glas Schuhgrösse Mathe 5 7 -.5..5..5..5 Reisezeit y 7 9 5 cm Mi Kozetratiosmessug Was für ei Ateil der Eiomme gehört

Mehr

Lage- und Streuungsmaße

Lage- und Streuungsmaße Statistik 1 für SoziologIe Lage- ud Streuugsmaße Uiv.Prof. Dr. Marcus Hudec Streuugsmaße Statistische Maßzahle, welche die Variabilität oder die Streubreite i de Date messe. Sie beschreibe die Abweichug

Mehr

Vl Statistische Prozess und Qualitätskontrolle und Versuchsplanung Übung 3

Vl Statistische Prozess und Qualitätskontrolle und Versuchsplanung Übung 3 Vl Statistische Prozess ud Qualitätskotrolle ud Versuchsplaug Übug 3 Aufgabe ) Die Schichtdicke X bei eier galvaische Beschichtug vo Autoteile sei ormalverteilt N(μ,σ ). 4 Teile werde galvaisch beschichtet.

Mehr

Vl Statistische Prozess- und Qualitätskontrolle und Versuchsplanung Übung 5

Vl Statistische Prozess- und Qualitätskontrolle und Versuchsplanung Übung 5 Vl Statistische Prozess- ud Qualitätskotrolle ud Versuchsplaug Übug 5 Aufgabe ) Sei p = P(A) die Wahrscheilichkeit für ei Ereigis A, dh., es gilt 0 p. Bereche Sie das Maximum der Fuktio f(p) = p(-p). Aufgabe

Mehr

Statistik Einführung // Konfidenzintervalle für einen Parameter 7 p.2/39

Statistik Einführung // Konfidenzintervalle für einen Parameter 7 p.2/39 Statistik Eiführug Kofidezitervalle für eie Parameter Kapitel 7 Statistik WU Wie Gerhard Derfliger Michael Hauser Jörg Leeis Josef Leydold Güter Tirler Rosmarie Wakolbiger Statistik Eiführug // Kofidezitervalle

Mehr

Der Modus. Lageparameter. Beispiel (Einrichtungen) Beispiel (Lieblingsfarben) Modus. Untersuchungseinheiten U 1,...,U n. Merkmal X

Der Modus. Lageparameter. Beispiel (Einrichtungen) Beispiel (Lieblingsfarben) Modus. Untersuchungseinheiten U 1,...,U n. Merkmal X Lageparameter Der Modus Utersuchugseiheite U,...,U Modus mod Mermal X Urliste,..., geordete Urliste (),..., () Es gilt i.allg.: ( ), i, K i i, Mermalsauspräguge a,..., a wird auch Modalwert oder häufigster

Mehr

Kapitel 5: Schließende Statistik

Kapitel 5: Schließende Statistik Kapitel 5: Schließede Statistik Statistik, Prof. Dr. Kari Melzer 5. Schließede Statistik: Typische Fragestellug ahad vo Beispiele Beispiel Aus 5 Messwerte ergebe sich für die Reißfestigkeit eier Garsorte

Mehr

Übersicht: BS - 08 BS Häufigkeitsverteilung. Häufigkeitsverteilungen. Parametrisierung. unklassiert. eindimensional. klassiert.

Übersicht: BS - 08 BS Häufigkeitsverteilung. Häufigkeitsverteilungen. Parametrisierung. unklassiert. eindimensional. klassiert. Übersicht: eidimesioal mehrdimesioal Häufigkeitsverteilug uklassiert klassiert tabellarische Darstellug Modul 07, graphische Darstellug Modul 07,2 Parametrisierug Lageparameter Modul 08 Streuugsparameter

Mehr

Statistik und Biometrie. Deskriptive Statistik I

Statistik und Biometrie. Deskriptive Statistik I Statistik ud Biometrie Deskriptive Statistik I Spruch des Tages Traue keier Statistik, die du icht selbst gefaelscht hast Wiederholug Merkmale Beobachtugseiheite sid Träger vo Merkmale Wiederholug Die

Mehr

Statistik mit Excel 2013. Themen-Special. Peter Wies. 1. Ausgabe, Februar 2014 W-EX2013S

Statistik mit Excel 2013. Themen-Special. Peter Wies. 1. Ausgabe, Februar 2014 W-EX2013S Statistik mit Excel 2013 Peter Wies Theme-Special 1. Ausgabe, Februar 2014 W-EX2013S 3 Statistik mit Excel 2013 - Theme-Special 3 Statistische Maßzahle I diesem Kapitel erfahre Sie wie Sie Date klassifiziere

Mehr

Übungen zu QM III Mindeststichprobenumfang

Übungen zu QM III Mindeststichprobenumfang Techische Hochschule Köl Fakultät für Wirtschafts- ud Rechtswisseschafte Prof. Dr. Arreberg Raum 221, Tel. 39 14 jutta.arreberg@th-koel.de Übuge zu QM III Mideststichprobeumfag Aufgabe 12.1 Sie arbeite

Mehr

Messeinheit in gleichen Abständen (Punkteskala, kg, cm, Jahre) Kapitel 3: Deskription Reihenfolge Beschreibung der Daten: (sehr - eher -

Messeinheit in gleichen Abständen (Punkteskala, kg, cm, Jahre) Kapitel 3: Deskription Reihenfolge Beschreibung der Daten: (sehr - eher - Kapitel 3: Deskriptio Beschreibug der Date: Gipfel, Streuug ud Verteilugsform Gruppe (ledig - verheiratet - gesch. - verwitwet) = omial Reihefolge (sehr - eher - weig - gar icht) = ordial Messeiheit i

Mehr

4 Schwankungsintervalle Schwankungsintervalle 4.2

4 Schwankungsintervalle Schwankungsintervalle 4.2 4 Schwakugsitervalle Schwakugsitervalle 4. Bemerkuge Die bekate Symmetrieeigeschaft Φ(x) = 1 Φ( x) bzw. Φ( x) = 1 Φ(x) für alle x R überträgt sich auf die Quatile N p der Stadardormalverteilug i der Form

Mehr

2. Schätzverfahren 2.1 Punktschätzung wirtschaftlicher Kennzahlen. Allgemein: Punktschätzung eines Parameters:

2. Schätzverfahren 2.1 Punktschätzung wirtschaftlicher Kennzahlen. Allgemein: Punktschätzung eines Parameters: . Schätzverfahre. Puktschätzug wirtschaftlicher Kezahle Allgemei: Puktschätzug eies Parameters: Ermittlug eies Schätzwertes für eie ubekate Parameter eier Zufallsvariable i der Grudgesamtheit mit Hilfe

Mehr

Statistik. 5. Schließende Statistik: Typische Fragestellung anhand von Beispielen. Kapitel 5: Schließende Statistik

Statistik. 5. Schließende Statistik: Typische Fragestellung anhand von Beispielen. Kapitel 5: Schließende Statistik Statistik Kapitel 5: Schließede Statistik 5. Schließede Statistik: Typische Fragestellug ahad vo Beispiele Beispiel 1» Aus 5 Messwerte ergebe sich für die Reißfestigkeit eier Garsorte der arithmetische

Mehr

Übungsaufgaben - Organisatorisches

Übungsaufgaben - Organisatorisches Übugsaufgabe - Orgaisatorisches Der Abgabetermi der eue Übugsblätter ist: Motag, 4:00 Uhr Fehlerrechugsbriefkaste Der Abgabetermi der verbesserte Übugsblätter ist: Freitag, 6:00 Uhr T. Kießlig: Auswertug

Mehr

Mathematik 2 für Naturwissenschaften

Mathematik 2 für Naturwissenschaften Has Walser Mathematik 2 für Naturwisseschafte Modul 201 Beschreibede Statistik Has Walser: Modul 201, Beschreibede Statistik ii Modul 201 für die Lehrverastaltug Mathematik 2 für Naturwisseschafte Sommer

Mehr

Der Vergleich eines Stichprobenmittelwertes mit einem Populationsmittelwert

Der Vergleich eines Stichprobenmittelwertes mit einem Populationsmittelwert Der Vergleich eies Stichprobemittelwertes mit eiem Populatiosmittelwert Am Beispiel des Falschspielers habe wir - uterstützt durch Ketisse über die Eigeschafte der Biomialverteilug - erstmals gesehe, welche

Mehr

Zusammenfassung: Gleichungen und Ungleichungen

Zusammenfassung: Gleichungen und Ungleichungen Zusammefassug: Gleichuge ud Ugleichuge Ihaltsverzeichis Polyomgleichuge ud -ugleichuge Bruch-, Wurzel- ud Betragsgleichuge ud -ugleichuge 6 Für Eperte 9 Polyomgleichuge ud -ugleichuge Defiitio: Ei Term

Mehr

Wissenschaftliches Arbeiten Studiengang Energiewirtschaft

Wissenschaftliches Arbeiten Studiengang Energiewirtschaft Wisseschaftliches Arbeite Studiegag Eergiewirtschaft - Auswerte vo Date - Prof. Dr. Ulrich Hah WS 01/013 icht umerische Date Tet-Date: Datebak: Name, Eigeschafte, Matri-Tabelleform Spalte: übliche Aordug:

Mehr

Kursthemen 5. Sitzung. Lagemaße

Kursthemen 5. Sitzung. Lagemaße Kurstheme 5. Sitzug Folie I - 5 - Lagemaße A) Arithmetisches Mittel (AM), Media ud Modus (Folie 2 bis 8) A) Arithmetisches Mittel (AM), Media ud Modus (Folie 2 bis 8) B) Der Additiossatz für AM (Folie

Mehr

Normalverteilung. Voraussetzung und verwandte Themen. Einführung. Ziel und Nutzen. Grundlagen

Normalverteilung. Voraussetzung und verwandte Themen. Einführung. Ziel und Nutzen. Grundlagen h Normalverteilug Voraussetzug ud verwadte Theme Für diese Beschreibuge sid Grudlage der Statistik ud isbesodere der statistische Verteiluge vorteilhaft. Weiterführede Theme sid: www.versuchsmethode.de/verteilugstests.pdf

Mehr

= 3. = 14,38... = x neu x = 0, = 97,87...%. Wie verändert sich der arithmetische Mittelwert von 20 Zahlen, wenn...

= 3. = 14,38... = x neu x = 0, = 97,87...%. Wie verändert sich der arithmetische Mittelwert von 20 Zahlen, wenn... Mathemati macht Freu()de AB Statistische Kegröße ud Boxplot Arithmetischer Mittelwert x 1, x,..., x ist eie Liste vo reelle Zahle. Das arithmetische Mittel x der Zahle ist x = x 1 + x + + x. Arithmetischer

Mehr

Statistik I im Sommersemester 2007

Statistik I im Sommersemester 2007 Statistik I im Sommersemester 2007 Theme am 30.4.2007: Uivariate Verteiluge II Graphische Darstellug omialskalierter Verteiluge Verteilugsparameter: Lagemaße Modus, Media ud Mittelwerte Lerziele:. Iterpretatio

Mehr

h i Deskriptive Statistik 1-dimensionale Daten Daten und Häufigkeiten Seite 1 Nominal Ordinal Metrisch (Kardinal) Metrisch - klassiert

h i Deskriptive Statistik 1-dimensionale Daten Daten und Häufigkeiten Seite 1 Nominal Ordinal Metrisch (Kardinal) Metrisch - klassiert Deskriptive Statistik dimesioale Date Date ud Häufigkeite Seite Nomial Ordial Metrisch (Kardial Metrisch klassiert Beschreibug: Date habe keie atürliche Reihefolge. Bsp: Farbe, Religio, Geschlecht, Natioalität...

Mehr

Beschreibende Statistik Kenngrößen in der Übersicht (Ac)

Beschreibende Statistik Kenngrößen in der Übersicht (Ac) Beschreibede Statistik Kegröße i der Übersicht (Ac) Im folgede wird die Berechugsweise des TI 83 (sowie vo SPSS, s. ute) verwedet. Diese geht auf eie Festlegug vo Moore ud McCabe (00) zurück. I der Literatur

Mehr

Konzentration und Disparität

Konzentration und Disparität Begleitede Uterlage zur Übug Deskriptive Statistik Michael Westerma Uiversität Esse Ihaltsverzeichis 6 Kozetratios- ud Disparitätsmessug................................ 2 6.1 Begriff ud Eileitug.......................................

Mehr

Wahrscheinlichkeit & Statistik Musterlösung Serie 13

Wahrscheinlichkeit & Statistik Musterlösung Serie 13 ETH Zürich FS 2013 D-MATH Has Rudolf Küsch Koordiator Blaka Horvath Wahrscheilichkeit & Statistik Musterlösug Serie 13 1. a) Die Nullhypothese lautet dass das echte Medikamet höchstes gleich gut ist wie

Mehr

a) Histogramm der Verteilung: Zunächst werden die gegebenen Messwerte in aufsteigender Reihenfolge sortiert:

a) Histogramm der Verteilung: Zunächst werden die gegebenen Messwerte in aufsteigender Reihenfolge sortiert: D Lösug zu Aufgabe 2: Histogra a) Histogra der Verteilug: Zuächst werde die gegebee Messwerte i aufsteigeder Reihefolge sortiert: i 2 3 4 5 6 7 8 9 2 3 4 5 4,574 4,589 4,593 4,599 4,6 4,67 4,68 4,69 4,6

Mehr

,,, xn. 3. Intervallschätzungen Zufallsstichproben und Stichprobenfunktionen Zufallsstichproben. Zufallsvariablen mit

,,, xn. 3. Intervallschätzungen Zufallsstichproben und Stichprobenfunktionen Zufallsstichproben. Zufallsvariablen mit 3. Itervallschätzuge 3.1. Zufallsstichprobe ud Stichprobefuktioe 3.1.1 Zufallsstichprobe 1 Sei eie Zufallsvariable ud seie gemeisamer Verteilug,,,, Zufallsvariable mit - da heiße 1,,, Zufallsstichprobe

Mehr

3 Vergleich zweier unverbundener Stichproben

3 Vergleich zweier unverbundener Stichproben 3 Vergleich zweier uverbudeer Stichprobe 3. Der Zweistichprobe t-test Es wird vorausgesetzt, dass die beide Teilstichprobe x, x,..., x ud y, y,..., y jeweils aus (voeiader uabhägige) ormalverteilte Grudgesamtheite

Mehr

WISTA WIRTSCHAFTSSTATISTIK

WISTA WIRTSCHAFTSSTATISTIK WISTA WIRTSCHAFTSSTATISTIK PROF. DR. ROLF HÜPEN FAKULTÄT FÜR WIRTSCHAFTSWISSENSCHAFT Semiar für Theoretische Wirtschaftslehre Vorlesugsprogramm 30.04.203 Mittelwerte ud Lagemaße I. Quatile vo Häufigkeitsverteiluge

Mehr

Zusammenfassung: Gleichungen und Ungleichungen

Zusammenfassung: Gleichungen und Ungleichungen LGÖ Ks VMa Schuljahr 6/7 Zusammefassug: Gleichuge ud Ugleichuge Ihaltsverzeichis Polyomgleichuge ud -ugleichuge Bruch-, Wurzel- ud Betragsgleichuge ud ugleichuge 6 Für Eperte 8 Polyomgleichuge ud -ugleichuge

Mehr

Beispiel: p-wert bei Chi-Quadrat-Anpassungstest (Grafik) Auftragseingangsbeispiel, realisierte Teststatistik χ 2 = , p-wert: 0.

Beispiel: p-wert bei Chi-Quadrat-Anpassungstest (Grafik) Auftragseingangsbeispiel, realisierte Teststatistik χ 2 = , p-wert: 0. 8 Apassugs- ud Uabhägigkeitstests Chi-Quadrat-Apassugstest 8.1 Beispiel: p-wert bei Chi-Quadrat-Apassugstest (Grafik) Auftragseigagsbeispiel, realisierte Teststatistik χ 2 = 12.075, p-wert: 0.0168 f χ

Mehr

Wirksamkeit, Effizienz

Wirksamkeit, Effizienz 3 Parameterpuktschätzer Eigeschafte vo Schätzfuktioe 3.3 Wirksamkeit, Effiziez Defiitio 3.5 (Wirksamkeit, Effiziez Sei W eie parametrische Verteilugsaahme mit Parameterraum Θ. 1 Seie θ ud θ erwartugstreue

Mehr

II. Grundzüge der Stichprobentheorie

II. Grundzüge der Stichprobentheorie II. Grudzüge der Stichprobetheorie Grüde für Stichprobeerhebug - deutlich gerigere Koste - größere Awedugsbreite - kürzere Erhebugs- ud Auswertugszeite - i der Regel größere Geauigkeit der Ergebisse Begriffsbestimmug

Mehr

Übungsaufgaben - Organisatorisches

Übungsaufgaben - Organisatorisches Übugsaufgabe - Orgaisatorisches Der Abgabetermi der eue Übugsblätter ist: Motag, 4:00 Uhr Fehlerrechugsbriefkaste Der Abgabetermi der verbesserte Übugsblätter ist: Freitag, 6:00 Uhr T. Kießlig: Auswertug

Mehr

Mathematische und statistische Methoden I

Mathematische und statistische Methoden I Prof. Dr. G. Meihardt Methodelehre Mathematische ud statistische Methode I Sprechstude jederzeit ach Vereibarug ud ach der Vorlesug Wallstr. 3, 6. Stock, Raum 06-206 Dr. Malte Persike persike@ui-maiz.de

Mehr

Kapitel 2. Kapitel 1 Skalierungen. Graphische Darstellungen. Seite 1/5 Deskriptive Statistik. Aufgabe 1 Welche Skalenniveaus liegen vor?

Kapitel 2. Kapitel 1 Skalierungen. Graphische Darstellungen. Seite 1/5 Deskriptive Statistik. Aufgabe 1 Welche Skalenniveaus liegen vor? Seite 1/5 Deskriptive Statistik Kapitel 1 Skalieruge Aufgabe 1 Welche Skaleiveaus liege vor? Telefoummer Hausummer Ihalt vo Bierflasche i Zetiliter Haushaltsgröße i Persoe Lägegrade Nummerschilder Kapitel

Mehr

Evaluierung einer Schulungsmaßnahme: Punktezahl vor der Schulung Punktezahl nach der Schulung. Autoritarismusscore vor/nach Projekt

Evaluierung einer Schulungsmaßnahme: Punktezahl vor der Schulung Punktezahl nach der Schulung. Autoritarismusscore vor/nach Projekt 2.4.5 Gauss-Test ud t-test für verbudee Stichprobe 2.4.5.8 Zum Begriff der verbudee Stichprobe Verbudee Stichprobe: Vergleich zweier Merkmale X ud Y, die jetzt a deselbe Persoe erhobe werde. Vorsicht:

Mehr

h a 2 b 1 h a1 b 2 h a1 b 1 h a1. h a 2. h.b1 h ij h 11 h 12 h 21 a b h. j h 1. h 2. h.1 a b h i. =h i1 h i2... h i m h. j =h 1j h 2j... h k j h.

h a 2 b 1 h a1 b 2 h a1 b 1 h a1. h a 2. h.b1 h ij h 11 h 12 h 21 a b h. j h 1. h 2. h.1 a b h i. =h i1 h i2... h i m h. j =h 1j h 2j... h k j h. Kotigeztabelle / Kreuztabelle für 2 diskrete /omialskalierte Variable ethält: 1. absolute gemeisame Häufigkeite h 11 h 12 h 21 für Kombiatioe vo zwei Merkmale / Variable a b steht also für mit jeweils

Mehr

Schätzen von Populationswerten

Schätzen von Populationswerten Schätze vo Populatioswerte SS00 7.Sitzug vom.06.00 Schätze vo Populatioswerte Ziel: Ermöglichug vo Aussage über die Grudgesamtheit ahad vo Stichprobedate Logische Methode: Iduktiosschluß Grudlage des Iduktiosschlusses:

Mehr

LGÖ Ks VMa 12 Schuljahr 2017/2018

LGÖ Ks VMa 12 Schuljahr 2017/2018 LGÖ Ks VMa Schuljahr 7/8 Zusammefassug: Gleichuge ud Ugleichuge Ihaltsverzeichis Polyomgleichuge ud -ugleichuge Bruch-, Wurzel- ud Betragsgleichuge ud ugleichuge 6 Für Experte 8 Polyomgleichuge ud -ugleichuge

Mehr

x 1, x 2,..., x n ist eine Liste von n reellen Zahlen. Das arithmetische Mittel x der Zahlen ist x = x 1 + x x n n

x 1, x 2,..., x n ist eine Liste von n reellen Zahlen. Das arithmetische Mittel x der Zahlen ist x = x 1 + x x n n Mathemati macht Freu()de AB Statistische Kegröße ud Boxplot x 1, x,..., x ist eie Liste vo reelle Zahle. Das arithmetische Mittel x der Zahle ist x = x 1 + x + + x. Arithmetischer Mittelwert Arithmetischer

Mehr

Angewandte Mathematik und Programmierung

Angewandte Mathematik und Programmierung Agewadte Mathematik ud Programmierug Eiführug i das Kozept der objektorietierte Aweduge zu wisseschaftliche Reches mit C++ ud Matlab SS03 Orgaisatorisches Dozete Gruppe: Ago (.50), Ludger Buchma(.50) Webseite:

Mehr

6. Übungsblatt Aufgaben mit Lösungen + Selbsttest-Auflösung

6. Übungsblatt Aufgaben mit Lösungen + Selbsttest-Auflösung 6. Übugsblatt Aufgabe mit Lösuge + Selbsttest-Auflösug Aufgabe 6: Utersuche Sie die Folge, dere Glieder ute für N agegebe sid, auf Beschräktheit, Mootoie ud Kovergez bzw. Beschräktheit, Mootoie ud Kovergez

Mehr

10. Testen von Hypothesen Seite 1 von 6

10. Testen von Hypothesen Seite 1 von 6 10. Teste vo Hypothese Seite 1 vo 6 10.1 Eiführug i das Teste vo Hypothese Eie Hypothese ist eie Vermutug bzw. Behauptug über die Wahrscheilichkeit eies Ereigisses. Mit Hilfe eies geeigete Tests (=Testverfahre)

Mehr

Teil II Zählstatistik

Teil II Zählstatistik Teil II Zählstatistik. Aufgabestellug. Vergleiche Sie experimetelle Zählverteiluge mit statistische Modelle (POISSON-Verteilug ud Normalverteilug) 2. Theoretische Grudlage Stichworte zur Vorbereitug: Impulszahl,

Mehr

STATISTIK I Übung 08 Bravais- Pearson- Korrelationskoeffizient. 1 Kurze Wiederholung. Was sind Zusammenhangsmaße?

STATISTIK I Übung 08 Bravais- Pearson- Korrelationskoeffizient. 1 Kurze Wiederholung. Was sind Zusammenhangsmaße? Statistik I Übug 08 Christia Reiboth STATISTIK I Übug 08 Bravais- Pearso- Korrelatioskoeffiziet 1 Kurze Wiederholug Was sid Zusammehagsmaße? Habe wir bislag immer ur eie Variable x (Lagemaße, Streuugsmaße,

Mehr

Statistische Maßzahlen. Statistik Vorlesung, 10. März, 2010. Beispiel. Der Median. Beispiel. Der Median für klassifizierte Werte.

Statistische Maßzahlen. Statistik Vorlesung, 10. März, 2010. Beispiel. Der Median. Beispiel. Der Median für klassifizierte Werte. Statistik Vorlesug,. ärz, Statistische aßzahle Iformatio zu verdichte, Besoderheite hervorzuhebe ittelwerte Aufgabe: die Lage der Verteilug auf der Abszisse zu zeige. Der odus: derjeige Wert, der im Häufigste

Mehr

Fit in Mathe. April Klassenstufe 10 Wurzelfunktionen

Fit in Mathe. April Klassenstufe 10 Wurzelfunktionen Thema Fit i Mathe Musterlösuge 1 April Klassestufe 10 Wurzelfuktioe Uter der -te Wurzel eier icht-egative Zahl (i Zeiche: ) versteht ma die icht-egative Zahl, die mal mit sich selber multipliziert, die

Mehr

Ulrich Stein Fehlerrechnung

Ulrich Stein Fehlerrechnung Fehlerrechug Verteilug vo Messwerte Mittelwert Stadardabweichug Stadardfehler Rude vo Messwerte Darstellug vo Messwerte (Stellezahl) Fehlerfortpflazug Messergebisse Messug physikalische Realität Messgerät,

Mehr

Schätzen von Populationswerten

Schätzen von Populationswerten Schätze vo Populatioswerte 7.Sitzug 35 Seite, SoSe 003 Schätze vo Populatioswerte Ziel: Ermöglichug vo Aussage über die Grudgesamtheit ahad vo Stichprobedate Logische Methode: Iduktiosschluss Grudlage

Mehr

Kreuztabellenanalyse und Assoziationsmaße

Kreuztabellenanalyse und Assoziationsmaße FB 1 W. Ludwig-Mayerhofer Statistik 1 Herzlich willkomme zur Vorlesug Statistik Zusammehäge zwische omiale (ud/oder ordiale) Merkmale: aalyse ud FB 1 W. Ludwig-Mayerhofer Statistik 2 eige sich zur Darstellug

Mehr

Auszüge der nichtparametrischen Statisik

Auszüge der nichtparametrischen Statisik Empirische Wirtschaftsforschug - 1 - Auszüge der ichtparametrische Statisik Kapitel 1: Räge ud lieare Ragstatistike Aahme, Defiitioe ud Eigeschafte (1.1) Aahme: (a) (b) Die Date x 1,, x sid midestes ordial.

Mehr

Aufgabe 5: Grundlagen Wahr keit, Satz von Bayes und Binomialverteilung

Aufgabe 5: Grundlagen Wahr keit, Satz von Bayes und Binomialverteilung Klausur: Statistik Jürge Meisel Zugelassee Hilfsmittel: icht progr. Tascherecher Bearbeitugszeit: 60 Miute Amerkug zur Bearbeitug: Die Klausur besteht aus isgesamt 6 Aufgabe. Sie müsse ur 5 davo bearbeite.

Mehr

14 Statistische Beziehungen zwischen nomi nalen Merkmalen

14 Statistische Beziehungen zwischen nomi nalen Merkmalen 14 Statistische Beziehuge zwische omi ale Merkmale 14.1 Der Chi Quadrat Test auf Uabhägigkeit für Vier Feldertafel 14.2 Der Chi Quadrat Test auf Uabhägigkeit für r s Kotigeztafel 14.3 Zusammmehagsmaße

Mehr

Wahrscheinlichkeitstheorie und Statistik vom

Wahrscheinlichkeitstheorie und Statistik vom INSTITUT FÜR MATHEMATISCHE STOCHASTIK WS 005/06 UNIVERSITÄT KARLSRUHE Priv.-Doz. Dr. D. Kadelka Klausur Wahrscheilichkeitstheorie ud Statistik vom 9..006 Musterlösuge Aufgabe A: Gegebe sei eie Urliste

Mehr

Übungen Abgabetermin: Freitag, , 10 Uhr THEMEN: Testtheorie

Übungen Abgabetermin: Freitag, , 10 Uhr THEMEN: Testtheorie Uiversität Müster Istitut für Mathematische Statistik Stochastik WS 203/204, Blatt Löwe/Heusel Aufgabe (4 Pukte) Übuge Abgabetermi: Freitag, 24.0.204, 0 Uhr THEMEN: Testtheorie Die Sollstärke der Rohrwäde

Mehr

1 Randomisierte Bestimmung des Medians

1 Randomisierte Bestimmung des Medians Praktikum Diskrete Optimierug (Teil 0) 0.07.006 Radomisierte Bestimmug des Medias. Problemstellug ud Ziel I diesem Abschitt stelle wir eie radomisierte Algorithmus zur Bestimmug des Medias vor, der besser

Mehr

Kapitel 6 : Punkt und Intervallschätzer

Kapitel 6 : Punkt und Intervallschätzer 7 Kapitel 6 : Pukt ud Itervallschätzer Puktschätzuge. I der Statistik wolle wir Rückschlüsse auf das Wahrscheilichkeitsgesetz ziehe, ach dem ei vo us beobachtetes Zufallsexperimet abläuft. Hierzu beobachte

Mehr

Wirksamkeit, Effizienz. Beispiel: Effizienz. Mittlerer quadratischer Fehler (MSE) Konsistenz im quadratischen Mittel

Wirksamkeit, Effizienz. Beispiel: Effizienz. Mittlerer quadratischer Fehler (MSE) Konsistenz im quadratischen Mittel 3 arameterpuktschätzer Eigeschafte vo Schätzfuktioe 3.3 Wirksamkeit, Effiziez 3 arameterpuktschätzer Eigeschafte vo Schätzfuktioe 3.3 Beispiel: Effiziez Defiitio 3.5 (Wirksamkeit, Effiziez Sei W eie parametrische

Mehr