Stochastik 01 Deskriptive Statistik

Ähnliche Dokumente
Lösungen. w58r4p Lösungen. w58r4p. Name: Klasse: Datum:

Die erhobenen Daten (Urliste) werden mithilfe einer Strichliste geordnet. Damit kann die absolute Häufigkeit einfach und schnell erfasst werden.

1 45, 39, 44, 48, 42, 39, 40, , 31, 46, 35, 31, 42, 51, , 42, 33, 46, 33, 44, 43

3. Deskriptive Statistik

Mathematische Statistik. Zur Notation

Statistik Skalen (Gurtner 2004)

a) x = 1150 ; x = 950 ; x = 800 b) Die Lagemaße unterscheiden sich voneinander. c) Der Median charakterisiert die Stichprobe am besten.

Die folgende Tabelle 1 wurde im Rahmen einer Umfrage unter den Studenten eines Statistikseminars erstellt.

Bitte am PC mit Windows anmelden!

absolute Häufigkeit h: Anzahl einer bestimmten Note relative Häufigkeit r: Anzahl einer bestimmten Note, gemessen an der Gesamtzahl der Noten

Die erhobenen Daten werden zunächst in einer Urliste angeschrieben. Daraus ermittelt man:

Die erhobenen Daten werden zunächst in einer Urliste angeschrieben. Daraus ermittelt man:

Statistik I für Betriebswirte Vorlesung 9

Kapitel 1 Beschreibende Statistik

Deskription, Statistische Testverfahren und Regression. Seminar: Planung und Auswertung klinischer und experimenteller Studien

Statistische Grundlagen I

Tutorium Mathematik in der gymnasialen Oberstufe 1. Veranstaltung: Beschreibende Statistik 19. Oktober 2016

Deskriptive Statistik

8. Statistik Beispiel Noten. Informationsbestände analysieren Statistik

Statistik I für Betriebswirte Vorlesung 9

W-Seminar: Versuche mit und am Menschen 2017/2019 Skript

Statistik und Wahrscheinlichkeitsrechnung

benötigen. Die Zeit wird dabei in Minuten angegeben und in einem Boxplot-Diagramm veranschaulicht.

SBP Mathe Aufbaukurs 1 # 0 by Clifford Wolf. SBP Mathe Aufbaukurs 1

Deskriptive Statistik

1.1 Graphische Darstellung von Messdaten und unterschiedliche Mittelwerte. D. Horstmann: Oktober

Stochastik 03 Zufallsgröÿen und Verteilung

Stochastik Deskriptive Statistik

Stochastik 04 Binomialverteilung

Mathematik für das Berufliche Gymnasium in Niedersachsen Kerncurriculum und Bildungsstandards Einführungsphase Schwerpunkt Wirtschaft

Institut für Biometrie und klinische Forschung. WiSe 2012/2013

Kreisdiagramm, Tortendiagramm

Qualität und Zuverlässigkeit - Statistik Master MB

Statistik und Wahrscheinlichkeitsrechnung

1,11 1,12 1,13 1,14 1,15 1,16 1,17 1,17 1,17 1,18

Grundlagen der. h Rückblick. Dr. K. Krüger. Grundwissen Mathematik

Weitere Lagemaße: Quantile/Perzentile I

Die ABSOLUTE HÄUFIGKEIT einer Merkmalsausprägung gibt an, wie oft diese in der Erhebung eingetreten ist.

BOXPLOT 1. Begründung. Boxplot A B C

WS 1.1 Aufgabenstellung: Lösung:

Harry Potter und die Kammer des Schreckens : m, s, g, a, a, a, sg, g, a, g, m, m, g, g, sg, s, a, a, a, g, a, a, g, g, a

Univariate Häufigkeitsverteilungen Kühnel, Krebs 2001: Statistik für die Sozialwissenschaften, S.41-66

13,86. Schritt 4: Berechnung des Quartilsabstandes. Unteres Quartil! #5,5.

Daten systematisch auswerten und vergleichen

Unterrichtsmaterialien in digitaler und in gedruckter Form. Auszug aus: Kopiervorlagen zur Statistik. Das komplette Material finden Sie hier:

Statistik und Wahrscheinlichkeitsrechnung

Einführung in Quantitative Methoden

Häufigkeitsverteilungen und Statistische Maßzahlen. Häufigkeitsverteilungen und Statistische Maßzahlen. Variablentypen. Stichprobe und Grundgesamtheit

Statistik I für Humanund Sozialwissenschaften

Verfahren für metrische Variable

Statistik eindimensionaler Größen

Aufgabe 3 Bei 16 PKWs desselben Typs wurde der Benzinverbrauch pro 100 km gemessen. Dabei ergab sich die folgende Urliste (in Liter pro 100km):

Statistik K urs SS 2004

Diese Lücken sollten nicht auch bei Ihnen vorhanden sein: Aufgrund einer statistischen Untersuchung entsteht eine geordnete bzw. ungeordnete, die durc

Fachrechnen für Tierpfleger

Das arithmetische Mittel. x i = = 8. x = 1 4. und. y i = = 8

Der Modus ist. Der Median ist. 3. Übung. Aufgabe 1. a) der häufigste Wert. b) der Wert unter dem 50 % aller anderen Werte liegen.

Ziel: Breite der Verteilung auf der Achse beschreiben nur bei quantitativen Merkmalen mo glich hier:

Beispiel 2 (Einige Aufgaben zu Lageparametern) Aufgabe 1 (Lageparameter)

Sommersemester Marktforschung

Median 2. Modus < Median < Mittelwert. Mittelwert < Median < Modus. 2 Modalwerte oder Modus viel größer bzw. viel kleiner als Mittelwert

Herzlich willkommen zur Vorlesung Statistik. Streuungsmaße oder die Unterschiedlichkeit der Daten nebst kurzen Ausführungen zu Schiefe und Wölbung

3) Lagemaße: Mittelwert, Median, Modus

Inhaltsverzeichnis. Teil 1 Basiswissen und Werkzeuge, um Statistik anzuwenden

STATISTIK. Erinnere dich

Übungen mit dem Applet Rangwerte

1) Warum ist die Lage einer Verteilung für das Ergebnis einer statistischen Analyse von Bedeutung?

Statistik. Jahr Mittlerer Wasserstand in cm

Mathematik für Biologen

htw saar 1 EINFÜHRUNG IN DIE STATISTIK: BESCHREIBENDE STATISTIK

Klausur Statistik I Dr. Andreas Voß Wintersemester 2005/06

Statistische Methoden der Datenanalyse Wintersemester 2012/2013 Albert-Ludwigs-Universität Freiburg

Ü B U N G S S K R I P T S T A T I S T I K

Stoffverteilungsplan Mathematik Grundkurs. Lambacher Schweizer Stochastik ISBN Klassenarbeit

2. Deskriptive Statistik

Empirische Verteilungsfunktion

Einführung in Quantitative Methoden

1. Maße der zentralen Tendenz Beispiel: Variable Anzahl der Geschwister aus Jugend '92. Valid Cum Value Frequency Percent Percent Percent

Vorwort Statistik Spannweite und Zentralwert Modalwert...7. Vierfeldertafeln Mittelwert Säulendiagramme...

Die erhobenen Daten (Urliste) werden mithilfe einer Strichliste geordnet. Damit kann die absolute Häufigkeit einfach und schnell erfasst werden.

LÖSUNG 2C a. Bei HHEINK handelt es sich um eine metrische Variable.

Ernst Klett Verlag GmbH, Stuttgart 2017 Alle Rechte vorbehalten Von dieser Druckvorlage ist die Vervielfältigung für den eigenen Unterrichtsgebrauch

Einführung in die Statistik für Wirtschaftswissenschaftler für Betriebswirtschaft und Internationales Management

Beispiel 4 (Einige weitere Aufgaben)

Ermitteln Sie auf 2 Dezimalstellen genau die folgenden Kenngrößen der bivariaten Verteilung der Merkmale Weite und Zeit:

PROC MEANS. zum Berechnen statistischer Maßzahlen (für quantitative Merkmale)

Orientierungshilfe für den ersten Hausaufgabenzettel

Biomathematik für Mediziner, Klausur WS 1999/2000 Seite 1

Graphische Darstellung einer univariaten Verteilung:

Häufigkeitsauszählungen, zentrale statistische Kennwerte und Mittelwertvergleiche

Statistik SS Deskriptive Statistik. Bernhard Spangl 1. Universität für Bodenkultur. March 6, 2012

Musterlösung zur Übungsklausur Statistik

Vorlage zur Dokumentation der täglichen Arbeitszeit

Einführung in die Statistik

2. Beschreibung von eindimensionalen (univariaten) Stichproben

Deskriptive Statistik

Mathematik III für MB und ME

Transkript:

Grundbegrie der Statistik 23. August 2018

Grundbegrie der Statistik Grundlagen der Statistik (bis Klasse 10) Grundlagen der Stochastik (bis Klasse 10) Zufallsgrößen und Verteilungen Beurteilende Statistik (Testen von Hypothesen) Bernoulli-Experimente

Grundbegrie der Statistik Ziele der Sitzung verschiedene Typen von Daten und ihre beurteilen können Daten in passenden Diagrammen veranschaulichen können Kenngröÿen von statistischen Daten beschreiben und interpretieren können interpretieren und darstellen können

Grundbegrie der Statistik Grundbegrie Beispiele In der deskriptiven (beschreibenden) Statistik erhebt man Daten und wertet diese aus, um Erkenntnisse über Zusammenhänge zu generieren. Grundbegrie der Statistik Daten sind meist in einer Urliste gegeben und werden dann in einer Strichliste geordnet. Daraus können dann die absolute Häugkeiten (ausgezählte Zahlen) und die relativen Häugkeiten (Anteil an der Gesamtheit) gebildet werden.

Grundbegrie der Statistik Grundbegrie Beispiele In der Klasse 6B hat Herr Wuschke die Lieblingstiere erfragt. Dabei ist folgendes Ergebnis herausgekommen: Lieblingstiere der 6B Lieblingstier Strichliste abs. Hfkt. rel. Hfkt. Kaninchen : 1 Pferd :::: 4 Hund ;: 6 Einhorn ;::: 8 Katze ::: 3 1 24 0,0417 4 24 0,1667 6 24 = 0,25 8 24 0,3333 3 24 = 0,125

Beispiel Besitz von Mediengeräte Bei der JIM-Studie a wurden Jugendliche von 12 Jahren bis 19 Jahren gefragt, welche Mediengeräte sie besitzen. Hier ist ein Beispiel von 5 Jugendlichen. Urliste: Smartphone; Laptop; Spielekonsole; Tablet; Smartphone; Fernsehgerät; Smartphone; Laptop; ipod; Smartphone; Spielekonsole; Tablet; Smartphone; Fernsehgerät; Tablet; Streamingbox; Smartphone; Laptop; Spielekonsole; ipod; Tablet Gerät Smartph. Laptop Konsole Tablet TV SBox ipod Strichliste ; ::: ::: :::: :: : :: abs. Hfkt. 5 3 3 4 2 1 2 a Jährlich durchgeführte Studie Jugend, Information, (Multi-)Media

niveaus Daten werden in drei unterschiedliche eingeteilt: Nominalskala Ordinalskala metrische Skala Nominalskala Daten können nur anhand unterschiedlicher Namen angegeben werden (z. B. Haarfarben, Geschlecht, Krankheiten,...) Ordinalskala Daten können geordnet werden unter bestimmten Gesichtspunkten (z. B. bevorzugte Produkte nach dem Motto: Ich würde eher... kaufen, als...) metrische Skala Daten können geordnet werden und in sinnvollen Zahlen ausgedrückt werden (z. B. Daten aus den Naturwissenschaften, Daten aus dem Sport,... nach dem Motto: Das kann ich messen.)

Grundbegrie der Statistik Bei metrischen Daten ist es häug sinnvoll, diese zu klassieren. Dabei werden sie in selbstgewählten oder vorgegebenen Klassen zusammengefasst. Beispiel Gewicht von Säuglingen im Nordkurier 2018 Im Nordkurier erscheinen wöchentlich Informationen über Neugeborene. Das Geburtsgewicht der letzten Zeit war folgendermaÿen: 3280g, 3165g, 3055g, 2850g, 3100g, 4190g, 3730g, 3540g, 3220g, 2774g, 2955g, 3280g, 2760g, 3570g, 3860g, 2915g, 3720g, 3500g, 3550g, 2760g, 4440g, 3720g, 3630g, 3450g Gewicht x abs. Hfkt. Gewicht x abs. Hfkt. 2500g x<3000g 6 3500g x<4000g 9 3000g x<3500g 7 4000g x<4500 2

Grundbegrie der Statistik Diagrammtypen Beispiele für Diagramme Diagrammtypen Für die Darstellung von absoluten Häugkeiten nutzt man ein Säulendiagramm oder Balkendiagramm. Wenn die x-achse dabei geordnet ist (z. B. bei Jahreszahlen), kann man auch ein Liniendiagramm nutzen. Für die Darstellung von relativen Häugkeiten nutzt man ein Kreisdiagramm oder Streifendiagramm. Diese Diagramme dürfen nur verwendet werden, wenn keine Mehrfachnennung möglich war. Klassierte Daten werden in einem Histogramm dargestellt. Dies ist eine besondere Form des Säulendiagramms. Wenn die statistischen Kenngröÿen berechnet wurden, können die Daten auch mithilfe eines dargestellt werden.

Lieblingstiere der 6B Kaninchen: 1; Pferd: 4; Hund: 6; Einhorn: 8; Katze: 3 Abbildung: Säulendiagramm [Felix Röhricht 2018, Excel]

Lieblingstiere der 6B Kaninchen: 1; Pferd: 4; Hund: 6; Einhorn: 8; Katze: 3 Abbildung: Balkendiagramm [Felix Röhricht 2018, Excel]

Lieblingstiere der 6B Kaninchen: 1; Pferd: 4; Hund: 6; Einhorn: 8; Katze: 3 Abbildung: Streifendiagramm [Felix Röhricht 2018, Excel]

Lieblingstiere der 6B Kaninchen: 1; Pferd: 4; Hund: 6; Einhorn: 8; Katze: 3 Abbildung: Kreisdiagramm [Felix Röhricht 2018, Excel]

Lieblingstiere der 6B Kaninchen: 1; Pferd: 4; Hund: 6; Einhorn: 8; Katze: 3 Abbildung: Kreisdiagramm [Felix Röhricht 2018, Excel]

Grundbegrie der Statistik Diagrammtypen Beispiele für Diagramme Gewichtsklassen von Säuglingen aus dem Nordkurier Gewicht x abs. Hfkt. 2500g x<3000g 6 3000g x<3500g 7 3500g x<4000g 9 4000g x<4500 2 Abbildung: Histogramm [HW 2018, GeoGebra]

Grundbegrie der Statistik Nominalskala Ordinalskala metrische Skala Je besser die Skala ist, umso mehr statistische Kenngröÿen können erhoben werden. Bei einer Nominalskala kann man den Modalwert angeben. Modalwert Der Modalwert x mod ist die Gröÿe, welche am häugsten vorkommt. Es kann mehre Modalwerte geben.

Grundbegrie der Statistik Nominalskala Ordinalskala metrische Skala Netix-Konsum Hannah erzählt über ihren Netix-Konsum am Wochenende: Ich habe 9 Folgen Haus des Geldes geschaut, dann noch 3 Folgen von Riverdale und zwischendurch 5 Folgen Modern Family. Der Modalwert ist in diesem Beispiel x mod = Haus des Geldes Schlafzeiten am Tag André ist in letzter Zeit häug erschöpft. Deshalb hat er seine tägliche Stundenanzahl Schlaf in zwei Wochen notiert: Mo Di Mi Do Fr Sa So 6h 4,5 h 7 h 6,5 h 5 h 9 h 10 h 7 h 6,5 h 6,5 h 5 h 5,5 h 7 h 10 h Die Modalwerte sind x mod1 = 6, 5 h und x mod2 = 7 h.

Grundbegrie der Statistik Nominalskala Ordinalskala metrische Skala Da die Daten bei der Ordinalskala geordnet werden können, ist es möglich einen Zentralwert zu bestimmen, den Median. Median Der Median (Zentralwert) x med ist die Gröÿe, welche in der geordneten Datenreihe in der Mitte steht. Ist die Anzahl der Daten gerade, kann man den Median nicht immer bestimmen. Für metrische Gröÿen (Zahlen) gilt für eine Datenreihe von n Daten: x med = x n 2 + x n+1 2 2

Grundbegrie der Statistik Nominalskala Ordinalskala metrische Skala Maximum, Minimum, Spannweite Bei einer Ordinalskala kann man das Maximum und das Minimum angeben. Dies ist eindeutig, wenn Zahlenwerte vorliegen, ansonsten ist es abhängig von der Betrachtung. Der Abstand zwischen Maximum und Minimum ist die Spannweite, es gilt also: Spannweite = Maximum Minimum Schlafzeiten von André Mo Di Mi Do Fr Sa So 6h 4,5 h 7 h 6,5 h 5 h 9 h 10 h 7 h 6,5 h 6,5 h 5 h 5,5 h 7 h 10 h Maximum = 10 h; Minimum = 4,5 h; Spannweite = 5,5 h

Beispiel Median In einem Freizeitpark können bei der Auswertung verschiedene Zufriedenheitsstufen angegeben werden: 15 Personen haben folgendermaÿen bewertet:,,,,,,,,,,,,,, Ordnen der Ergebnisse führt zu:,,,,,,,,,,,,,, x mod = x med = Schlafzeiten von André Beispiel oben Ordnet man die Schlafzeiten von André, erhält man: 4,5 h; 5 h; 5 h; 5,5 h; 6 h; 6,5 h; 6,5 h; 6,5 h; 7 h; 7 h; 7 h; 9 h; 10 h; 10 h 6, 5h + 6, 5h x med = = 6, 5h 2

Quartile für die unteres/oberes Quartil Bildet man wiederum den Median zwischen dem kleinsten Wert und dem Median a, so erhält man das untere Quartil x Q1. Bildet man den Median zwischen dem gröÿten Wert und dem Median, so erhält man das obere Quartil x Q3. Während der Median die Hälfte der Stichprobe markiert, zeigt x Q1 ein Viertel der Stichprobe und x Q3 drei Viertel der Stichprobe an. a Bei einer geraden Anzahl an Daten, nutzt man die Daten, aus denen der Median gebildet wurde. Schlafzeiten von André Beispiel oben 4,5 h; 5 h; 5 h; 5,5 h; 6 h; 6,5 h; 6,5 h; 6,5 h; 7 h; 7 h; 7 h; 9 h; 10 h; 10 h x med = 6, 5h x Q1 wird zwischen 4,5 h und 6,5 h gebildet: x Q1 = 5, 5h x Q3 wird zwischen 6,5 h und 10 h gebildet: x Q3 = 7h

Grundbegrie der Statistik Nominalskala Ordinalskala metrische Skala geordnete Geburtsgewichte Beispiel oben 2760g; 2760g; 2774g; 2850g; 2915g; 2955g; 3055g; 3100g; 3165g; 3220g; 3280g; 3280g; 3450g; 3500g; 3540g; 3550g; 3570g; 3630g; 3720g; 3720g; 3730g; 3860g; 4190g; 4440g 3280g + 3450g x med = = 3365g 2 Das untere Quartil wird zwischen 2760g und 3280g gebildet und das obere zwischen 3450g und 4440g. x Q1 = 2955g + 3055g 2 = 3005g x Q3 = 3630g + 3720g 2 = 3675g

arithmetisches Mittel Grundbegrie der Statistik Nominalskala Ordinalskala metrische Skala arithmetisches Mittel Das arithmetische Mittel (Durchschnitt) berechnet sich bei n metrischen Daten: x = x 1 + x 2 +... x n n Arithmetisches Mittel in den Beispielen Bei den Geburtsgewichten ist 2 2760g + 2774g + + 4440g x = 24 Bei Andrés Schlafzeiten ist 4, 5h + 2 5h + + 2 10h x = = 14 = 81814g 24 95, 5h 14 6, 82h 3375, 58g

arithmetisches Mittel bei klassierten Daten Das arithmetische Mittel von klassierten Daten bestimmt man ähnlich, nur dass man die Klassenmitten zur Berechnung nutzt. Durchschnittliches Gewicht der Säuglinge Gewicht x Klassenmitte abs. Hfkt. 2500g x<3000g 2750g 6 3000g x<3500g 3250g 7 3500g x<4000g 3750g 9 4000g x<4500g 4250g 2 x 6 2750g + 7 3250g + 9 3750g + 2 4250g = 24 = 81500g 3395, 83g 24

Zusammenhang Median und arithmetisches Mittel statistische Ausreiÿer Das arithmetische Mittel wird von extremen Daten stark beeinusst. Der Median gibt einen realistischen zentralen Wert der Datenmenge an. Wenn das arithmetische Mittel und der Median stark voneinander abweichen, dann ist in der Stichprobe ein Ausreiÿer enthalten. Gehalt in der Firma Knausrig Chef: Bei mir verdient jeder im Schnitt 1.500e, es geht meinen Angestellten sehr gut! Personal Gehalt Personal Gehalt Praktikant 200e Reinigungskraft 450e Werksstudentin 800e Aushilfe 450e Chef 6.000e Mitarbeiter 1.100e

Grundbegrie der Statistik Nominalskala Ordinalskala metrische Skala empirische Varianz Die empirische Varianz σ 2 ist die mittlere quadratische Abweichung vom arithmetischen Mittel. σ 2 = (x x 1) 2 + (x x 2 ) 2 + + (x x n ) 2 n empirische Standardabweichung Die empirische Standardabweichung σ macht die Quadrierung in der Varianz wieder rückgängig und gibt daher an, wie stark die Daten vom arithmetischen Mittel abweichen. σ heiÿt auch Streumaÿ, weil es beschreibt, wie stark die Stichprobe streut. (x x1 ) 2 + (x x 2 ) 2 + + (x x n ) 2 σ = σ 2 = n

Geburten von Zwillingen in Mecklenburg-Vorpommern Jahr 2000 76 51 63 2001 49 61 67 2002 64 60 52 2003 65 61 71 2004 70 71 72 2005 57 48 58 2006 64 66 58 2007 67 59 57 2008 64 76 55 2009 63 69 80 2010 71 75 67 2011 74 74 69 2012 63 70 57 2013 56 76 67 2014 74 81 64 2015 60 74 52 2 Jungen: Max = 76; Min = 49; Spannweite = 27 x med = 64; x Q1 = 61, 5; x Q3 = 70, 5; x mod = 64; x = 64, 81; σ = 7, 00 1 Junge 1 Mädchen: Max = 81; Min = 48; Spannweite = 33 x med = 69, 5; x Q1 = 60, 5; x Q3 = 74, 5; x mod1 = 61; x mod2 = 74; x mod3 = 74; x = 67, 0; σ = 9, 19 2 Mädchen: Max = 80; Min = 52; Spannweite = 28 x med = 63, 5; x Q1 = 57; x Q3 = 68; x mod = 67; x = 63, 06; σ = 7, 69

Grundbegrie der Statistik Ein Boxplot stellt die Verteilung der erfassten Daten dar. Er besteht aus Minimum, unterem Quartil, Median, (arithmetischem Mittel,) oberem Quartil und Maximum. Ausreiÿer liegen auÿerhalb des.

Abbildung: Boxplot [HW 2018, https://plot.ly/create/box-plot/]

Abbildung: Boxplot [HW 2018, https://plot.ly/create/box-plot/]