Gegeben: Eine Menge von Objekten mit Merkmalen (beobachtet oder gemessen) Die gegebene Menge heißt auch Grundgesamtheit.

Ähnliche Dokumente
a 1 < a 2 <... < a k. 2 Häufigkeitsverteilungen 52

Statistische Grundlagen I

Deskriptive Statistik Kapitel III - Merkmalsarten

Kapitel 2. Häufigkeitsverteilungen

Wahrscheinlichkeitsverteilungen

Kapitel VI - Lage- und Streuungsparameter

3.2 Streuungsmaße. 3 Lage- und Streuungsmaße 133. mittlere Variabilität. geringe Variabilität. große Variabilität

Ü b u n g s b l a t t 15

Kapitel 1: Deskriptive Statistik

Demoseiten für

0 Einführung: Was ist Statistik

Kapitel III - Merkmalsarten

Kompetenztest. Testheft

Geg.: Eine Menge von Elementen, z.b.

Teil I: Deskriptive Statistik

Pflichtteilaufgaben zu Stochastik (Pfadregeln, Erwartungswert, Binomialverteilung) Baden-Württemberg

Glücksrad-Aufgabe. Das Glücksrad ist in 2 Sektoren mit den Zahlen 1 (Winkel 120 ) und 2 eingeteilt.

Grundlagen der Statistik

Deskriptive Statistik Kapitel VII - Konzentration von Merkmalswerten

Ringvorlesung Einführung in die Methoden der empirischen Sozialforschung II

2 Häufigkeitsverteilungen

Kreisdiagramm, Tortendiagramm

TEIL 7: EINFÜHRUNG UNIVARIATE ANALYSE TABELLARISCHE DARSTELLUNG / AUSWERTUNG

Von insgesamt 50 Statistikern nehmen an allen 3 Tagen einer Tagung 30, an 2 Tagen 10 und an einem Tag ebenfalls 10 teil.

Deskriptive Statistik Kapitel IX - Kontingenzkoeffizient

Definition der Entropie unter Verwendung von supp(p XY )

Hackenbusch und Spieltheorie

5 Kontinuierliches Wachstum

Unter dem Symbol n! (gelesen n Fakultät) versteht man das Produkt der natürlichen Zahlen von 1 bis n.

Wahrscheinlichkeits - rechnung und Statistik

WAHRSCHEINLICHKEIT. Erinnere dich

Auswertung statistischer Daten 1

Analytische Statistik II

Deskriptive Statistik Erläuterungen

Biometrieübung 5 Spezielle Verteilungen. 1. Anzahl von weiblichen Mäusen in Würfen von jeweils 4 Mäusen

absolute Häufigkeit h: Anzahl einer bestimmten Note relative Häufigkeit r: Anzahl einer bestimmten Note, gemessen an der Gesamtzahl der Noten

Beschreibende Statistik

Logarithmen näherungsweise berechnen

Rudolf Brinkmann Seite

Kreissektoren und Bogenmaß

Kapitel 5 Kenngrößen empirischer Verteilungen 5.1. Lagemaße. x mod (lies: x-mod) Wofür? Lageparameter. Modus/ Modalwert Zentrum. Median Zentralwert

Lösungsvorschläge zur Klausur Beschreibende Statistik und Wirtschaftsstatistik (Sommersemester 2013)

1. Einführung und statistische Grundbegriffe. Grundsätzlich unterscheidet man zwei Bedeutungen des Begriffs Statistik:

Darstellung von Häufigkeitsverteilungen

DEMO für

Mit Dezimalzahlen multiplizieren

Kai Schaal. Universität zu Köln

Häufigkeitsverteilungen und Statistische Maßzahlen. Häufigkeitsverteilungen und Statistische Maßzahlen. Variablentypen. Stichprobe und Grundgesamtheit

Daten und Zufall in der Jahrgangsstufe 8 Seite 1

1 Elemente der Wahrscheinlichkeitstheorie

Mathematische und statistische Methoden I

Plus im Zahlenraum bis 10

Kombinatorik BEISPIEL: WIE VIELE MÖGLICHKEITEN GIBT ES, EINE DREISTELLIGE ZAHL MIT DEN ZIFFERN 3

LANGFRISTIGE HAUSAUFGABE (STOCHASTIK)

Natürliche Zahlen. Wer kann alle möglichen Zahlen aus diesen Ziffern basteln und sie der Größe nach ordnen?

6.3 Exakte Differentialgleichungen

Von der Normalverteilung zu z-werten und Konfidenzintervallen

WAHRSCHEINLICHKEITSLEHRE

Polizeidienst-Aufgabe Abiturprüfung Bayern LK 2003

f : x y = mx + t Der Graph einer linearen Funktion ist eine Gerade, welche die y-achse im Punkt S schneidet. = m 2 x 2 m x 1

N

Über die Vereinfachung der Gewichtsberechnung bei Umlegierungen

Der Trainer einer Fußballmannschaft stellt die Spieler seiner Mannschaft auf. Insgesamt besteht der Kader seiner Mannschaft aus 23 Spielern.

Grundbegriffe der Wahrscheinlichkeitstheorie

4 + 1 = = = = = = = = = = = = = = = = = =

Reihen, Einleitung. 1-E1 Ma 2 Lubov Vassilevskaya

Statistik III. Walter Zucchini Fred Böker Andreas Stadie

Funktionen mit mehreren Variablen. Voraussetzungen:

Lernen an Stationen mit den geometrischen Körpern

Natürliche Zahlen und. Zahlenstrahl

P (X = 2) = 1/36, P (X = 3) = 2/36,...

Lineare Gleichungen Lineare Gleichungssysteme. Lineare Algebra 5. Ein Trainingsheft für Schüler

Variablen und Skalenniveaus

Willkommen zur Vorlesung Statistik (Master)

Das arithmetische Mittel. x i = = 8. x = 1 4. und. y i = = 8

Forschungsmethoden in der Sozialen Arbeit

4b. Wahrscheinlichkeit und Binomialverteilung

Grundwissen Mathematik 6. Dieser Grundwissenskatalog gehört: Name: Klasse:

Serie 1 Serie 2 Serie 3 Serie 4 Serie 5 Serie 6. Statistik-Tutorium. Lösungsskizzen Übung SS2005. Thilo Klein. Grundstudium Sommersemester 2008

3 Reihen. 3.1 Konvergenz und Divergenz. Die Eindeutigkeit nach Satz 13 ergibt schließlich (5). (6) folgt aus (2) und (1) wegen. 1 a +log ba.

Institut für Biometrie und klinische Forschung. WiSe 2012/2013

htw saar 1 EINFÜHRUNG IN DIE STATISTIK: BESCHREIBENDE STATISTIK

Diese Aufgaben sind ohne Taschenrechner in maximal 45 Minuten zu lösen. Die Formelsammlung und deine Zeichengeräte darfst du benutzen.

Kompetenzcheck. Mathematik (AHS) Oktober Lösungsheft

Beschreibende Statistik

Dr Thomas Chaize Analyse Strategie Mittel Der Goldpreis. Mailing n

Kapitel 2 Wahrscheinlichkeitsrechnung

Relationen / Lineare Funktionen

Empirische Verteilungsfunktion

Bitte am PC mit Windows anmelden!

2. Deskriptive Statistik

KLAUSUR ZUR LINEAREN ALGEBRA I MUSTERLÖSUNG

Statistikmodul. Programmbeschreibung

Kaufmännische Berufsmatura 2012

47 cm. Maßzahl. Einheit. G Giga = M Mega = k Kilo = c centi. m milli. n nano.

Simulation eines radioaktiven Zerfalls, Zerfallsfunktionen

Welche der folgenden Aussagen sind richtig? (x aus 5) A Ein metrisches Merkmal, das überabzählbar viele Ausprägungen besitzt heißt diskret.

Transkript:

Kapitel 1 Beschreibende Statistik Gegeben: Eine Menge von Objekten mit Merkmalen (beobachtet oder gemessen) Gesucht: Übersichtliche Beschreibung Die gegebene Menge heißt auch Grundgesamtheit. Beispiele für Merkmale: rot, grün, blau,..., verheiratet, ledig,..., 1,54 m groß, 1,87 m groß, 1,62 m groß,..., gibt 22,1 l Milch, gibt 34,2 l Milch,.... In der Datensammlung muss erkennbar sein, welche Merkmale ein bestimmtes Objekt hat. Achtung: Merkmale kann man im allgemeinen durch Zahlen beschreiben: blond = 1, grün = 2, schwarz = 3,.... 1

aber: Wenn die Zuordnung von Merkmalen auf Zahlen willkürlich ist, darf man daraus nichts herauslesen. Man darf nicht sagen: fünf blonde Frauen und fünf schwarzhaarige Frauen haben durchschnittlich grüne Haare. 1 10 (5 1 + 5 3) = 2 Die Rechnung erweckt bei Ahnungslosen den Anschein der Exaktheit, ist aber vollkommener Blödsinn. Aber genau das Beispiel mit den grünen Haaren ist schon vorgekommen und war ernst gemeint. Unterscheidung von Datenniveaus: a) Metrische Daten werden durch eine reelle Zahl angegeben, z.b. Gewicht, Größe, Zeit, Konzentration. 2

b) Ordinale Daten lassen sich anordnen, z.b. Handelsklasse von Äpfeln, Bonitäten von Blattern mit Schädlingsbefall. c) Nominale Daten werden in verschiedene Kategorien eingeteilt, z.b. Augenfarbe, Geschlecht, Haarfarbe. Die Häufigkeit des Auftretens einer Kategorie kann gezählt werden. 3

1.1 Häufigkeitsverteilungen 1.1.1 Eine eindimensionale Häufigkeitsverteilung Eindimensional heißt bei Häufigkeitsverteilungen: Es wird ein Merkmal betrachtet. Milchleistung in dz von Milchkühen eines Hofes: 37, 34, 37, 29, 34, 33, 34, 31, 36, 34, 32, 36 Wie gewinnt man einen Überblick? Einfache Möglichkeiten: Strichliste (größter und kleinster vorkommender Wert? bei größeren Zahlen: Striche gruppieren - der besseren Übersicht halber) Kreuztabelle (von Hand auf kariertem Papier leicht anzulegen: größter und kleinster vorkommender Wert? Wieviel Platz braucht man nach oben?) Säulendiagramm (im Prinzip nur Rahmen um die Kreuze der Kreuztabelle) 4

1.1.2 Klassenbildung Manchmal wird eine Darstellung übersichtlicher durch Klassenbildung, zum Beispiel die Klassen 29-31, 32-34, 35-37. (Eine Klassenbildung hatte man schon am Anfang durch die Rundung auf ganze Zahlen.) Andere Klassenbildungen können einen anderen Eindruck hervorrufen. (Beispiel: Klassen etwas größer, 28-31, 32-35, 36-39. Die untere Grenze wird um eins kleiner, die obere Grenze um zwei größer. Anderes Beispiel: 28-30, 31-33, 34-36, 37-39) Vorsicht beim Lesen von Statistiken! Sind die Klassen verschieden groß, dann steckt manchmal eine Täuschungsabsicht dahinter! 1.1.3 Häufigkeit - relative Häufigkeit H(27) = 0 H(28) = 0 H(29) = 1 H(30) = 0 H(31) = 1 5

H(32) = 1 H(33) = 1 H(34) = 4 H(35) = 0 H(36) = 2 H(37) = 2 H(38) = 0 H(39) = 0 Nach oben und nach unten kann man beliebig weitermachen. Man erhält eine Funktion, die Häufigkeit, die - je nach Aufgabenstellung - definiert ist auf N, Z, R. Oft ist interessanter die relative Häufigkeit h(x) für den Merkmalswert x: h(x) = Anzahl der Werte x Anzahl aller betrachteten Werte Beispiel: Dem Arzt sind in seiner Praxistätigkeit sieben Patienten verstorben. Er praktiziert seit 42 Jahren und hatte in dieser Zeit immer ein volles Wartezimmer. Beispiel: Dem Arzt sind in seiner Praxistätigkeit sieben Patienten verstorben. Er hat vor sechs Wochen mit seiner Praxis angefan- 6

gen und bisher 63 Patienten behandelt. Bei der Milchleistung ist zum Beispiel: h(37) = 2 12 = 1 6 h(212) = 0 12 = 0 h(34) = 4 12 = 1 3 Die relative Häufigkeit gibt Anlass zu einem Diagramm: (kleinster Wert? größter Wert? Wieviel Platz braucht man nach oben? Höchstens 1! Maßstab so wählen, dass man etwas sieht!) 1.1.4 Schnelle Ermittlung von Häufigkeiten: Summenhäufigkeitsfunktion (empirische Verteilungsfunktion) F (x) = Anzahl der Werte x Anzahl aller betrachteten Werte Wie berechnet man das? Wenn man nur endlich viele Werte betrachtet, ganz einfach: 7

F (x) = t x h(t) Das erinnert an die Integration von Funktionen. (h als Integrand) Wie zeichnet man den Graphen von F? Es gilt: F (x) = 0, falls x < kleinster Wert F (x) = 1, falls x größter Wert Wozu ist das gut? Wenn man viele Merkmalswerte hat, ist eine Aufgabe der folgenden Art sehr rechenintensiv: Wieviele Kühe geben zwischen 31,5 und 34,5 dz Milch? Man muss dazu rechnen: Anzahl(32) + Anzahl(33) + Anzahl(34). Dabei: Anzahl(n) := Anzahl der Kühe auf dem Hof, die n dz Milch geben. 8

In der Regel hat man viel mehr Merkmalswerte und auch viel mehr Summanden. Kennt man die empirische Verteilungsfunktion F, so rechnet man einfach: Anzahl der Kühe insgesamt (F (34, 5) F (31, 5)). Bei der ersten Rechnung erhält man: 1 + 1 + 4 = 6. Bei der zweiten Rechnung erhält man: 12 ( 8 12 2 12 ) = 12 1 2 = 6. Beide Rechnungen ergeben: Sechs Kühe auf dem Hof geben zwischen 31,5 und 34,5 dz Milch. 1.1.5 Ein Beispiel: Münzwurf Ein Hobbyspieler will Profi werden. Er wirft eine Münze sehr oft. Immer, wenn Adler fällt, beginnt er eine neue Serie. Er stellt nach langen Aufzeichnungen über die relativen Häufigkeiten in den Serien fest: h(genau nullmal Zahl) = 1 2 h(genau einmal Zahl) = 1 4 h(genau zweimal Zahl) = 1 8 9

h(genau dreimal Zahl) = 1 16... h(genau n-mal Zahl) = 1 2 n+1 Er will nun wissen: Mit welcher Häufigkeit kommt es vor, dass in einer Serie mindestens zehnmal und höchstens 50-mal Zahl fällt? Bezeichnet man mit Z die Anzahl der Zahlen in einer Serie, so ist gesucht h(10 Z 50) = 50 n=10 1 2 n+1 Die Summe auszurechnen ist keine reine Freude. 41 Summanden! Schreibt man F (x) := h(z x) = x n=0 1 2 n+1, so erhält man mit der geometrischen Reihe: und damit F (x) = 1 (1 2 )x+2 1 1 2 1 = 1 1 2 x+1 10

h(10 Z 50) = F (50) F (9) = 1 2 1 10 2 = 51 1 1 (1 210 2 41) 1 In um ein Minimales weniger als 1024 der Serien tritt mindestens zehnmal und höchstens 50-mal Zahl auf. Strategien: Strategie 1: Einsatz ein Euro, Gewinn 1020 Euro; Strategie 2: Einsatz ein Euro, Gewinn 1030 Euro. Welche Strategie gewinnt? 1 oder 2 oder beide? Liegen viele Werte vor, ist der Umgang mit der Verteilungsfunktion oft praktischer als der mit den relativen Häufigkeiten! 11