a 1 < a 2 <... < a k. 2 Häufigkeitsverteilungen 52
|
|
- Dieter Althaus
- vor 7 Jahren
- Abrufe
Transkript
1 2 Häufigkeitsverteilungen
2 2.0 Grundbegriffe Ziel: Darstellung bzw. Beschreibung (Exploration) einer Variablen. Ausgangssituation: An n Einheiten ω 1,..., ω n sei das Merkmal X beobachtet worden. x 1 = X(ω 1 ),..., x n = X(ω n ) Also x i = X(ω i ), d.h. x i ist der Wert der i-ten Person x 1,..., x n werden auch als Urliste oder Rohdaten und n als Stichprobenumfang bezeichnet. Die verschiedenen Merkmalsausprägungen werden mit a 1,..., a k bezeichnet. Bemerkungen: Werden mehr Beobachtungen erhoben, so ändert sich n, aber i.a. k nicht. Meist bezeichnet a 1,..., a k die beobachteten verschiedenen Merkmalsausprägungen, manchmal aber auch die prinzipiell möglichen Merkmalsausprägungen. Für mindestens ordinalskalierte Merkmale seien die Ausprägungen geordnet, d.h. a 1 < a 2 <... < a k. 2 Häufigkeitsverteilungen 52
3 2.0 Grundbegriffe Beispiel: Häufigkeitsverteilung der Schichtzugehörigkeit einer Gesamtheit Ω von acht Personen Ω = {ω 1,..., ω 8 }. Kategorien: Unterschicht, Mittelschicht, Oberschicht. 2 Häufigkeitsverteilungen 53
4 Tabelle: 2.0 Grundbegriffe Person ω X(ω) ω 1 M x 1 ω 2 M x 2 ω 3 O x 3 ω 4 M x 4 ω 5 M x 5 ω 6 M x 6 n = k = a 1 = a 2 = a 3 = ω 7 U x 7 ω 8 O x 8 2 Häufigkeitsverteilungen 54
5 2.1 Häufigkeiten 2.1 Häufigkeiten Absolute Häufigkeiten der Merkmalsausprägungen: Für jedes a j, j = 1,..., k, bezeichnen h j und h(a j ) die absolute Häufigkeit der Ausprägung a j, d.h. die Anzahl der x i aus x 1,..., x n mit x i = a j. Formal: h j := h(a j ) := {ω Ω X(ω) = a j }. M bezeichnet die Mächtigkeit der Menge M := bedeutet wird definiert als. h 1, h 2,..., h k (als Ganzes) nennt man die absolute Häufigkeitsverteilung. Es gilt k h j = n. j=1 2 Häufigkeitsverteilungen 55
6 2.1 Häufigkeiten Erste Darstellung von Häufigkeiten anhand einer Strichliste: Relative Häufigkeiten der Merkmalsausprägungen: Für jedes a j, j = 1,..., k, bezeichnen f j und f(a j ) die relative Häufigkeit der Ausprägung a j, also f j := f(a j ) := h j n. f 1, f 2,..., f k nennt man die relative Häufigkeitsverteilung. Es gilt k f j = 1. j=1 2 Häufigkeitsverteilungen 56
7 Häufigkeitstabelle: 2.1 Häufigkeiten Allgemeine Form: Im Beispiel: j a j h j f j 1 a 1 h 1 f 1 2 a 2 h 2 f 2 3 a 3 h 3 f j a j h j f j k a k h k f k n 1 2 Häufigkeitsverteilungen 57
8 2.1 Häufigkeiten Insbesondere bei stetigen oder quasi-stetigen Merkmalen ist es häufig zweckmäßig, die Merkmalsausprägungen zu klassieren / zu gruppieren. gruppierte Häufigkeitsverteilung. Die gruppierte Häufigkeitsverteilung enthält nur die Häufigkeiten der Ausprägungen in den einzelnen Gruppen, die einzelnen a i entsprechen in diesem Fall Intervallen. Achtung: Die Gruppierung bedeutet einen Informationsverlust 2 Häufigkeitsverteilungen 58
9 Beispiel Mietspiegel: Merkmal = Nettomieten 2.1 Häufigkeiten Urliste für n=26 Wohnungen, bereits der Größe nach geordnet: Klasse j h j f j 100 < < < < < < Häufigkeitsverteilungen 59
10 2.2 Grafische Darstellung 2.2 Grafische Darstellung Stabdiagramm: Trage über a 1,..., a k jeweils einen zur x-achse senkrecht stehenden Stab mit Höhe h 1,..., h k (oder f 1,..., f k ) ab. Horizontal: Ausprägungen der Variablen (a 1, a 2,..., a k ) Vertikal: absolute / relative Häufigkeiten (h 1,..., h k bzw. f 1,..., f k ) Vorausgesetztes Skalenniveau: mindestens Nominalskala 2 Häufigkeitsverteilungen 60
11 2.2 Grafische Darstellung Säulendiagramm: Ersetze die Stäbe durch Rechtecke (Säulen) gleicher Breite. Balkendiagramm: Säulendiagramm mit vertauschten Achsen Vorausgesetztes Skalenniveau: mindestens Nominalskala 2 Häufigkeitsverteilungen 61
12 2.2 Grafische Darstellung Kreisdiagramm ( Tortendiagramm : Der Kreis wird in Segmente unterteilt, denen jeweils eine Ausprägung (oder Klasse) zugeordnet wird. Der jeweilige Winkel ist proportional zur Häufigkeit. dadurch ist auch die Fläche proportional zur Häufigkeit: Prinzip der Flächentreue. Für Stab-, Säulen- und Balkendiagramm gilt dagegen das Prinzip der Längentreue, d.h. die Länge der Stäbe / Säulen / Balken ist proportional zur Häufigkeit. Berechnung: Winkel des Kreissektors j = relative Häufigkeit 360 Häufigkeit f 1 = f 2 = Winkel Vorausgesetztes Skalenniveau: mindestens Nominalskala, f 3 = 2 Häufigkeitsverteilungen 62
13 Bemerkungen: 2.2 Grafische Darstellung Alle bisherigen Grafiken sind nur sinnvoll für kleine Kategorienzahlen k. Für ordinalskalierte Merkmale lässt sich mit Stab- / Balken- / Säulendiagramm auch die Ordnung der Kategorien darstellen. Durch Schichtung können die Grafiken auch zum Vergleich von Häufigkeitsverteilungen eingesetzt werden. 2 Häufigkeitsverteilungen 63
14 2.2 Grafische Darstellung Stamm-Blatt-Diagramm: Semigrafisches Verfahren in Analogie zu Strichlisten Erklärung anhand des Mietspiegelbeispiels: Stamm: Blatt: führende Ziffern nächste Ziffer (evtl. gerundet) 2 Häufigkeitsverteilungen 64
15 Prinzipielles Vorgehen: 2.2 Grafische Darstellung 1. Suche den kleinsten und größten Wert der Urliste und zerlege den Wertebereich in Intervalle der Breite 10 q (Vielfache von 10, q ist geeignet zu wählen). 2. Runde die Daten auf die führenden q Stellen Bestimme den Stamm aus den führenden Ziffern: 2 Häufigkeitsverteilungen 65
16 4. Bestimme die Blätter aus der folgenden Ziffer: 2.2 Grafische Darstellung Trage für jeden Wert des Stamms die zugehörigen Blätter rechts von einer vertikalen Linie der Größe nach geordnet ab: Vorteile: Implizierte Gruppierung ohne viel Information zu verlieren, da die Darstellung bis auf Rundungen alle Werte der Urliste enthält. Ermöglicht guten Einblick in Datenstruktur für explorative Analysen, z.b. auch Erkennen von Ausreißern. Nachteile: Wird bei großen Datensätzen schnell unübersichtlich. 2 Häufigkeitsverteilungen 66
17 Lässt sich oft nicht mehr gut auf Papier präsentieren. 2.2 Grafische Darstellung 2 Häufigkeitsverteilungen 67
18 2.3 Histogramm 2.3 Histogramm Ziel: Automatische Erstellung einer sinnvollen Häufigkeitsdarstellung für metrische Merkmale (ohne manuelle Kategorisierung). Gegeben: Urliste x 1,..., x n eines (mindestens) intervallskalierten Merkmals. Wähle c 0 min i=1,...,n (x i ) und c k max i=1,...,n (x i ) Bilde Klasseneinteilung [c 0, c 1 ), [c 1, c 2 ),..., [c k 1, c k ]. Für jede Klasse [c j 1, c j ), j = 1,..., k sei d j = c j c j 1 die Breite des j-ten Intervalls und h j bzw. f j die absolute bzw. relative Häufigkeit in der j-ten Klasse. Zeichne über jedem Intervall ein Rechteck der Breite d j so, dass die Fläche proportional zu f j und h j ist. 2 Häufigkeitsverteilungen 68
19 2.3 Histogramm Achtung: Das Histogramm ist flächentreu nicht längentreu! Es gilt Fläche = Breite Höhe und damit Höhe = Fläche / Breite. Also ist die Höhe der Rechtecke proportional zu und nicht zu f j bzw. h j. f j d j bzw. Ein Histogramm unterscheidet sich damit substantiell von einem Säulendiagramm! Man muss also bei einer Grafik immer angeben, ob es sich um ein Säulendiagramm oder ein Histogramm handelt. h j d j, 2 Häufigkeitsverteilungen 69
20 Beispiel: Punkteverteilung in der Klausur 2.3 Histogramm h j d j Klassen Hfgkt. Breite Höhe [0, 35.5) 53 [35.5, 48.5) 78 [48.5, 64.5) 91 [64.5, 79.5) 96 [79.5, 90) Häufigkeitsverteilungen 70
21 Vorteile des Histogramms: 2.3 Histogramm Information der metrischen Skala (Differenzen) voll ausgenutzt etwas weniger empfindlich gegenüber Klasseneinteilung, da sich Häufigkeiten in der Fläche widerspiegeln 2 Häufigkeitsverteilungen 71
22 Tücken des Histogramms: 2.3 Histogramm 2 Häufigkeitsverteilungen 72
23 2.3 Histogramm 2 Häufigkeitsverteilungen 73
24 Typen von Häufigkeitsverteilungen 2.3 Histogramm Histogramme eignen sich gut zur Beurteilung der Form von Häufigkeitsverteilungen Unimodale und multimodale Verteilungen: Unimodal Multimodal Multimodal Häufigkeitsverteilungen 74
25 2.3 Histogramm 2 Häufigkeitsverteilungen 75
26 Symmetrie und Schiefe symmetrisch: linkssteil (rechtsschief): rechtssteil (linksschief): 2.3 Histogramm Rechte und linke Hälfte der Verteilung sind annähernd zueinander spiegelbildlich. Verteilung fällt nach links deutlich steiler und nach rechts langsamer ab. Verteilung fällt nach rechts deutlich steiler und nach links langsamer ab (linkssteil) (symmetrisch) (rechtssteil) 2 Häufigkeitsverteilungen 76
27 Andere typische Verteilungsformen: 2.3 Histogramm U-förmig, J-förmig. 2 Häufigkeitsverteilungen 77
28 2.4 Kumulierte Häufigkeiten und empirische Verteilungsfunktion 2.4 Kumulierte Häufigkeiten und empirische Verteilungsfunktion Oft sind kumulierte Häufigkeiten von Interesse, also eine Antwort auf die Frage Wieviel Prozent der Daten über-/unterschreiten einen bestimmten Wert? Wieviel Prozent der Studenten arbeiten bis zu 8 Stunden pro Woche neben dem Studium? Wieviel Prozent der Studenten arbeiten mehr als 8 Stunden pro Woche neben dem Studium? Wieviel Prozent der Studenten haben mindestens 35.5 Punkte, also die Klausur bestanden? Voraussetzung: Mindestens ordinalskaliertes Merkmal. 2 Häufigkeitsverteilungen 78
29 2.4 Kumulierte Häufigkeiten und empirische Verteilungsfunktion Gegeben sei die Urliste x 1,..., x n eines (mindestens) ordinalskalierten Merkmals mit der Häufigkeitsverteilung h 1,..., h k bzw. f 1,..., f k. Dann heißt H(x) := Anzahl der Werte x i mit x i x = h(a j ) = j:a j x absolute kumulierte Häufigkeitsverteilung und j:a j x h j F (x) := Anteil der Werte x i mit x i x = H(x)/n = f(a j ) = 1 n j:a j x j:a j x h(a j ) relative kumulierte Häufigkeitsverteilung bzw. empirische Verteilungsfunktion. 2 Häufigkeitsverteilungen 79
30 Die Schreibweise H(x) := j:a j x h(a j ) ist eine Abkürzung für 2.4 Kumulierte Häufigkeiten und empirische Verteilungsfunktion H(x) := j J x h(a j ) mit J x := {j a j x}, d.h. für jedes x wird die Summe über alle j mit der Eigenschaft betrachtet, dass die zugehörigen Werte a j kleiner gleich x sind (analog für F (x)). Beispiel: Klausurnoten (zur Vereinfachung a j = j) Note: a j h(a j ) H(a j ) f(a j ) F (a j ) a 1 = a 2 = a 3 = a 4 = a 5 = Häufigkeitsverteilungen 80
31 H(1) = H(1.2) = h(a j ) = h(a 1 ) = 65 j:a j 1 j:a j 1.2 h(a j ) = h(a 1 ) = Kumulierte Häufigkeiten und empirische Verteilungsfunktion H(1.4) = = = Zwischen den Ausprägungen ist H(x) konstant, also H(x) = H(a j ) für alle x [a j, a j+1 ) und j = 1,..., k. Es reicht also, H(x) an den tatsächlichen Ausprägungen a j zu berechnen. 2 Häufigkeitsverteilungen 81
32 2.4 Kumulierte Häufigkeiten und empirische Verteilungsfunktion Häufigkeitsverteilungen 82
33 Bemerkungen: 2.4 Kumulierte Häufigkeiten und empirische Verteilungsfunktion F (x) sieht genauso aus; einfach den Maßstab auf der Ordinate (y-achse) durch 383 teilen. Man kann aus H(x) und F (x) die Häufigkeitsverteilungen h 1,..., h k und f 1,..., f k reproduzieren, z.b. ist h(a j ) = H(a j ) H(a j 1 ) die Häufigkeit von a j. Bei rein ordinalen Merkmalen ist die Skaleneinteilung auf der Abszisse (x-achse) völlig willkürlich; man könnte obige Funktion z.b. genauso gut wie folgt zeichnen: Bei intervallskalierten Merkmalen ist diese Willkürlichkeit nicht mehr vorhanden kumulierte Häufigkeitsverteilungen werden fast nur bei intervallskalierten Merkmalen betrachtet. 2 Häufigkeitsverteilungen 83
34 2.4 Kumulierte Häufigkeiten und empirische Verteilungsfunktion Empirische Verteilungsfunktion wenn alle Beobachtungen verschieden sind: 2 Häufigkeitsverteilungen 84
35 Empirische Verteilungsfunktion bei gegebenen Häufigkeiten: 2.4 Kumulierte Häufigkeiten und empirische Verteilungsfunktion 2 Häufigkeitsverteilungen 85
36 Kumulierte Häufigkeiten bei gruppierten Merkmalen 2.4 Kumulierte Häufigkeiten und empirische Verteilungsfunktion Beispiel: Punkteverteilung in den Klassen Klassen Häufigkeiten kumuliert [0, 35.5) 53 [35.5, 48.5) 78 [48.5, 64.5) 91 [64.5, 79.5) 96 [79.5, 90) 65 Bei gruppierten, intervallskalierten Merkmalen tritt folgendes zusätzliches Problem auf: Klar sind die Werte der kumulierten Häufigkeitsverteilungen an den zu den Intervallgrenzen gehörenden Punkten. Aber wie definiert man H(x) und F (x) zwischen diesen Punkten, was also ist etwa H(40)? 2 Häufigkeitsverteilungen 86
37 2.4 Kumulierte Häufigkeiten und empirische Verteilungsfunktion Jetzt ist H nicht mehr notwendigerweise konstant zwischen den Klassengrenzen. Beispielsweise ist 40 ja eine Ausprägung, die durchaus in den unklassierten Daten vorkam, und bei neuen Beobachtungen wieder vorkommen kann. H(40) ist aber aus den klassierten Daten nicht mehr rekonstruierbar. Eigentlich weiß man nur, dass H(40) einen Wert in dem entsprechenden Rechteck annehmen kann. Lineare Interpolation. 2 Häufigkeitsverteilungen 87
38 Allgemeine Formulierung: 2.4 Kumulierte Häufigkeiten und empirische Verteilungsfunktion k Klassen [c 0, c 1 ),..., [c j 1, c j ),..., [c k 1, c k ],h j Häufigkeit in j-ter Klasse. Verwende bei einem x aus der Klasse [c j 1, c j ) als Approximation für H(x) folgenden, aus der linearen Interpolation gewonnenen Punkt: 2 Häufigkeitsverteilungen 88
39 Geradengleichung: 2.4 Kumulierte Häufigkeiten und empirische Verteilungsfunktion H(x) H(c j 1 ) + h j (c j c j 1 ) (x c j 1 ) H(40) 2 Häufigkeitsverteilungen 89
Kapitel 2. Häufigkeitsverteilungen
6 Kapitel 2 Häufigkeitsverteilungen Ziel: Darstellung bzw Beschreibung (Exploration) einer Variablen Ausgangssituation: An n Einheiten ω,, ω n sei das Merkmal X beobachtet worden x = X(ω ),, x n = X(ω
Mehr2 Häufigkeitsverteilungen
2 Häufigkeitsverteilungen Ziel: Darstellung bzw Beschreibung (Exploration) einer Variablen Ausgangssituation An n Einheiten ω 1,,ω n sei das Merkmal X beobachtet worden x 1 = X(ω 1 ),,x n = X(ω n ) Also
Mehr0 Einführung: Was ist Statistik
0 Einführung: Was ist Statistik 1 Datenerhebung und Messung 2 Univariate deskriptive Statistik Häufigkeitsverteilungen Statistische Kennwerte 3 Multivariate Statistik 4 Regression 5 Ergänzungen Deskriptive
MehrKreisdiagramm, Tortendiagramm
Kreisdiagramm, Tortendiagramm Darstellung der relativen (absoluten) Häufigkeiten als Fläche eines Kreises Anwendung: Nominale Merkmale Ordinale Merkmale (Problem: Ordnung nicht korrekt wiedergegeben) Gruppierte
MehrN 1 0 50 0.5 50 0.5 2 1 20 0.2 70 0.7 3 2 15 0.15 85 0.85 4 3 10 0.1 95 0.95 5 4+ 5 0.05 100 1-100 1.00 - -
2 Deskriptive Statistik 1 Kapitel 2: Deskriptive Statistik A: Beispiele Beispiel 1: Im Rahmen einer Totalerhebung der Familien eines Dorfes (N = 100) wurde u.a. das diskrete Merkmal Kinderanzahl (X) registriert.
MehrKapitel 5 Kenngrößen empirischer Verteilungen 5.1. Lagemaße. x mod (lies: x-mod) Wofür? Lageparameter. Modus/ Modalwert Zentrum. Median Zentralwert
Kapitel 5 Kenngrößen empirischer Verteilungen 5.1. Lagemaße Wofür? Lageparameter Modus/ Modalwert Zentrum Median Zentralwert Im Datensatz stehende Informationen auf wenige Kenngrößen verdichten ermöglicht
Mehr3 Häufigkeitsverteilungen
3 Häufigkeitsverteilungen 3.1 Absolute und relative Häufigkeiten 3.2 Klassierung von Daten 3.3 Verteilungsverläufe 3.1 Absolute und relative Häufigkeiten Datenaggregation: Bildung von Häufigkeiten X nominal
Mehr3 Häufigkeitsverteilungen
3 Häufigkeitsverteilungen 3.1 Absolute und relative Häufigkeiten 3.2 Klassierung von Daten 3.3 Verteilungsverläufe 3.1 Absolute und relative Häufigkeiten Datenaggregation: Bildung von Häufigkeiten X nominal
MehrWillkommen zur Vorlesung Statistik
Willkommen zur Vorlesung Statistik Thema dieser Vorlesung: Häufigkeiten und ihre Verteilung, oder: Zusammenfassende Darstellungen einzelner Variablen Prof. Dr. Wolfgang Ludwig-Mayerhofer Universität Siegen
MehrWISTA WIRTSCHAFTSSTATISTIK
WISTA WIRTSCHAFTSSTATISTIK PROF DR ROLF HÜPEN FAKULTÄT FÜR WIRTSCHAFTSWISSENSCHAFT Seminar für Theoretische Wirtschaftslehre Vorlesungsprogramm 23042013 Datenlagen und Darstellung eindimensionaler Häufigkeitsverteilungen
Mehr3.2 Streuungsmaße. 3 Lage- und Streuungsmaße 133. mittlere Variabilität. geringe Variabilität. große Variabilität 0.0 0.1 0.2 0.3 0.4 0.
Eine Verteilung ist durch die Angabe von einem oder mehreren Mittelwerten nur unzureichend beschrieben. Beispiel: Häufigkeitsverteilungen mit gleicher zentraler Tendenz: geringe Variabilität mittlere Variabilität
MehrGegeben: Eine Menge von Objekten mit Merkmalen (beobachtet oder gemessen) Die gegebene Menge heißt auch Grundgesamtheit.
Kapitel 1 Beschreibende Statistik Gegeben: Eine Menge von Objekten mit Merkmalen (beobachtet oder gemessen) Gesucht: Übersichtliche Beschreibung Die gegebene Menge heißt auch Grundgesamtheit. Beispiele
MehrGraphische Darstellung einer univariaten Verteilung:
Graphische Darstellung einer univariaten Verteilung: Die graphische Darstellung einer univariaten Verteilung hängt von dem Messniveau der Variablen ab. Bei einer graphischen Darstellung wird die Häufigkeit
Mehr2 Univariate Deskription und Exploration von Daten
2 Univariate Deskription und Exploration von Daten Dieses Kapitel führt in die grundlegenden statistischen Methoden ein, mit denen univariate oder eindimensionale Daten, d.h. Daten, die aus Beobachtungen
MehrDeskriptive Statistik Lösungen zu Blatt 1 Christian Heumann, Susanne Konrath SS Lösung Aufgabe 1
1 Deskriptive Statistik Lösungen zu Blatt 1 Christian Heumann, Susanne Konrath SS 2011 Lösung Aufgabe 1 (a) Es sollen die mathematischen Vorkenntnisse der Studenten, die die Vorlesung Statistik I für Statistiker,
MehrStatistik SS Deskriptive Statistik. Bernhard Spangl 1. Universität für Bodenkultur. March 1, 2012
Statistik SS 2012 Deskriptive Statistik Bernhard Spangl 1 1 Institut für angewandte Statistik und EDV Universität für Bodenkultur March 1, 2012 B. Spangl (Universität für Bodenkultur) Statistik SS 2012
MehrUnivariate Häufigkeitsverteilungen Kühnel, Krebs 2001: Statistik für die Sozialwissenschaften, S.41-66
Univariate Häufigkeitsverteilungen Kühnel, Krebs 2001: Statistik für die Sozialwissenschaften, S.41-66 Gabriele Doblhammer: Empirische Sozialforschung Teil II, SS 2004 1/19 Skalenniveaus Skalenniveau Relation
Mehr2 Häufigkeitsverteilungen
14 Häufigkeitsverteilungen 2 Häufigkeitsverteilungen Lernziele In diesem Kapitel geht es um beschreibende Statistik. Nach erfolgreicher Bearbeitung sind Sie in der Lage, eine zunächst unübersichtliche
MehrMathematik für Biologen
Mathematik für Biologen Prof. Dr. Rüdiger W. Braun Heinrich-Heine Universität Düsseldorf 14. Oktober 2010 Übungen Aufgabenblatt 1 wird heute Nachmittag auf das Weblog gestellt. Geben Sie die Lösungen dieser
MehrWahrscheinlichkeits - rechnung und Statistik
Michael Sachs Mathematik-Studienhilfen Wahrscheinlichkeits - rechnung und Statistik für Ingenieurstudenten an Fachhochschulen 4., aktualisierte Auflage 2.2 Eindimensionale Häufigkeitsverteilungen 19 absolute
Mehr9. Kapitel: Grafische Darstellung quantitativer Informationen
9. Kapitel: Grafische Darstellung quantitativer Informationen 9.1: Fallstricke bei der Übersetzung von Zahlen in Bilder a) optische Täuschungen b) absichtliche Manipulationen 9.2: Typologie von Datengrafiken
MehrEinführung in Quantitative Methoden
Einführung in Quantitative Methoden Mag. Dipl.Ing. Dr. Pantelis Christodoulides & Mag. Dr. Karin Waldherr SS 2014 Christodoulides / Waldherr Einführung in Quantitative Methoden- 2.VO 1/57 Die Deskriptivstatistik
MehrDer Mittelwert (arithmetisches Mittel)
Der Mittelwert (arithmetisches Mittel) x = 1 n n x i bekanntestes Lagemaß instabil gegen extreme Werte geeignet für intervallskalierte Daten Deskriptive Statistik WiSe 2015/2016 Helmut Küchenhoff (Institut
MehrDeskriptive Statistik Kapitel IX - Kontingenzkoeffizient
Deskriptive Statistik Kapitel IX - Kontingenzkoeffizient Georg Bol bol@statistik.uni-karlsruhe.de Markus Höchstötter hoechstoetter@statistik.uni-karlsruhe.de Agenda 1. Untersuchung der Abhängigkeit 2.
Mehr4. Kumulierte Häufigkeiten und Quantile
4. Kumulierte Häufigkeiten und Quantile Statistik für SoziologInnen 1 4. Kumulierte Häufigkeiten und Quantile Kumulierte Häufigkeiten Oft ist man nicht an der Häufigkeit einzelner Merkmalsausprägungen
MehrStatistik SS Deskriptive Statistik. Bernhard Spangl 1. Universität für Bodenkultur. March 6, 2012
Statistik SS 2012 Bernhard Spangl 1 1 Institut für angewandte Statistik und EDV Universität für Bodenkultur March 6, 2012 B. Spangl (Universität für Bodenkultur) Statistik SS 2012 March 6, 2012 1 / 19
MehrVerteilungen und ihre Darstellungen
Verteilungen und ihre Darstellungen Übung: Stamm-Blatt-Diagramme Wie sind die gekennzeichneten Beobachtungswerte eweils zu lesen? Tragen Sie in beiden Diagrammen den Wert 0.452 an der richtigen Stelle
Mehr4. Kumulierte Häufigkeiten und Quantile
4. Kumulierte Häufigkeiten und Quantile Kumulierte Häufigkeiten Oft ist man nicht an der Häufigkeit einzelner Merkmalsausprägungen interessiert, sondern an der Häufigkeit von Intervallen. Typische Fragestellung:
MehrDeskriptive Statistik
Deskriptive Statistik [descriptive statistics] Ziel der deskriptiven (beschreibenden) Statistik einschließlich der explorativen Datenanalyse [exploratory data analysis] ist zunächst die übersichtliche
Mehrhtw saar 1 EINFÜHRUNG IN DIE STATISTIK: BESCHREIBENDE STATISTIK
htw saar 1 EINFÜHRUNG IN DIE STATISTIK: BESCHREIBENDE STATISTIK htw saar 2 Grundbegriffe htw saar 3 Grundgesamtheit und Stichprobe Ziel: Über eine Grundgesamtheit (Population) soll eine Aussage über ein
Mehr2. Deskriptive Statistik
Philipps-Universitat Marburg 2.1 Stichproben und Datentypen Untersuchungseinheiten: mogliche, statistisch zu erfassende Einheiten je Untersuchungseinheit: ein oder mehrere Merkmale oder Variablen beobachten
MehrStatistik I für Betriebswirte Vorlesung 9
Statistik I für Betriebswirte Vorlesung 9 Dr. Andreas Wünsche TU Bergakademie Freiberg Institut für Stochastik Vorlesung am 8. Juni 2017 im Audi-Max (AUD-1001) Dr. Andreas Wünsche Statistik I für Betriebswirte
MehrEinführung in Quantitative Methoden
Einführung in Quantitative Methoden Mag. Dipl.Ing. Dr. Pantelis Christodoulides & Mag. Dr. Karin Waldherr SS 2011 Christodoulides / Waldherr Einführung in Quantitative Methoden- 2.VO 1/62 Summenzeichen
MehrWeitere Lagemaße: Quantile/Perzentile I
3 Auswertung von eindimensionalen Daten Lagemaße 3.3 Weitere Lagemaße: Quantile/Perzentile I Für jeden Median x med gilt: Mindestens 50% der Merkmalswerte sind kleiner gleich x med und ebenso mindestens
MehrStatistik I für Studierende der Soziologie
Statistik I für Studierende der Soziologie Dr Carolin Strobl WS 2008/09 Danksagung Dieses Skript basiert in wesentlichen Teilen auf dem Skript von Prof Dr Thomas Augustin und den Ergänzungen von Dr Thomas
MehrVoraussetzung für statistische Auswertung: jeder Fall besitzt in bezug auf jedes Merkmal genau eine Ausprägung
Rohdaten Urliste oder Rohdaten sind die auszuwertenden Daten in der Form, wie sie nach der Datenerhebung vorliegen. Dimensionen der Urliste sind die Fälle, Merkmale und ihre Ausprägungen. Voraussetzung
MehrBeschreibung von Daten
Kapitel 2 Beschreibung von Daten In diesem Kapitel geht es um die Beschreibung von empirisch erhobenen Daten Größere Datenmengen sind schwer zu überblicken Weil ein Bild leichter als eine Ansammlung von
MehrKapitel VI - Lage- und Streuungsparameter
Universität Karlsruhe (TH) Institut für Statistik und Mathematische Wirtschaftstheorie Wahrscheinlichkeitstheorie Kapitel VI - Lage- und Streuungsparameter Markus Höchstötter Lehrstuhl für Statistik, Ökonometrie
MehrVerteilungsfunktion und dquantile
Statistik 1 für SoziologInnen Verteilungsfunktion und dquantile Univ.Prof. Dr. Marcus Hudec Kumulierte Häufigkeiten Hinweis: Damit die Kumulation inhaltlich sinnvoll ist, muss das Merkmal zumindest ordinal
MehrDas harmonische Mittel
Das harmonische Mittel x H := 1 1 n n 1 x i Das harmonische Mittel entspricht dem Mittel durch Transformation t 1 t Beispiel: x 1,..., x n Geschwindigkeiten, mit denen konstante Wegstrecken l zurückgelegt
MehrKenngrößen von Zufallsvariablen
Kenngrößen von Zufallsvariablen Die Wahrscheinlichkeitsverteilung kann durch die sogenannten Kenngrößen beschrieben werden, sie charakterisieren sozusagen die Verteilung. Der Erwartungswert Der Erwartungswert
MehrTeil I: Deskriptive Statistik
Teil I: Deskriptive Statistik 2 Grundbegriffe 2.1 Merkmal und Stichprobe 2.2 Skalenniveau von Merkmalen 2.3 Geordnete Stichproben und Ränge 2.1 Merkmal und Stichprobe An (geeignet ausgewählten) Untersuchungseinheiten
MehrDeskriptive Statistik
Deskriptive Statistik 1 Ziele In der deskriptiven (=beschreibenden) Statistik werden Untersuchungsergebnisse übersichtlich dargestellt, durch Kennzahlen charakterisiert und grafisch veranschaulicht. 2
MehrBeispiel 2 (Einige Aufgaben zu Lageparametern) Aufgabe 1 (Lageparameter)
Beispiel (Einige Aufgaben zu Lageparametern) Aufgabe 1 (Lageparameter) 1 Ein Statistiker ist zu früh zu einer Verabredung gekommen und vertreibt sich nun die Zeit damit, daß er die Anzahl X der Stockwerke
MehrVerteilungsfunktion und Quantile
Statistik 1 für SoziologInnen Verteilungsfunktion und Quantile Univ.Prof. Dr. Marcus Hudec Kumulierte Häufigkeiten Hinweis: Damit das Kumulieren inhaltlich sinnvoll ist, muss das auszuwertende Merkmal
MehrEinführung in die Statistik für Wirtschaftswissenschaftler für Betriebswirtschaft und Internationales Management
Einführung in die Statistik für Wirtschaftswissenschaftler für Betriebswirtschaft und Internationales Management Sommersemester 03 Hochschule Augsburg : Gliederung Einführung Deskriptive Statistik 3 Wahrscheinlichkeitstheorie
MehrDeskriptive Statistik Kapitel VII - Konzentration von Merkmalswerten
Deskriptive Statistik Kapitel VII - Konzentration von Merkmalswerten Georg Bol bol@statistik.uni-karlsruhe.de Markus Höchstötter hoechstoetter@statistik.uni-karlsruhe.de Agenda 1. Einleitung 2. Lorenzkurve
MehrDeskriptive Statistik
Fakultät für Humanwissenschaften Sozialwissenschaftliche Methodenlehre Prof. Dr. Daniel Lois Deskriptive Statistik Stand: April 2015 (V2) Inhaltsverzeichnis 1. Notation 2 2. Messniveau 3 3. Häufigkeitsverteilungen
MehrVerteilungsfunktion und Quantile
Statistik 1 für SoziologInnen Verteilungsfunktion und Quantile Univ.Prof. Dr. Marcus Hudec Kumulierte Häufigkeiten Hinweis: Damit das Kumulieren inhaltlich sinnvoll ist, muss das Merkmal zumindest ordinal
MehrStatistik I für Humanund Sozialwissenschaften
Statistik I für Humanund Sozialwissenschaften 1 Übung Lösungsvorschlag Gruppenübung G 1 Auf einer Touristeninsel in der Karibik wurden in den letzten beiden Juliwochen morgens zur gleichen Zeit die folgenden
MehrTEIL 7: EINFÜHRUNG UNIVARIATE ANALYSE TABELLARISCHE DARSTELLUNG / AUSWERTUNG
TEIL 7: EINFÜHRUNG UNIVARIATE ANALYSE TABELLARISCHE DARSTELLUNG / AUSWERTUNG Statistik eine Umschreibung Mathematische Hilfswissenschaft mit der Aufgabe, Methoden für die Sammlung, Aufbereitung, Analyse
MehrMathematische und statistische Methoden I
Prof. Dr. G. Meinhardt 6. Stock, Wallstr. 3 (Raum 06-206) Sprechstunde jederzeit nach Vereinbarung und nach der Vorlesung. Mathematische und statistische Methoden I Dr. Malte Persike persike@uni-mainz.de
MehrLagemaße Übung. Zentrale Methodenlehre, Europa Universität - Flensburg
Lagemaße Übung M O D U S, M E D I A N, M I T T E L W E R T, M O D A L K L A S S E, M E D I A N, K L A S S E, I N T E R P O L A T I O N D E R M E D I A N, K L A S S E M I T T E Zentrale Methodenlehre, Europa
MehrExcel 2013. Grundkurs kompakt. Sabine Spieß, Peter Wies 1. Ausgabe, Juni 2013 K-EX2013-G
Excel 2013 Sabine Spieß, Peter Wies 1. Ausgabe, Juni 2013 Grundkurs kompakt K-EX2013-G Welche Elemente besitzt ein Diagramm? Einheiten der y-achse Diagrammtitel Datenreihe Legende Kategorien der x-achse
Mehr1 Verteilungen und ihre Darstellung
GKC Statistische Grundlagen für die Korpuslinguistik Kapitel 2: Univariate Deskription von Daten 8.11.2004 Univariate (= eindimensionale) Daten bestehen aus Beobachtungen eines einzelnen Merkmals. 1 Verteilungen
MehrDas Histogramm, bzw. Stabdiagramm / Histogramm / Balkendiagramm
Histogram / Histogramm / histogram Akademische Disziplin der Statistik/academic field of statistics/ la discipline statistique/estadística/disciplina academica della statistica deskriptive Statistik/descriptive
MehrVerteilungsfunktionen (in Excel) (1)
Verteilungsfunktionen (in Excel) () F(x) Veranschaulichung der Sprungstellen: Erst ab x=4 ist F(x) = 0,75! Eine Minimal kleinere Zahl als 4, bspw. 3,9999999999 gehört noch zu F(x)=0,5! 0,75 0,5 0,25 0
MehrStatistische Grundlagen I
Statistische Grundlagen I Arten der Statistik Zusammenfassung und Darstellung von Daten Beschäftigt sich mit der Untersuchung u. Beschreibung von Gesamtheiten oder Teilmengen von Gesamtheiten durch z.b.
MehrDeskriptive Statistik
Deskriptive Statistik Deskriptive Statistik: Ziele Daten zusammenfassen durch numerische Kennzahlen. Grafische Darstellung der Daten. Quelle: Ursus Wehrli, Kunst aufräumen 1 Modell vs. Daten Bis jetzt
Mehry = y = 2'500 Darstellung in Grafik: P 2 (800 2'500) x (Stk) 1'000
. Kostenfunktion a) Vorgaben und Fragestellung Über die Herstellungskosten eines Produkts ist folgendes bekannt: Die variablen Material- und Lohnkosten betragen CHF. pro Stück. Die Fikosten belaufen sich
Mehr3 Lage- und Streuungsmaße
3 Lage- und Streuungsmaße Grafische Darstellungen geben einen allgemeinen Eindruck der Verteilung eines Merkmals, u.a. von Lage und Zentrum der Daten, Streuung der Daten um dieses Zentrum, Schiefe / Symmetrie
MehrTutorial: Balken- und Tortendiagramm
Tutorial: Balken- und Tortendiagramm In der Tabelle ist die Notenverteilung von 510 Teilnehmern an Mathematik Proseminaren angegeben (NA bedeutet einen unbekannten Wert). Der Sachverhalt sollte in zwei
MehrGanze und rationale Zahlen Ganze und rationale im Alltag: Temperaturen sowie Höhen- und Tiefenangaben. Stoffverteilungsplan Mathematik Klasse 7
Themen verschiedener Darstellungsmöglichkeiten von Proportionaler, ihre Darstellung in Koordinatensystemen und Berechnungen mit Hilfe des Dreisatz antiproportionaler, ihre Darstellung im Koordinatensystem
MehrVerteilungsfunktion und Quantile
Statistik 1 für SoziologInnen Verteilungsfunktion und Quantile Univ.Prof. Dr. Marcus Hudec Kumulierte Häufigkeiten Hinweis: Damit das Kumulieren inhaltlich sinnvoll ist, muss das Merkmal zumindest ordinal
MehrMathematik für Biologen
Mathematik für Biologen Prof. Dr. Rüdiger W. Braun Ruediger.Braun@uni-duesseldorf.de Heinrich-Heine Universität Düsseldorf Mathematik für Biologen p. 1 Hinweise Internetseite zur Vorlesung: http://blog.ruediger-braun.net
MehrDIAGRAMME. Kreisdiagramme. Wesentliche Diagrammformen sind:
Wesentliche Diagrammformen sind: DIAGRAMME Balkendiagramme, inklusive gruppierten Diagrammen und Stapelbalkendiagrammen Liniendiagramme Flächendiagramme Kreisdiagramme Boxplots Streudiagramme Histogramme
MehrKapitel 1: Deskriptive Statistik
Kapitel 1: Deskriptive Statistik Grafiken Mit Hilfe von SPSS lassen sich eine Vielzahl unterschiedlicher Grafiken für unterschiedliche Zwecke erstellen. Wir besprechen hier die zwei in Kapitel 1.1 thematisierten
MehrP (X = 2) = 1/36, P (X = 3) = 2/36,...
2.3 Zufallsvariablen 2.3 Zufallsvariablen Meist sind die Ereignisse eines Zufallseperiments bereits reelle Zahlen. Ist dies nicht der Fall, kann man Ereignissen eine reelle Zahl zuordnen. Zum Beispiel
MehrDeskriptive Statistik Erläuterungen
Grundlagen der Wirtschaftsmathematik und Statistik Erläuterungen Lernmaterial zum Modul - 40601 - der Fernuniversität Hagen 7 2.1 Einfache Lageparameter aus einer gegebenen Messreihe ablesen Erklärung
MehrProportionale und antiproportionale Zuordnungen
Proportionale und antiproportionale Zuordnungen Proportionale und antiproportionale Zuordnungen findet man in vielen Bereichen des täglichen Lebens. Zum Beispiel beim Tanken oder beim Einkaufen. Bei proportionalen
MehrKapitel V - Graphische Darstellung von Häufigkeitsverteilungen
Universität Karlsruhe (TH) Institut für Statistik und Mathematische Wirtschaftstheorie Statistik 1 - Deskriptive Statistik Kapitel V - Graphische Darstellung von Häufigkeitsverteilungen Markus Höchstötter
MehrAnwendung A_0801_Quantile_Minimum_Maximum
8. Lageparameter 63 8.3 Interaktive EXCEL-Anwendungen (CD-ROM) Anwendung A_080_Quantile_Minimum_Maimum Die Anwendung besteht aus einem Tabellenblatt Simulation : In der Simulation wird aus einer Urliste
MehrKapitel V - Graphische Darstellung von Häufigkeitsverteilungen
Institut für Volkswirtschaftslehre (ECON) Lehrstuhl für Ökonometrie und Statistik Kapitel V - Graphische Darstellung von Häufigkeitsverteilungen Deskriptive Statistik Prof. Dr. W.-D. Heller Hartwig Senska
MehrDeskriptive Statistik. (basierend auf Slides von Lukas Meier)
Deskriptive Statistik (basierend auf Slides von Lukas Meier) Deskriptive Statistik: Ziele Daten zusammenfassen durch numerische Kennzahlen. Grafische Darstellung der Daten. Quelle: Ursus Wehrli, Kunst
MehrGliederung der Vorlesung
Gliederung der Vorlesung A. Einführung: 1. Versuchsplanung 2. Merkmalsauswahl 3. Skalenniveaus 4. Durchführung B. Beschreibende (deskriptive) Statistik C. Schließende Statistik Fehler 1. und 2. Art Testverfahren
MehrMathematische Statistik. Zur Notation
Mathematische Statistik dient dazu, anhand von Stichproben Informationen zu gewinnen. Während die Wahrscheinlichkeitsrechnung Prognosen über das Eintreten zufälliger (zukünftiger) Ereignisse macht, werden
MehrInterpolation und Approximation
Interpolation und Approximation Fakultät Grundlagen Mai 2006 Fakultät Grundlagen Interpolation und Approximation Übersicht 1 Problemstellung Polynominterpolation 2 Kubische Fakultät Grundlagen Interpolation
MehrDeskriptive Statistik 1 behaftet.
Die Statistik beschäftigt sich mit Massenerscheinungen, bei denen die dahinterstehenden Einzelereignisse meist zufällig sind. Statistik benutzt die Methoden der Wahrscheinlichkeitsrechnung. Fundamentalregeln:
MehrDeskriptive Statistik Beschreiben, Zusammenfassen, Darstellen gegebener Daten (Datenreduktion!)
Deskriptive Statistik Beschreiben, Zusammenfassen, Darstellen gegebener Daten (Datenreduktion!) - Arithmetisches Mittel o Das arithmetische Mittel (auch Durchschnitt) ist ein Mittelwert, der als Quotient
MehrStatistik. Jan Müller
Statistik Jan Müller Skalenniveau Nominalskala: Diese Skala basiert auf einem Satz von qualitativen Attributen. Es existiert kein Kriterium, nach dem die Punkte einer nominal skalierten Variablen anzuordnen
MehrTEIL 13: DIE EINFACHE LINEARE REGRESSION
TEIL 13: DIE EINFACHE LINEARE REGRESSION Die einfache lineare Regression Grundlagen Die einfache lineare Regression ist ebenfalls den bivariaten Verfahren für metrische Daten zuzuordnen 1 Sie hat einen
MehrKapitel 1 Beschreibende Statistik
Beispiel 1.5: Histogramm (klassierte erreichte Punkte, Fortsetzung Bsp. 1.1) 0.25 0.2 Höhe 0.15 0.1 0.05 0 0 6 7 8,5 10 11 erreichte Punkte Dr. Karsten Webel 24 Beispiel 1.5: Histogramm (Fortsetzung) Klasse
MehrGrafische Darstellung von Häufigkeitsverteilungen (1)
Grafische Darstellung von Häufigkeitsverteilungen () Grafische Darstellungen dienen... - Einführung - der Unterstützung des Lesens und Interpretierens von Daten. der Veranschaulichung mathematischer Begriffe
Mehrf : x y = mx + t Der Graph einer linearen Funktion ist eine Gerade, welche die y-achse im Punkt S schneidet. = m 2 x 2 m x 1
III. Funktionen und Gleichungen ================================================================== 3.1. Lineare Funktionen Eine Funktion mit der Zuordnungvorschrift f : x y = mx + t und m, t R heißt lineare
MehrInstitut für Biometrie und klinische Forschung. WiSe 2012/2013
Klinische Forschung WWU Münster Pflichtvorlesung zum Querschnittsfach Epidemiologie, Biometrie und Med. Informatik Praktikum der Medizinischen Biometrie () Überblick. Deskriptive Statistik I - Grundlegende
Mehr1 x 1 y 1 2 x 2 y 2 3 x 3 y 3... n x n y n
3.2. Bivariate Verteilungen zwei Variablen X, Y werden gemeinsam betrachtet (an jedem Objekt werden gleichzeitig zwei Merkmale beobachtet) Beobachtungswerte sind Paare von Merkmalsausprägungen (x, y) Beispiele:
MehrRelationen / Lineare Funktionen
Relationen / Lineare Funktionen Relationen Werden Elemente aus einer Menge X durch eine Zuordnungsvorschrift anderen Elementen aus einer Menge Y zugeordnet, so wird durch diese Zuordnungsvorschrift eine
MehrFunktionen mit mehreren Variablen. Voraussetzungen:
Funktionen mit mehreren Variablen Voraussetzungen: Grundlegende Kenntnisse über Ableiten (Zu inden in dem Artikel Dierential und Integralrechnung au www.antigauss.de), sowie eine Vorstellung davon, was
MehrKapitel IV - Häufigkeitsverteilungen
Institut für Volkswirtschaftslehre (ECON) Lehrstuhl für Ökonometrie und Statistik Kapitel IV - Häufigkeitsverteilungen Deskriptive Statistik Prof. Dr. W.-D. Heller Hartwig Senska Carlo Siebenschuh Agenda
MehrDeskription, Statistische Testverfahren und Regression. Seminar: Planung und Auswertung klinischer und experimenteller Studien
Deskription, Statistische Testverfahren und Regression Seminar: Planung und Auswertung klinischer und experimenteller Studien Deskriptive Statistik Deskriptive Statistik: beschreibende Statistik, empirische
MehrInferenzstatistik (=schließende Statistik)
Inferenzstatistik (=schließende Statistik) Grundproblem der Inferenzstatistik: Wie kann man von einer Stichprobe einen gültigen Schluß auf di Grundgesamtheit ziehen Bzw.: Wie groß sind die Fehler, die
MehrFaustformeln / Zusammenhänge a) Binomialverteilung als Poissonverteilung:
Faustformeln / Zusammenhänge a) Binomialverteilung als Poissonverteilung: k ( np) np B( n, p; k) Poi( np, k) e k! falls gilt: p
MehrFachrechnen für Tierpfleger
Z.B.: Fachrechnen für Tierpfleger A10. Statistik 10.1 Allgemeines Was ist Statistik? 1. Daten sammeln: Durch Umfragen, Zählung, Messung,... 2. Daten präsentieren: Tabellen, Grafiken 3. Daten beschreiben/charakterisieren:
Mehr825 e 290 e 542 e 945 e 528 e 486 e 675 e 618 e 170 e 500 e 443 e 608 e. Zeichnen Sie das Box-Plot. Sind in dieser Stichprobe Ausreißer vorhanden?
1. Aufgabe: Eine Bank will die jährliche Sparleistung eines bestimmten Kundenkreises untersuchen. Eine Stichprobe von 12 Kunden ergab folgende Werte: 825 e 290 e 542 e 945 e 528 e 486 e 675 e 618 e 170
MehrEmpirische Verteilungsfunktion
Empirische Verteilungsfunktion H(x) := Anzahl der Werte x ist. Deskriptive
MehrKürzen und Erweitern Die drei Gesichter einer Vergröbern bzw. Verfeinern der Einteilung nutzen
Schulcurriculum Mathematik Städtisches Gymnasium Eschweiler Klasse 6 (G8) - rationale Zahlen - mit Zahlen und Symbolen umgehen Grundregeln für Rechenaus- einfache Brüche und Größen, Rechnen mit rationalen
Mehr