Kapitel 2. Häufigkeitsverteilungen
|
|
- Anneliese Ursler
- vor 7 Jahren
- Abrufe
Transkript
1 6
2 Kapitel 2 Häufigkeitsverteilungen Ziel: Darstellung bzw Beschreibung (Exploration) einer Variablen Ausgangssituation: An n Einheiten ω,, ω n sei das Merkmal X beobachtet worden x = X(ω ),, x n = X(ω n ) Also x i = X(ω i ), dh x i ist der Wert der i-ten Person x,, x n werden auch als Urliste oder Rohdaten und n als Stichprobenumfang bezeichnet Die verschiedenen Merkmalsausprägungen werden mit a,, a k bezeichnet Bemerkungen: Werden mehr Beobachtungen erhoben, so ändert sich n, aber ia k nicht Meist bezeichnet a,, a k die beobachteten verschiedenen Merkmalsausprägungen, manchmal aber auch die prinzipiell möglichen Merkmalsausprägungen Für mindestens ordinalskalierte Merkmale seien die Ausprägungen geordnet, dh a < a 2 < < a k Beispiel: Häufigkeitsverteilung der Schichtzugehörigkeit einer Gesamtheit Ω von acht Personen Ω = {ω,, ω 8 } Kategorien: Unterschicht, Mittelschicht, Oberschicht Ordinales Merkmal X : Ω W ω X(ω) W = {U, M, O} für Unterschicht Mittelschicht Oberschicht oder durch Zahlen ausgedrückt: W = {, 0, } 7
3 8 2 Häufigkeiten X(ω) = Tabelle: ω Unterschicht 0 falls ω Mittelschicht ω Oberschicht Person ω X(ω) ω M 0 x ω 2 M 0 x 2 ω 3 O x 3 ω 4 M 0 x 4 ω 5 M 0 x 5 ω 6 M 0 x 6 n = 8 k = 3 a = a 2 = 0 a 3 = Also: ω 7 U - x 7 ω 8 O x 8 n: Anzahl der Einheiten k: Anzahl der verschiedenen Werte von X 2 Häufigkeiten Absolute Häufigkeiten der Merkmalsausprägungen: Für jedes a j, j =,, k, bezeichnen h j und h(a j ) die absolute Häufigkeit der Ausprägung a j, dh die Anzahl der x i aus x,, x n mit x i = a j Formal: h j := h(a j ) := {ω Ω X(ω) = a j } M bezeichnet die Mächtigkeit der Menge M := bedeutet wird definiert als h, h 2,, h k (als Ganzes) nennt man die absolute Häufigkeitsverteilung Es gilt k h j = n Erste Darstellung von Häufigkeiten anhand einer Strichliste: j= Strichliste - 0 8
4 Kapitel 2 Häufigkeitsverteilungen 9 Relative Häufigkeiten der Merkmalsausprägungen: Für jedes a j, j =,, k, bezeichnen f j und f(a j ) die relative Häufigkeit der Ausprägung a j, also f j := f(a j ) := h j n f, f 2,, f k nennt man die relative Häufigkeitsverteilung Es gilt k f j = j= Häufigkeitstabelle: Allgemeine Form: Im Beispiel: j a j h j f j a h f 2 a 2 h 2 f 2 3 a 3 h 3 f 3 j a j h j f j k a k h k f k n Insbesondere bei stetigen oder quasi-stetigen Merkmalen ist es häufig zweckmäßig, die Merkmalsausprägungen zu klassieren / zu gruppieren gruppierte Häufigkeitsverteilung Die gruppierte Häufigkeitsverteilung enthält nur die Häufigkeiten der Ausprägungen in den einzelnen Gruppen, die einzelnen a i entsprechen in diesem Fall Intervallen Achtung: Die Gruppierung bedeutet einen Informationsverlust und sollte deshalb in der Regel nur zur Visualisierung eingesetzt werden (und nicht in den statistischen Analysen)! Benutzt nur noch Nominal- / Ordinalskala statt Verhältnisskala Beispiel Mietspiegel: Merkmal = Nettomieten Urliste für n=26 Wohnungen, bereits der Größe nach geordnet:
5 20 22 Grafische Darstellung Klasse j h j f j 00 < /26 = < < < < < Grafische Darstellung Stabdiagramm: Trage über a,, a k jeweils einen zur x-achse senkrecht stehenden Stab mit Höhe h,, h k (oder f,, f k ) ab Horizontal: Ausprägungen der Variablen (a, a 2,, a k ) Vertikal: absolute / relative Häufigkeiten (h,, h k bzw f,, f k ) h j a j - 0 Vorausgesetztes Skalenniveau: mindestens Nominalskala Säulendiagramm: Ersetze die Stäbe durch Rechtecke (Säulen) gleicher Breite h j Balkendiagramm: Säulendiagramm mit vertauschten Achsen
6 Kapitel 2 Häufigkeitsverteilungen 2 Vorausgesetztes Skalenniveau: mindestens Nominalskala Kreisdiagramm: Der Kreis wird in Segmente unterteilt, denen jeweils eine Ausprägung (oder Klasse) zugeordnet wird Der jeweilige Winkel ist proportional zur Häufigkeit Prinzip der Flächentreue, dh die Fläche ist proportional zur Häufigkeit Für Stab-, Säulen- und Balkendiagramm gilt dagegen das Prinzip der Längentreue, dh die Länge der Stäbe / Säulen / Balken ist proportional zur Häufigkeit Berechnung: Winkel des Kreissektors j = relative Häufigkeit 360 Legende: - Unterschicht Häufigkeit Winkel - 0 Mittelschicht 0 f = 360 Oberschicht = f 2 = = f 3 = = Vorausgesetztes Skalenniveau: mindestens Nominalskala, Bemerkungen: Alle bisherigen Grafiken sind nur sinnvoll für kleine Kategorienzahlen k Für ordinalskalierte Merkmale lässt sich mit Stab- / Balken- / Säulendiagramm auch die Ordnung der Kategorien darstellen Durch Schichtung können die Grafiken auch zum Vergleich von Häufigkeitsverteilungen eingesetzt werden Stamm-Blatt-Diagramm: Erklärung anhand des Mietspiegelbeispiels: Semigrafisches Verfahren in Analogie zu Strichlisten
7 22 22 Grafische Darstellung Stamm: Blatt: führende Ziffern nächste Ziffer (evtl gerundet) Prinzipielles Vorgehen: Suche den kleinsten und größten Wert der Urliste und zerlege den Wertebereich in Intervalle der Breite 0 q (Vielfache von 0, q ist geeignet zu wählen) Kleinster Wert: 27 Größter Wert: 676 Intervallbreite 00, dh q = 2 Für q = würde man zu viele Intervalle erhalten (55) 2 Runde die Daten auf die führenden q Stellen Bestimme den Stamm aus den führenden Ziffern: Ziffern bis 6 4 Bestimme die Blätter aus der folgenden Ziffer: Trage für jeden Wert des Stamms die zugehörigen Blätter rechts von einer vertikalen Linie der Größe nach geordnet ab: Vorteile: Implizierte Gruppierung ohne viel Information zu verlieren, da die Darstellung bis auf Rundungen alle Werte der Urliste enthält Ermöglicht guten Einblick in Datenstruktur für explorative Analysen, zb auch Erkennen von Ausreißern Nachteile: Wird bei großen Datensätzen schnell unübersichtlich Lässt sich oft nicht mehr gut auf Papier präsentieren
8 Kapitel 2 Häufigkeitsverteilungen Histogramm Ziel: Automatische Erstellung einer sinnvollen Häufigkeitsdarstellung für metrische Merkmale (ohne manuelle Kategorisierung) Gegeben: Urliste x,, x n eines (mindestens) intervallskalierten Merkmals Wähle c 0 min i=,,n (x i ) und c k max i=,,n (x i ) Bilde Klasseneinteilung [c 0, c ), [c, c 2 ),, [c k, c k ] Für jede Klasse [c j, c j ), j =,, k sei d j = c j c j die Breite des j-ten Intervalls und h j bzw f j die absolute bzw relative Häufigkeit in der j-ten Klasse Zeichne über jedem Intervall ein Rechteck der Breite d j so, dass die Fläche proportional zu f j und h j ist Achtung: Das Histogramm ist flächentreu nicht längentreu! Es gilt Fläche = Breite Höhe und damit Höhe = Fläche / Breite Also ist die Höhe der Rechtecke proportional zu f j h j bzw, d j und nicht zu f j bzw h j d j Ein Histogramm unterscheidet sich damit substantiell von einem Säulendiagramm! Man muss also bei einer Grafik immer angeben, ob es sich um ein Säulendiagramm oder ein Histogramm handelt Beispiel: Punkteverteilung in der Klausur h j d j Klassen Hfgkt Breite Höhe [0, 355) [355, 485) [485, 645) [645, 795) [795, 90) { Täuschung?
9 24 23 Histogramm Tücken des Histogramms: Die Gestalt des Histogramms hängt wesentlich von der Klasseneinteilung ab Einfluss der Klassenzahl: viele Klassen: geringer Informationsverlust, aber rauher Verlauf wenige Klassen: Glättung von Sprüngen, aber hoher Informationsverlust Faustregeln: k = ( n) oder k = ( 2n) Natürliche Klasseneinteilung nutzen (zb: Notenstufen) und / oder möglichst gleich große Klassenbreiten wählen Treten bestimmte Werte sehr häufig auf, so ergeben sich zusätzliche Probleme Beispiel: Arbeitsbelastung neben dem Studium Was tun, wenn ein Wert eine inhaltliche Kategorie für sich bildet? (zb 0 bei Arbeitsbelastung neben Studium) Dann ist die natürliche Breite des zugehörigen
10 Kapitel 2 Häufigkeitsverteilungen 25 Intervalls gleich 0 und damit die Höhe gleich unendlich beliebige Peaks produzierbar, die alle anderen Ausprägungen optisch verschwinden lassen Mögliche Lösung: Wert aus dem Histogramm nehmen und auf zwei Grafiken aufteilen: Arbeit ja/nein, Verteilung der Arbeitsstunden bei den Arbeitenden (Vorsicht bei der Interpretation) Implizite Rundung auf Jubiläumszahlen (attractive numbers, Heaping) 5, 0, 20 2 Jahr, Jahr 6, 8, 25, 30 Monate Zur Vermeidung von Artefakten, Jubiläumszahlen nicht als Intervallgrenzen verwenden! Typen von Häufigkeitsverteilungen Histogramme eignen sich gut zur Beurteilung der Form von Häufigkeitsverteilungen Unimodale und multimodale Verteilungen: Unimodal Multimodal Multimodal Symmetrie und Schiefe
11 26 24 Kumulierte Häufigkeiten und empirische Verteilungsfunktion symmetrisch: Rechte und linke Hälfte der Verteilung sind annähernd zueinander spiegelbildlich linkssteil (rechtsschief): Verteilung fällt nach links deutlich steiler und nach rechts langsamer ab rechtssteil (linksschief): Verteilung fällt nach rechts deutlich steiler und nach links langsamer ab (linkssteil) (symmetrisch) (rechtssteil) Andere typische Verteilungsformen: U-förmig, J-förmig 24 Kumulierte Häufigkeiten und empirische Verteilungsfunktion Oft sind kumulierte Häufigkeiten von Interesse, also eine Antwort auf die Frage Wieviel Prozent der Daten über-/unterschreiten einen bestimmten Wert? Wieviel Prozent der Studenten arbeiten mehr als 8 Stunden pro Woche neben dem Studium? Wieviel Prozent der Studenten haben mindestens 355 Punkte, also die Klausur bestanden? Voraussetzung: Mindestens intervallskaliertes Merkmal Gegeben sei die Urliste x,, x n eines (mindestens) ordinalskalierten Merkmals mit der Häufigkeitsverteilung h,, h k bzw f,, f k Dann heißt H(x) := Anzahl der Werte x i mit x i x = h(a j ) = j:a j x j:a j x h j
12 Kapitel 2 Häufigkeitsverteilungen 27 absolute kumulierte Häufigkeitsverteilung und F (x) := Anteil der Werte x i mit x i x = H(x)/n = f(a j ) = n j:a j x h(a j ) j:a j x relative kumulierte Häufigkeitsverteilung bzw empirische Verteilungsfunktion Die Schreibweise H(x) := h(a j ) ist eine Abkürzung für j:a j x H(x) := j J x h(a j ) mit J x := {j a j x}, dh für jedes x wird die Summe über alle j mit der Eigenschaft betrachtet, dass die zugehörigen Werte a j kleiner gleich x sind (analog für F (x)) Beispiel: Klausurnoten (zur Vereinfachung a j = j) H() = H(2) = j:a j j:a j 2 Note: a j h(a j ) H(a j ) f(a j ) F (a j ) a = a 2 = a 3 = a 4 = a 5 = h(a j ) = h(a ) = 65 h(a j ) = h(a ) = 65 H(4) = = = Zwischen den Ausprägungen ist H(x) konstant, also H(x) = H(a j ) für alle x [a j, a j+ ) und j =,, k Es reicht also, H(x) an den tatsächlichen Ausprägungen a j zu berechnen
13 28 24 Kumulierte Häufigkeiten und empirische Verteilungsfunktion } h } h 2 } h 3 } h 4 } h Bemerkungen: F (x) sieht genauso aus; einfach den Maßstab auf der Ordinate durch 383 teilen Man kann aus H(x) und F (x) die Häufigkeitsverteilungen h,, h k und f,, f k reproduzieren, zb ist h(a j ) = H(a j ) H(a j ) die Häufigkeit von a j Bei rein ordinalen Merkmalen ist die Skaleneinteilung auf der Abszisse völlig willkürlich; man könnte obige Funktion zb genauso gut wie folgt zeichnen: Bei intervallskalierten Merkmalen ist diese Willkürlichkeit nicht mehr vorhanden kumulierte Häufigkeitsverteilungen werden fast nur bei intervallskalierten Merkmalen betrachtet
14 Kapitel 2 Häufigkeitsverteilungen 29 Empirische Verteilungsfunktion wenn alle Beobachtungen verschieden sind: F (x) 2 n n n n x () x (2) Empirische Verteilungsfunktion bei gegebenen Häufigkeiten: F (x) f + f 2 f f a a 2 Kumulierte Häufigkeiten bei gruppierten Merkmalen den Klassen Beispiel: Punkteverteilung in
15 30 24 Kumulierte Häufigkeiten und empirische Verteilungsfunktion Klassen Häufigkeiten kumuliert [0, 355) [355, 485) 78 3 [485, 645) [645, 795) [795, 90) Bei gruppierten, intervallskalierten Merkmalen tritt folgendes zusätzliches Problem auf: Klar sind die Werte der kumulierten Häufigkeitsverteilungen an den zu den Intervallgrenzen gehörenden Punkten Aber wie definiert man H(x) und F (x) zwischen diesen Punkten, was also ist etwa H(40)? Jetzt ist H nicht mehr notwendigerweise konstant zwischen den Klassengrenzen Beispielsweise ist 40 ja eine Ausprägung, die durchaus in den unklassierten Daten vorkam H(40) ist aber aus den klassierten Daten nicht mehr rekonstruierbar Eigentlich weiß man nur, dass H(40) einen Wert in dem entsprechenden Rechteck annehmen kann Lineare Interpolation ,5 48,5 64,5 79,5 90 Allgemeine Formulierung: k Klassen [c 0, c ),, [c j, c j ),, [c k, c k ],h j Häufigkeit in j-ter Klasse Verwende bei einem x aus der Klasse [c j, c j ) als Approximation für H(x) folgenden, aus der linearen Interpolation gewonnenen Punkt: H(c j ) H(x) } h j } {{ } } {{ } x c j x H(c j ) c j c j
16 Kapitel 2 Häufigkeitsverteilungen 3 Geradengleichung: H(x) H(c j ) + (c j c j ) (x c j ) Ausgpkt Steigung Wegstrecke h j H(40) H(355) + = (40 355) =
a 1 < a 2 <... < a k. 2 Häufigkeitsverteilungen 52
2 Häufigkeitsverteilungen 2.0 Grundbegriffe Ziel: Darstellung bzw. Beschreibung (Exploration) einer Variablen. Ausgangssituation: An n Einheiten ω 1,..., ω n sei das Merkmal X beobachtet worden. x 1 =
Mehr2 Häufigkeitsverteilungen
2 Häufigkeitsverteilungen Ziel: Darstellung bzw Beschreibung (Exploration) einer Variablen Ausgangssituation An n Einheiten ω 1,,ω n sei das Merkmal X beobachtet worden x 1 = X(ω 1 ),,x n = X(ω n ) Also
Mehr0 Einführung: Was ist Statistik
0 Einführung: Was ist Statistik 1 Datenerhebung und Messung 2 Univariate deskriptive Statistik Häufigkeitsverteilungen Statistische Kennwerte 3 Multivariate Statistik 4 Regression 5 Ergänzungen Deskriptive
MehrKreisdiagramm, Tortendiagramm
Kreisdiagramm, Tortendiagramm Darstellung der relativen (absoluten) Häufigkeiten als Fläche eines Kreises Anwendung: Nominale Merkmale Ordinale Merkmale (Problem: Ordnung nicht korrekt wiedergegeben) Gruppierte
MehrWISTA WIRTSCHAFTSSTATISTIK
WISTA WIRTSCHAFTSSTATISTIK PROF DR ROLF HÜPEN FAKULTÄT FÜR WIRTSCHAFTSWISSENSCHAFT Seminar für Theoretische Wirtschaftslehre Vorlesungsprogramm 23042013 Datenlagen und Darstellung eindimensionaler Häufigkeitsverteilungen
Mehr3 Häufigkeitsverteilungen
3 Häufigkeitsverteilungen 3.1 Absolute und relative Häufigkeiten 3.2 Klassierung von Daten 3.3 Verteilungsverläufe 3.1 Absolute und relative Häufigkeiten Datenaggregation: Bildung von Häufigkeiten X nominal
Mehr3 Häufigkeitsverteilungen
3 Häufigkeitsverteilungen 3.1 Absolute und relative Häufigkeiten 3.2 Klassierung von Daten 3.3 Verteilungsverläufe 3.1 Absolute und relative Häufigkeiten Datenaggregation: Bildung von Häufigkeiten X nominal
MehrGraphische Darstellung einer univariaten Verteilung:
Graphische Darstellung einer univariaten Verteilung: Die graphische Darstellung einer univariaten Verteilung hängt von dem Messniveau der Variablen ab. Bei einer graphischen Darstellung wird die Häufigkeit
MehrDeskriptive Statistik Lösungen zu Blatt 1 Christian Heumann, Susanne Konrath SS Lösung Aufgabe 1
1 Deskriptive Statistik Lösungen zu Blatt 1 Christian Heumann, Susanne Konrath SS 2011 Lösung Aufgabe 1 (a) Es sollen die mathematischen Vorkenntnisse der Studenten, die die Vorlesung Statistik I für Statistiker,
MehrStatistik SS Deskriptive Statistik. Bernhard Spangl 1. Universität für Bodenkultur. March 1, 2012
Statistik SS 2012 Deskriptive Statistik Bernhard Spangl 1 1 Institut für angewandte Statistik und EDV Universität für Bodenkultur March 1, 2012 B. Spangl (Universität für Bodenkultur) Statistik SS 2012
MehrWillkommen zur Vorlesung Statistik
Willkommen zur Vorlesung Statistik Thema dieser Vorlesung: Häufigkeiten und ihre Verteilung, oder: Zusammenfassende Darstellungen einzelner Variablen Prof. Dr. Wolfgang Ludwig-Mayerhofer Universität Siegen
Mehr4. Kumulierte Häufigkeiten und Quantile
4. Kumulierte Häufigkeiten und Quantile Statistik für SoziologInnen 1 4. Kumulierte Häufigkeiten und Quantile Kumulierte Häufigkeiten Oft ist man nicht an der Häufigkeit einzelner Merkmalsausprägungen
MehrUnivariate Häufigkeitsverteilungen Kühnel, Krebs 2001: Statistik für die Sozialwissenschaften, S.41-66
Univariate Häufigkeitsverteilungen Kühnel, Krebs 2001: Statistik für die Sozialwissenschaften, S.41-66 Gabriele Doblhammer: Empirische Sozialforschung Teil II, SS 2004 1/19 Skalenniveaus Skalenniveau Relation
MehrWahrscheinlichkeits - rechnung und Statistik
Michael Sachs Mathematik-Studienhilfen Wahrscheinlichkeits - rechnung und Statistik für Ingenieurstudenten an Fachhochschulen 4., aktualisierte Auflage 2.2 Eindimensionale Häufigkeitsverteilungen 19 absolute
MehrStatistik SS Deskriptive Statistik. Bernhard Spangl 1. Universität für Bodenkultur. March 6, 2012
Statistik SS 2012 Bernhard Spangl 1 1 Institut für angewandte Statistik und EDV Universität für Bodenkultur March 6, 2012 B. Spangl (Universität für Bodenkultur) Statistik SS 2012 March 6, 2012 1 / 19
Mehr4. Kumulierte Häufigkeiten und Quantile
4. Kumulierte Häufigkeiten und Quantile Kumulierte Häufigkeiten Oft ist man nicht an der Häufigkeit einzelner Merkmalsausprägungen interessiert, sondern an der Häufigkeit von Intervallen. Typische Fragestellung:
MehrVerteilungsfunktion und dquantile
Statistik 1 für SoziologInnen Verteilungsfunktion und dquantile Univ.Prof. Dr. Marcus Hudec Kumulierte Häufigkeiten Hinweis: Damit die Kumulation inhaltlich sinnvoll ist, muss das Merkmal zumindest ordinal
MehrDeskriptive Statistik
Deskriptive Statistik [descriptive statistics] Ziel der deskriptiven (beschreibenden) Statistik einschließlich der explorativen Datenanalyse [exploratory data analysis] ist zunächst die übersichtliche
MehrVerteilungen und ihre Darstellungen
Verteilungen und ihre Darstellungen Übung: Stamm-Blatt-Diagramme Wie sind die gekennzeichneten Beobachtungswerte eweils zu lesen? Tragen Sie in beiden Diagrammen den Wert 0.452 an der richtigen Stelle
MehrEinführung in Quantitative Methoden
Einführung in Quantitative Methoden Mag. Dipl.Ing. Dr. Pantelis Christodoulides & Mag. Dr. Karin Waldherr SS 2014 Christodoulides / Waldherr Einführung in Quantitative Methoden- 2.VO 1/57 Die Deskriptivstatistik
Mehr2. Deskriptive Statistik
Philipps-Universitat Marburg 2.1 Stichproben und Datentypen Untersuchungseinheiten: mogliche, statistisch zu erfassende Einheiten je Untersuchungseinheit: ein oder mehrere Merkmale oder Variablen beobachten
MehrWeitere Lagemaße: Quantile/Perzentile I
3 Auswertung von eindimensionalen Daten Lagemaße 3.3 Weitere Lagemaße: Quantile/Perzentile I Für jeden Median x med gilt: Mindestens 50% der Merkmalswerte sind kleiner gleich x med und ebenso mindestens
MehrVoraussetzung für statistische Auswertung: jeder Fall besitzt in bezug auf jedes Merkmal genau eine Ausprägung
Rohdaten Urliste oder Rohdaten sind die auszuwertenden Daten in der Form, wie sie nach der Datenerhebung vorliegen. Dimensionen der Urliste sind die Fälle, Merkmale und ihre Ausprägungen. Voraussetzung
MehrDer Mittelwert (arithmetisches Mittel)
Der Mittelwert (arithmetisches Mittel) x = 1 n n x i bekanntestes Lagemaß instabil gegen extreme Werte geeignet für intervallskalierte Daten Deskriptive Statistik WiSe 2015/2016 Helmut Küchenhoff (Institut
MehrMathematik für Biologen
Mathematik für Biologen Prof. Dr. Rüdiger W. Braun Heinrich-Heine Universität Düsseldorf 14. Oktober 2010 Übungen Aufgabenblatt 1 wird heute Nachmittag auf das Weblog gestellt. Geben Sie die Lösungen dieser
Mehry = y = 2'500 Darstellung in Grafik: P 2 (800 2'500) x (Stk) 1'000
. Kostenfunktion a) Vorgaben und Fragestellung Über die Herstellungskosten eines Produkts ist folgendes bekannt: Die variablen Material- und Lohnkosten betragen CHF. pro Stück. Die Fikosten belaufen sich
MehrMathematische und statistische Methoden I
Prof. Dr. G. Meinhardt 6. Stock, Wallstr. 3 (Raum 06-206) Sprechstunde jederzeit nach Vereinbarung und nach der Vorlesung. Mathematische und statistische Methoden I Dr. Malte Persike persike@uni-mainz.de
MehrVerteilungsfunktion und Quantile
Statistik 1 für SoziologInnen Verteilungsfunktion und Quantile Univ.Prof. Dr. Marcus Hudec Kumulierte Häufigkeiten Hinweis: Damit das Kumulieren inhaltlich sinnvoll ist, muss das auszuwertende Merkmal
MehrStatistik I für Betriebswirte Vorlesung 9
Statistik I für Betriebswirte Vorlesung 9 Dr. Andreas Wünsche TU Bergakademie Freiberg Institut für Stochastik Vorlesung am 8. Juni 2017 im Audi-Max (AUD-1001) Dr. Andreas Wünsche Statistik I für Betriebswirte
Mehrhtw saar 1 EINFÜHRUNG IN DIE STATISTIK: BESCHREIBENDE STATISTIK
htw saar 1 EINFÜHRUNG IN DIE STATISTIK: BESCHREIBENDE STATISTIK htw saar 2 Grundbegriffe htw saar 3 Grundgesamtheit und Stichprobe Ziel: Über eine Grundgesamtheit (Population) soll eine Aussage über ein
MehrVerteilungsfunktion und Quantile
Statistik 1 für SoziologInnen Verteilungsfunktion und Quantile Univ.Prof. Dr. Marcus Hudec Kumulierte Häufigkeiten Hinweis: Damit das Kumulieren inhaltlich sinnvoll ist, muss das Merkmal zumindest ordinal
MehrStatistik I für Studierende der Soziologie
Statistik I für Studierende der Soziologie Dr Carolin Strobl WS 2008/09 Danksagung Dieses Skript basiert in wesentlichen Teilen auf dem Skript von Prof Dr Thomas Augustin und den Ergänzungen von Dr Thomas
MehrBeschreibung von Daten
Kapitel 2 Beschreibung von Daten In diesem Kapitel geht es um die Beschreibung von empirisch erhobenen Daten Größere Datenmengen sind schwer zu überblicken Weil ein Bild leichter als eine Ansammlung von
MehrEinführung in Quantitative Methoden
Einführung in Quantitative Methoden Mag. Dipl.Ing. Dr. Pantelis Christodoulides & Mag. Dr. Karin Waldherr SS 2011 Christodoulides / Waldherr Einführung in Quantitative Methoden- 2.VO 1/62 Summenzeichen
MehrDeskriptive Statistik
Deskriptive Statistik 1 Ziele In der deskriptiven (=beschreibenden) Statistik werden Untersuchungsergebnisse übersichtlich dargestellt, durch Kennzahlen charakterisiert und grafisch veranschaulicht. 2
MehrDas harmonische Mittel
Das harmonische Mittel x H := 1 1 n n 1 x i Das harmonische Mittel entspricht dem Mittel durch Transformation t 1 t Beispiel: x 1,..., x n Geschwindigkeiten, mit denen konstante Wegstrecken l zurückgelegt
MehrKapitel 1 Beschreibende Statistik
Beispiel 1.5: Histogramm (klassierte erreichte Punkte, Fortsetzung Bsp. 1.1) 0.25 0.2 Höhe 0.15 0.1 0.05 0 0 6 7 8,5 10 11 erreichte Punkte Dr. Karsten Webel 24 Beispiel 1.5: Histogramm (Fortsetzung) Klasse
MehrDeskriptive Statistik 1 behaftet.
Die Statistik beschäftigt sich mit Massenerscheinungen, bei denen die dahinterstehenden Einzelereignisse meist zufällig sind. Statistik benutzt die Methoden der Wahrscheinlichkeitsrechnung. Fundamentalregeln:
MehrDeskriptive Statistik
Fakultät für Humanwissenschaften Sozialwissenschaftliche Methodenlehre Prof. Dr. Daniel Lois Deskriptive Statistik Stand: April 2015 (V2) Inhaltsverzeichnis 1. Notation 2 2. Messniveau 3 3. Häufigkeitsverteilungen
MehrStatistik I für Humanund Sozialwissenschaften
Statistik I für Humanund Sozialwissenschaften 1 Übung Lösungsvorschlag Gruppenübung G 1 Auf einer Touristeninsel in der Karibik wurden in den letzten beiden Juliwochen morgens zur gleichen Zeit die folgenden
MehrLagemaße Übung. Zentrale Methodenlehre, Europa Universität - Flensburg
Lagemaße Übung M O D U S, M E D I A N, M I T T E L W E R T, M O D A L K L A S S E, M E D I A N, K L A S S E, I N T E R P O L A T I O N D E R M E D I A N, K L A S S E M I T T E Zentrale Methodenlehre, Europa
MehrKapitel V - Graphische Darstellung von Häufigkeitsverteilungen
Universität Karlsruhe (TH) Institut für Statistik und Mathematische Wirtschaftstheorie Statistik 1 - Deskriptive Statistik Kapitel V - Graphische Darstellung von Häufigkeitsverteilungen Markus Höchstötter
MehrEinführung in die Statistik für Wirtschaftswissenschaftler für Betriebswirtschaft und Internationales Management
Einführung in die Statistik für Wirtschaftswissenschaftler für Betriebswirtschaft und Internationales Management Sommersemester 03 Hochschule Augsburg : Gliederung Einführung Deskriptive Statistik 3 Wahrscheinlichkeitstheorie
MehrMATHEMATIK MTA 12 SCHULJAHR 07/08 STATISTIK
MATHEMATIK MTA 12 SCHULJAHR 07/08 STATISTIK PROF. DR. CHRISTINA BIRKENHAKE Inhaltsverzeichnis 1. Merkmale 2 2. Urliste und Häufigkeitstabellen 9. Graphische Darstellung von Daten 10 4. Lageparameter 1
MehrGrafische Darstellung von Häufigkeitsverteilungen (1)
Grafische Darstellung von Häufigkeitsverteilungen () Grafische Darstellungen dienen... - Einführung - der Unterstützung des Lesens und Interpretierens von Daten. der Veranschaulichung mathematischer Begriffe
MehrVerteilungsfunktion und Quantile
Statistik 1 für SoziologInnen Verteilungsfunktion und Quantile Univ.Prof. Dr. Marcus Hudec Kumulierte Häufigkeiten Hinweis: Damit das Kumulieren inhaltlich sinnvoll ist, muss das Merkmal zumindest ordinal
MehrStochastik Deskriptive Statistik
Stochastik Deskriptive Statistik 3 % 3 8% % % % 99 997 998 999 3 7 8 % 99 997 998 999 3 7 8 8 8 99 997 998 999 3 7 8 99 99 998 8 8 Typ A % Typ B % 998 Typ C % 99 3 Diese Diagramme stellen weitgehend dieselben
MehrP (X = 2) = 1/36, P (X = 3) = 2/36,...
2.3 Zufallsvariablen 2.3 Zufallsvariablen Meist sind die Ereignisse eines Zufallseperiments bereits reelle Zahlen. Ist dies nicht der Fall, kann man Ereignissen eine reelle Zahl zuordnen. Zum Beispiel
Mehr1 x 1 y 1 2 x 2 y 2 3 x 3 y 3... n x n y n
3.2. Bivariate Verteilungen zwei Variablen X, Y werden gemeinsam betrachtet (an jedem Objekt werden gleichzeitig zwei Merkmale beobachtet) Beobachtungswerte sind Paare von Merkmalsausprägungen (x, y) Beispiele:
MehrKapitel V - Graphische Darstellung von Häufigkeitsverteilungen
Institut für Volkswirtschaftslehre (ECON) Lehrstuhl für Ökonometrie und Statistik Kapitel V - Graphische Darstellung von Häufigkeitsverteilungen Deskriptive Statistik Prof. Dr. W.-D. Heller Hartwig Senska
MehrStatistik. Jan Müller
Statistik Jan Müller Skalenniveau Nominalskala: Diese Skala basiert auf einem Satz von qualitativen Attributen. Es existiert kein Kriterium, nach dem die Punkte einer nominal skalierten Variablen anzuordnen
MehrBeispiel 2 (Einige Aufgaben zu Lageparametern) Aufgabe 1 (Lageparameter)
Beispiel (Einige Aufgaben zu Lageparametern) Aufgabe 1 (Lageparameter) 1 Ein Statistiker ist zu früh zu einer Verabredung gekommen und vertreibt sich nun die Zeit damit, daß er die Anzahl X der Stockwerke
Mehr3 Lage- und Streuungsmaße
3 Lage- und Streuungsmaße Grafische Darstellungen geben einen allgemeinen Eindruck der Verteilung eines Merkmals, u.a. von Lage und Zentrum der Daten, Streuung der Daten um dieses Zentrum, Schiefe / Symmetrie
MehrMathematische Statistik. Zur Notation
Mathematische Statistik dient dazu, anhand von Stichproben Informationen zu gewinnen. Während die Wahrscheinlichkeitsrechnung Prognosen über das Eintreten zufälliger (zukünftiger) Ereignisse macht, werden
MehrBeispiel für Anwendung: z-tabelle kann genutzt werden, um z.b. Poissonverteilung näherungsweise zu integrieren. Beispiel: wie wahrscheinlich ist es
Beispiel für Anwendung: z-tabelle kann genutzt werden, um z.b. Poissonverteilung näherungsweise zu integrieren. Beispiel: wie wahrscheinlich ist es beim radioaktiven Zerfall, zwischen 100 und 110 Zerfälle
MehrStatistik Skalen (Gurtner 2004)
Statistik Skalen (Gurtner 2004) Nominalskala: Daten haben nur Namen(Nomen) und (eigentlich) keinen Zahlenwert Es kann nur der Modus ( ofteste Wert) berechnet werden Beispiel 1: Die Befragung von 48 Personen
MehrFaustformeln / Zusammenhänge a) Binomialverteilung als Poissonverteilung:
Faustformeln / Zusammenhänge a) Binomialverteilung als Poissonverteilung: k ( np) np B( n, p; k) Poi( np, k) e k! falls gilt: p
MehrKapitel IV - Häufigkeitsverteilungen
Institut für Volkswirtschaftslehre (ECON) Lehrstuhl für Ökonometrie und Statistik Kapitel IV - Häufigkeitsverteilungen Deskriptive Statistik Prof. Dr. W.-D. Heller Hartwig Senska Carlo Siebenschuh Agenda
MehrDeskription, Statistische Testverfahren und Regression. Seminar: Planung und Auswertung klinischer und experimenteller Studien
Deskription, Statistische Testverfahren und Regression Seminar: Planung und Auswertung klinischer und experimenteller Studien Deskriptive Statistik Deskriptive Statistik: beschreibende Statistik, empirische
Mehr1 Verteilungen und ihre Darstellung
GKC Statistische Grundlagen für die Korpuslinguistik Kapitel 2: Univariate Deskription von Daten 8.11.2004 Univariate (= eindimensionale) Daten bestehen aus Beobachtungen eines einzelnen Merkmals. 1 Verteilungen
Mehr5 Assoziationsmessung in Kontingenztafeln
5 Assoziationsmessung in Kontingenztafeln 51 Multivariate Merkmale 51 Multivariate Merkmale Gerade in der Soziologie ist die Analyse eindimensionaler Merkmale nur der allererste Schritt zur Beschreibung
MehrDeskriptive Statistik
Deskriptive Statistik Deskriptive Statistik: Ziele Daten zusammenfassen durch numerische Kennzahlen. Grafische Darstellung der Daten. Quelle: Ursus Wehrli, Kunst aufräumen 1 Modell vs. Daten Bis jetzt
MehrDiskrete Zufallsvariablen (Forts.) I
9 Eindimensionale Zufallsvariablen Diskrete Zufallsvariablen 9.4 Diskrete Zufallsvariablen (Forts.) I T (X ) ist endlich oder abzählbar unendlich, die Elemente von T (X ) werden daher im Folgenden häufig
MehrDiskrete Zufallsvariablen (Forts.) I
9 Eindimensionale Zufallsvariablen Diskrete Zufallsvariablen 9.4 Diskrete Zufallsvariablen (Forts.) I T (X ) ist endlich oder abzählbar unendlich, die Elemente von T (X ) werden daher im Folgenden häufig
MehrStatistik I. Zusammenfassung und wichtiges zur Prüfungsvorbereitung. Malte Wissmann. 9. Dezember Universität Basel.
Zusammenfassung und wichtiges zur Prüfungsvorbereitung 9. Dezember 2008 Begriffe Kenntnis der wichtigen Begriffe und Unterscheidung dieser. Beispiele: Merkmal, Merkmalsraum, etc. Skalierung: Nominal etc
MehrGliederung der Vorlesung
Gliederung der Vorlesung A. Einführung: 1. Versuchsplanung 2. Merkmalsauswahl 3. Skalenniveaus 4. Durchführung B. Beschreibende (deskriptive) Statistik C. Schließende Statistik Fehler 1. und 2. Art Testverfahren
MehrAnwendung A_0801_Quantile_Minimum_Maximum
8. Lageparameter 63 8.3 Interaktive EXCEL-Anwendungen (CD-ROM) Anwendung A_080_Quantile_Minimum_Maimum Die Anwendung besteht aus einem Tabellenblatt Simulation : In der Simulation wird aus einer Urliste
MehrWirtschaftswissenschaftliches Prüfungsamt Bachelor-Prüfung Deskriptive Statistik und Wahrscheinlichkeitsrechnung Wintersemester 2012/13
Wirtschaftswissenschaftliches Prüfungsamt Bachelor-Prüfung Deskriptive Statistik und Wahrscheinlichkeitsrechnung Wintersemester 2012/13 Aufgabenstellung und Ergebnisse Dr. Martin Becker Hinweise für die
Mehr2 Datenbeschreibung. 2.1 Datendarstellung
2 Datenbeschreibung Ihr Sparbuch ist gefüllt! Da Sie etwas Geld übrig haben, möchten Sie es anlegen. Sie gehen deshalb zu Ihrer Bank und lassen sich beraten. Was halten Sie von Fonds? Auf diese Frage Ihres
MehrGegeben: Eine Menge von Objekten mit Merkmalen (beobachtet oder gemessen) Die gegebene Menge heißt auch Grundgesamtheit.
Kapitel 1 Beschreibende Statistik Gegeben: Eine Menge von Objekten mit Merkmalen (beobachtet oder gemessen) Gesucht: Übersichtliche Beschreibung Die gegebene Menge heißt auch Grundgesamtheit. Beispiele
MehrAufgabenstellung und Ergebnisse zur. Bachelor-Prüfung Deskriptive Statistik und Wahrscheinlichkeitsrechnung Wintersemester 2018/19
Aufgabenstellung und Ergebnisse zur Bachelor-Prüfung Deskriptive Statistik und Wahrscheinlichkeitsrechnung Wintersemester 08/9 PD Dr. Martin Becker Hinweise für die Klausurteilnehmer ˆ Die Klausur besteht
MehrDer Modus ist. Der Median ist. 3. Übung. Aufgabe 1. a) der häufigste Wert. b) der Wert unter dem 50 % aller anderen Werte liegen.
3. Übung Aufgabe 1 Der Modus ist a) der häufigste Wert. b) der Wert unter dem 50 % aller anderen Werte liegen. c) der Durchschnitt aller Werte. d) der Wert mit der größten Häufigkeitsdichte. e) der Schwerpunkt
MehrWISTA WIRTSCHAFTSSTATISTIK
WISTA WIRTSCHAFTSSTATISTIK PROF DR ROLF HÜPEN FAKULTÄT FÜR WIRTSCHAFTSWISSENSCHAFT Seminar für Theoretische Wirtschaftslehre Vorlesungsprogramm 07052013 Mittelwerte und Lagemaße II 1 Anwendung und Berechnung
MehrForschungsstatistik I
Psychologie Prof. Dr. G. Meinhardt 2. Stock, Nordflügel R. 02-429 (Persike) R. 02-431 (Meinhardt) Sprechstunde jederzeit nach Vereinbarung Forschungsstatistik I Dr. Malte Persike persike@uni-mainz.de WS
MehrInstitut für Biometrie und klinische Forschung. WiSe 2012/2013
Klinische Forschung WWU Münster Pflichtvorlesung zum Querschnittsfach Epidemiologie, Biometrie und Med. Informatik Praktikum der Medizinischen Biometrie () Überblick. Deskriptive Statistik I - Grundlegende
MehrKapitel VIII - Mehrdimensionale Merkmale
Institut für Volkswirtschaftslehre (ECON) Lehrstuhl für Ökonometrie und Statistik Kapitel VIII - Mehrdimensionale Merkmale Deskriptive Statistik Prof. Dr. W.-D. Heller Hartwig Senska Carlo Siebenschuh
MehrDr. Reinhard Vonthein, Dipl. Statistiker (Univ.)
Dr. Reinhard Vonthein, Dipl. Statistiker (Univ.) Reinhard.Vonthein@imbs.uni-luebeck.de Institut für Medizinische Biometrie und Statistik Universität zu Lübeck / Universitätsklinikums Schleswig-Holstein
Mehr3 Lage- und Streuungsmaße
3 Lage- und Streuungsmaße 3.0 Kumulierte Häufigkeiten und empirische Verteilungsfunktion Grafische Darstellungen geben einen allgemeinen Eindruck der Verteilung eines Merkmals: Lage und Zentrum der Daten,
MehrDeskriptive Statistik Erläuterungen
Grundlagen der Wirtschaftsmathematik und Statistik Erläuterungen Lernmaterial zum Modul - 40601 - der Fernuniversität Hagen 7 2.1 Einfache Lageparameter aus einer gegebenen Messreihe ablesen Erklärung
MehrTutorial: Balken- und Tortendiagramm
Tutorial: Balken- und Tortendiagramm In der Tabelle ist die Notenverteilung von 510 Teilnehmern an Mathematik Proseminaren angegeben (NA bedeutet einen unbekannten Wert). Der Sachverhalt sollte in zwei
MehrDr. Quapp: Statistik für Mathematiker mit SPSS. Lösungs Hinweise 1. Übung Beschreibende Statistik & Verteilungsfunktion
Dr. Quapp: Statistik für Mathematiker mit SPSS Lösungs Hinweise. Übung Beschreibende Statistik & Verteilungsfunktion. Die folgende Tabelle enthält die Pulsfrequenz einer Versuchsgruppe von 39 Personen:
MehrStatistik I für Betriebswirte Vorlesung 9
Statistik I für Betriebswirte Vorlesung 9 Prof. Dr. Hans-Jörg Starkloff TU Bergakademie Freiberg Institut für Stochastik 06. Juni 2016 Prof. Dr. Hans-Jörg Starkloff Statistik I für Betriebswirte Vorlesung
Mehr1. Einführung und statistische Grundbegriffe. Grundsätzlich unterscheidet man zwei Bedeutungen des Begriffs Statistik:
. Einführung und statistische Grundbegriffe Beispiele aus dem täglichen Leben Grundsätzlich unterscheidet man zwei Bedeutungen des Begriffs Statistik: Quantitative Information Graphische oder tabellarische
MehrDeskriptivstatistik a) Univariate Statistik Weiters zum Thema der statistischen Informationsverdichtung
20 Weiters zum Thema der statistischen Informationsverdichtung M a ß z a h l e n Statistiken bei Stichproben Parameter bei Grundgesamtheiten Maßzahlen zur Beschreibung univariater Verteilungen Maßzahlen
Mehr1) Warum ist die Lage einer Verteilung für das Ergebnis einer statistischen Analyse von Bedeutung?
86 8. Lageparameter Leitfragen 1) Warum ist die Lage einer Verteilung für das Ergebnis einer statistischen Analyse von Bedeutung? 2) Was ist der Unterschied zwischen Parametern der Lage und der Streuung?
MehrDeskriptive Statistik. (basierend auf Slides von Lukas Meier)
Deskriptive Statistik (basierend auf Slides von Lukas Meier) Deskriptive Statistik: Ziele Daten zusammenfassen durch numerische Kennzahlen. Grafische Darstellung der Daten. Quelle: Ursus Wehrli, Kunst
MehrWirtschaftswissenschaftliches Prüfungssekretariat Bachelor-Prüfung Deskriptive Statistik und Wahrscheinlichkeitsrechnung Sommersemester 2015
Wirtschaftswissenschaftliches Prüfungssekretariat Bachelor-Prüfung Deskriptive Statistik und Wahrscheinlichkeitsrechnung Sommersemester 205 Namensschild Dr. Martin Becker Hinweise für die Klausurteilnehmer
MehrEmpirische Verteilungsfunktion
Empirische Verteilungsfunktion H(x) := Anzahl der Werte x ist. Deskriptive
MehrKapitel 1: Deskriptive Statistik
Kapitel 1: Deskriptive Statistik Grafiken 1 Statistische Kennwerte 5 z-standardisierung 7 Grafiken Mit Hilfe von SPSS lassen sich eine Vielzahl unterschiedlicher Grafiken für unterschiedliche Zwecke erstellen.
MehrFachrechnen für Tierpfleger
Z.B.: Fachrechnen für Tierpfleger A10. Statistik 10.1 Allgemeines Was ist Statistik? 1. Daten sammeln: Durch Umfragen, Zählung, Messung,... 2. Daten präsentieren: Tabellen, Grafiken 3. Daten beschreiben/charakterisieren:
MehrStatistik I (17) 79. Untersuchen Sie die Daten aus Tabelle 1.
Schüler Nr. Statistik I (7) Schuljahr /7 Mathematik FOS (Haben Sie Probleme bei der Bearbeitung dieser Aufgaben, wenden Sie sich bitte an die betreuenden Lehrkräfte!) Tabelle : Die Tabelle wurde im Rahmen
MehrMathematische und statistische Methoden II
Methodenlehre e e Prof. Dr. G. Meinhardt 6. Stock, Wallstr. 3 (Raum 06-206) Sprechstunde jederzeit nach Vereinbarung und nach der Vorlesung. Mathematische und statistische Methoden II Dr. Malte Persike
MehrTutorium Mathematik in der gymnasialen Oberstufe 1. Veranstaltung: Beschreibende Statistik 19. Oktober 2016
Tutorium Mathematik in der gymnasialen Oberstufe 1. Veranstaltung: Beschreibende Statistik 19. Oktober 2016 1. Daten erfassen 1. Aufgabe: Würfeln Sie 30-mal mit einem regelmäßigen Oktaeder und dokumentieren
MehrMathematik für Biologen
Mathematik für Biologen Prof. Dr. Rüdiger W. Braun Ruediger.Braun@uni-duesseldorf.de Heinrich-Heine Universität Düsseldorf Mathematik für Biologen p. 1 Hinweise Internetseite zur Vorlesung: http://blog.ruediger-braun.net
MehrAuswertung statistischer Daten 1
Auswertung statistischer Daten 1 Dr. Elke Warmuth Sommersemester 2018 1 / 26 Statistik Untersuchungseinheiten u. Merkmale Grundgesamtheit u. Stichprobe Datenaufbereitung Urliste, Strichliste, Häufigkeitstabelle,
MehrBitte am PC mit Windows anmelden!
Einführung in SPSS Plan für heute: Grundlagen/ Vorwissen für SPSS Vergleich der Übungsaufgaben Einführung in SPSS http://weknowmemes.com/generator/uploads/generated/g1374774654830726655.jpg Standardnormalverteilung
Mehr