1 Verteilungen metrischer Daten
|
|
- Carin Feld
- vor 6 Jahren
- Abrufe
Transkript
1 1 Verteilungen metrischer Daten Um statistische Qualität zu kontrollieren und sicherzustellen, interessiert im Rahmen eines Forschungsvorhabens von der Testkonstruktion bis zur statistischen Analyse in besonderem Maße die Verteilung der gewonnenen Daten. Besondere Sorgfalt gilt meist den intervallskalierten Merkmalen, denn vielen statistischen Verfahren und Analysemodellen liegt die Annahme der (zumindest approximativen) Normalverteilung (NV) zugrunde. Insbesondere bei kleinen Stichproben (N < 30) ist die Absicherung, dass NV in den Analysevariablen vorliegt, unentbehrlich, denn andernfalls sind bekanntlich nonparametrische Verfahren anzuwenden, die dann z. T. eine geringere Power aufweisen. Nun gibt es aber in der Statistik mehrere Optionen, Verteilungen an die Erfordernisse anzupassen, allerdings ist deren Anwendung im Regelfall nicht sehr verbreitet. Die folgenden Ausführungen werden sich deshalb mit solchen Techniken verbunden mit einigen statischen Überlegungen näher befassen. Verteilungen von metrischen Merkmalen können bekanntlich sehr verschieden aussehen. Die folgende Darstellung verdeutlicht das mit einigen Beispielen: Abbildung 1: Beispiele zu unterschiedlichen Verteilungen 1
2 Um Verteilungen zu beschreiben, werden verschiedene Kennwerte bzw. statistische Maße berechnet. Die wichtigsten Maße sind die zentrale Tendenz (Mittelwert, Median, Modus/Modalwert) und die Dispersion (Standardabweichung, Quartilabstand und Spannweite). Zusätzlich sind Schiefe und Exzess zur Beschreibung der Verteilung hilfreich (BÜHNER 06, S. 78). Die Normalverteilung.1 Eigenschaften der Normalverteilung Die Normalverteilung (NV) tritt bei Merkmalen, von denen angenommen werden kann, dass sie auch in der Grundgesamtheit einer NV folgen, sehr häufig auf, insbesondere, wo Merkmale wie Körpergröße, Intelligenz, Neugier, Stressbelastbarkeit von einer Vielzahl von fördernden und hemmenden Faktoren bestimmt sind. Diese Verteilung hat die Gestalt einer Glocke, d. h. mittlere Merkmalsausprägungen kommen häufiger vor als extreme (vgl. NACHTI- GALL & WIRTZ 09, S. 47f). Die NV lässt sich durch zwei Parameter, nämlich Mittelwert und Streuung, präzise charakterisieren. Die NV ist eine übliche Verteilung der Wahrscheinlichkeit stetig verteilter Merkmale. Alle Normalverteilungen haben die folgenden Verteilungseigenschaften: Da die Wahrscheinlichkeit für alle möglichen Ereignisse zusammengerechnet nur 1 betragen kann, ist die Fläche unter der Kurve ebenfalls 1. Alle Normalverteilungen sind eindeutig durch die zwei Bestimmungsmerkmale arithmetisches Mittel und Standardabweichung definiert: f ( x) 1 In der NV besteht eine feste Beziehung zwischen der Standardabweichung (SD) und prozentualen Flächenanteilen unter der Kurve. So finden sich zwischen dem Mittelwert und der ersten SD positiv und negativ jeweils 34,13 %, zusammen also 68,6% der s e 1 x X s
3 Verteilung. Die Wahrscheinlichkeit, dass ein Wert in das Intervall einer der SDn fällt, ist durch den zugehörigen Flächenanteil gegeben (für die 1. Standardabweichung ± 1: 0,683 oder 68,3%). Mit Hilfe der SD wird die NV-Kurve in weitere Abschnitte eingeteilt. Ausgehend vom Mittelwert lassen sich Bereiche von sowohl plus als auch minus zwei (für die. Standardabweichung ± : 0,954 oder 95,44 %) oder drei SDn (für die 3. Standardabweichung ± 3: 0,997 oder 99,74 % nahezu alle Fälle) betrachten und beschreiben. Die Verteilung hat einen glockenförmigen Verlauf. Die Verteilung ist symmetrisch (d. h. die Fläche links bzw. rechts vom M beträgt 0,5). Modus, Median sowie arithmetisches Mittel fallen zusammen und liegen am Hochpunkt der Verteilungsfunktion. Die zwischen den Wendepunkten (die sich im Abstand genau einer Standardabweichung beiderseits des arithmetischen Mittels befinden) liegenden x-werte machen ca. ⅔ (68,3 %) der Gesamtfläche aus. Die Verteilung nähert sich asymptotisch der x-achse. Die Normalverteilungsfunktion ist nur nummerisch integrierbar, daher kann keine allgemeine Formel für Flächenanteile angegeben werden. Zur Bestimmung von Flächenanteilen nimmt man daher Tabellen bzw. entsprechende Rechner. Normalverteilungen können weiters bei gleichen Mittelwerten, jedoch unterschiedlichen Streuungen verschieden flach oder steil verlaufen (vgl. NACHTIGALL & WIRTZ 09, S. 49): Abbildung : Beispiel für eine flache und steile Normalverteilung 3
4 Wenn die Streuung groß ist, ist die Verteilung breit und niedrig, wenn die Streuung klein ist, ist die Verteilung schmal und hoch.. Verfahren zur Überprüfung auf NV Da viele statistische Analysen auf der Normalverteilungsannahme beruhen, ist eine Überprüfung von intervallskalierten Variablen auf NV ein meist notwendiges Verfahren. Auf der Grundlage der voranstehenden Ausführungen lässt sich nun auf mehrfache Weise beurteilen, ob eine Variable (zumindest annähernd) normalverteilt ist oder nicht, ob die vorliegende Form die geplante(n) Analyse(n) erlaubt oder zuvor einer Normalisierung mittels einer passenden Transformation bedarf. In SPSS stehen dazu mehrere Verteilungsprüfungsoptionen, z. B. unter der Explorativen Datenanalyse, zur Verfügung: Pfad: Analysieren Deskriptive Statistiken Explorative Datenanalyse... gewünschte Variable einsetzen Statistiken... Weiter Diagramme Weiter OK. 4
5 Abbildung 3: Dialogfenster zur Anforderung der Explorativen Datenanalyse Eine Überprüfung auf NV liefert erfahrungsgemäß das wenig überraschende Resultat, dass mehr oder weniger schiefe Verteilungen vorliegen. Die folgenden Ausführungen setzen sich nun als Vorarbeit zur passenden Transformation mit der umfangreichen SPSS-Ausgabe der Explorativen Datenanalyse auseinander. 5
6 ..1 Grafisch gestützte Überprüfung Den ersten subjektiven Eindruck bietet die beliebte grafische Darstellung der Verteilung einer Zahlenreihe in Form eines Histogramms mit Normalverteilungskurve. Allerdings reicht diese Illustration zur Beurteilung nicht aus, da ihr Aussehen von der (frei wählbaren) Balken- bzw. Klassenbreite sowie den Klassengrenzen abhängt (in SPSS werden außerdem maximal 1 Klassen gebildet). Es gibt in SPSS neben der zuvor dargestellten Anforderung über die Explorative Datenanalyse mehrere Optionen, ein Histogramm mit NV-Kurve zu erzeugen. Für gewöhnlich wird folgender Weg in Zusammenhang mit Häufigkeitstabellen beschritten: Pfad: Analysieren Deskriptive Statistiken Häufigkeiten... gewünschte Variable einsetzen Diagramme... Histogramme: Normalverteilungskurve im Histogramm anzeigen Weiter OK. 6
7 Abbildung 4: Anfordern eines Histogramms in SPSS Häufigkeit 0 80 Mittelwert =41,75 Std.-Abw. =1,573 N =975 Alter Abbildung 5: Histogramm in SPSS Das Ergebnis entspricht, wie bereits erwähnt, eher selten exakt einer NV. Ausschlaggebend ist jedoch, dass keine ausgeprägte links- oder rechtssteile Verteilung vorliegt. Fordert man unter der Option Explorative Datenanalyse in SPSS unter den Diagrammen ein Stengel-Blatt an, erhält man folgende Verteilungsdarstellung: 7
8 Alter Stem-and-Leaf Plot Frequency Stem & Leaf 5, & 66, , , , , , , , , , , & 6, & Stem width: 10 Each leaf: 4 case(s) & denotes fractional leaves. Tabelle 1: Ausgabe Stem-and-Leaf-Plot (Stamm-Blatt-Diagramm) zur Variablen Alter Stem width = hier 10 (d. h. der Stamm enthält hier 10er-Stellenwerte, die höchstmöglichen Stellenwerte des dekadischen Systems in der untersuchten Variablen Alter ) Stem (Stamm, Stengel) = hier das bezifferte Jahrzehnt gemäß stem width Leaf (Blätter) = nächstkleinere Einheit im dekadischen System, d. h. beim Alter die gerundeten Einer-Ziffern, somit die einzelnen Jahre Frequency = absolute Häufigkeit der Fälle in jeder Zeile (Extremes = Ausreißer gemäß der Boxplots; hier nicht vorhanden deshalb nicht ausgewiesen) Interpretation der fettgedruckten Zeile im Datenbeispiel Alter (Hervorhebung d. Verf.): 30-mal sind in dieser Altersverteilung vertreten: Stamm 6: alle - bis einschließlich 69-Jährigen; davon sind präzise gemäß der Anzahl jeder Ziffer im Blatt (566789): ein 65-Jähriger, zwei 66-Jährige, ein 67-Jähriger, ein 68-Jähriger und letztlich ein 69-Jähriger. Mit Stem-and-Leaf-Plots, deren Aussehen mit einem nach rechts gekippten Histogramm vergleichbar ist (flächenproportional), lassen sich somit Verteilungen darstellen, denen vergleichsweise zu anderen grafischen Darstellungen auch noch die gerundeten Originaldaten entnommen werden können. Hier ist außerdem ersichtlich, dass die Variable Alter etwas linkssteil verteilt ist. Ein wesentlicher Vorteil von Stem-and-Leaf-Plots besteht ansonsten darin, dass zwei nebeneinander gestellte Verteilungen zahlenmäßig recht genau verglichen werden können. Sehr große 8
9 oder sehr kleine Zahlen können auf- bzw. abgerundet oder als Extremwerte ausgewiesen werden. Stem-and-Leaf-Plots werden übrigens auch gerne zur Fehlersuche verwendet. Eine weitere subjektive visuelle Überprüfung auf NV kann über Q- Q-Diagramme (Quantil-Quantil-Plots) erfolgen: 4 Erwarteter Normalwert Beobachteter Wert Abbildung 6: Q-Q-Diagramm der Explorativen Datenanalyse (Variable Alter) Die Gerade in der obigen Darstellung entspricht bei einer sog. Q-Q- Verteilung den Werten, die bei einer Normalverteilung des Merkmals zu erwarten sind also der theoretischen Verteilung. Auf der Y- Achse sind die Erwartungswerte skaliert, auf der X-Achse die Beobachtungswerte. Die Punkte markieren die vorliegenden Beobachtungen und interpretiert werden die Abweichungen von der theoretischen NV, die hier durch eine Linie dargestellt wird. Wenn alle Punkte auf der Geraden liegen, liegt eine perfekte Normalverteilung vor. 9
10 1,00 Abweichung von Normal 0,75 0,50 0,5 0,00-0,5 80 Beobachteter Wert Abbildung 7: Trendbereinigtes Q-Q-Diagramm der Explorativen Datenanalyse (Variable Alter) Das Trendbereinigte Q-Q-Diagramm stellt ebenfalls die Unterschiede von beobachteten und erwarteten Werten dar. Die Y-Achse kennzeichnet aber in dieser Darstellung die z-transformierten beobachteten Werte. Hier werden die Abweichungen der Punkte von einer horizontalen Normalverteilungslinie (Nulllinie) betrachtet. Bei einer perfekten NV wären alle Abweichungen Null, d. h. dass alle Punkte auf der Geraden liegen würden. Für beide Q-Q-Verteilung-Plots gilt: Je mehr die Punkte von der Geraden abweichen, umso weniger kann von einer NV ausgegangen werden. Da die beiden Diagramme die Abweichungen von der NV unabhängig vom Stichprobenumfang darstellen, sind sie oft besser als statistische Tests zur Beurteilung geeignet. Diese verbleibt jedoch da es keine eindeutigen Regeln gibt im Ermessen der Forschenden, womit zwingend ein gewisser Grad an Subjektivität verbleibt. Boxplot Eine weitere Alternative ist die übersichtliche Darstellung einer Beobachtungsreihe in Form eines Boxplots, der sich außerdem gut zum Vergleich mehrerer überschneidungsfreier Teilgruppen eignet (Gruppierte Boxplots). 10
11 80 Whisker Box Whisker Alter Quartil P 75 Median P 50 Quartil P 5 Die Box (Kasten) ist der Bereich, in dem sich die mittleren 50 % der Beobachtungswerte befinden. Sie wird daher durch das obere Quartil P 75 und das untere Quartil P 5 begrenzt. Die Länge der Box entspricht somit dem Interquartilsabstand IQA. Die Box ist umso größer, je mehr die beobachteten Daten in diesem Bereich streuen. Der Median ist als durchgehender waagrechter Strich in der Box eingezeichnet. Dieser Strich teilt das gesamte Diagramm (ohne Ausreißer) in zwei Hälften, in denen jeweils 50 % der Daten liegen. Alter Durch seine Lage in der Box erhält man einen grafischen Eindruck von der Schiefe der Verteilung. Ist der Median, wie im Datenbeispiel eher im unteren (bzw. linken) Teil der Box, so ist die Verteilung linkssteil, andernfalls umgekehrt. Die genauen Werte dazu liefert die explorative Datenanalyse. Durch die Antennen (Whisker) werden die außerhalb der Box liegenden Werte dargestellt (Streuung). Die Festlegung der Antennen ist in der Literatur nicht einheitlich. Die Definition von TUKEY beschränkt die Länge der Whisker auf das maximal 1,5-Fache des Interquartilabstands (1,5 * IQA). Dabei endet der Whisker jedoch nicht genau nach dieser Länge, sondern bei demjenigen Datenwert, der noch innerhalb dieser Grenze liegt. Die Länge der Whisker wird also durch die Datenwerte und nicht allein durch den IQA bestimmt. Deshalb müssen die Whisker nicht auf beiden Seiten gleich lang sein. Liegen keine Werte (Ausreißer) außerhalb von 1,5 * IQR vor, wird die Länge der Whisker durch Maximum und Minimum festgelegt. (Vgl. SCHENDERA 07, S. 177) Kippt man den Boxplot nach rechts, werden die Form der Verteilung und die Struktur der Daten anschaulicher insbesondere dann, wenn man die Darstellung mit der entsprechenden Verteilungskurve kombiniert. 80 Abbildung 8: Verteilungsanalyse anhand des Boxplots zur Variablen Alter 11
Deskription, Statistische Testverfahren und Regression. Seminar: Planung und Auswertung klinischer und experimenteller Studien
Deskription, Statistische Testverfahren und Regression Seminar: Planung und Auswertung klinischer und experimenteller Studien Deskriptive Statistik Deskriptive Statistik: beschreibende Statistik, empirische
MehrUnivariate Häufigkeitsverteilungen Kühnel, Krebs 2001: Statistik für die Sozialwissenschaften, S.41-66
Univariate Häufigkeitsverteilungen Kühnel, Krebs 2001: Statistik für die Sozialwissenschaften, S.41-66 Gabriele Doblhammer: Empirische Sozialforschung Teil II, SS 2004 1/19 Skalenniveaus Skalenniveau Relation
MehrEmpirische Verteilungsfunktion
Empirische Verteilungsfunktion H(x) := Anzahl der Werte x ist. Deskriptive
Mehr1. Maße der zentralen Tendenz Beispiel: Variable Anzahl der Geschwister aus Jugend '92. Valid Cum Value Frequency Percent Percent Percent
Deskriptive Statistik 1. Verteilungsformen symmetrisch/asymmetrisch unimodal(eingipflig) / bimodal (zweigipflig schmalgipflig / breitgipflig linkssteil / rechtssteil U-förmig / abfallend Statistische Kennwerte
MehrEvaluation der Normalverteilungsannahme
Evaluation der Normalverteilungsannahme. Überprüfung der Normalverteilungsannahme im SPSS P. Wilhelm; HS SPSS bietet verschiedene Möglichkeiten, um Verteilungsannahmen zu überprüfen. Angefordert werden
MehrBitte am PC mit Windows anmelden!
Einführung in SPSS Plan für heute: Grundlagen/ Vorwissen für SPSS Vergleich der Übungsaufgaben Einführung in SPSS http://weknowmemes.com/generator/uploads/generated/g1374774654830726655.jpg Standardnormalverteilung
MehrHerzlich willkommen zur Vorlesung Statistik. Streuungsmaße oder die Unterschiedlichkeit der Daten nebst kurzen Ausführungen zu Schiefe und Wölbung
FB 1 W. Ludwig-Mayerhofer Statistik 1 Herzlich willkommen zur Vorlesung Statistik smaße oder die Unterschiedlichkeit der Daten nebst kurzen Ausführungen zu Schiefe und Wölbung FB 1 W. Ludwig-Mayerhofer
MehrKapitel 1: Deskriptive Statistik
Kapitel 1: Deskriptive Statistik Grafiken 1 Statistische Kennwerte 5 z-standardisierung 7 Grafiken Mit Hilfe von SPSS lassen sich eine Vielzahl unterschiedlicher Grafiken für unterschiedliche Zwecke erstellen.
Mehr- Normalverteilung (Gaußverteilung) kann auf sehr viele Zufallsprozesse angewendet werden.
Normalverteilung und Standardnormalverteilung als Beispiel einer theoretischen Verteilung - Normalverteilung (Gaußverteilung) kann auf sehr viele Zufallsprozesse angewendet werden. - Stetige (kontinuierliche),
MehrKonfidenzintervalle Grundlegendes Prinzip Erwartungswert Bekannte Varianz Unbekannte Varianz Anteilswert Differenzen von Erwartungswert Anteilswert
Konfidenzintervalle Grundlegendes Prinzip Erwartungswert Bekannte Varianz Unbekannte Varianz Anteilswert Differenzen von Erwartungswert Anteilswert Beispiel für Konfidenzintervall Im Prinzip haben wir
MehrSTATISTIK I Übung 07 Box-Plots und Stem-and-Leaf-Diagramme. 1 Kurze Wiederholung. Warum nur zwei grafische Darstellungsformen?
STATISTIK I Übung 07 Box-Plots und Stem-and-Leaf-Diagramme 1 Kurze Wiederholung Warum nur zwei grafische Darstellungsformen? Im Rahmen der Vorlesungen haben wir kurz eine ganze Reihe grafischer Darstellungsformen
Mehr3. Deskriptive Statistik
3. Deskriptive Statistik Eindimensionale (univariate) Daten: Pro Objekt wird ein Merkmal durch Messung / Befragung/ Beobachtung erhoben. Resultat ist jeweils ein Wert (Merkmalsausprägung) x i : - Gewicht
MehrAnteile Häufigkeiten Verteilungen Lagemaße Streuungsmaße Merkmale von Verteilungen. Anteile Häufigkeiten Verteilungen
DAS THEMA: VERTEILUNGEN LAGEMAßE - STREUUUNGSMAßE Anteile Häufigkeiten Verteilungen Lagemaße Streuungsmaße Merkmale von Verteilungen Anteile Häufigkeiten Verteilungen Anteile und Häufigkeiten Darstellung
MehrVerteilungsfunktion und Quantile
Statistik 1 für SoziologInnen Verteilungsfunktion und Quantile Univ.Prof. Dr. Marcus Hudec Kumulierte Häufigkeiten Hinweis: Damit das Kumulieren inhaltlich sinnvoll ist, muss das Merkmal zumindest ordinal
Mehr1) Warum ist die Lage einer Verteilung für das Ergebnis einer statistischen Analyse von Bedeutung?
86 8. Lageparameter Leitfragen 1) Warum ist die Lage einer Verteilung für das Ergebnis einer statistischen Analyse von Bedeutung? 2) Was ist der Unterschied zwischen Parametern der Lage und der Streuung?
MehrUnivariate Kennwerte mit SPSS
Univariate Kennwerte mit SPSS In diesem Paper wird beschrieben, wie eindimensionale Tabellen und Kennwerte mit SPSS erzeugt werden. Eine Herleitung der Kennwerte und eine inhaltliche Interpretation der
MehrKapitel 1: Deskriptive Statistik
Kapitel 1: Deskriptive Statistik Grafiken Mit Hilfe von SPSS lassen sich eine Vielzahl unterschiedlicher Grafiken für unterschiedliche Zwecke erstellen. Wir besprechen hier die zwei in Kapitel 1.1 thematisierten
MehrAchim Bühl, Peter Zöfel SPSS 12. Einführung in die moderne Datenanalyse unter Windows. 9., überarbeitete und erweiterte Auflage
Achim Bühl, Peter Zöfel SPSS 12 Einführung in die moderne Datenanalyse unter Windows 9., überarbeitete und erweiterte Auflage ein Imprint der Pearson Education Deutschland GmbH 10.4 Explorative Datenanalyse
MehrLage- und Streuungsparameter
Lage- und Streuungsparameter Beziehen sich auf die Verteilung der Ausprägungen von intervall- und ratio-skalierten Variablen Versuchen, diese Verteilung durch Zahlen zu beschreiben, statt sie graphisch
MehrSpezielle Eigenschaften der Binomialverteilung
Spezielle Eigenschaften der Binomialverteilung Wir unterscheiden: 1) die Wahrscheinlichkeitsfunktion einer diskreten Variablen 2) die Verteilungsfunktion einer diskreten Variablen. 1) Die Wahrscheinlichkeitsfunktion
MehrStatistik. Jan Müller
Statistik Jan Müller Skalenniveau Nominalskala: Diese Skala basiert auf einem Satz von qualitativen Attributen. Es existiert kein Kriterium, nach dem die Punkte einer nominal skalierten Variablen anzuordnen
MehrStatistik Testverfahren. Heinz Holling Günther Gediga. Bachelorstudium Psychologie. hogrefe.de
rbu leh ch s plu psych Heinz Holling Günther Gediga hogrefe.de Bachelorstudium Psychologie Statistik Testverfahren 18 Kapitel 2 i.i.d.-annahme dem unabhängig. Es gilt also die i.i.d.-annahme (i.i.d = independent
Mehr- Beschreibung der Stichprobe(n-Häufigkeitsverteilung) <- Ermittlung deskriptiver Maßzahlen (Mittelungsmaße, Variationsmaße, Formparameter)
Mehr
4 Statistische Maßzahlen
4 Statistische Maßzahlen 4.1 Maßzahlen der mittleren Lage 4.2 Weitere Maßzahlen der Lage 4.3 Maßzahlen der Streuung 4.4 Lineare Transformationen, Schiefemaße 4.5 Der Box Plot Ziel: Charakterisierung einer
MehrInstitut für Biometrie und klinische Forschung. WiSe 2012/2013
Klinische Forschung WWU Münster Pflichtvorlesung zum Querschnittsfach Epidemiologie, Biometrie und Med. Informatik Praktikum der Medizinischen Biometrie (3) Überblick. Deskriptive Statistik I 2. Deskriptive
Mehr1 45, 39, 44, 48, 42, 39, 40, , 31, 46, 35, 31, 42, 51, , 42, 33, 46, 33, 44, 43
1) Ermittle jeweils das arithmetische Mittel. Ordne die Datenerhebungen nach der Größe der arithmetischen Mittel. Beginne mit dem Größten. 1 45, 39, 44, 48, 42, 39, 40, 31 2 35, 31, 46, 35, 31, 42, 51,
MehrBeispiel 2 (Einige Aufgaben zu Lageparametern) Aufgabe 1 (Lageparameter)
Beispiel (Einige Aufgaben zu Lageparametern) Aufgabe 1 (Lageparameter) 1 Ein Statistiker ist zu früh zu einer Verabredung gekommen und vertreibt sich nun die Zeit damit, daß er die Anzahl X der Stockwerke
MehrLösungen zu Janssen/Laatz, Statistische Datenanalyse mit SPSS 1
LÖSUNG 2C a) Lösungen zu Janssen/Laatz, Statistische Datenanalyse mit SPSS 1 Bei HHEINK handelt es sich um eine metrische Variable. Bei den Analysen sollen Extremwerte ausgeschlossen werden. Man sollte
MehrWirtschaftswissenschaftliches Prüfungsamt Bachelor-Prüfung Deskriptive Statistik und Wahrscheinlichkeitsrechnung Wintersemester 2012/13
Wirtschaftswissenschaftliches Prüfungsamt Bachelor-Prüfung Deskriptive Statistik und Wahrscheinlichkeitsrechnung Wintersemester 2012/13 Aufgabenstellung und Ergebnisse Dr. Martin Becker Hinweise für die
MehrPROC MEANS. zum Berechnen statistischer Maßzahlen (für quantitative Merkmale)
PROC MEAS zum Berechnen statistischer Maßzahlen (für quantitative Merkmale) Allgemeine Form: PROC MEAS DATA=name Optionen ; VAR variablenliste ; CLASS vergleichsvariable ; Beispiel und Beschreibung der
MehrVerteilungsfunktion und Quantile
Statistik 1 für SoziologInnen Verteilungsfunktion und Quantile Univ.Prof. Dr. Marcus Hudec Kumulierte Häufigkeiten Hinweis: Damit das Kumulieren inhaltlich sinnvoll ist, muss das Merkmal zumindest ordinal
Mehr4. Kumulierte Häufigkeiten und Quantile
4. Kumulierte Häufigkeiten und Quantile Kumulierte Häufigkeiten Oft ist man nicht an der Häufigkeit einzelner Merkmalsausprägungen interessiert, sondern an der Häufigkeit von Intervallen. Typische Fragestellung:
MehrFachrechnen für Tierpfleger
Z.B.: Fachrechnen für Tierpfleger A10. Statistik 10.1 Allgemeines Was ist Statistik? 1. Daten sammeln: Durch Umfragen, Zählung, Messung,... 2. Daten präsentieren: Tabellen, Grafiken 3. Daten beschreiben/charakterisieren:
MehrStatistik eindimensionaler Größen
Statistik eindimensionaler Größen Michael Spielmann Inhaltsverzeichnis 1 Aufgabe der eindimensionalen Statistik 2 2 Grundbegriffe 2 3 Aufbereiten der Stichprobe 3 4 Die Kennzahlen Mittelwert und Streuung,
MehrGraphische Darstellung einer univariaten Verteilung:
Graphische Darstellung einer univariaten Verteilung: Die graphische Darstellung einer univariaten Verteilung hängt von dem Messniveau der Variablen ab. Bei einer graphischen Darstellung wird die Häufigkeit
MehrDie erhobenen Daten werden zunächst in einer Urliste angeschrieben. Daraus ermittelt man:
Die erhobenen Daten werden zunächst in einer Urliste angeschrieben. Daraus ermittelt man: a) Die absoluten Häufigkeit: Sie gibt an, wie oft ein Variablenwert vorkommt b) Die relative Häufigkeit: Sie erhält
MehrDeskriptive Statistik
Deskriptive Statistik In der beschreibenden Statistik werden Methoden behandelt, mit deren Hilfe man Daten übersichtlich darstellen und kennzeichnen kann. Die Urliste (=Daten in der Reihenfolge ihrer Erhebung)
MehrStatistik und Wahrscheinlichkeitsrechnung
Statistik und Wahrscheinlichkeitsrechnung Dr. Jochen Köhler 26.02.2008 1 Warum Statistik und Wahrscheinlichkeits rechnung im Ingenieurwesen? Zusammenfassung der letzten Vorlesung Statistik und Wahrscheinlichkeitsrechnung
MehrVerteilungsfunktion und dquantile
Statistik 1 für SoziologInnen Verteilungsfunktion und dquantile Univ.Prof. Dr. Marcus Hudec Kumulierte Häufigkeiten Hinweis: Damit die Kumulation inhaltlich sinnvoll ist, muss das Merkmal zumindest ordinal
MehrKapitel 38 Verteilungsdiagramme
Kapitel 38 Verteilungsdiagramme Mit Verteilungsdiagrammen können Sie grafisch untersuchen, inwieweit die Stichprobenverteilung einer Variablen mit einer theoretischen Verteilung übereinstimmt. So können
MehrEinführung in die Statistik
Einführung in die Statistik Analyse und Modellierung von Daten Von Prof. Dr. Rainer Schlittgen 4., überarbeitete und erweiterte Auflage Fachbereich Materialwissenschaft! der Techn. Hochschule Darmstadt
MehrMittelwert und Standardabweichung
Professur E-Learning und Neue Medien Institut für Medienforschung Philosophische Fakultät Einführung in die Statistik Mittelwert und Standardabweichung Überblick Mittelwert Standardabweichung Weitere Maße
MehrKapitel 5 Kenngrößen empirischer Verteilungen 5.1. Lagemaße. x mod (lies: x-mod) Wofür? Lageparameter. Modus/ Modalwert Zentrum. Median Zentralwert
Kapitel 5 Kenngrößen empirischer Verteilungen 5.1. Lagemaße Wofür? Lageparameter Modus/ Modalwert Zentrum Median Zentralwert Im Datensatz stehende Informationen auf wenige Kenngrößen verdichten ermöglicht
Mehr1.1 Graphische Darstellung von Messdaten und unterschiedliche Mittelwerte. D. Horstmann: Oktober
1.1 Graphische Darstellung von Messdaten und unterschiedliche Mittelwerte D. Horstmann: Oktober 2014 4 Graphische Darstellung von Daten und unterschiedliche Mittelwerte Eine Umfrage nach der Körpergröße
MehrLösung Aufgabe 19. ( ) = [Mio Euro]. Empirische Varianz s 2 = 1 n
Statistik I für Statistiker, Mathematiker und Informatiker Lösungen zu Blatt 4 Gerhard Tutz, Jan Ulbricht, Jan Gertheiss WS 07/08 Lösung Aufgabe 9 (a) Lage und Streuung: Arithmetisches Mittel x = n i=
MehrVerteilungen und ihre Darstellungen
Verteilungen und ihre Darstellungen Übung: Stamm-Blatt-Diagramme Wie sind die gekennzeichneten Beobachtungswerte eweils zu lesen? Tragen Sie in beiden Diagrammen den Wert 0.452 an der richtigen Stelle
MehrWillkommen zur Vorlesung Statistik
Willkommen zur Vorlesung Statistik Thema dieser Vorlesung: Häufigkeiten und ihre Verteilung, oder: Zusammenfassende Darstellungen einzelner Variablen Prof. Dr. Wolfgang Ludwig-Mayerhofer Universität Siegen
Mehr3.2 Streuungsmaße. 3 Lage- und Streuungsmaße 133. mittlere Variabilität. geringe Variabilität. große Variabilität 0.0 0.1 0.2 0.3 0.4 0.
Eine Verteilung ist durch die Angabe von einem oder mehreren Mittelwerten nur unzureichend beschrieben. Beispiel: Häufigkeitsverteilungen mit gleicher zentraler Tendenz: geringe Variabilität mittlere Variabilität
MehrLösungen zu Janssen/Laatz, Statistische Datenanalyse mit SPSS 1
LÖSUNG 3A Lösungen zu Janssen/Laatz, Statistische Datenanalyse mit SPSS 1 Mit den Berechnungsfunktionen LG10(?) und SQRT(?) in "Transformieren", "Berechnen" können logarithmierte Werte sowie die Quadratwurzel
MehrHäufigkeitsauszählungen, zentrale statistische Kennwerte und Mittelwertvergleiche
Lehrveranstaltung Empirische Forschung und Politikberatung der Universität Bonn, WS 2007/2008 Häufigkeitsauszählungen, zentrale statistische Kennwerte und Mittelwertvergleiche 30. November 2007 Michael
MehrEinführung in die Statistik für Politikwissenschaftler Sommersemester 2011
Einführung in die Statistik für Politikwissenschaftler Sommersemester 2011 Es können von den Antworten alle, mehrere oder keine Antwort(en) richtig sein. Nur bei einer korrekten Antwort (ohne Auslassungen
MehrÜbungen mit dem Applet Vergleich von zwei Mittelwerten
Vergleich von zwei Mittelwerten 1 Übungen mit dem Applet Vergleich von zwei Mittelwerten 1 Statistischer Hintergrund... 2 1.1 Typische Fragestellungen...2 1.2 Fehler 1. und 2. Art...2 1.3 Kurzbeschreibung
MehrStatistische Tests (Signifikanztests)
Statistische Tests (Signifikanztests) [testing statistical hypothesis] Prüfen und Bewerten von Hypothesen (Annahmen, Vermutungen) über die Verteilungen von Merkmalen in einer Grundgesamtheit (Population)
MehrKapitel 35 Histogramme
Kapitel 35 Histogramme In einem Histogramm können Sie die Häufigkeitsverteilung der Werte einer intervallskalierten Variablen darstellen. Die Werte werden zu Gruppen zusammengefaßt und die Häufigkeiten
MehrTeil II: Einführung in die Statistik
Teil II: Einführung in die Statistik (50 Punkte) Bitte beantworten Sie ALLE Fragen. Es handelt sich um multiple choice Fragen. Sie müssen die exakte Antwortmöglichkeit angeben, um die volle Punktzahl zu
MehrWirtschaftswissenschaftliches Prüfungsamt Bachelor-Prüfung Deskriptive Statistik und Wahrscheinlichkeitsrechnung Wintersemester 2010/11.
Wirtschaftswissenschaftliches Prüfungsamt Bachelor-Prüfung Deskriptive Statistik und Wahrscheinlichkeitsrechnung Wintersemester 2010/11 Namensschild Dr. Martin Becker Hinweise für die Klausurteilnehmer
Mehr1,11 1,12 1,13 1,14 1,15 1,16 1,17 1,17 1,17 1,18
3. Deskriptive Statistik Ziel der deskriptiven (beschreibenden) Statistik (explorativen Datenanalyse) ist die übersichtliche Darstellung der wesentlichen in den erhobenen Daten enthaltene Informationen
MehrEs können keine oder mehrere Antworten richtig sein. Eine Frage ist NUR dann richtig beantwortet, wenn ALLE richtigen Antworten angekreuzt wurden.
Teil III: Statistik Alle Fragen sind zu beantworten. Es können keine oder mehrere Antworten richtig sein. Eine Frage ist NUR dann richtig beantwortet, wenn ALLE richtigen Antworten angekreuzt wurden. Wird
MehrKapitel 1 Beschreibende Statistik
Beispiel 1.25: fiktive Aktienkurse Zeitpunkt i 0 1 2 Aktienkurs x i 100 160 100 Frage: Wie hoch ist die durchschnittliche Wachstumsrate? Dr. Karsten Webel 53 Beispiel 1.25: fiktive Aktienkurse (Fortsetzung)
MehrDemokurs. Modul Grundlagen der Wirtschaftsmathematik Grundlagen der Statistik
Demokurs Modul 31101 Grundlagen der Wirtschaftsmathematik und Statistik Kurs 40601 Grundlagen der Statistik 13. Juli 2010 KE 1 2.4 Schiefe und Wölbung einer Verteilung Seite: 53 2.4 Schiefe und Wölbung
MehrEin- und Zweistichprobentests
(c) Projekt Neue Statistik 2003 - Lernmodul: Ein- Zweistichprobentests Ein- Zweistichprobentests Worum geht es in diesem Modul? Wiederholung: allgemeines Ablaufschema eines Tests Allgemeine Voraussetzungen
MehrUE Angewandte Statistik Termin 4 Gruppenvergleichstests
UE Angewandte Statistik Termin 4 Gruppenvergleichstests Martina Koller Institut für Pflegewissenschaft SoSe 2015 INHALT 1 Allgemeiner Überblick... 1 2 Normalverteilung... 2 2.1 Explorative Datenanalyse...
MehrGraphische Verfahren in der Statistik: Q-Q- und P-P-Plots
Prof. Dr. Dietmar Pfeifer Institut für Mathemati Graphische Verfahren in der Statisti: Q-Q- und P-P-Plots Bei den üblichen parametrischen Testverfahren in der Statisti wird in der Regel eine Annahme über
MehrBrückenkurs Statistik für Wirtschaftswissenschaften
Peter von der Lippe Brückenkurs Statistik für Wirtschaftswissenschaften Weitere Übungsfragen UVK Verlagsgesellschaft mbh Konstanz Mit UVK/Lucius München UVK Verlagsgesellschaft mbh Konstanz und München
MehrKapitel 2. Häufigkeitsverteilungen
6 Kapitel 2 Häufigkeitsverteilungen Ziel: Darstellung bzw Beschreibung (Exploration) einer Variablen Ausgangssituation: An n Einheiten ω,, ω n sei das Merkmal X beobachtet worden x = X(ω ),, x n = X(ω
MehrVerteilungsanalyse. Johannes Hain. Lehrstuhl für Mathematik VIII Statistik 1/35
Verteilungsanalyse Johannes Hain Lehrstuhl für Mathematik VIII Statistik 1/35 Datentypen Als Sammeln von Daten bezeichnet man in der Statistik das Aufzeichnen von Fakten. Erhobene Daten klassifziert man
MehrMathematische und statistische Methoden I
Prof. Dr. G. Meinhardt Methodenlehre Mathematische und statistische Methoden I Sprechstunde jederzeit nach Vereinbarung und nach der Vorlesung Wallstr. 3, 6. Stock, Raum 06-206 Dr. Malte Persike persike@uni-mainz.de
Mehr1.8 Kolmogorov-Smirnov-Test auf Normalverteilung
1.8 Kolmogorov-Smirnov-Test auf Normalverteilung Der Kolmogorov-Smirnov-Test ist einer der klassischen Tests zum Überprüfen von Verteilungsvoraussetzungen. Der Test vergleicht die Abweichungen der empirischen
MehrHydrologie und Flussgebietsmanagement
Hydrologie und Flussgebietsmanagement o.univ.prof. DI Dr. H.P. Nachtnebel Institut für Wasserwirtschaft, Hydrologie und konstruktiver Wasserbau Gliederung der Vorlesung Statistische Grundlagen Etremwertstatistik
MehrDeskriptive Statistik
Fakultät für Humanwissenschaften Sozialwissenschaftliche Methodenlehre Prof. Dr. Daniel Lois Deskriptive Statistik Stand: April 2015 (V2) Inhaltsverzeichnis 1. Notation 2 2. Messniveau 3 3. Häufigkeitsverteilungen
MehrParametrische vs. Non-Parametrische Testverfahren
Parametrische vs. Non-Parametrische Testverfahren Parametrische Verfahren haben die Besonderheit, dass sie auf Annahmen zur Verteilung der Messwerte in der Population beruhen: die Messwerte sollten einer
MehrPrüfung & Tutorium. Der 1. Prüfungstermin findet am 27. Juni 2011 um 10h im Audimaxstatt. Anmeldung in UNIVIS vom Juni
Prüfung & Tutorium Der 1. Prüfungstermin findet am 27. Juni 2011 um 10h im Audimaxstatt Anmeldung in UNIVIS vom 14.-22. Juni Die Prüfung wird aus 30 Multiple Choice Fragen(5 Antwortalternativen, 1-3 Richtige)
MehrStatistik I für Betriebswirte Vorlesung 14
Statistik I für Betriebswirte Vorlesung 14 Dr. Andreas Wünsche TU Bergakademie Freiberg Institut für Stochastik 13. Juli 017 Dr. Andreas Wünsche Statistik I für Betriebswirte Vorlesung 14 Version: 8. Juli
MehrWillkommen zur Vorlesung Statistik
Willkommen zur Vorlesung Statistik Thema dieser Vorlesung: Maßzahlen für zentrale Tendenz, Streuung und andere Eigenschaften von Verteilungen Prof. Dr. Wolfgang Ludwig-Mayerhofer Universität Siegen Philosophische
MehrDeskriptive Statistik
Deskriptive Statistik [descriptive statistics] Ziel der deskriptiven (beschreibenden) Statistik einschließlich der explorativen Datenanalyse [exploratory data analysis] ist zunächst die übersichtliche
MehrChi-Quadrat Verfahren
Chi-Quadrat Verfahren Chi-Quadrat Verfahren werden bei nominalskalierten Daten verwendet. Die einzige Information, die wir bei Nominalskalenniveau zur Verfügung haben, sind Häufigkeiten. Die Quintessenz
MehrSkript 6 Häufigkeiten und Deskriptive Statistiken einer Variablen
Skript 6 Häufigkeiten und Deskriptive Statistiken einer Variablen Ziel: Charakterisierung der Verteilung einer Variablen. Je nach Variablentyp geschieht dies durch Häufigkeitsauszählung und Modus (Nominale
MehrGrafische Darstellungen. Box-and-Whiskers-Plot (Boxplot) Grafische Darstellungen. Grafische Darstellungen
Box-and-Whiskers-Plot (Boxplot) der Boxplot vereinigt bekannte deskriptive Kenngrößen zu einer grafischen Darstellung Box x 0.5, Median, x 0.75 vertikale Linien x 0.5 -.5 IQR x 0.75 +.5 IQR Extremwerte
MehrHypothesen: Fehler 1. und 2. Art, Power eines statistischen Tests
ue biostatistik: hypothesen, fehler 1. und. art, power 1/8 h. lettner / physik Hypothesen: Fehler 1. und. Art, Power eines statistischen Tests Die äußerst wichtige Tabelle über die Zusammenhänge zwischen
MehrStatistik II: Grundlagen und Definitionen der Statistik
Medien Institut : Grundlagen und Definitionen der Statistik Dr. Andreas Vlašić Medien Institut (0621) 52 67 44 vlasic@medien-institut.de Gliederung 1. Hintergrund: Entstehung der Statistik 2. Grundlagen
MehrDeskriptive Statistik & grafische Darstellung
Deskriptive Statistik & grafische Darstellung Sven Garbade Fakultät für Angewandte Psychologie SRH Hochschule Heidelberg sven.garbade@hochschule-heidelberg.de Statistik 1 S. Garbade (SRH Heidelberg) Deskriptive
MehrPrüfung aus Statistik 1 für SoziologInnen- Gruppe A
Prüfung aus Statistik 1 für SoziologInnen- Gruppe A 26. Juni 2012 Gesamtpunktezahl =80 Prüfungsdauer: 2 Stunden 1) Wissenstest (maximal 20 Punkte) Lösungen Kreuzen ( ) Sie die jeweils richtige Antwort
MehrMarcus Hudec. Statistik 2 für SoziologInnen. Normalverteilung. Univ.Prof. Dr. Marcus Hudec. Statistik 2 für SoziologInnen 1 Normalverteilung
Statistik 2 für SoziologInnen Normalverteilung Univ.Prof. Dr. Marcus Hudec Statistik 2 für SoziologInnen 1 Normalverteilung Inhalte Themen dieses Kapitels sind: Das Konzept stetiger Zufallsvariablen Die
MehrVorlesungsskript. Deskriptive Statistik. Prof. Dr. Günter Hellmig
Vorlesungsskript Deskriptive Statistik Prof. Dr. Günter Hellmig Prof. Dr. Günter Hellmig Vorlesungsskript Deskriptive Statistik Erstes Kapitel Die Feingliederung des ersten Kapitels, welches sich mit einigen
MehrBachelor BEE Statistik Übung: Blatt 1 Ostfalia - Hochschule für angewandte Wissenschaften Fakultät Versorgungstechnik Aufgabe (1.1): Gegeben sei die folgende Messreihe: Nr. ph-werte 1-10 6.4 6.3 6.7 6.5
MehrBeide Verteilungen der Zeiten sind leicht schief. Der Quartilsabstand für Zeiten zum Surfen ist kleiner als der zum Fernsehen.
Welche der folgenden Maßzahlen sind resistent gegenüber Ausreißer? Der Mittelwert und die Standardabweichung. Der und die Standardabweichung. Der und die Spannweite. Der und der Quartilsabstand. Die Spannweite
MehrKorrelation, Regression und Signifikanz
Professur Forschungsmethodik und Evaluation in der Psychologie Übung Methodenlehre I, und Daten einlesen in SPSS Datei Textdaten lesen... https://d3njjcbhbojbot.cloudfront.net/api/utilities/v1/imageproxy/https://d15cw65ipcts
Mehr5. Spezielle stetige Verteilungen
5. Spezielle stetige Verteilungen 5.1 Stetige Gleichverteilung Eine Zufallsvariable X folgt einer stetigen Gleichverteilung mit den Parametern a und b, wenn für die Dichtefunktion von X gilt: f x = 1 für
MehrDeskriptive Statistik Kapitel VI - Lage- und Streuungsparameter
Deskriptive Statistik Kapitel VI - Lage- und Streuungsparameter Georg Bol bol@statistik.uni-karlsruhe.de Markus Höchstötter, hoechstoetter@statistik.uni-karlsruhe.de Agenda 1. Ziele 2. Lageparameter 3.
MehrKlassifikation von Signifikanztests
Klassifikation von Signifikanztests nach Verteilungsannahmen: verteilungsabhängige = parametrische Tests verteilungsunabhängige = nichtparametrische Tests Bei parametrischen Tests werden im Modell Voraussetzungen
MehrInhaltsverzeichnis. Inhalt Teil I: Beschreibende (Deskriptive) Statistik Seite. 1.0 Erste Begriffsbildungen Merkmale und Skalen 5
Inhaltsverzeichnis Inhalt Teil I: Beschreibende (Deskriptive) Statistik Seite 1.0 Erste Begriffsbildungen 1 1.1 Merkmale und Skalen 5 1.2 Von der Urliste zu Häufigkeitsverteilungen 9 1.2.0 Erste Ordnung
Mehr13,86. Schritt 4: Berechnung des Quartilsabstandes. Unteres Quartil! #5,5.
Lösung Aufgabe A1 Detaillierter Lösungsweg: Schritt 1: Prüfung, ob die gegebene Messreihe sortiert ist, In diesem Beispiel ist dies der Fall und wir haben insgesamt 22 Messungen. Schritt 2: Berechnen des
MehrVorlesung Wirtschaftsstatistik 2 (FK ) Wiederholungen deskriptive Statistik und Einleitung Normalverteilungsverfahren. Dipl.-Ing.
Vorlesung Wirtschaftsstatistik 2 (FK 040637) Wiederholungen deskriptive Statistik und Einleitung Normalverteilungsverfahren Dipl.-Ing. Robin Ristl Wintersemester 2012/13 1 Vorlesungsinhalte Wiederholung:
MehrMathematik IV für Maschinenbau und Informatik (Stochastik) Universität Rostock, Institut für Mathematik Sommersemester 2007
Mathematik IV für Maschinenbau und Informatik Stochastik Universität Rostock, Institut für Mathematik Sommersemester 007 Prof. Dr. F. Liese Dipl.-Math. M. Helwich Serie Termin: 9. Juni 007 Aufgabe 3 Punkte
Mehr2. Deskriptive Statistik 2.1. Häufigkeitstabellen, Histogramme, empirische Verteilungsfunktionen
4. Datenanalyse und Modellbildung Deskriptive Statistik 2-1 2. Deskriptive Statistik 2.1. Häufigkeitstabellen, Histogramme, empirische Verteilungsfunktionen Für die Auswertung einer Messreihe, die in Form
Mehr2. Beschreibung von eindimensionalen (univariaten) Stichproben
1 2. Beschreibung von eindimensionalen (univariaten) Stichproben Bei eindimensionalen (univariaten) Daten wird nur ein Merkmal untersucht. Der Fall von zwei- oder mehrdimensionalen Daten wird im nächsten
MehrMathematische Statistik. Zur Notation
Mathematische Statistik dient dazu, anhand von Stichproben Informationen zu gewinnen. Während die Wahrscheinlichkeitsrechnung Prognosen über das Eintreten zufälliger (zukünftiger) Ereignisse macht, werden
MehrWISTA WIRTSCHAFTSSTATISTIK
WISTA WIRTSCHAFTSSTATISTIK PROF DR ROLF HÜPEN FAKULTÄT FÜR WIRTSCHAFTSWISSENSCHAFT Seminar für Theoretische Wirtschaftslehre Vorlesungsprogramm 23042013 Datenlagen und Darstellung eindimensionaler Häufigkeitsverteilungen
Mehr