Deskriptive Statistik & grafische Darstellung

Größe: px
Ab Seite anzeigen:

Download "Deskriptive Statistik & grafische Darstellung"

Transkript

1 Deskriptive Statistik & grafische Darstellung Sven Garbade Fakultät für Angewandte Psychologie SRH Hochschule Heidelberg Statistik 1 S. Garbade (SRH Heidelberg) Deskriptive Statistik Statistik 1 1 / 62

2 Teil I Deskriptive Statistik S. Garbade (SRH Heidelberg) Deskriptive Statistik Statistik 1 2 / 62

3 Agenda Deskriptive Statistik Verteilung Maße der zentralen Tendenz Definition Modalwert Arithmetisches Mittel Gewichtetes arithmetisches Mittel Median Vergleich Median - Mittelwert Vergleich der Maße der zentralen Tendenz Dispersionsmaße: Maße der Variabilität Definition Übersicht von Dispersionsmaßen Minimum, Maximum, Variationsbreite Quantile S. Garbade (SRH Heidelberg) Deskriptive Statistik Statistik 1 3 / 62

4 Agenda (Forts. 2) Varianz Standardabweichung Zusammenfassung Übung S. Garbade (SRH Heidelberg) Deskriptive Statistik Statistik 1 4 / 62

5 Deskriptive Statistik Deskriptive Statistik Deskriptive Statistik bedeutet beschreibende Statistik. Dient dazu, mit möglichst wenigen Kennwerten möglichst viel Informationen darzustellen. Typische Kennwerte der deskriptiven Statistik sind: Minimum & Maximum, Spannweite (Range). Anzahl der Messwerte / Probanden. Maße der zentralen Tendenz: Arithmetisches Mittel (Mittelwert), Median, Modalwert. Dispersionsmaße (Streuungsmaße, z B. Varianz, Standardabweichung). Abbildungen, z. B. Boxplots, Histogramme, siehe Teil 2. S. Garbade (SRH Heidelberg) Deskriptive Statistik Statistik 1 5 / 62

6 Deskriptive Statistik Verteilung Verteilung Unter einer Verteilung einer Variablen versteht man eine Beschreibung der Häufigkeiten der einzelnen Messwerte. Beispiel: Wir erheben das Alter in Jahren aller Kursteilnehmer. Wir zählen aus, wie oft jedes Alter vorkommt. Die Häufigkeiten können auf verschiedene Arten dargestellt werden, weshalb es verschiedene Typen einer Verteilung gibt. Dazu in einer folgenden Veranstaltung mehr. Es existieren viele Verteilungen, die in der Statistik und Psychologie dazu genutzt werden, Variablen und Messwerte zu beschreiben und Kennwerte zu bestimmen. S. Garbade (SRH Heidelberg) Deskriptive Statistik Statistik 1 6 / 62

7 Maße der zentralen Tendenz Definition Maße der zentralen Tendenz Definition Maße der zentralen Tendenz fragen, durch welchen Wert die gesamte Verteilung, d. h. alle Zahlen, am besten repräsentiert wird. S. Garbade (SRH Heidelberg) Deskriptive Statistik Statistik 1 7 / 62

8 Maße der zentralen Tendenz Definition Beispieldatensatz Bewerber Alter in Jahren S. Garbade (SRH Heidelberg) Deskriptive Statistik Statistik 1 8 / 62

9 Maße der zentralen Tendenz Modalwert Modalwert Modalwert Der Modalwert, auch Modus genannt, ist der am häufigsten auftretende Wert einer Variablen. Beispiel: Alter der Bewerber = 24, 27, 25, 39, 28, 25. Das Alter 25 kommt zweimal vor, der Modalwert ist damit 25. Der Modus ist nicht notwendigerweise eindeutig bestimmbar. Üblicherweise spricht man nur bei solchen Verteilungen von einem Modalwert, die ein einzelnes Maximum besitzen. S. Garbade (SRH Heidelberg) Deskriptive Statistik Statistik 1 9 / 62

10 Maße der zentralen Tendenz Arithmetisches Mittel Arithmetisches Mittel Arithmetisches Mittel Das arithmetische Mittel, oder kurz Mittelwert, entspricht der Summe aller Messwerte x dividiert durch die Anzahl n der Messwerte: Mw = x = x 1 + x x n n n i=1 = x i n x hat die Eigenschaft, dass die quadrierten Abweichen (x i x) minimiert sind. (1) S. Garbade (SRH Heidelberg) Deskriptive Statistik Statistik 1 10 / 62

11 Maße der zentralen Tendenz Arithmetisches Mittel Rechenbeispiel zum Mittelwert Daten: 24, 27, 25, 39, 28, 25 Anzahl der Messwerte: n = 6, damit: n=6 i=1 x i n = = = 28 S. Garbade (SRH Heidelberg) Deskriptive Statistik Statistik 1 11 / 62

12 Maße der zentralen Tendenz Gewichtetes arithmetisches Mittel Gewichtetes arithmetisches Mittel Soll der Mittelwert von verschieden Mittelwerten mit unterschiedlicher Gruppengröße n berechnet werden, muss auf das gewogene arithmetische Mittel oder gewichtete arithmetische Mittel, GAM zugegriffen werden. Hierbei werden die einzelnen Mittelwerte anhand ihrer Stichprobengröße n gewichtet und durch die Summe aller n i dividiert. Gewichtetes arithmetisches Mittel Das gewichtete arithmetische Mittel GAM berechnet sich als GAM = n i=1 x i n i n i=1 n i (2) S. Garbade (SRH Heidelberg) Deskriptive Statistik Statistik 1 12 / 62

13 Maße der zentralen Tendenz Gewichtetes arithmetisches Mittel Rechenbeispiel GAM Das mittlere Körpergewicht in kg von 4 Gruppen beträgt: Gruppe Gewicht in kg Gruppengröße n Das GAM berechnet sich damit zu n i=1 GAM = i n i n i=1 n i = = = 73.5 Das gewichtete arithmetische Mittel für die 4 Gruppen beträgt damit 73.5 kg. S. Garbade (SRH Heidelberg) Deskriptive Statistik Statistik 1 13 / 62

14 Maße der zentralen Tendenz Median Median Median Der Median teilt eine sortierte Liste an Werten so, dass rechts und links des Medians jeweils gleich viele Werte liegen. Für eine aufsteigend sortierte Anzahl von n Messwerten gilt: Md = x = { n ungerade: n geradzahlig: Messwert an der Stelle x (n+1)/2 x n/2 +x (n/2)+1 2 (3) S. Garbade (SRH Heidelberg) Deskriptive Statistik Statistik 1 14 / 62

15 Maße der zentralen Tendenz Median Rechenbeispiel zum Median unsortierte Daten: 24, 27, 25, 39, 28, 25. sortierte Daten: 24, 25, 25, 27, 28, 39. n = 6 damit finden wir folgende Stellen: Stelle 1: n/2 = 6/2 = 3 Stelle 2: n/2 + 1 = 6/2 + 1 = 4 Damit Mittelwert des 3. und des 4. Messwerts der sortierten Liste berechnen: Md = ( )/2 = 26. Kommt ein weiterer Bewerber mit Alter 42 hinzu, ergibt sich: n = 7, damit Regel (n + 1)/2 = (7 + 1)/2 = 4, also Messwert an der Stelle 4 der sortierten Liste: x = 27. S. Garbade (SRH Heidelberg) Deskriptive Statistik Statistik 1 15 / 62

16 Maße der zentralen Tendenz Vergleich Median - Mittelwert Vergleich Median - Mittelwert Ein theoretisches Beispiel: Daten: 24, 25, 25, 27, 28, 39; Md = 26, Mw = 28. Nun wird der Messreihe hinzugefügt. Der Median lautet damit: Die sortierte Liste hat ein ungerades n = 7, also Md = (n + 1)/2 = 8/2 = 4, damit 4ter Messwert: 27. Hier ist es also egal, wie groß der Messwert ist, der der sortierten Liste hinzugeführt wird. Der Mittelwert berechnet sich nun: = = Der Mittelwert nimmt den Wert Unendlich an! Fazit: Der Mittelwert ist gegenüber dem Median deutlich anfälliger für besonders extreme Messwerte, so genannte Ausreißer. S. Garbade (SRH Heidelberg) Deskriptive Statistik Statistik 1 16 / 62

17 Maße der zentralen Tendenz Vergleich der Maße der zentralen Tendenz Vergleich der Maße der zentralen Tendenz Kennwert Vorteile Nachteile Niveau Mittelwert Median Modalwert ist bekannt; Verwendung auch im Alltag (Durchschnitt) durch Extremwerte kaum beeinflussbar ist immer auch ein existierender Wert kann ein nichtexistierender Wert sein; stark durch Extremwerte beeinflussbar nutzt nur Ranginformationen unter Umständen nicht eindeutig bestimmbar (z.b. wenn mehrere Werte gleich häufig auftauchen) nur sinnvoll bei mindestens intervallskalierten, normalverteilten Variablen mind. Ordinalskalen Nominalskalen S. Garbade (SRH Heidelberg) Deskriptive Statistik Statistik 1 17 / 62

18 Dispersionsmaße: Maße der Variabilität Definition Dispersionsmaße: Maße der Variabilität Definition Maße der Streuung (Dispersion) informieren über die Unterschiedlichkeit der Werte. S. Garbade (SRH Heidelberg) Deskriptive Statistik Statistik 1 18 / 62

19 Dispersionsmaße: Maße der Variabilität Übersicht von Dispersionsmaßen Übersicht von Dispersionsmaßen Minimum, Maximum Variationsbreite bzw. Range: Differenz zwischen Minimum und Maximum. Interquartilbereiche: Die sortierte Werteliste wird in 4 Bereiche geteilt, die jeweils 25% der Werte enthalten. Varianz: Durchschnittliche quadratische Abweichungen. Standardabweichung: Quadratwurzel aus der Varianz. S. Garbade (SRH Heidelberg) Deskriptive Statistik Statistik 1 19 / 62

20 Dispersionsmaße: Maße der Variabilität Minimum, Maximum, Variationsbreite Minimum, Maximum, Variationsbreite unsortierte Messwerte: 24, 25, 39, 19, 27, 28, 29, 25. sortierte Messwerte: 19, 24, 25, 25, 27, 28, 29, 39. Minimum: 19, Maximum: 39. Variationsbreite: = 20. S. Garbade (SRH Heidelberg) Deskriptive Statistik Statistik 1 20 / 62

21 Dispersionsmaße: Maße der Variabilität Quantile Quantile Ein Quantil ist ein Wert, unter dem ein bestimmter Prozentsatz an Messwerten liegt. Beispiel Median: Dieser entspricht dem 50% Quantil: 50% der Messwerte sind kleiner als der Median, die verbleibenden 50% sind damit größer. Ein verbreitetes Lagemaß sind Interquartilbereiche (oder auch Quartile), die eine sortierte Werteliste in vier gleiche größe Teile unterteilen, also jeweils 25%. S. Garbade (SRH Heidelberg) Deskriptive Statistik Statistik 1 21 / 62

22 Dispersionsmaße: Maße der Variabilität Quantile Beispiel: Punkte in Statistikklausur Es liegen die Punkte (0 bis 60) von 30 Studierenden vor. Die Werte in sortierter Reihenfolge: Sie haben 47 Punkte erreicht. Entspricht Ihre Leistung den der oberen 25%? Zuerst muss der Median bestimmt werden: Mittel zwischen 15ten und 16ten-Wert: ( )/2 = 36. Äquivalent wird der Median der ersten und zweiten 15 Messwerte bestimmt: Die Interquartilbereiche sind damit: 0% = 25, 25% = 30, 50% = 36, 75% = 45, 100% = 59 Damit gehören Sie zu den 25% der Besten. S. Garbade (SRH Heidelberg) Deskriptive Statistik Statistik 1 22 / 62

23 Dispersionsmaße: Maße der Variabilität Quantile Perzentile Als Perzentile werden 10% Bereiche bezeichnet. Beispiel: Sie vergleichen die durchschnittlichen Punktezahlen von Statistikklausuren über verschiedene Studiengänge in Baden-Württemberg. Sortieren Sie die Punkte aus 20 Fakultäten aufsteigend: In welchem Perzentil liegt der Punktewert 48? Dazu wird bestimmt, wieviele Werte kleiner oder gleich 48 sind: Damit sind 16 Messerte 48. Prozentsatz 16 von 20 bestimmen: = 0.8. Damit liegt der Punktewert 48 im 80% Perzentil, 20% haben mehr Punkte erzielt. S. Garbade (SRH Heidelberg) Deskriptive Statistik Statistik 1 23 / 62

24 Dispersionsmaße: Maße der Variabilität Quantile Weitere Quantile Es lassen sich beliebige weitere Quantile berechnen, z. B. in 1% oder 15% Schritten. Die grundlegende Idee der Quantile ist einfach, die Algorithmen aber teilweise sehr komplex (vgl. Hyndman und Fan, 1996). Typischerweise unterschieden sich die Algorithmen darin, wie ein Quantil zwischen zwei Werten approximiert wird. S. Garbade (SRH Heidelberg) Deskriptive Statistik Statistik 1 24 / 62

25 Dispersionsmaße: Maße der Variabilität Quantile Weitere Beispiele N = 148, Min - Max: und Interquartilbereiche: 15% Quantile: 0% 25% 50% 75% 100% % 15% 30% 45% 60% 75% 90% S. Garbade (SRH Heidelberg) Deskriptive Statistik Statistik 1 25 / 62

26 Dispersionsmaße: Maße der Variabilität Varianz Varianz Varianz Die Summe der quadrierten Abweichungen aller Messwerte x i vom Mittelwert x dividiert durch die Anzahl der Messwerte - 1 (n 1) bezeichnet man als Varianz s 2 : s 2 = n i=1 (x i x) 2 n 1 = n i=1 x i 2 ( n i=1 x i) 2 n n 1 (4) Der Zähler n i=1 (x i x) 2 bzw. n i=1 x 1 2 ( n i=1 x i) 2 n Quadratsumme oder QS bezeichnet. wird auch als S. Garbade (SRH Heidelberg) Deskriptive Statistik Statistik 1 26 / 62

27 Dispersionsmaße: Maße der Variabilität Varianz Berechnung über s 2 = 1 n 1 n i=1 (x i x) 2 Alter in Jahren von 6 Probanden: 24, 27, 25, 39, 28, 25. Berechnung des Mittelwerts: x Alter = 1 n n i=1 x i = 1 ( ) 6 = = 28 S. Garbade (SRH Heidelberg) Deskriptive Statistik Statistik 1 27 / 62

28 Dispersionsmaße: Maße der Variabilität Varianz Berechnung über s 2 = 1 n 1 n i=1 (x i x) 2 (Forts. 2) Konstruktion einer Hilfstabelle: Nr. Alter x i 28 (x i 28) S. Garbade (SRH Heidelberg) Deskriptive Statistik Statistik 1 28 / 62

29 Dispersionsmaße: Maße der Variabilität Varianz Berechnung über s 2 = 1 n 1 n i=1 (x i x) 2 (Forts. 3) Damit: s 2 = 1 n 1 = = 31.2 n (x i x) 2 i=1 Die Varianz des Alters s 2 Alter lautet damit S. Garbade (SRH Heidelberg) Deskriptive Statistik Statistik 1 29 / 62

30 Dispersionsmaße: Maße der Variabilität Berechnung durch 1 n 1 ( n i=1 x i 2 Varianz ( n i=1 x i) 2 n ) Hilfstabelle: Nr. Alter xi S. Garbade (SRH Heidelberg) Deskriptive Statistik Statistik 1 30 / 62

31 Dispersionsmaße: Maße der Variabilität Berechnung durch 1 n 1 ( n i=1 x i 2 Varianz ( n i=1 x i) 2 n ) (Forts. 2) Einsetzen: ( n salter 2 = 1 n 1 = i=1 x 2 i ( ) ( n i=1 x i) 2 n ) = = 31.2 Die Varianz beträgt damit S. Garbade (SRH Heidelberg) Deskriptive Statistik Statistik 1 31 / 62

32 Dispersionsmaße: Maße der Variabilität Varianz Eigenschaften der Varianz Die Quadrierung der Abweichungen der Messwerte vom Mittelwert führt zu folgenden Eigenschaften der Varianz: Die Differenzen können sich nicht zu Null aufaddieren. Größere Abweichungen vom Mittelwert werden stärker gewichtet. Die Maßeinheit quadriert sich auch, in unserem Beispiel (Alter in Jahren) 2. S. Garbade (SRH Heidelberg) Deskriptive Statistik Statistik 1 32 / 62

33 Dispersionsmaße: Maße der Variabilität Varianz Stichproben- und Populationsvarianz Die besprochene Varianz s 2 = 1 n 1 n i=1 (x i x) 2 heißt Stichprobenoder auch korrigierte Varianz. Es gibt auch die Populationsvarianz bzw. unkorrigierte Varianz: s 2 = 1 n n i=1 (x i x) 2, bei der im Nenner die Anzahl an Beobachtungen steht. Es gilt daher Stichprobenvarianz > Populationsvarianz. Die Herleitung der Stichprobenvarianz mit Nenner n 1 ist etwas aufwendig, Interessierte können dies im Bortz und Schuster (2010, S. 530) nachlesen. Statistikprogramme verwenden die Stichprobenvarianz. S. Garbade (SRH Heidelberg) Deskriptive Statistik Statistik 1 33 / 62

34 Dispersionsmaße: Maße der Variabilität Standardabweichung Standardabweichung Standardabweichung Die Standardabweichung ist definiert als die Quadratwurzel aus der Varianz: s = n s 2 i=1 = (x i x) 2 n 1 Durch die Ziehung der Wurzel wird die ursprüngliche Maßeinheit wieder erlangt. Die Standardabweichung wird auch als Streuung bezeichnet. Unser Beispiel: s 2 = 31.2, damit ist s = 31.2 = S. Garbade (SRH Heidelberg) Deskriptive Statistik Statistik 1 34 / 62

35 Zusammenfassung Zusammenfassung Maße der zentralen Tendenz fragen, durch welchen Wert die gesamte Verteilung am besten repräsentiert wird. Dispersionsmaße beschreiben die Unterschiedlichkeit der Messwerte. Typischerweise werden beide Maße gemeinsam angegeben: Mittelwert und Standardabweichung Median und Interquartilbereiche Zusätzlich werden (fast immer) das Minimum und Maximum angegeben. Es gibt weitere Maße der zentralen Tendenz und der Variation. Diese spielen für den Bachelor Psychologie eine untergeordnete Rolle. S. Garbade (SRH Heidelberg) Deskriptive Statistik Statistik 1 35 / 62

36 Zusammenfassung Beispiele für eine Stichprobenbeschreibung An der Befragung zum Thema Verärgerung haben 861 Personen teilgenommen. Das Durchschnittsalter beträgt Mw=22 Jahre (Std-Abw=3.05). Die jüngste Person war 19 Jahre alt, die älteste 44 Jahre. Oder: Der Median des Alters lag bei 21 Jahren, die Interquartile liegen bei 20 (25%) und 23 (75%) Jahren. S. Garbade (SRH Heidelberg) Deskriptive Statistik Statistik 1 36 / 62

37 Übung Übung Eine befreundete Psychologin erzählt Ihnen, dass sie den Eindruck hat, die Unfallhäufigkeit in einer bestimmten Produktionsstraße des Betriebes, in dem sie arbeitet (Automobilzulieferer), sei irgendwie zu hoch. Die Firma, in der Sie arbeiten, produziert etwas ganz ähnliches und die Anlagen sind durchaus vergleichbar. Sie bieten daher Ihrer Kollegin an, die Unfallzahlen der beiden Produktionsstraßen einmal miteinander zu vergleichen. S. Garbade (SRH Heidelberg) Deskriptive Statistik Statistik 1 37 / 62

38 Übung Daten zur Übung Produktionsstraße Ihre Kollegin Nr. Unfallhäufigkeit Alter Unfallhäufigkeit Alter S. Garbade (SRH Heidelberg) Deskriptive Statistik Statistik 1 38 / 62

39 Teil II Grafische Darstellung S. Garbade (SRH Heidelberg) Deskriptive Statistik Statistik 1 39 / 62

40 Grafische Darstellung Häufigkeitstabelle Beispiel Reaktionszeit Histogramme Boxplot Balkendiagramm Kreisdiagramm S. Garbade (SRH Heidelberg) Deskriptive Statistik Statistik 1 40 / 62

41 Grafische Darstellung Grafische Darstellung Die grafische Aufbereitung von Daten ist ein wichtiger Bestandteil der statistischen Analyse: Einen Effekt, denn man nicht sehen kann, gibt es nicht. Die grafische Darstellung erlaubt einen explorativen Einblick in die Daten. Durch Grafiken werden oft komplexe Zusammenhänge erst verständlich. Es gibt eine Vielzahl von grafischen Möglichkeiten, je nach verwendetem Programm. S. Garbade (SRH Heidelberg) Deskriptive Statistik Statistik 1 41 / 62

42 Häufigkeitstabelle Häufigkeitstabelle In einer Häufigkeitstabelle wird angegeben, wie oft jeder Messwert vorkommt. Beispiel: Anzahl erreichter Punkte: Häufigkeit (f ): Bei komplexeren Datensätzen (z. B. Gleitkommazahlen, große Variationsbreite) ist eine einfache Häufigkeitstabelle unübersichtlich. In diesem Fall werden Intervalle gebildet werden, in denen die Messwerte einsortiert werden. Für jedes Intervall wird dann gezählt, wieviele Messwerte in diesem Intervall liegen. S. Garbade (SRH Heidelberg) Deskriptive Statistik Statistik 1 42 / 62

43 Beispiel Reaktionszeit Beispiel Reaktionszeit Durch die folgenden Folien wird uns folgender Datensatz begleiten: Lösen eines Puzzle am Computer, gemessen wurde die Bearbeitungszeit in Sekunden. Messgenauigkeit im Millisekundenbereich. Männer: N = 100, Frauen: N = 100. Deskriptive Kennwerte des Bearbeitungszeit in Sekunden: Mittelwert Streuung Männer Frauen Gesamt Variationsbreite: = 39. S. Garbade (SRH Heidelberg) Deskriptive Statistik Statistik 1 43 / 62

44 Beispiel Reaktionszeit Konstruktion von Intervallen Für die Konstruktion von Intervallen gibt es viele Möglichkeiten. Die Intervalle sollten gleich breit sein (Ausnahmen z. B. Logarithmus-verteilte Variablen o. ä.). Faustregel nach Sturges (1926): Für ein Anzahl von n Messwerten werden m Kategorien nach der Beziehung m log 10 n gebildet. S. Garbade (SRH Heidelberg) Deskriptive Statistik Statistik 1 44 / 62

45 Beispiel Reaktionszeit Anwendung auf das Beispiel n = 200, damit m log Variationsbreite: 39. Kategorienbreite: 39/ Damit könnte man eine Intervallbreite von 4.5 Sekunden in Erwägung ziehen. Aber: Es gibt weitere Möglichkeiten, Kategoriengrenzen zu definieren. Dadurch verändert sich natürlich die Häufigkeitstabelle. S. Garbade (SRH Heidelberg) Deskriptive Statistik Statistik 1 45 / 62

46 Beispiel Reaktionszeit Resultierende Häufigkeitstabelle Kategorie f f kum % % kum [16.5,21] (21,25.5] (25.5,30] (30,34.5] (34.5,39] (39,43.5] (43.5,48] (48,52.5] (52.5,57] ( = nicht eingeschlossen, [ ] = eingeschlossen, kum = kumuliert S. Garbade (SRH Heidelberg) Deskriptive Statistik Statistik 1 46 / 62

47 Histogramme Histogramm Ein Histogramm ist eine Visualisierung einer Häufigkeitstabelle. Mit einem Histogramm kann man die Verteilung einer Variablen grafisch darstellen. S. Garbade (SRH Heidelberg) Deskriptive Statistik Statistik 1 47 / 62

48 Histogramme Histogramm Puzzle-Daten Histogramm Frequency Zeit in Sekunden S. Garbade (SRH Heidelberg) Deskriptive Statistik Statistik 1 48 / 62

49 Histogramme Histogramm Puzzle-Daten gruppiert nach Geschlecht Frauen Männer 20 Häufigkeit [%] Zeit [s] S. Garbade (SRH Heidelberg) Deskriptive Statistik Statistik 1 49 / 62

50 Histogramme Sturges vs. Freedman-Diaconis Histogramm des Alters in Jahren, N = 100 Min/Max: {0, 17} Jahre Histogramm des Alters in Jahren, N = 100 Min/Max: {0, 17} Jahre Absolute Häufigkeit Absolute Häufigkeit Alter in Jahren Methode nach Sturges Alter in Jahren Methode nach Freedman Diaconis S. Garbade (SRH Heidelberg) Deskriptive Statistik Statistik 1 50 / 62

51 Histogramme Verteilungsformen Abbildung aus Bortz und Schuster (2010, S. 42) S. Garbade (SRH Heidelberg) Deskriptive Statistik Statistik 1 51 / 62

52 Boxplot Darstellung von zentraler Tendenz & Variation Sollen Maße der zentralen Tendenz und der Variation gleichzeitig angezeigt werden, sind Boxplots eine der besten Alternativen. Boxplots wurden von Tukey im Jahr 1977 erstmals vorgestellt und erlauben die Einsicht in wichtige Verteilungsmerkmale wie Median und Interquartilabstand. In einem Boxplot kann man Ausreißer, also extreme Messwerte, sehr leicht identifizieren. S. Garbade (SRH Heidelberg) Deskriptive Statistik Statistik 1 52 / 62

53 Boxplot Kennzahlen im Boxplot IQR Ausreisser maximal 1.5 x IQR 75% Quantil Median 25% Quantil maximal 1.5 x IQR IQR: Interquartilabstand S. Garbade (SRH Heidelberg) Deskriptive Statistik Statistik 1 53 / 62

54 Boxplot Boxplot der Bearbeitungszeit Boxplot der Bearbeitungszeiten Bearbeitungszeit in Sekunden S. Garbade (SRH Heidelberg) Deskriptive Statistik Statistik 1 54 / 62

55 Boxplot Bearbeitungszeit gruppiert nach Geschlecht Bearbeitungszeit in Sekunden Frauen Männer S. Garbade (SRH Heidelberg) Deskriptive Statistik Statistik 1 55 / 62

56 Balkendiagramm Balkendiagramm In einem Balkendiagramm werden Kennwerte durch Balken repräsentiert. Die Höhe des Balkens gibt Auskunft über die Größe des Kennwerts. S. Garbade (SRH Heidelberg) Deskriptive Statistik Statistik 1 56 / 62

57 Balkendiagramm Beispiel Balkendiagramm Mittlere Bearbeitungszeit [s] Frauen Männer Gesamt S. Garbade (SRH Heidelberg) Deskriptive Statistik Statistik 1 57 / 62

58 Balkendiagramm Alternative: Liniendiagramm Bearbeitungszeit in Sekunden Frauen Männer Gesamt S. Garbade (SRH Heidelberg) Deskriptive Statistik Statistik 1 58 / 62

59 Kreisdiagramm Kreisdiagramm Ein Kreis- oder Tortendiagramm stellt Kennwerte in Anteilen von Kreissegmenten dar. Winkel eines Kreissegments: Winkel = 360 Teilwert Gesamtwert Dies ist die schlechteste Darstellungsform! S. Garbade (SRH Heidelberg) Deskriptive Statistik Statistik 1 59 / 62

60 Kreisdiagramm Berechnung Puzzle-Daten = = Tabelle: Variable Mittelwert Winkel Männer Frauen Mit diesen Winkeln kann das Kreisdiagramm gezeichnet werden. S. Garbade (SRH Heidelberg) Deskriptive Statistik Statistik 1 60 / 62

61 Kreisdiagramm Kreisdiagramm Puzzle-Daten Mittlere Bearbeitungszeit [s] Frauen Männer S. Garbade (SRH Heidelberg) Deskriptive Statistik Statistik 1 61 / 62

62 Kreisdiagramm Literaturverzeichnis Bortz, J. & Schuster, C. (2010). Statistik für Human- und Sozialwissenschaftler (7. Auflage). Berlin: Springer. Hyndman, R. J. & Fan, Y. (1996). Sample quantiles in statistical packages. The American Statistician, 50(4), S. Garbade (SRH Heidelberg) Deskriptive Statistik Statistik 1 62 / 62

Statistik K urs SS 2004

Statistik K urs SS 2004 Statistik K urs SS 2004 3.Tag Grundlegende statistische Maße Mittelwert (mean) Durchschnitt aller Werte Varianz (variance) s 2 Durchschnittliche quadrierte Abweichung aller Werte vom Mittelwert >> Die

Mehr

1. Maße der zentralen Tendenz Beispiel: Variable Anzahl der Geschwister aus Jugend '92. Valid Cum Value Frequency Percent Percent Percent

1. Maße der zentralen Tendenz Beispiel: Variable Anzahl der Geschwister aus Jugend '92. Valid Cum Value Frequency Percent Percent Percent Deskriptive Statistik 1. Verteilungsformen symmetrisch/asymmetrisch unimodal(eingipflig) / bimodal (zweigipflig schmalgipflig / breitgipflig linkssteil / rechtssteil U-förmig / abfallend Statistische Kennwerte

Mehr

Lage- und Streuungsparameter

Lage- und Streuungsparameter Lage- und Streuungsparameter Beziehen sich auf die Verteilung der Ausprägungen von intervall- und ratio-skalierten Variablen Versuchen, diese Verteilung durch Zahlen zu beschreiben, statt sie graphisch

Mehr

Deskriptive Statistik

Deskriptive Statistik Deskriptive Statistik 1 Ziele In der deskriptiven (=beschreibenden) Statistik werden Untersuchungsergebnisse übersichtlich dargestellt, durch Kennzahlen charakterisiert und grafisch veranschaulicht. 2

Mehr

Statistik und Wahrscheinlichkeitsrechnung

Statistik und Wahrscheinlichkeitsrechnung Statistik und Wahrscheinlichkeitsrechnung 3. Vorlesung Dr. Jochen Köhler 1 Inhalte der heutigen Vorlesung Ziel: Daten Modellbildung Probabilistisches Modell Wahrscheinlichkeit von Ereignissen Im ersten

Mehr

Deskription, Statistische Testverfahren und Regression. Seminar: Planung und Auswertung klinischer und experimenteller Studien

Deskription, Statistische Testverfahren und Regression. Seminar: Planung und Auswertung klinischer und experimenteller Studien Deskription, Statistische Testverfahren und Regression Seminar: Planung und Auswertung klinischer und experimenteller Studien Deskriptive Statistik Deskriptive Statistik: beschreibende Statistik, empirische

Mehr

3. Deskriptive Statistik

3. Deskriptive Statistik 3. Deskriptive Statistik Eindimensionale (univariate) Daten: Pro Objekt wird ein Merkmal durch Messung / Befragung/ Beobachtung erhoben. Resultat ist jeweils ein Wert (Merkmalsausprägung) x i : - Gewicht

Mehr

Herzlich willkommen zur Vorlesung Statistik. Streuungsmaße oder die Unterschiedlichkeit der Daten nebst kurzen Ausführungen zu Schiefe und Wölbung

Herzlich willkommen zur Vorlesung Statistik. Streuungsmaße oder die Unterschiedlichkeit der Daten nebst kurzen Ausführungen zu Schiefe und Wölbung FB 1 W. Ludwig-Mayerhofer Statistik 1 Herzlich willkommen zur Vorlesung Statistik smaße oder die Unterschiedlichkeit der Daten nebst kurzen Ausführungen zu Schiefe und Wölbung FB 1 W. Ludwig-Mayerhofer

Mehr

Einführung in Quantitative Methoden

Einführung in Quantitative Methoden Einführung in Quantitative Methoden Mag. Dipl.Ing. Dr. Pantelis Christodoulides & Mag. Dr. Karin Waldherr SS 2014 Christodoulides / Waldherr Einführung in Quantitative Methoden- 2.VO 1/57 Die Deskriptivstatistik

Mehr

Statistik und Wahrscheinlichkeitsrechnung

Statistik und Wahrscheinlichkeitsrechnung Statistik und Wahrscheinlichkeitsrechnung Übung 3 1 Inhalt der heutigen Übung Vorrechnen der Hausübung B.7 Beschreibende Statistik Gemeinsames Lösen der Übungsaufgaben C.1: Häufigkeitsverteilung C.2: Tukey

Mehr

Mittelwert und Standardabweichung

Mittelwert und Standardabweichung Professur E-Learning und Neue Medien Institut für Medienforschung Philosophische Fakultät Einführung in die Statistik Mittelwert und Standardabweichung Überblick Mittelwert Standardabweichung Weitere Maße

Mehr

Bitte am PC mit Windows anmelden!

Bitte am PC mit Windows anmelden! Einführung in SPSS Plan für heute: Grundlagen/ Vorwissen für SPSS Vergleich der Übungsaufgaben Einführung in SPSS http://weknowmemes.com/generator/uploads/generated/g1374774654830726655.jpg Standardnormalverteilung

Mehr

Statistische Grundlagen I

Statistische Grundlagen I Statistische Grundlagen I Arten der Statistik Zusammenfassung und Darstellung von Daten Beschäftigt sich mit der Untersuchung u. Beschreibung von Gesamtheiten oder Teilmengen von Gesamtheiten durch z.b.

Mehr

Kapitel 1: Deskriptive Statistik

Kapitel 1: Deskriptive Statistik Kapitel 1: Deskriptive Statistik Grafiken 1 Statistische Kennwerte 5 z-standardisierung 7 Grafiken Mit Hilfe von SPSS lassen sich eine Vielzahl unterschiedlicher Grafiken für unterschiedliche Zwecke erstellen.

Mehr

beruflicher Bildungsabschluss incl. Hochschulabschl. 4Kat.(m) Häufigkeit Prozent Gültig Lehre/Beruffachgesundh.Schule ,2 59,2 59,2

beruflicher Bildungsabschluss incl. Hochschulabschl. 4Kat.(m) Häufigkeit Prozent Gültig Lehre/Beruffachgesundh.Schule ,2 59,2 59,2 Häufigkeiten Deskriptive Statistiken Häufigkeiten Beruflicher Bildungsabschluss (Mbfbil4) Zielvariablenliste OK Er erscheint: Statistiken beruflicher Bildungsabschluss incl. N Gültig 3445 Fehlend 0 beruflicher

Mehr

Univariate Häufigkeitsverteilungen Kühnel, Krebs 2001: Statistik für die Sozialwissenschaften, S.41-66

Univariate Häufigkeitsverteilungen Kühnel, Krebs 2001: Statistik für die Sozialwissenschaften, S.41-66 Univariate Häufigkeitsverteilungen Kühnel, Krebs 2001: Statistik für die Sozialwissenschaften, S.41-66 Gabriele Doblhammer: Empirische Sozialforschung Teil II, SS 2004 1/19 Skalenniveaus Skalenniveau Relation

Mehr

Einführung in die Korrelationsrechnung

Einführung in die Korrelationsrechnung Einführung in die Korrelationsrechnung Sven Garbade Fakultät für Angewandte Psychologie SRH Hochschule Heidelberg sven.garbade@hochschule-heidelberg.de Statistik 1 S. Garbade (SRH Heidelberg) Korrelationsrechnung

Mehr

Kapitel 1 Beschreibende Statistik

Kapitel 1 Beschreibende Statistik Beispiel 1.25: fiktive Aktienkurse Zeitpunkt i 0 1 2 Aktienkurs x i 100 160 100 Frage: Wie hoch ist die durchschnittliche Wachstumsrate? Dr. Karsten Webel 53 Beispiel 1.25: fiktive Aktienkurse (Fortsetzung)

Mehr

Kapitel 2. Mittelwerte

Kapitel 2. Mittelwerte Kapitel 2. Mittelwerte Im Zusammenhang mit dem Begriff der Verteilung, der im ersten Kapitel eingeführt wurde, taucht häufig die Frage auf, wie man die vorliegenden Daten durch eine geeignete Größe repräsentieren

Mehr

Verfahren für metrische Variable

Verfahren für metrische Variable Verfahren für metrische Variable Grafische Methoden Histogramm Mittelwertsplot Boxplot Lagemaße Mittelwert, Median, Quantile Streuungsmaße Standardabweichung, Interquartilsabstand Lagemaße und Streumaße

Mehr

Grundlagen der empirischen Sozialforschung

Grundlagen der empirischen Sozialforschung Grundlagen der empirischen Sozialforschung Sitzung 10 - Datenanalyseverfahren Jan Finsel Lehrstuhl für empirische Sozialforschung Prof. Dr. Petra Stein 22. Dezember 2008 1 / 21 Online-Materialien Die Materialien

Mehr

Einführung in Quantitative Methoden

Einführung in Quantitative Methoden Einführung in Quantitative Methoden Mag. Dipl.Ing. Dr. Pantelis Christodoulides & Mag. Dr. Karin Waldherr SS 2011 Christodoulides / Waldherr Einführung in Quantitative Methoden- 2.VO 1/62 Summenzeichen

Mehr

Deskriptive Statistik

Deskriptive Statistik Deskriptive Statistik Deskriptive Statistik: Ziele Daten zusammenfassen durch numerische Kennzahlen. Grafische Darstellung der Daten. Quelle: Ursus Wehrli, Kunst aufräumen 1 Modell vs. Daten Bis jetzt

Mehr

W-Seminar: Versuche mit und am Menschen 2017/2019 Skript

W-Seminar: Versuche mit und am Menschen 2017/2019 Skript 3. Deskriptive Statistik Die deskriptive (auch: beschreibende) Statistik hat zum Ziel, [ ] Daten durch Tabellen, Kennzahlen [ ] und Grafiken übersichtlich darzustellen und zu ordnen. Dies ist vor allem

Mehr

Institut für Biometrie und klinische Forschung. WiSe 2012/2013

Institut für Biometrie und klinische Forschung. WiSe 2012/2013 Klinische Forschung WWU Münster Pflichtvorlesung zum Querschnittsfach Epidemiologie, Biometrie und Med. Informatik Praktikum der Medizinischen Biometrie () Überblick. Deskriptive Statistik I - Grundlegende

Mehr

htw saar 1 EINFÜHRUNG IN DIE STATISTIK: BESCHREIBENDE STATISTIK

htw saar 1 EINFÜHRUNG IN DIE STATISTIK: BESCHREIBENDE STATISTIK htw saar 1 EINFÜHRUNG IN DIE STATISTIK: BESCHREIBENDE STATISTIK htw saar 2 Grundbegriffe htw saar 3 Grundgesamtheit und Stichprobe Ziel: Über eine Grundgesamtheit (Population) soll eine Aussage über ein

Mehr

8. Statistik Beispiel Noten. Informationsbestände analysieren Statistik

8. Statistik Beispiel Noten. Informationsbestände analysieren Statistik Informationsbestände analysieren Statistik 8. Statistik Nebst der Darstellung von Datenreihen bildet die Statistik eine weitere Domäne für die Auswertung von Datenbestände. Sie ist ein Fachgebiet der Mathematik

Mehr

Anteile Häufigkeiten Verteilungen Lagemaße Streuungsmaße Merkmale von Verteilungen. Anteile Häufigkeiten Verteilungen

Anteile Häufigkeiten Verteilungen Lagemaße Streuungsmaße Merkmale von Verteilungen. Anteile Häufigkeiten Verteilungen DAS THEMA: VERTEILUNGEN LAGEMAßE - STREUUUNGSMAßE Anteile Häufigkeiten Verteilungen Lagemaße Streuungsmaße Merkmale von Verteilungen Anteile Häufigkeiten Verteilungen Anteile und Häufigkeiten Darstellung

Mehr

Mathematische und statistische Methoden I

Mathematische und statistische Methoden I Prof. Dr. G. Meinhardt Methodenlehre Mathematische und statistische Methoden I Sprechstunde jederzeit nach Vereinbarung und nach der Vorlesung Wallstr. 3, 6. Stock, Raum 06-206 Dr. Malte Persike persike@uni-mainz.de

Mehr

Das arithmetische Mittel. x i = = 8. x = 1 4. und. y i = = 8

Das arithmetische Mittel. x i = = 8. x = 1 4. und. y i = = 8 .2 Einige statistische Maßzahlen.2. Die Schusser in zwei Familien Die vier Kinder der Familie Huber haben x = 5, x 2 = 7, x 3 = 9, x 4 = Schusser. Die vier Kinder der Familie Maier haben y = 7, y 2 = 7,

Mehr

Auswertung und Darstellung wissenschaftlicher Daten (1)

Auswertung und Darstellung wissenschaftlicher Daten (1) Auswertung und Darstellung wissenschaftlicher Daten () Mag. Dr. Andrea Payrhuber Zwei Schritte der Auswertung. Deskriptive Darstellung aller Daten 2. analytische Darstellung (Gruppenvergleiche) SPSS-Andrea

Mehr

Maße der zentralen Tendenz

Maße der zentralen Tendenz UStatistische Kennwerte Sagen uns tabellarische und graphische Darstellungen etwas über die Verteilung der einzelnen Werte einer Stichprobe, so handelt es sich bei statistischen Kennwerten um eine Kennzahl,

Mehr

Deskriptive Statistik. (basierend auf Slides von Lukas Meier)

Deskriptive Statistik. (basierend auf Slides von Lukas Meier) Deskriptive Statistik (basierend auf Slides von Lukas Meier) Deskriptive Statistik: Ziele Daten zusammenfassen durch numerische Kennzahlen. Grafische Darstellung der Daten. Quelle: Ursus Wehrli, Kunst

Mehr

Statistik und Wahrscheinlichkeitsrechnung

Statistik und Wahrscheinlichkeitsrechnung Statistik und Wahrscheinlichkeitsrechnung Dr. Jochen Köhler 26.02.2008 1 Warum Statistik und Wahrscheinlichkeits rechnung im Ingenieurwesen? Zusammenfassung der letzten Vorlesung Statistik und Wahrscheinlichkeitsrechnung

Mehr

Prüfen von Unterschiedshypothesen für ordinale Variablen: Mann-Whitney Test und Ko

Prüfen von Unterschiedshypothesen für ordinale Variablen: Mann-Whitney Test und Ko Prüfen von Unterschiedshypothesen für ordinale Variablen: Mann-Whitney Test und Ko Sven Garbade Fakultät für Angewandte Psychologie SRH Hochschule Heidelberg sven.garbade@hochschule-heidelberg.de Statistik

Mehr

Fachrechnen für Tierpfleger

Fachrechnen für Tierpfleger Z.B.: Fachrechnen für Tierpfleger A10. Statistik 10.1 Allgemeines Was ist Statistik? 1. Daten sammeln: Durch Umfragen, Zählung, Messung,... 2. Daten präsentieren: Tabellen, Grafiken 3. Daten beschreiben/charakterisieren:

Mehr

1.1 Graphische Darstellung von Messdaten und unterschiedliche Mittelwerte. D. Horstmann: Oktober

1.1 Graphische Darstellung von Messdaten und unterschiedliche Mittelwerte. D. Horstmann: Oktober 1.1 Graphische Darstellung von Messdaten und unterschiedliche Mittelwerte D. Horstmann: Oktober 2014 4 Graphische Darstellung von Daten und unterschiedliche Mittelwerte Eine Umfrage nach der Körpergröße

Mehr

Graphische Darstellung einer univariaten Verteilung:

Graphische Darstellung einer univariaten Verteilung: Graphische Darstellung einer univariaten Verteilung: Die graphische Darstellung einer univariaten Verteilung hängt von dem Messniveau der Variablen ab. Bei einer graphischen Darstellung wird die Häufigkeit

Mehr

Kapitel 1: Deskriptive Statistik

Kapitel 1: Deskriptive Statistik Kapitel 1: Deskriptive Statistik Grafiken Mit Hilfe von SPSS lassen sich eine Vielzahl unterschiedlicher Grafiken für unterschiedliche Zwecke erstellen. Wir besprechen hier die zwei in Kapitel 1.1 thematisierten

Mehr

Datenstrukturen. Querschnitt. Grösche: Empirische Wirtschaftsforschung

Datenstrukturen. Querschnitt. Grösche: Empirische Wirtschaftsforschung Datenstrukturen Datenstrukturen Querschnitt Panel Zeitreihe 2 Querschnittsdaten Stichprobe von enthält mehreren Individuen (Personen, Haushalte, Firmen, Länder, etc.) einmalig beobachtet zu einem Zeitpunkt

Mehr

Deskriptivstatistik a) Univariate Statistik Weiters zum Thema der statistischen Informationsverdichtung

Deskriptivstatistik a) Univariate Statistik Weiters zum Thema der statistischen Informationsverdichtung 20 Weiters zum Thema der statistischen Informationsverdichtung M a ß z a h l e n Statistiken bei Stichproben Parameter bei Grundgesamtheiten Maßzahlen zur Beschreibung univariater Verteilungen Maßzahlen

Mehr

Aufgabe 3 Bei 16 PKWs desselben Typs wurde der Benzinverbrauch pro 100 km gemessen. Dabei ergab sich die folgende Urliste (in Liter pro 100km):

Aufgabe 3 Bei 16 PKWs desselben Typs wurde der Benzinverbrauch pro 100 km gemessen. Dabei ergab sich die folgende Urliste (in Liter pro 100km): Mathematik II für Naturwissenschaften Dr. Christine Zehrt 21.02.19 Übung 1 (für Pharma/Geo/Bio/Stat) Uni Basel Besprechung der Lösungen: 26./27. Februar 2019 in den Übungsstunden Bestimmen Sie zu den folgenden

Mehr

Ü B U N G S S K R I P T S T A T I S T I K

Ü B U N G S S K R I P T S T A T I S T I K Ü B U N G S S K R I P T S T A T I S T I K A. Ploner H. Strelec C. Yassouridis Universität für Bodenkultur Department für Raum, Landschaft und Infrastruktur Institut für Angewandte Statistik & EDV Peter-Jordan-Strasse

Mehr

Beispiel 2 (Einige Aufgaben zu Lageparametern) Aufgabe 1 (Lageparameter)

Beispiel 2 (Einige Aufgaben zu Lageparametern) Aufgabe 1 (Lageparameter) Beispiel (Einige Aufgaben zu Lageparametern) Aufgabe 1 (Lageparameter) 1 Ein Statistiker ist zu früh zu einer Verabredung gekommen und vertreibt sich nun die Zeit damit, daß er die Anzahl X der Stockwerke

Mehr

Stichwortverzeichnis. Symbole

Stichwortverzeichnis. Symbole Stichwortverzeichnis Symbole 50ste Perzentil 119 A Absichern, Ergebnisse 203 Abzählbar unendliche Zufallsvariable 146 Alternativhypothese 237 238 formulieren 248 Anekdote 340 Annäherung 171, 191 Antwortquote

Mehr

Univ.-Prof. Dr. Georg Wydra

Univ.-Prof. Dr. Georg Wydra Univ.-Prof. Dr. Georg Wydra Methoden zur Auswertung von Untersuchungen 1 SKALENTYPEN UND VARIABLEN 2 ZUR BEDEUTUNG DER STATISTIK IN DER FORSCHUNG 3 STATISTIK ALS VERFAHREN ZUR PRÜFUNG VON HYPOTHESEN 4

Mehr

Lösungen. w58r4p Lösungen. w58r4p. Name: Klasse: Datum:

Lösungen. w58r4p Lösungen. w58r4p. Name: Klasse: Datum: Testen und Fördern Name: Klasse: Datum: 1) Ermittle jeweils das arithmetische Mittel. Ordne die Datenerhebungen nach der Größe der arithmetischen Mittel. Beginne mit dem Größten. 45, 39, 44, 48, 42, 39,

Mehr

Häufigkeitsauszählungen, zentrale statistische Kennwerte und Mittelwertvergleiche

Häufigkeitsauszählungen, zentrale statistische Kennwerte und Mittelwertvergleiche Lehrveranstaltung Empirische Forschung und Politikberatung der Universität Bonn, WS 2007/2008 Häufigkeitsauszählungen, zentrale statistische Kennwerte und Mittelwertvergleiche 30. November 2007 Michael

Mehr

Statistik I für Betriebswirte Vorlesung 9

Statistik I für Betriebswirte Vorlesung 9 Statistik I für Betriebswirte Vorlesung 9 Dr. Andreas Wünsche TU Bergakademie Freiberg Institut für Stochastik Vorlesung am 8. Juni 2017 im Audi-Max (AUD-1001) Dr. Andreas Wünsche Statistik I für Betriebswirte

Mehr

5 Exkurs: Deskriptive Statistik

5 Exkurs: Deskriptive Statistik 5 EXKURS: DESKRIPTIVE STATISTIK 6 5 Ekurs: Deskriptive Statistik Wir wollen zuletzt noch kurz auf die deskriptive Statistik eingehen. In der Statistik betrachtet man für eine natürliche Zahl n N eine Stichprobe

Mehr

Lagemasse und Streuung

Lagemasse und Streuung Lagemasse und Streuung Benjamin Schlegel 07. März 2016 Lagemasse sagen etwas über die Lage und das Zentrum der Daten aus, Streuungsmasse, wie die Daten um dieses Zentrum gestreut sind. Lagemasse Lagemasse

Mehr

Deskriptive Statistik Erläuterungen

Deskriptive Statistik Erläuterungen Grundlagen der Wirtschaftsmathematik und Statistik Erläuterungen Lernmaterial zum Modul - 40601 - der Fernuniversität Hagen 7 2.1 Einfache Lageparameter aus einer gegebenen Messreihe ablesen Erklärung

Mehr

Diese Lücken sollten nicht auch bei Ihnen vorhanden sein: Aufgrund einer statistischen Untersuchung entsteht eine geordnete bzw. ungeordnete, die durc

Diese Lücken sollten nicht auch bei Ihnen vorhanden sein: Aufgrund einer statistischen Untersuchung entsteht eine geordnete bzw. ungeordnete, die durc SS 2017 Torsten Schreiber 222 Diese Lücken sollten nicht auch bei Ihnen vorhanden sein: Aufgrund einer statistischen Untersuchung entsteht eine geordnete bzw. ungeordnete, die durch Summierung je Ausprägung

Mehr

STATISTIK I Übung 04 Spannweite und IQR. 1 Kurze Wiederholung. Was sind Dispersionsparameter?

STATISTIK I Übung 04 Spannweite und IQR. 1 Kurze Wiederholung. Was sind Dispersionsparameter? STATISTIK I Übung 04 Spannweite und IQR 1 Kurze Wiederholung Was sind Dispersionsparameter? Die sogenannten Dispersionsparameter oder statistischen Streuungsmaße geben Auskunft darüber, wie die Werte einer

Mehr

1 45, 39, 44, 48, 42, 39, 40, , 31, 46, 35, 31, 42, 51, , 42, 33, 46, 33, 44, 43

1 45, 39, 44, 48, 42, 39, 40, , 31, 46, 35, 31, 42, 51, , 42, 33, 46, 33, 44, 43 1) Ermittle jeweils das arithmetische Mittel. Ordne die Datenerhebungen nach der Größe der arithmetischen Mittel. Beginne mit dem Größten. 1 45, 39, 44, 48, 42, 39, 40, 31 2 35, 31, 46, 35, 31, 42, 51,

Mehr

3. Lektion: Deskriptive Statistik

3. Lektion: Deskriptive Statistik Seite 1 von 5 3. Lektion: Deskriptive Statistik Ziel dieser Lektion: Du kennst die verschiedenen Methoden der deskriptiven Statistik und weißt, welche davon für Deine Daten passen. Inhalt: 3.1 Deskriptive

Mehr

Weitere Lagemaße: Quantile/Perzentile I

Weitere Lagemaße: Quantile/Perzentile I 3 Auswertung von eindimensionalen Daten Lagemaße 3.3 Weitere Lagemaße: Quantile/Perzentile I Für jeden Median x med gilt: Mindestens 50% der Merkmalswerte sind kleiner gleich x med und ebenso mindestens

Mehr

Statistik eindimensionaler Größen

Statistik eindimensionaler Größen Statistik eindimensionaler Größen Michael Spielmann Inhaltsverzeichnis 1 Aufgabe der eindimensionalen Statistik 2 2 Grundbegriffe 2 3 Aufbereiten der Stichprobe 3 4 Die Kennzahlen Mittelwert und Streuung,

Mehr

Ermitteln Sie auf 2 Dezimalstellen genau die folgenden Kenngrößen der bivariaten Verteilung der Merkmale Weite und Zeit:

Ermitteln Sie auf 2 Dezimalstellen genau die folgenden Kenngrößen der bivariaten Verteilung der Merkmale Weite und Zeit: 1. Welche der folgenden Kenngrößen, Statistiken bzw. Grafiken sind zur Beschreibung der Werteverteilung des Merkmals Konfessionszugehörigkeit sinnvoll einsetzbar? A. Der Modalwert. B. Der Median. C. Das

Mehr

Statistik I für Betriebswirte Vorlesung 9

Statistik I für Betriebswirte Vorlesung 9 Statistik I für Betriebswirte Vorlesung 9 Prof. Dr. Hans-Jörg Starkloff TU Bergakademie Freiberg Institut für Stochastik 06. Juni 2016 Prof. Dr. Hans-Jörg Starkloff Statistik I für Betriebswirte Vorlesung

Mehr

1,11 1,12 1,13 1,14 1,15 1,16 1,17 1,17 1,17 1,18

1,11 1,12 1,13 1,14 1,15 1,16 1,17 1,17 1,17 1,18 3. Deskriptive Statistik Ziel der deskriptiven (beschreibenden) Statistik (explorativen Datenanalyse) ist die übersichtliche Darstellung der wesentlichen in den erhobenen Daten enthaltene Informationen

Mehr

Empirische Verteilungsfunktion

Empirische Verteilungsfunktion Empirische Verteilungsfunktion H(x) := Anzahl der Werte x ist. Deskriptive

Mehr

Übungen mit dem Applet Rangwerte

Übungen mit dem Applet Rangwerte Rangwerte 1 Übungen mit dem Applet Rangwerte 1 Statistischer Hintergrund... 2 1.1 Verteilung der Einzelwerte und der Rangwerte...2 1.2 Kurzbeschreibung des Applets...2 1.3 Ziel des Applets...4 2 Visualisierungen

Mehr

STATISTIK FÜR STATISTIK-AGNOSTIKER Teil 1 (wie mich)

STATISTIK FÜR STATISTIK-AGNOSTIKER Teil 1 (wie mich) WS 07/08-1 STATISTIK FÜR STATISTIK-AGNOSTIKER Teil 1 (wie mich) Nur die erlernbaren Fakten, keine Hintergrundinfos über empirische Forschung etc. (und ich übernehme keine Garantie) Bei der Auswertung von

Mehr

Inhaltsverzeichnis. Über die Autoren Einleitung... 21

Inhaltsverzeichnis. Über die Autoren Einleitung... 21 Inhaltsverzeichnis Über die Autoren.... 7 Einleitung... 21 Über dieses Buch... 21 Was Sie nicht lesen müssen... 22 Törichte Annahmen über den Leser... 22 Wie dieses Buch aufgebaut ist... 23 Symbole, die

Mehr

Kapitel 3: Lagemaße. Ziel. Komprimierung der Daten zu einer Kenngröße, welche die Lage, das Zentrum der Daten beschreibt

Kapitel 3: Lagemaße. Ziel. Komprimierung der Daten zu einer Kenngröße, welche die Lage, das Zentrum der Daten beschreibt Kapitel 3: Lagemaße Ziel Komprimierung der Daten zu einer Kenngröße, welche die Lage, das Zentrum der Daten beschreibt Dr. Matthias Arnold 52 Definition 3.1 Seien x 1,...,x n Ausprägungen eines kardinal

Mehr

Statistik und Wahrscheinlichkeitsrechnung. Wahrscheinlichkeitsrechnung

Statistik und Wahrscheinlichkeitsrechnung. Wahrscheinlichkeitsrechnung Statistik und Wahrscheinlichkeitsrechnung Prof. Dr. Michael Havbro Faber 1 Inhalte der heutigen Vorlesung Ziel: Daten Modellbildung Probabilistisches Modell Im ersten Schritt werden wir die Daten nur beschreiben:

Mehr

Streuungsmaße von Stichproben

Streuungsmaße von Stichproben Streuungsmaße von Stichproben S P A N N W E I T E, V A R I A N Z, S T A N D A R D A B W E I C H U N G, Q U A R T I L E, K O V A R I A N Z, K O R R E L A T I O N S K O E F F I Z I E N T Zentrale Methodenlehre,

Mehr

BOXPLOT 1. Begründung. Boxplot A B C

BOXPLOT 1. Begründung. Boxplot A B C BOXPLOT 1 In nachstehender Tabelle sind drei sortierte Datenreihen gegeben. Zu welchem Boxplot gehört die jeweilige Datenreihe? Kreuze an und begründe Deine Entscheidung! Boxplot A B C Begründung 1 1 1

Mehr

Beschreibende Statistik Kenngrößen in der Übersicht (Ac )

Beschreibende Statistik Kenngrößen in der Übersicht (Ac ) Beschreibende Statistik Kenngrößen in der Übersicht (Ac 006-019) Boxplot Im folgenden wird die Berechnungsweise des TI 83 (sowie von SPSS, s. unten) verwendet. Diese geht auf eine Festlegung von Moore

Mehr

Kapitel 5 Kenngrößen empirischer Verteilungen 5.1. Lagemaße. x mod (lies: x-mod) Wofür? Lageparameter. Modus/ Modalwert Zentrum. Median Zentralwert

Kapitel 5 Kenngrößen empirischer Verteilungen 5.1. Lagemaße. x mod (lies: x-mod) Wofür? Lageparameter. Modus/ Modalwert Zentrum. Median Zentralwert Kapitel 5 Kenngrößen empirischer Verteilungen 5.1. Lagemaße Wofür? Lageparameter Modus/ Modalwert Zentrum Median Zentralwert Im Datensatz stehende Informationen auf wenige Kenngrößen verdichten ermöglicht

Mehr

I.V. Methoden 2: Deskriptive Statistik WiSe 02/03

I.V. Methoden 2: Deskriptive Statistik WiSe 02/03 I.V. Methoden 2: Deskriptive Statistik WiSe 02/03 Vorlesung am 04.11.2002 Figures won t lie, but liars will figure. General Charles H.Grosvenor Dr. Wolfgang Langer Institut für Soziologie Martin-Luther-Universität

Mehr

Mathematik für Biologen

Mathematik für Biologen Mathematik für Biologen Prof. Dr. Rüdiger W. Braun Heinrich-Heine-Universität Düsseldorf 20. Oktober 2010 1 empirische Verteilung 2 Lageparameter Modalwert Arithmetisches Mittel Median 3 Streuungsparameter

Mehr

Lage- und Streuungsmaße

Lage- und Streuungsmaße Statistik 1 für SoziologInnen Lage- und Streuungsmaße Univ.Prof. Dr. Marcus Hudec Streuungsmaße Statistische Maßzahlen, welche die Variabilität oder die Streubreite in den Daten messen. Sie beschreiben

Mehr

Univariate explorative Datenanalyse in R

Univariate explorative Datenanalyse in R Univariate explorative Datenanalyse in R Achim Zeileis, Regina Tüchler 2006-10-03 1 Ein metrisches Merkmal Wir laden den Datensatz: R> load("statlab.rda") und machen die Variablen direkt verfügbar: R>

Mehr

PROC MEANS. zum Berechnen statistischer Maßzahlen (für quantitative Merkmale)

PROC MEANS. zum Berechnen statistischer Maßzahlen (für quantitative Merkmale) PROC MEAS zum Berechnen statistischer Maßzahlen (für quantitative Merkmale) Allgemeine Form: PROC MEAS DATA=name Optionen ; VAR variablenliste ; CLASS vergleichsvariable ; Beispiel und Beschreibung der

Mehr

Sommersemester Marktforschung

Sommersemester Marktforschung Dipl.-Kfm. Sascha Steinmann Universität Siegen Lehrstuhl für Marketing steinmann@marketing.uni-siegen.de Sommersemester 2010 Marktforschung Übungsaufgaben zu den Themen 3-6 mit Lösungsskizzen Aufgabe 1:

Mehr

Die erhobenen Daten werden zunächst in einer Urliste angeschrieben. Daraus ermittelt man:

Die erhobenen Daten werden zunächst in einer Urliste angeschrieben. Daraus ermittelt man: Die erhobenen Daten werden zunächst in einer Urliste angeschrieben. Daraus ermittelt man: a) Die absoluten Häufigkeit: Sie gibt an, wie oft ein Variablenwert vorkommt b) Die relative Häufigkeit: Sie erhält

Mehr

Die erhobenen Daten werden zunächst in einer Urliste angeschrieben. Daraus ermittelt man:

Die erhobenen Daten werden zunächst in einer Urliste angeschrieben. Daraus ermittelt man: Die erhobenen Daten werden zunächst in einer Urliste angeschrieben. Daraus ermittelt man: a) Die absoluten Häufigkeit: Sie gibt an, wie oft ein Variablenwert vorkommt b) Die relative Häufigkeit: Sie erhält

Mehr

Tabellen und Abbildungen

Tabellen und Abbildungen Professur E-Learning und Neue Medien Institut für Medienforschung Philosophische Fakultät Einführung in die Statistik Tabellen und Abbildungen Überblick Tabellen Abbildungen Polygonzug Histogramm Box-Plot

Mehr

a) x = 1150 ; x = 950 ; x = 800 b) Die Lagemaße unterscheiden sich voneinander. c) Der Median charakterisiert die Stichprobe am besten.

a) x = 1150 ; x = 950 ; x = 800 b) Die Lagemaße unterscheiden sich voneinander. c) Der Median charakterisiert die Stichprobe am besten. R. Brinkmann http://brinkmann-du.de Seite 6.0.2009 Lösungen Mittelwert, Median II se: E E2 E3 E4 E5 E6 a) Notendurchschnitt 2,6 b) Säulendiagramm siehe ausführliche Lösung. c) Kreisdiagramm siehe ausführliche

Mehr

absolute Häufigkeit h: Anzahl einer bestimmten Note relative Häufigkeit r: Anzahl einer bestimmten Note, gemessen an der Gesamtzahl der Noten

absolute Häufigkeit h: Anzahl einer bestimmten Note relative Häufigkeit r: Anzahl einer bestimmten Note, gemessen an der Gesamtzahl der Noten Statistik Eine Aufgabe der Statistik ist es, Datenmengen zusammenzufassen und darzustellen. Man verwendet dazu bestimmte Kennzahlen und wertet Stichproben aus, um zu Aussagen bzw. Prognosen über die Gesamtheit

Mehr

Häufigkeitsverteilungen und Statistische Maßzahlen. Häufigkeitsverteilungen und Statistische Maßzahlen. Variablentypen. Stichprobe und Grundgesamtheit

Häufigkeitsverteilungen und Statistische Maßzahlen. Häufigkeitsverteilungen und Statistische Maßzahlen. Variablentypen. Stichprobe und Grundgesamtheit TECHNISCHE UNIVERSITÄT MÜNCHEN-WEIHENSTEPHAN MATHEMATIK UND STATISTIK INFORMATIONS- UND DOKUMENTATIONSZENTRUM R. Häufigkeitsverteilungen und Statistische Maßzahlen Statistik SS Variablentypen Qualitative

Mehr

3) Lagemaße: Mittelwert, Median, Modus

3) Lagemaße: Mittelwert, Median, Modus Thema: Beschreibende Statistik LE.1: 40 min Seite 9 3) Lagemaße: Mittelwert, Median, Modus Lagemaße In der beschreibenden Statistik werden Daten erhoben. Diese Daten weisen eine bestimmte Verteilung auf.

Mehr

Gliederung der Vorlesung

Gliederung der Vorlesung Gliederung der Vorlesung A. Einführung: 1. Versuchsplanung 2. Merkmalsauswahl 3. Skalenniveaus 4. Durchführung B. Beschreibende (deskriptive) Statistik C. Schließende Statistik Fehler 1. und 2. Art Testverfahren

Mehr

Inhaltsverzeichnis. 1 Über dieses Buch Zum Inhalt dieses Buches Danksagung Zur Relevanz der Statistik...

Inhaltsverzeichnis. 1 Über dieses Buch Zum Inhalt dieses Buches Danksagung Zur Relevanz der Statistik... Inhaltsverzeichnis 1 Über dieses Buch... 11 1.1 Zum Inhalt dieses Buches... 13 1.2 Danksagung... 15 2 Zur Relevanz der Statistik... 17 2.1 Beispiel 1: Die Wahrscheinlichkeit, krank zu sein, bei einer positiven

Mehr

Statistik II: Grundlagen und Definitionen der Statistik

Statistik II: Grundlagen und Definitionen der Statistik Medien Institut : Grundlagen und Definitionen der Statistik Dr. Andreas Vlašić Medien Institut (0621) 52 67 44 vlasic@medien-institut.de Gliederung 1. Hintergrund: Entstehung der Statistik 2. Grundlagen

Mehr

Statistik I für Humanund Sozialwissenschaften

Statistik I für Humanund Sozialwissenschaften Statistik I für Humanund Sozialwissenschaften 1 Übung Lösungsvorschlag Gruppenübung G 1 Auf einer Touristeninsel in der Karibik wurden in den letzten beiden Juliwochen morgens zur gleichen Zeit die folgenden

Mehr

Anwendung A_0801_Quantile_Minimum_Maximum

Anwendung A_0801_Quantile_Minimum_Maximum 8. Lageparameter 63 8.3 Interaktive EXCEL-Anwendungen (CD-ROM) Anwendung A_080_Quantile_Minimum_Maimum Die Anwendung besteht aus einem Tabellenblatt Simulation : In der Simulation wird aus einer Urliste

Mehr

1) Warum ist die Lage einer Verteilung für das Ergebnis einer statistischen Analyse von Bedeutung?

1) Warum ist die Lage einer Verteilung für das Ergebnis einer statistischen Analyse von Bedeutung? 86 8. Lageparameter Leitfragen 1) Warum ist die Lage einer Verteilung für das Ergebnis einer statistischen Analyse von Bedeutung? 2) Was ist der Unterschied zwischen Parametern der Lage und der Streuung?

Mehr

Inhaltsverzeichnis. Inhalt Teil I: Beschreibende (Deskriptive) Statistik Seite. 1.0 Erste Begriffsbildungen Merkmale und Skalen 5

Inhaltsverzeichnis. Inhalt Teil I: Beschreibende (Deskriptive) Statistik Seite. 1.0 Erste Begriffsbildungen Merkmale und Skalen 5 Inhaltsverzeichnis Inhalt Teil I: Beschreibende (Deskriptive) Statistik Seite 1.0 Erste Begriffsbildungen 1 1.1 Merkmale und Skalen 5 1.2 Von der Urliste zu Häufigkeitsverteilungen 9 1.2.0 Erste Ordnung

Mehr

Statistikpraktikum. Carsten Rezny. Sommersemester Institut für angewandte Mathematik Universität Bonn

Statistikpraktikum. Carsten Rezny. Sommersemester Institut für angewandte Mathematik Universität Bonn Statistikpraktikum Carsten Rezny Institut für angewandte Mathematik Universität Bonn Sommersemester 2016 Anmeldung in Basis: 06. 10.06.2016 Organisatorisches Einführung Statistik Analyse empirischer Daten

Mehr

Beide Verteilungen der Zeiten sind leicht schief. Der Quartilsabstand für Zeiten zum Surfen ist kleiner als der zum Fernsehen.

Beide Verteilungen der Zeiten sind leicht schief. Der Quartilsabstand für Zeiten zum Surfen ist kleiner als der zum Fernsehen. Welche der folgenden Maßzahlen sind resistent gegenüber Ausreißer? Der Mittelwert und die Standardabweichung. Der und die Standardabweichung. Der und die Spannweite. Der und der Quartilsabstand. Die Spannweite

Mehr

Deskriptive Statistik

Deskriptive Statistik Deskriptive Statistik Lösungen+ Aufgabe 1.1 (a) Sammelnde Statistik: Wahl einer zufälligen Stichprobe aus der Grundgesamtheit. (b) Beschreibende (deskriptive) Statistik: Aufbereitung der Stichprobe (oder

Mehr

benötigen. Die Zeit wird dabei in Minuten angegeben und in einem Boxplot-Diagramm veranschaulicht.

benötigen. Die Zeit wird dabei in Minuten angegeben und in einem Boxplot-Diagramm veranschaulicht. , D 1 Kreuze die richtige Aussage an und stelle die anderen Aussagen richtig. A Das arithmetische Mittel kennzeichnet den mittleren Wert einer geordneten Datenliste. B Die Varianz erhält man, wenn man

Mehr