Statistische Erhebung

Größe: px
Ab Seite anzeigen:

Download "Statistische Erhebung"

Transkript

1 Fachhochschule Hannover Sommersemester 2001 Fachbereich Information und Kommunikation Studiengang Allgemeine Dokumentation Lehrveranstaltung Deskriptive Statistik II Frau Prof. Dr. Kira Klenke Statistische Hausarbeit mit Hilfe der Software SAS Statistische Erhebung zur Meinung der hannoverschen Autofahrer über die aktuellen Spritpreise Referentinnen: Birgit Becker, Katharina Kluin

2 Inhaltsverzeichnis Inhalt Seite Einleitung 3 Die Fragestellung 3 Die Stichprobe 3 Inhalt der Befragung 3 Erfasste Merkmale und deren Codierung 4 Auswertung der statistischen Erhebung 5 1. Mittelwerte und Streuungsmaße 5 2. Häufigkeitsverteilungen 7 Auffälligkeiten 9 Anhang: Die Erhebung in SAS 2

3 Einleitung Die Fragestellung Seit der Einführung der Öko-Steuer im Januar 2000 und der Verteuerung der Weltmarktpreise für Öl in den letzten Monaten steigen die Spritpreise in Deutschland erheblich. In der folgenden statistischen Erhebung soll die Meinung der hannoverschen Autofahrer zu diesem Thema erfasst werden. Relevant für diese Erhebung ist also die Gesamtheit der volljährigen Hannoveraner, die einen Führerschein besitzen und sich regelmäßig mit dem Auto fortbewegen. Auf diese Gruppe wirkt sich die Spritpreiserhöhung direkt aus. Die Stichprobe Befragungstag war der Befragt wurden 27 Hannoveraner, elf Männer und 16 Frauen. Um eine möglichst repräsentative Stichprobe zu erhalten, wurde die Befragung an fünf Tankstellen durchgeführt, die zuvor per Los aus dem Gesamtverzeichnis der hannoverschen Tankstellen bestimmt wurden. Des weiteren wurde die Umfrage an allen Befragungsorten auf die Zeiträume zwischen 10 bis 14 Uhr (13 Personen) und 17 bis 19 Uhr (14 Personen) aufgeteilt. So wurde gewährleistet, dass Halbtagsarbeitende oder Studierende nicht aus der Stichprobe herausfallen. Inhalt der Befragung Da die Meinung zu den Spritpreisen erheblich von variablen äußeren Faktoren abhängt und nur im Kontext mit ihnen aussagekräftig sein kann, wurden zusätzliche Angaben zum Nettogehalt, der Anzahl eigener Autos, zum Familienstand, sowie zum allgemeinen Interesse am Umweltschutz erfragt und in die Statistiken mit einbezogen. Bei der Meinung über die Spritpreiserhöhung und für das Interesse am Umweltschutz konnten sich die Befragten in eine Skala von eins bis drei einordnen (siehe Legende). 3

4 Erfasste Merkmale und deren Codierung Nominales Merkmal Geschlecht: m = männlich w = weiblich Nominales Merkmal Familienstand v = verheiratet l = ledig Stetiges Merkmal Monatliches Nettogehalt (in DM) Nettogehalt Stetiges Merkmal Monatliche Ausgaben für Sprit (in DM) AusgabeSprit Diskretes Merkmal Anzahl der eigenen Autos (in realen Zahlen) AnzahlAutos Ordinales Merkmal Interesse am Umweltschutz im Allgemeinen InteresseUmwelt: 1 = eher gering 2 = mittel 3 = hoch Ordinales Merkmal Meinung zu den Spritpreisen MeinungSpritpreis: 1 = ablehnend 2 = neutral 3 = befürwortend 4

5 Auswertung der statistischen Erhebung 1. Mittelwerte und Streuungsmaße der stetigen Merkmale AusgabeSprit Nettogehalt Die Tabelle Durchschnitt (Mean) und Streuung (Std Dev) für die Merkmale AusgabeSprit und Nettogehalt beschreibt das arithmetische Mittel und die Standardabweichung der stetigen Merkmale AusgabeSprit und Nettogehalt. Ersichtlich wird hier, dass die 27 Befragten zwischen 0 und 600 DM monatlich für Sprit ausgeben. Das arithmetische Mittel ( Mean ) liegt bei ca. 269,26 DM. Anhand des ermittelten Wertes für die Standardabweichung ( Std Dev ) von 136,24 DM ist erkennbar, dass nicht alle Angaben der Befragten in unmittelbarer Nähe zum arithmetischen Mittel rangieren, sondern zum großen Teil zwischen ca. 130 DM und 400 DM variieren. Das Nettogehalt der 27 Beteiligten liegt zwischen 1400 und 5600 DM. Im Durchschnitt (arithmetisches Mittel) werden monatlich 2707,41 DM bezogen. Die Streuung der einzelnen Merkmalsausprägungen ist mit 913,54 DM angegeben, d.h. ungefähr 68% der befragten Personen verdienen zwischen 1800 und 2600 DM. Unter Weitere Mittelwerte und Streuungsmaße für das Merkmal AusgabeSprit wird die ungleichmäßige Streuung der einzelnen Werte für die monatlichen Spritkosten genauer ermittelt. In der Zeile Skewness, also Schiefe, ist erkennbar, dass die Extremwerte in einem Kurvendiagramm zu einer leicht linksschiefen Kurve führen. Dies bedeutet, dass der überwiegende Teil der Befragten Spritkosten hat, die über dem Durchschnitt der Stichprobe liegen. Es gibt also nur einige wenige Personen, die erheblich niedrigere Kosten für Treibstoff haben. Die Zeile Variance bezeichnet die Varianz, welche lediglich die mit zwei potenzierte Form der Standardabweichung darstellt, also s²=v. Für diese Erhebung ist allerdings die einfache Standardabweichung das geeignetere Streuungsmaß. In der Zeile Mode wird als Mittelwert Modus der Durchschnittswert 200 DM angegeben. Dies ist die am häufigsten angegebene Merkmalsausprägung. Hier gibt es 5

6 jedoch noch einen zweiten Modus von 300 DM. Beide wurden exakt dreimal erhoben. Angezeigt wird aber nur der kleinere Modus. Der Abschnitt Quantiles beschreibt die Verteilung der prozentuellen Häufigkeiten der Merkmalsausprägungen. Zwar liegen die monatlichen Ausgaben für Sprit aller Befragten zwischen minimal 0 und maximal 600 DM, allerdings bewegen sich die Kosten von 50% der Befragten nur innerhalb des Interquartilsabstands ( Interquartile Range ) von 160 DM zwischen 180 (1. Quartil) und 340 DM (3. Quartil). Der Median wird mit 280 DM angegeben. Dementsprechend verfahren 50 % der Personen Sprit für weniger oder =280 DM, während die andere Hälfte 280 DM oder mehr für Sprit im Monat berechnen muss. Da der Median um etwa 10 DM über dem arithmetischen Mittel liegt, ergibt sich die oben erwähnte Linksschiefe (siehe Skewness ). Die Tabelle Extreme Observations zeigt die fünf niedrigsten, sowie die fünf höchsten gemessenen Werte bezüglich der monatlichen Ausgabe für Kraftstoff mit dem Hinweis auf die entsprechende Stelle in der Urliste an. Unter Stem Leaf wird veranschaulicht, wie die einzelnen Angaben zu den Spritausgaben über die gesamte Breite (von 0 bis 600 DM) verteilt sind. So geben zum Beispiel 2 Personen 450 DM für Sprit aus. Der Interquartilsabstand wird in dieser Darstellung bestätigt, denn allein 18 der 27 Befragten siedelten ihre monatlichen Spritkosten zwischen 150 und 350 DM an. Die Linksschiefe der Verteilung der Merkmalsausprägungen auf die Merkmalsträger wird hier noch einmal veranschaulicht, wenn man die Tabelle als graphische Darstellung betrachtet. Unter Weitere Mittelwerte und Streuungsmaße für das Merkmal Nettogehalt wird in der Zeile Skewness anhand des ermittelten Wertes von 1,32 ersichtlich, dass einige wenige Personen ein wesentlich höheres Einkommen beziehen, als der Großteil der Befragten. Im Kurvendiagramm ergibt sich hieraus eine rechtsschiefe Kurve. Der Mittelwert Modus liegt bei 3000 DM, da dies den am häufigsten gemessenen Wert darstellt. Vier Personen beziehen 3000 DM monatlich. Im Punkt Quantiles wird verdeutlicht, dass bei einem minimalen Einkommen von 1400 DM und einem maximalen Bezug von 5600 DM 50 % der befragten Personen zwischen 2200 und 3000 DM verdienen. Der Interquartilsabstand beträgt also 800 DM. Der Median wird mit 2600 DM angegeben, er ist also niedriger als das arithmetische 6

7 Mittel (2707 DM) und bewirkt damit die Rechtsschiefe. Die Tabelle Extreme Observations zeigt noch einmal die jeweils fünf niedrigsten, sowie die fünf höchsten gemessenen Merkmale dieses Merkmals mit dem Hinweis auf die entsprechende Stelle in der Urliste an. Am Stem Leaf wird das Ergebnis der Skewness -Berechnung präzisiert. Nur 4 Personen der Stichprobe beziehen monatlich mehr als 3000 DM. 2. Häufigkeitsverteilungen der nominalen Merkmale der ordinalen Merkmale des diskreten Merkmals Geschlecht Familienstand Meinung zu der Spritpreiserhöhung (siehe vertikales Balkendiagramm) Interesse am Umweltschutz (siehe horizontales Balkendiagramm) Anzahl eigener Autos (siehe Kreisdiagramm) Im folgenden soll die Verteilung der einzelnen Merkmalsausprägungen auf alle Befragten anhand der Tabellenübersicht Häufigkeitsverteilungen kurz erläutert werden. So waren 41 % der Befragten Frauen, 59 % waren Männer. Außerdem wurden 10% mehr verheiratete Personen befragt als ledige. 11 % der Stichprobe befürworteten die Höhe der Spritpreise, 41% lehnen sie ab. Etwa die Hälfte der Befragten steht den hohen Spritpreisen neutral gegenüber. Kein Interesse am Umweltschutz haben lediglich 22% der Befragten, 41% haben Interesse und immerhin 37% sind besonders am Schutz der Umwelt interessiert. Der Großteil der Befragten besitzt ein Auto (74%). Interessant an dieser Häufigkeitsverteilung ist besonders, dass obwohl 37% der Befragten ein sehr großes Interesse am Umweltschutz haben, nur 11% die hohen Benzinpreise befürworten. 7

8 In der Kreuztabelle Einfluss des Interesses am Umweltschutz auf die Bewertung der aktuellen Spritpreiserhöhung wird diese Beobachtung bestätigt. Der Anteil derer, die die hohen Spritpreise befürworten, an denen, die ein hohes Interesse am Umweltschutz haben, beträgt nur 30 Prozent. Unter den immerhin 11 Personen, die sich für am Umweltschutz interessiert einstuften, war sogar keine einzige Person, welche die Treibstoffpreise befürworten wollte. Das Stabdiagramm Meinung zur Spritpreiserhöhung unter Berücksichtigung des Geschlechts stellt nicht nur die prozentuelle Verteilung der ablehnenden, neutralen und befürwortenden Personen dar, sondern unterteilt die drei Gruppen auch graphisch in männliche und weibliche Personen. Herausragend ist hier, dass der Anteil der Frauen unter denen, die die hohen Spritpreise befürworten, sehr gering ist. Dagegen sind im Balkendiagramm Interesse am Umweltschutz unter Berücksichtigung des Geschlechts knapp die Hälfte der sehr interessierten Personen weiblichen Geschlechts. Demnach können sich die befragten Frauen trotz eines recht hohen Anliegens am Erhalt der Umwelt nicht so recht damit anfreunden, hierfür auch höhere Kosten hinzunehmen. Das Balkendiagramm Auswirkung der Höhe des Nettogehalts auf die monatlichen Spritausgaben setzt die beiden Merkmale ins Verhältnis. Mit der Höhe des Einkommens steigen demnach nicht zwangsläufig die Ausgaben für Sprit. So variieren die Spritkosten der Befragten mit einem Einkommen zwischen 0 und 360 DM nur gering. Lediglich die Spritausgaben der höchsten Gehaltsgruppe sind höher als die der übrigen. Allerdings muss an dieser Stelle berücksichtigt werden, das die Gruppe der Höchstverdiener aus nur zwei Personen besteht, d. h. es handelt sich hier um Extremwerte, die in die Auswertung nur bedingt mit einbezogen werden können. 8

9 Auffälligkeiten Dem errechneten arithmetischen Mittel der Merkmale AusgabeSprit und Nettogehalt zufolge, geben die befragten Personen im Durchschnitt rund ein Zehntel ihres monatlichen Einkommens für Sprit aus. Würde man allein diesen Wert für eine Interpretation der Erhebung zugrunde legen, könnte man daraus schließen, dass die monatlichen Spritkosen auch proportional zu der Höhe des Gehalts steigen (nämlich jeweils um 10 Prozent). Zieht man in diesem Zusammenhang jedoch die unterschiedlich breiten Streuungen der Merkmale und das Balkendiagramm Auswirkung des Nettogehalts auf die monatlichen Spritkosten heran, wird diese Vermutung widerlegt. An diesem Beispiel wird deutlich, dass die unterschiedlichen statistischen Berechnungen immer aus dem Zusammenhang heraus verstanden werden müssen. Die Meinung der befragten Hannoveraner zu der Höhe der Spritpreise bewegt sich vor allem im Bereich ablehnend bis neutral. Das allgemein recht hohe Interesse am Umweltschutz erleichtert den Befragten den tieferen Griff in die Tasche also nicht. 9

10 SAS Programme DATA Hausarbeit; INPUT Geschlecht $ Familienstand $ InteresseUmwelt MeinungSpritpreis AnzahlAutos AusgabeSprit Nettogehalt; datalines; w l w l w v w v w v w l w v w l w v w v w l w v w v w l w v w l m v m v m l m l m l m v m v m l m l m v m v run; proc means; var AusgabeSprit; var Nettogehalt; Title1 'Durchschnitt (Mean) und Streuung (Std Dev) fuer die Merkmale AusgabeSprit und Nettogehalt'; run; proc univariate plot; Title1 'Weitere Mittelwerte und Streuungsmaße für das Merkmal AusgabeSprit'; var AusgabeSprit; run; proc univariate plot; var Nettogehalt; 10

11 title1 'Weitere Mittelwerte und Streuungsmaße für das Merkmals Nettogehalt'; run; proc freq; Tables Geschlecht Familienstand MeinungSpritpreis InteresseUmwelt AnzahlAutos; title1 'Haeufigkeitsverteilungen'; run; proc freq; Tables MeinungSpritpreis*InteresseUmwelt; title1 'Einfluss des Interesses am Umweltschutz auf die Bewertung der aktuellen Spritpreiserhoehung'; run; proc gchart; vbar MeinungSpritpreis/subgroup=Geschlecht type=pct discrete; Title1 'Meinung zur Spritpreiserhoehung unter Beruecksichtung des Geschlechts'; run; proc gchart; hbar InteresseUmwelt/subgroup=Geschlecht type=pct discrete; Title1 'Interesse am Umweltschutz unter Beruecksichtung des Geschlechts'; run; proc gchart; pie AnzahlAutos/type=pct; title1 'Anzahl der eigenen Autos'; run; proc gchart; hbar AusgabeSprit/sumvar=Nettogehalt type=mean Levels=5 Space=1 ; Title1 'Auswirkung der Hoehe des Nettogehalts auf die monatlichen Spritausgaben'; run; 11

12 SAS Logs 1 DATA Hausarbeit; 2 INPUT Geschlecht $ Familienstand $ InteresseUmwelt MeinungSpritpreis AnzahlAutos 2! AusgabeSprit Nettogehalt; 3 datalines; NOTE: The data set WORK.HAUSARBEIT has 27 observations and 7 variables. NOTE: DATA statement used: real time 2.08 seconds 31 run; 32 proc means; 33 var AusgabeSprit; 34 var Nettogehalt; 35 Title1 'Durchschnitt (Mean) und Streuung (Std Dev) fuer die Merkmale AusgabeSprit und 35! Nettogehalt'; 36 run; NOTE: There were 27 observations read from the data set WORK.HAUSARBEIT. NOTE: PROCEDURE MEANS used: real time 2.91 seconds 37 proc univariate plot; 38 Title1 'Weitere Mittelwerte und Streuungsmaße für das Merkmal AusgabeSprit'; 39 var AusgabeSprit; 40 run; NOTE: PROCEDURE UNIVARIATE used: real time 1.53 seconds 41 proc univariate plot; 42 var Nettogehalt; 43 title1 'Weitere Mittelwerte und Streuungsmaße für das Merkmals Nettogehalt'; 44 run; NOTE: PROCEDURE UNIVARIATE used: real time 0.10 seconds 45 proc freq; 46 Tables Geschlecht Familienstand MeinungSpritpreis InteresseUmwelt AnzahlAutos; 47 title1 'Haeufigkeitsverteilungen'; 48 run; NOTE: There were 27 observations read from the data set WORK.HAUSARBEIT. NOTE: PROCEDURE FREQ used: real time 0.37 seconds 49 proc freq; 50 Tables MeinungSpritpreis*InteresseUmwelt; 51 title1 'Einfluss des Interesses am Umweltschutz auf die Bewertung der aktuellen 51! Spritpreiserhoehung'; 52 run; NOTE: There were 27 observations read from the data set WORK.HAUSARBEIT. NOTE: PROCEDURE FREQ used: real time 0.22 seconds 53 proc gchart; 54 vbar MeinungSpritpreis/subgroup=Geschlecht type=pct discrete; 55 Title1 'Meinung zur Spritpreiserhoehung unter Beruecksichtung des Geschlechts'; 56 run; WARNING: TITLE1 is too long. Height has been reduced to pct of specified or default size. NOTE: There were 27 observations read from the data set WORK.HAUSARBEIT. NOTE: PROCEDURE GCHART used: real time 9.23 seconds

13 57 proc gchart; 58 hbar InteresseUmwelt/subgroup=Geschlecht type=pct discrete; 59 Title1 'Interesse am Umweltschutz unter Beruecksichtung des Geschlechts'; 60 run; WARNING: TITLE1 is too long. Height has been reduced to pct of specified or default size. NOTE: There were 27 observations read from the data set WORK.HAUSARBEIT. NOTE: PROCEDURE GCHART used: real time 0.21 seconds 61 proc gchart; 62 pie AnzahlAutos/type=pct; 63 title1 'Anzahl der eigenen Autos'; 64 run; NOTE: There were 27 observations read from the data set WORK.HAUSARBEIT. NOTE: PROCEDURE GCHART used: real time 0.22 seconds 65 proc gchart; 66 hbar AusgabeSprit/sumvar=Nettogehalt type=mean Levels=5 Space=1 ; 67 Title1 'Auswirkung der Hoehe des Nettogehalts auf die monatlichen Spritausgaben'; 68 run; WARNING: TITLE1 is too long. Height has been reduced to pct of specified or default size. 13

14 SAS Outputs Durchschnitt (Mean) und Streuung (Std Dev) fuer die Merkmale AusgabeSprit und Nettogehalt 1 17:31 Wednesday, May 22, 2002 The MEANS Procedure Variable N Mean Std Dev Minimum Maximum AusgabeSprit Nettogehalt Weitere Mittelwerte und Streuungsmaße für das Merkmal AusgabeSprit 2 17:31 Wednesday, May 22, 2002 The UNIVARIATE Procedure Variable: AusgabeSprit Moments N 27 Sum Weights 27 Mean Sum Observations 7270 Std Deviation Variance Skewness Kurtosis Uncorrected SS Corrected SS Coeff Variation Std Error Mean Basic Statistical Measures Location Variability Mean Std Deviation Median Variance Mode Range Interquartile Range NOTE: The mode displayed is the smallest of 2 modes with a count of 3. Tests for Location: Mu0=0 Test -Statistic p Value Student's t t Pr > t <.0001 Sign M 12.5 Pr >= M <.0001 Signed Rank S Pr >= S <

15 Quantiles (Definition 5) Quantile Estimate 100% Max % % % % Q % Median % Q % 110 5% 0 1% 0 0% Min 0 Weitere Mittelwerte und Streuungsmaße für das Merkmal AusgabeSprit 3 17:31 Wednesday, May 22, 2002 The UNIVARIATE Procedure Variable: AusgabeSprit ----Lowest---- Extreme Observations ----Highest--- Value Obs Value Obs

16 Stem Leaf # Boxplot *--+--* Multiply Stem.Leaf by 10**+2 Normal Probability Plot 625+ * *++* * ** ****+* **++ ***** ** **+ * *+++*

17 Weitere Mittelwerte und Streuungsmaße für das Merkmals Nettogehalt 4 17:31 Wednesday, May 22, 2002 The UNIVARIATE Procedure Variable: Nettogehalt Moments N 27 Sum Weights 27 Mean Sum Observations Std Deviation Variance Skewness Kurtosis Uncorrected SS Corrected SS Coeff Variation Std Error Mean Basic Statistical Measures Location Variability Mean Std Deviation Median Variance Mode Range 4200 Interquartile Range Tests for Location: Mu0=0 Test -Statistic p Value Student's t t Pr > t <.0001 Sign M 13.5 Pr >= M <.0001 Signed Rank S 189 Pr >= S <.0001 Quantiles (Definition 5) Quantile Estimate 100% Max % % % % Q % Median % Q % % % % Min

18 Weitere Mittelwerte und Streuungsmaße für das Merkmals Nettogehalt 5 17:31 Wednesday, May 22, 2002 The UNIVARIATE Procedure Variable: Nettogehalt Extreme Observations ----Lowest Highest--- Value Obs Value Obs Stem Leaf # Boxplot * *--+--* Multiply Stem.Leaf by 10**+3 Normal Probability Plot * * **+*+ +**** ****+* **+*+** *+* * ++*

19 Haeufigkeitsverteilungen 17:31 Wednesday, May 22, The FREQ Procedure Cumulative Cumulative Geschlecht Frequency Percent Frequency Percent m w Cumulative Cumulative Familienstand Frequency Percent Frequency Percent l v Meinung Cumulative Cumulative Spritpreis Frequency Percent Frequency Percent Cumulative Cumulative InteresseUmwelt Frequency Percent Frequency Percent Cumulative Cumulative AnzahlAutos Frequency Percent Frequency Percent

20 Einfluss des Interesses am Umweltschutz auf die Bewertung der aktuellen Spritpreiserhoehung 7 17:31 Wednesday, May 22, 2002 The FREQ Procedure Table of MeinungSpritpreis by InteresseUmwelt MeinungSpritpreis InteresseUmwelt Frequency Percent Row Pct Col Pct Total Total

21 21

22

PROC UNIVARIATE. Starten Sie die Programmzeilen aus dem Beispiel, zeigt SAS im Output-Fenster die Informationen auf der Rückseite:

PROC UNIVARIATE. Starten Sie die Programmzeilen aus dem Beispiel, zeigt SAS im Output-Fenster die Informationen auf der Rückseite: PROC UNIVARIATE zum Berechnen statistischer Maßzahlen, Prüfung auf Normalverteilung, Häufigkeitslisten für stetige Merkmale (für quantitative Merkmale) Allgemeine Form: PROC UNIVARIATE DATA=name Optionen

Mehr

Verfahren für metrische Variable

Verfahren für metrische Variable Verfahren für metrische Variable Grafische Methoden Histogramm Mittelwertsplot Boxplot Lagemaße Mittelwert, Median, Quantile Streuungsmaße Standardabweichung, Interquartilsabstand Lagemaße und Streumaße

Mehr

1 Univariate Statistiken

1 Univariate Statistiken 1 Univariate Statistiken Im ersten Kapitel berechnen wir zunächst Kenngrößen einer einzelnen Stichprobe bzw. so genannte empirische Kenngrößen, wie beispielsweise den Mittelwert. Diese können, unter gewissen

Mehr

Univariate Häufigkeitsverteilungen Kühnel, Krebs 2001: Statistik für die Sozialwissenschaften, S.41-66

Univariate Häufigkeitsverteilungen Kühnel, Krebs 2001: Statistik für die Sozialwissenschaften, S.41-66 Univariate Häufigkeitsverteilungen Kühnel, Krebs 2001: Statistik für die Sozialwissenschaften, S.41-66 Gabriele Doblhammer: Empirische Sozialforschung Teil II, SS 2004 1/19 Skalenniveaus Skalenniveau Relation

Mehr

Streuungsmaße. Die angegebenen Maßzahlen sind empirisch, d.h. sie sind Schätzungen für die wahre Varianz (empirische) Varianz (Streuung) s 2 = 1 n

Streuungsmaße. Die angegebenen Maßzahlen sind empirisch, d.h. sie sind Schätzungen für die wahre Varianz (empirische) Varianz (Streuung) s 2 = 1 n Streuungsmaße Diskrete Stetige Die angegebenen Maßzahlen sind empirisch, d.h. sie sind Schätzungen für die wahre (empirische) (Streuung) s 2 = 1 n (X i X) 2 n 1 i=1 s 2 n var(x) Warum Division durch (n

Mehr

Deskription, Statistische Testverfahren und Regression. Seminar: Planung und Auswertung klinischer und experimenteller Studien

Deskription, Statistische Testverfahren und Regression. Seminar: Planung und Auswertung klinischer und experimenteller Studien Deskription, Statistische Testverfahren und Regression Seminar: Planung und Auswertung klinischer und experimenteller Studien Deskriptive Statistik Deskriptive Statistik: beschreibende Statistik, empirische

Mehr

Merkmalstypen Univ.-Prof. Dr. rer. nat. et med. habil. Andreas Faldum

Merkmalstypen Univ.-Prof. Dr. rer. nat. et med. habil. Andreas Faldum 1 Merkmalstypen Quantitativ: Geordnete Werte, Vielfache einer Einheit Stetig: Prinzipiell sind alle Zwischenwerte beobachtbar Beispiele: Gewicht, Größe, Blutdruck Diskret: Nicht alle Zwischenwerte sind

Mehr

Häufigkeitsverteilungen und Statistische Maßzahlen. Häufigkeitsverteilungen und Statistische Maßzahlen. Variablentypen. Stichprobe und Grundgesamtheit

Häufigkeitsverteilungen und Statistische Maßzahlen. Häufigkeitsverteilungen und Statistische Maßzahlen. Variablentypen. Stichprobe und Grundgesamtheit TECHNISCHE UNIVERSITÄT MÜNCHEN-WEIHENSTEPHAN MATHEMATIK UND STATISTIK INFORMATIONS- UND DOKUMENTATIONSZENTRUM R. Häufigkeitsverteilungen und Statistische Maßzahlen Statistik SS Variablentypen Qualitative

Mehr

2. Deskriptive Statistik

2. Deskriptive Statistik Philipps-Universitat Marburg 2.1 Stichproben und Datentypen Untersuchungseinheiten: mogliche, statistisch zu erfassende Einheiten je Untersuchungseinheit: ein oder mehrere Merkmale oder Variablen beobachten

Mehr

PROC MEANS. zum Berechnen statistischer Maßzahlen (für quantitative Merkmale)

PROC MEANS. zum Berechnen statistischer Maßzahlen (für quantitative Merkmale) PROC MEAS zum Berechnen statistischer Maßzahlen (für quantitative Merkmale) Allgemeine Form: PROC MEAS DATA=name Optionen ; VAR variablenliste ; CLASS vergleichsvariable ; Beispiel und Beschreibung der

Mehr

erwartete Häufigkeit n=80 davon 50% Frauen fe=40 davon 50% Männer fe=40 Abweichung der beobachteten von den erwarteten Häufigkeiten:

erwartete Häufigkeit n=80 davon 50% Frauen fe=40 davon 50% Männer fe=40 Abweichung der beobachteten von den erwarteten Häufigkeiten: Verfahren zur Analyse von Nominaldaten Chi-Quadrat-Tests Vier-Felder Kontingenztafel Mehrfach gestufte Merkmale Cramers V, Kontingenzkoeffizient, Phi-Koeffizient Muster aller Chi-Quadrat-Verfahren eine

Mehr

Deskriptive Statistik

Deskriptive Statistik Deskriptive Statistik 1 Ziele In der deskriptiven (=beschreibenden) Statistik werden Untersuchungsergebnisse übersichtlich dargestellt, durch Kennzahlen charakterisiert und grafisch veranschaulicht. 2

Mehr

Datenstrukturen. Querschnitt. Grösche: Empirische Wirtschaftsforschung

Datenstrukturen. Querschnitt. Grösche: Empirische Wirtschaftsforschung Datenstrukturen Datenstrukturen Querschnitt Panel Zeitreihe 2 Querschnittsdaten Stichprobe von enthält mehreren Individuen (Personen, Haushalte, Firmen, Länder, etc.) einmalig beobachtet zu einem Zeitpunkt

Mehr

Syntax. Ausgabe *Ü12. *1. corr it25 with alter li_re kontakt.

Syntax. Ausgabe *Ü12. *1. corr it25 with alter li_re kontakt. Syntax *Ü2. *. corr it25 with alter li_re kontakt. *2. regression var=it25 alter li_re kontakt/statistics /dependent=it25 /enter. regression var=it25 li_re kontakt/statistics /dependent=it25 /enter. *3.

Mehr

Institut für Soziologie Dipl.-Soz. Benjamin Gedon. Methoden 2. Ausblick; Darstellung von Ergebnissen; Wiederholung

Institut für Soziologie Dipl.-Soz. Benjamin Gedon. Methoden 2. Ausblick; Darstellung von Ergebnissen; Wiederholung Institut für Soziologie Dipl.-Soz. Methoden 2 Ausblick; Darstellung von Ergebnissen; Wiederholung Ein (nicht programmierbarer) Taschenrechner kann in der Klausur hilfreich sein. # 2 Programm Ausblick über

Mehr

Statistik K urs SS 2004

Statistik K urs SS 2004 Statistik K urs SS 2004 3.Tag Grundlegende statistische Maße Mittelwert (mean) Durchschnitt aller Werte Varianz (variance) s 2 Durchschnittliche quadrierte Abweichung aller Werte vom Mittelwert >> Die

Mehr

Weitere Lagemaße: Quantile/Perzentile I

Weitere Lagemaße: Quantile/Perzentile I 3 Auswertung von eindimensionalen Daten Lagemaße 3.3 Weitere Lagemaße: Quantile/Perzentile I Für jeden Median x med gilt: Mindestens 50% der Merkmalswerte sind kleiner gleich x med und ebenso mindestens

Mehr

Institut für Biometrie und klinische Forschung. WiSe 2012/2013

Institut für Biometrie und klinische Forschung. WiSe 2012/2013 Klinische Forschung WWU Münster Pflichtvorlesung zum Querschnittsfach Epidemiologie, Biometrie und Med. Informatik Praktikum der Medizinischen Biometrie () Überblick. Deskriptive Statistik I - Grundlegende

Mehr

MEHR ALS LINEAR ODER LOGISTISCH?

MEHR ALS LINEAR ODER LOGISTISCH? MEHR ALS LINEAR ODER LOGISTISCH? QUANTILS EN UND ADAPTIVE SPLINES IN SAS MIHAI PAUNESCU QUANTILE proc univariate data=dat; ods select moments quantiles; var sales; Basic Statistical Measures Location Variability

Mehr

Ermitteln Sie auf 2 Dezimalstellen genau die folgenden Kenngrößen der bivariaten Verteilung der Merkmale Weite und Zeit:

Ermitteln Sie auf 2 Dezimalstellen genau die folgenden Kenngrößen der bivariaten Verteilung der Merkmale Weite und Zeit: 1. Welche der folgenden Kenngrößen, Statistiken bzw. Grafiken sind zur Beschreibung der Werteverteilung des Merkmals Konfessionszugehörigkeit sinnvoll einsetzbar? A. Der Modalwert. B. Der Median. C. Das

Mehr

3. Deskriptive Statistik

3. Deskriptive Statistik 3. Deskriptive Statistik Eindimensionale (univariate) Daten: Pro Objekt wird ein Merkmal durch Messung / Befragung/ Beobachtung erhoben. Resultat ist jeweils ein Wert (Merkmalsausprägung) x i : - Gewicht

Mehr

Bitte am PC mit Windows anmelden!

Bitte am PC mit Windows anmelden! Einführung in SPSS Plan für heute: Grundlagen/ Vorwissen für SPSS Vergleich der Übungsaufgaben Einführung in SPSS http://weknowmemes.com/generator/uploads/generated/g1374774654830726655.jpg Standardnormalverteilung

Mehr

1.6 Der Vorzeichentest

1.6 Der Vorzeichentest .6 Der Vorzeichentest In diesem Kapitel soll der Vorzeichentest bzw. Zeichentest vorgestellt werden, mit dem man Hypothesen bezüglich des Medians der unabhängig und identisch stetig verteilten Zufallsvariablen

Mehr

Deskriptive Statistik

Deskriptive Statistik Deskriptive Statistik Deskriptive Statistik: Ziele Daten zusammenfassen durch numerische Kennzahlen. Grafische Darstellung der Daten. Quelle: Ursus Wehrli, Kunst aufräumen 1 Modell vs. Daten Bis jetzt

Mehr

Einführung in Quantitative Methoden

Einführung in Quantitative Methoden Einführung in Quantitative Methoden Mag. Dipl.Ing. Dr. Pantelis Christodoulides & Mag. Dr. Karin Waldherr SS 2014 Christodoulides / Waldherr Einführung in Quantitative Methoden- 2.VO 1/57 Die Deskriptivstatistik

Mehr

1. Maße der zentralen Tendenz Beispiel: Variable Anzahl der Geschwister aus Jugend '92. Valid Cum Value Frequency Percent Percent Percent

1. Maße der zentralen Tendenz Beispiel: Variable Anzahl der Geschwister aus Jugend '92. Valid Cum Value Frequency Percent Percent Percent Deskriptive Statistik 1. Verteilungsformen symmetrisch/asymmetrisch unimodal(eingipflig) / bimodal (zweigipflig schmalgipflig / breitgipflig linkssteil / rechtssteil U-förmig / abfallend Statistische Kennwerte

Mehr

Deskriptive Statistik. (basierend auf Slides von Lukas Meier)

Deskriptive Statistik. (basierend auf Slides von Lukas Meier) Deskriptive Statistik (basierend auf Slides von Lukas Meier) Deskriptive Statistik: Ziele Daten zusammenfassen durch numerische Kennzahlen. Grafische Darstellung der Daten. Quelle: Ursus Wehrli, Kunst

Mehr

I.V. Methoden 2: Deskriptive Statistik WiSe 02/03

I.V. Methoden 2: Deskriptive Statistik WiSe 02/03 I.V. Methoden 2: Deskriptive Statistik WiSe 02/03 Vorlesung am 04.11.2002 Figures won t lie, but liars will figure. General Charles H.Grosvenor Dr. Wolfgang Langer Institut für Soziologie Martin-Luther-Universität

Mehr

Statistik und Wahrscheinlichkeitsrechnung

Statistik und Wahrscheinlichkeitsrechnung Statistik und Wahrscheinlichkeitsrechnung 3. Vorlesung Dr. Jochen Köhler 1 Inhalte der heutigen Vorlesung Ziel: Daten Modellbildung Probabilistisches Modell Wahrscheinlichkeit von Ereignissen Im ersten

Mehr

UE Statistik für PflegewissenschafterInnen I

UE Statistik für PflegewissenschafterInnen I UE Statistik für PflegewissenschafterInnen I 1 7 Analysieren Sie die Unterschiede in der Zufriedenheit mit dem Lebensstandard (H129) zwischen Personen, die als höchste abgeschlossene Ausbildung einen Pflichtschulabschluss

Mehr

Mathematische und statistische Methoden II

Mathematische und statistische Methoden II Methodenlehre e e Prof. Dr. G. Meinhardt 6. Stock, Wallstr. 3 (Raum 06-206) Sprechstunde jederzeit nach Vereinbarung und nach der Vorlesung. Mathematische und statistische Methoden II Dr. Malte Persike

Mehr

Häufigkeitsauszählungen, zentrale statistische Kennwerte und Mittelwertvergleiche

Häufigkeitsauszählungen, zentrale statistische Kennwerte und Mittelwertvergleiche Lehrveranstaltung Empirische Forschung und Politikberatung der Universität Bonn, WS 2007/2008 Häufigkeitsauszählungen, zentrale statistische Kennwerte und Mittelwertvergleiche 30. November 2007 Michael

Mehr

Statistik I für Betriebswirte Vorlesung 9

Statistik I für Betriebswirte Vorlesung 9 Statistik I für Betriebswirte Vorlesung 9 Dr. Andreas Wünsche TU Bergakademie Freiberg Institut für Stochastik Vorlesung am 8. Juni 2017 im Audi-Max (AUD-1001) Dr. Andreas Wünsche Statistik I für Betriebswirte

Mehr

Kreisdiagramm, Tortendiagramm

Kreisdiagramm, Tortendiagramm Kreisdiagramm, Tortendiagramm Darstellung der relativen (absoluten) Häufigkeiten als Fläche eines Kreises Anwendung: Nominale Merkmale Ordinale Merkmale (Problem: Ordnung nicht korrekt wiedergegeben) Gruppierte

Mehr

htw saar 1 EINFÜHRUNG IN DIE STATISTIK: BESCHREIBENDE STATISTIK

htw saar 1 EINFÜHRUNG IN DIE STATISTIK: BESCHREIBENDE STATISTIK htw saar 1 EINFÜHRUNG IN DIE STATISTIK: BESCHREIBENDE STATISTIK htw saar 2 Grundbegriffe htw saar 3 Grundgesamtheit und Stichprobe Ziel: Über eine Grundgesamtheit (Population) soll eine Aussage über ein

Mehr

Univariate explorative Datenanalyse in R

Univariate explorative Datenanalyse in R Univariate explorative Datenanalyse in R Achim Zeileis, Regina Tüchler 2006-10-03 1 Ein metrisches Merkmal Wir laden den Datensatz: R> load("statlab.rda") und machen die Variablen direkt verfügbar: R>

Mehr

Einstieg in SPSS. Man kann auch für jede Ausprägung einer Variablen ein Wertelabel vergeben.

Einstieg in SPSS. Man kann auch für jede Ausprägung einer Variablen ein Wertelabel vergeben. Einstieg in SPSS In SPSS kann man für jede Variable ein Label vergeben, damit in einer Ausgabe nicht der Name der Variable (der kryptisch sein kann) erscheint, sondern ein beschreibendes Label. Der Punkt

Mehr

Angewandte Statistik 1

Angewandte Statistik 1 Angewandte Statistik 1 Beschreibende und Explorative Statistik - Wahrscheinlichkeitsrechnung - Zufallsvariablen und Statistische Maßzahlen -Wichtige Verteilungen - Beurteilende Statistik -Vertrauensintervalle

Mehr

5 Exkurs: Deskriptive Statistik

5 Exkurs: Deskriptive Statistik 5 EXKURS: DESKRIPTIVE STATISTIK 6 5 Ekurs: Deskriptive Statistik Wir wollen zuletzt noch kurz auf die deskriptive Statistik eingehen. In der Statistik betrachtet man für eine natürliche Zahl n N eine Stichprobe

Mehr

BOXPLOT 1. Begründung. Boxplot A B C

BOXPLOT 1. Begründung. Boxplot A B C BOXPLOT 1 In nachstehender Tabelle sind drei sortierte Datenreihen gegeben. Zu welchem Boxplot gehört die jeweilige Datenreihe? Kreuze an und begründe Deine Entscheidung! Boxplot A B C Begründung 1 1 1

Mehr

Deskriptive Statistik Winfried Zinn

Deskriptive Statistik Winfried Zinn Deskriptive Statistik Winfried Zinn Inhalte Statistik 1 1. Themenblock: Grundlagen der beschreibenden Statistik: Skalenniveaus Häufigkeitsverteilungen Mittelwerte (Lagemaße) Standardabweichung und Varianzen

Mehr

Dr. Reinhard Vonthein, Dipl. Statistiker (Univ.)

Dr. Reinhard Vonthein, Dipl. Statistiker (Univ.) Dr. Reinhard Vonthein, Dipl. Statistiker (Univ.) Reinhard.Vonthein@imbs.uni-luebeck.de Institut für Medizinische Biometrie und Statistik Universität zu Lübeck / Universitätsklinikums Schleswig-Holstein

Mehr

Die erhobenen Daten werden zunächst in einer Urliste angeschrieben. Daraus ermittelt man:

Die erhobenen Daten werden zunächst in einer Urliste angeschrieben. Daraus ermittelt man: Die erhobenen Daten werden zunächst in einer Urliste angeschrieben. Daraus ermittelt man: a) Die absoluten Häufigkeit: Sie gibt an, wie oft ein Variablenwert vorkommt b) Die relative Häufigkeit: Sie erhält

Mehr

Empirische Verteilungsfunktion

Empirische Verteilungsfunktion Empirische Verteilungsfunktion H(x) := Anzahl der Werte x ist. Deskriptive

Mehr

SAS-Treff am URZ: Formate Formate automatisieren. 2. Picture-Formate. 3. Boxplots und Formate. 4. Beschriften von Balkendiagrammen

SAS-Treff am URZ: Formate Formate automatisieren. 2. Picture-Formate. 3. Boxplots und Formate. 4. Beschriften von Balkendiagrammen SAS-Treff am URZ: Tipps und Tricks zu Formaten. November 27 Carina Ortseifen Inhalt. Formate automatisieren 2. Picture-Formate. Boxplots und Formate 4. Beschriften von n 5. Literatur Formate automatisieren.

Mehr

Bio- Statistik 1. mit 87 Abbildungen, 40 Tabellen und 102 Beispielen

Bio- Statistik 1. mit 87 Abbildungen, 40 Tabellen und 102 Beispielen Bio- Statistik 1 Beschreibende und explorative Statistik - Wahrscheinlichkeitsrechnung und Zufallsvariablen - Statistische Maßzahlen - Wichtige Verteilungen - Beurteilende Statistik - Vertrauensintervalle

Mehr

Die erhobenen Daten werden zunächst in einer Urliste angeschrieben. Daraus ermittelt man:

Die erhobenen Daten werden zunächst in einer Urliste angeschrieben. Daraus ermittelt man: Die erhobenen Daten werden zunächst in einer Urliste angeschrieben. Daraus ermittelt man: a) Die absoluten Häufigkeit: Sie gibt an, wie oft ein Variablenwert vorkommt b) Die relative Häufigkeit: Sie erhält

Mehr

Serie 1 Serie 2 Serie 3 Serie 4 Serie 5 Serie 6. Statistik-Tutorium. Lösungsskizzen Übung SS2005. Thilo Klein. Grundstudium Sommersemester 2008

Serie 1 Serie 2 Serie 3 Serie 4 Serie 5 Serie 6. Statistik-Tutorium. Lösungsskizzen Übung SS2005. Thilo Klein. Grundstudium Sommersemester 2008 Serie 1 Serie 2 Serie 3 Serie 4 Serie 5 Serie 6 Lösungsskizzen Übung SS2005 Grundstudium Sommersemester 2008 Serie 1 Serie 2 Serie 3 Serie 4 Serie 5 Serie 6 Inhalt Serie 1 Serie 2 Serie 3 Serie 4 Serie

Mehr

Werkzeuge der empirischen Forschung

Werkzeuge der empirischen Forschung Werkzeuge der empirischen Forschung I. Daten und Beschreibende Statistik 1. Einführung 2. Dateneingabe, Datentransformation, Datenbehandlung 3. Beschreibende Statistik II. Schließende Statistik 1 III.

Mehr

Beschreibende Statistik

Beschreibende Statistik Beschreibende Statistik Variablentypen Variablentypen Einteilung von Merkmalen Qualitative Merkmale (nominal und ordinal) qualitativ quantitativ Quantitative Merkmale (diskret und stetig) kategorial, artmäßig

Mehr

Inhaltsverzeichnis. 1 Über dieses Buch Zum Inhalt dieses Buches Danksagung Zur Relevanz der Statistik...

Inhaltsverzeichnis. 1 Über dieses Buch Zum Inhalt dieses Buches Danksagung Zur Relevanz der Statistik... Inhaltsverzeichnis 1 Über dieses Buch... 11 1.1 Zum Inhalt dieses Buches... 13 1.2 Danksagung... 15 2 Zur Relevanz der Statistik... 17 2.1 Beispiel 1: Die Wahrscheinlichkeit, krank zu sein, bei einer positiven

Mehr

Frank Lammers. Statistik I: deskriptive und explorative Statistik. Lehr- und Übungsbuch

Frank Lammers. Statistik I: deskriptive und explorative Statistik. Lehr- und Übungsbuch Frank Lammers Statistik I: deskriptive und explorative Statistik Lehr- und Übungsbuch 2004 Verlag der Gesellschaft für Unternehmensrechnung und Controlling m.b.h. Vorwort I Vorwort zur zweiten Auflage

Mehr

Diese Lücken sollten nicht auch bei Ihnen vorhanden sein: Aufgrund einer statistischen Untersuchung entsteht eine geordnete bzw. ungeordnete, die durc

Diese Lücken sollten nicht auch bei Ihnen vorhanden sein: Aufgrund einer statistischen Untersuchung entsteht eine geordnete bzw. ungeordnete, die durc SS 2017 Torsten Schreiber 222 Diese Lücken sollten nicht auch bei Ihnen vorhanden sein: Aufgrund einer statistischen Untersuchung entsteht eine geordnete bzw. ungeordnete, die durch Summierung je Ausprägung

Mehr

3. Lektion: Deskriptive Statistik

3. Lektion: Deskriptive Statistik Seite 1 von 5 3. Lektion: Deskriptive Statistik Ziel dieser Lektion: Du kennst die verschiedenen Methoden der deskriptiven Statistik und weißt, welche davon für Deine Daten passen. Inhalt: 3.1 Deskriptive

Mehr

Vorlesungsskript. Deskriptive Statistik. Prof. Dr. Günter Hellmig

Vorlesungsskript. Deskriptive Statistik. Prof. Dr. Günter Hellmig Vorlesungsskript Deskriptive Statistik Prof. Dr. Günter Hellmig Prof. Dr. Günter Hellmig Vorlesungsskript Deskriptive Statistik Erstes Kapitel Die Feingliederung des ersten Kapitels, welches sich mit einigen

Mehr

6.4 Der Kruskal-Wallis Test

6.4 Der Kruskal-Wallis Test 6.4 Der Kruskal-Wallis Test Der Test von Kruskal und Wallis, auch H-Test genannt, ist ein Test, mit dem man die Verteilungen von Teilstichproben auf Unterschiede untersuchen kann. Bei diesem Test geht

Mehr

4 Statistische Maßzahlen

4 Statistische Maßzahlen 4 Statistische Maßzahlen 4.1 Maßzahlen der mittleren Lage 4.2 Weitere Maßzahlen der Lage 4.3 Maßzahlen der Streuung 4.4 Lineare Transformationen, Schiefemaße 4.5 Der Box Plot Ziel: Charakterisierung einer

Mehr

beruflicher Bildungsabschluss incl. Hochschulabschl. 4Kat.(m) Häufigkeit Prozent Gültig Lehre/Beruffachgesundh.Schule ,2 59,2 59,2

beruflicher Bildungsabschluss incl. Hochschulabschl. 4Kat.(m) Häufigkeit Prozent Gültig Lehre/Beruffachgesundh.Schule ,2 59,2 59,2 Häufigkeiten Deskriptive Statistiken Häufigkeiten Beruflicher Bildungsabschluss (Mbfbil4) Zielvariablenliste OK Er erscheint: Statistiken beruflicher Bildungsabschluss incl. N Gültig 3445 Fehlend 0 beruflicher

Mehr

Statistik I. Übungklausur. Prof. Dr. H. Toutenburg

Statistik I. Übungklausur. Prof. Dr. H. Toutenburg Statistik I Übungklausur Prof. Dr. H. Toutenburg Hinweis: Die Zeitangaben sollen Ihnen aufzeigen wieviel Zeit Ihnen für eine Aufgabe von gewissem Umfang eingeräumt wird. Die Punktzahlen für die einzelnen

Mehr

10. Medizinische Statistik

10. Medizinische Statistik 10. Medizinische Statistik Projektplanung Deskriptive Statistik Inferenz-Statistik Literatur: Hüsler, J. und Zimmermann, H.: Statistische Prinzipien für medizinische Projekte, Verlag Hans Huber, 1993.

Mehr

Mathematische Statistik. Zur Notation

Mathematische Statistik. Zur Notation Mathematische Statistik dient dazu, anhand von Stichproben Informationen zu gewinnen. Während die Wahrscheinlichkeitsrechnung Prognosen über das Eintreten zufälliger (zukünftiger) Ereignisse macht, werden

Mehr

Eindimensionale Darstellungen

Eindimensionale Darstellungen Deskriptive Statistik Eindimensionale Darstellungen, Fraktile, Trimean, Box-Plot; Stem-and-Leaf 27.04.2009 1/52 Fraktile, Quantile und Quartile Allgemein werden Zerlegungen der geordneten Beobachtungsreihen

Mehr

Beide Verteilungen der Zeiten sind leicht schief. Der Quartilsabstand für Zeiten zum Surfen ist kleiner als der zum Fernsehen.

Beide Verteilungen der Zeiten sind leicht schief. Der Quartilsabstand für Zeiten zum Surfen ist kleiner als der zum Fernsehen. Welche der folgenden Maßzahlen sind resistent gegenüber Ausreißer? Der Mittelwert und die Standardabweichung. Der und die Standardabweichung. Der und die Spannweite. Der und der Quartilsabstand. Die Spannweite

Mehr

Lösungen. w58r4p Lösungen. w58r4p. Name: Klasse: Datum:

Lösungen. w58r4p Lösungen. w58r4p. Name: Klasse: Datum: Testen und Fördern Name: Klasse: Datum: 1) Ermittle jeweils das arithmetische Mittel. Ordne die Datenerhebungen nach der Größe der arithmetischen Mittel. Beginne mit dem Größten. 45, 39, 44, 48, 42, 39,

Mehr

Analyse von Querschnittsdaten. Arten von Variablen und Strategien der Datenanalyse

Analyse von Querschnittsdaten. Arten von Variablen und Strategien der Datenanalyse Analyse von Querschnittsdaten Arten von Variablen und Strategien der Datenanalyse Gliederung 1. Arten von Variablen 2. Analyse einzelner Variablen (univariate Verteilungen) 3. Analyse der Zusammenhänge

Mehr

Median 2. Modus < Median < Mittelwert. Mittelwert < Median < Modus. 2 Modalwerte oder Modus viel größer bzw. viel kleiner als Mittelwert

Median 2. Modus < Median < Mittelwert. Mittelwert < Median < Modus. 2 Modalwerte oder Modus viel größer bzw. viel kleiner als Mittelwert Universität Flensburg Zentrum für Methodenlehre Tutorium Statistik I Modus oder Modalwert (D) : - Geeignet für nominalskalierte Daten - Wert der häufigsten Merkmalsausprägung - Es kann mehrere Modalwerte

Mehr

1.8 Kolmogorov-Smirnov-Test auf Normalverteilung

1.8 Kolmogorov-Smirnov-Test auf Normalverteilung 1.8 Kolmogorov-Smirnov-Test auf Normalverteilung Der Kolmogorov-Smirnov-Test ist einer der klassischen Tests zum Überprüfen von Verteilungsvoraussetzungen. Der Test vergleicht die Abweichungen der empirischen

Mehr

Herzlich willkommen zur Vorlesung Statistik. Streuungsmaße oder die Unterschiedlichkeit der Daten nebst kurzen Ausführungen zu Schiefe und Wölbung

Herzlich willkommen zur Vorlesung Statistik. Streuungsmaße oder die Unterschiedlichkeit der Daten nebst kurzen Ausführungen zu Schiefe und Wölbung FB 1 W. Ludwig-Mayerhofer Statistik 1 Herzlich willkommen zur Vorlesung Statistik smaße oder die Unterschiedlichkeit der Daten nebst kurzen Ausführungen zu Schiefe und Wölbung FB 1 W. Ludwig-Mayerhofer

Mehr

Statistik II: Grundlagen und Definitionen der Statistik

Statistik II: Grundlagen und Definitionen der Statistik Medien Institut : Grundlagen und Definitionen der Statistik Dr. Andreas Vlašić Medien Institut (0621) 52 67 44 vlasic@medien-institut.de Gliederung 1. Hintergrund: Entstehung der Statistik 2. Grundlagen

Mehr

STATISTIK I Übung 04 Spannweite und IQR. 1 Kurze Wiederholung. Was sind Dispersionsparameter?

STATISTIK I Übung 04 Spannweite und IQR. 1 Kurze Wiederholung. Was sind Dispersionsparameter? STATISTIK I Übung 04 Spannweite und IQR 1 Kurze Wiederholung Was sind Dispersionsparameter? Die sogenannten Dispersionsparameter oder statistischen Streuungsmaße geben Auskunft darüber, wie die Werte einer

Mehr

Lagemasse und Streuung

Lagemasse und Streuung Lagemasse und Streuung Benjamin Schlegel 07. März 2016 Lagemasse sagen etwas über die Lage und das Zentrum der Daten aus, Streuungsmasse, wie die Daten um dieses Zentrum gestreut sind. Lagemasse Lagemasse

Mehr

Phallosan-Studie. Statistischer Bericht

Phallosan-Studie. Statistischer Bericht Phallosan-Studie Statistischer Bericht Verfasser: Dr. Clemens Tilke 15.04.2005 1/36 Inhaltsverzeichnis Inhaltsverzeichnis... 2 Einleitung... 3 Alter der Patienten... 4 Körpergewicht... 6 Penisumfang...

Mehr

4 Statistische Maßzahlen

4 Statistische Maßzahlen 4 Statistische Maßzahlen 4.1 Maßzahlen der mittleren Lage 4.2 Weitere Maßzahlen der Lage 4.3 Maßzahlen der Streuung 4.4 Lineare Transformationen, Schiefemaße 4.5 Der Box Plot Ziel: Charakterisierung einer

Mehr

1.4 Der Binomialtest. Die Hypothesen: H 0 : p p 0 gegen. gegen H 1 : p p 0. gegen H 1 : p > p 0

1.4 Der Binomialtest. Die Hypothesen: H 0 : p p 0 gegen. gegen H 1 : p p 0. gegen H 1 : p > p 0 1.4 Der Binomialtest Mit dem Binomialtest kann eine Hypothese bezüglich der Wahrscheinlichkeit für das Auftreten einer Kategorie einer dichotomen (es kommen nur zwei Ausprägungen vor, z.b. 0 und 1) Zufallsvariablen

Mehr

Statistik für Wirtschaftswissenschaftler

Statistik für Wirtschaftswissenschaftler Peter P. Eckstein Statistik für Wirtschaftswissenschaftler Eine real daten basierte Einführung mit SPSS GABLER Inhaltsverzeichnis Inhaltsverzeichnis VII 1 Statistik >...". 1 1.1 Historische Notizen 2 1.2

Mehr

Statistik SS Deskriptive Statistik. Bernhard Spangl 1. Universität für Bodenkultur. March 6, 2012

Statistik SS Deskriptive Statistik. Bernhard Spangl 1. Universität für Bodenkultur. March 6, 2012 Statistik SS 2012 Bernhard Spangl 1 1 Institut für angewandte Statistik und EDV Universität für Bodenkultur March 6, 2012 B. Spangl (Universität für Bodenkultur) Statistik SS 2012 March 6, 2012 1 / 19

Mehr

Univariate Kennwerte mit SPSS

Univariate Kennwerte mit SPSS Univariate Kennwerte mit SPSS In diesem Paper wird beschrieben, wie eindimensionale Tabellen und Kennwerte mit SPSS erzeugt werden. Eine Herleitung der Kennwerte und eine inhaltliche Interpretation der

Mehr

Graphische Darstellung einer univariaten Verteilung:

Graphische Darstellung einer univariaten Verteilung: Graphische Darstellung einer univariaten Verteilung: Die graphische Darstellung einer univariaten Verteilung hängt von dem Messniveau der Variablen ab. Bei einer graphischen Darstellung wird die Häufigkeit

Mehr

Uwe Hassler. Statistik im. Bachelor-Studium. Eine Einführung. für Wirtschaftswissenschaftler. ^ Springer Gabler

Uwe Hassler. Statistik im. Bachelor-Studium. Eine Einführung. für Wirtschaftswissenschaftler. ^ Springer Gabler Uwe Hassler Statistik im Bachelor-Studium Eine Einführung für Wirtschaftswissenschaftler ^ Springer Gabler 1 Einführung 1 2 Beschreibende Methoden univariater Datenanalyse 5 2.1 Grundbegriffe 5 2.2 Häufigkeitsverteilungen

Mehr

TESTTHEORIE UND TESTKONSTRUKTION - PRAKTISCHE ANWENDUNG - TEIL 1

TESTTHEORIE UND TESTKONSTRUKTION - PRAKTISCHE ANWENDUNG - TEIL 1 TESTTHEORIE UND TESTKONSTRUKTION - PRAKTISCHE ANWENDUNG - TEIL 1 Prof. Dr. Franke SS2012 Hochschule Magdeburg-Stendal (FH) M.Sc. Rehabilitationspsychologie Gliederung Einführung in Datensatz Stichprobenbeschreibung

Mehr

PROC NPAR1WAY. zum Durchführen des U-Tests für zwei unverbundene Stichproben (für quantitative nicht-normalverteilte Merkmale)

PROC NPAR1WAY. zum Durchführen des U-Tests für zwei unverbundene Stichproben (für quantitative nicht-normalverteilte Merkmale) PROC NPAR1WAY zum Durchführen des U-Tests für zwei unverbundene Stichproben (für quantitative nicht-normalverteilte Merkmale) Allgemeine Form: PROC NPAR1WAY DATA=name Optionen ; VAR variablenliste ; CLASS

Mehr

4. Kumulierte Häufigkeiten und Quantile

4. Kumulierte Häufigkeiten und Quantile 4. Kumulierte Häufigkeiten und Quantile Statistik für SoziologInnen 1 4. Kumulierte Häufigkeiten und Quantile Kumulierte Häufigkeiten Oft ist man nicht an der Häufigkeit einzelner Merkmalsausprägungen

Mehr

Dr. Maike M. Burda. Welchen Einfluss hat die Körperhöhe auf das Körpergewicht? Eine Regressionsanalyse. HU Berlin, Econ Bootcamp

Dr. Maike M. Burda. Welchen Einfluss hat die Körperhöhe auf das Körpergewicht? Eine Regressionsanalyse. HU Berlin, Econ Bootcamp Dr. Maike M. Burda Welchen Einfluss hat die Körperhöhe auf das Körpergewicht? Eine Regressionsanalyse. HU Berlin, Econ Bootcamp 8.-10. Januar 2010 BOOTDATA.GDT: 250 Beobachtungen für die Variablen... cm:

Mehr

STATISTIK I Übung 07 Box-Plots und Stem-and-Leaf-Diagramme. 1 Kurze Wiederholung. Warum nur zwei grafische Darstellungsformen?

STATISTIK I Übung 07 Box-Plots und Stem-and-Leaf-Diagramme. 1 Kurze Wiederholung. Warum nur zwei grafische Darstellungsformen? STATISTIK I Übung 07 Box-Plots und Stem-and-Leaf-Diagramme 1 Kurze Wiederholung Warum nur zwei grafische Darstellungsformen? Im Rahmen der Vorlesungen haben wir kurz eine ganze Reihe grafischer Darstellungsformen

Mehr

Einführung in Quantitative Methoden

Einführung in Quantitative Methoden Einführung in Quantitative Methoden Mag. Dipl.Ing. Dr. Pantelis Christodoulides & Mag. Dr. Karin Waldherr SS 2011 Christodoulides / Waldherr Einführung in Quantitative Methoden- 2.VO 1/62 Summenzeichen

Mehr

Sommersemester Marktforschung

Sommersemester Marktforschung Dipl.-Kfm. Sascha Steinmann Universität Siegen Lehrstuhl für Marketing steinmann@marketing.uni-siegen.de Sommersemester 2010 Marktforschung Übungsaufgaben zu den Themen 3-6 mit Lösungsskizzen Aufgabe 1:

Mehr

Einige Grundbegriffe der Statistik

Einige Grundbegriffe der Statistik Einige Grundbegriffe der Statistik Philipp Mitteröcker Basic terms Statistik (statistics) stammt vom lateinischen statisticum ( den Staat betreffend ) und dem italienischen statista ( Staatsmann" oder

Mehr

(x i x) 2. (x i a) 2, x i x med. x i a. i=1. 3 Lage- und Streuungsmaße 134

(x i x) 2. (x i a) 2, x i x med. x i a. i=1. 3 Lage- und Streuungsmaße 134 Lagemaße als Lösung eines Optimierungsproblems 3.1 Lagemaße Gegeben sei die Urliste x 1,...,x n eines intervallskalierten Merkmals X, die zu einer Zahl a zusammengefasst werden soll. Man könnte sagen,

Mehr

Statistics, Data Analysis, and Simulation SS 2015

Statistics, Data Analysis, and Simulation SS 2015 Mainz, June 11, 2015 Statistics, Data Analysis, and Simulation SS 2015 08.128.730 Statistik, Datenanalyse und Simulation Dr. Michael O. Distler Dr. Michael O. Distler

Mehr

Übungsrunde 2, Gruppe 2 LVA , Übungsrunde 1, Gruppe 2, Markus Nemetz, TU Wien, 10/2006

Übungsrunde 2, Gruppe 2 LVA , Übungsrunde 1, Gruppe 2, Markus Nemetz, TU Wien, 10/2006 1 1.2.3.4. 1.1 Angabe Übungsrunde 2, Gruppe 2 LVA 107.369, Übungsrunde 1, Gruppe 2, 24.10. Markus Nemetz, markus.nemetz@tuwien.ac.at, TU Wien, 10/2006 Bestimmen Sie für den Datensatz bulb.dat die Quartile,

Mehr

Aufgaben zu Kapitel 9

Aufgaben zu Kapitel 9 Aufgaben zu Kapitel 9 Aufgabe 1 Für diese Aufgabe benötigen Sie den Datensatz Nominaldaten.sav. a) Sie arbeiten für eine Marktforschungsfirma und sollen überprüfen ob die in diesem Datensatz untersuchte

Mehr

1.1 Graphische Darstellung von Messdaten und unterschiedliche Mittelwerte. D. Horstmann: Oktober

1.1 Graphische Darstellung von Messdaten und unterschiedliche Mittelwerte. D. Horstmann: Oktober 1.1 Graphische Darstellung von Messdaten und unterschiedliche Mittelwerte D. Horstmann: Oktober 2014 4 Graphische Darstellung von Daten und unterschiedliche Mittelwerte Eine Umfrage nach der Körpergröße

Mehr

Anteile Häufigkeiten Verteilungen Lagemaße Streuungsmaße Merkmale von Verteilungen. Anteile Häufigkeiten Verteilungen

Anteile Häufigkeiten Verteilungen Lagemaße Streuungsmaße Merkmale von Verteilungen. Anteile Häufigkeiten Verteilungen DAS THEMA: VERTEILUNGEN LAGEMAßE - STREUUUNGSMAßE Anteile Häufigkeiten Verteilungen Lagemaße Streuungsmaße Merkmale von Verteilungen Anteile Häufigkeiten Verteilungen Anteile und Häufigkeiten Darstellung

Mehr

0 Einführung: Was ist Statistik

0 Einführung: Was ist Statistik 0 Einführung: Was ist Statistik 1 Datenerhebung und Messung 2 Univariate deskriptive Statistik Häufigkeitsverteilungen Statistische Kennwerte 3 Multivariate Statistik 4 Regression 5 Ergänzungen Deskriptive

Mehr

Umgang mit und Ersetzen von fehlenden Werten bei multivariaten Analysen

Umgang mit und Ersetzen von fehlenden Werten bei multivariaten Analysen Umgang mit und Ersetzen von fehlenden Werten bei multivariaten Analysen Warum überhaupt Gedanken machen? Was fehlt, ist doch weg, oder? Allgegenwärtiges Problem in psychologischer Forschung Bringt Fehlerquellen

Mehr