Deskriptive Statistik. Statistik mit R Heike Zinsmeister
|
|
- Henriette Buchholz
- vor 7 Jahren
- Abrufe
Transkript
1 Deskriptive Statistik Statistik mit R Heike Zinsmeister
2 Abgrenzung: deskriptive vs. analytische Statistik (1) Deskriptive Statistik = beschreibende Statistik Aufgabe Zustände und Vorgänge beschreiben Methoden Tabelle, grafische Darstellungen, Verhältniszahlen, typische Kenngrößen wie Lagema (z. B. arithmetischer Mittelwert) und Streuungsmaße (z. B. Varianz und Standardabweichung) Ursprung von Herrschern benötigte Daten über die Bevölkerung, z B. die Zahl der wehrfähigen Männer durch den Spieltrieb angeregte Überlegungen über Wettchancen beim Würfelspiel 1
3 Abgrenzung: deskriptive vs. analytische Statistik (2) Analytische Statistik = beurteilende Statistik Aufgabe anhand von geeigneten Daten auf allgemeine Gesetzmäßigkeiten schließen, die über den Beobachtungsraum hinaus gültig sind Methoden anhand von Zufallsstichproben auf die Grundgesamtheit schließen; Prüfen von Hypothesen über die Grundgesamtheit; statistische Kenngröße: (Zufalls-)Fehler Ursprung in der politischen Arithmetik, die sich mit Tauf, Heirats- und Sterberegistern beschäftigte, um Geschlechtsverhältnisse, Fruchtbarkeit, Altersaufbau und Sterblichkeit der Bevölkerung abzuschätzen basiert auf der Wahrscheinlichkeitsrechnung, die mathematische Methoden zur Erfassung stochastischer Experimente beschreibt. 2
4 Maße der zentralen Tendenz Charakterisieren eine Verteilung durch eine einzelne Zahl Modalwert (mode) Häufigster Wert einer Verteilung Median (median) Zentralwert Geeignet für ordinale Daten Arithmetisches Mittel (arithmetic mean) Summe aller Werte eines Vektors geteilt durch Anzahl der Werte Geometrisches Mittel (geometric mean) Bei relativen Änderungen (z.b. Wachstum, Zuwachsraten, Produktionssteigung) 3
5 Maße der zentralen Tendenz Modalwert (mode) Häufigster Wert einer Verteilung bei allen Datentypen einsetzbar, einschließlich nominalen/kategorialen Daten In R (nach Gries 2008: 113) > x <-c("kalt", "lau", "kalt", "kalt", "warm", "heiß", "warm", "lau") > which.max(sort(table(x))) kalt 4 Die Zahl gibt nur den Index an, nicht die Häufigkeit! Vgl. table (x) 4
6 Beispiel Durchschnittliche Temperaturen Jan Feb Mär Apr Mai Jun Jul Aug Sep Okt Nov Dez S S (Gries 2008: 117f.) 5
7 Maße der zentralen Tendenz Median (median) Zentralwert die Werte nach ihrer Größe sortieren und den Mittleren wählen bei einer geradzahligen Menge von Elementen das arithmetische Mittel der beiden Mittelwerte geeignet für Ordinal-, Intervall- und Verhältnisvariablen In R: > Stadt1= c(-5,-12,5,12,15,18,22,23,20,16,8,1) > median(stadt1) [1] 13.5 > Stadt2= c(6,7,8,9,10,12,16,15,11,9,8,7) > median(stadt2) [1] 9 6
8 Maße der zentralen Tendenz Arithmetisches Mittel (arithmetic mean) Summe aller Werte geteilt durch die Anzahl n aller Werte angemessen nur für metrische Variablen (Intervall- und Verhältnisvariablen) > sum(stadt1)/length(stadt1) [1] > mean(stadt1) [1] > mean(stadt2) [1] > round(mean(stadt2),2) [1] 9.83 µ = n i=1 n x i x 7
9 Streuungsmaße: Motivation > mean(stadt1) [1] > mean(stadt2) [1] > plot(stadt1, type="b", xlab="monate", ylab="temperatur", col="darkgreen") > lines(c(rep(0,12)), col="lightgrey") > lines(stadt2, type="b", col="darkblue") 8
10 Dispersion und Streuung Bei Mittelwertangaben immer auch ein Dispersions- oder Streuungsmaß angeben. Extremeres Beispiel: > Verteilung_1! [1] ! > Verteilung_2! [1] ! mean(verteilung_1)! [1] 5! mean(verteilung_2)! [1] 5! median(verteilung_1)! [1] 5! median(verteilung_2)! [1] 5 par(mfrow=c(2,1)); plot(verteilung_1, type="b"); plot(verteilung_2, 9 type="b")
11 Streuungsmaße Relativer Informationsgehalt / relative Entropie (relative entropy) z.b. Häufigkeitsverteilung von kategorialen Daten H=1, wenn die Werte maximal gleichmäßig über alle Ausprägungen verteilt sind H=0, wenn alle Werte die selbe Ausprägung annehmen (Zentralwert) H rel = n i=1 ( p i ln p i ) lnn Bsp.: 300 NPs, davon 164 ohne Artikel, 33 mit indefinitem, 103 mit definitem Artikel (Gries 2008:119) > artikel<-c(164, 33, 103) > prozente<-artikel/sum(artikel) > hrel<--sum(prozente*log(prozente))/log(length(prozente)); hrel [1]
12 Streuungsmaße Spannweite / Variationsbreite (range) Verhältnisskalierte Daten Differenz des höchsten und niedrigsten Wertes Einfach, aber empfindlich gegenüber Ausreißern > range(stadt1) [1] > diff(range(stadt1)) # diff bildet paarweise Differenzen [1] 35 > max(stadt1)-min(stadt1) # alternative Berechnung [1] 35 > range(stadt1)[2]-range(stadt1)[1] # zweite Alternative [1] 35 > range(stadt2) [1] 6 16 > diff(range(stadt2)) # diff bildet paarweise Differenzen [1] 10 11
13 Streuungsmaße Quantile Aufsteigend sortierte Werte Angabe, welcher Wert die niedrigsten x%, y% usw. abgrenzt > quantile(a, probs=c(0.05, 0.1, 0.5, 0.9, 0.95), type=1) 5% 10% 50% 90% 95% Sonderfall: Quartile (= Default des Aufrufs von quantile()) > quantile(stadt1) 0% 25% 50% 75% 100% > IQR(Stadt1) # die Funktion fuer den Interquartilsabstand [1] 14.5 > quantile(stadt2) 0% 25% 50% 75% 100% > IQR(Stadt2) [1] 3.5 Spannbreite zwischen dem Wert der 25%- Quartile und der 75%-Quartile, d.h. die Spannbreite in denen sich die Werte der mittleren 50% der Datenpunkte befinden. 12
14 Durchschnittliche Abweichung average deviation Für jeden Datenpunkt wird die Abweichung zum Mittelwert µ angegeben Die absoluten Abweichungen werden summiert und gemittelt (d.h. durch die Anzahl n der Datenpunkte geteilt). AD = n i=1 ( x i µ) n 13
15 Durchschnittliche Abweichung Beispiel > Stadt1 [1] > Stadt1-mean(Stadt1) [1] [10] > abs(stadt1-mean(stadt1)) # Absolutbeträge [1] [12] 9.25 > mean(abs(stadt1-mean(stadt1))) [1] > mean(abs(stadt2-mean(stadt2))) [1]
16 Streuungsmaße Varianz Summe der quadratischen Abweichungen vom Mittelwert µ > var(stadt1) [1] > var(stadt2) [1] var = n i=1 (x i µ) 2 n 15
17 Standardabweichung Wurzel der Varianz ist das meist verbreitete Streuungsmaß Nachteil Ist abhängig von der Höhe des Mittelwerts Schlechter Vergleich von Verteilungen mit unterschiedlichen Mittelwerten > sd(stadt1) [1] > sd(stadt2) [1] sd = n i=1 (x i µ) 2 n 16
18 Standardfehler Abweichung eines Mittelwerts von gleich großen Stichproben aus einer Population / Gesamtheit je größer der Stanardfehler, desto schlechter schätzt ein beobachteter Mittelwert einer Stichprobe den Mittelwert der Gesamtheit SE Mittelwert = var n = sd n SE Pr ozentwert = p (1 p) n Sinnvoll bei: n 30, normalverteilt 17
19 Variationskoeffizient Normalisiert die Standardabweichung in Bezug auf die Größe des Mittelwerts Division der Standardabweichung durch den Mittelwert > sd(stadt1) [1] > sd(stadt1*10) [1] # Vergleich nicht möglich > sd(stadt1)/mean(stadt1) [1] > sd(stadt1*10)/mean(stadt1*10) # nun erhalten wir den gleichen Wert [1] > sd(stadt2)/mean(stadt2) [1]
20 Zusammenfassende Funktion > summary(stadt1) Min. 1st Qu. Median Mean 3rd Qu. Max > summary(stadt2) Min. 1st Qu. Median Mean 3rd Qu. Max
21 Zusammenfassende Darstellung Boxplot (siehe Gries 2008: 125) > boxplot(stadt1, Stadt2, notch=t) > text(1:2, c(mean(stadt1), mean(stadt2)), c("+", "+")) > summary(stadt1) Min. 1st Qu. Median Mean 3rd Qu. Max > summary(stadt2) Min. 1st Qu. Median Mean 3rd Qu. Max
22 Zusammenfassende Darstellung Boxplot horizontale fette Linie = Median horizontale Linie, die obere und untere Grenze der Box darstellen = obere und untere Hinges (ca. der 75%- und 25%-Quartil) die gestrichelte vertikale Linien mit den horizontalen Begrenzungen (Whiskers) markieren den höchsten und niedrigsten Werte, die nicht mehr als 1.5 Interquartilsabstände von der Box entfernt sind Ausreißer außerhalb der Whiskers werden mit einzelnem Punkt dargestellt die durch notch=true erzeugten Einschnürungen erstrecken sich über den Bereich ±1.58*IQR/sqrt(n): wenn sich die Einschnürungen nicht überlappen (sondern eine die andere einschließt), unterscheiden sich die Mediane wahrscheinlich nicht signifikant. 21
23 Standardisierung (z-werte) Notwendig beim Vergleich von unterschiedlichen Skalen Bsp.: Noten aus unterschiedlichen Klassenarbeiten Güte zweier Noten, die zu zwei Verteilungen mit unterschiedlichen Durchschnitten (mean) gehören. Transformation der Abstände zum jeweiligen Mittelwert in die Anzahl der jeweiligen Standardabweichungen, die der Wert abweicht. Z-transformierte Werte besitzen einen Mittelwert von 0 und eine Standardabweichung von 1 22
24 Standardisierung (z-werte) > a<-1:5 # Beispielverteilung > z.werte<-(a-mean(a))/sd(a); z.werte #"zu Fuß" [1] > mean(z.werte) # standardisierter Mittelwert [1] 0 > sd(z.werte)# standardisierte Standardabweichung [1] 1 > scale(a) # Standardisierungsfunktion in R [,1] [1,] [2,] [3,] [4,] [5,] attr(,"scaled:center") # Mittelwert der Eingabedaten [1] 3 attr(,"scaled:scale") # Standardabweichung der Eingabedaten [1]
25 Standardisierung (z-werte) Beispiel nach Gries (2008:127) Frage: Wenn Schüler X in Kurs A eine 2 erhalten hat und Schüler Y in Kurs B eine 3, ist Schüler X dann wirklich besser als Schüler Y? > Noten.vom.Kurs.A<-rep(1:6, 6:1); Noten.vom.Kurs.A > Noten.vom.Kurs.B<-rep(1:6, 1:6); Noten.vom.Kurs.B > scale(noten.vom.kurs.a) > scale(noten.vom.kurs.b) Note 2 in Kurs A: z-wert = [7,] Note 3 in Kurs B: z-wert = [2,]
26 Konfidenzintervalle Bisher: Häufigkeiten einer Variablenausprägung / Mittelwerte etc. einer Variable in einer Stichprobe Neu: Wie gut charakterisiert der Kennwert der Stichprobe die Gesamtheit? Wie lang sind (wahrscheinlich) die Vorfelder aller Texte des L2-Lernenden / aller L2-Lernenden (in Buchstaben)? Wie häufig steht (wahrscheinlich) eine Nominalphrase im Vorfeld aller Sätze des L2-Lernenden / aller L2- Lernenden? Standard: 95%ige Konfidenz 25
27 Konfidenzintervall: Mittelwert mean(buchstaben,na.rm=t)! [1] ! Welche wahren Populationsmittelwerte könnten den Stichprobenmittelwert von ca mit einer 95%igen Wahrscheinlichkeit erzeugt haben?! t.test(buchstaben, conf.level=0.95)$conf.int! [1] ! attr(,"conf.level")! [1] 0.95! Relevanz: Vergleich von zwei Mittelwerten. Überlappen die Konfidenzintervalle nicht Signifikanter Unterschied der Mittelwerte Sinnvoll bei: n 30, normalverteilt Mittelwert: 7,86 (95%-K.I.: 5,24 10,47) Die Umkehrung gilt nicht zwingend! Vgl. Crawley 2005: 169f. nach Gries 2008:
28 Konfidenzintervall: Häufigkeit Häufigkeiten von Kategorien im Vorfeld > table(kategorie)! Kategorie! AdvP NP PP Satz! ! 95%-Konfidenzintervall für den Prozentanteil von 55,17% für NP (16/29 = )! > prop.test(16,29, conf.level=0.95)$conf.int! [1] ! attr(,"conf.level")! [1] 0.95! In 55,17% der Vorfelder steht eine NP (95%-K.I.: 35,98% - 73,05%) 27
29 Visualisierung von Häufigkeiten Punkt-/Streu- und Liniendiagramme Abbildung individueller Datenpunkte eines Vektors Bsp. Vektor (1, 3, 5, 2, 4) plot(c(1,3,5,2,4))! plot(c(1,3,5,2,4), type="l")! plot(c(1,3,5,2,4), type= b")! 28
30 Visualisierung von Häufigkeiten Kreis- und Säulendiagramme Nominal-/Kategorialvariablen Bsp. Häufigkeiten von Pausenelementen pie(table(filler))! barplot(table(filler), col=c("grey20", "grey40", "grey60"), names.arg=c("aeh", "Aehm", "Stille")) 29
31 Visualisierung von Häufigkeiten Histogramme Klassenbildung über Verhältnisdaten Bsp. Häufigkeiten der Längen von Planungspausen abgebildet auf Längenklassen hist(laenge, main="", xlab="laenge in ms", ylab="haeufigkeit", xlim=c(0, 2000), ylim=c(0, 100), col="grey80")
32 Referenzen Stefan Th. Gries Statistik für Sprachwissenschaftler. Vandenhoeck & Ruprecht. Kapitel 1 und 3. Andere: K. Backhaus, W. Plinke und B. Erichson Multivariate Analysemethoden Eine anwendungsorientierte Einführung, Berlin: Springer. Ellen F. Prince Toward a taxonomy of given-new information. In Peter Cole (Hrsg.) Radical Pragmatics. New York: Academic Press Ellen F. Prince How not to mark topics: Topicalization in English and Yiddish. 8 Texas Linguistics Forum. Lothar Sachs und Jürgen Hedderich Angewandte Statistik, Berlin: Springer. 1-2 Michael Strube und Udo Hahn Functional Centering Grounding Referential Coherence in Information Structure. Computational Linguistics, Volume 25, Number 3, September
Deskriptive Statistik II. Statistische Methoden in der Korpuslinguistik Heike Zinsmeister WS 2008/09
Deskriptive Statistik II Statistische Methoden in der Korpuslinguistik Heike Zinsmeister WS 2008/09 Übersicht Wiederholung Maße der zentralen Tendenz Streuungsmaße Zusammenfassung einer Verteilung tabellarisch
MehrDeskriptive Statistik. Korpuslinguistik Heike Zinsmeister WS 2009/10
Deskriptive Statistik Korpuslinguistik Heike Zinsmeister WS 2009/10 Abgrenzung: deskriptive vs. analytische Statistik (1) Deskriptive Statistik = beschreibende Statistik Aufgabe Zustände und Vorgänge beschreiben
MehrQuantitative Auswertung. Korpuslinguistik Dr. Heike Zinsmeister
Quantitative Auswertung Korpuslinguistik Dr. Heike Zinsmeister 02.12.2011 Analysetypen Deskriptive Statistik Beschreibung der 'Gestalt' von Datenverteilungen Grafische Darstellungen Zentrale Maße (Mittelwert
MehrGundlagen empirischer Forschung & deskriptive Statistik. Statistische Methoden in der Korpuslinguistik Heike Zinsmeister WS 2008/09
Gundlagen empirischer Forschung & deskriptive Statistik Statistische Methoden in der Korpuslinguistik Heike Zinsmeister WS 2008/09 Grundlagen Vorbereitung einer empirischen Studie Allgemeine Beschreibung
MehrGrundlagen empirischer Forschung Statistik mit R Heike Zinsmeister WS 2010/11
Grundlagen empirischer Forschung 27.10.2011 Statistik mit R Heike Zinsmeister WS 2010/11 Übersicht Grundlagen Beispiel für Übung 4 Operationalisierung Skalenniveaus Hypothesen Ur-Datensets 1 Grundlagen
MehrStatistik K urs SS 2004
Statistik K urs SS 2004 3.Tag Grundlegende statistische Maße Mittelwert (mean) Durchschnitt aller Werte Varianz (variance) s 2 Durchschnittliche quadrierte Abweichung aller Werte vom Mittelwert >> Die
MehrKonfidenzintervalle. Statistische Methoden in der Korpuslinguistik Heike Zinsmeister WS 2008/09
Konfidenzintervalle Statistische Methoden in der Korpuslinguistik Heike Zinsmeister WS 2008/09 Münzspiel Experiment 100 Münzwürfe: Stefan gewinnt bei "Kopf" Hypothesen H 0 : Stefan wird so oft gewinnen
MehrVerfahren für metrische Variable
Verfahren für metrische Variable Grafische Methoden Histogramm Mittelwertsplot Boxplot Lagemaße Mittelwert, Median, Quantile Streuungsmaße Standardabweichung, Interquartilsabstand Lagemaße und Streumaße
MehrBitte am PC mit Windows anmelden!
Einführung in SPSS Plan für heute: Grundlagen/ Vorwissen für SPSS Vergleich der Übungsaufgaben Einführung in SPSS http://weknowmemes.com/generator/uploads/generated/g1374774654830726655.jpg Standardnormalverteilung
MehrStatistik und Wahrscheinlichkeitsrechnung
Statistik und Wahrscheinlichkeitsrechnung 3. Vorlesung Dr. Jochen Köhler 1 Inhalte der heutigen Vorlesung Ziel: Daten Modellbildung Probabilistisches Modell Wahrscheinlichkeit von Ereignissen Im ersten
MehrW-Seminar: Versuche mit und am Menschen 2017/2019 Skript
3. Deskriptive Statistik Die deskriptive (auch: beschreibende) Statistik hat zum Ziel, [ ] Daten durch Tabellen, Kennzahlen [ ] und Grafiken übersichtlich darzustellen und zu ordnen. Dies ist vor allem
MehrHäufigkeitsverteilungen und Statistische Maßzahlen. Häufigkeitsverteilungen und Statistische Maßzahlen. Variablentypen. Stichprobe und Grundgesamtheit
TECHNISCHE UNIVERSITÄT MÜNCHEN-WEIHENSTEPHAN MATHEMATIK UND STATISTIK INFORMATIONS- UND DOKUMENTATIONSZENTRUM R. Häufigkeitsverteilungen und Statistische Maßzahlen Statistik SS Variablentypen Qualitative
Mehr1. Maße der zentralen Tendenz Beispiel: Variable Anzahl der Geschwister aus Jugend '92. Valid Cum Value Frequency Percent Percent Percent
Deskriptive Statistik 1. Verteilungsformen symmetrisch/asymmetrisch unimodal(eingipflig) / bimodal (zweigipflig schmalgipflig / breitgipflig linkssteil / rechtssteil U-förmig / abfallend Statistische Kennwerte
MehrUnivariate Häufigkeitsverteilungen Kühnel, Krebs 2001: Statistik für die Sozialwissenschaften, S.41-66
Univariate Häufigkeitsverteilungen Kühnel, Krebs 2001: Statistik für die Sozialwissenschaften, S.41-66 Gabriele Doblhammer: Empirische Sozialforschung Teil II, SS 2004 1/19 Skalenniveaus Skalenniveau Relation
MehrBivariate Verteilungen. Statistische Methoden in der Korpuslinguistik Heike Zinsmeister WS 2008/09
Bivariate Verteilungen Statistische Methoden in der Korpuslinguistik Heike Zinsmeister WS 2008/09 Wiederholung Konfidenzintervalle Abschätzung wie gut eine Stichprobe die Grundgesamtheit repräsentiert
MehrKapitel 1 Beschreibende Statistik
Beispiel 1.25: fiktive Aktienkurse Zeitpunkt i 0 1 2 Aktienkurs x i 100 160 100 Frage: Wie hoch ist die durchschnittliche Wachstumsrate? Dr. Karsten Webel 53 Beispiel 1.25: fiktive Aktienkurse (Fortsetzung)
MehrDeskriptive Statistik
Deskriptive Statistik Deskriptive Statistik: Ziele Daten zusammenfassen durch numerische Kennzahlen. Grafische Darstellung der Daten. Quelle: Ursus Wehrli, Kunst aufräumen 1 Modell vs. Daten Bis jetzt
MehrAnteile Häufigkeiten Verteilungen Lagemaße Streuungsmaße Merkmale von Verteilungen. Anteile Häufigkeiten Verteilungen
DAS THEMA: VERTEILUNGEN LAGEMAßE - STREUUUNGSMAßE Anteile Häufigkeiten Verteilungen Lagemaße Streuungsmaße Merkmale von Verteilungen Anteile Häufigkeiten Verteilungen Anteile und Häufigkeiten Darstellung
MehrStatistik I. Methodologie der Psychologie
Statistik I Methodologie der Psychologie Thomas Schmidt & Lena Frank Wintersemester 2003/2004 Georg-Elias-Müller-Institut für Psychologie Uni Göttingen Literatur: Glantz, S.A. (2002). Primer of Biostatistics.
MehrInhaltsverzeichnis. Inhalt Teil I: Beschreibende (Deskriptive) Statistik Seite. 1.0 Erste Begriffsbildungen Merkmale und Skalen 5
Inhaltsverzeichnis Inhalt Teil I: Beschreibende (Deskriptive) Statistik Seite 1.0 Erste Begriffsbildungen 1 1.1 Merkmale und Skalen 5 1.2 Von der Urliste zu Häufigkeitsverteilungen 9 1.2.0 Erste Ordnung
MehrDeskription, Statistische Testverfahren und Regression. Seminar: Planung und Auswertung klinischer und experimenteller Studien
Deskription, Statistische Testverfahren und Regression Seminar: Planung und Auswertung klinischer und experimenteller Studien Deskriptive Statistik Deskriptive Statistik: beschreibende Statistik, empirische
MehrEinführung in Quantitative Methoden
Einführung in Quantitative Methoden Mag. Dipl.Ing. Dr. Pantelis Christodoulides & Mag. Dr. Karin Waldherr SS 2014 Christodoulides / Waldherr Einführung in Quantitative Methoden- 2.VO 1/57 Die Deskriptivstatistik
Mehr2. Deskriptive Statistik
Philipps-Universitat Marburg 2.1 Stichproben und Datentypen Untersuchungseinheiten: mogliche, statistisch zu erfassende Einheiten je Untersuchungseinheit: ein oder mehrere Merkmale oder Variablen beobachten
MehrDeskriptive Statistik
Deskriptive Statistik 1 Ziele In der deskriptiven (=beschreibenden) Statistik werden Untersuchungsergebnisse übersichtlich dargestellt, durch Kennzahlen charakterisiert und grafisch veranschaulicht. 2
MehrStatistik SS Deskriptive Statistik. Bernhard Spangl 1. Universität für Bodenkultur. March 6, 2012
Statistik SS 2012 Bernhard Spangl 1 1 Institut für angewandte Statistik und EDV Universität für Bodenkultur March 6, 2012 B. Spangl (Universität für Bodenkultur) Statistik SS 2012 March 6, 2012 1 / 19
MehrMethodenlehre. Vorlesung 10. Prof. Dr. Björn Rasch, Cognitive Biopsychology and Methods University of Fribourg
Methodenlehre Vorlesung 10 Prof. Dr., Cognitive Biopsychology and Methods University of Fribourg 1 Methodenlehre I Woche Datum Thema 1 FQ Einführung, Verteilung der Termine 1 25.9.13 Psychologie als Wissenschaft
MehrMethodenlehre. Vorlesung 10. Prof. Dr. Björn Rasch, Cognitive Biopsychology and Methods University of Fribourg
Methodenlehre Vorlesung 10 Prof. Dr., Cognitive Biopsychology and Methods University of Fribourg 1 Methodenlehre II Woche Datum Thema 1 FQ Einführung, Verteilung der Termine 1 18.2.15 Psychologie als Wissenschaft
MehrLage- und Streuungsparameter
Lage- und Streuungsparameter Beziehen sich auf die Verteilung der Ausprägungen von intervall- und ratio-skalierten Variablen Versuchen, diese Verteilung durch Zahlen zu beschreiben, statt sie graphisch
MehrStatistik und Wahrscheinlichkeitsrechnung
Statistik und Wahrscheinlichkeitsrechnung Übung 3 1 Inhalt der heutigen Übung Vorrechnen der Hausübung B.7 Beschreibende Statistik Gemeinsames Lösen der Übungsaufgaben C.1: Häufigkeitsverteilung C.2: Tukey
MehrStatistik für NichtStatistiker
Statistik für NichtStatistiker Zufall und Wahrscheinlichkeit von Prof. Dr. Karl Bosch 5., verbesserte Auflage R. Oldenbourg Verlag München Wien Inhaltsverzeichnis 1. ZufalLsexperimente und zufällige Ereignisse
MehrDeskriptive Statistik. (basierend auf Slides von Lukas Meier)
Deskriptive Statistik (basierend auf Slides von Lukas Meier) Deskriptive Statistik: Ziele Daten zusammenfassen durch numerische Kennzahlen. Grafische Darstellung der Daten. Quelle: Ursus Wehrli, Kunst
MehrDas arithmetische Mittel. x i = = 8. x = 1 4. und. y i = = 8
.2 Einige statistische Maßzahlen.2. Die Schusser in zwei Familien Die vier Kinder der Familie Huber haben x = 5, x 2 = 7, x 3 = 9, x 4 = Schusser. Die vier Kinder der Familie Maier haben y = 7, y 2 = 7,
MehrDiese Lücken sollten nicht auch bei Ihnen vorhanden sein: Aufgrund einer statistischen Untersuchung entsteht eine geordnete bzw. ungeordnete, die durc
SS 2017 Torsten Schreiber 222 Diese Lücken sollten nicht auch bei Ihnen vorhanden sein: Aufgrund einer statistischen Untersuchung entsteht eine geordnete bzw. ungeordnete, die durch Summierung je Ausprägung
MehrKapitel 3: Lagemaße. Ziel. Komprimierung der Daten zu einer Kenngröße, welche die Lage, das Zentrum der Daten beschreibt
Kapitel 3: Lagemaße Ziel Komprimierung der Daten zu einer Kenngröße, welche die Lage, das Zentrum der Daten beschreibt Dr. Matthias Arnold 52 Definition 3.1 Seien x 1,...,x n Ausprägungen eines kardinal
MehrEin metrisches Merkmal
Kapitel 4 Ein metrisches Merkmal 4.1 Wie kann man ein metrisches Merkmal numerisch beschreiben? Häufigkeitstabellen erzeugt man mit table. Das arithmetische Mittel und den Median berechnet man mit mean
MehrStatistik eindimensionaler Größen
Statistik eindimensionaler Größen Michael Spielmann Inhaltsverzeichnis 1 Aufgabe der eindimensionalen Statistik 2 2 Grundbegriffe 2 3 Aufbereiten der Stichprobe 3 4 Die Kennzahlen Mittelwert und Streuung,
MehrStatistik II: Grundlagen und Definitionen der Statistik
Medien Institut : Grundlagen und Definitionen der Statistik Dr. Andreas Vlašić Medien Institut (0621) 52 67 44 vlasic@medien-institut.de Gliederung 1. Hintergrund: Entstehung der Statistik 2. Grundlagen
MehrKorrelation, Regression und Signifikanz
Professur Forschungsmethodik und Evaluation in der Psychologie Übung Methodenlehre I, und Daten einlesen in SPSS Datei Textdaten lesen... https://d3njjcbhbojbot.cloudfront.net/api/utilities/v1/imageproxy/https://d15cw65ipcts
MehrEinführung in Quantitative Methoden
Einführung in Quantitative Methoden Mag. Dipl.Ing. Dr. Pantelis Christodoulides & Mag. Dr. Karin Waldherr SS 2011 Christodoulides / Waldherr Einführung in Quantitative Methoden- 2.VO 1/62 Summenzeichen
MehrEinführung in die computergestützte Datenanalyse
Karlheinz Zwerenz Statistik Einführung in die computergestützte Datenanalyse 6., überarbeitete Auflage DE GRUYTER OLDENBOURG Vorwort Hinweise zu EXCEL und SPSS Hinweise zum Master-Projekt XI XII XII TEIL
Mehrhtw saar 1 EINFÜHRUNG IN DIE STATISTIK: BESCHREIBENDE STATISTIK
htw saar 1 EINFÜHRUNG IN DIE STATISTIK: BESCHREIBENDE STATISTIK htw saar 2 Grundbegriffe htw saar 3 Grundgesamtheit und Stichprobe Ziel: Über eine Grundgesamtheit (Population) soll eine Aussage über ein
Mehr(x i x) 2. (x i a) 2, x i x med. x i a. i=1. 3 Lage- und Streuungsmaße 134
Lagemaße als Lösung eines Optimierungsproblems 3.1 Lagemaße Gegeben sei die Urliste x 1,...,x n eines intervallskalierten Merkmals X, die zu einer Zahl a zusammengefasst werden soll. Man könnte sagen,
MehrTeil / Ein paar statistische Grundlagen 25. Kapitel 1 Was Statistik ist und Warum sie benötigt Wird 2 7
Inhaltsverzeichnis Einführung 21 Über dieses Buch 21 Törichte Annahmen über den Leser 22 Wie dieses Buch aufgebaut ist 23 Teil I: Ein paar statistische Grundlagen 23 Teil II: Die beschreibende Statistik
MehrStatistische Grundlagen I
Statistische Grundlagen I Arten der Statistik Zusammenfassung und Darstellung von Daten Beschäftigt sich mit der Untersuchung u. Beschreibung von Gesamtheiten oder Teilmengen von Gesamtheiten durch z.b.
MehrWiederholung. Statistik I. Sommersemester 2009
Statistik I Sommersemester 2009 Statistik I (1/21) Daten/graphische Darstellungen Lage- und Streuungsmaße Zusammenhangsmaße Lineare Regression Wahrscheinlichkeitsrechnung Zentraler Grenzwertsatz Konfidenzintervalle
MehrStatistik. Datenanalyse mit EXCEL und SPSS. R.01denbourg Verlag München Wien. Von Prof. Dr. Karlheinz Zwerenz. 3., überarbeitete Auflage
Statistik Datenanalyse mit EXCEL und SPSS Von Prof. Dr. Karlheinz Zwerenz 3., überarbeitete Auflage R.01denbourg Verlag München Wien Inhalt Vorwort Hinweise zu EXCEL und SPSS Hinweise zum Master-Projekt
MehrKreisdiagramm, Tortendiagramm
Kreisdiagramm, Tortendiagramm Darstellung der relativen (absoluten) Häufigkeiten als Fläche eines Kreises Anwendung: Nominale Merkmale Ordinale Merkmale (Problem: Ordnung nicht korrekt wiedergegeben) Gruppierte
Mehr3. Deskriptive Statistik
3. Deskriptive Statistik Eindimensionale (univariate) Daten: Pro Objekt wird ein Merkmal durch Messung / Befragung/ Beobachtung erhoben. Resultat ist jeweils ein Wert (Merkmalsausprägung) x i : - Gewicht
MehrStatistik. Einführung in die com putergestützte Daten an alyse. Oldenbourg Verlag München B , überarbeitete Auflage
Statistik Einführung in die com putergestützte Daten an alyse von Prof. Dr. Karlheinz Zwerenz 4., überarbeitete Auflage B 366740 Oldenbourg Verlag München Inhalt Vorwort XI Hinweise zu EXCEL und SPSS XII
MehrEmpirische Verteilungsfunktion
Empirische Verteilungsfunktion H(x) := Anzahl der Werte x ist. Deskriptive
Mehr5 Exkurs: Deskriptive Statistik
5 EXKURS: DESKRIPTIVE STATISTIK 6 5 Ekurs: Deskriptive Statistik Wir wollen zuletzt noch kurz auf die deskriptive Statistik eingehen. In der Statistik betrachtet man für eine natürliche Zahl n N eine Stichprobe
MehrStatistik I für Betriebswirte Vorlesung 9
Statistik I für Betriebswirte Vorlesung 9 Prof. Dr. Hans-Jörg Starkloff TU Bergakademie Freiberg Institut für Stochastik 06. Juni 2016 Prof. Dr. Hans-Jörg Starkloff Statistik I für Betriebswirte Vorlesung
MehrWeitere Lagemaße: Quantile/Perzentile I
3 Auswertung von eindimensionalen Daten Lagemaße 3.3 Weitere Lagemaße: Quantile/Perzentile I Für jeden Median x med gilt: Mindestens 50% der Merkmalswerte sind kleiner gleich x med und ebenso mindestens
Mehr3. Lektion: Deskriptive Statistik
Seite 1 von 5 3. Lektion: Deskriptive Statistik Ziel dieser Lektion: Du kennst die verschiedenen Methoden der deskriptiven Statistik und weißt, welche davon für Deine Daten passen. Inhalt: 3.1 Deskriptive
MehrErmitteln Sie auf 2 Dezimalstellen genau die folgenden Kenngrößen der bivariaten Verteilung der Merkmale Weite und Zeit:
1. Welche der folgenden Kenngrößen, Statistiken bzw. Grafiken sind zur Beschreibung der Werteverteilung des Merkmals Konfessionszugehörigkeit sinnvoll einsetzbar? A. Der Modalwert. B. Der Median. C. Das
MehrStatistik. Datenanalyse mit EXCEL und SPSS. Prof. Dr. Karlheinz Zwerenz. R.Oldenbourg Verlag München Wien. Von
Statistik Datenanalyse mit EXCEL und SPSS Von Prof. Dr. Karlheinz Zwerenz R.Oldenbourg Verlag München Wien Inhalt Vorwort Hinweise zu EXCEL und SPSS Hinweise zum Master-Projekt XI XII XII TEIL I GRUNDLAGEN
MehrDatenstrukturen. Querschnitt. Grösche: Empirische Wirtschaftsforschung
Datenstrukturen Datenstrukturen Querschnitt Panel Zeitreihe 2 Querschnittsdaten Stichprobe von enthält mehreren Individuen (Personen, Haushalte, Firmen, Länder, etc.) einmalig beobachtet zu einem Zeitpunkt
MehrLagemasse und Streuung
Lagemasse und Streuung Benjamin Schlegel 07. März 2016 Lagemasse sagen etwas über die Lage und das Zentrum der Daten aus, Streuungsmasse, wie die Daten um dieses Zentrum gestreut sind. Lagemasse Lagemasse
MehrWiederholung Statistik I. Statistik für SozialwissenschaftlerInnen II p.8
Wiederholung Statistik I Statistik für SozialwissenschaftlerInnen II p.8 Konstanten und Variablen Konstante: Merkmal hat nur eine Ausprägung Variable: Merkmal kann mehrere Ausprägungen annehmen Statistik
MehrUniv.-Prof. Dr. Georg Wydra
Univ.-Prof. Dr. Georg Wydra Methoden zur Auswertung von Untersuchungen 1 SKALENTYPEN UND VARIABLEN 2 ZUR BEDEUTUNG DER STATISTIK IN DER FORSCHUNG 3 STATISTIK ALS VERFAHREN ZUR PRÜFUNG VON HYPOTHESEN 4
MehrVorlesung Gesamtbanksteuerung Mathematische Grundlagen II Dr. Klaus Lukas Carsten Neundorf. Vorlesung 04 Mathematische Grundlagen II,
Vorlesung Gesamtbanksteuerung Mathematische Grundlagen II Dr. Klaus Lukas Carsten Neundorf 1 Was sollen Sie heute lernen? 2 Agenda Wiederholung stetige Renditen deskriptive Statistik Verteilungsparameter
MehrBeschreibende Statistik
Beschreibende Statistik Variablentypen Variablentypen Einteilung von Merkmalen Qualitative Merkmale (nominal und ordinal) qualitativ quantitativ Quantitative Merkmale (diskret und stetig) kategorial, artmäßig
Mehra) x = 1150 ; x = 950 ; x = 800 b) Die Lagemaße unterscheiden sich voneinander. c) Der Median charakterisiert die Stichprobe am besten.
R. Brinkmann http://brinkmann-du.de Seite 6.0.2009 Lösungen Mittelwert, Median II se: E E2 E3 E4 E5 E6 a) Notendurchschnitt 2,6 b) Säulendiagramm siehe ausführliche Lösung. c) Kreisdiagramm siehe ausführliche
MehrInstitut für Biometrie und klinische Forschung. WiSe 2012/2013
Klinische Forschung WWU Münster Pflichtvorlesung zum Querschnittsfach Epidemiologie, Biometrie und Med. Informatik Praktikum der Medizinischen Biometrie () Überblick. Deskriptive Statistik I - Grundlegende
MehrLösungen. w58r4p Lösungen. w58r4p. Name: Klasse: Datum:
Testen und Fördern Name: Klasse: Datum: 1) Ermittle jeweils das arithmetische Mittel. Ordne die Datenerhebungen nach der Größe der arithmetischen Mittel. Beginne mit dem Größten. 45, 39, 44, 48, 42, 39,
MehrFranz Kronthaler. Statistik angewandt. Datenanalyse ist (k)eine Kunst. mit dem R Commander. A Springer Spektrum
Franz Kronthaler Statistik angewandt Datenanalyse ist (k)eine Kunst mit dem R Commander A Springer Spektrum Inhaltsverzeichnis Teil I Basiswissen und Werkzeuge, um Statistik anzuwenden 1 Statistik ist
MehrStatistik und Wahrscheinlichkeitsrechnung
Statistik und Wahrscheinlichkeitsrechnung Dr. Jochen Köhler 26.02.2008 1 Warum Statistik und Wahrscheinlichkeits rechnung im Ingenieurwesen? Zusammenfassung der letzten Vorlesung Statistik und Wahrscheinlichkeitsrechnung
MehrMathematische Statistik. Zur Notation
Mathematische Statistik dient dazu, anhand von Stichproben Informationen zu gewinnen. Während die Wahrscheinlichkeitsrechnung Prognosen über das Eintreten zufälliger (zukünftiger) Ereignisse macht, werden
Mehr4 Statistische Maßzahlen
4 Statistische Maßzahlen 4.1 Maßzahlen der mittleren Lage 4.2 Weitere Maßzahlen der Lage 4.3 Maßzahlen der Streuung 4.4 Lineare Transformationen, Schiefemaße 4.5 Der Box Plot Ziel: Charakterisierung einer
MehrÜbungen mit dem Applet Rangwerte
Rangwerte 1 Übungen mit dem Applet Rangwerte 1 Statistischer Hintergrund... 2 1.1 Verteilung der Einzelwerte und der Rangwerte...2 1.2 Kurzbeschreibung des Applets...2 1.3 Ziel des Applets...4 2 Visualisierungen
MehrWahrscheinlichkeitsverteilungen
Universität Bielefeld 3. Mai 2005 Wahrscheinlichkeitsrechnung Wahrscheinlichkeitsrechnung Das Ziehen einer Stichprobe ist die Realisierung eines Zufallsexperimentes. Die Wahrscheinlichkeitsrechnung betrachtet
Mehr1 45, 39, 44, 48, 42, 39, 40, , 31, 46, 35, 31, 42, 51, , 42, 33, 46, 33, 44, 43
1) Ermittle jeweils das arithmetische Mittel. Ordne die Datenerhebungen nach der Größe der arithmetischen Mittel. Beginne mit dem Größten. 1 45, 39, 44, 48, 42, 39, 40, 31 2 35, 31, 46, 35, 31, 42, 51,
MehrEinführung in die Statistik für Wirtschaftswissenschaftler für Betriebswirtschaft und Internationales Management
Einführung in die Statistik für Wirtschaftswissenschaftler für Betriebswirtschaft und Internationales Management Sommersemester 03 Hochschule Augsburg : Gliederung Einführung Deskriptive Statistik 3 Wahrscheinlichkeitstheorie
MehrBeispiel 2 (Einige Aufgaben zu Lageparametern) Aufgabe 1 (Lageparameter)
Beispiel (Einige Aufgaben zu Lageparametern) Aufgabe 1 (Lageparameter) 1 Ein Statistiker ist zu früh zu einer Verabredung gekommen und vertreibt sich nun die Zeit damit, daß er die Anzahl X der Stockwerke
MehrFachrechnen für Tierpfleger
Z.B.: Fachrechnen für Tierpfleger A10. Statistik 10.1 Allgemeines Was ist Statistik? 1. Daten sammeln: Durch Umfragen, Zählung, Messung,... 2. Daten präsentieren: Tabellen, Grafiken 3. Daten beschreiben/charakterisieren:
MehrMusterlösung zur Übungsklausur Statistik
Musterlösung zur Übungsklausur Statistik WMS4A Oettinger 6/205 Aufgabe (a) Falsch: der Modus ist die am häufigsten auftretende Merkmalsausprägung in einer Stichprobe. (b) Richtig: ein ordinales Merkmal
MehrEinführung in die Statistik
Einführung in die Statistik 1. Deskriptive Statistik 2. Induktive Statistik 1. Deskriptive Statistik 1.0 Grundbegriffe 1.1 Skalenniveaus 1.2 Empirische Verteilungen 1.3 Mittelwerte 1.4 Streuungsmaße 1.0
MehrInhaltsverzeichnis DESKRIPTIVE STATISTIK. 1 Grundlagen Grundbegriffe Skalen... 15
Inhaltsverzeichnis 1 Grundlagen... 13 1.1 Grundbegriffe...13 1.2 Skalen... 15 DESKRIPTIVE STATISTIK 2 Eindimensionale Häufigkeitsverteilungen...16 2.1 Häufigkeiten... 16 2.1.1 Grundbegriffe... 16 2.1.2
Mehrberuflicher Bildungsabschluss incl. Hochschulabschl. 4Kat.(m) Häufigkeit Prozent Gültig Lehre/Beruffachgesundh.Schule ,2 59,2 59,2
Häufigkeiten Deskriptive Statistiken Häufigkeiten Beruflicher Bildungsabschluss (Mbfbil4) Zielvariablenliste OK Er erscheint: Statistiken beruflicher Bildungsabschluss incl. N Gültig 3445 Fehlend 0 beruflicher
Mehr4 Statistische Maßzahlen
4 Statistische Maßzahlen 4.1 Maßzahlen der mittleren Lage 4.2 Weitere Maßzahlen der Lage 4.3 Maßzahlen der Streuung 4.4 Lineare Transformationen, Schiefemaße 4.5 Der Box Plot Ziel: Charakterisierung einer
MehrMethodenlehre. Vorlesung 12. Prof. Dr. Björn Rasch, Cognitive Biopsychology and Methods University of Fribourg
Methodenlehre Vorlesung 12 Prof. Dr., Cognitive Biopsychology and Methods University of Fribourg 1 Methodenlehre II Woche Datum Thema 1 FQ Einführung, Verteilung der Termine 1 18.2.15 Psychologie als Wissenschaft
MehrStatistik in R Block 1: April 1
Statistik in R Block 1: 24-26.April 1 Statistik in R Ziele: Theoretische Grundlagen der deskriptiven Statistik und der Prüfstatistik Anwendung in der Phonetik Berechnungen mit R Themen Übungen mit R 1.
MehrStatistik I für Betriebswirte Vorlesung 4
Statistik I für Betriebswirte Vorlesung 4 Prof. Dr. Hans-Jörg Starkloff TU Bergakademie Freiberg Institut für Stochastik 25. April 2016 Prof. Dr. Hans-Jörg Starkloff Statistik I für Betriebswirte Vorlesung
MehrÜber den Autor 7 Über den Fachkorrektor 7. Einführung 19
Inhaltsverzeichnis Über den Autor 7 Über den Fachkorrektor 7 Einführung 19 Über dieses Buch 19 Törichte Annahmen über den Leser 20 Wie dieses Buch aufgebaut ist 20 Teil I: Ein paar statistische Grundlagen
MehrInhaltsverzeichnis Inhaltsverzeichnis VII Erst mal locker bleiben: Es f angt ganz einfach an! Keine Taten ohne Daten!
Inhaltsverzeichnis Inhaltsverzeichnis VII 1 Erst mal locker bleiben: Es fängt ganz einfach an! 1 1.1 Subjektive Wahrscheinlichkeit - oder warum...?..... 4 1.2 Was Ethik mit Statistik zu tun hat - Pinocchio
MehrI.V. Methoden 2: Deskriptive Statistik WiSe 02/03
I.V. Methoden 2: Deskriptive Statistik WiSe 02/03 Vorlesung am 04.11.2002 Figures won t lie, but liars will figure. General Charles H.Grosvenor Dr. Wolfgang Langer Institut für Soziologie Martin-Luther-Universität
Mehr1 GRUNDLAGEN Grundbegriffe Skalen...15
Inhaltsverzeichnis 1 GRUNDLAGEN...13 1.1 Grundbegriffe...13 1.2 Skalen...15 DESKRIPTIVE STATISTIK 2 EINDIMENSIONALE HÄUFIGKEITSVERTEILUNGEN...16 2.1 Häufigkeiten...16 2.1.1 Grundbegriffe...16 2.1.2 Klassieren
MehrStatistik I für Betriebswirte Vorlesung 9
Statistik I für Betriebswirte Vorlesung 9 Dr. Andreas Wünsche TU Bergakademie Freiberg Institut für Stochastik Vorlesung am 8. Juni 2017 im Audi-Max (AUD-1001) Dr. Andreas Wünsche Statistik I für Betriebswirte
MehrÜbungsrunde 2, Gruppe 2 LVA , Übungsrunde 1, Gruppe 2, Markus Nemetz, TU Wien, 10/2006
1 1.2.3.4. 1.1 Angabe Übungsrunde 2, Gruppe 2 LVA 107.369, Übungsrunde 1, Gruppe 2, 24.10. Markus Nemetz, markus.nemetz@tuwien.ac.at, TU Wien, 10/2006 Bestimmen Sie für den Datensatz bulb.dat die Quartile,
MehrInhaltsverzeichnis. Teil 1 Basiswissen und Werkzeuge, um Statistik anzuwenden
Inhaltsverzeichnis Teil 1 Basiswissen und Werkzeuge, um Statistik anzuwenden 1 Statistik ist Spaß 3 Warum Statistik? 3 Checkpoints 4 Daten 4 Checkpoints 7 Skalen - lebenslang wichtig bei der Datenanalyse
MehrStatistische Kennzahlen für die Lage
Statistische Kennzahlen für die Lage technische universität ach der passenden grafischen Darstellung der Werte eines Merkmals auf der Gesamtheit der Beobachtungen interessieren jetzt geschickte algebraische
MehrDer Modus ist. Der Median ist. 3. Übung. Aufgabe 1. a) der häufigste Wert. b) der Wert unter dem 50 % aller anderen Werte liegen.
3. Übung Aufgabe 1 Der Modus ist a) der häufigste Wert. b) der Wert unter dem 50 % aller anderen Werte liegen. c) der Durchschnitt aller Werte. d) der Wert mit der größten Häufigkeitsdichte. e) der Schwerpunkt
MehrT-Test für unabhängige Stichproben
T-Test für unabhängige Stichproben Wir gehen von folgendem Beispiel aus: Wir erheben zwei Zufallstichproben, wobei nur die Probanden der einen Stichprobe einer speziellen experimentellen Behandlung (etwa
MehrBeispiel für Anwendung: z-tabelle kann genutzt werden, um z.b. Poissonverteilung näherungsweise zu integrieren. Beispiel: wie wahrscheinlich ist es
Beispiel für Anwendung: z-tabelle kann genutzt werden, um z.b. Poissonverteilung näherungsweise zu integrieren. Beispiel: wie wahrscheinlich ist es beim radioaktiven Zerfall, zwischen 100 und 110 Zerfälle
MehrBeschreibende Statistik Eindimensionale Daten
Mathematik II für Biologen 16. April 2015 Prolog Geordnete Stichprobe Rang Maße für die mittlere Lage der Daten Robustheit Quantile Maße für die Streuung der Daten Erkennung potentieller Eindimensionales
Mehr