Übersicht Statistik-Funktionen. Statistische Software (R) Nützliche Funktionen. Nützliche Funktionen

Ähnliche Dokumente
Zusammenstellung der Befehle in R

Überblick über die Tests

Erwin Grüner

Analog zu Aufgabe 16.1 werden die Daten durch folgenden Befehl eingelesen: > kredit<-read.table("c:\\compaufg\\kredit.

Einige Statistische Tests für den Ein- Zwei- und k-stichprobenfall (Nach Sachs, Stat. Meth.)

Datenanalyse und Statistik

Motivation. Wilcoxon-Rangsummentest oder Mann-Whitney U-Test. Wilcoxon Rangsummen-Test Voraussetzungen. Bemerkungen

Füllmenge. Füllmenge. Füllmenge. Füllmenge. Mean = 500,0029 Std. Dev. = 3,96016 N = ,00 490,00 495,00 500,00 505,00 510,00 515,00 Füllmenge

Statistik im Bachelor-Studium der BWL und VWL

2.3 Univariate Datenanalyse in R

R ist freie Software und kann von der Website.

13.5 Der zentrale Grenzwertsatz

Kategoriale abhängige Variablen:

Statistik mit Excel. für Praktiker: Statistiken aufbereiten und präsentieren HORST-DIETER RADKE

Einfache Statistiken in Excel

Kapitel 3. Zufallsvariable. Wahrscheinlichkeitsfunktion, Dichte und Verteilungsfunktion. Erwartungswert, Varianz und Standardabweichung

Eine Einführung in R: Deskriptive Statistiken und Graphiken

Die Pareto Verteilung wird benutzt, um Einkommensverteilungen zu modellieren. Die Verteilungsfunktion ist

2. Deskriptive Statistik 2.1. Häufigkeitstabellen, Histogramme, empirische Verteilungsfunktionen

Statistik mit Excel. für Praktiker: Statistiken aufbereiten und präsentieren HORST-DIETER RADKE. Markt+Technik

Klausur zu Methoden der Statistik II (mit Kurzlösung) Wintersemester 2008/2009. Aufgabe 1

Statistische Thermodynamik I Lösungen zur Serie 1

Statistik und Wahrscheinlichkeitsrechnung

Einleitung 19. Teil I Datenanalyse und Modellbildung Grundlagen 25

Kategoriale abhängige Variablen: Logit- und Probit -Modelle. Statistik II

Standardab er des. Testwert = % Konfidenzintervall. T df Sig. (2-seitig) Differenz Untere Obere

Statistik II für Betriebswirte Vorlesung 3

a) Zeichnen Sie in das nebenstehende Streudiagramm mit Lineal eine Regressionsgerade ein, die Sie für passend halten.

Klausur zu Methoden der Statistik I (mit Kurzlösung) Wintersemester 2007/2008. Aufgabe 1

Nichtparametrische statistische Verfahren

Deskriptive Statistik

Klausur Statistik Lösungshinweise

Integrierte Office Anwendungen

, dt. $+ f(x) = , - + < x < +, " > 0. " 2# Für die zugehörige Verteilungsfunktion F(x) ergibt sich dann: F(x) =

Schätzer (vgl. Kapitel 1): Stichprobenmittel X N. Stichprobenmedian X N

Frailty Models in Survival Analysis

8. Februar Bei Unterschleif gilt die Klausur als nicht bestanden und es erfolgt eine Meldung an das Prüfungsamt.

90-minütige Klausur Statistik für Studierende der Kommunikationswissenschaft

Kapitel 4: Binäre Regression

Willkommen zur Vorlesung Statistik

Monte-Carlo Simulation

Teil I Beschreibende Statistik 29

Statistik. R. Frühwirth. Statistik. VO Februar R. Frühwirth Statistik 1/536

$ % + 0 sonst. " p für X =1 $

Klausur zur Vorlesung Statistik III für Studenten mit dem Wahlfach Statistik

Klaus Pötzelberger Department of Statistics and Mathematics Wirtschaftsuniversität Wien

Umgang mit und Ersetzen von fehlenden Werten bei multivariaten Analysen

Commercial Banking. Kreditportfoliosteuerung

Mathematische und statistische Methoden II

Statistik II für Betriebswirte Vorlesung 2

Einführung in R. Kapitel 2 : Einfache Statistische Auswertungen

Überblick über die Verfahren für Ordinaldaten

Beispiel 5 Europäische Call Option (ECO) in einer Aktie S mit Laufzeit T und Ausübungspreis (Strikepreis) K.

Eine Einführung in R: Statistische Tests

Messen im psychologischen Kontext II: Reliabilitätsüberprüfung und explorative Faktorenanalyse

Monty Hall-Problem. Wochen 3 und 4: Verteilungen von Zufallsvariablen. Lernziele. Diskrete Verteilungen

Willkommen zur Vorlesung Statistik (Master)

Dynamische Modelle. 1 Ökonomische Relevanz. 2 Ökonometrische Modelle. a) Statisches Modell und Differenzenbildung

Versuchsplanung SoSe 2015 R - Lösung zu Übung 1 am Autor: Ludwig Bothmann

Einführung in R. Christoph Dalitz. August Hochschule Niederhein Fachbereich Elektrotechnik & Informatik

Beispiele zur UE Wirtschaftsstatistik 1 bei Nagel

2. Patienten, Material und Methodik Patienten

Vorlesung 1: Grundlagen, Evidenzbasierte Medizin und Gute Klinische Praxis (GCP)

CAPM Die Wertpapierlinie

4. Auswertung eindimensionaler Daten

ARCH- und GARCH-Modelle

Lineare Strukturgleichungsmodelle (LISREL) Konfirmatorische Faktorenanalyse (CFA)

7.9 Referenz der statistischen Funktionen. Excel 2013 erweitert die Reihe der statistischen Funktionen noch um einige neue Funktionen:

Grundlagen der Inferenzstatistik: Was Ihnen nicht erspart bleibt!

Statistisches Programmieren

Analyse von Extremwerten

EXCEL in der Wirtschaftsmathematik

Häufigkeitstabellen. Balken- oder Kreisdiagramme. kritischer Wert für χ2-test. Kontingenztafeln

Klausur STATISTIK 2 für Diplom VWL

Multivariate Statistik

Anhang A: Fragebögen und sonstige Unterlagen

Übungsrunde 7, Gruppe 2 LVA , Übungsrunde 7, Gruppe 2, Markus Nemetz, markus.nemetz@tuwien.ac.at, TU Wien, 11/2006

Parametrische Statistik

Wilcoxon-Rangsummen-Test

Empirische Softwaretechnik. Einführung in das Statistikpaket R?! Entwickler von R. nicht vergleichbar mit den üblichen Statistikprogrammen

Präsenzübungsaufgaben zur Vorlesung Elementare Sachversicherungsmathematik

Inhaltsverzeichnis. TEIL I: Einführung in EXCEL

Medizinische Biometrie (L5)

Datenaufbereitung, Grafische Datenanalyse

Einfache statistische Auswertungen mit dem Programm SPSS

Logo-Aufgaben mit Verbindung zur Mathematik

Herzlich Willkommen zur Vorlesung Statistik

Auswertung und Darstellung wissenschaftlicher Daten (1)

9 Schlüsseleinigung, Schlüsselaustausch

Analyse von Eingabedaten

Veranstaltung Statistik (BWL) an der FH Frankfurt/Main im WS 2004/05 (Dr. Faik) Klausur GRUPPE A - BEARBEITER/IN (NAME, VORNAME):

Prüfung auf Normalverteilung

1 Verteilungen und ihre Darstellung

Profil A 49,3 48,2 50,7 50,9 49,8 48,7 49,6 50,1 Profil B 51,8 49,6 53,2 51,1 51,1 53,4 50, ,5 51,7 48,8

Wie man mit Statistik schlecht informiert: Praktiken der Ergebnisdarstellung bei Experimenten im Software Engineering

Transkript:

Übersicht Statistik-Funktionen Statistische Software (R) Paul Fink, M.Sc. Institut für Statistik Ludwig-Maximilians-Universität München Pseudo Zufallszahlen, Dichten, Verteilungsfunktionen, etc. Funktion mean() median() exp(mean(log( ))) quantile() var() sd() range() diff(range()) cov() cor() density() ecdf() Beschreibung artihmetische Mittel Median Geometrisches Mittel empirische Quantile Stichproben-Varianz Stichproben-Standardabweichung Minimum und Maximum Spannweite Stichproben-Kovarianz Korrelation (Spearman, Bravais Pearson) Kerndichteschätzer Empirische Verteilungsfunktion Paul Fink: Statistische Software (R) SoSe 2015 2 Sortieren eines Vektors: > x <- c(1, 3, 2, 5) > sort(x) [1] 1 2 3 5 > sort(x, decreasing = TRUE) [1] 5 3 2 1 > sort(c("morgen", "Mittag", "Nachmittag", "Abend", "Nacht")) [1] "Abend" "Mittag" "Morgen" "Nachmittag" "Nacht" Bestimmung der Ränge: > rank(x) [1] 1.0 4.0 2.5 5.0 2.5 Indizierung mehrfach vorkommender Werte in einem Vektor: > duplicated(x) [1] FALSE FALSE FALSE FALSE TRUE Entfernung von Duplikaten (z.b. Bestimmung aller vorkommenden Merkmalsausprägungen in einer Stichprobe): > unique(x) [1] 1 3 2 5 Paul Fink: Statistische Software (R) SoSe 2015 3 Paul Fink: Statistische Software (R) SoSe 2015 4

Kumulierte Summe und Produkt: Diskretisierung einer (quasi )stetigen Variable: > x <- c(1.3, 1.5, 2.5, 3.8, 4.1, 5.9, 7.1, 8.4, 9.0) > xdiscrete <- cut(x, breaks = c(-inf, 2, 5, 8, Inf) ) > is.factor(xdiscrete) [1] TRUE > xdiscrete [1] (-Inf,2] (-Inf,2] (2,5] (2,5] (2,5] (5,8] (5,8] [8] (8, Inf] (8, Inf] Levels: (-Inf,2] (2,5] (5,8] (8, Inf] > table(xdiscrete) xdiscrete (-Inf,2] (2,5] (5,8] (8, Inf] 2 3 2 2 > x <- c(1, 3, 2, 5) > cumsum(x) # 1, 1+3, 1+3+2, 1+3+2+5 [1] 1 4 6 11 > cumprod(x) # 1, 1*3, 1*3*2, 1*3*2*5 [1] 1 3 6 30 Fakultät: > factorial(5) [1] 120 Binomialkoeffizient ( n k) : > choose(4, 2) [1] 6 Paul Fink: Statistische Software (R) SoSe 2015 5 Paul Fink: Statistische Software (R) SoSe 2015 6 Verteilungen und Zufallszahlen Gammafunktion: Für natürliche Zahlen n gilt: Γ(n) = (n 1)! > c(gamma(5), factorial(4)) [1] 24 24 > c(gamma(0.5), sqrt(pi)) [1] 1.772454 1.772454 Betafunktion: B(a, b) = Γ(a)Γ(b) Γ(a+b) > c(beta(5, 3), gamma(5) * gamma(3) / gamma(5 + 3)) [1] 0.00952381 0.00952381 Funktionen zur Berechnung von Dichten, Verteilungsfunktionen, theoretischen Quantilen und Erzeugung von (Pseudo ) Zufallszahlen Funktionsnamen-Schema Anfangsbuchstabe d p q r Art der Funktion Dichte (density) Verteilungsfunktion (probability) Quantilsfunktion (quantiles) Zufallszahl (random number) Paul Fink: Statistische Software (R) SoSe 2015 7 Paul Fink: Statistische Software (R) SoSe 2015 8

Funktionsnamen-Schema Beispiel Std.-NV Funktionsnamen-Schema Beispiel Std.-NV Dichte der N(0, 1) Verteilung an der Stelle x = 0: (theoretisch: 1/ 2π) > c(dnorm(x = 0), 1 / sqrt(2 * pi)) [1] 0.3989423 0.3989423 Verteilungsfunktion der N(0, 1) Verteilung an der Stelle q: Φ(q) = P(X q) > pnorm(q = 0) [1] 0.5 > pnorm(q = 1.96) [1] 0.9750021 p-quantil der N(0, 1) Verteilung z p : > qnorm(p = 0.95) [1] 1.644854 Stichprobe vom Umfang n = 5 aus N(0, 1) Verteilung > (X <- rnorm(n = 5)) [1] 0.08490976-0.09564817 0.09662517-1.14158372-1.66845847 Paul Fink: Statistische Software (R) SoSe 2015 9 Paul Fink: Statistische Software (R) SoSe 2015 10 Übersicht Modellverteilungen Übersicht Prüfverteilungen Funktionsende Verteilungsname beta binom cauchy exp gamma geom hyper lnorm norm pois unif mvnorm Beta-Verteilung Binomial-Verteilung Cauchy-Verteilung Exponential-Verteilung Gamma-Verteilung Geometrische-Verteilung Hypergeometrische-Verteilung Log-Normal-Verteilung Normal-Verteilung Poisson-Verteilung Gleich-/ Rechtecks-Verteilung Multivariate Normal-Verteilung (package mvtnorm) Funktionsende chisq f signrank t wilcox Verteilungsname χ 2 -Verteilung F -Verteilung Verteilung der Wilcoxon Vorzeichen- Rangsummen (1 Stichprobe) t-verteilung Verteilung der Wilcoxon Rangsummen (2 Stichproben) Paul Fink: Statistische Software (R) SoSe 2015 11 Paul Fink: Statistische Software (R) SoSe 2015 12

Die sample() Funktion Die sample() Funktion Beispiele Ziehen einer Stichprobe mit festem Umfang (Argument size) aus endlich diskreten Mengen (Argument x) mit Zurücklegen (Argument replace = TRUE) oder ohne Zurücklegen (Argument replace = FALSE) und optional mit bestimmten Wahrscheinlichkeiten (Argument prob). Argument replace ist auf FALSE voreingestellt. Ziehen mit Zurücklegen aus einer Gleichverteilung über {1, 2, 3, 4, 5}: > sample(x = c(1, 2, 3, 4, 5), size = 10, replace = TRUE) [1] 2 3 5 2 5 4 2 5 5 4 Ziehen mit Zurücklegen aus einer vorgegebenen Verteilung (prob gesetzt): > zmzv <- sample(x = c(1, 2, 3, 4, 5), size = 1000, replace = TRUE, + prob = c(0.1, 0.1, 0.4, 0.3, 0.1)) > table(zmzv) zmzv 1 2 3 4 5 91 92 388 332 97 Paul Fink: Statistische Software (R) SoSe 2015 13 Paul Fink: Statistische Software (R) SoSe 2015 14 Empirische Verteilungsfunktion Kenrdichteschätzung Beispiel Standardnormalverteilung: > set.seed(123) > x <- rnorm(n = 20) > plot(ecdf(x)) ecdf(x) Beispiel Normalverteilung mit µ = 3 und σ 2 = 4: > kernds <- density(rnorm(n = 20, mean = 3, sd = 2)) > plot(kernds, main = "Kerndichte von Exponentialverteilung") Kerndichte von Exponentialverteilung Fn(x) 0.0 0.2 0.4 0.6 0.8 1.0 Density 0.00 0.05 0.10 0.15-2 0 2 4 6 8-2 -1 0 1 2 N = 20 Bandwidth = 0.8206 x Paul Fink: Statistische Software (R) SoSe 2015 15 Paul Fink: Statistische Software (R) SoSe 2015 16

Aufgaben 1. Erzeugen Sie Stichproben aus verschiedenen Verteilungen (Poisson, Binomial, χ 2, Exponential) mit verschiedenen Parametern und den Stichprobenumfängen n = 20, n = 50, n = 100 und n = 1000. Visualisieren Sie die die standardisierten Summen mittels Kerndichteschätzung. 2. Zeigen Sie, dass das Vorgehen wie in 1. für die Cauchy Verteilung nicht klappt. Paul Fink: Statistische Software (R) SoSe 2015 17