Teil VII. Deskriptive Statistik. Woche 5: Deskriptive Statistik. Arbeitsschritte der Datenanalyse. Lernziele
|
|
- Alexandra Voss
- vor 6 Jahren
- Abrufe
Transkript
1 Woche 5: Deskriptive Statistik Teil VII Patric Müller Deskriptive Statistik ETHZ WBL 17/19, Wahrscheinlichkeit und Statistik Patric Müller WBL 2017 Wahrscheinlichkeit und Statistik 2 / 31 WBL 2017 Lernziele Arbeitsschritte der Datenanalyse Sie können Kenngrössen von Stichproben berechnen, auf Papier und mit R: arithmetisches Mittel, empirische Standardabweichung und Varianz, Median, Quantile... die empirische Korrelation zweier Grössen mit Hilfe verschiedener Kennzahlen berechnen... die Unterschide der empirischen Kenngrössen zu den entsprechenden Kennzahlen bei Zufallsvariablen nennen... Plots zeichnen und lesen, die eine numerische Stichprobe visualisieren: Histogramm, Boxplot, empirische kumulative Verteilungsfunktion, Dichtekurve... Vor- und Nachteile der obenstehenden Plots benennen. Vorlesung basiert auf Kapitel 4.3 des Skripts. Modell generieren Daten messen Daten inspizieren statistische Inferenz Interpretation Wahrscheinlichkeitsrechnung deskriptive Statistik beurteilende Statistik Wahrscheinlichkeit und Statistik 3 / 31 WBL 2017 Wahrscheinlichkeit und Statistik 4 / 31 WBL 2017
2 Deskriptive und beurteilende Statistik Von Modellen zu Daten Deskriptive Statistik Überblick über Datensätze Verteilungen visualisieren auffällige Eigenschaften finden Verteilungen mit wenigen Kenngrössen beschreiben Beurteilende Statistik aus Daten Schlüsse ziehen Parameter schätzen Hypothesen testen Bisher probabilistische Modelle betrachtet. Rest des Kurses: Analyse von Daten, die von realen System erzeugt wurden. Im Folgenden nehmen wir an, x 1, x 2,..., x n seien n Messungen derselben Grösse. Übliche Annahme: n unabhängige Messungen von gleicher Wahrscheinlichkeitsverteilung. Formal: Modell: Stichprobe: X 1, X 2,..., X n i.i.d. F X ( ), x 1, x 2,..., x n i.i.d.: independent and identically distributed, unabhängig und identisch verteilt. Wahrscheinlichkeit und Statistik 5 / 31 WBL 2017 Wahrscheinlichkeit und Statistik 6 / 31 WBL 2017 Kenngrössen für eine einzelne Stichprobe Deskriptive Statistik für eine einzelne Stichprobe Mittelwert empirische Varianz und Standardabweichung empirischer Median empirische Quantile Beispieldatensatz: Aktivitätsniveau von Monoamine-Oxidase (MAO) in 18 Patienten mit einem gewissen Typ Schizophrenie. Messwerte x 1 bis x 18. MAO: Enzym, das vermutlich das Verhalten beeinflusst, und dessen Aktivität durch Schizophrenie beeinträchtigt sein kann. Eine gute Gewohnheit ist es, die Daten immer zuerst anzuschauen, das heisst die Daten zu plotten! (Quelle: Potkin et al. (1978)) Wahrscheinlichkeit und Statistik 7 / 31 WBL 2017 Wahrscheinlichkeit und Statistik 8 / 31 WBL 2017
3 Mittelwert (arithmetisches Mittel) Empirische Varianz Arithmetisches Mittel: x = x x n = 1 n n n R-Funktion: mean Arithmetisches Mittel ist ein konsistenter Schätzer für den Erwartungswert µ = E(X ): X = 1 n x i n X i µ wenn n Arithmetisches Mittel ist erwartungstreu (engl. unbiased ): x Empirische Varianz: sx 2 = 1 n (x i x) 2 (s x : n 1 empirische Standardabweichung) R-Funktionen: var, sd Empirische Varianz ist ein konsistenter Schätzer für σ 2 = Var(X ): s 2 x σ 2 wenn n Empirische Varianz ist erwartungstreu: E(s 2 x ) = σ 2 x + s x x x s x E(X ) = µ Wahrscheinlichkeit und Statistik 9 / 31 WBL 2017 Wahrscheinlichkeit und Statistik 10 / 31 WBL 2017 Empirischer Median Mittelwert und Median: Vergleich Empirischer Median: Wert, der grösser (oder gleich) ist als die Hälfte der Datenpunkte kleiner (oder gleich) ist als die andere Hälfte der Datenpunkte Berechnung: Messwerte ordnen x (1) x (2)... x (n). Median: { x m = ((n+1)/2), für n ungerade, 1 2 (x (n/2) + x (n/2+1) ), sonst R-Funktion: median x m xm mx mx m x Median ist robust, Mittelwert nicht! Wahrscheinlichkeit und Statistik 11 / 31 WBL 2017 Wahrscheinlichkeit und Statistik 12 / 31 WBL 2017
4 Quantile Graphische Darstellungen einer einzelnen Stichprobe Verallgemeinerung des Konzepts des Medians. Empirisches α-quantil: Wert q α, der grösser (oder gleich) ist als (α n) Messwerte, und kleiner (oder gleich) ist als (1 α) n Messwerte Berechnung (Beispiel): Daten sortieren: x (1) x (2)... x (n) Falls α (n 1) eine ganze Zahl ist, ist q α = x (α(n 1)+1) ; ansonsten interpoliert man q α zwischen x ( α(n 1) +1) und x ( α(n 1) +1) Die Berechnung in der Literatur ist nicht einheitlich! R-Funktion: quantile... und weitere 8 (!) verschiedene Algorithmen. Boxplot Histogramm Empirische kumulative Verteilungsfunktion später: Q-Q (Quantil-Quantil)-Plot Wahrscheinlichkeit und Statistik 13 / 31 WBL 2017 Wahrscheinlichkeit und Statistik 14 / 31 WBL 2017 Boxplot Boxplot R-Funktion: boxplot Ausreisser Grösster normaler Messwert Oberes Quartil q 0.75 Median Unteres Quartil q 0.25 Kleinster normaler Messwert Ausreisser Interquartilsabstand IQR ( interquartile range ) IQR = q 0.75 q 0.25 Normale Messwerte : Messwerte, die nicht mehr als 1.5 IQR von den Quartilen entfernt sind Wahrscheinlichkeit und Statistik 15 / 31 WBL 2017 Wahrscheinlichkeit und Statistik 16 / 31 WBL 2017
5 Histogramm Histogramm: Wahl der Intervall-Breite Histogram of x 20 Bereich der gemessenen Werte wird in Intervalle (c k 1, c k ] unterteilt Bsp.: c k = 4, 6, 8, 10, 12, 14, 16, 18, 20 Anzahl Messwerte in jedem Intervall zählen: h k := #{i x i (c k 1, c k ]} Bsp.: h k = 2, 5, 4, 3, 1, 2, 0, 1 Über Intervall (c k 1, c k ] Dichte h k einzeichnen (oder n(c k c k 1 ) absolute Häufigkeiten h k ) Wie wählen wir die Intervall-Breite eines Histogramms? Intervalle Intervalle Intervalle Intervalle Herumspielen, oder R automatisch wählen lassen Wahrscheinlichkeit und Statistik 17 / 31 WBL 2017 Wahrscheinlichkeit und Statistik 18 / 31 WBL 2017 Histogramm für bimodale Verteilung Nichtparametrische Dichteschätzung Achtung: schlecht gewählte Intervall-Breite kann Eigenschaften (hier: Bimodalität) verschleiern! Nachteile von Histogrammen Darstellungsqualität stark von Histogrammbreite abhängig Sprünge der geschätzten Wahrscheinlichkeitsdichte an Intervallgrenzen unrealistisch Alternative: nichtparametrische Dichteschätzung Verbesserungen gegenüber Histogramm: Datenpunkte nicht in vordefiniertem Intervall zählen, sondern in sliding window Punkte in der Mitte des sliding window mehr Gewicht geben als Punkte am Rand Wahrscheinlichkeit und Statistik 19 / 31 WBL 2017 Wahrscheinlichkeit und Statistik 20 / 31 WBL 2017
6 Kerndichteschätzer Wahl der Bandbreite Gegeben: Messwerte x 1, x 2,..., x n Kerndichteschätzer für Dichte der erzeugenden Verteilung ist ˆf (x) = 1 nh n ( ) x xi K ; h K heisst Kern und kann eine beliebige, symmetrische Wahrscheinlichkeitsdichte sein. Häufig verwendet: Rechteck-Kern: K ist Dichte der uniformen Verteilung auf [ 1 2, 1 2 ]; gibt allen Datenpunkten in [x h, x + h] gleiches Gewicht Gauss-Kern: K ist Dichte der Standard-Normalverteilung; gibt Punkten, die weit von x entfernt sind, weniger Gewicht Die Bandbreite h hat grossen Einfluss auf die Schätzung. Eine kleine Bandbreite lässt die Schätzung stark oszillieren. Grosse Bandbreite flacht die Schätzung ab. Automatische Bandbreitenwahl in R (Funktion density). Wahrscheinlichkeit und Statistik 21 / 31 WBL 2017 Wahrscheinlichkeit und Statistik 22 / 31 WBL 2017 Beispiel: Kerndichteschätzer für RNA-Expressionsdaten Vergleich verschiedener Darstellungsmethoden Histogramm, Kerndichteschätzer und Boxplot für bimodale Stichprobe: Boxplot verschleiert Bimodalität vollständig! Wahrscheinlichkeit und Statistik 23 / 31 WBL 2017 Wahrscheinlichkeit und Statistik 24 / 31 WBL 2017
7 Empirische kumulative Verteilungsfunktion Verschiedene Darstellungen einer bimodalen Stichprobe Zur Erinnerung: kumulative Verteilungsfunktion einer Zufallsvariablen X ist definiert als F X (x) = P(X x) Empirische kumulative Verteilungsfunktion einer Stichprobe x 1, x 2,..., x n : ˆF (x) = #{k x k x} n Fn(x) Fn(x) Wahrscheinlichkeit und Statistik 25 / 31 WBL 2017 Wahrscheinlichkeit und Statistik 26 / 31 WBL 2017 Deskriptive Statistik für mehrere Messgrössen Pearsons Korrelationskoeffizient I Streudiagramm: (Pearsons) Korrelationskoeffizient: NO 2 (µ g m 3 ) In R: r = s xy s x s y [ 1, 1], s xy = 1 n 1 n (x i x)(y i y) > cor(no2$no2, no2$temp) Pearsons Korrelationskoeffizient misst die lineare Beziehung zwischen 2 Stichproben {x i } and {y i }: r = +1 falls y i = a + bx i für eine reelle Zahl b > 0 r = 1 falls y i = a + bx i für eine reelle Zahl b < 0 Achtung: verschiedene nichtlineare Abhängigkeiten können zum selben Korrelationskoeffizienten führen! Temp ( C) [1] Wahrscheinlichkeit und Statistik 27 / 31 WBL 2017 Wahrscheinlichkeit und Statistik 28 / 31 WBL 2017
8 Pearsons Korrelationskoeffizient II Rangkorrelation Streudiagramme verschiedener simulierter Datensätze und ihr Korrelationskoeffizient Quelle: (Spearman) Rangkorrelationskoeffizient: Alternative zu Pearsons Korrelationskoeffizient Misst, wie monoton der Zusammenhang zwischen zwei Stichproben ist Misst auch nichtlineare Zusammenhänge Robust gegen Ausreisser Berechnung: Ränge k i der Datenpunkte x 1, x 2,..., x n berechnen: kleinster Messwert hat Rang 1, zweitkleinster Rang 2, etc. Ränge li der Datenpunkt y 1, y 2,..., y n berechnen Spearsons Rangkorrelationskoeffizient: ρ = rkl (d.h., Pearsons Korrelationskoeffizient zwischen k i und l i ) In R: > cor(no2$no2, no2$temp, method = "spearman") [1] Wahrscheinlichkeit und Statistik 29 / 31 WBL 2017 Wahrscheinlichkeit und Statistik 30 / 31 WBL 2017 Literatur Steven G Potkin, H Eleanor Cannon, Dennis L Murphy, and Richard Jed Wyatt. Are paranoid schizophrenics biologically different from other schizophrenics? New England Journal of Medicine, 298(2):61 66, Wahrscheinlichkeit und Statistik 31 / 31 WBL 2017
Datenanalyse und Statistik
Datenanalyse und Statistik p. 1/44 Datenanalyse und Statistik Vorlesung 2 (Graphik I) K.Gerald van den Boogaart http://www.stat.boogaart.de Datenanalyse und Statistik p. 2/44 Daten Schätzung Test Mathe
Mehr2. Deskriptive Statistik 2.1. Häufigkeitstabellen, Histogramme, empirische Verteilungsfunktionen
4. Datenanalyse und Modellbildung Deskriptive Statistik 2-1 2. Deskriptive Statistik 2.1. Häufigkeitstabellen, Histogramme, empirische Verteilungsfunktionen Für die Auswertung einer Messreihe, die in Form
MehrSchätzer (vgl. Kapitel 1): Stichprobenmittel X N. Stichprobenmedian X N
Prof. Dr. J. Franke Statistik II für Wirtschaftswissenschaftler 8.1 Schätzer für Lage- und Skalenparameter und Verteilungsmodellwahl Lageparameter (l(x + a) = l(x) + a): Erwartungswert EX Median von X
MehrStatistik und Wahrscheinlichkeitsrechnung
Statistik und Wahrscheinlichkeitsrechnung Übung 2 28.02.2008 1 Inhalt der heutigen Übung Beschreibende Statistik Gemeinsames Lösen der Übungsaufgaben 2.1: Häufigkeitsverteilung 2.2: Tukey Boxplot 25:Korrelation
MehrEine computergestützte Einführung mit
Thomas Cleff Deskriptive Statistik und Explorative Datenanalyse Eine computergestützte Einführung mit Excel, SPSS und STATA 3., überarbeitete und erweiterte Auflage ^ Springer Inhaltsverzeichnis 1 Statistik
Mehra) Zeichnen Sie in das nebenstehende Streudiagramm mit Lineal eine Regressionsgerade ein, die Sie für passend halten.
Statistik für Kommunikationswissenschaftler Wintersemester 2009/200 Vorlesung Prof. Dr. Helmut Küchenhoff Übung Cornelia Oberhauser, Monia Mahling, Juliane Manitz Thema 4 Homepage zur Veranstaltung: http://www.statistik.lmu.de/~helmut/kw09.html
MehrEinfache Statistiken in Excel
Einfache Statistiken in Excel Dipl.-Volkswirtin Anna Miller Bergische Universität Wuppertal Schumpeter School of Business and Economics Lehrstuhl für Internationale Wirtschaft und Regionalökonomik Raum
MehrKlausur zu Methoden der Statistik I (mit Kurzlösung) Wintersemester 2007/2008. Aufgabe 1
Lehrstuhl für Statistik und Ökonometrie der Otto-Friedrich-Universität Bamberg Prof. Dr. Susanne Rässler Klausur zu Methoden der Statistik I (mit Kurzlösung) Wintersemester 2007/2008 Aufgabe 1 Ihnen liegt
MehrWillkommen zur Vorlesung Statistik
Willkommen zur Vorlesung Statistik Thema dieser Vorlesung: Maßzahlen für zentrale Tendenz, Streuung und andere Eigenschaften von Verteilungen Prof. Dr. Wolfgang Ludwig-Mayerhofer Universität Siegen Philosophische
MehrHäufigkeitstabellen. Balken- oder Kreisdiagramme. kritischer Wert für χ2-test. Kontingenztafeln
Häufigkeitstabellen Menüpunkt Data PivotTable Report (bzw. entsprechendes Icon): wähle Data Range (Zellen, die die Daten enthalten + Zelle mit Variablenname) wähle kategoriale Variable für Spalten- oder
MehrGenexpression. Expression eines einzelnen Gens. Expressionsmessung. Genexpressionsmessung. Transkription (Vorgang) Genexpression
Genexpressionsmessung Genexpression Transkription (Vorgang) Genexpression (quantitativ) Wieviele m-rna Moleküle eines bestimmten Gens sind in den Zellen? Genomische Datenanalyse 8. Kapitel Wie mißt man
Mehr2. Eindimensionale (univariate) Datenanalyse
2. Eindimensionale (univariate) Datenanalyse Dr. Antje Kiesel Institut für Angewandte Mathematik WS 2011/2012 Kennzahlen, Statistiken In der Regel interessieren uns nicht so sehr die beobachteten Einzeldaten
MehrStatistische Thermodynamik I Lösungen zur Serie 1
Statistische Thermodynamik I Lösungen zur Serie Zufallsvariablen, Wahrscheinlichkeitsverteilungen 4. März 2. Zwei Lektoren lesen ein Buch. Lektor A findet 2 Druckfehler, Lektor B nur 5. Von den gefundenen
MehrStatistische Verfahren für das Data Mining in einem Industrieprojekt
Statistische Verfahren für das Data Mining in einem Industrieprojekt Thorsten Dickhaus Forschungszentrum Jülich GmbH Zentralinstitut für Angewandte Mathematik Telefon: 02461/61-4193 E-Mail: th.dickhaus@fz-juelich.de
MehrStatistik I für Betriebswirte Vorlesung 2
Statistik I für Betriebswirte Vorlesung 2 PD Dr. Frank Heyde TU Bergakademie Freiberg Institut für Stochastik 16. April 2015 PD Dr. Frank Heyde Statistik I für Betriebswirte Vorlesung 2 1 ii) empirische
Mehr1,11 1,12 1,13 1,14 1,15 1,16 1,17 1,17 1,17 1,18
3. Deskriptive Statistik Ziel der deskriptiven (beschreibenden) Statistik (explorativen Datenanalyse) ist die übersichtliche Darstellung der wesentlichen in den erhobenen Daten enthaltene Informationen
MehrStatistische Auswertung der Daten von Blatt 13
Statistische Auswertung der Daten von Blatt 13 Problemstellung 1 Graphische Darstellung der Daten 1 Diskussion der Normalverteilung 3 Mittelwerte und deren Konfidenzbereiche 3 Signifikanz der Behandlung
MehrMonty Hall-Problem. Wochen 3 und 4: Verteilungen von Zufallsvariablen. Lernziele. Diskrete Verteilungen
Monty Hall-Problem Wochen 3 und 4: Verteilungen von Zufallsvariablen US-amerikanische Fernseh-Show Let s make a deal, moderiert von Monty Hall: WBL 15/17, 04.05.2015 Alain Hauser
MehrDatenanalyse mit Excel. Wintersemester 2013/14
Datenanalyse mit Excel 1 KORRELATIONRECHNUNG 2 Korrelationsrechnung Ziel der Korrelationsrechnung besteht im bivariaten Fall darin, die Stärke des Zusammenhangs zwischen zwei interessierenden statistischen
MehrProteinsequenzen. Raumstruktur GPCR. G-Protein gekoppelte Rezeptoren
G-Protein gekoppelte Rezeptoren Proteinsequenzen MEEPGAQCAPPPPAGSETWVPQANL SSAPSQNCSAKDYIYQDSISLPWKV LLVMLLALITLATTLSNAFVIATVY RTRKLHTPANYLIASLAVTDLLVSI LVMPISTMYTVTGRWTLGQVVCDFW LSSDITCCTASILHLCVIALDRYWA
MehrEvaluation der Normalverteilungsannahme
Evaluation der Normalverteilungsannahme. Überprüfung der Normalverteilungsannahme im SPSS P. Wilhelm; HS SPSS bietet verschiedene Möglichkeiten, um Verteilungsannahmen zu überprüfen. Angefordert werden
MehrVerteilungsanalyse. Johannes Hain. Lehrstuhl für Mathematik VIII Statistik 1/31
Verteilungsanalyse Johannes Hain Lehrstuhl für Mathematik VIII Statistik 1/31 Datentypen Als Sammeln von Daten bezeichnet man in der Statistik das Aufzeichnen von Fakten. Erhobene Daten klassifziert man
MehrHerzlich Willkommen zur Vorlesung Statistik
Herzlich Willkommen zur Vorlesung Statistik Thema dieser Vorlesung: Kovarianz und Korrelation Prof. Dr. Wolfgang Ludwig-Mayerhofer Universität Siegen Philosophische Fakultät, Seminar für Sozialwissenschaften
MehrVerteilungsanalyse. Johannes Hain. Lehrstuhl für Mathematik VIII Statistik 1/35
Verteilungsanalyse Johannes Hain Lehrstuhl für Mathematik VIII Statistik 1/35 Datentypen Als Sammeln von Daten bezeichnet man in der Statistik das Aufzeichnen von Fakten. Erhobene Daten klassifziert man
MehrMedizinische Biometrie (L5)
Medizinische Biometrie (L5) Vorlesung II Daten Deskription Prof. Dr. Ulrich Mansmann Institut für Medizinische Informationsverarbeitung, Biometrie und Epidemiologie mansmann@ibe.med.uni-muenchen.de IBE,
MehrMini-Skript Wahrscheinlichkeitstheorie und Statistik
Mini-Skript Wahrscheinlichkeitstheorie und Statistik Peter Bühlmann Georg Grafendorfer, Lukas Meier Inhaltsverzeichnis 1 Der Begriff der Wahrscheinlichkeit 1 1.1 Rechenregeln für Wahrscheinlichkeiten........................
MehrÜbungsrunde 7, Gruppe 2 LVA 107.369, Übungsrunde 7, Gruppe 2, 28.11. Markus Nemetz, markus.nemetz@tuwien.ac.at, TU Wien, 11/2006
1 3.34 1.1 Angabe Übungsrunde 7, Gruppe 2 LVA 107.369, Übungsrunde 7, Gruppe 2, 28.11. Markus Nemetz, markus.nemetz@tuwien.ac.at, TU Wien, 11/2006 U sei auf dem Intervall (0, 1) uniform verteilt. Zeigen
MehrEinleitung 19. Teil I Datenanalyse und Modellbildung Grundlagen 25
Inhaltsverzeichnis Einleitung 19 Zu diesem Buch 19 Konventionen in diesem Buch 20 Was Sie nicht lesen müssen 21 Falsche Voraussetzungen 21 Wie dieses Buch aufgebaut ist 21 Teil I: Datenanalyse und Grundlagen
MehrTeil II: Einführung in die Statistik
Teil II: Einführung in die Statistik (50 Punkte) Bitte beantworten Sie ALLE Fragen. Es handelt sich um multiple choice Fragen. Sie müssen die exakte Antwortmöglichkeit angeben, um die volle Punktzahl zu
MehrStatistik II für Betriebswirte Vorlesung 3
PD Dr. Frank Heyde TU Bergakademie Freiberg Institut für Stochastik Statistik II für Betriebswirte Vorlesung 3 5. November 2013 Beispiel: Aktiensplit (Aczel & Sounderpandan, Aufg. 14-28) Ein Börsenanalyst
Mehr- Beschreibung der Stichprobe(n-Häufigkeitsverteilung) <- Ermittlung deskriptiver Maßzahlen (Mittelungsmaße, Variationsmaße, Formparameter)
Mehr
WEBINAR@LUNCHTIME THEMA: " SCHICKE BERICHTE SCHNELL ERSTELLT MIT DEM SAS ENTERPRISE GUIDE" HELENE SCHMITZ
WEBINAR@LUNCHTIME THEMA: " SCHICKE BERICHTE SCHNELL ERSTELLT MIT DEM SAS ENTERPRISE GUIDE" HELENE SCHMITZ EBINAR@LUNCHTIME HERZLICH WILLKOMMEN BEI WEBINAR@LUNCHTIME Moderation Anne K. Bogner-Hamleh SAS
Mehr1 Darstellen von Daten
1 Darstellen von Daten BesucherInnenzahlen der Bühnen Graz in der Spielzeit 2010/11 1 Opernhaus 156283 Hauptbühne 65055 Probebühne 7063 Ebene 3 2422 Next Liberty 26800 Säulen- bzw. Balkendiagramm erstellen
MehrDeskriptive Statistik
Deskriptive Statistik In der beschreibenden Statistik werden Methoden behandelt, mit deren Hilfe man Daten übersichtlich darstellen und kennzeichnen kann. Die Urliste (=Daten in der Reihenfolge ihrer Erhebung)
MehrMethoden der empirischen Sozialforschung I
Methoden der empirischen Sozialforschung I Annelies Blom, PhD TU Kaiserslautern Wintersemester 2011/12 Übersicht Quantitative Datenauswertung: deskriptive und induktive Statistik Wiederholung: Die wichtigsten
MehrKapitel 3. Zufallsvariable. Wahrscheinlichkeitsfunktion, Dichte und Verteilungsfunktion. Erwartungswert, Varianz und Standardabweichung
Kapitel 3 Zufallsvariable Josef Leydold c 2006 Mathematische Methoden III Zufallsvariable 1 / 43 Lernziele Diskrete und stetige Zufallsvariable Wahrscheinlichkeitsfunktion, Dichte und Verteilungsfunktion
Mehr90-minütige Klausur Statistik für Studierende der Kommunikationswissenschaft
Prof. Dr. Helmut Küchenhoff SS08 90-minütige Klausur Statistik für Studierende der Kommunikationswissenschaft am 22.7.2008 Anmerkungen Überprüfen Sie bitte sofort, ob Ihre Angabe vollständig ist. Sie sollte
MehrWolfgang Trutschnig. Salzburg, 2014-05-08. FB Mathematik Universität Salzburg www.trutschnig.net
Auffrischungskurs Angewandte Statistik/Datenanalyse (Interne Weiterbildung FOR SS14-08) Block 1: Deskriptive Statistik, Wiederholung grundlegender Konzepte, R FB Mathematik Universität Salzburg www.trutschnig.net
MehrStatistik im Bachelor-Studium der BWL und VWL
Max C. Wewel Statistik im Bachelor-Studium der BWL und VWL Methoden, Anwendung, Interpretation Mit herausnehmbarer Formelsammlung ein Imprint von Pearson Education München Boston San Francisco Harlow,
Mehr9. Schätzen und Testen bei unbekannter Varianz
9. Schätzen und Testen bei unbekannter Varianz Dr. Antje Kiesel Institut für Angewandte Mathematik WS 2011/2012 Schätzen und Testen bei unbekannter Varianz Wenn wir die Standardabweichung σ nicht kennen,
MehrGrundlagen der Inferenzstatistik: Was Ihnen nicht erspart bleibt!
Grundlagen der Inferenzstatistik: Was Ihnen nicht erspart bleibt! 1 Einführung 2 Wahrscheinlichkeiten kurz gefasst 3 Zufallsvariablen und Verteilungen 4 Theoretische Verteilungen (Wahrscheinlichkeitsfunktion)
Mehrε heteroskedastisch BINARY CHOICE MODELS Beispiele: Wahlentscheidung Kauf langlebiger Konsumgüter Arbeitslosigkeit Schätzung mit OLS?
BINARY CHOICE MODELS 1 mit Pr( Y = 1) = P Y = 0 mit Pr( Y = 0) = 1 P Beispiele: Wahlentscheidung Kauf langlebiger Konsumgüter Arbeitslosigkeit Schätzung mit OLS? Y i = X i β + ε i Probleme: Nonsense Predictions
MehrZusammenhänge zwischen metrischen Merkmalen
Zusammenhänge zwischen metrischen Merkmalen Darstellung des Zusammenhangs, Korrelation und Regression Daten liegen zu zwei metrischen Merkmalen vor: Datenpaare (x i, y i ), i = 1,..., n Beispiel: x: Anzahl
MehrModellbildung und Simulation
Modellbildung und Simulation 5. Vorlesung Wintersemester 2007/2008 Klaus Kasper Value at Risk (VaR) Glossar Portfolio: In der Ökonomie bezeichnet der Begriff Portfolio ein Bündel von Investitionen, das
MehrStandardisierung von Daten Darstellung von Daten in Texten, Tabellen und Abbildungen. Standardisierung von Daten
DAS THEMA: TABELLEN UND ABBILDUNGEN Standardisierung von Daten Darstellung von Daten in Texten, Tabellen und Abbildungen Standardisierung von Daten z-standardisierung Standardnormalverteilung 1 DIE Z-STANDARDISIERUNG
MehrUnsupervised Kernel Regression
9. Mai 26 Inhalt Nichtlineare Dimensionsreduktion mittels UKR (Unüberwachte KernRegression, 25) Anknüpfungspunkte Datamining I: PCA + Hauptkurven Benötigte Zutaten Klassische Kernregression Kerndichteschätzung
MehrFüllmenge. Füllmenge. Füllmenge. Füllmenge. Mean = 500,0029 Std. Dev. = 3,96016 N = 10.000. 485,00 490,00 495,00 500,00 505,00 510,00 515,00 Füllmenge
2.4 Stetige Zufallsvariable Beispiel. Abfüllung von 500 Gramm Packungen einer bestimmten Ware auf einer automatischen Abfüllanlage. Die Zufallsvariable X beschreibe die Füllmenge einer zufällig ausgewählten
MehrEine Einführung in R: Statistische Tests
Eine Einführung in R: Statistische Tests Bernd Klaus, Verena Zuber Institut für Medizinische Informatik, Statistik und Epidemiologie (IMISE), Universität Leipzig http://www.uni-leipzig.de/ zuber/teaching/ws12/r-kurs/
Mehr5. Schließende Statistik. 5.1. Einführung
5. Schließende Statistik 5.1. Einführung Sollen auf der Basis von empirischen Untersuchungen (Daten) Erkenntnisse gewonnen und Entscheidungen gefällt werden, sind die Methoden der Statistik einzusetzen.
MehrElisabeth Raab-Steiner/Michael Benesch. Der Fragebogen. Von der Forschungsidee zur SPSS/PASW-Auswertung. 2., aktualisierte Auflage. facultas.
Elisabeth Raab-Steiner/Michael Benesch Der Fragebogen Von der Forschungsidee zur SPSS/PASW-Auswertung 2., aktualisierte Auflage facultas.wuv Inhaltsverzeichnis 1 Elementare Definitionen 11 1.1 Deskriptive
MehrKorrelation - Regression. Berghold, IMI
Korrelation - Regression Zusammenhang zwischen Variablen Bivariate Datenanalyse - Zusammenhang zwischen 2 stetigen Variablen Korrelation Einfaches lineares Regressionsmodell 1. Schritt: Erstellung eines
MehrStochastische Eingangsprüfung, 17.05.2008
Stochastische Eingangsprüfung, 17.5.8 Wir gehen stets von einem Wahrscheinlichkeitsraum (Ω, A, P) aus. Aufgabe 1 ( Punkte) Sei X : Ω [, ) eine integrierbare Zufallsvariable mit XdP = 1. Sei Q : A R, Q(A)
MehrModellgestützte Analyse und Optimierung Übungsblatt 4
Fakultät für Informatik Lehrstuhl 4 Peter Buchholz, Jan Kriege Sommersemester 2015 Modellgestützte Analyse und Optimierung Übungsblatt 4 Ausgabe: 27.04.2015, Abgabe: 04.05.2015 (12 Uhr) Aufgabe 4.1: Verteilungsfunktionen
MehrAnalog zu Aufgabe 16.1 werden die Daten durch folgenden Befehl eingelesen: > kredit<-read.table("c:\\compaufg\\kredit.
Lösung 16.3 Analog zu Aufgabe 16.1 werden die Daten durch folgenden Befehl eingelesen: > kredit
MehrParametrische Statistik
Statistik und ihre Anwendungen Parametrische Statistik Verteilungen, maximum likelihood und GLM in R Bearbeitet von Carsten F. Dormann 1. Auflage 2013. Taschenbuch. xxii, 350 S. Paperback ISBN 978 3 642
MehrInterne und externe Modellvalidität
Interne und externe Modellvalidität Interne Modellvalidität ist gegeben, o wenn statistische Inferenz bzgl. der untersuchten Grundgesamtheit zulässig ist o KQ-Schätzer der Modellparameter u. Varianzschätzer
Mehr4. Auswertung eindimensionaler Daten
4. Auswertung eindimensionaler Daten Ziel dieses Kapitels: Präsentation von Methoden zur statistischen Auswertung eines einzelnen Merkmals 64 Bezeichnungen (Wiederholung): Merkmalsträger: e 1,..., e n
Mehr, dt. $+ f(x) = , - + < x < +, " > 0. " 2# Für die zugehörige Verteilungsfunktion F(x) ergibt sich dann: F(x) =
38 6..7.4 Normalverteilung Die Gauß-Verteilung oder Normal-Verteilung ist eine stetige Verteilung, d.h. ihre Zufallsvariablen können beliebige reelle Zahlenwerte annehmen. Wir definieren sie durch die
MehrGrundlagen von Versuchsmethodik und Datenanalyse
Grundlagen von Versuchsmethodik und Datenanalyse Der Anfang: Hypothesen über Ursache-Wirkungs-Zusammenhänge Ursache Wirkung Koffein verbessert Kurzzeitgedächtnis Gewaltfilme führen zu aggressivem Verhalten
MehrWahrscheinlichkeitsrechnung und Statistik für Biologen Einführung: Deskriptive Statistik
Wahrscheinlichkeitsrechnung und Statistik für Biologen Einführung: Deskriptive Statistik Martin Hutzenthaler & Dirk Metzler 17. April 2012 Inhaltsverzeichnis 1 Einführung 1 1.1 Konzept und Quellen.........................................
MehrEinführung in die Statistik für Wirtschaftswissenschaftler für Betriebswirtschaft und Internationales Management
Einführung in die Statistik für Wirtschaftswissenschaftler für Betriebswirtschaft und Internationales Management Sommersemester 2013 Hochschule Augsburg : Gliederung 1 Einführung 2 Deskriptive Statistik
MehrTeil I Beschreibende Statistik 29
Vorwort zur 2. Auflage 15 Vorwort 15 Kapitel 0 Einführung 19 0.1 Methoden und Aufgaben der Statistik............................. 20 0.2 Ablauf statistischer Untersuchungen..............................
MehrEinführung in statistische Analysen
Einführung in statistische Analysen Andreas Thams Econ Boot Camp 2008 Wozu braucht man Statistik? Statistik begegnet uns jeden Tag... Weihnachten macht Deutschen Einkaufslaune. Im Advent überkommt die
MehrGrundbegriffe der Biostatistik
Grundbegriffe der Biostatistik Theo Gasser & Burkhardt Seifert Abteilung Biostatistik Universität Zürich 3. Auflage 2006 INHALTSVERZEICHNIS i Inhaltsverzeichnis 1 Einführung 1 1.1 Was bietet die Statistik?.............................
MehrBeispiele zur UE Wirtschaftsstatistik 1 bei Nagel
Beispiele zur UE Wirtschaftsstatistik 1 bei Nagel 1 Ereignisse und Wahrscheinlichkeiten 1. Ein Würfel wird zweimal geworfen, der Stichprobenraum Ω ist Ihnen nicht neu. Versuchen Sie, den Stichprobenraum
MehrBiostatistik, Winter 2011/12
Biostatistik, Winter 2011/12 Vergleich zweier Stichproben, nichtparametrische Tests Prof. Dr. Achim Klenke http://www.aklenke.de 11. Vorlesung: 27.01.2012 1/86 Inhalt 1 Tests t-test 2 Vergleich zweier
MehrGemischte Modelle. Fabian Scheipl, Sonja Greven. SoSe 2011. Institut für Statistik Ludwig-Maximilians-Universität München
Gemischte Modelle Fabian Scheipl, Sonja Greven Institut für Statistik Ludwig-Maximilians-Universität München SoSe 2011 Inhalt Amsterdam-Daten: LMM Amsterdam-Daten: GLMM Blutdruck-Daten Amsterdam-Daten:
MehrEinführung in die Statistik
Einführung in die Statistik Dr. C.J. Luchsinger 2 Zufallsgrössen Literatur Kapitel 2 * Statistik in Cartoons: Kapitel 4 * Krengel: 3.1 und 3.2 in 3 und (Honours Program) 10 sowie 11.1, 11.2 und 11.3 in
Mehr2.3 Univariate Datenanalyse in R
2.3. UNIVARIATE DATENANALYSE IN R 47 2.3 Univariate Datenanalyse in R Wir wollen nun lernen, wie man in R Daten elementar analysiert. R bietet eine interaktive Umgebung, Befehlsmodus genannt, in der man
MehrEinseitig gerichtete Relation: Mit zunehmender Höhe über dem Meeresspiegel sinkt im allgemeinen die Lufttemperatur.
Statistik Grundlagen Charakterisierung von Verteilungen Einführung Wahrscheinlichkeitsrechnung Wahrscheinlichkeitsverteilungen Schätzen und Testen Korrelation Regression Einführung Die Analyse und modellhafte
MehrAnleitung zum Physikpraktikum für Oberstufenlehrpersonen Fehlerrechnung und Statistik (FR) Herbstsemester 2015
Anleitung zum Physikpraktikum für Oberstufenlehrpersonen Fehlerrechnung und Statistik (FR) Herbstsemester 2015 Physik-Institut der Universität Zürich Inhaltsverzeichnis 12 Fehlerrechnung und Statistik
MehrMultivariate Statistik
Hermann Singer Multivariate Statistik 1 Auflage 15 Oktober 2012 Seite: 12 KAPITEL 1 FALLSTUDIEN Abbildung 12: Logistische Regression: Geschätzte Wahrscheinlichkeit für schlechte und gute Kredite (rot/blau)
MehrBox-and-Whisker Plot -0,2 0,8 1,8 2,8 3,8 4,8
. Aufgabe: Für zwei verschiedene Aktien wurde der relative Kurszuwachs (in % beobachtet. Aus den jeweils 20 Quartaldaten ergaben sich die folgenden Box-Plots. Box-and-Whisker Plot Aktie Aktie 2-0,2 0,8,8
MehrBeispiel 5 Europäische Call Option (ECO) in einer Aktie S mit Laufzeit T und Ausübungspreis (Strikepreis) K.
Beispiel 5 Europäische Call Option (ECO) in einer Aktie S mit Laufzeit T und Ausübungspreis (Strikepreis) K. Wert der Call Option zum Zeitpunkt T: max{s T K,0} Preis der ECO zum Zeitpunkt t < T: C = C(t,
MehrProfil A 49,3 48,2 50,7 50,9 49,8 48,7 49,6 50,1 Profil B 51,8 49,6 53,2 51,1 51,1 53,4 50,7 50 51,5 51,7 48,8
1. Aufgabe: Eine Reifenfirma hat für Winterreifen unterschiedliche Profile entwickelt. Bei jeweils gleicher Geschwindigkeit und auch sonst gleichen Bedingungen wurden die Bremswirkungen gemessen. Die gemessenen
MehrÜberblick über die Tests
Anhang A Überblick über die Tests A.1 Ein-Stichproben-Tests A.1.1 Tests auf Verteilungsannahmen ˆ Shapiro-Wilk-Test Situation: Test auf Normalverteilung H 0 : X N(µ, σ 2 ) H 1 : X nicht normalverteilt
MehrBeispiel 48. 4.3.2 Zusammengesetzte Zufallsvariablen
4.3.2 Zusammengesetzte Zufallsvariablen Beispiel 48 Ein Würfel werde zweimal geworfen. X bzw. Y bezeichne die Augenzahl im ersten bzw. zweiten Wurf. Sei Z := X + Y die Summe der gewürfelten Augenzahlen.
MehrMonte Carlo Methoden in Kreditrisiko-Management
Monte Carlo Methoden in Kreditrisiko-Management P Kreditportfolio bestehend aus m Krediten; Verlustfunktion L = n i=1 L i; Die Verluste L i sind unabhängig bedingt durch einen Vektor Z von ökonomischen
MehrMultivariate and Geostatistical Data Analysis. Multivariate and Geostatistical Data Analysis
Multivariate and Geostatistical Data Analysis Multivariate and Geostatistical Data Analysis c 2012 Helmut Schaeben Geomathematics and Geoinformatics Technische Universität Bergakademie Freiberg, Germany
MehrAufgabe 1 10 ECTS. y i x j gering mittel hoch n i Hausrat 200 25 0 225 KFZ 0 10 75 85 Unfall 20 35 90 145 Reiserücktritt 40 5 0 45 n j 260 75 165 500
Aufgabe 1 Für die Securance-Versicherung liegen Ihnen die gemeinsamen absoluten Häugkeiten der Merkmale X: Schadenshöhe und Y : Versicherungsart für die letzten 500 gemeldeten Schäden vor. 1. Interpretieren
MehrForschungsstatistik I
Prof. Dr. G. Meinhardt. Stock, Nordflügel R. 0-49 (Persike) R. 0- (Meinhardt) Sprechstunde jederzeit nach Vereinbarung Forschungsstatistik I Dr. Malte Persike persike@uni-mainz.de WS 008/009 Fachbereich
Mehr2. Korrelation, lineare Regression und multiple Regression
multiple 2.2 Lineare 2.2 Lineare 1 / 130 2.2 Lineare 2 / 130 2.1 Beispiel: Arbeitsmotivation Untersuchung zur Motivation am Arbeitsplatz in einem Chemie-Konzern 25 Personen werden durch Arbeitsplatz zufällig
MehrStatistik Rechnerübungen Beispiele für die Einführungsstunde mit Lösungsweg
Statistik Rechnerübungen Beispiele für die Einführungsstunde mit Lösungsweg Prof. Dr. Peter Plappert Fakultät Grundlagen Für alle Beispiele benötigen Sie die Datei einf_daten.xls. Für Beispiel 1 ist zusätzlich
MehrMETHODENLEHRE I WS 2013/14 THOMAS SCHÄFER
METHODENLEHRE I WS 2013/14 THOMAS SCHÄFER DAS THEMA: INFERENZSTATISTIK IV INFERENZSTATISTISCHE AUSSAGEN FÜR ZUSAMMENHÄNGE UND UNTERSCHIEDE Inferenzstatistik für Zusammenhänge Inferenzstatistik für Unterschiede
MehrUntersuchungen zum Thema Tracking Error
Untersuchungen zum Thema Tracking Error J. Fulmek 24. August 2003 1 Einleitung Im Folgenden werden folgende Punkte untersucht: 1. verschiedene in der Literatur übliche Definitionen des Tracking Errors
MehrSchätzung des Lifetime Values von Spendern mit Hilfe der Überlebensanalyse
Schätzung Lifetime Values von Spenn mit Hilfe Überlebensanalyse Einführung in das Verfahren am Beispiel Einzugsgenehmigung Überlebensanalysen o Ereignisdatenanalysen behandeln das Problem, mit welcher
MehrRegressionsanalysen. Zusammenhänge von Variablen. Ziel der Regression. ( Idealfall )
Zusammenhänge von Variablen Regressionsanalysen linearer Zusammenhang ( Idealfall ) kein Zusammenhang nichtlinearer monotoner Zusammenhang (i.d.regel berechenbar über Variablentransformationen mittels
MehrUmgang mit und Ersetzen von fehlenden Werten bei multivariaten Analysen
Umgang mit und Ersetzen von fehlenden Werten bei multivariaten Analysen Warum überhaupt Gedanken machen? Was fehlt, ist doch weg, oder? Allgegenwärtiges Problem in psychologischer Forschung Bringt Fehlerquellen
MehrAuswertung und Darstellung wissenschaftlicher Daten (1)
Auswertung und Darstellung wissenschaftlicher Daten () Mag. Dr. Andrea Payrhuber Zwei Schritte der Auswertung. Deskriptive Darstellung aller Daten 2. analytische Darstellung (Gruppenvergleiche) SPSS-Andrea
MehrAnwendung von Statistik in Excel Deskriptive Statistik und Wirtschaftsstatistik
Anwendung von Statistik in Excel Deskriptive Statistik und Wirtschaftsstatistik Wintersemester 08/09 Kai Schaal Universität zu Köln Organisatorisches und Einleitung (1) Was, wann, wo? Anwendung von Statistik
MehrFranz Kronthaler. Statistik angewandt. Datenanalyse ist (k)eine Kunst. Excel Edition. ^ Springer Spektrum
Franz Kronthaler Statistik angewandt Datenanalyse ist (k)eine Kunst Excel Edition ^ Springer Spektrum Inhaltsverzeichnis Teil I Basiswissen und Werkzeuge, um Statistik anzuwenden 1 Statistik ist Spaß 3
MehrAnalyse von Zeitreihen in der Umweltphysik und Geophysik Stochastische Prozesse
Analyse von Zeitreihen in der Umweltphysik und Geophysik Stochastische Prozesse Yannik Behr Gliederung 1 Stochastische Prozesse Stochastische Prozesse Ein stochastischer Prozess ist ein Phänomen, dessen
MehrEine Einführung in R: Deskriptive Statistiken und Graphiken
Eine Einführung in R: Deskriptive Statistiken und Graphiken (basierend auf Vorarbeiten von Verena Zuber und Bernd Klaus) Institut für Medizinische Informatik, Statistik und Epidemiologie (IMISE), Universität
MehrB 2. " Zeigen Sie, dass die Wahrscheinlichkeit, dass eine Leiterplatte akzeptiert wird, 0,93 beträgt. (genauerer Wert: 0,933).!:!!
Das folgende System besteht aus 4 Schraubenfedern. Die Federn A ; B funktionieren unabhängig von einander. Die Ausfallzeit T (in Monaten) der Federn sei eine weibullverteilte Zufallsvariable mit den folgenden
MehrBeispiel: Sonntagsfrage. Einführung in die induktive Statistik. Statistische Tests. Statistische Tests
Beispiel: Sonntagsfrage Vier Wochen vor der österreichischen Nationalratswahl 1999 wurde 499 Haushalten die Sonntagsfrage gestellt: Falls nächsten Sonntag Wahlen wären, welche Partei würden Sie wählen?
Mehr