Einführung in die Quantitative Datenanalyse

Größe: px
Ab Seite anzeigen:

Download "Einführung in die Quantitative Datenanalyse"

Transkript

1 Einführung in die Quantitative Datenanalyse Sitzung 3: Lineare Regression I Proseminar an der Freien Universität Berlin Marcus Spittler

2 2 / 21 Inhalt der 3. Sitzung Datenmanipulation mit R und dplyr (mehr Infos und hilfreiche Tipps gibt es hier: und hier: Kurzer Einstieg in die lineare Regression (heute bivariate Zusammenhänge) Riverview Beispiel aus Lewis Beck/Lewis Beck (2016)

3 4 / 21 R Grundlagen Zuweisungspfeil Zuweisung erfolgen mit Hilfe des Pfeils Lies: Speichere das Ergebnis von rechts in das Objekt links ab neuesobjekt < Funktion Mit Funktionen können wir unsere Daten manipulieren. Wir erkennen sie daran, dass nach ihrem Funktionsnamen immer Klammmern folgen (...). Innerhalb der Klammern übergeben wir der Funktion unsere Argumente. Würden in einem Satz den Verben entsprechen. neuesobjekt <- einefunktion(27)

4 5 / 21 R Grundlagen II Pipe Mit Hilfe von einfachen Pipes %>%wird das Ergebnis von links in die Funktion(en) rechts übertragen. Wichtig: Es wird nichts gespeichert. Lies: Nimm das Objekt/Ergebnis links und bring es in die Funktion rechts Pipes kann man mit CMD + Mschnell tippen. objekt %>% einefunktion() Pipes können auch verkettet werden objekt %>% einefunktion() %>% undnocheinefunktion() Das Ergebnis der ganzen Kette kann auch gespeichert werden neuesobjekt <- objekt %>% einefunktion() %>% undnocheinefunktion()

5 8 / 21 R Grundlagen III Mehrere Werte werden mit der Funktion combine miteinander verbunden c neuesobjekt <- c(2017, "bisschen Text", 45, TRUE, FALSE, 300) Hilfe zu einzelnen Befehlen bekommt man mit einem Fragezeichen??filter

6 11 / 21 Lineare Regression Mit einer linearen Regression lassen sich sog. Zusammenhangshypothesen prüfen (nicht Unterschiedshypothesen), also Fragen ob ein Merkmal Xmit einem anderen Merkmal Yin Zusammenhang steht. Bsp.: Ist das Einkommen von Personen die länger zur Schule/Universität/etc. gegangen sind höher, gegenüber jenen die kürzere Zeit Bildungseinrichtungen besucht haben? Vorausetzung ist, dass die abhängige Variable metrisch skaliert ist. In diesem Beispiel ist Einkommen die abhängige Variable. Erklärende Variablen (hier Bildungsjahre) nennt man unabhängige Variablen.

7 12 / 21 Riverview Beispiel Im Örtchen Riverview möchte man etwas über den Zusammmenhang von Bildungsdauer und Einkommen bei Angestellten im Öffentlichen Dienst wissen. Von den 320 Angestellten (Grundgesamtheit) wurde eine zufällige Stichprobe von 32 Angestellten gezogen und deren Bildungsdauer und Einkommen erfasst. Näheres zum Beispiel findet man bei Lewis Beck/Lewis Beck (2016) ab Seite 8. ## # A tibble: 6 3 ## id edu income ## <int> <int> <dbl> ## ## ## ## ## ##

8 13 / 21 Riverview Show 8 entries Search: id edu income Showing 1 to 8 of 32 entries Previous Next

9 Riverview 14 / 21

10 15 / 21 Erste Interpretation Die unabhängige Variable X wird auf der X Achse (Abszisse) abgetragen, die abhängige Variable Y auf der Y Achse (Ordinate). Jeder Punkt im Streudiagramm entspricht einer Untersuchungseinheit, im Riverview Beispiel einem Angestellten. Geht man von einem bestimmten Datenpunkt senkrecht nach unten, so erhält man die Ausprägung der X Variablen. Geht man waagrecht nach links, so findet man die Ausprägung der abhängigen Variablen Y. Das Streudiagramm zeigt die gemeinsame Verteilung der Merkmale Bildung (X) und Einkommen (Y). Die Merkmale hängen, dem Augenschein zufolge, positiv zusammen: Je länger die Bildungsdauer, desto höher ist auch im allgemeinen auch das Einkommen der Befragten. Es besteht offenbar eine positive Beziehung zwischen X und Y.

11 Riverview Beispiel 17 / 21

12 Linearer Zusammenhang Grundgleichung eines linearen Zusammenhangs y = b0 + b1x Beispiel für einen perfekt linearen Zusammenhang y = 5 + 2x Unabhängige Variable X Abhängige Variable y / 21

13 Scatterplot 19 / 21

14 20 / 21 Linearer Zusammenhang Linearer Zusammenhang mit Fehlerterm Riverview Beispiel: y = b0 + b1x + e y = x + e

Teil: lineare Regression

Teil: lineare Regression Teil: lineare Regression 1 Einführung 2 Prüfung der Regressionsfunktion 3 Die Modellannahmen zur Durchführung einer linearen Regression 4 Dummyvariablen 1 Einführung o Eine statistische Methode um Zusammenhänge

Mehr

Bivariate explorative Datenanalyse in R

Bivariate explorative Datenanalyse in R Bivariate explorative Datenanalyse in R Achim Zeileis 2009-02-20 1 Zwei metrische Merk Zunächst einmal wird wieder der BBBClub Datensatz geladen und der Bequemlichkeit halber auch attached. R> load("bbbclub.rda")

Mehr

Bivariate Zusammenhänge

Bivariate Zusammenhänge Bivariate Zusammenhänge 40 60 80 Bivariater Zusammenhang: Zusammenhang zwischen zwei Variablen weight (kg) Gibt es einen Zusammenhang zwischen Größe & Gewicht? (am Beispieldatensatz) Offensichtlich positiver

Mehr

Bivariate explorative Datenanalyse in R

Bivariate explorative Datenanalyse in R Bivariate explorative Datenanalyse in R Achim Zeileis, Regina Tüchler 2006-10-09 In der LV Statistik 1 haben wir auch den Zusammenhang von 2 Variablen untersucht. Hier werden die dazugehörenden R-Befehle

Mehr

Es können keine oder mehrere Antworten richtig sein. Eine Frage ist NUR dann richtig beantwortet, wenn ALLE richtigen Antworten angekreuzt wurden.

Es können keine oder mehrere Antworten richtig sein. Eine Frage ist NUR dann richtig beantwortet, wenn ALLE richtigen Antworten angekreuzt wurden. Teil III: Statistik Alle Fragen sind zu beantworten. Es können keine oder mehrere Antworten richtig sein. Eine Frage ist NUR dann richtig beantwortet, wenn ALLE richtigen Antworten angekreuzt wurden. Wird

Mehr

Übung Statistik I Statistik mit Stata SS Zusammenhangsanalyse III

Übung Statistik I Statistik mit Stata SS Zusammenhangsanalyse III Übung Statistik I Statistik mit Stata SS07 02.07.2007 11. Zusammenhangsanalyse III Andrea Kummerer (M.A.) Oec R. I-53 Sprechstunde: n.v. Andrea.Kummerer@sowi.uni-goettingen.de Statistik mit Stata - 1 -

Mehr

Elementare Regressionsrechnung

Elementare Regressionsrechnung Elementare Regressionsrechnung Motivation: Streudiagramm zweier metrisch skalierter Merkmale X und Y Y X Dr. Karsten Webel 107 Ziel: Erfassung des Zusammenhangs zwischen X und Y durch eine Gerade der Form

Mehr

Übung 3 im Fach "Biometrie / Q1"

Übung 3 im Fach Biometrie / Q1 Universität Ulm, Institut für Epidemiologie und Medizinische Biometrie, D-89070 Ulm Institut für Epidemiologie und Medizinische Biometrie Leiter: Prof. Dr. D. Rothenbacher Schwabstr. 13, 89075 Ulm Tel.

Mehr

Übungsblatt 10: Lineare Regression (Sitzung 11)

Übungsblatt 10: Lineare Regression (Sitzung 11) 1 Übungsblatt 10: Lineare Regression (Sitzung 11) Aufgabe 1 a) Nach welchem Kriterium wird die Regressionsgerade zur Vorhersage von Y-Werten festgelegt? b) Was sind die Gemeinsamkeiten und Unterschiede

Mehr

Statistik II: Signifikanztests /2

Statistik II: Signifikanztests /2 Medien Institut : Signifikanztests /2 Dr. Andreas Vlašić Medien Institut (0621) 52 67 44 vlasic@medien-institut.de Gliederung 1. Korrelation 2. Exkurs: Kausalität 3. Regressionsanalyse 4. Key Facts 2 I

Mehr

Beschreibende Statistik Zweidimensionale (bivariate) Daten

Beschreibende Statistik Zweidimensionale (bivariate) Daten Mathematik II für Biologen Beschreibende Statistik Zweidimensionale (bivariate) Daten 8. Mai 2009 Lineare Regression Transformationen Produktmomenten-Korrelation Rangkorrelation Warnung Stichprobe ( 1,y

Mehr

TEIL 12: BIVARIATE ANALYSE FÜR METRISCH SKALIERTE VARIABLEN

TEIL 12: BIVARIATE ANALYSE FÜR METRISCH SKALIERTE VARIABLEN TEIL 12: BIVARIATE ANALYSE FÜR METRISCH SKALIERTE VARIABLEN Bivariate Analyse für metrisch skalierte Variablen Grundlagen Verfahren für metrische Daten nutzen den vollen mathematischen Informationsgehalt

Mehr

Dr. Maike M. Burda. Welchen Einfluss hat die Körperhöhe auf das Körpergewicht? Eine Regressionsanalyse. HU Berlin, Econ Bootcamp 7.-9.

Dr. Maike M. Burda. Welchen Einfluss hat die Körperhöhe auf das Körpergewicht? Eine Regressionsanalyse. HU Berlin, Econ Bootcamp 7.-9. Dr. Maike M. Burda Welchen Einfluss hat die Körperhöhe auf das Körpergewicht? Eine Regressionsanalyse. HU Berlin, Econ Bootcamp 7.-9. Januar 2011 BOOTDATA11.GDT: 250 Beobachtungen für die Variablen...

Mehr

Bivariater Zusammenhang bei metrischen Variablen: Regression und Korrelation

Bivariater Zusammenhang bei metrischen Variablen: Regression und Korrelation Bivariater Zusammenhang bei metrischen Variablen: Regression und Korrelation PEΣO 12. November 2001 Von der Tabellenanalyse zur Regression Die bivariate Verteilung zweier metrischer Variablen kann konzeptionell

Mehr

Einführung in die Statistik für Politikwissenschaftler Sommersemester 2011

Einführung in die Statistik für Politikwissenschaftler Sommersemester 2011 Einführung in die Statistik für Politikwissenschaftler Sommersemester 2011 Es können von den Antworten alle, mehrere oder keine Antwort(en) richtig sein. Nur bei einer korrekten Antwort (ohne Auslassungen

Mehr

TEIL 12: BIVARIATE ANALYSE FÜR METRISCH SKALIERTE VARIABLEN

TEIL 12: BIVARIATE ANALYSE FÜR METRISCH SKALIERTE VARIABLEN TEIL 12: BIVARIATE ANALYSE FÜR METRISCH SKALIERTE VARIABLEN GLIEDERUNG Bivariate Analyse für metrisch skalierte Variablen Grundlagen Streudiagramme und Visualisierungen von Zusammenhängen Positive lineare

Mehr

1 x 1 y 1 2 x 2 y 2 3 x 3 y 3... n x n y n

1 x 1 y 1 2 x 2 y 2 3 x 3 y 3... n x n y n 3.2. Bivariate Verteilungen zwei Variablen X, Y werden gemeinsam betrachtet (an jedem Objekt werden gleichzeitig zwei Merkmale beobachtet) Beobachtungswerte sind Paare von Merkmalsausprägungen (x, y) Beispiele:

Mehr

Voraussetzung für statistische Auswertung: jeder Fall besitzt in bezug auf jedes Merkmal genau eine Ausprägung

Voraussetzung für statistische Auswertung: jeder Fall besitzt in bezug auf jedes Merkmal genau eine Ausprägung Rohdaten Urliste oder Rohdaten sind die auszuwertenden Daten in der Form, wie sie nach der Datenerhebung vorliegen. Dimensionen der Urliste sind die Fälle, Merkmale und ihre Ausprägungen. Voraussetzung

Mehr

Inhaltsübersicht.

Inhaltsübersicht. Inhaltsübersicht Vorwort zur vierten Auflage 1 Einleitung 2 Installation 3 Ein erster Überblick 4 Einführung in die Programmiersprache 5 Objekte 6 Dateneingabe und -management 7 Variablen bearbeiten 8

Mehr

6 Korrelations- und Regressionsanalyse: Zusammenhangsanalyse stetiger Merkmale

6 Korrelations- und Regressionsanalyse: Zusammenhangsanalyse stetiger Merkmale 6 Korrelations- und Regressionsanalyse: Zusammenhangsanalyse stetiger Merkmale 397 6.1 Korrelationsanalyse Jetzt betrachten wir bivariate Merkmale (X, Y ), wobei sowohl X als auch Y stetig bzw. quasi-stetig

Mehr

Bivariate Regressionsanalyse

Bivariate Regressionsanalyse Universität Bielefeld 15. März 2005 Kovarianz, Korrelation und Regression Kovarianz, Korrelation und Regression Ausgangspunkt ist folgende Datenmatrix: Variablen 1 2... NI 1 x 11 x 12... x 1k 2 x 21 x

Mehr

Einführung in die Statistik

Einführung in die Statistik Elmar Klemm Einführung in die Statistik Für die Sozialwissenschaften Westdeutscher Verlag INHALTSVERZEICHNIS 1. Einleitung und Begrifflichkeiten 11 1.1 Grundgesamtheit, Stichprobe 12 1.2 Untersuchungseinheit,

Mehr

Vorwort zur vierten Auflage Einleitung 13

Vorwort zur vierten Auflage Einleitung 13 http://www.beltz.de/de/nc/verlagsgruppe-beltz/gesamtprogramm.html?isbn=978-3-621-28249-9 6 Inhalt Inhalt Vorwort zur vierten Auflage 11 1 Einleitung 13 1.1 Warum R? 13 1.2 Fürwen ist dieses Buch? 14 1.3

Mehr

Statistische Methoden in den Umweltwissenschaften

Statistische Methoden in den Umweltwissenschaften Statistische Methoden in den Umweltwissenschaften Korrelationsanalysen Kreuztabellen und χ²-test Themen Korrelation oder Lineare Regression? Korrelationsanalysen - Pearson, Spearman-Rang, Kendall s Tau

Mehr

Hypothesentests mit SPSS

Hypothesentests mit SPSS Beispiel für eine einfache Regressionsanalyse (mit Überprüfung der Voraussetzungen) Daten: bedrohfb_v07.sav Hypothese: Die Skalenwerte auf der ATB-Skala (Skala zur Erfassung der Angst vor terroristischen

Mehr

6Korrelationsanalyse:Zusammengangsanalysestetiger Merkmale

6Korrelationsanalyse:Zusammengangsanalysestetiger Merkmale 6Korrelationsanalyse:Zusammengangsanalysestetiger Merkmale Jetzt betrachten wir bivariate Merkmale (X, Y ), wobei sowohl X als auch Y stetig bzw. quasi-stetig und mindestens ordinalskaliert, typischerweise

Mehr

Korrelation und Regression

Korrelation und Regression FB 1 W. Ludwig-Mayerhofer und 1 und FB 1 W. Ludwig-Mayerhofer und 2 Mit s- und sanalyse werden Zusammenhänge zwischen zwei metrischen Variablen analysiert. Wenn man nur einen Zusammenhang quantifizieren

Mehr

Workshop Statistik mit R

Workshop Statistik mit R Workshop Statistik mit R Aufgaben Stefan Heyder 7. und 8. März 2019 1 Grundlagen R und Vektoren 1.1 Einen Vektor erstellen (i) Erstellen Sie einen Vektor x welcher die Zahlen 1 bis 12 enthält. (ii) Multiplizieren

Mehr

Regressionsanalysen mit Stata

Regressionsanalysen mit Stata Regressionsanalysen mit Stata Wiederholung: Deskriptive Analysen - Univariate deskriptive Analysen (Häufigkeitsauszählungen einer Variablen) - Multivariate deskriptive Analysen (Untersuchung gemeinsamer

Mehr

Statistik II Übung 1: Einfache lineare Regression

Statistik II Übung 1: Einfache lineare Regression Statistik II Übung 1: Einfache lineare Regression Diese Übung beschäftigt sich mit dem Zusammenhang zwischen dem Lohneinkommen von sozial benachteiligten Individuen (16-24 Jahre alt) und der Anzahl der

Mehr

2.5 Lineare Regressionsmodelle

2.5 Lineare Regressionsmodelle 2.5.1 Wiederholung aus Statistik I Gegeben Datenpunkte (Y i, X i ) schätze die beste Gerade Y i = β 0 + β 1 X i, i = 1,..., n. 2 Induktive Statistik 409 Bsp. 2.30. [Kaffeeverkauf auf drei Flohmärkten]

Mehr

» S C H R I T T - F Ü R - S C H R I T T - A N L E I T U N G «M U L T I P L E L I N E A R E R E G R E S S I O N M I T S P S S / I B M Daniela Keller

» S C H R I T T - F Ü R - S C H R I T T - A N L E I T U N G «M U L T I P L E L I N E A R E R E G R E S S I O N M I T S P S S / I B M Daniela Keller » SCHRITT-FÜR-SCHRITTANLEITUNG«MULTIPLE LINEARE REGRESSION MIT SPSS/IBM Daniela Keller Daniela Keller - MULTIPLE LINEARE REGRESSION MIT SPSS/IBM Impressum 2016 Statistik und Beratung Dipl.-Math. Daniela

Mehr

Gibt es einen Zusammenhang zwischen Merkmalen? Korrelationen

Gibt es einen Zusammenhang zwischen Merkmalen? Korrelationen Arbeitsblatt SPSS Kapitel 8 Seite Gibt es einen Zusammenhang zwischen Merkmalen? Korrelationen Wie in allen Kapiteln gehen wir im Folgenden davon aus, dass Sie die Datei elporiginal.sav geöffnet haben.

Mehr

Statistik II Übung 1: Einfache lineare Regression

Statistik II Übung 1: Einfache lineare Regression Statistik II Übung 1: Einfache lineare Regression Diese Übung beschäftigt sich mit dem Zusammenhang zwischen dem Lohneinkommen von sozial benachteiligten Individuen (16-24 Jahre alt) und der Anzahl der

Mehr

1. Datei Informationen

1. Datei Informationen 1. Datei Informationen Datei vorbereiten (Daten, Variablen, Bezeichnungen und Skalentypen) > Datei Dateiinformation anzeigen Arbeitsdatei 2. Häufigkeiten Analysieren Deskriptive Statistik Häufigkeiten

Mehr

Beschreibende Statistik Zweidimensionale (bivariate) Daten

Beschreibende Statistik Zweidimensionale (bivariate) Daten Mathematik II für Biologen Beschreibende Statistik Zweidimensionale (bivariate) Daten 26. April 2013 Prolog Lineare Regression Transformationen Produktmomenten-Korrelation Rangkorrelation Warnung Artensterben

Mehr

Instrument zur Untersuchung eines linearen Zusammenhangs zwischen zwei (oder mehr) Merkmalen.

Instrument zur Untersuchung eines linearen Zusammenhangs zwischen zwei (oder mehr) Merkmalen. Gliederung Grundidee Einfaches lineares Modell KQ-Methode (Suche nach der besten Geraden) Einfluss von Ausreißern Güte des Modells (Bestimmtheitsmaß R²) Multiple Regression Noch Fragen? Lineare Regression

Mehr

1 Aufgaben 1.1 Umgebungsvariable setzen: CLASSPATH

1 Aufgaben 1.1 Umgebungsvariable setzen: CLASSPATH 1 Aufgaben 1.1 Umgebungsvariable setzen: CLASSPATH Die Umgebungsvariable CLASSPATH kann im Hamster-Simulator sowohl für Compiler als auch für die Ausführung des Hamster-Programms gesetzt werden: Hierdurch

Mehr

Analyse von Querschnittsdaten. Arten von Variablen und Strategien der Datenanalyse

Analyse von Querschnittsdaten. Arten von Variablen und Strategien der Datenanalyse Analyse von Querschnittsdaten Arten von Variablen und Strategien der Datenanalyse Gliederung 1. Arten von Variablen 2. Analyse einzelner Variablen (univariate Verteilungen) 3. Analyse der Zusammenhänge

Mehr

Deskriptive Beschreibung linearer Zusammenhänge

Deskriptive Beschreibung linearer Zusammenhänge 9 Mittelwert- und Varianzvergleiche Mittelwertvergleiche bei k > 2 unabhängigen Stichproben 9.4 Beispiel: p-wert bei Varianzanalyse (Grafik) Bedienungszeiten-Beispiel, realisierte Teststatistik F = 3.89,

Mehr

Sozialwissenschaftliche Datenanalyse mit R

Sozialwissenschaftliche Datenanalyse mit R Katharina Manderscheid Sozialwissenschaftliche Datenanalyse mit R Eine Einführung F' 4-1 V : 'i rl ö LiSl VS VERLAG Inhaltsverzeichnis Vorwort 5 Danksagung 7 Inhaltsverzeichnis 9 R für sozialwissenschaftliche

Mehr

Analyse kategorialer Variablen Schriftliche Ausarbeitung des Referats vom 23. Mai 2002

Analyse kategorialer Variablen Schriftliche Ausarbeitung des Referats vom 23. Mai 2002 Universität Tübingen Tübingen, im Mai 2002 Geographisches Institut Sommersemester 2002 Seminar Verarbeitung Geographischer Daten Dozent: Dr. H.-J. Rosner Referenten: Katrin Oehlkers, Helke Neuendorff,

Mehr

Einführungsbeispiel Kostenfunktion

Einführungsbeispiel Kostenfunktion Einführungsbeispiel Kostenfunktion Sie bauen eine Fabrik für Luxusautos auf und steigern die Produktion jeden Monat um 1000 Stück. Dabei messen Sie die jeweiligen Kosten und stellen sie grafisch dar. Die

Mehr

R-Wörterbuch Ein Anfang... ein Klick auf einen Begriff führt, sofern vorhanden, zu dessen Erklärung.

R-Wörterbuch Ein Anfang... ein Klick auf einen Begriff führt, sofern vorhanden, zu dessen Erklärung. R-Wörterbuch Ein Anfang... ein Klick auf einen Begriff führt, sofern vorhanden, zu dessen Erklärung. Carsten Szardenings c.sz@wwu.de 7. Mai 2015 A 2 B 3 C 4 D 5 F 6 R 16 S 17 V 18 W 19 Z 20 H 7 I 8 K 9

Mehr

Überblick über multivariate Verfahren in der Statistik/Datenanalyse

Überblick über multivariate Verfahren in der Statistik/Datenanalyse Überblick über multivariate Verfahren in der Statistik/Datenanalyse Die Klassifikation multivariater Verfahren ist nach verschiedenen Gesichtspunkten möglich: Klassifikation nach der Zahl der Art (Skalenniveau)

Mehr

Statistik. Jan Müller

Statistik. Jan Müller Statistik Jan Müller Skalenniveau Nominalskala: Diese Skala basiert auf einem Satz von qualitativen Attributen. Es existiert kein Kriterium, nach dem die Punkte einer nominal skalierten Variablen anzuordnen

Mehr

Bitte bearbeite zunächst alle Aufgaben bevor du einen Blick in die Lösungen wirfst.

Bitte bearbeite zunächst alle Aufgaben bevor du einen Blick in die Lösungen wirfst. Übungsblatt 1 - Häufigkeiten, Mittelwert, Erwartungswert Das erste Übungsblatt ist als Einstieg ins Thema Wahrscheinlichkeitsrechnung gedacht und umfasst die Themen relative/absolute Häufigkeiten, Mittelwert

Mehr

1 Wahrscheinlichkeitsrechnung. 2 Zufallsvariablen und ihre Verteilung. 3 Statistische Inferenz. 4 Intervallschätzung. 5 Hypothesentests.

1 Wahrscheinlichkeitsrechnung. 2 Zufallsvariablen und ihre Verteilung. 3 Statistische Inferenz. 4 Intervallschätzung. 5 Hypothesentests. 0 Einführung 1 Wahrscheinlichkeitsrechnung 2 Zufallsvariablen und ihre Verteilung 3 Statistische Inferenz 4 Intervallschätzung 5 Hypothesentests 6 Regression Lineare Regressionsmodelle Deskriptive Statistik:

Mehr

Deskription, Statistische Testverfahren und Regression. Seminar: Planung und Auswertung klinischer und experimenteller Studien

Deskription, Statistische Testverfahren und Regression. Seminar: Planung und Auswertung klinischer und experimenteller Studien Deskription, Statistische Testverfahren und Regression Seminar: Planung und Auswertung klinischer und experimenteller Studien Deskriptive Statistik Deskriptive Statistik: beschreibende Statistik, empirische

Mehr

1 Aufgaben 1.1 Objektorientiert: ("extended-hamster") Sammel-Hamster

1 Aufgaben 1.1 Objektorientiert: (extended-hamster) Sammel-Hamster 1 Aufgaben 1.1 Objektorientiert: ("extended-hamster") Sammel-Hamster Aufgabe: Bearbeitungszeit: ca. 1/4 Std) Schreiben Sie ein "objektorientiertes" Programm ("CuB_05_1") für das Sammeln der Körner. Aufgabenbeschreibung:

Mehr

Einführung in die Statistik für Politikwissenschaftler Wintersemester 2011/2012

Einführung in die Statistik für Politikwissenschaftler Wintersemester 2011/2012 Einführung in die Statistik für Politikwissenschaftler Wintersemester 2011/2012 Es können von den Antwortmöglichkeiten alle, mehrere, eine oder keine Antwort(en) richtig sein. Nur bei einer korrekten Antwort

Mehr

Wissenschaftstheoretische Grundlagen

Wissenschaftstheoretische Grundlagen Wissenschaftstheoretische Grundlagen Wissenschaftstheorie: Lehre von der Vorgehensweise bei der wissenschaftlichen Tätigkeit (Methodologie) Wissenschaftstheorie ist der Sammelbegriff für alle metawissenschaftlichen

Mehr

Analyse eines mehrdimensionalen Datensatzes unterstützt durch Xplo- Re

Analyse eines mehrdimensionalen Datensatzes unterstützt durch Xplo- Re Claudia Kegel Analyse eines mehrdimensionalen Datensatzes unterstützt durch Xplo- Re Hausarbeit zur Vorlesung Einführung in die Softwareumgebung XploRe im WS1998/99 1 Inhaltsverzeichnis 1. EINLEITUNG 1

Mehr

2. Generieren Sie deskriptive Statistiken (Mittelwert, Standardabweichung) für earny3 und kidsunder6yr3 und kommentieren Sie diese kurz.

2. Generieren Sie deskriptive Statistiken (Mittelwert, Standardabweichung) für earny3 und kidsunder6yr3 und kommentieren Sie diese kurz. Statistik II Übung : Einfache lineare Regression Diese Übung beschäftigt sich mit dem Zusammenhang zwischen dem Lohneinkommen von sozial benachteiligten Individuen (6-24 Jahre alt) und der Anzahl der unter

Mehr

Univariate explorative Datenanalyse in R

Univariate explorative Datenanalyse in R Univariate explorative Datenanalyse in R Achim Zeileis, Regina Tüchler 2006-10-03 1 Ein metrisches Merkmal Wir laden den Datensatz: R> load("statlab.rda") und machen die Variablen direkt verfügbar: R>

Mehr

Bivariate Analyseverfahren

Bivariate Analyseverfahren Bivariate Analyseverfahren Bivariate Verfahren beschäftigen sich mit dem Zusammenhang zwischen zwei Variablen Beispiel: Konservatismus/Alter Zusammenhangsmaße beschreiben die Stärke eines Zusammenhangs

Mehr

Drittvariablenkontrolle in der linearen Regression: Trivariate Regression

Drittvariablenkontrolle in der linearen Regression: Trivariate Regression Drittvariablenkontrolle in der linearen Regression: Trivariate Regression 14. Januar 2002 In der Tabellenanalyse wird bei der Drittvariablenkontrolle für jede Ausprägung der Kontrollvariablen eine Partialtabelle

Mehr

Verallgemeinerte lineare Modelle. Promotion. Promotion. Methoden empirischer Sozialforschung. 1 binäre und mehrere metrische und kategoriale Variablen

Verallgemeinerte lineare Modelle. Promotion. Promotion. Methoden empirischer Sozialforschung. 1 binäre und mehrere metrische und kategoriale Variablen Verallgemeinerte lineare Modelle 1 binäre und mehrere metrische und kategoriale Variablen Methoden empirischer Sozialforschung Verallgemeinerte lineare Modelle () Wie läßt sich die Abhängigkeit der Erfolgswahrscheinlichkeit

Mehr

Statistik II Übung 2: Multivariate lineare Regression

Statistik II Übung 2: Multivariate lineare Regression Statistik II Übung 2: Multivariate lineare Regression Diese Übung beschäftigt sich mit dem Zusammenhang zwischen Flugpreisen und der Flugdistanz, dem Passagieraufkommen und der Marktkonzentration. Verwenden

Mehr

Informationen zur KLAUSUR am

Informationen zur KLAUSUR am Wiederholung und Fragen 1 Informationen zur KLAUSUR am 24.07.2009 Raum: 032, Zeit : 8:00 9:30 Uhr Bitte Lichtbildausweis mitbringen! (wird vor der Klausur kontrolliert) Erlaubte Hilfsmittel: Alle Unterlagen,

Mehr

Statistik I. Aufgabe 1

Statistik I. Aufgabe 1 Statistik I, WS 2004/05, Seite 1 von 8 Statistik I Hinweise zur Bearbeitung Hilfsmittel: - Taschenrechner (ohne Datenbank oder die Möglichkeit diesen zu programmieren) - selbst erstellte Formelsammlung

Mehr

Dr. Maike M. Burda. Welchen Einfluss hat die Körperhöhe auf das Körpergewicht? Eine Regressionsanalyse. HU Berlin, Econ Bootcamp

Dr. Maike M. Burda. Welchen Einfluss hat die Körperhöhe auf das Körpergewicht? Eine Regressionsanalyse. HU Berlin, Econ Bootcamp Dr. Maike M. Burda Welchen Einfluss hat die Körperhöhe auf das Körpergewicht? Eine Regressionsanalyse. HU Berlin, Econ Bootcamp 8.-10. Januar 2010 BOOTDATA.GDT: 250 Beobachtungen für die Variablen... cm:

Mehr

Analysen politikwissenschaftlicher Datensätze mit Stata. Sitzung 6: Übung zur logistischen Regression

Analysen politikwissenschaftlicher Datensätze mit Stata. Sitzung 6: Übung zur logistischen Regression n politikwissenschaftlicher Datensätze mit Stata Sitzung 6: Übung zur logistischen Regression 1 Vorbereitung Laden Sie den Datensatz z:\logitdemo Der Datensatz enthält 2000 Fälle, von denen 69 die Republikaner

Mehr

Aufgabe 1 (Exponentielles Wachstum, wird teilweise auch in Vorlesung besprochen, Teile a) bis c) sind exakt die Aufgaben von Blatt 2, Aufgabe 3))

Aufgabe 1 (Exponentielles Wachstum, wird teilweise auch in Vorlesung besprochen, Teile a) bis c) sind exakt die Aufgaben von Blatt 2, Aufgabe 3)) Formalisierungspropädeutikum Übungsblatt 3 Prof. Dr. Th. Augustin, Dr. R. Poellinger, C. Jansen, J. Plaß, G. Schollmeyer WiSe 2015/16 Aufgabe 1 (Exponentielles Wachstum, wird teilweise auch in Vorlesung

Mehr

Analyse von Querschnittsdaten. Signifikanztests I Basics

Analyse von Querschnittsdaten. Signifikanztests I Basics Analyse von Querschnittsdaten Signifikanztests I Basics Warum geht es in den folgenden Sitzungen? Kontinuierliche Variablen Generalisierung kategoriale Variablen Datum 13.10.2004 20.10.2004 27.10.2004

Mehr

6 Korrelationsanalyse: Zusammenhangsanalyse stetiger. Merkmale

6 Korrelationsanalyse: Zusammenhangsanalyse stetiger. Merkmale 6 Korrelationsanalyse: Zusammenhangsanalyse stetiger Merkmale 6.1 Korrelationsanalyse Jetzt betrachten wir bivariate Merkmale (X, Y ), wobei sowohl X als auch Y stetig bzw. quasi-stetig und mindestens

Mehr

Datenanalyse mit Excel und Gretl

Datenanalyse mit Excel und Gretl Dozent: Christoph Hindermann christoph.hindermann@uni-erfurt.de Datenanalyse mit Excel und Gretl Teil Titel 2: Gretl 1 Teil 2: Gretl Datenanalyse mit Excel und Gretl Teil Titel 2: Gretl 2 Modellannahmen

Mehr

9. Kapitel: Grafische Darstellung quantitativer Informationen

9. Kapitel: Grafische Darstellung quantitativer Informationen 9. Kapitel: Grafische Darstellung quantitativer Informationen 9.1: Fallstricke bei der Übersetzung von Zahlen in Bilder a) optische Täuschungen b) absichtliche Manipulationen 9.2: Typologie von Datengrafiken

Mehr

Grundlagen empirischer Forschung. Korpuslinguistik Heike Zinsmeister WS 2009/10

Grundlagen empirischer Forschung. Korpuslinguistik Heike Zinsmeister WS 2009/10 Grundlagen empirischer Forschung Korpuslinguistik Heike Zinsmeister WS 2009/0 Grundlagen Vorbereitung einer empirischen Studie Allgemeine Beschreibung des zu untersuchenden Phänomens Literaturstudien Erkundigungen

Mehr

2.4 Indexbildung und Einblick in Skalierungsverfahren

2.4 Indexbildung und Einblick in Skalierungsverfahren 2.4 Indexbildung und Einblick in Skalierungsverfahren 79 15. November 2013 2.4.1 Indexbildung Zusammenfassung mehrerer Indikatoren eines Konstrukts zu einer Kennzahl. Oft sind Konstrukte mehrdimensional

Mehr

Statistik II. Lineare Regressionsrechnung. Wiederholung Skript 2.8 und Ergänzungen (Schira: Kapitel 4) Statistik II

Statistik II. Lineare Regressionsrechnung. Wiederholung Skript 2.8 und Ergänzungen (Schira: Kapitel 4) Statistik II Statistik II Lineare Regressionsrechnung Wiederholung Skript 2.8 und Ergänzungen (Schira: Kapitel 4) Statistik II - 09.06.2006 1 Mit der Kovarianz und dem Korrelationskoeffizienten können wir den statistischen

Mehr

Analyse von Querschnittsdaten. Spezifikation der unabhängigen Variablen

Analyse von Querschnittsdaten. Spezifikation der unabhängigen Variablen Analyse von Querschnittsdaten Spezifikation der unabhängigen Variablen Warum geht es in den folgenden Sitzungen? Kontinuierliche Variablen Annahmen gegeben? kategoriale Variablen Datum 3.0.004 0.0.004

Mehr

Verlauf Material LEK Glossar Lösungen. Vom Mittelwert zur Ausgleichsgeraden interessante Entdeckungen bei eigenen statistischen Erhebungen

Verlauf Material LEK Glossar Lösungen. Vom Mittelwert zur Ausgleichsgeraden interessante Entdeckungen bei eigenen statistischen Erhebungen Reihe 5 S 1 Verlauf Material Vom Mittelwert zur Ausgleichsgeraden interessante Entdeckungen bei eigenen statistischen Erhebungen Dr. Ulrich Rasbach, Asbach Foto: Pixelio Ein Zeppelin hat die Form einer

Mehr

ÜBUNGSAUFGABEN ZUR DESKRIPTIVEN UND EXPLORATIVEN DATENANALYSE

ÜBUNGSAUFGABEN ZUR DESKRIPTIVEN UND EXPLORATIVEN DATENANALYSE ÜBUNGSAUFGABEN ZUR DESKRIPTIVEN UND EXPLORATIVEN DATENANALYSE 1.1 Füllen Sie bitte folgenden Lückentext aus. Daten, die in Untersuchungen erhoben werden, muss man grundsätzlich nach ihrem unterscheiden.

Mehr

Franz Kronthaler. Statistik angewandt. Datenanalyse ist (k)eine Kunst. mit dem R Commander. A Springer Spektrum

Franz Kronthaler. Statistik angewandt. Datenanalyse ist (k)eine Kunst. mit dem R Commander. A Springer Spektrum Franz Kronthaler Statistik angewandt Datenanalyse ist (k)eine Kunst mit dem R Commander A Springer Spektrum Inhaltsverzeichnis Teil I Basiswissen und Werkzeuge, um Statistik anzuwenden 1 Statistik ist

Mehr

PROCESSING EINE ZUSAMMENFASSUNG. Created by Michael Kirsch & Beat Rossmy

PROCESSING EINE ZUSAMMENFASSUNG. Created by Michael Kirsch & Beat Rossmy PROCESSING EINE ZUSAMMENFASSUNG Created by Michael Kirsch & Beat Rossmy INHALT 1. Typen und Operatoren 1. Datentypen 3. Klassen und Objekte 1. Klassen und Objekte 2. Operatoren 2. Konstruktor 3. Typkonversion

Mehr

Vorwort zur dritten Auflage Einleitung 13

Vorwort zur dritten Auflage Einleitung 13 http://www.beltz.de/de/nc/verlagsgruppe-beltz/gesamtprogramm.html?isbn=978-3-621-28090-7 6 Inhalt Inhalt Vorwort zur dritten Auflage 11 1 Einleitung 13 1.1 Warum R? 13 1.2 Für wen ist diesesbuch? 14 1.3

Mehr

Anwendungsaufgaben. a. Anhand des Streudiagramms (. Abb. 1) lässt sich ein linearer Zusammenhang vermuten. Aufgabe 1. Anhang 1: Lösungen der Aufgaben

Anwendungsaufgaben. a. Anhand des Streudiagramms (. Abb. 1) lässt sich ein linearer Zusammenhang vermuten. Aufgabe 1. Anhang 1: Lösungen der Aufgaben Anhang 1: Lösungen der Aufgaben 15 +1). Korrelationskoeffizienten unterschiedlicher Stichproben oder verschiedener Variablen können so miteinander verglichen werden, was mit der Kovarianz nicht möglich

Mehr

Klausur Statistik Lösungshinweise

Klausur Statistik Lösungshinweise Klausur Statistik Lösungshinweise Prüfungsdatum: 13. Januar 2017 Prüfer: Etschberger, Jansen, Ivanov, Wins Studiengang: IM, BW, Inf und W-Inf Punkte: 21, 18, 12, 12, 11, 16 ; Summe der Punkte: 90 Aufgabe

Mehr

Statistikpraktikum. Carsten Rezny. Sommersemester Institut für angewandte Mathematik Universität Bonn

Statistikpraktikum. Carsten Rezny. Sommersemester Institut für angewandte Mathematik Universität Bonn Statistikpraktikum Carsten Rezny Institut für angewandte Mathematik Universität Bonn Sommersemester 2014 Mehrdimensionale Datensätze: Multivariate Statistik Multivariate Statistik Mehrdimensionale Datensätze:

Mehr

Notiere Definitionen und wichtige Begriffe in deiner Mitschrift!

Notiere Definitionen und wichtige Begriffe in deiner Mitschrift! Die Funktion Funktionen bezeichnen in der Mathematik Zuordnungen, die bestimmte Eigenschaften aufweisen. Du trainierst verschiedene Begriffe, die für das Arbeiten mit Funktionen wichtig sind, und arbeitest

Mehr

Grundlagen sportwissenschaftlicher Forschung Inferenzstatistik 2

Grundlagen sportwissenschaftlicher Forschung Inferenzstatistik 2 Grundlagen sportwissenschaftlicher Forschung Inferenzstatistik 2 Dr. Jan-Peter Brückner jpbrueckner@email.uni-kiel.de R.216 Tel. 880 4717 Statistischer Schluss Voraussetzungen z.b. bzgl. Skalenniveau und

Mehr

Vorlesung: Multivariate Statistik für Psychologen

Vorlesung: Multivariate Statistik für Psychologen Vorlesung: Multivariate Statistik für Psychologen 7. Vorlesung: 05.05.2003 Agenda 2. Multiple Regression i. Grundlagen ii. iii. iv. Statistisches Modell Verallgemeinerung des Stichprobenmodells auf Populationsebene

Mehr

8. 6. Die Regressionsanalyse

8. 6. Die Regressionsanalyse 8. 6. Die Regressionsanalyse (vgl. Hartung & Elpelt 1999, S. 77 ff.) Ziel: Quantifizierung eines (vermuteten) linearen Zusammenhangs zwischen einem Attribut y (Regressand; endogene Variable; abhängige

Mehr

Lösungen zu Janssen/Laatz, Statistische Datenanalyse mit SPSS 1. LÖSUNG 9A a.

Lösungen zu Janssen/Laatz, Statistische Datenanalyse mit SPSS 1. LÖSUNG 9A a. LÖSUNG 9A a. Lösungen zu Janssen/Laatz, Statistische Datenanalyse mit SPSS 1 Das Regressionsmodell soll nur für Büropersonal angewendet werden Management- und Bewachungspersonal (MIND =0) soll nicht einbezogen

Mehr

Statistik. Für Sozialwissenschaftler. Dritte, neu bearbeitete Auflage Mit 71 Abbildungen und 224 Tabellen

Statistik. Für Sozialwissenschaftler. Dritte, neu bearbeitete Auflage Mit 71 Abbildungen und 224 Tabellen Jürgen Bortz Statistik Für Sozialwissenschaftler Dritte, neu bearbeitete Auflage Mit 71 Abbildungen und 224 Tabellen Springer-Verlag Berlin Heidelberg Newlfork London Paris Tokyo Inhaltsverzeichnis Einleitung

Mehr

Zusammenfassung 11. Sara dos Reis.

Zusammenfassung 11. Sara dos Reis. Zusammenfassung 11 Sara dos Reis sdosreis@student.ethz.ch Diese Zusammenfassungen wollen nicht ein Ersatz des Skriptes oder der Slides sein, sie sind nur eine Sammlung von Hinweise zur Theorie, die benötigt

Mehr

3.4 Bivariate Datenanalyse in R

3.4 Bivariate Datenanalyse in R 90 KAPITEL 3. BIVARIATE ANALYSE 3.4 Bivariate Datenanalyse in R Beginnen wir mit dem Zusammenhang zwischen einem qualitativem und einem quantitativem Merkmal. Wir wollen das Alter der weiblichem Teilnehmer

Mehr

Die Regressionsanalyse

Die Regressionsanalyse Die Regressionsanalyse Zielsetzung: Untersuchung und Quantifizierung funktionaler Abhängigkeiten zwischen metrisch skalierten Variablen eine unabhängige Variable Einfachregression mehr als eine unabhängige

Mehr

Korrelation - Regression. Berghold, IMI

Korrelation - Regression. Berghold, IMI Korrelation - Regression Zusammenhang zwischen Variablen Bivariate Datenanalyse - Zusammenhang zwischen 2 stetigen Variablen Korrelation Einfaches lineares Regressionsmodell 1. Schritt: Erstellung eines

Mehr

R für Einsteiger. Einführung in die Statistiksoftware für die Sozialwissenschaften. Bearbeitet von Maike Luhmann

R für Einsteiger. Einführung in die Statistiksoftware für die Sozialwissenschaften. Bearbeitet von Maike Luhmann R für Einsteiger Einführung in die Statistiksoftware für die Sozialwissenschaften Bearbeitet von Maike Luhmann Originalausgabe, 3., überarbeitete Aufl. 2013. Taschenbuch. 320 S. Paperback ISBN 978 3 621

Mehr

Glossar Statistik 2. Bivariate Verfahren: zwei nummerische Merkmale

Glossar Statistik 2. Bivariate Verfahren: zwei nummerische Merkmale Glossar Statistik 2 Bivariate Verfahren: zwei nummerische Merkmale Streudiagramm - Datenpaare (X, Y) als Punkte auf einem zweidimensionale Diagramm (Ordinate: Y, Abszisse: X) Lineare Regression - Optimierungsproblem

Mehr

Jan bis Deutsch 43% 1510 Aufenthaltsbewilligung C. Wohnviertel. Auswahlbasis: Einwohnerregister Jan bis 6.

Jan bis Deutsch 43% 1510 Aufenthaltsbewilligung C. Wohnviertel. Auswahlbasis: Einwohnerregister Jan bis 6. Internetanhang: Meyer, Reto 2011. Eine empirische Untersuchung zur sozialen Verteilung von Verkehrslärm in den Städten Basel und Bern. Schweizerische Zeitschrift für Soziologie, 37(1) Tabelle I: Beschreibung

Mehr

Proinformatik Marco Block Dienstag, den 21. Juli 2009

Proinformatik Marco Block Dienstag, den 21. Juli 2009 2. Skript vom Dienstag, den 21. Juli 2009 zur Vorlesung Proinformatik Marco Block Dienstag, den 21. Juli 2009 1 Verschiedenes 1.1 let und where Am Anfang der Vorlesung haben wir uns ein paar einfache neue

Mehr

Der χ 2 -Test (Chiquadrat-Test)

Der χ 2 -Test (Chiquadrat-Test) Der χ 2 -Test (Chiquadrat-Test) Der Grundgedanke Mit den χ 2 -Methoden kann überprüft werden, ob sich die empirischen (im Experiment beobachteten) Häufigkeiten einer nominalen Variable systematisch von

Mehr

Statistik I für Statistiker, Mathematiker und Informatiker Lösungen zu Blatt 6 Gerhard Tutz, Jan Ulbricht WS 05/06.

Statistik I für Statistiker, Mathematiker und Informatiker Lösungen zu Blatt 6 Gerhard Tutz, Jan Ulbricht WS 05/06. Statistik I für Statistiker, Mathematiker und Informatiker Lösungen zu Blatt Gerhard Tutz, Jan Ulbricht WS 05/0 Lösung Aufgabe 4 Notation: X: Rauchen, Y : chronische Bronchitis S X {ja, nein} {a 1, a },

Mehr

Lösungen zur Klausur zur Statistik Übung am

Lösungen zur Klausur zur Statistik Übung am Lösungen zur Klausur zur Statistik Übung am 28.06.2013 Fabian Kleine Staatswissenschaftliche Fakultät Aufgabe 1 Gegeben sei die folgende geordneten Urliste des Merkmals Y. 30 Punkte Y : 5 5 5 5 10 10 10

Mehr

Sozialwissenschaftliche Fakultät der Universität Göttingen. Sommersemester Statistik mit SPSS

Sozialwissenschaftliche Fakultät der Universität Göttingen. Sommersemester Statistik mit SPSS Sommersemester 2009 Statistik mit SPSS 15. Mai 2009 15. Mai 2009 Statistik Dozentin: mit Esther SPSSOchoa Fernández 1 Überblick 1. Korrelation vs. Regression 2. Ziele der Regressionsanalyse 3. Syntax für

Mehr