Korrelation Regression. Wenn Daten nicht ohne einander können Korrelation
|
|
- Pia Bieber
- vor 7 Jahren
- Abrufe
Transkript
1 DAS THEMA: KORRELATION UND REGRESSION Korrelation Regression Wenn Daten nicht ohne einander können Korrelation Korrelation Kovarianz Pearson-Korrelation Voraussetzungen für die Berechnung die Höhe der Korrelation Korrelation und Kausalität Rangkorrelationen Phi-Koe zient 1
2 KORRELATION ausgehend von visuell sichtbaren Zusammenhängen in Streudiagrammen stellt sich die Frage, wie stark ein Zusammenhang ist diese Stärke lässt sich durch die Korrelation ausdrücken! Die Korrelation ist das Ausmaß des linearen Zusammenhangs zweier Variablen. (d) und (e) sind keine linearen Zusammenhänge KORRELATION Korrelationen unterstellen immer lineare Zusammenhänge! wenn diese Annahme verletzt ist, ist der Korrelationskoeffizient verzerrt oder sogar unbrauchbar 2
3 AUSGANGSPUNKT: KOVARIANZ Ausgangspunkt für die Korrelation: die Kovarianz Kovarianz ist das gleichsinnige Variieren (ko-variieren) von Merkmalen in der Kovarianz liegen die interessanten und aufschlussreichen Mechanismen und Prinzipien von Erleben und Verhalten Kovarianz gemeinsames Variieren von X und Y Anzahl von Datenpunkten (SDchprobengröße) AUSGANGSPUNKT: KOVARIANZ Problem: die Kovarianz ist abhängig von der Skalierung der Variablen Abhilfe schafft die Standardisierung à Korrelation 3
4 PEARSON-KORRELATION relativiert man die Kovarianz an der Streuung (Standardisierung), erhält man die Korrelation (r) sie wird auch Pearson-Korrelation oder Produkt- Moment-Korrelation genannt sie kann nur Werte zwischen -1 (perfekter negativer Zusammenhang) und +1 (perfekter positiver Zusammenhang) annehmen Achtung: Korrelationskoeffizienten sind nicht intervallskaliert (die inhaltliche Bedeutung der Intervalle nimmt von 0 aus gesehen immer mehr zu) Karl Pearson KorrelaDon Kovarianz gemeinsame Streuung von X und Y PEARSON-KORRELATION 4
5 PEARSON-KORRELATION alle Punkte auf einer Linie: nicht alle Punkte auf einer Linie: die Streuung kann komplett durch die Kovarianz aufgeklärt werden à Koeffizient ist 1 die Streuung kann nur zum Teil durch die Kovarianz aufgeklärt werden à Koeffizient sinkt unter 1 DIE HÖHE DER KORRELATION die Höhe der Korrelation ist nur von der Dichte der Punktewolke abhängig, nicht von der Neigung der Gerade Wann sind Korrelationskoeffizienten groß oder klein? pauschal schwer zu beantworten, hängt vom Inhaltsbereich ab grobe Konventionen nach Cohen (1988): 5
6 BERECHNUNGS-VORAUSSETZUNGEN Voraussetzungen für das Berechnen von Korrelationen: Intervallskalenniveau der beiden Variablen hinreichend lineare Zusammenhänge hinreichend normalverteilte Daten Beispiele für r =.82 KORRELATION UND KAUSALITÄT rein rechnerisch bedeutet eine Korrelation, dass man die eine Variable aus der anderen vorhersagen kann das bedeutet jedoch nicht, dass sich die Variablen auch kausal bedingen!!! in vielen Fällen kommen Korrelationen zufällig zustande (besonders bei Variablen, die sich über die Zeit hinweg ändern) 6
7 RANGKORRELATIONEN Als Alternative zur Pearson-Korrelation können Rangkorrelationen berechnet werden, wenn die Normalverteilungs-Voraussetzung bei eigentlich intervall-skalierten Daten verletzt ist à Spearmans Rho (ρ) 2. man von vornherein Ordinaldaten zur Verfügung hat (z.b. Ränge) à Kendalls Tau (τ) Rangkorrelationen sind in der Größe genau so zu interpretieren wie die Pearson-Korrelation meist sind ihre Werte aber etwas kleiner DER PHI-KOEFFIZIENT für den Spezialfall, dass beide Variablen nur zwei Ausprägungen haben darstellbar in einer so genannten Vierfeldertafel: in den Zellen stehen die Häufigkeiten + und stehen für die beiden möglichen Ausprägungen (z.b. ja und nein) der Phi-Koeffizient ist ebenfalls wie die Pearson-Korrelation interpretierbar 7
8 DER PHI-KOEFFIZIENT Beispiel aus der Vorlesung: φ =.051 Freier Wille? Geschlecht? weiblich ja männlich 14 7 nein à es besteht kein nennenswerter Zusammenhang zwischen dem Geschlecht und der Einschätzung, ob Menschen einen freien Wille haben Das gleiche Ergebnis erhält man, wenn man eine Pearson-Korrelation rechnet und Geschlecht und Freier Wille jeweils mit beispielsweise 0 und 1 codiert. KORRELATION STECKBRIEF Korrelationen sind Zusammenhangs-Analysen je stärker zwei Variablen gleichsinnig variieren (ko-variieren), desto höher ist ihre Korrelation die Stärke der Korrelation lässt sich durch einen Korrelationskoeffizienten ausdrücken die Pearson-Korrelation r wird für Intervall-Daten verwendet, Spearmans Rho und Kendalls Tau für Ordinaldaten die Korrelation unterstellt immer einen linearen Zusammenhang dieser muss also mit Hilfe eines Streudiagramms erst geprüft werden die inhaltliche Bedeutsamkeit der Korrelation hängt vom Inhaltsbereich ab, aber es gibt eine grobe Konvention: ab.1: kleiner Effekt, ab.3: mittlerer Effekt, ab.5: großer Effekt 8
9 Von Vätern und Söhnen Regression Regression zur Mitte Grundidee der Regression Regressionsgerade Vorhersagen machen Regressionskoe zient Determinationskoe zient Anwendungsfelder einfache und multiple Regression REGRESSION ZUR MITTE Galtons Entdeckung: größere Väter haben größere Söhne, aber deren Größe tendiert zum Mittelwert zurück (Regression zur Mitte) Francis Galton 9
10 DIE GRUNDIDEE DER REGRESSION Galtons Entdeckung liefert die Voraussetzung für das Vorhersagen von Variablen aus anderen Variablen das Vorliegen einer Korrelation kann daher zur Formulierung von Vorhersagen verwendet werden die vorhersagende Variable wird dabei Prädiktor (auch X oder UV) genannt, die vorherzusagende Variable heißt Kriterium (auch Y oder AV) die Vorhersage von Y aus X geschieht durch eine Gleichung, die im Streudiagramm als Gerade eingezeichnet werden kann DIE REGRESSIONSGERADE Wie gelangt man zur Regressionsgerade? die Gerade sollte so liegen, dass der durchschnittliche Abstand aller Punkte zur Gerade minimiert wird dieser durchschnittliche Abstand wird durch die Quadratsumme (Summe aller quadrierten Abweichungen) definiert 10
11 DIE REGRESSIONSGERADE Was bedeutet die Regressionskonstante a (oder auch b 0 )? wenn man über eine Person gar nichts weiß und ein Kriterium schätzen soll, dann ist der Mittelwert M dieses Kriteriums von einer Vielzahl bekannter Personen die beste Schätzung dieser Mittelwert steckt in der Regressionskonstante (wenn der Mittelwert von X gleich 0 ist) y y M kommt ein sinnvoller Prädiktor hinzu, verbessert sich die Vorhersage für alle Personen der Schni`punkt der Regressionsgerade entspricht dem Mi`elwert und stellt die Regressionskonstante dar Mà b 0 VORHERSAGEN MACHEN Die Vorhersage von Y-Werten aus X-Werten gelingt umso besser, je näher die Punkte an der Gerade liegen (je höher also die Korrelation ist). Warum weichen die Punkte von der Geraden überhaupt ab? Variablen korrelieren nicht Y ist von weiteren Variablen beeinflusst Messfehler die Abweichungen von der Gerade repräsentieren den Vorhersagefehler (Schätzfehler) der Fehler beinhaltet also Varianz, die durch die Regression (also durch X) nicht erklärt werden kann er wird als Residuum oder Residualwert bezeichnet 11
12 VORHERSAGEN MACHEN das Dach zeigt an, dass es sich um eine Schätzung handelt! =! +!"!!!!! =!! +!!!! REGRESSIONSKOEFFIZIENT der Regressionskoeffizient b 1 beschreibt die Stärke des Zusammenhangs von X und Y seine Höhe ist aber von der Skalierung der Ausgangsvariablen abhängig standardisiert man ihn (β), ist sein Wertebereich auf Werte von -1 bis +1 begrenzt der Koeffizient wird auch Beta-Gewicht genannt, da er angibt, mit welchem Gewicht die Korrelation von X und Y in die Vorhersage einfließt 12
13 DETERMINATIONSKOEFFIZIENT die Vorhersage von Y gelingt umso besser, je höher die Korrelation ist um die aufgeklärte Varianz von Y durch X zu beschreiben, muss die Korrelation daher nur quadriert werden so erhält man den Determinationskoeffizienten r 2 seine Werte reichen von 0 bis 1, was einer Varianzaufklärung von 0 bis 100% entspricht z.b.: r =.80 à r 2 =.64 (Varianzaufklärung von 64%) äquivalent dazu kann auch der Schätzfehler betrachtet werden (siehe Inferenzstatistik): bei r 2 = 1 wäre der Schätzfehler 0 ANWENDUNGSFELDER DER REGRESSION 1. praktische Anwendung: zur Bestimmung konkreter Werte für Y Beispiel: welche Umsatzsteigerung in Euro bringt es einem Verkaufsleiter, wenn er die Werbeausgaben um x% erhöht? diese Information steckt im unstandardisierten b außerdem wird die Regressionsgleichung benötigt 2. Anwendung in der Forschung: der theoretische Zusammenhang ist von Interesse hier sind konkrete Vorhersagen unwichtig die Hauptinformationen stecken in den standardisierten Betas und in r² die Regressionsgleichung ist nicht so wichtig 13
14 EINFACHE UND MULTIPLE REGRESSION einfache Regression nur ein Prädiktor r und β sind identisch multiple Regression mehr als ein Prädiktor identifiziert den relativen (spezifischen) Einfluss einer Reihe von Prädiktoren (X 1, X 2...) auf das Kriterium die Betas sind entweder gleich groß wie oder und das ist die Regel kleiner als die rs die Betas sind nur noch untereinander vergleichbar, aber nicht mehr absolut die Varianzaufklärung wird durch den multiplen Determinations- Koeffizienten R 2 für alle Prädiktoren zusammen angegeben der relative Einfluss von Prädiktoren wird an Venn-Diagrammen deutlich VENN-DIAGRAMME EXKURS Venn-Diagramme stellen die Varianz von Variablen als Flächeninhalt von Kreisen dar die Überschneidung von Kreisen entspricht der gemeinsamen Varianz und damit der Korrelation Anteil gemeinsamer Varianz 14
15 MULTIPLE REGRESSION unkorrelierte Prädiktoren: korrelierte Prädiktoren: Kriterium Kriterium x 1 x 2 x 1 x 2 jedes r² leistet seinen spezifischen Beitrag zur Vorhersage von Y jedes r² leistet nur zum Teil einen spezifischen Beitrag zur Vorhersage von Y à R² = r² 1 + r² 2 à R² < r² 1 + r² 2 MULTIPLE REGRESSION Regressionsgleichung für die multiple Regression: 1. Prädiktor 2. Prädiktor usw. Konstante Koeffizient für den Koeffizient für den ersten Prädiktor zweiten Prädiktor 15
16 MULTIPLE REGRESSION Zusammenfassung der multiplen Regression MULTIPLE REGRESSION Beispiel: Prädiktoren für die Stärke von Musikpräferenz 16
17 REGRESSION STECKBRIEF die Regression ist eine Vorhersageanalyse: wenn Variablen korrelieren, lässt sich die eine Variable aus der anderen vorhersagen die Regressionsgerade repräsentiert alle Datenpunkte so gut wie möglich und dient der Vorhersage von Y aus X ihr Steigung wird durch den Regressionskoeffizienten b beschrieben die standardisierte Form des Koeffizienten wird Beta oder Beta-Gewicht genannt bei mehr als einem Prädiktor (multiple Regression) beschreiben die Betas den relativen Einfluss aller Prädiktoren auf das Kriterium die Regression kann der Vorhersage konkreter Werte dienen oder der theoretischen Beschreibung des Zusammenhangs von Variablen LITERATUR Hussy, W., Schreier, M. & Echterhoff, G. (2010). Forschungsmethoden in Psychologie und Sozialwissenschaften. Heidelberg: Springer. Schäfer, T. (2010). Statistik I. Deskriptive und Explorative Datenanalyse. Wiesbaden: Springer VS. Schäfer, T. (2011). Statistik II. Inferenzstatistik. Wiesbaden: Springer VS. Sedlmeier, P. & Renkewitz, F. (2013). Forschungsmethoden und Statistik: Ein Lehrbuch für Psychologen und Sozialwissenschaftler. München: Pearson. 17
Parametrische vs. Non-Parametrische Testverfahren
Parametrische vs. Non-Parametrische Testverfahren Parametrische Verfahren haben die Besonderheit, dass sie auf Annahmen zur Verteilung der Messwerte in der Population beruhen: die Messwerte sollten einer
MehrStatistik II: Signifikanztests /2
Medien Institut : Signifikanztests /2 Dr. Andreas Vlašić Medien Institut (0621) 52 67 44 vlasic@medien-institut.de Gliederung 1. Korrelation 2. Exkurs: Kausalität 3. Regressionsanalyse 4. Key Facts 2 I
MehrTeil: lineare Regression
Teil: lineare Regression 1 Einführung 2 Prüfung der Regressionsfunktion 3 Die Modellannahmen zur Durchführung einer linearen Regression 4 Dummyvariablen 1 Einführung o Eine statistische Methode um Zusammenhänge
MehrStatistische Methoden in den Umweltwissenschaften
Statistische Methoden in den Umweltwissenschaften Korrelationsanalysen Kreuztabellen und χ²-test Themen Korrelation oder Lineare Regression? Korrelationsanalysen - Pearson, Spearman-Rang, Kendall s Tau
MehrVS PLUS
VS PLUS Zusatzinformationen zu Medien des VS Verlags Statistik II Inferenzstatistik 2010 Übungsaufgaben und Lösungen Inferenzstatistik 2 [Übungsaufgaben und Lösungenn - Inferenzstatistik 2] ÜBUNGSAUFGABEN
MehrAnwendungsaufgaben. a. Anhand des Streudiagramms (. Abb. 1) lässt sich ein linearer Zusammenhang vermuten. Aufgabe 1. Anhang 1: Lösungen der Aufgaben
Anhang 1: Lösungen der Aufgaben 15 +1). Korrelationskoeffizienten unterschiedlicher Stichproben oder verschiedener Variablen können so miteinander verglichen werden, was mit der Kovarianz nicht möglich
MehrAusführliche Lösungen zu ausgewählten Aufgaben von ÜB 5 und 6. Streudiagramm
y Aufgabe 3 Ausführliche Lösungen zu ausgewählten Aufgaben von ÜB 5 und 6 a) Zur Erstellung des Streudiagramms zeichnet man jeweils einen Punkt für jedes Datenpaar (x i, y i ) aus der zweidimensionalen
MehrBivariater Zusammenhang bei metrischen Variablen: Regression und Korrelation
Bivariater Zusammenhang bei metrischen Variablen: Regression und Korrelation PEΣO 12. November 2001 Von der Tabellenanalyse zur Regression Die bivariate Verteilung zweier metrischer Variablen kann konzeptionell
MehrDrittvariablenkontrolle in der linearen Regression: Trivariate Regression
Drittvariablenkontrolle in der linearen Regression: Trivariate Regression 14. Januar 2002 In der Tabellenanalyse wird bei der Drittvariablenkontrolle für jede Ausprägung der Kontrollvariablen eine Partialtabelle
MehrInhaltsverzeichnis. 1 Über dieses Buch Zum Inhalt dieses Buches Danksagung Zur Relevanz der Statistik...
Inhaltsverzeichnis 1 Über dieses Buch... 11 1.1 Zum Inhalt dieses Buches... 13 1.2 Danksagung... 15 2 Zur Relevanz der Statistik... 17 2.1 Beispiel 1: Die Wahrscheinlichkeit, krank zu sein, bei einer positiven
MehrEinführung in die Korrelationsrechnung
Einführung in die Korrelationsrechnung Sven Garbade Fakultät für Angewandte Psychologie SRH Hochschule Heidelberg sven.garbade@hochschule-heidelberg.de Statistik 1 S. Garbade (SRH Heidelberg) Korrelationsrechnung
MehrZiel der linearen Regression
Regression 1 Ziel der linearen Regression Bei der linearen Regression wird untersucht, in welcher Weise eine abhängige metrische Variable durch eine oder mehrere unabhängige metrische Variablen durch eine
MehrMathematische und statistische Methoden I
Prof. Dr. G. Meinhardt 6. Stock, Wallstr. 3 (Raum 06-06) Sprechstunde jederzeit nach Vereinbarung und nach der Vorlesung. Mathematische und statistische Methoden I Dr. Malte Persike persike@uni-mainz.de
MehrHypothesentests mit SPSS
Beispiel für eine einfache Regressionsanalyse (mit Überprüfung der Voraussetzungen) Daten: bedrohfb_v07.sav Hypothese: Die Skalenwerte auf der ATB-Skala (Skala zur Erfassung der Angst vor terroristischen
MehrDeskriptive Statistik
Markus Wirtz, Christof Nachtigall Deskriptive Statistik 2008 AGI-Information Management Consultants May be used for personal purporses only or by libraries associated to dandelon.com network. Statistische
MehrGlossar. den man als mindesten oder interessanten Effekt für die Population annimmt. Anpassungstest; 148 f., 151: Der Anpassungstest
Literatur Aron, A., Aron, E. N., and Coups, E. J. (2009). Statistics for Psychology. Upper Saddle River: Prentice Hall. Backhaus, K.; Erichson, B.; Plinke, W. und Weiber, R. (2006). Multivariate Analysemethoden.
MehrRegression ein kleiner Rückblick. Methodenseminar Dozent: Uwe Altmann Alexandra Kuhn, Melanie Spate
Regression ein kleiner Rückblick Methodenseminar Dozent: Uwe Altmann Alexandra Kuhn, Melanie Spate 05.11.2009 Gliederung 1. Stochastische Abhängigkeit 2. Definition Zufallsvariable 3. Kennwerte 3.1 für
MehrStandardisierung von Daten Darstellung von Daten in Texten, Tabellen und Abbildungen. Standardisierung von Daten
DAS THEMA: TABELLEN UND ABBILDUNGEN Standardisierung von Daten Darstellung von Daten in Texten, Tabellen und Abbildungen Standardisierung von Daten z-standardisierung Standardnormalverteilung 1 DIE Z-STANDARDISIERUNG
MehrModul G.1 WS 07/08: Statistik
Modul G.1 WS 07/08: Statistik 10.01.2008 1 2 Test Anwendungen Der 2 Test ist eine Klasse von Verfahren für Nominaldaten, wobei die Verteilung der beobachteten Häufigkeiten auf zwei mehrfach gestufte Variablen
MehrInstrument zur Untersuchung eines linearen Zusammenhangs zwischen zwei (oder mehr) Merkmalen.
Gliederung Grundidee Einfaches lineares Modell KQ-Methode (Suche nach der besten Geraden) Einfluss von Ausreißern Güte des Modells (Bestimmtheitsmaß R²) Multiple Regression Noch Fragen? Lineare Regression
MehrVorlesung: Multivariate Statistik für Psychologen
Vorlesung: Multivariate Statistik für Psychologen 7. Vorlesung: 05.05.2003 Agenda 2. Multiple Regression i. Grundlagen ii. iii. iv. Statistisches Modell Verallgemeinerung des Stichprobenmodells auf Populationsebene
MehrSchätzen und Testen von Populationsparametern im linearen Regressionsmodell PE ΣO
Schätzen und Testen von Populationsparametern im linearen Regressionsmodell PE ΣO 4. Dezember 2001 Generalisierung der aus Stichprobendaten berechneten Regressionsgeraden Voraussetzungen für die Generalisierung
MehrGibt es einen Zusammenhang zwischen Merkmalen? Korrelationen
Arbeitsblatt SPSS Kapitel 8 Seite Gibt es einen Zusammenhang zwischen Merkmalen? Korrelationen Wie in allen Kapiteln gehen wir im Folgenden davon aus, dass Sie die Datei elporiginal.sav geöffnet haben.
MehrDr. Maike M. Burda. Welchen Einfluss hat die Körperhöhe auf das Körpergewicht? Eine Regressionsanalyse. HU Berlin, Econ Bootcamp
Dr. Maike M. Burda Welchen Einfluss hat die Körperhöhe auf das Körpergewicht? Eine Regressionsanalyse. HU Berlin, Econ Bootcamp 8.-10. Januar 2010 BOOTDATA.GDT: 250 Beobachtungen für die Variablen... cm:
MehrKarl Entacher. FH-Salzburg
Ahorn Versteinert Bernhard.Zimmer@fh-salzburg.ac.at Statistik @ HTK Karl Entacher FH-Salzburg karl.entacher@fh-salzburg.ac.at Beispiel 3 Gegeben sind 241 NIR Spektren (Vektoren der Länge 223) zu Holzproben
MehrStatistik II Übung 4: Skalierung und asymptotische Eigenschaften
Statistik II Übung 4: Skalierung und asymptotische Eigenschaften Diese Übung beschäftigt sich mit der Skalierung von Variablen in Regressionsanalysen und mit asymptotischen Eigenschaften von OLS. Verwenden
MehrDr. Maike M. Burda. Welchen Einfluss hat die Körperhöhe auf das Körpergewicht? Eine Regressionsanalyse. HU Berlin, Econ Bootcamp 7.-9.
Dr. Maike M. Burda Welchen Einfluss hat die Körperhöhe auf das Körpergewicht? Eine Regressionsanalyse. HU Berlin, Econ Bootcamp 7.-9. Januar 2011 BOOTDATA11.GDT: 250 Beobachtungen für die Variablen...
MehrForschungsstatistik I
Prof. Dr. G. Meinhardt 2. Stock, Nordflügel R. 02-429 (Persike) R. 02-431 (Meinhardt) Sprechstunde jederzeit nach Vereinbarung Forschungsstatistik I Dr. Malte Persike persike@uni-mainz.de http://psymet03.sowi.uni-mainz.de/
MehrEigene MC-Fragen SPSS. 1. Zutreffend auf die Datenerfassung und Datenaufbereitung in SPSS ist
Eigene MC-Fragen SPSS 1. Zutreffend auf die Datenerfassung und Datenaufbereitung in SPSS ist [a] In der Variablenansicht werden für die betrachteten Merkmale SPSS Variablen definiert. [b] Das Daten-Editor-Fenster
MehrAufgaben zu Kapitel 4
Rasch, Friese, Hofmann & aumann (2006). Quantitative Methoden. Band (2. Auflage). Heidelberg: Springer. Aufgaben zu Kapitel 4 Aufgabe a) Berechnen Sie die Korrelation zwischen dem Geschlecht und der Anzahl
MehrInformationen zur KLAUSUR am
Wiederholung und Fragen 1 Informationen zur KLAUSUR am 24.07.2009 Raum: 032, Zeit : 8:00 9:30 Uhr Bitte Lichtbildausweis mitbringen! (wird vor der Klausur kontrolliert) Erlaubte Hilfsmittel: Alle Unterlagen,
MehrMathematische und statistische Methoden I
Prof. Dr. G. Meinhardt Methodenlehre Mathematische und statistische Methoden I Sprechstunde jederzeit nach Vereinbarung und nach der Vorlesung Wallstr. 3, 6. Stock, Raum 06-06 Dr. Malte Persike persike@uni-mainz.de
MehrMultiple Regressionsanalyse - Kurzabriss
Multiple Regressionsanalyse - Kurzabriss Ziele: Schätzung eines Kriteriums aus einer Linearkombination von Prädiktoren Meist zu Screening-Untersuchungen, um den Einfluß von vermuteten Ursachenvariablen
MehrBivariate lineare Regression. Statistik für SozialwissenschaftlerInnen II p.154
Bivariate lineare Regression Statistik für SozialwissenschaftlerInnen II p.154 Grundidee und Typen der Regression Die Regressionsanalyse dient zur Quantifizierung des Zusammenhangs und der statistisch
MehrStatistik II Übung 1: Einfache lineare Regression
Statistik II Übung 1: Einfache lineare Regression Diese Übung beschäftigt sich mit dem Zusammenhang zwischen dem Lohneinkommen von sozial benachteiligten Individuen (16-24 Jahre alt) und der Anzahl der
MehrSeminar: Multivariate Verfahren g Dr. Thomas Schäfer Referenten: Wiebke Hoffmann, Claudia Günther
Seminar: Multivariate Verfahren g Dr. Thomas Schäfer Leitung: Referenten: Wiebke Hoffmann, Claudia Günther 18.05.2010 Regressionsanalyse was war das nochmal? Grundlagen Einfaches lineares Regressionsmodell
MehrZusammenhänge zwischen metrischen Merkmalen
Zusammenhänge zwischen metrischen Merkmalen Darstellung des Zusammenhangs, Korrelation und Regression Daten liegen zu zwei metrischen Merkmalen vor: Datenpaare (x i, y i ), i = 1,..., n Beispiel: x: Anzahl
MehrÜBUNGSAUFGABEN ZUR DESKRIPTIVEN UND EXPLORATIVEN DATENANALYSE
ÜBUNGSAUFGABEN ZUR DESKRIPTIVEN UND EXPLORATIVEN DATENANALYSE 1.1 Füllen Sie bitte folgenden Lückentext aus. Daten, die in Untersuchungen erhoben werden, muss man grundsätzlich nach ihrem unterscheiden.
MehrStatistik II Übung 2: Multivariate lineare Regression
Statistik II Übung 2: Multivariate lineare Regression Diese Übung beschäftigt sich mit dem Zusammenhang zwischen Flugpreisen und der Flugdistanz, dem Passagieraufkommen und der Marktkonzentration. Verwenden
MehrKorrelation und Regression
Professur E-Learning und Neue Medien Institut für Medienforschung Philosophische Fakultät Einführung in die Statistik Korrelation und Regression Überblick Kovarianz und Korrelation Korrelation und Kausalität
MehrEinführung in Quantitative Methoden
in Quantitative Methoden Mag. Dipl.Ing. Dr. Pantelis Christodoulides & Mag. Dr. Karin Waldherr SS 2011 Christodoulides / Waldherr in Quantitative Methoden- 2.VO 1/47 Historisches Regression geht auf Galton
MehrEinführung in die Statistik für Politikwissenschaftler Sommersemester 2011
Einführung in die Statistik für Politikwissenschaftler Sommersemester 2011 Es können von den Antworten alle, mehrere oder keine Antwort(en) richtig sein. Nur bei einer korrekten Antwort (ohne Auslassungen
Mehr1.1. Zusammenhänge und Vorhersagen
1.1. Zusammenhänge und Vorhersagen In diesem Kapitel dreht sich alles um Zusammenhänge und Vorhersagen. Anstatt uns zu fragen Was ist größer / mehr / ausgeprägter?, versuchen wir Aussagen zu treffen wie
MehrÜbungsblätter zu Methoden der Empirischen Sozialforschung IV: Regressionsanalyse. Lösungsblatt zu Nr. 2
Martin-Luther-Universität Halle-Wittenberg Institut für Soziologie Dr. Wolfgang Langer 1 Übungsblätter zu Methoden der Empirischen Sozialforschung IV: Regressionsanalyse Lösungsblatt zu Nr. 2 1. a) Je
MehrMultiple Regression. Ziel: Vorhersage der Werte einer Variable (Kriterium) bei Kenntnis der Werte von zwei oder mehr anderen Variablen (Prädiktoren)
Multiple Regression 1 Was ist multiple lineare Regression? Ziel: Vorhersage der Werte einer Variable (Kriterium) bei Kenntnis der Werte von zwei oder mehr anderen Variablen (Prädiktoren) Annahme: Der Zusammenhang
MehrÜBUNGSAUFGABEN ZU INFERENZSTATISTIK II
ÜBUNGSAUFGABEN ZU INFERENZSTATISTIK II 1.1 Durch welche Elemente lässt sich laut der Formel für die multiple Regression der Wert einer Person auf einer bestimmten abhängigen Variable Y vorhersagen? a)
MehrBiometrieübung 10 Lineare Regression. 2. Abhängigkeit der Körpergröße von der Schuhgröße bei Männern
Biometrieübung 10 (lineare Regression) - Aufgabe Biometrieübung 10 Lineare Regression Aufgabe 1. Düngungsversuch In einem Düngeversuch mit k=9 Düngungsstufen x i erhielt man Erträge y i. Im (X, Y)- Koordinatensystem
MehrZusammenhangsmaße II
Sommersemester 2009 Eine nominale und eine intervallskalierte Variable χ 2 =?!? Übung von Simone Reutzel Heute im HS1, altes ReWi-Haus Zum Nachlesen Agresti/Finlay: Kapitel 8.5, 9.4 Gehring/Weins: Kapitel
MehrKorrelation - Regression. Berghold, IMI
Korrelation - Regression Zusammenhang zwischen Variablen Bivariate Datenanalyse - Zusammenhang zwischen 2 stetigen Variablen Korrelation Einfaches lineares Regressionsmodell 1. Schritt: Erstellung eines
MehrBivariate Regressionsanalyse
Universität Bielefeld 15. März 2005 Kovarianz, Korrelation und Regression Kovarianz, Korrelation und Regression Ausgangspunkt ist folgende Datenmatrix: Variablen 1 2... NI 1 x 11 x 12... x 1k 2 x 21 x
MehrDeskriptive Beschreibung linearer Zusammenhänge
9 Mittelwert- und Varianzvergleiche Mittelwertvergleiche bei k > 2 unabhängigen Stichproben 9.4 Beispiel: p-wert bei Varianzanalyse (Grafik) Bedienungszeiten-Beispiel, realisierte Teststatistik F = 3.89,
MehrDeskription, Statistische Testverfahren und Regression. Seminar: Planung und Auswertung klinischer und experimenteller Studien
Deskription, Statistische Testverfahren und Regression Seminar: Planung und Auswertung klinischer und experimenteller Studien Deskriptive Statistik Deskriptive Statistik: beschreibende Statistik, empirische
MehrEs können keine oder mehrere Antworten richtig sein. Eine Frage ist NUR dann richtig beantwortet, wenn ALLE richtigen Antworten angekreuzt wurden.
Teil III: Statistik Alle Fragen sind zu beantworten. Es können keine oder mehrere Antworten richtig sein. Eine Frage ist NUR dann richtig beantwortet, wenn ALLE richtigen Antworten angekreuzt wurden. Wird
MehrMethodenlehre. Vorlesung 12. Prof. Dr. Björn Rasch, Cognitive Biopsychology and Methods University of Fribourg
Methodenlehre Vorlesung 12 Prof. Dr., Cognitive Biopsychology and Methods University of Fribourg 1 Methodenlehre II Woche Datum Thema 1 FQ Einführung, Verteilung der Termine 1 18.2.15 Psychologie als Wissenschaft
MehrProf. Dr. Walter F. Tichy Dr. Matthias Müller Sommersemester 2006
Empirische Softwaretechnik Prof. Dr. Walter F. Tichy Dr. Matthias Müller Sommersemester 2006 1 Experiment zur Vererbungstiefe Softwaretechnik: die Vererbungstiefe ist kein guter Schätzer für den Wartungsaufwand
MehrFranz Kronthaler. Statistik angewandt. Datenanalyse ist (k)eine Kunst. mit dem R Commander. A Springer Spektrum
Franz Kronthaler Statistik angewandt Datenanalyse ist (k)eine Kunst mit dem R Commander A Springer Spektrum Inhaltsverzeichnis Teil I Basiswissen und Werkzeuge, um Statistik anzuwenden 1 Statistik ist
Mehrsimple lineare Regression kurvilineare Regression Bestimmtheitsmaß und Konfidenzintervall
Regression Korrelation simple lineare Regression kurvilineare Regression Bestimmtheitsmaß und Konfidenzintervall Zusammenhänge zw. Variablen Betrachtet man mehr als eine Variable, so besteht immer auch
Mehr2. Generieren Sie deskriptive Statistiken (Mittelwert, Standardabweichung) für earny3 und kidsunder6yr3 und kommentieren Sie diese kurz.
Statistik II Übung : Einfache lineare Regression Diese Übung beschäftigt sich mit dem Zusammenhang zwischen dem Lohneinkommen von sozial benachteiligten Individuen (6-24 Jahre alt) und der Anzahl der unter
MehrKapitel 4: Merkmalszusammenhänge
Kapitel 4: Merkmalszusammenhänge Streudiagramme 1 Korrelationen 3 Lineare Regression 6 Zusammenhang zwischen Korrelation, Regression und t-test 8 Streudiagramme SPSS bietet die Möglichkeit, verschiedene
MehrÜbungen (HS-2010): Urteilsfehler. Autor: Siegfried Macho
Übungen (HS-2010): Urteilsfehler Autor: Siegfried Macho Inhaltsverzeichnis i Inhaltsverzeichnis 1. Übungen zu Kapitel 2 1 Übungen zu Kontingenz- und Kausalurteile 1 Übung 1-1: 1. Übungen zu Kapitel 2 Gegeben:
MehrStatistik II Übung 2: Multivariate lineare Regression
Statistik II Übung 2: Multivariate lineare Regression Diese Übung beschäftigt sich mit dem Zusammenhang zwischen Flugpreisen und der Flugdistanz, dem Passagieraufkommen und der Marktkonzentration. Verwenden
MehrÜbungsklausur zur Vorlesung Wahrscheinlichkeit und Regression Thema: Wahrscheinlichkeit. Übungsklausur Wahrscheinlichkeit und Regression
Übungsklausur Wahrscheinlichkeit und Regression 1. Welche der folgenden Aussagen treffen auf ein Zufallsexperiment zu? a) Ein Zufallsexperiment ist ein empirisches Phänomen, das in stochastischen Modellen
MehrInhalt. Vorwort Univariate Verteilungen Verteilungen Die Normalverteilung... 47
Inhalt Vorwort... 9 1 Einleitung: Grundlagen der Statistik... 11 1.1 Die statistische Fragestellung im Forschungsprozess... 11 1.2 Grundbegriffe der Statistik... 13 1.3 Voraussetzung jeder Statistik: Die
MehrStatistik II. Lineare Regressionsrechnung. Wiederholung Skript 2.8 und Ergänzungen (Schira: Kapitel 4) Statistik II
Statistik II Lineare Regressionsrechnung Wiederholung Skript 2.8 und Ergänzungen (Schira: Kapitel 4) Statistik II - 09.06.2006 1 Mit der Kovarianz und dem Korrelationskoeffizienten können wir den statistischen
MehrAufgaben zu Kapitel 4
Aufgaben zu Kapitel 4 Aufgabe 1 a) Berechnen Sie die Korrelation zwischen dem Geschlecht und der Anzahl erinnerter positiver Adjektive. Wie nennt sich eine solche Korrelation und wie lässt sich der Output
Mehr1 Grundlagen der Wahrscheinlichkeitsrechnung Wahrscheinlichkeitsräume. Ein erster mathematischer Blick auf Zufallsexperimente...
Inhaltsverzeichnis 1 Grundlagen der Wahrscheinlichkeitsrechnung 1 1.1 Wahrscheinlichkeitsräume Ein erster mathematischer Blick auf Zufallsexperimente.......... 1 1.1.1 Wahrscheinlichkeit, Ergebnisraum,
MehrMittelwert und Standardabweichung
Professur E-Learning und Neue Medien Institut für Medienforschung Philosophische Fakultät Einführung in die Statistik Mittelwert und Standardabweichung Überblick Mittelwert Standardabweichung Weitere Maße
MehrPeter Sedlmeier Frank Renkewitz Forschungsmethoden und Statistik in der Psychologie
Peter Sedlmeier Frank Renkewitz Forschungsmethoden und Statistik in der Psychologie ein Imprint von Pearson Education München Boston San Francisco Harlow, England Don Mills, Ontario Sydney Mexico City
MehrEinfache lineare Regressionsanalyse
Dr. Matthias Rudolf Modul M3: Multivariate Statistik Aufgaben und Lösungshinweise zum Computerseminar ERA: Einfache lineare Regressionsanalyse Dr. Matthias Rudolf: Modul BA-M3 Multivariate Statistik Seite
MehrLineare vs. nichtlineare Zusammenhänge
Nicht lineare Zusammenhänge Lowess und Potenzleiter Partialkorrelation Thomas Schäfer SS 29 1 Lineare vs. nichtlineare Zusammenhänge Was Sie schon wissen: Zusammenhänge sind die Grundlage der Methodenlehre
MehrForschungsstatistik I
Psychologie Prof. Dr. G. Meinhardt 6. Stock, TB II R. 06-206 (Persike) R. 06-321 (Meinhardt) Sprechstunde jederzeit nach Vereinbarung Forschungsstatistik I Dr. Malte Persike persike@uni-mainz.de http://psymet03.sowi.uni-mainz.de/
MehrSozialwissenschaftliche Fakultät der Universität Göttingen. Sommersemester Statistik mit SPSS
Sommersemester 2009 Statistik mit SPSS 15. Mai 2009 15. Mai 2009 Statistik Dozentin: mit Esther SPSSOchoa Fernández 1 Überblick 1. Korrelation vs. Regression 2. Ziele der Regressionsanalyse 3. Syntax für
MehrAssoziation & Korrelation
Statistik 1 für SoziologInnen Assoziation & Korrelation Univ.Prof. Dr. Marcus Hudec Einleitung Bei Beobachtung von Merkmalen stellt sich die Frage, ob es Zusammenhänge oder Abhängigkeiten zwischen den
MehrStatistik I für Studierende der Wirtschaftswissenschaften Übungsblatt 12 Prof. Dr. Christian Heumann WS 2015/16
Statistik I für Studierende der Wirtschaftswissenschaften Übungsblatt 2 Prof. Dr. Christian Heumann WS 205/6 Aufgabe : Der Datensatz Theater (verfügbar auf der Homepage) beinhaltet Informationen über eine
Mehr2. Zusammenhangsmaße
2. Zusammenhangsmaße Signifikante χ²-werte von Kreuztabellen weisen auf die Existenz von Zusammenhängen zwischen den zwei untersuchten Variablen X und Y hin. Für die Interpretation interessieren jedoch
MehrZiel: Vorhersage eines Kriteriums/Regressand Y durch einen Prädiktor/Regressor X.
Lineare Regression Einfache Regression Beispieldatensatz: trinkgeld.sav Ziel: Vorhersage eines Kriteriums/Regressand Y durch einen Prädiktor/Regressor X. H0: Y lässt sich nicht durch X erklären, das heißt
MehrVerfahren zur Überprüfung von Zusammenhangshypothesen
Verfahren zur Überprüfung von Zusammenhangshypothesen 0. Allgemeines Wir haben uns bisher mit Unterschiedshypothesen beschäftigt (Unterschiede von Stichproben in Bezug auf abhängige Variablen). Im Folgenden
MehrInhaltsverzeichnis. Über die Autoren Einleitung... 21
Inhaltsverzeichnis Über die Autoren.... 7 Einleitung... 21 Über dieses Buch... 21 Was Sie nicht lesen müssen... 22 Törichte Annahmen über den Leser... 22 Wie dieses Buch aufgebaut ist... 23 Symbole, die
MehrBrückenkurs Statistik für Wirtschaftswissenschaften
Peter von der Lippe Brückenkurs Statistik für Wirtschaftswissenschaften Weitere Übungsfragen UVK Verlagsgesellschaft mbh Konstanz Mit UVK/Lucius München UVK Verlagsgesellschaft mbh Konstanz und München
MehrAssoziation & Korrelation
Statistik 1 für SoziologInnen Assoziation & Korrelation Univ.Prof. Dr. Marcus Hudec Einleitung Bei Beobachtung von 2 Merkmalen stellt sich die Frage, ob es Zusammenhänge oder Abhängigkeiten zwischen den
MehrPolynomiale Regression lässt sich mittels einer Transformation der Merkmale auf multiple lineare Regression zurückführen
Rückblick Polynomiale Regression lässt sich mittels einer Transformation der Merkmale auf multiple lineare Regression zurückführen Ridge Regression vermeidet Überanpassung, indem einfachere Modelle mit
MehrAnnahmen des linearen Modells
Annahmen des linearen Modells Annahmen des linearen Modells zusammengefasst A1: Linearer Zusammenhang: y = 0 + 1x 1 + 2x 2 + + kx k A2: Zufallsstichprobe, keine Korrelation zwischen Beobachtungen A3: Erwartungswert
MehrSommersemester Marktforschung
Dipl.-Kfm. Sascha Steinmann Universität Siegen Lehrstuhl für Marketing steinmann@marketing.uni-siegen.de Sommersemester 2010 Marktforschung Übungsaufgaben zu den Themen 3-6 mit Lösungsskizzen Aufgabe 1:
MehrBiostatistik 101 Korrelation - Regressionsanalysen
Good Data don't need statistics Biostatistik 101 Korrelation - Regressionsanalysen Carl Herrmann IPMB Uni Heidelberg & DKFZ B080 carl.herrmann@uni-heidelberg.de Korrelation Sind Alter und Blutdruck miteinander
MehrZusammenhangsmaße II
Sommersemester 2009 Wiederholung/ Eine nominale und eine intervallskalierte Variable χ 2 =?!? Übung von Simone Reutzel Heute im HS1, altes ReWi-Haus Zum Nachlesen Agresti/Finlay: Kapitel 8.5, 9.4 Gehring/Weins:
MehrGliederung. 1. Einführung. Heute schon Musik gehört?
Regressionsanalyse Technische Universität Chemnitz Seminar: Forschungsmethodik und Evalua
MehrKapitel 4: Merkmalszusammenhänge
Kapitel 4: Merkmalszusammenhänge Streudiagramme SPSS bietet die Möglichkeit, verschiedene Arten von Streudiagrammen zu zeichnen. Gehen Sie auf Grafiken Streu-/Punkt-Diagramm und wählen Sie die Option Einfaches
MehrStatistik III Regressionsanalyse, Varianzanalyse und Verfahren bei Messwiederholung mit SPSS
Statistik III Regressionsanalyse, Varianzanalyse und Verfahren bei Messwiederholung mit SPSS Verena Hofmann Dr. phil. des. Departement für Sonderpädagogik Universität Freiburg Petrus-Kanisius-Gasse 21
Mehr6 Korrelations- und Regressionsanalyse: Zusammenhangsanalyse stetiger Merkmale
6 Korrelations- und Regressionsanalyse: Zusammenhangsanalyse stetiger Merkmale 397 6.1 Korrelationsanalyse Jetzt betrachten wir bivariate Merkmale (X, Y ), wobei sowohl X als auch Y stetig bzw. quasi-stetig
MehrStatistik II. II. Univariates lineares Regressionsmodell. Martin Huber 1 / 20
Statistik II II. Univariates lineares Regressionsmodell Martin Huber 1 / 20 Übersicht Definitionen (Wooldridge 2.1) Schätzmethode - Kleinste Quadrate Schätzer / Ordinary Least Squares (Wooldridge 2.2)
Mehr6Korrelationsanalyse:Zusammengangsanalysestetiger Merkmale
6Korrelationsanalyse:Zusammengangsanalysestetiger Merkmale Jetzt betrachten wir bivariate Merkmale (X, Y ), wobei sowohl X als auch Y stetig bzw. quasi-stetig und mindestens ordinalskaliert, typischerweise
MehrTEIL 13: DIE LINEARE REGRESSION
TEIL 13: DIE LINEARE REGRESSION Dozent: Dawid Bekalarczyk GLIEDERUNG Dozent: Dawid Bekalarczyk Lineare Regression Grundlagen Prognosen / Schätzungen Verbindung zwischen Prognose und Zusammenhang zwischen
MehrStichprobenumfangsplanung
Professur E-Learning und Neue Medien Institut für Medienforschung Philosophische Fakultät Einführung in die Statistik Stichprobenumfangsplanung Überblick Einführung Signifikanzniveau Teststärke Effektgröße
MehrKapitel 4: Merkmalszusammenhänge
Kapitel 4: Merkmalszusammenhänge Korrelationen 1 Lineare Regression 3 Literatur 5 Korrelationen Mit Hilfe von G*Power lässt sich analog zum Vorgehen beim t-test (Kapitel 3, Band I) vor einer Untersuchung
MehrLösung Aufgabe 1 (Regression) Es wurden in einer Befragung zwei metrische Merkmale X und Y erhoben. Betrachten Sie dazu die
Statistik für Kommunikationswissenschaftler Wintersemester 2010/2011 Vorlesung Prof. Dr. Nicole Krämer Übung Nicole Krämer, Cornelia Oberhauser, Monia Mahling Lösung Thema 9 Homepage zur Veranstaltung:
MehrGeg.: Eine Menge von Elementen, z.b.
1.3 Zweidimensionale Häufigkeitsverteilungen Geg.: Eine Menge von Elementen, z.b. Schüler einer Schule Soldaten eines Bataillons Schrauben einer Stichprobe Tage eines Jahrhunderts Betrachtet werden zwei
MehrWeitere Korrelationskoeffizienten (1)
Weitere Korrelationskoeffizienten () Welche Korrelationskoeffizienten man für die Analyse von Zusammenhängen benutzen kann, hängt entscheidend von dem Skalenniveau der beteiligen Variablen und der Fragestellung
Mehr