1 Statistische Grundlagen

Save this PDF as:
 WORD  PNG  TXT  JPG

Größe: px
Ab Seite anzeigen:

Download "1 Statistische Grundlagen"

Transkript

1 Konzepte in Empirische Ökonomie 1 (Winter) Hier findest Du ein paar Tipps zu den Konzepten in Empirische 1. Wenn Du aber noch etwas Unterstützung kurz vor der Klausur brauchst, schreib uns eine kurze . Wir sind ehemalige Übungsleiter in Mathematik und Statistik, die auch alle Empirische 1 hören mussten und dir kompetente und klausurorientierte Hilfe anbieten können - zu einem fairen Preis. Frag einfach an! 1 Statistische Grundlagen ˆ Zufallsvariablen: Eine Größe, die eine Verteilung besitzt, aus der Realisationen gezogen werden. ˆ Schätzer: Ein Schätzer ist eine Funktion der Daten. Wichtige Schätzer sind das arithmetische Mittel für den Erwartungswert µ der Normalverteilung oder der Koeffizientenschätzer in einer Regression ˆβ. Schätzer sind Zufallsvariablen. ˆ Geschätzter Wert: Das Resultat eines Schätzers, wenn er auf die beobachteten Daten angewendet wird. Der geschätzte Wert ist keine Zufallsvariable, sondern fest. Man wird aber nur durch Zufall den wahren Parameter richtig schätzen. ˆ Unverzerrter Schätzer: Ein Schätzer ˆθ ist unverzerrt, wenn der Erwartungswert des Schätzers ˆθ dem zu schätzenden Parameter θ entspricht. Formal bedeutet das: E(ˆθ) = θ. Im Mittel erhält man also den wahren Wert, wenn man den Schätzer immer wieder auf neue Stichproben anwendet. ˆ Bias: Verzerrung eines Schätzers, also E(ˆθ) θ. Ist der Bias gleich Null, heißt der Schätzer unverzerrt. ˆ Konsistenz: Ein Schätzer ist genau dann konsistent, wenn sich der Schätzer beliebig genau dem wahren Parameter annähert, wenn der Stichprobenumfang n wächst. 1

2 Nicht jeder unverzerrte Schätzer ist konsistent (dazu muss die Varianz des Schätzers für n noch gegen Null gehen). Nicht jeder konsistente Schätzer ist unverzerrt ˆ Effizienz und relative Effizienz: Da Schätzer Zufallsvariablen sind, besitzen sie Erwartungswert und Varianz. Ein unverzerrter Schätzer ist relativ effizient, wenn er eine geringere Varianz besitzt als ein anderer unverzerrter Schätzer. ˆ BLUE: Best linear unbiased estimator. Der lineare unverzerrte Schätzer für einen Parameter mit der kleinsten Varianz unter allen linearen unverzerrten Schätzern für diesen Parameter. Linear bedeutet, dass die Daten linear in die Schätzfunktion eingehen, z.b. 1/n n i=1 x i für das arithmetische Mittel. ˆ t-test allgemein: Der t-test soll eine Aussage darüber treffen, wie wahrscheinlich es ist, dass ein bestimmter geschätzter Wert für einen Parameter θ beobachtet wird, wenn man davon ausgeht, dass das wahre θ den unterstellten Wert H 0 : θ = θ H0 annimmt. Dazu wird die t-statistik t = geschätzter Wert unterstellter Wert Standardfehler des Schätzers berechnet. Je höher der Betrag der t-statistik, desto unwahrscheinlicher ist es, dass der geschätzte Wert zufällig so extrem im Vergleich zum unterstellten wahren Wert in der Nullhypothese ist. Auf deutsch: H 0 wird abgelehnt, wenn der Betrag des t-werts über dem kritischen Wert ist (1.64 für 10%-Niveau, 1.96 für 5%-Niveau und 2.58 für 1%-Niveau). Wenn der kritische Wert kleiner als die jeweilige Grenze ist, wird H 0 nicht verworfen. Wird H 0 verworfen, geht man davon aus, dass der wahre Parameter nicht dem Wert in H 0 entspricht. Bei einer Regression geht man bei Ablehnen des Tests, ob der Koeffizient gleich Null ist, davon aus, dass ein signifikanter Zusammenhang zwischen der jeweiligen Einflussgröße X und der Zielgröße Y besteht. ˆ p-wert: Die Wahrscheinlichkeit für gegebene Daten, dass ein auf Basis der Stichprobe geschätzter Wert beobachtet wird, wenn der wahre Parameter den Wert wie in der Nullhypothese H 0 annimmt. Ein niedriger p-wert spricht gegen die Hypothese H 0. ˆ Signifikanzniveau: Höchste zulässige Wahrscheinlichkeit dafür, dass H 0 abgelehnt wird, obwohl H 0 richtig ist. Einfacher zu merken: Obere Grenze für den p-wert, bei dem H 0 abgelehnt wird. ˆ Konfidenzintervall: Ein Konfidenzintervall deckt genau die möglichen Werte eines Schätzers ab, bei denen ein t-test für ein festes Signifikanzniveau nicht ablehnen würde. 2

3 ˆ Verständnistipps: Im Beispiel hier gehen wir jetzt davon aus, dass das Signifikanzniveau auf 5% festgelegt wurde (das passiert meist aus einer Konvention heraus, manche Wissenschaftsgebiete akzeptieren 5%, für andere Gebiete wäre das nicht überzeugend) und man möchte die Signifikanz einer Einflussgröße in der Regression testen, also ob das wahre β = 0. Als Hypothese H 0 : β = 0. Es besteht eine sogenannte Dualität zwischen t-test und Konfidenzintervall. Drei Beispiele: Der Betrag der t-statistik ist größer als 1,96. Dann weiß man, dass der p- Wert kleiner ist als 0.05 und dass das zugehörige Konfidenzintervall die 0 nicht überdeckt. Das Konfidenzintervall überdeckt die Null. Dann weiß man, dass der p-wert größer ist als 0.05 und dass der t-wert kleiner ist als Der p-wert ist kleiner als Dann weiß man, dass der t-wert größer ist als 1.96 und das Konfidenzintervall die Null nicht überdeckt. 2 Regression ˆ Schätzung der Parameter: Die Parameter werden geschätzt, indem die Summe der quadrierten Abweichungen der Datenpunkte von der Regressionsgeraden minimiert werden. ˆ Koeffizientenschätzer: ˆβ k = s X k Y s 2 X k Der Koeffizientenschätzer wird berechnet, indem die Stichprobenkovarianz zwischen der Einflussgröße X und der Zielgröße Y durch die Stichprobenvarianz der Einflussgröße X geteilt wird. Möchte man die Kovarianz zwischen der Einflussgröße und der Zielgröße berechnen, löst man die Gleichung einfach danach auf! Der Schätzer für den Achsenabschnitt wird über ˆβ 0 = Y ˆβ 1 X 1... ˆβ k X k berechnet, wobei der Überstrich bedeutet, dass es sich um das arithmetische Mittel der jeweiligen Größe handelt. ˆ Varianz des Koeffizientenschätzers: ˆβ streut weniger, je größer der Stichprobenumfang n ist und je größer die Varianz der Einflussgröße X ist. ˆ Prognostizierter Wert für Y : Setze die Werte in die geschätzte Regressionsgleichung ein und erhalte so die Prognose für Y. ˆ Residuum: Das Residuum ist die Differenz zwischen wahrem Wert und durch die Regression vorhergesagtem Wert. In einer Grafik ist das der senkrechte Abstand des Datenpunkts zur geschätzten Regressionsgerade. 3

4 ˆ Hetero- und Homoskedastie: Daten sind homoskedastisch, wenn die Varianz nicht davon abhängt, welchen Bereich der Daten man betrachtet. Daten sind heteroskedastisch, wenn man für verschiedene Bereiche der Daten eine andere Varianz schätzen müsste. Liegt Heteroskedastie vor, kann man die Standardfehler von ˆβ nicht mehr konsistent schätzen und muss robuste Standardfehler verwenden. ˆ Annahme M1: E(u i X 1i,..., X ki ) = 0. Bei einer Regression wird der bedingte Erwartungswert von Y bei gegebenen Kovariablen modelliert. Annahme M1 besagt, dass alle relevanten Charakteristika der Daten für den bedingten Erwartungswert von Y auch in der Regression berücksichtigt wurden. ˆ Annahme M2: Die Beobachtungen der Einfluss- und der Zielvariablen stammen aus einer Zufallsstichprobe und sind deswegen identisch und vor allem unabhängig verteilt. ˆ Annahme M3: Es liegen keine Ausreißer vor. ˆ Annahme M4: Es liegt keine perfekte Multikollinearität vor. Perfekte Multikollinearität liegt vor, wenn die Korrelation zwischen zwei Einflussgrößen exakt gleich 1 ist. Liegt perfekte Multikollinearität vor, können die Koeffizientenschätzwerte nicht mehr eindeutig bestimmt werden. Viele Programme brechen die Schätzung bei perfekter Multikollinearität ab. Das liegt meist daran, dass die Einflussgrößen schlecht gewählt sind (z.b. die Aufnahme von Körpergröße in cm und Körpergröße in m in die Regression). Imperfekte Multikollinearität schließt eine Schätzung nicht aus, hohe Standardfehler sind aber möglich! (Instabile Schätzer) ˆ Wenn M1 bis M4 gilt: Die OLS-Schätzer sind unverzerrt, konsistent und asymptotisch normalverteilt. ˆ M1 bis M4 gelten und Daten homoskedastisch: Gauss-Markov Theorem gilt. OLS-Schätzer ist BLUE. Ist Y bzw. der Fehler auch noch normalverteilt, hat der OLS-Schätzer die kleinste asymptotische Varianz unter allen linearen und nicht-linearen Schätzern. ˆ Kleine Stichproben: Für approximative Normalverteilung der Schätzer und für die Verteilung der t-statistik entsprechend der t-verteilung mit n 2 Freiheitsgraden müssen die Daten homoskedastisch und Y normalverteilt sein. Die Normalverteilung muss nicht für die Einflussgrößen gelten. ˆ Bestimmtheitsmaß und korrigiertes Bestimmtheitsmaß: Das Bestimmtheitsmaß R 2 ist gibt den Anteil der erklärten Varianz der Gesamtvarianz an. Es nimmt Werte zwischen 0 und 1 und kann auch 1 werden. Das R 2 kann dadurch künstlich erhöht werden, indem man viele Regressionskoeffizienten aufnimmt. Das verhindert das korrigierte R 2, das von den Einflussgrößen fordert, dass deren Aufnahme einen Beitrag zum Erklärungsgehalt liefert. Es berücksichtigt die Anzahl bereits aufgenommener Regressionen und kann auch sinken, wenn die zusätzlich aufgenommene Variable nicht genügend Erklärungsgehalt aufweist. 4

5 ˆ Standardfehler der Regression: Durchschnittliche Größe des Residuums, berücksichtigt verlorene Freiheitsgrade durch zu schätzende Residuen, der Root Mean Squared Error nicht. ˆ Interpretation der geschätzten Koeffizienten: Interpretation als marginaler Effekt (erste partielle Ableitung der Regressionsgerade nach interessierender Einflussgröße). Steigt X k um eine Einheit, steigt Y im Mittel um β k Einheiten, wenn alle übrigen Variablen konstant gehalten werden. Angabe der Signifikanz über p-wert indem p-wert und Signifikanzniveau angegeben werden, oder: Angabe der Signifikanz über t-wert, indem berechneter t-wert mit entsprechendem t-quantil verglichen wird (bei 5%-Signifikanzniveau: 1.96), oder: Falls t-wert nicht gegeben: Berechnung, indem der geschätzte Wert für β durch dessen Standardfehler berechnet wird (t-test, wenn unterstellter wahrer Parameter Null sein soll). ˆ Warum F-Test bei verbundenen Hypothesen? Zu testen wäre H 0 : β 1 = β 1,H0 und β 2 = β 2,H0. Geschätzte Parameter sind nicht statistisch unabhängig voneinander und damit sind die t-statistiken ebenfalls nicht unabhängig. In die F-Statistik geht die Varianz-Kovarianz der geschätzten Koeffizienten ein, wodurch die Korrelation zwischen den Koeffizienten berücksichtigt wird. Die Statistik ist F q, -verteilt. ˆ Restriktionen q des F-Tests: Salopp: Anzahl der Gleichheitszeichen in H 0. ˆ Unkorrelierte t-statistiken bei zwei Koeffizienten: F = 0.5(t t 2 2). ˆ R-Matrix beim F-Test: Matrix mit q-zeilen bezogen auf die zu testenden Hypothesen und (k + 1)-Spalten für die Anzahl der Koeffizienten (k + 1 für Achsenabschnitt und Steigungsparameter). 3 Ausgelassene Variablen Betrachte das wahre Modell Y i = β 0 + β 1 X i + β 2 Z i + u i. X ist die Größe, an deren Einfluss wir interessiert sind und deswegen β 1 unverzerrt und konsistent schätzen wollen. Nehmen wir an, dass wir Z nicht beobachten können. Wann ist der Schätzer für β 1 verzerrt? Dafür müssen beide folgenden Bedingungen gelten: ˆ X und Z müssen korreliert sein, also corr(x, Z) 0 und ˆ Z muss einen Einfluss auf Y besitzen. 5

6 Nur dann ist β 1 verzerrt und M1 verletzt. Lösung: Versuche die Variable Z in die Regression aufzunehmen. Ist sie beobachtbar und im Datensatz vorhanden, dann kann man sie in die Regression aufnehmen, eventuell muss man sie allerdings nichtlinear transformieren. ˆ Lineares Modell: Die X dürfen beliebig verändert werden, nur die Koeffizienten dürfen höchstens mit einer Konstanten multipliziert werden. Die Koeffizienten müssen linear bleiben (logarithmieren oder die Anwendung der e-funktion auf den Koeffizienten sind nichtlineare Transformationen). ˆ Richtung der Verzerrung In der Regression y = β 0 + β 1 X steht Z im Zusammenhang mit Y und ist mit X korreliert. In welche Richtung ist β 1 verzerrt? corr(x, Z) Zusammenhang mit Y Verzerrung in welche Richtung? + + E( ˆβ 1 ) > β 1 (Überschätzung) - + E( ˆβ 1 ) < β 1 (Unterschätzung) + - E( ˆβ 1 ) < β 1 (Unterschätzung) - - E( ˆβ 1 ) > β 1 (Überschätzung) ˆ Nichtlineare Regressoren: Modelliert wird bspw. Y i = β 0 + β 1 X i + β 2 X 2 i Marginaler Effekt hängt vom Wert von X ab, da Y i X = β 1 + 2β 2 X i ˆ Interpretation lin-log: Y linear, X im Logarithmus. Steigt X um 1% führt das im Mittel zu einer Erhöhung von Y um β/100. ˆ Interpretation log-lin: Y im Logarithmus, X linear. Steigt X um eine Einheit, ändert sich Y im Mittel um 100β%. ˆ Interpretation log-log: Steigt X um 1%, ändert sich Y im Mittel um β%. β kann als Elastizität von Y bezüglich X interpretiert werden. ˆ Interaktionen: Siehe Folie 270. Y i = β 0 + β 1 D 1i + β 2 D 2i + β 3 (D 1i D 2i ) wobei D1 und D2 jeweils Dummy-Variablen sind. Vier Fälle: E(Y D 1 = 0, D 2 = 0) = β 0 + β β β 3 (0 0) = β 0 E(Y D 1 = 1, D 2 = 0) = β 0 + β β β 3 (1 0) = β 0 + β 1 E(Y D 1 = 1, D 2 = 1) = β 0 + β 1 + β 2 + β 3 Wichtig ist, dass β 3 nur dann in den bedingten Erwartungswert eingehen, wenn beide Dummies den Wert 1 annehmen Vergleiche Folien !!. 6

7 4 (Natürliche) Experimente und Differenzenschätzer ˆ Average Treatment Effect: Differenz des Durchschnittswerts in Treatmentgruppe und des Durchschnittswerts der Kontrollgruppe. Modelliert durch Regression mit Dummy D, die den Wert 1 annimmt, wenn das Individuum in der Treatmentgruppe war: Y i = β 0 + β 1 X i β 1 kann dann als ATE interpretiert werden. ˆ Potenzielle Probleme bei der Durchführung von Zufallsexperimenten: Verletung des Versuchsprotokolls bzw. Fehlschlagen der Zufallsauswahl (z.b. Selbstselektion) Abbrecher (Gründe für Abbrechen entscheidend!) Experimentelle Effekte: Teilnehmer können ihr natürliches Verhalten verändern, weil sie wissen, dass sie an einem Experiment teilnehmen (Hawthorne-Effekt). Doppelblind-Studien als Ideal. Zu kleine Stichproben, sodass Erwartungstreue und Konsistenz des OLS- Schätzers argumentativ schwer durchsetzbar sind. Hohe Standardfehler der Schätzer können auch ein Problem sein. Übertragbarkeit der Ergebnisse (externe Validität). Ist das Experiment repräsentativ? ˆ Einfacher und doppelter Differenzenschätzer intuitiv: In natürlichen Experimenten ohne zeitliche Änderung entspricht der einfache Differenzenschätzer dem ATE. In Experimenten mit zeitlicher Änderung ist entscheidend, ob Niveauunterschiede zwischen den beiden Gruppen vor dem Experiment vorgelegen haben. Liegen Niveauunterschiede vor, ist der doppelte Differenzenschätzer vorzuziehen, da dieser die Niveauunterschiede herausrechnet, indem die Veränderung in diesen Gruppen verglichen werden. ˆ Einfacher und doppelter Differenzenschätzer in Regressionen: Regression mit dem einfachen Differenzenschätzer: Siehe Average Treatment Effect. Es können auch Kovariablen aufgenommen werden. Regression beim doppelten Differenzenschätzer: Y = β 0 + β 1 D 1 + β 2 D 2 + β 3 (D 1 D 2 ), Wobei D 1 den Wert 1 annimmt, wenn die Person der Treatmentgruppe angehört und D 2 ist 1, wenn sich die Beobachtung nach dem Experiment gemacht wurde. Effekt ist dann am Koeffizienten des Interaktionsterms des Zeit- und Treatment- Dummies abzulesen, hier β 3. ˆ Tipps: Grafik auf Folie 314! Der einfache Differenzenschätzer ist hier die Differenz zwischen dem Mittelwert in treatment-after und dem Mittelwert von controlafter. 7

8 5 Logit und Probit ˆ Warum kein lineares Modell?: Modelliert werden soll die bedingte Wahrscheinlichkeit, dass Y = 1 bei gegebenen Kovariablen. Wahrscheinlichkeiten nehmen aber nur Werte zwischen 0 und 1 an, ein lineares Modell ist aber nicht beschränkt. Besonders problematisch ist aber, dass immer Heteroskedastie vorliegen würde und so die korrekte Berechnung von Standardfehlern nicht möglich ist (und damit Schlüsse auf die Grundgesamtheit über t- oder p-wert problematisch wäre). ˆ Marginaler Effekte im Probit: Modelliert wird P r(y = 1 X 1,..., X k ) = Φ(β 0 + β 1 X β k X k ), wobei Φ( ) die Verteilungsfunktion der Standardnormalverteilung ist (dafür gibt es keine Formel, die Verteilungsfunktion der Normalverteilung ist analytisch nicht vorhanden). Marginaler Effekt: P r(y = 1 X 1,..., X k ) X 1 = φ(β 0 + β 1 X β k X k ) β 1, wobei φ( ) die Dichte der Standardnormalverteilung ist. Der marginale Effekt ist über die Kettenregel zu berechnen und abhängig von allen Koeffizienten. Die Richtung des Effekts wird durch das Vorzeichen des Koeffizienten der interessierenden Einflussgröße berechnet. ˆ Interpretation des marginalen Effekts im Probit: Interpretiert wird nur die Richtung des Effekts. Ist ˆβ positiv, hat X im Mittel einen positiven Effekt auf Y und einen negativen, wenn ˆβ negativ ist. Signifikanz wird hier über den Gauss-Test abgelesen (z-wert), die kritischen Werte sind die gleichen wie beim t-test, jedenfalls für große Stichproben. ˆ Marginaler Effekte im Logit: Modelliert wird P r(y = 1 X 1,..., X k ) = F (β 0 + β 1 X β k X k ), wobei F ( ) die Verteilungsfunktion der logistischen Verteilung ist. Marginaler Effekt: P r(y = 1 X 1,..., X k ) = f(β 0 + β 1 X β k X k ) β 1, X 1 wobei f( ) die Dichte der logistischen Verteilung ist. Der marginale Effekt ist über die Kettenregel zu berechnen und abhängig von allen Koeffizienten. Die Richtung des Effekts wird durch das Vorzeichen des Koeffizienten der interessierenden Einflussgröße berechnet. ˆ Interpretation des marginalen Effekts im Logit: Interpretiert wird nur die Richtung des Effekts. Ist ˆβ positiv, hat X im Mittel einen positiven Effekt auf Y und einen negativen, wenn ˆβ negativ ist. ˆ Was bedeutet Steigung im Gretl-Output? Marginaler Effekt des jeweiligen Koeffizienten, wenn für alle Einflussgrößen der Mittelwert eingesetzt wird. 8

9 6 Zeitreihen ˆ Autokorrelation: Korrelation von zeitlich benachbarten Werten der gleichen Größe. ρ j = corr(y t, Y t j ). ˆ Persistenz: Hohe Autokorrelation über mehrere Perioden. Persistente Zeitreihen eignen sich besonders, um vergangene Werte zur kurzfristigen Prognose zukünftiger Werte zu verwenden. ˆ AR(p)-Prozess: Lineares Modell mit vergangenen Werten von Y als Kovariablen. Schätzung funktioniert auch über OLS. Parameterschätzung sind bei korrekter Spezifikation durchaus konsistent! Für Prognosen kann das (korrigierte) R 2 verwendet werden, genauso kann ein t-test für einzeln signifikante Koeffizienten und der F-Test für gemeinsam signifikante Koeffizienten verwendet werden. 9

9. Schätzen und Testen bei unbekannter Varianz

9. Schätzen und Testen bei unbekannter Varianz 9. Schätzen und Testen bei unbekannter Varianz Dr. Antje Kiesel Institut für Angewandte Mathematik WS 2011/2012 Schätzen und Testen bei unbekannter Varianz Wenn wir die Standardabweichung σ nicht kennen,

Mehr

Interne und externe Modellvalidität

Interne und externe Modellvalidität Interne und externe Modellvalidität Interne Modellvalidität ist gegeben, o wenn statistische Inferenz bzgl. der untersuchten Grundgesamtheit zulässig ist o KQ-Schätzer der Modellparameter u. Varianzschätzer

Mehr

METHODENLEHRE I WS 2013/14 THOMAS SCHÄFER

METHODENLEHRE I WS 2013/14 THOMAS SCHÄFER METHODENLEHRE I WS 2013/14 THOMAS SCHÄFER DAS THEMA: INFERENZSTATISTIK IV INFERENZSTATISTISCHE AUSSAGEN FÜR ZUSAMMENHÄNGE UND UNTERSCHIEDE Inferenzstatistik für Zusammenhänge Inferenzstatistik für Unterschiede

Mehr

Binäre abhängige Variablen

Binäre abhängige Variablen Binäre abhängige Variablen Thushyanthan Baskaran thushyanthan.baskaran@awi.uni-heidelberg.de Alfred Weber Institut Ruprecht Karls Universität Heidelberg Einführung Oft wollen wir qualitative Variablen

Mehr

Bachelorprüfung. Praxis der empirischen Wirtschaftsforschung Prof. Regina T. Riphahn, Ph.D. Name, Vorname. Matrikelnr. E-Mail. Studiengang.

Bachelorprüfung. Praxis der empirischen Wirtschaftsforschung Prof. Regina T. Riphahn, Ph.D. Name, Vorname. Matrikelnr. E-Mail. Studiengang. Lehrstuhl für Statistik und empirische Wirtschaftsforschung Fach: Prüfer: Bachelorprüfung Praxis der empirischen Wirtschaftsforschung Prof. Regina T. Riphahn, Ph.D. Name, Vorname Matrikelnr. E-Mail Studiengang

Mehr

Fortgeschrittene Statistik Logistische Regression

Fortgeschrittene Statistik Logistische Regression Fortgeschrittene Statistik Logistische Regression O D D S, O D D S - R A T I O, L O G I T T R A N S F O R M A T I O N, I N T E R P R E T A T I O N V O N K O E F F I Z I E N T E N, L O G I S T I S C H E

Mehr

Institut für Soziologie. Methoden 2. Regressionsanalyse I: Einfache lineare Regression

Institut für Soziologie. Methoden 2. Regressionsanalyse I: Einfache lineare Regression Institut für Soziologie Methoden 2 Regressionsanalyse I: Einfache lineare Regression Programm Anwendungsbereich Vorgehensweise Interpretation Annahmen Zusammenfassung Übungsaufgabe Literatur # 2 Anwendungsbereich

Mehr

Kapitel 8. Einfache Regression. Anpassen des linearen Regressionsmodells, OLS. Eigenschaften der Schätzer für das Modell

Kapitel 8. Einfache Regression. Anpassen des linearen Regressionsmodells, OLS. Eigenschaften der Schätzer für das Modell Kapitel 8 Einfache Regression Josef Leydold c 2006 Mathematische Methoden VIII Einfache Regression 1 / 21 Lernziele Lineares Regressionsmodell Anpassen des linearen Regressionsmodells, OLS Eigenschaften

Mehr

Business Value Launch 2006

Business Value Launch 2006 Quantitative Methoden Inferenzstatistik alea iacta est 11.04.2008 Prof. Dr. Walter Hussy und David Tobinski UDE.EDUcation College im Rahmen des dokforums Universität Duisburg-Essen Inferenzstatistik Erläuterung

Mehr

Kapitel 4: Binäre Regression

Kapitel 4: Binäre Regression Kapitel 4: Binäre Regression Steffen Unkel (basierend auf Folien von Nora Fenske) Statistik III für Nebenfachstudierende WS 2013/2014 4.1 Motivation Ausgangssituation Gegeben sind Daten (y i, x i1,...,

Mehr

Lösungen zu Janssen/Laatz, Statistische Datenanalyse mit SPSS 1

Lösungen zu Janssen/Laatz, Statistische Datenanalyse mit SPSS 1 LÖSUNG 9B a) Lösungen zu Janssen/Laatz, Statistische Datenanalyse mit SPSS 1 Man kann erwarten, dass der Absatz mit steigendem Preis abnimmt, mit höherer Anzahl der Außendienstmitarbeiter sowie mit erhöhten

Mehr

12. Vergleich mehrerer Stichproben

12. Vergleich mehrerer Stichproben 12. Vergleich mehrerer Stichproben Dr. Antje Kiesel Institut für Angewandte Mathematik WS 2011/2012 Häufig wollen wir verschiedene Populationen, Verfahren, usw. miteinander vergleichen. Beipiel: Vergleich

Mehr

2. Korrelation, lineare Regression und multiple Regression

2. Korrelation, lineare Regression und multiple Regression multiple 2.2 Lineare 2.2 Lineare 1 / 130 2.2 Lineare 2 / 130 2.1 Beispiel: Arbeitsmotivation Untersuchung zur Motivation am Arbeitsplatz in einem Chemie-Konzern 25 Personen werden durch Arbeitsplatz zufällig

Mehr

5. Schließende Statistik. 5.1. Einführung

5. Schließende Statistik. 5.1. Einführung 5. Schließende Statistik 5.1. Einführung Sollen auf der Basis von empirischen Untersuchungen (Daten) Erkenntnisse gewonnen und Entscheidungen gefällt werden, sind die Methoden der Statistik einzusetzen.

Mehr

Grundlagen der Inferenzstatistik: Was Ihnen nicht erspart bleibt!

Grundlagen der Inferenzstatistik: Was Ihnen nicht erspart bleibt! Grundlagen der Inferenzstatistik: Was Ihnen nicht erspart bleibt! 1 Einführung 2 Wahrscheinlichkeiten kurz gefasst 3 Zufallsvariablen und Verteilungen 4 Theoretische Verteilungen (Wahrscheinlichkeitsfunktion)

Mehr

Inhaltsverzeichnis. Regressionsanalyse. http://mesosworld.ch - Stand vom: 20.1.2010 1

Inhaltsverzeichnis. Regressionsanalyse. http://mesosworld.ch - Stand vom: 20.1.2010 1 Inhaltsverzeichnis Regressionsanalyse... 2 Lernhinweise... 2 Einführung... 2 Theorie (1-8)... 2 1. Allgemeine Beziehungen... 3 2. 'Best Fit'... 3 3. 'Ordinary Least Squares'... 4 4. Formel der Regressionskoeffizienten...

Mehr

Profil A 49,3 48,2 50,7 50,9 49,8 48,7 49,6 50,1 Profil B 51,8 49,6 53,2 51,1 51,1 53,4 50,7 50 51,5 51,7 48,8

Profil A 49,3 48,2 50,7 50,9 49,8 48,7 49,6 50,1 Profil B 51,8 49,6 53,2 51,1 51,1 53,4 50,7 50 51,5 51,7 48,8 1. Aufgabe: Eine Reifenfirma hat für Winterreifen unterschiedliche Profile entwickelt. Bei jeweils gleicher Geschwindigkeit und auch sonst gleichen Bedingungen wurden die Bremswirkungen gemessen. Die gemessenen

Mehr

Statistik II für Betriebswirte Vorlesung 2

Statistik II für Betriebswirte Vorlesung 2 PD Dr. Frank Heyde TU Bergakademie Freiberg Institut für Stochastik Statistik II für Betriebswirte Vorlesung 2 21. Oktober 2014 Verbundene Stichproben Liegen zwei Stichproben vor, deren Werte einander

Mehr

ε heteroskedastisch BINARY CHOICE MODELS Beispiele: Wahlentscheidung Kauf langlebiger Konsumgüter Arbeitslosigkeit Schätzung mit OLS?

ε heteroskedastisch BINARY CHOICE MODELS Beispiele: Wahlentscheidung Kauf langlebiger Konsumgüter Arbeitslosigkeit Schätzung mit OLS? BINARY CHOICE MODELS 1 mit Pr( Y = 1) = P Y = 0 mit Pr( Y = 0) = 1 P Beispiele: Wahlentscheidung Kauf langlebiger Konsumgüter Arbeitslosigkeit Schätzung mit OLS? Y i = X i β + ε i Probleme: Nonsense Predictions

Mehr

Das (multiple) Bestimmtheitsmaß R 2. Beispiel: Ausgaben in Abhängigkeit vom Einkommen (I) Parameterschätzer im einfachen linearen Regressionsmodell

Das (multiple) Bestimmtheitsmaß R 2. Beispiel: Ausgaben in Abhängigkeit vom Einkommen (I) Parameterschätzer im einfachen linearen Regressionsmodell 1 Lineare Regression Parameterschätzung 13 Im einfachen linearen Regressionsmodell sind also neben σ ) insbesondere β 1 und β Parameter, deren Schätzung für die Quantifizierung des linearen Zusammenhangs

Mehr

Weitere Fragestellungen im Zusammenhang mit einer linearen Einfachregression

Weitere Fragestellungen im Zusammenhang mit einer linearen Einfachregression Weitere Fragestellungen im Zusammenhang mit einer linearen Einfachregression Speziell im Zusammenhang mit der Ablehnung der Globalhypothese werden bei einer linearen Einfachregression weitere Fragestellungen

Mehr

Multiple Regression. Ziel: Vorhersage der Werte einer Variable (Kriterium) bei Kenntnis der Werte von zwei oder mehr anderen Variablen (Prädiktoren)

Multiple Regression. Ziel: Vorhersage der Werte einer Variable (Kriterium) bei Kenntnis der Werte von zwei oder mehr anderen Variablen (Prädiktoren) Multiple Regression 1 Was ist multiple lineare Regression? Ziel: Vorhersage der Werte einer Variable (Kriterium) bei Kenntnis der Werte von zwei oder mehr anderen Variablen (Prädiktoren) Annahme: Der Zusammenhang

Mehr

Probeklausur Zeitreihenökonometrie (Sommersemester 2014) 1

Probeklausur Zeitreihenökonometrie (Sommersemester 2014) 1 Probeklausur Zeitreihenökonometrie (Sommersemester 2014) 1 Aufgabe 1: Betrachtet wird folgendes Modell zur Erklärung des Managergehalts salary durch den Umsatz sales, die Eigenkapitalrendite roe und die

Mehr

Güte von Tests. die Wahrscheinlichkeit für den Fehler 2. Art bei der Testentscheidung, nämlich. falsch ist. Darauf haben wir bereits im Kapitel über

Güte von Tests. die Wahrscheinlichkeit für den Fehler 2. Art bei der Testentscheidung, nämlich. falsch ist. Darauf haben wir bereits im Kapitel über Güte von s Grundlegendes zum Konzept der Güte Ableitung der Gütefunktion des Gauss im Einstichprobenproblem Grafische Darstellung der Gütefunktionen des Gauss im Einstichprobenproblem Ableitung der Gütefunktion

Mehr

Annahmen des linearen Modells

Annahmen des linearen Modells Annahmen des linearen Modells Annahmen des linearen Modells zusammengefasst A1: Linearer Zusammenhang: y = 0 + 1x 1 + 2x 2 + + kx k A2: Zufallsstichprobe, keine Korrelation zwischen Beobachtungen A3: Erwartungswert

Mehr

Bachelorabschlussseminar Dipl.-Kfm. Daniel Cracau

Bachelorabschlussseminar Dipl.-Kfm. Daniel Cracau 1 Einführung in die statistische Datenanalyse Bachelorabschlussseminar Dipl.-Kfm. Daniel Cracau 2 Gliederung 1.Grundlagen 2.Nicht-parametrische Tests a. Mann-Whitney-Wilcoxon-U Test b. Wilcoxon-Signed-Rank

Mehr

Übung zur Empirischen Wirtschaftsforschung V. Das Lineare Regressionsmodell

Übung zur Empirischen Wirtschaftsforschung V. Das Lineare Regressionsmodell Universität Ulm 89069 Ulm Germany Dipl.-WiWi Christian Peukert Institut für Wirtschaftspolitik Fakultät für Mathematik und Wirtschaftswissenschaften Ludwig-Erhard-Stiftungsprofessur Sommersemester 2010

Mehr

Statistik Einführung // Lineare Regression 9 p.2/72

Statistik Einführung // Lineare Regression 9 p.2/72 Statistik Einführung Lineare Regression Kapitel 9 Statistik WU Wien Gerhard Derflinger Michael Hauser Jörg Lenneis Josef Ledold Günter Tirler Rosmarie Wakolbinger Statistik Einführung // Lineare Regression

Mehr

Willkommen zur Vorlesung Statistik

Willkommen zur Vorlesung Statistik Willkommen zur Vorlesung Statistik Thema dieser Vorlesung: Varianzanalyse Prof. Dr. Wolfgang Ludwig-Mayerhofer Universität Siegen Philosophische Fakultät, Seminar für Sozialwissenschaften Prof. Dr. Wolfgang

Mehr

Willkommen zur Vorlesung Statistik (Master)

Willkommen zur Vorlesung Statistik (Master) Willkommen zur Vorlesung Statistik (Master) Thema dieser Vorlesung: Verteilungsfreie Verfahren Prof. Dr. Wolfgang Ludwig-Mayerhofer Universität Siegen Philosophische Fakultät, Seminar für Sozialwissenschaften

Mehr

Prüfung im Fach Ökonometrie im WS 2011/12 Aufgabenteil. Name, Vorname. Matrikelnr. Studiengang. E-Mail-Adresse. Unterschrift

Prüfung im Fach Ökonometrie im WS 2011/12 Aufgabenteil. Name, Vorname. Matrikelnr. Studiengang. E-Mail-Adresse. Unterschrift Lehrstuhl für Statistik und empirische Wirtschaftsforschung Prof. Regina T. Riphahn, Ph.D. Prüfung im Fach Ökonometrie im WS 2011/12 Aufgabenteil Name, Vorname Matrikelnr. Studiengang E-Mail-Adresse Unterschrift

Mehr

90-minütige Klausur Statistik für Studierende der Kommunikationswissenschaft

90-minütige Klausur Statistik für Studierende der Kommunikationswissenschaft Prof. Dr. Helmut Küchenhoff SS08 90-minütige Klausur Statistik für Studierende der Kommunikationswissenschaft am 22.7.2008 Anmerkungen Überprüfen Sie bitte sofort, ob Ihre Angabe vollständig ist. Sie sollte

Mehr

Einige Statistische Tests für den Ein- Zwei- und k-stichprobenfall (Nach Sachs, Stat. Meth.)

Einige Statistische Tests für den Ein- Zwei- und k-stichprobenfall (Nach Sachs, Stat. Meth.) ue biostatistik: nichtparametrische testverfahren / ergänzung 1/6 h. Lettner / physik Statistische Testverfahren Einige Statistische Tests für den Ein- Zwei- und k-stichprobenfall (Nach Sachs, Stat. Meth.)

Mehr

Franz Kronthaler. Statistik angewandt. Datenanalyse ist (k)eine Kunst. Excel Edition. ^ Springer Spektrum

Franz Kronthaler. Statistik angewandt. Datenanalyse ist (k)eine Kunst. Excel Edition. ^ Springer Spektrum Franz Kronthaler Statistik angewandt Datenanalyse ist (k)eine Kunst Excel Edition ^ Springer Spektrum Inhaltsverzeichnis Teil I Basiswissen und Werkzeuge, um Statistik anzuwenden 1 Statistik ist Spaß 3

Mehr

Statistik II. IV. Hypothesentests. Martin Huber

Statistik II. IV. Hypothesentests. Martin Huber Statistik II IV. Hypothesentests Martin Huber 1 / 41 Übersicht Struktur eines Hypothesentests Stichprobenverteilung t-test: Einzelner-Parameter-Test F-Test: Multiple lineare Restriktionen 2 / 41 Struktur

Mehr

Überblick über die Verfahren für Ordinaldaten

Überblick über die Verfahren für Ordinaldaten Verfahren zur Analyse ordinalskalierten Daten 1 Überblick über die Verfahren für Ordinaldaten Unterschiede bei unabhängigen Stichproben Test U Test nach Mann & Whitney H Test nach Kruskal & Wallis parametrische

Mehr

Kurs Empirische Wirtschaftsforschung

Kurs Empirische Wirtschaftsforschung Kurs Empirische Wirtschaftsforschung 5. Bivariates Regressionsmodell 1 Martin Halla Institut für Volkswirtschaftslehre Johannes Kepler Universität Linz 1 Lehrbuch: Bauer/Fertig/Schmidt (2009), Empirische

Mehr

Schätzverfahren, Annahmen und ihre Verletzungen, Standardfehler. Oder: was schiefgehen kann, geht schief. Statistik II

Schätzverfahren, Annahmen und ihre Verletzungen, Standardfehler. Oder: was schiefgehen kann, geht schief. Statistik II Schätzverfahren, Annahmen und ihre Verletzungen, Standardfehler. Oder: was schiefgehen kann, geht schief Statistik II Wiederholung Literatur Kategoriale Unabhängige, Interaktion, nicht-lineare Effekte

Mehr

Bachelorprüfung SS 2015

Bachelorprüfung SS 2015 Lehrstuhl für Statistik und empirische Wirtschaftsforschung Prof. Regina T. Riphahn, Ph.D. Fach: Praxis der empirischen Wirtschaftsforschung Prüfer: Prof. Regina T. Riphahn, Ph.D. Bachelorprüfung SS 205

Mehr

Statistik II Übung 4: Skalierung und asymptotische Eigenschaften

Statistik II Übung 4: Skalierung und asymptotische Eigenschaften Statistik II Übung 4: Skalierung und asymptotische Eigenschaften Diese Übung beschäftigt sich mit der Skalierung von Variablen in Regressionsanalysen und mit asymptotischen Eigenschaften von OLS. Verwenden

Mehr

Kapitel 7. Regression und Korrelation. 7.1 Das Regressionsproblem

Kapitel 7. Regression und Korrelation. 7.1 Das Regressionsproblem Kapitel 7 Regression und Korrelation Ein Regressionsproblem behandelt die Verteilung einer Variablen, wenn mindestens eine andere gewisse Werte in nicht zufälliger Art annimmt. Ein Korrelationsproblem

Mehr

Standardab er des. Testwert = 145.5 95% Konfidenzintervall. T df Sig. (2-seitig) Differenz Untere Obere -2.011 698.045-5.82-11.50 -.14.

Standardab er des. Testwert = 145.5 95% Konfidenzintervall. T df Sig. (2-seitig) Differenz Untere Obere -2.011 698.045-5.82-11.50 -.14. Aufgabe : einfacher T-Test Statistik bei einer Stichprobe Standardfehl Standardab er des Mittelwert weichung Mittelwertes 699 39.68 76.59 2.894 Test bei einer Sichprobe Testwert = 45.5 95% Konfidenzintervall

Mehr

Bachelorprüfung. Praxis der empirischen Wirtschaftsforschung Prof. Regina T. Riphahn, Ph.D. Name, Vorname. Matrikelnr. E-Mail. Studiengang.

Bachelorprüfung. Praxis der empirischen Wirtschaftsforschung Prof. Regina T. Riphahn, Ph.D. Name, Vorname. Matrikelnr. E-Mail. Studiengang. Lehrstuhl für Statistik und empirische irtschaftsforschung, SS 2009 ach: Prüfer: Bachelorprüfung Praxis der empirischen irtschaftsforschung Prof. Regina T. Riphahn, Ph.D. Name, Vorname Matrikelnr. E-Mail

Mehr

Skriptum zur Veranstaltung. Quantitative Methoden (Mathematik/Statistik) Teil Induktive Statistik. 1. Version (mehr Draft als Skriptum)

Skriptum zur Veranstaltung. Quantitative Methoden (Mathematik/Statistik) Teil Induktive Statistik. 1. Version (mehr Draft als Skriptum) Skriptum zur Veranstaltung Quantitative Methoden (Mathematik/Statistik) Teil Induktive Statistik 1. Version (mehr Draft als Skriptum) Anmerkungen, Aufzeigen von Tippfehlern und konstruktive Kritik erwünscht!!!

Mehr

9. StatistischeTests. 9.1 Konzeption

9. StatistischeTests. 9.1 Konzeption 9. StatistischeTests 9.1 Konzeption Statistische Tests dienen zur Überprüfung von Hypothesen über einen Parameter der Grundgesamtheit (bei einem Ein-Stichproben-Test) oder über die Verteilung einer Zufallsvariablen

Mehr

Korrelation - Regression. Berghold, IMI

Korrelation - Regression. Berghold, IMI Korrelation - Regression Zusammenhang zwischen Variablen Bivariate Datenanalyse - Zusammenhang zwischen 2 stetigen Variablen Korrelation Einfaches lineares Regressionsmodell 1. Schritt: Erstellung eines

Mehr

Statistik II Wahrscheinlichkeitsrechnung und induktive Statistik Erste Klausur zum Sommersemester 2005 26. Juli 2005

Statistik II Wahrscheinlichkeitsrechnung und induktive Statistik Erste Klausur zum Sommersemester 2005 26. Juli 2005 Statistik II Wahrscheinlichkeitsrechnung und induktive Statistik Erste Klausur zum Sommersemester 2005 26. Juli 2005 Aufgabe 1: Grundzüge der Wahrscheinlichkeitsrechnung 19 P. Als Manager eines großen

Mehr

Inferenz im multiplen Regressionsmodell

Inferenz im multiplen Regressionsmodell 1 / 29 Inferenz im multiplen Regressionsmodell Kapitel 4, Teil 1 Ökonometrie I Michael Hauser 2 / 29 Inhalt Annahme normalverteilter Fehler Stichprobenverteilung des OLS Schätzers t-test und Konfidenzintervall

Mehr

Modul G.1 WS 07/08: Statistik 17.01.2008 1. Die Korrelation ist ein standardisiertes Maß für den linearen Zusammenhangzwischen zwei Variablen.

Modul G.1 WS 07/08: Statistik 17.01.2008 1. Die Korrelation ist ein standardisiertes Maß für den linearen Zusammenhangzwischen zwei Variablen. Modul G.1 WS 07/08: Statistik 17.01.2008 1 Wiederholung Kovarianz und Korrelation Kovarianz = Maß für den linearen Zusammenhang zwischen zwei Variablen x und y Korrelation Die Korrelation ist ein standardisiertes

Mehr

Empirische Wirtschaftsforschung

Empirische Wirtschaftsforschung Empirische Wirtschaftsforschung Prof. Dr. Bernd Süßmuth Universität Leipzig Institut für Empirische Wirtschaftsforschung Volkswirtschaftslehre, insbesondere Ökonometrie 1 3. Momentenschätzung auf Stichprobenbasis

Mehr

Prof. Dr. Walter F. Tichy Dr. Matthias Müller Sommersemester 2006

Prof. Dr. Walter F. Tichy Dr. Matthias Müller Sommersemester 2006 Empirische Softwaretechnik Prof. Dr. Walter F. Tichy Dr. Matthias Müller Sommersemester 2006 1 Experiment zur Vererbungstiefe Softwaretechnik: die Vererbungstiefe ist kein guter Schätzer für den Wartungsaufwand

Mehr

Statistik II Übung 2: Multivariate lineare Regression

Statistik II Übung 2: Multivariate lineare Regression Statistik II Übung 2: Multivariate lineare Regression Diese Übung beschäftigt sich mit dem Zusammenhang zwischen Flugpreisen und der Flugdistanz, dem Passagieraufkommen und der Marktkonzentration. Verwenden

Mehr

Schätzverfahren, Annahmen und ihre Verletzungen, Standardfehler. Oder: was schiefgehen kann, geht schief

Schätzverfahren, Annahmen und ihre Verletzungen, Standardfehler. Oder: was schiefgehen kann, geht schief Schätzverfahren, Annahmen und ihre Verletzungen, Standardfehler. Oder: was schiefgehen kann, geht schief Statistik II Literatur Kategoriale Unabhängige, Interaktion, nicht-lineare Effekte : Schätzung Statistik

Mehr

Regression und Korrelation

Regression und Korrelation Kapitel 7 Regression und Korrelation Ein Regressionsproblem behandeltdie VerteilungeinerVariablen, wenn mindestens eine andere gewisse Werte in nicht zufälliger Art annimmt. Ein Korrelationsproblem dagegen

Mehr

Kapitel 3: Interpretationen

Kapitel 3: Interpretationen Kapitel 3: 1. Interpretation von Outputs allgemein... 1 2. Interpretation von Signifikanzen... 1 2.1. Signifikanztests / Punktschätzer... 1 2.2. Konfidenzintervalle... 2 3. Interpretation von Parametern...

Mehr

Melanie Kaspar, Prof. Dr. B. Grabowski 1

Melanie Kaspar, Prof. Dr. B. Grabowski 1 7. Hypothesentests Ausgangssituation: Man muss sich zwischen 2 Möglichkeiten (=Hypothesen) entscheiden. Diese Entscheidung soll mit Hilfe von Beobachtungen ( Stichprobe ) getroffen werden. Die Hypothesen

Mehr

Klausur Sommersemester 2010

Klausur Sommersemester 2010 Klausur Sommersemester 2010 Lehrstuhl: Wirtschaftspolitik Prüfungsfach: Empirische Wirtschaftsforschung Prüfer: Prof. Dr. K. Kraft Datum: 04.08.2010 Hilfsmittel: Nicht-programmierbarer Taschenrechner Klausurdauer:

Mehr

Das Dialogfeld für die Regressionsanalyse ("Lineare Regression") findet sich im Statistik- Menu unter "Regression"-"Linear":

Das Dialogfeld für die Regressionsanalyse (Lineare Regression) findet sich im Statistik- Menu unter Regression-Linear: Lineare Regression Das Dialogfeld für die Regressionsanalyse ("Lineare Regression") findet sich im Statistik- Menu unter "Regression"-"Linear": Im einfachsten Fall werden mehrere Prädiktoren (oder nur

Mehr

Lineare Regression mit einem Regressor: Einführung

Lineare Regression mit einem Regressor: Einführung Lineare Regression mit einem Regressor: Einführung Quantifizierung des linearen Zusammenhangs von zwei Variablen Beispiel Zusammenhang Klassengröße und Testergebnis o Wie verändern sich Testergebnisse,

Mehr

Eine Einführung in R: Statistische Tests

Eine Einführung in R: Statistische Tests Eine Einführung in R: Statistische Tests Bernd Klaus, Verena Zuber Institut für Medizinische Informatik, Statistik und Epidemiologie (IMISE), Universität Leipzig http://www.uni-leipzig.de/ zuber/teaching/ws12/r-kurs/

Mehr

Klausur zur Vorlesung Multivariate Verfahren, SS 2006 6 Kreditpunkte, 90 min

Klausur zur Vorlesung Multivariate Verfahren, SS 2006 6 Kreditpunkte, 90 min Klausur, Multivariate Verfahren, SS 2006, 6 Kreditpunkte, 90 min 1 Prof. Dr. Fred Böker 08.08.2006 Klausur zur Vorlesung Multivariate Verfahren, SS 2006 6 Kreditpunkte, 90 min Gesamtpunkte: 39 Aufgabe

Mehr

Prüfen von Mittelwertsunterschieden: t-test

Prüfen von Mittelwertsunterschieden: t-test Prüfen von Mittelwertsunterschieden: t-test Sven Garbade Fakultät für Angewandte Psychologie SRH Hochschule Heidelberg sven.garbade@hochschule-heidelberg.de Statistik 1 S. Garbade (SRH Heidelberg) t-test

Mehr

Webergänzung zu Kapitel 10

Webergänzung zu Kapitel 10 Webergänzung zu Kapitel 10 10.1.4 Varianzanalyse (ANOVA: analysis of variance) Im Kapitel 10 haben wir uns hauptsächlich mit Forschungsbeispielen beschäftigt, die nur zwei Ergebnissätze hatten (entweder

Mehr

Multinomiale logistische Regression

Multinomiale logistische Regression Multinomiale logistische Regression Die multinomiale logistische Regression dient zur Schätzung von Gruppenzugehörigkeiten bzw. einer entsprechenden Wahrscheinlichkeit hierfür, wobei als abhänginge Variable

Mehr

Mehrdimensionale Zufallsvariablen

Mehrdimensionale Zufallsvariablen Mehrdimensionale Zufallsvariablen Im Folgenden Beschränkung auf den diskreten Fall und zweidimensionale Zufallsvariablen. Vorstellung: Auswerten eines mehrdimensionalen Merkmals ( ) X Ỹ also z.b. ω Ω,

Mehr

Seminar zur Energiewirtschaft:

Seminar zur Energiewirtschaft: Seminar zur Energiewirtschaft: Ermittlung der Zahlungsbereitschaft für erneuerbare Energien bzw. bessere Umwelt Vladimir Udalov 1 Modelle mit diskreten abhängigen Variablen 2 - Ausgangssituation Eine Dummy-Variable

Mehr

3. Der t-test. Der t-test

3. Der t-test. Der t-test Der t-test 3 3. Der t-test Dieses Kapitel beschäftigt sich mit einem grundlegenden statistischen Verfahren zur Auswertung erhobener Daten: dem t-test. Der t-test untersucht, ob sich zwei empirisch gefundene

Mehr

Einfache lineare Modelle mit Statistik-Software R Beispiel (Ausgaben in Abhängigkeit vom Einkommen)

Einfache lineare Modelle mit Statistik-Software R Beispiel (Ausgaben in Abhängigkeit vom Einkommen) 3 Einfache lineare Regression Einfache lineare Modelle mit R 36 Einfache lineare Modelle mit Statistik-Software R Beispiel (Ausgaben in Abhängigkeit vom Einkommen) > summary(lm(y~x)) Call: lm(formula =

Mehr

WS 2014/15. (d) Bestimmen Sie die Wahrscheinlichkeitsfunktion von X. (e) Bestimmen Sie nun den Erwartungswert und die Varianz von X.

WS 2014/15. (d) Bestimmen Sie die Wahrscheinlichkeitsfunktion von X. (e) Bestimmen Sie nun den Erwartungswert und die Varianz von X. Fragenkatalog zur Übung Methoden der empirischen Sozialforschung WS 2014/15 Hier finden Sie die denkbaren Fragen zum ersten Teil der Übung. Das bedeutet, dass Sie zu diesem Teil keine anderen Fragen im

Mehr

Abschlussklausur (60 Minuten), 15. Juli 2014

Abschlussklausur (60 Minuten), 15. Juli 2014 Prof. Dr. Amelie Wuppermann Volkswirtschaftliche Fakultät Universität München Sommersemester 2014 Empirische Ökonomie 1 Abschlussklausur (60 Minuten), 15. Juli 2014 Bearbeitungshinweise Die Bearbeitungszeit

Mehr

Analytische Statistik I. Statistische Methoden in der Korpuslinguistik Heike Zinsmeister WS 2009/10

Analytische Statistik I. Statistische Methoden in der Korpuslinguistik Heike Zinsmeister WS 2009/10 Analytische Statistik I Statistische Methoden in der Korpuslinguistik Heike Zinsmeister WS 2009/10 Testen Anpassungstests (goodness of fit) Weicht eine gegebene Verteilung signifikant von einer bekannten

Mehr

Multivariate Verfahren

Multivariate Verfahren Selbstkontrollarbeit 1 Multivariate Verfahren Musterlösung Aufgabe 1 (40 Punkte) Auf der dem Kurs beigelegten CD finden Sie im Unterverzeichnis Daten/Excel/ die Datei zahlen.xlsx. Alternativ können Sie

Mehr

Kommentierter SPSS-Ausdruck zur logistischen Regression

Kommentierter SPSS-Ausdruck zur logistischen Regression Daten: POK V AG 3 (POKV_AG3_V07.SAV) Kommentierter SPSS-Ausdruck zur logistischen Regression Fragestellung: Welchen Einfluss hat die Fachnähe und das Geschlecht auf die interpersonale Attraktion einer

Mehr

Übung V Lineares Regressionsmodell

Übung V Lineares Regressionsmodell Universität Ulm 89069 Ulm Germany Dipl.-WiWi Michael Alpert Institut für Wirtschaftspolitik Fakultät für Mathematik und Wirtschaftswissenschaften Ludwig-Erhard-Stiftungsprofessur Sommersemester 2007 Übung

Mehr

Kaplan-Meier-Schätzer

Kaplan-Meier-Schätzer Kaplan-Meier-Schätzer Ausgangssituation Zwei naive Ansätze zur Schätzung der Survivalfunktion Unverzerrte Schätzung der Survivalfunktion Der Kaplan-Meier-Schätzer Standardfehler und Konfidenzintervall

Mehr

Korrelation (II) Korrelation und Kausalität

Korrelation (II) Korrelation und Kausalität Korrelation (II) Korrelation und Kausalität Situation: Seien X, Y zwei metrisch skalierte Merkmale mit Ausprägungen (x 1, x 2,..., x n ) bzw. (y 1, y 2,..., y n ). D.h. für jede i = 1, 2,..., n bezeichnen

Mehr

Biostatistik, WS 2015/2016 Der zwei-stichproben-t-test

Biostatistik, WS 2015/2016 Der zwei-stichproben-t-test 1/29 Biostatistik, WS 2015/2016 Der zwei-stichproben-t-test (t-test für ungepaarte Stichproben) Matthias Birkner http://www.staff.uni-mainz.de/birkner/biostatistik1516/ 11.12.2015 2/29 Inhalt 1 t-test

Mehr

Statistik II Übung 2: Multivariate lineare Regression

Statistik II Übung 2: Multivariate lineare Regression Statistik II Übung 2: Multivariate lineare Regression Diese Übung beschäftigt sich mit dem Zusammenhang zwischen Flugpreisen und der Flugdistanz, dem Passagieraufkommen und der Marktkonzentration. Verwenden

Mehr

Klausur zu Methoden der Statistik I (mit Kurzlösung) Wintersemester 2007/2008. Aufgabe 1

Klausur zu Methoden der Statistik I (mit Kurzlösung) Wintersemester 2007/2008. Aufgabe 1 Lehrstuhl für Statistik und Ökonometrie der Otto-Friedrich-Universität Bamberg Prof. Dr. Susanne Rässler Klausur zu Methoden der Statistik I (mit Kurzlösung) Wintersemester 2007/2008 Aufgabe 1 Ihnen liegt

Mehr

Studiendesign/ Evaluierungsdesign

Studiendesign/ Evaluierungsdesign Jennifer Ziegert Studiendesign/ Evaluierungsdesign Praxisprojekt: Nutzerorientierte Evaluierung von Visualisierungen in Daffodil mittels Eyetracker Warum Studien /Evaluierungsdesign Das Design einer Untersuchung

Mehr

Einführung in die Geostatistik (7) Fred Hattermann (Vorlesung), hattermann@pik-potsdam.de Michael Roers (Übung), roers@pik-potsdam.

Einführung in die Geostatistik (7) Fred Hattermann (Vorlesung), hattermann@pik-potsdam.de Michael Roers (Übung), roers@pik-potsdam. Einführung in die Geostatistik (7) Fred Hattermann (Vorlesung), hattermann@pik-potsdam.de Michael Roers (Übung), roers@pik-potsdam.de 1 Gliederung 7 Weitere Krigingverfahren 7.1 Simple-Kriging 7.2 Indikator-Kriging

Mehr

Statistik II für Betriebswirte Vorlesung 3

Statistik II für Betriebswirte Vorlesung 3 PD Dr. Frank Heyde TU Bergakademie Freiberg Institut für Stochastik Statistik II für Betriebswirte Vorlesung 3 5. November 2013 Beispiel: Aktiensplit (Aczel & Sounderpandan, Aufg. 14-28) Ein Börsenanalyst

Mehr

Kategoriale abhängige Variablen: Logit- und Probit -Modelle. Statistik II

Kategoriale abhängige Variablen: Logit- und Probit -Modelle. Statistik II Kategoriale abhängige Variablen: Logit- und Probit -Modelle Statistik II Wiederholung Literatur Annahmen und Annahmeverletzungen Funktionen Exponenten, Wurzeln usw. Das Problem Das binäre Logit-Modell

Mehr

Modell (Konstante) 0,411 0,155 male 0,212 0,13 job 0,119 0,131 alcohol 0,255 0,05 a. Abhängige Variable: skipped

Modell (Konstante) 0,411 0,155 male 0,212 0,13 job 0,119 0,131 alcohol 0,255 0,05 a. Abhängige Variable: skipped Aufgabe 1 [14 Punkte] Sie möchten untersuchen, wovon die Abwesenheit der Studierenden in den Vorlesungen an einer Universität abhängt. Sie verfügen über einen Datensatz zu 282 Studierenden mit folgenden

Mehr

In konstanten Modellen wird davon ausgegangen, dass die zu prognostizierende Größe sich über die Zeit hinweg nicht verändert.

In konstanten Modellen wird davon ausgegangen, dass die zu prognostizierende Größe sich über die Zeit hinweg nicht verändert. Konstante Modelle: In konstanten Modellen wird davon ausgegangen, dass die zu prognostizierende Größe sich über die Zeit hinweg nicht verändert. Der prognostizierte Wert für die Periode T+i entspricht

Mehr

Schätzen und Testen von Populationsparametern im linearen Regressionsmodell PE ΣO

Schätzen und Testen von Populationsparametern im linearen Regressionsmodell PE ΣO Schätzen und Testen von Populationsparametern im linearen Regressionsmodell PE ΣO 4. Dezember 2001 Generalisierung der aus Stichprobendaten berechneten Regressionsgeraden Voraussetzungen für die Generalisierung

Mehr

Angewandte Ökonometrie, WS 2012/13, 1. Teilprüfung am 6.12.2012 - Lösungen. Das folgende Modell ist ein GARCH(1,1)-Modell:

Angewandte Ökonometrie, WS 2012/13, 1. Teilprüfung am 6.12.2012 - Lösungen. Das folgende Modell ist ein GARCH(1,1)-Modell: Angewandte Ökonometrie, WS 2012/13, 1. Teilprüfung am 6.12.2012 - Lösungen LV-Leiterin: Univ.Prof.Dr. Sylvia Frühwirth-Schnatter 1 Wahr oder falsch? 1. Das folgende Modell ist ein GARCH(1,1)-Modell: Y

Mehr

Universität Bonn 28. Juli 2010 Fachbereich Rechts- und Wirtschaftswissenschaften Statistische Abteilung Prof. Dr. A. Kneip. KLAUSUR Statistik B

Universität Bonn 28. Juli 2010 Fachbereich Rechts- und Wirtschaftswissenschaften Statistische Abteilung Prof. Dr. A. Kneip. KLAUSUR Statistik B Universität Bonn 28. Juli 2010 Fachbereich Rechts- und Wirtschaftswissenschaften Statistische Abteilung Prof. Dr. A. Kneip Sommersemester 2010 KLAUSUR Statistik B Hinweise zur Bearbeitung: Bei allen Teilaufgaben

Mehr

29. Mai 2006. 5. Bei Unterschleif gilt die Klausur als nicht bestanden und es erfolgt eine Meldung an das Prüfungsamt.

29. Mai 2006. 5. Bei Unterschleif gilt die Klausur als nicht bestanden und es erfolgt eine Meldung an das Prüfungsamt. L. Fahrmeir, C. Belitz Department für Statistik Bitte für die Korrektur freilassen! Aufgabe 1 2 3 4 Punkte Klausur zur Vorlesung Statistik III für Studenten mit Wahlfach Statistik 29. Mai 2006 Hinweise:

Mehr

Aufgabenstellung Aufgabe 1: Betrachten Sie das folgende ökonometrische Modell: y t = α + βx t + u t (1)

Aufgabenstellung Aufgabe 1: Betrachten Sie das folgende ökonometrische Modell: y t = α + βx t + u t (1) Klausur: Einführung in die Ökonometrie Prüfer: Prof. Dr. Karl-Heinz Paqué Dr.Ludwigv.Auer Semester: WS 1999/00 Als Hilfsmittel sind zugelassen: nicht-programmierbarer Taschenrechner Diese Klausur besteht

Mehr

DIPLOMVORPRÜFUNG GRUNDZÜGE DER STATISTIK, TEIL B WINTERSEMESTER 2006/07 28.02.2007

DIPLOMVORPRÜFUNG GRUNDZÜGE DER STATISTIK, TEIL B WINTERSEMESTER 2006/07 28.02.2007 Wirtschaftswissenschaftliches Prüfungsamt DIPLOMVORPRÜFUNG GRUNDZÜGE DER STATISTIK, TEIL B WINTERSEMESTER 006/07 8.0.007 Lösung Prof. Dr. R Friedmann / Dr. R. Hauser Hinweise für die Klausurteilnehmer

Mehr

Grundlagen der Inferenzstatistik

Grundlagen der Inferenzstatistik Grundlagen der Inferenzstatistik (Induktive Statistik oder schließende Statistik) Dr. Winfried Zinn 1 Deskriptive Statistik versus Inferenzstatistik Die Deskriptive Statistik stellt Kenngrößen zur Verfügung,

Mehr

1 Beispiel zur Methode der kleinsten Quadrate

1 Beispiel zur Methode der kleinsten Quadrate 1 Beispiel zur Methode der kleinsten Quadrate 1.1 Daten des Beispiels t x y x*y x 2 ŷ ˆɛ ˆɛ 2 1 1 3 3 1 2 1 1 2 2 3 6 4 3.5-0.5 0.25 3 3 4 12 9 5-1 1 4 4 6 24 16 6.5-0.5 0.25 5 5 9 45 25 8 1 1 Σ 15 25

Mehr

1.3 Die Beurteilung von Testleistungen

1.3 Die Beurteilung von Testleistungen 1.3 Die Beurteilung von Testleistungen Um das Testergebnis einer Vp zu interpretieren und daraus diagnostische Urteile ableiten zu können, benötigen wir einen Vergleichsmaßstab. Im Falle des klassischen

Mehr

Regression mit Gretl Eine erste Einführung 1

Regression mit Gretl Eine erste Einführung 1 Kurzeinführung in Gretl S. 1 Regression mit Gretl Eine erste Einführung 1 Installation: Gretl für das entsprechende Betriebssystem herunterladen und die Setup-Datei ausführen. Hinweis: Für die Benutzung

Mehr

Trim Size: 176mm x 240mm Lipow ftoc.tex V1 - March 9, :34 P.M. Page 11. Über die Übersetzerin 9. Einleitung 19

Trim Size: 176mm x 240mm Lipow ftoc.tex V1 - March 9, :34 P.M. Page 11. Über die Übersetzerin 9. Einleitung 19 Trim Size: 176mm x 240mm Lipow ftoc.tex V1 - March 9, 2016 6:34 P.M. Page 11 Inhaltsverzeichnis Über die Übersetzerin 9 Einleitung 19 Was Sie hier finden werden 19 Wie dieses Arbeitsbuch aufgebaut ist

Mehr

Ein möglicher Unterrichtsgang

Ein möglicher Unterrichtsgang Ein möglicher Unterrichtsgang. Wiederholung: Bernoulli Experiment und Binomialverteilung Da der sichere Umgang mit der Binomialverteilung, auch der Umgang mit dem GTR und den Diagrammen, eine notwendige

Mehr

Einfache Varianzanalyse für abhängige

Einfache Varianzanalyse für abhängige Einfache Varianzanalyse für abhängige Stichproben Wie beim t-test gibt es auch bei der VA eine Alternative für abhängige Stichproben. Anmerkung: Was man unter abhängigen Stichproben versteht und wie diese

Mehr

Statistische Auswertung der Daten von Blatt 13

Statistische Auswertung der Daten von Blatt 13 Statistische Auswertung der Daten von Blatt 13 Problemstellung 1 Graphische Darstellung der Daten 1 Diskussion der Normalverteilung 3 Mittelwerte und deren Konfidenzbereiche 3 Signifikanz der Behandlung

Mehr

Wichtige Definitionen und Aussagen

Wichtige Definitionen und Aussagen Wichtige Definitionen und Aussagen Zufallsexperiment, Ergebnis, Ereignis: Unter einem Zufallsexperiment verstehen wir einen Vorgang, dessen Ausgänge sich nicht vorhersagen lassen Die möglichen Ausgänge

Mehr