1 Statistische Grundlagen

Größe: px
Ab Seite anzeigen:

Download "1 Statistische Grundlagen"

Transkript

1 Konzepte in Empirische Ökonomie 1 (Winter) Hier findest Du ein paar Tipps zu den Konzepten in Empirische 1. Wenn Du aber noch etwas Unterstützung kurz vor der Klausur brauchst, schreib uns eine kurze . Wir sind ehemalige Übungsleiter in Mathematik und Statistik, die auch alle Empirische 1 hören mussten und dir kompetente und klausurorientierte Hilfe anbieten können - zu einem fairen Preis. Frag einfach an! 1 Statistische Grundlagen ˆ Zufallsvariablen: Eine Größe, die eine Verteilung besitzt, aus der Realisationen gezogen werden. ˆ Schätzer: Ein Schätzer ist eine Funktion der Daten. Wichtige Schätzer sind das arithmetische Mittel für den Erwartungswert µ der Normalverteilung oder der Koeffizientenschätzer in einer Regression ˆβ. Schätzer sind Zufallsvariablen. ˆ Geschätzter Wert: Das Resultat eines Schätzers, wenn er auf die beobachteten Daten angewendet wird. Der geschätzte Wert ist keine Zufallsvariable, sondern fest. Man wird aber nur durch Zufall den wahren Parameter richtig schätzen. ˆ Unverzerrter Schätzer: Ein Schätzer ˆθ ist unverzerrt, wenn der Erwartungswert des Schätzers ˆθ dem zu schätzenden Parameter θ entspricht. Formal bedeutet das: E(ˆθ) = θ. Im Mittel erhält man also den wahren Wert, wenn man den Schätzer immer wieder auf neue Stichproben anwendet. ˆ Bias: Verzerrung eines Schätzers, also E(ˆθ) θ. Ist der Bias gleich Null, heißt der Schätzer unverzerrt. ˆ Konsistenz: Ein Schätzer ist genau dann konsistent, wenn sich der Schätzer beliebig genau dem wahren Parameter annähert, wenn der Stichprobenumfang n wächst. 1

2 Nicht jeder unverzerrte Schätzer ist konsistent (dazu muss die Varianz des Schätzers für n noch gegen Null gehen). Nicht jeder konsistente Schätzer ist unverzerrt ˆ Effizienz und relative Effizienz: Da Schätzer Zufallsvariablen sind, besitzen sie Erwartungswert und Varianz. Ein unverzerrter Schätzer ist relativ effizient, wenn er eine geringere Varianz besitzt als ein anderer unverzerrter Schätzer. ˆ BLUE: Best linear unbiased estimator. Der lineare unverzerrte Schätzer für einen Parameter mit der kleinsten Varianz unter allen linearen unverzerrten Schätzern für diesen Parameter. Linear bedeutet, dass die Daten linear in die Schätzfunktion eingehen, z.b. 1/n n i=1 x i für das arithmetische Mittel. ˆ t-test allgemein: Der t-test soll eine Aussage darüber treffen, wie wahrscheinlich es ist, dass ein bestimmter geschätzter Wert für einen Parameter θ beobachtet wird, wenn man davon ausgeht, dass das wahre θ den unterstellten Wert H 0 : θ = θ H0 annimmt. Dazu wird die t-statistik t = geschätzter Wert unterstellter Wert Standardfehler des Schätzers berechnet. Je höher der Betrag der t-statistik, desto unwahrscheinlicher ist es, dass der geschätzte Wert zufällig so extrem im Vergleich zum unterstellten wahren Wert in der Nullhypothese ist. Auf deutsch: H 0 wird abgelehnt, wenn der Betrag des t-werts über dem kritischen Wert ist (1.64 für 10%-Niveau, 1.96 für 5%-Niveau und 2.58 für 1%-Niveau). Wenn der kritische Wert kleiner als die jeweilige Grenze ist, wird H 0 nicht verworfen. Wird H 0 verworfen, geht man davon aus, dass der wahre Parameter nicht dem Wert in H 0 entspricht. Bei einer Regression geht man bei Ablehnen des Tests, ob der Koeffizient gleich Null ist, davon aus, dass ein signifikanter Zusammenhang zwischen der jeweiligen Einflussgröße X und der Zielgröße Y besteht. ˆ p-wert: Die Wahrscheinlichkeit für gegebene Daten, dass ein auf Basis der Stichprobe geschätzter Wert beobachtet wird, wenn der wahre Parameter den Wert wie in der Nullhypothese H 0 annimmt. Ein niedriger p-wert spricht gegen die Hypothese H 0. ˆ Signifikanzniveau: Höchste zulässige Wahrscheinlichkeit dafür, dass H 0 abgelehnt wird, obwohl H 0 richtig ist. Einfacher zu merken: Obere Grenze für den p-wert, bei dem H 0 abgelehnt wird. ˆ Konfidenzintervall: Ein Konfidenzintervall deckt genau die möglichen Werte eines Schätzers ab, bei denen ein t-test für ein festes Signifikanzniveau nicht ablehnen würde. 2

3 ˆ Verständnistipps: Im Beispiel hier gehen wir jetzt davon aus, dass das Signifikanzniveau auf 5% festgelegt wurde (das passiert meist aus einer Konvention heraus, manche Wissenschaftsgebiete akzeptieren 5%, für andere Gebiete wäre das nicht überzeugend) und man möchte die Signifikanz einer Einflussgröße in der Regression testen, also ob das wahre β = 0. Als Hypothese H 0 : β = 0. Es besteht eine sogenannte Dualität zwischen t-test und Konfidenzintervall. Drei Beispiele: Der Betrag der t-statistik ist größer als 1,96. Dann weiß man, dass der p- Wert kleiner ist als 0.05 und dass das zugehörige Konfidenzintervall die 0 nicht überdeckt. Das Konfidenzintervall überdeckt die Null. Dann weiß man, dass der p-wert größer ist als 0.05 und dass der t-wert kleiner ist als Der p-wert ist kleiner als Dann weiß man, dass der t-wert größer ist als 1.96 und das Konfidenzintervall die Null nicht überdeckt. 2 Regression ˆ Schätzung der Parameter: Die Parameter werden geschätzt, indem die Summe der quadrierten Abweichungen der Datenpunkte von der Regressionsgeraden minimiert werden. ˆ Koeffizientenschätzer: ˆβ k = s X k Y s 2 X k Der Koeffizientenschätzer wird berechnet, indem die Stichprobenkovarianz zwischen der Einflussgröße X und der Zielgröße Y durch die Stichprobenvarianz der Einflussgröße X geteilt wird. Möchte man die Kovarianz zwischen der Einflussgröße und der Zielgröße berechnen, löst man die Gleichung einfach danach auf! Der Schätzer für den Achsenabschnitt wird über ˆβ 0 = Y ˆβ 1 X 1... ˆβ k X k berechnet, wobei der Überstrich bedeutet, dass es sich um das arithmetische Mittel der jeweiligen Größe handelt. ˆ Varianz des Koeffizientenschätzers: ˆβ streut weniger, je größer der Stichprobenumfang n ist und je größer die Varianz der Einflussgröße X ist. ˆ Prognostizierter Wert für Y : Setze die Werte in die geschätzte Regressionsgleichung ein und erhalte so die Prognose für Y. ˆ Residuum: Das Residuum ist die Differenz zwischen wahrem Wert und durch die Regression vorhergesagtem Wert. In einer Grafik ist das der senkrechte Abstand des Datenpunkts zur geschätzten Regressionsgerade. 3

4 ˆ Hetero- und Homoskedastie: Daten sind homoskedastisch, wenn die Varianz nicht davon abhängt, welchen Bereich der Daten man betrachtet. Daten sind heteroskedastisch, wenn man für verschiedene Bereiche der Daten eine andere Varianz schätzen müsste. Liegt Heteroskedastie vor, kann man die Standardfehler von ˆβ nicht mehr konsistent schätzen und muss robuste Standardfehler verwenden. ˆ Annahme M1: E(u i X 1i,..., X ki ) = 0. Bei einer Regression wird der bedingte Erwartungswert von Y bei gegebenen Kovariablen modelliert. Annahme M1 besagt, dass alle relevanten Charakteristika der Daten für den bedingten Erwartungswert von Y auch in der Regression berücksichtigt wurden. ˆ Annahme M2: Die Beobachtungen der Einfluss- und der Zielvariablen stammen aus einer Zufallsstichprobe und sind deswegen identisch und vor allem unabhängig verteilt. ˆ Annahme M3: Es liegen keine Ausreißer vor. ˆ Annahme M4: Es liegt keine perfekte Multikollinearität vor. Perfekte Multikollinearität liegt vor, wenn die Korrelation zwischen zwei Einflussgrößen exakt gleich 1 ist. Liegt perfekte Multikollinearität vor, können die Koeffizientenschätzwerte nicht mehr eindeutig bestimmt werden. Viele Programme brechen die Schätzung bei perfekter Multikollinearität ab. Das liegt meist daran, dass die Einflussgrößen schlecht gewählt sind (z.b. die Aufnahme von Körpergröße in cm und Körpergröße in m in die Regression). Imperfekte Multikollinearität schließt eine Schätzung nicht aus, hohe Standardfehler sind aber möglich! (Instabile Schätzer) ˆ Wenn M1 bis M4 gilt: Die OLS-Schätzer sind unverzerrt, konsistent und asymptotisch normalverteilt. ˆ M1 bis M4 gelten und Daten homoskedastisch: Gauss-Markov Theorem gilt. OLS-Schätzer ist BLUE. Ist Y bzw. der Fehler auch noch normalverteilt, hat der OLS-Schätzer die kleinste asymptotische Varianz unter allen linearen und nicht-linearen Schätzern. ˆ Kleine Stichproben: Für approximative Normalverteilung der Schätzer und für die Verteilung der t-statistik entsprechend der t-verteilung mit n 2 Freiheitsgraden müssen die Daten homoskedastisch und Y normalverteilt sein. Die Normalverteilung muss nicht für die Einflussgrößen gelten. ˆ Bestimmtheitsmaß und korrigiertes Bestimmtheitsmaß: Das Bestimmtheitsmaß R 2 ist gibt den Anteil der erklärten Varianz der Gesamtvarianz an. Es nimmt Werte zwischen 0 und 1 und kann auch 1 werden. Das R 2 kann dadurch künstlich erhöht werden, indem man viele Regressionskoeffizienten aufnimmt. Das verhindert das korrigierte R 2, das von den Einflussgrößen fordert, dass deren Aufnahme einen Beitrag zum Erklärungsgehalt liefert. Es berücksichtigt die Anzahl bereits aufgenommener Regressionen und kann auch sinken, wenn die zusätzlich aufgenommene Variable nicht genügend Erklärungsgehalt aufweist. 4

5 ˆ Standardfehler der Regression: Durchschnittliche Größe des Residuums, berücksichtigt verlorene Freiheitsgrade durch zu schätzende Residuen, der Root Mean Squared Error nicht. ˆ Interpretation der geschätzten Koeffizienten: Interpretation als marginaler Effekt (erste partielle Ableitung der Regressionsgerade nach interessierender Einflussgröße). Steigt X k um eine Einheit, steigt Y im Mittel um β k Einheiten, wenn alle übrigen Variablen konstant gehalten werden. Angabe der Signifikanz über p-wert indem p-wert und Signifikanzniveau angegeben werden, oder: Angabe der Signifikanz über t-wert, indem berechneter t-wert mit entsprechendem t-quantil verglichen wird (bei 5%-Signifikanzniveau: 1.96), oder: Falls t-wert nicht gegeben: Berechnung, indem der geschätzte Wert für β durch dessen Standardfehler berechnet wird (t-test, wenn unterstellter wahrer Parameter Null sein soll). ˆ Warum F-Test bei verbundenen Hypothesen? Zu testen wäre H 0 : β 1 = β 1,H0 und β 2 = β 2,H0. Geschätzte Parameter sind nicht statistisch unabhängig voneinander und damit sind die t-statistiken ebenfalls nicht unabhängig. In die F-Statistik geht die Varianz-Kovarianz der geschätzten Koeffizienten ein, wodurch die Korrelation zwischen den Koeffizienten berücksichtigt wird. Die Statistik ist F q, -verteilt. ˆ Restriktionen q des F-Tests: Salopp: Anzahl der Gleichheitszeichen in H 0. ˆ Unkorrelierte t-statistiken bei zwei Koeffizienten: F = 0.5(t t 2 2). ˆ R-Matrix beim F-Test: Matrix mit q-zeilen bezogen auf die zu testenden Hypothesen und (k + 1)-Spalten für die Anzahl der Koeffizienten (k + 1 für Achsenabschnitt und Steigungsparameter). 3 Ausgelassene Variablen Betrachte das wahre Modell Y i = β 0 + β 1 X i + β 2 Z i + u i. X ist die Größe, an deren Einfluss wir interessiert sind und deswegen β 1 unverzerrt und konsistent schätzen wollen. Nehmen wir an, dass wir Z nicht beobachten können. Wann ist der Schätzer für β 1 verzerrt? Dafür müssen beide folgenden Bedingungen gelten: ˆ X und Z müssen korreliert sein, also corr(x, Z) 0 und ˆ Z muss einen Einfluss auf Y besitzen. 5

6 Nur dann ist β 1 verzerrt und M1 verletzt. Lösung: Versuche die Variable Z in die Regression aufzunehmen. Ist sie beobachtbar und im Datensatz vorhanden, dann kann man sie in die Regression aufnehmen, eventuell muss man sie allerdings nichtlinear transformieren. ˆ Lineares Modell: Die X dürfen beliebig verändert werden, nur die Koeffizienten dürfen höchstens mit einer Konstanten multipliziert werden. Die Koeffizienten müssen linear bleiben (logarithmieren oder die Anwendung der e-funktion auf den Koeffizienten sind nichtlineare Transformationen). ˆ Richtung der Verzerrung In der Regression y = β 0 + β 1 X steht Z im Zusammenhang mit Y und ist mit X korreliert. In welche Richtung ist β 1 verzerrt? corr(x, Z) Zusammenhang mit Y Verzerrung in welche Richtung? + + E( ˆβ 1 ) > β 1 (Überschätzung) - + E( ˆβ 1 ) < β 1 (Unterschätzung) + - E( ˆβ 1 ) < β 1 (Unterschätzung) - - E( ˆβ 1 ) > β 1 (Überschätzung) ˆ Nichtlineare Regressoren: Modelliert wird bspw. Y i = β 0 + β 1 X i + β 2 X 2 i Marginaler Effekt hängt vom Wert von X ab, da Y i X = β 1 + 2β 2 X i ˆ Interpretation lin-log: Y linear, X im Logarithmus. Steigt X um 1% führt das im Mittel zu einer Erhöhung von Y um β/100. ˆ Interpretation log-lin: Y im Logarithmus, X linear. Steigt X um eine Einheit, ändert sich Y im Mittel um 100β%. ˆ Interpretation log-log: Steigt X um 1%, ändert sich Y im Mittel um β%. β kann als Elastizität von Y bezüglich X interpretiert werden. ˆ Interaktionen: Siehe Folie 270. Y i = β 0 + β 1 D 1i + β 2 D 2i + β 3 (D 1i D 2i ) wobei D1 und D2 jeweils Dummy-Variablen sind. Vier Fälle: E(Y D 1 = 0, D 2 = 0) = β 0 + β β β 3 (0 0) = β 0 E(Y D 1 = 1, D 2 = 0) = β 0 + β β β 3 (1 0) = β 0 + β 1 E(Y D 1 = 1, D 2 = 1) = β 0 + β 1 + β 2 + β 3 Wichtig ist, dass β 3 nur dann in den bedingten Erwartungswert eingehen, wenn beide Dummies den Wert 1 annehmen Vergleiche Folien !!. 6

7 4 (Natürliche) Experimente und Differenzenschätzer ˆ Average Treatment Effect: Differenz des Durchschnittswerts in Treatmentgruppe und des Durchschnittswerts der Kontrollgruppe. Modelliert durch Regression mit Dummy D, die den Wert 1 annimmt, wenn das Individuum in der Treatmentgruppe war: Y i = β 0 + β 1 X i β 1 kann dann als ATE interpretiert werden. ˆ Potenzielle Probleme bei der Durchführung von Zufallsexperimenten: Verletung des Versuchsprotokolls bzw. Fehlschlagen der Zufallsauswahl (z.b. Selbstselektion) Abbrecher (Gründe für Abbrechen entscheidend!) Experimentelle Effekte: Teilnehmer können ihr natürliches Verhalten verändern, weil sie wissen, dass sie an einem Experiment teilnehmen (Hawthorne-Effekt). Doppelblind-Studien als Ideal. Zu kleine Stichproben, sodass Erwartungstreue und Konsistenz des OLS- Schätzers argumentativ schwer durchsetzbar sind. Hohe Standardfehler der Schätzer können auch ein Problem sein. Übertragbarkeit der Ergebnisse (externe Validität). Ist das Experiment repräsentativ? ˆ Einfacher und doppelter Differenzenschätzer intuitiv: In natürlichen Experimenten ohne zeitliche Änderung entspricht der einfache Differenzenschätzer dem ATE. In Experimenten mit zeitlicher Änderung ist entscheidend, ob Niveauunterschiede zwischen den beiden Gruppen vor dem Experiment vorgelegen haben. Liegen Niveauunterschiede vor, ist der doppelte Differenzenschätzer vorzuziehen, da dieser die Niveauunterschiede herausrechnet, indem die Veränderung in diesen Gruppen verglichen werden. ˆ Einfacher und doppelter Differenzenschätzer in Regressionen: Regression mit dem einfachen Differenzenschätzer: Siehe Average Treatment Effect. Es können auch Kovariablen aufgenommen werden. Regression beim doppelten Differenzenschätzer: Y = β 0 + β 1 D 1 + β 2 D 2 + β 3 (D 1 D 2 ), Wobei D 1 den Wert 1 annimmt, wenn die Person der Treatmentgruppe angehört und D 2 ist 1, wenn sich die Beobachtung nach dem Experiment gemacht wurde. Effekt ist dann am Koeffizienten des Interaktionsterms des Zeit- und Treatment- Dummies abzulesen, hier β 3. ˆ Tipps: Grafik auf Folie 314! Der einfache Differenzenschätzer ist hier die Differenz zwischen dem Mittelwert in treatment-after und dem Mittelwert von controlafter. 7

8 5 Logit und Probit ˆ Warum kein lineares Modell?: Modelliert werden soll die bedingte Wahrscheinlichkeit, dass Y = 1 bei gegebenen Kovariablen. Wahrscheinlichkeiten nehmen aber nur Werte zwischen 0 und 1 an, ein lineares Modell ist aber nicht beschränkt. Besonders problematisch ist aber, dass immer Heteroskedastie vorliegen würde und so die korrekte Berechnung von Standardfehlern nicht möglich ist (und damit Schlüsse auf die Grundgesamtheit über t- oder p-wert problematisch wäre). ˆ Marginaler Effekte im Probit: Modelliert wird P r(y = 1 X 1,..., X k ) = Φ(β 0 + β 1 X β k X k ), wobei Φ( ) die Verteilungsfunktion der Standardnormalverteilung ist (dafür gibt es keine Formel, die Verteilungsfunktion der Normalverteilung ist analytisch nicht vorhanden). Marginaler Effekt: P r(y = 1 X 1,..., X k ) X 1 = φ(β 0 + β 1 X β k X k ) β 1, wobei φ( ) die Dichte der Standardnormalverteilung ist. Der marginale Effekt ist über die Kettenregel zu berechnen und abhängig von allen Koeffizienten. Die Richtung des Effekts wird durch das Vorzeichen des Koeffizienten der interessierenden Einflussgröße berechnet. ˆ Interpretation des marginalen Effekts im Probit: Interpretiert wird nur die Richtung des Effekts. Ist ˆβ positiv, hat X im Mittel einen positiven Effekt auf Y und einen negativen, wenn ˆβ negativ ist. Signifikanz wird hier über den Gauss-Test abgelesen (z-wert), die kritischen Werte sind die gleichen wie beim t-test, jedenfalls für große Stichproben. ˆ Marginaler Effekte im Logit: Modelliert wird P r(y = 1 X 1,..., X k ) = F (β 0 + β 1 X β k X k ), wobei F ( ) die Verteilungsfunktion der logistischen Verteilung ist. Marginaler Effekt: P r(y = 1 X 1,..., X k ) = f(β 0 + β 1 X β k X k ) β 1, X 1 wobei f( ) die Dichte der logistischen Verteilung ist. Der marginale Effekt ist über die Kettenregel zu berechnen und abhängig von allen Koeffizienten. Die Richtung des Effekts wird durch das Vorzeichen des Koeffizienten der interessierenden Einflussgröße berechnet. ˆ Interpretation des marginalen Effekts im Logit: Interpretiert wird nur die Richtung des Effekts. Ist ˆβ positiv, hat X im Mittel einen positiven Effekt auf Y und einen negativen, wenn ˆβ negativ ist. ˆ Was bedeutet Steigung im Gretl-Output? Marginaler Effekt des jeweiligen Koeffizienten, wenn für alle Einflussgrößen der Mittelwert eingesetzt wird. 8

9 6 Zeitreihen ˆ Autokorrelation: Korrelation von zeitlich benachbarten Werten der gleichen Größe. ρ j = corr(y t, Y t j ). ˆ Persistenz: Hohe Autokorrelation über mehrere Perioden. Persistente Zeitreihen eignen sich besonders, um vergangene Werte zur kurzfristigen Prognose zukünftiger Werte zu verwenden. ˆ AR(p)-Prozess: Lineares Modell mit vergangenen Werten von Y als Kovariablen. Schätzung funktioniert auch über OLS. Parameterschätzung sind bei korrekter Spezifikation durchaus konsistent! Für Prognosen kann das (korrigierte) R 2 verwendet werden, genauso kann ein t-test für einzeln signifikante Koeffizienten und der F-Test für gemeinsam signifikante Koeffizienten verwendet werden. 9

9. Schätzen und Testen bei unbekannter Varianz

9. Schätzen und Testen bei unbekannter Varianz 9. Schätzen und Testen bei unbekannter Varianz Dr. Antje Kiesel Institut für Angewandte Mathematik WS 2011/2012 Schätzen und Testen bei unbekannter Varianz Wenn wir die Standardabweichung σ nicht kennen,

Mehr

Bachelorprüfung. Praxis der empirischen Wirtschaftsforschung Prof. Regina T. Riphahn, Ph.D. Name, Vorname. Matrikelnr. E-Mail. Studiengang.

Bachelorprüfung. Praxis der empirischen Wirtschaftsforschung Prof. Regina T. Riphahn, Ph.D. Name, Vorname. Matrikelnr. E-Mail. Studiengang. Lehrstuhl für Statistik und empirische Wirtschaftsforschung Fach: Prüfer: Bachelorprüfung Praxis der empirischen Wirtschaftsforschung Prof. Regina T. Riphahn, Ph.D. Name, Vorname Matrikelnr. E-Mail Studiengang

Mehr

Institut für Soziologie. Methoden 2. Regressionsanalyse I: Einfache lineare Regression

Institut für Soziologie. Methoden 2. Regressionsanalyse I: Einfache lineare Regression Institut für Soziologie Methoden 2 Regressionsanalyse I: Einfache lineare Regression Programm Anwendungsbereich Vorgehensweise Interpretation Annahmen Zusammenfassung Übungsaufgabe Literatur # 2 Anwendungsbereich

Mehr

Interne und externe Modellvalidität

Interne und externe Modellvalidität Interne und externe Modellvalidität Interne Modellvalidität ist gegeben, o wenn statistische Inferenz bzgl. der untersuchten Grundgesamtheit zulässig ist o KQ-Schätzer der Modellparameter u. Varianzschätzer

Mehr

Inhaltsverzeichnis. Regressionsanalyse. http://mesosworld.ch - Stand vom: 20.1.2010 1

Inhaltsverzeichnis. Regressionsanalyse. http://mesosworld.ch - Stand vom: 20.1.2010 1 Inhaltsverzeichnis Regressionsanalyse... 2 Lernhinweise... 2 Einführung... 2 Theorie (1-8)... 2 1. Allgemeine Beziehungen... 3 2. 'Best Fit'... 3 3. 'Ordinary Least Squares'... 4 4. Formel der Regressionskoeffizienten...

Mehr

Kapitel 4: Binäre Regression

Kapitel 4: Binäre Regression Kapitel 4: Binäre Regression Steffen Unkel (basierend auf Folien von Nora Fenske) Statistik III für Nebenfachstudierende WS 2013/2014 4.1 Motivation Ausgangssituation Gegeben sind Daten (y i, x i1,...,

Mehr

Lösungen zu Janssen/Laatz, Statistische Datenanalyse mit SPSS 1

Lösungen zu Janssen/Laatz, Statistische Datenanalyse mit SPSS 1 LÖSUNG 9B a) Lösungen zu Janssen/Laatz, Statistische Datenanalyse mit SPSS 1 Man kann erwarten, dass der Absatz mit steigendem Preis abnimmt, mit höherer Anzahl der Außendienstmitarbeiter sowie mit erhöhten

Mehr

2. Korrelation, lineare Regression und multiple Regression

2. Korrelation, lineare Regression und multiple Regression multiple 2.2 Lineare 2.2 Lineare 1 / 130 2.2 Lineare 2 / 130 2.1 Beispiel: Arbeitsmotivation Untersuchung zur Motivation am Arbeitsplatz in einem Chemie-Konzern 25 Personen werden durch Arbeitsplatz zufällig

Mehr

METHODENLEHRE I WS 2013/14 THOMAS SCHÄFER

METHODENLEHRE I WS 2013/14 THOMAS SCHÄFER METHODENLEHRE I WS 2013/14 THOMAS SCHÄFER DAS THEMA: INFERENZSTATISTIK IV INFERENZSTATISTISCHE AUSSAGEN FÜR ZUSAMMENHÄNGE UND UNTERSCHIEDE Inferenzstatistik für Zusammenhänge Inferenzstatistik für Unterschiede

Mehr

Binäre abhängige Variablen

Binäre abhängige Variablen Binäre abhängige Variablen Thushyanthan Baskaran thushyanthan.baskaran@awi.uni-heidelberg.de Alfred Weber Institut Ruprecht Karls Universität Heidelberg Einführung Oft wollen wir qualitative Variablen

Mehr

Business Value Launch 2006

Business Value Launch 2006 Quantitative Methoden Inferenzstatistik alea iacta est 11.04.2008 Prof. Dr. Walter Hussy und David Tobinski UDE.EDUcation College im Rahmen des dokforums Universität Duisburg-Essen Inferenzstatistik Erläuterung

Mehr

Weitere Fragestellungen im Zusammenhang mit einer linearen Einfachregression

Weitere Fragestellungen im Zusammenhang mit einer linearen Einfachregression Weitere Fragestellungen im Zusammenhang mit einer linearen Einfachregression Speziell im Zusammenhang mit der Ablehnung der Globalhypothese werden bei einer linearen Einfachregression weitere Fragestellungen

Mehr

5. Schließende Statistik. 5.1. Einführung

5. Schließende Statistik. 5.1. Einführung 5. Schließende Statistik 5.1. Einführung Sollen auf der Basis von empirischen Untersuchungen (Daten) Erkenntnisse gewonnen und Entscheidungen gefällt werden, sind die Methoden der Statistik einzusetzen.

Mehr

Fortgeschrittene Statistik Logistische Regression

Fortgeschrittene Statistik Logistische Regression Fortgeschrittene Statistik Logistische Regression O D D S, O D D S - R A T I O, L O G I T T R A N S F O R M A T I O N, I N T E R P R E T A T I O N V O N K O E F F I Z I E N T E N, L O G I S T I S C H E

Mehr

Multiple Regression. Ziel: Vorhersage der Werte einer Variable (Kriterium) bei Kenntnis der Werte von zwei oder mehr anderen Variablen (Prädiktoren)

Multiple Regression. Ziel: Vorhersage der Werte einer Variable (Kriterium) bei Kenntnis der Werte von zwei oder mehr anderen Variablen (Prädiktoren) Multiple Regression 1 Was ist multiple lineare Regression? Ziel: Vorhersage der Werte einer Variable (Kriterium) bei Kenntnis der Werte von zwei oder mehr anderen Variablen (Prädiktoren) Annahme: Der Zusammenhang

Mehr

ε heteroskedastisch BINARY CHOICE MODELS Beispiele: Wahlentscheidung Kauf langlebiger Konsumgüter Arbeitslosigkeit Schätzung mit OLS?

ε heteroskedastisch BINARY CHOICE MODELS Beispiele: Wahlentscheidung Kauf langlebiger Konsumgüter Arbeitslosigkeit Schätzung mit OLS? BINARY CHOICE MODELS 1 mit Pr( Y = 1) = P Y = 0 mit Pr( Y = 0) = 1 P Beispiele: Wahlentscheidung Kauf langlebiger Konsumgüter Arbeitslosigkeit Schätzung mit OLS? Y i = X i β + ε i Probleme: Nonsense Predictions

Mehr

Probeklausur Zeitreihenökonometrie (Sommersemester 2014) 1

Probeklausur Zeitreihenökonometrie (Sommersemester 2014) 1 Probeklausur Zeitreihenökonometrie (Sommersemester 2014) 1 Aufgabe 1: Betrachtet wird folgendes Modell zur Erklärung des Managergehalts salary durch den Umsatz sales, die Eigenkapitalrendite roe und die

Mehr

Prüfung im Fach Ökonometrie im WS 2011/12 Aufgabenteil. Name, Vorname. Matrikelnr. Studiengang. E-Mail-Adresse. Unterschrift

Prüfung im Fach Ökonometrie im WS 2011/12 Aufgabenteil. Name, Vorname. Matrikelnr. Studiengang. E-Mail-Adresse. Unterschrift Lehrstuhl für Statistik und empirische Wirtschaftsforschung Prof. Regina T. Riphahn, Ph.D. Prüfung im Fach Ökonometrie im WS 2011/12 Aufgabenteil Name, Vorname Matrikelnr. Studiengang E-Mail-Adresse Unterschrift

Mehr

Statistik Einführung // Lineare Regression 9 p.2/72

Statistik Einführung // Lineare Regression 9 p.2/72 Statistik Einführung Lineare Regression Kapitel 9 Statistik WU Wien Gerhard Derflinger Michael Hauser Jörg Lenneis Josef Ledold Günter Tirler Rosmarie Wakolbinger Statistik Einführung // Lineare Regression

Mehr

Korrelation - Regression. Berghold, IMI

Korrelation - Regression. Berghold, IMI Korrelation - Regression Zusammenhang zwischen Variablen Bivariate Datenanalyse - Zusammenhang zwischen 2 stetigen Variablen Korrelation Einfaches lineares Regressionsmodell 1. Schritt: Erstellung eines

Mehr

Bachelorprüfung. Praxis der empirischen Wirtschaftsforschung Prof. Regina T. Riphahn, Ph.D. Name, Vorname. Matrikelnr. E-Mail. Studiengang.

Bachelorprüfung. Praxis der empirischen Wirtschaftsforschung Prof. Regina T. Riphahn, Ph.D. Name, Vorname. Matrikelnr. E-Mail. Studiengang. Lehrstuhl für Statistik und empirische irtschaftsforschung, SS 2009 ach: Prüfer: Bachelorprüfung Praxis der empirischen irtschaftsforschung Prof. Regina T. Riphahn, Ph.D. Name, Vorname Matrikelnr. E-Mail

Mehr

Standardab er des. Testwert = 145.5 95% Konfidenzintervall. T df Sig. (2-seitig) Differenz Untere Obere -2.011 698.045-5.82-11.50 -.14.

Standardab er des. Testwert = 145.5 95% Konfidenzintervall. T df Sig. (2-seitig) Differenz Untere Obere -2.011 698.045-5.82-11.50 -.14. Aufgabe : einfacher T-Test Statistik bei einer Stichprobe Standardfehl Standardab er des Mittelwert weichung Mittelwertes 699 39.68 76.59 2.894 Test bei einer Sichprobe Testwert = 45.5 95% Konfidenzintervall

Mehr

Grundlagen der Inferenzstatistik: Was Ihnen nicht erspart bleibt!

Grundlagen der Inferenzstatistik: Was Ihnen nicht erspart bleibt! Grundlagen der Inferenzstatistik: Was Ihnen nicht erspart bleibt! 1 Einführung 2 Wahrscheinlichkeiten kurz gefasst 3 Zufallsvariablen und Verteilungen 4 Theoretische Verteilungen (Wahrscheinlichkeitsfunktion)

Mehr

Klausur Sommersemester 2010

Klausur Sommersemester 2010 Klausur Sommersemester 2010 Lehrstuhl: Wirtschaftspolitik Prüfungsfach: Empirische Wirtschaftsforschung Prüfer: Prof. Dr. K. Kraft Datum: 04.08.2010 Hilfsmittel: Nicht-programmierbarer Taschenrechner Klausurdauer:

Mehr

Modul G.1 WS 07/08: Statistik 17.01.2008 1. Die Korrelation ist ein standardisiertes Maß für den linearen Zusammenhangzwischen zwei Variablen.

Modul G.1 WS 07/08: Statistik 17.01.2008 1. Die Korrelation ist ein standardisiertes Maß für den linearen Zusammenhangzwischen zwei Variablen. Modul G.1 WS 07/08: Statistik 17.01.2008 1 Wiederholung Kovarianz und Korrelation Kovarianz = Maß für den linearen Zusammenhang zwischen zwei Variablen x und y Korrelation Die Korrelation ist ein standardisiertes

Mehr

Abschlussklausur (60 Minuten), 15. Juli 2014

Abschlussklausur (60 Minuten), 15. Juli 2014 Prof. Dr. Amelie Wuppermann Volkswirtschaftliche Fakultät Universität München Sommersemester 2014 Empirische Ökonomie 1 Abschlussklausur (60 Minuten), 15. Juli 2014 Bearbeitungshinweise Die Bearbeitungszeit

Mehr

Analytische Statistik I. Statistische Methoden in der Korpuslinguistik Heike Zinsmeister WS 2009/10

Analytische Statistik I. Statistische Methoden in der Korpuslinguistik Heike Zinsmeister WS 2009/10 Analytische Statistik I Statistische Methoden in der Korpuslinguistik Heike Zinsmeister WS 2009/10 Testen Anpassungstests (goodness of fit) Weicht eine gegebene Verteilung signifikant von einer bekannten

Mehr

Franz Kronthaler. Statistik angewandt. Datenanalyse ist (k)eine Kunst. Excel Edition. ^ Springer Spektrum

Franz Kronthaler. Statistik angewandt. Datenanalyse ist (k)eine Kunst. Excel Edition. ^ Springer Spektrum Franz Kronthaler Statistik angewandt Datenanalyse ist (k)eine Kunst Excel Edition ^ Springer Spektrum Inhaltsverzeichnis Teil I Basiswissen und Werkzeuge, um Statistik anzuwenden 1 Statistik ist Spaß 3

Mehr

Willkommen zur Vorlesung Statistik (Master)

Willkommen zur Vorlesung Statistik (Master) Willkommen zur Vorlesung Statistik (Master) Thema dieser Vorlesung: Verteilungsfreie Verfahren Prof. Dr. Wolfgang Ludwig-Mayerhofer Universität Siegen Philosophische Fakultät, Seminar für Sozialwissenschaften

Mehr

Skriptum zur Veranstaltung. Quantitative Methoden (Mathematik/Statistik) Teil Induktive Statistik. 1. Version (mehr Draft als Skriptum)

Skriptum zur Veranstaltung. Quantitative Methoden (Mathematik/Statistik) Teil Induktive Statistik. 1. Version (mehr Draft als Skriptum) Skriptum zur Veranstaltung Quantitative Methoden (Mathematik/Statistik) Teil Induktive Statistik 1. Version (mehr Draft als Skriptum) Anmerkungen, Aufzeigen von Tippfehlern und konstruktive Kritik erwünscht!!!

Mehr

12. Vergleich mehrerer Stichproben

12. Vergleich mehrerer Stichproben 12. Vergleich mehrerer Stichproben Dr. Antje Kiesel Institut für Angewandte Mathematik WS 2011/2012 Häufig wollen wir verschiedene Populationen, Verfahren, usw. miteinander vergleichen. Beipiel: Vergleich

Mehr

Statistik II für Betriebswirte Vorlesung 2

Statistik II für Betriebswirte Vorlesung 2 PD Dr. Frank Heyde TU Bergakademie Freiberg Institut für Stochastik Statistik II für Betriebswirte Vorlesung 2 21. Oktober 2014 Verbundene Stichproben Liegen zwei Stichproben vor, deren Werte einander

Mehr

Kategoriale abhängige Variablen:

Kategoriale abhängige Variablen: Kategoriale abhängige Variablen: Logit- und Probit -Modelle Statistik II Literatur Annahmen und Annahmeverletzungen Funktionen Exponenten, Wurzeln usw. Das Problem Das binäre Logit-Modell Statistik II

Mehr

Bachelorabschlussseminar Dipl.-Kfm. Daniel Cracau

Bachelorabschlussseminar Dipl.-Kfm. Daniel Cracau 1 Einführung in die statistische Datenanalyse Bachelorabschlussseminar Dipl.-Kfm. Daniel Cracau 2 Gliederung 1.Grundlagen 2.Nicht-parametrische Tests a. Mann-Whitney-Wilcoxon-U Test b. Wilcoxon-Signed-Rank

Mehr

Prüfen von Mittelwertsunterschieden: t-test

Prüfen von Mittelwertsunterschieden: t-test Prüfen von Mittelwertsunterschieden: t-test Sven Garbade Fakultät für Angewandte Psychologie SRH Hochschule Heidelberg sven.garbade@hochschule-heidelberg.de Statistik 1 S. Garbade (SRH Heidelberg) t-test

Mehr

Nachholklausur STATISTIK II

Nachholklausur STATISTIK II Nachholklausur STATISTIK II Name, Vorname: Matrikel-Nr.: Die Klausur enthält zwei Typen von Aufgaben: T e i l A besteht aus Fragen mit mehreren vorgegebenen Antwortvorschlägen, von denen mindestens eine

Mehr

9. StatistischeTests. 9.1 Konzeption

9. StatistischeTests. 9.1 Konzeption 9. StatistischeTests 9.1 Konzeption Statistische Tests dienen zur Überprüfung von Hypothesen über einen Parameter der Grundgesamtheit (bei einem Ein-Stichproben-Test) oder über die Verteilung einer Zufallsvariablen

Mehr

Klausur zur Vorlesung Statistik III für Studenten mit dem Wahlfach Statistik

Klausur zur Vorlesung Statistik III für Studenten mit dem Wahlfach Statistik Ludwig Fahrmeir, Nora Fenske Institut für Statistik Bitte für die Korrektur freilassen! Aufgabe 1 2 3 4 Punkte Klausur zur Vorlesung Statistik III für Studenten mit dem Wahlfach Statistik 29. März 21 Hinweise:

Mehr

Kategoriale abhängige Variablen: Logit- und Probit -Modelle. Statistik II

Kategoriale abhängige Variablen: Logit- und Probit -Modelle. Statistik II Kategoriale abhängige Variablen: Logit- und Probit -Modelle Statistik II Wiederholung Literatur Annahmen und Annahmeverletzungen Funktionen Exponenten, Wurzeln usw. Das Problem Das binäre Logit-Modell

Mehr

Das Dialogfeld für die Regressionsanalyse ("Lineare Regression") findet sich im Statistik- Menu unter "Regression"-"Linear":

Das Dialogfeld für die Regressionsanalyse (Lineare Regression) findet sich im Statistik- Menu unter Regression-Linear: Lineare Regression Das Dialogfeld für die Regressionsanalyse ("Lineare Regression") findet sich im Statistik- Menu unter "Regression"-"Linear": Im einfachsten Fall werden mehrere Prädiktoren (oder nur

Mehr

Aufgabenstellung Aufgabe 1: Betrachten Sie das folgende ökonometrische Modell: y t = α + βx t + u t (1)

Aufgabenstellung Aufgabe 1: Betrachten Sie das folgende ökonometrische Modell: y t = α + βx t + u t (1) Klausur: Einführung in die Ökonometrie Prüfer: Prof. Dr. Karl-Heinz Paqué Dr.Ludwigv.Auer Semester: WS 1999/00 Als Hilfsmittel sind zugelassen: nicht-programmierbarer Taschenrechner Diese Klausur besteht

Mehr

Klausur zur Vorlesung Multivariate Verfahren, SS 2006 6 Kreditpunkte, 90 min

Klausur zur Vorlesung Multivariate Verfahren, SS 2006 6 Kreditpunkte, 90 min Klausur, Multivariate Verfahren, SS 2006, 6 Kreditpunkte, 90 min 1 Prof. Dr. Fred Böker 08.08.2006 Klausur zur Vorlesung Multivariate Verfahren, SS 2006 6 Kreditpunkte, 90 min Gesamtpunkte: 39 Aufgabe

Mehr

Statistik II für Betriebswirte Vorlesung 3

Statistik II für Betriebswirte Vorlesung 3 PD Dr. Frank Heyde TU Bergakademie Freiberg Institut für Stochastik Statistik II für Betriebswirte Vorlesung 3 5. November 2013 Beispiel: Aktiensplit (Aczel & Sounderpandan, Aufg. 14-28) Ein Börsenanalyst

Mehr

Multinomiale logistische Regression

Multinomiale logistische Regression Multinomiale logistische Regression Die multinomiale logistische Regression dient zur Schätzung von Gruppenzugehörigkeiten bzw. einer entsprechenden Wahrscheinlichkeit hierfür, wobei als abhänginge Variable

Mehr

Einfache statistische Testverfahren

Einfache statistische Testverfahren Einfache statistische Testverfahren Johannes Hain Lehrstuhl für Mathematik VIII (Statistik) 1/29 Hypothesentesten: Allgemeine Situation Im Folgenden wird die statistische Vorgehensweise zur Durchführung

Mehr

Multiple Regression II: Signifikanztests, Gewichtung, Multikollinearität und Kohortenanalyse

Multiple Regression II: Signifikanztests, Gewichtung, Multikollinearität und Kohortenanalyse Multiple Regression II: Signifikanztests,, Multikollinearität und Kohortenanalyse Statistik II Übersicht Literatur Kausalität und Regression Inferenz und standardisierte Koeffizienten Statistik II Multiple

Mehr

Statistik II Wahrscheinlichkeitsrechnung und induktive Statistik Erste Klausur zum Sommersemester 2005 26. Juli 2005

Statistik II Wahrscheinlichkeitsrechnung und induktive Statistik Erste Klausur zum Sommersemester 2005 26. Juli 2005 Statistik II Wahrscheinlichkeitsrechnung und induktive Statistik Erste Klausur zum Sommersemester 2005 26. Juli 2005 Aufgabe 1: Grundzüge der Wahrscheinlichkeitsrechnung 19 P. Als Manager eines großen

Mehr

3. Der t-test. Der t-test

3. Der t-test. Der t-test Der t-test 3 3. Der t-test Dieses Kapitel beschäftigt sich mit einem grundlegenden statistischen Verfahren zur Auswertung erhobener Daten: dem t-test. Der t-test untersucht, ob sich zwei empirisch gefundene

Mehr

Güte von Tests. die Wahrscheinlichkeit für den Fehler 2. Art bei der Testentscheidung, nämlich. falsch ist. Darauf haben wir bereits im Kapitel über

Güte von Tests. die Wahrscheinlichkeit für den Fehler 2. Art bei der Testentscheidung, nämlich. falsch ist. Darauf haben wir bereits im Kapitel über Güte von s Grundlegendes zum Konzept der Güte Ableitung der Gütefunktion des Gauss im Einstichprobenproblem Grafische Darstellung der Gütefunktionen des Gauss im Einstichprobenproblem Ableitung der Gütefunktion

Mehr

Teil I Beschreibende Statistik 29

Teil I Beschreibende Statistik 29 Vorwort zur 2. Auflage 15 Vorwort 15 Kapitel 0 Einführung 19 0.1 Methoden und Aufgaben der Statistik............................. 20 0.2 Ablauf statistischer Untersuchungen..............................

Mehr

90-minütige Klausur Statistik für Studierende der Kommunikationswissenschaft

90-minütige Klausur Statistik für Studierende der Kommunikationswissenschaft Prof. Dr. Helmut Küchenhoff SS08 90-minütige Klausur Statistik für Studierende der Kommunikationswissenschaft am 22.7.2008 Anmerkungen Überprüfen Sie bitte sofort, ob Ihre Angabe vollständig ist. Sie sollte

Mehr

Einleitung 19. Teil I Datenanalyse und Modellbildung Grundlagen 25

Einleitung 19. Teil I Datenanalyse und Modellbildung Grundlagen 25 Inhaltsverzeichnis Einleitung 19 Zu diesem Buch 19 Konventionen in diesem Buch 20 Was Sie nicht lesen müssen 21 Falsche Voraussetzungen 21 Wie dieses Buch aufgebaut ist 21 Teil I: Datenanalyse und Grundlagen

Mehr

Profil A 49,3 48,2 50,7 50,9 49,8 48,7 49,6 50,1 Profil B 51,8 49,6 53,2 51,1 51,1 53,4 50,7 50 51,5 51,7 48,8

Profil A 49,3 48,2 50,7 50,9 49,8 48,7 49,6 50,1 Profil B 51,8 49,6 53,2 51,1 51,1 53,4 50,7 50 51,5 51,7 48,8 1. Aufgabe: Eine Reifenfirma hat für Winterreifen unterschiedliche Profile entwickelt. Bei jeweils gleicher Geschwindigkeit und auch sonst gleichen Bedingungen wurden die Bremswirkungen gemessen. Die gemessenen

Mehr

Biometrie und Methodik (Statistik) - WiSem08/09 Probeklausur 1

Biometrie und Methodik (Statistik) - WiSem08/09 Probeklausur 1 Biometrie und Methodik (Statistik) - WiSem08/09 Probeklausur 1 Aufgabe 1 (10 Punkte). 10 Schüler der zehnten Klasse unterziehen sich zur Vorbereitung auf die Abschlussprüfung einem Mathematiktrainingsprogramm.

Mehr

29. Mai 2006. 5. Bei Unterschleif gilt die Klausur als nicht bestanden und es erfolgt eine Meldung an das Prüfungsamt.

29. Mai 2006. 5. Bei Unterschleif gilt die Klausur als nicht bestanden und es erfolgt eine Meldung an das Prüfungsamt. L. Fahrmeir, C. Belitz Department für Statistik Bitte für die Korrektur freilassen! Aufgabe 1 2 3 4 Punkte Klausur zur Vorlesung Statistik III für Studenten mit Wahlfach Statistik 29. Mai 2006 Hinweise:

Mehr

Statistische Auswertung der Daten von Blatt 13

Statistische Auswertung der Daten von Blatt 13 Statistische Auswertung der Daten von Blatt 13 Problemstellung 1 Graphische Darstellung der Daten 1 Diskussion der Normalverteilung 3 Mittelwerte und deren Konfidenzbereiche 3 Signifikanz der Behandlung

Mehr

DIPLOMVORPRÜFUNG GRUNDZÜGE DER STATISTIK, TEIL B WINTERSEMESTER 2006/07 28.02.2007

DIPLOMVORPRÜFUNG GRUNDZÜGE DER STATISTIK, TEIL B WINTERSEMESTER 2006/07 28.02.2007 Wirtschaftswissenschaftliches Prüfungsamt DIPLOMVORPRÜFUNG GRUNDZÜGE DER STATISTIK, TEIL B WINTERSEMESTER 006/07 8.0.007 Lösung Prof. Dr. R Friedmann / Dr. R. Hauser Hinweise für die Klausurteilnehmer

Mehr

Regressionsanalysen. Zusammenhänge von Variablen. Ziel der Regression. ( Idealfall )

Regressionsanalysen. Zusammenhänge von Variablen. Ziel der Regression. ( Idealfall ) Zusammenhänge von Variablen Regressionsanalysen linearer Zusammenhang ( Idealfall ) kein Zusammenhang nichtlinearer monotoner Zusammenhang (i.d.regel berechenbar über Variablentransformationen mittels

Mehr

Lehrstuhl für Statistik und empirische Wirtschaftsforschung Prof. Regina T. Riphahn, Ph.D. Prüfung im Fach Ökonometrie im WS 2011/12 Lösungsskizze

Lehrstuhl für Statistik und empirische Wirtschaftsforschung Prof. Regina T. Riphahn, Ph.D. Prüfung im Fach Ökonometrie im WS 2011/12 Lösungsskizze Lehrstuhl für Statistik und empirische irtschaftsforschung Prof. Regina T. Riphahn, Ph.D. Prüfung im ach Ökonometrie im S 20/2 Lösungsskizze Aufgabe (.5 Punkte) Sie verfügen über einen Datensatz, der Informationen

Mehr

Kapitel 23 Lineare Regression

Kapitel 23 Lineare Regression Kapitel 23 Lineare Regression Sowohl einfache als auch multiple Regressionsanalysen können Sie mit dem Befehl STATISTIK REGRESSION LINEAR... durchführen. Dabei lassen sich mit Hilfe diverser Optionen zahlreiche

Mehr

Einführung in die Statistik für Wirtschaftswissenschaftler für Betriebswirtschaft und Internationales Management

Einführung in die Statistik für Wirtschaftswissenschaftler für Betriebswirtschaft und Internationales Management Einführung in die Statistik für Wirtschaftswissenschaftler für Betriebswirtschaft und Internationales Management Sommersemester 2013 Hochschule Augsburg : Gliederung 1 Einführung 2 Deskriptive Statistik

Mehr

Eine zweidimensionale Stichprobe

Eine zweidimensionale Stichprobe Eine zweidimensionale Stichprobe liegt vor, wenn zwei qualitative Merkmale gleichzeitig betrachtet werden. Eine Urliste besteht dann aus Wertepaaren (x i, y i ) R 2 und hat die Form (x 1, y 1 ), (x 2,

Mehr

Statistik II Übung 2: Multivariate lineare Regression

Statistik II Übung 2: Multivariate lineare Regression Statistik II Übung 2: Multivariate lineare Regression Diese Übung beschäftigt sich mit dem Zusammenhang zwischen Flugpreisen und der Flugdistanz, dem Passagieraufkommen und der Marktkonzentration. Verwenden

Mehr

Regression mit Gretl Eine erste Einführung 1

Regression mit Gretl Eine erste Einführung 1 Kurzeinführung in Gretl S. 1 Regression mit Gretl Eine erste Einführung 1 Installation: Gretl für das entsprechende Betriebssystem herunterladen und die Setup-Datei ausführen. Hinweis: Für die Benutzung

Mehr

Statistik im Bachelor-Studium der BWL und VWL

Statistik im Bachelor-Studium der BWL und VWL Max C. Wewel Statistik im Bachelor-Studium der BWL und VWL Methoden, Anwendung, Interpretation Mit herausnehmbarer Formelsammlung ein Imprint von Pearson Education München Boston San Francisco Harlow,

Mehr

Willkommen zur Vorlesung Statistik

Willkommen zur Vorlesung Statistik Willkommen zur Vorlesung Statistik Thema dieser Vorlesung: Varianzanalyse Prof. Dr. Wolfgang Ludwig-Mayerhofer Universität Siegen Philosophische Fakultät, Seminar für Sozialwissenschaften Prof. Dr. Wolfgang

Mehr

Kapitel 3: Interpretationen

Kapitel 3: Interpretationen Kapitel 3: 1. Interpretation von Outputs allgemein... 1 2. Interpretation von Signifikanzen... 1 2.1. Signifikanztests / Punktschätzer... 1 2.2. Konfidenzintervalle... 2 3. Interpretation von Parametern...

Mehr

Grundlagen quantitativer Sozialforschung Interferenzstatistische Datenanalyse in MS Excel

Grundlagen quantitativer Sozialforschung Interferenzstatistische Datenanalyse in MS Excel Grundlagen quantitativer Sozialforschung Interferenzstatistische Datenanalyse in MS Excel 16.11.01 MP1 - Grundlagen quantitativer Sozialforschung - (4) Datenanalyse 1 Gliederung Datenanalyse (inferenzstatistisch)

Mehr

2.Tutorium Generalisierte Regression

2.Tutorium Generalisierte Regression 2.Tutorium Generalisierte Regression - Binäre Regression - Moritz Berger: 04.11.2013 und 11.11.2013 Shuai Shao: 06.11.2013 und 13.11.2013 Institut für Statistik, LMU München 1 / 16 Gliederung 1 Erweiterte

Mehr

Einige Statistische Tests für den Ein- Zwei- und k-stichprobenfall (Nach Sachs, Stat. Meth.)

Einige Statistische Tests für den Ein- Zwei- und k-stichprobenfall (Nach Sachs, Stat. Meth.) ue biostatistik: nichtparametrische testverfahren / ergänzung 1/6 h. Lettner / physik Statistische Testverfahren Einige Statistische Tests für den Ein- Zwei- und k-stichprobenfall (Nach Sachs, Stat. Meth.)

Mehr

Einfache Statistiken in Excel

Einfache Statistiken in Excel Einfache Statistiken in Excel Dipl.-Volkswirtin Anna Miller Bergische Universität Wuppertal Schumpeter School of Business and Economics Lehrstuhl für Internationale Wirtschaft und Regionalökonomik Raum

Mehr

Angewandte Ökonometrie, WS 2012/13, 1. Teilprüfung am 6.12.2012 - Lösungen. Das folgende Modell ist ein GARCH(1,1)-Modell:

Angewandte Ökonometrie, WS 2012/13, 1. Teilprüfung am 6.12.2012 - Lösungen. Das folgende Modell ist ein GARCH(1,1)-Modell: Angewandte Ökonometrie, WS 2012/13, 1. Teilprüfung am 6.12.2012 - Lösungen LV-Leiterin: Univ.Prof.Dr. Sylvia Frühwirth-Schnatter 1 Wahr oder falsch? 1. Das folgende Modell ist ein GARCH(1,1)-Modell: Y

Mehr

Studiendesign/ Evaluierungsdesign

Studiendesign/ Evaluierungsdesign Jennifer Ziegert Studiendesign/ Evaluierungsdesign Praxisprojekt: Nutzerorientierte Evaluierung von Visualisierungen in Daffodil mittels Eyetracker Warum Studien /Evaluierungsdesign Das Design einer Untersuchung

Mehr

14.01.14 DAS THEMA: INFERENZSTATISTIK II. Standardfehler Konfidenzintervalle Signifikanztests. Standardfehler

14.01.14 DAS THEMA: INFERENZSTATISTIK II. Standardfehler Konfidenzintervalle Signifikanztests. Standardfehler DAS THEMA: INFERENZSTATISTIK II INFERENZSTATISTISCHE AUSSAGEN Standardfehler Konfidenzintervalle Signifikanztests Standardfehler der Standardfehler Interpretation Verwendung 1 ZUR WIEDERHOLUNG... Ausgangspunkt:

Mehr

3. Der t-test. Der t-test

3. Der t-test. Der t-test 3 3. Der t-test Dieses Kapitel beschäftigt sich mit einem grundlegenden statistischen Verfahren zur Auswertung erhobener Daten: dem t-test. Der t-test untersucht, ob sich zwei empirisch gefundene Mittelwerte

Mehr

Weiterbildungskurs Stochastik

Weiterbildungskurs Stochastik Hansruedi Künsch Seminar für Statistik Departement Mathematik, ETH Zürich 24. Juni 2009 Inhalt STATISTIK DER BINOMIALVERTEILUNG 1 STATISTIK DER BINOMIALVERTEILUNG 2 Fragestellungen Typische Fragestellungen

Mehr

Eine Einführung in R: Statistische Tests

Eine Einführung in R: Statistische Tests Eine Einführung in R: Statistische Tests Bernd Klaus, Verena Zuber Institut für Medizinische Informatik, Statistik und Epidemiologie (IMISE), Universität Leipzig http://www.uni-leipzig.de/ zuber/teaching/ws12/r-kurs/

Mehr

Varianzanalyse ANOVA

Varianzanalyse ANOVA Varianzanalyse ANOVA Johannes Hain Lehrstuhl für Mathematik VIII Statistik 1/23 Einfaktorielle Varianzanalyse (ANOVA) Bisher war man lediglich in der Lage, mit dem t-test einen Mittelwertsvergleich für

Mehr

Analyse von Querschnittsdaten. Regression mit Dummy-Variablen

Analyse von Querschnittsdaten. Regression mit Dummy-Variablen Analyse von Querschnittsdaten Regression mit Dummy-Variablen Warum geht es in den folgenden Sitzungen? Datum Vorlesung 9.0.05 Einführung 26.0.05 Beispiele 02..05 Forschungsdesigns & Datenstrukturen 09..05

Mehr

Intervallschätzer, einfache Hypothesentests und Prognosen

Intervallschätzer, einfache Hypothesentests und Prognosen Kapitel 5 Intervallschätzer, einfache Hypothesentests und Prognosen The greatest enemy of knowledge is not ignorance, it is the illusion of knowledge. (Stephen Hawking) Bisher haben wir uns im wesentlichen

Mehr

Regression ein kleiner Rückblick. Methodenseminar Dozent: Uwe Altmann Alexandra Kuhn, Melanie Spate

Regression ein kleiner Rückblick. Methodenseminar Dozent: Uwe Altmann Alexandra Kuhn, Melanie Spate Regression ein kleiner Rückblick Methodenseminar Dozent: Uwe Altmann Alexandra Kuhn, Melanie Spate 05.11.2009 Gliederung 1. Stochastische Abhängigkeit 2. Definition Zufallsvariable 3. Kennwerte 3.1 für

Mehr

Überblick über die Verfahren für Ordinaldaten

Überblick über die Verfahren für Ordinaldaten Verfahren zur Analyse ordinalskalierten Daten 1 Überblick über die Verfahren für Ordinaldaten Unterschiede bei unabhängigen Stichproben Test U Test nach Mann & Whitney H Test nach Kruskal & Wallis parametrische

Mehr

Kommentierter SPSS-Ausdruck zur logistischen Regression

Kommentierter SPSS-Ausdruck zur logistischen Regression Daten: POK V AG 3 (POKV_AG3_V07.SAV) Kommentierter SPSS-Ausdruck zur logistischen Regression Fragestellung: Welchen Einfluss hat die Fachnähe und das Geschlecht auf die interpersonale Attraktion einer

Mehr

Institut für Soziologie Benjamin Gedon. Methoden 2. Regressionsanalyse IV: Transformation und Interaktion

Institut für Soziologie Benjamin Gedon. Methoden 2. Regressionsanalyse IV: Transformation und Interaktion Institut für Soziologie Methoden 2 Regressionsanalyse IV: Transformation und Interaktion Inhalt 1. Zusammenfassung letzte Sitzung 2. Weitere Annahmen und Diagnostik 3. Transformationen zur besseren Interpretierbarkeit

Mehr

12.1 Wie funktioniert ein Signifikanztest?

12.1 Wie funktioniert ein Signifikanztest? Sedlmeier & Renkewitz Kapitel 12 Signifikanztests 12.1 Wie funktioniert ein Signifikanztest? Zentrales Ergebnis eine Signifikanztests: Wie wahrscheinlich war es unter der Bedingung dass H0 gilt, diesen

Mehr

8. Februar 2007. 5. Bei Unterschleif gilt die Klausur als nicht bestanden und es erfolgt eine Meldung an das Prüfungsamt.

8. Februar 2007. 5. Bei Unterschleif gilt die Klausur als nicht bestanden und es erfolgt eine Meldung an das Prüfungsamt. L. Fahrmeir, C. Belitz Department für Statistik Bitte für die Korrektur freilassen! Aufgabe 1 2 3 4 Punkte Klausur zur Vorlesung Statistik III für Studenten mit Wahlfach Statistik 8. Februar 2007 Hinweise:

Mehr

Nichtparametrische statistische Verfahren

Nichtparametrische statistische Verfahren Nichtparametrische statistische Verfahren (im Wesentlichen Analyse von Abhängigkeiten) Kategorien von nichtparametrischen Methoden Beispiel für Rangsummentests: Wilcoxon-Test / U-Test Varianzanalysen 1-faktorielle

Mehr

Melanie Kaspar, Prof. Dr. B. Grabowski 1

Melanie Kaspar, Prof. Dr. B. Grabowski 1 7. Hypothesentests Ausgangssituation: Man muss sich zwischen 2 Möglichkeiten (=Hypothesen) entscheiden. Diese Entscheidung soll mit Hilfe von Beobachtungen ( Stichprobe ) getroffen werden. Die Hypothesen

Mehr

Klausur zur Vorlesung Methoden der empirischen Kapitalmarktforschung

Klausur zur Vorlesung Methoden der empirischen Kapitalmarktforschung Universität Augsburg Wirtschaftswissenschaftliche Fakultät Lehrstuhl für Finanz und Bankwirtschaft Matrikelnummer Klausur zur Vorlesung Methoden der empirischen Kapitalmarktforschung Prof. Dr. Marco Wilkens

Mehr

1 Interaktion von zwei Dummyvariablen. 2 Interaktion einer Dummyvariablen mit einer kardinalskalierten Variablen

1 Interaktion von zwei Dummyvariablen. 2 Interaktion einer Dummyvariablen mit einer kardinalskalierten Variablen Modelle mit Interationsvariablen I Modelle mit Interationsvariablen II In der beim White-Test verwendeten Regressionsfuntion y = β 0 + β 1 x 1 + β 2 x 2 + β 3 x 2 1 + β 4 x 2 2 + β 5 x 1 x 2, ist anders

Mehr

Biostatistik, WS 2015/2016 Der zwei-stichproben-t-test

Biostatistik, WS 2015/2016 Der zwei-stichproben-t-test 1/29 Biostatistik, WS 2015/2016 Der zwei-stichproben-t-test (t-test für ungepaarte Stichproben) Matthias Birkner http://www.staff.uni-mainz.de/birkner/biostatistik1516/ 11.12.2015 2/29 Inhalt 1 t-test

Mehr

Kap. 9: Regression mit einer binären abhängigen Variablen

Kap. 9: Regression mit einer binären abhängigen Variablen Kap. 9: Regression mit einer binären abhängigen Variablen Motivation Lineares Wahrscheinlichkeitsmodell Probit- und Logit-Regression Maximum Likelihood Empirisches Beispiel: Analyse der HMDA-Daten Ausblick:

Mehr

Wahrscheinlichkeitsrechnung und Statistik für Biologen 5. Der zwei-stichproben-t-test. und der Wilcoxon-Test

Wahrscheinlichkeitsrechnung und Statistik für Biologen 5. Der zwei-stichproben-t-test. und der Wilcoxon-Test Wahrscheinlichkeitsrechnung und Statistik für Biologen 5. Der zwei-stichproben-t-test (t-test für ungepaarte Stichproben) und der Wilcoxon-Test Dirk Metzler 22. Mai 2015 Inhaltsverzeichnis 1 Wiederholung:

Mehr

, dt. $+ f(x) = , - + < x < +, " > 0. " 2# Für die zugehörige Verteilungsfunktion F(x) ergibt sich dann: F(x) =

, dt. $+ f(x) = , - + < x < +,  > 0.  2# Für die zugehörige Verteilungsfunktion F(x) ergibt sich dann: F(x) = 38 6..7.4 Normalverteilung Die Gauß-Verteilung oder Normal-Verteilung ist eine stetige Verteilung, d.h. ihre Zufallsvariablen können beliebige reelle Zahlenwerte annehmen. Wir definieren sie durch die

Mehr

Einführung in die Geostatistik (7) Fred Hattermann (Vorlesung), hattermann@pik-potsdam.de Michael Roers (Übung), roers@pik-potsdam.

Einführung in die Geostatistik (7) Fred Hattermann (Vorlesung), hattermann@pik-potsdam.de Michael Roers (Übung), roers@pik-potsdam. Einführung in die Geostatistik (7) Fred Hattermann (Vorlesung), hattermann@pik-potsdam.de Michael Roers (Übung), roers@pik-potsdam.de 1 Gliederung 7 Weitere Krigingverfahren 7.1 Simple-Kriging 7.2 Indikator-Kriging

Mehr

Einführung in statistische Analysen

Einführung in statistische Analysen Einführung in statistische Analysen Andreas Thams Econ Boot Camp 2008 Wozu braucht man Statistik? Statistik begegnet uns jeden Tag... Weihnachten macht Deutschen Einkaufslaune. Im Advent überkommt die

Mehr

Sönke Albers Bernd Skiera Regressionsanalyse Februar 1998

Sönke Albers Bernd Skiera Regressionsanalyse Februar 1998 Sönke Albers Bernd Skiera Regressionsanalyse Vorabversion des Beitrags: Albers, S. / Skiera, B. (1999), "Regressionsanalyse", in: Herrmann, A. / Homburg, C. (Hrsg.), "Marktforschung. Grundlagen - Methoden

Mehr

Auswertung mit dem Statistikprogramm SPSS: 30.11.05

Auswertung mit dem Statistikprogramm SPSS: 30.11.05 Auswertung mit dem Statistikprogramm SPSS: 30.11.05 Seite 1 Einführung SPSS Was ist eine Fragestellung? Beispiel Welche statistische Prozedur gehört zu welcher Hypothese? Statistische Berechnungen mit

Mehr

1 Von den Ereignissen U und V eines Zufallsexperiments kennt man die Eigenschaften (1) bis (3) :

1 Von den Ereignissen U und V eines Zufallsexperiments kennt man die Eigenschaften (1) bis (3) : Prof. Dr. E. Mammen SEMINAR FÜR STATISTIK Prof. Dr. H. Stenger UNIVERSITÄT MANNHEIM Vierstündige Klausur in statistischer Methodenlehre 9. Juli 003; 8:30 - :30 Zulässige Hilfsmittel: keine, insbesondere

Mehr

2.1 Die Normalverteilung

2.1 Die Normalverteilung . INFERENZSTATISTIK Inferenzstatistik bedeutet übersetzt schließende Statistik. Damit ist der Schluss von den erhobenen Daten einer Stichprobe auf Werte in der Population gemeint..1 Die Normalverteilung

Mehr