"Korrelation" bei Nominaldaten: Kontingenz
|
|
- Johanna Siegel
- vor 5 Jahren
- Abrufe
Transkript
1 "Korrelation" bei Nominaldaten: Kontingenz j beobachtete Häufigkeiten (KSV Tabelle 6.3): i Augenfar be Haarfarb e blau braun grün 1 blond braun schwarz rot
2 i j Summe Randverteil ung Z i /N Augenfar be blau braun grün Haarfarb e 1 blond /128= braun /128= schwarz /128= rot /128=
3 i j Summ e Augenf arbe Haarfar be blau braun grün Randvert eilung Z i /N 1 blond /128= braun /128= schwar z /128= rot /128= 0.09 Summe Randve rteilung S j /N 62/128 = /128 = /128 =
4 Deshalb: erwartete Häufigkeiten E ij in Kontingenztafel mit p i = Z i /N und p j = S j /N : pˆ ij =p i p j wenn p i und p j unabhängig pˆ ij so daß E ij = *N oder: E ij = Z i S j /N dann gilt, falls Merkmale i und j unabhängig: B ij = E ij (Probe bei der Berechnung der E ij : E ij = B ij ) 178
5 i j Summ e Augenf arbe blau braun grün Randvert eilung Z i /N bei erwartete (vorausgesagte) Häufigkeiten Unabhängigkeit: Haarfar be 1 blond 0.38*0. 48*128 = braun 3 schwar z /128= /128= /128= rot /128= 0.09 Summe Randve rteilung S j /N 62/128 = /128 = /128 =
6 Definiere 2 i, j ( B ij E E ij ij ) 2 ( i, j B E 2 ij ij ) N mit: B ij, E ij = beobachtete, erwartete Häufigkeiten N = Gesamt-Stichprobenumfang Hier: 2 =42 2 / = = Kontingenzkoeffizient C C 2 2 N ; 0C<1 180
7 es gilt jedoch: C max m m 1 wir definieren daher einen korrigierten Kontingenzkoeffizienten für Nominaldaten: C korr C C max ( m 2 m 1)( 2 N) mit 0C korr 1 181
8 n=m=2: Matthews'scher Korrelationskoeffizient MCC Für eine 2x2 Matrix aus tatsächlichen und vorausgesagten Werten: TP = true positives FP = false positives FN = false negatives TN = true negatives Falls einer der Faktoren im Nenner Null ist, ist MCC:=0 Damit gilt: -1 MCC
9 Zusammenfassung: Korrelations-/Kontingenzkoeffizienten Voraussetzung Ratiodaten/ Intervalldaten linear r Koeffizient Ordinaldaten monoton R Nominaldaten C/C korr, MCC 183
10 Regressionsrechnung Düngermenge [kg/ha] Ertrag [dt/ha] Regressionsgerade ŷ = a + b x wie??? - per Auge freihändig einzeichnen - Gauss (1809): allgemein - Methode der kleinsten Quadrate 184
11 graphisch ŷ = a + b x : a ist der Schnittpunkt der Gerade mit der y-achse, bei x=0 b : 2 beliebige Punkte 1,2 auf der Geraden nehmen und Differenzenquotient (y 2 -y 1 )/(x 2 -x 1 ) berechnen b heißt Regressionskoeffizient 185
12 least-squares (Ausgleichs-)Gerade ŷ = a + b x : Minimierung von ( yi a bxi 2 ) hat die Lösung: b x i y x i 2 i 1/ n 1/ n( xi xi ) 2 y i a= y i b x i n Achtung: ŷ kann nur innerhalb des Wertebereiches von x berechnet werden (Interpolation); ob Extrapolation möglich ist, muß geprüft werden. 186
13 Tabelle mit Auswertung (Skizze für Excel!) 3,00 3,00 4,00 4,50 4,50 5,00 5,00 6,00 4,375 x, Summe 32,00 38,00 39,00 40,00 44,00 47,00 50,00 49,00 42,375 y, Summe -1,38-1,38-0,38 0,13 0,13 0,63 0,63 1,63 x, Differenzen -10,38-4,38-3,38-2,38 1,63 4,63 7,63 6,63 y, Differenzen 14,27 6,02 1,27-0,30 0,20 2,89 4,77 10,77 39,875 Zeile 3*Zeile 4 1,89 1,89 0,14 0,02 0,02 0,39 0,39 2,64 7,375 5,407 18,720-2,94 3,06-1,35-3,05 0,95 1,25 4,25-2,16 107,64 19,14 11,39 5,64 2,64 21,39 58,14 43,89 269,88 0,148-1,
14 Plot der Residuen r i = y i ŷ i : 5,00 4,00 3,00 2,00 1,00 0,00-1,00-2,00-3,00-4, Bewertung des Residuenplots: Residuen sind um 0 normalverteilt 188
15 Klausurergebnis - Tutorienbesuch in Klausur erzielte Punkte Regressionsgerad e; r= besuchte Tutorien 189
16 190
17 Schließende Statistik Test-Theorie Hypothesen Fehler 1. und 2. Art Wahrscheinlichkeitstheorie, Bayes'sche Formel einige Teststatistiken (χ 2, t, F-Test), Anwendungen 191
18 Test-Theorie - schließen von Stichprobe auf Grundgesamtheit - wie zuverlässig sind die Kennzahlen? - überprüfen, ob Stichprobe aus Grundgesamtheit stammt - Kennzahlen aus Stichprobe mit Dach: z.b. xˆ, sˆ - Kennzahlen aus Grundgesamtheit als griech. Buchstaben μ, λ, σ - Hypothesen H0 und H1 - beziehen sich i.a. auf Grundgesamtheit - z.b. H0(μ =18) oder H0(μ = μ T ) "Nullhypothese" - z.b. H1(μ 18) oder H1(μ μ T ) Alternativhypothese - der Test entscheidet zwischen H0 und H1 192
19 Klausur Fr :15-9:45 Studentenausweis und z,t,f, χ2,-tabellen mitbringen! Kein Rücktritt nach der Klausur Durchstreichen vor Abgabe ergibt 0 Punkte. 1 Buch, 1 Ordner R512 (niedrige M-Nr) und R513 (hohe M-Nr) Sitzordnung nach Matrikel-Nummer, deshalb bis 8:05 ankommen und Platz suchen!
20 Beispiel: Palette mit Äpfeln ganze Palette "schlecht", wenn > 15% mit braunen Stellen Grundgesamtheit = Äpfel einer Palette Stichprobe = 10 Äpfel davon H0 = "die Palette ist gut" Prüfgröße T = Anzahl schlechter Äpfel was ist die Häufigkeitsverteilung der Anzahl schlechter Äpfel aus 10 Äpfeln, wenn wir einen bestimmten Prozentsatz schlechter Äpfel voraussetzen? Antwort: B(n,p;k) mit n=10, p=0.15, k=
21 Binomialverteilung mit n=10, p=0.15 (ungünstigster Fall) Anzahl schlecht er Äpfel k B(n, p=0.15; k) B(n,p;l) mit l k Wahrscheinlichkeit, höchstens k schlechte Äpfel zu finden Wahrscheinlichkeit, höchstens 3 schlechte Äpfel zu finden k=3 ist die 5%-Grenze
22 Annahme von H0: T K Ablehnung von H0: T > K (im Beispiel: rechter Ausläufer der Verteilung "einseitig") in vielen anderen Fällen gilt, dass T im Intervall zwischen K 1 und K 2 liegen muss : Annahme von H0: K 1 T K 2 Ablehnung von H0: T < K 1 oder T > K 2 linker oder rechter Ausläufer der Verteilung von T "zweiseitig" wichtig für Tabellen! 196
23 Feststellung 1: wenn ich bei einer guten Palette die schlechten Äpfel meiner Stichprobe zähle, dann ist die Wahrscheinlichkeit, daß es mehr als 3 sind, 5%. Feststellung 2: wenn ich Paletten, bei denen von 10 Äpfeln einer Stichprobe mehr als 3 schlecht sind, als "schlecht" bezeichne, dann mache ich in 5% aller Fälle einen Fehler. Definition: Wenn ich die Hypothese H0 ablehne, obwohl sie in Wirklichkeit richtig ist, mache ich einen Fehler 1. Art, oder α-fehler. False negative Die Wahrscheinlichkeit des Fehlers 1. Art nennt man α -Risiko oder Irrtumswahrscheinlichkeit α. α wird unglücklicherweise auch als Signifikanzniveau oder Signifikanz bezeichnet. 197
24 Feststellung 3: im Beispiel ist die Irrtumswahrscheinlichkeit 5%, wenn ich k=3 als Grenze K verwende. (bei K=4 wäre die Irrtumswahrscheinlichkeit α =1%) Feststellung 4: je kleiner die Irrtumswahrscheinlichkeit α, desto größer die Wahrscheinlichkeit, daß ich schlechte Paletten als gut ansehe. Definition: Wenn ich H0 annehme, obwohl diese in Wirklichkeit falsch ist, begehe ich einen Fehler 2. Art oder β-fehler. False positive Die Wahrscheinlichkeit des β -Fehlers ist der Zahlenwert β. 1- β heißt Power/Teststärke/Güte. Je kleiner der α -Fehler, desto größer der β -Fehler (und umgekehrt). 198
25 was kann man über den Fehler 2. Art sagen? Annahme: schlechte Paletten haben 50% schlechte Äpfel B(10,0.5;k) (das ist noch nicht der ungünstigste Fall!) Anzahl schlecht er Äpfel k B(n,p;k) B(n,p;l) mit l k Wahrscheinlichkeit, höchstens 3 schlechte Äpfel zu finden
26 Feststellung 1: Die Wahrscheinlichkeit ist 17.2 %, eine schlechte Palette (mit 50% schlechter Äpfel) als gut zu befinden (bei K=3 von 10) Feststellung 2: Um den β-fehler zu berechnen, brauchen wir den wahren Wert von p! Dieser ist aber meistens nicht bekannt... Was passiert, wenn wir 20 anstelle von 10 Äpfeln untersuchen? p=0.15: B(n,p;l) mit l 6 ist 0.978, also α =2.2% (l 5; 0.933, α=6.7%) p=0.5: B(n,p;l) mit l 6 ist , also β =5.8% (l 5; 0.021, β=2.1%) Feststellung 3: Um den α- und β- Fehler zu verringern, können wir den Umfang der Stichprobe vergrößern. Dies kostet aber im Allgemeinen Geld/Arbeit/Zeit! 200
27 wahrer Sachverhalt "gute Palette" "schlechte Palette" Entscheidung des Tests T K; Annehmen von H0 ("gute Palette") positive T > K; Ablehnen von H0 ("schlechte Palette") negative Wahrscheinlichkeit 1-α: richtige Entscheidung - wahrer Sachverhalt stimmt mit Testergebnis überein Wahrscheinlichkeit α: falsche Entscheidung - H0 wäre richtig, aber Testergebnis führt zu H1 (Fehler 1. Art) false negative Wahrscheinlichkeit β: falsche Entscheidung - H1 wäre richtig, aber Testergebnis führt zu H0 (Fehler 2. Art) false positive Wahrscheinlichkeit 1-β: richtige Entscheidung - wahrer Sachverhalt stimmt mit Testergebnis überein 201
r=0.666 Number of people who drowned by falling into a pool correlates with Films Nicolas Cage appeared in 140 drownings 6 films 4 films 120 drownings
r=.666 Number of people who drowned by falling into a pool correlates with Films Nicolas Cage appeared in 5 6 7 8 9 6 films drownings films drownings films 8 drownings Nicholas Cage Swimming pool drownings
MehrWahrscheinlichkeit 1-α: richtige Entscheidung - wahrer Sachverhalt stimmt mit Testergebnis überein. Wahrscheinlichkeit α: falsche Entscheidung -
wahrer Sachverhalt: Palette ist gut Palette ist schlecht Entscheidung des Tests: T K; Annehmen von H0 ("gute Palette") positive T > K; Ablehnen von H0 ("schlechte Palette") negative Wahrscheinlichkeit
MehrKapitel III: Einführung in die schließende Statistik
Kapitel III: Einführung in die schließende Statistik Das zweite Kapitel beschäftigte sich mit den Methoden der beschreibenden Statistik. Im Mittelpunkt der kommenden Kapitel stehen Verfahren der schließenden
Mehr5. Seminar Statistik
Sandra Schlick Seite 1 5. Seminar 5. Seminar Statistik 30 Kurztest 4 45 Testen von Hypothesen inkl. Übungen 45 Test- und Prüfverfahren inkl. Übungen 45 Repetitorium und Prüfungsvorbereitung 15 Kursevaluation
MehrStatistische Überlegungen: Eine kleine Einführung in das 1 x 1
Statistische Überlegungen: Eine kleine Einführung in das 1 x 1 PD Dr. Thomas Friedl Klinik für Frauenheilkunde und Geburtshilfe, Universitätsklinikum Ulm München, 23.11.2012 Inhaltsübersicht Allgemeine
Mehr2. Formulieren von Hypothesen. Nullhypothese: H 0 : µ = 0 Gerät exakt geeicht
43 Signifikanztests Beispiel zum Gauß-Test Bei einer Serienfertigung eines bestimmten Typs von Messgeräten werden vor der Auslieferung eines jeden Gerätes 10 Kontrollmessungen durchgeführt um festzustellen,
MehrAllgemeines zu Tests. Statistische Hypothesentests
Statistische Hypothesentests Allgemeines zu Tests Allgemeines Tests in normalverteilten Grundgesamtheiten Asymptotische Tests Statistischer Test: Verfahren Entscheidungsregel), mit dem auf Basis einer
Mehr4.1. Nullhypothese, Gegenhypothese und Entscheidung
rof. Dr. Roland Füss Statistik II SS 8 4. Testtheorie 4.. Nullhypothese, Gegenhypothese und Entscheidung ypothesen Annahmen über die Verteilung oder über einzelne arameter der Verteilung eines Merkmals
MehrKlassifikation von Signifikanztests
Klassifikation von Signifikanztests nach Verteilungsannahmen: verteilungsabhängige = parametrische Tests verteilungsunabhängige = nichtparametrische Tests Bei parametrischen Tests werden im Modell Voraussetzungen
MehrStatistische Tests (Signifikanztests)
Statistische Tests (Signifikanztests) [testing statistical hypothesis] Prüfen und Bewerten von Hypothesen (Annahmen, Vermutungen) über die Verteilungen von Merkmalen in einer Grundgesamtheit (Population)
MehrEpidemiologie / Biometrie
Wintersemester 2004 / 2005 Epidemiologie / Biometrie Robert Hochstrat 14. März 2005 Zusammenschrift der Übung zur Vorlesung aus dem WS 04/05 Rückfragen, Ergänzungen und Korrekturen an robert hochstrat@web.de
MehrStatistik II für Betriebswirte Vorlesung 1
Statistik II für Betriebswirte Vorlesung 1 Dr. Andreas Wünsche TU Bergakademie Freiberg Institut für Stochastik 16. Oktober 2017 Dr. Andreas Wünsche Statistik II für Betriebswirte Vorlesung 1 Version:
MehrStatistisches Testen
Statistisches Testen Grundlegendes Prinzip Erwartungswert Bekannte Varianz Unbekannte Varianz Differenzen Anteilswert Chi-Quadrat Tests Gleichheit von Varianzen Prinzip des Statistischen Tests Konfidenzintervall
MehrVorlesung: Statistik II für Wirtschaftswissenschaft
Vorlesung: Statistik II für Wirtschaftswissenschaft Prof. Dr. Helmut Küchenhoff Institut für Statistik, LMU München Sommersemester 2017 Einführung 1 Wahrscheinlichkeit: Definition und Interpretation 2
MehrKlassifikation von Signifikanztests
Klassifikation von Signifikanztests nach Verteilungsannahmen: verteilungsabhängige = parametrische Tests verteilungsunabhängige = nichtparametrische Tests Bei parametrischen Tests werden im Modell Voraussetzungen
MehrBeurteilende Statistik
Beurteilende Statistik Wahrscheinlichkeitsrechnung und Beurteilende Statistik was ist der Unterschied zwischen den beiden Bereichen? In der Wahrscheinlichkeitstheorie werden aus gegebenen Wahrscheinlichkeiten
MehrKlassifikation von Signifikanztests
Klassifikation von Signifikanztests nach Verteilungsannahmen: verteilungsabhängige = parametrische Tests verteilungsunabhängige = nichtparametrische Tests Bei parametrischen Tests werden im Modell Voraussetzungen
MehrBiomathematik für Mediziner, Klausur WS 2000/2001 Seite 1
Biomathematik für Mediziner, Klausur WS 2000/2001 Seite 1 Aufgabe 1: Von 2 gleichartigen Maschinen eines pharmazeutischen Betriebes stellt die erste 40% und die zweite 60% der Produkte her. Dabei verursacht
MehrWichtige Definitionen und Aussagen
Wichtige Definitionen und Aussagen Zufallsexperiment, Ergebnis, Ereignis: Unter einem Zufallsexperiment verstehen wir einen Vorgang, dessen Ausgänge sich nicht vorhersagen lassen Die möglichen Ausgänge
MehrSozialwissenschaftlerInnen II
Statistik für SozialwissenschaftlerInnen II Henning Best best@wiso.uni-koeln.de Universität zu Köln Forschungsinstitut für Soziologie Statistik für SozialwissenschaftlerInnen II p.1 Testen von Hypothesen
MehrMathematik 2 für Naturwissenschaften
Hans Walser Mathematik 2 für Naturwissenschaften 2 3 3 4 6 4 5 0 0 5 6 5 20 5 6 Tabellen (leicht gekürzte Version) Hans Walser: Tabellen ii Inhalt Binomische Verteilung.... Binomische Verteilung (ohne
MehrMathematik 2 für Naturwissenschaften
Hans Walser Mathematik 2 für Naturwissenschaften 2 3 3 4 6 4 5 0 0 5 6 5 20 5 6 Tabellen (leicht gekürzte Version) Hans Walser: Tabellen ii Inhalt Binomische Verteilung.... Binomische Verteilung (ohne
MehrBiomathematik für Mediziner, Klausur SS 2001 Seite 1
Biomathematik für Mediziner, Klausur SS 2001 Seite 1 Aufgabe 1: Von den Patienten einer Klinik geben 70% an, Masern gehabt zu haben, und 60% erinnerten sich an eine Windpockeninfektion. An mindestens einer
MehrTesten von Hypothesen:
Testen von Hypothesen: Ein Beispiel: Eine Firma produziert Reifen. In der Entwicklungsabteilung wurde ein neues Modell entwickelt, das wesentlich ruhiger läuft. Vor der Markteinführung muss aber auch noch
MehrStatistik II. IV. Hypothesentests. Martin Huber
Statistik II IV. Hypothesentests Martin Huber 1 / 41 Übersicht Struktur eines Hypothesentests Stichprobenverteilung t-test: Einzelner-Parameter-Test F-Test: Multiple lineare Restriktionen 2 / 41 Struktur
MehrOnline-Aufgaben Statistik (BIOL, CHAB) Auswertung und Lösung
Online-Aufgaben Statistik (BIOL, CHAB) Auswertung und Lösung Abgaben: 92 / 234 Maximal erreichte Punktzahl: 7 Minimal erreichte Punktzahl: 1 Durchschnitt: 4 Frage 1 (Diese Frage haben ca. 0% nicht beantwortet.)
MehrMathematik für Biologen
Mathematik für Biologen Prof. Dr. Rüdiger W. Braun Heinrich-Heine-Universität Düsseldorf 16. Januar 2013 1 Allgemeine Hypothesentests Nullhypothese und Alternative Beispiel: Blutdrucksenker Testverfahren
MehrMögliche Fehler beim Testen
Mögliche Fehler beim Testen Fehler. Art (Irrtumswahrscheinlichkeit α), Zusammenfassung: Die Nullhypothese wird verworfen, obwohl sie zutrifft. Wir haben uns blamiert, weil wir etwas Wahres abgelehnt haben.
MehrBereiche der Statistik
Bereiche der Statistik Deskriptive / Exploratorische Statistik Schließende Statistik Schließende Statistik Inferenz-Statistik (analytische, schließende oder konfirmatorische Statistik) baut auf der beschreibenden
MehrTesten von Hypothesen, Beurteilende Statistik
Testen von Hypothesen, Beurteilende Statistik Was ist ein Test? Ein Test ist ein Verfahren, mit dem man anhand von Beobachtungen eine begründete Entscheidung über die Gültigkeit oder Ungültigkeit einer
MehrKlausur zur Vorlesung Analyse mehrdimensionaler Daten, Lösungen WS 2010/2011; 6 Kreditpunkte, 90 min
Klausur, Analyse mehrdimensionaler Daten, WS 2010/2011, 6 Kreditpunkte, 90 min 1 Prof. Dr. Fred Böker 21.02.2011 Klausur zur Vorlesung Analyse mehrdimensionaler Daten, Lösungen WS 2010/2011; 6 Kreditpunkte,
Mehr3.Wiederholung: Toleranzbereiche Für EX Geg:
3.Wiederholung: Toleranzbereiche Für EX Geg: Vl. 24.2.2017 Schätzfunktion für Güte: Ist X Problem: Feb 17 13:21 > Wir berechnen Bereiche (Toleranzbereiche) für sind untere und obere Grenzen, berechnet
Mehr1. Nennen Sie den für das Merkmal X geeigneten Skalentyp und begründen Sie Ihre Antwort.
Aufgabe 1 150 Personen gaben bei einer Befragung an, wie viel Geld sie in diesem Jahr für Weihnachtsgeschenke ausgegeben haben. Die Ergebnisse der Befragung sind in nachfolgender Tabelle zusammengefasst,
MehrLösungen zur Biomathe-Klausur Gruppe C Montag, den 16. Juli 2001
Lösungen zur Biomathe-Klausur Gruppe C Montag, den 16. Juli 2001 1. Normalverteilung Der diastolische Blutdruck bei einer Gruppe von jungen Männern ist normalverteilt mit einem Erwartungswert von 65 mmhg
MehrDeskriptive Beschreibung linearer Zusammenhänge
9 Mittelwert- und Varianzvergleiche Mittelwertvergleiche bei k > 2 unabhängigen Stichproben 9.4 Beispiel: p-wert bei Varianzanalyse (Grafik) Bedienungszeiten-Beispiel, realisierte Teststatistik F = 3.89,
MehrStatistische Tests funktionieren generell nach obigem Schema; der einzige Unterschied besteht in der unterschiedlichen Berechnung der Testgröße.
Statistische Tests Testen von Hypothesen Fehlerarten wichtigste statistische Tests Hypothesen Jeder statistische Test beruht auf der Widerlegung einer zuvor aufgestellten Hypothese. Die Widerlegung ist
MehrHypothesentests. Hypothese Behauptung eines Sachverhalts, dessen Überprüfung noch aussteht.
Hypothese Behauptung eines Sachverhalts, dessen Überprüfung noch aussteht. Wissenschaftliche Vorgehensweise beim Hypothesentest Forscher formuliert eine Alternativhypothese H 1 (die neue Erkenntnis, die
MehrEmpirische Wirtschaftsforschung
Empirische Wirtschaftsforschung Prof. Dr. Bernd Süßmuth Universität Leipzig Institut für Empirische Wirtschaftsforschung Volkswirtschaftslehre, insbesondere Ökonometrie 1 4. Basiskonzepte der induktiven
Mehr3) Testvariable: T = X µ 0
Beispiel 4.9: In einem Molkereibetrieb werden Joghurtbecher abgefüllt. Der Sollwert für die Füllmenge dieser Joghurtbecher beträgt 50 g. Aus der laufenden Produktion wurde eine Stichprobe von 5 Joghurtbechern
MehrGoethe-Universität Frankfurt
Goethe-Universität Frankfurt Fachbereich Wirtschaftswissenschaft PD Dr. Martin Biewen Dr. Ralf Wilke Sommersemester 2006 Klausur Statistik II 1. Alle Aufgaben sind zu beantworten. 2. Bitte runden Sie Ihre
MehrKonfidenzintervalle. Gesucht: U = U(X 1,..., X n ), O = O(X 1,..., X n ), sodass für das wahre θ gilt
Konfidenzintervalle Annahme: X 1,..., X n iid F θ. Gesucht: U = U(X 1,..., X n ), O = O(X 1,..., X n ), sodass für das wahre θ gilt P θ (U θ O) = 1 α, α (0, 1). Das Intervall [U, O] ist ein Konfidenzintervall
MehrDer χ 2 -Test. Überblick. Beispiel 1 (χ 2 -Anpassungstest)
Der χ 2 -Test Überblick Beim χ 2 -Test handelt es sich um eine Familie ähnlicher Tests, die bei nominal- oder ordinalskalierten Merkmalen mit zwei oder mehr Ausprägungen angewendet werden können. Wir behandeln
Mehr2 Wiederholung statistischer Grundlagen Schließende Statistik empirischen Information aus Stichprobenrealisation x von X
Hypothesentests Bisher betrachtet: Punkt- bzw. Intervallschätzung des unbekannten Mittelwerts Hierzu: Verwendung der 1 theoretischen Information über Verteilung von X empirischen Information aus Stichprobenrealisation
Mehr3. Das Prüfen von Hypothesen. Hypothese?! Stichprobe Signifikanztests in der Wirtschaft
3. Das Prüfen von Hypothesen Hypothese?! Stichprobe 3.1. Signifikanztests in der Wirtschaft Prüfung, ob eine (theoretische) Hypothese über die Verteilung eines Merkmals X und ihre Parameter mit einer (empirischen)
MehrDer χ2-test Der χ2-test
Der χ 2 -Test Überblick Beim χ 2 -Test handelt es sich um eine Familie ähnlicher Tests, die bei nominal- oder ordinalskalierten Merkmalen mit zwei oder mehr Ausprägungen angewendet werden können. Wir behandeln
MehrDie Familie der χ 2 (n)-verteilungen
Die Familie der χ (n)-verteilungen Sind Z 1,..., Z m für m 1 unabhängig identisch standardnormalverteilte Zufallsvariablen, so genügt die Summe der quadrierten Zufallsvariablen χ := m Z i = Z 1 +... +
MehrDie Familie der χ 2 (n)-verteilungen
Die Familie der χ (n)-verteilungen Sind Z 1,..., Z m für m 1 unabhängig identisch standardnormalverteilte Zufallsvariablen, so genügt die Summe der quadrierten Zufallsvariablen χ := m Z i = Z 1 +... +
MehrDWT 2.1 Maximum-Likelihood-Prinzip zur Konstruktion von Schätzvariablen 330/467 Ernst W. Mayr
2.1 Maximum-Likelihood-Prinzip zur Konstruktion von Schätzvariablen Wir betrachten nun ein Verfahren zur Konstruktion von Schätzvariablen für Parameter von Verteilungen. Sei X = (X 1,..., X n ). Bei X
MehrKapitel 13. Grundbegriffe statistischer Tests
Kapitel 13 Grundbegriffe statistischer Tests Oft hat man eine Vermutung über die Verteilung einer Zufallsvariablen X. Diese Vermutung formuliert man als Hypothese H 0.Sokönnte man daran interessiert sein
MehrStatistik II. Version A. 1. Klausur Sommersemester 2011 Hamburg, BITTE LESERLICH IN DRUCKBUCHSTABEN AUSFÜLLEN!
Statistik II Version A 1. Klausur Sommersemester 2011 Hamburg, 27.07.2011 BITTE LESERLICH IN DRUCKBUCHSTABEN AUSFÜLLEN! Nachname:............................................................................
MehrPrüfung aus Statistik 2 für SoziologInnen
Prüfung aus Statistik 2 für SoziologInnen 11. Oktober 2013 Gesamtpunktezahl =80 Name in Blockbuchstaben: Matrikelnummer: Wissenstest (maximal 16 Punkte) Kreuzen ( ) Sie die jeweils richtige Antwort an.
MehrVergleich von Gruppen I
Vergleich von Gruppen I t-test und einfache Varianzanalyse (One Way ANOVA) Werner Brannath VO Biostatistik im WS 2006/2007 Inhalt Der unverbundene t-test mit homogener Varianz Beispiel Modell Teststatistik
MehrStatistische Tests für unbekannte Parameter
Konfidenzintervall Intervall, das den unbekannten Parameter der Verteilung mit vorgegebener Sicherheit überdeckt ('Genauigkeitsaussage' bzw. Zuverlässigkeit einer Punktschätzung) Statistischer Test Ja-Nein-Entscheidung
MehrLösungen zur Biomathe-Klausur Gruppe B Montag, den 16. Juli 2001
Lösungen zur Biomathe-Klausur Gruppe B Montag, den 16. Juli 2001 1. α-fehler und ß-Fehler Welche Aussage ist richtig? A. Der ß-Fehler ist unabhängig von α-fehler. Falsch. Je größer der α-fehler, umso kleiner
MehrParametrische vs. Non-Parametrische Testverfahren
Parametrische vs. Non-Parametrische Testverfahren Parametrische Verfahren haben die Besonderheit, dass sie auf Annahmen zur Verteilung der Messwerte in der Population beruhen: die Messwerte sollten einer
MehrEinführung in die Induktive Statistik: Testen von Hypothesen
Einführung in die Induktive Statistik: Testen von Hypothesen Jan Gertheiss LMU München Sommersemester 2011 Vielen Dank an Christian Heumann für das Überlassen von TEX-Code! Testen: Einführung und Konzepte
MehrR. Brinkmann Seite
R. Brinkmann http://brinkmann-du.de Seite 1 17.3.21 Grundlagen zum Hypothesentest Einführung: Wer Entscheidungen zu treffen hat, weiß oft erst im nachhinein ob seine Entscheidung richtig war. Die Unsicherheit
MehrSTATISTIK Teil 2 Wahrscheinlichkeitsrechnung und schließende Statistik
Kapitel 15 Statistische Testverfahren 15.1. Arten statistischer Test Klassifikation von Stichproben-Tests Einstichproben-Test Zweistichproben-Test - nach der Anzahl der Stichproben - in Abhängigkeit von
MehrKlausur zu Statistik II
Goethe-Universität Frankfurt Prof. Dr. Uwe Hassler FB Wirtschaftswissenschaften Sommersemester 2005 Klausur zu Statistik II Version B Bitte tragen Sie hier und auf den Lösungsblättern (oben links) Ihre
MehrStatistik II. Statistische Tests. Statistik II
Statistik II Statistische Tests Statistik II - 5.5.2006 1 Ausgangslage Wir können Schätzen (z.b. den Erwartungswert) Wir können abschätzen, wie zuverlässig unsere Schätzungen sind: In welchem Intervall
MehrPrüfgröße: Ist die durch eine Schätzfunktion zugeordnete reelle Zahl (etwa Mittelwert 7 C).
Statistik Grundlagen Charakterisierung von Verteilungen Einführung Wahrscheinlichkeitsrechnung Wahrscheinlichkeitsverteilungen Schätzen und Testen Korrelation Regression Einführung Aus praktischen Gründen
MehrPrüfung aus Wahrscheinlichkeitstheorie und Statistik MASCHINENBAU 2002
Prüfung aus Wahrscheinlichkeitstheorie und Statistik MASCHINENBAU 2002 1. Ein Chemiestudent hat ein Set von 10 Gefäßen vor sich stehen, von denen vier mit Salpetersäure Stoff A), vier mit Glyzerin Stoff
Mehr7. Übung: Aufgabe 1. b), c), e) Aufgabe 2. a), c), e) Aufgabe 3. c), e) Aufgabe 4. Aufgabe 5. Aufgabe 6. Aufgabe 7. Aufgabe 8. Aufgabe 9.
7. Übung: Aufgabe 1 b), c), e) Aufgabe a), c), e) Aufgabe 3 c), e) Aufgabe 4 b) Aufgabe 5 a) Aufgabe 6 b) Aufgabe 7 e) Aufgabe 8 c) Aufgabe 9 a), c), e) Aufgabe 10 b), d) Aufgabe 11 a) Aufgabe 1 b) Aufgabe
MehrAnalyse 2: Hypothesentests
Analyse 2: Hypothesentests Ashkan Taassob Andreas Reisch Inhalt Motivation Statistischer Hintergrund Hypothese Nullhypothesen Alternativhypothesen Fehler beim Hypothesentesten Signifikanz-LEVEL und P-value
MehrStatistische Tests für unbekannte Parameter
Konfidenzintervall Intervall, das den unbekannten Parameter der Verteilung mit vorgegebener Sicherheit überdeckt ('Genauigkeitsaussage' bzw. Zuverlässigkeit einer Punktschätzung) Statistischer Test Ja-Nein-Entscheidung
MehrDie Stochastischen Eigenschaften von OLS
Die Stochastischen Eigenschaften von OLS Das Bivariate Modell Thushyanthan Baskaran thushyanthan.baskaran@awi.uni-heidelberg.de Alfred Weber Institut Ruprecht Karls Universität Heidelberg Wiederholung
MehrI.V. Methoden 4: Regressionsund Pfadanalyse WiSe 02/03
I.V. Methoden 4: Regressionsund Pfadanalyse WiSe 02/03 Vorlesung: 12.11.2002 He uses statistics as a drunken man use lampposts - for support rather than for illumination. Andrew Lang Dr. Wolfgang Langer
MehrAlternative Darstellung des 2-Stcihprobentests für Anteile
Alternative Darstellung des -Stcihprobentests für Anteile DCF CF Total n 111 11 3 Response 43 6 69 Resp. Rate 0,387 0,3 0,309 Bei Gültigkeit der Nullhypothese Beobachtete Response No Response Total absolut
MehrJost Reinecke. 7. Juni 2005
Universität Bielefeld 7. Juni 2005 Testtheorie Test für unabhängige Stichproben Test für abhängige Stichproben Testtheorie Die Testtheorie beinhaltet eine Reihe von Testverfahren, die sich mit der Überprüfung
MehrStatistik Klausur Sommersemester 2013 Hamburg, BITTE LESERLICH IN DRUCKBUCHSTABEN AUSFÜLLEN!
Statistik 2 1. Klausur Sommersemester 2013 Hamburg, 26.07.2013 A BITTE LESERLICH IN DRUCKBUCHSTABEN AUSFÜLLEN! Nachname:............................................................................ Vorname:.............................................................................
Mehr0 sonst. a) Wie lautet die Randwahrscheinlichkeitsfunktion von Y? 0.5 y = 1
Aufgabe 1 (2 + 2 + 2 + 1 Punkte) Gegeben sei folgende gemeinsame Wahrscheinlichkeitsfunktion f(x, y) = P (X = x, Y = y) der Zufallsvariablen X und Y : 0.2 x = 1, y = 1 0.3 x = 2, y = 1 f(x, y) = 0.45 x
MehrLösungen zum Aufgabenblatt 14
Lösungen zum Aufgabenblatt 14 61. Das Gewicht von Brötchen (gemessen in g) sei zufallsabhängig und werde durch eine normalverteilte Zufallsgröße X N(µ, 2 ) beschrieben, deren Varianz 2 = 49 g 2 bekannt
Mehr73 Hypothesentests Motivation Parametertest am Beispiel eines Münzexperiments
73 Hypothesentests 73.1 Motivation Bei Hypothesentests will man eine gewisse Annahme über eine Zufallsvariable darauf hin überprüfen, ob sie korrekt ist. Beispiele: ( Ist eine Münze fair p = 1 )? 2 Sind
MehrHypothesentest, ein einfacher Zugang mit Würfeln
R. Brinkmann http://brinkmann-du.de Seite 4..4 ypothesentest, ein einfacher Zugang mit Würfeln Von einem Laplace- Würfel ist bekannt, dass bei einmaligem Wurf jede einzelne der Zahlen mit der Wahrscheinlichkeit
MehrKlassifikation von Signifikanztests
Klassifikation von Signifikanztests Nach Verteilungsannahmen: verteilungsabhängig: parametrischer [parametric] Test verteilungsunabhängig: nichtparametrischer [non-parametric] Test Bei parametrischen Tests
MehrR. Brinkmann Seite
R. Brinkmann http://brinkmann-du.de Seite 1 24.2.214 Grundlagen zum Hypothesentest Einführung: Wer Entscheidungen zu treffen hat, weiß oft erst im nachhinein ob seine Entscheidung richtig war. Die Unsicherheit
MehrKlausur zu Methoden der Statistik II (mit Kurzlösung) Sommersemester Aufgabe 1
Lehrstuhl für Statistik und Ökonometrie der Otto-Friedrich-Universität Bamberg Prof. Dr. Susanne Rässler Klausur zu Methoden der Statistik II (mit Kurzlösung) Sommersemester 2013 Aufgabe 1 In einer Urne
MehrBrückenkurs Statistik für Wirtschaftswissenschaften
Peter von der Lippe Brückenkurs Statistik für Wirtschaftswissenschaften Weitere Übungsfragen UVK Verlagsgesellschaft mbh Konstanz Mit UVK/Lucius München UVK Verlagsgesellschaft mbh Konstanz und München
MehrStatistik II. IV. Hypothesentests. Martin Huber
Statistik II IV. Hypothesentests Martin Huber 1 / 22 Übersicht Weitere Hypothesentests in der Statistik 1-Stichproben-Mittelwert-Tests 1-Stichproben-Varianz-Tests 2-Stichproben-Tests Kolmogorov-Smirnov-Test
MehrLösungen zu den Übungsaufgaben in Kapitel 10
Lösungen zu den Übungsaufgaben in Kapitel 10 (1) In einer Stichprobe mit n = 10 Personen werden für X folgende Werte beobachtet: {9; 96; 96; 106; 11; 114; 114; 118; 13; 14}. Sie gehen davon aus, dass Mittelwert
MehrEinführung in Quantitative Methoden
Einführung in Quantitative Methoden Pantelis Christodoulides & Karin Waldherr 4. Juni 2014 Christodoulides / Waldherr Einführung in Quantitative Methoden 1/35 Ein- und Zweiseitige Hypothesen H 0 : p =
MehrWS 2014/15. (d) Bestimmen Sie die Wahrscheinlichkeitsfunktion von X. (e) Bestimmen Sie nun den Erwartungswert und die Varianz von X.
Fragenkatalog zur Übung Methoden der empirischen Sozialforschung WS 2014/15 Hier finden Sie die denkbaren Fragen zum ersten Teil der Übung. Das bedeutet, dass Sie zu diesem Teil keine anderen Fragen im
MehrStatistische Methoden in den Umweltwissenschaften
Statistische Methoden in den Umweltwissenschaften Korrelationsanalysen Kreuztabellen und χ²-test Themen Korrelation oder Lineare Regression? Korrelationsanalysen - Pearson, Spearman-Rang, Kendall s Tau
Mehrdas Kleingedruckte...
Gepaarte t-tests das Kleingedruckte... Datenverteilung ~ Normalverteilung QQ-plot statistischer Test (Shapiro-Wilk, Kolmogorov-Smirnov) wenn nicht : nicht-parametrische Tests gleiche Varianz (2-Proben
MehrWirtschaftswissenschaftliches Prüfungsamt Bachelor-Studiengang Schließende Statistik Sommersemester Namensschild
Wirtschaftswissenschaftliches Prüfungsamt Bachelor-Studiengang Schließende Statistik Sommersemester 2010 Namensschild Prof. Dr. Ralph Friedmann / Dr. Martin Becker Hinweise für die Klausurteilnehmer ˆ
MehrStatistik II. Statistische Tests. Statistik II
Statistik II Statistische Tests Statistik II - 12.5.2006 1 Test auf Anteilswert: Binomialtest Sei eine Stichprobe unabhängig, identisch verteilter ZV (i.i.d.). Teile diese Stichprobe in zwei Teilmengen
MehrDr. W. Kuhlisch Dresden, Institut für Mathematische Stochastik
Dr. W. Kuhlisch Dresden, 12. 08. 2014 Institut für Mathematische Stochastik Klausur Statistik für Studierende der Fachrichtungen Hydrologie und Altlasten/Abwasser zugelassene Hilfsmittel: Taschenrechner
MehrBivariater Zusammenhang in der Vierfeldertafel PEΣO
Bivariater Zusammenhang in der Vierfeldertafel PEΣO 12. Oktober 2001 Zusammenhang zweier Variablen und bivariate Häufigkeitsverteilung Die Bivariate Häufigkeitsverteilung gibt Auskunft darüber, wie zwei
MehrKlausur zu Methoden der Statistik II (mit Kurzlösung) Wintersemester 2013/2014. Aufgabe 1
Lehrstuhl für Statistik und Ökonometrie der Otto-Friedrich-Universität Bamberg Prof. Dr. Susanne Rässler Klausur zu Methoden der Statistik II (mit Kurzlösung) Wintersemester 2013/2014 Aufgabe 1 Der Fußballprofi
Mehr4.1. Verteilungsannahmen des Fehlers. 4. Statistik im multiplen Regressionsmodell Verteilungsannahmen des Fehlers
4. Statistik im multiplen Regressionsmodell In diesem Kapitel wird im Abschnitt 4.1 zusätzlich zu den schon bekannten Standardannahmen noch die Annahme von normalverteilten Residuen hinzugefügt. Auf Basis
MehrBiometrieübung 11 Kontingenztafeln
Biometrieübung 11 (Kontingenztafeln) - Aufgabe Biometrieübung 11 Kontingenztafeln Aufgabe 1 2x2-Kontingenztafeln 100 weibliche Patienten sind mit einer konventionellen Therapie behandelt worden 85 Patientinnen
MehrGüteanalyse. Nochmal zur Erinnerung: Hypothesentest. Binominalverteilung für n=20 und p=0,5. Münzwurf-Beispiel genauer
Universität Karlsruhe (TH) Forschungsuniversität gegründet 1825 Güteanalyse Prof. Walter F. Tichy Fakultät für Informatik 1 Fakultät für Informatik 2 Nochmal zur Erinnerung: Hypothesentest Am Beispiel
MehrZweiseitiger Test für den unbekannten Mittelwert µ einer Normalverteilung bei unbekannter Varianz
Grundlage: Zweiseitiger Test für den unbekannten Mittelwert µ einer Normalverteilung bei unbekannter Varianz Die Testvariable T = X µ 0 S/ n genügt der t-verteilung mit n 1 Freiheitsgraden. Auf der Basis
MehrSchätzen und Testen von Populationsparametern im linearen Regressionsmodell PE ΣO
Schätzen und Testen von Populationsparametern im linearen Regressionsmodell PE ΣO 4. Dezember 2001 Generalisierung der aus Stichprobendaten berechneten Regressionsgeraden Voraussetzungen für die Generalisierung
Mehr