Skriptteufel Klausurworkshop Statistik Teil 1 - Handout 01.07.2016 1
Inhalt Sieben Aufgabentypen mit Lösungsweg Häufigkeiten Regression (2 Typen) Dichte und Verteilungsfunktionen Beweise Lösungswege für die Beweise sind von der Tafel abzuschreiben 01.07.2016 2
Aufgabentyp 1 geg.: Graphik und Merkmalsdefinitionen ges.(meist): Angabe der Merkmalsart In statistischer Def. angegebene Häufigkeiten Berechnung und Interpretation bedingter Häufigkeiten Berechnung und Interpretation eines beliebigen Maßes (meist Streuung oder Assoziation) (Anwendungsfrage) 01.07.2016 3
Lösungswege 1. Erstelle Kontingenztabelle aus der Graphik a) Version 1: absolute Häufigkeiten in der Graphik gegeben -> Abschreiben der Daten b) Version 2: Bedingte Häufigkeiten im Kreisdiagramm gegeben mit Angabe der Randhäufigkeiten für ein Merkmal -> Multiplikation der bed. Häufigkeiten mit Randhäufigkeit ergibt gemeinsame Häufigkeit c) Version 3: Kombination aus beiden Typen -> Übernehmen der bekannten absoluten Zahlen mithilfe der relativen Angaben Lücken auffüllen 01.07.2016 4
Lösungswege 2. Ermitteln der gefragten Häufigkeiten mithilfe der Kontingenztabelle 3. Bedingte Häufigkeiten Formulierung: 01.07.2016 5
Lösungswege 4. Maße: a) Streuung: Zunächst benötigte Häufigkeiten in einer Excelzeile aufschreiben. Dann =1-Quadratesumme(Wert1;Wert2; ). Für die Normierung =Ergebnis/(1-1/Anzahl) mit Anzahl= Anzahl der Merkmalausprägungen b) Assoziation: a) Indifferenztabelle erstellen, hier auf die Fixierung der Zellen achten! b) Hilfstabelle erstellen =Quadrat(alter Wert- Indifferenzwert)/Indifferenzwert c) =Summe(alle Werte der Hilfstabelle)/n Teilen durch n nur bei absoluten Werten, bei relativen nicht nötig d) Normierung: Merkmal mit geringerer Anzahl an Ausprägungen auswählen, dann =Wurzel(Ergebnis/Anzahl-1), Anzahl= Anzahl der Ausprägungen des gewählten Merkmals c) Interpretation: Meist Vergleich von zwei Maßen oder Frage nach stat. Unabhängigkeit (nur dann, wenn Kontingenzmaß = 0) 01.07.2016 6
Lösungswege 5. Verschiedene Fragetypen: a) Gegeben stat. Unabhängigkeit: Welche Aussagen sind wahr? Formelsammlung!!!! b) Gegeben stat. Unabhängigkeit: Frage nach einer hypothetischen gemeinsamen Häufigkeit -> Berechnung wie bei Indifferenztabelle 01.07.2016 7
Aufgabentyp 7 (Varianz/Kovarianz Beweis) 01.07.2016 8
Aufgabentyp 3 (Regression) geg.: Datenwerte für X und Y, mit Y=a 0 +a 1 X ges.: (Mittelwert, Varianz für X und Y berechnen) a 0,a 1 bestimmen, Bestimmtheitsmaß bestimmen Werte interpretieren Neue Werte für X und Y auf Basis der Gerade schätzen 01.07.2016 9
Lösungswege 1. Daten in Exceltabelle übertragen a) =Mittelwert(Wert1;Wert2; ) b) =Varianzen(Wert1;Wert2; ) c) =Kovar(Matrix1;Matrix2) 2. Punktdiagramm erstellen a 0, a 1, R 2 ablesen a) Daten markieren b) Einfügen -> Punktdiagramm c) Rechtsklick auf Datenpunkt -> Trendlinie -> Haken bei Linear, Trendlinie im Diagramm anzeigen, Bestimmtheitsmaß im Diagramm anzeigen 01.07.2016 10
Lösungswege 3. Interpretation a) a 0 : Wert den Y annimmt, wenn X=0 ist b) a 1 : Zuwachs(oder Abnahme) von Y, wenn X um 1 steigt c) R 2 : Maß für die Güte der Anpassung der Gerade zwischen 0 und 1 je näher an 1, desto besser die Anpassung 4. Werte schätzen a) Gefragt nach Y: Setze gegebenes X in Y=a 0 +a 1 X ein und rechne Y aus b) Gefragt nach X: Setze gegebenes Y in X= (Y-a 0 )/a 1 ein und rechne X aus 01.07.2016 11
Aufgabentyp 4 (Regression) geg.: a 0, a 1, R 2 und Y=a 0 +a 1 X ges.: Gerade einzeichnen Interpretation der Koeffizienten Bezug zu Korrelationskoeffizienten und Kovarianz 01.07.2016 12
Lösungsweg 1. Koordinatenkreuz zeichnen (sinnvolle Beschriftungen wählen) a) a 0 auf der y-achse eintragen b) Beliebigen(möglichst einfach: 1, 10, 100) Wert für X einsetzen, Y ausrechnen, Wertepaar einzeichnen c) Beide Punkte verbinden -> fertig 2. Siehe letzter Aufgabentyp 3. Bezüge a) VZ der Kovarianz= VZ des Korrelationskoeffizienten = VZ von a 1 b) Korrelationskoeffizient²=Bestimmtheitsmaß c) Korrelationskoeffizient gibt Richtung und Stärke an (wg Normierung zwischen -1 und 1) d) Kovarianz gibt nur die Richtung an (bzw. Stärke auch, aber nicht vergleichbar) e) Achtung: Aus Unkorreliertheit folgt NICHT Unabhängigkeit! 01.07.2016 13
Aufgabentyp 5 (Regression Beweistyp 1) 01.07.2016 14
Aufgabentyp 6 (Regression Beweistyp 2) 01.07.2016 15
Aufgabentyp 2 (Dichte & Verteilung) geg.: meist vier Graphiken: 1 Dichte & 3 Verteilung oder andersherum ges.: Zusammengehörige Graphiken Wert für Median oder gewisse Quantile Gewisse Wahrscheinlichkeiten Interpretation zu Mittelwert und Median 01.07.2016 16
Lösungswege 1. Betrachten der Graphiken: a) Graph der VF schnell an 1, kaum Veränderung am Ende -> DF am Anfang groß, dann schnell abfallend, klein am Ende b) Graph der VF wenig Veränderung am Anfang, erst am Ende zur 1 -> DF am klein, dann rasch ansteigend, groß am Ende c) Graph der VF relativ gleichmäßig Steigung -> DF wie eine Konstante d) Graph der VF lange nah an 0, schnelle Steigung, dann lange nah an 1 -> DF Glockenkurve, Mittelpunkt da, wo die schnelle Steigung ist 01.07.2016 17
Lösungswege 2. Verteilungsfunktion nehmen (oder, falls Dezilein Dichtefunktion eingezeichnet sind, Dichtefunktion) a) Median: a) VF: an der vertikalen Achse 0,5 markieren, zum Graph gehörigen Punkt auf der horizontalen Achse ist der Median b) DF: 5. Dezilmarkieren, zugehöriger Wert auf der horizontalen Achse ist der Median b) Quantile: analog, nur anstatt 0,5 bzw. 5. Dezil entsprechend anpassen! 01.07.2016 18
Lösungswege 3. mehr als, weniger als, mind., höchst. in der Aufgabenstellung -> VF benutzen a) mehr als x : x auf der horizontalen Achse markieren, Wert an der vertikalen Achse ablesen, dann: 1- Wert b) weniger als x : x-1 auf der horizontalen Achse markieren, Wert an der vertikalen Achse ablesen fertig. c) mind. x : x-1 markieren, Wert ablesen, dann: 1-Wert d) höchst. x : x markieren, Wert ablesen fertig. 4. genau, gerade in der Aufgabenstellung: -> DF benutzen: Wert auf horizontaler Achse markieren, vertikalen Wert ablesen fertig. 5. Achtung bei stetigen DF oder VF: a) Mind. = mehr als b) Höchst = weniger als c) Wahrscheinlichkeit eines exakten Punktes = 0! 6. zwischen x und y VF benutzen: weniger als y/höchst. y weniger als x/höchst x rechnen je nach dem, ob x und y mit einbezogen werden sollen oder nicht! 01.07.2016 19
Lösungswege 1. Typische Frage: Der Mittelwert ist geringer als der Median richtig oder falsch? 2. Überprüfe DF: Linkssteil oder rechtsteil? a) DF Linkssteil Median <Mittelwert b) DF rechtsteil Median > Mittelwert c) DF symmetrisch Median Mittelwert 01.07.2016 20