Modul G.1 WS 07/08: Statistik
|
|
- Hanna Schmitt
- vor 7 Jahren
- Abrufe
Transkript
1 Modul G.1 WS 07/08: Statistik Test Anwendungen Der 2 Test ist eine Klasse von Verfahren für Nominaldaten, wobei die Verteilung der beobachteten Häufigkeiten auf zwei mehrfach gestufte Variablen betrachtet wird. Mit dem 2 Test berechnet man, ob es Unterschiede zwischen den beobachteten und den nach der Nullhypothese zu erwartenden Unterschieden gibt. Voraussetzungen Es müssen Beobachtungen aus unabhängigen Zufallsstichproben vorliegen, wobei die erwarteten Häufigkeiten in den Zellen nicht zu klein sein dürfen. Das Verfahren sollte nur eingesetzt werden, wenn: 1. weniger als 1 aller Zellen eine erwartete Häufigkeit kleiner 5 haben und 5 2. keine Zelle eine erwartete Häufigkeit kleiner 1 aufweist. Beispiel In der Kieler Innenstadt wurden Männer und Frauen beobachtet und gezählt, wie viele bei Regen einen Schirm benutzen oder nicht. Fragen Was sind Nominaldaten bzw. nominalskalierte Daten? Was ist eine zweifach gestufte Variable? Warum können wir für die obige Stichprobe keinen t-test oder z-test rechnen? Tabelle I: 4-Felder-Tafel der Beobachtungen im Beispiel Frauen Männer Zeilensumme mit Schirm ohne Schirm Spaltensumme Frage: Ist der Unterschied in den Häufigkeiten der Schirmbenutzung bei Frauen und Männern signifikant unterschiedlich oder zufällig? Herleitung: Beim 2 Test werden zunächst bei Gültigkeit der Nullhypothese über die Randsummen die bei Gleichverteilung zu erwartenden Häufigkeiten geschätzt. Es ergibt sich die folgende Tabelle:
2 Modul G.1 WS 07/08: Statistik Tabelle II: Darstellung der Randsummen Frauen Männer Zeilensumme mit Schirm 45 ohne Schirm 75 Spaltensumme Die nach der Nullhypothese zu erwartenden Häufigkeiten für die einzelnen Zeilen sind über die folgende Gleichung zu berechnen: fe (j,k) = f (erwartetes j,k) = Anza hl Aj N * Anza hl Bk N * N = Zeilensumme j Spaltensumme (k) N Die Anzahl Aj beschreibt die absolute erwartete Häufigkeit für die j-te Kategorie des ersten Merkmals und ist somit die absolute erwartete Häufigkeit für das Tragen eines Schirms mit 45 Beobachtungen. Analog dazu beschreibt die Abzahl Bk die Häufigkeiten für das Geschlecht. So ergeben sich pro Zelle die folgenden Erwartungswerte: Frauen Männer Zeilensumme mit Schirm = 18, = 26, ohne Schirm = 31, = 43, Spaltensumme Vergleicht man die Häufigkeiten fe (j,k) mit den beobachteten Werten fb (j,k), so zeigt sich Zellenweise eine Differenz. Mit Hilfe des 2 Tests kann nun bestimmt werden, ob diese Unterschiede signifikant sind. Anmerkung Der hier vorgestellte Vierfelder- 2 Test ist auf beliebig viele Felder erweiterbar. So könnte auch untersucht werden, ob sich Psychologie-, Jura- und Germanistikstudierende in der relativen Häufigkeit des Schirmtragens unterscheiden.
3 Modul G.1 WS 07/08: Statistik Die Freiheitsgrade lassen sich über die Anzahl der Zellen mit frei variierbaren Häufigkeiten veranschaulichen. Da innerhalb einer Spalte die Summe der Zeilen immer der Randsumme entsprechen muss, sind p 1 Zeilensummen frei variierbar. Analog dazu sind q 1 Spaltensummen frei wählbar, da auch hier pro Zeile die Summe der Spalten die jeweilige Randsumme ergeben muss. Damit sind (p 1) * (q - 1) Zellenhäufigkeiten frei. Im Beispiel ergibt sich folgender 2 Wert: 2 = (30 18,75)2 18,75 + (15 25,25)2 26,25 + (20 31,25)2 31,25 + (55 43,75)2 43,75 = 6,75 + 4,82 + 4,05 + 2,30 = 17,92 Bei einem Freiheitsgrad von (2-1) * (2-1) = 1 ist den 2 entsprechenden Tabellen (z.b. B.16 und B.17 (Leonhart 2004)) bei einem α-niveau von 5% ein kritischer Wert von 3,84146 zu entnehmen. Da der berechnete 2 Wert größer als der kritische Wert in der Tabelle ausfällt, ist in diesem Beispiel auf signifikante Unterschiede in der Schirmbenutzung zwischen Männern und Frauen zu schließen. Anmerkung Da beim 2 Test ausschließlich bei einem Freiheitsgrad von 1 gerichtete Hypothesen möglich sind, werden die meisten Tabellen für kritische Werte für ungerichtete Hypothesen erstellt. Soll bei einem Freiheitsgrad von 1 eine gerichtete Hypothese getestet werden, so ist bei einem α-niveau von 5% der kritische 2 Wert der Fläche von 0,90 zugrundezulegen. Fragen Formuliere sämtliche Hypothesen für obiges Beispiel. Warum gehen nur ungerichtete Hypothesen bei mehr als vier Feldern? Wie können wir gerichtete Hypothesen testen, wenn wir mehr als vier Felder haben? Phonetisches Beispiel mit mehr als vier Feldern?
4 RMS [db] Modul G.1 WS 07/08: Statistik Korrelation und Regression Zusammenhang zwischen mehreren kontinuierlichen Variablen. Z.B: Haben überdurchschnittlich gute Psychologiestudenten auch eine überdurchschnittliche soziale Kompetenz? Wenn ja: positiver Zusammenhang. Falls das Gegenteil der Fall ist (da die besonders guten Studenten ihre ganze Zeit mit Lernen verbracht haben) gibt es einen negativen Zusammenhang. Frage Interpretiere folgende Abbildung F1 [Hz] Frage: Weitere Beispiele für Zusammenhänge zwischen Variablen? Andere Beispiele: 1. Körpergröße Körpergewicht, 2. Zungenhöhe und Gaumenkontakt, 3. Frequenzwerte von F1 und f0
5 Modul G.1 WS 07/08: Statistik Kovarianz = Maß für den linearen Zusammenhang zwischen zwei Variablen X und Y (covariance). Zähler: Summe der Abweichungen vom Mittelwert für Variable X multipliziert mit den Abweichungen für Y. Fall 1: Beide Messwerte weichen stark positiv oder stark negativ von ihren Mittelwerten ab Produkt positiv Fall 2: Ein Messwert weicht negativ und der andere positiv von den Mittelwerten ab Produkt ist negativ Verhalten sich nun alle Differenzen einheitlich, d.h. sind sie für einen vorgegebenen Zusammenhang alle positiv oder negativ, so wird der Betrag der Summe größer als bei ständig wechselnden Vorzeichen. Nenner: Division durch die Anzahl der Messwerte ist notwendig, da die Summe automatisch größer wird, je mehr Messwerte in die Berechnung eingehen. Für Stichproben wird durch (n 1) geteilt. Die Kovarianz kann theoretisch unendlich große positive oder negative Werte annehmen und ist damit schwierig zu interpretieren. Ein positiver Zusammenhang ist vorhanden, wenn mit höherer Ausprägung in der Variablen X auch eine höhere Ausprägung in der Variablen Y gegeben ist. Beispiel Zusammenhang zwischen Alter und benutzter Wortmenge bei Kleinkindern. Mit höherem Alter verwenden Kinder mehr Wörter. Für eine untersuchte Stichprobe gilt: Überdurchschnittlich alte Kinder verwenden mehr Wörter als durchschnittlich alte Kinder. Umkehrschluss: Kinder die weniger Wörter als der Durchschnitt verwenden sind vermutlich auch unter dem Altersdurchschnitt. Fragen Beispiel für negativen Zusammenhang? Beispiel für keinen Zusammenhang? Achtung Kovarianzen erlauben nur Aussagen über stochastische Zusammenhänge zwischen Variablen. Es können aus Kovarianzen keine Kausalaussagen abgeleitet werden. Unzulässige Kausalaussage: Je höher die Ausprägung im Merkmal A, desto höher muss auch die Ausprägung im Merkmal B sein.
6 Modul G.1 WS 07/08: Statistik Problem Die Kovarianz ist stark vom Maßstab der Daten abhängig (z.b. bei Gewichtsangaben in Gramm vs. Kilo vs. Tonnen). Dieser Maßstab beeinflusst neben der Varianz auch die Kovarianz. Lösung Standardisierung der Kovarianz s yx an der Standardabweichung der beiden Variablen. Daraus folgt der Korrelationskoeffizient. Ähnlich: z-transformation. Hier entsteht durch Normierung eine z-verteilung mit dem Mittelwert 0 und der Streuung 1. Berechnung der z-scores: z i =(x i - x )/s x. So entsteht Vergleichbarkeit zwischen Datensätzen, die sich in Mittelwert und Standardabweichung unterscheiden. Korrelation Die Korrelation ist ein standardisiertes Maß für den linearen Zusammenhangzwischen zwei Variablen. Die Kovarianz ist stark vom Maßstab der Daten abhängig. Die Korrelation hingegen nimmt stets Werte zwischen 1 und -1 an. Damit sind Korrelationskoeffizienten r xy (auch ρ (gesprochen roh)) normierte Kennwerte, die besser zu vergleichen sind als Kovarianzen und außerdem besser interpretierbar sind. Produkt-Moment Korrelation Interaktive Beispiele zur Punkt-Moment-Korrelation: a. Graphische Darstellung der Produkt-Moment-Korrelation b. Unsinnige Zusammenhänge
7 Modul G.1 WS 07/08: Statistik Voraussetzungen für Produkt-Moment Korrelation: 1. Beide Variablen müssen intervallskaliert sein. 2. Beide Variablen müssen normalverteilt sein. 3. Der Zusammenhang zwischen beiden Variablen sollte linear sein. 4. Homoskedastizität: für alle Individuen i, die ein gleiches x i haben, müssen die entsprechenden y i normalverteilt sein. Andere Korrelationskoeffizienten (vgl. Tabelle 11.1 in Leonhart): 1) Spearmans Rangkorrelation: Alle Beobachtungen werden durch ihren Rang ersetzt. Verwendung: wenn keine Normalverteilung vorliegt, bei kleinem N, Voraussetzung: die Daten müssen mindestens ordinalskaliert sein. Nachteil: sehr anfällig für Ausreißer. 2) Kendalls τ: die übereinstimmenden und nicht-übereinstimmenden Paare werden gezählt. Übereinstimmendes Paar = Differenz der x Koordinate hat gleiches Vorzeichen wie die Differenz der y Koordinate. Verwendung: bei ordinalskalierten Daten mit vielen Ausreißern Nachteil: Da dabei alle Ränge miteinander verglichen werden, ist der Rechenaufwand sehr hoch. Interpretation r = -1 negative Winkelhalbierende, perfekter Zusammenhang, kommt in der Sozialwissenschaft nicht vor. Wenn r = -1 zu beobachten ist, ist eine Berechnung der Korrelation normalerweisen nicht sinnvoll (Bsp.: Zusammenhang von Körpergröße und Abstand zu einer 2,50 hohen Zimmerdecke) -1 < r < 0 negative Korrelation negativ gerichtete Punktwolke, je größer x umso kleiner y z.b. Intelligenzquotient und Lösungszeit für eine Aufgabe, f0 und F1 bei Vokalen r = 0 ca. kreisförmige Punktwolke es existiert kein Zusammenhang zwischen den Variablen 0 < r < 1 positive Korrelation positiv gerichtete Punktwolke, je größer y umso größer x z.b. Körpergröße und Körpergewicht, Körpergröße und f0 r = 1 positive Winkelhalbierende, siehe r = -1. JE NÄHER DER KORRELATIONSKOEFFIZIENT BEI 1 ODER -1 LIEGT UND JE SCHMALER DIE PUNKTWOLKE, DESTO DEUTLICHER ODER AUSGEPRÄGTER IST DER ZUSAMMENHANG ZWISCHEN ZWEI VARIABLEN
8 Modul G.1 WS 07/08: Statistik Vorsicht vor Fehlinterpretationen: Auch aus einer hohen Korrelation darf kein kausaler Zusammenhang geschlossen werden!!! Signifikanzprüfung Nullhypothese: Der Stichprobenkorrelationskoeffizient unterscheidet sich nicht signifikant von 0 (=Populationskorrelationskoeffizient). Alternativhypothese: r 0 Zur Überprüfung wird wiederum ein t-test verwendet. Vorsicht: Bei großen Stichproben werden auch niedrige Korrelationskoeffizienten leicht signifikant
Chi-Quadrat Verfahren
Chi-Quadrat Verfahren Chi-Quadrat Verfahren werden bei nominalskalierten Daten verwendet. Die einzige Information, die wir bei Nominalskalenniveau zur Verfügung haben, sind Häufigkeiten. Die Quintessenz
MehrParametrische vs. Non-Parametrische Testverfahren
Parametrische vs. Non-Parametrische Testverfahren Parametrische Verfahren haben die Besonderheit, dass sie auf Annahmen zur Verteilung der Messwerte in der Population beruhen: die Messwerte sollten einer
MehrStatistisches Testen
Statistisches Testen Grundlegendes Prinzip Erwartungswert Bekannte Varianz Unbekannte Varianz Differenzen Anteilswert Chi-Quadrat Tests Gleichheit von Varianzen Prinzip des Statistischen Tests Konfidenzintervall
MehrStatistische Methoden in den Umweltwissenschaften
Statistische Methoden in den Umweltwissenschaften Korrelationsanalysen Kreuztabellen und χ²-test Themen Korrelation oder Lineare Regression? Korrelationsanalysen - Pearson, Spearman-Rang, Kendall s Tau
MehrDer χ 2 -Test. Überblick. Beispiel 1 (χ 2 -Anpassungstest)
Der χ 2 -Test Überblick Beim χ 2 -Test handelt es sich um eine Familie ähnlicher Tests, die bei nominal- oder ordinalskalierten Merkmalen mit zwei oder mehr Ausprägungen angewendet werden können. Wir behandeln
MehrDer χ2-test Der χ2-test
Der χ 2 -Test Überblick Beim χ 2 -Test handelt es sich um eine Familie ähnlicher Tests, die bei nominal- oder ordinalskalierten Merkmalen mit zwei oder mehr Ausprägungen angewendet werden können. Wir behandeln
MehrSkalenniveaus =,!=, >, <, +, -
ZUSAMMENHANGSMAßE Skalenniveaus Nominalskala Ordinalskala Intervallskala Verhältnisskala =,!= =,!=, >, < =,!=, >, ,
MehrBivariater Zusammenhang in der Vierfeldertafel PEΣO
Bivariater Zusammenhang in der Vierfeldertafel PEΣO 12. Oktober 2001 Zusammenhang zweier Variablen und bivariate Häufigkeitsverteilung Die Bivariate Häufigkeitsverteilung gibt Auskunft darüber, wie zwei
MehrKapitel 7. Regression und Korrelation. 7.1 Das Regressionsproblem
Kapitel 7 Regression und Korrelation Ein Regressionsproblem behandelt die Verteilung einer Variablen, wenn mindestens eine andere gewisse Werte in nicht zufälliger Art annimmt. Ein Korrelationsproblem
MehrVerfahren zur Überprüfung von Zusammenhangshypothesen
Verfahren zur Überprüfung von Zusammenhangshypothesen 0. Allgemeines Wir haben uns bisher mit Unterschiedshypothesen beschäftigt (Unterschiede von Stichproben in Bezug auf abhängige Variablen). Im Folgenden
MehrErmitteln Sie auf 2 Dezimalstellen genau die folgenden Kenngrößen der bivariaten Verteilung der Merkmale Weite und Zeit:
1. Welche der folgenden Kenngrößen, Statistiken bzw. Grafiken sind zur Beschreibung der Werteverteilung des Merkmals Konfessionszugehörigkeit sinnvoll einsetzbar? A. Der Modalwert. B. Der Median. C. Das
Mehrerwartete Häufigkeit n=80 davon 50% Frauen fe=40 davon 50% Männer fe=40 Abweichung der beobachteten von den erwarteten Häufigkeiten:
Verfahren zur Analyse von Nominaldaten Chi-Quadrat-Tests Vier-Felder Kontingenztafel Mehrfach gestufte Merkmale Cramers V, Kontingenzkoeffizient, Phi-Koeffizient Muster aller Chi-Quadrat-Verfahren eine
MehrWiederholung. Statistik I. Sommersemester 2009
Statistik I Sommersemester 2009 Statistik I (1/21) Daten/graphische Darstellungen Lage- und Streuungsmaße Zusammenhangsmaße Lineare Regression Wahrscheinlichkeitsrechnung Zentraler Grenzwertsatz Konfidenzintervalle
MehrEinführung in die Korrelationsrechnung
Einführung in die Korrelationsrechnung Sven Garbade Fakultät für Angewandte Psychologie SRH Hochschule Heidelberg sven.garbade@hochschule-heidelberg.de Statistik 1 S. Garbade (SRH Heidelberg) Korrelationsrechnung
MehrSommersemester Marktforschung
Dipl.-Kfm. Sascha Steinmann Universität Siegen Lehrstuhl für Marketing steinmann@marketing.uni-siegen.de Sommersemester 2010 Marktforschung Übungsaufgaben zu den Themen 3-6 mit Lösungsskizzen Aufgabe 1:
MehrRegression und Korrelation
Kapitel 7 Regression und Korrelation Ein Regressionsproblem behandeltdie VerteilungeinerVariablen, wenn mindestens eine andere gewisse Werte in nicht zufälliger Art annimmt. Ein Korrelationsproblem dagegen
MehrEinführung in Web- und Data-Science
Einführung in Web- und Data-Science Prof. Dr. Ralf Möller Universität zu Lübeck Institut für Informationssysteme Tanya Braun (Übungen) P-Wert (einseitiger Ablehnungsbereich) Hypothesentest H 0 vs. H 1
Mehr1 x 1 y 1 2 x 2 y 2 3 x 3 y 3... n x n y n
3.2. Bivariate Verteilungen zwei Variablen X, Y werden gemeinsam betrachtet (an jedem Objekt werden gleichzeitig zwei Merkmale beobachtet) Beobachtungswerte sind Paare von Merkmalsausprägungen (x, y) Beispiele:
Mehr6 Korrelations- und Regressionsanalyse: Zusammenhangsanalyse stetiger Merkmale
6 Korrelations- und Regressionsanalyse: Zusammenhangsanalyse stetiger Merkmale 397 6.1 Korrelationsanalyse Jetzt betrachten wir bivariate Merkmale (X, Y ), wobei sowohl X als auch Y stetig bzw. quasi-stetig
MehrEigene MC-Fragen SPSS. 1. Zutreffend auf die Datenerfassung und Datenaufbereitung in SPSS ist
Eigene MC-Fragen SPSS 1. Zutreffend auf die Datenerfassung und Datenaufbereitung in SPSS ist [a] In der Variablenansicht werden für die betrachteten Merkmale SPSS Variablen definiert. [b] Das Daten-Editor-Fenster
Mehr6Korrelationsanalyse:Zusammengangsanalysestetiger Merkmale
6Korrelationsanalyse:Zusammengangsanalysestetiger Merkmale Jetzt betrachten wir bivariate Merkmale (X, Y ), wobei sowohl X als auch Y stetig bzw. quasi-stetig und mindestens ordinalskaliert, typischerweise
Mehr7.1 Korrelationsanalyse. Statistik. Kovarianz. Pearson-Korrelation. Institut für angewandte Statistik & EDV Universität für Bodenkultur Wien
Statistik 7.1 Korrelationsanalyse Institut für angewandte Statistik & EDV Universität für Bodenkultur Wien Sommersemester 2012 7 Regressions- und Korrelationsanalyse Kovarianz Pearson-Korrelation Der (lineare)
MehrDeskription, Statistische Testverfahren und Regression. Seminar: Planung und Auswertung klinischer und experimenteller Studien
Deskription, Statistische Testverfahren und Regression Seminar: Planung und Auswertung klinischer und experimenteller Studien Deskriptive Statistik Deskriptive Statistik: beschreibende Statistik, empirische
MehrTEIL 12: BIVARIATE ANALYSE FÜR METRISCH SKALIERTE VARIABLEN
TEIL 12: BIVARIATE ANALYSE FÜR METRISCH SKALIERTE VARIABLEN GLIEDERUNG Bivariate Analyse für metrisch skalierte Variablen Grundlagen Streudiagramme und Visualisierungen von Zusammenhängen Positive lineare
MehrTEIL 12: BIVARIATE ANALYSE FÜR METRISCH SKALIERTE VARIABLEN
TEIL 12: BIVARIATE ANALYSE FÜR METRISCH SKALIERTE VARIABLEN Bivariate Analyse für metrisch skalierte Variablen Grundlagen Verfahren für metrische Daten nutzen den vollen mathematischen Informationsgehalt
MehrKlassifikation von Signifikanztests
Klassifikation von Signifikanztests nach Verteilungsannahmen: verteilungsabhängige = parametrische Tests verteilungsunabhängige = nichtparametrische Tests Bei parametrischen Tests werden im Modell Voraussetzungen
MehrStatistik II: Signifikanztests /2
Medien Institut : Signifikanztests /2 Dr. Andreas Vlašić Medien Institut (0621) 52 67 44 vlasic@medien-institut.de Gliederung 1. Korrelation 2. Exkurs: Kausalität 3. Regressionsanalyse 4. Key Facts 2 I
MehrBIOMETRIE I - KLINISCHE EPIDEMIOLOGIE
BIOMETRIE I - KLINISCHE EPIDEMIOLOGIE Wintersemester 2003/04 - Übung zur Vorlesung Biometrie I Ein Lösungsvorschlag von Christian Brockly Lösungsvorschlag zur Übung Biometrie I Bei diesem Dokument handelt
MehrGrundlagen sportwissenschaftlicher Forschung Deskriptive Statistik 2 Inferenzstatistik 1
Grundlagen sportwissenschaftlicher Forschung Deskriptive Statistik 2 Inferenzstatistik 1 Dr. Jan-Peter Brückner jpbrueckner@email.uni-kiel.de R.216 Tel. 880 4717 Rückblick: Besonders wichtige Themen Wissenschaftstheoretischer
Mehr5. Seminar Statistik
Sandra Schlick Seite 1 5. Seminar 5. Seminar Statistik 30 Kurztest 4 45 Testen von Hypothesen inkl. Übungen 45 Test- und Prüfverfahren inkl. Übungen 45 Repetitorium und Prüfungsvorbereitung 15 Kursevaluation
MehrSchätzen und Testen von Populationsparametern im linearen Regressionsmodell PE ΣO
Schätzen und Testen von Populationsparametern im linearen Regressionsmodell PE ΣO 4. Dezember 2001 Generalisierung der aus Stichprobendaten berechneten Regressionsgeraden Voraussetzungen für die Generalisierung
MehrWas sind Zusammenhangsmaße?
Was sind Zusammenhangsmaße? Zusammenhangsmaße beschreiben einen Zusammenhang zwischen zwei Variablen Beispiele für Zusammenhänge: Arbeiter wählen häufiger die SPD als andere Gruppen Hochgebildete vertreten
Mehr7. Lösungen weitere Übungsaufgaben Statistik für Ingenieure WiSe 16/17
7. Lösungen weitere Übungsaufgaben Statistik für Ingenieure WiSe 16/17 1. Aufgabe: a) Grundgesamtheit sind alle Reifen aus der Produktion von Langstone aus dem Monat März der entsprechenden Reifentypen.
MehrBiometrieübung 7 t-test (gepaarte Daten) & Wilcoxon-Test
Biometrieübung 7 (t-test gepaarte Daten & Wilcoxon-Test) - Aufgabe Biometrieübung 7 t-test (gepaarte Daten) & Wilcoxon-Test Aufgabe 1 Hirschläufe An 10 Hirschen wurde die Länge der rechten Vorder- und
MehrWahrscheinlichkeitsverteilungen
Universität Bielefeld 3. Mai 2005 Wahrscheinlichkeitsrechnung Wahrscheinlichkeitsrechnung Das Ziehen einer Stichprobe ist die Realisierung eines Zufallsexperimentes. Die Wahrscheinlichkeitsrechnung betrachtet
Mehrfh management, communication & it Constantin von Craushaar fh-management, communication & it Statistik Angewandte Statistik
fh management, communication & it Folie 1 Überblick Grundlagen (Testvoraussetzungen) Mittelwertvergleiche (t-test,..) Nichtparametrische Tests Korrelationen Regressionsanalyse... Folie 2 Überblick... Varianzanalyse
MehrDr. Maike M. Burda. Welchen Einfluss hat die Körperhöhe auf das Körpergewicht? Eine Regressionsanalyse. HU Berlin, Econ Bootcamp
Dr. Maike M. Burda Welchen Einfluss hat die Körperhöhe auf das Körpergewicht? Eine Regressionsanalyse. HU Berlin, Econ Bootcamp 8.-10. Januar 2010 BOOTDATA.GDT: 250 Beobachtungen für die Variablen... cm:
Mehr3) Testvariable: T = X µ 0
Beispiel 4.9: In einem Molkereibetrieb werden Joghurtbecher abgefüllt. Der Sollwert für die Füllmenge dieser Joghurtbecher beträgt 50 g. Aus der laufenden Produktion wurde eine Stichprobe von 5 Joghurtbechern
MehrAusführliche Lösungen zu ausgewählten Aufgaben von ÜB 5 und 6. Streudiagramm
y Aufgabe 3 Ausführliche Lösungen zu ausgewählten Aufgaben von ÜB 5 und 6 a) Zur Erstellung des Streudiagramms zeichnet man jeweils einen Punkt für jedes Datenpaar (x i, y i ) aus der zweidimensionalen
MehrEs können keine oder mehrere Antworten richtig sein. Eine Frage ist NUR dann richtig beantwortet, wenn ALLE richtigen Antworten angekreuzt wurden.
Teil III: Statistik Alle Fragen sind zu beantworten. Es können keine oder mehrere Antworten richtig sein. Eine Frage ist NUR dann richtig beantwortet, wenn ALLE richtigen Antworten angekreuzt wurden. Wird
MehrStatistik Testverfahren. Heinz Holling Günther Gediga. Bachelorstudium Psychologie. hogrefe.de
rbu leh ch s plu psych Heinz Holling Günther Gediga hogrefe.de Bachelorstudium Psychologie Statistik Testverfahren 18 Kapitel 2 i.i.d.-annahme dem unabhängig. Es gilt also die i.i.d.-annahme (i.i.d = independent
MehrAnpassungstests VORGEHENSWEISE
Anpassungstests Anpassungstests prüfen, wie sehr sich ein bestimmter Datensatz einer erwarteten Verteilung anpasst bzw. von dieser abweicht. Nach der Erläuterung der Funktionsweise sind je ein Beispiel
MehrFH- Management & IT. Constantin von Craushaar FH-Management & IT Statistik Angewandte Statistik (Übungen)
FH- Management & IT Folie 1 Rückblick Häufigkeiten berechnen Mittelwerte berechnen Grafiken ausgeben Grafiken anpassen und als Vorlage abspeichern Variablenoperationen Fälle vergleichen Fälle auswählen
Mehr7.2 Mittelwert einer Stichprobe
66 7.2 Mittelwert einer Stichprobe Gegeben ist eine normalverteilte Grundgesamtheit. Mit Hilfe einer Stichprobe möchten wir Aussagen über den unbekannten Mittelwert µ dieser Grundgesamtheit machen. Wenn
MehrWahrscheinlichkeit 1-α: richtige Entscheidung - wahrer Sachverhalt stimmt mit Testergebnis überein. Wahrscheinlichkeit α: falsche Entscheidung -
wahrer Sachverhalt: Palette ist gut Palette ist schlecht Entscheidung des Tests: T K; Annehmen von H0 ("gute Palette") positive T > K; Ablehnen von H0 ("schlechte Palette") negative Wahrscheinlichkeit
MehrDidaktisches Seminar über Stochastik. Themen: ffl Korrelation von zwei Zufallsvariablen
Didaktisches Seminar über Stochastik Themen: ffl Gemeinsame Verteilung von zwei Zufallsvariablen ffl Lineare Regression ffl Korrelation von zwei Zufallsvariablen Michael Ralph Pape Mai 1998 1 1 GEMEINSAME
MehrGrundlagen sportwissenschaftlicher Forschung Inferenzstatistik 2
Grundlagen sportwissenschaftlicher Forschung Inferenzstatistik 2 Dr. Jan-Peter Brückner jpbrueckner@email.uni-kiel.de R.216 Tel. 880 4717 Statistischer Schluss Voraussetzungen z.b. bzgl. Skalenniveau und
MehrKonkretes Durchführen einer Inferenzstatistik
Konkretes Durchführen einer Inferenzstatistik Die Frage ist, welche inferenzstatistischen Schlüsse bei einer kontinuierlichen Variablen - Beispiel: Reaktionszeit gemessen in ms - von der Stichprobe auf
MehrVorlesung: Statistik II für Wirtschaftswissenschaft
Vorlesung: Statistik II für Wirtschaftswissenschaft Prof. Dr. Helmut Küchenhoff Institut für Statistik, LMU München Sommersemester 2017 Einführung 1 Wahrscheinlichkeit: Definition und Interpretation 2
MehrInhaltsverzeichnis. 1 Über dieses Buch Zum Inhalt dieses Buches Danksagung Zur Relevanz der Statistik...
Inhaltsverzeichnis 1 Über dieses Buch... 11 1.1 Zum Inhalt dieses Buches... 13 1.2 Danksagung... 15 2 Zur Relevanz der Statistik... 17 2.1 Beispiel 1: Die Wahrscheinlichkeit, krank zu sein, bei einer positiven
MehrAlternative Darstellung des 2-Stcihprobentests für Anteile
Alternative Darstellung des -Stcihprobentests für Anteile DCF CF Total n 111 11 3 Response 43 6 69 Resp. Rate 0,387 0,3 0,309 Bei Gültigkeit der Nullhypothese Beobachtete Response No Response Total absolut
MehrAngewandte Statistik 3. Semester
Angewandte Statistik 3. Semester Übung 5 Grundlagen der Statistik Übersicht Semester 1 Einführung ins SPSS Auswertung im SPSS anhand eines Beispieles Häufigkeitsauswertungen Grafiken Statistische Grundlagen
MehrInhalt. Vorwort Univariate Verteilungen Verteilungen Die Normalverteilung... 47
Inhalt Vorwort... 9 1 Einleitung: Grundlagen der Statistik... 11 1.1 Die statistische Fragestellung im Forschungsprozess... 11 1.2 Grundbegriffe der Statistik... 13 1.3 Voraussetzung jeder Statistik: Die
MehrEmpirische Wirtschaftsforschung
Empirische Wirtschaftsforschung Prof. Dr. Bernd Süßmuth Universität Leipzig Institut für Empirische Wirtschaftsforschung Volkswirtschaftslehre, insbesondere Ökonometrie 1 4. Basiskonzepte der induktiven
MehrKorrelation Regression. Wenn Daten nicht ohne einander können Korrelation
DAS THEMA: KORRELATION UND REGRESSION Korrelation Regression Wenn Daten nicht ohne einander können Korrelation Korrelation Kovarianz Pearson-Korrelation Voraussetzungen für die Berechnung die Höhe der
MehrStatistik II: Signifikanztests /1
Medien Institut : Signifikanztests /1 Dr. Andreas Vlašić Medien Institut (0621) 52 67 44 vlasic@medien-institut.de Gliederung 1. Noch einmal: Grundlagen des Signifikanztests 2. Der chi 2 -Test 3. Der t-test
MehrBiometrieübung 10 Lineare Regression. 2. Abhängigkeit der Körpergröße von der Schuhgröße bei Männern
Biometrieübung 10 (lineare Regression) - Aufgabe Biometrieübung 10 Lineare Regression Aufgabe 1. Düngungsversuch In einem Düngeversuch mit k=9 Düngungsstufen x i erhielt man Erträge y i. Im (X, Y)- Koordinatensystem
MehrEine zweidimensionale Stichprobe
Eine zweidimensionale Stichprobe liegt vor, wenn zwei qualitative Merkmale gleichzeitig betrachtet werden. Eine Urliste besteht dann aus Wertepaaren (x i, y i ) R 2 und hat die Form (x 1, y 1 ), (x 2,
MehrBiomathematik für Mediziner, Klausur WS 1999/2000 Seite 1
Biomathematik für Mediziner, Klausur WS 1999/2000 Seite 1 Aufgabe 1: Wieviele der folgenden Variablen sind quantitativ stetig? Schulnoten, Familienstand, Religion, Steuerklasse, Alter, Reaktionszeit, Fahrzeit,
MehrHäufigkeitsverteilungen
Häufigkeitsverteilungen Eine Häufigkeitsverteilung gibt die Verteilung eines erhobenen Merkmals an und ordnet jeder Ausprägung die jeweilige Häufigkeit zu. Bsp.: 100 Studenten werden gefragt, was sie studieren.
MehrHypothesenprüfung. Darüber hinaus existieren zahlreiche andere Testverfahren, die alle auf der gleichen Logik basieren
Hypothesenprüfung Teil der Inferenzstatistik Befaßt sich mit der Frage, wie Hypothesen über eine (in der Regel unbekannte) Grundgesamtheit an einer Stichprobe überprüft werden können Behandelt werden drei
MehrDer χ 2 -Test (Chiquadrat-Test)
Der χ 2 -Test (Chiquadrat-Test) Der Grundgedanke Mit den χ 2 -Methoden kann überprüft werden, ob sich die empirischen (im Experiment beobachteten) Häufigkeiten einer nominalen Variable systematisch von
MehrAnalytische Statistik II
Analytische Statistik II Institut für Geographie 1 Schätz- und Teststatistik 2 Das Testen von Hypothesen Während die deskriptive Statistik die Stichproben nur mit Hilfe quantitativer Angaben charakterisiert,
MehrStatistik und Wahrscheinlichkeitsrechnung
Statistik und Wahrscheinlichkeitsrechnung 3. Vorlesung Dr. Jochen Köhler 1 Inhalte der heutigen Vorlesung Ziel: Daten Modellbildung Probabilistisches Modell Wahrscheinlichkeit von Ereignissen Im ersten
MehrLineare Korrelation. Statistik für SozialwissenschaftlerInnen II p.143
Lineare Korrelation Statistik für SozialwissenschaftlerInnen II p.143 Produkt-Moment-Korrelation Der Produkt-Moment-Korrelationskoffizient r von Pearson ist ein Zusammenhangsmaß für metrische Variablen
MehrZusammenhänge zwischen metrischen Merkmalen
Zusammenhänge zwischen metrischen Merkmalen Darstellung des Zusammenhangs, Korrelation und Regression Daten liegen zu zwei metrischen Merkmalen vor: Datenpaare (x i, y i ), i = 1,..., n Beispiel: x: Anzahl
MehrLiebe Bianca, hier die Zusammenfassung Ihrer Ergebnisse. Ihr Beauty-Score: Ihr Beauty-Quotient: 117. Ihre Figuranalyse:
Liebe Bianca, hier die Zusammenfassung Ihrer Ergebnisse. Ihr Beauty-Score: 4.22 Ihr Beauty-Quotient: 117 Ihre Figuranalyse: Abweichung Ihrer einzelnen Körpermerkmale von den durchschnittlichen Körpermerkmalen
Mehr5. Lektion: Einfache Signifikanztests
Seite 1 von 7 5. Lektion: Einfache Signifikanztests Ziel dieser Lektion: Du ordnest Deinen Fragestellungen und Hypothesen die passenden einfachen Signifikanztests zu. Inhalt: 5.1 Zwei kategoriale Variablen
MehrMathematik 2 für Naturwissenschaften
Hans Walser Mathematik 2 für Naturwissenschaften 2 3 3 4 6 4 5 0 0 5 6 5 20 5 6 Tabellen (leicht gekürzte Version) Hans Walser: Tabellen ii Inhalt Binomische Verteilung.... Binomische Verteilung (ohne
MehrStreuungsmaße von Stichproben
Streuungsmaße von Stichproben S P A N N W E I T E, V A R I A N Z, S T A N D A R D A B W E I C H U N G, Q U A R T I L E, K O V A R I A N Z, K O R R E L A T I O N S K O E F F I Z I E N T Zentrale Methodenlehre,
MehrLage- und Streuungsparameter
Lage- und Streuungsparameter Beziehen sich auf die Verteilung der Ausprägungen von intervall- und ratio-skalierten Variablen Versuchen, diese Verteilung durch Zahlen zu beschreiben, statt sie graphisch
Mehr5. Spezielle stetige Verteilungen
5. Spezielle stetige Verteilungen 5.1 Stetige Gleichverteilung Eine Zufallsvariable X folgt einer stetigen Gleichverteilung mit den Parametern a und b, wenn für die Dichtefunktion von X gilt: f x = 1 für
MehrBestimmte Zufallsvariablen sind von Natur aus normalverteilt. - naturwissenschaftliche Variablen: originär z.b. Intelligenz, Körpergröße, Messfehler
6.6 Normalverteilung Die Normalverteilung kann als das wichtigste Verteilungsmodell der Statistik angesehen werden. Sie wird nach ihrem Entdecker auch Gaußsche Glockenkurve genannt. Die herausragende Stellung
MehrDr. Maike M. Burda. Welchen Einfluss hat die Körperhöhe auf das Körpergewicht? Eine Regressionsanalyse. HU Berlin, Econ Bootcamp 7.-9.
Dr. Maike M. Burda Welchen Einfluss hat die Körperhöhe auf das Körpergewicht? Eine Regressionsanalyse. HU Berlin, Econ Bootcamp 7.-9. Januar 2011 BOOTDATA11.GDT: 250 Beobachtungen für die Variablen...
MehrLösungen zur Biomathe-Klausur Gruppe C Montag, den 16. Juli 2001
Lösungen zur Biomathe-Klausur Gruppe C Montag, den 16. Juli 2001 1. Normalverteilung Der diastolische Blutdruck bei einer Gruppe von jungen Männern ist normalverteilt mit einem Erwartungswert von 65 mmhg
MehrWahrscheinlichkeitsrechnung und Statistik. 11. Vorlesung /2019
Wahrscheinlichkeitsrechnung und Statistik 11. Vorlesung - 2018/2019 Quantil der Ordnung α für die Verteilung des beobachteten Merkmals X ist der Wert z α R für welchen gilt z 1 2 heißt Median. P(X < z
MehrRegression ein kleiner Rückblick. Methodenseminar Dozent: Uwe Altmann Alexandra Kuhn, Melanie Spate
Regression ein kleiner Rückblick Methodenseminar Dozent: Uwe Altmann Alexandra Kuhn, Melanie Spate 05.11.2009 Gliederung 1. Stochastische Abhängigkeit 2. Definition Zufallsvariable 3. Kennwerte 3.1 für
MehrDeskriptive Beschreibung linearer Zusammenhänge
9 Mittelwert- und Varianzvergleiche Mittelwertvergleiche bei k > 2 unabhängigen Stichproben 9.4 Beispiel: p-wert bei Varianzanalyse (Grafik) Bedienungszeiten-Beispiel, realisierte Teststatistik F = 3.89,
Mehr3.Wiederholung: Toleranzbereiche Für EX Geg:
3.Wiederholung: Toleranzbereiche Für EX Geg: Vl. 24.2.2017 Schätzfunktion für Güte: Ist X Problem: Feb 17 13:21 > Wir berechnen Bereiche (Toleranzbereiche) für sind untere und obere Grenzen, berechnet
MehrProf. Dr. Walter F. Tichy Dr. Matthias Müller Sommersemester 2006
Empirische Softwaretechnik Prof. Dr. Walter F. Tichy Dr. Matthias Müller Sommersemester 2006 1 Experiment zur Vererbungstiefe Softwaretechnik: die Vererbungstiefe ist kein guter Schätzer für den Wartungsaufwand
MehrPrüfung aus Statistik 2 für SoziologInnen
Prüfung aus Statistik 2 für SoziologInnen 11. Oktober 2013 Gesamtpunktezahl =80 Name in Blockbuchstaben: Matrikelnummer: Wissenstest (maximal 16 Punkte) Kreuzen ( ) Sie die jeweils richtige Antwort an.
MehrStatistik-Klausur A WS 2009/10
Statistik-Klausur A WS 2009/10 Name: Vorname: Immatrikulationsnummer: Studiengang: Hiermit erkläre ich meine Prüfungsfähigkeit vor Beginn der Prüfung. Unterschrift: Dauer der Klausur: Erlaubte Hilfsmittel:
MehrDie Familie der χ 2 (n)-verteilungen
Die Familie der χ (n)-verteilungen Sind Z 1,..., Z m für m 1 unabhängig identisch standardnormalverteilte Zufallsvariablen, so genügt die Summe der quadrierten Zufallsvariablen χ := m Z i = Z 1 +... +
MehrDie Familie der χ 2 (n)-verteilungen
Die Familie der χ (n)-verteilungen Sind Z 1,..., Z m für m 1 unabhängig identisch standardnormalverteilte Zufallsvariablen, so genügt die Summe der quadrierten Zufallsvariablen χ := m Z i = Z 1 +... +
MehrAnalyse von Kontingenztafeln
Analyse von Kontingenztafeln Mit Hilfe von Kontingenztafeln (Kreuztabellen) kann die Abhängigkeit bzw. die Inhomogenität der Verteilungen kategorialer Merkmale beschrieben, analysiert und getestet werden.
MehrEinfaktorielle Varianzanalyse
Kapitel 16 Einfaktorielle Varianzanalyse Im Zweistichprobenproblem vergleichen wir zwei Verfahren miteinander. Nun wollen wir mehr als zwei Verfahren betrachten, wobei wir unverbunden vorgehen. Beispiel
Mehr6 Korrelationsanalyse: Zusammenhangsanalyse stetiger. Merkmale
6 Korrelationsanalyse: Zusammenhangsanalyse stetiger Merkmale 6.1 Korrelationsanalyse Jetzt betrachten wir bivariate Merkmale (X, Y ), wobei sowohl X als auch Y stetig bzw. quasi-stetig und mindestens
MehrStatistik I für Betriebswirte Vorlesung 4
Statistik I für Betriebswirte Vorlesung 4 Prof. Dr. Hans-Jörg Starkloff TU Bergakademie Freiberg Institut für Stochastik 25. April 2016 Prof. Dr. Hans-Jörg Starkloff Statistik I für Betriebswirte Vorlesung
MehrAufgaben zu Kapitel 3
Aufgaben zu Kapitel 3 Aufgabe 1 a) Berechnen Sie einen t-test für unabhängige Stichproben für den Vergleich der beiden Verarbeitungsgruppen strukturell und emotional für die abhängige Variable neutrale
MehrT-Test für unabhängige Stichproben
T-Test für unabhängige Stichproben Wir gehen von folgendem Beispiel aus: Wir erheben zwei Zufallstichproben, wobei nur die Probanden der einen Stichprobe einer speziellen experimentellen Behandlung (etwa
MehrBivariater Zusammenhang in der Mehrfeldertafel PEΣO
Bivariater Zusammenhang in der Mehrfeldertafel PEΣO 9. November 2001 Bivariate Häufigkeitsverteilungen in Mehrfeldertabellen In der Mehrfeldertabelle werden im Gegensatz zur Vierfeldertabelle keine dichotomen
MehrVS PLUS
VS PLUS Zusatzinformationen zu Medien des VS Verlags Statistik II Inferenzstatistik 2010 Übungsaufgaben und Lösungen Inferenzstatistik 2 [Übungsaufgaben und Lösungenn - Inferenzstatistik 2] ÜBUNGSAUFGABEN
MehrBrückenkurs Statistik für Wirtschaftswissenschaften
Peter von der Lippe Brückenkurs Statistik für Wirtschaftswissenschaften Weitere Übungsfragen UVK Verlagsgesellschaft mbh Konstanz Mit UVK/Lucius München UVK Verlagsgesellschaft mbh Konstanz und München
Mehr