V a r i a b l e X x 1 x 2 x 3 x 4 Σ y y y Σ Variable Y. V a r i a b l e X
|
|
- Emil Goldschmidt
- vor 6 Jahren
- Abrufe
Transkript
1 Ausgangsüberlegung: Verschiedene Kontingenztabellen bei gleicher Randverteilung und gleichem Stichprobenumfang n sind möglich. Beispiel: Variable Y V a r i a b l e X x 1 x x 3 x 4 Σ y y 0 0 y Σ Variable Y V a r i a b l e X x 1 x x 3 x 4 Σ y y y Σ
2 Offenkundig wird nun: Bei gleichen Randverteilungen ( Marginalhäufigkeiten) und verschiedenen beobachteten konditionalen Häufigkeiten für die einzelnen Merkmalsausprägungen wird ein jeweils anderer Zusammenhang zwischen den beiden Variablen X und Y sichtbar. Dieser Sachverhalt wird bei der Konstruktion des Chi-Quadrat Modells genutzt. Aber wie? Kurz noch zur Nomenklatur: ffrequency ; Subskript b beobachtet Subskript e erwartet also: f b beobachtete (empirisch erfasste) Häufigkeit in der Kontigenztabelle f e erwartete Häufigkeit in der Indifferenztabelle
3 Indem wir die vorgefundenen Häufigkeiten in der Kontingenztabelle (f b ) mit den Häufigkeiten aus der Indifferenztabelle (f e ) vergleichen. In der Indifferenztabelle finden sich die Häufigkeiten, die wir erwarten würden, wenn keine Beziehung(Indifferenz) zwischen den Variablen bestünde. Exkurs : Zum weiteren Verständnis ist hier die Nomenklatur für die bivariate Tabelle noch wichtig: Die bivariate Tabelle besteht ja aus einer bestimmten Anzahl von Zeilen, Spalten und Zellen. Zur Identifizierung der Häufigkeiten in den Zellen benutzen wir die Subskripte i und j, wobei das erste Subskript i die Zeile und das zweite Subskript j die Spalte bezeichnet, in der die Häufigkeit lokalisiert ist: f ij ist also die Häufigkeit in der Zelle der i-ten Zeile und der j-ten Spalte.
4 Allgemeine Struktur der bivariaten Tabelle: Variable Y V a r i a b l e X x 1 x x 3 n i. y 1 f 11 f 1 f 13 n 1. y f 1 f f 3 n. y 3 f 31 f 3 f 33 n 3. y 4 f 41 f 4 f 43 n 4. n.j n.1 n. n.3 n
5 Beispiel zur Bestimmung von Chi-Quadrat: 60 Beschäftigte eines Betriebes wurden nach ihrem Schulabschluss befragt und zudem danach, ob sie in ihrem bisherigen Erwerbsleben bereits einen oder gar mehrere Berufswechsel vorgenommen haben. Variable X: Schulabschluss Abitur x 1 ja x nein Variable Y: Berufswechsel vorgenommen y 1 ja y nein a) Kontingenztabelle (f b ) Abitur/ Berufswechsel ja nein Randhäufigkeiten n i. ja nein Randhäufig keiten: n.j
6 Die jeweilige Häufigkeit in der Zelle der Indifferenztabelle wird auf Basis der Randhäufigkeiten der Kontingenztabelle berechnet: n n i.. f e ij N j Oder verbal ausgedrückt Die erwartete Zellenhäufigkeit berechnet sich über die: Randhäufigkeit der Zeile Randhäufigkeit der Spalte N
7 1.Schritt zur Berechung von Chi-Quadrat: Die erwarteten Häufigkeiten (f e ) mit Hilfe der marginalen Häufigkeiten der Kontingenztabelle bestimmen, so ergibt sich als Indifferenztabelle (hier für unser Beispiel, s.o.) Indifferenztabelle (f e ) Abitur/ Berufswechsel ja nein ja , ,7 Randhäufigkeiten n i. 6,0 nein , ,0 15,3 60 Randhäufig- 33,0 7,0 60,0 keiten: n.j
8 Was wurde also bisher hier getan? Es wurde berechnet, wie sich die Untersuchungseinheiten (UE) auf die einzelnen Zellen verteilen würden, wenn zwischen den beiden Variablen X und Y kein Zusammenhang (Indifferenz) bestünde: In diesem Fall müssten die Häufigkeiten in den Zellen zur marginalen Verteilung der Y-Variable proportional sein, das meint:
9 Proportionen der Häufigkeiten in den Zellen in der Indifferenztabelle zu denen der Marginalverteilung der Y-Variable: Indifferenztabelle (f e ) Abitur/ Berufswechsel ja nein ja Randhäufigkeiten n i. 14,3 11,7 6,0 nein 18,7 15,3 34,0 Randhäufig- 33,0 7,0 60,0 keiten: n.j 14,3 11,7 6,0 0,76 0, 76 0, 76 18,7 15,3 34,0
10 .Schritt zur Berechung von Chi-Quadrat: Differenzen zwischen f b und f e bestimmen Arbeitstabelle zur Berechnung von Chi-quadrat Zeile i Spalte j f b f e (f b f e ) (f b f e ) (f b f e ) /f e ,3-5,3 8,09 1, ,7 5,3 8,09, ,7 5,3 8,09 1, ,3-5,3 8,09 1,84 Σ ,0 0,0 7,70 3.Schritt: Die Berechung von Chi-Quadrat geschieht mit Hilfe der Formel: χ ( f f ) b e Σ f e
11 χ χ Deskriptivstatistik Chi-Quadrat ist dann hier nach der obigen Formel zu berechnen mit den Werten: 8,09 14,3 1,96 + +,40 8,09 11, ,50 8,09 18,7 + 1,84 Damit ist Chi-Quadrat hier mit dem Wert 7,70 bestimmt. + 8,09 15,3 7,70 Also noch einmal kurz zusammengefasst: Wenn die Konditionalverteilung der Kontingenztabelle gleich der Konditionalverteilung der Indifferenztabelle ist, dann besteht zwischen x und y kein Zusammenhang. Wenn aber die Konditionalverteilung der Kontingenztabelle ungleich der Konditionalverteilung der Indifferenztabelle ist, dann besteht zwischen x und y ein Zusammenhang.
12 Problem bei χ ist allerdings : Eine Verdoppelung der Zellenhäufigkeiten bei identischen Verteilungen (Proportionen) führt zu einer Verdoppelung des Chi-Quadrat-Wertes. Chi-Quadrat variiert also mit N. Beispiel: χ 7,70 15, 40 Proportionen: Proportionen: 9 0, , , , , , χ
13 Deutlich wird also: Wenngleich χ das Ausmaß der Abweichung der Kontingenzvon der Indifferenztabelle aufzeigt, kann es - allein für sich genommen - kein sinnvoller Kennwert für die Assoziation zwischen X und Y sein. Das bedeutet dann: χ Alle auf basierenden Assoziationsmaße müssen die Anzahl der Fälle (N) berücksichtigen.
14 (φ Der Phi-Koeffizient ) ist solch ein Maß, dass die Anzahl der Fälle (N) berücksichtigt. Die Formel für diesen Koeffizienten lautet: χ φ N bzw. φ χ N Für unser obiges Beispiel mit den Werten 7,70 χ und N60 errechnet sich dann ein Phi von: φ 7, ,183 0,358 Charakteristika zu Phi: Phi ist symmetrisch, zudem - nimmt Phi die Werte zwischen 0 bis 1 an; - Phi ist gleich 0, wenn gilt: X Y; - Phi ist > 0 bis 1, wenn gilt: X Y; - Phi ist 1, wenn gilt: χ N Aber: Phi ist ein Spezialfall für x Tabellen, d.h.: φ > 1, wenn gilt: r> bzw. c> (rrow) (ccolumn)
15 Eine Verbesserung zu Phi stellt der Assoziationskoeffizient Cramer s V insofern dar, als Cramer s V auch sinnvoll für größere als x-tabellen berechenbar ist. Die Formel für diesen Koeffizienten lautet: V χ N min( r 1, c 1) Dabei steht r für die Anzahl der Zeilen(rows) und c für die Anzahl der Spalten(columns). min steht für Minimum und besagt, dass zunächst zu prüfen ist, ob die Anzahl der Zeilen(r) oder die Anzahl der Spalten(c) kleiner ist. Der jeweils kleinere Wert geht dann in die Berechnung des Koeffizienten ein.
16 Charakteristika zu Cramer s V: V ist symmetrisch, zudem - nimmt V die Werte zwischen 0 bis 1 an; - V ist gleich 0, wenn gilt: X Y - V ist > 0 bis 1, wenn gilt: X Y Conclusio: χ Von den -basierten Assoziationskoeffizienten ist Cramer s V die geeignete Verallgemeinerung von φ auf Tabellen, die größer als x-tabellen sind. Für unser obiges Beispiel mit χ 7, 70; N60 ; r und c ist dann Cramer s V: V 7,70 60 min( 1, 1) 7, ,70 60 V 0,183 0,358 (in diesem Fall ist also Cramer s V Phi, da eine x-tabelle vorliegt)
17 Der Kontingenzkoeffizient C Die Formel für diesen Koeffizienten lautet: C χ χ + N Vorteil: Der Kontingenzkoeffizient C ist der für beliebig große rxc-tabellen bereits 1904 von PEARSON konstruierte χ -basierte Assoziationskoeffizient. Aber: Sein Nachteil liegt darin, dass seine praktische Grenze unter 1 liegt, das bedeutet, C nähert sich dem Wert 1 (auch bei einer perfekten Assoziation) nur an und zwar mit Zunahme der Spalten- und Zeilenanzahl.
18 Für unser obiges Beispiel mit 7,70 χ und N60 ist dann C: C 7,70 7, ,70 67,70 0,1137 0,337 χ Generell ist bei allen -basierten Assoziationskoeffizienten zu beachten, dass ihre Werte nur schwer inhaltlich zu deuten sind: Die Werte vermitteln nur einen rein ziffernmäßigen Eindruck von der Stärke eines Zusammenhanges. Literaturhinweis: KROMREY, Helmut, a.a.o., 006(11.üb.Aufl.):
Bivariate Verteilungen
Bivariate Verteilungen Tabellarische Darstellung: Bivariate Tabellen entstehen durch Kreuztabulation zweier Variablen. Beispiel: X Y Student(in) Herkunft Fakultät 0001 Europa Jura 000 Nicht-Europa Medizin
MehrBivariate Analyse: Gemeinsame (bivariate) Häufigkeitstabelle. Sie wird auch Kontingenz-, Assoziations- oder Korrelationstabelle (f b )genannt.
Bivariate Analyse: Tabellarische Darstellung: Gemeinsame (bivariate) Häufigkeitstabelle. Sie wird auch Kontingenz-, Assoziations- oder Korrelationstabelle (f b )genannt. Beispiel: Häufigkeitsverteilung
MehrGrundlagen der empirischen Sozialforschung
Grundlagen der empirischen Sozialforschung Sitzung 11 - Datenanalyseverfahren Jan Finsel Lehrstuhl für empirische Sozialforschung Prof. Dr. Petra Stein 5. Januar 2009 1 / 22 Online-Materialien Die Materialien
MehrKreuztabellenanalyse. bedingte Häufigkeiten
Lehrveranstaltung Empirische Forschung und Politikberatung der Universität Bonn, WS 2007/2008 Kreuztabellenanalyse bedingte Häufigkeiten 07. Dezember 2007 Michael Tiemann, Bundesinstitut für Berufsbildung,
MehrBivariater Zusammenhang in der Vierfeldertafel PEΣO
Bivariater Zusammenhang in der Vierfeldertafel PEΣO 12. Oktober 2001 Zusammenhang zweier Variablen und bivariate Häufigkeitsverteilung Die Bivariate Häufigkeitsverteilung gibt Auskunft darüber, wie zwei
MehrEinführung in die sozialwissenschaftliche Statistik
Einführung in die sozialwissenschaftliche Statistik Sitzung 4 Bivariate Deskription Heinz Leitgöb in Vertretung von Katrin Auspurg Sommersemester 2015 04.05.2015 Überblick 1. Kontingenztabellen 2. Assoziationsmaße
MehrBivariate Zusammenhänge
Bivariate Zusammenhänge Tabellenanalyse: Kreuztabellierung und Kontingenzanalyse Philosophische Fakultät Institut für Soziologie Berufsverläufe und Berufserfolg von Hochschulabsolventen Dozent: Mike Kühne
Mehrerwartete Häufigkeit n=80 davon 50% Frauen fe=40 davon 50% Männer fe=40 Abweichung der beobachteten von den erwarteten Häufigkeiten:
Verfahren zur Analyse von Nominaldaten Chi-Quadrat-Tests Vier-Felder Kontingenztafel Mehrfach gestufte Merkmale Cramers V, Kontingenzkoeffizient, Phi-Koeffizient Muster aller Chi-Quadrat-Verfahren eine
MehrMathematische und statistische Methoden I
Prof. Dr. G. Meinhardt 6. Stock, Wallstr. 3 (Raum 06-206) Sprechstunde jederzeit nach Vereinbarung und nach der Vorlesung. Mathematische und statistische Methoden I Dr. Malte Persike persike@uni-mainz.de
MehrBivariater Zusammenhang in der Mehrfeldertafel PEΣO
Bivariater Zusammenhang in der Mehrfeldertafel PEΣO 9. November 2001 Bivariate Häufigkeitsverteilungen in Mehrfeldertabellen In der Mehrfeldertabelle werden im Gegensatz zur Vierfeldertabelle keine dichotomen
Mehr1 x 1 y 1 2 x 2 y 2 3 x 3 y 3... n x n y n
3.2. Bivariate Verteilungen zwei Variablen X, Y werden gemeinsam betrachtet (an jedem Objekt werden gleichzeitig zwei Merkmale beobachtet) Beobachtungswerte sind Paare von Merkmalsausprägungen (x, y) Beispiele:
MehrBivariate Kreuztabellen
Bivariate Kreuztabellen Kühnel, Krebs 2001 S. 307-342 Gabriele Doblhammer: Empirische Sozialforschung Teil II, SS 2004 1/33 Häufigkeit in Zelle y 1 x 1 Kreuztabellen Randverteilung x 1... x j... x J Σ
MehrWas sind Zusammenhangsmaße?
Was sind Zusammenhangsmaße? Zusammenhangsmaße beschreiben einen Zusammenhang zwischen zwei Variablen Beispiele für Zusammenhänge: Arbeiter wählen häufiger die SPD als andere Gruppen Hochgebildete vertreten
Mehr11. Zusammenhangsmaße für nominale Variablen
Statistik I Übung 11. Zusammenhangsmaße für nominale Variablen Dozent: Jürgen Leibold 1 Evaluation Nominale Zusammenhangsmaße Übersicht Chi-Quadrat Phi Cramers V Nominale Zusammenhangsmaße 3 Randverteilung
MehrStatistisches Testen
Statistisches Testen Grundlegendes Prinzip Erwartungswert Bekannte Varianz Unbekannte Varianz Differenzen Anteilswert Chi-Quadrat Tests Gleichheit von Varianzen Prinzip des Statistischen Tests Konfidenzintervall
MehrZusammenhangsanalyse in Kontingenztabellen
Zusammenhangsanalyse in Kontingenztabellen Bisher: Tabellarische / graphische Präsentation Jetzt: Maßzahlen für Stärke des Zusammenhangs zwischen X und Y. Chancen und relative Chancen Zunächst 2 2 - Kontingenztafel
MehrHypothesentests mit SPSS
Beispiel für einen chi²-test Daten: afrikamie.sav Im Rahmen der Evaluation des Afrikamie-Festivals wurden persönliche Interviews durchgeführt. Hypothese: Es gibt einen Zusammenhang zwischen dem Geschlecht
MehrÜbungsblatt 3: Bivariate Deskription I (Sitzung 4)
1 Übungsblatt 3: Bivariate Deskription I (Sitzung 4) Aufgabe 1 Eine Kreuztabelle beinhaltet unterschiedliche Verteilungen. a) Geben Sie an, wie diese Verteilungen heißen und was sie beinhalten. b) Welche
MehrDeskriptivstatistik a) Univariate Statistik Weiters zum Thema der statistischen Informationsverdichtung
20 Weiters zum Thema der statistischen Informationsverdichtung M a ß z a h l e n Statistiken bei Stichproben Parameter bei Grundgesamtheiten Maßzahlen zur Beschreibung univariater Verteilungen Maßzahlen
MehrSkalenniveaus =,!=, >, <, +, -
ZUSAMMENHANGSMAßE Skalenniveaus Nominalskala Ordinalskala Intervallskala Verhältnisskala =,!= =,!=, >, < =,!=, >, ,
MehrGrundlagen der empirischen Sozialforschung
Vorlesung (2std.): Grundlagen der empirischen Sozialforschung (nicht für : OAWISS-Studierende) Zeitraum: Wintersemester 2006/07 (19.Oktober 2006 08.Februar 2007) Ort: Termin/ Raum: Campus Essen Donnerstag,
MehrWichtige statistische Koeffizienten und Formeln
Wichtige statistische Koeffizienten und Formeln Felix Baumann Skalenniveau Art des Koeffizienten Koeffizient Formel (ab) ominalskala: (Unterscheidung nach Gleichheit/Ungleichheit; jeder Ausprägung eine
MehrStatistik I. Sommersemester 2009
I Sommersemester 2009 I Wiederholung/Einführung χ 2 =?!? I Wiederholung/Einführung χ 2 =?!? Nächste Woche: Maße für ordinale, nominal/intervallskalierte und intervallskalierte Daten I Zum Nachlesen Agresti/Finlay:
MehrChi² Test und Kontingenzkoeffizient. - aber keine natürliche Reihenfolge
Chi² Test und Kontingenzoeffizient Für nominalsalierte Daten: - diese haben unterschiedliche Ausprägung, - aber eine natürliche Reihenfolge 1. Chi² Test Test nominalsalierter Daten Vergleich von beobachteten
MehrStatistik I. Sommersemester 2009
I Sommersemester 2009 I χ 2 =?!? Nächste Woche: Maße für ordinale, nominal/intervallskalierte und intervallskalierte Daten I Zum Nachlesen Agresti/Finlay: Kapitel 8.1-8.4 Gehring/Weins: Kapitel 7.1 Schumann:
Mehr5.2.3 Grafische Darstellung der gemeinsamen Verteilung. Verschiedene Darstellungsarten, z.b. als 3D-Säulendiagramm der gemeinsamen Häufigkeiten
5.2.3 Grafische Darstellung der gemeinsamen Verteilung 5.2 Assoziationsmessung in Kontingenztafeln Verschiedene Darstellungsarten, z.b. als 3D-Säulendiagramm der gemeinsamen Häufigkeiten h ij oder normale
MehrAlternative Darstellung des 2-Stcihprobentests für Anteile
Alternative Darstellung des -Stcihprobentests für Anteile DCF CF Total n 111 11 3 Response 43 6 69 Resp. Rate 0,387 0,3 0,309 Bei Gültigkeit der Nullhypothese Beobachtete Response No Response Total absolut
Mehr5.3 (Empirische) Unabhängigkeit und χ 2
5.3 (Empirische) Unabhängigkeit und χ 2 5.3.1 (Empirische) Unabhängigkeit Durch den Vergleich der bedingten Häufigkeiten mit den Randhäufigkeiten kann man Zusammenhänge beurteilen Illustration an einem
MehrAssoziation & Korrelation
Statistik 1 für SoziologInnen Assoziation & Korrelation Univ.Prof. Dr. Marcus Hudec Einleitung Bei Beobachtung von Merkmalen stellt sich die Frage, ob es Zusammenhänge oder Abhängigkeiten zwischen den
MehrStatistik I. 1. Klausur Wintersemester 2010/2011 Hamburg, Art der Anmeldung: STiNE FlexNow Zulassung unter Vorbehalt
Statistik I 1. Klausur Wintersemester 2010/2011 Hamburg, 11.02.2011 BITTE LESERLICH IN DRUCKBUCHSTABEN AUSFÜLLEN! Nachname:............................................................................ Vorname:.............................................................................
MehrAssoziation & Korrelation
Statistik 1 für SoziologInnen Assoziation & Korrelation Univ.Prof. Dr. Marcus Hudec Einleitung Bei Beobachtung von 2 Merkmalen stellt sich die Frage, ob es systematische Zusammenhänge oder Abhängigkeiten
MehrBivariate Verteilungen [bivariate data]
Bivariate Verteilungen [bivariate data] Zwei Variablen X, Y werden gemeinsam betrachtet, d.h. an jedem Objekt i werden zwei Merkmale beobachtet. Beobachtungswerte sind Paare/Kombinationen von Merkmalsausprägungen
MehrLösungen zum Aufgabenblatt 2: Bivariate Kreuztabellen mit nominalem Messniveau
Lösungen zum Aufgabenblatt 2 1 Lösungen zum Aufgabenblatt 2: Bivariate Kreuztabellen mit nominalem Messniveau Nach dem Laden des Datensatzes (G:\DATEN\METH2\DATEN\EUROBAR\ Euba30.sav) ist zunächst der
MehrZusammenhangsanalyse mit SPSS. Messung der Intensität und/oder der Richtung des Zusammenhangs zwischen 2 oder mehr Variablen
- nominal, ordinal, metrisch In SPSS: - Einfache -> Mittelwerte vergleichen -> Einfaktorielle - Mehrfaktorielle -> Allgemeines lineares Modell -> Univariat In SPSS: -> Nichtparametrische Tests -> K unabhängige
MehrKapitel 5 Wichtige Maßzahlen für den Zusammenhang zwischen Merkmalen
Kapitel 5 Wichtige Maßzahlen für den Zusammenhang zwischen Merkmalen 5.1 Darstellung der Verteilung zweidimensionaler Merkmale 5.2 Maßzahlen für den Zusammenhang zweier nominaler Merkmale 5.3 Maßzahlen
MehrKontingenzkoeffizient (nach Pearson)
Assoziationsmaß für zwei nominale Merkmale misst die Unabhängigkeit zweier Merkmale gibt keine Richtung eines Zusammenhanges an 46 o jl beobachtete Häufigkeiten der Kombination von Merkmalsausprägungen
MehrLösungen zu Janssen/Laatz, Statistische Datenanalyse mit SPSS 1
LÖSUNG 4B a.) Lösungen zu Janssen/Laatz, Statistische Datenanalyse mit SPSS 1 Mit "Deskriptive Statistiken", "Kreuztabellen " wird die Dialogbox "Kreuztabellen" geöffnet. POL wird in das Eingabefeld von
Mehr2. Zusammenhangsmaße
2. Zusammenhangsmaße Signifikante χ²-werte von Kreuztabellen weisen auf die Existenz von Zusammenhängen zwischen den zwei untersuchten Variablen X und Y hin. Für die Interpretation interessieren jedoch
MehrMusterlösung zur Aufgabensammlung Statistik I Teil 3
Musterlösung zur Aufgabensammlung Statistik I Teil 3 2008, Malte Wissmann 1 Zusammenhang zwischen zwei Merkmalen Nominale, Ordinale Merkmale und Mischungen Aufgabe 12 a) x\ y 1.Klasse 2.Klasse 3.Klasse
MehrTutorial:Unabhängigkeitstest
Tutorial:Unabhängigkeitstest Mit Daten aus einer Befragung zur Einstellung gegenüber der wissenschaftlich-technischen Entwicklungen untersucht eine Soziologin den Zusammenhang zwischen der Einstellung
MehrAlternative Darstellung des 2-Stichprobentests für Anteile
Alternative Darstellung des -Stichprobentests für Anteile DCF CF Total n= 111 11 3 Response 43 6 69 Resp. Rate 0,387 0,3 0,309 Bei Gültigkeit der Nullhypothese Beobachtete Response No Response Total absolut
Mehr5.3 (Empirische) Unabhängigkeit und χ 2
5.3 (Empirische) Unabhängigkeit und χ 2 5.3 (Empirische) Unabhängigkeit und χ 2 5.3.1 (Empirische) Unabhängigkeit Durch den Vergleich der bedingten Häufigkeiten mit den Randhäufigkeiten kann man Zusammenhänge
MehrKapitel 17. Unabhängigkeit und Homogenität Unabhängigkeit
Kapitel 17 Unabhängigkeit und Homogenität 17.1 Unabhängigkeit Im Rahmen der Wahrscheinlichkeitsrechnung ist das Konzept der Unabhängigkeit von zentraler Bedeutung. Die Ereignisse A und B sind genau dann
MehrStatistische Methoden in den Umweltwissenschaften
Statistische Methoden in den Umweltwissenschaften Korrelationsanalysen Kreuztabellen und χ²-test Themen Korrelation oder Lineare Regression? Korrelationsanalysen - Pearson, Spearman-Rang, Kendall s Tau
MehrPrüfung aus Statistik 1 für SoziologInnen- Gruppe A
Prüfung aus Statistik 1 für SoziologInnen- Gruppe A 26. Juni 2012 Gesamtpunktezahl =80 Prüfungsdauer: 2 Stunden 1) Wissenstest (maximal 20 Punkte) Lösungen Kreuzen ( ) Sie die jeweils richtige Antwort
MehrMathematik 2 für Naturwissenschaften
Hans Walser Mathematik 2 für Naturwissenschaften 2 3 3 4 6 4 5 0 0 5 6 5 20 5 6 Tabellen (leicht gekürzte Version) Hans Walser: Tabellen ii Inhalt Binomische Verteilung.... Binomische Verteilung (ohne
Mehr5.5 PRE-Maße (Fehlerreduktionsmaße) 6
359 5.5 PRE-Maße (Fehlerreduktionsmaße) 6 5.5.1 Die grundlegende Konstruktion Völlig andere, sehr allgemeine Grundidee zur Beschreibung von Zusammenhängen. Grundlegendes Prinzip vieler statistischer Konzepte.
MehrAssoziation & Korrelation
Statistik 1 für SoziologInnen Assoziation & Korrelation Univ.Prof. Dr. Marcus Hudec Einleitung Bei Beobachtung von 2 Merkmalen stellt sich die Frage, ob es Zusammenhänge oder Abhängigkeiten zwischen den
MehrWillkommen zur Vorlesung Statistik (Master)
Willkommen zur Vorlesung Statistik (Master) Thema dieser Vorlesung: Verteilungen stetiger Zufallsvariablen Prof. Dr. Wolfgang Ludwig-Mayerhofer Universität Siegen Philosophische Fakultät, Seminar für Sozialwissenschaften
MehrChi-Quadrat Verfahren
Chi-Quadrat Verfahren Chi-Quadrat Verfahren werden bei nominalskalierten Daten verwendet. Die einzige Information, die wir bei Nominalskalenniveau zur Verfügung haben, sind Häufigkeiten. Die Quintessenz
MehrStatistik I für Betriebswirte Vorlesung 14
Statistik I für Betriebswirte Vorlesung 14 Dr. Andreas Wünsche TU Bergakademie Freiberg Institut für Stochastik 13. Juli 017 Dr. Andreas Wünsche Statistik I für Betriebswirte Vorlesung 14 Version: 8. Juli
MehrZwei kategoriale Merkmale. Homogenität Unabhängigkeit
121 Zwei kategoriale Merkmale Homogenität Unabhängigkeit 122 Beispiel Gründe für die Beliebtheit bei Klassenkameraden 478 neun- bis zwölfjährige Schulkinder in Michigan, USA Grund für Beliebtheit weiblich
MehrGrundidee. χ 2 Tests. Ausgangspunkt: Klasseneinteilung der Beobachtungen in k Klassen. Grundidee. Annahme: Einfache Zufallsstichprobe (X 1,..., X n ).
Grundidee χ 2 -Anpassungstest χ 2 -Unabhängigkeitstest χ 2 -Homogenitätstest χ 2 Tests Grundidee Ausgangspunkt: Klasseneinteilung der Beobachtungen in k Klassen Annahme: Einfache Zufallsstichprobe (X 1,,
MehrAlle weiteren Messoperationen schließen die Klassifikation als Minimaloperation ein.
1 unterschiedliche Skalenniveaus Wir haben zuvor schon kurz von unterschiedlichen Skalenniveaus gehört, nämlich dem: - Nominalskalenniveau - Ordinalskalenniveau - Intervallskalenniveau - Ratioskalenniveau
MehrQuantitative Auswertung II. Korpuslinguistik Heike Zinsmeister
Quantitative Auswertung II Korpuslinguistik Heike Zinsmeister 16.12.2011 Unterschiedstest Fall 1: unabhängige Stichproben Daten eine unabhängige Variable auf Nominal- oder Kategorialniveau eine abhängige
MehrKlassifikation von Signifikanztests
Klassifikation von Signifikanztests nach Verteilungsannahmen: verteilungsabhängige = parametrische Tests verteilungsunabhängige = nichtparametrische Tests Bei parametrischen Tests werden im Modell Voraussetzungen
MehrMathematik 2 für Naturwissenschaften
Hans Walser Mathematik 2 für Naturwissenschaften 2 3 3 4 6 4 5 0 0 5 6 5 20 5 6 Tabellen (leicht gekürzte Version) Hans Walser: Tabellen ii Inhalt Binomische Verteilung.... Binomische Verteilung (ohne
MehrGibt es einen Zusammenhang zwischen Merkmalen? Korrelationen
Arbeitsblatt SPSS Kapitel 8 Seite Gibt es einen Zusammenhang zwischen Merkmalen? Korrelationen Wie in allen Kapiteln gehen wir im Folgenden davon aus, dass Sie die Datei elporiginal.sav geöffnet haben.
Mehr5.5 PRE-Maße (Fehlerreduktionsmaße)
5.5 PRE-Maße (Fehlerreduktionsmaße) 5.5.1 Die grundlegende Konstruktion Völlig andere, sehr allgemeine Grundidee zur Beschreibung von Zusammenhängen. Grundlegendes Prinzip vieler statistischer Konzepte.
MehrAnwendung A_0801_Quantile_Minimum_Maximum
8. Lageparameter 63 8.3 Interaktive EXCEL-Anwendungen (CD-ROM) Anwendung A_080_Quantile_Minimum_Maimum Die Anwendung besteht aus einem Tabellenblatt Simulation : In der Simulation wird aus einer Urliste
MehrGrundlagen der empirischen Sozialforschung
Grundlagen der empirischen Sozialforschung Sitzung 10 - Datenanalyseverfahren Jan Finsel Lehrstuhl für empirische Sozialforschung Prof. Dr. Petra Stein 22. Dezember 2008 1 / 21 Online-Materialien Die Materialien
MehrTest auf den Erwartungswert
Test auf den Erwartungswert Wir interessieren uns für den Erwartungswert µ einer metrischen Zufallsgröße. Beispiele: Alter, Einkommen, Körpergröße, Scorewert... Wir können einseitige oder zweiseitige Hypothesen
Mehr3 Häufigkeitsverteilungen
3 Häufigkeitsverteilungen 3.1 Absolute und relative Häufigkeiten 3.2 Klassierung von Daten 3.3 Verteilungsverläufe 3.1 Absolute und relative Häufigkeiten Datenaggregation: Bildung von Häufigkeiten X nominal
MehrSehr Einigermaßen Nicht Schüler Lehrer Eltern h 0.j n=500
1. Aufgabe 1.1 Kreuz- bzw. Kontingenztabelle, auch bivariate Häufigkeitsverteilung. Mermal X: nominal, Merkmal Y: ordinal. Tabelle der beobachteten Häufigkeiten mit Randverteilungen: Ich (mein Kind) fühlt
MehrInstitut für Soziologie Werner Fröhlich. Methoden 2. Kontingenztabellen Chi-Quadrat-Unabhängigkeitstest
Institut für Soziologie Methoden 2 Kontingenztabellen Chi-Quadrat-Unabhängigkeitstest Aufbau der Sitzung Was sind Kontingenztabellen? Wofür werden Kontingenztabellen verwendet? Aufbau und Interpretation
Mehr5. Spezielle stetige Verteilungen
5. Spezielle stetige Verteilungen 5.1 Stetige Gleichverteilung Eine Zufallsvariable X folgt einer stetigen Gleichverteilung mit den Parametern a und b, wenn für die Dichtefunktion von X gilt: f x = 1 für
MehrLösungen zur deskriptiven Statistik
Lösungen zur deskriptiven Statistik Aufgabe 1. Bei einer Stichprobe von n = Studenten wurden folgende jährliche Ausgaben (in e) für Urlaubszwecke ermittelt. 1 58 5 35 6 8 1 6 55 4 47 56 48 1 6 115 8 5
Mehr73 Hypothesentests Motivation Parametertest am Beispiel eines Münzexperiments
73 Hypothesentests 73.1 Motivation Bei Hypothesentests will man eine gewisse Annahme über eine Zufallsvariable darauf hin überprüfen, ob sie korrekt ist. Beispiele: ( Ist eine Münze fair p = 1 )? 2 Sind
MehrW-Rechnung und Statistik für Ingenieure Übung 5
W-Rechnung und Statistik für Ingenieure Übung 5 Grafische/ tabellarische Darstellung für bivariate Daten diskrete Merkmale (qualitativ+ quantitativ diskret) stetige Merkmale (quantitativ stetig) Zusammenhangsmaße
MehrDer χ 2 -Test (Chiquadrat-Test)
Der χ 2 -Test (Chiquadrat-Test) Der Grundgedanke Mit den χ 2 -Methoden kann überprüft werden, ob sich die empirischen (im Experiment beobachteten) Häufigkeiten einer nominalen Variable systematisch von
Mehr3. ZWEI KATEGORIALE MERKMALE (bivariate kategoriale Daten)
3. ZWEI KATEGORIALE MERKMALE (bivariate kategoriale Daten) Beispiel: Gründe für Beliebtheit bei Klassenkameraden 478 neun- bis zwölfjährigen Schulkinder in Michigan, USA warum ist man bei seinen Klassenkameraden
MehrWahrscheinlichkeitsverteilungen
Universität Bielefeld 3. Mai 2005 Wahrscheinlichkeitsrechnung Wahrscheinlichkeitsrechnung Das Ziehen einer Stichprobe ist die Realisierung eines Zufallsexperimentes. Die Wahrscheinlichkeitsrechnung betrachtet
Mehr7. Grenzwertsätze. Dr. Antje Kiesel Institut für Angewandte Mathematik WS 2011/2012
7. Grenzwertsätze Dr. Antje Kiesel Institut für Angewandte Mathematik WS 2011/2012 Mittelwerte von Zufallsvariablen Wir betrachten die arithmetischen Mittelwerte X n = 1 n (X 1 + X 2 + + X n ) von unabhängigen
MehrChi Quadrat-Unabhängigkeitstest
Fragestellung 1: Untersuchung mit Hilfe des Chi-Quadrat-Unabhängigkeitstestes, ob zwischen dem Herkunftsland der Befragten und der Bewertung des Kontaktes zu den Nachbarn aus einem Anderen Herkunftsland
MehrInstitut für Soziologie Dipl. Soz. Maximilian Sonnauer. Methoden II. Zusammenhangsmaße für kategoriale und metrische Variablen
Institut für Soziologie Dipl. Soz. Methoden II Zusammenhangsmaße für kategoriale und metrische Variablen Organisatorisches Prüfungsanmeldung Methoden II Die Anmeldung zur Prüfung läuft über die Tafelübung.
MehrSozialwissenschaftliche Fakultät der Universität Göttingen. Sommersemester 2009, Statistik mit SPSS
Sommersemester 2009, Statistik mit SPSS 26. August 2009 26. August 2009 Statistik Dozentin: mit Anja SPSS Mays 1 1. Ziel der Kreuztabellierung 2. Übersicht CROSSTABS - Syntax 3. 2x2 Kreuztabellen Überblick
Mehr3.1 Zusammenhang zwischen einem qualitativen und einem quantitativen Merkmal
Kapitel 3 Bivariate Analyse In Kapitel 2 haben wir gesehen, wie man ein Merkmal auswertet. Mit Hilfe statistischer Verfahren kann man aber auch untersuchen, ob zwischen mehreren Merkmalen Abhängigkeiten
MehrDeskriptive Statistik Kapitel IX - Kontingenzkoeffizient
Deskriptive Statistik Kapitel IX - Kontingenzkoeffizient Georg Bol bol@statistik.uni-karlsruhe.de Markus Höchstötter hoechstoetter@statistik.uni-karlsruhe.de Agenda 1. Untersuchung der Abhängigkeit 2.
MehrBivariate Statistik: Kreuztabelle
Bivariate Statistik: Kreuztabelle Beispiel 1: Im ALLBUS wurde u.a. nach dem Nationalstolz und nach dem Gefühl der Überfremdung gefragt: Würden Sie sagen, dass Sie sehr stolz, ziemlich stolz, nicht sehr
MehrAnalyse bivariater Kontingenztafeln
Analyse bivariater Kontingenztafeln Werden zwei kategoriale Merkmale mit nicht zu vielen möglichen Ausprägungen gemeinsam analysiert, so kommen zur Beschreibung der gemeinsamen Verteilung im allgemeinen
MehrInstitut für Soziologie Sabine Düval. Methoden 2. Kontingenztabellen Chi-Quadrat-Unabhängigkeitstest
Institut für Soziologie Methoden 2 Kontingenztabellen Chi-Quadrat-Unabhängigkeitstest Aufbau der Sitzung Wiederholung Exkurs zur Inferenzstatistik Was sind Kontingenztabellen? Recodieren, Kategorisieren
Mehr6. Multivariate Verfahren Übersicht
6. Multivariate Verfahren 6. Multivariate Verfahren Übersicht 6.1 Korrelation und Unabhängigkeit 6.2 Lineare Regression 6.3 Nichtlineare Regression 6.4 Nichtparametrische Regression 6.5 Logistische Regression
Mehr3 Häufigkeitsverteilungen
3 Häufigkeitsverteilungen 3.1 Absolute und relative Häufigkeiten 3.2 Klassierung von Daten 3.3 Verteilungsverläufe 3.1 Absolute und relative Häufigkeiten Datenaggregation: Bildung von Häufigkeiten X nominal
MehrAnalytische Statistik II
Analytische Statistik II Institut für Geographie 1 Schätz- und Teststatistik 2 Das Testen von Hypothesen Während die deskriptive Statistik die Stichproben nur mit Hilfe quantitativer Angaben charakterisiert,
Mehr5 Assoziationsmessung in Kontingenztafeln
5 Assoziationsmessung in Kontingenztafeln 51 Multivariate Merkmale 51 Multivariate Merkmale Gerade in der Soziologie ist die Analyse eindimensionaler Merkmale nur der allererste Schritt zur Beschreibung
Mehr5. Seminar Statistik
Sandra Schlick Seite 1 5. Seminar 5. Seminar Statistik 30 Kurztest 4 45 Testen von Hypothesen inkl. Übungen 45 Test- und Prüfverfahren inkl. Übungen 45 Repetitorium und Prüfungsvorbereitung 15 Kursevaluation
MehrWirtschaftsstatistik-Klausur am
Wirtschaftsstatistik-Klausur am 0.07.017 Aufgabe 1 Ein Handy- und PC-Hersteller verfügt über ein exklusives Filialnetz von 900 Filialen. Der Gewinn (in GE) der Filialen ist in der folgenden Tabelle nach
MehrKlausur zu Methoden der Statistik I (mit Kurzlösung) Wintersemester 2008/2009. Aufgabe 1
Lehrstuhl für Statistik und Ökonometrie der Otto-Friedrich-Universität Bamberg Prof. Dr. Susanne Rässler Klausur zu Methoden der Statistik I (mit Kurzlösung) Wintersemester 2008/2009 Aufgabe 1 Der Student
MehrWahrscheinlichkeitsrechnung und Statistik für Biologen Spezielle Verteilungen
Wahrscheinlichkeitsrechnung und Statistik für Biologen Spezielle Verteilungen Noémie Becker & Dirk Metzler http://evol.bio.lmu.de/_statgen 7. Juni 2013 1 Binomialverteilung 2 Normalverteilung 3 T-Verteilung
MehrEinführung in SPSS. Sitzung 4: Bivariate Zusammenhänge. Knut Wenzig. 27. Januar 2005
Sitzung 4: Bivariate Zusammenhänge 27. Januar 2005 Inhalt der letzten Sitzung Übung: ein Index Umgang mit missing values Berechnung eines Indexes Inhalt der letzten Sitzung Übung: ein Index Umgang mit
MehrStatistik. Sommersemester Prof. Dr. Stefan Etschberger Hochschule Augsburg
für Betriebswirtschaft, Internationales Management, Wirtschaftsinformatik und Informatik Sommersemester 2016 Prof. Dr. Stefan Etschberger Hochschule Augsburg Weitere smaße skoeffizient: CR g = Anteil,
Mehr5. Kolmogorov-Smirnov-Test und χ 2 -Anpassungstest
Empirische Wirtschaftsforschung Prof. Dr. Ralf Runde 5. Kolmogorov-Smirnov-Test und χ 2 -Anpassungstest Ein wesentliches Merkmal nichtparametrischer Testverfahren ist, dass diese im Allgemeinen weniger
MehrKonkretes Durchführen einer Inferenzstatistik
Konkretes Durchführen einer Inferenzstatistik Die Frage ist, welche inferenzstatistischen Schlüsse bei einer kontinuierlichen Variablen - Beispiel: Reaktionszeit gemessen in ms - von der Stichprobe auf
MehrTutorial: Vergleich von Anteilen
Tutorial: Vergleich von Anteilen Die Sicherung des Pensionssystems ist in vielen Ländern ein heikles Thema. Noch stärker als der Streit, wer wann welche Pension beziehen können soll, tobt ein Streit, welche
MehrKlausur zur Vorlesung
Institut für Mathematische Stochastik WS 2004/2005 Universität Karlsruhe 14. Februar 2005 Dr. Bernhard Klar Sebastian Müller Aufgabe 1: (15 Punkte) Klausur zur Vorlesung Statistik für Biologen Musterlösungen
MehrÜbung zu Empirische Ökonomie für Fortgeschrittene SS 2009
Übung zu Empirische Ökonomie für Fortgeschrittene Steen Elstner, Klaus Wohlrabe, Steen Henzel SS 9 1 Wichtige Verteilungen Die Normalverteilung Eine stetige Zufallsvariable mit der Wahrscheinlichkeitsdichte
MehrParametrische vs. Non-Parametrische Testverfahren
Parametrische vs. Non-Parametrische Testverfahren Parametrische Verfahren haben die Besonderheit, dass sie auf Annahmen zur Verteilung der Messwerte in der Population beruhen: die Messwerte sollten einer
Mehr