METHODENPRAKTIKUM II Kurs 1. Prof. Dr. Beat Fux SUZ Frühlingssemester 2009
|
|
- Franziska Färber
- vor 6 Jahren
- Abrufe
Transkript
1 METHODENPRAKTIKUM II Kurs 1 Prof. Dr. Beat Fux SUZ Frühlingssemester 2009
2 Prüfung von Modellannahmen (Regression) Stichprobengrösse Ausreisser Linearität Multikollinearität Normalverteilung Homoskedastizität 2
3 Stichprobengrösse Faustregel: Für die Prüfung der Regressionsgleichung: N > *Anzahl der UVs Für die Prüfung der Regressionskoeffizienten: N > Anzahl der UVs 3
4 Ausreisser 4
5 Ausreisser (2) 5
6 Linearität (1) 6
7 Linearität (2) 7
8 Multikollinearität (1) 8
9 Multikollinearität (2) 9
10 Normalverteilung (1) 10
11 Normalverteilung (2) 11
12 Normalverteilung (3) 12
13 Normalverteilung (4) 13
14 Normalverteilung (5) 14
15 Homoskedastizität (1) 15
16 Homoskedastizität (2) 16
17 Homoskedastizität (3) 17
18 Datentransformation (1) 18
19 Datentransformation (2) 19
20 Multivariate Verfahren Dimensionierend - Regression - Varianzanalyse - Faktorenanalyse - Korrespondenzanalyse Skalierend - Reliabilitätsanalyse - multidimensional scaling MDS 20 Gruppierend - Clusteranalyse - Diskriminanzanalyse
21 Multivariate Verfahren Strukturen prüfen - Regression - Varianzanalyse - Korrespondenzanalyse - Reliabilitätsanalyse - Diskriminanzanalyse Strukturen entdecken - Clusteranalyse - Faktorenanalyse - multidimensional scaling MDS 21
22 Verfahren dimensionierend skalierend gruppierend Strukturen prüfen Regression Varianzanalyse Korrespondenz -analyse Reliabilitäts -analyse Diskriminanz -analyse Strukturen entdecken Faktoranalyse Clusteranalyse multidim.- Scaling 22
23 Datenniveau unabhängige Variable metrisch nominal abhängige Variable metrisch nominal Regression Korrespondenzanalyse Diskriminanzanalyse Varianzanalyse 23
24 Verfahren nur nominal metrisch /nominal metrisch /ordinal nur metrisch Varianzanalyse Diskriminanzanalyse Korrespondenzanalyse multidim.- Scaling Faktoranalyse Regression Reliabilitäts -analyse beliebig Clusteranalyse gelb= strukturprüfend 24
25 Anwendungen - Regression Frage Logik Bsp Eine abhängige Variable soll aufgrund einer/mehrerer anderer Variablen erklärt/geschätzt/ vorhergesagt werden Multiple Korrelation partielle Korrelation Einkommen schätzen aus Alter, Dauer der Ausbildung, Wochenstunden, Geschlecht, dimensionierend Strukturen prüfen alle Variablen metrisch + normalverteilt 25
26 F = 37,8, sig,00000 Social survey 1993 n für diese Analyse = 273 (exclude missings listwise) 26
27 Anwendungen - Varianzanalyse Frage Logik Bsp Die Mittelwerte einer abhängigen Variable in verschiedenen Gruppen werden auf signifikanten Unterschied getestet Varianz innerhalb der Gruppen versus Varianz zwischen den Gruppen Durchschnittl. Hausarbeitszeit nach Geschlecht und Familienstand 27 dimensionierend Strukturen prüfen Testvariable(n) metrisch Gruppenvariablen kategorial
28 Hausarbeitszeit in Min Geschätztes Randmittel verheiratet geschieden/getrennt maennlich weiblich verw itw et ledig 28 Familienstand
29 Anwendungen - Faktoranalyse Frage Logik Bsp Hinter mehreren Variablen liegende Dimensionen auffinden eine Art von Regression - neue Funktionen bzw. Faktoren bilden Typische Ernährungsgewohnheiten nach abgefragten Nahrungsmitteln dimensionierend Strukturen entdecken alle Variablen metrisch, gleiche Skala + normalverteilt 29
30 fast food gesund Kaffee HBSC Gesundheitsrelevantes Verhalten von SchülerInnen, 1990 n=
31 Anwendungen Korrespondenz Frage Logik Bsp Für welche Gruppen sind welche Merkmale bedeutend Mehrdimensionale Kreuztabellenanalyse Rauchgewohnheiten bei bestimmen Gruppen dimensionierend Strukturen prüfen alle Variablen kategorial 31
32 Anwendungen Clusteranalyse Frage Logik Bsp Anhand von relevanten Merkmalen sollen Gruppen bestimmt werden Abstände zwischen Personenpunkten im Personenraum Lifestyles aufgrund von Einstellungen und sozioökonom. Merkmalen gruppierend Strukturen entdecken 32 beliebiges Datenniveau
33 hedonistisch konventionel l materialistisch intellektuell traditionel l konservativ 33
34 34
35 Anwendungen Diskriminanzanalyse Frage Logik Bsp Ist die bestehende Gruppenbildung sinnvoll, bzw. welche Merkmale sind zur Gruppenbildung geeignet 35 Gruppen in zweidimensionalem Raum abbilden wie gut gelingt dies Funktion finden gruppierend Strukturen prüfen Einstellung zu Wissenschaft und Technik nach Lebensstil Testvariablen: metrisch + normalverteilt Gruppenvariable kategorial
36 Ausnützen versus Schonen 36 Funktion 2 2,0 1,5 1,0,5 0,0 -,5-1,0-1,5-2,0-2,0 materialistisch -1,5-1,0 intellektuell -,5 konservativ konventionell hedonistisch 0,0 traditionell 1,0 1,5 2,0 Optimismus/sorglos versus Pess/Angst Funktion Fux 1FS 2009,5 Kanonische Diskriminanzfunktion nach 34 Einstellungen zu Wissenschaft und Technik Lebensstile Gruppen -Mittelpunkte materialistisch hedonistisch intellektuell konservativ konventionell traditionell
37 Anwendungen Multidimensionale Skalierung Frage Logik Bsp Kann man mehrere Variablen auf zwei (od. mehrere) Skalen reduzieren eine Art Faktoranalyse Einkommen, Bildung und berufliche Position zur Dimension Statuskonsistenz und Statusinkonsistenz skalierend Strukturen entdecken alle Variablen kategorial oder metrisch 37
38 Objectscores Dim.2 (27% Variance) SES German women Statusinkonsist enz Objectscores Dim.1 (61% Variance) Cluster (n) (410) (2170) (988) (230) Δ (2170): low educational level, housewives, employees, skilled / unskilled workers low / middle income O (988): low / middle educational level employees, housewives, skilled workers, self employed in trade high / middle income (230): high educational level high qualified employees, freelancers and artists low / middle income (410): high educational level high qualified employees, freelancers and artists, managers high / middle income Statuskonsisten z 38
39 39
40 Biplot einer Faktoranalyse für kategoriale Daten F-3 F-2 LUX A ISL cent00 cent02 MOLD SERB BELA MONTE MAZ UKR LIT BG EST cent90 com95 com00 com02 com90 cent95 LAT SR PL right00 I right02 right95 NL soc90 soc95 H CH B IRL right90 SF N RU S F-1 F-4 soc02 CRO soc00 F DK P GR CZ D 40 UK
41 Cluster (dt.: Traube, Haufen) heuristisches Verfahren zur systematischen Klassifizierung von Beobachtungen, z.b. Personen, Autos, Schallplatten) Ziel: Auffinden von Gruppen, in denen sich Beobachtungen befinden, die innerhalb der Gruppe möglichst ähnlich sind und extern (zwischen den Gruppen) verschieden. Anwendungsgebiete: Sozialwissenschaften, Biologie, Wirtschaftswissenschaften, Marktforschung 41
42 Ähnlichkeit / Unähnlichkeit Die Ähnlichkeit bzw. Unähnlichkeit wird auf der Basis von Merkmalen definiert. Z.B. gleiches Alter, gleiche Haarfarbe. Andere Begriffe für Unähnlichkeit Distanz für Ähnlichkeit Proximität 42
43 Beispiel (10 Fälle, 2 Merkmale (A; B; beide stetig) 43
44 Euklidische Distanzen allgemein 44
45 Distanzmasse für metrische Variablen 45 Euklidische Distanz City Block-Distanz Summe der absoluten Differenzen = Spezialfälle der Minkowski-Distanz Hohe Unterschiede werden stark gewichtet. Masse sind translationsinvariant, aber nicht skaleninvariant. (Einkommen in Dollar oder Euro) Mahalanobis-Distanz dij=(xi-xj) S-1 (xixj) wobei S-1 die Inverse der Stichproben- Varianz-Kovarianzmatrix der p Merkmale ist. Translations- und Skaleninvariant
46 Binäre Variablen 46
47 Ähnlichkeitskoeffizient von Jaccard p ij =a / (a+b+c) (d spielt keine Rolle) Das entsprechende Distanzmass ist: d ij =1- p ij = (b+c) / (a+b+c) p ij nimmt Werte zwischen 0 und 1 an. Für das Beispiel: p AB = 3/6 =
48 Distanzmasse für binäre Merkmale (Simple) Matching Koeffizient pij=a+d / (a+b+c+d) Jaccard- (Tanimoto-) Koeffizient pij=a / (a+b+c) RR-Koeffizient pij=a / (a+b+c+d) Dice-Koeffizient pij=2 a / (2 a+b+c) 48
49 Mögliche Probleme 49 Ungleiche Skala Standardisierung Ungleiches Skalenniveau der Merkmale binäre Merkmale als metrische betrachten metrische Merkmale binär kodieren Aggregation der verschiedenen Distanzmaße Merkmale sind korreliert Berechnung von Faktorwerten Mahalanobis-Distanz Ordinalskalierte Merkmale Merkmale am Median dichotomisieren Merkmale als metrische Daten behandeln
50 Cluster-Analyse-Verfahren Start Clusterbildung Ziel Hierarchische Verfahren Feinste Partionierung, jedes Objekt bildet ein eigenes Cluster Fusionierung von Clustern Das zuvor festgelegte Kriterium ist erfüllt. Nichthierarchische Verfahren * Vorgabe einer Startgruppierung Verschieben der Objekte Das zuvor festgelegte Kriterium ist erfüllt. 50 * Auch: Partitionierendes Cluster-Analyse Verfahren, Clusterzentrenanalyse
51 Nichthierarchische Verfahren Objekte werden solange in verschiedene Gruppen sortiert, bis die beste Lösung im Sinne des Kriteriums gefunden ist. Problem: enormer Arbeits- und Zeitaufwand (bei 10 Objekten gibt es schon verschiedene Möglichkeiten), deshalb sind meist nur Annäherungen möglich. 51
52 Ein Beispiel 4 ISL S P r i n MOLD UKR BELA 3 BG RU LAT EST CZ 2 MAZ SR H LIT PL CRO CYP SLO P IRL 4 E UK A F B D NL LUX N 1 SF CH DK -3 GR I Prin 1 52
53 Hierarchische Verfahren 1. Berechnung der Distanzen zwischen den Clustern 2. Fusionierung der beiden Cluster, die die geringste Distanz zueinander haben 3. Berechnung des Ende-Kriteriums: Wenn erfüllt, dann Ende; sonst weiter. 4. Berechnung der neuen Distanzen 5. Zurück zu Punkt 2 ITERATIVES VERFAHREN!! 53
54 Bsp: 10 Fälle, 2 Merkmale (A;B; beide stetig 54
55 Distanzen zwischen den Clustern Single Linkage: Nächst gelegener Nachbar Kleinste Distanz zwischen einem Objekt des einen Clusters und einem Objekt des anderen Clusters Ketten-Tendenz Complete Linkage: Entferntester Nachbar größte Distanz zwischen einem Objekt des einen Clusters und einem Objekt des anderen Clusters anfällig für Ausreißer 55
56 Distanzen zwischen den Clustern (2) Average Linkage: Linkage zwischen den Gruppen. Durchschnitt aller Distanz zwischen den Objekten der beiden betrachteten Cluster tendiert dazu Cluster mit kleinen Varianzen zu verbinden, neigt zu Clustern mit gleicher Varianz Linkage innerhalb der Gruppen Zentroid: Zentroid Clustering Quadrierte Euklidische Distanz zwischen Cluster- Mittelwerten nur für metrische Merkmale, robust gegenüber Ausreissern) 56
57 Distanzen zwischen Clustern: Ward Distanz ist die Anova-Quadratsumme zwischen zwei Clustern (nur für intervallskalierte normalverteilte Daten) vereinigt diejenigen Elemente, deren Fusion die Gesamtvarianz innerhalb der Cluster am geringsten erhöht findet Cluster mit annährend gleicher Besetzungszahl anfällig für Ausreisser 57
58 Bewertungskriterium Distanz zwischen zwei Clustern Bestimmtheitsmass r 2 (RSQ) Semipartielles Bestimmheitsmass Pseudo-F Pseudo-t2 58
59 Überprüfung der Cluster-Lösung Inhaltliche Interpretation Deskriptive Unterschiede zwischen den Clustern auf weiteren Variablen Diskriminanzanalytische Überprüfung Clustervariable als Gruppenvariable Graphische Veranschaulichung Eiszapfen, Dendogramm, Plot 59
60 Hierarchische Clusteranalyse unter SPSS 60
61 Ergebnisse 61
62 Diagramme 62
63 Multidimensionale Skalierung Bei der multidimensionalen Skalierung wird versucht, die Struktur in einem Set von Distanzmassen zwischen Objekten oder Fällen zu erkennen. Dies wird durch das Zuweisen von Beobachtungen zu bestimmten Positionen in einem konzeptuellen Raum (gewöhnlich zwei- oder dreidimensional) erzielt, und zwar so, dass die Distanzen zwischen den Punkten des Raums mit den gegebenen Unähnlichkeiten so gut wie möglich übereinstimmen. In vielen Fällen können die Dimensionen dieses konzeptuellen Raums interpretiert und für ein besseres Verständnis Ihrer Daten verwendet werden. Wenn Sie über objektiv gemessene Variablen verfügen, können Sie die multidimensionale Skalierung als Technik zur Datenreduktion verwenden (erforderlichenfalls berechnet die Prozedur "Multidimensionale Skalierung" die Distanzen aus multivariaten Daten für Sie). Die multidimensionale Skalierung kann auch auf subjektive Einschätzungen von Unähnlichkeiten zwischen Objekten oder Konzepten angewendet werden. Ausserdem kann sie Unähnlichkeitsdaten aus mehreren Quellen verarbeiten. 63
64 Korrespondenzanalyse Das Ziel der Korrespondenzanalyse besteht darin, die Beziehungen zwischen zwei nominalen Variablen in einer Korrespondenztabelle in einem flachdimensionierten Raum und gleichzeitig die Beziehungen zwischen den Kategorien für jede Variable zu beschreiben. Für jede Variable werden die Beziehungen zwischen den Kategorien durch die Distanzen zwischen den Kategoriepunkten in einem Diagramm dargestellt, wobei ähnliche Kategorien jeweils nahe beieinander liegen. Durch die Projizierung von Punkten für eine Variable auf dem Vektor vom Ursprung zu einem Kategoriepunkt einer anderen Variablen wird die Beziehung zwischen den Variablen beschrieben. 64
65 Abgrenzung zur Kreuztabelle Bei einer Analyse der Kontingenztafeln werden häufig Zeilen- und Spaltenprofile untersucht und Tests auf Unabhängigkeit mit Hilfe der Chi-Quadrat- Statistik durchgeführt. Die Anzahl der Profile kann jedoch unter Umständen relativ gross sein, wobei durch die Chi-Quadrat-Statistik die Abhängigkeitsstruktur nicht erkennbar wird. Die Prozedur "Kreuztabelle" bietet verschiedene Zusammenhangsmasse und -tests, kann jedoch keine Beziehungen zwischen den Variablen darstellen. 65
66 Abgrenzung zu Faktoranalyse Die Faktorenanalyse ist ein Standardverfahren zur Beschreibung von Beziehungen zwischen Variablen in einem flachdimensionierten Raum. Zur Faktorenanalyse werden jedoch Intervalldaten benötigt. Ausserdem muss die Anzahl der Beobachtungen das Fünffache der Anzahl der Variablen betragen. Andererseits wird bei der Korrespondenzanalyse von nominalen Variablen ausgegangen, so dass die Beziehungen zwischen den Kategorien jeder Variablen sowie die Beziehungen zwischen den Variablen beschrieben werden können. Zudem kann die Korrespondenzanalyse zur Untersuchung einer beliebigen Tabelle mit positiven Korrespondenzmassen verwendet werden. 66
Einführung in die Cluster-Analyse mit SPSS
Einführung in die -Analyse mit SPSS SPSS-Benutzertreffen am URZ Carina Ortseifen. Juli 00 Inhalt. analyse im allgemeinen Definition, Distanzmaße, Gruppierung, Kriterien. analyse mit SPSS a) Hierarchische
MehrEinführung in die Cluster-Analyse mit SAS
Einführung in die Cluster-Analyse mit SAS Benutzertreffen am URZ Carina Ortseifen 4. Juli 2003 Inhalt 1. Clusteranalyse im allgemeinen Definition, Distanzmaße, Gruppierung, Kriterien 2. Clusteranalyse
MehrStatistik IV für Studenten mit dem Nebenfach Statistik Lösungen zu Blatt 9 Gerhard Tutz, Jan Ulbricht SS 07
Statistik IV für Studenten mit dem Nebenfach Statistik Lösungen zu Blatt 9 Gerhard Tutz, Jan Ulbricht SS 07 Ziel der Clusteranalyse: Bilde Gruppen (cluster) aus einer Menge multivariater Datenobjekte (stat
MehrAngewandte Statistik 3. Semester
Angewandte Statistik 3. Semester Übung 5 Grundlagen der Statistik Übersicht Semester 1 Einführung ins SPSS Auswertung im SPSS anhand eines Beispieles Häufigkeitsauswertungen Grafiken Statistische Grundlagen
MehrDie Clusteranalyse 24.06.2009. Clusteranalyse. Grundidee Mögliche Anwendungsgebiete gg Vorgehensweise Beispiele. methodenlehre ll Clusteranalyse
Clusteranalyse Thomas Schäfer SS 2009 1 Die Clusteranalyse Grundidee Mögliche Anwendungsgebiete gg Vorgehensweise Beispiele Thomas Schäfer SS 2009 2 1 Die Clusteranalyse Grundidee: Eine heterogene Gesamtheit
MehrComputergestützte Methoden. Master of Science Prof. Dr. G. H. Franke WS 07/08
Computergestützte Methoden Master of Science Prof. Dr. G. H. Franke WS 07/08 1 Seminarübersicht 1. Einführung 2. Recherchen mit Datenbanken 3. Erstellung eines Datenfeldes 4. Skalenniveau und Skalierung
MehrStatistik. Jan Müller
Statistik Jan Müller Skalenniveau Nominalskala: Diese Skala basiert auf einem Satz von qualitativen Attributen. Es existiert kein Kriterium, nach dem die Punkte einer nominal skalierten Variablen anzuordnen
MehrEinfache statistische Auswertungen mit dem Programm SPSS
Einfache statistische Auswertungen mit dem Programm SPSS Datensatz: fiktive_daten.sav Dipl. Päd. Anne Haßelkus Dr. Dorothea Dette-Hagenmeyer 11/2011 Überblick 1 Deskriptive Statistiken; Mittelwert berechnen...
MehrSozialwissenschaftliche Fakultät der Universität Göttingen. Sommersemester Statistik mit SPSS
Sommersemester 2009 Statistik mit SPSS 09. Mai 2009 09. Mai 2009 Statistik Dozentin: mit Esther SPSSOchoa Fernández 1 Arbeitsschritte bei der Datenanalyse Datenmanagement (Einlesen von Daten, Teilen von
MehrAuswertung mit dem Statistikprogramm SPSS: 30.11.05
Auswertung mit dem Statistikprogramm SPSS: 30.11.05 Seite 1 Einführung SPSS Was ist eine Fragestellung? Beispiel Welche statistische Prozedur gehört zu welcher Hypothese? Statistische Berechnungen mit
MehrZusammenhangsanalyse mit SPSS. Messung der Intensität und/oder der Richtung des Zusammenhangs zwischen 2 oder mehr Variablen
- nominal, ordinal, metrisch In SPSS: - Einfache -> Mittelwerte vergleichen -> Einfaktorielle - Mehrfaktorielle -> Allgemeines lineares Modell -> Univariat In SPSS: -> Nichtparametrische Tests -> K unabhängige
MehrEine computergestützte Einführung mit
Thomas Cleff Deskriptive Statistik und Explorative Datenanalyse Eine computergestützte Einführung mit Excel, SPSS und STATA 3., überarbeitete und erweiterte Auflage ^ Springer Inhaltsverzeichnis 1 Statistik
MehrSozialwissenschaftliche Datenanalyse mit R
Katharina Manderscheid Sozialwissenschaftliche Datenanalyse mit R Eine Einführung F' 4-1 V : 'i rl ö LiSl VS VERLAG Inhaltsverzeichnis Vorwort 5 Danksagung 7 Inhaltsverzeichnis 9 R für sozialwissenschaftliche
MehrStatistische Grundlagen I
Statistische Grundlagen I Arten der Statistik Zusammenfassung und Darstellung von Daten Beschäftigt sich mit der Untersuchung u. Beschreibung von Gesamtheiten oder Teilmengen von Gesamtheiten durch z.b.
MehrMultivariate Statistik
Hermann Singer Multivariate Statistik 1 Auflage 15 Oktober 2012 Seite: 12 KAPITEL 1 FALLSTUDIEN Abbildung 12: Logistische Regression: Geschätzte Wahrscheinlichkeit für schlechte und gute Kredite (rot/blau)
MehrDatenanalyse mit Excel und Gretl
Dozent: Christoph Hindermann christoph.hindermann@uni-erfurt.de Datenanalyse mit Excel und Gretl Teil Titel 2: Gretl 1 Teil 2: Gretl Datenanalyse mit Excel und Gretl Teil Titel 2: Gretl 2 Modellannahmen
MehrSozialwissenschaftliche Fakultät der Universität Göttingen. Sommersemester 2009, Statistik mit SPSS
Sommersemester 2009, Statistik mit SPSS 26. August 2009 26. August 2009 Statistik Dozentin: mit Anja SPSS Mays 1 Bivariate Datenanalyse, Überblick bis Freitag heute heute Donnerstag Donnerstag Freitag
MehrStatistische Datenanalyse mit SPSS
Jürgen Janssen Wilfried Laatz Statistische Datenanalyse mit SPSS Eine anwendungsorientierte Einführung in das Basissystem und das Modul Exakte Tests Siebte, neu bearbeitete und erweiterte Auflage 4ü Springer
MehrProjekt Kaffeemaschine Welche Faktoren beeinflussen das Geschmacksurteil?
AKULTÄT ANGEWANDTE SOZIALWISSENSCHATEN PRO. DR. SONJA HAUG Projekt Kaffeemaschine Welche aktoren beeinflussen das Geschmacksurteil? Ausgehend von der Verkostung an der Hochschule Regensburg und der dabei
MehrHierarchische Clusteranalyse
Hierarchische Clusteranalyse Unter dem Menupunkt Statistik - Klassifizieren finden sich sowohl agglomerative ( hierarchische ) als auch partitionierende ( Clusterzentren ) Clusteranalyseverfahren. Da die
MehrModulklausur Multivariate Verfahren
Name, Vorname Matrikelnummer Modulklausur 31821 Multivariate Verfahren Datum Punkte Note Termin: 28. März 2014, 9.00-11.00 Uhr Erstprüfer: Univ.-Prof. Dr. H. Singer Hinweise zur Bearbeitung der Modulklausur
MehrInhaltsverzeichnis. II. Statistische Modelle und sozialwissenschaftliche Meßniveaus 16
Vorwort 1 1. Kapitel: Der Stellenwert der Statistik für die sozialwissenschaflliche Forschung 1 1. Zur Logik (sozial-)wissenschaftlicher Forschung 1 1. Alltagswissen und wissenschaftliches Wissen 1 2.
MehrMarketing III - Angewandte Marktforschung (SS 2016)
TECHNISCHE UNIVERSITÄT ILMENAU Fakultät für Wirtschaftswissenschaften und Medien Fachgebiet Marketing Univ.-Prof. Dr. rer. pol. habil. Anja Geigenmüller Marketing III - Angewandte Marktforschung (SS 2016)
MehrFlorian Frötscher und Demet Özçetin
Statistische Tests in der Mehrsprachigkeitsforschung Aufgaben, Anforderungen, Probleme. Florian Frötscher und Demet Özçetin florian.froetscher@uni-hamburg.de SFB 538 Mehrsprachigkeit Max-Brauer-Allee 60
MehrChi-Quadrat Verfahren
Chi-Quadrat Verfahren Chi-Quadrat Verfahren werden bei nominalskalierten Daten verwendet. Die einzige Information, die wir bei Nominalskalenniveau zur Verfügung haben, sind Häufigkeiten. Die Quintessenz
MehrGrundlagen der Datenanalyse am Beispiel von SPSS
Grundlagen der Datenanalyse am Beispiel von SPSS Einführung Dipl. - Psych. Fabian Hölzenbein hoelzenbein@psychologie.uni-freiburg.de Einführung Organisatorisches Was ist Empirie? Was ist Statistik? Dateneingabe
MehrHypothesentests mit SPSS. Beispiel für eine einfaktorielle Varianzanalyse Daten: museum_m_v05.sav
Beispiel für eine einfaktorielle Varianzanalyse Daten: museum_m_v05.sav Hypothese: Die Beschäftigung mit Kunst ist vom Bildungsgrad abhängig. 1. Annahmen Messniveau: Modell: Die Skala zur Erfassung der
MehrInhaltsverzeichnis. Teil 1 Basiswissen und Werkzeuge, um Statistik anzuwenden
Inhaltsverzeichnis Teil 1 Basiswissen und Werkzeuge, um Statistik anzuwenden 1 Statistik ist Spaß 3 Warum Statistik? 3 Checkpoints 4 Daten 4 Checkpoints 7 Skalen - lebenslang wichtig bei der Datenanalyse
MehrI Einführung 1. 1 Über den Umgang mit Statistik 3
I Einführung 1 1 Über den Umgang mit Statistik 3 1.1 Statistik richtig lehren und lernen 3 1.2 Testergebnisse richtig interpretieren 6 1.3 Einfluss des Zufalls 8 1.4 Die Interpretation von Zusammenhängen
MehrAbhängigkeit zweier Merkmale
Abhängigkeit zweier Merkmale Johannes Hain Lehrstuhl für Mathematik VIII Statistik 1/33 Allgemeine Situation Neben der Untersuchung auf Unterschiede zwischen zwei oder mehreren Untersuchungsgruppen hinsichtlich
MehrInhaltsverzeichnis. Fragestellungen und Methoden 11. Vorwort 15. Kapitel 1 Einführung 17. Kapitel 2 Statistische Grundbegriffe 23
Fragestellungen und Methoden 11 Vorwort 15 Kapitel 1 Einführung 17 1.1 KonzeptiondesBuchs... 18 1.2 AufbaudesBuchs... 19 1.3 Programmversionen von PASW bzw. SPSS..... 20 1.4 WiekanndiesesBuchverwendetwerden?...
Mehra) Zeichnen Sie in das nebenstehende Streudiagramm mit Lineal eine Regressionsgerade ein, die Sie für passend halten.
Statistik für Kommunikationswissenschaftler Wintersemester 2009/200 Vorlesung Prof. Dr. Helmut Küchenhoff Übung Cornelia Oberhauser, Monia Mahling, Juliane Manitz Thema 4 Homepage zur Veranstaltung: http://www.statistik.lmu.de/~helmut/kw09.html
MehrEine zweidimensionale Stichprobe
Eine zweidimensionale Stichprobe liegt vor, wenn zwei qualitative Merkmale gleichzeitig betrachtet werden. Eine Urliste besteht dann aus Wertepaaren (x i, y i ) R 2 und hat die Form (x 1, y 1 ), (x 2,
MehrTeil I: Deskriptive Statistik
Teil I: Deskriptive Statistik 2 Grundbegriffe 2.1 Merkmal und Stichprobe 2.2 Skalenniveau von Merkmalen 2.3 Geordnete Stichproben und Ränge 2.1 Merkmal und Stichprobe An (geeignet ausgewählten) Untersuchungseinheiten
MehrKapitel 1 Beschreibende Statistik
Beispiel 1.25: fiktive Aktienkurse Zeitpunkt i 0 1 2 Aktienkurs x i 100 160 100 Frage: Wie hoch ist die durchschnittliche Wachstumsrate? Dr. Karsten Webel 53 Beispiel 1.25: fiktive Aktienkurse (Fortsetzung)
MehrIBM SPSS Categories 22
IBM SPSS Categories 22 Hinweis Vor Verwendung dieser Informationen und des darin beschriebenen Produkts sollten die Informationen unter Bemerkungen auf Seite 57 gelesen werden. Produktinformation Diese
MehrClustering Seminar für Statistik
Clustering Markus Kalisch 03.12.2014 1 Ziel von Clustering Finde Gruppen, sodas Elemente innerhalb der gleichen Gruppe möglichst ähnlich sind und Elemente von verschiedenen Gruppen möglichst verschieden
MehrWeitere Fragestellungen im Zusammenhang mit einer linearen Einfachregression
Weitere Fragestellungen im Zusammenhang mit einer linearen Einfachregression Speziell im Zusammenhang mit der Ablehnung der Globalhypothese werden bei einer linearen Einfachregression weitere Fragestellungen
MehrMultiple Regression. Ziel: Vorhersage der Werte einer Variable (Kriterium) bei Kenntnis der Werte von zwei oder mehr anderen Variablen (Prädiktoren)
Multiple Regression 1 Was ist multiple lineare Regression? Ziel: Vorhersage der Werte einer Variable (Kriterium) bei Kenntnis der Werte von zwei oder mehr anderen Variablen (Prädiktoren) Annahme: Der Zusammenhang
MehrTeil II: Einführung in die Statistik
Teil II: Einführung in die Statistik (50 Punkte) Bitte beantworten Sie ALLE Fragen. Es handelt sich um multiple choice Fragen. Sie müssen die exakte Antwortmöglichkeit angeben, um die volle Punktzahl zu
MehrProf. Dr. Achim Bühl SPSS 16. Einführung in die moderne Datenanalyse. 7 7., überarbeitete und erweiterte Auflage PEARSON. Studium
Prof. Dr. Achim Bühl SPSS 16 Einführung in die moderne Datenanalyse 7 7., überarbeitete und erweiterte Auflage PEARSON Studium ein Imprint von Pearson Education München Boston San Francisco Harlow, England
MehrFragenkatalog zur Vorlesung "Grundlagen des Data Mining" (WS 2006/07)
Fragenkatalog zur Vorlesung "Grundlagen des Data Mining" (WS 2006/07) 1. Grenzen Sie die Begriffe "Daten" und "Wissen" mit je 3 charakteristischen Eigenschaften gegeander ab. 2. Nennen Sie vier verschiedene
MehrStandardab er des. Testwert = 145.5 95% Konfidenzintervall. T df Sig. (2-seitig) Differenz Untere Obere -2.011 698.045-5.82-11.50 -.14.
Aufgabe : einfacher T-Test Statistik bei einer Stichprobe Standardfehl Standardab er des Mittelwert weichung Mittelwertes 699 39.68 76.59 2.894 Test bei einer Sichprobe Testwert = 45.5 95% Konfidenzintervall
MehrRegression ein kleiner Rückblick. Methodenseminar Dozent: Uwe Altmann Alexandra Kuhn, Melanie Spate
Regression ein kleiner Rückblick Methodenseminar Dozent: Uwe Altmann Alexandra Kuhn, Melanie Spate 05.11.2009 Gliederung 1. Stochastische Abhängigkeit 2. Definition Zufallsvariable 3. Kennwerte 3.1 für
MehrAufgaben zu Kapitel 7:
Aufgaben zu Kapitel 7: Aufgabe 1: In einer Klinik sollen zwei verschiedene Therapiemethoden miteinander verglichen werden. Zur Messung des Therapieerfolges werden die vorhandenen Symptome einmal vor Beginn
MehrWebergänzung zu Kapitel 10
Webergänzung zu Kapitel 10 10.1.4 Varianzanalyse (ANOVA: analysis of variance) Im Kapitel 10 haben wir uns hauptsächlich mit Forschungsbeispielen beschäftigt, die nur zwei Ergebnissätze hatten (entweder
MehrDas Dialogfeld für die Regressionsanalyse ("Lineare Regression") findet sich im Statistik- Menu unter "Regression"-"Linear":
Lineare Regression Das Dialogfeld für die Regressionsanalyse ("Lineare Regression") findet sich im Statistik- Menu unter "Regression"-"Linear": Im einfachsten Fall werden mehrere Prädiktoren (oder nur
MehrFaktorenanalyse. Fakultät für Human und Sozialwissenschaften Professur für Forschungsmethodik und Evaluation in der Psychologie
Faktorenanalyse Fakultät für Human und Sozialwissenschaften Professur für Forschungsmethodik und Evaluation in der Psychologie Seminar: Multivariate Analysemethoden Seminarleiter: Dr. Thomas Schäfer Referenten:
Mehr5.2 Optionen Auswahl der Statistiken, die bei der jeweiligen Prozedur zur Verfügung stehen.
5 Statistik mit SPSS Die Durchführung statistischer Auswertungen erfolgt bei SPSS in 2 Schritten, der Auswahl der geeigneten Methode, bestehend aus Prozedur Variable Optionen und der Ausführung. 5.1 Variablen
MehrS^^SS 22. Einführung in die moderne Datenanalyse. Achim Bühl. 14., aktualisierte Auflage
S^^SS 22 Einführung in die moderne Datenanalyse 14., aktualisierte Auflage Achim Bühl INHALT Inhaltsverzeichnis Vorwort zur vierzehnten Auflage 15 1 Installation und Historie von SPSS 17 1.1 Systemvoraussetzungen
Mehr6. Faktorenanalyse (FA) von Tests
6. Faktorenanalyse (FA) von Tests 1 6. Faktorenanalyse (FA) von Tests 1 6.1. Grundzüge der FA nach der Haupkomponentenmethode (PCA) mit anschliessender VARIMAX-Rotation:... 2 6.2. Die Matrizen der FA...
MehrAnalog zu Aufgabe 16.1 werden die Daten durch folgenden Befehl eingelesen: > kredit<-read.table("c:\\compaufg\\kredit.
Lösung 16.3 Analog zu Aufgabe 16.1 werden die Daten durch folgenden Befehl eingelesen: > kredit
MehrModul G.1 WS 07/08: Statistik 17.01.2008 1. Die Korrelation ist ein standardisiertes Maß für den linearen Zusammenhangzwischen zwei Variablen.
Modul G.1 WS 07/08: Statistik 17.01.2008 1 Wiederholung Kovarianz und Korrelation Kovarianz = Maß für den linearen Zusammenhang zwischen zwei Variablen x und y Korrelation Die Korrelation ist ein standardisiertes
MehrStatistik II Übung 2: Multivariate lineare Regression
Statistik II Übung 2: Multivariate lineare Regression Diese Übung beschäftigt sich mit dem Zusammenhang zwischen Flugpreisen und der Flugdistanz, dem Passagieraufkommen und der Marktkonzentration. Verwenden
MehrZusammenhangsanalyse in Kontingenztabellen
Zusammenhangsanalyse in Kontingenztabellen Bisher: Tabellarische / graphische Präsentation Jetzt: Maßzahlen für Stärke des Zusammenhangs zwischen X und Y. Chancen und relative Chancen Zunächst 2 2 - Kontingenztafel
MehrGrundlagen Statistik Angewandte Statistik 3. Semester
Angewandte Statistik 3. Semester Zur Person Constantin von Craushaar Consultant / Partner Innstat e.u. (www.innstat.com) info@innstat.com Grundlagen der Statistik Übersicht Semester 1 Einführung ins SPSS
Mehrfh management, communication & it Constantin von Craushaar FH-management, communication & it Statistik Angewandte Statistik
fh management, communication & it Folie 1 Angewandte Statistik Übersicht Semester 1 Einführung ins SPSS Auswertung im SPSS anhand eines einfachen Beispieles Häufigkeitsauswertungen Grafiken Datenmanipulationen
MehrStandardisierte Vorgehensweisen und Regeln zur Gewährleistung von: Eindeutigkeit Schlussfolgerungen aus empirischen Befunden sind nur dann zwingend
Standardisierte Vorgehensweisen und Regeln zur Gewährleistung von: Eindeutigkeit Schlussfolgerungen aus empirischen Befunden sind nur dann zwingend oder eindeutig, wenn keine alternativen Interpretationsmöglichkeiten
MehrChristian FG Schendera. Regressionsanalyse. mit SPSS. 2. korrigierte und aktualisierte Auflage DE GRUYTER OLDENBOURG
Christian FG Schendera Regressionsanalyse mit SPSS 2. korrigierte und aktualisierte Auflage DE GRUYTER OLDENBOURG Inhalt Vorworte V 1 Korrelation 1 1.1 Einführung 1 1.2 Erste Voraussetzung: Das Skalenniveau
Mehr1 Installieren von SPSS 1 1.1 Anforderungen an die Hard- und Software 1 1.2 Die Installation durchfuhren 1 1.3 Weitere Hinweise 3
1 Installieren von SPSS 1 1.1 Anforderungen an die Hard- und Software 1 1.2 Die Installation durchfuhren 1 1.3 Weitere Hinweise 3 2 Einführende Übungen mit SPSS 5 2.1 Die Oberfläche von SPSS für Windows
MehrKapitel 4: Merkmalszusammenhänge
Kapitel 4: Merkmalszusammenhänge Streudiagramme 1 Korrelationen 3 Lineare Regression 6 Zusammenhang zwischen Korrelation, Regression und t-test 8 Streudiagramme SPSS bietet die Möglichkeit, verschiedene
MehrClusteranalyse. Clusteranalyse. Fragestellung und Aufgaben. Abgrenzung Clusteranalyse - Diskriminanzanalyse. Rohdatenmatrix und Distanzmatrix
TECHNISCHE UNIVERSITÄT MÜNCHEN-WEIHENSTEPHAN MATHEMATIK UND STATISTIK INFORMATIONS- UND DOKUMENTATIONSZENTRUM R. Biometrische und Ökonometrische Methoden II SS 00 Fragestellung und Aufgaben Abgrenzung
MehrSTATISTIK II. Hans-Otfried Müller Institut für Mathematische Stochastik.
STATISTIK II Hans-Otfried Müller Institut für Mathematische Stochastik http://www.math.tu-dresden.de/sto/mueller 1 Ausgewählte Verfahren der multivariaten Datenanalyse und Statistik Werden bei einer Analyse
MehrNichtparametrische statistische Verfahren
Nichtparametrische statistische Verfahren (im Wesentlichen Analyse von Abhängigkeiten) Kategorien von nichtparametrischen Methoden Beispiel für Rangsummentests: Wilcoxon-Test / U-Test Varianzanalysen 1-faktorielle
MehrHypothesentests mit SPSS. Beispiel für einen t-test
Beispiel für einen t-test Daten: museum-f-v04.sav Hypothese: Als Gründe, in ein Museum zu gehen, geben mehr Frauen als Männer die Erweiterung der Bildung für Kinder an. Dies hängt mit der Geschlechtsrolle
MehrSignifikanztests zur Prüfung von Unterschieden in der zentralen Tendenz -Teil 1-
SPSSinteraktiv Signifikanztests (Teil ) - - Signifikanztests zur Prüfung von Unterschieden in der zentralen Tendenz -Teil - t-test bei einer Stichprobe - SPSS-Output Der t-test bei einer Stichprobe wird
MehrAchim Bühl, Peter Zöfel SPSS 12. Einführung in die moderne Datenanalyse unter Windows. 9., überarbeitete und erweiterte Auflage
Achim Bühl, Peter Zöfel SPSS 12 Einführung in die moderne Datenanalyse unter Windows 9., überarbeitete und erweiterte Auflage ein Imprint der Pearson Education Deutschland GmbH SPSS Version 12 - PDF Inhaltsverzeichnis
MehrKapitel 6. Zusammenfassung der wichtigsten Ergebnisse dieser Arbeit
Kapitel 6 Zusammenfassung der wichtigsten Ergebnisse dieser Arbeit 159 160 Kapitel 6. Zusammenfassung der Ergebnisse Im Fokus der vorliegenden Arbeit steht die Frage nach der Eignung verschiedener Matchingverfahren
MehrKapitel 4: Merkmalszusammenhänge
Kapitel 4: Merkmalszusammenhänge Streudiagramme SPSS bietet die Möglichkeit, verschiedene Arten von Streudiagrammen zu zeichnen. Gehen Sie auf Grafiken Streu-/Punkt-Diagramm und wählen Sie die Option Einfaches
MehrAnalyse bivariater Kontingenztafeln
Analyse bivariater Kontingenztafeln Werden zwei kategoriale Merkmale mit nicht zu vielen möglichen Ausprägungen gemeinsam analysiert, so kommen zur Beschreibung der gemeinsamen Verteilung im allgemeinen
Mehrfh management, communication & it Constantin von Craushaar fh-management, communication & it Statistik Angewandte Statistik
fh management, communication & it Folie 1 Angewandte Statistik Übersicht Semester 1 Einführung ins SPSS Auswertung im SPSS anhand eines einfachen Beispieles Häufigkeitsauswertungen Grafiken Datenmanipulationen
MehrBivariate Zusammenhänge
Bivariate Zusammenhänge Tabellenanalyse: Kreuztabellierung und Kontingenzanalyse Philosophische Fakultät Institut für Soziologie Berufsverläufe und Berufserfolg von Hochschulabsolventen Dozent: Mike Kühne
MehrKai Schaal. Universität zu Köln
Deskriptive Statistik und Wirtschaftsstatistik Tutorium zur Anwendung von Statistik 1 in Excel Kai Schaal Universität zu Köln Organisatorisches und Einleitung (1) Was, wann, wo? Anwendung von Statistik
MehrVS PLUS
VS PLUS Zusatzinformationen zu Medien des VS Verlags Statistik II Inferenzstatistik 2010 Übungsaufgaben und Lösungen Inferenzstatistik 2 [Übungsaufgaben und Lösungenn - Inferenzstatistik 2] ÜBUNGSAUFGABEN
MehrÜberblick über die Verfahren für Ordinaldaten
Verfahren zur Analyse ordinalskalierten Daten 1 Überblick über die Verfahren für Ordinaldaten Unterschiede bei unabhängigen Stichproben Test U Test nach Mann & Whitney H Test nach Kruskal & Wallis parametrische
MehrQuantitative Methoden der Bildungsforschung
Glieung Wieholung Korrelationen Grundlagen lineare Regression Lineare Regression in SPSS Übung Wieholung Korrelationen Standardisiertes Zusammenhangsmaß (unstandardisiert: Kovarianz) linearer Zusammenhang
MehrKommentierter SPSS-Ausdruck zur logistischen Regression
Daten: POK V AG 3 (POKV_AG3_V07.SAV) Kommentierter SPSS-Ausdruck zur logistischen Regression Fragestellung: Welchen Einfluss hat die Fachnähe und das Geschlecht auf die interpersonale Attraktion einer
MehrWillkommen zur Vorlesung Statistik
Willkommen zur Vorlesung Statistik Thema dieser Vorlesung: Varianzanalyse Prof. Dr. Wolfgang Ludwig-Mayerhofer Universität Siegen Philosophische Fakultät, Seminar für Sozialwissenschaften Prof. Dr. Wolfgang
MehrKapitel 5: Einfaktorielle Varianzanalyse
Kapitel 5: Einfaktorielle Varianzanalyse Durchführung einer einfaktoriellen Varianzanalyse ohne Messwiederholung Dieser Abschnitt zeigt die Durchführung der in Kapitel 5 vorgestellten einfaktoriellen Varianzanalyse
MehrKapitel 27 Distanz- und Ähnlichkeitsmaße
Kapitel 7 Distanz- und Ähnlichkeitsmaße 7.1 Einführung Sowohl Distanz- als auch Ähnlichkeitsmaße dienen dazu, die Ähnlichkeit verschiedener Fälle oder Variablen zu quantifizieren. Beide Maße untersuchen,
MehrWas ist eine Clusteranalyse, wann und wie wird sie angewendet?
Autor: Dr. Ralf Gutfleisch, Stadt Frankfurt a. M., Bürgeramt, Statistik und Wahlen Was ist eine Clusteranalyse, wann und wie wird sie angewendet? Fragestellung Drei Fragen stehen im Vordergrund dieser
MehrBeispiel für Anwendung: z-tabelle kann genutzt werden, um z.b. Poissonverteilung näherungsweise zu integrieren. Beispiel: wie wahrscheinlich ist es
Beispiel für Anwendung: z-tabelle kann genutzt werden, um z.b. Poissonverteilung näherungsweise zu integrieren. Beispiel: wie wahrscheinlich ist es beim radioaktiven Zerfall, zwischen 100 und 110 Zerfälle
MehrSPSS V Gruppenvergleiche ( 2 Gruppen) abhängige (verbundene) Stichproben
SPSS V Gruppenvergleiche ( 2 Gruppen) abhängige (verbundene) Stichproben ÜBERSICHT: Testverfahren bei abhängigen (verbundenen) Stichproben parametrisch nicht-parametrisch 2 Gruppen t-test bei verbundenen
MehrSkript 7 Kreuztabellen und benutzerdefinierte Tabellen
Skript 7 Kreuztabellen und benutzerdefinierte Tabellen Ziel: Analysieren und verdeutlichen von Zusammenhängen mehrerer Variablen, wie z.b. Anzahlen pro Kategorien; Mittelwert und Standardabweichung pro
MehrSTATISTISCHE MUSTERANALYSE - DARSTELLUNGSVORSCHLAG
STATISTISCHE MUSTERANALYSE - DARSTELLUNGSVORSCHLAG Statistische Methoden In der vorliegenden fiktiven Musterstudie wurden X Patienten mit XY Syndrom (im folgenden: Gruppe XY) mit Y Patienten eines unauffälligem
MehrTutorial: Regression Output von R
Tutorial: Regression Output von R Eine Firma erzeugt Autositze. Ihr Chef ist besorgt über die Anzahl und die Kosten von Maschinenausfällen. Das Problem ist, dass die Maschinen schon alt sind und deswegen
MehrDeskriptive Statistik
Deskriptive Statistik [descriptive statistics] Ziel der deskriptiven (beschreibenden) Statistik einschließlich der explorativen Datenanalyse [exploratory data analysis] ist zunächst die übersichtliche
MehrLage- und Streuungsparameter
Lage- und Streuungsparameter Beziehen sich auf die Verteilung der Ausprägungen von intervall- und ratio-skalierten Variablen Versuchen, diese Verteilung durch Zahlen zu beschreiben, statt sie graphisch
Mehr3.2 Streuungsmaße. 3 Lage- und Streuungsmaße 133. mittlere Variabilität. geringe Variabilität. große Variabilität 0.0 0.1 0.2 0.3 0.4 0.
Eine Verteilung ist durch die Angabe von einem oder mehreren Mittelwerten nur unzureichend beschrieben. Beispiel: Häufigkeitsverteilungen mit gleicher zentraler Tendenz: geringe Variabilität mittlere Variabilität
MehrInhaltsverzeichnis. I Einführung in STATISTICA 1. 1 Erste Schritte in STATISTICA 3
I Einführung in STATISTICA 1 1 Erste Schritte in STATISTICA 3 2 Datenhaltung in STATISTICA 11 2.1 Die unterschiedlichen Dateitypen in STATISTICA....... 11 2.2 Import von Daten......... 12 2.3 Export von
MehrKlausur Statistik I. Dr. Andreas Voß Wintersemester 2005/06
Klausur Statistik I Dr. Andreas Voß Wintersemester 2005/06 Hiermit versichere ich, dass ich an der Universität Freiburg mit dem Hauptfach Psychologie eingeschrieben bin. Name: Mat.Nr.: Unterschrift: Bearbeitungshinweise:
Mehr2. Korrelation, lineare Regression und multiple Regression
multiple 2.2 Lineare 2.2 Lineare 1 / 130 2.2 Lineare 2 / 130 2.1 Beispiel: Arbeitsmotivation Untersuchung zur Motivation am Arbeitsplatz in einem Chemie-Konzern 25 Personen werden durch Arbeitsplatz zufällig
MehrANalysis Of VAriance (ANOVA) 1/2
ANalysis Of VAriance (ANOVA) 1/2 Markus Kalisch 16.10.2014 1 ANOVA - Idee ANOVA 1: Zwei Medikamente zur Blutdrucksenkung und Placebo (Faktor). Gibt es einen sign. Unterschied in der Wirkung (kontinuierlich)?
Mehr