Prof. Dr. G. Meinhardt 6. Stock, Wallstr. 3 Forschungsstatistik I R. 06-206 (Persike) R. 06-321 (Meinhardt) Sprechstunde jederzeit nach Vereinbarung und nach der Vorlesung Dr. Malte Persike persike@uni-mainz.de http://psymet03.sowi.uni-mainz.de/ WS 2009/2010 Fachbereich Sozialwissenschaften Psychologisches Institut Johannes Gutenberg Universität Mainz
Vorlesung Tutorien Literatur Organisatorische Hinweise I. Gliederung Vorlesung & Übung zur Vorlesung wöchentliche Hausaufgaben Tutorien (Übungen & Besprechung der HA) Zwischenklausur (?) Abschlussklausur Software II. Ihr Leistungskriterium Bestehen der Klausur III. Unser Qualitätsversprechen Emails werden im Semester innerhalb von 24h beantwortet (an Werktagen) Folien und Aufgabenzettel sind ab 20:00 Uhr des Tages vor der Veranstaltung herunterladbar Klausuren werden innerhalb von 3 Wochen nachgesehen
Vorlesung Tutorien Literatur Software Tutorien Termine Josephine Clausen Di 10-12 Uhr (Raum CIP Pool) Josephine Clausen Fr 12-14 Uhr (Raum CIP Pool) Bernhard Both Mo 16-18 Uhr (Raum CIP Pool) Bernhard Both Do 14-16 Uhr (Raum CIP Pool) Bitte um: Gleichmäßige Verteilung auf die 4 Tutorien
Vorlesung Inhalte der Vorlesung im WS Tutorien Deskriptive Literatur Software Tabellarische und grafische Möglichkeiten der Ergebnisdarstellung Kennwerte Explorative Datenanalysetechniken (Regression) Univariate und multivariate deskriptive Methoden Varianzanalyse (ANOVA) in zentrale Konzepte und Modelle Einfaktorielle und mehrfaktorielle ANOVA Messwiederholungsdesigns
Vorlesung Tutorien Weitere Informationen und Kummerkasten http://psymet03.sowi.uni-mainz.de Literatur Software
Vorlesung Literatur Arbeitsbücher Tutorien Literatur Spiegel, M. R. (2008). Statistics. Hamburg: Schaum s Outlines (evtl. noch in Deutsch erhältlich, 1990) Software Bernstein, S. & Bernstein, R. (1999). Elements of Statistics I & II Hamburg: Schaum s Outlines
Vorlesung Literatur Grundlagen Tutorien Literatur Steland, A. (2004). Mathematische Grundlagen der empirischen Forschung. Heidelberg: Springer Software Huber, O. (2005). Das psychologische Experiment: Eine. Bern: Huber
Vorlesung Literatur Basiswerke Tutorien Literatur Bortz, J. (2004). für Sozialwissenschaftler (6. Aufl.). Berlin: Springer-Verlag Software Fahrmeir, L., Künstler, R., Pigeot, I. & Tutz, G. (2007). - Der Weg zur Datenanalyse (6. Aufl.). Berlin: Springer.
Vorlesung Software Tutorien Literatur Software Einfache und komplexe statistische Verfahren Nicht erforderlich für diese Veranstaltung im Sommersemester
Vorlesung Tutorien Literatur Software Software Datenerfassung Datentransformation Deskriptive Auswertung Darstellung & Visualisierung Kennwertberechnung Einfache statistische Analysen Einarbeitung und Mitarbeit erforderlich! verstehen durch Arbeit an Daten! Excel-basierte Klausuren
Vorlesung Exceleinführung Tutorien Literatur Termin 1 und Grundlagen Donnerstag, 29.10.2009, 14 16 Uhr Freitag, 30.10.2009, 12 14 Uhr Software Termin 2 Vertiefung Donnerstag, 05.11.2009, 14 16 Uhr Freitag, 06.11.2009, 12 14 Uhr
als Wissenschaft Wozu brauchen wir das? Gegenstand Die ist eine empirische Wissenschaft menschlichen Verhaltens und Erlebens. Empirische Wissenschaft Auf Erfahrung beruhend, erfahrungswissenschaftlich Prüfung von Hypothesen über Tatsachenbeobachtungen Empirische Methoden: a) Prinzip der systematischen Manipulation und Beobachtung; b) werden über die Regeln des logischen Schliessens verküpft Verallgemeinerung durch statistischen Induktionsschluss
als Wissenschaft Grundbegriffe wissenschaftlicher Datensammlung Statistische Einheiten (auch: Merkmalsträger, Beobachtungseinheiten) Objekte von denen man Informationen erheben kann In der zumeist Menschen, aber auch Tiere oder Aggregate wie z.b. Abteilungen in Firmen Beobachtungen: Informationen über statistische Einheiten Beobachtungen im engeren Sinn (z.b. Verhaltensbeoabachtung, Bildgebende Verfahren) Ergebnisse in einem Leistungstest, Selbstauskunft Daten: Sämtliche Beobachtungen bei der Informationssammlung (im weiteren Sinn): Methoden zur Sammlung und Analyse von Daten
Theorien/ Fragestellung/Problem Vermutung über Zusammenhang von Größen Forschungsprozeß Operationalisierung der AV und UV: Festlegen von Gößen auf die Art, in der sie gemessen werden können & des Messinstrumentes Datenauswertung: 1. Festellung der Ausprägung der AV und UV 2. Statistischer Schluss von der Stichprobe auf die Population Formulierung inhaltlicher Hypothesen Formulierung der statistischen Hypothesen Rückschluss auf die zu erfassenden Konstrukte Identifikation der AV und UV Wahl der Stichprobe (Ort, Zeit, Umfang etc.) Konfrontation der Ergebnisse mit den inhaltlichen Hypothesen Messung Beantwortung der Fragestellung
Wissenschaftliche Anforderungen Einfachheit Eindeutigkeit Logische Konsistenz (innere und äußere) Falsifizierbarkeit, Prüfbarkeit durch Tatsachenbezug
Wissenschaftliche Interindividuelles Assessment kognitiver Performanz wird durch genderdependente Biasgrößen moduliert. Einfachheit Eindeutigkeit Logische Konsistenz (innere und äußere) Falsifizierbarkeit, Prüfbarkeit durch Tatsachenbezug
Wissenschaftliche Bei der Einschätzung des IQ von Personen des anderen Geschlechts gibt es geschlechterspezifische Unterschiede. Einfachheit Eindeutigkeit Logische Konsistenz (innere und äußere) Falsifizierbarkeit, Prüfbarkeit durch Tatsachenbezug
Wissenschaftliche Bei der Einschätzung des IQ von Personen des anderen Geschlechts gibt es geschlechterspezifische Unterschiede in der Höhe der Schätzung. Einfachheit Eindeutigkeit Logische Konsistenz (innere und äußere) Falsifizierbarkeit, Prüfbarkeit durch Tatsachenbezug
Wissenschaftliche Bei der Einschätzung des IQ von Personen des anderen Geschlechts gibt es geschlechterspezifische Unterschiede in der Höhe der Schätzung und gibt es solche nicht. Einfachheit Eindeutigkeit Logische Konsistenz (innere und äußere) Falsifizierbarkeit, Prüfbarkeit durch Tatsachenbezug
Wissenschaftliche Bei der Einschätzung des IQ von Personen des anderen Geschlechts gibt es geschlechterspezifische Unterschiede in der Höhe der Schätzung oder auch nicht. Einfachheit Eindeutigkeit Logische Konsistenz (innere und äußere) Falsifizierbarkeit, Prüfbarkeit durch Tatsachenbezug
Psychologische Psychologische orientieren sich an den 4 Anforderungen für wissenschaftliche. Hypothesen in der sind üblicherweise über Gesetzmäßigkeiten, die als Wenn- Dann - formuliert sind Wenn Menschen den IQ von Personen des anderen Geschlechts schätzen sollen, dann gibt es geschlechterspezifische Unterschiede in der Höhe der Schätzung.
Psychologische Psychologische orientieren sich an den 4 Anforderungen für wissenschaftliche. Hypothesen in der sind üblicherweise über Gesetzmäßigkeiten, die als Wenn- Dann - formuliert sind Diese Kovariation zwischen Begriffen kann empirisch über Beobachtung und Messung geprüft werden
Theorien/ Fragestellung/Problem Vermutung über Zusammenhang von Größen Forschungsprozeß Operationalisierung der AV und UV: Festlegen von Gößen auf die Art, in der sie gemessen werden können & des Messinstrumentes Datenauswertung: 1. Festellung der Ausprägung der AV und UV 2. Statistischer Schluss von der Stichprobe auf die Population Formulierung inhaltlicher Hypothesen Formulierung der statistischen Hypothesen Rückschluss auf die zu erfassenden Konstrukte Identifikation der AV und UV Wahl der Stichprobe (Ort, Zeit, Umfang etc.) Konfrontation der Ergebnisse mit den inhaltlichen Hypothesen Messung Beantwortung der Fragestellung
Merkmale, deren Werte bei den statistischen Einheiten beobachtet werden, heißen Die Werte, die eine Variable annehmen kann, heißen Ausprägungen Es gibt verschiedene Klassifikationssysteme, um Typen von zu unterscheiden (a) der Art der Daten, die sie beschreiben (b) der Quelle der Manipulation ihrer Werte
Klassifikation nach der Art der Daten I Eine diskrete Variable besitzt zumeist endlich viele und feste Werte, die man über Ganzzahlen beschreiben kann (z.b. Geschlecht, Zugehörigkeit zu einer Partei, Augenzahl beim Würfelspiel) Eine kontinuierliche (stetige) Variable kann unendlich viele beliebige Werte annehmen, die man über reelle Zahlen beschreibt (z.b. Alter, Reaktionszeit, Erregungsniveau)
Klassifikation nach der Art der Daten II Unterscheidung danach, ob ihre Ausprägungen eine Intensität bzw. eine Ordnung beschreiben Eine qualitative Variable unterscheidet zwischen zumeist endlich vielen verschiedenen Ausprägungen (häufig 2), impliziert aber keine wertmäßige Ordnung. Eine quantitative Variable unterscheidet zwischen zumeist unendlich vielen verschiedenen Ausprägungen mit einer wertmäßigen Ordnung Eine feinere Auflösung dieser Dichotomie wird mit der Kategorisierung in Skalenniveaus geleistet.
Klassifikation nach der Art der Manipulation ihrer Werte Eine unabhängige Variable (UV, IV) besitzt Werte, die ein Versuchsleiter willkürlich hergestellt hat (z.b. Dosis eines verabreichten Medikamentes, Einteilung in Gruppen, die bestimmte Treatments bekommen) Eine abhängige Variable (AV, DV) besitzt Werte, die man über Beabachtung an den Merkmalsträgern gewinnt (z.b. Reaktionszeit, Fehlerquote, Erregungsniveau, etc.) Schema: Unabhängige Variable UV Abhängige Variable AV
In der Praxis Beispiel für psychologische Forschung Beobachtung Ich laufe schneller, wenn ich mich vorher geärgert habe. Vermutung Stark aversive Gefühlszustände erhöhen die sportliche Leistungsfähigkeit. Hypothese Wenn Menschen Stimuli mit hohem negativen Anregungsgehalt dargeboten bekommen, dann erhöht sich ihre physiologische Aktivierung bei sportlichen Tätigkeiten.
Theorien/ Fragestellung/Problem Vermutung über Zusammenhang von Größen Forschungsprozeß Operationalisierung der AV und UV: Festlegen von Gößen auf die Art, in der sie gemessen werden können & des Messinstrumentes Datenauswertung: 1. Festellung der Ausprägung der AV und UV 2. Statistischer Schluss von der Stichprobe auf die Population Formulierung inhaltlicher Hypothesen Formulierung der statistischen Hypothesen Rückschluss auf die zu erfassenden Konstrukte Identifikation der AV und UV Wahl der Stichprobe (Ort, Zeit, Umfang etc.) Konfrontation der Ergebnisse mit den inhaltlichen Hypothesen Messung Beantwortung der Fragestellung
Operationalisierung In Hypothesen kommen theoretische Begriffe, sog. Konstrukte vor, die nicht direkt beobachtbar sind (z.b. Intelligenz, Angst, Kreativität) Einer Hypothese müssen also beobachtbare Phänomene zugeordnet werden. Die Vorschrift, wie ein Begriff durch Beobachtung und Messung festgestellt werden kann, nennt man Operationalisierung. Das beobachtbaren Phänomen wird häufig auch als Indikator bezeichnet. Daten im Forschungsprozess sind also Informationen, die mithilfe einer Operationalisierung gewonnen wurden
Theorien/ Fragestellung/Problem Vermutung über Zusammenhang von Größen Forschungsprozeß Operationalisierung der AV und UV: Festlegen von Gößen auf die Art, in der sie gemessen werden können & des Messinstrumentes Datenauswertung: 1. Festellung der Ausprägung der AV und UV 2. Statistischer Schluss von der Stichprobe auf die Population Formulierung inhaltlicher Hypothesen Formulierung der statistischen Hypothesen Rückschluss auf die zu erfassenden Konstrukte Identifikation der AV und UV Wahl der Stichprobe (Ort, Zeit, Umfang etc.) Konfrontation der Ergebnisse mit den inhaltlichen Hypothesen Messung Beantwortung der Fragestellung
Ziele der Anwendung statistischer Methoden Design: Planung und Ausführung von Untersuchungen (Art der Stichprobe, Wahl des Messinstrumentes, Kontrolle der Messung etc.) Deskription (Beschreibung) und Exploration (Entdecken): Zusammenfassung, Darstellung und das Auffinden von systematischen Strukturen in Daten der untersuchten Stichprobe Inferenz (schließende, induktive ): Generalisierung und Vorhersagen über gemachte Beobachtungen von der untersuchten Stichprobe auf die Grundgesamtheit (Population)
Daten und ihre Analyse Daten werden in Matrizen Festgehalten (Datenmatrix) Für jeden Merkmalsträger wird in einer Zeile die Ausprägung der UV und der AV codiert Die Kodierung ist häufig nicht-numerisch. Zahlen haben vielfach unterschiedliche Bedeutungen. Matrixorganisation: Personen x Merkmale (Zeile) (Spalten)
Deskriptive statistische Methoden Kennwerte Kennwerte fassen die Eigenschaften der Verteilung der gemessenen (Zufalls-)variablen zusammen Vergleiche von Kennwerten sind für statistische Entscheidungen wichtig Verteilungen von Kennwerten sind die Grundlage der schließenden (Schätzung und Testung) Mittelwert Median Standardab weichung Standardfehler des Mittelwerts Minimum Maximum Anregung Hoch Maximalpuls 181.58 181.92 12.01 3.80 159.84 201.81 Adrenalin 44 44 3 1 41 51 Niedrig Maximalpuls 165.79 164.01 8.83 2.79 152.41 179.21 Adrenalin 38 37 2 1 35 43
Deskriptive statistische Methoden Diagramme
Adrenalin Methoden der Korrelation & Regression Zusammenhang zwischen zwei (bivariate ) 48 46 44 42 40 38 36 34 32 30 Anregung hoch Anregung niedrig Linear (Anregung hoch) Linear (Anregung niedrig) y = 0.1837x + 10.224 R 2 = 0.5747 y = 0.2451x - 2.7681 R 2 = 0.8532 120 140 160 180 200 Maximalpuls
Inferenzstatistische Methoden Zusammenhänge von Stichprobe und Grundgesamtheit Was kann man mit Kennwerten, gewonnen aus Stichproben, über die Kennwerte der Population aussagen? Schätzen Wie und wie genau kann man Kennwerte der Population aus Stichproben schätzen? Testen Kann man etwas über die Gleichheit oder Ungleichheit von aus Stichproben geschätzen Kennwerten mit einer bestimmten statistischen Verlässlichkeit sagen?
Theorien/ Fragestellung/Problem Vermutung über Zusammenhang von Größen Forschungsprozeß Operationalisierung der AV und UV: Festlegen von Gößen auf die Art, in der sie gemessen werden können & des Messinstrumentes Datenauswertung: 1. Festellung der Ausprägung der AV und UV 2. Statistischer Schluss von der Stichprobe auf die Population Formulierung inhaltlicher Hypothesen Formulierung der statistischen Hypothesen Rückschluss auf die zu erfassenden Konstrukte Identifikation der AV und UV Wahl der Stichprobe (Ort, Zeit, Umfang etc.) Konfrontation der Ergebnisse mit den inhaltlichen Hypothesen Messung Beantwortung der Fragestellung
Der Modus Ponens Das Verfahren der Implikation Beispiele: Wenn A, dann B : A B Wenn es regnet, ist die Strasse nass Pech im Spiel, Glück in der Liebe Schema: Antecedenz A Konsequenz B
Der Modus Ponens In Mengendarstellung Wenn A, dann B : A B A A B B Wenn es regnet (A), ist die Strasse nass (B) Wenn man Pech im Spiel hat (A), hat man Glück in der Liebe (B)
Der Modus Ponens Umkehrung? Wenn A, dann B : A B Gilt dann auch: Wenn B, dann A : B A? B A Die Umkehrung gilt nicht: A B B A
Der Modus Tollens Das Verfahren der Implikation B A B A B B A Wenn die Strasse nicht nass ist, hat es nicht geregnet Wenn man kein Glück in der Liebe hatte, hatte man kein Pech im Spiel
Determinismus vs. Probabilismus Deterministisch Wenn A, dann B ( Wenn A, dann immer B ) Probabilistisch Wenn A, dann besteht eine Wahrscheinlichkeit P(B) alternativ: Es besteht eine Wahrscheinlichkeit P(B A) (Lies: B unter Bedingung A )
Probabilistische Zusammenhänge A B gilt nicht für alle a A, b B Wirkung von Störvariablen Nichtberücksichtigung komplexer Interaktionen Unbestimmtheit von Anfangsbedingungen in komplexen Situationen In der gilt eine Gesetzmäßigkeit als belegt, wenn die statistische Bedeutsamkeit des Zusammenhanges von aufgezeigt wird Sie gilt als bestätigt, wenn die statistische Bedeutsamkeit mehrfach aufgewiesen werden konnte.
Ende. persike@uni-mainz.de