Das Kausalitätsproblem. Grundlagen des sozialwissenschaftlichen Experiments. Zusammenhänge allgemein. Beispiel Adipositas

Ähnliche Dokumente
Glossar. Cause of Effects Behandelt die Ursache von Auswirkungen. Debriefing Vorgang der Nachbesprechung der experimentellen Untersuchung.

Empirische Forschung. Übung zur Vorlesung Kognitive Modellierung. Kognitive Modellierung Dorothea Knopp Angewandte Informatik/ Kognitve Systeme

Forschungsmethoden: Definition

TEIL 4: FORSCHUNGSDESIGNS UND UNTERSUCHUNGSFORMEN

Forschungsdesigns und Untersuchungsformen

III. Methoden der empirischen Kommunikations forschung. Hans-Bernd Brosius Friederike Koschel. Eine Einführung. 3. Auflage - CKIZ

Methodenlehre. Vorlesung 5. Prof. Dr. Björn Rasch, Cognitive Biopsychology and Methods University of Fribourg

Grundlagen der empirischen Sozialforschung

Forschungsmethoden VORLESUNG SS 2017

Standardisierte Vorgehensweisen und Regeln zur Gewährleistung von: Eindeutigkeit Schlussfolgerungen aus empirischen Befunden sind nur dann zwingend

Einführung in Techniken wissenschaftlichen Arbeitens

Grundlagen sportwissenschaftlicher Forschung Untersuchungsplanung 2 und Grundlagen des Messens

Inhalt. 1. Kapitel: Was sind Methoden, was ist Empirie? 17

Kurzzusammenfassung der Einführungsvorlesung zum emp. Praktikum

Einführung ins Experimentieren. Methodenpropädeutikum II Allgemeine Psychologie. Hypothesen. Fragestellung. Adrian Schwaninger & Stefan Michel

5. Untersuchungsdesigns

Empirische Forschung. Übung zur Vorlesung Kognitive Modellierung. Kognitive Modellierung Dorothea Knopp Angewandte Informatik/ Kognitve Systeme

»Wirkungsmessung im Kontext von Evaluationen Möglichkeiten und Grenzen in der Praxis«

Untersuchungsarten im quantitativen Paradigma

Forschungsmethoden. Versuchspläne. Florian Kobylka

Beobachtung und Experiment II

Experimentelle und quasiexperimentelle

Messwiederholungen und abhängige Messungen

Methodenlehre. Vorlesung 6. Prof. Dr. Björn Rasch, Cognitive Biopsychology and Methods University of Fribourg

Methoden der Psychologie Dr. Z. Shi Wiss. Arbeiten

Kapitel 3: Empirische Forschung

Methoden der empirischen Kommunikationsforschung

Aufgaben und Ziele der Wissenschaften

Psychologische Methodenlehre Statistik

5. Wie wird im Experiment die interessierende, vom Versuchsleiter gemessene Variable bezeichnet?

Methodik für Linguisten

Sozialwissenschaftliche Methoden und Methodologie. Begriffe, Ziele, Systematisierung, Ablauf. Was ist eine Methode?

Methodenlehre. Vorlesung 4. Prof. Dr. Björn Rasch, Cognitive Biopsychology and Methods University of Fribourg

Methoden der empirischen Kommunikationsforschung

Das Experiment als Teil quantitativer Datenerhebung Eine Einführung in die quantitative Erhebungspraxis

Unsystematische Störvariablen

Methodenlehre. Vorlesung 10. Prof. Dr. Björn Rasch, Cognitive Biopsychology and Methods University of Fribourg

Attribution. Unterschied zwischen Akteur und Beobachter

Institut für Soziologie Benjamin Gedon. Methoden 2. Kausalanalyse

VL Organisationspsychologie

QUANTITATIVE VS QUALITATIVE STUDIEN

Experimentalpsychologisches Praktikum

Empirische Sozialforschung

Psycholinguistik. Definition: Psycholinguistik (synonym: Sprachpsychologie) erforscht das kognitive (mentale) System, das den Sprachgebrauch erlaubt.

Einführung in den Forschungsprozess und die Methoden der empirischen Kommunikations- und Medienforschung

in der Psychologie Experimentelle Hypothesenprüfung und Verlag für Psychologie von

Alltagspsychologie & Wissenschaftliche Psychologie

Umfrage, eine Methode für die Maturaarbeit. GM.my in Zusammenarbeit mit der Kantonsschule Olten

Studie «Screen Effect»

Forschungsmethoden VORLESUNG SS 2017

Einführung in die Kausalanalyse

Aufgaben zu Kapitel 3

Testtheorie und Gütekriterien von Messinstrumenten. Objektivität Reliabilität Validität

Reliabilitäts- und Itemanalyse

Lernziele Experimentelles Praktikum

Methodenlehre. Vorlesung 10. Prof. Dr. Björn Rasch, Cognitive Biopsychology and Methods University of Fribourg

Experimentalpsychologisches Praktikum

Bis heute: Überblick Einheit Literatur lesen. 2. Introspektion. 3. Thema definieren und eingrenzen. Untersuchungsproblem.

Parametrische vs. Non-Parametrische Testverfahren

Operationalisierung (1)

Einführung in den Forschungsprozess und die Methoden der empirischen Kommunikations- und Medienforschung

Eigene MC-Aufgaben Kap. 4 Operationalisierung & Indikatorenauswahl (X aus 5)

JOACHIM BEHNKE / NINA BAUR / NATHALIE BEHNKE. Empirische Methoden der Politikwissenschaft

Begriffe und Methoden (8.5.)

Familiäre Prädiktoren bilingualer Sprachkenntnisse

Aufbau des Experiments Reihung von Versuchsitems und Distraktoren

3.2 Grundlagen der Testtheorie Methoden der Reliabilitätsbestimmung

Einführung in die empirische Sozialforschung BA VM, 45 Minuten, Probeklausur

LV2 Quantitative Methoden

Empirische Sozialforschung

Hypothesen. Ziel: Vorwissen der ForscherInnen in den Griff zu bekommen - Strukturierung des Vorwissens

Evaluation (10.7.) Definition Beschreibungsmerkmale von Evaluation Zu den Hausaufgaben Methodische Aspekte der (summativen) Evaluation

Objektivität und Validität. Testgütekriterien. Objektivität. Validität. Reliabilität. Objektivität

Klausuraufgaben für Probeklausur. 1.Die Zuverlässigkeit von Kodierern in der Inhaltsanalyse kann man berechnen.

Beobachtungsverfahren

VS PLUS

Der χ 2 -Test (Chiquadrat-Test)

Wörterbuch zur Statistik III. Um den Einfluss der Kovariablen bereinigte Mittelwerte Man schaut die Zentroide an und bildet den Mittelwert aller Vpn.

Wissenschaftstheoretische Grundlagen

Empirische Methoden der Politikwissenschaft

Stichwortverzeichnis. Symbole

Experiment Allgemeiner Teil

Grundlagen sportwissenschaftlicher Forschung Deskriptive Statistik 2 Inferenzstatistik 1

Vorschulkinder vor dem Fernseher

Methoden der qualitativen und quantitativen Inhaltsanalyse

ExPra FS Bibliotheksführung University of Zurich. Stefan Michel & Anton Bolfing

Teil: lineare Regression

Studiendesign/ Evaluierungsdesign

Bivariate Analyseverfahren

Stichprobe vs. Vollerhebung

Modulprüfung Methoden der Dienstleistungsforschung

PD Dr. Daniel Effer-Uhe. Psychologie für Juristen

Wie entwickelt sich die Ablehnung gegenüber der Outgroup?

Transkript:

Das Kausalitätsproblem Grundlagen des sozialwissenschaftlichen Experiments In unserer Umwelt gibt es viele korrelative Beziehungen zwischen Variablen. Diese müssen jedoch keineswegs kausal zusammenhängen. Es besteht aber die Neigung, Korrelationen als Kausalitäten wahrzunehmen. klassisches Beispiel: Je höher die Zahl der Störche, die in einem Gebiet nisten, desto höher die Zahl der Geburten (positive Korrelation) Der Storch bringt die Kinder Zu bezweifeln ist aber, ob die Störche tatsächlich als Ursache für den Kindersegen zu sehen sind. Es ist vielmehr zu vermuten, dass andere Faktoren dafür verantwortlich sind. Eine sog. Drittvariable könnte der Urbanisierungsgrad sein: Störche nisten lieber auf Reetdächern als auf Hochhäusern und Kinder werden häufiger auf dem Land großgezogen. Beispiel Adipositas Zusammenhänge allgemein

Was ist ein Experiment? Experimente sind der Königsweg für Kausalanalysen. Korrelationen werden meist als interessante Grundlage für Hypothesen gesehen, die experimentell überprüft werden könnten. (vgl. Parducci & Sarris 1986) Wissenschaftliche Experimente sind Untersuchungsanordnungen, mit denen Kausalzusammenhänge überprüft werden. (Brosius & Koschel 2001: 204) Ein wissenschaftliches Experiment untersucht den Einfluss einer unabhängigen Variablen (Ursache) auf zu messende abhängige Variablen (Wirkungen) (vgl. ebd.: 205) Was ist ein Experiment? Ein Experiment ist der Beweis für eine Hypothese, der zwei Faktoren in einer ursächliche Beziehung zueinander bringen will, indem er sie in unterschiedlichen Situationen untersucht. Diese Situationen werden in Bezug auf alle Faktoren kontrolliert mit Ausnahme des einen, der uns besonders interessiert, da er entweder die hypothetische Ursache oder die hypothetische Wirkung darstellt. (Greenwood 1967: 177) Grundlegende Elemente Kausalhypothese Prüfung einer Reihe von unterschiedlichen Situationen Kontrolle der gegensätzlichen Situationen Forschungsfelder Markt- und Werbepsychologie Gewaltforschung Wirkung von medialen Inhalten generell Persuasionsforschung Gesundheitskommunikation Experimentelle Vorgehensweise Beispiel aus der Forschungspraxis Ein Forscher vermutet, dass ein Zeitungsartikel über Krebskrankheiten das krebsspezifische Wissen der Leser steigert. Wie kann er vorgehen, um dies zu überprüfen?

Experimentelle Vorgehensweise Variante 1: Einmalige Messung Einer Gruppe von Personen wird ein Zeitungsartikel mit entsprechenden Informationen (UV) vorgelegt (Treatment) und danach das Wissen (AV) gemessen. Zeitpunkt Treatment t1 Messung t2 Experimentelle Vorgehensweise Variante 2: Vorher-Nachher-Messung Es wird bei einer Gruppe von Versuchspersonen (Vpn) zunächst der Wissensstand (AV) gemessen (Pretest). Danach wird dieser Gruppe der Zeitungsartikel (UV) vorgelegt (Treatment) und hierauf das Wissen erneut (AV) gemessen (Posttest). Zeitpunkt Messung 1 (Pretest) t1 x (Treatment) t2 (Posttest) t3? Wie hoch war der Wissensstand vorher?? Können Veränderungen im Wissensstand tatsächlich auf den Artikel zurückgeführt werden oder waren andere Faktoren ausschlaggebend? Experimentelle Vorgehensweise Variante 3: Vorher-Nachher-Messung mit Kontrollgruppe Es werden Versuchspersonen nach dem Zufallsprinzip einer Experimentalgruppe und einer Kontrollgruppe zugeordnet (Randomisierung). In beiden Gruppen wird dann zunächst das Wissen über Krebskrankheiten (AV) gemessen. Danach wird der Experimentalgruppe ein Zeitungsartikel mit Informationen über Krebs vorgeführt, der Kontrollgruppe Artikel ohne die entsprechenden Inhalte (= Manipulation der UV). Darauf erfolgt dann die erneute zweite Messung der abhängigen Variable. Experimentelle Vorgehensweise Variante 3: Vorher-Nachher-Messung mit Kontrollgruppe Experimentalgruppe Kontrollgruppe Messung 1 (Pretest) Messung 1 (Pretest) x (Treatment) Wenn in der Experimentalgruppe eine deutliche Messwerterhöhung vorliegt, kann mit großer Sicherheit auf eine Wirkung des Stimulus (der UV) geschlossen werden.? Verändert die Vorher-Messung den Einfluss des Treatments? (Posttest) (Posttest) Zeitpunkt t1 t2 t3

Experimentelle Vorgehensweise Variante 4: Nachher-Messung mit Kontrollgruppe Experimentalgruppe Kontrollgruppe Zeitpunkt x (Treatment) Messung (Posttest) Messung (Posttest) Vergleich der beiden Gruppen ermöglicht Rückschluss auf den Einfluss des Treatments? War der Wissensstand vor dem Treatment bei beiden Gruppen gleich oder schon vorher unterschiedlich? t1 t2 - theoretisch ist Variante 3 am besten geeignet - Einfluss der Messwiederholung --> daher wird häufig Variante 4 praktiziert - sauberste Lösung Kombination aus Variante 3 und 4 = Solomondesign EG1 KG1 EG2 KG2 Experimentelle Vorgehensweise Messung 1 Messung 1 Treatment Treatment Zeitpunkt t1 t2 t3 Manipulation und Kontrolle Es wird systematisch mindestens eine unabhängige Variable (Zeitungsartikel mit Informationen über Krebs) variiert und dann gemessen, welchen Effekt diese Veränderung auf die abhängige Variable (Wissen über Krebs) hat. Gleichzeitig werden mögliche Wirkungen von anderen Variablen (Störvariablen) ausgeschaltet (Brosius & Koschel 2001: 208): Wir manipulieren die natürlichen Bedingungen so weit, dass nur noch eine einzige Ursache übrig bleibt, um die vermutete Wirkung herauszufinden. Wir kontrollieren alle anderen Bedingungen derart, dass sich die beiden Untersuchungsgruppen ansonsten nicht unterscheiden. Dabei nennt man... die Gruppe, die einen Stimulus (eine Ausprägung der unabhängigen Variablen) bekommt, Experimentalgruppe, diejenige, die den Stimulus nicht bekommt (die andere Ausprägung der unabhängigen Variablen), die Kontrollgruppe. Ein- und mehrfaktorielle Designs einfaktorielles Design Zeitungsartikel mit / ohne Krebs o 1 UV: Krebsinhalte o 2 Ausprägungen (Inhalte vorhanden, nicht vorhanden) = 2 Stufen Zeitungsartikel mit positiven / negativen Informationen / ohne Info über Krebs o 1 UV: Krebsinhalte o 3 Stufen mehrfaktorielle Designs Variation mehrerer UV bzw. Faktoren: z.b. 2x2-Design (vgl. Stimulationsthese) o 2 UV: Krebsinhalte (Faktor 1), Furchtappell (Faktor 2) o jeweils 2 Stufen

Zusammenfassung: Was ist ein Experiment? Die Idee ist also ganz einfach: Wenn es gelingt, die Wirkung aller anderen systematischen Einflussnahmen auf die Ausprägungen der Messgrößen auszuschalten, ist die einzige systematische Veränderung von Bedingungen gleichzeitig die Möglichkeit, bestimmte gerichtete Veränderungen der Messgrößen zu erklären. Dadurch, daß nun aber (im einfachsten Fall) die Variation der einzigen Variablen vorliegt und lediglich die Veränderungen dieser Variablen unsere Messgrößen der abhängigen Variablen (im günstigsten Fall!) beeinflussen, können wir auch auf eine Verursachungsbeziehung schließen - wir können also die Variation der gemessenen Werte kausal erklären. (Czienskowski 1996) Zusammenfassung: Was ist ein Experiment? Als wesentlichstes Merkmal experimenteller Forschung kann formuliert werden, dass im Experiment der Durchführende des Experimentes aktiv in das Geschehen eingreift. Seine Hauptaufgabe besteht dabei, mindestens eine UV systematisch zu variieren, und aufzuzeichnen, welche der Ausprägungen der UV welche Veränderungen der AV nach sich zieht. Gleichzeitig muss er aber darauf achten, daß die Wirkung aller anderen Variablen der sog. Störvariablen ausgeschaltet ist. (Czienskowski 1996) Störvariablen Störvariablen sind Einflussfaktoren, die die AV ebenfalls beeinflussen und im Ablauf eines Experiments unkontrolliert auftreten. Beispiele : Zusammensetzung der Vpn Störungen bei der Versuchsdurchführung zwischenzeitliches Geschehen Lern- und Reifungsprozesse Messeffekte Verzerrte Auswahl (z.b. Versuchsgruppen gleichen sich nicht) Konfundierung (s.u.) Ziel: Wirkung von Störvariablen neutralisieren oder aktiv einbeziehen Letzteres setzt voraus: man kennt die Störvariable und kann sie als zusätzliche unabhängige Variable ins Untersuchungsdesign einfügen Störvariablen: Konfundierung Störvariablen im Treatment selbst vorhanden = Konfundierung. Konfundierung von zwei Variablen: 2 Gruppen unterscheiden sich nicht in einem, sondern in zwei Merkmalen. Stichwort: Äpfel und Birnen Das Experiment ist wertlos, da das Ergebnis nicht auf eine Ursache zurückzuführen ist (z.b. frühe Experimente der Gewaltforschung)

Störvariablen: Konfundierung - Beispiel Stimulus: Gewaltfilm kein Film Stimulus: Gewaltfilm Naturfilm Lösung? Einfluss der rezipierten Gewalt, oder generell des Filmsehens? Einfluss der rezipierten Gewalt oder der unterschiedlichen Schnittlänge, des unterschiedlichen Settings u.dgl.? Es wird ein und derselbe Film gezeigt: einmal mit allen Gewaltszenen, einmal ohne Gewaltszenen Achtung! gleiche Länge Störvariablen: Konfundierung Medieninhalte sind äußerst komplex und nie bis ins letzte in einem Experiment zu kontrollieren Gefahr der Konfundierung steigt mit der Komplexität des Stimulus und lässt sicht nicht immer völlig vermeiden Ausweg: nur ein minimales Detail manipulieren, in dem sich die Gruppen unterscheiden Störvariablen: Kontrolle Elimination (etwa durch Durchführung im Labor) Standardisierung der Durchführung Durchführung in kleinen Gruppen etc. Randomisierung der Versuchspersonen Kontrolle durch Randomisierung Beim Randomisieren werden die Versuchspersonen nach dem Prinzip der Zufallsauswahl auf die verschiedenen experimentellen Bedingungen (Kontrollgruppe, Experimentalgruppe) verteilt. Dabei ist es wichtig, ein Zufallskriterium zu wählen, dass mit Sicherheit nicht in Verbindung mit dem experimentellen Stimulus steht. Bankreihe in Schulklassen eher schlecht. besser: gerade und ungerade Tage des Geburtsdatums, jeder zweite an einer Bank zu einer Gruppe, der andere zur anderen, Ziehen per Los, Würfeln etc. Mit dem Randomisieren erreicht man, dass potenzielle Störvariablen sich in gleicher Weise auf die verschiedenen Versuchsgruppen verteilen, so dass die Gruppen sich nur in bezug auf die unabhängigen Variablen unterscheiden.

Kontrolle durch Randomisierung Vorraussetzung ist allerdings, dass die Gruppen ausreichend groß sind, damit sich alle Variablen gleichmäßig auf die Gruppen verteilen (mind. 20 bis 30 Personen). Da man nie ganz sicher sein kann, sollte man entscheidende Merkmale mit erheben, um ihre Verteilung zu erfassen: z.b. Geschlecht Alter Rezeptionsgewohnheiten generelles Aggressionspotenzial Stimmung am Tag der Erhebung Kontrolle durch Parallelisierung / Matchen Beim Parallelisierung besteht das Prinzip darin, bestimmte Merkmale zu identifizieren, von denen man weiß, dass sie für die Untersuchung zentral sind. z.b. Wenn man die Möglichkeit hat, das krebsspezifische Wissen von Vpn vor der Induktion des Stimulus valide zu messen, könnte man die Gruppen so einteilen, dass das Merkmal in allen Gruppen gleich verteilt ist (vgl. Einteilung zweier gleichstarker Sportmannschaften durch den Sportlehrer) wesentlich seltener aufgrund entscheidender Nachteile: Man kontrolliert nur bestimmte Merkmale: Die Wahrscheinlichkeit, dass andere Merkmale nicht gleichverteilt sind, zumal jene, von denen man nichts weiß, ist hier sehr hoch. Höherer Aufwand und Messwiederholung: Vor der Einteilung in Gruppen müssen die relevanten Merkmale erfasst werden (zusätzlicher Fragebogen, der möglicherweise zu Lerneffekten führt und das Untersuchungsziel offen legt). Parallelisierung versus Randomisierung Die Parallelisierung ist daher sehr unsicher und wird selten angewendet. Vorteil der Randomisierung ist ja gerade, dass sich mit ihr alle Merkmale auf die Gruppen gleichmäßig verteilen. Selbstselektion Achtung! Sobald Menschen sich durch Selbstselektion der einen oder anderen Gruppe zuordnen, sind die Gruppen nicht mehr vergleichbar! Beispiel: Gewaltfilmfans versus Naturfilmfans; Will ich den Einfluss von Gewalt auf die Aggressionsbereitschaft messen, darf ich die Vpn nicht selbst entscheiden lassen, was sie sehen wollen, da die Bevorzugung der einen oder anderen Versuchsbedingung mit anderen Persönlichkeitsmerkmalen zusammenhängt (Kondundierung!) Die Grundbedingung, um später Unterschiede eindeutig als Wirkung eines Merkmals interpretieren zu können, wird also verletzt. Selbstselektion muss daher bei der Rekrutierung von Versuchspersonen bzw. Einteilung in Gruppen unter allen Umständen ausgeschaltet werden Die Ergebnisse eines solchen Experiments lassen sich sonst nicht kausal interpretieren!

Repräsentativität interne versus externe Validität Güte des Experiments Repräsentativität Zwar werden die Probanden bei Experimenten per Zufall den Versuchsgruppen zugeteilt, die Auswahl des Pools an Probanden geschieht jedoch in der Regel nicht zufällig - es handelt sich meist um eine bewusste, keine repräsentative Auswahl (z.b. Studenten). Bewusste, nicht repräsentative Auswahlverfahren lassen sich vor allem daher kaum vermeiden, weil die Verfügbarkeit von Versuchspersonen ein großes Problem darstellt. Es liegt daher für die Forschung nahe, immer dort, wo Menschen zumeist aus beruflichen Gründen zusammenkommen und deshalb verfügbar sind, diese Gruppe für ihre Untersuchung zu rekrutieren. Es werden besonders häufig Studierende, Soldaten, Schüler oder Arbeiter in einem großen Betrieb in Experimenten untersucht. Repräsentativität Repräsentativität Daher wird an Experimenten häufig kritisiert: Die Probanden stehen nicht für eine Grundgesamtheit, die Summe der Teilnehmer der Experimental- und Kontrollgruppe ist nicht repräsentativ. Die absolute Höhe der gemessenen abhängigen Variablen kann nicht von der Stichprobe auf die Grundgesamtheit hochgerechnet werden. Man muss hier aber differenzieren: Das generelle Ziel von repräsentativen Bevölkerungsumfragen sind verallgemeinerbare Aussagen über eine bestimmte Population, das Experiment will dagegen relative Aussagen machen Messergebnisse im Experiment sind insofern generalisierbar, als ein beobachteter Unterschied zwischen Experimental- und Kontrollgruppe unabhängig von der jeweiligen Teilgruppe existieren wird. Die genaue Größe des Unterschiedes ist nicht generalisierbar. Vermutlich wird sich z.b. der Unterschied in der Erinnerungsleistung zwischen bebilderten und nicht bebilderten Nachrichten, der bei Studierenden gefunden wurde, bei anderen Bevölkerungsgruppen auch finden, wenn auch auf einem anderen Niveau. Entscheidend ist dabei: Der Einfluss von sozialen / soziodemographischen Merkmalen auf die gefundenen Effekte muss berücksichtigt und möglichst ausgeschlossen werden können.

Validität des Experiments Auch die Validität eines Experiments ist von zentraler Bedeutung dafür, ob man die Ergebnisse verallgemeinern lassen. Die allgemeine Bedeutung der Validität (Gültigkeit) in empirischen Untersuchung ( Misst die Untersuchung/ das Instrument das, was es messen soll? ) wird im Experiment um entscheidende Aspekte erweitert. Unterschieden wird hier zwischen interner und externer Validität. Interne Validität Die interne Validität sagt etwas darüber aus, inwieweit durch die experimentelle Variation das gemessen wird, was gemessen werden soll. Die interne Validität stellt somit sicher, dass die Veränderung einer abhängigen Variablen tatsächlich auf die unabhängige zurückgeführt werden kann und Konfundierungen zwischen der unabhängigen und einer Störvariable ausgeschlossen werden können. Dies ist die notwendige Bedingung, um ein Ursache-Wirkungsverhältnis zu identifizieren. Erst wenn alle Variablen kontrolliert sind, kann man sicher sein, dass der Kausalschluss zulässig ist. Externe Validität Mit der vollständigen Kontrolle der experimentellen Situation erreicht man zwar eine hohe interne Validität, jedoch kann es sein, dass dadurch die Situation so unnatürlich wird, dass sie in der tatsächlichen Realität nicht oder kaum je auftreten wird. Diesen Sachverhalt bezeichnet die externe Validität. Die externe Validität sagt also etwas darüber aus, inwieweit sich die Ergebnisse eines Experimentes auf die Realität generalisieren lassen, also auch außerhalb des Labors auftreten. Interne versus externe Validität Zwischen externer und interner Validität herrscht also eine Art Antagonismus: Die Erhöhung der internen Validität durch Kontrolle aller Variablen geht häufig zu lasten der Übertragbarkeit der Ergebnisse auf die Realität außerhalb des experimentellen Labors. Je höher die interne Validität einer Versuchsanordnung, desto geringer wird die externe - und umgekehrt.

Feld- versus Laborexperiment Laborexperimente zeichnen sich in erster Linie durch die Manipulation der unabhängigen Variablen und eine starke Kontrolle der Versuchssituation aus: Die Untersuchungsräume sind in extra für den Forschungszweck ausgestattet, meist relativ einfach gehalten, um die Kontrolle der Störvariablen klein zu halten. Darunter leidet die externe Validität (künstlich). Um die externe Validität nicht zu sehr einzuschränken, kann man bspw. in Fernsehexperimenten das Labor wie ein Wohnzimmer gestalten (Couch, Tisch, Snacks, Getränke). Dies erfordert aber einen hohen Aufwand, weil diese Bedingung dann bei allen Vpn gleich sein muss. Feld- versus Laborexperiment Feldexperimente zeichnen sich in erster Linie durch eine hohe externe Validität aus: Die natürliche Umgebung, in der sich die Vpn bewegen, wird weitgehend beibehalten. Die Teilung in Experimental- und Kontrollgruppe ist weitgehend in die natürliche Lebenssituation eingebaut. Damit verhalten sich die Vpn weitgehend natürlich. Allerdings kann der Versuchsleiter Stimulus, Situation und Ablauf nicht kontrollieren. Die Interpretation, damit die interne Validität, solcher Ergebnisse ist damit recht problematisch. Feld- versus Laborexperiment Beispiel 1 Kriterien Ort der Untersuchung Manipulation der UV Kontrolle der Störvariablen Verhalten der Vpn Interne Validität Externe Validität Labor spezielle Räumlichkeiten auf allen gewünschten Stufen ja, soweit Störvariablen kontrollierbar instruiertes Verhalten hoch niedrig Feld natürliche Umgebung nur soweit in der natürlichen Umgebung angemessen Einfluss von Störungen kann nicht verhindert werden natürliches Verhalten niedrig hoch Operationalisierung der Katharsisthese durch Feshbach (1961): Laborexperiment Experimentalgruppe durch Beleidigungen verärgert, Kontrollgruppe nicht (Faktor 1) Präsentation eines aggressiven (Preisboxkampf) oder neutralen Films (Konsequenzen der Verbreitung eines Gerüchts in einer Fabrik) (Faktor 2) Messung der AV: Wort-Assoziationstest, Einstellung der Vpn zu Versuchsleiter und Experiment signifikant weniger aggressive Wort-Assoziationen und aggressive Einstellungen nach Sehen des aggressiven Films im Gegensatz zum neutralen Film in der EG (=vorher frustrierte Vpn) signifikant mehr aggressive Wort-Assoziationen nach Sehen des aggressiven Films im Gegensatz zum neutralen Film in der KG (=nicht frustrierte Vpn) Interpretation: Beleg für Katharsisthese

Kritik Beispiel 1 nicht vergleichbares Filmmaterial (zu unterschiedlich, neutraler Film möglicherweise als aggressiver gesehen als der aggressive Film) keine Vorhermessung des Aggressionsniveaus keine Interpretation in der einen oder anderen Richtung möglich Beispiel 2 Operationalisierung der Theorie der kognitiven Unterstützung durch Feshbach & Singer, 1971 (Feldexperiment) 2-faktorielles Design: F1: männliche Jugendliche von private schools (intelligent, kognitiv besser entwickelt) vs. männliche Jugendliche von boys homes (weniger intelligent); F2: gewalthaltige Sendungen vs. gewaltfreie (Kontrollgruppe, die aber Lieblingsserie Batman sehen darf) AV: Einschätzung des Agressivitätsniveaus durch die Lehrer, die über das Untersuchungsziel Bescheid wussten Jugendliche der boys school (geringe Intelligenz und Phantasieaggression), die 6 Wochen lang aggressive Sendungen sehen durften, waren weniger aggressiv als die anderen Interpretation: das Nichtsehen aggressiver Fernsehsendungen gekoppelt mit niedrigerer Phantasieaggression hat ein aggressiveres Verhalten zur Folge, umgekehrt hat die Rezeption gewalthaltiger Sendungen und dadurch unterstützte Phantasieaggression eine Reduktion der Aggressivität zur Folge. Beispiel 2 Beispiel 3 Kritik keine Vorhermessung keine Kontrolle und Messung von Phantasieaggression zentrales Konzept der kognitiven Kontrolle nicht definiert, operationalisiert oder kontrolliert Operationalisierung der Stimulationsthese durch Parke et al. (1977): Untersuchung der Auswirkung violenter Kinofilme auf das Verhalten männlicher delinquenter Jugendlicher 3 Wochen lange Beobachtung delinquenter Jugendlicher base-line (Einteilung der Jugendlichen in aggressiv-nicht aggressiv) (Faktor 1) 5 Tage lang zeigen von Kinofilmen (Experimentalgruppe: gewalthaltige Filme, Kontrollgruppe: ähnlich interessante und aufregende gewaltlose Filme); während dieser Zeit kein Fernsehen erlaubt (Faktor 2) AV: Beobachtung der Verhaltens der Jugendlichen noch 3 Wochen nach der Experimentalphase durch Beobachter, die über das Untersuchungsziel Bescheid wussten; außerdem Messung der Aggressivität am Tag nach dem Ansehen des letzten Films mit Elektroschocks und verbal aggression index Experimentalgruppen aggressiver Interpretation als Beleg für Stimulationsthese

Kritik Beispiel 3 systematische Verzerrung durch Beobachter nicht auszuschließen Übertragbarkeit auf das Medium Fernsehen fraglich, weil in der Experimentalphase andere Fernsehrezeption nicht erlaubt war ( Frustration durch Fernsehverbot) Übertragbarkeit der Befunde auf nicht-delinquente Vpn nicht gewährleistet andere Studien mit ebenfalls delinquenten Vpn konnten den Effekt nicht nachweisen Beispiel 4 Experiment von Werbevermeidung durch Schimansky (1999) 83 Versuchspersonen zufällig auf zwei Experimentalgruppen verteilt Jede der beiden Gruppen sieht 19 Werbespots, die vorher (von anderen Leuten) in einem Pretest bewertet worden waren. Gruppe 1: gut bewertete Spots; Gruppe 2: schlechte Spots (=Stimulus) AV: Befragung der Teilnehmer, wie sie sich Fernsehwerbung gegenüber normalerweise verhalten (die Skala Werbevermeidung bestand aus mehreren Items). Hypothese des Verfassers bestätigt: Probanden, die die schlechten Spots gesehen hatten, wiesen im Vergleich zur anderen Gruppe eine signifikant stärkere Zappingtendenz auf. Beispiel 4 Literatur Kritik Messung der AV keine Vorhermessung Atteslander, P. (1984). Methoden der empirischen Sozialforschung. Berlin: de Gruyter. (Kapitel 5: Das Experiment, S. 190-210). Brosius, H.-B., Koschel, F. & Haas (2007). Methoden der empirischen Kommunikationswissenschaft. Wiesbaden: Westdeutscher Verlag. Berger, A.A. (2000). Media and Communication Research Methods. An Introduction to Qualitative and Quantitative Approaches. Thousand Oaks: Sage. (Kapitel 13: Experiment, S. 209-218). Czienskowski, U. (1996). Wissenschaftliche Experimente. Planung, Auswertung, Interpretation. Weinheim: Beltz. Friedrichs, J. (1980). Methoden empirischer Sozialforschung. Opladen: Westdeutscher Verlag. (Darin Kapitel 5.11. Experiment, S. 333-353) Greenwood, E. (1967). Das Experiment in der Soziologie. In König, R. (Hrsg.), Beobachtung und Experiment in der Sozialforschung. Köln, Berlin: Kiepenheuer & Witsch, S. 171-220.