Grundlagen der empirischen Sozialforschung Sitzung 3 - Messen Jan Finsel Lehrstuhl für empirische Sozialforschung Prof. Dr. Petra Stein 03. November 2008 1 / 34
Online-Materialien Die Materialien zur Vorlesung finden Sie auf der Homepage http://www.uni-due.de/soziologie/stein_lehre.php Die ganze Vorlesung ist dort auch als Stream verfügbar Es gibt eine Übung von Dawid Bekalarczyk um 14 bis 16 Uhr am Montag in Raum S-E 005 hier in Essen Im Sekretariat von Frau Werner in Raum R12 R06 A30 können CDs bzw. DVDs erstanden werden Meine Materialien werden auf meiner Seite http://www.uni-due.de/soziologie/finsel.php abgelegt Mail: jan_finsel@uni-due.de http://www.tagesschau.de/ausland/realclearpolitics100.html 2 / 34
Der Plan für heute I 1 Struktur des Vorlesungsblockes Datenerhebung Vorlesungsblock Datenerhebung - sechs Sitzungen 2 Messen Messen Kern- und Hilfstheorien Empirisches und Numerisches Relativ Strukturtreue Abbildungen Morphismen Isomorphismus Homomorphismus Beispiel: Parteizugehörigkeit 3 Messniveaus Nominales Messniveau Ordinales Messniveau Metrisches Messniveau Intervallskala Ratioskala 4 Die drei Gütekriterien von Messungen 3 / 34
Der Plan für heute II Objektivität Reliabilität Validität Validitätskonzepte 5 Sozialwissenschaftliche Skalen Skalen Items Beispiele für Statements Zusammenfassung 6 Die Likert-Skala 1. Schritt: Sammlung von Items 2. Schritt: Vercodung der Items 3. Schritt: Item-Analyse Techniken zur Überprüfung der Likert-Skala 1. Trennschärfe-Indizes 2. Trennschärfe-Koeffizienten 7 Die Guttman-Skala 4 / 34
Der Plan für heute III Beispiel Guttman-Skala 5 / 34
Vorlesungsblock Datenerhebung - sechs Sitzungen Ablauf 1. Grundlagen der empirischen Sozialforschung - Der Forschungsprozess 2. Definitionen und Hypothesen in der Wissenschaft 3. Messen und Skalieren 4. Forschungsdesigns und Untersuchungsformen 5. Auswahlverfahren und Stichprobendesigns 6. Das Datenerhebungsverfahren der Befragung 6 / 34
Das Messen Datenerhebung Messen Der Prozess der Datenerhebung kann auch als Messen bezeichnet werden, denn im Prozess der Datenerhebung messen wir Merkmalsausprägungen von Untersuchungseinheiten Messen Zuordnung von Zahlen zu Objekten oder Ereignissen nach festgelegten Regeln und zwar so, dass die numerischen Relative den empirischen Relativen entsprechen 7 / 34
Kern- und Hilfstheorien Neben der Kerntheorie werden immer auch Hilfstheorien (z.b. bei der Messung von Konstrukten über Indikatoren) herangezogen Bei der empirischen Untersuchung steht nicht nur die Kerntheorie auf dem Prüfstand Das Ergebnis, die Annahme oder die Verwerfung der Hypothesen, ist auch von der Gültigkeit der Hilfs- ( Mess-) theorien abhängig Wunder Punkt empirischer Arbeiten Quelle: Laatz, Wilfried 1993: Empirische Methoden. Ein Lehrbuch für Sozialwissenschaftler. S. 58 8 / 34
Empirisches und Numerisches Relativ Beispiel Definition Empirisches Relativ Otto > Fritz > Hugo Eine Menge von Objekten, über die eine Relation definiert wurde Numerisches Relativ 186 > 179 > 168 Eine Menge von Zahlen, über die eine Relation definiert wurde 9 / 34
Strukturtreue Abbildungen Morphismen Morphismen Eine Messung im o.g. Sinne ist eine strukturtreue Abbildung Die Beziehungen der Objekte werden durch die Beziehungen der zugeordneten Zahlen korrekt wiedergegeben Strukturtreue Abbildungen werden als Morphismen bezeichnet Zwei Arten von Morphismen Isomorphismus Homomorphismus 10 / 34
Isomorphismus Umkehrbar eindeutige Abbildung Schüler Zuordnung Mathenote A 1 B 2 C 3 D 4 11 / 34
Homomorphismus Nicht umkehrbar eindeutige Abbildung A Schüler C 1 Deutschnote 2 B Schüler D 12 / 34
Beispiel Parteizugehörigkeit I Wenn zwei Personen der gleichen Partei angehören, so wird ihnen die gleiche Zahl zugeordnet Wenn zwei Personen unterschiedlichen Parteien angehören, so werden ihnen unterschiedliche Zahlen zugeordnet Tabelle: Vercodungsplan Partei CDU SPD CSU FDP Grüne Die Linke Code 2 4 3 5 8 7 13 / 34
Beispiel: Parteizugehörigkeit II Tabelle: Vercodungsplan Partei CDU SPD CSU FDP Grüne Die Linke Code 2 4 3 5 8 7 Code der CDU SPD CSU FDP Grüne Die Linke Person Person A X 4 Person B X 4 Person C X 2 Person D X 5 Person E X 4 Person F X 2 Person G X 3 Person H X 8 Person I X 8 Person J X 7 14 / 34
Messniveaus von Variablen Skalenwert Mögliche Aussagen Beispiele Nominalskala Gleichheit/ Geschlecht, Verschiedenheit Konfession Ordinalskala größer-kleiner Arbeitszu- Relationen friedenheit Intervallskala Gleichheit von Temperatur Differenzen ( F, C) Ratioskala Gleichheit von Länge, Gewicht, Verhältnissen K 15 / 34
Die drei Gütekriterien von Messungen Objektivität Reliabilität Validität 16 / 34
Objektivität (Intersubjektivitat) Gütekriterien von Messungen Durchführungsobjektivität Unabhängigkeit der Messung von den Messenden (z.b. standardisierte Fragen; kein Spielraum für verschiedene Interviewer) Auswertungsobjektivität Unabhängigkeit zwischen einer Auswertung und der auswertenden Personen (deshalb gibt es etablierte statistische Analyseverfahren) Interpretationsobjektivität Unabhängigkeit zwischen der interpretierenden Person und der Interpretation 17 / 34
Reliabilität (Zuverlässigkeit von Messungen) Gütekriterien von Messungen Reliabilität Ausmaß, bei wiederholten Messungen mit einem Messinstrument unter den gleichen Bedingungen zu dem gleichen Ergebnis zu gelangen. Verfahren zur Überprüfung der Reliabilität Methoden der Reliabilitätsprüfung Test-Retestmethode Parallel-Testmethode Split-half-Methode 18 / 34
Validität (Gültigkeit von Messungen) Gütekriterien von Messungen Unter der Validität eines Messinstrumentes versteht man das Ausmaß, in dem das Messinstrument tatsächlich das misst, was es messen soll 19 / 34
Validitätskonzepte I Gütekriterien von Messungen Inhaltsvalidität Alle Aspekte der Dimensionen, die gemessen werden sollten, müssen berücksichtigt werden Kriteriumsvalidität Der Zusammenhang zwischen den empirisch gemessenen Ergebnissen des Meßinstrumentes und einem anders gemessenen externen Kriteriums sollte möglichst hoch sein Vorhersagevalidität (Prädiktive Validität) Die Prognosen, die ein Meßinstrument liefert, sollten möglichst genau zutreffen 20 / 34
Validitätskonzepte II Gütekriterien von Messungen Known-groups Sind 2 Gruppen bekannt, die auf der interessierenden Dimension Unterschiede aufweisen, so muss ein Messinstrument diese beiden Gruppen einfangen können Expertenvalidierung Experten überprüfen gefühlsmäßig die Gültigkeit des Messinstrumentes Konstruktvalidität Gilt, wenn aus dem Konstrukt empirisch überprüfbare Zusammenhänge dieses Konstruktes mit anderen Konstrukten theoretisch hergeleitet und empirisch überprüft werden können 21 / 34
Sozialwissenschaftliche Skalen Skala Skala im Sinne der Messtheorie wird formal definiert als einen Homomorphismus eines empirischen Relativs in ein numerisches Relativ (d.h. eine strukturerhaltene Zuordnung von Zahlen zu Objekten) Diese Zuordnung leisten in der Praxis Mess- bzw. Erhebungsinstrumente Methoden zur Konstruktion solcher Instrumente könnte man daher als Skalierungsverfahren bezeichnen In der Praxis der empirischen Sozialforschung hat der Begriff der Skala noch eine weitere Bedeutung Dort bezeichnet das Wort Skala eine Reihe von Items, die entlang einer Dimension messen 22 / 34
Sozialwissenschaftliche Skalen Items Item bezieht sich auf die kleinsten Bestandteile eines Erhebungsinstrumentes Dies können einzelne Fragen, Aufgaben oder Aussagen, die mit der Aufforderung, den Grad der Zustimmung bzw. Ablehnung oder eine andere Bewertung anzugeben verbunden sind Man erschließt soziale Einstellungen aus Reaktionen auf sorgfältig ausgewählten Fragen und Statements (Items), die als Indikatoren für die direkt nicht beobachtbare Einstellung betrachtet werden 23 / 34
Beispiele für Statements Das Konstrukt Ausländerfeindlichkeit wird über die folgenden beiden Items operationalisiert: In wirtschaftlich schlechten Zeiten wie diesen sollten Ausländer lieber wieder gehen Ausländer können sich nicht anpassen Diese Statements werden den Befragten vorgelegt und man erwartet von ihnen eine Stellungnahme 24 / 34
Zusammenfassung Skalierungsverfahren werden in der empirischen Sozialforschung überwiegend zur Messung von Einstellungen verwendet Einstellungen werden dabei als latente Variablen aufgefasst Ziel der Einstellungsmessung ist die Feststellung der Ausprägung der latenten Variablen bei den Befragten Zur Messung werden den Befragten Aussagen vorgelegt, auf die die Befragten mit Zustimmung oder Ablehnung reagieren sollen Diese Statements (Items) geben in der Regel bestimmten Auffassungen zum Einstellungsgegenstand Ausdruck 25 / 34
Die Likert-Skala Drei Konstruktionsschritte 1. Sammlung von Items 2. Vercodung der Items 3. Item-Analyse 26 / 34
1. Schritt: Sammlung von Items Die Konstruktion einer Likert-Skala beginnt mit der Sammlung einer großen Zahl von Items Diese Items stellen hierbei Aussagen dar, von denen angenommen wird, daß sie die interessierende Einstellung wiedergeben Diese Items werden einer Stichprobe von Personen vorgelegt Die Befragten werden nun aufgefordert, zu jedem Statement Stellung zu beziehen Tabelle: Als mögliche Stellungsnahme werden ihm vorgegeben: ++ + 0 - - - stimme stimme unent- lehne lehne stark zu zu schieden ab stark ab 27 / 34
2. Schritt: Vercodung der Items Messung von Extraversion Tabelle: Beispiel eines positiv formulierten Items: Ich genieße die Gegenwart anderer Menschen. ++ + 0 - - - 1 2 3 4 5 2 1 0-1 -2 Tabelle: Beispiel eines negativ formulierten Items: Am liebsten bin ich mit mir alleine. ++ + 0 - - - 5 4 3 2 1-2 -1 0 1 2 Die Reaktion auf ein Item wird als Einzelmesswert verbucht Der Wert der Gesamtskala ergibt sich aus der Addition der Werte 28 / 34
3. Schritt: Item-Analyse Ziel der Item-Analyse Ungeeignete Items aus der Skala aussondern Ungeeignete Items 1. Personen mit sehr unterschiedlicher Einstellung beantworten ein Item ähnlich 2. alle Personen stimmen dem Item zu 3. alle Personen lehnen es unisono ab Überprüfung der Eindimensionalität Alle Items einer Skala sollten nur eine Dimension erfassen (eine zu messende Einstellung erfassen) 29 / 34
Techniken zur Überprüfung der Likert-Skala Vorgehensweise Trennschärfe-Indizes Trennschärfe-Koeffizienten 30 / 34
1. Trennschärfe-Indizes Technik zur Überprüfung der Likert-Skala Vorgehensweise Die (vorläufige) Skala wird gebildet Anhand des Gesamtscores werden die Personen in vier gleich große Gruppen (= Quartile) eingeteilt. Dabei sind in der ersten Gruppe 25% der Personen. Sie besitzen die niedrigsten Werte auf der Skala. Für jedes Item wird der Mittelwert x des Items in beiden Gruppen berechnet. T = x oberstes Quartil - x unterstes Quartil Je größer T, desto besser diskriminiert das Item zwischen den Gruppen 31 / 34
2. Trennschärfe-Koeffizienten Technik zur Überprüfung der Likert-Skala Vorgehensweise Über alle Personen wird jedes Item mit der Gesamtskala korreliert Items, die hoch mit der Gesamtskala korrelieren, werden beibehalten Die Höhe der Korrelation ist ein Ausdruck dafür wie gut das einzelne Item auf der Untersuchungsdimension liegt 32 / 34
Die Guttman-Skala Konzept 1. Stufencharakteristik - Schwellenwerte 2. Immer schwieriger werdende Items 3. Unterstellt monotones Antwortverhalten 4. Nur dichtome Ja-Nein oder Bestehen-Nichtbestehen outcomes möglich 5. funktionalistische Messtheorie statt künstlicher Reduktion des Merkmalsraumes Reproduktionskoeffizient = 1 Daumenregeln Guttman: > 0,9 ist gut Zahl der inkonsistenten Antworten (Zahl der Items)(Zahl der Faelle) Lüdtke: bei ihm ist 0,84 in Ordnung 33 / 34
Die Guttman-Skala zur musischen Erziehung Das Kind hat(te) bis zu seinem 10. Lebensjahr 1. eine Musikschule besucht 2. Gesangs- oder Ballettunterricht 3. mehrmals im Jahr gemeinsam musiziert 4. manchmal Konzert oder Oper besucht 5. mehrmals im Jahr gemeinsam gesungen 6. ein Instrument spielen gelernt 7. nichts von allem 34 / 34