DR. GUNDULA WAGNER Systemisch, dynamische Begabungsförderung Darstellungsmöglichkeiten in der Mehrebenenanalyse 13. ECHA-Tagung 2012
Inhalt 1 Einleitung 2 Multifaktorielles Begabungsmodell 3 Allgemeines zur Mehrebenenanalyse 4 Systemisches Begabungsmodell 5 Grundlagen der Mehrebenenanalyse 5.1 Lineare und multiple Regression 5.2 Residuum 5.3 Feste Effekte 5.4 Zufallseffekte 5.5 Zentrierung der Variablen 6 Zwei-Ebenen-Modell 6.1 Random-Intercept-Modell 6.2 Random-Slope-Modell 7 Paneldaten im Mehrebenenmodell 8 Beispiel einer dynamischen Begabungsentwicklung 9 Literatur
1. Einleitung Die Mehrebenenanalyse ist ein statistisches Analyseverfahren, das es ermöglicht den Einfluss von individuellen und kontextuellen Merkmalen simultan darzustellen. Dadurch können systemische Effekt von Begabungsförderung auf den Einzelnen untersucht werden. Ein besonderes Spezifikum ist die verbesserte Darstellung von Entwicklungsverläufen im Sinne eines dynamischen Begabungsbegriffs. Dient der Objektivierung der Schülerwahrnehmung.
2. Multifaktorielles Begabungsmodell
2. Multifaktorielles Begabungsmodell Das Münchner Hochbegabungsmodell (Heller, Perleth & Hany 1994) berücksichtigt neben individuellen Persönlichkeitsfaktoren bereits Kontextmerkmale wie die familiäre Lernumwelt, das Familien- und Klassenklima oder die Instruktionsqualität der Lehrenden. Begabung ist demnach nicht nur die Folge individueller Persönlichkeitsmerkmale, sondern auch das Resultat der Bedingungen des Umfelds. Unterschiedliche Kontexte können bei Personen mit an sich gleichen oder ähnlichen individuellen Merkmalen unterschiedliche Entwicklungen der Begabung zur Folge haben ( Big-fish-little-pond- Effekt ).
2. Multifaktorielles Begabungsmodell Die herkömmlichen Analysemethoden (z.b. Varianz- und Regressionsanalyse) bieten folgende Möglichkeiten der statistischen Modellierung: Das Verbleiben auf der Individualebene, indem die individuelle Begabung/Leistung durch individuelle Merkmale und durch die individuelle Einschätzung von Kontextmerkmalen z.b. Klassenklima erklärt wird. Die Aggregierung von Individualdaten, d.h. aus den individuellen Einschätzungen der Schüler hinsichtlich des Klassenklimas wird durch Berechnung des Mittelwerts das Aggregatmerkmal Klassenklima erzeugt.
2. Multifaktorielles Begabungsmodell Nachteile der Aggregation von Individualdaten: Aggregateinheiten werden irrtümlich als homogen betrachtet Die Aggregation von Variablen führt zu einem Verlust an Varianz und damit u.u. zu einer Verminderung der Effektstärke Nach der Datenaggregation sind nur noch Aussagen auf der Aggregatebene (z.b. Klasse) möglich, aber nicht mehr auf der Ebene der einzelnen Schüler Gefahr des ökologischen Fehlschlusses, d.h. aus Ergebnissen, die anhand von Aggregateinheiten gewonnen wurden, wird auf Eigenschaften der Individuen geschlossen.
2. Multifaktorielles Begabungsmodell Fazit: Die Aggregation von Individualdaten bzw. die Disaggregation von Merkmalen der Aggregatseinheiten schränkt die Zuverlässigkeit statistischer Schlüsse ein Führt zu Problemen bei der inhaltlichen Interpretation der Ergebnisse Mit den herkömmlichen Analysemethoden ist die Beantwortung systemischer Aspekte der Begabungs-förderung nicht möglich.
3. Allgemeines zur Mehrebenenanalyse Um das Zusammenspiel individueller Faktoren, Merkmale des Unterrichts in der Klasse und die Spezifika der besuchten Schulen darzustellen, bedarf es der Mehrebenenanalyse, die Daten verschiedener Ordnung bzw. Ebenen simultan berechnet. Systemische Grundannahme ist, dass sich die Schüler der sozialen Einheit Klasse oder Schule durch gemeinsame Erlebens- und Erfahrungsräume ähnlicher geworden sind und sich von anderen Klassen unterscheiden (vgl. Luhmann 1999; Wilke 2000). Die Mehrebenenanalyse ermöglicht es wirksame und nicht wirksame Klassen oder Schulen hinsichtlich Begabungsförderung zu identifizieren.
3 Allgemeines zur Mehrebenenanalyse Zur Mehrebenenanalyse werden min. 2 Ebenen benötigt, es können aber 3 und mehr Ebenen berechnet werden. 1. Ebene = Individualebene (der einzelne Schüler) 2. Ebene = z.b. Klassenebene (Aggregateinheit der einzelnen Schüler einer Klasse) 3. Ebene = z.b. Schulebene (Aggregateinheit der einzelnen Klassen einer Schule) 4.Ebene = z.b. Bezirksschulebene (Aggregateinheit der einzelnen Schulen) 5. Ebene = z.b. Landesschulebene (Aggregateinheit der einzelnen Schulbezirke
3 Allgemeines zur Mehrebenenanalyse Schule Klasse 1 S 1 S 2 S 3 S 4 Anwendungsvoraussetzung ist eine hierarchische oder geschachtelte Datenstruktur, wie sie in Klumpenstichproben vorliegt, d.h. es werden z.b. alle Schüler (S) einer Klasse und mehrere Klassen einer Schule erhoben. Klasse 2 S 1 S 3 S 4 S 2
4. Systemisches Begabungsmodell
4. Systemisches Begabungsmodell Auf den drei Ebenen wirken unterschiedliche Prädiktoren der Begabung: Absolute Prädiktoren wirken nur auf der Ebene, für die sie definiert worden sind (Geschlecht, Alter, Intelligenz, Sprachkompetenz, Akzeleration, Individualisierung u.s.w.) Analytische Variablen repräsentieren die Verteilung eines absoluten Merkmals der unteren Ebene in Form seines Mittelwerts (mittleres Intelligenz- oder Sprachniveau der Klasse; mittleres Klassenklima der Schule als Schulklima) Kontextuelle Variablen beziehen sich nur auf die übergeordneten Ebenen ( Klassenklima, Schulform, begabungsfördernde Ausbildung des Lehrers,)
4. Systemisches Begabungsmodell Drei Arten von Effekten sind in diesem Modell möglich: Effekte der Individualebene auf die abhängige Variable Individuelle Faktoren Abhängige Variable der Individualebene Beispiel einer Hypothese: Je höher die individuelle Motivation ist, desto höher ist die Schulleistung.
4. Systemisches Begabungsmodell Effekte der Kontextebene auf die abhängige Variable Kontextfaktoren Abhängige Variable der Individualebene Beispiele von Hypothesen: Je höher das mittlere Intelligenzniveau der Klasse ist, desto höher ist die Schulleistung. Je besser das Klassenklima, desto höher ist die Schulleistung.
4. Systemisches Begabungsmodell Interaktionseffekte zwischen Individual- und Kontextebene auf die abhängige Variable (Cross-Level-Effekte) Kontextfaktoren Individuelle Faktoren Abhängige Variable der Individualebene Beispiel einer Hypothese: Je größer der Anteil von Lehrern mit ECHA-Ausbildung, desto stärker ist der Effekt der Intelligenz auf die Schulleistung (umso weniger Underachiever gibt es).
4. Systemisches Begabungsmodell Kritik an diesem Modell: Schüler gehören nicht nur dem Kontext Schule an, sondern auch anderen Kontexten z.b. Familie Schulexterne Kontexte wie z.b. Familie können in diesem Modell nicht berücksichtigt werden sondern müssten in einem eigenen Zwei-Ebenen-Modell dargestellt werden: 2. Ebene.. Familienebene 1. Ebene.. Individualebene (mehrere Kinder einer Familie aufgrund der Varianz zwischen den Kindern notwendig!)
5. Grundlagen der Mehrebenenanalyse Folgende Begriffe sind zum Verständnis der Mehrebenenanalyse notwendig: 1. Lineare bzw. multiple Regression 2. Residualvarianz 3. Feste und zufällige Effekte 4. Zentrierung von Variablen
5. 1 Lineare Regression Die Grundlage der Mehrebenenanalyse ist die lineare Regression. Mit der einfachen linearen Regression wird versucht, die Wirkung eines einzelnen Prädiktors vorherzusagen z.b. die Wirkung der Intelligenz auf die Schulleistung γ = β 0 + β 1 χ 1 + e i Mit der multiplen Regression wird die Wirkung mehrerer Prädiktoren auf eine Kriteriumsvariable prognostiziert. γ = β 0 + β 1 χ 1 + β 2 χ 2 + + β n χ n + e i
5.1 Lineare Regression Zur Erklärung der Regressionsgleichung: γ = β 0 + β 1 χ 1 + e i γ.. Kriteriumsvariable od. abhängige Variable od. auch Responsevariable (z.b. Schulleistung) β 0 Regressionskonstante, die die y-achse an einer bestimmten Stelle schneidet (Intercept oder Achsenabstand) β 1.. Steigung der Regressionsgeraden in Abhängigkeit vom Prädiktor (Slope) χ 1 Prädiktor oder unabhängige Variable (z.b. Intelligenz) e i Residuum
5.2 Residualvarianz Residuum oder die Residualvarianz ist die Differenz zwischen den empirischen und prognostizierten Kriteriumswerten von γ. Sie ist der durch die Regressionsgleichung unaufgeklärt gebliebene Anteil. Beispiel: Die Korrelation zwischen Intelligenz und Schulleistung liegt bei r = 0,5, d.h. die Schulleistung kann nur teilweise aus der Intelligenz prognostiziert werden und es gibt einen nicht erklärten Rest. Im statistischen Sinn wird sie auch als Fehlervarianz bezeichnet. Umgangssprachlich kann sie als Abweichung von einer erwarteten Norm bezeichnet werden oder als statistischer Ausdruck von Individualität.
5.2 Residualvarianz Schwetz & Swoboda (2010, S. 46)
5.3 Residualvarianz Während die Varianzanalyse auf die erklärte Varianz abzielt, die in den Prädiktoren steckt, zielt die Regression auf die Residualvarianz in den Kriteriumsvariablen (abhängigen Variablen). In der Mehrebenenanalyse wird die Residualvarianz der Kriteriumsvariable in zwei Komponenten zerlegt: Residualvarianz Interclass- Varianz Ebene 1 Intraclass- Varianz ICC Ebene 2
5.5 Feste Effekte In der Regressionsanalyse spricht man von einem festen (fixed) Effekt, wenn ein einheitlicher Koeffizient für alle Aggregateinheiten einer Stichprobe gültig ist. Beispiel: Schüler unterschiedlicher Schulen unterscheiden sich nicht hinsichtlich ihrer sozialen Herkunft. Fixe Effekte sind Parameter, die nicht zwischen den Gruppen variieren.
5.5 Zufällige Effekte In der Regressionsanalyse spricht man von einem zufälligen (random) Effekt, wenn durch die Merkmale der Aggregateinheiten jeweils unterschiedliche Koeffizienten resultieren. Beispiel: Schüler unterschiedlicher Schulen unterscheiden sich schulspezifisch hinsichtlich ihrer Leistungsmotivation. Sowohl Intercept als auch Slopes zählen zu den zufälligen Effekten.
5.6 Zentrierung von Variablen Wenn Prädiktoren verbotenerweise miteinander korrelieren, spricht man von Multikolliniarität. Prädiktoren werden transformiert, um eine sinnvolle Interpretation der ermittelten Werte zu erreichen. Zentrierung heißt, Mittelwert auf 0 setzen, d.h. man raubt jeder Variable, die mit einer anderen Variable korreliert den Gesamtmittelwert (grand mean) oder den Gruppenmittelwert (group mean). Entsprechend Variablen haben bei Mlwin den Zusatz gem.
6 Zwei-Ebenen-Modell In der Mehrebenenanalyse wird das Residuum (auch Resudialvarianz oder der unerklärte Rest ) zerlegt und auf die Kontexte zurückgeführt. Gleichung für Zwei- Ebenen-Modell: γ ij = β 0 + β 1 χ ij + (u j + e ij ) i j γ ij. χ ij u i.. e ij. Schüler Klasse Wert der Responsevariable des Schülers i in Klasse j Prädiktor des Schülers i in Klasse j Residuum für den Abstand einer Klasse von der Gesamtregressionslinie (Varianz zwischen den Klassen) Indiviualresiduum als Abstand eines Schülers von der Gesamtregressionslinie (Varianz zwischen den Schülern)
6 Zwei-Ebenen-Modell Schwetz & Swoboda (2010, S. 29)
6.1 Random-Intercept-Modell Mit dem Random-Intercept-Modell kann gezeigt werden, dass Kontexte eine Rolle spielen. Zufällige Effekte der Kriteriumsvariable (Schulleistung) hinsichtlich Klassenzugehörigkeit werden berücksichtigt. Für jede Klasse wird dazu eine eigene Regressionsgerade ermittelt, jedoch variieren nur die Intercepte, die Steigungen bleiben für alle Regressionslinien gleich. Erklärung der Grafik oben: 1. Gesamtregressionslinie (grand mean) 2. Klassenregressionslinie 3. Klassenresiduum 4 einzelner Schüler 5. individuelles Residuum
6.2 Random-Slope-Modell Mit dem Random-Slope-Modell kann die differenzielle Wirkung (crosslevel-effekte) von Prädiktoren und Kontexten dargestellt werden. Es wird die Varianz der Intercepte und der Steigungen ermittelt und der Zusammenhang (Kovarianz) zwischen beiden ermittelt, d.h. wie variieren die Intercepte und Steigungen der einzelnen Regressionsgeraden. Mögliche Hypothesen für ein Random-Slope-Modell : Je größer der Anteil von Lehrern mit ECHA-Ausbildung, desto stärker ist der Effekt der Intelligenz auf die Schulleistung (umso weniger Underachiever gibt es). Je höher die Intelligenz, desto stärker ist die Wirkung des Klassenklimas auf die Schulleistung.
6.2 Random-Slope-Modell Schwetz & Swoboda (2010, S. 134)
7 Paneldaten als Mehrebenenmodell Will man eine dynamische Begabungsentwicklung darstellen, benötigt man Längsschnittuntersuchungen mit Messwiederholungen (sog. Paneldaten). Die Mehrebenanalyse ermöglicht die Veränderung der Kriteriumsvariable (z.b. Schulleistung): auf Personenebene zu untersuchen und über die Zeitachse zu bestimmen. Dazu gehen wir von einem Zwei-Ebenen-Modell aus, indem die befragten Personen die zweite Ebene sind und ihre zeitlich aufeinanderfolgenden Messzeitpunkte die erste Ebene darstellen, d.h. die Messzeitpunkte stecken in der Person. Man spricht auch hier von geschachtelten Datensätzen (nested modles).
7 Paneldaten als Mehrebenenmodell Russische Puppen als Beispiel eines geschachtelten Datensatzes
7 Paneldaten als Mehrebenenmodell
7 Paneldaten als Mehrebenenmodell Vorteile der Mehrebenenanalyse im Vergleich zur Varianzanalyse (BRYK & RAUDENBUSH 1992, zit. nach LANGER 2009, S. 227): Die Schätzung von Wachstumsmodellen auf Personen- und nicht auf Stichprobenebene; Erfordert keine vollständigen Datensätze für alle Personen und alle Messzeitpunkte; Die Abstände zwischen den einzelnen Messzeitpunkten dürfen variiieren;
8 Beispiel einer dynamischen Begabungsentwicklung Datensatz einer internen Evaluation im Rahmen des Begabungssiegels des Wiener Stadtschulrats Befragt wurden 2 Jahrgangsklassen und 2 Lerngruppen aus Mehrstufenklassen ( insgesamt 52 Schüler) Gemessen wurde im Schuljahr 2009/10 und 2010/11 Kriteriumsvariable war nicht die Schulleistung, sondern die Leistungsmotivation Messinstrumente CFT 20-R (Weiß 2006) Skalen aus FEES 3-4 (Rauer & Schuck 2003) Auswertung erfolgte mit MLwiN 2.16
8.1 Nullmodell Die Datenanalyse beginnt mit dem Nullmodell, um zu zeigen, ob überhaupt Kontexteffekte vorliegen. Das Nullmodell enthält noch keine Prädiktoren und die Regressionskonstante verläuft noch waagrecht zur x-achse. Die Klassenebene (v) im Beispieldatensatz zeigt keine Kontexteffekte. Die Varianz zwischen den Schülern beträgt 3,35 (52,6%) und ist nach der Rule-of-Thumb signifikant. Die Schülerebene (u) erklärt 52,6% der Residualvarianz. Die Varianz zwischen den Zeitpunkten beträgt 5,18 und ist nach der Rule-of-Thumb signifikant. Die Zeitebene (e) erklärt 47,4% der Residualvarianz.
8.1 Nullmodell
8.1 Random-Intercept-Modell Die Klasseneben wird weggelassen und mit einem Zwei-Ebenen- Modell (Zeitebene und Schülerebenen) weitergerechnet. Die Varianz zwischen den Schülern beträgt 0,48 (6,45%) und ist nach der Rule-of-Thumb nicht signifikant. Die Varianz zwischen den Zeitpunkten (u) beträgt 5,18 (93,55%) und ist nach der Rule-of-Thumb signifikant. Die Zeitebene erklärt demnach 93,55% Mit nur einer Ebene ist eine Regression ausreichend, das Random- Slope-Modell ermöglicht jedoch einen linearen Trend der Leistungsmotivation der Schüler darzustellen. Dargestellt sind Wachstumsmodelle für die verschiedenen Gruppen von Schülern (Buben und Mädchen). Individuelle Wachstumsmodelle können über die Residualanalyse gesondert dargestellt werden.
8.2 Random- Intercept-Modell
8.3 Random- Slope-Modell Das Random-Slope-Modell klärt die Frage, ob der Prädiktor Zeit auf alle Schüler in der gleichen Weise wirkt oder ob der zeitliche Einfluss variiert. Die Varianz bezüglich der Intercepte beträgt 5,02, die Varianz der Slopes beträgt 5,09. Beide sind nach der Rule-of-Thumb signifikant von null verschieden. Die Kovarianz zwischen Intercept und Steigung beträgt 4,4 und ist signifikant. Das negative Vorzeichen bedeutet, dass Schüler mit einer höheren Leistungsmotivation zum 1. Messzeitpunkt eine deutlich schwächere Entwicklung der Leistungsmotivation über die Zeitspanne zwischen 1. und 2. Messzeitpunkt haben (Deckeneffekt?!).
8.3 Random- Slope-Modell
8.3 Random- Slope-Modell Interpretation der signifikanten Prädiktoren: Der grand mean der LM für eine Schülerin mit geringer kognitiver Fähigkeit, Deutsch als Muttersprache, mit geringem Selbstwertkonzept, die den Zusammenhalt gering bewertet und die nicht an der Interessensförderung teilnimmt, liegt bei 2,7. Buben haben einen um 0,3 geringeren Wert der LM. Kinder mit anderer Muttersprache einen um 0,26 höheren Wert. Kinder mit hohem Selbstkonzept einen um 1,02 höheren Wert. Kinder, die den Zusammenhalt höher bewerten, einen um 0,23 niedrigeren Wert. Kinder, die an der Interessenförderung teilnehmen einen um 0,29 höheren Wert. Zum 2. Zeitpunkt liegt die LM um 0,05 unter dem 1. Messzeitpunkt In der Interaktion wirken der Zusammenhalt und 2. Messzeitpunkt als positive Interaktion.
9 Literatur BORTZ, J. & Döring, N. (2006): Forschungsmethoden und Evaluation. Heidelberg: Springer HELLER, K.A.; Perleth, C.& Hany, E.A. (1994): Hochbegabung ein lange Zeit vernachlässigtes Forschungsthema. Einsichten Forschung an der Ludwig-Maximilians-Universität München, 3, H. 1, S. 18-22 LANGER, W. (2009): Mehrebenenanalyse. Eine Einführung in Forschung und Praxis. Wiesbaden: Verlag für Sozialwissenschaften LUHMANN, N. (1999): Funktionen und Folgen formaler Organisationen. Berlin: Duncker & Humblot SCHWETZ, H. (2003): Die Klasse macht den Unterschied. Mehrebenenanalystische Untersuchungen der Effekte von Unterricht. Landau: Verlag Empirische Pädagogik
9 Literatur SCHWETZ H. & SWOBODA, B. (2010, Hrsg.): Einführung in die Mehrebenenanalyse mit MlwiN 2.16. Landau: Verlag Empirische Pädagogik WAGNER, G. (2012): Systemisches Begabungsmodell. Ein empirischer Ansatz ausgewählter Determinaten zur Begabungsentwicklung. In: news&science. H. 1, S. 32-35 WILKE, H. (2000): Systemtheorie I: Grundlagen. Stuttgart: Lucius & Lucius