PIRLS & TIMSS Die Kompetenzen in Lesen, Mathematik und Naturwissenschaft am Ende der Volksschule. Österreichischer Expertenbericht

Größe: px
Ab Seite anzeigen:

Download "PIRLS & TIMSS Die Kompetenzen in Lesen, Mathematik und Naturwissenschaft am Ende der Volksschule. Österreichischer Expertenbericht"

Transkript

1 PIRLS & TIMSS 2011 Die Kompetenzen in Lesen, Mathematik und Naturwissenschaft am Ende der Volksschule Österreichischer Expertenbericht Herausgegeben von Birgit Suchań, Christina Wallner-Paschon & Claudia Schreiner

2

3 Birgit Suchań, Christina Wallner-Paschon & Claudia Schreiner (Hrsg.) PIRLS & TIMSS 2011 Die Kompetenzen in Lesen, Mathematik und Naturwissenschaft am Ende der Volksschule Österreichischer Expertenbericht Leykam

4 Bundesministerium für Bildung und Frauen Minoritenplatz Wien Bundesinstitut für Bildungsforschung, Innovation & Entwicklung des österreichischen Schulwesens Alpenstraße Salzburg PIRLS & TIMSS Die Kompetenzen in Lesen, Mathematik und Naturwissenschaft am Ende der Volksschule. Österreichischer Expertenbericht. Birgit Suchań, Christina Wallner-Paschon & Claudia Schreiner (Hrsg.). Graz: Leykam ISBN Einbandgestaltung und Layout: Die Fliegenden Fische, Salzburg & Andreas Kamenik, BIFIE I Zentrales Management & Services Satz: Sandra Hechenberger, BIFIE I Zentrales Management & Services Druck: Steiermärkische Landesdruckerei GmbH, 8020 Graz Vertrieb an den Buchhandel: Leykam Buchverlagsgesellschaft m. b. H. Nfg. & Co. KG Kein Teil des Werks darf in irgendeiner Form (durch Fotografie, Mikrofilm oder ein anderes Verfahren) ohne schriftliche Genehmigung des Verlags reproduziert oder unter Verwendung elektronischer Systeme verarbeitet, vervielfältigt oder verbreitet werden.

5 Vorwort Die internationalen Studien PIRLS und TIMSS beleuchten systemische Zusammenhänge des Kompetenzerwerbs durch den Vergleich mit anderen Ländern. Die Möglichkeit des Systemvergleichs bietet dabei einen wichtigen Interpretationsrahmen für die Ergebnisse einzelner Länder und Bildungssysteme. PIRLS und TIMSS geben somit dem österreichischen Schulsystem regelmäßig Rückmeldung darüber, wie gut es gelingt, bis zum Ende der Volksschule wesentliche Grundkompetenzen in Lesen sowie Mathematik und Naturwissenschaft zu vermitteln und damit einen wesentlichen Baustein für erfolgreiche Bildungskarrieren zu legen. Im Zentrum steht, Orientierungswissen für die Bildungsplanung, -steuerung, die Aus- und Fortbildung der Lehrerinnen und Lehrer sowie für die Qualitätsentwicklung zu gewinnen. Die Ergebnisse aus PIRLS und TIMSS dienen nicht der Steuerung von Einzelschulen so wie das in Österreich die flächendeckenden Standardüberprüfungen mit Rückmeldungen für Schulen und Lehrer/innen intendieren. Sehr wohl können aber einzelne Erkenntnisse aus PIRLS und TIMSS auch für die konkrete pädagogische Arbeit am Schulstandort von Nutzen sein. Der vorliegende Band geht verschiedenen Fragestellungen im Zusammenhang mit der Lese-, Mathematik- und Naturwissenschaftskompetenz von Kindern im Volksschulalter nach. Die Basis für die Analysen bilden vorrangig die Daten aus PIRLS und TIMSS 2011, aber auch Daten aus früheren Erhebungen dieser Studien sowie der OECD-Studie PISA. Abschnitt I widmet sich den Kompetenzen selbst im internationalen Vergleich sowie im Längsschnitt, mit einem fokussierten Blick auf besonders leistungsstarke und besonders leistungsschwache Kinder, durch die Analyse der Schwierigkeit der einzelnen verwendeten Leseaufgaben für österreichische Kinder, aus der Perspektive der Geschlechtergerechtigkeit sowie durch eine spezifische methodische Fragestellung im Zusammenhang mit fehlenden Antworten im Test. Abschnitt II lenkt die Aufmerksamkeit auf außerschulische Rahmenbedingungen des Kompetenzerwerbs der Einfluss des Migrationshintergrunds auf die Schülerleistungen sowie verschiedene Faktoren familiärer Bedingungen und Unterstützung stehen hier im Mittelpunkt. Abschnitt III greift Themen des Unterrichts auf und zeigt, welche Rolle Hausaufgaben sowie Methoden der inneren Differenzierung im Unterricht der Volksschule spielen. Dieser Band ist vor allem das Ergebnis der Arbeit der Autorinnen und Autoren. Das Team der internationalen Studien am BIFIE unter der Leitung von Birgit Suchań und Christina Wallner- Paschon zeichnet nicht nur für die Durchführung von PIRLS und TIMSS in Österreich verantwortlich, sondern hat durch konzeptionelle, strukturelle und organisatorische Arbeiten über verschiedene Autorengruppen hinaus wesentlich zum Entstehen dieses Buchs beigetragen. Für ihren Beitrag zur Qualitätssicherung gilt unser Dank den externen Reviewern Johann Bacher, Ferdinand Eder und Josef Thonhauser. Layout, Satz und Lektorat oblag dem Medienmanagement des BIFIE unter der Leitung von Hannes Kaschnig. Ganz besonderer Dank gebührt den Schülerinnen und Schülern, ohne deren Bereitschaft und Engagement die Durchführung von PIRLS und TIMSS 2011 nicht möglich gewesen wäre. Salzburg, im Oktober 2015 Claudia Schreiner Direktorin des BIFIE

6

7 Inhalt 3 Vorwort 7 Einführung 13 I. Kompetenzen in Lesen, Mathematik & Naturwissenschaft Die Leistungen der Schüler/innen in Lesen, Mathematik & Naturwissenschaft Analysen auf Itemebene in Lesen Mathematik weiblich? Leistung, Selbstkonzept und Studienabschlüsse im Geschlechtervergleich Zu nichtignorierbaren Konsequenzen des (partiellen) Ignorierens fehlender Item Responses im Large-Scale-Assessment 65 II. Familiäre und vorschulische Unterstützung Migrationshintergrund und Lesekompetenz: Entwicklung seit dem Jahr Die Bedeutung von familiären, schulischen und individuellen Merkmalen für die Mathematikkompetenz Lernen von älteren oder Lernen durch jüngere Geschwister? Effekte der Geschwisterkonstellation auf schulische Kompetenzen 111 III. Unterricht in Lesen, Mathematik & Naturwissenschaft an Österreichs Volksschulen Hausaufgaben und deren Bedeutung für die Mathematik- und Leseleistung Innere Differenzierung im Mathematikunterricht 143 Anhang 145 Anhangstabellen 151 Autorenverzeichnis

8

9 Einführung 7 Einführung Birgit Suchań & Christina Wallner-Paschon Österreich beteiligte sich 2011 zum zweiten Mal an der internationalen Lesestudie PIRLS und zum dritten Mal an der internationalen Studie TIMSS zur Erfassung der Mathematik- und Naturwissenschaftskompetenz von Schülerinnen und Schülern auf der vierten Schulstufe. Dieses Kapitel bietet einen Überblick über wesentliche Aspekte bei der Durchführung von PIRLS und TIMSS. Neben einer Beschreibung der Ziele und der für die Studien verantwortlichen internationalen und nationalen Institutionen wird auf die Stichprobe, das Testdesign sowie auf wesentliche Aspekte bei der Interpretation der Ergebnisse eingegangen. Die Studien PIRLS (Progress in International Reading Literacy Study) und TIMSS (Trends in International Mathematics and Science Study) erfassen in regelmäßigen Abständen Schlüsselkompetenzen von Schülerinnen und Schülern der vierten Schulstufe 1 : PIRLS misst seit 2001 alle fünf Jahre die Lesekompetenz; TIMSS erhebt seit 1995 im Abstand von vier Jahren die Kenntnisse der Schüler/innen in Mathematik und Naturwissenschaft. Durch diesen unterschiedlichen Erhebungsrhythmus fielen PIRLS und TIMSS im Jahr 2011 erstmals zusammen. Die Teilnehmerländer hatten so die Möglichkeit, alle drei Kompetenzbereiche gemeinsam bei denselben Schülerinnen und Schülern zu erheben eine Gelegenheit, die sich erst wieder in 20 Jahren bieten wird. Initiator dieser beiden Studien ist die unabhängige Forschergemeinschaft IEA (International Association for the Evaluation of Educational Achievement), die 1958 gegründet wurde. Seit über 50 Jahren hat die IEA zahlreiche groß angelegte Vergleichsstudien im Bereich der Bildung durchgeführt, um den politischen Entscheidungsträgern internationale Bildungsindikatoren bereitzustellen. Damit können Stärken und Schwächen im Bildungssystem im internationalen Vergleich identifiziert werden. Ziele von PIRLS und TIMSS Internationale Studien wie PIRLS und TIMSS messen die Qualität von Bildungssystemen zu bestimmten Zeitpunkten der schulischen Ausbildung in Form ihres Ertrags (Outputs) und vergleichen diesen über alle Teilnehmerländer hinweg. Darüber hinaus wird eine Reihe an Hintergrundinformationen erhoben, die Hinweise auf mögliche Bedingungsfaktoren guter und schwacher Schulleistungen liefern. Daraus können faktenbasierte Maßnahmen für eine Qualitätsverbesserung im Bildungssystem abgeleitet werden. Folgende Indikatoren können mit PIRLS und TIMSS gewonnen werden: Basisindikatoren: Die Leistungsdaten aus PIRLS und TIMSS liefern Informationen über den Ist-Stand der Kompetenzen in Lesen, Mathematik und Naturwissenschaft am Ende der vierten Schulstufe. Kontextindikatoren: Mithilfe von Fragebögen für Schüler/innen, Eltern, Lehrkräfte, Schulleiter/innen sowie hinsichtlich des Lehrplans werden Kontextindikatoren erhoben, von denen angenommen wird, dass sie mit dem Lernen von Lesen, Mathematik und Naturwissenschaft in Zusammenhang stehen. Sie können wichtige Erklärungsbeiträge für unterschiedliche Schülerleistungen liefern. Trendindikatoren: Die regelmäßige Durchführung von PIRLS und TIMSS ermöglicht es, die Leistungen der Schüler/innen im Zeitverlauf zu beobachten und zu analysieren. Teilnehmerländer und Organisation von PIRLS & TIMSS 2011 Teilnehmerländer Abbildung 1.1 zeigt alle Teilnehmerländer von PIRLS & TIMSS 2011auf der 4. Schulstufe. An PIRLS haben sich insgesamt 45 Länder und acht Regionen 2 beteiligt; an TIMSS 50 Länder und sieben Regionen. Insgesamt 37 Länder und sechs Regionen haben die Gelegenheit des Zusammenfalls beider Studien genützt und die Kinder sowohl in Lesen als auch in Mathematik und Naturwissenschaft getestet. 1 TIMSS bietet die Möglichkeit, auch die Schüler/innen der 8. Schulstufe zu testen. Österreich hat sowohl 2007 als auch 2011 nur an der Erhebung auf der 4. Schulstufe teilgenommen. 2 Bei den Regionen handelt es sich um Regionen/Teile eines Landes, die sich unabhängig von einer landesweiten Teilnahme an PIRLS und/oder TIMSS beteiligen, um eigene Vergleichsdaten zu erhalten. International werden diese als Benchmarking Participants bezeichnet. Sie werden in der Ergebnisdarstellung des vorliegenden Berichts nicht berücksichtigt.

10 8 Einführung nur PIRLS Belgien (fr) BEL (fr)* Bulgarien BGR* Frankreich FRA* Indonesien IDN Israel ISR Kanada CAN Teilnehmende Länder PIRLS & TIMSS 2011 PIRLS & TIMSS Aserbaidschan AZE Norwegen NOR Australien AUS Oman OMN Dänemark DNK* Deutschland DEU* England GBR (E)* Finnland FIN* Österreich AUT* Polen POL* Portugal PRT* Rumänien ROU* nur TIMSS Armenien ARM Bahrain BHR Belgien (fl) BEL (fl)* Chile CHL Japan JPN Jemen YEM Kolumbien COL Georgien GEO Russland RUS Kasachstan KAZ Trinidad und Tobago TTO Hongkong HKG Saudi-Arabien SAU Korea KOR Iran IRN Schweden SWE* Kuwait KWT Irland IRL* Singapur SGP Serbien SRB Italien ITA* Slowakische Republik SVK* Thailand THA Katar QAT Slowenien SVN* Tunesien TUN Kroatien HRV Spanien ESP* Türkei TUR Litauen LTU* Taiwan TWN Malta MLT* Tschechische Republik CZE* Marokko MAR Ungarn HUN* Neuseeland NZL Niederlande NLD* Nordirland GBR (N)* Vereinigte Arabische Emirate ARE Vereinigte Staaten von Amerika USA Regionen (Benchmarking Participants) Andalusien ESP (AN)* Malta MLT (mt)* Abu Dhabi ARE (AD) Alberta CAN (AB) Florida USA (FL) Ontario CAN (ON) North Carolina USA (NC) Dubai ARE (DU) Quebec CAN (QC) ausgewählte Vergleichsländer sind fett hervorgehoben * Teilnehmerland ist Mitglied der Europäischen Union Abbildung 1.1: Teilnehmerländer 4. Schulstufe (PIRLS & TIMSS 2011)

11 Einführung 9 Die internationale Organisation Die IEA trägt als Initiatorin der beiden Studien die übergeordnete Projektverantwortung. Grundlegende Entscheidungen, die neben PIRLS und TIMSS auch alle anderen IEA-Studien betreffen, werden in der jährlich stattfindenden General Assembly (Generalversammlung) getroffen. Verantwortlich für die internationale Organisation und Koordination für PIRLS und TIMSS ist das International Study Center (ISC) am Boston College in den USA. Das ICS arbeitet dabei eng mit einem Konsortium zusammen, dem folgende Institutionen angehören: IEA-Sekretariat (Amsterdam): Überprüfung der Übersetzungen aller Testinstrumente der teilnehmenden Länder, Ausbildung der internationalen Qualitätsbeobachter/innen; IEA-Datenverarbeitungs- und Forschungszentrum (Hamburg): Verarbeitung und Prüfung der bei PIRLS und TIMSS erhobenen Daten; Statistics Canada (Ottawa, Ontario): Stichprobenziehung, Gewichtung; Educational Testing Service (Princeton, New Jersey): Unterstützung in messtheoretischen Belangen. Für die Entwicklung und Begutachtung der Testaufgaben sowie der Hintergrundfragebögen gibt es jeweils eine Expertengruppe bestand jede dieser Gruppen aus acht bis zwölf Expertinnen und Experten aus verschiedenen Teilnehmerländern. Somit wird eine breite wissenschaftliche Expertise bei der Erstellung der Erhebungsinstrumente sichergestellt. Für die nationale Umsetzung der Studien gibt es in jedem Land ein nationales Projektzentrum. Der National Research Coordinator (NRC) ist dabei für die Durchführung der Studie unter Einhaltung sämtlicher internationalen Richtlinien im eigenen Land verantwortlich. Die nationale Organisation In Österreich gehört die Durchführung internationaler Assessments zu den gesetzlichen Kernaufgaben des BI- FIE (Bundesinstitut für Bildungsforschung, Innovation & Entwicklung des österreichischen Schulwesens) unter der Leitung von Dr. in Claudia Schreiner (Direktorin). Umgesetzt werden diese im Department Bildungsstandards & Internationale Assessments in Salzburg unter der Leitung von Mag. a Simone Breit (Departmentleiterin). Aufgabe des BIFIE ist die wissenschaftliche Planung und praktische Umsetzung der Studien. In Zusammenarbeit mit dem ISC wurde am BIFIE das Untersuchungsdesign an die nationalen Gegebenheiten angepasst, die Aufgaben und Frage - bögen wurden mitentwickelt, übersetzt und an österreichische Besonderheiten adaptiert. Darüber hinaus hat das BIFIE die Erhebungen an den Schulen durchgeführt, erfasst die Daten elek tronisch und analysiert sie für den Ergebnisbericht. Population und Stichprobe Die Definition der Stichprobe erfolgt bei PIRLS und TIMSS über die Schulstufe: Zur Grundgesamtheit zählen alle Schüler/innen jener Schulstufe, die dem 4. Schuljahr entspricht 3. Das Durchschnittsalter muss zum Testzeitpunkt mindestens bei 9,5 Jahren liegen. In Österreich sowie in den meisten Teilnehmerländern finden die Tests somit am Ende der 4. Schulstufe (4. Klasse Volksschule) statt. Die Ziehung der Stichprobe erfolgte in zwei Schritten. Zunächst wurden in jedem Land aus allen Schulen mit Schülerinnen und Schülern der 4. Schulstufe die Testschulen zufällig ausgewählt. Um dabei eine standardisierte Vorgehensweise zu gewährleisten, wurde dieser Schritt für alle Länder von Statistics Canada durchgeführt. Im zweiten Schritt wurde am jeweiligen nationalen Zentrum an diesen Schulen mindestens eine Klasse der 4. Schulstufe ebenfalls zufällig ausgewählt. Den Ländern stand es frei, jeweils mehr als eine Klasse pro Schule für die Stichprobe zu ziehen. Alle Schüler/innen der somit festgelegten Klassen waren Teil der PIRLS- und TIMSS-Stichprobe. Sowohl auf Schul- als auch auf Schülerebene war es nach international definierten Kriterien möglich, Viertklässler/ innen vom Test auszuschließen die Ausschlüsse durften in Summe allerdings nicht mehr als 5 % der Population ausmachen. In Österreich wurden auf Schulebene Sonderschulen sowie Schulen mit weniger als drei Schülerinnen und Schülern der 4. Schulstufe im Vorfeld (vor dem ersten Schritt der Stichprobenziehung) ausgeschlossen. Auf Schülerebene wurden (nach der Ziehung der Klassenstichprobe) folgende Schüler/innen ausgeschlossen: Schüler/innen mit einer anhaltenden körperlichen Beeinträchtigung (0,2 % aller ausgewählten Schüler/innen in Österreich), Schüler/innen mit einer anhaltenden geistigen Beeinträchtigung (2,6 %) und Schüler/innen mit einer anderen Muttersprache, wenn gleichzeitig die Testsprache noch nicht ausreichend beherrscht wird (0,7 %). 3 Das erste Schuljahr wird dabei über den ISCED-Level 1 definiert. ISCED ist eine internationale Standardklassifikation der Bildung, die von der UNESCO entwickelt wurde (Details dazu unter: ISCED-Level 1 ist jener Zeitpunkt in der Schullaufbahn, zu dem das systematische Lernen von Lesen, Schreiben und Mathematik sowie der Erwerb eines Basiswissens in anderen Bereichen beginnen.

12 10 Einführung Die Entscheidung darüber hat in Österreich die Klassenlehrerin/der Klassenlehrer in Absprache mit der für die Testdurchführung zuständigen Person getroffen und betraf 3,5 % aller ausgewählten Schüler/innen. Weitere 25 Kinder (0,5 %) hatten die Schule zwischen der Erstellung der Schülerlisten und dem Testzeitpunkt verlassen. Die österreichische Stichprobe für PIRLS & TIMSS 2011 besteht aus 158 Schulen, 276 Klassen und 4670 bzw Schülerinnen und Schülern. Mit einer Teilnahmequote von 100 % sowohl auf Schul- als auch auf Klassenebene und 97,8 % (PIRLS) bzw. 97,7 % (TIMSS) auf Schülerebene konnte Österreich die international geforderten Teilnahmequoten (85 % auf Schul- und Schülerebene, 95 % auf Klassenebene) deutlich übertreffen. Ablauf der Tests und Testinstrumente Der PIRLS-Test PIRLS misst die Leseleistung der Viertklässler/innen differenziert für unterschiedliche (1) Leseabsichten und (2) Verstehensprozesse, die beim Lösen der Aufgabenstellung erforderlich sind. Darüber hinaus werden (3) das Leseverhalten und die Einstellungen zum Lesen erfasst. Mithilfe von literarischen Texten und Informationstexten werden beim PIRLS-Test zwei unterschiedliche Leseabsichten generiert: Lesen, um literarische Erfahrung zu machen, und andererseits Lesen, um Informationen zu gewinnen. Die Lesekompetenzen der Schüler/innen können nach diesen beiden Subskalen getrennt analysiert werden. Die Verstehensprozesse (kognitive Prozesse, die beim Lösen einer Aufgabe notwendig sind) werden durch unterschiedliche Aufgabentypen zu den Texten hervorgerufen. Es gibt (1) Aufgaben, bei denen die Schüler/innen explizit angegebene Informationen Erkennen und Wiedergeben müssen, (2) Aufgaben, die ein Ziehen von einfachen Schlussfolgerungen verlangen, (3) Aufgaben, bei denen ein Interpretieren sowie Verknüpfen von Gedanken und Informationen notwendig sind, um zur richtigen Lösung zu kommen und (4) Aufgaben, bei denen Inhalt, Sprache und einzelne Textelemente untersucht und bewertet werden müssen. Für eine Analyse der Lesekompetenz hinsichtlich der Verstehensprozesse werden jeweils zwei der eben genannten Anforderungen zu Subskalen zusammengefasst: Wiedergeben und Schlussfolgern sowie Interpretieren und Bewerten. Der dritte Aspekt das Leseverhalten und die Einstellungen zum Lesen wird mit den Hintergrundfragen im Schülerfragebogen erhoben. Die Messung der Lesekompetenz erfolgt mit einem Papierund-Bleistift-Test. Insgesamt gibt es zehn Texte (fünf Informationstexte und fünf literarische Texte) mit daran anschließenden Aufgaben. Die Texte wurden zu 13 verschiedenen Testheften kombiniert, wobei jedes Testheft aus 2 Texten besteht. Für die Bearbeitung des Testshefts hatten die Schüler/innen insgesamt 80 Minuten Zeit. Im Anschluss daran beantworteten sie den Schülerfragebogen. Dieser umfasst neben demographischen Informationen auch Fragen zum familiären Hintergrund, zu den Lesegewohnheiten außerhalb der Schule und zum Lesen in der Schule. Auch die Eltern sowie die Lehrkräfte der beteiligten Schüler/innen wurden gebeten, einen Fragebogen zu beantworten. Auf Schulebene wurden von den Schulleiterinnen und Schulleitern Informationen zu Schulressourcen, Schulklima etc. erhoben. Der Fragebogen zum Lehrplan in den Teilnehmerländern ergänzt die Informationen auf Schul- und Klassenebene und fokussiert auf die national festgelegten Rahmenbedingungen des Leseunterrichts an den Schulen. Der TIMSS-Test Um ein möglichst detailliertes Bild von den Kompetenzen der Schüler/innen zu erhalten, werden die Domänen Mathematik und Naturwissenschaft in jeweils drei inhaltliche und drei kognitive Bereiche (Subskalen) unterteilt. Die kognitiven Bereiche sind für beide Domänen ident und erfassen (1) das Wissen über mathematische bzw. naturwissenschaftliche Fakten, Konzepte und Prozesse, (2) das Anwenden ihres Wissens in unterschiedlichen Situationen und (3) das Begründen von Schlussfolgerungen und Lösungen bzw. von Experimenten. Bei den Inhaltsbereichen in Mathematik wird unterschieden zwischen (1) Zahlen, (2) geometrische Formen und Maße sowie (3) Darstellen von Daten. In Naturwissenschaft werden die Themen (1) Biologie, (2) Physik und (3) Erdkunde abgedeckt. Auch bei TIMSS wird ein Papier-und-Bleistift-Test eingesetzt, um die Kompetenzen der Schüler/innen zu erfassen. Insgesamt gab es 14 verschiedene Testheftformen. Jedes Testheft bestand aus insgesamt zwei Aufgabenblöcken im Bereich Mathematik und zwei Aufgabenblöcken im Bereich Naturwissenschaft. Für die Bearbeitung aller Aufgaben in einem Testheft hatten die Schüler/innen insgesamt 72 Minuten Zeit. Darüber hinaus wurden wie bei PIRLS Fragebögen auf folgenden Ebenen eingesetzt: Schüler/innen, Eltern, Lehrkräfte, Schulleitung sowie ein Lehrplanfragebogen. Zur Interpretation der Ergebnisse Die vorliegende Publikation fokussiert auf die österreichischen Ergebnisse. Da bei PIRLS & TIMSS, wie bei Large-Scale-Assessments üblich, nicht alle Schüler/innen der 4. Schulstufe eines Landes getestet wurden, sondern eine Stichprobe, muss bei der Interpretation der Daten Folgendes beachtet werden:

13 Einführung 11 Die aus den Daten resultierenden statistischen Kennzahlen (z. B. Mittelwerte) sind Punktschätzungen der tatsächlichen Populationswerte. Sie sind aufgrund der Testung einer Stichprobe mit einem gewissen statistischen Messfehler dem Standardfehler (SE) behaftet. Dieser wird unter anderem dafür verwendet, einen Werte bereich (Konfidenzintervall) zu berechnen, innerhalb dessen sich der tatsächliche Populationsmittelwert mit einer bestimmten Wahrscheinlichkeit befindet. Für die vorliegende Publikation wurde diese Wahrscheinlichkeit mit 95 %, (d. h. p <.05) festgelegt 4. Das heißt, die Werte der Population liegen mit 95-prozentiger Wahrscheinlichkeit innerhalb der berichteten Konfidenzintervalle. Der Standardfehler (statistischer Messfehler) spielt auch bei statistischen Tests eine Rolle, etwa wenn man die Ergebnisse zweier Gruppen miteinander vergleicht (z. B. Mädchen und Buben). Alle Signifikanzprüfungen in dieser Publikation erfolgen, falls nicht explizit anders vermerkt, zweiseitig auf dem 5 %-Niveau. Da es sich bei PIRLS & TIMSS um sehr große, präzise Stichproben handelt, können teilweise auch sehr kleine Unterschiede (etwa zwischen Mädchen und Buben) statistisch nachgewiesen werden. Diese existieren mit großer Wahrscheinlichkeit in der betreffenden Population, sind aber manchmal so klein, dass sie in praktischer Hinsicht nicht relevant sind. Einige Ergebnisdarstellungen beinhalten deshalb Angaben zur Effektstärke eines Unterschieds. 5 Damit wird zusätzlich zur statistischen Signifikanz auch die Größenordnung von gefundenen Unterschieden quantifiziert. Eine grobe Faustregel für die Einschätzung der Größenordnung sind die Richtwerte nach Cohen (1988), nach denen Effektstärken ab 0.2 als kleine, ab 0.5 als mittlere und ab 0.8 als große Unterschiede eingestuft werden. Demnach kann ab einer Effektstärke von 0.2 (d. h., der Unterschied macht 20 % der Standardabweichung aus) zusätzlich zu einer statistischen Signifikanz auch von einer praktischen Relevanz ausgegangen werden. Darüber hinaus wird darauf hingewiesen, dass es sich bei den angegebenen Kennwerten (Mittelwerte, Standardfehler, Prozentangaben etc.) um gerundete Werte handelt. Die Werte (inkl. jener in Tabellen und Abbildungen) werden zuerst unter Berücksichtigung entsprechender Nachkommastellen berechnet und dann kaufmännisch gerundet. Es kann daher vorkommen, dass beispielsweise die Summe von gerundeten Prozentangaben nicht exakt 100 ergibt oder Summen und Differenzen von Werten geringfügig inkonsistent erscheinen. Folgende Berichte zu PIRLS & TIMSS 2011 wurden bereits publiziert: B. Suchań & C. Schreiner (2012). PIRLS & TIMSS Schülerleistungen in Lesen, Mathematik und Naturwissenschaft in der Grundschule. Technischer Bericht. Verfügbar unter: B. Suchań, C. Wallner-Paschon, S. Bergmüller & C. Schreiner (2012). PIRLS & TIMSS Schülerleistungen in Lesen, Mathematik und Naturwissenschaft in der Grundschule. Die Studie im Überblick. Graz: Leykam. B. Suchań, C. Wallner-Paschon, S. Bergmüller & C. Schreiner (2012). PIRLS & TIMSS Schülerleistungen in Lesen, Mathematik und Naturwissenschaft in der Grundschule. Die ersten Ergebnisse. Graz: Leykam. Martin, M. O. & Mullis, I. V. S. (Eds.). (2013). TIMSS and PIRLS 2011: Relationships Among Reading, Mathematics, and Science Achievement at the Fourth Grade Implications for Early Learning. Chestnut Hill, MA: TIMSS & PIRLS International Study Center, Boston College. Mullis, I. V. S., Martin, M. O., Foy, P. & Drucker, K. T. (2012). The PIRLS 2011 International Results in Reading. Chestnut Hill, MA: TIMSS & PIRLS International Study Center, Boston College. Literatur Cohen, J. (1988). Statistical power analysis for the behavioral sciences. Hillsdale, NJ: Erlbaum 4 Das Konfidenzintervall errechnet sich damit aus dem Wert der Punktschätzung (z. B. Mittelwert) ±1,96 x SE. 5 Das hier verwendete Effektstärkemaß für Mittelwertunterschiede (Cohens d) wird nach folgender Formel berechnet:

14

15 I. Kompetenzen in Lesen, Mathematik & Naturwissenschaft

16

17 Die Leistungen der Schüler/innen in Lesen, Mathematik & Naturwissenschaft Die Leistungen der Schüler/innen in Lesen, Mathematik & Naturwissenschaft Birgit Suchań Dieser Abschnitt gibt einen Überblick über das Abschneiden der österreichischen Schüler/innen bei PIRLS & TIMSS 2011 im europäischen Vergleich. Dabei werden wesentliche Ergebnisse aus dem ersten nationalen Ergebnisbericht (Suchań, Wallner-Paschon, Bergmüller & Schreiner, 2012) zusammenfassend dargestellt und durch österreichspezifische Analysen ergänzt. Zunächst erfolgt eine Darstellung der Mittelwerte und Streuungen in den drei Kompetenzbereichen Lesen, Mathematik und Naturwissenschaft. Neben dem aktuellen Abschneiden der Schüler/innen wird darüber hinaus die Leistungsentwicklung seit dem Jahr 2001 (PIRLS) bzw. seit 1995 (TIMSS) analysiert. Weiters widmet sich dieser Abschnitt einer Charakterisierung der leistungsstarken und -schwachen Schüler/innen nach den Merkmalen Geschlecht, Migrationshintergrund und Bildung der Eltern sowie einer zusammenfassenden Darstellung der Geschlechterdifferenzen in allen Leistungsbereichen. Mit Ausnahme der Trendanalysen beschränken sich die Ländervergleiche in diesem Abschnitt auf die jeweils teilnehmenden EU-Länder 1. Mittelwerte und Streuungen in den drei Kompetenzbereichen Wie gut können Österreichs Viertklässler/innen im Vergleich zu jenen aus den teilnehmenden EU-Ländern sinnerfassend lesen? Wie hoch sind ihre mathematischen Fähigkeiten im EU-Vergleich und sind ihre Kenntnisse bei naturwissenschaftlichen Themen besser als jene der Kinder anderer Länder? Um diese Fragen zu beantworten, wird zunächst ein Überblick über das durchschnittliche Leistungsniveau gegeben. Die Abbildungen bis zeigen für die teilnehmenden EU-Länder den Mittelwert und das dazugehörige 95 %ige Konfidenzintervall (in Orange) sowie die Streuung der Leistung in Form von Perzentilen (5., 25., 75. und 95.). Die Länder sind dabei absteigend nach dem Durchschnittswert gereiht. Hellblau hinterlegt sind jene Länder, in denen sich der Mittelwert nicht signifikant vom Österreich-Schnitt unterscheidet. Um zu überprüfen, ob die Unterschiede, die auch wenn sie sehr gering sind aufgrund der großen und präzisen Stichproben statistisch nachgewiesen werden können, auch in praktischer Hinsicht relevant sind, wurde für alle Ländervergleiche mit Österreich die Effektstärke 2 berechnet. Die Effektstärken sind in Form von Sternsymbolen in den Abbildungen bis eingetragen. Die exakten Werte zu diesen Abbildungen befinden sich in den Anhangstabellen A.1 bis A.3. Lesen Im Durchschnitt erreichen die 23 teilnehmenden EU- Länder bei PIRLS einen Mittelwert von 534 Punkten (s. Abbildung 1.1.1). Finnland liegt an der Spitze. Die finnischen Schüler/innen übertreffen mit 568 Punkten die Leseleistung eines jeden anderen EU-Teilnehmerlands. Nordirland folgt mit einem Mittelwert von 558 Punkten und ist ebenfalls signifikant besser als alle dahinter gereihten Länder. Danach folgen zwei nordeuropäische Länder und England, wo die Kinder eine etwa gleich hohe Lesekompetenz aufweisen: Dänemark (554), Irland (552) und England (552). Die Kinder in Österreich erzielen 529 Punkte auf der Lese-Gesamtskala. Mit diesem Wert liegen sie knapp, aber dennoch statistisch signifikant unter dem EU-Mittel und 39 Punkte hinter Finnland. Neben Finnland übertreffen weitere 11 EU-Länder (darunter auch Deutschland) den Österreich-Schnitt. In sieben dieser 11 Länder ist diese höhere Lesekompetenz nicht nur statistisch gegeben, sondern auch von praktischer Relevanz. So beträgt die Effektstärke für den Vergleich von Finnland und Österreich 0.61, was als mittlerer Effekt eingestuft werden kann. Die Effektstärken für Nordirland bis zur Tschechischen Republik betragen zwischen 0.42 und Von Schweden bis Ungarn sind die Differenzen hinsichtlich der Lesekompetenz praktisch nicht relevant. Vergleichbare Lesekompetenzen mit Österreich haben die Schüler/innen der Slowakischen Republik (535), Bulgariens (532), Sloweniens (530), Litauens (528) sowie Polens (526) gemeinsam mit Österreich befinden sie sich in der unteren Hälfte der Länderreihung. Fünf Länder liegen deutlich hinter Österreich, wobei die Schüler/innen aus Malta mit 477 Punkten die niedrigste Lesekompetenz unter den hier dargestellten Ländern aufweisen. Mit Ausnahme von Frankreich sind die Effektstärken dieser Länder ebenfalls so hoch ausgeprägt, dass man auch von einer praktischen Bedeutsamkeit der 1 Es sei an dieser Stelle darauf hingewiesen, dass die europäischen Teilnehmerländer von PIRLS 2011 und jene von TIMSS 2011 nicht völlig ident sind. Die Darstellungen und Analysen von PIRLS beruhen auf 23 teilnehmenden EU-Ländern; jene von TIMSS auf 21. Insgesamt beteiligten sich 20 Mitgliedsstaaten der EU sowohl an PIRLS als auch an TIMSS. 2 Details zur Berechnung der Effektstärke finden sich im Einführungskapitel.

18 16 Die Leistungen der Schüler/innen in Lesen, Mathematik & Naturwissenschaft Leistungsunterschiede sprechen kann. Sie reichen bei diesen Vergleichen von 0.63 in Malta bis hin zu 0.24 in Spanien. Die gesamte Balkenlänge in Abbildung zeigt den Abstand zwischen den Schülerinnen und Schülern mit den höchsten bzw. mit den niedrigsten Leseleistungen exklusive der obersten bzw. der untersten 5 % der Schüler/innen. Zwischen den Leserinnen und Lesern in Österreich mit den höchsten Mittelwerten und jenen mit den geringsten Leistungen liegen 209 Punkte: Die erfolgreichsten Kinder (exkl. der besten 5 %) erreichen bis zu 626 Punkte (95. Perzentil); umgekehrt liegen die Werte der leseschwächeren Kinder bei 418 Punkten (5. Perzentil). Im Ländervergleich ist dieser Abstand relativ gering ausgeprägt. Nur in den Niederlanden und in der Tschechischen Republik (beides Länder mit einem signifikant höheren Mittelwert als in Österreich) sind die Schülerleistungen noch homogener. Die Differenz zwischen dem 5. und dem 95. Perzentil beträgt in diesen Ländern 178 bzw. 205 Punkte. In Finnland liegen so wie in Österreich 209 Punkte zwischen den besten und den schwächsten Schülerinnen und Schülern allerdings auf einem deutlich höheren Leistungsniveau. Im Vergleich dazu sind Rumänien und Malta nicht nur jene Länder mit den niedrigsten Mittelwerten, hier zeigen sich auch die größten Leistungsstreuungen, die jene von Österreich und Finnland um etwa 100 Punkte übertreffen (298 bzw. 317 Punkte Differenz zwischen 5. und 95. Perzentil). Mathematik In Mathematik beträgt der Mittelwert der 21 beteiligten EU-Länder 519 Punkte. Die höchste Mathematikkompetenz unter den in Abbildung dargestellten Ländern haben die Schüler/innen aus Nordirland. Sie liegen mit einem Mittelwert von 562 Punkten deutlich über dem EU- Schnitt und übertreffen alle anderen EU-Teilnehmerländer signifikant. Der flämischsprachige Teil Belgiens, Finnland sowie England folgen; sie unterscheiden sich im Leistungsniveau mit Durchschnittswerten von 549, 545 und 542 Punkten kaum voneinander. Ähnlich wie in Lesen befindet sich Österreich auch hinsichtlich der Mathematikkompetenz in der unteren Hälfte der 21 teilnehmenden EU-Länder und signifikant unter dem EU-Durchschnittswert. Mit 508 Punkten liegen die heimischen Schüler/innen 54 Punkte hinter den Kindern aus Nordirland dem bestgereihten EU-Teilnehmerland. In insgesamt 10 EU-Ländern ist die durchschnittliche Mathematikkompetenz deutlich höher als in Österreich. In all diesen Ländern ist die Leistungsdifferenz zu Öster - reich nicht nur statistisch signifikant, sondern auch von praktischer Bedeutung (Effektstärken zwischen 0.72 in Nordirland und 0.27 in Irland). In sechs weiteren Ländern zeigen sich keine signifikanten Leistungsunterschiede zu Österreich (Ungarn, Slowenien, Tschechische Republik, Italien, Slowakische Republik und Schweden). Die Schüler/ innen aus Malta, Spanien, Rumänien und Polen schneiden Lesekompetenz: Mittelwerte und Streuung (EU-Länder) hoch 700 EU-Mittel 600 Lesekompetenz niedrig FIN** GBR (N)* DNK* IRL* NLD* CZE* Perzentile (%) 5. Mittelwert } GBR (E)* Konfidenzintervall (+/ 1.96 SE) SWE ITA DEU PRT sig. besser als AUT HUN SVK BGR SVN AUT LTU POL kein sig. Unterschied zu AUT FRA ESP* BEL (fr)* ROU* MLT** sig. schlechter als AUT *... Effektstärke > 0.2 **... Effektstärke > 0.5 Teilnehmerländer absteigend nach dem Mittelwert auf der Lese-Gesamtskala gereiht Abbildung 1.1.1: Lesekompetenz im EU-Vergleich (PIRLS 2011)

19 Die Leistungen der Schüler/innen in Lesen, Mathematik & Naturwissenschaft 17 hingegen signifikant schlechter ab und mit Ausnahme von Malta weisen die Effektstärken (0.40 bis 0.30) auch hier auf praktisch bedeutsame Unterschiede hin. Der Leistungsabstand zwischen dem erst- und dem letztgereihten EU-Land (Nordirland und Polen) beträgt 81 Punkte. Bezieht man in diese Analyse neben dem Leistungsniveau auch die Streuung der Schülerwerte innerhalb der Länder mit ein, so fällt auf, dass die Mathematikkompetenzen in Nordirland im europäischen Vergleich zwar sehr hoch ausgeprägt, allerdings auch sehr heterogen sind: Während die Höchstleistungen (exklusive der besten 5 %) bei 693 Punkten liegen, erreichen die leistungsschwächsten Kinder (exklusive der schwächsten 5 %) 411 Punkte. Ähnlich sieht es in England aus: ein relativ hoher Mittelwert bei einer Bandbreite von 292 Punkten zwischen dem 5. und dem 95. Perzentil. Österreich fällt nicht nur in Lesen, sondern auch in Mathematik mit relativ homogenen Leistungen auf: 204 Punkte liegen zwischen den besten (606 Punkte) und schwächsten Kindern (401 Punkte). Lediglich in den Niederlanden und im flämischsprachigen Teil Belgiens ist diese Differenz geringer (174 bzw. 195 Punkte). Dass die Viertklässler/innen aus Nordirland deutlich besser sind als die österreichischen, lässt sich neben der Mittelwertdifferenz auch daran erkennen, dass das 75. Perzentil für Nordirland (622) höher ist als das 95. für Österreich (606). Das bedeutet, dass jener Leistungswert, den in Österreich nur mehr jedes 20. Kind erreicht bzw. überschreitet (ab 606 Punkte aufwärts), in Nordirland von zumindest jedem 4. Kind erzielt wird. Naturwissenschaft Im Kompetenzbereich Naturwissenschaft (s. Abbildung 1.1.3) schneiden wie bereits in Lesen die finnischen Schüler/innen (570) deutlich besser als die Kinder aller anderen EU-Teilnehmerländer ab. Sie liegen damit auch über dem Durchschnittswert der 21 beteiligten EU-Länder von 521 Punkten. Unmittelbar hinter Finnland folgt eine Gruppe von zehn Ländern (von der Tschechischen Republik bis einschließlich Italien), deren Mittelwerte alle auf sehr ähnlichem Niveau sind. Zu diesen Ländern zählen auch Österreich (532) und Deutschland (528). Weitere zehn Länder schneiden deutlich schlechter als diese Gruppe ab, wobei wiederum Malta das letztgereihte Land ist (446). Die österreichischen Schüler/innen erreichen im Schnitt um 39 Punkte weniger als die finnischen; dieser Unterschied ist mit einer Effektstärke von 0.56 auch in praktischer Hinsicht bedeutsam. Anders als in Lesen und Mathematik ist der österreichische Mittelwert in Naturwissenschaft signifikant über dem EU-Schnitt. Die Naturwissenschaftsleistungen der österreichischen Kinder sind nicht so homogen wie in Mathematik: 231 Punkte liegen zwischen dem 5. und dem 95. Perzentil, wobei die Schwächsten bis zu 408 und die Besten über 640 Punkte erreichen. Vor allem im unteren Leistungsbereich streuen die Werte in Naturwissenschaft stärker als in Mathematik. Deutlich einheitlicher sind die Kompetenzen der Schüler/ innen in den Niederlanden (bei gleichem Leistungsniveau wie in Österreich beträgt der Abstand 174 Punkte), im Mathematikkompetenz: Mittelwerte und Streuung (EU-Länder) hoch 700 EU-Mittel 600 Mathematikkompetenz niedrig GBR (N)** BEL (fl)** FIN** GBR (E)* sig. besser als AUT NLD** DNK* LTU* PRT* DEU* IRL* Perzentile (%) 5. Mittelwert } Konfidenzintervall (+/ 1.96 SE) HUN SVN CZE AUT ITA SVK kein sig. Unterschied zu AUT SWE MLT ROU* POL* ESP* sig. schlechter als AUT Teilnehmerländer absteigend nach dem Mittelwert auf der Mathematik-Gesamtskala gereiht *... Effektstärke > 0.2 **... Effektstärke > 0.5 Abbildung 1.1.2: Mathematikkompetenz im EU-Vergleich (TIMSS 2011)

20 18 Die Leistungen der Schüler/innen in Lesen, Mathematik & Naturwissenschaft Naturwissenschaftskompetenz: Mittelwerte und Streuung (EU-Länder) hoch 700 EU-Mittel Naturwissenschaftskompetenz niedrig FIN** CZE HUN SWE SVK AUT Perzentile (%) 5. Mittelwert } Konfidenzintervall (+/ 1.96 SE) NLD GBR (E) DNK DEU ITA kein sig. Unterschied zu AUT PRT SVN GBR (N)* IRL* LTU* BEL (fl)* ROU* ESP* sig. schlechter als AUT POL* MLT** Teilnehmerländer absteigend nach dem Mittelwert auf der Naturwissenschafts-Gesamtskala gereiht *... Effektstärke > 0.2 **... Effektstärke > 0.5 Abbildung 1.1.3: Naturwissenschaftskompetenz im EU-Vergleich (TIMSS 2011) flämischsprachigen Teil Belgiens (189 Punkte; allerdings auf einem signifikant niedrigeren Leistungsniveau als in Österreich) und im führenden Land Finnland (217 Punkte Differenz zwischen 5. und 95. Perzentil). Erklärung der Leistungsvarianz auf Individual-, Schul- und Klassenebene Die oben dargestellten Leistungsunterschiede innerhalb der Länder können durch individuelle Voraussetzungen der Schüler/innen, aber auch durch Einflüsse auf Klassen- bzw. Schulebene entstehen. Mithilfe eines Mehrebenenmodells wurde für Österreich der Anteil dieser drei Ebenen (Schüler/ innen, Klasse und Schule) an der gesamten Leistungsvarianz in Lesen, Mathematik und Naturwissenschaft analysiert. Tabelle zeigt, dass der Großteil der Leistungsvarianz in Lesen (87 %) auf individuelle Merkmale der Kinder zurückzuführen ist. Weitere 5 % lassen sich durch Unterschiede zwischen den Klassen jeweils innerhalb einer Schule und 8 % durch Unterschiede zwischen den Schulen erklären. In Mathematik ist der Anteil, der durch individuelle Unterschiede zwischen den Schülerinnen und Schülern erklärt wird, mit 83 % etwas geringer. Die restliche Varianz verteilt sich zu 7 % auf Klassenebene und zu 11 % auf Schul - ebene. Ein ähnliches Bild zeigt sich in Naturwissenschaft. 84 % der Leistungsunterschiede zwischen den Schülerinnen und Schülern werden durch individuelle Merkmale erklärt, weitere 6 % kommen durch die Klassenzugehörigkeit hinzu und 10 % durch die Schulzugehörigkeit. In allen drei Bereichen lässt sich somit der Großteil der Leistungsvarianz in Österreich durch individuelle Merkmale der Viertklässler/innen erklären. Der Anteil der Klassenund Schulebene ist vergleichsweise geringer ausgeprägt. Dies ist allerdings kein österreichspezifisches Ergebnis. In jenen EU-Ländern, in denen eine derartige Analyse der Varianzkomponenten möglich ist (weil zumindest zwei Klassen pro Schule getestet wurden) 3, liegt der Anteil auf Individualebene bei einem Großteil dieser Länder ebenfalls bei 80 % bzw. darüber. Im führenden EU-Land Finnland können beispielsweise zwischen 89 % (Naturwissenschaft und Mathematik) bzw. 90 % (Lesen) der Varianz auf individuelle Schülermerkmale zurückgeführt werden. 4 Dieser Befund, dass der Großteil der Leistungsunterschiede in einem Land durch individuelle Voraussetzungen der Schüler/innen erklärt werden kann, deckt sich auch mit einem Befund von Marzano (2000; zitiert nach Lipowski, 2006) aus einer Metaanalyse: Diese zeigt, dass 80 % der Unterschiede mit den individuellen Merkmalen der Lernenden erklärt werden können; auf die Klassenzugehörigkeit ent fallen 13 % und auf die Schulzugehörigkeit 7 % der Varianz. 3 In Lesen ist dies für 12 der teilnehmenden EU-Länder möglich und in Mathematik und Naturwissenschaft für 10 Länder. 4 Ein derartiger Vergleich der Varianzanteile mit Deutschland ist nicht möglich, da in Deutschland pro Schule nur eine Klasse getestet wurde und somit keine Varianz auf Klassenebene berechnet werden kann.

21 Die Leistungen der Schüler/innen in Lesen, Mathematik & Naturwissenschaft 19 Es gibt unter den EU-Ländern bei PIRLS & TIMSS 2011 allerdings auch welche, in denen der Schüleranteil geringer ausfällt. So weicht beispielsweise Bulgarien in Lesen am stärksten von diesen Zahlen ab: Mit 63 % ist die Varianzerklärung auf Schülerebene unter den EU-Vergleichsländern am geringsten; 30 % entfallen hingegen auf die Schulebene und 7 % auf die Klassenebene. In Mathematik und Naturwissenschaft ist der Anteil auf Schülerebene mit 69 bzw. 67 % in Ungarn vergleichsweise gering (jeweils ein Viertel der Leistungsschwankungen kann in Ungarn auf Schulebene und rund 7 % auf Klassenebene erklärt werden). Ein derartiger Ländervergleich im Hinblick auf die Varianzkomponenten sollte allerdings mit Vorsicht interpretiert werden, da in den Ländern die Einheit Schule bzw. Klasse unterschiedlich definiert wird und somit möglicherweise nicht vergleichbar ist (siehe dazu OECD, 2009, S. 221 f.). Ebene Leistungsvarianz in Österreich (Lesen, Mathematik und Naturwissenschaft) auf Schüler-, Klassen- und Schulebene Kompetenzbereich Lesen Mathematik Naturwissenschaft Schüler 87,0 % 82,5 % 84,2 % Klasse 5,2 % 6,8 % 5,9 % Schule 7,8 % 10,7 % 9,9 % Tabelle 1.1.1: Verteilung der Leistungsvarianz auf Individual-, Klassen- und Schulebene in Österreich (PIRLS und TIMSS 2011) Leistungstrend in den drei Kompetenzbereichen Nachdem 2011 PIRLS bereits zum dritten Mal stattgefunden hat und TIMSS zum fünften Mal, ist es möglich, die Veränderung der Schülerleistungen über die Jahre hinweg zu analysieren. Abbildung zeigt für Österreich und drei weitere Länder die Kompetenzen der Viertklässler/ innen im Zeitverlauf sowohl für alle Kinder gemeinsam (graue Linie) als auch getrennt nach Geschlecht (rote Linie für Mädchen, blaue Linie für Buben). Neben Deutschland als gleichsprachigem Nachbarland Österreichs wurden auch Slowenien und Singapur für diese Darstellung ausgewählt: In Slowenien haben sich unter den EU-Ländern die Leistungen der Schüler/innen in allen drei Kompetenzbereichen deutlich verbessert. Singapur wurde gewählt, um zu zeigen, wie sich die Leistungen in einem Land entwickeln, das in allen drei Bereichen zu den führenden Nationen zählt. Für PIRLS umfasst die Abbildung alle drei Erhebungsjahre seit Beginn der Studie (da sich mit Ausnahme von Österreich die dargestellten Länder seit 2001 an PIRLS beteiligen); für TIMSS sind nur die Zeitpunkte mit österreichischer Beteiligung eingetragen. Signifikante Leistungsänderungen im Vergleich zur jeweils vorangegangenen Erhebung sind sowohl für den Ländermittelwert (in Schwarz) sowie für Mädchen (in Rot) und Buben (in Blau) mit einem Sternsymbol gekennzeichnet. 5 Die exakten Werte zu Abbildung befinden sich in Anhangstabelle A.4. Lesen In Österreich ist die Lesekompetenz von 2006 (538 Punkte) auf 2011 (529 Punkte) um neun Punkte zurückgegangen. Dieser Unterschied ist zwar gering, aber dennoch statistisch signifikant. Getrennt nach den Geschlechtern zeigt sich sowohl für die Mädchen als auch für die Buben eine geringe, aber signifikante Abnahme von 10 bzw. 8 Punkten. In Deutschland hat sich die Leistung von 2001 auf 2006 zunächst von 539 auf 548 Punkte verbessert (p <.05). Von 2006 auf 2011 ist sie allerdings wie in Österreich gering, aber dennoch signifikant zurückgegangen ( 7 Punkte). Für die Geschlechter zeigt sich nur eine statistisch bedeutsame Verbesserung der Buben von 2001 auf 2006 (11 Punkte). Das Leistungsniveau in Slowenien war zu Beginn von PIRLS mit 502 Punkten vergleichsweise gering. Bis zum Jahr 2006 hat sich der Mittelwert der Kinder allerdings um 20 Punkte gesteigert (p <.01) und bei der aktuellen Erhebung erfolgte nochmals eine kleine, aber statistisch bedeutsame Verbesserung von neun Punkten. Dieser Leistungstrend lässt sich auch getrennt für beide Geschlechter feststellen: Die Buben haben sich um 22 bzw. 11 Punkte signifikant verbessert und die Mädchen um 19 bzw. 7 Punkte. In Singapur hat sich die Lesekompetenz der Schüler/innen besonders stark von 2001 auf 2006 verbessert der Leistungszuwachs beträgt 30 Punkte (p <.01). Von 2006 auf 2011 gab es nochmals eine kleine, aber statistisch bedeutsame Verbesserung von 9 Punkten. Mit diesem stetigen Kompetenzzuwachs ist das Leistungsniveau in der aktuellen Erhebung deutlich höher als in Österreich, Deutschland und Slowenien. Betrachtet man die Leistungsveränderung getrennt nach Geschlecht, zeigt sich sowohl bei den Mädchen als auch bei den Buben von 2001 auf 2006 eine deutliche Verbesserung von 27 bzw. 34 Punkten (p <.01). Der Leistungszuwachs in den letzten 5 Jahren um jeweils 9 Punkte ist allerdings statistisch nicht signifikant. Mathematik Hinsichtlich der Mathematikkompetenz fällt das außerordentlich hohe Leistungsniveau der Kinder aus Singapur 5 Die Berechnungen der Leistungsveränderungen von einem Erhebungsjahr zum nächsten wurden in Anlehnung an die Vorgehensweise im internationalen Bericht nicht bonferronikorrigiert.

22 20 Die Leistungen der Schüler/innen in Lesen, Mathematik & Naturwissenschaft seit Beginn von TIMSS im Jahr 1995 auf. Sie erreichten damals im Schnitt 590 Punkte; das Österreich-Mittel lag 60 Punkte darunter. Während in Singapur die Mathematikkompetenz bis 2011 auf hohem Leistungsniveau konstant blieb, hat sich die Leistung der österreichischen Kinder von 1995 auf 2007 um 25 Punkte verringert (p <.01). Die Veränderung von 2007 auf 2011 ist wie in Deutschland und Singapur nicht signifikant. Somit trennen die Kinder aus Österreich und Singapur aktuell 97 Leistungspunkte. Analysiert man die Kompetenzentwicklung der Mädchen hoch 600 Leistungstrend in Lesen AUT DEU SVN SGP Lesekompetenz * * * * * * * * * 475 niedrig * * 2011* * 2011* * 2011* hoch 625 Leistungstrend in Mathematik AUT DEU SVN SGP Mathematikkompetenz * * * * * * niedrig * hoch 600 Naturwissenschaftskompetenz niedrig Landesmittelwert Mittelwert Mädchen Mittelwert Buben * 2011* Leistungstrend in Naturwissenschaft AUT DEU SVN SGP * * * * Abbildung 1.1.4: Leistungstrend in Lesen, Mathematik und Naturwissenschaft (PIRLS 2001, 2006 und 2011; TIMSS 1995, 2007 und 2011) * * * 2011 * *... Landesmittelwert hat sich im Vergleich zur letzen Erhebung signifikant verbessert/verschlechtert... Mittelwert Mädchen hat sich im Vergleich zur letzten Erhebung signifikant verbessert/verschlechtert... Mittelwert Buben hat sich im Vergleich zur letzten Erhebung signfikant verbessert/verschlechtert * *

23 Die Leistungen der Schüler/innen in Lesen, Mathematik & Naturwissenschaft 21 und Buben getrennt voneinander, so zeigt sich lediglich in Österreich von 1995 auf 2007 für beide Geschlechter ein deut - licher Leistungsrückgang von 27 bzw. 24 Punkten (p <.01). Die mathematischen Fähigkeiten der slowenischen Schüler/ innen waren bei TIMSS 1995 vergleichsweise gering (462) und haben sich bis 2007 um 40 Punkte deutlich verbessert (p <.01). Bis 2011 sind ihre Leistungen nochmals um 11 Punkte (p <.01) gestiegen. Dieser Aufwärtstrend über alle Erhebungszeitpunkte hinweg lässt sich auch getrennt für Mädchen und Buben feststellen. Naturwissenschaft In Naturwissenschaft zeigt sich für alle Länder ein ähnlicher Leistungstrend wie in Mathematik. In Österreich ist die Naturwissenschaftskompetenz der Schüler/innen von 1995 auf 2007 zurückgegangen ( 13 Punkte; p <.01). Der Mittelwert der Buben ist von 545 auf 532 Punkte gesunken (p <.05) und jener der Mädchen um 11 Punkte (p <.05). Von 2007 bis 2011 gab es, wie auch in Deutschland, Singapur und Slowenien, keine bedeutsame Veränderung (auch bei den Geschlechtern nicht). Die Viertklässler/innen in Slowenien konnten ihre naturwissenschaftlichen Fähigkeiten von 1995 auf 2007 deutlich verbessern (+54 Punkte; p <.01); von 2007 auf 2011 blieb das Niveau an nähernd gleich (dieses Bild spiegelt sich ebenfalls für die beiden Geschlechter getrennt betrachtet wider). Auch in Singapur gab es von 1995 auf 2007 einen deutlichen Leistungssprung. Der Durchschnittswert in Naturwissenschaft hat sich um 63 Punkte verbessert (p <.01); keine bedeutsame Veränderung gab es hingegen von 2007 auf Das gleiche Muster zeigt sich ebenfalls, wenn man die Mittelwerte der Mädchen getrennt von jenen der Buben analysiert: Sowohl die Buben als auch die Mädchen haben sich von 1995 auf 2007 signifikant um 61 bzw. 66 Punkte verbessert; von 2007 auf 2011 blieben die Leistungen annähernd gleich. Leistungsstarke und leistungsschwache Schüler/innen Auch wenn bei den Ergebnisdarstellungen von internationalen Studien stets mit einem Vergleich der Mittelwerte begonnen wird, sollte nicht außer Acht gelassen werden, dass die Mittelwerte in erster Linie dazu geeignet sind, einen ersten Überblick über das Leistungsniveau der Länder zu geben. Ein und derselbe Leistungswert kann dabei allerdings durch völlig unterschiedliche Konstellationen entstehen: Ein bestimmter Mittelwert kann beispielsweise dadurch zustande kommen, dass es in einem Land viele Schüler/innen auf einem mittleren Leistungsniveau gibt, gleichzeitig jedoch wenige gute und wenige schwache Schüler/innen. Umgekehrt kann in einem anderen Land derselbe Mittelwert dadurch entstehen, dass es viele schwache und gleichzeitig viele leistungsstarke Kinder gibt. Aus dem Mittelwert können also weder Aussagen über die Verteilung der Leistungen gemacht werden noch ist es möglich, die erbrachten Leistungen inhaltlich zu charakterisieren. Dazu gibt es bei PIRLS & TIMSS die sogenannten Kompetenzstufen. Diese bilden einen wesentlichen und pädagogisch wichtigen Teil bei den Ergebnisanalysen. In jedem Testbereich (Lesen, Mathematik und Naturwissenschaft) wurde die Leistungsskala an bestimmten Punkten unterteilt, um dadurch fünf Stufen zu bilden (für eine Beschreibung dieser Methode und eine inhaltliche Beschreibung der Kompetenzstufen siehe Suchań & Wallner-Paschon, 2012, S. 69 ff.). Schüler/innen auf Stufe 1 ( Punkte) bzw. unter Stufe 1 (< 400 Punkte) können aufgrund ihrer geringen Kompetenzen als leistungsschwache Schüler/innen bezeichnet werden. Sie besitzen maximal Basiskompetenzen und können nur die einfachsten Aufgaben von PIRLS bzw. TIMSS lösen wie beispielsweise in Mathematik das Addieren von zwei ganzen Zahlen oder in Lesen das Heraussuchen von leicht auffindbaren Informationen in einem Text. Stufe 2 verlangt von den Schülerinnen und Schülern, ihr Basiswissen in ein fachen Situationen anzuwenden; auf Stufe 3 müssen sie ihre erworbenen Fähigkeiten in mehreren unterschiedlichen Kontexten einsetzen. Kinder auf der höchsten Kompetenzstufe 4 ( 625 Punkte) können hingegen komplexe Auf gaben (mit mehreren Zwischenschritten) in einer Reihe von unterschiedlichen Situationen erfolgreich bearbeiten; sie werden als leistungsstark bezeichnet. Überschneidungen zwischen den Kompetenzbereichen hinsichtlich leistungsstarker und leistungsschwacher Schüler/innen Im Erstbericht zu PIRLS und TIMSS 2011 (Suchań, Wallner-Paschon, Bergmüller & Schreiner, 2012) findet sich für jeden Kompetenzbereich getrennt eine Darstellung, wie sich die Schüler/innen der Teilnehmerländer auf die Kompetenzstufen verteilen. Abbildung zeigt ergänzend dazu, wie viele Schüler/innen in allen drei Leistungsbereichen, in zwei der drei Leistungsbereiche bzw. in einem Bereich zur leistungsstarken/leistungsschwachen Gruppe zählen. Dargestellt sind jene EU-Länder, die sich sowohl bei PIRLS als auch bei TIMSS mit der 4. Schulstufe beteiligt haben; insgesamt trifft dies auf 17 Länder zu. 6 Auf der linken Seite der Abbildung finden sich die Überschneidungen der leistungsschwachen Schüler/innen; rechts jene der leistungsstarken. Die Teilnehmerländer sind dabei absteigend nach dem Anteil jener Kinder sortiert, die sowohl in Lesen als auch in Mathematik und Naturwissenschaft maximal Basiskompetenzen besitzen (Kompetenzstufe 1 bzw. unter 1). Diese Schüler/innen sollten besonders gefördert werden; sie weisen bereits in der Volksschule in jenen Bereichen Defizite auf, die eine wesentliche Grundlage für die Entwicklung einer fundierten Allgemeinbildung sind. 6 Von den 20 EU-Ländern, die sich sowohl an PIRLS als auch an TIMSS 2011 beteiligt haben, haben 17 für beide Studien dieselben Schüler/innen getestet.

24 22 Die Leistungen der Schüler/innen in Lesen, Mathematik & Naturwissenschaft Überschneidungen zwischen leistungsschwachen und -starken Schülerinnen und Schülern % leistungsschwach leistungsstark % MLT ESP ROU POL ITA AUT SWE SVN SKV HUN LTU IRL Spitze in 3 Bereichen Spitze in 2 Bereichen Spitze in 1 Bereich Leistungsschwach in 3 Bereichen CZE 4 11 Leistungsschwach in 2 Bereichen Leistungsschwach in 1 Bereich PRT DEU GBR (N) FIN Teilnehmerländer absteigend nach dem Anteil der leistungsschwachen Schüler/innen in allen drei Bereichen (Lesen, Mathematik und Naturwissenschaft) sortiert Abbildung 1.1.5: Überschneidungen zwischen leistungsstarken und leistungsschwachen Schülerinnen und Schülern in Lesen, Mathematik und Naturwissenschaft (PIRLS & TIMSS 2011) Der Anteil jener Viertklässler/innen, die besonderen Förderbedarf haben, da sie in allen drei Bereichen zu den Leistungsschwachen zählen, schwankt zwischen 3 % in Finnland und 27 % in Malta. In Österreich betrifft dies jedes 10. Kind; weitere 12 % erreichen in zwei von drei Bereichen maximal Kompetenzstufe 1 und 16 % zählen entweder in Lesen oder in Mathematik oder in Naturwissenschaft zur leistungsschwachen Gruppe. Insgesamt hat somit etwa jedes 3. Kind in Österreich (38 %) in zumindest einer von drei grundlegenden Kompetenzen in der 4. Schulstufe Mängel. In Polen, Spanien, Rumänien und Malta trifft dies auf jeweils (knapp) über die Hälfte der Schüler/innen zu. Den höchsten Anteil an Kindern, die in Lesen, Mathematik und Naturwissenschaft zu den Leistungsstarken zählen, gibt es erwartungsgemäß in Finnland: 5 % schaffen es hier in allen drei Domänen in die höchste Stufe. Mit weiteren 9 % in zwei Domänen und 18 % in einer erzielt insgesamt knapp ein Drittel der finnischen Viertklässler/innen in zumindest einem Bereich herausragende Leistungen. In Österreich ist dieser Anteil mit 12 % nicht einmal halb so groß; wobei nur 1 % sowohl in Lesen als auch in Mathematik und Naturwissenschaft leistungsstark ist, 3 % in zwei dieser Kompetenzen und 9 % in einem Kompetenzbereich. Charakteristika leistungsstarker und leistungsschwacher Schüler/innen in Österreich Analysiert man die Leistungsstarken und -schwachen in Lesen, Mathematik und Naturwissenschaft getrennt voneinander, so zählen in Österreich 20 % der bei PIRLS getesteten Kinder (in Lesen) zur leistungsschwachen Gruppe; bei TIMSS-Mathematik sind es 30 % und in Naturwissenschaft 21 %. Dem stehen 5 % leistungsstarke Schüler/ innen in Lesen, 2 % in Mathematik und 8 % in Naturwissenschaft gegenüber. In weiterer Folge werden diese Gruppen nun für Österreich nach den Merkmalen Geschlecht, Migrationshintergrund und Schulbildung der Eltern genauer charakterisiert. Abbildung zeigt, getrennt für Lesen, Mathematik und Naturwissenschaft, zu welchen Anteilen die leistungsstarke bzw. -schwache Gruppe aus Mädchen und Buben, aus Schülerinnen und Schülern mit bzw. ohne Migrationshintergrund besteht und welche Bildungsabschlüsse ihre Eltern besitzen. Zum Vergleich ist für jedes Merkmal auch die Verteilung in der gesamten Population dargestellt. In Lesen sind entsprechend dem Leistungsunterschied beim Mittelwert (s. Abbildung 1.1.4) die Mädchen in der leistungsstarken und die Buben in der leistungsschwachen Gruppe im Vergleich zur Population tendenziell über-

25 Die Leistungen der Schüler/innen in Lesen, Mathematik & Naturwissenschaft 23 Anteile leistungsstarker und leistungsschwacher Schüler/innen in Österreich in Lesen nach Geschlecht... Migrationshintergrund... Bildung der Eltern Population Population leistungsstark 94 leistungsstark leistungsschwach leistungsschwach % % % % Anteile leistungsstarker und leistungsschwacher Schüler/innen in Österreich in Mathematik (M) und Naturwissenschaft (N) nach Geschlecht... Migrationshintergrund... Bildung der Eltern Population Population leistungsstark M 94 leistungsstark M NW 96 NW leistungsschwach M leistungsschwach M NW NW % % % % Mädchen Buben Angaben in Prozent; Werte unter 4 % sind nicht eingetragen ohne Migrationshintergrund Migrationshintergrund 2. Generation: Schüler/in in Österreich, beide Eltern im Ausland geboren Migrationshintergrund 1. Generation: Schüler/in und beide Eltern im Ausland geboren max. Pflichtschule BMS/Lehre Matura Uni/PädAk PH/Soz/AK/FH Abbildung 1.1.6: Charakteristika der leistungsstarken und leistungsschwachen Schüler/innen (PIRLS & TIMSS 2011) repräsentiert. In Mathematik und Naturwissenschaft ist dieses Bild umgekehrt: Mit einem Verhältnis von etwa 2/3 zu 1/3 gibt es bei den Leistungsstarken deutlich mehr Buben als Mädchen. Unter den leistungsschwachen Schülerinnen und Schülern ist der Unterschied (mehr Mädchen als Buben) nicht so deutlich ausgeprägt. Hinsichtlich des Merkmals Migrationshintergrund zeigt sich, dass leistungsschwache Schüler/innen im Vergleich zu allen getesteten Kindern wesentlich häufiger aus Familien mit Migrationshintergrund stammen. Dies gilt sowohl für Lesen als auch für Mathematik und Naturwissenschaft. Während in der Population 19 % der Kinder Migrationshintergrund haben (Migrantinnen und Migranten der ersten bzw. zweiten Generation), sind es bei den Leistungsschwachen je nach Domäne zwischen 31 % (Mathematik) und 43 % (Naturwissenschaft). Dennoch darf die Tatsache nicht unerwähnt bleiben, dass jeweils mehr als die Hälfte der Kinder in der leistungsschwachen Gruppe keinen Migrationshintergrund hat. Die leistungsstarken Gruppen bestehen hingegen zu über 90 % aus einheimischen Kindern; das heißt, dass die Migrantinnen und Migranten in der höchsten Kompetenzstufe unterrepräsentiert sind. Darüber hinaus lassen sich leistungsschwache Kinder dadurch charakterisieren, dass ihre Eltern häufiger geringere Bildungsabschlüsse aufweisen. In der Population hat etwa 1/4 der Kinder zumindest einen Elternteil mit einem Universitätsabschluss oder einem Abschluss an einer Fachhochschule bzw. Pädagogischen Akademie/Sozialakademie. Sieht man sich die Verteilung der Abschlüsse bei jenen Kindern auf Kompetenzstufe 1 und darunter an, so haben nur % von ihnen zumindest einen Elternteil mit Universitätsoder Fachhochschulabschluss. Weitere % stammen aus Familien, in denen die höchste absolvierte Ausbildung einem Pflichtschulabschluss entspricht. Die Mehrheit der leistungsschwachen Schüler/innen (etwa 60 %) hat Eltern mit einem Abschluss an einer berufs bildenden mittleren Schule oder mit einem Lehrabschluss. Ein anderes Bild zeigt sich in allen drei Kompetenzbereichen bei den

26 24 Die Leistungen der Schüler/innen in Lesen, Mathematik & Naturwissenschaft Viertkläss lerinnen und Viertklässlern auf der höchsten Leistungsstufe 4: etwa 50 % der Kinder (doppelt so viele wie in der Population) haben zumindest einen Elternteil mit Universitätsabschluss (oder mit einem vergleichbaren Abschluss). Die Anteile in der Kategorie Matura unterscheiden sich nur gering von jenen in der Population und jene mit einem Lehrabschluss bzw. einer berufsbildenden mittlere Schule sind mit % geringer als in der Population (47 %). Geschlechterdifferenzen bei den Leistungsskalen von PIRLS & TIMSS 2011 In Ergänzung zum Erstbericht folgt zum Abschluss dieses Beitrags eine zusammenfassende Darstellung der Geschlechterdifferenzen sowohl im Hinblick auf die Gesamtals auch auf die Subskalen von PIRLS & TIMSS 2011 (eine detaillierte Beschreibung der Subskalen findet sich in Grafendorfer, Wallner-Paschon, Suchań & Widauer, 2012). Im Erstbericht wurden lediglich die Mittelwerte aller Teilnehmerländer bei den Subskalen berichtet die Geschlechterdifferenzen wurden in diesem Zusammenhang bislang nicht berücksichtigt. Weiterführende Analysen zu den anderen beiden Faktoren, die im Hinblick auf die Chancengerechtigkeit von Bedeutung sind (Migrationshintergrund und Bildung der Eltern), finden sich in eigenen Beiträgen dieser Publikation (siehe Kapitel 2.1 sowie 2.2), weshalb dieser Beitrag im Gegensatz zu den Geschlechterdifferenzen nicht gesondert darauf eingeht. Abbildung zeigt die Unterschiede zwischen Mädchen und Buben für alle Lesebereiche sowohl für Österreich als auch im Schnitt für die teilnehmenden EU-Länder. Neben der Punktdifferenz und der Signifikanz (Sternsymbol neben dem entsprechenden Balken) ist rechts daneben auch die Effektstärke eingetragen. In Lesen übertreffen die österreichischen Mädchen die Buben um 8 Punkte; im EU-Schnitt sind es 12 Punkte (siehe Abbildung 1.1.7). In beiden Fällen ist die Differenz statistisch signifikant, aber inhaltlich kaum von Bedeutung (Effektstärke < 0.2). In den EU-Ländern gibt es durchschnittlich betrachtet bei allen vier Lese-Subskalen signifikante Geschlechterdifferenzen. Allerdings zeigen sich nur beim Interpretieren, Verknüpfen und Bewerten von Inhalten bedeutende Effektstärken über 0.2 (in der Abbildung nur als Interpretieren bezeichnet). Es handelt sich dabei um den komplexeren der beiden Verstehensprozesse, die zur Lösung der Aufgaben von den Schülerinnen und Schülern verlangt werden. Im EU-Schnitt übertreffen die Mädchen die Buben dabei um 13 Punkte. In Österreich erbringen die Mädchen und Buben beim Lesen von Informationstexten und bei der kognitiven Skala Wiedergeben und einfaches Schluss folgern (in der Abbildung nur als Wiedergeben bezeichnet) vergleichbare Leistungen. Beim Lesen von literarischen Texten sowie beim komplexeren Verstehensprozess Interpretieren, Verknüpfen und Bewerten übertreffen die Mädchen die Buben um 13 bzw. 10 Punkte. Beide Unterschiede sind zwar signifikant, die Effektstärke liegt allerdings nur beim Interpretieren über 0.2. In Mathematik (s. Abbildung 1.1.8) schwanken die Geschlechterdifferenzen in Österreich zwischen 5 und 16 Punkten zugunsten der Buben. Inhaltlich von Bedeutung ist allerdings nur die Differenz beim anspruchsvollsten der drei kognitiven Bereiche beim Begründen. Wenn es also darum geht, in Mathematik Fragestellungen zu lösen, die sich auf unbekannte Situationen sowie komplexe Kontexte und Probleme beziehen, übertreffen die Buben der 4. Klasse ihre Alterskolleginnen um 16 Punkte. Im EU-Schnitt sind die Unterschiede zwischen Mädchen und Buben auf den meisten Skalen etwas geringer als in Österreich; sie sind zwar statistisch signifikant, inhaltlich allerdings kaum von Bedeutung (Effektstärke < 0.2). Im Kompetenzbereich Naturwissenschaft (s. Abbildung 1.1.8) sind die Geschlechterdifferenzen in Österreich auf Geschlechterdifferenzen in Lesen Mädchen besser Buben besser Effektstärke Gesamtskala Lesen Leseintentionen Information Literarisch Wiedergeben Verstehensprozesse Interpretieren AUT EU-Schnitt Differenz ist signifikant (p <.05) Abbildung 1.1.7: Geschlechterdifferenzen in Lesen (PIRLS 2011)

27 Die Leistungen der Schüler/innen in Lesen, Mathematik & Naturwissenschaft 25 Geschlechterdifferenzen in Mathematik Mädchen besser Buben besser Effektstärke Gesamtskala Mathematik Inhaltsbereiche Kognitive Bereiche Zahlen Geom. Formen Darstellen Wissen Anwenden Begründen AUT EU-Schnitt Differenz ist signifikant (p <.05) Geschlechterdifferenzen in Naturwissenschaft Mädchen besser Buben besser Effektstärke Inhaltsbereiche Kognitive Bereiche Gesamtskala Naturwissenschaft Biologie Physik Erdkunde Wissen Anwenden Begründen Abbildung 1.1.8: Geschlechterdifferenzen in Mathematik & Naturwissenschaft (TIMSS 2011) AUT EU-Schnitt Differenz ist signifikant (p <.05) einigen Skalen deutlich höher als in Mathematik und Lesen. Bei den Aufgaben zu den Themen Physik und Erdkunde liegen die Buben im Schnitt um 18 bzw. 24 Punkte vor den Mädchen. Beide Unterschiede sind sowohl statistisch als auch praktisch bedeutsam. Aufgaben aus dem Inhaltsbereich Biologie werden in Österreich und im EU-Schnitt von beiden Geschlechtern jeweils gleich gut gelöst. Die Differenzen der kognitiven Subskalen schwanken in Österreich zwischen 12 und 15 Punkten (im EU-Schnitt sind sie mit 1 7 Punkten geringer); von inhaltlicher Relevanz sind diese allerdings wie in Mathematik nur beim komplexesten Bereich Begründen, bei dem die Schüler/innen beispielsweise Ergebnisse aus Experimenten mit naturwissenschaftlichen Konzepten in Verbindung bringen müssen. Zusammenfassung Die Lese- und Mathematikkompetenzen der österreichischen Schüler/innen liegen unter dem Durchschnittswert der jeweils teilnehmenden EU-Länder. In Naturwissenschaft schneiden sie besser ab; das Österreich-Mittel liegt deutlich über dem EU-Schnitt und nur die finnischen Kinder erreichen einen signifikant höheren Mittelwert. Vor allem in Lesen und in Mathematik fällt Österreich durch eine vergleichsweise geringe Streuung der Leistung auf. Diese lässt sich hauptsächlich auf individuelle Schülermerkmale zurückführen und ist nur zu einem geringen Anteil durch die Zugehörigkeit zu einer bestimmten Klasse oder Schule erklärbar.

28 26 Die Leistungen der Schüler/innen in Lesen, Mathematik & Naturwissenschaft Ein Vergleich der Leistung über die Zeit hinweg zeigt für Lesen einen geringen, aber dennoch statistisch signifikanten Leistungsrückgang von 9 Punkten. In Mathematik und Naturwissenschaft ist die Leistung nach einer deutlichen Abnahme von 1995 auf 2007 annähernd gleich geblieben. Insgesamt 38 % der Viertklässler/innen in Österreich zäh - len in zumindest einem Kompetenzbereich zu den Leistungsschwachen; in Finnland sind es mit 17 % etwa halb so viele. Jedes 10. Kind in Österreich hat hingegen sowohl in Lesen als auch in Mathematik und Naturwissenschaft bereits am Ende der Volksschule Defizite. Diese leistungsschwachen Schüler/innen stammen häufiger aus Familien mit Migrationshintergrund und ihre Eltern haben zum Großteil maximal eine berufsbildende mittlere Schule oder eine Lehre absolviert. Im Vergleich dazu sind über 90 % der leistungsstarken Kinder Einheimische und etwa 50 % haben Eltern mit einem Universitätsabschluss bzw. einem Abschluss an einer Fachhochschule oder an einer Pädagogischen Akademie/Sozialakademie. Die Leistungsunterschiede zwischen Mädchen und Buben in Österreich sind insgesamt gering. In Lesen liegen sie bei allen Subskalen jeweils etwas unter dem EU-Durchschnitt; in Mathematik und Naturwissenschaft zeigen sich hingegen für Österreich größere Differenzen im Vergleich zum Mittelwert aller teilnehmenden EU-Länder. Inhaltlich bedeutsam sind die Differenzen bei der anspruchsvollen Lesesubskala Interpretieren zugunsten der Mädchen; beim kognitiven Bereich Begründen in Mathematik und Naturwissenschaft sowie bei Aufgaben aus den Bereichen Physik und Erdkunde zugunsten der Buben. Literatur Grafendorfer, A., Wallner-Paschon, C., Suchań, B. & Widauer, K. (2012). Was messen PIRLS & TIMSS? In: B. Suchań, C. Wallner-Paschon, S. Bergmüller & C. Schreiner (Hrsg.), PIRLS & TIMSS Schülerleistungen in Lesen, Mathematik und Naturwissenschaft in der Grundschule. Die Studie im Überblick (S ). Graz: Leykam. Lipowsky, F. (2006). Auf den Lehrer kommt es an. Zeitschrift für Pädagogik, 51, OECD (2009). PISA Data Analyses Manual. SPSS, Second Edition. Paris: OECD. Suchań, B. & Wallner-Paschon, C. (2012). Datenaufbereitung für die Ergebnisanalysen. In: B. Suchań, C. Wallner-Paschon, S. Bergmüller & C. Schreiner (Hrsg.), PIRLS & TIMSS Schülerleistungen in Lesen, Mathematik und Naturwissenschaft in der Grundschule. Die Studie im Überblick (S ). Graz: Leykam. Suchań, B., Wallner-Paschon, C., Bergmüller, S. & Schreiner, C. (Hrsg.). (2012). PIRLS & TIMSS Schülerleistungen in Lesen, Mathematik und Naturwissenschaft in der Grundschule. Erste Ergebnisse. Graz: Leykam.

29 Analysen auf Itemebene in Lesen Analysen auf Itemebene in Lesen Karl Blüml & Sandra Filzmoser Bei PIRLS wird eine Vielzahl an Leseaufgaben (Items) eingesetzt. In Itemanalysen werden diese nach ihrer Schwierigkeit eingestuft. Schwierige Aufgaben zeichnen sich durch eine geringe Lösungshäufigkeit aus, leichte durch eine hohe. Im vorliegenden Beitrag wird untersucht, welche Aufgaben den österreichischen Kindern auffällig leicht bzw. schwer fallen. Die Lösungshäufigkeiten der österreichischen Schüler/innen werden dabei mit jenen aller PIRLS-Länder im Durchschnitt sowie mit den Werten der Schüler/innen Deutschlands und Englands verglichen. Anschließend wird der Frage nachgegangen, welche spezifischen Merkmale die in Österreich auffälligen Aufgaben aufweisen. Daraus sollen didaktische Rückschlüsse auf den Unterricht gezogen werden. Fragestellung Lesekompetenz ist ein elementarer Bestandteil unserer Kultur. Sie bildet nicht nur das Fundament für das Lernen in allen Schulfächern, sondern ist auch für das Leben außerhalb der Schule unverzichtbar. Bei PIRLS wird Lesekompetenz definiert als die Fähigkeit, jene geschriebenen Sprachformen zu verstehen und zu nutzen, die von der Gesellschaft verlangt werden und/oder für die jeweilige Person nützlich und wertvoll sind. Junge Leser/innen können die Bedeutung von verschiedensten Texten erfassen. Sie lesen, um zu lernen, um an der Gemeinschaft der Lesenden in der Schule sowie im täglichen Leben teilzunehmen und zum Vergnügen (Mullis, Martin, Kennedy, Trong & Sainsbury, 2009, S. 11; deutsche Übersetzung v. BIFIE). Lesen ist damit die Fähigkeit, Texte in allen Medien dekodieren, verstehen, verarbeiten und zum Lernen nutzen zu können (Renner, 2013, S. 5). Man kann das Verstehen von Texten anhand einiger Verstehensprozesse überprüfen, die in ihrer Gesamtheit den kompetenten Umgang mit Texten beschreiben sollen. PIRLS überprüft die folgenden vier Verstehensprozesse anhand entsprechender Aufgabenstellungen (Mullis, Martin, Kennedy, Trong & Sainsbury, 2009, S. 13 f.): Erkennen und Wiedergeben explizit angegebener Informationen; Ziehen einfacher Schlussfolgerungen; Interpretieren sowie Verknüpfen von Gedanken und Informationen; Untersuchen und Bewerten von Inhalt, Sprache und einzelnen Textelementen. Neben diesen vier Verstehensprozessen werden bei PIRLS zwei Leseabsichten untersucht: das Lesen, um literarische Erfahrungen zu machen und das Lesen, um Informationen zu gewinnen (Mullis, Martin, Kennedy, Trong & Sainsbury, 2009). Erstere wird anhand von literarischen Texten erhoben, zweitere anhand von Sachtexten. Die literarischen Texte sind durchwegs narrativer Art (keine Lyrik, kein dramatischer Text), die Informationstexte sind ebenfalls zum überwiegenden Teil stark narrativer Art. Von den zehn eingesetzten Texten sind fünf literarische Texte und fünf Sachtexte. Jede der Leseaufgaben kann somit einem Verstehensprozess und einer Textart (und in diesem Verständnis einer angenommenen Leseabsicht) zugeordnet werden. Um festzustellen, wie gut es den österreichischen Schülerinnen und Schülern gelingt, diese unterschiedlichen Verstehensprozesse und Textarten zu meistern, werden im Folgenden einzelne Testaufgaben analysiert. Dabei handelt es sich im Allgemeinen um veröffentlichte 1, in Ausnahmefällen auch unveröffentlichte Aufgaben. Die unveröffentlichten Aufgaben müssen unter Verschluss gehalten werden, da sie in zukünftigen Erhebungen von PIRLS wieder eingesetzt werden. Diese können daher hier nur in sehr allgemeiner und verschlüsselter Form beschrieben werden, sodass kein Rückschluss auf die konkrete Aufgabe möglich ist. Um dennoch die Textart (Leseabsicht) herauslesen zu können, werden die Texte INFO und LIT inklusive einer durchlaufenden Ziffer genannt. Neben einer Zuordnung der Aufgaben zu den Verstehensprozessen und Leseabsichten (Textarten) können diese auch nach ihrem Aufgabenformat eingeteilt werden. Bei Auf gaben mit geschlossenem Antwortformat müssen die Kinder das jeweils richtige Kästchen ankreuzen (Multiple Choice). Bei Fragen mit offenem Antwortformat müssen sie selbstständig Antworten formulieren. In diesem Beitrag wird untersucht, welche Merkmale Aufgaben aufweisen, die den österreichischen Kindern auffällig leicht bzw. schwer fallen. Die Lösungshäufigkeiten der österreichischen Schüler/innen werden dabei mit jenen alle r PIRLS-Länder im Durchschnitt sowie mit den Werten der Schüler/innen Deutschlands und Englands verglichen. Deutschland wurde wegen des ähnlichen Schulsystems und der gleichen Sprache als Vergleichsland gewählt. England wurde gewählt, weil es immer wiederkehrende Vermutungen gibt, dass die Schüler/innen in angelsächsischen Ländern vertrauter mit dem Multiple-Choice-Aufgabenformat sind und deshalb bessere Ergebnisse erzielen. 1 Alle veröffentlichten PIRLS-Testaufgaben und -Texte können auf nachgelesen werden.

30 28 Analysen auf Itemebene in Lesen Insbesondere soll untersucht werden, ob die österreich i schen Schüler/innen Stärken oder Schwächen in Bezug auf bestimmte Verstehensprozesse, bestimmte Textarten, bestimmte Antwortformate oder auch in Bezug auf wesentliche Textmerkmale (z. B. Lesbarkeit, Integration von Tabellen, Grafiken) aufweisen. Methode Bei PIRLS 2011 wurden den Schülerinnen und Schülern 142 Testaufgaben (Items) zu 10 Texten auf 13 Testhefte aufgeteilt vorgelegt (s. Wallner-Paschon & Widauer, 2012, S. 52 ff.). Die Grundlage der vorliegenden Analyse bilden die Lösungshäufigkeiten dieser 142 Items. Die Lösungshäufigkeit entspricht dem Schüleranteil, der das jeweilige Item richtig beantwortet hat. Beispielsweise bedeutet eine Lösungshäufigkeit von 57 %, dass 57 % der Schüler/innen die Frage richtig gelöst haben. Über die Schüler/innen aller Teilnehmerländer hinweg wird für jedes Item die durchschnittliche Lösungshäufigkeit berechnet. Auf Basis dieser Lösungshäufigkeit werden die Items unterschiedlichen Kompetenzstufen (I IV) zugeordnet. Die Itemschwierigkeit ist hoch, wenn nur wenige Testteilnehmer/innen eine richtige Lösung gefunden haben und niedrig, wenn das Item von vielen beantwortet werden konnte. Items der Stufe I gelten somit als sehr leicht und jene auf Stufe IV als sehr schwer zu lösen. (Grundsätzlich setzt sich die Itemschwierigkeit zusammen aus Textschwierigkeit und Aufgabenschwierigkeit. Es kann ein einfacher Text durch schwer zu lösende Aufgaben schwierig werden und umgekehrt.) In Abbildung sind vier Items aus dem Text Flieg, Adler, flieg! 2 dargestellt und anhand der angeführten Parameter erläutert. Im linken Balken ist die Itemschwierigkeit abgebildet. Rechts daneben sind die Lösungshäufigkeiten im PIRLS-Schnitt, darunter für Österreich gesamt bzw. für die Buben und Mädchen separat und in der dritten Zeile für Deutschland und England angegeben. Die Testitems sind in der dritten Spalte abgebildet, so wie sie in den Testheften abgedruckt werden, woraus sich die Nummerierung ergibt. In Blau sind Musterlösungen eingetragen. Welchem Verstehensprozess die Items zugeordnet werden, ist in der rechten Spalte abzulesen. Die ausgewählten Items aus dem Text Flieg, Adler, flieg! sind in Abbildung so dargestellt, dass die Anforderung an die Leseleistung von unten nach oben zunimmt. In manchen Fällen ist eine Frage mit einer reinen Suchleistung zu lösen, ohne die Bedeutung des Worts überhaupt zu verstehen. So zum Beispiel im ersten Item der Abbildung Der erste Satz der Geschichte lautet: Eines Tages machte sich ein Bauer auf die Suche nach einem verloren gegangenen Kalb. Hier ist der Schwierigkeitsgrad eher niedrig, die Schüler/innen müssen die Bedeutung von Kalb nicht kennen, sie müssen lediglich erkennen, dass suchen gehen bedeutungsmäßig ident ist mit machte sich auf die Suche. Der direkte Verstehensprozess ist einfach, sprachlich ge sehen gibt es jedoch die Voraussetzung, dass die semantische Identität eines Funktionsverbgefüges und eines Verbs erkannt wird. Das Item wird dem Verstehensprozess Erkennen und Wiedergeben explizit angegebener Informationen zugeordnet. Beim folgenden Verstehensprozess, Ziehen einfacher Schlussfolgerungen, ist die Anforderung an die Testkandidatinnen und -kandidaten erkennbar höher. Sie müssen bei Item 3 den Schluss ziehen, dass man das In-beide-Hände-Nehmen als Zeichen für vorsichtige Behandlung sehen kann bzw. muss. Der Verstehensprozess Untersuchen und Bewerten von Inhalt, Sprache und einzelnen Textelementen stellt die komplexesten Anforderungen zur Lösungsfindung. Bei Item 10 muss Sprache bewertet werden. Man muss zunächst beurteilen, welche Wörter für die Schönheit des Himmels stehen können und sie sodann als Beleg aufschreiben. Das erfordert Weltwissen. Bei Item 12 muss zunächst eine charakteristische Eigenschaft eines Menschen gefunden werden (klug, gescheit, schlau) und dann muss man diese Interpretation mit einem Zitat aus dem Text belegen. Eine anspruchsvolle Aufgabe, die dem Verstehensprozess Interpretieren sowie Verknüpfen von Gedanken und Informationen zugeordnet wird. Überdies muss die Antwort selbstständig formuliert werden, was eine weitere Schwierigkeit darstellt. Obwohl die Verstehensprozesse in ihrer Komplexität aufbauend sind, werden jeweils zugehörige Items in allen Schwierigkeitsstufen entworfen. In Abbildung wird deutlich, wie schwer die einzelnen Items den österreichischen Schülerinnen und Schülern gefallen sind. Es zeigt sich, dass die österreichischen Kinder nahezu nur bei den schwierigeren Items unter die durchschnittliche Lösungshäufigkeit von PIRLS gefallen sind. Das kann vorsichtig so interpretiert werden, dass den österreichischen Kindern nicht immer alle Items gleich leicht oder gleich schwer gefallen sind wie den Kindern der PIRLS-Länder insgesamt. Von den insgesamt 142 Items trifft auf 58 zu, dass der Unterschied in der Lösungshäufigkeit zwischen Österreich und dem PIRLS-Schnitt bzw. den beiden Vergleichs ländern (Deutschland und England) über 10 Prozentpunkte be 2 Der Text Flieg, Adler, flieg! ist ein literarischer Text, der bei PIRLS 2011 zum Einsatz kam und nun für die Öffentlichkeit freigegeben wurde. Dieser Text, inklusive aller Testitems, findet sich unter folgendem Link auf den Seiten 12 21: mit_beispiell%c3%b6sungen_ pdf

31 Analysen auf Itemebene in Lesen 29 Item Itemschwierigkeit Lösungshäufigkeit Verstehensprozess hoch IV 40 59/56/63 36/ Du hast durch das, was der Freund des Bauern getan hat, erfahren, was für ein Mensch er war. Beschreibe zuerst, was der Freund für ein Mensch war. Nenne dann zur Begründung ein Beispiel, was er getan hat.! Er war schlau. Er wusste, dass er den Adler zum Berg bringen musste, damit er fliegen würde. Interpretieren sowie Verknüpfen von Gedanken und Informationen III 51 56/55/58 57/ Suche Wörter, die beschreiben, wie schön der Himmel in der Morgendämmerung aussah und schreibe sie ab.! Die Wolkenfetzen am Himmel waren zuerst rosa, dann begannen sie, golden zu glänzen. Untersuchen und Bewerten von Inhalt, Sprache und einzelnen Textelementen erfahren, was für ein Mensch er war. II 63 79/77/81 83/73 Beschreibe zuerst, was der Freund für ein Mensch war. Nenne dann zur Begründung ein Beispiel, was er getan hat.! Er war schlau. Er wusste, dass er den Adler zum Berg bringen musste, damit er fliegen würde. Ziehen einfacher Schlussfolgerungen niedrig I 87 96/96/96 95/ Suche Wörter, die beschreiben, wie schön der Himmel in der Morgendämmerung aussah und schreibe sie ab.! Die Wolkenfetzen am Himmel waren zuerst rosa, dann begannen sie, golden zu glänzen. Erkennen und Wiedergeben explizit angegebener Informationen Angaben der Lösungshäufigkeit in Prozent für... PIRLS AT/B/M DE/EN... PIRLS gesamt... Österreich gesamt/österreich Buben/Österreich Mädchen... Deutschland/England Abbildung 1.2.1: Testitems aus dem Text Flieg, Adler, flieg! (PIRLS 2011)

32 30 Analysen auf Itemebene in Lesen % 100 leicht Prozent richtige Antworten schwierig % 0 schwierig Item Itemschwierigkeit für Österreich sehr schwierig (LH < 20 %) schwierig (LH %) mittel (LH %) leicht (LH %) sehr leicht (LH > 80 %) LH = Lösungshäufigkeit leicht Werte aufsteigend nach der Lösungshäufigkeit im PIRLS-Schnitt gereiht PIRLS-Schnitt Österreich Abbildung : Testitems nach Lösungshäufigkeit gereiht (PIRLS 2011) trägt. Bei diesen schneidet Österreich bei 54 Items besser und bei 4 Items schlechter ab als der PIRLS-Schnitt. Diese Items werden auf den folgenden Seiten bezüglich Aufgabenformat (geschlossene Fragestellung, zumeist Multiple Choice, gegenüber offener Fragestellung, die eine verbalisierte Antwort verlangt), Textart (literarisch oder informatorisch) analysiert und die Textschwierigkeit anhand von Lesbarkeitsindizes untersucht. 3 Ergebnisse Überblick über alle Items Im Gesamtergebnis haben die österreichischen Kinder 529 Punkte in Lesen erreicht. Der PIRLS-Schnitt liegt bei 512 Punkten, Deutschland hat einen Durchschnitt von 541 Punkten und England einen von 552 Punkten erreicht. Im PIRLS-Ergebnisbericht (vgl. Suchań, Wallner-Paschon, Bergmüller & Schreiner, 2012) wird dies ausführlich dargestellt. Die Einzelitemanalysen sollen Aufschluss darüber geben, worauf die Punktunterschiede zurückführbar sein können. In weiterer Folge wird gezeigt werden, dass die österreichischen Schüler/innen bei manchen Items eine bis zu 28 Prozentpunkte höhere Lösungshäufigkeit erreichen als im PIRLS-Schnitt. Bei anderen Items erreichen sie eine bis zu 15 Prozentpunkte geringere Lösungshäufigkeit. Im Hinblick auf die Leistung der Kinder bei den Text arten (literarischer Text gegenüber Informations-/Sachtext) gibt die Abbildung Aufschluss. Allgemein betrachtet ist Österreich bei den Informationstexten unter den Werten von Deutschland und England, aber über dem PIRLS- Schnitt. Bei den literarischen Texten ist Österreich sehr nahe an diesen beiden Vergleichsländern und deutlich über dem PIRLS-Schnitt. In der Einzelanalyse wollen wir untersuchen, ob es dafür verallgemeinerbare Gründe gibt. Eine Analyse der Leistung getrennt für Mädchen und Buben zeigt, dass grundsätzlich die Mädchen besser abschneiden als die Buben (im Allgemeinen eher bei literarischen Texten), dass aber die Unterschiede in der Performanz in Österreich erkennbar geringer sind als in den Vergleichsländern (vgl. Abb ). Daraus kann der vorsichtige Schluss gezogen werden, dass die PIRLS-Texte und -Items keine besonderen geschlechtsspezifischen Bevorzugungen und Benachteiligungen enthalten. 4 3 Dabei ist zu beachten, dass geringfügige Unterschiede in der Lösungshäufigkeit statistisch gesehen keine Aussagekraft haben. Wir führen daher nur jene Items an, deren Lösungshäufigkeit sich bei den österreichischen Schülerinnen und Schülern signifikant vom PIRLS-Schnitt unterscheidet. Der kritische Differenzwert wird von uns bei 10 Prozentpunkten gesetzt. Die durchschnittliche Differenz zwischen der Lösungshäufigkeit von PIRLS und Österreich liegt bei 7,6 Prozentpunkten. Für allfällige didaktische Aussagen erscheint es uns jedoch erforderlich, den Wert bei mindestens 10 Prozentpunkten anzusetzen. 4 Es war erklärtes Ziel von PIRLS, sowohl Texte wie auch Aufgabenprofile so zu gestalten, dass es keine geschlechtsspezifischen Bevorzugungen oder Benachteiligungen gibt.

33 Analysen auf Itemebene in Lesen 31 leicht Prozent richtige Antworten schwierig % % 40 % 80 Zahn INFO3 INFO1 Informationstext PIRLS-Schnitt Österreich INFO2 LIT2 Kuchen Text Adler Wandern Literarischer Text Deutschland England LIT1 Texte aufsteigend nach Lösungshäufigkeit im PIRLS-Schnitt geordnet Folgende Texte sind freigegeben: Zahn = Das Rätsel des riesigen Zahns Kuchen = Der Feindkuchen Adler = Flieg, Adler, flieg! Wandern = Wandern macht Spaß! Abbildung 1.2.3: Lösungshäufigkeit der Testitems nach Texten im Ländervergleich (PIRLS 2011) Österreich LIT3 Zu dem Befund aus Abbildung kommt noch eine wichtige Überlegung hinzu: Zu jedem der zehn Texte gibt es im Schnitt 14 Items von unterschiedlicher Art und Schwierigkeit. Die Frage ist nun, wie sich Items mit überdurchschnittlich hohen Lösungshäufigkeiten auf die Texte verteilen. Zum Text LIT1 gibt es 13 Items, 10 davon haben die österreichischen Schüler/innen signifikant häufiger bewältigt als die Schüler/innen aller PIRLS-Länder im Durchschnitt. Darunter befinden sich auch jene Items mit den höchsten Anforderungen im Hinblick auf die Schwierigkeitsstufe. Bei drei weiteren Items liegen die Kinder aus Österreich zwischen 6 und 9 Prozentpunkte über dem internationalen Schnitt (darunter findet sich allerdings kein Testitem aus einer höheren Schwierigkeitsstufe als III). Kurz gesagt, bei den einfacheren Items schneiden die österreichischen Schüler/innen erkennbar besser ab (10 von 13 besser). Zum Text INFO1 gibt es 12 Items, drei davon haben die österreichischen Schüler/innen häufiger richtig gelöst als die Schüler/innen aller PIRLS-Länder im Durchschnitt; diese liegen jedoch alle auf Schwierigkeitsstufe II und keine darüber. Es zeigt sich, die österreichischen Schüler/innen lösen die eher einfachen Items erkennbar besser, nicht aber die schwierigeren. Das Muster zeichnet sich auch bei den übrigen Texten und Items ab. Deutschland England leicht Prozent richtige Antworten schwierig % 40 Zahn INFO3 INFO1 INFO2 LIT2 Kuchen Adler Wandern LIT1 LIT3 Zahn INFO3 INFO1 INFO2 LIT2 Kuchen Adler Wandern LIT1 LIT3 Zahn INFO3 INFO1 INFO2 LIT2 Kuchen Text Text Text Adler Wandern LIT1 LIT3 Informationstext Literarischer Text Landesmittelwert Texte aufsteigend nach Lösungshäufigkeit im PIRLS-Schnitt geordnet Folgende Texte sind freigegeben: Mädchen Zahn = Das Rätsel des riesigen Zahns Adler = Flieg, Adler, flieg! Landesdurchschnitt Buben PIRLS-Durchschnitt Kuchen = Der Feindkuchen Wandern = Wandern macht Spaß! Abbildung 1.2.4: Geschlechterunterschiede der Lösungshäufigkeit der Testitems nach Texten im Ländervergleich (PIRLS 2011)

34 32 Analysen auf Itemebene in Lesen Zunächst wollen wir der Frage nachgehen, welche Items es sind, die den österreichischen Schülerinnen und Schülern deutlich leichter gefallen sind (sie eine höhere Lösungshäufigkeit erreicht haben) als dem PIRLS-Schnitt und welche ihnen schwerer gefallen sind (sie eine niedrigere Lösungshäufigkeit erreicht haben). Item Nr. Format G/O Lösungshäufigkeit Tabelle 1.2.1: Items, bei denen Österreich besser abschneidet als der PIRLS-Schnitt Kompetenzstufe Textart Verstehensprozess PIRLS Österreich Deutschland England 1 LIT1 Interpretieren G IV 2 LIT1 Schlussfolgern G IV 3 LIT1 Schlussfolgern G III 4 LIT1 Info suchen G IV 5 LIT1 Schlussfolgern G IV 7 LIT1 Interpretieren O IV 8 LIT1 Schlussfolgern O III 9 LIT1 Info suchen O IV 10 LIT1 Schlussfolgern O IV 11 LIT1 Untersuchen G III 15 INFO1 Schlussfolgern G II 21 INFO1 Schlussfolgern O II 24 INFO1 Untersuchen G II 27 Adler Info suchen G III 28 Adler Schlussfolgern G II 29 Adler Info suchen G II 33 Adler Interpretieren G IV 34 Adler Interpretieren O IV 37 Adler Interpretieren O IV 40 INFO2 Schlussfolgern G IV 43 INFO2 Schlussfolgern G III 48 INFO2 Schlussfolgern G III 53 Wandern Info suchen G III 56 Wandern Schlussfolgern G III 57 Wandern Schlussfolgern O III 58 Wandern Schlussfolgern G III 62 LIT2 Schlussfolgern G III 64 LIT2 Untersuchen O IV 65 LIT2 Info suchen G III 67 LIT2 Info suchen G III 68 LIT2 Info suchen G II 69 LIT2 Schlussfolgern G III 70 LIT2 Schlussfolgern O IV 72 Zahn Schlussfolgern O III 77 Zahn Info suchen G III 81 Zahn Schlussfolgern G IV 92 LIT3 Info suchen G II 93 LIT3 Info suchen O II 94 LIT3 Untersuchen G III 95 LIT3 Schlussfolgern G II 99 LIT3 Info suchen G II 100 LIT3 Interpretieren O III 104 LIT3 Interpretieren O III 105 LIT3 Schlussfolgern G II 106 LIT3 Interpretieren G III 110 LIT3 Interpretieren O III 117 Kuchen Info suchen O II 120 Kuchen Schlussfolgern O II 121 Kuchen Schlussfolgern G II 123 Kuchen Interpretieren G III 128 INFO3 Info suchen O III 138 INFO3 Schlussfolgern G IV 139 INFO3 Schlussfolgern G IV 140 INFO3 Interpretieren O IV Folgende Texte sind freigegeben: Adler = Flieg, Adler, flieg! ; Wandern = Wandern macht Spaß! Zahn = Das Rätsel des riesigen Zahns ; Kuchen = Der Feindkuchen G = geschlossenes Antwortformat; O = offenes Antwortformat Angaben der Lösungshäufigkeit in Prozent

35 Analysen auf Itemebene in Lesen 33 Items, bei denen Österreich besser abschneidet als der Durchschnitt aller PIRLS-Länder Es muss angemerkt werden, dass der PIRLS-Durchschnitt zwar als Vergleichsbasis herangezogen werden kann und muss, dass aber der Vergleich mit Deutschland, das die gleiche Sprache, eine vergleichbare Kultur und Tradition und ein vergleichbares Schulsystem hat, aus Sicht der Autoren eine größere Relevanz bei der Interpretation der Ergebnisse hat. Das wird weiter unten im Detail ausgeführt. Tabelle beinhaltet alle 54 Items, bei denen die österreichischen Schüler/innen eine um mindestens 10 Prozentpunkte höhere Lösungshäufigkeit aufweisen als die Schüler/ innen aller PIRLS-Länder im Durchschnitt. Es werden die Textart, der erwartete Verstehensprozess, das Aufgabenformat und die Itemschwierigkeit angeführt und Lösungshäufigkeiten zwischen den interessierenden Ländern verglichen. Die Tabelle beginnt in der ersten Spalte von links mit der durchlaufenden Itemnummer in PIRLS Die nächste Spalte gibt die Art des Texts an (LIT = Literarischer Text, INFO = Informationstext). Die dritte Spalte beschreibt, welche Verstehensleistung erwartet wird: Erkennen und Wiedergeben explizit angegebener Informationen (Info suchen); Ziehen einfacher Schlussfolgerungen (Schlussfolgern); Interpretieren sowie Verknüpfen von Gedanken und Informationen (Interpretieren); Untersuchen und Bewerten von Inhalt, Sprache und einzelnen Textelementen (Untersuchen). In der vierten Spalte wird das Aufgabenformat (geschlossen oder offen) angegeben, die Spalten fünf bis acht geben die Lösungshäufigkeiten (LH) in Prozentwerten an PIRLS- Schnitt, Österreich, Deutschland, England. Und die rechte Spalte zeigt die Klassifizierung der Itemschwierigkeit laut PIRLS (I bis IV), wobei I die niedrigste ist. In Abbildung werden die Items aus Tabelle nach relevanten Kategorien zusammengefasst. Hier zeigt sich, dass österreichische Kinder bei den geschlossenen Aufgabenformaten (Multiple Choice) öfter bessere Ergebnisse erzielen als bei den offenen (wo sie selbst eine Antwort formulieren müssen). Das ist zunächst ein wichtiger Indikator dafür, dass das Abschneiden der österreichischen Kinder in PIRLS nicht primär damit beantwortet werden kann, dass sie mit dem Testformat Multiple Choice nicht so vertraut sind wie die Schüler/innen anderer Länder. Wir können auch davon ausgehen, dass die österreichischen Schüler/innen beim Identifizieren direkt im Text genannter Informationen (Wiedergeben) und bei einfachen Schlussfolgerungen erkennbar besser sind als beim Verknüpfen und Interpretieren von Informationen und beim Untersuchen und Bewerten von Inhalt und Sprache in einem Text. Im Hinblick auf die Kompetenzstufen zeichnet sich kein Muster ab. Über alle Stufen hinweg beantworteten die österreichischen Schüler/innen die Hälfte bis ein Drittel der Items besser als im PIRLS-Schnitt. Items, bei denen Österreich schlechter abschneidet Wie Tabelle zeigt, gibt es nur wenige Items, bei denen österreichische Kinder schlechter abschneiden als der PIRLS-Schnitt. Die Unterschiede zu Deutschland und zu England sind jedoch bisweilen beträchtlich. Im Folgenden soll hinterfragt werden, was mögliche Ursachen für diese Unterschiede sein könnten. Je zwei Items zählen zum offenen bzw. geschlossenen Aufgabenformat. Drei der vier Items werden dem Verstehens Frageformat Anzahl der Items geschlossen offen Verstehensprozess Anzahl der Items Wiedergeben Schlussfolgern Interpretieren Untersuchen Itemschwierigkeit Anzahl der Items I II III IV leicht schwierig Items Items gesamt Anzahl der Items, die von österreichischen Schülerinnen und Schülern besser gelöst wurden als der PIRLS-Schnitt Abbildung 1.2.5: Anzahl der von österreichischen Schülerinnen und Schülern besser gelösten Items als vom PIRLS-Schnitt (PIRLS 2011)

36 34 Analysen auf Itemebene in Lesen Item Nr. Textart Verstehensprozess G = geschlossenes Antwortformat O = offenes Antwortformat Format G/O Lösungshäufigkeit PIRLS Österreich Deutschland England Tabelle 1.2.2: Items, bei denen österreichische Schüler/innen schlechter abschneiden als der PIRLS-Schnitt Kompetenzstufe 18 INFO1 Schlussfolgern G III 20 INFO1 Interpretieren G II 44 INFO2 Interpretieren O IV 126 Kuchen Interpretieren O IV Angaben der Lösungshäufigkeit in Prozent Freigegebener Text: Kuchen = Der Feindkuchen prozess Interpretieren sowie Verknüpfen von Gedanken und Informationen zugeschrieben. Das vierte zählt zu Ziehen einfacher Schlussfolgerungen. Zwei der Items befinden sich auf Schwierigkeitsstufe IV. Die anderen beiden jeweils eine Stufe darunter. INFO1 (Text nicht freigegeben, daher nur verschlüsselt und abstrakt dargestellt) ist der Grundtext für ein Testitem, bei dem die österreichischen Schüler/innen zwei der vier Items eindeutig schlechter bewältigt haben als der internationale Schnitt. Da, wie oben angedeutet, die unterschiedliche Performanz mehrere Ursachen haben kann, untersuchen wir zunächst den Aufgabentext im Hinblick auf seine Lese Verstehens-Schwierigkeit. Dazu kann man zur ersten Orientierung so genannte Lesbarkeitsindizes heranziehen. Wir nehmen diese Indizes, die für unterschiedliche Zwecke gemacht wurden, als erste Orientierung. Da PIRLS keine Begründung für die Schwierigkeitsstufen gibt außer der Lösungshäufigkeit (also rein empirisch ohne sprachliche Analyse hinsichtlich Wortschatz, Satzlänge, Satztiefe... und ohne Analyse des für das Verstehen erforderlichen Weltwissens ), bieten diese Indizes eine erste grobe Einschätzung. Für unsere weitere Analyse sind sie nicht relevant. Wir haben den Text mit einigen gebräuchlichen Lesbarkeitsindizes (vgl. Scott, 2013 und Lenhard & Lenhard 2011) überprüft und dabei folgende Resultate erhalten: LIX: sehr niedriger bis niedriger Schwierigkeitsgrad (35) Flesch Reading Ease score: 51.3 (text scale) ziemlich schwer zu lesen; The Coleman-Liau Index: 12 gut geeignet für 12. Schulstufe; The SMOG Index: 9.4 Grade level: 9. Schulstufe. Didaktische Beurteilung: Ein linearer Text mit einigen unterstützenden Illustrationen, die jedoch nicht für das Verständnis notwendig sind. Die Lesbarkeitsindizes zeigen zwar, dass der Text an sich nicht für die 5. Schulstufe als typisch angesehen werden kann, aber er dürfte auch keine wirklichen Probleme verursachen weder vom Wortschatz noch von den grammatischen Konstruktionen her. Er könnte aus einem Jugendlexikon, einem anderen Sachbuch, aus einem Magazin mit Künstlerbiografien für Jugendliche o. Ä. stammen, ist aber fast eher literarisch als informationsorientiert. Der Text ist im Duktus ausgesprochen narrativ gehalten. Zwei von zwölf Items (18 und 20) wurden von den österreichischen Schülerinnen und Schülern signifikant weniger häufig gelöst als im PIRLS-Schnitt und noch viel weniger häufig im Vergleich mit England (Deutschland fällt in beiden Fällen auch unter den PIRLS-Schnitt). Beide Items sind geschlossen, d. h. sie verlangen eine Auswahl aus vier vorgegebenen Antworten. Item 18 sieht das Ziehen von Schlussfolgerungen vor und ist auf Schwierigkeitsstufe III angesetzt. Es wird danach gefragt, was ein bestimmtes Wort in einem bestimmten Zusammenhang über die beschriebene Person aussagt. Wie sehen die Distraktoren (falschen Antwortalternativen) aus? Es sind praktisch alle vorgegebenen Antworten wahr, d. h. sie enthalten keine falschen Angaben im Hinblick auf den Text. Die erwartete richtige Antwort kann jedoch nur gegeben werden, wenn man die Bedeutung des als richtig angesehenen Worts kennt. In Item 20 wird das Interpretieren und Verknüpfen von Gedanken verlangt und es ist auf Stufe II (also eher niedrig) aber die Lösung verlangt ein sehr genaues Lesen des Texts. Einer der Distraktoren schlägt eine in Bezug auf den Text offensichtlich falsche Antwort vor, d. h. die Aussage findet sich nirgends im Text, die beiden anderen sind jedoch grundsätzlich richtig, erklären aber den Sachverhalt nicht der Fragestellung entsprechend. Die richtige Antwort könnte ganz einfach mit Weltwissen gefunden werden. Es ist schwer erklärbar, warum die Ergebnisse in Österreich (und in Deutschland) so viel schlechter sind als im PIRLS- Schnitt und vor allem im Vergleich zu England. Beim Text INFO2, Item 44, ist wiederum der Unterschied zu Deutschland nicht sehr groß, wohl aber zum PIRLS- Schnitt und noch deutlich mehr zu England. Die Fragestellung ist in diesem Fall offen. Bemerkenswerterweise erreichen die österreichischen Schüler/innen bei einem anderen Item zum selben Text die im Vergleich höchste Lösungshäufigkeit. Einfacher Schluss: An der Art und Schwierigkeit des Testtexts selbst kann es nicht liegen, dass sich ein solcher

37 Analysen auf Itemebene in Lesen 35 Unterschied ergibt, es muss also an der Aufgabenart bzw. der konkreten Aufgabenstellung liegen. Der verlangte Verstehensprozess ist bei Item 44 Interpretieren, das Format ist offen. Es muss herausgefunden werden, inwiefern sich bestimmte Sinne von Menschen und Tieren unterscheiden. Die Unterschiede sind im Text zwar implizit genannt, müssen aber dennoch interpretiert bzw. müssen einzelne Teile miteinander verknüpft werden. Die Itemschwierigkeit ist IV, also hoch. Die Fragestellung ist an sich völlig eindeutig, es müssen jedoch im Text Belege dafür gefunden werden, warum eine Antwort richtig ist. Diese Art der Aufgabe hat sich schon mehrmals als eher schwierig für österreichische Kinder erwiesen. Es ist offenbar die Kombination aus genauem Lesen und der daraus zu ziehenden Interpretation, die Probleme macht. Im Text Der Feindkuchen handelt es sich es sich um einen vergleichsweise einfachen literarischen Text. Mit diesem Text gehen österreichische Kinder sehr unterschiedlich um, zumindest zwei Aufgaben lösen sie deutlich besser als der PIRLS-Schnitt, Item 126 ganz schlecht und ein weiteres auch um 9,8 Prozentpunkte schlechter als der PIRLS- Schnitt, was bemerkenswert ist. Das Item 126 wird weiter unten noch genauer besprochen. Diese Heterogenität deutet darauf hin, dass es nicht der Text als solcher (also literarischer Text, eher gut zu verstehen) ist, der Probleme verursacht. Schlecht schneiden die Schüler/ innen bei einer offenen Interpretationsfrage auf Stufe IV ab; gut hingegen bei einem offenen Item, das ein einfaches Schlussfolgern verlangt und Stufe II zugeordnet wurde. Einzelitems In diesem Abschnitt besprechen wir zunächst die beiden Spitzenergebnisse in jede Richtung: Einmal, wo die österreichischen Kinder im hohen Ausmaß über dem PIRLS- Schnitt liegen, das zweite Mal, wo sie im hohen Maß unter dem PIRLS-Schnitt liegen. Österreich schneidet besser ab Das Item entstammt dem Text INFO2. Da dieser Text bisher nicht veröffentlicht wurde, wird er hier nur verschlüsselt und abstrakt besprochen. Die größte Zahl österreichischer Schüler/innen hat dieses Testitem zu einem eklatant höheren Prozentsatz, nämlich 27,9 Prozentpunkte, richtig gelöst als der PIRLS-Schnitt. Hier liegt die Lösungshäufigkeit in Österreich ungefähr wie in Deutschland, aber deutlich höher als in England und wesentlich höher als im PIRLS-Schnitt. Land LH PIRLS-Schnitt 49 % Österreich 77 % österr. Mädchen 81 % österr. Buben 73 % Deutschland 80 % England 67 % LH = Lösungshäufigkeit Tabelle 1.2.3: Lösungshäufigkeiten zum Item, bei dem Österreich die größte positive Differenz zum PIRLS-Schnitt aufweist Der zugrunde liegende Text ist vom Typus Information, ein linearer Text etwa aus einem Sachbuch, einem Jugendlexikon oder einem Kindermagazin mit einigen ansprechenden Illustrationen, die mit Untertexten versehen sind. Die Aufgabenstellung ist klar und deutlich. Die Aufgabenart verlangt einfache Schlussfolgerungen, weil die Antwort nicht wörtlich im Text aufscheint aber nahezu. Die Antwort findet sich jedoch nicht im Fließtext, sondern in einer Abbildungsbeschriftung. Das Aufgabenformat ist geschlossen, das heißt hier, aus vier vorgegebenen Antworten ist eine zu wählen. Das Item ist auf der Schwierigkeitsstufe III. Der Text Wir haben den Text wieder mit international üblichen Lesbarkeitsindizes (vgl. Scott, 2013 und Lenhard & Lenhard 2011) untersucht und dabei Folgendes festgestellt: Nach dem Lesbarkeitsindex (LIX) erreicht dieser spezielle Textausschnitt, der die gesuchte Information enthält, die Stufe 36, also geringe Schwierigkeit etwa wie Kinder- und Jugendliteratur und Belletristik. Mit der Flesch-Formel wird ein etwas anderes Ergebnis erzielt: Flesch Reading Ease score: 56.4 (text scale) Flesch Reading Ease ziemlich schwer zu lesen; The Coleman-Liau Index: 12 Grade level: 12. Schulstufe The SMOG Index: 8.3 Grade level: 8. Schulstufe. Diese Befunde deuten darauf hin, dass es nicht die besondere Einfachheit des Texts sein kann, die zu diesem positiven Ergebnis geführt hat der Text ist danach zumindest als mittelschwer einzustufen und definitiv nicht so, dass ihn der Durchschnitt der Schüler/innen der Schulstufen 4 und 5 im überwiegenden Ausmaß leicht verstehen könnte. Der verlangte Verstehensprozess Hier geht es um das Ziehen einfacher Schlussfolgerungen, d. h. die gesuchte Information ist nicht wortwörtlich aus dem Text ablesbar. In diesem Fall ist es tatsächlich ein sehr einfacher Schluss, der gezogen werden muss, denn der

38 36 Analysen auf Itemebene in Lesen gesuchte Terminus wird im Text genannt, nicht aber im Fließtext (im linearen Haupttext), sondern in einer Abbildungsbeschriftung, die man beim Lesen möglicherweise gar nicht so genau zur Kenntnis nimmt. Es spricht für ein genaues Leseverhalten, wenn auch diese Nebentexte offensichtlich zur Kenntnis genommen werden. Das Testformat (Art der Aufgabenstellung) Hier wird ein geschlossenes Format angewendet, und zwar das Multiple-Choice-Format. Die Schwierigkeit dieses Formats hängt unter anderem von den vorgegebenen Alternativen (Distraktoren) ab. Sind die anderen drei Antwortmöglichkeiten völlig unwahrscheinlich, dann fällt die Wahl der richtigen Antwort nicht besonders schwer immer vorausgesetzt, man hat Text und Fragestellung verstanden. In diesem Fall sind zwei Distraktoren (falsche Antworten) sehr unwahrscheinlich bis augenscheinlich unzutreffend. Zwei Antwortmöglichkeiten sind grundsätzlich plausibel und könnten als richtig eingestuft werden. Die erwartete richtige Antwort ist nicht so formuliert, dass Wörter aus dem Bezugstext verwendet werden, sondern dass man schlussfolgern muss. Man muss den Schluss ziehen, dass der Text der richtigen Antwort das mit anderen Worten beschreibt, was im Originaltext steht. Man muss kulturell (zivilisatorisch) wissen, dass die Dinge, von denen hier die Rede ist, auch in einem Mülleimer vorkommen können. Als Nebenbemerkung zum Multiple-Choice-Testformat muss noch angeführt werden, dass es ein gewisses Unsicherheitspotenzial hinsichtlich der Aussagekraft enthält: Man kann raten und zufällig das Richtige finden. Dies gilt jedoch für die Kinder aller Länder gleichermaßen. Österreich schneidet schlechter ab Das Item, bei dem die österreichischen Schüler/innen die größte negative Differenz zum PIRLS-Schnitt aufweisen, entstammt einem bereits veröffentlichten Text Der Feindkuchen (vgl. Item 126 in Tabelle 1.2.2). Das auffälligste Ergebnis ist, dass bei diesem Item die österreichischen Schüler/innen eine um 15,2 Prozentpunkte geringere Lösungshäufigkeit aufweisen als der PIRLS-Schnitt. Land LH PIRLS-Schnitt 39 % Österreich 24 % österr. Mädchen 28 % österr. Buben 19 % Deutschland 29 % England 56 % LH = Lösungshäufigkeit Tabelle 1.2.4: Lösungshäufigkeiten zum Item, bei dem Österreich die größte negative Differenz zum PIRLS-Schnitt aufweist Hier liegt die Lösungshäufigkeit zwischen Deutschland und Österreich nicht sehr weit auseinander, sie ist jedoch wesentlich niedriger als in England. Selbst die österreichischen Mädchen erreichen nur knapp die Hälfte der Lösungshäufigkeiten aller Schüler/innen in England. Der zugrunde liegende Text ist vom Typus her ein literarischer Text. Es ist ein völlig linearer Text etwa aus einem Literaturmagazin, einem Jugendbuch, einer Jugendzeitschrift mit einigen ansprechenden Illustrationen, die nicht mit Untertexten versehen sind und in diesem Sinne nicht zur Information gehören (Typus illustrative Grafik im Gegensatz zu einer funktionalen Grafik). Die Aufgabenstellung hingegen ist schwierig: Was für ein Mensch ist Toms Vater? Nenne dazu ein Beispiel, was er in der Geschichte getan hat. Die Aufgabenart verlangt Interpretieren sowie Verknüpfen von Gedanken und Informationen. Die Antwort findet sich nicht im Fließtext, sondern muss aus Handlungen der Person interpretiert werden. Das Aufgabenformat ist offen, das heißt hier, die Schüler/innen müssen die Antwort selbst formulieren und aus dem Text eine entsprechende Belegstelle herausfinden. PIRLS stuft das Item auf der Schwierigkeitsstufe IV ein. Der Text Nach den internationalen Lesbarkeitsindizes (vgl. Scott, 2013 und Lenhard & Lenhard 2011) ergibt sich für den zugrunde liegenden Text folgende Bewertung: Nach LIX hat der Text einen Schwierigkeitsindex von 26 (der obige Text INFO2 einen Index von 35: etwa Stufe Comic, Luther-Bibel, Werbetext). Der Schwierigkeitsgrad wird also niedriger bemessen als bei dem Text oben, den die österreichischen Kinder wesentlich besser bearbeiten konnten. Flesch Reading Ease score: 68.4 (text scale) Flesch Reading Ease: Standard/durchschnittlich schwer; The Coleman-Liau Index: 10 Empfehlung: 10. Schulstufe; The SMOG Index: 5.9 Empfehlung: 6. Schulstufe. Alle Lesbarkeitsindizes zeigen, dass der Text als ziemlich einfach zu lesen anzusehen und durchaus mit der Schulstufe kompatibel ist. Der verlangte Verstehensprozess Die Aufgabenstellung ist dem Verstehensprozess Interpretieren sowie Verknüpfen von Gedanken und Informationen zugeordnet und ist nach dem internationalen PIRLS-Verständnis als beträchtlich schwerer einzuschätzen als das Auffinden von Informationen im Text oder das Ziehen einfacher Schlussfolgerungen (wie im obigen Beispiel). Es gibt im Text keinerlei wörtliche Anhaltspunkte, d. h. die Schüler/innen können nicht einfach nur schauen, ob die

39 Analysen auf Itemebene in Lesen 37 Wörter des Items irgendwo im Text zu finden sind. Sie müssen den Textsinn erfassen, um die Frage beantworten zu können, und sie müssen die Antwort auch selbstständig formulieren. Der zweite Teil der Aufgabenstellung verlangt, dass die Schüler/innen im Text eine Passage finden, die ihre Charakteristik von Toms Vater belegt, d. h. sie müssen im Text einen Satz oder eine Satzfolge finden, mit der sie untermauern können, dass ihre Aussage (die Antwort auf die Frage, was für ein Mensch Toms Papa ist) richtig ist. Das ist eine Vorgangsweise, die bei einer guten textbezogenen Interpretation literarischer Texte üblich ist allerdings nicht auf dieser Schulstufe. Das Testformat (Art der Aufgabenstellung) Eine offene Aufgabenstellung verlangt von den Schülerinnen und Schülern, dass sie die Antwort selbstständig formulieren. Sie kreuzen nicht einfach an, was sie für richtig halten (wie im MC-Format), sondern sie müssen die Fragestellung voll verstehen und darauf eine passende Antwort formulieren können. Sie müssen wie in diesem Beispiel darüber hinaus ihre Ansicht aus dem Text belegen können, d. h. sie müssen erkennen, welche Textstelle(n) ihre Aussage wahrscheinlich begründen kann (können). Diese Art der Aufgabenstellung ist eindeutig anspruchsvoller als die meisten geschlossenen Schlussfolgerungen Bildungspolitisch wird es kaum im Sinne der österreichischen Verantwortlichen sein, sich damit zufrieden zu geben, dass die österreichischen Schüler/innen bei circa einem Drittel der Items (54 von 142) höhere Lösungshäufigkeiten aufweisen als der PIRLS-Schnitt und in 4 (von 142) Fällen signifikant schlechter abschneiden. Der Rest liegt mehr oder minder im PIRLS-Schnitt. Man wird Maßnahmen entweder im curricularen und/oder methodisch-didaktischen Bereich überlegen müssen, wie die Lesekompetenzen der Schüler/innen in einem Land mit einem elaborierten und vergleichsweise teuren Schulsystem verbessert werden können. Grosso modo lassen sich im Vergleich zu Deutschland und England keine gravierenden und durchgehenden Unterschiede erkennen, vor allem lässt sich kaum bestätigen, dass die Gewöhnung der Kinder anderer Länder an solche Tests (vor allem des geschlossenen Typs Multiple Choice) einen ausschlaggebenden Unterschied erbrächte: Im geschlossenen Testformat (Multiple-Choice) lösen die österreichischen Kinder bei literarischen Texten 75 %, die deutschen 77 % und die englischen 75 %, der PIRLS- Schnitt liegt bei 64 %. Bei Informationstexten liegt die PIRLS-Lösungshäufigkeit bei 58 %, für Österreich bei 67 %, für Deutschland bei 68 % und für England bei 69 %. Es ist also eindeutig nicht das Multiple-Choice-Testformat, das den österreichischen Kindern größere Schwierigkeiten bereitet als denen anderer Länder. Bei den offenen Antworten, also jenen, die selbst formuliert werden müssen, ergeben sich deutlichere Unterschiede: Bei den literarischen Texten liegt der PIRLS-Schnitt bei 48 %, Österreich bei 56 %, Deutschland bei 61 % und England bei 65 % Lösungshäufigkeit. Bei den Informationstexten hat PIRLS eine Lösungshäufigkeit von 40 %, Österreich 42 %, Deutschland 48 % und England 53 %. Somit zeigt sich ein deutlicher Trend: Österreichische Kinder haben mit offenen Antworten bei Informationstexten deutlich größere Schwierigkeiten als deutsche und englische, sie liegen nur knapp über dem PIRLS-Schnitt. Ein deutlicher Unterschied ergibt sich auch bei den Verstehensprozessen: Es gibt nur geringe Unterschiede beim Auffinden expliziter Information, ebenso wenig beim Ziehen einfacher Schlussfolgerungen. Die Österreicher liegen jedoch 6 Prozentpunkte hinter den Deutschen und 11 hinter den Engländern, was das Interpretieren betrifft, und 4 Prozentpunkte bzw. 10 hinter den beiden Ländern beim Untersuchen und Bewerten. Diese Unterschiede ergeben sich vor allem bei Informationstexten. Erstaunlicherweise bereitet auch das Auffinden expliziter Information in literarischen Texten ein Problem (46 % Lösungshäufigkeit gegenüber 52 % in Deutschland und 60 % bei den englischen Kindern). Dies könnte allerdings auch heißen, dass österreichische Schüler/innen nicht gelernt haben, literarische Texte als Informationsquellen zu nutzen und somit faktische Details eher weniger beachten. Das mag zwar zunächst als Erklärungsoption dienen, ist aber letztlich keine Tugend, denn zum Verstehen der durch den jeweiligen Text geschaffenen Welt ist ein Erkennen der konstituierenden Faktoren dieser (fiktionalen) Welt erforderlich. Unseres Erachtens zeigt die Datenlage folgendes Bild: Österreichische Kinder erzielen bei den geschlossenen Aufgabenformaten (Multiple Choice) öfter bessere Ergebnisse als bei den offenen (wo sie selbst eine Antwort formulieren müssen). Das ist ein wichtiger Indikator dafür, dass das eher bescheidene Abschneiden der österreichischen Kinder in PIRLS nicht primär damit beantwortet werden kann, dass sie mit dem Testformat Multiple Choice nicht so vertraut wären wie die Schüler/innen anderer Länder. Und das erfolgt bei denselben Ausgangstexten. Es ist also nicht die relative Schwierigkeit eines Testtexts, der unseren Kindern Probleme bereitet, sondern die Art der Aufgabenstellung und die Art der erwarteten Antwort; haben Schwierigkeiten mit offenen Aufgabenformaten, d. h. sie arbeiten besser, wenn sie aus mehreren Möglichkeiten die richtige wählen können (geschlossenes

40 38 Analysen auf Itemebene in Lesen Format) und nicht die Antwort selbst formulieren müssen; sind beim Identifizieren direkt im Text genannter Informationen (Wiedergeben) und bei einfachen Schlussfolgerungen erkennbar besser als beim Verknüpfen und Interpretieren von Informationen und beim Untersuchen und Bewerten von Inhalt und Sprache in einem Text; haben wenig Probleme mit dem Verstehen von eher schwer eingestuften Texten; haben wenig Schwierigkeiten, wenn sie aus einem Text Informationen entnehmen und daraus einfache Schlüsse ziehen sollen; haben ein Problem damit, wenn sie in literarischen Texten Interpretationen vornehmen sollen, die nicht direkt aus dem Text erschließbar sind und die sie dennoch aus dem Text belegen sollen. Daraus können mit aller gebotenen Vorsicht didaktische Rückschlüsse für den Unterricht gezogen werden: Österreichische Kinder brauchen mehr Anleitung zum genauen Lesen, um Details wahrnehmen und diese Details in einen interpretatorischen Zusammenhang bringen zu können; brauchen ganz grundsätzlich mehr Übung im Umgang mit Informationstexten, das bedeutet jedoch, dass die Nicht-Sprach-Fächer in der Schule stärker gefordert sind, Leseverstehen/Textverstehen mit den Kindern zu trainieren und einzufordern (z. B. auf der Basis der Texte in den jeweiligen Fachlehrbüchern); brauchen mehr Übung im Interpretieren von Textsinn auf der Basis von Evidenz, d. h. sie müssen Textbelege finden lernen, um ihre Interpretationen zu belegen. Sie müssen auch in literarischen Texten die relevanten Informationen/Belegstellen finden; brauchen mehr Übung im eigenständigen Formulieren von Antworten. Diese didaktischen Rückschlüsse müssen vor allem deshalb mit Vorsicht gezogen werden, weil es sich bei internationalen Tests wie PIRLS oder PISA nicht um flächendeckende Überprüfungen aller Schüler/innen einer Jahrgangskohorte handelt, sondern nur um eine statistisch ausreichende Auswahl, die eine Hochrechnung erlaubt. Die Auswahl folgt zwar im Prinzip nachvollziehbaren sozioökonomischen Kriterien, dennoch ist ein verlässlicher Rückschluss methodisch-didaktischer Art nur im Grundsatz möglich, nicht aber als direkte Handlungsanweisung an die Lehrerinnen und Lehrer. Das Abschneiden der österreichischen Kinder bei PIRLS 2011 ist keineswegs katastrophal oder erschreckend, es ist an sich insgesamt nicht schlecht. Jedoch, wie schon oben angedeutet, ist es erstaunlich, dass das Ergebnis nicht deutlich besser ist in einem traditionsreichen und eher teuren Schulsystem. PIRLS (und auch PISA) erlaubt nur diese Rückschlüsse, die Bildungsverantwortlichen müssen sich allerdings fragen, warum das Ergebnis nur so ist, wie es ist. Literatur Lenhard, A. & Lenhard, W. (2011). Lesbarkeitsindex (LIX). Zugriff am unter Mullis, I. V. S., Martin, M. O., Kennedy, A. M., Trong, K. L. & Sainsbury, M. (2009). PIRLS 2011 Assessment Framework. Chestnut Hill, MA: TIMSS & PIRLS International Study Center, Boston College. Renner, M. (2013). Textkompetenz in allen Unterrichtsgegenständen. Handreichung für Autorinnen und Autoren von Unterrichtsmaterialien. Wien: Kopierzentrale BMUKK. Scott, B. (2013). Text Readability Consensus Calculator. Retrieved October 15, 2013, from com/free-readability-formula-tests.php Suchań, B., Wallner-Paschon, C., Bergmüller, S. & Schreiner, C. (Hrsg.). (2012). PIRLS & TIMSS Schülerleistungen in Lesen, Mathematik und Naturwissenschaft in der Grundschule. Erste Ergebnisse. Graz: Leykam. Wallner-Paschon, C. & Widauer, K. (2012). Tests und Fragebögen. In B. Suchań, C. Wallner-Paschon, S. Bergmüller & C. Schreiner (Hrsg.), PIRLS & TIMSS Die Studie im Überblick (S ). Graz: Leykam.

41 Mathematik weiblich? Leistung, Selbstkonzept und Studienabschlüsse im Geschlechtervergleich Mathematik weiblich? Leistung, Selbstkonzept und Studienabschlüsse im Geschlechtervergleich Silvia Salchegger Ist die Mathematik eine männliche Domäne? Diese Frage wird anhand von Geschlechterunterschieden in drei mathematikbezogenen Merkmalen untersucht: der Mathematikleistung, dem Mathematikselbstkonzept und den Absolventenraten in mathematikintensiven Studienfächern. Während sich bei der Leistung kaum bedeutsame Geschlechterunterschiede finden lassen, schätzen Mädchen in den meisten Ländern ihre mathematischen Fähigkeiten schlechter ein als Buben (d. h. sie verfügen über ein niedrigeres Mathematikselbstkonzept). Auch beim Abschluss mathematikintensiver Studienrichtungen sind Frauen in den OECD-Ländern in der Regel unterrepräsentiert. Es zeigt sich, dass Frauen in jenen Ländern häufiger mathematikintensive Studienrichtungen absolvieren, in denen auch schon bei 10-jährigen Mädchen das Mathematikselbstkonzept positiver ausgeprägt ist. Einleitung Die Frage, ob es Geschlechterunterschiede in Mathematik gibt, wurde bereits eingehend beforscht. In der folgenden Einleitung wird zunächst ein Überblick über die Ergebnisse dieser Forschungsarbeiten zur Mathematikleistung, zum Mathematikselbstkonzept und zu Studienraten in mathematikintensiven Fächern gegeben. Darüber hinaus wird auf mög liche Gründe für die gefundenen Geschlechterunterschiede eingegangen. Geschlechterunterschiede in der Mathematikleistung Unterscheiden sich Mädchen und Buben in ihrer Mathematikleistung? Großangelegte Metaanalysen, in denen eine Vielzahl von Ländern und Erhebungen berücksichtigt wurden, kamen zum Konsens, dass Leistungsunterschiede zwischen Buben und Mädchen in Mathematik meist un - bedeutend sind (Else-Quest, Hyde & Linn, 2010; Hyde, Lindberg, Linn, Ellis & Williams, 2008; Lindberg, Hyde, Peterson & Linn, 2010). Zwar weisen internationale Schüler leistungsvergleiche immer wieder für einige Länder darunter auch Österreich statistisch signifikante Leistungsunterschiede zwischen Mädchen und Burschen nach (z. B. Filzmoser & Suchań, 2013; OECD, 2009; OECD, 2013; Wallner-Paschon, 2012a), diese sind allerdings in der Regel von geringer praktischer Bedeutsamkeit. Eine Metaanalyse von Else-Quest et al. (2010), die sich auf Daten aus 69 Ländern stützt, zeigt, dass es nur in acht Ländern Geschlechterunterschiede in der Mathematikkompetenz gibt, die die Schwelle zur praktischen Bedeutsamkeit (d +/ 0.20; vgl. Methodenteil) überschreiten (zugunsten der 14- bis 16-jährigen Burschen in sechs Ländern, zugunsten der gleichaltrigen Mädchen in zwei Ländern). In den rest lichen 61 Ländern sind die Leistungs unterschiede kleiner als d +/ 0.20 und können als praktisch unbedeutend ein gestuft werden. Unter diesen Ländern befindet sich auch Österreich mit einer Effektstärke von d = 0.08 (bezogen auf die PISA-2003-Daten). Hier muss jedoch darauf hingewiesen werden, dass die Effektstärken der Geschlechterunterschiede in der Mathematikleistung in Österreich normalerweise größer ausfallen und bei den sonstigen PISA-Erhebungen (2000, 2006, 2009 und 2012) im Bereich von 0.20 bis 0.24 lagen. Am Ende der Grundschule (4. Schulstufe) liegen die Geschlechterunterschiede in der Mathematikkompetenz fast gleich hoch wie bei den 15-/16-jährigen PISA-Schülerinnen und Schülern (zwischen 0.15 bei TIMSS 1995 sowie TIMSS 2011 und 0.20 bei TIMSS 2007; Wallner-Paschon, 2010, 2012a). Im internationalen Vergleich weist Österreich in den meisten Erhebungen eine überdurchschnittlich hohe Leistungsdifferenz in Mathematik auf: Beispielsweise ist der Leistungsvorsprung von Burschen gegenüber Mädchen bei PISA 2012 OECD-weit nur in Luxemburg und Chile noch größer als in Österreich (Filzmoser & Suchań, 2013). Trotz dieser im Ländervergleich hohen Geschlechterunterschiede wird selbst in Österreich die Schwelle, ab der von einem kleinen Effekt gesprochen wird (d = 0.20), in allen bisherigen Erhebungen, wenn überhaupt, dann nur geringfügig überschritten. Bezogen auf die Leistung lässt sich demnach keine bedeutungsvolle männliche Dominanz in Mathematik feststellen: Buben erzielen in der Regel keine praktisch bedeutsam besseren Mathematikleistungen als Mädchen. Geschlechterunterschiede im Mathematikselbstkonzept Ausgehend von diesen geringen Leistungsunterschieden wäre anzunehmen, dass sich Mädchen und Buben nicht wesentlich in der Selbsteinschätzung ihrer Mathematikkompetenz unterscheiden. Studien zum Mathematikselbst-

42 40 Mathematik weiblich? Leistung, Selbstkonzept und Studienabschlüsse im Geschlechtervergleich konzept zeigen jedoch, dass Mädchen selbst bei gleicher oder besserer Leistung ihre Mathematikkompetenz geringer einschätzen als Buben (Gabriel, Mösko & Lipowsky, 2011; Helmke, 1997; Marsh & Yeung, 1998; Sáinz & Eccles, 2012). Auch die bereits oben erwähnte ländervergleichende Metaanalyse von Else-Quest et al. (2010) zeigt, dass 14- bis 16-jährige Burschen in der Regel ein deutlich höheres Mathematikselbstkonzept aufweisen als gleichaltrige Mädchen, obwohl es kaum Leistungsunterschiede gibt: Die Selbstkonzeptunterschiede zwischen Mädchen und Burschen erreichen in 42 Ländern (von 69) die Schwelle von d = 0.20 (ohne Ausnahme immer zugunsten der Buben). In elf Ländern liegt die Effektstärke sogar über 0.40, was von Hattie (2009) als Schwelle für einen mittleren Effekt definiert wird (vgl. Methodenteil). Mit einer Effektstärke von 0.44 reiht sich auch Österreich unter diese elf Länder mit den größten Geschlechterunterschieden im Mathematikselbstkonzept 15-Jähriger bei PISA 2003 ein. Auch bei den Kindern am Ende der Volksschule liegen die Geschlechterdifferenzen im Mathematikselbstkonzept in Österreich bereits ähnlich hoch (d = 0.48 bei TIMSS 2007; Wallner- Paschon, 2010). Bezogen auf das Selbstkonzept ist Mathematik demnach eine stärkere männliche Domäne: Burschen schätzen ihre Mathematikleistungen in der Regel bedeutsam höher ein als Mädchen, insbesondere auch in Österreich. Geschlechterunterschiede bei der Beteiligung an mathematikintensiven Studienrichtungen Eine dritte wesentliche Komponente bei der Untersuchung von Geschlechterunterschieden in Mathematik ist die Berufs- und Bildungswahl. Hier zeigt sich, dass Frauen in mathematisch-naturwissenschaftlichen Fächern unterrepräsentiert sind (Ceci, Williams & Barnett, 2009; European Commission, 2013; OECD, 2011). Beispielsweise belegen Statistiken der OECD (2011, Tab. A4.6), dass in Österreich unter den 25- bis 34-jährigen Erwerbstätigen 2,4 % der Männer, aber nur 0.9 % der Frauen ein naturwissenschaftliches oder technisches Studium absolviert haben. Im EU-Schnitt ist diese Diskrepanz mit 2,3 % vs. 1,2 % etwas weniger gravierend. Daten der EU (European Commission, 2013) belegen, dass in Österreich der Frauenanteil unter den Doktorandinnen und Doktoranden in Natur wissenschaft, Mathematik und Informatik bei 36 % liegt, im EU-Schnitt beträgt dieser 40 %. Tabelle (letzte Spalte) gibt einen Überblick über den Anteil von Frauen, der ein mathematikintensives Studium (Biowissenschaften, physikalische Wissenschaften, Mathematik und Statistik, Computerwissenschaften) absolviert hat, für die Teilnehmerländer von TIMSS Diese Angaben basieren auf Daten der UNESCO (n. d.). Im Durchschnitt der hier berichteten Länder sind 43 % der Absolventinnen und Absolventen weiblich, in Österreich liegt der Anteil mit 34 % deutlich niedriger. Bemerkenswert sind die hohen Absolventenquoten von Frauen in arabischen Ländern (Saudi-Arabien, Iran, Oman und Katar). Für die OECD-/EU-Staaten kann jedoch in der Regel festgestellt werden, dass bezogen auf die Abschlussquoten mathematikintensiver Studienrichtungen Mathe matik männlich dominiert ist. Mögliche Gründe für Geschlechterunterschiede Woran könnte es liegen, dass Frauen viel seltener mathematikintensive Studienrichtungen absolvieren als Männer, obwohl sie etwa dasselbe Leistungspotenzial dazu hätten? Eccles (1994) versucht Bildungs- und Berufsentscheidungen anhand eines Erwartung-mal-Wert-Modells zu erklären. Demnach wird die Berufs- und Bildungswahl durch zwei wesentliche Komponenten bestimmt: Der Erwartung für Erfolg und dem subjektiven Wert einer Tätigkeit. Personen werden eher jene Tätigkeiten wählen, von denen sie überzeugt sind, dass sie sie schaffen werden und denen sie einen hohen Wert zuschreiben. Frauen werden sich also eher dann für mathematikintensive Studienfächer entscheiden, wenn sie a) davon überzeugt sind, über eine hohe Mathematikkompetenz zu verfügen (d. h. ein hohes Mathematikselbstkonzept aufweisen) 1 und b) der Mathematik einen hohen subjektiven Wert zuschreiben (d. h. großes Interesse daran haben, ihr hohe Wichtigkeit und Nützlichkeit beimessen). Im vorliegenden Beitrag wird genauer auf die Bedeutung des Mathematikselbstkonzepts für die geschlechtsspezifische Berufs- und Studienwahl eingegangen. Zur Entwicklung des Selbstkonzepts wurde gezeigt, dass dieses stark von vorausgehenden Leistungserfahrungen (vor allem Noten) abhängt. Es wird aber auch durch Sozialisationserfahrungen in Schule und Elternhaus sowie durch Vergleichsprozesse mitbestimmt (vgl. Hellmich & Günther, 2011). Im Folgenden wird genauer darauf eingegangen, inwiefern diese Faktoren dafür verantwortlich sein könnten, dass Mädchen ein deutlich schlechteres Mathematikselbstkonzept entwickeln als Buben. Zunächst kann festgestellt werden, dass die schlechteren Fähigkeitseinschätzungen der Mädchen nicht durch schlechtere Mathematiknoten von Mädchen erklärt werden können: Mädchen erhalten in Mathematik etwa gleich gute Noten wie Burschen (vgl. Bacher, Beham & Lachmayr, 2008; Spiel, Schober & Litzenberger, 2008; Schreiner, Breit & Haider, 2008; Voyer & Voyer, 2014). Bei den Vergleichsprozessen werden soziale und dimensionale Vergleiche als bedeutsam für die Selbstkonzeptentwicklung erachtet. Beim sozialen Vergleich setzen die Kinder ihre eigene Leistung in Beziehung zu den Leistungen ihrer Mitschüler/innen. Dies hat zur Folge, dass gleich kompetente Kinder in leistungsstarken Klassen im Durchschnitt ein niedrigeres Fähigkeitsselbstkonzept aufweisen als in Klassen mit schwa- 1 Die Komponenten Erwartung für Erfolg und Selbstkonzept, werden in Eccles (1994) Modell als getrennte Faktoren betrachtet. Empirisch lassen sie sich jedoch nicht unterscheiden und werden daher in neueren Studien bedeutungsgleich verwendet (z. B. Nagy et al., 2008). Auch im vorliegenden Beitrag wird nicht zwischen diesen beiden Komponenten unterschieden.

43 Mathematik weiblich? Leistung, Selbstkonzept und Studienabschlüsse im Geschlechtervergleich 41 chem Leistungsniveau (z. B. Marsh, 2005). Bisher liegen allerdings keine Befunde vor, dass diese sozialen Vergleiche geschlechtsspezifischen Mustern folgen würden und somit die unterschiedliche Ausprägung im Selbstkonzept von Mädchen und Buben erklären könnten (vgl. Gabriel et al., 2011). Während bei den sozialen Vergleichen ein Kind seine Leistung mit jener der Mitschüler/innen in Beziehung setzt, erfolgt ein dimensionaler Vergleich innerhalb einer Person zwischen unterschiedlichen Domänen. Sind die eigenen Leistungen zum Beispiel in Deutsch besser als in Mathematik, so erfährt das Deutschselbstkonzept eine Aufwertung, während das Mathematikselbstkonzept abgewertet wird (vgl. Marsh, 1986). Bei der Entwicklung geschlechtsspezifischer Mathematikselbstkonzepte könnte dies relevant sein, da Mädchen den Buben in Lesen in fast allen Ländern deutlich überlegen sind (Wallner-Paschon, 2012b), und sie dadurch häufiger zur Feststellung gelangen können, gut in Lesen zu sein; im Sinne des dimensionalen Vergleichs ist die Feststellung, gut in Lesen zu sein, auch gleichzeitig mit der Feststellung, weniger gut in Mathematik zu sein, verbunden und die Mathematikkompetenz wird abgewertet (vgl. Möller & Marsh, 2013). Es wurde gezeigt, dass Effekte dimensionaler Vergleiche für die Selbstkonzepte bei Kindern im Grundschulalter (und damit bei der im vorliegenden Beitrag untersuchten Population) noch keine wesentliche Rolle spielen (vgl. Möller, Kuska & Zaunbauer, 2011), bei älteren Kindern und Jugendlichen jedoch sehr bedeutsam sind (Möller, Pohlmann, Köller & Marsh, 2009). Eine weitere wesentliche Komponente für die Selbstkonzeptentwicklung von Kindern sind Sozialisationserfahrungen in Schule und Elternhaus (vgl. Hellmich & Günther, 2011). Eltern und Lehrkräfte sind zentrale Vermittler dieser Sozialisationserfahrungen. Bisherige Befunde weisen darauf hin, dass die Entwicklung des Selbstkonzepts bedeutsam durch Geschlechtsrollenzuschreibungen und Geschlechterstereotype von Eltern und Lehrkräften geprägt wird (z B. Frome & Eccles, 1998; Retelsdorf, Schwartz & Asbrock, 2015). Studien hierzu zeigen, dass Einschätzungen von Eltern und Lehrkräften häufig Geschlechterstereotypen folgen, etwa dass Mathematik eher für Buben und weniger für Mädchen ist. Beispielsweise überschätzen Eltern die numerische und figurale Intelligenz ihrer Söhne, die ihrer Töchter unterschätzten sie dagegen (Steinmayr & Spinath, 2009); auch trauen Eltern Söhnen in Mathematik mehr zu als Töchtern (Buff, Reusser, Dinkelmann & Steiner, 2011). Und diese elterlichen Fähigkeitseinschätzungen beeinflussen über die tatsächliche Leistung hinaus das Mathematikselbstkonzept der Schüler/innen (Frome & Eccles, 1998). Auch die Lehrkräfte neigen zu geschlechterverzerrten Wahrnehmungen. So zeigten Ziegler, Kuhn & Heller (1998), dass 27 % der Mathematiklehrer/innen und 30 % der Physiklehrer/ innen Buben für begabter halten als Mädchen; umgekehrt hält jedoch keine der befragten Lehrpersonen Mädchen für begabter als Buben. Entsprechend würden die Lehrkräfte auch Mädchen eher Karrieren in Erziehung, Medizin oder Philologie empfehlen, Buben sehen sie hingegen für mathematischnaturwissenschaftlich-technische Berufe besser geeignet. In einer Studie von Tiedemann (2000a) schätzten Lehrkräfte Mädchen gegenüber Buben im Durchschnitt als weniger talentiert in Mathematik ein, waren überzeugt, dass Mädchen weniger von zusätzlicher Unterstützung profitieren und dass Mädchen sich mehr anstrengen müssen, um gut in Mathematik zu sein. Darüber hinaus führten sie bei Mädchen ein Scheitern eher auf mangelnde Fähigkeit und bei Buben eher auf mangelnde Anstrengung zurück. Ähnlich zeigt der Literaturüberblick von Li (1999), dass Lehrkräfte dazu neigen, die Mathematikfähigkeiten von männlichen Schülern zu überschätzen und höhere Erwartungen in die Mathematikleistung von Buben zu setzen. Ebenso wie die Fähigkeitseinschätzungen der Eltern wirken sich auch jene der Lehrkräfte auf das Selbstkonzept der Kinder aus (Tiedemann, 2000b). Die Einschätzungen der Lehrkräfte scheinen aber noch bedeutsamer zu sein, da diese auch Einfluss auf die Fähigkeitseinschätzungen der Eltern nehmen (Tiedemann, 2000b). Insgesamt verdeutlichen diese Befunde, dass Mädchen und Buben unterschiedliche soziale Erfahrungen in Bezug auf Mathematik machen. Wie stark etwa diese sozialen Erfahrungen geschlechtsspezifisch gefärbt sind, wird auch durch kulturelle Faktoren mitbestimmt (vgl. Else-Quest et al., 2010; Tiedemann, 2002). Etwa wurde gezeigt, dass es in einer Vielzahl an Kulturen Geschlechterstereotype dahingehend gibt, dass Naturwissenschaft stärker männlich als weiblich konnotiert ist (Nosek et al., 2009). Diese Stereotype sind zwar unterschiedlich stark ausgeprägt, jedoch in allen 34 untersuchten Ländern nachweisbar. Kinder internalisieren durch soziale Erfahrungen diese Stereotype etwa im Umgang mit Eltern und Lehrpersonen (vgl. oben). Gesellschaftliche Stereotype spiegeln sich auch in den Berufen wider, die von Frauen und Männern ausgeübt werden. Augenscheinlich für die österreichischen Schüler/innen ist dabei, dass Lehrpersonen in der Volksschule fast zur Gänze Frauen sind, mit sozialen und kulturellen Interessen und praktisch nicht ausgeprägten naturwissenschaftlichen Orientierungen. Geschlechtsspezifische Unterschiede in der Berufswahl vergegenwärtigen den Kindern geschlechtstypische Rollen bilder und beeinflussen auch die Vorstellung der Kinder über Geschlechterrollen (z. B. welcher Beruf für Mädchen passend ist; vgl. Eccles, 1994). Hierzu zeigten Else-Quest et al. (2010) einen signifikanten Zusammenhang zwischen Frauenquoten in der Wissenschaft und Geschlechterunterschieden im Mathematikselbstkonzept 14- bis 16-Jähriger: In Ländern, in denen Frauen häufiger in wissenschaftlichen Positionen anzutreffen sind, liegt das Mathematikselbstkonzept von Mädchen weniger hinter jenem von Burschen zurück.

44 42 Mathematik weiblich? Leistung, Selbstkonzept und Studienabschlüsse im Geschlechtervergleich Das Selbstkonzept kann in diesem Sinn als Output gesellschaftlicher Werte und Normen gesehen werden. Es kann auf der anderen Seite aber auch als Input betrachtet werden, das dazu beiträgt, geschlechterspezifische Rollenverteilungen in der Gesellschaft aufrechtzuerhalten, indem es die individuelle Berufs- und Bildungswahl mitbestimmt. Beispielsweise zeigten Parker et al. (2012), dass die Entscheidung junger Erwachsener, ob sie studieren, stark von schulischen Selbstkonzepten abhängt und das Mathematikselbstkonzept ein starker Prädiktor für die Wahl mathematikintensiver Hauptfächer ist. Ähnlich belegten Köller, Daniels, Schnabel und Baumert (2000), dass das Mathematikselbstkonzept auf der 10. Schulstufe einen hohen Vorhersagewert für die Leistungskurswahl in Mathematik zwei Jahre später hat. Insbesondere konnte die häufigere Leistungskurswahl von Buben zu einem erheblichen Teil durch ihr höheres Selbstkonzept erklärt werden. Eine weitere Studie (Guay, Larose & Boivin, 2004) zeigte, dass das schulische Selbstkonzept von Kindern der vierten bis sechsten Schulstufe auf den zehn Jahre später erreichten Bildungsgrad schließen lässt: Ein höheres Selbstkonzept sagt einen höheren Bildungsgrad voraus. Das Selbstkonzept bleibt auch dann ein signifikanter Prädiktor, wenn nach Leistung und sozialem Status kontrolliert wird. Eder (2012) erklärt die geschlechtsspezifische Berufswahl damit, dass es ab dem elften Lebensjahr zu einer fähigkeitsbezogenen Abgrenzung gegenüber bestimmten Aktivitäten kommt. Ausgegrenzt werden jene Aktivitäten, die nicht mit den eigenen Fähigkeiten vereinbar erscheinen. Ist das Mathematikselbstkonzept folglich in diesem Alter niedrig, werden mathematikbezogene Interessen ausgegrenzt. Im Geschlechtervergleich zeigt sich, dass mathematiknahe praktischtechnische Interessen bei 15-jährigen Mädchen deutlich geringer ausgeprägt sind als bei Burschen (vgl. Eder, 2012). Eine Hebung des Mathematikselbstkonzepts von Mädchen könnte daher auch ihre Entwicklung einschlägiger beruflicher Interessen positiv beeinflussen. Doch nicht nur auf individueller Ebene wurde ein enger Zusammenhang zwischen Selbstkonzept und Berufs- und Bildungsentscheidungen nachgewiesen, sondern auch auf Länderebene. So hat Lenzer (2006) für die 38 Teilnehmerländer von TIMSS 1999 belegt, dass die Größe der Geschlechterunterschiede im Mathematikselbstkonzept ein signifikanter Prädiktor der Studienrate von Frauen in Mathematik und Computerwissenschaft ist: In Ländern, in denen das Mathematikselbstkonzept 14-jähriger Mädchen stärker hinter jenem ihrer männlichen Altersgenossen zurückliegt, wählen Frauen seltener Mathematik und Computerwissenschaft als Studienfach. Das Selbstkonzept scheint somit einen zentralen Angelpunkt einzunehmen: Einerseits wird es durch gesellschaftliche Normen mitbestimmt, andererseits trägt es zur Berufsund Bildungswahl bei, womit gesellschaftliche Rollenverhältnisse aufrechterhalten und weitergeführt werden. Fragestellung Der vorliegende Beitrag geht der Frage nach, wie stark Geschlechterunterschiede in der Mathematikleistung und im Mathematikselbstkonzept bei 10-Jährigen ausgeprägt sind. Die Analysen beziehen sich auf jene 50 Länder, die sich an TIMSS 2011 mit der vierten Schulstufe beteiligt haben. Darüber hinaus wird untersucht, ob Geschlechterunterschiede im Mathematikselbstkonzept 10-Jähriger in Zusammenhang mit Frauenraten in mathematikintensiven Studienrichtungen stehen. Die vorliegende Studie ist die erste, die diesen Zusammenhang bei einer so jungen Altersgruppe untersucht. Konkret werden die folgenden Hypothesen getestet: Geschlechterunterschiede in der Mathematikleistung 10-Jähriger sind in allen Ländern nur von geringer Effektstärke (zwischen 0.20 und +0.20). Geschlechterunterschiede im Mathematikselbstkonzept sind wesentlich größer als in der Mathematikleistung. Es wird für den Großteil der Länder erwartet, dass Buben ein praktisch bedeutsam höheres Mathematikselbstkonzept aufweisen als Mädchen; konkret wird angenommen, dass die Effektstärke des Geschlechterunterschieds im Mathematikselbstkonzept in mehr als der Hälfte der Länder über 0.20 liegt. Die Geschlechterunterschiede im Mathematikselbstkonzept von 10-Jährigen stehen in einem praktisch bedeutsamen Zusammenhang mit der Frauenquote unter den Absolventinnen und Absolventen mathematikintensiver Studienrichtungen: In Ländern, in denen Mädchen ihre Mathematikkompetenz ähnlich gut einschätzen wie Buben, ist der Frauenanteil unter den Absolventinnen und Absolventen mathematikintensiver Studienrichtungen höher. Je weiter die 10-jährigen Mädchen in der Einschätzung ihrer mathematischen Fähigkeiten hinter den Buben zurückliegen, desto geringer ist die Beteiligung von Frauen an mathematikintensiven Fächern. Methode Beschreibung der verwendeten Variablen Die Skala zum Mathematikselbstkonzept von TIMSS 2011 basiert auf den folgenden sieben Items aus dem Schülerfragebogen: Normalerweise bin ich gut in Mathematik; Mathematik fällt mir schwerer als vielen Kindern meiner Klasse; Ich bin einfach nicht gut in Mathematik; Ich lerne schnell in Mathematik; Ich kann schwierige Mathematikaufgaben gut lösen; Meine Lehrerin sagt, ich bin gut in Mathematik; Mathematik fällt mir schwerer als alle anderen Fächer.

45 Mathematik weiblich? Leistung, Selbstkonzept und Studienabschlüsse im Geschlechtervergleich 43 Die Kinder sollten für jede dieser Aussagen angeben, wie sehr sie ihr zustimmen. Vier Antwortkategorien standen zur Auswahl, von stimme völlig zu über stimme eher zu und stimme eher nicht zu bis zu stimme überhaupt nicht zu. Die kursiv gesetzten Items sind negativ formuliert und wurden bei der Skalenkonstruktion umgepolt. Die Mathematikselbstkonzept-Skala wurde so konstruiert, dass der Mittelwert über alle Länder bei 10 liegt und die Standardabweichung bei 2. Höhere Werte indizieren ein positiveres Selbstkonzept. Die genaue Skalenkonstruktion wird bei Martin, Mullis, Foy und Arora (2012) beschrieben. In diesem Dokument wird auch die hohe Reliabilität der Selbstkonzeptskala belegt: In mehr als der Hälfte der Teilnehmerländer liegt Cronbachs α über 0,80, nur in einem (Marokko) unter 0,60. Die Mittelwerte der Mädchen und Buben jedes Landes sind in Tabelle eingetragen. Der Anteil fehlender Werte liegt überall unter 10 %, außer für Aserbaidschan (Mädchen 17 %, Buben 18 %) und für die Buben Deutschlands (12 %). Der Frauenanteil unter den Absolventinnen und Absolventen mathematikintensiver Studienrichtungen (Biowissenschaften, Mathematikleistung Mathematikselbstkonzept Frauenanteil (%) an den Absolvent/innen mathematikintensiver Land MW Buben MW Mädchen d MW Buben MW Mädchen d Studienrichtungen ARE 430 (106) 438 (91) (2.0) (2.0) 0.09 m ARM 451 (90) 454 (87) (2.1) (2.1) AUS 519 (89) 513 (83) (2.2) 9.88 (2.1) AUT 513 (63) 504 (61) (2.1) 9.97 (2.0) AZE 460 (101) 466 (101) (1.9) (1.9) BEL (fl) 553 (60) 545 (59) (1.9) 9.38 (1.8) BHR 432 (98) 440 (81) (1.8) (1.8) 0.06 m CHL 466 (83) 457 (77) (1.9) 9.26 (1.9) CZE 516 (71) 505 (69) (1.9) 9.54 (1.8) DEU 532 (63) 523 (61) (2.2) 9.79 (2.1) DNK 540 (71) 534 (70) (1.9) 9.61 (1.7) ESP 488 (72) 477 (68) (2.1) 9.59 (2.0) FIN 549 (71) 542 (66) (2.0) 9.49 (2.0) GBR (E) 544 (93) 541 (85) (1.9) 9.74 (1.8) GBR (N) 563 (88) 562 (83) (2.0) 9.76 (1.9) GEO 447 (94) 454 (85) (2.1) (2.0) HKG 604 (69) 598 (63) (2.0) 8.91 (2.0) 0.44 m HRV 495 (69) 485 (65) (2.3) 9.95 (2.2) HUN 517 (93) 514 (87) (2.3) (2.3) IRL 529 (81) 526 (75) (2.1) (2.1) IRN 431 (95) 431 (90) (2.0) (2.1) ITA 512 (73) 503 (71) (1.8) 9.69 (1.7) 0.27 m JPN 587 (75) 584 (70) (1.5) 8.33 (1.4) KAZ 504 (87) 498 (80) (2.1) (1.9) 0.01 m KOR 608 (70) 601 (66) (1.6) 8.82 (1.3) KWT 323 (104) 358 (96) (1.9) (2.0) 0.15 m LTU 534 (76) 533 (72) (1.9) 9.56 (1.9) MAR 331 (104) 338 (101) (1.5) 9.75 (1.6) MLT 499 (80) 492 (75) (2.3) (2.2) NLD 544 (53) 536 (53) (2.0) 9.62 (2.0) NOR 499 (71) 492 (66) (2.0) (1.8) NZL 486 (86) 486 (81) (1.8) 9.47 (1.7) OMN 372 (109) 398 (97) (2.0) (2.0) POL 486 (76) 476 (70) (2.1) (2.0) PRT 535 (70) 529 (67) (1.9) 9.32 (1.6) QAT 407 (110) 420 (100) (2.0) (2.0)

46 44 Mathematik weiblich? Leistung, Selbstkonzept und Studienabschlüsse im Geschlechtervergleich Mathematikleistung Mathematikselbstkonzept Frauenanteil (%) an den Absolvent/innen mathematikintensiver Land MW Buben MW Mädchen d MW Buben MW Mädchen d Studienrichtungen ROU 484 (105) 481 (106) (2.2) (2.1) RUS 542 (75) 543 (72) (2.0) 9.68 (2.1) 0.15 m SAU 402 (114) 418 (84) (1.7) (1.9) SGP 604 (81) 608 (75) (2.1) 8.87 (1.9) 0.30 m SRB 519 (91) 513 (87) (2.0) 9.98 (1.9) SVK 511 (80) 503 (79) (2.1) 9.69 (2.0) SVN 518 (70) 508 (67) (2.0) (1.9) SWE 506 (67) 501 (66) (2.0) (1.7) THA 451 (85) 465 (74) (1.3) 9.32 (1.3) TUN 356 (97) 363 (92) (1.7) (1.7) 0.03 m TUR 469 (102) 470 (99) (2.0) (2.0) TWN 590 (74) 592 (72) (2.1) 8.87 (2.0) 0.27 m USA 545 (77) 536 (73) (2.1) (2.1) YEM 243 (111) 255 (108) (1.6) 9.63 (1.7) 0.14 m MW = Mittelwert; d = Effektstärke des Geschlechterunterschieds; m = Werte fehlen; Standardabweichungen stehen in Klammern; Länderkürzel vgl. Abb. 1 (Einführung). Tabelle 1.3.1: Mathematikleistung, Mathematikselbstkonzept und Abschluss mathematikintensiver Studienrichtungen im Geschlechtervergleich physikalische Wissenschaften, Mathematik und Sta tistik, Computerwissenschaften) wurde der Datenbank der UNESCO (n. d.) entnommen. Die Frauenraten beziehen sich auf das Jahr 2010, außer in Australien, Marokko und Korea, wo das Jahr 2009 als Referenzpunkt herangezogen wurde, da keine Daten für 2010 vorliegen. Für England und Nordirland wurde die Rate von Großbritannien insgesamt herangezogen. Für elf der 50 TIMSS-Teilnehmerländer liegen keine Angaben zu Absolventenraten vor (vgl. Tab ). In den übrigen Ländern schwankt der Frauen anteil unter den Absolventinnen und Absolventen mathematikinten siver Studienrichtungen zwischen 23 % in den Niederlanden und 73 % in Saudi-Arabien. In 30 von 39 Ländern liegt der Frauenanteil unter der Schwelle von 50 %, die Geschlechterparität kennzeichnet. Ermittlung der Effektstärke Um die Größen der Geschlechterunterschiede über unterschiedliche Metriken (Mathematik-Leistungsskala, Mathematik-Selbstkonzept skala) hinweg vergleichbar zu machen, werden absolute Geschlechterunterschiede in das Effektstärkenmaß Cohen s d transformiert. Dies ist ein etabliertes Maß zur Ermittlung der praktischen Bedeutsamkeit von Mittelwertdifferenzen (Cohen, 1988; Ellis, 2010; vgl. auch die Einleitung zu diesem Bericht). Die Effektstärke d wurde nach folgender Formel berechnet (M steht dabei für Mittelwert, SD für Standardabweichung des Mittelwerts): Im vorliegenden Beitrag wird, wie in Studien zu Geschlechterunterschieden üblich (z. B. Else-Quest et al., 2010), der Mittelwert der Mädchen vom Mittelwert der Buben abgezogen, womit positive Werte von d anzeigen, dass Buben im Durchschnitt eine höhere Ausprägung als Mädchen aufweisen (d. h. eine höhere Leistung oder ein positiveres Selbstkonzept), negative Werte indizieren eine höhere Ausprägung der Mädchen. Angelehnt an Hattie (2009) werden Effekte ab einer Größe von d = 0.20 als klein eingestuft und ab einer Größe von d = 0.40 als mittel. Effekte unter einer Größe von 0.20 werden als praktisch nicht bedeutsam erachtet (vgl. Cohen, 1988; Else- Quest et al., 2010; Hattie, 2009). Eine Effektstärke von 0.20 bedeutet, dass sich 85,3 % der Werteverteilungen von zwei Gruppen (im vorliegenden Beitrag von Mädchen und Buben) überlappen. Bei einer Effektstärke von 0.40 überlappen sich die Verteilungskurven nur mehr zu 72,6 % und der Unterschied zwischen zwei Mittelwerten beträgt 40 % einer Standardabweichung. Ergebnisse In Abbildung werden Effektstärken von Geschlechterunterschieden in der Mathematikleistung und im Mathematikselbstkonzept dargestellt. Auf der linken Seite der Abbildung sind die Länder entsprechend der Effektstärke der Geschlechterdifferenzen in der Mathematikleistung eingetragen, auf der rechten Seite erfolgt eine Darstellung nach Geschlechterdifferenzen im Mathematikselbstkon-

47 Mathematik weiblich? Leistung, Selbstkonzept und Studienabschlüsse im Geschlechtervergleich 45 zept. Der Wertebereich zwischen / wurde weiß belassen. Für Länder in diesem Bereich liegen keine praktisch bedeutsamen Geschlechterunterschiede vor. Im hellblau gekennzeichneten Wertebereich befinden sich Länder, in denen Geschlechterdifferenzen praktisch bedeutsam sind, der Effekt aber insgesamt klein ist. Im mittelblau gekennzeichneten Wertebereich befinden sich Länder, in denen Geschlechterdifferenzen praktisch bedeutsam sind und der Effekt eine mittlere Größe erreicht (mindestens 0.40). Aufseiten der Mathematikleistung wird deutlich, dass in keinem der 50 Länder Buben praktisch bedeutsam höhere Leistungen erbringen als Mädchen. Bemerkenswert ist, dass im Oman und in Kuwait im Gegenteil sogar Mädchen eine bedeutsam höhere Mathematikleistung aufweisen als Buben. Österreich befindet sich zwar unter den Ländern mit den höchsten Geschlechterunterschieden in der Mathematikleistung zugunsten der Buben, bleibt mit d = 0.15 aber trotzdem unter der Schwelle zur praktischen Bedeutsamkeit. Hypothese 1, in der angenommen wurde, dass Leistungsunterschiede in Mathematik in allen Ländern nur von geringer Effektstärke sind, konnte somit größtenteils bestätigt werden: Abgesehen vom Oman und von Kuwait, wo Mädchen eine bedeutsam höhere Mathematikkompetenz aufweisen als Buben, sind keine praktisch bedeutsamen Geschlechterunterschiede in der Mathematikleistung feststellbar. Mathematikleistung 0.50 Mathematikselbstkonzept NLD HKG DEU BEL (fl) JPN AUT ESP PRT FIN DNK 0.30 SGP SVN LTU GBR (E) TWN ITA CZE SVK 0.25 MLT NOR POL GBR (N) AUS USA KOR 0.20 HRV CHL HUN NZL CZE HRV ESP NLD AUT 0.15 SWE IRL RUS DEU SVN BEL (fl) CHL POL ITA SRB USA KOR NOR SVK FIN 0.10 PRT MLT HKG DNK SRB AUS SWE KAZ Effektstärke des Geschlechterunterschieds ROU 0.05 TUR GEO JPN IRL ROU HUN GBR (E) ARM LTU KAZ mittlerer Effekt kleiner Effekt praktisch bedeutsame Geschlechterunterschiede zugungsten der Buben keine praktisch bedeutsamen Geschlechterunterschiede

48 46 Mathematik weiblich? Leistung, Selbstkonzept und Studienabschlüsse im Geschlechtervergleich Mathematikleistung IRN NZL GBR (N) 0 Mathematikselbstkonzept TWN RUS TUR TUN ARM THA IRN SGP 0.05 BHR TUN MAR AZE AZE BHR ARE GEO ARE 0.10 MAR YEM QAT SAU 0.15 QAT YEM KWT OMN keine praktisch bedeutsamen Geschlechterunterschiede THA 0.20 Länderkürzel vgl. Abb. 1 (Einführung) OMN KWT SAU kleiner Effekt mittlerer Effekt praktisch bedeutsame Geschlechterunterschiede zugungsten der Mädchen Abbildung 1.3.1: Effektstärken von Geschlechterunterschieden in der Mathematikleistung und im Mathematikselbstkonzept im internationalen Vergleich (TIMSS 2011) Anders verhält es sich beim Mathematikselbstkonzept. Hier schätzen in 27 der 50 Länder Buben ihre Mathematikleistung bedeutsam höher ein als Mädchen. Einzig in Saudi- Arabien ist das Mathematikselbstkonzept der Mädchen bedeutsam positiver als jenes der Buben. In Österreich sind die geschlechterspezifischen Selbstkonzeptunterschiede am siebthöchsten unter den 50 Ländern: Die Effektstärke, mit der Mädchen hinter den Buben zurückliegen, beträgt 0.37, womit fast schon die Schwelle für einen mittleren Effekt (d = 0.40) erreicht wird. Länder, in denen ein solcher mittlerer Effekt vorliegt, sind die Niederlande, Hongkong, Deutschland, der flämische Teil Belgiens und Finnland. Somit kann auch Hypothese 2 bestätigt werden: Tatsächlich weisen im Großteil der Länder (27 von 50) Buben ein praktisch bedeutsam höheres Mathematikselbstkonzept auf als Mädchen.

49 Mathematik weiblich? Leistung, Selbstkonzept und Studienabschlüsse im Geschlechtervergleich 47 Abbildung zeigt den Zusammenhang zwischen dem Mathematikselbstkonzept und der Absolventenrate von Frauen in mathematikintensiven Studienrichtungen. Hier ergibt sich ein sowohl statistisch als auch praktisch hoch bedeutsamer Zusammenhang von r (38) =.77 (p <.01). Das heißt, je höher in einem Land die Absolventenrate von Frauen in mathematikintensiven Studienrichtungen ist, desto positiver ist das Selbstkonzept von Mädchen gegenüber jenem von Buben ausgeprägt. Da es sich um ein Zusammenhangsergebnis handelt, kann es natürlich auch umgekehrt gelesen werden: Je positiver das Selbstkonzept von 10-jährigen Mädchen gegenüber jenem gleichaltriger Buben in einem Land ausgeprägt ist, desto höher ist die Absolventenrate von Frauen in mathematikintensiven Studienrichtungen. Zu dieser zweiten Interpretationsmöglichkeit muss angemerkt werden, dass das Selbstkonzept der aktuell Zehnjährigen natürlich keinen Einfluss auf die derzeitigen Studienquoten nehmen kann. Ein Längsschnittvergleich zwischen TIMSS 1995 und TIMSS 2011 deutet jedoch darauf hin, dass Geschlechterunterschiede im Mathe matikselbstkonzept über die Zeit hinweg ziemlich stabil sind. So haben im Jahr % der österreichischen Buben und 80 % der Mädchen die Aussage Ich bin normalerweise gut in Mathematik 2 mit stimmt genau oder stimmt eher schon beantwortet. Im Jahr 2011 haben 81 % der Buben und 75 % der Mädchen der fast identen Aussage Normalerweise bin ich gut in Mathematik etwas oder sehr zugestimmt. Mit 7 bzw. 6 Prozentpunkten Unterschied sind die Geschlechterdifferenzen damit annähernd gleich geblieben. Das heißt, bei den heutigen Endzwanzigern (und damit den potenziellen Studienabsolventen von heute) waren die Geschlechterunterschiede im Selbstkonzept am Ende der Volksschule bereits ähnlich hoch ausgeprägt wie bei den aktuell 10-Jährigen. Bemer- 100 Frauenanteil an den Abslovent/innen mathematikintensiver Studienrichtungen SAU r =.77 (p <.01) IRN OMN THA QAT AZE ARM MAR TUR ROU PRT HRV GEO KOR FIN SRB POL SVK DEU SWE USA IRL CZE SVN NZL HUN LTU ESP AUS DNK NOR MLT AUT BEL (fl) GBR (N) GBR (E) JPN CHL NLD % Mädchen haben höheres MSK Buben haben höheres MSK Effektstärke des Geschlechterunterschieds im Mathematikselbstkonzept (MSK) 10-Jähriger Länderkürzel vgl. Abb. 1 (Einführung) Abbildung 1.3.2: Zusammenhang zwischen dem Mathematikselbstkonzept und dem Anteil von Frauen in mathematikintensiven Studienrichtungen (TIMSS 2011, UNESCO 2010) Dies ist das einzige Item der aktuellen TIMSS-Selbstkonzeptskala, das auch bereits bei TIMSS 1995 in nahezu identer Form erhoben wurde.

50 48 Mathematik weiblich? Leistung, Selbstkonzept und Studienabschlüsse im Geschlechtervergleich kenswert ist, dass sowohl die Mädchen als auch die Buben ihre Mathematikkompetenz heute kritischer einschätzen als Mitte der 1990er Jahre. Im folgenden Diskussionsteil wird die Rolle des Selbstkonzepts als Ursache und Folge von geschlechterverzerrten Studienraten genauer beleuchtet. Diskussion Die vorliegende Studie hat gezeigt, dass es bei 10-Jährigen in keinem der 50 untersuchten Länder einen praktisch bedeutsamen Geschlechterunterschied in der Mathematikleistung zugunsten der Buben gibt. Geschlechterunterschiede im Mathematikselbstkonzept sind jedoch im Großteil der TIMSS-Länder bedeutsam. Das heißt, obwohl Mädchen und Buben etwa gleich gute Mathematikleistungen erbringen, sind Mädchen weniger als Buben davon überzeugt, gut in Mathematik zu sein. Dies gilt insbesondere auch für Österreich. Zwar ist in Österreich der Geschlechterunterschied in der Mathematikleistung im Ländervergleich relativ hoch ausgeprägt, die Schwelle zur praktischen Bedeutsamkeit wird aber trotzdem nicht überschritten. Der Geschlechterunterschied im Mathematikselbstkonzept ist hingegen praktisch bedeutsam: Buben schätzen ihre Mathematikleistung deutlich besser ein als Mädchen. Ähnliche Ergebnisse lassen sich auch für die OECD-Länder feststellen, nicht aber für die arabischen. Vor allem Saudi-Arabien fällt aus dem Rahmen: Hier schätzen Mädchen ihre Mathe matikleistungen bedeutsam besser ein als Buben. In einer Reihe weiterer arabischer Länder (z. B. Kuwait, Jemen, Oman und Katar) weisen Mädchen ein tendenziell höheres Mathematikselbstkonzept auf als Buben. Auch bei der Mathematikleistung zeigt sich in den arabischen Ländern eher eine Überlegenheit der Mädchen. Hohe Frauenbeteiligung in arabischen Ländern Woran könnte es liegen, dass gerade in den arabischen Ländern Mädchen ein positiveres Selbstkonzept aufweisen als Buben? Eine Erklärung geht davon aus, dass in diesen Kulturen Vergleiche mit anderen eher gruppenintern durchgeführt werden (z. B. Costa, Terracciano & McCrae, 2001). Dies hieße, dass sich Mädchen in arabischen Ländern eher nur mit Mädchen vergleichen und Buben mit Buben geschlechterübergreifende Vergleiche finden kaum statt. Dies ist plausibel, da auch die Schulen in diesen Ländern stark geschlechtersegregiert sind (vgl. Wiseman, 2008). Dennoch warnen Else-Quest et al. (2010) davor, den einfachen Schluss zu ziehen, Geschlechtersegregation würde zu mehr Geschlechtergerechtigkeit führen. Wisemann (2008) zeigt, dass in Ländern mit einem hohen Anteil monoedukativer Schulen Leistungsunterschiede in Mathematik sehr heter ogen ausfallen. Auch die OECD (2009) bestätigt, dass monoedukativ unterrichtete Mädchen in der Regel keinen Leistungsvorteil gegenüber koedukativ unterrichteten Mädchen haben insbesondere dann, wenn nach sozialem Status kontrolliert wird. Zuletzt zeigte eine groß angelegte Metaanalyse über 184 Studien aus 21 Nationen (Pahlke, Hyde & Allison, 2014), dass monoedukativer Unterricht keinen Vorteil gegenüber koedukativem hat, weder für Buben noch für Mädchen. Dies gilt für eine breite Reihe an Ergebnisgrößen, insbesondere auch für die Mathematikleistung, das Selbstkonzept und Bildungsaspirationen. Bemerkenswert an den arabischen Ländern ist nicht nur das relativ positive Mathematikselbstkonzept der Mädchen, sondern auch die hohen Frauenanteile in mathematikintensiven Studienrichtungen (vgl. Tab ). Laut Lenzer (2006) haben Frauen in der arabischen Welt das Bedürfnis, sich in einer männerdominierten Gesellschaft zu beweisen, indem sie herausfordernde Studienrichtungen wählen. Weiters berichtet Lenzer davon, dass in arabischen Ländern jene Berufe als passend für Frauen angesehen werden, die wenig Kontakt mit Männern erfordern, ein Anspruch, den die Arbeit von Mathematikern und Computerwissenschaftlern in der Regel erfüllt. Charles (2011) geht auch davon aus, dass Frauen in weniger entwickelten Ländern ihre Studienwahl eher nach praktisch-ökonomischen Gesichtspunkten treffen, während in westlichen Gesellschaften der Wunsch nach Selbstverwirklichung im Vordergrund steht. Im Gegensatz zu den arabischen Ländern sind Frauen in OECD-Staaten in mathematikintensiven Studienrichtungen in der Regel unterrepräsentiert. Auch Österreich macht hier keine Ausnahme: Frauen stellen nur 34 % aller Absolventinnen und Absolventen in mathematikintensiven Studienrichtungen. Nur in fünf Vergleichsländern ist diese Rate noch niedriger (den Niederlanden, Chile, Japan, dem flämischen Teil Belgiens und in Malta). Eine größere Anzahl von Frauen in MINT (Mathematik, Informatik, Naturwissenschaften, Technik) wäre einerseits mit einem persönlichen Nutzen für diese Frauen verknüpft, da mathematikintensive Berufe mit einem höheren Ansehen und einer höheren Entlohnung verbunden sind (Watt, 2008). Mehr Frauen in MINT würden damit eine allgemeine Hebung der beruflichen Stellung von Frauen bedeuten. Andererseits wären mehr Frauen in MINT auch mit einem hohen volkswirtschaftlichen Nutzen verbunden. So weist etwa die Industriellenvereinigung (2013) auf einen starken Mangel an technisch-naturwissenschaftlich qualifizierten Arbeitskräften hin und betont, dass es die gemeinsame Zielsetzung von Politik, Industrie und Gesellschaft sein muss, künftig mehr junge Menschen und hier im Speziellen junge Frauen und Mädchen für MINT zu interessieren und für entsprechende Bildungswege, Studienrichtungen und berufliche Tätigkeiten zu motivieren (S. 4). Auch die OECD (2009, S. 12) sieht Mädchen als the most obvious resource for increasing science and technology enrolments.

51 Mathematik weiblich? Leistung, Selbstkonzept und Studienabschlüsse im Geschlechtervergleich 49 Wie können mehr Frauen für MINT gewonnen werden? Um mehr Mädchen für mathematikintensive Berufe zu gewinnen, ist es wichtig jene Faktoren zu kennen, die Mädchen zu solchen Karrieren führen bzw. sie davon abhalten. Wie im Modell von Eccles (1994) in der Einleitung erwähnt, spielt das Mathematikselbstkonzept eine wesentliche Rolle für die Berufswahl: Personen mit hohem Mathematikselbstkonzept entscheiden sich eher für mathematikintensive Karrieren (vgl. Guay et al., 2004; Parker et al., 2012). Das Mathematikselbstkonzept wird wiederum gespeist durch gesellschaftliche Werte und Normen. Der vorliegende Beitrag konnte erstmals zeigen, dass sich die Beteiligung von Frauen an mathematikintensiven Studiendisziplinen bereits in den Selbstkonzepten 10-Jähriger wider spiegelt: In Ländern mit geringerer Frauenbeteiligung an mathematikintensiven Studienrichtungen hinkt auch das Mathematikselbstkonzept 10-jähriger Mädchen stärker hinter jenem gleichaltriger Buben nach als in Ländern mit starker Frauenbeteiligung. Geschlechtsstereotype werden demnach schon so früh internalisiert, dass sie sich bereits am Ende der Grundschulzeit in einem verminderten Mathematikselbstkonzept der Mädchen niederschlagen. Wenn man die Wichtigkeit des Selbstkonzepts für die spätere Berufswahl miteinbezieht, so scheint es in Gesellschaften mit geringer MINT-Beteiligung von Frauen bereits für 10-jährige Mädchen grundgelegt zu sein, eher keine mathematikbezogenen Berufe zu ergreifen. Somit kann von einem negativen Kreislauf ausgegangen werden: Da nur wenige Frauen mathematikintensiven Berufen nachgehen, haben Mädchen kaum Rollenvorbilder, was sich negativ im eigenen Mathematikselbstkonzept niederschlägt. Das negative Selbstkonzept wiederum lässt Mädchen seltener mathematikintensive Studien- und Berufsrichtungen wählen. Auf diese Weise reproduzieren sich Geschlechterverhältnisse in einer Gesellschaft. Wie könnte dieser Reproduktionsmechanismus entschärft werden? Zunächst kann festgestellt werden, dass Mädchen allein schon aufgrund ihres breiteren Potenzials sie sind häufiger als Burschen sowohl in Mathematik als auch in Lesen gut (Wang, Eccles & Kenny, 2013) mehr Wahlmöglichkeit für unterschiedliche Berufe haben. Burschen verfügen da gegen häufiger zwar über gute mathematische, aber nur moderate sprachliche Fähigkeiten, womit sie eher auf die Wahl mathematikintensiver Berufe eingeschränkt sind. Warum aber entscheiden sich Mädchen oft gegen MINT, obwohl sie sich aufgrund ihrer Fähigkeiten auch dafür entscheiden könnten? Hierzu gibt es Indizien, dass bei einer größeren und früheren Spezialisierungsmöglichkeit auf Ebene des Bildungssystems Mädchen eher geschlechtsstereotype Berufs- und Bildungsentscheidungen treffen (Charles, 2011; Yazilitas, Svensson, de Vries & Saharso, 2013). So verweisen Yazilitas et al. (2013) auf eine englische Studie, in der festgestellt wurde, dass sich der Anteil an weiblichen Studierenden in MINT-Fächern erhöht hat, nachdem bei den Abschlussprüfungen (A-Levels) mehr MINT-Fächer Pflicht wurden. Ähnlich wurde gezeigt, dass in gesamtschulartigen Bildungssystemen die Mathematikleistungen von Mädchen (15-/16-Jährigen) weniger hinter jener der Burschen zurückliegen als in differenzierten Bildungssystemen, in denen eine Auswahl zwischen unterschiedlichen Bildungsgängen getroffen werden muss (van Langen, Bosker & Dekkers, 2006). Bradley und Charles (2004) fanden darüber hinaus, dass es in Ländern mit sehr differenzierten und berufsorientierten Sekundarschulsystemen eine stärkere Geschlechter segregation im tertiären Bereich gibt als in Ländern mit Gesamtschulsystemen (siehe auch Lassnigg, 2012). Bradley und Charles (2004) erklären dies damit, dass a) stark differenzierte Systeme mehr Möglichkeit für die Wahl geschlechtsstereotyper Bildungswege bieten und b) dass diese Entscheidung in der Adoleszenz getroffen werden muss, also in einer Entwicklungsphase, in der der Druck, Geschlechterstereotypen zu entsprechen, besonders groß ist. Insbesondere in Österreich liegt durch die starke Zergliederung des Schulsystems schon relativ früh eine große Wahlmöglichkeit vor und Schüler/innen können sich bereits mit 14 bis 15 Jahren für Bildungsgänge mit sehr unterschiedlich hohem MINT-Anteil entscheiden. Diese Wahl erfolgt stark geschlechtsstereotyp: Burschen sind in Schulformen mit hohem MINT-Anteil drastisch in der Überzahl (vgl. Vogtenhuber et al., 2012). Auch Lassnigg und Laimer (2012) bemängeln die enge zeitliche Verknüpfung zwischen der adoleszenten Geschlechtsidentitätsentwicklung und der ersten beruflichen Weichenstellung auf der 9. Schulstufe, deren vorbereitende Prozesse in das sensible Alter zwischen 13 und 15 Jahren fallen. Möglicherweise könnten mehr Mädchen an MINT-Studien herangeführt werden, wenn der Zeitpunkt einer berufsbildenden Spezialisierung verschoben wird bzw. wenn auch in typischer weise von Mädchen gewählten Schulformen MINT-Fächern ein höher Stellenwert eingeräumt wird und diese auch zu Pflichtgegenständen bei der Matura gemacht werden. Eine weitere Möglichkeit mehr Mädchen an MINT heranzuführen wäre, Frauen, die sich für MINT entscheiden, stärker (für Mädchen) sichtbar zu machen und ihnen hohe Wertschätzung entgegenzubringen. Denn Rollenvorbilder spielen eine wichtige Rolle für die Berufswahl (Eccles, 1994). Nehmen Mädchen es als normal und erwünscht wahr, dass Frauen mathematikintensive Berufe ergreifen, werden sie dies selbst auch eher tun. Auch Else-Quest et al. (2010) betonen, dass Mädchen sehen müssen, dass sich Frauen mit MINT beschäftigen, um MINT als eine Option für sich selbst wahrzunehmen. Wenn also Mädchen in einem gesellschaftlichen Kontext aufwachsen, in dem es geschätzt wird, dass Frauen MINT-Karrieren verfolgen, erhalten sie die Botschaft, dass ein mathematisch-naturwissenschaftlicher Beruf eine gute Option für sie selbst sein könnte.

52 50 Mathematik weiblich? Leistung, Selbstkonzept und Studienabschlüsse im Geschlechtervergleich Ceci et al. (2009) stellen darüber hinaus fest, dass es für Frauen schwieriger ist als für Männer, höhere Positionen in mathematikintensiven Berufen zu erreichen. Auch Valenduc et al. (2004) weisen auf diese mangelnde Geschlechter - gerechtigkeit hin: The same level of education as men and comparable qualifications are not enough to guarantee a woman s career in informatics (S. 31). Wenn durch geschlechtergerechtere Beförderungsstrategien oder auch durch verpflichtend vorgegebene Frauenquoten mehr Frauen in höheren MINT-Positionen zu finden wären, wäre dies ein Signal für Mädchen, dass es sich sehr wohl lohnt, MINT-Berufe zu ergreifen. Und es könnte auch dazu be itragen, die wenigen Frauen, die sich für mathematikintensive Karrieren entscheiden, stärker dort zu halten; denn wie die aktuelle Forschung zeigt, neigen Frauen eher dazu als Männer, nach einem absolvierten MINT-Studium keine naturwissenschaftliche Karriere einzuschlagen (OECD, 2012) oder bereits eingeschlagene mathematikintensive Karrieren wieder zu verlassen (Ceci et al., 2009). Auch für Österreich ist bekannt, dass weibliche Fachkräfte in Handwerk und Technik wesentlich kürzer in ihrem Beruf verbleiben als ihre männlichen Kollegen (Europäischer Sozialfonds, 2013). Kessels (2012) betont, dass es nicht nur wichtig ist, Mädchen stärker an MINT-Fächer heranzuführen, sondern auch MINT an die Mädchen, indem etwa im naturwissenschaftlichen Unterricht stärker auf die Interessen von Mädchen eingegangen wird. So zeigen Häußler und Hoffmann (1995), dass Mädchen sehr intensiv auf den Wechsel des Kontexts reagieren und es für sie beispielsweise wesentlich interessanter ist, etwas über eine Pumpe zu erfahren, die als künstliches Herz Blut pumpt, als über eine Pumpe, die Erdöl aus großer Tiefe heraufpumpt. Ähnlich zeigen Kerger, Martin und Brunner (2011), dass das mathematisch-naturwissenschaftliche Interesse von Mädchen wesentlich erhöht werden kann, wenn die Unterrichtsinhalte im Kontext weiblicher Themen präsentiert werden. Darüber hinaus scheint sich ein stark strukturierter naturwissenschaftlicher Unterricht insbesondere positiv auf die Leistungen von Mädchen auszuwirken (Blumberg, Hardy & Möller, 2008). Auch sollte das Image von MINT-Berufen stärker an die Interessen von Mädchen herangeführt werden, etwa indem gezeigt wird, dass auch in diesen Berufen gemeinsam mit Menschen gearbeitet werden kann, diese Berufe einen Nutzen für die Gesellschaft mit sich bringen und sich mit den Bedürfnissen einer eigenen Familie vereinbaren lassen. Auf diese Weise könnten junge Frauen, die sowohl in Mathematik als auch in sprachlichen Domänen hohe Leistungen erzielen, vermehrt dazu gewonnen werden, MINT- Karrieren zu ergreifen (vgl. Wang et al., 2013). Resümee Die Ergebnisse des vorliegenden Beitrags verweisen auf die Wichtigkeit, die Begeisterung von Mädchen für Mathematik bereits im Grundschulalter und davor anzuregen. Denn schon bei 10-Jährigen lassen sich in Österreich wie in vielen anderen Ländern auch bedeutsame Geschlechterdifferenzen im Mathematikselbstkonzept feststellen. Dennoch sollte auch zu späteren Zeitpunkten ständig daran weitergearbeitet werden, Mädchen die Nützlichkeit von MINT zu verdeutlichen und ihnen vor Augen zu halten, wie Selbstverwirklichung auch in mathematikintensiven Berufen möglich ist. Ein wichtiger Schritt zu mehr Frauen in mathematikintensiven Studiengängen wäre, dass Mädchen bis einschließlich zur Matura mit MINT-Fächern konfrontiert werden und sie sich nicht frühzeitig für Schulformen mit geringem MINT-Anteil entscheiden können. Denn je früher Bildungsentscheidungen getroffen werden müssen, desto stärker fallen sie in eine sensible Entwicklungsphase der (Geschlechts-)Identität (Erikson, 1968) und desto eher erfolgen sie geschlechtsstereotyp (Bradley & Charles 2004; Lassnigg & Laimer, 2012; Yazilitas et al., 2013). Mädchen haben in der Regel breitere Potenziale als Burschen (Wang et al., 2013). Durch die frühzeitige Abwahlmöglichkeit von MINT bleibt ein Teil dieser Potenziale unentdeckt und ungenutzt. Der vorliegende Beitrag zeigt ganz klar: Die Überzeugung von Mädchen, nicht gut in Mathematik zu sein, ist stark gesellschaftlich geprägt und sie ist den Mädchen keinesfalls angeboren. Literatur Bacher, J., Beham, M. & Lachmayr, N. (Hrsg.) (2008). Geschlechterunterschiede in der Bildungswahl. Wiesbaden: Verlag für Sozialwissenschaften. Blumberg, E., Hardy, I. & Möller, K. (2008). Anspruchsvolles naturwissenschaftsbezogenes Lernen im Sachunterricht der Grundschule auch für Mädchen? Zeitschrift für Grundschulforschung, 1, Bradley, K. & Charles, M. (2004). Uneven inroads: Understanding women s status in higher education. Research in the Sociology of Education, 14,

53 Mathematik weiblich? Leistung, Selbstkonzept und Studienabschlüsse im Geschlechtervergleich 51 Buff, A., Reusser, K., Dinkelmann, I. & Steiner, E. (2011). Unser Kind ist gut in Mathematik! Zur Bedeutung elterlicher kindbezogener Kompetenzüberzeugungen hinsichtlich Selbstkonzept und Schulerfolg von Schülerinnen und Schülern. In F. Hellmich (Hrsg.), Selbstkonzepte im Grundschulalter Modelle, empirische Ergebnisse, pädagogische Konsequenzen (S ). Stuttgart: Kohlhammer. Ceci, S. J., Williams, W. M. & Barnett, S. M. (2009). Women s underrepresentation in science: Sociocultural and biological considerations. Psychological Bulletin, 135, Charles, M. (2011). A world of difference: International trends in women s economic status. Annual Review of Sociology, 37, Cohen, J. (1988). Statistical power analysis for the behavioral sciences. Hillsdale, NJ: Erlbaum. Costa, P. T., Jr., Terracciano, A. & McCrae, R. R. (2001). Gender differences in personality traits across cultures: Robust and surprising findings. Journal of Personality and Social Psychology, 81, Eccles, J. S. (1994). Understanding women s educational and occupational choices. Psychology of Women Quarterly, 18, Eder, F. (2012). Die beruflichen Interessen der 15- und 16-Jährigen. In F. Eder (Hrsg.), PISA Nationale Zusatzanalysen für Österreich (S ). Münster: Waxmann. Ellis, P. D. (2010). The essential guide to effect sizes. Cambridge: Cambridge University Press. Else-Quest, N. M., Hyde, J. S. & Linn, M. C. (2010). Cross-national patterns of gender differences in mathematics: A metaanalysis. Psychological Bulletin, 136, Erikson, E. H. (1968). Identity, Youth and Crisis. New York: Norton. Europäischer Sozialfonds (2013). InSight Magazin des europäischen Sozialfonds, September Zugriff am unter European Commission (2013). She figures Gender in research and innovation. Retrieved September 18, 2013 from Filzmoser, S. & Suchań, B. (2013). Mathematik: Unterschiede zwischen Mädchen und Burschen. In U. Schwantner, B. Toferer & C. Schreiner (Hrsg.), PISA Internationaler Vergleich von Schülerleistungen. Erste Ergebnisse Mathematik, Lesen, Naturwissenschaft (S ). Graz: Leykam. Frome, P. M. & Eccles, J. S. (1998). Parents influence on children s achievement-related perceptions. Journal of Personality and Social Psychology, 74, Gabriel, K., Mösko, E. & Lipowsky, F. (2011). Selbstkonzeptentwicklung von Jungen und Mädchen im Anfangsunterricht Ergebnisse aus der PERLE-Studie. In F. Hellmich (Hrsg.), Selbstkonzepte im Grundschulalter Modelle, empirische Ergebnisse, pädagogische Konsequenzen (S ). Stuttgart: Kohlhammer. Guay, F., Larose, S. & Boivin, M. (2004). Academic self-concept and educational attainment level: A ten-year longitudinal study. Self and Identity, 3, Hattie, J. (2009). Visible Learning A synthesis of over 800 meta-analyses relating to achievement. New York: Routledge. Häußler, P. & Hoffmann, L. (1995). Physikunterricht an den Interessen von Mädchen und Jungen orientiert. Unterrichtswissenschaft, 23, Hellmich, F. & Günther, F. (2011). Entwicklung von Selbstkonzepten bei Kindern im Grundschulalter ein Überblick. In F. Hellmich (Hrsg.), Selbstkonzepte im Grundschulalter Modelle, empirische Ergebnisse, pädagogische Konsequenzen ( 19 46). Stuttgart: Kohlhammer.

54 52 Mathematik weiblich? Leistung, Selbstkonzept und Studienabschlüsse im Geschlechtervergleich Helmke, A. (1997). Individuelle Bedingungsfaktoren der Schulleistung: Ergebnisse aus dem SCHOLASTIK-Projekt. In F. E. Weinert & A. Helmke (Hrsg.), Entwicklung im Grundschulalter (S ). Weinheim: Beltz. Hyde, J. S., Lindberg, S. M., Linn, M. C., Ellis, A. & Williams, C. (2008). Gender similarities characterize math performance. Science, 321, Industriellenvereinigung (2013). MINT 2020 Der Unterricht von morgen. Wien: Autor. Kerger, S., Martin, R. & Brunner, M. (2011). How can we enhance girls interest in scientific topics? British Journal of Educational Psychology, 81, Kessels, U. (2012). Selbstkonzept: Geschlechterunterschiede und Interventionsmöglichkeiten. In H. Stöger, A. Ziegler & M. Heilemann (Hrsg.), Mädchen und Frauen in MINT (S ). Berlin: LIT. Köller, O., Daniels, Z., Schnabel, K. U. & Baumert, J. (2000). Kurswahlen von Mädchen und Jungen im Fach Mathematik: Zur Rolle von fachspezifischem Selbstkonzept und Interesse. Zeitschrift für Pädagogische Psychologie, 14, Lassnigg, L. (2012). Die berufliche Erstausbildung zwischen Wettbewerbsfähigkeit, sozialen Ansprüchen und Lifelong Learning eine Policy-Analyse. In B. Herzog-Punzenberger (Hrsg.), Nationaler Bildungsbericht Österreich Band 2. Fokussierte Analysen bildungspolitischer Schwerpunktthemen (S ). Graz: Leykam. Lassnigg, L. & Laimer, A. (2012). Berufsbildung in Österreich: Hintergrundbericht zum Nationalen Bildungsbericht Österreich Zugriff am unter Lenzer, A. (2006). Women in mathematics. Münster: Waxmann. Li, Q. (1999). Teachers beliefs and gender differences in mathematics: A review. Educational Research, 41, Lindberg, S. M., Hyde, J. S., Petersen, J. L. & Linn, M. C. (2010). New trends in gender and mathematics performance: A metaanalysis. Psychological Bulletin, 136, Marsh, H. W. (1986). Verbal and math self-concepts: An internal/external frame of reference model. American Educational Research Journal, 23, Marsh, H. W. (2005). The big-fish little-pond effect on academic self-concept. Zeitschrift für Pädagogische Psychologie, 19, Marsh, H. W. & Yeung, A. S. (1998). Longitudinal structural models of academic self-concept and achievement: Gender differences in the development of math and English constructs. American Educational Research Journal, 35, Martin, M. O., Mullis, I. V. S., Foy, P. & Arora, A. (2012). Creating and Interpreting the TIMSS and PIRLS 2011 Context Questionnaire Scales. In Martin, M. O. & Mullis, I. V. S. (Eds.), Methods and procedures in TIMSS and PIRLS Retrieved September 18, 2013 from Möller, J., Kuska, K. & Zaunbauer, A. M. C. (2011). Internale und externale Bezugsrahmen in der Grundschule. In F. Hellmich (Hrsg.), Selbstkonzepte im Grundschulalter Modelle, empirische Ergebnisse, pädagogische Konsequenzen (S ). Stuttgart: Kohlhammer. Möller, J. & Marsh, H. W. (2013). Dimensional comparison theory. Psychological Review, 120, Möller, J., Pohlmann, B., Köller, O. & Marsh, H. W. (2009). A meta-analytic path analysis of the internal/external frame of reference model of academic achievement and academic self-concept. Review of Educational Research, 79, Nagy, G., Garrett, J., Trautwein, U., Cortina, K., Baumert, J. & Eccles, J. (2008). Gendered high school course selection as a precursor of gendered careers: The mediating role of self-concept and intrinsic value. In H. Watt & J. Eccles (Eds.), Gender and occupational outcomes: Longitudinal assessments of individual, social, and cultural influences (pp ). Washington, DC: American Psychological Association.

55 Mathematik weiblich? Leistung, Selbstkonzept und Studienabschlüsse im Geschlechtervergleich 53 Nosek, B. A., Smyth, F., Sriram, N., Lindner, N., Devos, T., Ayala, A. Greenwald, A. G. (2009). National differences in genderscience stereotypes predict national sex differences in science and math achievement. Proceedings of the National Academy of Sciences of the United States of America, 106, Retrieved September 18, 2013 from content/106/26/10593.full OECD (2009). Equally prepared for life? How 15-year-old boys and girls perform in school. Paris, France: Author. OECD (2011). Education at a Glance. Paris, France: Author. OECD (2012). Closing the gender gap: Act now. Paris, France: Author. OECD (2013). PISA 2012 Results: What students know and can do. Student Performance in Mathematics, Reading and Science (Vol. I). Paris, France: Author. Pahlke, E., Hyde, J. S. & Allison, C. M. (2014). The effects of single-sex compared with coeducational schooling on students performance and attitudes: A meta-analysis. Psychological Bulletin, 140, Parker, P. D., Schoon, I., Tsai, Y.-M., Nagy, G., Trautwein, U. & Eccles, J. S. (2012). Achievement, agency, gender, and socioeconomic background as predictors of postschool choices: A multicontext study. Developmental Psychology, 48, Retelsdorf, J., Schwartz, K. & Asbrock, F. (2015). Michael can t read! Teachers gender stereotypes and boys reading selfconcept. Journal of Educational Psychology, 107, Sáinz, M. & Eccles, J. (2012). Self-concept of computer and math ability: Gender implications across time and within ICT studies. Journal of Vocational Behavior, 80, Schreiner, C., Breit, S. & Haider, G. (2008). Zur Validität der Mathematiknoten. In F. Hofmann, C. Schreiner & J. Thonhauser (Hrsg.), Qualitative und quantitative Aspekte. Zu ihrer Komplementarität in der erziehungswissenschaftlichen Forschung (S ). Münster: Waxmann. Spiel, C., Schober, B. & Litzenberger, M. (2008). Evaluation der Eignungstests für das Medizinstudium in Österreich. Zugriff am unter Steinmayr, R. & Spinath, B. (2009). What explains boys stronger confidence in their intelligence? Sex roles, 61, Tiedemann, J. (2000a). Gender-related beliefs of teachers in elementary school mathematics. Educational Studies in Mathematics, 41, Tiedemann, J. (2000b). Parents gender stereotypes and teachers beliefs as predictors of children s concept of their mathematical ability in elementary school. Journal of Educational Psychology, 92, Tiedemann, J. (2002). Teachers gender stereotypes as determinants of teacher perceptions in elementary school mathematics. Educational Studies in Mathematics, 50, UNESCO (n. d.). Table 16: Graduates by broad field of education in tertiary education. Retrieved September 18, 2013 from Valenduc, G., Vendramin, P., Guffens, C, Ponzellini, A. M., Lebano, A., D Ouville, L., Isabelle Collet, I. Webster, J. (2004). Widening women s work in information and communication technology. Retrieved September 18, 2013 from ftu-namur.org/fichiers/d12-print.pdf van Langen, A., Bosker, R. & Dekkers, H. (2006). Exploring cross-national differences in gender gaps in education. Educational Research and Evaluation, 12, Vogtenhuber, S., Lassnigg, L., Bruneforth, M., Gumpoldsberger, H., Toferer, B., Schmich, J. Bergmüller, S. (2012). Indikatoren C: Prozess. In: M. Bruneforth & L. Lassnigg (Hrsg.), Nationaler Bildungsbericht Österreich Band 1. Das Schulsystem im Spiegel von Daten und Indikatoren (S ). Graz: Leykam.

56 54 Mathematik weiblich? Leistung, Selbstkonzept und Studienabschlüsse im Geschlechtervergleich Voyer, D. & Voyer, S. (2014). Gender differences in scholastic achievement: A meta-analysis. Psychological Bulletin, 140, Wang, M., Eccles, J. S. & Kenny, S. (2013). Not lack of ability but more choice: Individual and gender difference in choice of careers in sciences, technology, engineering, and Mathematics. Psychological Sciences, 24, Wallner-Paschon, C. (2010). Kompetenzunterschiede zwischen Mädchen und Buben. In B. Suchań, C. Wallner-Paschon & C. Schreiner (Hrsg.), TIMSS Mathematik & Naturwissenschaft in der Grundschule. Österreichischer Expertenbericht (S ). Graz: Leykam. Wallner-Paschon, C. (2012a). Mathematik: Leistungsunterschiede zwischen Mädchen und Buben. In B. Suchań, C. Wallner- Paschon, S. Bergmüller & C. Schreiner (Hrsg.), PIRLS & TIMSS Schülerleistungen in Lesen, Mathematik und Naturwissenschaft in der Grundschule. Erste Ergebnisse (S ). Graz: Leykam. Wallner-Paschon, C. (2012b). Lesen: Leistungsunterschiede zwischen Mädchen und Buben. In B. Suchań, C. Wallner- Paschon, S. Bergmüller & C. Schreiner (Hrsg.), PIRLS & TIMSS Schülerleistungen in Lesen, Mathematik und Naturwissenschaft in der Grundschule. Erste Ergebnisse (S ). Graz: Leykam. Watt, H. M. G. (2008). What motivates females and males to pursue sex-stereotyped careers? In H. Watt & J. Eccles (Eds.), Gender and occupational outcomes: Longitudinal assessments of individual, social, and cultural influences (pp ). Washington, DC: American Psychological Association. Wiseman, A. W. (2008). A culture of (in)equality?: A cross-national study of gender parity and gender segregation in national school systems. Research in Comparative & International Education, 3, Yazilitas, D., Svensson, J., de Vries, G. & Saharso, S. (2013). Gendered study choice: A literature review. A review of theory and research into the unequal representation of male and female students in mathematics, science, and technology. Educational Research and Evaluation, Ziegler, A., Kuhn, C. & Heller, K. A. (1998). Implicit theories of mathematics and physics teachers of the German gymnasium on gender specific giftedness and motivation. Psychologische Beiträge, 40,

57 Zu nichtignorierbaren Konsequenzen des (partiellen) Ignorierens fehlender Item Responses im Large-Scale-Assessment Zu nichtignorierbaren Konsequenzen des (partiellen) Ignorierens fehlender Item Responses im Large-Scale-Assessment Alexander Robitzsch In neuerer Literatur werden alternative Modellierungen fehlender Item Responses im Large-Scale-Assessment vorgeschlagen. Prinzipiell argumentieren diese Ansätze auf Basis von Simulationen und testtheoretischen Überlegungen, dass fehlende Item Responses niemals als falsch zu bepunkten, sondern eher als ignorierbar zu behandeln seien (z. B. Pohl, Gräfe & Rose, 2014). Der vorliegende Beitrag zeigt auf, dass diese Argumentationen eingeschränkte Gültigkeit besitzen und illustriert anhand eines Ländervergleichs in PIRLS 2011, dass eine andere Bewertung der fehlenden Item Responses als die einer Falschantwort zu deutlichen Änderungen in Länderreihenfolgen führt und daher nichtignorierbare Konsequenzen hinsichtlich der Validität der Ergebnisse besitzt. Zusätzlich werden zwei alternative Item-Response-Modelle vorgeschlagen, mit denen verschiedene Annahmen für das Zustandekommen fehlender Werte bei den Item Responses beschrieben werden können. Fehlende Item Responses in Large-Scale- Assessments In Large-Scale-Assessments wie PIRLS, TIMSS, PISA oder den österreichischen Bildungsstandard-Erhebungen werden Kompetenzen von Schülerinnen und Schülern mithilfe von Testitems erfasst. Häufig geben Schülerinnen und Schüler allerdings keine Antwort bei bestimmten Items (fehlender Item Response; fehlende Itemantwort), sodass unklar ist, inwiefern sich eine Nichtbeantwortung eines Items auf die Bestimmung der Kompetenzwerte niederschlagen soll. Während die Behandlung fehlender Daten im Rahmen statistischer Analysen in den Sozialwissenschaften mittlerweile verbreitet zu sein scheint (Graham, 2009; Lüdtke & Robitzsch, 2010), ist in jüngerer Literatur (Pohl et al., 2014; Rose et al., 2010) Kritik an konventionellen Verfahren der Behandlung fehlender Item Responses in Item-Response- Modellen (IRT-Modelle) der Kompetenzmessung in Large- Scale-Assessments zu finden. Typischerweise wird dabei die Missing-Behandlung zwischen dem Prozess der Kalibrierung (Ermittlung von Itemparametern) und der Skalierung (Ermittlung von Kompetenzwerten) unterschieden. In PIRLS/TIMSS und PISA werden bei der Kalibrierung ausschließlich fehlende Item Responses am Ende eines Testhefts (sog. Not Reached Items) weggelassen (d. h. ignoriert), um Schätzungen der Itemschwierigkeiten nicht zu verzerren. Für die Skalierung werden fehlende Item Responses typischerweise als falsch bewertet. Die o. g. Literatur argumentiert jedoch, dass alle fehlenden Item Responses niemals (d. h. sowohl in Kalibrierung als Skalierung) als falsch zu kodieren seien (Rose, 2013; Pohl et al., 2014) und schlägt alternative Item-Response-Modelle zur Behandlung der fehlenden Itemantworten vor. Der folgende Beitrag geht dabei zunächst auf die in der Literatur angebrachten Kritikpunkte (Rose, 2013; Pohl et al. 2014) zur Behandlung fehlender Item Responses als Falschantwort und die vorgeschlagenen modell basierten Alternativen ein. Ich argumentiere in diesem Beitrag im Gegensatz zur o. g. Literatur, dass nur aus Gründen der Validität und nicht aus (schein baren) testtheoretischen Gründen eine bestimmte Methode für den Umgang mit fehlenden Item Responses präferiert werden sollte. Da im Allgemeinen Annahmen über den Datenausfall bei Item Responses empirisch nicht testbar sind, werden zwei alternative Item-Response-Modelle vorgeschlagen, in denen verschiedene Annahmen an den Ausfallprozess parametrisiert werden. Abschließend diskutiere ich mög liche psychometrische Konsequenzen im Large-Scale- Assessment zur Erfassung von Kompetenzen bei unterschiedlichen Behandlungsweisen fehlender Itemantworten. Eine Auseinandersetzung mit Kritikpunkten des traditionellen Vorgehens bei fehlenden Item Responses Für die Ermittlung von Kompetenzwerten werden im Large- Scale-Assessment bei einer Skalierung typischerweise fehlende Item Responses als falsch bewertet. Konträr dazu wird in einer Reihe aktueller Publikationen (Rose, 2013; Pohl & Carstensen, 2012, 2013; Pohl et al., 2014) behauptet, dass fehlende Item Responses niemals als falsch zu bewerten seien, und es wird empfohlen, diese traditionelle Ad-Hoc- Methode nicht im Large-Scale-Assessment einzusetzen. Im Folgenden gehe ich dabei auf die Begründungen der Autorinnen und Autoren ein und gelange zur Feststellung, dass diese auf Annahmen und Schlussfolgerungen beruhen,

58 56 Zu nichtignorierbaren Konsequenzen des (partiellen) Ignorierens fehlender Item Responses im Large-Scale-Assessment die in der Anwendung von Item-Response- Modellen untypisch sind und daher die in der o. g. Literatur befindlichen Empfehlungen als fragwürdig zu erachten sind. Nützlich für die folgenden Überlegungen erweist sich dabei die von Denoeux (2011) vorgeschlagene Unterscheidung bei der Quantifikation der Unsicherheit in Daten (den Item Responses) und damit korrespondierenden Modellierungen, die in der Abgrenzung der Konzepte der Probability (Wahrscheinlichkeit) und Possibility (Möglichkeit) bedeutsam sind. Durch Stichproben ziehung oder Modellierung existierender Daten (Datensatz mit allen Item Responses) entstehende Unsicherheit wird dabei als aleatorische Unsicherheit bezeichnet. Unsicherheit (bzw. Unschärfe in der Terminologie von Fuzzy-Daten) für jedes einzelne Datum (jede einzelne Itemantwort) wird als epistemische Unsicherheit bezeichnet. Denoeux (2011) argumentiert, dass man aleatorische Unsicherheit mittels Wahrscheinlichkeiten modellieren solle, was im Falle des vorliegenden Kompetenztests bedeutet, ein IRT-Modell für fest vorgegebene Item Responses anzupassen. Die Beobachtung der einzelnen Daten (der einzelnen Item Responses jeder Schülerin oder jedes Schülers) erfolgt dabei mit dem Konzept epistemischer Unsicherheit, das in Anwendungen dann häufig in unscharfen Beobachtungen (sog. Fuzzy- Daten) mündet (Denoeux, 2011, 2013). Bei fehlenden Item Responses ist demzufolge unklar, welche Bepunktung das Fehlen eines Item Response nach sich ziehen soll. Es ist aber in dieser Konzeption offensichtlich, dass Annahmen an die einzelnen Daten (den einzelnen Item Responses) strikt von Annahmen in einem Wahrscheinlichkeitsmodell (ein gemeinsames Modell für alle Item Responses) zu unterscheiden sind. Zur Illustration dieser begrifflichen Unterscheidung wird angenommen, dass man die Verteilung der Laufzeiten in einem 50-Meter-Lauf für eine definierte Population österreichischer Schüler/innen der 4. Schulstufe erfassen möge. Dazu wird eine Stichprobe von Schülerinnen und Schülern ge zogen. Die mit dieser Stichprobenziehung verbundene Unsicherheit auf die Population wird mit Wahrscheinlich keiten im Kontext der aleatorischen Unsicherheit ausgedrückt. Jede Messung der Laufzeit einer Schülerin/eines Schülers ist aber niemals exakt, sondern immer nur unscharf (z. B. liegt die gemessene Laufzeit aufgrund der Messunsicherheit im Intervall zwischen 8.75 und 8.85 Sekunden, das ein Fuzzy-Datum darstellt). Diese Unsicherheit entspricht dem Konzept epistemischer Unsicherheit. Die Kritik der Falschbewertung fehlender Item Responses fußt dabei auf simulationsbasierten und testtheoretischen Begründungen (Rose, 2013), auf die ich in weiterer Folge jeweils näher eingehe. Die meisten Simulationsstudien versuchen zu vermitteln, dass eine Falschbewertung von fehlenden Item Responses zu verzerrten Itemparametern und Personenparametern führt. Dabei wird ein fehlender Item Response meist durch eine Abhängigkeit von einer weiteren latenten Variable oder Personenkovariaten (nicht aber in Abhängigkeit des Items selbst) simuliert. Dann ist die berichtete Verzerrung bei einer Bewertung als falsch in Parametern folgerichtig, denn das der Simulation zugrunde liegende datengenerierende Modell stimmt nicht mit dem Analysemodell (Missings sind falsche Itemantworten) überein. Nimmt man jedoch um gekehrt an, dass ein IRT-Modell für die Item Responses passt und es werden bei allen Items fehlende Werte generiert, für die das Item falsch gelöst wurde, dann führt natürlich jede zur Falschbewertung alternative Missingbehandlung zu verzerrten Parametern (siehe Rohwer, 2013). Ob eine simulationsbasierte Argumentation gegen eine Falschbewertung von fehlenden Item Responses zutreffend ist, hängt dem zufolge von der Plausibilität des datengenerierenden Modells für den Ausfallprozess ab. Ich argumentiere, dass Ansätze, die den Ausfall auf einem Item unabhängig von der unbekannten Itemantwort selbst modellieren, unplau sibel sind. Somit helfen Simulationsstudien bei der Frage nach der Begründung einer richtigen Bewertung fehlender Item Responses nicht weiter. In der testtheoretischen Begründung ist der Kern der Kritik, dass eine Falschbewertung fehlende Items deterministisch behandeln würde und demzufolge modellimplizierte Wahrscheinlichkeiten des IRT-Modells ungültig seien (Rose, 2013; Pohl et al., 2014). Bezeichnet man mit R ni die Dummyvariable, dass für Person n das Item i beobachtet wird, so wird bei einer Falschbewertung der Item Response Y ni auf null (d. h. falsch) gesetzt, also P(Y ni = 1 R ni = 0) = 0 unabhängig von der Personenfähigkeit θ n. Dadurch entstünde ein Widerspruch, denn über die Vorhersage im IRT-Modell (z. B. das Rasch-Modell) würde man eine Wahrscheinlichkeit P(Y ni = 1 θ n ) > 0 annehmen, d. h. die Datenbehandlung sei deterministisch und das IRT-Modell sei probabilistisch (Rose, 2013), weshalb Modellannahmen im IRT-Modell verletzt seien. Formal ist der Widerspruch mit den beiden verschiedenen Konzepten der Unsicherheit nach Denoeux (2011) auflösbar, denn in der Argumentation von Rose (2013) und Pohl et al. (2014) erfolgt eine Konfundierung von epistemischer und aleatorischer Unsicherheit, so dass man damit gar nicht von einer Gleichsetzung der verschiedenen Wahrscheinlichkeiten ausgehen sollte. Bettet man die Überlegungen stärker in Begrifflichkeiten der Psychometrie ein, so fällt auf, dass die Argumentation der Ablehnung als Falschbewertung offenbar auf einer intraindividuellen Interpretation der Wahrscheinlichkeiten im IRT-Modell im Sinne der Stochastic-Subject-Perspektive (d. h. Wahrscheinlichkeiten des IRT-Modells können für jede Kombination einer Person n mit einem Item i interpretiert werden) beruht (siehe Holland, 1990; für eine auf der Stochastic Subject basierende Testtheorie siehe Steyer & Eid, 2001), die in Anwendungen des Large-Scale Assessments allenfalls historische und geringe praktische Bedeutung besitzt (Wainer, 2010). Stellt man eine Random- Sampling-Perspektive (Holland, 1990; Molenaar, 1995) an, so interpretiert man Wahrscheinlichkeiten als Ergebnis einer Stichprobenziehung von Personen und führt Item parameter

59 Zu nichtignorierbaren Konsequenzen des (partiellen) Ignorierens fehlender Item Responses im Large-Scale-Assessment 57 sowie eine Verteilung für Personenfähigkeiten θ als Repräsentation einer hochdimensionalen Kontingenz tafel für multivariate diskrete Beobachtungen Y ein. Dann ergibt sich formal als statistisches Modell eine Repräsen tation als Integral: In dieser Schreibweise wird deutlich, dass in IRT-Modellen eine Verteilung für Personen spezifiziert wird und nicht einzelne Individuen repräsentiert werden (siehe auch Rohwer, 2013). Wenn man jedoch die intraindividuelle Perspektive im Sinne der Stochastic-Subject-Perspektive annimmt, so beruht die Argumentation auf der Behauptung, dass bei einem Scoring der Missings als falsch die Wahrscheinlichkeit für eine korrekte Lösung eines Items deterministisch sei, denn die Bewertung als falsch führe zu einer falschen Antwort mit Wahrscheinlichkeit 1. Die Bewertung einer Antwort als falsch steht aber in keinem Zusammenhang zur probabilistischen Modellierung der Itemantworten einer Person. Denn es könnten auch die nichtfehlenden Items durch einen wie auch immer gearteten deterministischen Prozess zustande gekommen sein, was nicht der probabilistischen Modellierung im statistischen Modell für alle Item Responses widerspricht. Man muss daher zwischen einem realen Antwortprozess der deterministisch oder probabilistisch erfolgen kann, aber sicher in den seltensten Fällen der vorgegebenen probabilistischen Spezifikation des IRT-Modells folgt und der statistischen Modellannahme zur Definition einer Fähigkeit im Sinne einer Skalenkonstruktion unterscheiden (Rohwer, 2013). Auch statistische Gründe im Sinne der Stochastic-Subject- Perspektive entkräften die Kritik an einer Falschbewertung der fehlenden Item Responses. Bei der Modellierung intraindividueller Verteilungen in einem IRT-Modell für eine Person werden dabei Itemparameter als feste und bekannte Parameter vorausgesetzt und die Personenfähigkeit θ n ist als ein der Person zugeordneter fester Effekt (fixed effect) zu interpretieren. Die Annahme der lokalen stochastischen Unabhängigkeit bezieht sich dann auf eine bedingte Unabhängigkeit der Itemantworten für eine feste Person n anhand der vorgegebenen Itemmenge und ist damit empirisch nicht widerlegbar, sondern eine Setzung zur Identifikation der Fähigkeit θ n dieser Person. D. h. die Personenfähigkeit θ n ist erst durch die Spezifikation der Likelihood und der Itemantworten Y definiert. Im Rasch-Modell ist bei einer festen Person n und Item i die Wahrscheinlichkeit einer korrekten Itemantwort durch P(Y ni = 1 θ n ) = Ψ(θ n b i ) (mit der logistischen Funktion Ψ) gegeben, die in der Likelihood-Schätzung für den Parameter θ n verwendet wird. Ob eine einzelne Beobachtung dann in diesem Modell passt, ist empirisch nicht entscheidbar, so dass eine Falschbewertung der fehlenden Item Responses nicht per se das IRT- Modell verletzen kann. (1) Zusammenfassend sind die in der Literatur auffindbaren simulationsbasierten und testtheoretischen Begründungen, die gegen die Bewertung der fehlenden Antworten als falsch angebracht werden, aus meiner Sicht für typische Anwendungen im Large-Scale-Assessment nicht zutreffend. Es soll hier aber angemerkt werden, dass aus Gründen der Validität durchaus andere Bewertungen als falsch in Anwendungen adäquat sein könnten. Zentral in der Argumentation der Kritik der Autorinnen und Autoren ist, dass aus dem Antwortverhalten von Schülerinnen und Schülern in einer querschnittlichen Messung (inter-individuelle Perspektive) fälschlicherweise auf ein Antwortverhalten eines einzelnen Schülers (intraindividuelle Perspektive) rückgeschlossen wird (siehe Molenaar, 2004). Modellbasierte Behandlung fehlender Item Responses In diesem Abschnitt werden verschiedene modellbasierte Verfahren zur Behandlung fehlender Item Responses diskutiert, wobei im Folgenden nur IRT-Modelle für dichotome Daten in der Familie der Rasch-Modelle (Fischer & Molenaar, 1995) betrachtet werden. Allerdings sind unsere Über legungen auch für allgemeinere Modellklassen wie 2PL-Modelle oder IRT-Modelle für polytome Daten gültig. Unter den modellbasierten Verfahren werden häufig IRT- Modelle für ignorierbare und nichtignorierbare Item Responses unterschieden (Holman & Glas, 2005). Bei einer Ignorierung fehlender Item Responses werden Items für Schüler/innen aus der Likelihood-Funktion in der Schätzung weggelassen (d. h. ignoriert), für die das jeweilige Item fehlend ist. Ignoriert man die fehlenden Item Responses in der Schätzung, so kann man zeigen, dass fehlende Item Responses unter dieser Annahme mit einer Wahrscheinlichkeit von P ni (θ n, M ) als richtig imputiert (d. h. bepunktet) werden, wenn θ n, M die Fähigkeit von Person n bezeichnet, die ausschließlich mit den nichtfehlenden Items ermittelt wurde. D. h. praktisch, dass das IRT-Modell und die beobachteten Item Responses genutzt werden, um die fehlenden Items zu ersetzen. Da die Wahrscheinlichkeit P ni (θ n, M ) immer größer als null ist, führt die Ignorierung von Item Responses bei fest gehaltenen Itemparametern immer zu höheren Personenfähigkeiten als eine Bewertung als falsch. Das Ignorieren fehlender Item Responses bedeutet nicht, dass der Ausfall unabhängig von der Fähigkeit ist (d. h. der Ausfall ist nicht missing completely at random, MCAR; siehe Lüdtke & Robitzsch, 2010). Er ist dadurch charakterisiert, dass die gesamte Information über die Fähigkeit θ n bereits aus den beobachteten Item Responses rekonstruierbar ist, d. h. der Ausfall ist missing at random (MAR). D. h. unter dieser Annahme kann der Fall ein treten, dass der Anteil fehlender Item Responses bei leistungsschwächeren Schülerinnen und Schülern größer als bei leistungsstärkeren Schülerinnen und Schülern ist.

60 58 Zu nichtignorierbaren Konsequenzen des (partiellen) Ignorierens fehlender Item Responses im Large-Scale-Assessment Die Behandlung fehlender Item Responses als falsch kann dabei als ein Extremum, die Ignorierung als ein anderes Extremum angesehen werden (Rost, 2004, S. 324 ff.). Im ersten Fall besteht die Gefahr einer Unterschätzung der Personenfähigkeit, im zweiten gegebenenfalls eine Überschätzung der Personenfähigkeit. Alternativ zur Ignorierung fehlender Item Responses wurden mehrdimensionale IRT-Modelle für nichtignorierbare Item Responses vorgeschlagen (Holman & Glas, 2005; Rose et al., 2010). Das zweidimensionale Modell von Holman und Glas (2005) führt neben der latenten Fähigkeit θ eine latente individuelle Response Propensity (Antworttendenz) ξ ein, die dem Ausfall der Item Responses zugrunde liegt. Für die Responsevariablen R ni nimmt man dabei ebenso ein Rasch-Modell an: P(R ni = 1 θ n, ξ n ) = Ψ(ξ n β i ) (2) Die Wahrscheinlichkeit, eine Itemantwort zu produzieren, hängt demnach von der Antworttendenz ξ n und von der Schwierigkeit eines nichtfehlenden Responses β i ab. Ob ein Item fehlt oder nicht, hängt allerdings nicht vom Item Response selbst ab. Das zweidimensionale Modell schätzt damit eine bivariate Verteilung von (θ, ξ). Allerdings existiert für jede Person nur eine EAP-Schätzung und keine Maximum-Likelihood-Schätzung (Yen & Fitzpatrick, 2006) für die Fähigkeit θ n. Als Konsequenz ist dann nur unter Vorgabe einer Korrelation von Fähigkeit θ und Antworttendenz ξ eine Schätzung der Fähigkeit möglich. Lässt sich dann die Antworttendenz ξ als ξ = ρθ + ε schreiben, so kann man zeigen, dass fehlende Item Responses eine Bepunktung von P ni (θ n, M ) erfahren (siehe Bertoli-Barsotti & Punzo, 2013). Im Unterschied zum Modell mit ignorierbaren Item Responses werden Fähigkeitsschätzungen demzufolge in Abhängigkeit der Regression der Antworttendenz auf die Fähigkeit um die Konstante ρ adjustiert. Nur wenn Antworttendenz und Fähigkeit unkorreliert sind (ρ = 0), führen beide Modelle zu denselben Personenparameterschätzungen. Als Approximation des zweidimensionalen Modells schlagen Rose et al. (2010; siehe auch Pohl et al., 2014) ein eindimensionales IRT-Modell (bei Ignorierung fehlender Item Responses) für die Fähigkeit mit einem latenten Hintergrundmodell vor, in dem der Anteil fehlender Items als manifeste Kovariate verwendet wird. Diese Kovariate soll dabei näherungsweise die Rolle der Response Propensity ξ einnehmen. Ich bezweifle aber die Nützlichkeit dieses Modells: Bei längeren Tests mit vielen Items dominiert bei der Schätzung der Personenfähigkeit die Likelihood der nichtfehlenden Item Responses im Vergleich zur Priorverteilung des latenten Hintergrundmodells, so dass man für Tests mit hinreichend vielen Items näherungsweise das Vorgehen der Ignorierbarkeit fehlender Item Responses erhält. Weitere modellbasierte Verfahren verallgemeinern das bivariate IRT-Modell von Holman und Glas (siehe Rose, 2013, Bertoli-Barsotti & Punzo, 2013) oder setzen Mischverteilungsansätze ein (Bacci & Bartolucci, 2013; Pietsch, 2011). Ich beziehe diese Modelle allerdings nicht in die vergleichenden Analysen dieses Beitrags ein. Zwei alternative Item-Response-Modelle für nichtignorierbare Item Responses: Ansätze für eine Sensitivitätsanalyse In diesem Abschnitt sollen zwei alternative modellbasierte Ansätze diskutiert werden, die die fehlenden Item Responses als nichtignorierbar behandeln. Im ersten Modell soll der Ansatz der teilrichtigen Bewertung von Lord (1974) angewendet werden. Ein zweites IRT-Modell erweitert das zweidimensionale IRT-Modell von Holman und Glas (2005) um eine mögliche Abhängigkeit des Ausfallens eines Items vom unbekannten Item Response selbst, sodass sich die Bewertung einer fehlenden Itemantwort als falsch als ein Spezialfall ergibt. Die beiden vorgeschlagenen Modelle können dabei als eine so genannte Sensitivitätsanalyse angesehen werden, bei der unter einer Variation verschiedener Annahmen an den Ausfallprozess die erhaltenen Ergebnisse studiert werden (z. B. Resseguier, Roch & Paoletti, 2011). Ein Pseudo-Likelihood-Ansatz für partielles Scoring der Item Responses Im Pseudo-Likelihood-Ansatz nach Lord (1974) können Item Responses als partiell korrekt (teilrichtige Bepunktung) bewertet werden. Die Pseudo-Likelihood-Funktion L n (genauer: die Pseudo-Log-Likelihood) für Person n ist definiert als Dabei ist P ni die Wahrscheinlichkeit der korrekten Beantwortung von Item i durch Person n und w ni ist der Punktwert (Score) von Person n auf Item i. Liegen keine fehlenden Item Responses vor, dann sind die Scores w ni entweder gleich 1 (bei einer richtigen Antwort) oder gleich 0 (bei einer falschen Antwort). Lord (1974) argumentiert, dass bei fehlenden Item Responses bei Multiple-Choice-Items mit M Antwortalternativen die Scores w ni gleich einer Ratewahrscheinlichkeit von 1/M gesetzt werden können und die entstehende Likelihood (3) optimiert wird. Würde man die fehlenden Item Responses ignorieren, dann bedeutete dies wie oben argumentiert, fehlende Items mit w ni = P ni (θ n, M ) zu bepunkten, wobei θ n, M die Fähigkeitsschätzung für Person n auf Basis der nichtfehlenden Item Responses ist. Bei einer Behandlung der fehlenden Item Responses als falsch wählt man die Scores w ni = 0. Diese beiden Fälle sollen als Extrema der Behandlung fehlen- (3)

61 Zu nichtignorierbaren Konsequenzen des (partiellen) Ignorierens fehlender Item Responses im Large-Scale-Assessment 59 der Item Responses aufgefasst werden (siehe Rost, 2004, S. 324 ff.) und dazwischen liegende Annahmen durch einen Sensitivitätsparameter ρ = 0 (Behandlung der Missings als falsch) und ρ = 1 (Behandlung der Missings als ignorierbar) im Rahmen einer Sensitivitätsanalyse studiert werden. Setzt man in diesem Ansatz als Bepunktung von Item i für Person n den Score w ni = ρ P ni (θ n, M ) und ermittelt die Ergebnisse der Skalierung bei Variation des Parameters ρ. Diese Technik der Sensitivitätsanalysen ist bei der Imputation fehlender Daten für nichtignorierbare Missings verbreitet (van Buuren, 2012; Resseguier, Roch & Paoletti, 2011). Dabei ist zu bemerken, dass der Parameter ρ selbst nicht schätzbar ist, sondern für die Schätzung vorgegeben werden muss. Dies wird auch dadurch gestützt, dass die Pseudo-Likelihood-Funktion in Abhängigkeit von ρ nur ein Maximum bei ρ = 0 oder ρ = 1 annehmen kann. Modellierung des Ausfallprozesses der Item Responses Im zweiten Modell werden die fehlenden Item Responses ähnlich dem zweidimensionalen Modell von Holman und Glas (2005; siehe auch Rose et al., 2010) modelliert. Schreibt man wiederum Ψ als Abkürzung für die logistische Funktion, so gilt unter der Annahme des Rasch-Modells (Yen & Fitzpatrick, 2006) folgende Gleichung für die Wahrscheinlichkeit eines korrekten Item Responses: P(Y i = 1 θ) = Ψ(θ b i ) (4) Die Modellgleichung für einen fehlenden Wert des Items i mithilfe der Response Propensity (Ausfalltendenz) ξ möge nun allerdings auch vom unbekannten Item Response Y i selbst abhängen (siehe Mislevy & Wu, 1996). Dafür definieren wir: P(R i = 1 Y i = k, ξ) = Ψ(ξ β i + kδ) mit k = 0,1 (5) Die Wahrscheinlichkeit eines nichtfehlenden Item Response (d. h. R i =1) in Abhängigkeit des Item Response Y i entsteht dabei unter der Annahme δ 0. Wählt man δ = 0, so gelangt man zum IRT-Modell für nichtignorierbare Item Responses von Holman und Glas (2005). Der Parameter δ ist jedoch ebenso wie der Parameter ρ im Pseudo-Likelihood-Ansatz nicht aus den Daten schätzbar (d. h. nicht empirisch identifizierbar). Wiederum können im Rahmen einer Sensitivitätsanalyse Skalierungsergebnisse in Abhängigkeit vorgegebener Parameterwerte für δ studiert werden. Für sehr kleine Werte von δ (also z. B. δ = 10) erhält man P(R i = 1 Y i = 1, ξ) = 1, also P(R i = 0 Y i = 1, ξ) = 0. D. h. alle Schüler/ innen, die die korrekte Itemantwort wissen, geben mit einer Wahrscheinlichkeit von 1 auch einen korrekten Item Response und lassen daher dieses Item nicht aus. Daraus folgt allerdings nach dem Satz von Bayes die Beziehung P(Y i = 1 R i = 0; θ, ξ) = 0, d. h. fehlende Item Responses werden mit einer Wahrscheinlichkeit von 1 als falsch bewertet. Wie im Pseudo-Likelihood-Ansatz modelliert man demzufolge auch mit diesem Modell die Extrema der Ignorierbarkeit von Missings (δ = 0) und der Behandlung von Missings als falsch (δ = 10). Das vorgeschlagene Item-Response-Modell schätzt Itemschwierigkeiten bi, Itemparameter b i für die Response- Tendenz sowie die bivariate Verteilung von (θ, ξ). Dabei werden in der Ermittlung der Likelihood für Item i die Wahrscheinlichkeiten dreier disjunkter Ereignisse P(R i = 1, Y i = 0 θ, ξ), P(R i = 1, Y i = 1 θ, ξ) und P(R i = 0 θ, ξ) verwendet. Die Wahrscheinlichkeit eines fehlenden Item Responses P(R i = 0 θ, ξ) ist dabei durch die totale Wahrscheinlichkeit P(R i = 0 θ, ξ) = P(R i = 0 Y i = 0 θ, ξ) P(Y i = 0 θ) + P(R i = 0 Y i = 1 ξ) P(Y i = θ) (6) gegeben, die man aus den Itemparametern berechnen kann. Fehlende Item Responses Y i werden dabei praktisch in Analogie zu fehlenden Items in Large-Scale-Assessments mit der Marginal Maximum Likelihood (MML)-Schätzmethode ausintegriert (von Davier & Sinharay, 2014; siehe auch Mislevy & Wu, 1996; Hanson, 2000). Ländervergleich von vier Ländern in PIRLS 2011 Im folgenden Abschnitt soll ein Vergleich der Lesekompetenzleistungen in PIRLS 2011 anhand eines Testhefts für vier ausgewählte Länder, Österreich (Ö), Deutschland (DEU), Frankreich (FRA) und die Niederlande (NLD), vorgenommen und die Abhängigkeit der Ländermittelwerte in Abhängigkeit verschiedener Behandlungen der fehlenden Item Responses untersucht werden. Daten Für die Analyse sollen die Schülerantworten des Testhefts 13 in PIRLS 2011 ( PIRLS Reader ) mit 35 Items (davon 15 Multiple-Choice-Items mit 4 Antwortalternativen) verwendet werden. Dabei resultierten 968 österreichische, 809 deutsche, 901 französische und 802 niederländische Schüler/innen in der Stichprobe. Zur Vereinfachung der Analysen wurden alle polytomen Items dichotomisiert, wobei nur der höchste Punktwert bei einem Item zu einer Richtigantwort führt. Deskriptive Analysen zeigen, dass die mittleren Missinganteile der Items zwischen den Ländern stark variierten (Ö: 11.2 %, DEU: 7.9 %, FRA: 13.6 %, NLD: 2.7 %). Diese Missinganteile waren bei den offenen Items deutlich stärker als bei den Multiple-Choice-Items ausgeprägt (z. B. Ö: offen 17.7 %, Multiple Choice 2.6 %). Bei einer Bewertung der fehlenden Item Responses als Falschantwort erreichten österreichische Schüler/innen im Mittel 55.1 %

62 60 Zu nichtignorierbaren Konsequenzen des (partiellen) Ignorierens fehlender Item Responses im Large-Scale-Assessment richtige Antworten und übertrafen damit leicht Frankreich (53.7 %), erreichten aber signifikant niedrigere Ergebnisse als deutsche Schüler/innen (63.0 %) und niederländische Schüler/innen (64.4 %). Analysen Für die Ländervergleiche werden sechs verschiedene Item- Response-Modelle (im Folgenden als M1,, M6 bezeichnet) unter Berücksichtigung der Schülergewichte für das Testheft 13 berechnet. Für eine vereinfachte Beschreibung der Effekte der Länderreihenfolgen transformieren wir in jedem IRT-Modell erhaltene Fähigkeitsschätzungen so, dass österreichische Schüler/innen einen Mittelwert von 500 und eine Standardabweichung von 100 besitzen. Die Kompetenzwerte für Deutschland, Frankreich und die Niederlande wurden derselben Transformation unterworfen, so dass Ländervergleiche in allen Modellen immer relativ zur mittleren Leistung Österreichs vorgenommen wurden. In Modell M1 werden in einem eindimensionalen Rasch- Modell mit vier Gruppen (den vier verschiedenen Ländern) fehlende Item Responses als falsch bepunktet. Im Modell M2 werden fehlende Item Responses ignoriert, d. h. als Missing in der Likelihood-Schätzung betrachtet und damit ignoriert. In Erweiterung zu M2 wird in Modell M3 ein zweidimensionales Rasch-Modell mit den zwei latenten Variablen der Fähigkeit θ und der Response-Tendenz ξ spezifiziert. In Modell M4 werden im Pseudo-Likelihood- Ansatz des Rasch-Modells nur fehlende Item Responses für die Multiple-Choice-Items mit vier Antwortalternativen mit dem Score w ni =1/4 bepunktet, während fehlende Item Responses bei offenen Items als falsch bepunktet werden (d. h. Score w ni = 0). In den Modellen M1 bis M4 werden Itemschwierigkeiten und die Fähigkeitsverteilung in den vier Ländern simultan geschätzt. Für die Modelle M5 und M6 werden in einer ersten Analyse durch eine Bewertung der fehlenden Item Response sals Falschantworten gemeinsame Itemschwierigkeiten für alle vier Länder erhalten, die in einem zweiten Schritt fixiert werden. In Modell M5 wird der Pseudo-Likelihood-Ansatz (siehe 4.1) im Rahmen des Rasch-Modells eingesetzt, bei dem fehlende Item-Responses mit dem Score w ni = ρ P ni (θ n, M ) versehen sind, wobei θ n, M die Personenfähigkeit unter ausschließlicher Berücksichtigung der nichtfehlenden Item Responses bezeichnet. Die Personenfähigkeit θ n, M wurde dabei aus der individuellen Posteriorverteilung simuliert. Die Ländermittelwerte werden in Abhängigkeit des Sensitivitätsparameters ρ = 0,0.01,,0.99,1 berechnet. In Modell M6 wird die Erweiterung des zweidimensionalen Modells M3 durch die Modellierung des Ausfallprozesses die Abhängigkeit des Fehlens eines Item Responses vom Item selbst vorgenommen (siehe 4.2). Dieses Modell wird in Abhängigkeit des Sensitivitätsparameters δ = 10, 9.5,, 0.5, 0 berechnet. Für alle Item-Response-Modelle sollen die Ländermittelwerte Deutschlands, Frankreichs und der Niederlande im Vergleich zu Österreich verglichen werden. Die gesamte Datenaufbereitung und Schätzung der Modelle fand in der Software R (R Core Team, 2014) statt. Für die Berechnung der Modelle M1 bis M3 wurde das R-Paket TAM (Kiefer, Robitzsch & Wu, 2014) verwendet. Die in M4, M5 und M6 eingesetzten Modelle sind in der Funktion rasch.mml2 des R-Paketes sirt (Robitzsch, 2014) implementiert. Ergebnisse In Tabelle sind die Ländermittelwerte für alle Modelle M1 bis M6 dargestellt. Dabei fällt auf, dass zwischen den beiden Extrema der Missingbehandlung von Modell M1 (Missings werden als falsch bewertet) und Modell M2 (Missings sind ignorierbar) für Deutschland und Frankreich kleinere Unterschiede für die Differenz zum Österreich- Mittelwert entstehen (M1-DEU: 537.5, M2-DEU: 534.2; M1-FRA: 488.7, M2-FRA: 492.4), während die verschiedenen Modelle für die Niederlande zu deutlichen Differenzen führen (M1-NLD: 540.3, M2-NLD: 523.4). Dieser Befund ist aufgrund der deutlich geringeren Missinganteile bei den Item Responses (2.7 %) der niederländischen Schüler/ innen im Vergleich zum Missinganteil der Referenz der österreichischen Schüler/innen (11.2 %) erklärbar. Das Modell M3, das neben einer Fähigkeit auch eine Response-Tendenz als latente Variable enthält, weist nur geringe Abweichungen zum Modell M2 der Ignorierung von Missings auf (z. B. M2-DEU: 534.2, M3-DEU: 534.9). Dies steht im Einklang mit der Literatur (Rose et al., 2010; Pohl et al., 2014). Über die vier Länder hinweg ist die Fähigkeit mit der Response-Tendenz zu.37 korreliert, d. h. fähigere Schüler/innen (wobei Fähigkeit hier modell - implizit in Modell M3 definiert ist) produzieren weniger häufig fehlende Item Responses. Imputiert man nur die fehlenden Item Responses der Multiple-Choice-Items im Pseudo-Likelihood-Ansatz von Modell M4 mit dem Kehrwert der Anzahl der Antwortalternativen (1/4), so werden nur geringe Abweichungen zur Falschbewertung der Missings in Modell M1 beobachtet (z. B. M1-DEU: 537.5, M4-DEU: 537.6). Dies ist damit zu begründen, dass generell Multiple- Choice-Items einen niedrigen Missinganteil in PIRLS besitzen und daher diese Missings nur einen geringen Einfluss auf Analysen besitzen. Die Modelle M5 und M6 variieren dabei die Sensitivitätsparameter ρ bzw. δ im Rahmen einer Sensitivitätsanalyse hinsichtlich verschiedener Annahmen an den Ausfall prozess der Item Responses. Praktisch bilden die Befunde aus Tabelle die Spannweite der Ländermittelwerte zwischen den Extrema der Falschbewertung (Modell M1) und der Ignorier barkeit (Modell M2). In Abbildung erfolgt eine Darstellung der Ländermittelwerte in Abhängig keit

63 Zu nichtignorierbaren Konsequenzen des (partiellen) Ignorierens fehlender Item Responses im Large-Scale-Assessment 61 der Sensitivitätsparameter der Modelle M5 und M6. Die Ränge von Deutschland und den Niederlanden tauschen dabei bei einem bestimmten Wert der Parameter ρ bzw. δ. Die Ländermittelwerte sind dabei stetige und monotone Funktionen der Sensitivitätsparameter. Modell Ö DEU FRA NLD M1: Missing = falsch M2: Missing = ignorierbar M3: 2-dim. Modell M4: Pseudo-Likelihood (für Multiple-Choice-Items) M5: Pseudo-Likelihood ρ = 0 ρ = 0.3 ρ = 0.7 ρ = M6: 2-dim. Modellierung des Ausfallprozesses δ = 10 δ = 1.5 δ = 0.5 δ = Tabelle 1.4.1: Mittelwerte für die Länder Österreich (Ö), Deutschland (DEU), Frankreich (FRA) und die Niederlande (NLD). Der Mittelwert für Österreich wurde in allen Item-Response-Modellen auf 500 fixiert. Mittelwert NLD DEU Ö FRA Mittelwert NLD DEU Ö FRA ρ δ Abbildung 1.4.1: Sensitivitätsanalysen für Ländermittelwerte der Länder Österreich (Ö), Deutschland (DEU), Frankreich (FRA) und der Niederlande (NLD). Links: Pseudo-Likelihood-Schätzung (Modell M5) in Abhängigkeit des Sensitivitätsparameters ρ Rechts: Zweidimensionales Modell M6 in Abhängigkeit des Sensitivitätsparameters δ

64 62 Zu nichtignorierbaren Konsequenzen des (partiellen) Ignorierens fehlender Item Responses im Large-Scale-Assessment Diskussion Im Gegensatz zu Behauptungen der neueren Literatur (Pohl & Carstensen, 2013; Pohl et al., 2014) wurde anhand von Analysen in PIRLS 2011 gezeigt, dass das Ignorieren fehlender Item Responses einen Einfluss auf zentrale Resultate einer Studie besitzt. Länderunterschiede bei verschiedenen Behandlungen fehlender Item Responses fallen dabei deutlich verschieden aus, was die Frage nach einer validen Analysemethode nach sich zieht. Es kann argumentiert werden, dass die in der Literatur auffindbare testtheoretisch basierte Kritik an einer Falschbewertung fehlender Item Responses (Rose, 2013; Pohl et al., 2014) bestenfalls auf einer intraindividuellen Interpretation von Wahrscheinlichkeiten beruht. In dieser Argumentation werden dann jedoch fälschlicherweise die Konzepte der aleatorischen Unsicherheit (das statistische Modell) und epistemischen Unsicherheit (das Zustandekommen der Daten betreffend) konfundiert. Es wurde ebenso aufgezeigt, dass Simulationsstudien für die Wahl der richtigen Behandlung fehlender Item Responses keine Relevanz besitzen (siehe auch Rohwer, 2013). Da die Frage der Festlegung einer adäquaten Bepunktungsregel für die Missings nicht empirisch entscheidbar ist, wurden in diesem Beitrag zwei IRT-Modelle vorgeschlagen, die Sensititivitätsanalysen gegenüber der Annahme der Ignorierbarkeit fehlender Item Responses vornehmen. Das erste alternative eindimensionale IRT-Modell (Modell M5) basiert auf einem Pseudo-Likelihood-Ansatz, bei dem für fehlende Item Responses Punktwerte zwischen 0 und 1 zugelassen werden. Dieser Ansatz besitzt jedoch gegenüber dem zweiten alternativen zweidimensionalen IRT-Modell den Nachteil, dass die Bepunktung für die fehlenden Item Responses von einer ausschließlich auf den nichtfehlenden Items bestimmten weiteren Fähigkeit abhängen. Im zweiten Modell (Modell M6) wird neben der Fähigkeit auch eine dazu korrelierte Response-Tendenz angenommen. Dabei kann das Fehlen eines Item Responses auch vom unbekannten Item Response selbst abhängen. Rechnerisch ist das zweidimensionale Modell aufwändiger als das ein dimensionale Modell und besitzt zusätzlich das Problem, dass keine Maximum- Likelihood-Schätzung der Personenfähigkeit existiert (wenn δ verschieden von null ist). Allerdings beruht in diesem Modell die Berechnung der Fähigkeit nicht wie bei Modell M5 auf einer zusätzlichen Ermittlung der Fähigkeit auf den nichtfehlenden Items. Typischerweise werden die in diesem Artikel durchgeführten Sensitivitätsanalysen bei der Imputation fehlender Daten gegenüber komplexeren Modellspezifikationen wie Pattern-Mixture-Modellen (Pietsch, 2011) vorgezogen, wenn ein Bereich plausibler Analyseergebnisse unter einer Variation von plausiblen Annahmen an den Ausfallprozess vorgenommen wird (van Buuren, 2012). Wird zusätzlich eine Priorverteilung über einen die An - nahmen des Ausfallprozesses charakterisierenden Sensitivitätsparameter spezifiziert, so kann man im Rahmen einer Multi-Model-Inference Analyseergebnisse entsprechend theoretischen Vorannahmen gewichten (Siddique, Harel & Crespi, 2012), was häufig zu größeren Standardfehlern interessierender Modellparameter führt. Eine integrierte statistische Inferenz im Hinblick auf die Generalisierbarkeit hinsichtlich Personen, Items und verschiedener statistischer Modelle hat daher auch im Large-Scale-Assessment Bedeutung (Robitzsch, Dörfler, Pfost & Artelt, 2011). Im Rahmen der vorgestellten Analysen wurde auf eine Beschränkung auf die Familie der Rasch-Modelle vorgenommen. Formal sind die Betrachtungen jedoch einfach auf komplexere IRT- Modelle wie das 2PL- oder das 3PL- Modell oder Modelle für polytome Daten übertragbar. Anstelle eines für alle Items gültigen Sensitivitätsparameters kann dieser separat für jedes einzelne Item oder für einzelne Itemgruppen (etwa Multiple- Choice Items und offene Items) spezifiziert werden. Der vorgeschlagene Pseudo-Likelihood-Ansatz ermöglicht zusätzlich, Messfehler oder Unreliabilität bei der Erfassung der einzelnen Item Responses (etwa aufgrund eines Ratings bei einem offenen Item, das keine perfekte Reliabilität besitzt) zu berücksichtigen, indem beobachtete Item Responses von 0 (falsch) bzw. 1 (richtig) auf nichtganzzahlige Scores modifiziert werden, die die Größe der Raterübereinstimmung abbilden soll. Alternativ zum Pseudo-Likelihood-Ansatz kann allerdings auch mit dem statistischen Ansatz der Belief Functions nach Denoeux (2013) in IRT- Modellen gearbeitet werden, der auf anderen Modellannahmen der Likelihood-Funktion für die Schätzung beruht. Neben der Betrachtung der Konsequenzen der Behandlung fehlender Item Responses für Personenfähigkeiten hat die Analysestrategie durchaus auch Bedeutung für Itemparameterschätzungen (d. h. die Kalibrierung). Da offene Items meistens höhere Missinganteile als Multiple-Choice-Items besitzen, sind die Schwierigkeitsreihenfolgen der Items mit verschiedenen Itemformaten unter den Extrembehandlungen der Falschbewertung und der Ignorierbarkeit in vielen Large-Scale-Assessments mit substanziellen Missinganteilen bedeutsam voneinander verschieden. Die Wahl der Methode der Itemparameterbestimmung hat allerdings Konsequenzen für die Verankerung von Items auf Kompetenzstufen und damit die Interpretation von Kompetenzwerten. Die Konsequenzen einer Bewertung der fehlenden Item Responses als fehlende Itemantwort (und damit als ignorierbar) können vor allem bei Skalierungen in Längsschnittstudien bedeutsam sein, wenn Missinganteile schulformund klassenstufen- oder zeitpunktspezifisch (sowie in deren Interaktion) variieren. In IRT-Modellen mit ignorierbaren fehlenden Item Responses scheint in dieser Situation die Bedeutung einer ermittelten Fähigkeit unklar. Wird eine

65 Zu nichtignorierbaren Konsequenzen des (partiellen) Ignorierens fehlender Item Responses im Large-Scale-Assessment 63 Fähigkeit in einer bestimmten Domäne in einem Test jedoch als Ausmaß der korrekten Beantwortung von Items einer vorgegebenen Itemmenge in einer vorgegebenen maximalen Testbearbeitungszeit definiert (wie dies beispielsweise in PIRLS/TIMSS oder PISA der Fall ist), so führt dies zu einer nichtzirkulären und aus unserer Sicht valideren Definition dieser Fähigkeit. Daraus folgt die Konsequenz, dass fehlende Item Responses nicht ignorierbar sein können. Literatur Bacci, S. & Bartolucci, F. (2013). A multidimensional latent class IRT model for non-ignorable missing responses. Retrieved from Bertoli-Barsotti, L. & Punzo, A. (2013). Rasch analysis for binary data with nonignorable nonresponses. Psicologica, 34, Denoeux, T. (2011). Maximum likelihood estimation from fuzzy data using the EM algorithm. Fuzzy Sets and Systems, 183, Denoeux, T. (2013). Maximum likelihood estimation from uncertain data in the belief function framework. IEEE Transactions on Knowledge and Data Engineering, 25, Fischer, G. H. & Molenaar, I. W. (1995). Rasch models. Foundations, recent developments, and applications. Berlin: Springer. Graham, J. W. (2009). Missing data analysis: Making it work in the real world. Annual Review of Psychology, 60, Hanson, B. (2000). IRT parameter estimation using the EM algorithm. Technical report. Retrieved from Holland, P. W. (1990). On the sampling theory foundations of item response theory models. Psychometrika, 55, Holman, R. & Glas, C. A. (2005). Modelling non ignorable missing data mechanisms with item response theory models. British Journal of Mathematical and Statistical Psychology, 58, Kiefer, T., Robitzsch, A. & Wu, M. (2014). TAM: Test analysis modules. R package version package=tam Lüdtke, O. & Robitzsch, A. (2010). Umgang mit fehlenden Daten in der empirischen Bildungsforschung. In S. Maschke & L. Stecher (Hrsg.), Enzyklopädie Erziehungswissenschaft Online. Fachgebiet Methoden der empirischen erziehungswissenschaftlichen Forschung, Quantitative Forschungsmethoden. Weinheim: Juventa. Mislevy, R. J. & Wu, P.-K. (1996). Missing responses and IRT ability estimation: Omits, choice, time limits, and adaptive testing. ETS Research Report No. RR Princeton, NJ: Educational Testing Service. Molenaar, I. W. (1995). Some background for item response theory and the Rasch model. In G. H. Fischer & I. W. Molenaar (Hrsg.), Rasch models. foundations, recent developments, and applications (S. 3 14). New York: Springer. Molenaar, P. C. M. (2004). A manifesto on psychology as idiographic science: Bringing the person back into scientific psychology, this time forever. Measurement: Interdisciplinary Research & Perspective, 2, Pietsch, M. (2011). Fehlende Daten bei Unterrichtsbeobachtungen: Eine Sensitivitätsanalyse anhand von Daten der Schulinspektion Hamburg. Empirische Pädagogik, 25, Pohl, S. & Carstensen, C. H. (2012). NEPS technical report Scaling the data of the competence tests. NEPS Working Paper No. 14. Bamberg: NEPS. Pohl, S. & Carstensen, C. H. (2013). Scaling of competence tests in the National Educational Panel Study: Many questions, some answers, and further challenges. Journal for Educational Research Online, 5(2), Pohl, S., Gräfe, L. & Rose, N. (2014). Dealing with omitted and not-reached items in competence tests evaluating approaches accounting for missing responses in item response theory models. Educational and Psychological Measurement, 74, 3,

66 64 Zu nichtignorierbaren Konsequenzen des (partiellen) Ignorierens fehlender Item Responses im Large-Scale-Assessment R Core Team (2014). R: A language and environment for statistical computing. R Foundation for Statistical Computing, Vienna, Austria. Resseguier, N., Roch, G. & Paoletti, X. (2011). Sensitivity analysis: When data are missing not-at-random. Epidemiology, 22, Robitzsch, A. (2014). sirt: Supplementary item response theory models. R package version org/package=sirt. Robitzsch, A., Dörfler, T., Pfost, M. & Artelt, C. (2011). Die Bedeutung der Itemauswahl und der Modellwahl für die längsschnittliche Erfassung von Kompetenzen. Zeitschrift für Entwicklungspsychologie und pädagogische Psychologie, 43, Rohwer, G. (2013). Making sense of missing answers in competence tests. NEPS Working Paper No. 30. Bamberg: NEPS. Rose, N. (2013). Item nonresponses in educational and psychological assessment. Dissertationsschrift. Friedrich-Schiller- Universität Jena. Rose, N., von Davier, M. & Xu, X. (2010). Modeling nonignorable missing data with item response theory (IRT). ETS Research Report No. RR Princeton, NJ: Educational Testing Service. Rost, J. (2004). Lehrbuch Testtheorie-Testkonstruktion. Bern: Hans Huber. Siddique, J., Harel, O. & Crespi, C. M. (2012). Addressing missing data mechanism uncertainty using multiple-model multiple imputation: Application to a longitudinal clinical trial. Annals of Applied Statistics, 6, Steyer, R. & Eid, M. (2001). Messen und Testen. Berlin: Springer. van Buuren, S. (2012). Flexible imputation of missing data. Boca Raton: CRC Press. von Davier, M. & Sinharay, S. (2014). Analytics in international large-scale assessments: Item response theory and population models. In L. Rutkowski, M. von Davier & D. Rutkowski (Eds.), Handbook of international large-scale assessment (pp ). Boca Raton: CRC Press. Wainer, H. (2010). Schrödinger s cat and the conception of probability in item response theory. Chance, 23, Yen, W. M. & Fitzpatrick, A. R. (2006). Item response theory. In R. L. Brennan (Hrsg.), Educational measurement (S ). Westport: Praeger Publisher.

67 II. Familiäre und vorschulische Unterstützung

68

69 Migrationshintergrund und Lesekompetenz: Entwicklung seit dem Jahr Migrationshintergrund und Lesekompetenz: Entwicklung seit dem Jahr 2000 Silvia Salchegger, Barbara Herzog-Punzenberger & Sandra Filzmoser Wie hat sich die Lesekompetenz von Kindern und Jugendlichen mit Migrationshintergrund im Vergleich zu jenen ohne Migrationshintergrund seit der Jahrtausendwende entwickelt? Die Daten von PIRLS (seit dem Jahr 2006) und PISA (seit dem Jahr 2000) zeigen, dass der Leistungsunterschied kleiner geworden ist. Dies ist darauf zurückzuführen, dass sich die Lesekompetenz der Schüler/innen mit Migrationshintergrund in Relation zu jenen ohne positiver entwickelt hat: Bei PIRLS ist die Lesekompetenz bei den Kindern ohne Migrationshintergrund zurückgegangen, bei jenen mit hingegen etwa gleich geblieben. Bei PISA ist von 2000 auf 2012 die Lesekompetenz von Jugendlichen ohne Migrationshintergrund etwa gleich geblieben, bei jenen aus Zuwandererfamilien ist sie hingegen signifikant gestiegen. Darüber hinaus zeigt sich, dass bei PIRLS (4. Schulstufe) die Leistungsunterschiede größer ausfallen als bei PISA (15-/16-Jährige), was auf einen positiven Effekt längerer Beschulung für Zuwandererkinder hindeuten könnte. Einleitung Im vorliegenden Beitrag wird der Frage nachgegangen, wie gut es dem österreichischen Bildungssystem gelingt, das Potenzial von Kindern mit Migrationshintergrund zur Entfaltung zu bringen. Ein wesentlicher Gradmesser für diese Bemühungen ist, wie gut Kinder und Jugendliche mit Migrationshintergrund die deutsche Sprache beherrschen. Deutsch sprechen und verstehen zu können, ist eine wesentliche Voraussetzung für die Teilhabe am gesellschaftlichen Leben in Österreich sowie für den persönlichen bildungsmäßigen und beruflichen Erfolg. Bei PISA und PIRLS wird ein wichtiger Teilaspekt des Sprachverständnisses gemessen, die Lesekompetenz. Anhand der Daten dieser Studien kann somit untersucht werden, wie gut Kinder und Jugendliche aus Zuwandererfamilien in der Lage sind, deutsche Texte zu verstehen und zu nutzen. Kinder mit Migrationshintergrund kommen zu Hause in der Regel weniger mit der deutschen Sprache in Berührung als jene ohne. So sprechen 16 % der Kinder mit Migrationshintergrund zu Hause ausschließlich (eine) andere Sprache(n) als Deutsch, 68 % sprechen in der Familie sowohl Deutsch als auch zumindest eine andere Sprache und weitere 16 % sprechen dort ausschließlich Deutsch (Vogtenhuber, Lassnigg & Bruneforth 2012, S. 25). Bei den Kindern ohne Migrationshintergrund sprechen dagegen 87 % ausschließlich Deutsch zu Hause. Mehrsprachigkeit ist eine wichtige Ressource in einer globalisierten Welt. Sie stellt jedoch auch besondere Herausforderungen an das Bildungssystem. Da Kinder mit Migrationshintergrund in ihren Elternhäusern die deutsche Sprache in der Regel weniger vermittelt bekommen, sind sie beim Deutschlernen stärker auf Bildungseinrichtungen (Kindergarten und Schule) angewiesen als Kinder ohne Migrationshintergrund. Auch darüber hinaus sind Kinder mit Migrationshintergrund in besonderem Maße auf eine hohe Qualität der (vor)schulischen Bildung angewiesen: Ihre Eltern beherrschen die Landessprache fallweise nicht ausreichend, um ihren Kindern bei den schulbezogenen Aufgaben helfen zu können. Sie sind mit dem österreichischen Bildungssystem weniger vertraut und stärker mit Hürden in den unterschiedlichsten Lebensbereichen (wie z. B. dem Rechtssystem) konfrontiert als Eltern, die nicht zugewandert sind (Latcheva & Herzog-Punzenberger, 2011). Das Bildungssystem sollte diese spezifischen Benachteiligungen möglichst kompensieren und die Kompetenzen von Kindern mit Migrationshintergrund im Laufe ihrer Schulkarriere an die Kompetenzen von jenen ohne Migrationshintergrund heranführen. Bisherige Studien zeigen, dass dies nur unzureichend ge lingt. Starke Kompetenzunterschiede zwischen Kindern mit und ohne Migrationshintergrund lassen sich nicht nur bei der Sprachstandsmessung im Kindergarten (Breit & Schneider, 2009) und bei der Messung der Lesekompetenz am Ende der Volksschule (Unterwurzacher, 2009) feststellen, sondern auch noch bei den 15-/16-Jährigen am Ende der Schulpflicht (Breit, 2009b; Reiter, 2002; Schreiner & Breit, 2006; Wroblewski, 2012). Hierbei muss natürlich bedacht werden, dass Kinder mit Migrationshintergrund in der Regel unter schwierigeren sozioökonomischen Bedingungen aufwachsen und ein Teil der Leistungsunterschiede auf Unterschiede in der sozialen Lage zurückgeführt werden kann (vgl. unten). Neben sprachlichen und sozioökonomischen Faktoren werden auch interaktionale und institutionelle Diskriminierung (Gomolla & Radtke 2002; Herzog-Punzenberger, 2009), ein geringer Grad an kulturell-sprachlicher Responsivität der Bildungsinstitutionen und gesamtgesellschaftlich ein hoher chill 1 factor (Heath 1 Das englische Wort chill steht für kühl, frostig. Der chill-factor gibt die gefühlte Temperatur an, die durch Wind oder Nässe wesentlich unter den mit dem Thermometer gemessenen Graden liegen kann.

70 68 Migrationshintergrund und Lesekompetenz: Entwicklung seit dem Jahr 2000 & Li, 2010) als weitere Gründe für den Leistungsrückstand von Kindern mit Migrationshintergrund diskutiert. Allerdings gibt es auch gesellschaftliche Situationen und Zuwanderungsgruppen, bei denen die erreichten Kompetenzen jene der Kinder einheimischer Eltern mit demselben Bildungshintergrund übertreffen. Dieses Phänomen wird in der wissenschaftlichen Literatur immigrant optimism genannt und beschreibt die hohe Motivation von Kindern aus zugewanderten Familien, aber auch die hohen Erwartungen der Eltern (Kao & Tienda 1998). Beispielhaft können hier Kinder von vietnamesischen Einwanderern in Deutschland erwähnt werden (Spiewak, 2009). Die Sprachkompetenzen der mehrsprachigen Kinder messen Über 100 Sprachen werden von Schulkindern in Österreich derzeit gesprochen (Brizic & Hufnagl, 2011, S. 27). Mehr als zwanzig Sprachen werden in der österreichischen Schule im Rahmen des muttersprachlichen Unterrichts angeboten (BMBF, 2014, S. 15) Schüler/innen verwenden derzeit auch eine andere Sprache als Deutsch in ihrer familiären Kommunikation (BMBF, 2015, S. 14). Eine wesentliche Aufgabe der Schule ist es, systematische Benachteiligung mehrsprachiger Kinder, die sich am Ende ihrer Schullaufbahn in niedrigeren Deutschkompetenzen im Vergleich zu einsprachigen Kindern ausdrücken würde, zu verhindern. Gleichzeitig soll die Mehrsprachigkeit gefördert und sollen damit auch die Kompetenzen in der jeweiligen Erstsprache entwickelt werden. Es kann davon ausgegangen werden, dass selbst unter günstigen Voraussetzungen (strukturierte durchgängige Förderung) fünf bis sieben Jahre notwendig sind, um die Zweitsprache auf muttersprachenähnlichem Niveau zu beherrschen (de Cillia, n. d.). In Ermangelung verlässlicher Alternativen werden im vorliegenden Beitrag die sprachlichen Kompetenzen der Schüler/innen ohne Migrationshintergrund als Maßstab für den Erfolg der Beschulung von Kindern mit Migrationshintergrund verwendet. Hierbei muss jedoch bedacht werden, dass ein Teil der Schüler/innen die österreichische Schule (inklusive Kindergarten) zum Testzeitpunkt noch gar nicht fünf bis sieben Jahre besucht hat 2. Bisherige Analysen haben gezeigt, dass die soziale Situation von Schülerinnen und Schülern mit Migrationshintergrund wesentlich schlechter ist als jene ohne (z. B. Herzog-Punzenberger & Gapp, 2009; Wroblewski, 2012). Zwar haben Kinder mit Migrationshintergrund fast ebenso häufig Eltern, die eine Universität oder Fachhochschule abgeschlossen haben, wie Kinder ohne Migrationshintergrund; der Anteil an Kindern, deren Eltern maximal über eine Pflichtschulausbildung verfügen, ist hingegen bei jenen mit Migrationshintergrund etwa fünfmal so hoch wie bei jenen ohne Migrationshintergrund (vgl. Vogtenhuber et al., 2012, S. 23). Und selbst hoch qualifizierte Zuwanderer stehen oft auf einer niedrigeren sozialen Stufe als im Inland geborene Personen gleichwertiger Qualifikation, weil sie ihre Bildungszertifikate (aus dem Herkunftsland) auf dem österreichischen Arbeitsmarkt nicht einsetzen können und daher häufig Berufe ausüben, die deutlich unter ihrer Qualifikation liegen (Österreichischer Integrationsfonds, 2014). Bei einem Vergleich der Leistungen von Schülerinnen und Schülern mit und ohne Migrationshintergrund muss daher stets ihre ungleiche soziale Situation mitberücksichtigt werden. Der Spracherwerb ist neben dem familiären Kontext auch in einen schulischen und gesellschaftlichen Kontext eingebettet. Im Folgenden wird beleuchtet, wie sich der schulische und gesellschaftliche Kontext in Bezug auf den Deutschspracherwerb von Kindern mit Migrationshintergrund in den vergangenen Jahren verändert hat. Entwicklung der Sprachförderung in Gesellschaft und Schule seit den 1990er Jahren Nachdem in Österreich zu Beginn der 1990er Jahre die Rückkehrorientierung der österreichischen Gastarbeiterpolitik und damit auch die Abkommen zum Muttersprachen- und Heimatkundeunterricht mit den Entsendeländern Jugoslawien und der Türkei beendet wurden, wurde mit dem Schuljahr 1992/93 die österreichische Schulpolitik hinsichtlich der sprachlich und kulturell vielfältiger werdenden Schule neu ausgerichtet. Die darauffolgenden zwanzig Jahre, , können in drei Phasen eingeteilt werden. In der ersten Phase der 1990er Jahre konnte die ministerielle Verwaltung großzügige Rahmenbedingungen (außerordentlicher Status, Deutschförderung bis zu 22 Wochenstunden, muttersprachlicher Unterricht bis zu sechs Wochenstunden, zusätzliche Lehrerwerteinheiten pro Schüler/in mit einer anderen Erstsprache als Deutsch, interkulturelles Lernen als Unterrichtsprinzip, Sprachentausch; vgl. BMUKK, 2011) durchsetzen, die aber in der inhalt lichen Tiefe von den politischen Entscheidungsträgerinnen und -trägern (u. a. auch wegen der zersplitterten Verantwortungsstruktur zwischen Bund und Ländern) nicht mitgetragen wurden. Dies war möglich, da sie kaum Verpflichtungscharakter hatten und schließlich nur in begrenztem Ausmaß umgesetzt wurden (vgl. Çinar & Davy, 1998). Die zweite Phase in den 2000er Jahren war von Large-Scale- Assessments wie PISA, PIRLS und TIMSS geprägt. Durch diese rückte der internationale Vergleich stärker in den Fokus und es wurde durch das mittelmäßige Abschneiden Österreichs in diesen Leistungsvergleichen von den Medien und der Zivilgesellschaft Handlungsdruck aufgebaut. Das Thema des Leistungsrückstands der Schüler/innen mit Migrationshintergrund wurde in Österreich ab Dezember 2004 (infolge der Veröffentlichung der PISA-2003-Ergebnisse) im nationalen Rahmen breit diskutiert. Dadurch stieg die 2 Dieser Anteil ist jedoch gering: Bei PISA 2012 waren 9 % der 15-/16-Jährigen mit Migrationshintergrund bei der Zuwanderung nach Österreich älter als 8 Jahre. Die allermeisten (67 %) wurden bereits in Österreich geboren.

71 Migrationshintergrund und Lesekompetenz: Entwicklung seit dem Jahr allgemeine Sensibilität für diese Fragestellung sowie die Akzeptanz für etwaige Maßnahmen hierzulande erheblich. Als unmittelbare Reaktion wurde ab 2005/06 die Schuleinschreibung um ein Jahr vorgezogen und Kindern, die von der Schulleitung als förderbedürftig in der Unterrichtssprache eingestuft wurden, ein Sprachticket zur Verfügung gestellt. Da die Wirksamkeit dieser Maßnahme nicht nachgewiesen werden konnte, kam es zu neuen Maßnahmen im Elementarbereich wie der Sprachförderung im Kindergarten ab 2008, einer Sprachstandsfeststellung ab 2009 und schließlich dem verpflichtenden letzten Kindergartenjahr ab Die dritte Phase kann mit dem Jahr 2008 angesetzt werden. In diesem Jahr wurden einerseits verpflichtende Maßnahmen in der vorschulischen Bildung für Kinder mit sprachlichem Aufholbedarf eingeführt und andererseits die Abteilung Migration, interkulturelle Bildung, Sprachenpolitik im Bundesministerium für Unterricht, Kunst und Kultur eingerichtet. Dort entstanden nachhaltige und breit angelegte Strategien mit Dutzenden Einzelmaßnahmen, die die seit Anfang der 1990er Jahre prägenden Vorgangsweisen (siehe oben) komplettierten. Darunter auch die Handlungsempfehlungen der OECD-Länderprüfung Migration und Schulbildung (Nusche, Shewbridge & Rasmussen, 2009). Das seit Dezember 2013 umbenannte BMBF (Bundesministerium für Bildung und Frauen, früher Bundesministerium für Unterricht, Kunst und Kultur: BMUKK) beschreibt seine Vorgangsweise anhand von fünf Strategien (BMUKK, n. d.): 1. Stärkung der Schüler/innen mit anderen Erstsprachen als Deutsch, 2. Professionalisierung von Lehrkräften, Schulleitungen und Schulaufsicht, 3. Unterstützung der Eltern mit Migrationshintergrund, 4. Initiativen in der Erwachsenenbildung für Personen mit Migrationshintergrund, 5. Sensibilisierung der Öffentlichkeit für Mehrsprachigkeit, Interkulturalität und Integration. Abgesehen von den ressorteigenen Aktivitäten des Unterrichtsministeriums wird die Effektivität einschlägiger Maßnahmen durch öffentlichkeitswirksame Aktivitäten anderer Spitzenpolitiker/innen und Ressorts im Bereich der Migration/Integration wesentlich beeinflusst. Daher ist es relevant, dass in diese dritte Phase auch die Einrichtung einer Koordinierungsstelle für Integration 2008 im Bundesministerium für Inneres, der Ausbau des österreichischen Integrationsfonds zu einem Hauptakteur der Umsetzung integrationspolitischer Maßnahmen ( sowie schließlich 2011 die Erfüllung der langjährigen Forderung zivilgesellschaftlicher Akteure nach einem Staatssekretariat für Integration (2011) 3 fällt. Was in den Jahrzehnten zuvor in Form von wissenschaftlichen Publikationen (Boeckmann et al., 1988; Busch & de Cillia, 2003; Çinar, 1998; Fischer, 1986; Matuschek, 1982; Plutzar & Kerschhofer-Puhalo, 2009; Viehböck & Bratić, 1994) und zivilgesellschaftlichen Forderungen in die öffentliche Debatte eingebracht und medial kaum wahrgenommen wurde, erlebt in der dritten Phase durch die Verankerung auf ministerieller Ebene und entsprechende finanzielle Mittel eine deutliche Aufwertung. In ihrer Gesamtheit sollten die vielfältigen Maßnahmen zu einer Erhöhung der Kompetenzen der Schüler/innen mit Migrationshintergrund führen. Allerdings kann dies mit den vorliegenden Daten aus PISA und PIRLS nur mit Einschränkungen geprüft werden. Einerseits weil die Kinder und Jugendlichen von neueren Maßnahmen noch nicht profitieren konnten. So kann die allgemein verpflichtende Maßnahme der Sprachförderung im Kindergarten frühestens bei Schülerinnen und Schülern des Geburtenjahrgangs 2003 (und daher erst bei PIRLS 2016 bzw. PISA 2021) Wirkung zeigen. Andererseits sind die Maßnahmen in der ersten Implementierungsphase meist nicht voll wirksam bzw. kann es auch vorher ähnliche Maßnahmen auf anderen Ebenen (Bundesland, Stadt, ), unter anderem Titel oder in anderer Ausprägung (Sprachticket für den freiwilligen Gebrauch) gegeben haben. Außerdem ist bei Längsschnittvergleichen die Veränderung der Gruppenzusammensetzung, sei es nach Herkunftsländern oder nach sozioökonomischem Hintergrund, zu beachten. Trotz all dieser einschränkenden Faktoren sind die Daten aus den PIRLS- und PISA-Erhebungen aufgrund ihrer Qualität und Repräsentativität ein wichtiger Anhaltspunkt, um Kompetenzveränderungen festzustellen. Die vorliegende Untersuchung Die vorliegende Untersuchung ist die erste für Österreich, die die Entwicklung der Lesekompetenz von Schülerinnen und Schülern mit bzw. ohne Migrationshintergrund systematisch über unterschiedliche Studien (PIRLS und PISA) und unterschiedliche Erhebungszeitpunkte (ab dem Jahr 2000 bis zum Jahr 2012) darstellt. Dabei wird den folgenden Fragen nachgegangen: 1. Gibt es Veränderungen in der Zusammensetzung der Schüler/innen mit Migrationshintergrund seit dem Jahr 2000? Konkret, gibt es Veränderungen in den Anteilen der Schüler/innen, die selbst zugewandert sind (1. Generation) bzw. deren Eltern zugewandert sind (2. Generation), gibt es Veränderungen nach dem Geburtsland der Eltern und nach dem familiären Sprachgebrauch? 2. Wie sehr hat sich das Ausmaß des Leistungsunterschieds 3 Gleichzeitig gelang es nicht, die übergeordnete Koordinierungsstelle vom Innenministerium ins Bundeskanzleramt zu übersiedeln. Die Agenden des Staatssekretariats für Integration wurden ab Dezember 2013 gemeinsam mit dem Amtsträger Sebastian Kurz erstmals ins Bundesministerium für Europa, Integration und Äußeres (BMEIA) überführt.

72 70 Migrationshintergrund und Lesekompetenz: Entwicklung seit dem Jahr 2000 zwischen Schülerinnen und Schülern mit und ohne Migrationshintergrund im Zeitverlauf verändert? 3. Wie viel des jeweiligen Leistungsunterschieds kann durch Faktoren des sozialen Hintergrunds erklärt werden? 4. Wie haben sich die Anteile an leseschwachen Schülerinnen und Schülern (bei PISA sogenannte Risikoschüler/ innen) unter jenen mit Migrationshintergrund entwickelt? 5. Wie und in welchem Ausmaß wird bei der Gestaltung schulischer Rahmenbedingungen auf Multikulturalität und Mehrsprachigkeit eingegangen? Methode Stichprobe Die vorliegende Untersuchung inkludiert Daten aus folgenden internationalen Schülerleistungsstudien, an denen sich Österreich beteiligte: PIRLS 2006, PIRLS 2011, PISA 2000, PISA 2003, PISA 2006, PISA 2009 und PISA Alle Studien umfassten repräsentative Stichproben von jeweils mehr als 4500 Schülerinnen und Schülern. Bei PIRLS sind diese Stichproben repräsentativ für Schüler/innen der vierten Schulstufe (vgl. Suchań & Wintersteller, 2012). Bei PISA sind die Stichproben repräsentativ für Schüler/innen, die 16 Jahre vor der Erhebung geboren worden sind und demnach zum Zeitpunkt der Testung 15/16 Jahre alt sind (vgl. Schwantner & Schreiner, 2013). Bei PISA 2012 war dies der Geburtsjahrgang 1996 (d. h. Schüler/innen, die von bis geboren worden sind), bei PISA 2009 war es der Geburtsjahrgang 1993 usw. Bemerkenswert ist, dass ein Großteil der bei PIRLS 2006 getesteten Schüler/innen (56 %) im Jahr 1996 geboren worden ist und demnach genau dem Jahrgang angehört, der auch bei PISA 2012 getestet wurde. Dem Vergleich von PIRLS 2006 und PISA 2012 kommt daher ein besonderer Stellenwert zu. Tabelle gibt einen Überblick über die Geburtsjahrgänge der Schüler/innen unterschiedlicher PISA-Erhebungen und zeigt zudem, in welchen beiden Jahren der Großteil der Schüler/innen, der bei PIRLS teilgenommen hat, geboren worden ist. Für alle Berechnungen zu PISA 2000 wurden die im Jahr 2003 neu adjustierten Gewichte verwendet (Neuwirth, 2006). Für PISA 2009 muss beachtet werden, dass es zu einem bislang nicht geklärten Leistungsrückgang kam (vgl. Bacher, 2012) und die Ergebnisse mit Vorsicht interpretiert werden sollten. Verwendete Maße Migrationshintergrund In den Schülerfragebögen von PIRLS und PISA wurde erhoben, ob die Schüler/innen sowie deren Eltern innerhalb oder außerhalb Österreichs geboren wurden. Die Einstufung des Migrationshintergrunds erfolgt nach den Regeln der OECD (z. B. OECD, 2012). Dabei werden drei Gruppen unterschieden: 1. Einheimische Schüler/innen (= Schüler/innen ohne Migrationshintergrund): zumindest ein Elternteil wurde im Inland geboren, unabhängig vom Geburtsland des Kinds. 2. Schüler/innen zweiter Generation: Schüler/in wurde im Inland geboren, beide Elternteile jedoch im Ausland. 3. Schüler/innen erster Generation: Sowohl die Schülerin/ der Schüler selbst als auch beide Elternteile wurden im Ausland geboren. Wie oben angeführt, wurden bei PIRLS sowohl die Eltern als auch die Schüler/innen danach gefragt, ob Eltern und/ oder Kind im In- oder Ausland geboren worden sind. Wenn sich die Angaben von Eltern und Kindern widersprechen, werden jene der Eltern herangezogen. Fehlende Angaben wurden jeweils wechselseitig ergänzt. In den meisten der folgenden Analysen werden Schüler/innen erster und zweiter Generation zusammengefasst und als Schüler/innen mit Migrationshintergrund bezeichnet. Wenn keine Angaben zum Geburtsland des Kinds und zumindest eines Elternteils vorlagen, konnte der Migrationshintergrund nicht rekodiert werden. Dies war jedoch nur bei einem sehr geringen Anteil an Schülerinnen und Schülern der Fall (bei PISA zwischen 0,5 % im Jahr 2000 und 2,1 % im Jahr 2009, bei PIRLS zwischen bei 0,6 % im Jahr 2006 und bei 0,3 % im Jahr 2011). Schüler/innen mit fehlenden Werten wurden in den nachfolgenden Analysen zum Migrationshintergrund ausgeschlossen. Da der Anteil fehlender Werte gering ist, ist auch die Wahrscheinlichkeit einer Ergebnisverzerrung durch den Ausschluss dieser 4. Schulstufe Altersgruppe 15-/16-Jährige (in der Regel 10-Jährige) Studie PISA 2000 PISA 2003 PISA 2006 PISA 2009 PISA 2012 PIRLS 2006 PIRLS 2011 Geburtsjahrgang (56 %) 1995 (41 %) 2001 (57 %) 2000 (40 %) 1 Bei PISA wurden alle getesteten Schüler/innen im entsprechenden Jahr geboren; bei PIRLS sind jene beiden Jahre eingetragen, in denen die meisten getesteten Schüler/innen geboren wurden. Der genaue Anteil steht in Klammern. Tabelle 2.1.1: Einbezogene Studien nach Geburtsjahrgang der Schüler/innen

73 Migrationshintergrund und Lesekompetenz: Entwicklung seit dem Jahr Schüler/innen gering. Es soll dennoch darauf hingewiesen werden, dass fehlende Werte nicht zufällig sind, sodass leistungsschwächere Schüler/innen mit Migrationshintergrund aus unteren sozialen Schichten untererfasst werden (vgl. Bacher, 2009, S. 84). Herkunftsland der Eltern Bei PISA wurde ab der Erhebung von 2003 das Herkunftsland der Eltern ermittelt, indem die Schüler/innen in einer Liste von Ländern ankreuzen sollten, in welchem Land ihr Vater und in welchem Land ihre Mutter geboren wurde. Bei PISA 2000 wurden noch keine konkreten Geburtsländer erfragt. Bei PIRLS wurden die Eltern (im Elternfragebogen) gebeten, aus einer Liste von Ländern jenes anzukreuzen, in dem sie geboren wurden (getrennt für Mutter und Vater). Die nachfolgenden Analysen zum Geburtsland der Eltern basieren damit bei PISA auf Schülerangaben und bei PIRLS auf den Angaben der Eltern. In den Analysen dieses Beitrags werden bei Kindern mit Migrationshintergrund folgende Herkunftsländer der Eltern unterschieden: Türkei: beide Eltern wurden in der Türkei geboren; Exjugoslawien: Mutter und Vater stammen aus einem der folgenden Staaten: Serbien, Montenegro, Kosovo, Bosnien-Herzegowina oder Kroatien 4 ; anderes Land oder gemischte Herkunft: beide Eltern wurden in einem anderen Land geboren oder die Eltern wurden in zwei unterschiedlichen Ländern geboren. Sozialer Hintergrund Der soziale Hintergrund wurde bei PISA im Index des ökonomischen, sozialen und kulturellen Status (ESCS) zusammengefasst. Der ESCS-Index setzt sich aus folgenden drei Indizes zusammen: a) der beruflichen Stellung der Eltern, b) der Bildung der Eltern, umgerechnet in Bildungsjahre, c) Besitztümer zu Hause (Wohlstandsindikatoren, kulturelle Besitztümer, Bildungsressourcen und Bücher). Der ESCS- Index wurde so standardisiert, dass der Mittelwert über alle OECD-Länder bei 0 liegt und die Standardabweichung bei 1. Eine detaillierte Beschreibung des ESCS-Index findet sich in OECD (2012) und OECD (2013a). Dieser Index wird von der OECD (2013a) unter anderem herangezogen, um zu kontrollieren, wie viel des Leistungsunterschieds zwischen Schülerinnen und Schülern mit und ohne Migrationshintergrund durch Unterschiede in der Verteilung der sozioökonomischen Merkmale der beiden Gruppen erklärt werden kann. Diesem Standard wird auch im vorliegenden Beitrag gefolgt. Für Trendanalysen wurde der ESCS-Index auf der Basis der Erhebung von 2012 reskaliert (vgl. OECD, 2013a). Alle Analysen zur zeitlichen Entwicklung des ESCS beruhen auf diesen reskalierten Werten. In allen Analysen, in denen der ESCS-Index als Kontrollvariable dient, wurde jeweils der originale Index verwendet (mit Ausnahme von PISA 2000, wo im Originaldatenfile noch keine ESCS Variable enthalten ist hier wurde der im Rahmen von PISA 2009 nachskalierte Index verwendet). Der Anteil fehlender Werte schwankte beim ESCS zwischen 0,3 % bei PISA 2003 und 2,4 % bei PISA In der Erhebung 2012 lag dieser Anteil bei 1 %. Für PIRLS gibt es keinen vergleichbaren Index. Als Maß für den sozialen Hintergrund wurden hier zwei Variablen herangezogen: a) die Bildung der Eltern (laut Elternangaben) umgerechnet in die Anzahl der Bildungsjahre; diese Umrechnung erfolgte entsprechend den Vorgaben der OECD (2013a) und b) die Anzahl der Bücher im Elternhaus laut Schülerangaben; dabei handelt es sich um eine fünfstufige Variable: von keine oder sehr wenige (0 10) bis drei oder mehr Bücherregale (200 oder mehr). Der Schüleranteil mit fehlenden Werten zur Bildung der Eltern lag bei PIRLS 2006 bei 6,6 % und bei PIRLS 2011 bei 5,7 %. Von 2,8 % der Schüler/innen lagen 2006 und von 2,2 % lagen 2011 keine Angaben zum Buchbesitz vor. Bei der Interpretation der Ergebnisse muss beachtet werden, dass der soziale Hintergrund bei PISA durch ein breiteres Variablenspektrum erfasst wird als bei PIRLS und kein direkter Vergleich möglich ist. Zu Hause gesprochene Sprache Sowohl bei PISA als auch bei PIRLS wurden die Schüler/innen gefragt, ob sie zu Hause (auch) eine andere Sprache als Deutsch sprechen. Der konkrete Fragewortlaut unterschied sich geringfügig zwischen den beiden Studien. Bei PIRLS wurde gefragt: Wie oft sprichst du zu Hause Deutsch? Die Antwortkategorien waren: Ich spreche zu Hause immer oder fast immer Deutsch, Ich spreche zu Hause manchmal Deutsch und manchmal eine andere Sprache und Ich spreche zu Hause nie Deutsch. Bei PISA wurden die Jugendlichen gefragt: Welche Sprache sprichst du zu Hause am häufigsten? In einer Liste von konkreten Sprachen sollten sie dann die entsprechende ankreuzen. Der Anteil fehlender Werte schwankte bei PISA zwischen 2,9 % bei der Erhebung 2006 und 8,8 % bei der Erhebung Bei PIRLS fehlte die Angabe zur Sprache bei 13,4 % der Schüler/innen im Jahr 2006 und bei 1,3 % im Jahr Lesekompetenz Bei PIRLS wird Lesekompetenz definiert als die Fähigkeit, jene geschriebenen Sprachformen zu verstehen und zu nutzen, die von der Gesellschaft verlangt werden und/oder für die jeweilige Person nützlich und wertvoll sind. Junge Leser/innen können die Bedeutung von verschiedensten Texten erfassen. Sie lesen, um zu lernen, um an der Ge 4 Mazedonien und Slowenien wurden zumindest bei einer Erhebung nicht gesondert abgefragt, weshalb diese beiden Länder in der Kategorie Exjugoslawien nicht berücksichtigt werden.

74 72 Migrationshintergrund und Lesekompetenz: Entwicklung seit dem Jahr 2000 meinschaft der Lesenden in der Schule sowie im täglichen Leben teilzunehmen und zum Vergnügen (Grafendorfer, Wallner-Paschon, Suchan & Widauer, 2012, S. 13). Lesekompetenz bedeutet bei PISA geschriebene Texte zu verstehen, zu nutzen, über sie zu reflektieren und sich mit ihnen auseinanderzusetzen, um eigene Ziele zu erreichen, das eigene Wissen und Potenzial weiterzuentwickeln und am gesellschaftlichen Leben teilzunehmen (Schwantner & Schreiner, 2013, S. 20). In beiden Definitionen bedeutet Lesen weit mehr, als einen Text vorlesen zu können. Es geht darum, die Bedeutung von Texten zu erfassen und das Gelesene für sich nutzen zu können. Bei der ersten PIRLS-Erhebung im Jahr 2001 (an der sich Österreich noch nicht beteiligte) wurde die PIRLS-Leseskala so verankert, dass der Mittelwert über alle damaligen Teilnehmerländer 500 beträgt und die Standardabweichung 100. Höhere Werte indizieren eine höhere Kompetenz. Eine genaue Beschreibung der Leseskala von PIRLS erfolgt bei Gonzalez (2003) sowie bei Foy, Brossman & Galia (2012). Die PISA-Leseskala wurde im Jahr 2000 so verankert, dass der Mittelwert über alle OECD-Länder, die sich an PISA 2000 beteiligten, 500 beträgt, die Standardabweichung 100 (Adams & Carstensen, 2002). Die Konstruktion der PISA- Leseskala wird durch die OECD (2012) genauer beschrieben. Durch diese Verankerung auf einen bestimmten Erhebungszeitpunkt können die Leistungen unterschiedlicher Erhebungszeitpunkte derselben Studie (PIRLS bzw. PISA) miteinander verglichen werden. So kann etwa festgestellt werden, ob sich die Lesekompetenz von Schülerinnen und Schülern mit Migrationshintergrund über die Zeit hinweg verändert hat. Ein direkter Vergleich von Leistungswerten zwischen den beiden Studien ist allerdings nicht möglich, da sich die Skalierung auf unterschiedliche Länder (vgl. oben) und Leseframeworks bezieht. Über den Umweg der Berechnung von Effektstärken (Cohen, 1988; Ellis, 2010) ist es jedoch möglich, die Größe der Leistungsunterschiede zwischen Schülerinnen und Schülern mit bzw. ohne Migrationshintergrund über unterschiedliche Studien hinweg vergleichbar zu machen. So kann festgestellt werden, ob der Leistungsunterschied zwischen Schülerinnen und Schülern mit bzw. ohne Migrationshintergrund am Ende der Volksschule (PIRLS) oder am Ende der Schulpflicht (PISA) größer ist. In der Einführung zu diesem Bericht sowie in Kapitel 1.3 wird die Berechnung und Interpretation von Effektstärken genauer beschrieben. Die Berechnungen erfolgten für PISA mit SPSS 21 unter Verwendung des Replicates Add-In 8.1. Für PIRLS wurde der IEA-IDB-Analyzer Version 3.1 verwendet. Diese Programme berücksichtigen das komplexe Stichprobendesign der beiden Studien. Alle Analysen wurden mit gewichteten Daten durchgeführt. Jede Schülerin/jeder Schüler geht damit gemäß ihrem/seinem Anteil in der Population in die Analysen ein. Genauere Informationen zu Stichprobendesign und Datengewichtung finden sich für PISA z. B. bei der OECD (2009) und für PIRLS bei Foy (2012). Alle Signifikanzprüfungen erfolgten auf einem Alpha-Niveau von < Die statistische Signifikanz von Mittelwertdifferenzen wurde mittels t-tests für unabhängige Stichproben ermittelt. Bei Analysen mit PISA-Daten wurde in die Standardfehler der Differenz bei Trendvergleichen zusätzlich ein Link Error eingerechnet (vgl. OECD, 2013b, S. 281 ff.). Schüler/innen mit fehlenden Werten zumindest einer für die jeweilige Analyse relevanten Variable wurden von der jeweiligen Analyse ausgeschlossen. Ergebnisse Anteile und Zusammensetzung der Schüler/innen mit Migrationshintergrund im Zeitverlauf Abbildung zeigt, dass sich der Anteil an Schülerinnen und Schülern mit Migrationshintergrund unter den 15-/16-Jährigen von PISA 2000 (Geburtsjahrgang 1984) bis PISA 2012 (Geburtsjahrgang 1996) von 11 % auf 17 % erhöht hat. Es wird deutlich, dass der Anteil an Schülerinnen und Schülern mit Migrationshintergrund, der bereits in Österreich geboren wurde (2. Generation), in diesem Zeitraum stark zugenommen hat, während der Anteil jener, die selbst erst nach Österreich zugewandert sind (1. Generation), rückläufig ist. Bei einem Zeitvergleich, der nur die PISA-Daten (also 15-/16-Jährige) berücksichtigt, fällt auf, dass sich zwischen 2006 und 2009 eine deutliche Änderung in der Zusammensetzung ergeben hat. Während bis 2006 die selbst zugewanderten Jugendlichen eindeutig in der Überzahl waren, bilden ab 2009 die in Österreich gebore Schüler/innen (gesamt) % 25 % PISA PIRLS 2011 Schüler/innen mit Migrationshintergrund gesamt 1. Generation 2. Generation vgl. Tabelle A.5 im Anhang für genaue Werte Abbildung 2.1.1: Entwicklung der Anteile von Kindern und Jugendlichen mit Migrationshintergrund

75 Migrationshintergrund und Lesekompetenz: Entwicklung seit dem Jahr nen Jugendlichen (2. Generation) die Mehrheit unter den Jugendlichen mit Migrationshintergrund 5. Abbildung zeigt den Anteil an Kindern und Jugendlichen mit Migrationshintergrund, der zu Hause (auch) eine andere Sprache als Deutsch spricht. Zu allen Erhebungszeitpunkten gaben zumindest 70 % der Schüler/innen mit Migrationshintergrund an, zu Hause (auch) eine andere Sprache als Deutsch zu sprechen. Bei PIRLS liegen die Anteile noch etwas höher als bei PISA. Dies könnte einerseits damit zu tun haben, dass bei PIRLS die Frage nach Mehrsprachigkeit weiter gefasst war: Während bei PIRLS auch jene Schüler/innen zu den Mehrsprachigen zählen, die zu Hause nur manchmal eine andere Sprache als Deutsch sprechen, sind es bei PISA nur diejenigen, die zu Hause am häufigsten eine andere Sprache als Deutsch sprechen (vgl. Methodenteil). Andererseits könnte gerade die Dauer des Schulbesuchs, die von der deutschen Sprache geprägt ist, zu einer vermehrten Benutzung des Deutschen auch zuhause und insbesondere unter den Geschwistern führen. Insgesamt zeigt sich jedoch für beide Studien, dass ein Migrationshintergrund eng mit Mehrsprachigkeit verknüpft ist. Dabei ist zu beachten, dass etwa bei PISA % der zugewanderten Eltern aus Deutschland stammen und daher Deutsch mit großer Wahrscheinlichkeit ihre Erstsprache ist. Daten der Bildungsstandard-Baseline-Erhebung 2010 (4. Schulstufe) zeigen, dass in den meisten Herkunftsgruppen (z. B. Eltern aus der Türkei oder dem ehemaligen Jugoslawien) knapp über 10 % der zugewanderten Familien nur Deutsch zuhause sprechen, zwei Drittel bis drei Viertel Deutsch und eine andere Sprache und die verbleibenden 13 % bis 22 % (je nach Herkunftsgruppe) nur eine andere Sprache als Deutsch (Vogtenhuber et al., 2012, S. 25). Schüleranteil mit Migrationshintergrund, der zweisprachig ist % % PISA PIRLS Abbildung 2.1.3: Entwicklung der Anteile von Kindern und Jugendlichen mit Migrationshintergrund nach Herkunftsland der Eltern In Abbildung wird der Anteil an Kindern und Jugendlichen mit Migrationshintergrund getrennt nach dem Geburtsland ihrer Eltern dargestellt. Bei PISA 2000 wurden noch keine konkreten Geburtsländer der Eltern erhoben. Bei PISA 2003 (Geburtsjahrgang 1987) zeigte sich, dass fast die Hälfte aller Jugendlichen mit Migrationshintergrund (46 %) Eltern hatten, die im ehemaligen Jugoslawien geboren worden waren. Jeweils weniger als 30 % hatten Eltern, die aus der Türkei (25 %) oder einem anderen Land (29 %) zugewandert waren. Die neuesten Erhebungen zeigen eine Zunahme an Schülerinnen und Schülern, deren Eltern aus anderen Ländern als der Türkei oder Exjugoslawien stammen. Diese machen nun 44 % der Kinder mit Migrationshintergrund in den Volksschulen aus (PIRLS 2011) und 37 % der 15-/16-Jährigen (PISA 2012). Die Vielfalt der Herkunftsländer ist insgesamt größer geworden. Die Zusammensetzung der Schüler/innen mit Migrationshintergrund wird damit heterogener. Ein immer größerer Teil stammt nicht mehr aus den klassischen Zuwanderungsländern Exjugoslawien und Türkei, sondern aus einer Vielzahl unterschiedlicher Länder. Angesichts der immer größeren Anteile von Schülerinnen und Schülern mit Migrationshintergrund und auch ihrer größeren Diversität wird in der Folge untersucht, inwiefern dieser gesteigerten Multikulturalität im Unterrichtsalltag entsprochen wird. Schüler/innen mit Migrationshintergrund % % * 2003 PISA PIRLS Eltern in Exjugoslawien geboren Eltern in der Türkei geboren anderes Land oder gemischte Herkunft *Herkunftsland nicht erhoben vgl. Tabelle A.5 im Anhang für genaue Werte Abbildung 2.1.2: Anteile an Kindern und Jugendlichen mit Migrationshintergrund nach Sprachgebrauch zu Hause 5 Diese Veränderungen können mit einer sich verändernden Zusammensetzung der Elterngenerationen als Folge von politischen Gegebenheiten in den Auswanderungsländern zusammenhängen (z. B. keine Kriegsflüchtlinge mehr aus Exjugoslawien), aber auch mit Veränderungen in der Einwanderungspolitik Österreichs (z. B. Regelung des Familiennachzugs).

76 74 Migrationshintergrund und Lesekompetenz: Entwicklung seit dem Jahr 2000 Die Beachtung von Mehrsprachigkeit und Multikulturalität im Unterrichtskontext Im Rahmen von PIRLS und PISA wurden auch einige Fragen zum Unterrichtskontext gestellt, die sich auf Multikulturalität und Mehrsprachigkeit beziehen, vor allem auf die Kompetenzen der Lehrpersonen und die Aktivitäten der Schulleitungen. Diese Maßnahmen im Aus- und Weiterbildungsbereich, aber auch die Durchführung entsprechender Aktivitäten im Schulalltag finden sich auch im Maßnahmenkatalog des BMUKK (n. d.) und wurden in den Nationalen Aktionsplan für Integration 2012 (Bundesministerium für Innere Angelegenheiten, 2012) aufgenommen. Kenntnisse zur Sprachentwicklung mehrsprachiger Kinder sowie zur Entwicklung von Deutsch als Zweitsprache sind besonders wichtig zur Führung mehrsprachiger Klassen. Daher wurden die Lehrkräfte bei PIRLS 2006 und bei PIRLS 2011 gefragt, wie intensiv sie sich im Rahmen ihrer Aus- und Fortbildung mit Deutsch als Fremdsprache beschäftigt haben. Im Jahr 2006 wurden 61 % der Kinder von Lehrkräften unterrichtet, die angaben, überhaupt keine derartige Aus- oder Fortbildung zu haben, im Jahr 2011 waren es immer noch 57 % (vgl. Abb ). Darüber hinaus wurde analysiert, wie hoch der Anteil an Kindern mit Migrationshintergrund ist, deren Lehrkraft sich in der Aus- und Fortbildung mit Deutsch als Fremdsprache beschäftigt hat. Hier zeigt sich, dass bei PIRLS % der Kinder mit Migrationshintergrund von einer Lehrkraft ohne entsprechende Aus- oder Fortbildung unterrichtet worden sind. 42 % der Kinder mit Migrationshintergrund wurden von einer Lehrkraft unterrichtet, die im Rahmen ihrer Aus- und Fortbildung einen Überblick oder eine Einführung in das Gebiet erhalten hat, nur 13 % der Kinder mit Migrationshintergrund hatten eine PIRLS 2006 PIRLS 2011 gesamt gesamt Lehrkraft, die sich in ihrer Ausbildung schwerpunktmäßig mit Deutsch als Fremdsprache auseinandergesetzt hat. Der Zeitvergleich zeigt, dass seit 2006 die Zahl der Lehrkräfte, die zumindest einen Überblick oder eine Einführung aufweisen kann, größer geworden ist. Dieser Anteil ist von 39 % bei PIRLS 2006 auf 44 % bei PIRLS 2011 gestiegen und der Anteil ohne derartige Ausbildung wurde geringer. Jedoch hatten 2011 (mit 13 %) sogar etwas weniger Kinder mit Migrationshintergrund eine Lehrkraft, die einen Schwerpunkt in dieser Ausbildung vorweisen konnte, als 2006 (17 %). In diesem Zusammenhang bemängelt auch die Europäische Kommission (2013), dass in Österreich Kompetenzen im Bereich der kulturellen Diversität und Deutsch als Fremdsprache keine Voraussetzung sind, um Schüler/innen mit Migrationshintergrund unterrichten zu dürfen. Im Rahmen von PISA 2012 wurden die Schulleiter/innen unter anderem gefragt, wie viele Lehrer/innen mit einer anderen Erstsprache als Deutsch an ihrer Schule beschäftigt sind und ob es an ihrer Schule im laufenden Schuljahr Aktivitäten gibt, die sich auf das Leben in einer multikulturellen Gesellschaft beziehen (interkulturelle Kompetenz, Antidiskriminierung, rassismusfreie Schule). Es wird deutlich, dass insgesamt 61 % der 15-/16-Jährigen ohne Migrationshintergrund und 68 % der Jugendlichen mit Migrationshintergrund eine Schule besuchten, in der es im Schuljahr 2011/12 laut Schulleiterangaben solche Aktivitäten gab. Dies bedeutet umgekehrt auch, dass fast ein Drittel der Jugendlichen mit Migrationshintergrund eine Schule besuchte, in der keine solche Aktivität durchgeführt wurde. Analysen zum Lehreranteil mit einer anderen Erstsprache als Deutsch zeigen, dass 55 % der Jugendlichen von PISA 2012 eine Schule besuchen, in der es keine einzige Lehrkraft mit einer anderen Erstsprache als Deutsch gibt. Weitere 35 % besuchen eine Schule, in der es zwar zumindest eine Lehrkraft mit anderer Erstsprache gibt, ihr Anteil am Lehrkörper aber weniger als 5 % ausmacht. 15-/16-Jährige kommen damit im Rahmen ihrer Ausbildung nur sehr selten mit Lehrkräften, die eine andere Erstsprache sprechen, in Berührung. PIRLS 2006 mit Migrationshintergrund Entwicklung der Lesekompetenz von Kindern und Jugendlichen mit Migrationshintergrund PIRLS 2011 mit Migrationshintergrund % % Schüleranteil, der von einer Lehrkraft mit entsprechender Qualifikation unterrichtet wird keine Ausbildung im Bereich Deutsch als Fremdsprache Überblick oder Einführung in das Gebiet Deutsch als Fremdsprache war ein Schwerpunkt Abbildung 2.1.4: Aus- und Fortbildung der Lehrer/innen im Bereich Deutsch als Fremdsprache (PIRLS 2006 & 2011) Die bisher vorgestellten Ergebnisse haben gezeigt, dass die Schülerschaft kulturell vielfältiger wird und wie dieser Vielfalt im Unterrichtsalltag entsprochen wird. Im Folgenden wird der Frage nachgegangen, inwiefern sich die Lesekompetenz der Schüler/innen mit Migrationshintergrund im vergangenen Jahrzehnt verändert hat. Abbildung zeigt die Entwicklung der Lesekompetenz von Schülerinnen und Schülern mit und ohne Migrationshintergrund im Zeitvergleich. Die Mittelwerte der Schüler/ innen mit Migrationshintergrund werden durch dunkelrote Rautensymbole dargestellt, jene der Einheimischen mittels

77 Migrationshintergrund und Lesekompetenz: Entwicklung seit dem Jahr hellroter Rautesymbole. Darüber hinaus sind für alle Mittelwerte die 95-Prozent-Konfidenzintervalle eingetragen (vgl. Zur Interpretation der Ergebnisse in der Einführung zu diesem Bericht). Da sich der Geburtsjahrgang der bei PISA 2012 und PIRLS 2006 getesteten Schüler/innen zum Großteil deckt (Jahrgang 1996), wird in den folgenden Abbildungen PIRLS 2006 immer im Anschluss an PISA 2012 präsentiert. Diese chronologische Darstellung nach Geburtsjahrgang bringt es mit sich, dass die Ergebnisse für ältere Schüler/innen (PISA) vor den Ergebnissen jüngerer Schüler/innen (PIRLS) angeführt werden. Der Vergleich der PISA-Erhebungen von 2000 und 2012 zeigt, dass sich die Lesekompetenz der Jugendlichen mit Migrationshintergrund signifikant verbessert hat: von 409 Punkten im Jahr 2000 auf 449 Punkte im Jahr Die Lesekompetenz der Jugendlichen ohne Migrationshintergrund ist hingegen etwa gleich geblieben (502 Punkte im Jahr 2000 und 499 Punkte im Jahr 2012). Dass 15-jährige Schüler/innen mit Migrationshintergrund seit dem Jahr 2000 immer besser lesen (abgesehen von PISA 2009), diejenigen ohne Migrationshintergrund ihre Kompetenzen im Vergleich zu PISA 2000 aber nicht verbessern konnten, hat zur Folge, dass sich die Leistungsunterschiede zwischen diesen beiden Gruppen verringern. Während die Effektstärke des Leistungsunterschieds bei PISA 2000 noch d = 0,94 (großer Effekt) und 93 Leistungspunkte betrug, sind es bei PISA 2012 nur mehr 51 Leistungspunkte und der Effekt erreicht eine mittlere Größe ( 0,56; siehe auch Tab , Modell 1). Bei PIRLS entwickelt sich die Lesekompetenz bei den Kindern mit Migrationshintergrund weniger negativ als bei den Kindern ohne Migrationshintergrund. Bei Ersteren beträgt der Leistungsrückgang von 2006 auf 2011 nur zwei Punkte und ist statistisch nicht signifikant. Kinder ohne Migrationshintergrund schneiden hingegen 2011 signifikant schlechter ab als 2006 ( 10 Punkte; vgl. Abb , rechte Grafik). Es ist somit der Unterschied in der Lesekompetenz zwischen Kindern mit und ohne Migrationshintergrund kleiner geworden: Während diese im Jahr 2006 noch 49 Kompetenzpunkte trennten (d = 0,77), sind es im Jahr 2011 nur mehr 42 Punkte (d = 0,67; siehe auch Tab , Modell 1). Auch wenn die vorliegenden Ergebnisse zeigen, dass die Leistungsunterschiede zwischen Kindern und Jugendlichen mit und ohne Migrationshintergrund geringer werden, muss im Auge behalten werden, dass über alle Erhebungszeitpunkte und über alle Studien (PISA und PIRLS) hinweg Schüler/ innen mit Migrationshintergrund eine wesentlich geringere Lesekompetenz aufweisen als jene ohne. Dieser Unterschied ist stets statistisch signifikant und von mittlerer bis hoher praktischer Bedeutsamkeit (vgl. Tab , Modell 1). Für Kinder und Jugendliche macht es einen Unterschied, ob sie bereits im Einwanderungsland der Eltern geboren wurden (2. Generation) oder ob sie selbst eingewandert sind (1. Generation). Vergleicht man die erste und zweite Generation in ihren Leseleistungen, muss man allerdings auf ihre interne Zusammensetzung und die Veränderung derselben über die Zeit achten. Abbildung zeigt die Leistungsentwicklung von Migrantinnen/Migranten der ersten und zweiten Generation im Trendvergleich. Seit dem Jahr 2000 kam es bei PISA insbesondere bei den 15-Jährigen, die selbst mit ihren Eltern zugewandert sind der ersten Ge Lesekompetenz hoch niedrig PISA PIRLS Erhebungsjahr 350 Geburtsjahr der gestesteten Schüler/innen Schüler/innen mit Migrationshintergrund Mittelwert } Konfidenzintervall (+/ 1.96 SE) Manche Konfidenzintervalle sind aufgrund ihrer geringen Größe nicht sichtbar vgl. Tabelle A.6 im Anhang für genaue Werte Schüler/innen ohne Migrationshintergrund 1 Bei PISA wurden alle getesteten Schüler/innen im entsprechenden Jahr geboren; bei PIRLS ist jenes Jahr eingetragen, in dem der Großteil der getesteten Schüler/innen geboren wurde. Abbildung 2.1.5: Entwicklung der Lesekompetenz von Schülerinnen und Schülern mit und ohne Migrationshintergrund

78 76 Migrationshintergrund und Lesekompetenz: Entwicklung seit dem Jahr 2000 hoch PISA hoch PIRLS Lesekompetenz niedrig Lesekompetenz niedrig Mittelwert Schüler/innen mit Migrationshintergrund gesamt } Konfidenzintervall (+/ 1.96 SE) 1. Generation 2. Generation vgl. Tabelle A.6 im Anhang für genaue Werte Abbildung 2.1.6: Leseleistungsentwicklung: 1. und 2. Generation im Vergleich neration zu einer deutlichen und statistisch signifikanten Leistungssteigerung (plus 46 Punkte von 2000 auf 2012). Auch Jugendliche der zweiten Generation erreichten eine höhere Punktanzahl (plus 22 Punkte von 2000 auf 2012) dieser Zuwachs ist jedoch statistisch nicht signifikant. Für die aktuellsten Erhebungen (PIRLS 2011 und PISA 2012) zeigt sich, dass Schüler/innen mit Migrationshintergrund, die bereits in Österreich geboren sind (2. Generation), keine signifikant besseren Leseleistungen aufweisen als Schüler/innen, die erst im Laufe ihres Lebens nach Österreich zugewandert sind (1. Generation). Abbildung zeigt die Leistungsentwicklung von Schülerinnen und Schülern mit Migrationshintergrund getrennt nach ihrem Herkunftsland. Es wird deutlich, dass Schüler/innen, deren Eltern in der Türkei geboren wurden, die relativ schwächste Lesekompetenz aufweisen. Schüler/innen mit Eltern aus Exjugoslawien liegen im Mittelfeld und lesen etwa gleich gut wie Schüler/innen mit Migrationshintergrund im Durchschnitt. Die relativ leistungsstärksten Schüler/innen mit Migrationshintergrund finden sich in der Gruppe anderes Herkunftsland. Das sind Kinder und Jugendliche mit Migrationshintergrund, die ihre Wurzeln nicht in Exjugoslawien oder der Türkei haben oder deren Eltern aus zwei unterschiedlichen Ländern stammen. Diese Gruppe besteht bei PISA 2012 zu 12 % aus Jugendlichen, deren Eltern aus Deutschland zugewandert sind und damit im Regelfall die gleiche Muttersprache haben wie einheimische Schüler/innen. Würde man die deutschen Schüler/ innen aus der Berechnung ausschließen, würde sich der Mittelwert der Gruppe andere oder gemischte Herkunft geringfügig verringern, von 481 auf 475 Punkte. Der Gesamtmittelwert der Jugendlichen mit Migrationshintergrund würde unter Ausnahme der deutschen Jugendlichen leicht von 449 auf 445 Punkte zurückgehen. Das heißt, selbst bei PISA 2012, wo der Anteil deutschstämmiger Jugendlicher unter allen Erhebungen bisher am größten ist, spielt diese Gruppe kaum eine Rolle für die Leistungsentwicklung der Jugendlichen mit Migrationshintergrund insgesamt. Es muss darauf hingewiesen werden, dass sich die unterschiedlichen Migrantengruppen in ihrem sozialen Hintergrund stark unterscheiden. Den eindeutig niedrigsten ESCS (ökonomischen, sozialen und kulturellen Status) weisen türkischstämmige Schüler/innen auf (M = 1,17; SE = 0,07), der ESCS für Jugendliche, die aus Exjugoslawien stammen, liegt signifikant höher (M = 0,54; SE = 0,04) und Jugendliche anderer oder gemischter Herkunft (M = 0,05; SE = 0,07) weisen einen signifikant höheren ESCS auf als beide eben genannten Gruppen (bezogen auf PISA 2012) 6. Bei der Interpretation der Leseleistungen muss stets dieser ungleiche soziale Hintergrund mitbedacht werden. Wenn man die unterschiedliche soziale Herkunft statistisch kontrolliert, dann verringert sich bei PISA 2012 der Leistungsnachteil türkischer Jugendlicher von 87 auf 36 Punkte, bei exjugoslawischen von 60 auf 32 Punkte und bei Jugendlichen anderer oder gemischter ausländischer Herkunft von 18 auf 9 Punkte jeweils gegenüber den Jugendlichen ohne Migrationshintergrund. Im Zeitvergleich wird deutlich, dass sich die Lesekompetenz der türkischstämmigen Jugendlichen zuerst lange Zeit auf dem etwa gleichen Niveau befunden hat, bei PISA 2012 aber deutlich angestiegen ist: Während der Durchschnittswert dieser Gruppe in allen vorhergehenden PISA-Erhebungen 6 Jugendliche ohne Migrationshintergrund haben einen mittleren ESCS von 0,19 (SE = 0,02).

79 Migrationshintergrund und Lesekompetenz: Entwicklung seit dem Jahr Lesekompetenz hoch niedrig PISA Lesekompetenz hoch niedrig PIRLS 2011 Schüler/innen mit Migrationshintergrund gesamt anderes Land oder gemischte Herkunft Mittelwert } Konfidenzintervall (+/ 1.96 SE) vgl. Tabelle A.6 im Anhang für genaue Werte Abbildung 2.1.7: Leseleistungsentwicklung nach Herkunftsland Eltern in Exjugoslawien geboren Eltern in der Türkei geboren maximal 372 Punkte betrug, verbesserte er sich bei PISA 2012 signifikant auf 412 Punkte. Auch bei PIRLS lässt sich ein tendenzieller Leistungsanstieg bei den türkischstämmigen Kindern erkennen, während bei den anderen Gruppen die Tendenz eher rückläufig ist. Der Leistungsrückstand der türkischstämmigen Schüler/innen zu jenen der anderen Herkunftsgruppen ist damit sowohl bei PISA als auch bei PIRLS in neuester Zeit kleiner geworden. Bildungsgerechtigkeit spiegelt sich nicht nur in (möglichst geringen) Mittelwertsunterschieden wider, sondern auch darin, dass möglichst alle Schüler/innen grundlegende Fähigkeiten erwerben sollen. Schüler/innen, die bei PISA oder PIRLS nur maximal Kompetenzstufe 1 erreichen, fehlt es an grundlegenden Lesefertigkeiten für die aktive Teil habe an der Gesellschaft. Abbildung zeigt getrennt nach Migrationshintergrund, wie viele Schüler/innen zu den Leseschwachen 7 zählen. Es wird deutlich, dass der Anteil an Schülerinnen und Schülern mit Migrationshintergrund unter den Leseschwachen zwar beständig kleiner wird (mit Ausnahme von PISA 2009), aber noch immer beachtlich hoch ist: Während im Jahr % der Jugendlichen mit Migrationshintergrund zur Risikogruppe zählten, sind es im Jahr 2012 mit 34 % zwar deutlich weniger, aber immer noch mehr als ein Drittel. Bei den Schülerinnen und Schülern ohne Migrationshintergrund ist der Risikoschüleranteil (mit 15 % im Jahr 2000 und 16 % im Jahr 2012) jedoch etwa gleich geblieben. Bei PIRLS zählen 2006 und 2011 konstant 37 % der Viertklässler/innen zu den Leseschwachen. Bei den Einheimischen ist der Anteil Leseschwacher jedoch größer geworden: von 12 % im Jahr 2006 auf 16 % im Jahr So zeigt sich auch beim Anteil leseschwacher Schüler/innen bei jenen mit Migrationshintergrund eine Schüleranteil auf oder unter Level 1 % 60 % PISA 40 PIRLS vergleichsweise bessere Entwicklung als bei jenen ohne sowohl für PISA als auch für PIRLS. Dennoch ist der Anteil an Schülerinnen und Schülern mit Migrationshintergrund, der zur Risikogruppe gehört, mit 34 % (bei PISA 2012) bzw. 37 % (bei PIRLS 2011) nach wie vor mehr als doppelt so hoch wie bei den Einheimischen mit 16 % (sowohl bei PISA 2012 als auch bei PIRLS 2011). Es wurde bereits wiederholt gezeigt, dass Schüler/innen mit Migrationshintergrund im Durchschnitt unter schlechteren sozialen Bedingungen leben als Schüler/innen der Mehrheitsbevölkerung (z. B. Breit, 2009a; Herzog-Punzenberger Schüler/innen ohne Migrationshintergrund Schüler/innen mit Migrationshintergrund Abbildung 2.1.8: Entwicklung des Anteils an Risikoschülerinnen und -schülern bei PISA bzw. leseschwacher Schüler/ innen bei PIRLS nach Migrationshintergrund 7 Es handelt sich hierbei um Schüler/innen, die maximal Kompetenzstufe 1 erreichen. Bei PISA werden diese Schüler/innen auch als Risikogruppe bezeichnet.

80 78 Migrationshintergrund und Lesekompetenz: Entwicklung seit dem Jahr 2000 & Gapp, 2009) und ein wesentlicher Teil der Leistungsunterschiede zwischen diesen beiden Gruppen durch ihre soziale Herkunft erklärt werden kann (Breit, 2009b; Unterwurzacher, 2009). Auch die PISA-2012-Daten zeigen, dass Jugendliche mit Migrationshintergrund (M = 0,49) einen signifikant schlechteren ökonomischen sozialen und kulturellen Status (ESCS) aufweisen als jene ohne (M = 0,19). Im Zeitvergleich (PISA 2000 zu PISA 2012) wird deutlich, dass der ESCS der Jugendlichen mit Migrationshintergrund (plus 0,42 Indexpunkte) etwa im gleichen Umfang gestiegen ist, wie bei den Jugendlichen ohne Migrationshintergrund (plus 0,40 Indexpunkte). Dass der Leistungsunterschied in Lesen zwischen Jugendlichen mit und ohne Migrationshintergrund kleiner geworden ist, kann somit definitiv nicht durch eine Verringerung sozialer Unterschiede erklärt werden. Denkbar wäre jedoch, dass sich die Wirkung des sozialen Hintergrunds verstärkt hat, sodass der gleiche Unterschied zu größeren Differenzen führt. Die Tabellen und (jeweils Modell 2) zeigen die Ergebnisse von Regressionsmodellen, in denen nach dem ökonomischen sozialen und kulturellen Status (ESCS) kontrolliert wird. Es wird deutlich, dass je nach Studie % des Leistungsunterschieds zwischen Schülerinnen und Schülern mit und ohne Migrationshintergrund durch soziale Faktoren erklärt werden können. Wird beispielsweise bei PISA 2012 nach dem sozialen Hintergrund kontrolliert, verringert sich der Leistungsunterschied von 51 auf 23 Punkte. Bemerkenswert ist, dass der soziale Hintergrund über die Zeit hinweg immer mehr Varianz in den (rückläufigen) Leistungsunterschieden erklärt: Konnten bei PISA 2000 nur 30 % des Leistungsunterschieds zwischen Schülerinnen und Schülern mit und ohne Migrationshintergrund auf den sozialen Hintergrund zurückgeführt werden, sind es bei PISA %. Leistungsunterschiede werden also insgesamt kleiner und sie können in einem immer stärkeren Umfang auf soziale Faktoren zurückgeführt werden, ob PISA 2000 PISA 2003 PISA 2006 PISA 2009 PISA 2012 B SE B SE B SE B SE B SE Modell 1 Konstante ** ** ** ** ** 2.73 Migrationshintergrund 93.28** ** ** ** ** 5.78 R Effektstärke des Leistungsunterschieds zwischen Einheimischen und Migrant/ innen (ohne Kontrolle des sozialen Hintergruns) Modell 2 Konstante ** ** ** ** ** 2.68 Migrationshintergrund 64.99** ** ** ** ** 5.54 ESCS 36.87** ** ** ** ** 2.51 R Effektstärke des Leistungsunterschieds zwischen Einheimischen und Migrant/ innen unter Kontrolle des sozialen Hintergrunds Anteil (%) des Leistungsunterschieds zwischen Einheimischen und Migrant/ innen, der durch den sozialen Hintergrund erklärt wird **Werte sind signifikant (p <.01); 1 berechnet als (1-(B-Koeffizient zum Migrationshintergrund aus Modell 2/B-Koeffizient zum Migrationshintergrund aus Modell 2))*100. Tabelle 2.1.2: Unterschiede in der Lesekompetenz zwischen Jugendlichen mit und ohne Migrationshintergrund: ohne und mit Kontrolle des sozialen Hintergrunds (PISA 2000, 2003, 2006, 2009, 2012)

81 Migrationshintergrund und Lesekompetenz: Entwicklung seit dem Jahr PIRLS 2006 PIRLS 2011 B SE B SE Modell 1 Konstante ** ** 1.74 Migrationshintergrund 49.17** ** 3.63 R Effektstärke des Leistungsunterschieds zwischen Einheimischen und Migrant/innen (ohne Kontrolle des sozialen Hintergrunds) Modell 2 Konstante ** ** 6.30 Migrationshintergrund 27.70** ** 3.75 Bildung der Eltern (umgerechnet in Jahre) 5.44** ** 0.51 Buchbesitz 12.25** ** 1.05 R Effektstärke des Leistungsunterschieds zwischen Einheimischen und Migrant/innen unter Kontrolle des sozialen Hintergrunds Anteil (%) des Leistungsunterschieds zwischen Einheimischen und Migrant/innen, der durch den sozialen Hintergrund erklärt wird **Werte sind signifikant (p <.01); 1 berechnet als (1-(B-Koeffizient zum Migrationshintergrund aus Modell 2/B-Koeffizient zum Migrationshintergrund aus Modell 2))*100. Tabelle 2.1.3: Unterschiede in der Lesekompetenz zwischen Kindern mit und ohne Migrationshintergrund: ohne und mit Kontrolle des sozialen Hintergrunds (PIRLS 2006, 2011) wohl der Unterschied im ESCS zwischen Jugendlichen mit und ohne Migrationshintergrund im Jahr 2012 etwa gleich hoch ausfällt wie im Jahr Wie in der Einleitung erwähnt, kommt dem Vergleich von PIRLS 2006 mit PISA 2012 eine besondere Bedeutung zu, da sich die Schülerkohorte zu großen Teilen deckt. Beim Vergleich dieser beiden Studien zeigt sich, dass die Effektstärke des Leistungsunterschieds zwischen Schülerinnen und Schülern mit und ohne Migrationshintergrund am Ende der Grundschule deutlich höher liegt (d = 0,77) als bei PISA (d = 0,56). Dies deutet darauf hin, dass die Leistungskluft zwischen Schülerinnen und Schülern mit und ohne Migrationshintergrund mit zunehmender Beschulung geringer wird 8. In der Folge werden die wichtigsten Ergebnisse zusammengefasst und mögliche Gründe für die positive Leistungsentwicklung bei Jugendlichen mit Migrationshintergrund diskutiert. Diskussion Wie bereits mehrfach für die Allgemeinbevölkerung dokumentiert (z. B. Statistik Austria, 2013), zeigt der vorliegende Beitrag, dass auch bei den Jugendlichen in der Schule der Migrantenanteil seit der Jahrtausendwende deutlich gestiegen ist. Unter den 15-/16-Jährigen hatten im Jahr % einen Migrationshintergrund (d. h. beide Elternteile wurden im Ausland geboren), im Jahr 2012 waren es 17 %. Und aus den neuesten Volksschuldaten zeichnet sich ab, dass auch dieser Anteil weiter steigen wird. So haben bei PIRLS % der Viertklässler/innen einen Migrationshintergrund. Auch zeigen die vorliegenden Ergebnisse, dass die kulturelle Vielfalt unter den Kindern mit Migrationshintergrund größer geworden ist. So stammen bei PIRLS 2011 nur mehr 55 % der Schüler/innen mit Migrationshintergrund aus den klassischen Zuwanderungsländern Exjugoslawien und Türkei (bei PISA 2003 waren es noch 71 %) und ein Anteil von 45 % kommt aus einer Vielzahl weiterer Länder. Der vorliegende Beitrag zeigt erstmals für den langen Zeitraum von 12 Jahren, wie sich die Lesekompetenz von Schülerinnen und Schülern mit Migrationshintergrund in Österreich entwickelt hat. Bei PISA konnte hier eine wesentliche Verringerung des Leistungsunterschieds zwischen Jugendlichen mit und ohne Migrationshintergrund festgestellt werden: Während im Jahr /16-Jährige mit Migrationshintergrund noch hoch bedeutsam ( 93 Punkte) hinter Gleichaltrigen ohne Migrationshintergrund zurücklagen, fällt der Leistungsunterschied im Jahr 2012 mit 51 Punkten wesentlich geringer aus. Es muss aber dennoch betont werden, dass auch dieser Unterschied nach wie vor beträchtlich und statistisch signifikant ist. Trendergebnisse belegen, dass sich die Leistungskluft zwischen Schülerinnen und Schülern mit und ohne Migrationshintergrund immer mehr schließt, weil sich die Lese 8 Hierbei muss bedacht werden, dass bei PISA etwa 5 % der Jugendlichen nicht mehr im Schulsystem zu finden sind (vgl. Pareiss, 2013). Es kann angenommen werden, dass es sich dabei überwiegend um sehr leistungsschwache Schüler/innen (oft mit Migrationshintergrund) handelt. Würden die Leistungen aller 15-/16-Jährigen erfasst werden und nicht nur jene der beschulten, würde der Leistungsunterschied zwischen Jugendlichen mit und ohne Migrationshintergrund bei PISA wahrscheinlich höher ausfallen.

82 80 Migrationshintergrund und Lesekompetenz: Entwicklung seit dem Jahr 2000 kompetenz bei Jugendlichen mit Migrationshintergrund von PISA 2000 auf PISA 2012 positiv entwickelt hat (+39 Punkte), während sie bei Jugendlichen ohne Migrationshintergrund konstant geblieben ist ( 3 Punkte, n. s.). Bei PIRLS ist die Lesekompetenz der Kinder mit Migrationshintergrund von 2006 auf 2011 etwa gleich geblieben ( 2 Punkte, n. s.), Kinder ohne Migrationshintergrund haben sich hingegen signifikant verschlechtert ( 10 Punkte). Bemerkenswert ist die positive Entwicklung der Lesekompetenz von Jugendlichen mit türkischen Wurzeln. Zwischen und 2009 waren die Leistungswerte ungefähr gleich geblieben, verbesserten sich aber 2012 sehr deutlich um 40 Punkte. Und dies, obwohl der soziale Status bei den türkischen Jugendlichen im Zeitverlauf ( ) in einem geringeren Ausmaß gestiegen ist (plus 0,13 ESCS-Indexpunkte) als bei Jugendlichen mit Migrationshintergrund insgesamt (plus 0,28 Indexpunkte) und Jugendlichen ohne Migrationshintergrund (plus 0,37 Indexpunkte). Nach wie vor lässt sich ein beachtlicher Teil der Leistungsunterschiede zwischen Schülerinnen und Schülern mit und ohne Migrationshintergrund durch Unterschiede im sozialen Hintergrund erklären. Kinder und Jugendliche mit Migrationshintergrund wachsen im Durchschnitt unter wesentlich schlechteren sozioökonomischen Bedingungen auf als jene ohne. Für PIRLS 2011 und PISA 2012 zeigt sich, dass die Leistungsunterschiede nur etwa halb so groß ausfallen würden, wenn Kinder und Jugendliche mit und ohne Migrationshintergrund unter denselben sozioökonomischen Bedingungen aufwachsen würden 10. Über die Zeit hinweg ist der Anteil des Leistungsunterschieds, der durch sozioökonomische Faktoren erklärt werden kann, immer größer geworden. Waren dies bei PISA 2000 nur 30 %, sind es 12 Jahre später 54 %. Insgesamt zeigt sich damit, dass die Leistungsunterschiede zwischen Jugendlichen mit und ohne Migrationshintergrund kleiner werden, gleichzeitig aber der soziale Hintergrund eine immer größere Rolle bei der Erklärung dieser Leistungsunterschiede spielt. Die vorliegenden Ergebnisse belegen, dass Jugendliche mit Migrationshintergrund heute im Durchschnitt eine höhere Lesekompetenz aufweisen als zur Jahrtausendwende. Die Ursachen für diese Verbesserung können mit den PISA-Daten allerdings nicht eindeutig geklärt werden. Es ist davon auszugehen, dass eine Vielzahl von Faktoren dafür verantwortlich ist. Diese Faktoren sind einerseits in der Zusammensetzung der Jugendlichen mit Migrationshintergrund zu suchen. Beispielsweise zeigt sich, dass der Anteil an Schülerinnen und Schülern, die nicht aus den klassischen Einwanderungsländern Exjugoslawien und Türkei stammen, deutlich gewachsen ist und gerade diese Jugendlichen (Gruppe anderes Herkunftsland oder gemischte Herkunft ) die höchste Lesekompetenz unter den Schülerinnen und Schülern mit Migrationshintergrund aufweisen. Gleichzeitig ist der Anteil türkischer Jugendlicher und damit der traditionell leistungsschwächsten Zuwanderungsgruppe in Österreich kleiner geworden. Dabei soll jedoch der deutliche Leistungsanstieg bei den türkischen Jugendlichen in letzter Zeit nicht übersehen werden, der bei dieser Gruppe in den letzten Jahren am stärksten war. Möglicherweise spielen hierfür Initiativen in der türkischen Community selbst, die sich durch eine starke Bildungsorientierung auszeichnen, wie etwa die Gülen-Bewegung, eine Rolle (vgl. für Deutschland Agai, 2010, 36 46; Geier & Frank, 2014). Ein weiterer Grund für die Steigerung der Lesekompetenz bei Jugendlichen mit Migrationshintergrund könnte in verbesserten schulischen Rahmenbedingungen liegen. So wird in der Lehreraus- und -fortbildung ein stärkerer Fokus auf Interkulturalität, Mehrsprachigkeit und Deutsch als Zweitsprache gelegt. Die vorliegenden Ergebnisse zeigen, dass Volksschullehrer/innen 2011 häufiger eine Ausbildung in Deutsch als Fremdsprache/Zweitsprache aufweisen als noch Dennoch wurden auch im Jahr 2011 noch immer 45 % der Kinder mit Migrationshintergrund von einer Lehrkraft ohne entsprechende Ausbildung unterrichtet. Auch zeigen die PISA-2012-Daten, dass es noch immer nur sehr selten Lehrkräfte mit einer anderen Erstsprache als Deutsch gibt: Mehr als die Hälfte der PISA-Schüler/innen hatte im Schuljahr 2011/12 überhaupt keine solche Lehrkraft an der Schule. Neben Maßnahmen in der Schule wird in letzter Zeit der Sprachförderung im Kindergarten eine immer größere Bedeutung beigemessen (vgl. Einleitung). Von der frühen Sprachförderung (beginnend mit 2008) konnten allerdings die PISA- und PIRLS-Schüler/innen noch nicht profitieren. So wurden die bei PISA 2012 getesteten Jugendlichen in der Regel bereits im Jahr 2002 eingeschult und die bei PIRLS 2011 getesteten Kinder im Jahr Bemerkenswert am Einflussfaktor Schule ist, dass die Effekt stärke der Leistungsdifferenz mit zunehmender Beschulung kleiner wird. Wie erwähnt, teilt sich ein großer Teil der Schülerkohorte von PIRLS 2006 und PISA 2012 das Geburtsjahr (1996). Als sich die (zum Großteil) 1996 Geborenen auf der vierten Schulstufe befanden (PIRLS 2006), betrug die Effektstärke der Leistungsdifferenz zwischen Kindern mit und ohne Migrationshintergrund 0,77. Sechs Jahre später, als die 1996 Geborenen bei PISA 2012 getestet wurden, betrug die Effektstärke nur mehr 0,54. Wenn man also Schülerkohorten untersucht, deren Geburtsjahrgang sich stark überlappt, zeigen sich mit längerer 9 Bei der PISA-Testung im Jahr 2000 wurde nur danach gefragt, ob Mutter und Vater im Inland oder im Ausland geboren wurden, sodass in den Analysen der PISA-2000-Daten nicht nach Geburtsland (z. B. Türkei) unterschieden werden kann. 10 Wie in der Einleitung erwähnt, wurde bei PIRLS und PISA der soziale Hintergrund unterschiedlich operationalisiert, wodurch die Vergleichbarkeit der Ergebnisse zwischen PIRLS und PISA in diesem Punkt eingeschränkt ist.

83 Migrationshintergrund und Lesekompetenz: Entwicklung seit dem Jahr Beschulung geringere Leistungsunterschiede. Dies könnte auch darauf hindeuten, dass die Aufholprozesse mehrsprachiger Kinder mit zunehmendem Alter stärker zur Entfaltung kommen. Wie in der Einleitung erwähnt, ist eine durchgängige Sprachförderung von fünf bis sieben Jahren notwendig, um Kinder in der Zweitsprache an ein bildungssprachliches Niveau heranzuführen (de Cillia, n. d.). Eine längere Beschulung könnte bei geeigneten Rahmenbedingungen daher insbesondere für Kinder mit Migrationshintergrund weitergehende positive Effekte haben. Darüber hinaus könnten sich auch die in der Einleitung beschriebenen gesellschaftlichen Veränderungen auf die Leistungen der Schüler/innen mit Migrationshintergrund auswirken. Integration wird auch auf gesamtgesellschaftlicher Ebene immer stärker wahrgenommen und die Handlungsempfehlungen im Bereich Bildung (Volf & Bauböck, 2001; Herzog-Punzenberger & Unterwurzacher, 2009; Nusche, Shewbridge & Rasmussen, 2009) schrittweise umgesetzt. Zusammenfassend belegen die vorliegenden Ergebnisse, dass die Lesekompetenz bei Jugendlichen (15-/16-Jährigen) mit Migrationshintergrund im Zeitraum gestiegen ist, während sie bei Jugendlichen ohne Migrationshintergrund etwa gleich geblieben ist. Bei den Volksschulkindern mit Migrationshintergrund ist die Lesekompetenz etwa gleich geblieben, während sie bei den Kindern ohne Migrationshintergrund signifikant gesunken ist (von 2006 auf 2011). Damit sind die Leistungsunterschiede in Lesen zwischen Schülerinnen und Schülern mit und ohne Migrationshintergrund sowohl in der Volksschule als auch bei den 15-/16-Jährigen kleiner geworden. Die Gründe für diese positivere Leistungsentwicklung bei den Jugendlichen mit Migrationshintergrund (im Vergleich zu jenen ohne Migrationshintergrund) können mit den vorliegenden Daten allerdings nicht im Detail festgestellt werden. Anzunehmen ist ein Zusammenspiel von individuellen, schulischen und gesellschaftlichen Faktoren. Literatur Adams, R. & Carstensen, C. (2002). Scaling Outcomes. In R. Adams & M. Wu (Eds.), PISA 2000 Technical Report (pp ). Paris: OECD Publishing. Agai, B. (2010). Die Arbeit der Gülen-Bewegung in Deutschland: Akteure, Rahmenbedingungen, Motivation und Diskurse. In W. Homolka, J. Hafner, A. Kosman & E. Karakoyun (Hrsg.), Muslime zwischen Tradition und Moderne. Die Gülen-Bewegung als Brücke zwischen den Kulturen (S. 9 55). Freiburg i. B.: Herder. Bacher, J. (2009). Soziale Ungleichheit, Schullaufbahn und Testleistungen. In B. Suchan, C. Wallner-Paschon & C. Schreiner (Hrsg.), PIRLS Die Lesekompetenz am Ende der Volksschule (S ). Graz: Leykam. Bacher, J. (2012). Repräsentativität der PISA2009-Erhebung. In F. Eder (Hrsg.), PISA Nationale Zusatzanalysen für Österreich (S ). Münster: Waxmann. BMBF Bundesministerium für Bildung und Frauen (2014). Der muttersprachliche Unterricht in Österreich. Statistische Auswertung für das Schuljahr 2012/13. Informationsblätter des Referats für Migration und Schule Nr. 5/2013/14. Zugriff am unter 14.pdf BMBF Bundesministerium für Bildung und Frauen (2015). SchülerInnen mit anderen Erstsprachen als Deutsch. Statistische Übersicht Schuljahre 2007/08 bis 2013/14. Informationsblätter des Referats für Migration und Schule Nr. 2/2014/15. Zugriff am unter BMUKK Bundesministerium für Unterricht, Kunst und Kultur (2011). Gesetzliche Grundlagen schulischer Maßnahmen für SchülerInnen mit anderen Erstsprachen als Deutsch. Gesetze und Verordnungen. Zugriff am unter grg23vbs.ac.at/fileadmin/media/infomat/leistungsbeurteilung/01_gesetzliche_grundlagen_fuer_schueler_mit_nichtdeutscher_muttersprache.pdf BMUKK Bundesministerium für Unterricht, Kunst und Kultur (n.d.). Unveröffentlichtes Arbeitspapier der Abteilung I/5 Diversitäts- und Sprachenpolitik, Sonderpädagogik und inklusive Bildung, Begabungsförderung. Boeckmann, B., Brunner, K. M., Egger, M., Gombos, G., Juric, M. & Larcher, D. (1988). Identität und Assimilation. In R. Bauböck, G. Baumgartner & K. Pintér (Hrsg.),...und raus bist du! Ethnische Minderheiten in der Politik (S ). Wien: Verlag für Gesellschaftskritik.

84 82 Migrationshintergrund und Lesekompetenz: Entwicklung seit dem Jahr 2000 Breit, S. (2009a). Sozialisationsbedingungen von Schülerinnen und Schülern mit Migrationshintergrund. In C. Schreiner & U. Schwantner (Hrsg.), PISA Österreichischer Expertenbericht zum Naturwissenschaftsschwerpunkt (S ). Graz: Leykam. Breit, S. (2009b). Kompetenzen von Schülerinnen und Schülern mit Migrationshintergrund. In C. Schreiner & U. Schwantner (Hrsg.), PISA Österreichischer Expertenbericht zum Naturwissenschaftsschwerpunkt (S ). Graz: Leykam. Breit, S. & Schneider, P. (2009). Ergebnisse der Sprachstandsfeststellung. In S. Breit (Hrsg.), Frühkindliche Sprachstandsfeststellung. Konzept und Ergebnisse der systematischen Beobachtung im Kindergarten (S ). Graz: Leykam. Brizic, K. & Hufnagl, C. (2011). Multilingual Cities Wien: Bericht zur Sprachenerhebung in den 3. und 4. Volksschulklassen. Zugriff am unter Cities_Vienna._Preliminary_school_report_on_a_home-language_survey_in_Viennese_primary_schools_in_German_._Austrian _Academy_of_Sciences._Online Bundesministerium für Innere Angelegenheiten (2012). Nationaler Aktionsplan für Integration. Maßnahmen. Zugriff am unter Busch, B. & de Cillia, R. (Hrsg.). (2003). Sprachenpolitik in Österreich. Eine Bestandsaufnahme. Frankfurt am Main: Peter Lang. Çinar, D. (Hrsg.). (1998). Gleichwertige Sprachen? Muttersprachlicher Unterricht für die Kinder von Einwanderern. Innsbruck: StudienVerlag. Çinar, D. & Davy, U. (1998). Von der Rückkehrförderung zum Interkulturellen Lernen: Rahmenbedingungen des muttersprachlichen Unterrichts. In D. Çinar (Hrsg.), Gleichwertige Sprachen? Muttersprachlicher Unterricht für die Kinder von Einwanderern (S ). Innsbruck: StudienVerlag. Cohen, J. (1988). Statistical power analysis for the behavioral sciences. Hillsdale, NJ: Erlbaum. de Cillia, R. (n.d.). Spracherwerb in der Migration Deutsch als Zweitsprache. Bundesinstitut für Bildungsforschung, Innovation und Entwicklung des österreichischen Schulwesens BIFIE. Zugriff am unter dl/srdp_cillia_spracherwerb_migration_ pdf Ellis, P. D. (2010). The essential guide to effect sizes. Cambridge: Cambridge University Press. Europäische Kommission (2013). Study on educational support for newly arrived migrant children. Case study report Austria. Zugriff am unter Fischer, G. (1986). Gastarbeiterkinder an österreichischen Pflichtschulen. In H. Wimmer (Hrsg.), Ausländische Arbeitskräfte in Österreich (S ). Frankfurt am Main: Campus. Foy, P. (2012). Estimating standard errors for the TIMSS and PIRLS 2011 achievement scales. In M. O. Martin & I. V. S. Mullis (Eds.), Methods and procedures in TIMSS and PIRLS Retrieved September 18, 2013 from methods/pdf/tp11_estimating_achievement.pdf Foy, P., Brossman, B. & Galia, J. (2012). Scaling the TIMSS and PIRLS 2011 achievement data. In M. O. Martin & I. V. S. Mullis (Eds.), Methods and procedures in TIMSS and PIRLS Retrieved September 18, 2013 from methods/pdf/tp11_scaling_achievement.pdf Geier, T. & Frank M. (2014). Bildung im hizmet zu Bildungspraxen und Biographien junger Studierender im Kontext der Gülen-Bewegung. In T. Geier & K. U. Zaborowski (Hrsg.), Migration: Auflösungen und Grenzziehungen. Zu aktuellen Perspektiven einer erziehungswissenschaftlichen Migrationsforschung. Gomolla, M. & Radtke, F. O. (2002). Institutionelle Diskriminierung. Die Herstellung ethnischer Differenz in der Schule. Opladen: Leske+Budrich.

85 Migrationshintergrund und Lesekompetenz: Entwicklung seit dem Jahr Gonzalez, E. J. (2003). Scaling the PIRLS Reading Assessment Data. In M. O. Martin, I. V. S. Mullis & A. M. Kennedy (Eds.), PIRLS 2001 Technical Report (pp ). Chestnut Hill, MA: TIMSS & PIRLS International Study Center, Boston College. Grafendorfer, A., Wallner-Paschon, C., Suchan, B. & Widauer, K. (2012). Was messen PIRLS & TIMSS? In B. Suchan, C. Wallner-Paschon, S. Bergmüller & C. Schreiner (Hrsg.), PIRLS & TIMSS Schülerleistungen in Lesen, Mathematik und Naturwissenschaft in der Grundschule. Die Studie im Überblick (S ). Graz: Leykam. Heath, A. & Li, Y. (2010). The feasibility of constructing a race equality index. Research report No 695, Department for Work and Pensions. Retrieved March 23, 2014 from file/214468/rrep695.pdf Herzog-Punzenberger, B. (2009). Jenseits individueller Charakteristiken welche Bedeutung haben gesellschaftliche Strukturen für den Bildungserfolg von Schülerinnen und Schülern mit Migrationshintergrund? In C. Schreiner & U. Schwantner (Hrsg.), PISA Österreichischer Expertenbericht zum Naturwissenschafts-Schwerpunkt (S ). Graz: Leykam. Herzog-Punzenberger, B. & Gapp, P. (2009). Sozialisationsbedingungen von Schülerinnen und Schülern mit Migrationshintergrund. In B. Suchan, C. Wallner-Paschon & C. Schreiner (Hrsg.), PIRLS Die Lesekompetenz am Ende der Volksschule (S ). Graz: Leykam. Herzog-Punzenberger, B. & Unterwurzacher, A. (2009). Migration Interkulturalität Mehrsprachigkeit. In W. Specht (Hrsg.), Nationaler Bildungsbericht Österreich 2009 (S ). Graz: Leykam. Zugriff am unter buch/1024/b/2 Kao, G. & Tienda, M. (1998). Educational aspirations of minority youth. American Journal of Education, 106, Latcheva, R. & Herzog-Punzenberger, B. (2011). Integration revisited. Zur Dynamik und Kontextabhängigkeit individueller Integrationsverläufe am Beispiel von MigrantInnen der ersten Generation in Wien. Österreichische Zeitschrift für Soziologie, 36, Matuschek, H. (1982). Die Auswirkungen der Ausländerpolitik auf Schul- und Berufsausbildung der jugoslawischen und türkischen Jugendlichen in Wien und Niederösterreich. Situation und Lösungsmöglichkeiten. Wien: Europäisches Zentrum für Ausbildung und Forschung auf dem Gebiet der Sozialen Wohlfahrt. Neuwirth, E. (2006). PISA Sample weight problems in Austria. Retrieved September 18, 2013 from Nusche, D., Shewbridge, C. & Rasmussen, C. (2009). OECD Reviews of Migrant Education. Austria. Zugriff am unter OECD (2009). PISA data analysis manual SPSS (2nd ed.). Paris: OECD Publishing. OECD (2012). PISA 2009 Technical Report. Paris: OECD Publishing. OECD (2013a). PISA 2012 results: Excellence through equity: Giving every student the chance to succeed Volume II. Paris: OECD Publishing. OECD (2013b). PISA 2012 results: What students know and can do Volume I. Paris: OECD Publishing. Österreichischer Integrationsfonds (2014). Migration & Integration Schwerpunkt: Arbeit und Beruf. Zugriff am unter Pareiss, M. (2013). Sampling-Design und Stichproben. In U. Schwantner & C. Schreiner (Hrsg.), PISA Internationaler Vergleich von Schülerleistungen. Technischer Bericht. Zugriff am unter Plutzar, V. & Kerschhofer-Puhalo, N. (Hrsg.). (2009). Nachhaltige Sprachförderung. Zur veränderten Aufgabe des Bildungswesens in einer Zuwanderergesellschaft. Bestandsaufnahmen und Perspektiven. Innsbruck: StudienVerlag.

86 84 Migrationshintergrund und Lesekompetenz: Entwicklung seit dem Jahr 2000 Reiter, C. (2002). Wenn die Testsprache nicht der Muttersprache entspricht In C. Reiter & G. Haider (Hrsg.), PISA 2000 Lernen für das Leben Österreichische Perspektiven des internationalen Vergleichs (S ). Innsbruck: StudienVerlag. Schreiner, C. & Breit, S. (2006). Kompetenzen von Schüler/innen mit Migrationshintergrund. In G. Haider & C. Schreiner (Hrsg.), Die PISA-Studie. Österreichs Schulsystem im internationalen Wettbewerb (S ). Wien, Köln, Weimar: Böhlau. Schwantner, U. & Schreiner, C. (Hrsg.). (2013). PISA Internationaler Vergleich von Schülerleistungen. Die Studie im Überblick. Graz: Leykam. Spiewak, M. (2009). Das vietnamesische Wunder. Die Zeit, Nr. 5/2009. Zugriff am unter /05/B-Vietnamesen Statistik Austria (2013). Migration & Integration. Zahlen Daten Indikatoren Zugriff am unter bmeia.gv.at/fileadmin/user_upload/bmeia/media/integration/integrationsbericht_2013/statistische_jahrbuch_2013.pdf Suchań, B. & Wintersteller, A. (2012). Population und Stichprobe von PIRLS & TIMSS. In B. Suchań, C. Wallner-Paschon, S. Bergmüller & C. Schreiner (Hrsg.), PIRLS & TIMSS Schülerleistungen in Lesen, Mathematik und Naturwissenschaft. Die Studie im Überblick (S ). Graz: Leykam. Unterwurzacher, A. (2009). Lesekompetenz von Schülerinnen und Schülern mit Migrationshintergrund: Einfluss das familiären Hintergrundes. In B. Suchan, C. Wallner-Paschon & C. Schreiner (Hrsg.), PIRLS Die Lesekompetenz am Ende der Volksschule (S ). Graz: Leykam. Viehböck, E. & Bratić, L. (1994). Die zweite Generation. Migrantenjugendliche im deutschsprachigen Raum. Innsbruck: Studien-Verlag. Vogtenhuber, S., Lassnigg, L., Bruneforth, M. (2012). Indikatoren A: Kontext des Schul- und Bildungswesens. In M. Bruneforth & L. Lassnigg (Hrsg.), Nationaler Bildungsbericht Österreich Band 1. Das Schulsystem im Spiegel von Daten und Indikatoren (S ). Graz: Leykam. Volf, P. & Bauböck, R. (2001). Wege zur Integration. Was man gegen Diskriminierung und Fremdenfeindlichkeit tun kann. Klagenfurt: Drava. Wroblewski, A. (2012). Situation und Kompetenzen von Schüler/inne/n mit Migrationshintergrund: Deskriptive und multivariate Analyse der Determinanten der Testleistung. In F. Eder (Hrsg.), PISA Nationale Zusatzanalysen für Österreich (S ). Münster: Waxmann.

87 Die Bedeutung von familiären, schulischen und individuellen Merkmalen für die Mathematikkompetenz Die Bedeutung von familiären, schulischen und individuellen Merkmalen für die Mathematikkompetenz Christina Wallner-Paschon & Gerda Hagenauer Der Beitrag hat das Ziel, die Mathematikkompetenz von Grundschülerinnen und -schülern auf der 4. Schulstufe zu erklären. In Anlehnung an Schulleistungsmodelle und auf Basis bisheriger Ergebnisse wird ein Modell abgeleitet, das die Bedeutung familiärer, schulischer und individueller Merkmale für die Mathematikkompetenz untersucht. Die angenommenen Strukturen werden empirisch mit den TIMSS-2011-Daten überprüft. Die Analysen zeigen, dass der Zusammenhang zwischen sozioökonomischen Merkmalen der Eltern und der Mathematikleistung der Kinder vor allem indirekt, beispielsweise über kulturelle Ressourcen, vermittelt wird. Bei den Geschlechtereffekten ist vor allem das deutlich höhere Vertrauen der Buben in ihre Mathematikkompetenz trotz vergleichbarer familiärer Rahmenbedingungen hervorzuheben. Ihr tatsächlicher Leistungsvorsprung in Mathematik ist jedoch nur gering. Eine geringe Leistungsdifferenz bei gleichen Rahmenbedingungen gilt auch für Kinder mit und ohne Migrationshintergrund. Insgesamt kann durch das Modell ein wesentlicher Anteil an Leistungsunterschieden in Mathematik (41 %) erklärt werden, dessen Konsequenzen für Wissenschaft und Unterrichtspraxis am Ende des Beitrags diskutiert werden. Die schulische Leistung wird von verschiedenen Faktoren beeinflusst, die in komplexer, wechselseitiger Abhängigkeit zueinander stehen. Helmke und Weinert (1997; entnommen aus Helmke, 1997, S. 203) gehen in ihrem Modell schulischer Leistung davon aus, dass sowohl Merkmale der Lernenden wie auch Faktoren der schulischen, außerschulischen und familiären Umwelt die Schulleistung bestimmen. Heller (1997, S. 185) schreibt dabei motivationalen Merkmalen, die wiederum, ebenso wie die Schulleistung, von den Kontextbedingungen beeinflusst werden, eine vermittelnde Funktion zwischen der Kognition (z. B. Vorwissen, IQ) und der aktuellen Schulleistung zu. Aus diesen Annahmen zur Erklärung der schulischen Leistung im Allgemeinen wurde ein Modell zur Erklärung der Mathematikkompetenz am Ende der Grundschule abgeleitet, das im vorliegenden Beitrag empirisch überprüft wird. Dabei wird der Frage nachgegangen, inwieweit familiäre, schulische und individuelle Merkmale unter Berücksichtigung von Geschlecht und Migrationsstatus zur Aufklärung der Mathematikkompetenz beitragen können (s. Abbildung 2.2.1). Die folgenden Abschnitte gehen auf die wissenschaftliche Befundlage der einzelnen Merkmale dieses Modells und deren Bedeutung für die Mathematikleistung näher ein. Exogene Merkmale: Geschlecht Migrationsstatus Familiäre und schulische Sozialisationseinflüsse Kognitive Merkmale der Lernenden Motivationale Merkmale der Lernenden Mathematikkompetenz Abbildung 2.2.1: Rahmenmodell zur Erklärung der Mathematikleistung (eigene Illustration basierend auf Helmke & Weinert [1997] und Heller [1997])

88 86 Die Bedeutung von familiären, schulischen und individuellen Merkmalen für die Mathematikkompetenz Mathematikkompetenz und Merkmale der Lernenden Im Hinblick auf die Lernenden spielen sowohl kognitive als auch motivationale Merkmale 1 eine Rolle für die Entwicklung von Mathematikkompetenz. Als wichtigstes Merkmal zur Erklärung der Mathematikkompetenz gelten nach wie vor kognitive Merkmale der Lernenden. Neben der kognitiven Fähigkeit im Allgemeinen (numerische, räumliche, sprachliche Intelligenz etc.; z. B. Weinert & Stefanek, 1997) hat dabei insbesondere das Vorwissen der Schüler/innen eine wichtige Funktion (Helmke & Weinert, 1997). Umso mehr Vorwissen Schüler/innen in einem Unterrichtsfach mitbringen (z. B. zu Beginn des Schuljahrs), desto höher ist deren Leistung in diesem Fach (z. B. am Ende des Schuljahrs). Daher ist davon auszugehen, dass die mathematische Kompetenz, die Kinder vor dem Eintritt in die Grundschule aufweisen (= Vorwissen), eine hohe Erklärungskraft für die Kompetenz am Ende der Grundschule besitzt. Vorwissen und Intelligenz hängen dabei eng zusammen, da die Intelligenz neben zahlreichen weiteren Faktoren (z. B.: Förderung im Elternhaus) am Aufbau des Vorwissens beteiligt ist (z. B. Gröhlich, 2012; Grube & Hasselhorn, 2006; Weinert & Helmke, 1995). Im Vergleich dazu ist die Erklärungskraft der motivationalen Faktoren der Lernenden als geringer einzustufen. Dennoch dürfen sie für die Leistungsentwicklung nicht vernachlässigt werden, da sie das Lernverhalten steuern und somit indirekt ebenfalls die Leistung beeinflussen. Als sehr fruchtbar zur Erklärung der schulischen Lernmotivation hat sich dabei das Erwartungs-Wert-Modell (Eccles et al., 1983; Wigfield & Eccles, 2000) erwiesen. Entsprechend diesem Modell entsteht Motivation dann, wenn eine Situation als kontrollierbar (erwartbar) und als wertvoll eingeschätzt wird. Das schulische Fähigkeitsselbstkonzept und die schulische Selbstwirksamkeitsüberzeugung haben sich bei diesem Modell als wichtige motivationale Merkmale durchgesetzt, welche die Erwartungskomponente des Modells widerspiegeln. Im Hinblick auf die Wertkomponente werden intrinsische und extrinsische Wertzuschreibungen unterschieden: Interesse (intrinsisch), Nützlichkeit (extrinsisch) und Wichtigkeit (subjektiver Wert). Gemäß der Selbstbestimmungstheorie der Motivation (Deci & Ryan, 1993) ist eine intrinsische oder eine identifizierte (subjektiv wertvolle) Motivationslage der rein extrinsischen Motivation vorzuziehen. Intrinsisch und subjektiv wertvolle Motivationslagen (auch als autonome Motivationslagen bezeichnet) gehen häufiger mit einem optimalen Lernverhalten einher, wie beispielsweise tiefergehenden Lernstrategien, einer längeren Aufmerksamkeitsspanne, einer größeren Anstrengungsbereitschaft sowie einer höheren Mitarbeit (Hagenauer & Hascher, 2011), und lösen auch häufiger positive Emotionen aus (z. B. Lernfreude, Hagenauer, 2011). Mathematikkompetenz und Unterrichtsgestaltung Unterricht kann auf verschiedenen Ebenen beschrieben werden, die wiederum von mehreren Merkmalen gekennzeichnet sind. So unterscheiden Helmke, Hosenfeld und Schrader (2002) Merkmale der Unterrichtsqualität (z. B. Klarheit, Strukturiertheit), der Unterrichtsquantität (Zeitnutzung im Unterricht), der Lehrerpersönlichkeit (z. B. Engagement, Enthusiasmus) und des Lehr-Lern-Materials (z. B. individualisierte Aufgabengestaltung). Diese Unterrichtsfaktoren tragen alle für sich, jedoch in unterschiedlich starkem Ausmaß, zur Leistungsentwicklung der Schüler/ innen bei. Das Angebots-Nutzungs-Modell, entwickelt von Helmke (2000; entnommen aus Helmke, Hosenfeld & Schrader, 2002, S. 426), geht davon aus, dass die Angebote des Unterrichts allerdings nicht direkt auf die Schulleistung der Schüler/innen wirken, sondern diese durch das Nutzungsverhalten der Schüler/innen (z. B. aktive Lernzeit, Engagement) und deren Motivationslage vermittelt wird. Lehrkräfte können demnach im Unterricht zwar gezielte Angebote setzen (z. B. innere Differenzierung bei der Aufgabengestaltung), die Auswirkung dieses Angebots auf die schulische Leistung hängt jedoch nicht nur von dessen Qualität ab, sondern auch davon, wie dieses von den Schülerinnen und Schülern genutzt wird, und ob es in der Lage ist, Schüler/innen motivational anzusprechen. Diese motivationale Anregung gelingt entsprechend der oben bereits angeführten Selbstbestimmungstheorie der Motivation (Deci & Ryan, 1993) durch die Erfüllung der drei psychologischen Grundbedürfnisse der Bedürfnisse nach Autonomie, Kompetenz und Eingebundenheit. Das Bedürfnis nach Autonomie kann durch eine autonomieunterstützende Lernumgebung gefördert werden, die sich beispielsweise durch wenig kontrollierendes Verhalten der Lehrperson, das Gewähren von Freiräumen/Wahlmöglichkeiten und auch durch das Aufzeigen der Relevanz von Inhalten charakterisiert. Kompetenzerleben kann durch das Ermöglichen von Erfolgen für alle Schüler/innen, z. B. durch individualisierte Aufgabengestaltung, unterstützt werden, während das Gefühl der Eingebundenheit auf positiven Lehrer-Schüler-Beziehungen sowie auf positiven Schüler-Schüler-Beziehungen aufbaut (Reeve, Bolt & Cai, 1999). Klieme et al. (2006, S. 131) subsumieren all jene Methoden, die auf die Erfüllung der Grundbedürfnisse und 1 Geht es darum, Schüler/innen zu motivieren, wird in der Forschung zwischen Motivation (z. B. Interesse an Mathematik) und Emotionen (Freude an Mathematik) unterschieden (Wild & Möller, 2014). In diesem Beitrag werden auch emotionale Faktoren, z. B. Freude an Mathematik, unter dem Begriff motivationale Merkmale subsumiert. Diese sprachlich vereinfachte Darstellung erscheint sinnvoll, da aus Forschungsarbeiten bekannt ist, dass Motivationskonstrukte, wie z. B. das schulische Interesse (Krapp, 2009), neben persönlicher Bedeutsamkeit ebenso eine emotionale Komponente (positive Gefühle) enthalten.

89 Die Bedeutung von familiären, schulischen und individuellen Merkmalen für die Mathematikkompetenz 87 somit auf die Erhöhung der Schülermotivation abzielen, unter dem Begriff unterstützendes Unterrichtsklima. Dieses ist abzugrenzen von weiteren vordergründig auf die Förderung der Kognition gerichteten Dimensionen der Unterrichtsqualität (z. B. kognitive Aktivierung). Die Befunde bezüglich der Relevanz der Prozessmerkmale der familiären Umwelt für die Leistungsentwicklung der Kinder sind weniger eindeutig. Während sich eine anregende häusliche Umwelt positiv auf die Kompetenzentwicklung der Kinder auszuwirken scheint, gibt es eine weniger konsistente Befundlage im Hinblick auf die elterliche Lernunterstützung. Diese scheint nicht per se positiv auf die Leistung der Kinder zu wirken, sondern von der Qualität der Unterstützungsleistung der Eltern bestimmt zu werden (Niggli et al., 2007). Mathematikkompetenz und das Elternhaus Neben der schulischen Umwelt spielt entsprechend dem Modell auch das Elternhaus eine bedeutende Rolle für die Entwicklung der Mathematikkompetenz. Die Leistungsentwicklung in Mathematik beginnt bereits vor dem Grundschulalter (im Überblick, siehe z. B. Krajewski, Grüßling und Peter-Koop, 2009) und dem Elternhaus als primärer Sozialisationsinstanz kommt hier eine zentrale Schlüssel rolle zu. Weinert und Helmke (1997) konnten in der SCHOLASTIK-Grundschulstudie zeigen, dass Kinder ihren Leistungsrückstand zu Beginn der Grundschulzeit während der Grundschulzeit nicht mehr aufholen konnten, d. h. Leistungspositionen bleiben im Grundschulalter relativ stabil (siehe auch Grube & Hasselhorn, 2006), weshalb die mathematische Frühförderung im Elternhaus und/oder auch die externe Frühförderung, z. B. in Kindergärten, wesentlich für die Leistungsentwicklung ist. Familiäre Einflüsse können hinsichtlich struktureller und prozessualer Aspekte unterschieden werden. Die strukturellen Merkmale umfassen Statusmerkmale, wie z. B. Bildungsabschluss und Beruf der Eltern. Prozessuale Faktoren fokussieren auf den Prozess beim Erwerb von Mathematikkompetenz, wie z. B. die Qualität der elterlichen Unterstützung beim Lernen, Frühförderung im Elternhaus oder auch gemeinsame kulturelle Aktivitäten etc. (für ein entsprechendes Modell siehe Ehmke & Siegle, 2008, S. 256). Die Bedeutung der Statusmerkmale für die schulische Leistung der Kinder gilt als vielfach belegt, lediglich die Stärke des Einflusses ist länderspezifisch unterschiedlich. Österreich zählt dabei zu jenen Ländern mit den größten Chancenungleichheiten (Bruneforth, Weber, & Bacher, 2013). Bereits in TIMSS 2007 konnte ein enger Zusammenhang zwischen der Herkunft des Kinds und dessen Leistung in Mathematik festgestellt werden: Schwache Leistungen werden überdurchschnittlich häufig von Kindern aus Familien mit geringem sozialem Status erbracht (Bergmüller, 2010). Nach Bourdieu (1983) werden diese Rückstände in der Leistung durch Benachteiligung in den frühen Sozialisationserfahrungen, basierend auf Unterschieden im Vorhandensein kultureller Ressourcen und kultureller Praxis, ausgelöst. Mathematikkompetenz in Abhängigkeit von Geschlecht und Migrationsstatus Eine Vielzahl an empirischen Studien illustriert, dass Mädchen im Vergleich zu Buben eine geringere Schulleistung in Mathematik aufweisen und auch deren motivationale Merkmale weniger positiv ausgeprägt sind (z. B. Faber, Tiedemann & Billmann-Mahecha, 2011; Rustemeyer & Fischer, 2007). Dieser Unterschied zeigt sich bereits in der Grundschule. So weisen Mädchen beispielsweise ein geringeres Selbstkonzept in Mathematik auf, zeigen weniger Lernfreude (Helmke, 1993, 1997) und messen der Mathematik weniger Wert bei (Wigfield et al., 1997). Während die Unterschiede in motivationalen Faktoren relativ hoch sind, sind die tatsächlichen Leistungsunterschiede zwischen Mädchen und Buben in der Grundschule relativ gering ausgeprägt, wie eine Metaanalyse aus Deutschland, die Studien zwischen 1991 und 2008 umfasst, aufzeigt (Mücke, 2009). Ähnlich geringe Unterschiede in der Mathematikkompetenz zugunsten der Buben bestätigen sich im amerikanischen Raum (Hyde, Fennema & Lamon, 1990). Ebenso lassen sich in Österreich in TIMSS 1995, 2007 und 2011 die besseren Leistungen der Buben in Mathematik belegen, jedoch auch hier basierend auf einer (relativ) kleinen Effektstärke von 0.15 (1995, 2011) bzw (2007) (Cohen, 1988; Wallner-Paschon, 2010; 2012). Die Unterschiede in der Mathematikkompetenz zwischen den Geschlechtern vergrößern sich jedoch im Laufe der Schulzeit, einhergehend mit einem Anstieg der Unterschiede im mathematischen Interesse und Selbstkonzept. Dies kann zur Folge haben, dass Mädchen weniger häufig Mathematik als Schwerpunktfach in der Oberstufe oder als Studienfach wählen als Buben (Köller, Daniels, Schnabel & Baumert, 2000). Neben dem Geschlecht spielt auch der Migrationsstatus der Schüler/innen eine Rolle in der Erklärung der Mathematikleistung. Aus bisherigen Studien ist bekannt, dass Migrantinnen und Migranten durchschnittlich eine schlechtere Leistung in Mathematik zeigen als Schüler/innen ohne Migrationshintergrund. Dabei hängen Migrationsstatus und Mathematikleistung stärker zusammen als Geschlecht und Leistung. In Deutschland konnten Bos et al. (2003; zitiert nach Heinze et al. 2007) belegen, dass Migrantenkinder eine etwa um ein Schuljahr schlechtere Mathematikleistung erbringen als ihre einheimischen Klassenkameradinnen und Klassenkameraden. Auch Breit und Wanka (2010) errechneten einen Kompetenzunterschied von 44 Punkten für Österreichs Grundschüler/innen mit und ohne Migrationsstatus (TIMSS 2007; S. 101).

90 88 Die Bedeutung von familiären, schulischen und individuellen Merkmalen für die Mathematikkompetenz Neben den familiären und kulturellen Hintergrundmerkmalen, anhand derer sich Migrantenkinder häufig von einheimischen Schülerinnen und Schülern unterscheiden, wird insbesondere der Sprachbeherrschung im Hinblick auf die Entwicklung der Mathematikkompetenz eine wesentliche Funktion zugeschrieben, denn auch die Erbringung guter Leistungen in Mathematik setzt eine gute Sprachbeherrschung voraus. Heinze, Herwartz-Emden und Reiss (2007) konnten die signifikante Korrelation (r =.35) zwischen dem Sprachstand und der Mathematikleistung in der Grundschule empirisch absichern. Wurde der Sprachstand kontrolliert, zeigten sich keine weiteren Unterschiede in der Mathematikleistung zwischen Schülerinnen und Schülern mit und ohne Migrationshintergrund. Während Migrantenkinder durchschnittlich schlechtere Leistungen in Mathematik zeigen, weisen sie im Vergleich zu den einheimischen Gleichaltrigen jedoch eine höhere Motivation auf (z. B. Faber, Tiedemann & Billmann-Mahecha, 2011; Helmke & Reich, 2001). Durchgehend berichten Kinder mit Migrationshintergrund in diversen Studien im deutschsprachigen Raum von einem höheren Selbstkonzept in Mathematik, obwohl sie in den (standardisierten) Mathematiktests schlechtere Leistungen erbringen. Forschungsanliegen und Ableitung des Vorhersagemodells Aufbauend auf dem theoretischen Rahmenmodell der schulischen Leistung (s. Abbildung 2.2.1) und der empirischen Befundlage zu den Prädiktoren wird im Folgenden das zu testende Wirkmodell zur Erklärung der Mathematikkompetenz näher beschrieben. Abbildung zeigt dieses empirisch überprüfbare Wirkmodell, das zentrale Annahmen der Forschung über die Zusammenhänge von motivationalen Individualmerkmalen und schulischen Merkmalen sowie die Relevanz familiärer Struktur- und Prozessmerkale integriert. Primäres Ziel der Analyse ist es, die Wirkung dieser Merkmale auf die Mathematikkompetenz der österreichischen Schüler/ innen darzustellen. Konkret sollen mit dem vorliegenden Pfadmodell folgende Forschungsfragen beantwortet werden: 1. Inwieweit ist der in Österreich relativ starke Zusammenhang zwischen Schulbildung und Beruf der Eltern und der Mathematikleistung der Kinder durch indirekte Effekte vermittelt? 2. Welche familiären, schulischen und individuellen Merkmale wirken sich direkt auf motivationale Merkmale in Mathematik sowie auf die Mathematikleistung aus? 3. In welchen Bereichen zeigen sich Geschlechter- und Migrationseffekte? Der Modellaufbau erfolgt chronologisch nach dem zeitlichen Ablauf der Sozialisation. Die Anordnung der motivationalen Merkmale erfolgt theoriegeleitet entsprechend dem Erwartungs-Wert-Modell nach Eccles et al. (1983). Die Modellannahmen lassen sich wie folgt skizzieren: Als wichtiges Ausgangsmerkmal gelten die familiären Strukturmerkmale. Sie umfassen die Bildungsnähe sowie den Beruf der Eltern im Modell. Entsprechend der Theorie von Bourdieu (1983) wird angenommen, dass diese sozioökonomischen Faktoren indirekt über familiäre Prozessmerkmale wie kulturelle Ressourcen zu Hause und die kulturelle Praxis in der Familie (z. B. Theater- und Museumsbesuche) auf die Mathematikkompetenz der Schüler/innen wirken. Als relevante Merkmale kultureller Ressourcen sind die Leseressourcen (ermittelt über den Besitz von Büchern), der Besitz eines Musikinstruments im Haushalt sowie das (Nicht-)vorhandensein eines eigenen Fernsehers im Kinderzimmer im Modell berücksichtigt. Als Indikator für die kulturelle Praxis wurde die familiäre mathematische Frühförderung im Modell integriert. Es wird angenommen, dass der Zusammenhang zwischen strukturellen Merkmalen (Schulbildung und Beruf der Eltern) und der Schulleistung der Kinder nicht nur direkt, sondern primär indirekt über die familiären Prozessmerkmale gebildet wird. Das für die Leistungsentwicklung überaus bedeutende Vorwissen der Schüler/innen geht mit dem Merkmal Mathematikfähigkeit zu Schulbeginn in das Modell ein. Da die Leistungspositionen im Grundschulalter relativ stabil bleiben und ein zu Schulbeginn feststellbarer Leistungsrückstand in der Regel nicht mehr aufgeholt wird, werden deutliche Effekte des Vorwissens auf die Mathematikkompetenz auch noch am Ende der Grundschule erwartet. Es wird angenommen, dass sich das mathematische Wissen zu Schulbeginn sowohl direkt als auch indirekt über gute Noten und hohe Ausprägungen bei den motivationalen Merkmalen positiv auf die Mathematikleistung auswirkt. Die Berücksichtigung der Unterrichtsqualität im Modell erfolgt über die beiden Merkmale autonomiegestützter und anregender Mathematikunterricht aus Schülersicht. Beide Merkmale sollen entsprechend der Selbstbestimmungstheorie der Motivation vor allem motivationsfördernd wirken. Es wird deshalb postuliert, dass diese Unterrichtsmerkmale primär positive Effekte auf die motivationalen Merkmale im Modell zeigen und keine bzw. nur geringfügige direkte Effekte auf die Mathematikleistung. Als nächste Dimension werden die motivationalen Merkmale (mathematisches Selbstkonzept, Freude an Mathematik und subjektiver Wert der Mathematik) in das Modell integriert. Aufgrund der Annahme des Erwartungs-Wert- Modells wird zuerst das Selbstkonzept als Erwartungskomponente aufgenommen und anschließend die Freude an Mathematik sowie der subjektive Wert der Mathematik, die beide die Wertkomponente abbilden. Das Selbstkonzept entwickelt sich im Laufe der Grundschulzeit und wird von vorausgegangenen Leistungsvergleichen und Leistungsrückmeldungen wie beispielsweise durch Noten beeinflusst. Die Wertekomponente des Modells wird u. a von der Einschätzung des eigenen Könnens (Selbstkonzept) bestimmt. Entsprechend der Modellannahme wird davon ausgegan

91 Die Bedeutung von familiären, schulischen und individuellen Merkmalen für die Mathematikkompetenz 89 gen, dass das mathematische Selbstkonzept sowohl direkt als auch über die Freude und den subjektiven Wert einen positiven Effekt auf die Mathematikleistung hat. Darüber hinaus werden auch direkte positive Effekte der Wertekomponente auf die Leistung erwartet. Aufgrund der signifikanten, aber praktisch kaum relevanten Geschlechterunterschiede zugunsten der Buben am Ende der Grundschule (Wallner-Paschon, 2012) werden nur geringe Geschlechtereffekte bei der vorschulischen Förderung in Mathematik sowie der Mathematikfähigkeit zu Schulbeginn angenommen. Deutlichere Effekte zugunsten der Buben werden bei den motivationalen Merkmalen erwartet. Es wird davon ausgegangen, dass Buben trotz gleicher familiärer Rahmenbedingen ein höheres Selbstkonzept und mehr Freude an Mathematik haben als Mädchen und darüber hinaus der subjektive Wert der Mathematik bei ihnen höher ist. In Bezug auf den Migrationshintergrund werden die aus anderen Studien bereits bekannten Effekte hohe Motivation bei gleichzeitig geringerer Leistung erwartet. Methodischer Zugang Untersuchungsvariablen Als Indikator für den sozioökonomischen Status wurden die Elternangaben im Fragebogen über deren Bildungsnähe und den beruflichen Status herangezogen. Die elterliche Bildungsnähe wurde aus den Elternangaben zu ihrer Schulbildung ermittelt. Der Index Höchste Schulbildung der Eltern untergliedert sich in die vier Kategorien (1) max. Pflichtschule, (2) Lehre/berufsbildende mittlere Schule/Meisterprüfung, (3) Matura und (4) akademischer Abschluss. Zur Indexbildung wurde jeweils der höchste Bildungsabschluss der beiden Elternteile verwendet. Das Merkmal Höchste berufliche Position der Eltern untergliedert sich in sechs Kategorien: (1) nie einer beruflichen Tätigkeit nachgegangen, (2) Arbeiter, (3) Facharbeiter, (4) Angestellte, (5) Kleinunternehmer sowie (6) Fachkräfte (Akademiker/innen, Techniker/innen und Führungskräfte). Bei Unterschieden zwischen den beiden Elternteilen wurde jeweils der höhere Statuswert berücksichtigt. 2 Die Operationalisierung der Leseressourcen erfolgte über zwei Fragen im Elternfragebogen (Cronbachs Alpha =.85). Zum einen wurde nach dem Buchbesitz zu Hause allgemein, zum anderen nach dem Besitz von Kinderbüchern gefragt. Als Antwortkategorien standen fünf Möglichkeiten zur Auswahl: 0 10 Bücher, 11 25, , und über 200 Bücher. Bei den Kinderbüchern konnten Eltern zwischen 0 10, 11 25, 26 50, und über 100 Bücher wählen. Fehlende Elternangaben bei den Kinderbüchern zu Hause wurden durch die Angaben ihrer Kinder im Schülerfragebogen ergänzt. Die Frage, ob es zu Hause ein Musikinstrument gibt (aus dem Schülerfragbogen), wird als Dummy-Kodierung (1 = es Familiäre Strukturen Familiäre Prozesse Schulische Merkmale Individuelle Merkmale Note in Mathematik Schulbildung der Eltern Beruf der Eltern Leseressourcen Fernseher Musikinstrument Mathematische Frühförderung Mathefähigkeiten zu Schulbeginn Autonomiegestützter Mathematikunterricht Anregender Mathematikunterricht Mathematisches Selbstkonzept.44 Freude an Mathematik Mathematikkompetenz Subjektiver Wert der Mathematik Migrationshintergrund Geschlecht Abbildung 2.2.2: Empirisches Prüfmodell der Untersuchung 2 Die berufliche Position der Eltern wurde im Fragebogen etwas detaillierter auf Nominalskalen-Niveau abgefragt und für Österreich zu sinnvollen Kategorien auf Ordinalskalen-Niveau rekodiert. Die Ordinalität dieses Merkmals (also ob ein Kleinunternehmer tatsächlich eine höhere berufliche Position als ein Angestellter hat) wurde nicht überprüft bzw. konnte im Rahmen der vorliegenden Untersuchung mit den vorhandenen Daten auch nicht überprüft werden.

92 90 Die Bedeutung von familiären, schulischen und individuellen Merkmalen für die Mathematikkompetenz gib ein Musikinstrument; 0 = es gibt kein Musikins trument) im Modell verwendet. Die Frage zum eigenen Fernseher (im Kinderzimmer) geht ebenfalls als Dummy-Kodierung in das Modell ein (1 = eigener Fernseher, 0 = kein eigener Fernseher). Das Merkmal familiäre mathematische Frühförderung umfasst Fragen zu familiären Aktivitäten vor dem Schuleintritt, wie Zahlenreime sprechen, Abzähllieder singen oder verschiedene Dinge zählen. Die Fragen stammen aus dem Elternfragebogen und wurden mit den vorgegebenen Antwortkategorien nie oder fast nie, manchmal und oft erhoben. Es handelt sich dabei um eine nach der Item- Response-Theorie (IRT) konstruierte Skala. 3 Die interne Konsistenz als Qualitätsmerkmal der Skala mit insgesamt 5 Items kann mit einem Cronbachs-Alpha-Wert von.68 als ausreichend beurteilt werden. Beim Merkmal Mathematikfähigkeit zu Schulbeginn handelt es sich ebenfalls um ein IRT-skaliertes Merkmal, das auf sechs Statements im Elternfragebogen zu einfachen mathematischen Fertigkeiten der Kinder bei Schulbeginn basiert. Diese Fertigkeiten inkludieren das Zählen, das Erkennen von Formen (z. B. Dreieck, Kreis) und von geschriebenen Zahlen, das Schreiben von Zahlen sowie das einfache Addieren und Subtrahieren. Die Qualität der Skala kann mit einem Cronbachs-Alpha-Wert von durchschnittlich.76 als gut beurteilt werden. Es ist jedoch darauf hinzuweisen, dass es sich hier um keinen objektiven Test zum Vorwissen handelt, sondern um eine retrospektive Einschätzung seitens der Eltern. Die nationale Skala zum autonomiegestützten Mathematikunterricht besteht aus sechs Items (z. B. Bei einer neuen Aufgabe darf ich selber probieren, wie das funktioniert. ) und wird im Kapitel Innere Differenzierung im Mathematikunterricht 4.3 im Detail beschrieben. Beim anregenden Mathematikunterricht (IRT, Cronbachs Alpha =.68, 5 Items) handelt es sich um ein Merkmal, bei dem vor allem die wahrgenommene Instruktionsqualität bzw. die Strukturiertheit des Unterrichts (z. B. Ich weiß, was meine Lehrerin von mir erwartet. ) sowie die motivationale Aktivierung (z. B. Mich interessiert, was meine Lehrerin sagt. ) thematisiert wird. Als Note in Mathematik ging ein Durchschnittswert der Eltern- und Schülerangaben zur Mathematiknote im letzten Semesterzeugnis ein. Die drei motivationalen Merkmale mathematisches Selbstkonzept, Freude an Mathematik und der subjektive Wert der Mathematik basieren auf vierstufigen Likertskalen mit den Antwortkategorien Stimme überhaupt nicht zu, Stimme eher nicht zu, Stimme eher zu und Stimme völlig zu. Das Merkmal mathematisches Selbstkonzept (IRT) wurde über sieben Aussagen (z. B. Normalerweise bin ich gut in Mathematik., Mathematik fällt mir schwerer als vielen Kindern meiner Klasse. ) erhoben (Cronbachs Alpha =.87). Das Merkmal Freude an Mathematik (IRT) beruht auf fünf Statements (z. B. Ich lerne gern Mathematik., Mathe matik ist langweilig. ). Die Qualität der Skala ist mit einem Cronbachs-Alpha-Wert von durchschnittlich.89 als sehr gut zu beurteilen. Der subjektive Wert der Mathematik wurde durch folgende zwei Items ermittelt: (1) Es ist wichtig, gut in Mathematik zu sein. (2) Für meine Zukunft ist es notwendig, gut rechnen zu können. Die Qualität der Skala mit einem Cronbachs Alpha von.65 ist noch ausreichend. Die bei TIMSS eingesetzten Indikatoren zur Messung des Selbstkonzepts erfassen die Bewertung der eigenen Fähigkeiten (evaluative Komponente), ohne den emotionalen Anteil des Selbstkonzepts zu berücksichtigen. Deshalb kann im Modell sehr gut zwischen der Erwartungskomponente (Selbstkonzept) und der Wertkomponente (Freude an Mathematik und subjektive Bedeutung des Fachs) differenziert werden. Sowohl der Migrationshintergrund (1 = mit Migrationshintergrund, 0 = ohne Migrationshintergrund) als auch das Geschlecht (1 = Mädchen, 0 = Buben) gehen als Dummy- Variable in das Modell ein. 4 Der Migrationshintergrund der Kinder definiert sich über das Geburtsland der Eltern. Demnach haben Kinder ohne Migrationshintergrund Eltern, die beide im Inland geboren wurden, und jene mit Migrationshintergrund haben zumindest einen Elternteil, der im Ausland geboren wurde. Auswertungsverfahren Für die Analyse der Wirkungszusammenhänge der familiären, schulischen und individuellen Merkmalsbereiche wurde ein Pfadmodell in Mplus 7 (Muthén & Muthén, ) berechnet. Dabei wurden entsprechend der Fragestellung Regressionspfade von den beiden Strukturmerkmalen über die familiären Prozessmerkmale und individuellen Merkmale zur Mathematikkompetenz modelliert und ebenso von den Prozessmerkmalen über die individuellen Merkmale zur Mathematikkompetenz. Darüber hinaus wurden auch Pfade von den Unterrichtsmerkmalen zu den individuellen Merkmalen und zur Mathematikleistung spezifiziert (s. Abbildung 2.2.2). Interkorrelationen zwischen den im Modell untereinanderstehenden Merkmalen wurden im Modell berücksichtigt, aber grafisch nicht dar 3 Dabei wurde das Partial-Credit-Modell als Erweiterung des Rasch-Modells eingesetzt. Details zur Skalierung der Merkmale bei PIRLS & TIMSS 2011 sind im internationalen Technischen Bericht (Martin & Mullis, 2012) dokumentiert. 4 Zum einen zeigen sich dadurch die Effekte der familiären und schulischen Sozialisation um den Migrations- und Geschlechtereffekt bereinigt und zum anderen kann überprüft werden, inwieweit der Migrationshintergrund und das Geschlecht unter Einbeziehung aller Modellvariablen einen eigenständigen und unabhängigen Einfluss haben.

93 Die Bedeutung von familiären, schulischen und individuellen Merkmalen für die Mathematikkompetenz 91 gestellt. Nicht statistisch signifikante Pfade im Modell wurden zugelassen und nicht auf null gesetzt. Zur Beurteilung der Modellanpassung wurden der Comparative Fit Index (CFI) und der Standardized Root Mean Square Residual (SRMR) herangezogen. Ein Modell weist eine zufriedenstellende Anpassung auf, wenn der CFI nahe bei 1 liegt sowie SRMR <.11 ausfallen (Bühner, 2011). Aufgrund der individualpsychologischen Fragestellung wurde auf die Modellierung eines Mehrebenenmodells verzichtet. Die mit der Ziehung von Schulklassen verbundene hierarchische Struktur der Daten wurde in der Spezifikation des Modells (Analyseoption Type = Complex in Mplus) berücksichtigt. Dabei verwendet das Programm Mplus standardmäßig den Full-Information-Maximum-Likelihood-Algorithmus (FIML), der die Behandlung der fehlenden Werte und die Parameterschätzung des Modells in einem gemeinsamen Schritt vornimmt (Lüdtke et al., 2007). Bei dieser Methode werden keine fehlenden Werte imputiert oder geschätzt, sondern die Schätzung der Populationsparameter und ihrer Standardfehler wird auf der Basis der vorhandenen Daten vorgenommen (Lüdtke et al., 2007). Die Stichprobengröße, auf der das Pfadmodell beruht, beträgt demnach N = Die Berechnung der indirekten Effekte erfolgte ebenfalls mit Mplus und mit den oben angeführten Analyseoptionen. Die Imputation der fünf Plausible Values ist jedoch bei der Berechnung indirekter Effekte nicht möglich, weshalb die Analysen für jeden der fünf Plausible Values getrennt gerechnet und gemittelt wurden. Ergebnisse In Abbildung sind die statistisch geprüften Wirkungszusammenhänge graphisch dargestellt. Bevor die Ergebnisse dieses Modells näher beschrieben werden, wird ausgeführt, wie dieses Modell zu lesen und zu verstehen ist: Die Pfeile symbolisieren die direkten Effekte und zeigen in Richtung der abhängigen bzw. zu erklärenden Variablen. Der Pfeil von der höchsten Schulbildung der Eltern auf die Leseressourcen bedeutet beispielsweise, dass die Anzahl der Bücher direkt von der Schulbildung der Eltern abhängt. Bei den eingetragenen Effekten handelt es sich um partielle, standardisierte Effekte (standardisierte Beta-Koeffizienten), die ab einem Absolutbetrag von größer/gleich.10 inhaltlich bedeutsam sind und im Modell eingetragen wurden. Die links stehenden Merkmale fungieren dabei immer als erklärende Variablen (Prädiktoren) für die jeweils rechts stehenden Merkmale, d. h. die hier dargestellten Effekte sind bereits um die Wirkung aller anderen Variablen, die Familiäre Strukturen Familiäre Prozesse Schulische Merkmale Individuelle Merkmale Note in Mathematik R 2 = Höchste Schulbildung der Eltern Höchste berufliche Position der Eltern.41 Leseressourcen (Bücher) R 2 = Eigener Fernseher R 2 =.06 Musikinstrument R 2 = Familiäre Mathematische Frühförderung R 2 = Mathefähigkeiten zu Schulbeginn R 2 =.10 Autonomiegestützter Mathematikunterricht R 2 = Anregender Mathematikunterricht R 2 = Mathematisches.44 Selbstkonzept R 2 = Freude an Mathematik R 2 = Mathematikkompetenz R 2 = Subjektiver Wert.28 der Mathematik R 2 =.14 Migrationshintergrund Kind ist Mädchen Eingetragen sind standardisierte Effekte (standardisierte Beta-Koeffizienten), ab.10. Direkte Effekte auf die Leistung sind blau, Migrationseffekte grün und Geschlechtereffekte rot hervorgehoben. Indizes der Modellgüte: CFI = 0,884; SRMR = Abbildung 2.2.3: Erklärungsmodell zur Mathematikleistung (TIMSS 2011)

94 92 Die Bedeutung von familiären, schulischen und individuellen Merkmalen für die Mathematikkompetenz weiter links davon stehen, bereinigt und wirken unabhängig davon (partielle Effekte). Durch die Pfadanalyse können nicht nur direkte Pfade und damit die spezifische Wirkung eines Prädiktors auf eine abhängige Variable in Form von standardisierten Beta-Koeffizienten gezeigt werden, sondern es ist auch eine Schätzung der gemeinsamen Wirkung aller Prädiktoren auf ein Merkmal möglich. Diese Wirkung wird in Form des Determinationskoeffizienten (R 2 ) ausgedrückt, der den Anteil erklärter Varianz aller (links stehenden) Prädiktoren für die jeweils abhängige Variable angibt. Das in der Abbildung angegebene R 2 von.34 beim Merkmal Leseressourcen bedeutet, dass 34 % der Streuung des Merkmals Bücher- und Kinderbücher zu Hause (Leseressourcen) durch die links davon stehenden Merkmale (Schulbildung der Eltern, berufliche Position der Eltern) aufgeklärt werden können. Bei der Ergebnisinterpretation werden nun einleitend jene Merkmale dargestellt, die einen direkten Einfluss auf die Mathematikleistung der österreichischen Kinder haben. Für die Mathematikkompetenz, deren Varianz zu 41 % durch das Modell erklärt werden kann, zeigen sich unter den hier berücksichtigten Merkmalen insgesamt sechs direkte Einflussgrößen (s. blaue Pfade in Abbildung 2.2.3): Die erste Einflussgröße sind die Leseressourcen in Form der Anzahl an (Kinder-)Büchern im Haushalt, die trotz Berücksichtigung der anderen Merkmale im Modell einen positiven Effekt auf die Mathematikkompetenz der Schüler/innen haben. Auch ein eigener Fernseher (im Kinderzimmer) zeigt bei Kontrolle der übrigen Merkmale einen deutlichen negativen Effekt auf die Mathematikleistung. Ebenso zeigen die mathematischen Fähigkeiten zu Schulbeginn noch am Ende der Grundschule einen positiven Effekt auf die Mathematik leistung. Auf der Unterrichtsebene geht der autonomiegestützte Mathematikunterricht mit schlechteren Leistungen in Mathematik einher (Erklärung s. unten). Die deutlichsten Effekte zeigen sich bei den Noten und dem mathematischen Selbstkonzept. Erwartungsgemäß sind gute Noten sowie ein hohes mathematisches Selbstkonzept mit besseren Leistungen in Mathematik verbunden. Die weitere Ergebnisinterpretation erfolgt der chronologischen und theoriegeleiteten Modellierung entsprechend von links nach rechts. Das postulierte Modell hat sich im Wesentlichen bestätigt und stellt sich wie folgt dar: Die strukturellen Familienmerkmale (Schul- und Berufsbildung der Eltern) haben unter Berücksichtigung der Modellmerkmale keinen direkten Effekt (<0.10) auf die Mathematikkompetenz. Beide Merkmale wirken primär indirekt über das kulturelle Kapital (Leseressourcen, Musikinstrument im Haushalt oder Fernseher im eigenen Zimmer) und über die Schulnoten und das mathematische Selbstkonzept auf die Mathematikleistung. Somit lässt sich der relativ starke positive Zusammenhang zwischen Schulbildung und Beruf der Eltern und der Mathematikleistung der Kinder in erster Linie dadurch erklären, dass Kinder aus höheren Bildungs- und Berufsschichten über mehr kulturelles Kapital (Bücher, Musikinstrumente, kein eigener Fernseher im Kinderzimmer) verfügen, bessere Noten bekommen und dadurch vermittelt auch ein besseres mathematisches Selbstkonzept aufbauen. Der Anteil der direkten und indirekten Effekte am Gesamteffekt ist in Tabelle dargestellt. Hier zeigt sich sowohl für die Schulbildung als auch den Beruf der Eltern, dass ¾ der Gesamteffekte auf die Mathematikleistung indirekt bedingt sind. Gesamteffekt direkter Effekt indirekter Effekt primär bedingt durch Bildung der Eltern Beruf der Eltern Mathematische Fähigkeiten zu Schulbeginn Die mathematischen Fähigkeiten zu Schulbeginn (mathematisches Vorwissen) zeigen sowohl direkte als auch indirekte Effekte auf die Mathematikleistung. Der direkte Pfad von 0.10 wurde bereits anfangs beschrieben und besagt, dass auch bei gleichen familiären Bedingungen (von der Schulbil Autonomiegestützter Mathe- Unterricht Anregender Mathe- Unterricht Mathematiknote % % % % % % % % % % n. s. n. s % % % % % % % Noten, Bücher, Noten Selbstkonzept* Fernseher im Zimmer, Musikinstrument Noten, Bücher, Noten Selbstkonzept*, Musikinstrument Noten, Noten Selbstkonzept*, Selbstkonzept Noten, Noten Selbstkonzept* * indirekter Effekt, der über das höhere Selbstkonzept bedingt durch gute Noten die Leistung beeinflusst n. s. = nicht signifikant Selbstkonzept, Noten, Noten Selbstkonzept* subjektiver Wert der Mathematik Tabelle 2.2.1: Direkte und indirekte Effekte auf die Mathematikleistung (TIMSS 2011) Selbstkonzept

95 Die Bedeutung von familiären, schulischen und individuellen Merkmalen für die Mathematikkompetenz 93 dung und dem Beruf der Eltern bis hin zur mathe matischen Frühförderung) das mathematische Vorwissen zu Schulbeginn bessere Mathematikleistungen am Ende der Grundschule bedingt. Es zeigen sich aber auch indirekte Effekte von 0.08, die vor allem vermittelnd über bessere Noten und ein höheres Selbstkonzept sowie ein höheres Selbstkonzept bedingt durch bessere Noten die Mathe matik leistung positiv beeinflussen (s. Tabelle 2.2.1). Das mathematische Vorwissen zu Schulbeginn beeinflusst jedoch weder die Freude an Mathematik noch den subjektiven Wert, der Mathematik beigemessen wird. Das Unterrichtsmerkmal autonomiegestützter Mathematikunterricht zeigt vor allem negative Effekte auf die Mathematikleistung: Autonomie im Mathematikunterricht geht demnach mit schlechteren Leistungen einher (Erklärung s. unten). Indirekt wird dieser Effekt vor allem über schlechtere Mathematiknoten vermittelt. Der anregende Mathematikunterricht zeigt hingegen die erwartete positive Wirkung auf die Mathematikleistung, wenngleich sich diese Wirkung auch nur in indirekter Form zeigt: Die Leistung wird im anregenden Unterrichtssetting primär über bessere Noten, ein höheres mathematisches Selbstkonzept sowie ein höheres Selbstkonzept bedingt durch bessere Noten positiv beeinflusst. Ein anregender Mathematikunterricht wird auch von mehr Freude und einem höheren subjektiven Wert, der Mathematik zugeschrieben wird, begleitet. Gute Mathematiknoten gehen auch bei gleichen familiären und schulischen Bedingungen mit einem höheren Selbstkonzept und besseren Mathematikleistungen einher. Effekte auf die motivationalen Merkmale, wie Freude und subjektiver Wert der Mathematik, können keine beobachtet werden. Somit werden auch die indirekten Effekte von 0.08 ausschließlich über das Selbstkonzept vermittelt (s. Tabelle 2.2.1). Das mathematische Selbstkonzept zeigt, wie angenommen, einen direkten positiven Effekt auf die Mathematikleistung sowie positive Effekte auf die Freude und den subjektiven Wert. Ein vermittelter Effekt über Freude und subjektiven Wert auf die Mathematikleistung kann jedoch nicht bestätigt werden. Ebenso bleibt auch der direkte Effekt der beiden Merkmale Freude an Mathematik und subjektiver Wert der Mathematik auf die Leistung aus. Migrationseffekte Wie erwartet, geht der Migrationshintergrund mit geringeren sozioökonomischen Merkmalsausprägungen einher 5. Vor allem die berufliche Position der Eltern zeigt dahingehend deutliche Effekte: Kinder mit Migrationshintergrund haben häufiger Eltern in niedrigeren beruflichen Positionen. Sie besitzen auch deutlich weniger Leseressourcen zu Hause und erfahren weniger häufig eine mathematische Frühförderung im Elternhaus. Wie zu erwarten war, erfahren sie jedoch häufiger einen autonomiegestützten Mathematikunterricht. Ihre Mathematikfähigkeiten zu Schulbeginn werden von den Eltern aber höher eingeschätzt als bei Kindern ohne Migrationshintergrund. Kinder mit Migrationshintergrund haben mehr Freude an Mathematik und messen der Mathematik mehr subjektiven Wert bei (dabei handelt es sich um Effekte unter 0.10; diese sind aufgrund des strengen Schwellenwerts im Modell nicht eingetragen). Werden die familiären, schulischen und individuellen Unterschiede statistisch kontrolliert, reduziert sich der ursprüngliche Effekt auf die Leistung von 0.25 auf Das heißt, dass Kinder mit Migrationshintergrund unter gleichen Rahmenbedingungen nur geringfügig geringere Mathematikfähigkeiten aufweisen. Geschlechtereffekte Einige der im Folgenden berichteten Geschlechtereffekte im Modell sind zwar statistisch signifikant, praktisch jedoch von geringer Größe (Effektstärken kleiner.10), weshalb sie im Modell nicht eingezeichnet sind. Aufgrund der Bedeutung des Themas werden diese Ergebnisse dennoch berichtet. Im Hinblick auf das kulturelle Kapital berichten Mädchen eine positivere familiäre Situation als Buben: Sie haben häufiger ein Musikinstrument im Haushalt (Effekt =.16) und besitzen seltener einen eigenen Fernseher im Kinderzimmer (Effekt =.10). Sie erwähnen auch eine höhere Anzahl von Büchern zu Hause, wobei dieser Effekt nur gering ist (Effekt: 0.04). Dennoch werden die mathematischen Fähigkeiten zu Schulbeginn bei den Buben von ihren Eltern höher eingestuft (Effekt = 0.09). Während der Schulzeit spricht der anregende Unterricht eher die Mädchen an (Effekt = 0.08), wobei sich im Hinblick auf die Autonomieunterstützung im Unterricht keine Unterschiede zeigen. Ein deutlicher Effekt zeigt sich beim mathematischen Selbstkonzept, das bei den Buben deutlich höher ist als bei den Mädchen. Auch die Freude an Mathematik sowie die Leistung in Mathematik sind unter Berücksichtigung von sozioökonomischen, kulturellen, familiären und unterrichtlichen Unterschieden bei den Buben etwas höher (Effekte unter 0.10). 5 Der Migrationseffekt im Zusammenhang mit der Schulbildung der Eltern ist signifikant und beträgt.09. Er liegt damit knapp unter dem strengen Schwellenwert und ist deshalb im Modell nicht eingetragen.

96 94 Die Bedeutung von familiären, schulischen und individuellen Merkmalen für die Mathematikkompetenz Diskussion Im vorliegenden Beitrag wurde die Mathematikkompetenz durch individuelle, familiäre und unterrichtliche Merkmale anhand eines Pfadmodells erklärt. Dieses Modell basiert auf dem Rahmenmodell schulischer Leistung, wie es 1997 im Rahmen der SCHOLASTIK-Studie von Helmke und Weinert postuliert wurde, und das um die Annahmen des Angebots-Nutzungs-Modells (Helmke, 2006) ergänzt und erweitert wurde. Im Folgenden werden die zentralen Ergebnisse zusammengefasst, diskutiert und Konsequenzen für die Praxis abgeleitet. Beginnend mit den Schülerinnen und Schülern selbst (= individuelle Faktoren), lässt sich die Bedeutung der motivationalen Faktoren für die Schülerleistung bestätigen. Das schulische Selbstkonzept, das neben der positiven Beziehung zur Leistung auch mit einer höheren Freude in Mathematik und einer höheren Wertzuschreibung für das Fach einhergeht, stellt dabei das wichtigste Merkmal dar. Für eine optimale Entwicklung der Mathematikkompetenz ist es daher von Relevanz, dass Schüler/innen Vertrauen in die eigene Leistungsfähigkeit in Mathematik entwickeln. Dies sollte möglichst frühzeitig erfolgen, da sich Selbstkonzepte mit zunehmenden Schuljahren kontinuierlich verfestigen und dadurch auch schwerer beeinflussbar werden (Möller & Trautwein, 2009). Konkret für die Unterrichtspraxis bedeutet dies, dass den Schülerinnen und Schülern ein positives Kompetenzerleben ermöglicht werden sollte. Dies könnte beispielsweise durch Klarheit in der Instruktion, durch Anwendung einer individuellen Bezugsnormorientierung und auch durch Individualisierung im Unterricht (z. B. durch die Darbietung von Aufgaben mit unterschiedlichem Anspruchsniveau) realisiert werden. Auch der Notenpraxis kommt eine bedeutende Rolle zu, beeinflusst die Schulnote doch deutlich die Entwicklung des Selbstkonzepts (Jung, 2014). Insbesondere Mädchen sollten in ihrer Zuversicht, auch in Mathematik gute Leistungen erbringen zu können, gefördert werden, da sie ein niedrigeres Selbstkonzept als Buben aufweisen. Hier sollte auch an der geschlechtlichen Identität gezielt gearbeitet und ein Aufbrechen der geschlechtsbezogenen Interessen angestrebt werden (z. B. Lazarides & Ittel, 2011; Paseka, 2009). Dass Mädchen und Buben unterschiedliche Sozialisationserfahrungen bereits vor Schulbeginn haben, spiegelt sich auch in den Unterschieden im frühen mathematischen Bildungserfolg wider: Aus Elternsicht bestätigt sich die geringere Fähigkeit in Mathematik von Mädchen bereits vor Schuleintritt. Eine Förderung des mathematischen Selbstkonzepts der Mädchen sollte sinnvollerweise daher immer in Zusammenarbeit mit und unter Einbindung der Familie erfolgen. Dies steht auch in Einklang mit Erkenntnissen aus der Frühförderung: Frühförderungsprogramme sind langfristig nur dann wirksam, wenn auch das familiäre Umfeld in diese Programme einbezogen wird (Hany, 1997). Aus der Geschlechterforschung ist des Weiteren bekannt, dass soziale Bezugspersonen, wozu neben den Mitschülerinnen und -schülern sowohl die Lehrkräfte wie auch die Familie und der nähere Bekanntenund Freundeskreis zählen, insbesondere dann an Bedeutung gewinnen, wenn im geschlechtsuntypischen Fach Vertrauen und Interesse aufgebaut werden soll. Hier braucht es im Besonderen die Unterstützung, aber auch das Vorbild der sozialen Umwelt (Lazarides & Ittel, 2011). Während die Mädchen ein geringeres Selbstkonzept entwickeln als die Buben, stellt dieses eine Ressource von Schülerinnen und Schülern mit Migrationshintergrund dar. Wie auch schon in früheren Studien aufgezeigt (z. B. Faber et al., 2011), berichten Migrantenkinder von einem höheren Selbstkonzept in Mathematik trotz geringerer vorhandener Mathematikleistung. Neben möglicherweise kulturellen Unterschieden im Einschätzungsverhalten (= Schüler/innen mit Migrationshintergrund beurteilen optimistischer ) oder auch der Bedeutung der Note für die Selbstkonzeptentwicklung (= Migrantinnen und Migranten weisen keine inhaltlich bedeutsam schlechteren Schulnoten in Mathematik auf), könnte dieser Effekt auf die Art der herangezogenen Vergleichs dimension zurückgeführt werden. Es ist wahrscheinlich, dass das Selbstkonzept in Mathematik durch vergleichsweise geringe Leistungen im Fach Deutsch aufgewertet wird. Man nennt dies dimensionales Vergleichen (= internal frame of reference): Schüler/innen vergleichen ihre Leistungen nicht nur mit ihren Klassenkameraden (= external frame of reference), sondern es finden auch intraindividuelle Vergleiche statt (siehe z. B. Dickhäuser, 2003). Dadurch, dass Migrantinnen und Migranten aufgrund von Schwierigkeiten in der Sprachbeherrschung meist ein geringeres Selbstkonzept in Deutsch aufweisen, ist es sehr wahrscheinlich, dass im Vergleich dazu die mathematische Fähigkeit überdurchschnittlich positiv eingeschätzt folglich auch überschätzt wird. Man spricht hier von Kontrasteffekten (Möller & Trautwein, 2009, S. 193). Die Schule ist aufgrund des Wissens um auftretende Kontrasteffekte daher besonders gefordert, realistische Selbsteinschätzungen der Schüler/innen zu fördern, ohne dabei aber die Ressource des positiven Selbstkonzepts zu gefährden. Dies könnte zum Beispiel durch den Einsatz einer gezielten regelmäßigen Feedbackpraxis gekoppelt mit Selbsteinschätzungselementen erfolgen. Im Hinblick auf die Form des Feedbacks erscheint eine Kombination aus einer auf den Leistungsfortschritt bezogenen Rückmeldung (individuelle Bezugsnorm) verbunden mit Informationen über die Erreichung des Leistungsziels (= Kriterium; kriteriale Bezugsnorm) sinnvoll. Neben dem Selbstkonzept erweist sich die schulische Leistungsfähigkeit der Kinder vor Beginn der Grundschule (= Vorwissen) direkt und auch indirekt vermittelt über die motivationalen Variablen als die Mathematikleistung am Ende der Grundschule beeinflussend. Entsprechend bisherigen Befunden bestätigt sich also auch in TIMSS 2011 die Bedeutung des Vorwissens für die Leistungsentwicklung der Kinder. Wie bereits bei Helmke und Weinert (1997) auf

97 Die Bedeutung von familiären, schulischen und individuellen Merkmalen für die Mathematikkompetenz 95 gezeigt, lassen sich somit Leistungsvorsprünge respektive -nachteile, die bereits zu Beginn der Grundschulzeit existieren, nicht mehr vollständig aufholen, womit dem Elternhaus sowie den vorschulischen Einrichtungen eine zentrale Rolle für die Leistungsentwicklung zukommt. Am Ausmaß des Vorwissens maßgeblich beteiligt sind vor allem der Zugang zu Leseressourcen im Elternhaus und die mathematische familiäre Frühförderung. Leseressourcen im Elternhaus, deren Vorhandensein wiederum vom sozioökonomischen Status der Eltern (= operationalisiert durch Schulbildung und Beruf der Eltern) abhängt, weisen auch einen direkten Einfluss auf die Mathematikleistung am Ende der 4. Klasse auf. Insbesondere Migrantenkinder sind im Hinblick auf das im Elternhaus vorhandene kulturelle Kapital benachteiligt, was sich sowohl durch einen geringeren Zugang zu Büchern als auch in einer weniger häufig stattfindenden mathematischen Frühförderung in der Familie äußert. Laut Elternangaben sollten Schüler/ innen mit Migrationshintergrund jedoch ein höheres mathematisches Vorwissen zu Schulbeginn aufweisen. Dass ein geringeres kulturelles Kapital zu einer höheren Mathematikleistung zu Schulbeginn führen sollte, scheint jedoch sehr unplausibel und ist möglicherweise durch kulturelle Unterschiede im Einschätzungsverhalten bedingt. Möglich wäre auch, dass die geringen Unterschiede in den Mathematiknoten zwischen Kindern mit und ohne Migrationshintergrund, die den Eltern als Basis zur Einschätzung der Mathematikkompetenz dienen, dazu beitragen, dass Eltern mit Migrationshintergrund das Vorwissen der Kinder vor Beginn der Grundschule systematisch überschätzen. Neben diesem vorerst unplausibel erscheinenden Befund, dem allerdings mit der aktuellen Datenlage nicht weiter nachgegangen werden kann (es liegt keine objektive Messung der Leistung zu Beginn der Grundschule vor), sprechen die Daten im Hinblick auf familiäre Merkmale jedoch ein klares Bild: Sie heben die Relevanz der vorschulischen Förderung und des im Elternhaus zur Verfügung stehenden kulturellen Kapitals hervor. Bildungsungleichheiten bzw. auch -ungerechtigkeiten bilden sich demnach sehr früh und das österreichische Bildungssystem ist gefordert, dieser Entwicklung entgegenzusteuern. Die Verpflichtung zum mindestens ein Jahr dauernden Kindergartenbesuch ist ein Versuch, diese durch Unterschiede im kulturellen Kapital im Elternhaus verursachte Ungerechtigkeit zu verringern. Es ist jedoch nicht anzunehmen, dass die externe Frühförderung Unterschiede in den familiären Sozialisationsbedingungen vollständig kompensieren kann, wofür auch der direkte Pfad der Leseressourcen zur Mathematikleistung spricht. Um optimale Entwicklungen zu ermöglichen, ist die Einbindung der Eltern in die Bemühungen der Frühförderung erstrebenswert, wie bereits im Hinblick auf die Entwicklung des Vorwissens angesprochen wurde. Eine weitere Möglichkeit, der bestehenden Bildungsungleichheit entgegenzuwirken, wäre eine Modifikation bei der Anerkennung der beruflichen Ausbildung von Migrantinnen und Migranten in Österreich. Die Analysen zeigen, dass Kinder mit Migrationshintergrund vor allem Eltern in niedrigeren beruflichen Positionen und weniger mit geringer Schulbildung haben. Dieses Ergebnis steht im Einklang mit der Erkenntnis, dass in Österreich Migration, bei gleicher formaler Schulbildung, mit einer geringeren beruflichen Position verbunden ist (Gächter, 2010). Ergänzend muss jedoch hinzugefügt werden, dass es bis dato keine datenbasierten Untersuchungen gibt, die sich mit der Anerkennung beruflicher Ausbildung und einer damit einhergehenden Reduzierung von Bildungsungleichheit beschäftigt haben. Als dritter Bereich wurden im Modell Faktoren des Unterrichts konkret ein autonomieunterstützender Unterricht und eine anregende Unterrichtsgestaltung (z. B. Förderung des Interesses im Unterricht) berücksichtigt. Während der anregende Mathematikunterricht die erwartete Wirkung zeigt, nämlich die Förderung der Schülermotivation (Selbstkonzept/Freude/Wert), und auch mit besseren Noten einhergeht, erweist sich die Wirkung des autonomieunterstützenden Unterrichts als komplexer und weniger eindeutig. Während Autonomieunterstützung im Unterricht wie erwartet von den Schülerinnen und Schülern als positiv anregend eingeschätzt wird, und in Folge mit einem erhöhten Selbstkonzept und einer höheren Wertzuschreibung einhergeht, erreichen Schüler/innen, die von einer höheren Autonomieunterstützung berichten, schlechtere Noten in der Schule. Die Noten wirken wiederum negativ auf das schulische Selbstkonzept und sind auch mit einer schlechteren Mathematikleistung in TIMSS assoziiert. Das heißt, Autonomieunterstützung wirkt entsprechend dem berechneten Modell zum einen motivational günstig, zum anderen jedoch eher ungünstig auf die Leistung. Eine Erklärungsmöglichkeit für diesen Befund könnte in der Selbstregulationsfähigkeit der Schüler/innen liegen: Um optimales Lernen in einer relativ frei gestalteten Lernumgebung (= hohe Autonomie) zu erzielen, müssen die Schüler/innen über eine entsprechende Selbstregulationskompetenz, wozu auch Lernstrategien zählen, verfügen, um diese Offenheit entsprechend nützen zu können. Fehlt diese Kompetenz im selbstgesteuerten Lernen, kann Autonomie im Klassenzimmer der Leistungsentwicklung auch hinderlich sein. Autonomieerleben ist demnach entsprechend der Selbst bestimmungstheorie der Motivation (Deci & Ryan, 1993) eine hilfreiche Unterrichtsstrategie, um Lernmotivation zu fördern. Soll sie jedoch auch leistungssteigernd sein, so sind Lehrkräfte darin beraten, die Selbstregulationsfähigkeiten der Schüler/innen explizit zu fördern. Hierzu gibt es bereits eine Reihe an Trainings (Götz & Nett, 2011). Damit der Transfer der Selbstregulationsfähigkeiten in den schu lischen Alltag gelingt, ist es notwendig, diese Trainings möglichst nah am schulischen Lernen und den dort zu verarbeitenden Inhalten zu orientieren (Hasselhorn & Labuhn, 2010).

98 96 Die Bedeutung von familiären, schulischen und individuellen Merkmalen für die Mathematikkompetenz Zusammenfassend lässt sich mit dem in diesem Beitrag berechneten Modell demnach belegen, dass die Mathematikkompetenz wie es von Rahmenmodellen schulischer Leistung angenommen wird multideterminiert ist. Im Bewusstsein, dass bei internationalen Schulleistungsstudien Restriktionen im Hinblick auf die Länge der Fragebögen vorliegen und Indikatoren sehr komprimiert erhoben werden müssen, wäre für zukünftige Zyklen von TIMSS die zusätzliche Aufnahme von Schülerverhaltensvariablen, wozu beispielsweise Selbstregulationsstrategien zählen würden, wünschenswert (für die Erfassung von Lernstrategien in Lesen siehe PISA-Studie, z. B. Artelt, Naumann & Schneider, 2010). Entsprechend dem Angebots-Nutzungs- Modell, das zu Beginn des Beitrags vorgestellt wurde, mediiert das Nutzungsverhalten die Beziehung zwischen dem Unterrichtsangebot, der ausgelösten Motivationslage und der daraus resultierenden Schülerleistung. Damit stellt das Schülerverhalten eine wesentliche Variable zur Erklärung der Schülerleistung dar. Literatur Artelt, C., Naumann, J. & Schneider, W. (2010). Lesemotivation und Lernstrategien. In E. Klieme et al. (Hrsg.), PISA Bilanz nach einem Jahrzehnt (S ). Münster: Waxmann. Bergmüller, S. (2010). Leistungsschwache Schüler/innen: Kompetenzen und Charakteristika. In B. Suchan, C. Wallner Paschon & C. Schreiner (Hrsg.), TIMSS Mathematik und Naturwissenschaft in der Grundschule. Österreichischer Expertenbericht (S ). Graz: Leykam. Breit, S. & Wanka, R. (2010). Schüler/innen mit Migrationshintergrund: Ein Portrait ihrer Kompetenzen im Licht ihrer familiären und schulischen Sozialisation. In B. Suchan, C. Wallner-Paschon & C. Schreiner (Hrsg.), TIMSS Mathematik und Naturwissenschaft in der Grundschule. Österreichischer Expertenbericht (S ). Graz: Leykam. Bourdieu, P. (1983). Ökonomisches Kapital, kulturelles Kapital, soziales Kapital. In R. Kreckel (Ed.), Soziale Ungleichheit (S ). Göttingen: Schwartz. Bruneforth, M., Weber, C. & Bacher, J. (2013). Chancengleichheit und garantiertes Bildungsminimum in Österreich. In B. Herzog-Punzenberger (Hrsg.), Nationaler Bildungsbericht Österreich 2012: Band 2 Fokussierte Analysen bildungspolitischer Schwerpunktthemen (S ). Graz: Leykam. Bühner, M. (2011). Einführung in die Test- und Fragebogenkonstruktion. München: Pearson Studium. Cohen, J. (1988). Statistical power analysis for the behavioral sciences (2nd ed.). Hillsdale, NJ: Erlbaum. Deci, E. L. & Ryan, R. M. (1993). Die Selbstbestimmungstheorie der Motivation und ihre Bedeutung für die Pädagogik. Zeitschrift für Pädagogik, 39 (2), Dickhäuser, O. (2003). Überprüfung des erweiterten Modells des internal/external frame of reference. Zeitschrift für Entwicklungspsychologie und Pädagogische Psychologie, 35 (4), Eccles (Parsons), J., Adler, T. F., Futterman, R., Goff, S. B., Kaczala, C. M., Meece, J. L. & Midgley, C. (1983). Expectancies, values, and academic behaviors. In J. T. Spence (Ed.), Achievement and achievement motivation (pp ). San Francisco, CA.: W. H. Freeman. Ehmke, T. & Siegle, T. (2008). Einfluss elterlicher Mathematikkompetenz und familialer Prozesse auf den Kompetenzerwerb von Kindern in Mathematik. Psychologie in Erziehung und Unterricht, 55 (4), Faber, G., Tiedemann, J. & Billmann-Mahecha, E. (2011). Selbstkonzept und Lernfreude in der Grundschulmathematik: Die Bedeutung von Migration und Geschlecht. Längsschnittliche Ergebnisse aus der Hannoverschen Grundschulstudie. Heilpädagogische Forschung, 37 (3), Gächter, A. (2010). Der Integrationserfolg des Arbeitsmarktes. In H. Langthaler (Hrsg.), Integration in Österreich: Sozialwissenschaftliche Befunde (S ). Wien: StudienVerlag.

99 Die Bedeutung von familiären, schulischen und individuellen Merkmalen für die Mathematikkompetenz 97 Götz, T. & Nett, U. E. (2011). Selbstreguliertes Lernen. In T. Götz (Hrsg.), Emotion, Motivation und selbstgesteuertes Lernen (S ). Paderborn: Schöningh. Gröhlich, C. (2012). Bildungsqualität. Strukturen und Prozesse in Schule und Unterricht und ihre Bedeutung für den Kompetenzerwerb (Reihe: Empirische Erziehungswissenschaft). Münster: Waxmann. Grube, D. & Hasselhorn, M. (2006). Längsschnittliche Analysen zur Lese-, Rechtschreib- und Mathematikleistung im Grundschulalter: zur Rolle von Vorwissen, Intelligenz, phonologischem Arbeitsgedächtnis und phonologischer Bewusstheit. In I. Hosenfeld & F.-W. Schrader (Hrsg.), Schulische Leistung. Grundlagen, Bedingungen, Perspektiven (S ). Münster: Waxmann. Hagenauer, G. (2011). Lernfreude in der Schule. Münster: Waxmann. Hagenauer, G. & Hascher, T. (2011). Lernfreude, engagierte Mitarbeit im Unterricht und erfolgreiches Leisten bei instrumentellen Formen der Lernmotivation ein Widerspruch in sich? Zeitschrift für Bildungsforschung, 1 (2), Hany, E. A. (1997). Entwicklung vor, während und nach der Grundschulzeit. Literaturüberblick über den Einfluss der vorschulischen Entwicklung auf die Entwicklung im Grundschulalter. In F. E. Weinert & A. Helmke (Hrsg.), Entwicklung im Grundschulalter (S ). Weinheim: Beltz. Hasselhorn, M. & Labuhn, A. S. (2010). Lernstrategien. In T. Hascher & B. Schmitz (Hrsg.), Pädagogische Interventionsforschung (S ). Weinheim & München: Juventa. Heinze, A., Herwartz-Emden, L. & Reiss, K. (2007). Mathematikkenntnisse und sprachliche Kompetenz bei Kindern mit Migrationshintergrund zu Beginn der Grundschulzeit. Zeitschrift für Pädagogik, 53 (4), Heller, K. A. (1997). Individuelle Bedingungsfaktoren der Schulleistung: Literaturüberblick. In F. E. Weinert & A. Helmke (Hrsg.), Entwicklung im Grundschulalter (S ). Weinheim: Beltz Helmke, A. (2006). Unterrichtsqualität: Erfassen, Bewerten, Verbessern (4. Aufl.). Seelze: Kallmeyersche Verlagsbuchhandlung. Helmke, A. (1993). Die Entwicklung der Lernfreude vom Kindergarten bis zur 5. Klassenstufe. Zeitschrift für Pädagogische Psychologie, 7 (2 3), Helmke, A. (1997). Individuelle Bedingungsfaktoren der Schulleistung: Ergebnisse aus dem SCHOLASTIK-Projekt. In F. E. Weinert & A. Helmke (Hrsg.), Entwicklung im Grundschulalter (S ). Weinheim: Beltz. Helmke, A., Hosenfeld, I. & Schrader, F.-W. (2002). Unterricht, Mathematikleistung und Lernmotivation. In A. Helmke & R. S. Jäger (Hrsg.), Das Projekt MARKUS. Mathematik-Gesamterhebung Rheinland Pfalz: Kompetenzen, Unterrichtsmerkmale, Schulkontext (S ). Landau: Empirische Pädagogik. Helmke, A. & Reich, H. H. (2001). Die Bedeutung der sprachlichen Herkunft für die Schulleistung. Empirische Pädagogik, 15 (4), Helmke, A. & Weinert, F. E. (1997). Bedingungsfaktoren schulischer Leistungen. In F. E. Weinert (Hrsg.), Psychologie des Unterrichts und der Schule (S ). Göttingen: Hogrefe. Hyde, J. S., Fennema, E. & Lamon, S. J. (1990). Gender differences in mathematics performance: A meta-analysis. Psychological Bulletin, 107 (2), Jung, J. (2014). Reform- und Alternativschulen. In W. Einsiedler, M. Götz, A. Hartinger & F. Heinzel (Hrsg.), Handbuch Grundschulpädagogik und Grundschuldidaktik (pp ): UTB GmbH. Klieme, E., Lipowsky, F., Rakoczy, K. & Ratzka, N. (2006). Qualitätsdimensionen und Wirksamkeit von Mathematikunterricht. Theoretische Grundlagen und ausgewählte Ergebnisse des Projekts Pythagoras. In M. Prenzel & L. Allolio-Näcke (Hrsg.), Untersuchungen zur Bildungsqualität von Schule (S ). Münster: Waxmann.

100 98 Die Bedeutung von familiären, schulischen und individuellen Merkmalen für die Mathematikkompetenz Köller, O., Zoe, D., Schnabel, K. U. & Baumert, J. (2000). Kurswahlen von Mädchen und Jungen im Fach Mathematik: Zur Rolle von fachspezifischem Selbstkonzept und Interesse. Zeitschrift für Pädagogische Psychologie, 14 (1), Krajewski, K., Grüßing, M. & Peter-Koop, A. (2009). Die Entwicklung mathematischer Kompetenzen bis zum Beginn der Grundschulzeit. In A. Heinze & M. Grüßing (Hrsg.), Mathematiklernen vom Kindergarten bis zum Studium (S ). Münster: Waxmann. Krapp, A. (2009). Interesse. In V. Brandstätter & J. H. Otto (Hrsg.), Handbuch der Allgemeinen Psychologie Motivation und Emotion (S ). Göttingen: Hogrefe. Lazarides, R. & Ittel, A. (2011). Soziale und individuelle Bedeutungsfaktoren für mathematisches Fachinteresse und geschlechtsspezifisches Verhalten. In A. Hadjar (Hrsg.), Geschlechtsspezifische Bildungsungleichheiten (S ) Wiesbaden: VS. Lüdtke, O., Robitzsch, A., Trautwein, U. & Köller, O. (2007). Umgang mit fehlenden Werten in der psychologischen Forschung. Probleme und Lösungen. Psychologische Rundschau, 58 (2), Martin, M. O. & Mullis, I. V. S. (Eds.). (2012). Methods and procedures in TIMSS and PIRLS Chestnut Hill, MA: TIMSS & PIRLS International Study Center, Boston College. [Zugriff am unter methods/t-context-q-scales.html]. Möller, J. & Trautwein, U. (2009). Selbstkonzept. In E. Wild & J. Möller (Hrsg.), Pädagogische Psychologie (S ) Heidelberg: Springer. Mücke, S. (2009). Schulleistungen von Jungen und Mädchen in der Grundschule eine metaanalytische Bilanz. Empirische Pädagogik, 23 (3), Muthén, L. K. & Muthén, B. O. ( ). Mplus User s Guide. 7th Ed. Los Angeles, CA: Muthén & Muthén. Niggli, A., Trautwein, U., Schnyder, I., Lüdtke, O. & Neumann, M. (2007). Elterliche Unterstützung kann hilfreich sein, aber Einmischung schadet. Psychologie in Erziehung und Unterricht, 54 (1), Paseka, A. (2009). Geschlecht lernen rekonstruieren dekonstruieren konstruieren. Einige Anregungen für eine geschlechtssensible Pädagogik und Didaktik. In T. Schweiger & T. Hascher (Hrsg.), Geschlecht, Bildung und Kunst (S ). Wiesbaden: VS. Reeve, J., Bolt, E. & Cai, Y. (1999). Autonomy-supportive teachers: How they teach and motivate students. Journal of Educational Psychology, 91, Rustemeyer, R. & Fischer, N. (2007). Geschlechterdifferenzen bei Leistungserwartung und Wertschätzung im Fach Mathematik. In P. H. Ludwig & H. Ludwig (Hrsg.), Erwartungen in himmelblau und rosarot. Effekte, Determinanten und Konsequenzen von Geschlechterdifferenzen in der Schule (S ). Weinheim & München: Juventa. Wallner-Paschon, C. (2010). Kompetenzunterschiede für Mädchen und Buben. In B. Suchan, C. Wallner-Paschon & C. Schreiner (Hrsg.), TIMSS Mathematik und Naturwissenschaft in der Grundschule. Österreichischer Expertenbericht (S ). Graz: Leykam. Wallner-Paschon, C. (2012). Mathematik: Leistungsunterschiede zwischen Mädchen und Buben. In B. Suchań, C. Wallner- Paschon, S. Bergmüller & C. Schreiner (Hrsg.), PIRLS & TIMSS Schülerleistungen in Lesen, Mathematik und Naturwissenschaft in der Grundschule. Erste Ergebnisse (S ). Graz: Leykam. Weinert, F. E. & Helmke, A. (1995). Interclassroom differences in instructional quality and interindividual differences in cognitive development. Educational Psychologist, 30, Weinert, F. E. & Helmke, A. (1997). Entwicklung im Grundschulalter. Weinheim: Beltz. Weinert, F. E. & Stefanek, J. (1997). Entwicklung vor, während und nach der Grundschulzeit. Ergebnisse aus dem SCHO LASTIK-Projekt. In F. E. Weinert & A. Helmke (Hrsg.), Entwicklung im Grundschulalter (S ). Weinheim: Beltz.

101 Die Bedeutung von familiären, schulischen und individuellen Merkmalen für die Mathematikkompetenz 99 Wigfield, A. & Eccles, J. S. (2000). Expectancy value theory of motivation. Contemporary Educational Psychology, 25 (1), Wigfield, A., Eccles, J. S., Suk Yoom, K., Harold, R., Abreton, A. J. A., Freedman-Doan, C. & Blumenfeld, P. C. (1997). Change in children s competence beliefs and subjective task values across the elementary school years: a 3-year study. Journal of Educational Psychology, 89 (3), Wild, E. & Möller, J. (2014). Pädagogische Psychologie. Springer: Berlin Heidelberg.

102 100 Effekte der Geschwisterkonstellation auf schulische Kompetenzen 2.3 Lernen von älteren oder Lernen durch jüngere Geschwister? Effekte der Geschwisterkonstellation auf schulische Kompetenzen Christine Schmid & Anna Glaeser Lernen Kinder von älteren Geschwistern und erwächst Kindern mit älteren Geschwistern dadurch ein Vorteil für den schulischen Kompetenzerwerb? Welche Rolle spielt in diesem Zusammenhang die Hausaufgabenhilfe? Der Annahme des Lernens von älteren Geschwistern steht die Annahme des Lernens durch Lehren jüngerer Geschwister gegenüber. Profitieren Kinder mit jüngeren Geschwistern davon, dass sie diesen etwas beibringen? Einen solchen teaching effect haben Zajonc und Markus (1975; vgl. auch Zajonc, 2001) im Rahmen des von ihnen entwickelten confluence models postuliert. Im vorliegenden Beitrag werden sowohl die beiden genannten Hypothesen als auch weitere Annahmen zur elterlichen Ressourcenverdünnung wie zum confluence model überprüft. Einleitung Der vorliegende Beitrag widmet sich der Frage, ob und in welcher Weise Geschwister mit der Entwicklung von schulischen Kompetenzen in Lesen, Mathematik und Naturwissenschaft im Zusammenhang stehen. In der Literatur zu Geschwisterbeziehungen wird beschrieben, dass ältere Geschwister gegenüber den jüngeren häufig die Rolle von Lehrenden und Betreuenden übernehmen und in dieser Funktion sogar erfolgreicher sein können als die Eltern (Kasten, 1993; Liegle, 2006). Die Vermutung liegt nahe, dass ältere Geschwister mit den jüngeren auch für die Schule lernen und es stellt sich die Frage, ob Kindern mit älteren Geschwistern dadurch ein systematischer Vorteil beim Erwerb schulischer Kompetenzen erwächst. Der Vermutung, dass Kinder mit älteren Geschwistern einen Lernvorteil haben, steht die Annahme gegenüber, dass Kinder mit jüngeren Geschwistern einen Kompetenzvorsprung aufweisen. Diese Annahme ist durch den sogenannten teaching effect begründet, den Zajonc und Markus (1975) auf der Grundlage des in den 1970er Jahren entwickelten confluence models in die Diskussion brachten (s. auch Zajonc, 2001; Zajonc & Sulloway, 2007). Kinder mit jüngeren Geschwistern sollen davon profitieren, dass sie die Möglichkeit haben, lehrendes Verhalten auszuüben. Tatsächlich belegen experimentelle Untersuchungen einen positiven Effekt solchen Verhaltens auf die Entwicklung von kognitiven Kompetenzen bei Kindern (z. B. Bargh & Shul, 1980; Kagan, 1992). Anderen etwas beibringen führt demnach zu einer Strukturierung des eigenen Wissens und der eigenen Fähigkeiten, die auch der Entwicklung schulischer Kompetenzen förderlich sein könnte. Inwieweit sich Evidenzen für die eine wie für die andere Annahme ergeben, soll im Folgenden auf der Grundlage der im Jahr 2011 im Rahmen von PIRLS & TIMSS erhobenen Daten für österreichische Schüler/innen der 4. Schulstufe geprüft werden. Die Geschwisterbeziehung als Lernkontext Geschwisterbeziehungen weisen eine Reihe von Charakteristika auf, die als besonders lernförderlich gelten können (Azmitia & Perlmutter, 1989; Rogoff, 1990). Ein älteres Geschwister mit hinreichend großem Altersabstand verfügt im Vergleich zum jüngeren Geschwister über weiterent wickelte soziale und kognitive Fähigkeiten und ist dadurch ab einem gewissen Alter in der Lage, die gemeinsamen Interaktionen zu strukturieren. Gleichzeitig ist die kognitive Überlegenheit älterer Geschwister geringer als diejenige der Eltern, weshalb es älteren Geschwistern unter Umständen leichter gelingt, an die Sichtweisen und den Erfahrungshorizont des jüngeren Geschwisters anzuknüpfen. Experimentelle Untersuchungen belegen zum einen, dass ältere Geschwister das sogenannte scaffolding beherrschen (McGillicuddy-De Lisi, 1993). Der Begriff des scaffolding ist schwer ins Deutsche zu übersetzen. Er bedeutet, dass ältere Geschwister in der Lage sind, Lernkontexte für jüngere Geschwister so zu gestalten, dass deren Zone der nächsten Entwicklung stimuliert wird (Vygotsky, 1978). Nach Vygotsky werden kognitive Fähigkeiten schrittweise erworben und zwar zuerst interaktiv unter der Anleitung kompetenterer sozialer Agenten, bevor sie dann in das eigene, selbstständig ausführbare Repertoire übernommen werden. Die Zone der nächsten Entwicklung ist durch die Differenz zwischen den zunächst nur interaktiv

103 Effekte der Geschwisterkonstellation auf schulische Kompetenzen 101 vorhandenen und den bereits eigenständig anwendbaren Fähigkeiten definiert. Zum anderen zeigte sich in Studien zur kooperativen Bearbeitung von Problemlöseaufgaben, dass Kinder, die mit ihrem älteren Geschwister zusammenarbeiteten, bessere Ergebnisse erzielten als Kinder, die mit Freunden, Fremden (Azmitia & Hesser, 1993; Cicirelli, 1972) oder alleine (Cicirelli, 1974) arbeiteten. Untersuchungen, in denen das kooperative Problemlösen von Kindern mit ihren Müttern mit dem von Kindern in Zusammenarbeit mit ihren älteren Geschwistern verglichen wurde, zeigten, dass nicht nur Mütter, sondern auch ältere Geschwister lehrende Verhaltensweisen, sogenanntes tutoring, ausüben (Cicirelli, 1975; 1976). Die Art und Qualität dieser Verhaltensweisen erwies sich allerdings als abhängig von der Geschlechterkonstellation: Die Zusammenarbeit mit älteren Schwestern war erfolgreicher als jene mit älteren Brüdern (Cicirelli 1972; 1974). Zudem schienen Mädchen vor allem von der Zusammenarbeit mit älteren Schwestern zu profitieren, während Buben eher durch die Rivalität mit älteren Brüdern angespornt wurden. Schließlich schienen die Mütter mit ihrem eigenen Verhalten auf die Geschlechterkonstellation zu reagieren: Sie gaben jüngeren Geschwistern weniger Hilfe und Feedback, wenn das jüngere Geschwister männlich und das ältere Geschwister weiblich war. In experimentellen Untersuchungen werden nur kurzfristige Effekte erfasst, sie können von daher keine Auskunft darüber geben, inwieweit jüngeren Geschwistern durch das Vorhandensein älterer ein systematischer Entwicklungsvorteil erwächst. Das Auftreten eines solchen Vorteils dürfte unter anderem davon abhängen, in welchem Ausmaß Eltern und ältere Geschwister die Rolle des Tutors/der Tutorin übernehmen, beispielsweise indem sie Hausaufgabenhilfe leisten. Auch dieser Frage soll im vorliegenden Beitrag nachgegangen werden. Das confluence model In Studien zu Bildungs-Outcomes zeigt sich häufig ein negativer Effekt der Zahl der Kinder in der Familie auf entsprechende abhängige Größen wie beispielsweise die Zahl der besuchten Schuljahre, Bildungsabschlüsse, Schulnoten oder auch Leistungstestwerte (z. B. Black, Devereux & Salvanes, 2005; Blake 1989; Booth & Kee, 2009; Kanazawa, 2012). Sozialökonomen erklären diesen Zusammenhang in der Regel im Rahmen eines Ressourcenverdünnungsmodells (im Überblick s. Downey, 2001). Mit zunehmender Zahl der Kinder werden die begrenzten elterlichen Ressourcen finanzieller, affektiver wie intellektueller Art auf eine h öhere Anzahl an Kindern verteilt, so dass für jedes einzelne Kind ein entsprechend geringerer Anteil verbleibt. Erstgeborene erhalten zunächst die volle Zuwendung ihrer Eltern, der Anteil verringert sich jedoch mit der Geburt jedes weiteren Kinds. Da Kinder mit steigendem Geburtsrangplatz in für sie zunehmend ungünstigere familiäre Ressourcenverhältnisse geboren werden, kann vor dem Hintergrund dieses Erklärungsmodells nicht nur ein negativer Effekt der Zahl der Kinder, sondern auch des Geburtsrangplatzes auf die Bildungs-Outcomes erwartet werden. Ein solch negativer Effekt des Geburtsrangplatzes konnte allerdings nur vereinzelt in Studien bestätigt werden (z. B. Black et al., 2005; Booth & Kee, 2009; Taubmann & Behrmann, 1986; dazu auch Hertwig, Davis & Sulloway, 2002), sodass verschiedene Autoren zu dem Schluss kamen, der Geburtsrangplatz hätte offenbar im Unterschied zur Zahl der Kinder keinen systematischen Einfluss auf den Erwerb von schulischen Kompetenzen (Ernst & Angst, 1983; Kanazawa 2012; Retherford & Sewell, 1991; Rodgers, Cleveland, van den Oord & Rowe, 2000; Schooler, 1972). Dieser Schlussfolgerung widersprachen Zajonc und Mullally (1997), Zajonc und Sulloway (2007) sowie Sulloway (2007) vor dem Hintergrund des confluence models (Zajonc, 1983; Zajonc, 2001; Zajonc & Bargh, 1980; Zajonc & Markus, 1975). Die Grundlage der Überlegungen zum confluence model bildete eine Studie über holländische Militärrekruten (Belmont & Marolla, 1973), deren Intelligenztestscores, erhoben im Alter von 19 Jahren, ein charakteristisches Muster aufwiesen: Rekruten aus Zweikindfamilien zeigten höhere Intelligenzwerte als Rekruten aus Dreikindfamilien, diese wiederum höhere als Rekruten aus Vierkindfamilien, letztere wiederum höhere als Rekruten aus Fünfkindfamilien usw. Bis zu diesem Punkt erscheint die Abnahme der Intelligenztestscores rein durch die zunehmende Zahl der Kinder begründbar. Zusätzlich zeigte sich jedoch eine Abhängigkeit der Scores vom Geburtsrangplatz. Während in Zwei- bis Vierkindfamilien die Intelligenzscores mit steigendem Geburtsrangplatz abnahmen, begannen die Werte in Familien mit mehr als vier Kindern mit den späteren Geburtsrangplätzen wieder anzusteigen. Die Verläufe nach Geburtsrangplatz waren demnach nicht linear, sondern zumindest in größeren Familien kurvilinear. Außerdem traten in den Daten zwei Anomalien auf, die weder mit der Familiengröße noch mit dem Geburtsrangplatz der Rekruten zu erklären waren: Die Intelligenztestscores von Einzelkindern lagen unter den Werten der Erstgeborenen aus Zwei- und Dreikindfamilien, etwa auf der Höhe der Erstgeborenen aus Vierkindfamilien. Zudem ergab sich in allen Familiengrößen ein stärkerer Abfall der Werte der Letzt geborenen im Vergleich zu den Vorgeborenen. Diese Anomalien veranlassten Zajonc und Markus (1975) zur Annahme des teaching effect. Einzelkindern und Letztge borenen soll ein systematischer Nachteil dadurch erwachsen, dass sie keine jüngeren Geschwister haben, denen sie etwas beibringen können. Theoretisch postuliert das confluence model, dass die Entwicklung der intellektuellen Fähigkeiten von Kindern vom durchschnittlichen Fähigkeitsniveau der Familie abhängig sei. In das durchschnittliche Fähigkeitsniveau der Familie fließen die Niveaus aller Familienmitglieder inklusive dem des Zielkinds ein. Es verändert sich demnach mit dem Alter

104 102 Effekte der Geschwisterkonstellation auf schulische Kompetenzen und der Zahl der Kinder. Mit steigender Zahl der Kinder nimmt das durchschnittliche Familienniveau ab hier teilt das confluence model die Annahme der Ressourcenverdünnung, denn das hohe elterliche Niveau verliert mit der Zahl der Kinder an Gewicht im familiären Gesamtniveau. 1 Mit steigendem Geburtsrangplatz muss sich jedoch keineswegs eine solche Abnahme ergeben, dies konnten Zajonc und Markus (1975) anhand von mathematischen Modellrechnungen zeigen. Beispielsweise kann ein Zweitgeborenes schon nach wenigen Jahren eine günstigere familiäre Umwelt vorfinden, als das Erstgeborene im selben Alter vorfand. 2 Dieser Effekt, bei dem die familiäre Umwelt für die später Geborenen günstiger wird als für die vorher Geborenen, ist abhängig vom Altersabstand zwischen den Kindern. Er tritt umso eher auf, je größer der Altersabstand ist. Daneben spielt aber auch das Testalter der Kinder eine Rolle. In großen Datensätzen zeigten sich mit höherem Geburtsrangplatz umso eher positive Effekte, je niedriger das Testalter war. Erst ab einem Testalter von etwa 11 Jahren (+/ 2 Jahre) ergab sich ein Abfall von Intelligenz- oder Leistungstestwerten bei den später Geborenen (Zajonc, 1976; Zajonc & Bargh, 1980; Zajonc, 2001). Die Ursache für diese abfallenden Werte bei höherem Testalter sehen die Autoren in der Zeit, welche der teaching effect braucht, um seine Wirkung zu entfalten. In jedem Fall liefert das confluence model durch diesen Umkehreffekt eine stichhaltige Erklärung für den häufig fehlenden negativen Effekt des Geburtsrangplatzes und prognostiziert gleichzeitig einen möglichen positiven oder auch kurvilinearen Effekt bei niedrigerem Testalter. Im vorliegenden Beitrag soll überprüft werden, ob sich in den Daten aus PIRLS & TIMSS 2011 ein ähnliches Muster nach der Zahl der Kinder und dem Geburtsrangplatz zeigt, wie bei Zajonc und Markus (1975) oder Zajonc und Bargh (1980) berichtet. Außerdem soll geprüft werden, ob sich Hinweise auf den durch das confluence model postulierten teaching effect auch bei österreichischen Schülerinnen und Schülern der 4. Schulstufe zeigen. Hinweise auf einen solchen ergäben sich vor allem durch ein Handicap von Einzelkindern und von Letztgeborenen sowie durch eine Bestätigung der Übernahme lehrender Verhaltensweisen aufseiten älterer Geschwister. Vorgehensweise und Hypothesen Im ersten Schritt wird deshalb zunächst untersucht, in welchem Ausmaß Kinder von Geschwistern Unterstützung bei den Hausaufgaben erhalten und ob eine derartige Unterstützung vom Vorhandensein älterer Geschwister sowie von der Zahl der Kinder abhängt. Aufgrund begrenzter zeitlicher Ressourcen sollte die elterliche Hausaufgabenhilfe mit steigender Zahl der Kinder abnehmen. Im Gegenzug könnte die geschwisterliche Hausaufgabenhilfe zunehmen, insbesondere wenn ältere Geschwister vorhanden sind. Zudem wird überprüft, inwieweit sich das Vorhandensein älterer Geschwister und die Zahl der Kinder negativ auf die Häufigkeit von privater Nachhilfe und Nachmittagsbetreuung auswirken. Ersteres ist anzunehmen, wenn ältere Geschwister häufiger die Betreuung jüngerer Geschwister übernehmen und Hilfestellung bei der Hausübung geben, anstatt dass auf private Nachhilfe und externe Nachmittagsbetreuung zurückgegriffen wird. Letzteres könnte mit begrenzten finanziellen Ressourcen in größeren Familien im Zusammenhang stehen, aber auch durch ein häufigeres Zuhausebleiben von Müttern im Falle mehrerer Kinder begründet sein. Um zu überprüfen, ob sich im vorliegenden Datensatz ähnliche Muster ergeben, wie bei Zajonc und Markus (1975) oder bei Zajonc und Bargh (1980) berichtet, werden im zweiten Schritt die Kompetenzwerte für Lesen, Mathematik und Naturwissenschaft nach der Zahl der Kinder und dem Geburtsrangplatz dargestellt. Erwartet werden abnehmende Kompetenzwerte mit höherer Zahl der Kinder sowie, insbesondere in Familien mit mehreren Kindern, eventuell ein Wiederanstieg der Kompetenzwerte mit höherem Geburtsrangplatz. Vor dem Hintergrund des teaching effect ist außerdem zu erwarten, dass die Kompetenzwerte der Einzelkinder unter den Werten der Erstgeborenen aus Zwei- und Dreikindfamilien liegen sowie die Werte der Letztgeborenen jeweils einen Abfall gegenüber den Werten der Vorgeborenen zeigen. Die Erwartung eines Abfalls der Kompetenzwerte mit steigender Zahl der Kinder sowie eines möglichen kurvilinearen Verlaufs mit höherem Geburtsrangplatz wird anschließend einer regressionsanalytischen Prüfung unterzogen. Im dritten Schritt sollen die beiden Hypothesen des Lernens von älteren Geschwistern sowie des Lernens durch Lehren (teaching effect) einer regressionsanalytischen Prüfung unterzogen werden. Hierzu werden Kinder mit und ohne ältere Geschwister sowie Kinder mit und ohne jüngere Geschwister jeweils miteinander verglichen. Im Falle des Lernens von älteren Geschwistern wäre zu erwarten, dass Kinder mit 1 Um die Annahmen des confluence model zu verdeutlichen, soll idealtypisch angenommen werden, dass Erwachsene ein intellektuelles Niveau von 30 besitzen, Neugeborene mit einem Niveau von 0 in das Gesamtniveau eingehen und Kinder pro Lebensjahr einen Zuwachs von 1 verzeichnen. Die intellektuelle Umgebung eines Erstgeborenen im Alter von 10 Jahren aus einer Zweikindfamilie mit einem siebenjährigen Geschwister (( ) /4 = 19,25) wäre demnach höher als die eines Erstgeborenen im Alter von 10 Jahren aus einer Dreikindfamilie mit einem sieben- und einem vierjährigen Geschwister (( )/5 = 16,2). Ähnliche Modellrechnungen finden sich bei Zajonc (2001). 2 Obwohl die Bedingungen für das Erstgeborene bei der Geburt denjenigen des Zweitgeborenen überlegen sind, ist das Verhältnis im folgenden Beispiel im Alter von vier Jahren umgedreht: Bei der Geburt liegt das Niveau für das Erstgeborene mit ( )/3 = 20 über dem Niveau für das Zweitgeborene ( )/4 = 16, im Alter von vier Jahren liegt das Niveau für das Erstgeborene mit ( )/4 = 16 unter dem Niveau für das Zweitgeborene ( )/4 = 18.

105 Effekte der Geschwisterkonstellation auf schulische Kompetenzen 103 älteren Geschwistern höhere Kompetenzwerte aufweisen als Kinder ohne ältere Geschwister. Im Fall des Lernens durch Lehren sollten Kinder mit jüngeren Geschwistern höhere Werte aufweisen als Kinder ohne jüngere Geschwister. Methode Die Analysen basieren auf den österreichischen Datensätzen der Studien PIRLS & TIMSS von Getestet wurden Schüler/innen auf der 4. Schulstufe im Frühjahr Das Durchschnittsalter der Schüler/innen lag bei 10,3 Jahren. Für die Analysen wurden die Gesamtwerte der Kompetenzmessungen für die Lesekompetenz aus dem PIRLS- Datensatz (N = 4670) sowie für die Mathematik- und Natur wissenschaftskompetenz aus dem TIMSS-Datensatz (N = 4668) herangezogen, die jeweils in Form von fünf plausible values vorliegen. Die Angaben zur Hausaufgabenhilfe entstammen dem Schülerfragebogen der PIRLS-Testung ( Wer hilft dir am meisten bei den Hausübungen? ). 3 Die Angaben zu Geschwistern wurden dem Elternfragebogen entnommen. 4 Die Eltern wurden nach der Anzahl der Schwestern sowie nach der Anzahl der Brüder gefragt, die mit dem bei PIRLS & TIMSS 2011 getesteten Kind im gemeinsamen Haushalt leben. Außerdem wurde gefragt, wie viele dieser Geschwister jünger sind als das Zielkind. Aus diesen Angaben ließ sich die Zahl der Kinder im Haushalt, der Geburtsrangplatz (Erst-, Zweit-, Drittgeborene/r usw.) sowie die Geschwisterposition (Einzelkind, ältestes, mittleres oder jüngstes Kind) ermitteln. 5 Die Geschwisterposition diente dann der Bildung von zwei Dummy-Variablen: 1. Älteres Geschwister vorhanden mit dieser werden mittlere und jüngste Kinder gegen Einzelkinder und älteste getestet und 2. Jüngeres Geschwister vorhanden, mit der älteste und mittlere Kinder gegen Einzelkinder und jüngste getestet werden. Da mit den Variablen Zahl der Kinder und Geburtsrangplatz sehr differenzierte Analysen durchgeführt wurden und es sich um kategoriale Größen handelt, wurden fehlende Werte für diese Variablen (solche ergaben sich in beiden Datensätzen für 5,8 % der Fälle) nicht imputiert. Außerdem wurden Familiengrößen ab fünf Kindern aus dem Daten satz ausgeschlossen, weil für diese Familiengrößen die Fallzahlen für eine Auswertung zu gering waren und zum Teil unplausible Werte im Datensatz vorlagen (dies betrifft weitere 5 % der Fälle in beiden Datensätzen). Dadurch reduzierte sich die Zahl der gültigen Fälle für Berechnungen mit den PIRLS-Daten auf 4167 Schüler/innen und für Berechnungen mit den TIMSS-Daten auf 4166 Schüler/ innen. Alle im Folgenden berichteten Ergebnisse lassen sich somit nur auf Familien mit ein bis vier Kindern verallgemeinern. Auf Grundlage dieser Fallzahlen wurden fehlende Werte in den abhängigen Variablen sowie in den Variablen zur Hausaufgabenhilfe, Nachmittagsbetreuung und privaten Nachhilfe mittels multipler Imputation ersetzt. Für die Imputation wurde ein umfangreiches Variablenset herangezogen, das sowohl Größen aus dem Elternfragebogen wie auch aus dem Schülerfragebogen enthielt (z. B. Geschlecht, kulturelles Kapital, 6 Migrationshintergrund, Bildung der Eltern, häusliche Lernressourcen). Es wurden für jeden Kompetenz bereich (Lesen, Mathematik, Naturwissenschaft) fünf Datensätze mit imputierten Daten generiert. Der i-te imputierte Datensatz (i = 1,, 5) verwendet dabei jeweils den i-ten plausible value. Die Imputationen wurden mit dem Modul Impute Missing Data Values in SPSS (Version 20) unter Anwendung der Methode Predictive Mean Matching (PMM) durchgeführt. Die Analysen wurden mit MPlus7 (Muthen & Muthen, ) unter Berücksichtigung der Populations- und der Replikationsgewichte sowie der geschachtelten Datenstruktur durchgeführt. 7 Als Schätzverfahren wurde Maximum-Likelihood (ML) verwendet. Im Folgenden werden sowohl standardisierte Regressionskoeffizienten (Beta-Gewichte) als auch in einzelnen Fällen unstandardisierte Regressionskoeffizienten (B-Gewichte) berichtet. An Stellen, an denen es nicht sinnvoll ist, Beta- Gewichte zu berichten, 8 werden die B-Gewichte herangezogen. Diese geben direkt den Unterschied in den Kompetenzwerten zwischen den verglichenen Gruppen wieder. Ergebnisse Hausaufgabenhilfe, private Nachhilfe und Nachmittagsbetreuung in Abhängigkeit von älteren Geschwistern und der Zahl der Kinder Auf die Frage Wer hilft dir am meisten bei den Hausübungen? gaben insgesamt 27 % der Kinder an, keine Hilfe zu 3 (S. 35) 4 (S. 20) 5 Missings wurden durch den Wert 0 ersetzt, wenn eine der beiden anderen Fragen beantwortet wurde. Dieser Vorgehensweise liegt die Annahme zugrunde, dass die Frage bei Nichtzutreffen übersprungen wurde. Die Variablen zur Geschwisterkonstellation würden sonst über 30 % fehlende Werte aufweisen. 6 Anzahl der Bücher zu Hause 7 Spezifikation in M-PLUS: TYPE = COMPLEX, REPSE = JACKKNIFE2 8 An einigen Stellen geht es nicht um den Zusammenhang zweier Größen, sondern um den Unterschied von Gruppen.

106 104 Effekte der Geschwisterkonstellation auf schulische Kompetenzen benötigen, 50 % erhielten Hilfe von Eltern oder Groß eltern, nur 1 % erhielt private Nachhilfe, 7 % erhielten am meisten Hilfe in der Nachmittagsbetreuung, 6 % bekamen Unterstützung durch andere Personen und 3 % der Kinder gaben an, von niemandem Hilfe zu bekommen. Nur etwa 7 % der Kinder erhielten am meisten Hilfe von Geschwistern. Ob ein älteres Geschwister vorhanden ist oder nicht, stand in keinem signifikanten Zusammenhang mit dem Anteil an Hilfe durch andere Personen (6 %) oder dem Anteil an privater Nachhilfe (1 %). Dagegen erhielten Kinder mit älteren Geschwistern signifikant seltener Hausaufgabenhilfe durch Eltern oder Großeltern (47 % zu 52 %, Beta-Gewicht =.05, p <.01) aber häufiger durch Geschwister im Vergleich zu Kindern ohne ältere Geschwister (11 % zu 2 %, Beta-Gewicht =.19, p <.01). Hilfe in der Nachmittagsbetreuung erhielten Kinder mit älteren Geschwistern ebenfalls signifikant seltener im Vergleich zu Kindern ohne ältere Geschwister (6 % zu 8 %, Beta-Gewicht =.05, p <.01). Sind ein oder mehrere ältere Geschwister vorhanden, nimmt demnach die Hausaufgabenhilfe durch Eltern oder Großeltern sowie in der Nachmittagsbetreuung ab, während die Hausaufgabenhilfe durch Geschwister zunimmt. Gemäß der Annahme der Ressourcenverdünnung sollte die Hausaufgabenhilfe durch Eltern und Großeltern jedoch nicht in erster Linie vom Vorhandensein älterer Geschwister, sondern vor allem von der Zahl der Kinder abhängen. Abbildung dokumentiert die entsprechenden Prozentanteile. Bei der Überprüfung dieser Annahme ergab sich zwar ein niedriges negatives Beta-Gewicht für den Effekt der Zahl der Kinder auf die Häufigkeit der Hausaufgabehilfe durch Eltern oder Großeltern, dieser war jedoch nicht signifikant. Statistisch absichern ließ sich dagegen die Zunahme der Häufigkeit der Hausaufgabenhilfe durch Geschwister mit steigender Zahl der Kinder (von 6 % in Zweikind familien auf 18 % in Vierkindfamilien; 9 Beta-Gewicht =.15, p <.01). Für die Häufigkeit von privater Nachhilfe ergab sich kein signifikanter Zusammenhang mit der Zahl der Kinder. Die Häufigkeit von Hilfe in der Nachmittags betreuung jedoch nahm mit steigender Zahl der Kinder signifikant ab (von 13 % in Einkindfamilien auf 3 % in Vierkindfamilien; Beta-Gewicht =.10, p <.01). Insgesamt ergab sich also keine Abhängigkeit der elterlichen Hausaufgabenhilfe von der Zahl der Kinder, wohl aber vom Vorhandensein älterer Geschwister. Offenbar sehen sich Eltern seltener veranlasst, selbst Hausaufgabenhilfe zu leisten, wenn ältere Geschwister dies übernehmen können. Möglicherweise wird auch eine nachmittägliche Betreuung häufiger den älteren Geschwistern überlassen, was sich letztlich negativ auf den Anteil an Hilfe in der Nachmittagsbetreuung ausgewirkt haben könnte. Allerdings kann hier nicht ausgeschlossen werden, dass bei einer höheren Zahl an Kindern die Mütter häufiger zu Hause blieben und eine % % Zahl der Kinder in der Familie brauche keine Hilfe Eltern/Großeltern Geschwister private Nachhilfe Nachmittagbetreuung andere Person keine/r hilft mir Angaben in Prozent; Werte unter 4 % sind nicht eingetragen; Abbildung 2.3.1: Hilfe bei den Hausaufgaben in Abhängigkeit von der Zahl der Kinder (Angaben der Schüler/innen; PIRLS 2011) externe Nachmittagsbetreuung deshalb seltener in Anspruch genommen wurde. Aus lerntheoretischer Sicht müsste Kindern durch die Hilfe und Betreuung durch ältere Geschwister kein Nachteil entstehen. Es könnte sich im Gegenteil sogar als ein Vorteil erweisen, denn ältere Geschwister liegen näher am Erfahrungshorizont ihrer jüngeren Geschwister als Eltern und können deshalb möglicherweise besser an deren Wissensstand anschließen. Entgegen der Erwartung wirkte sich die Zahl der Kinder nicht auf die Häufigkeit privater Nachhilfe aus, wobei angemerkt werden muss, dass der Anteil an Kindern, die angaben, private Nachhilfe zu erhalten, insgesamt auf einem sehr niedrigen Niveau lag. Auf die Häufigkeit von Hilfe in der Nachmittagsbetreuung dagegen zeigte die Zahl der Kinder einen Effekt: Solche Unterstützung war umso unwahrscheinlicher, je mehr Kinder in einer Familie waren. Wie bereits erwähnt, muss dieser Befund nicht bedeuten, dass ältere Geschwister in größeren Familien häufiger die Nachmittagsbetreuung übernehmen. Ebenso wahrscheinlich ist, dass bei mehr als einem Kind die Mütter ihre Berufstätigkeit aufgeben und dann, weil sie selbst zu Hause sind, auf eine externe Nachmittagsbetreuung für die Kinder verzichten Bei den nicht plausiblen Angaben zur Hausaufgabenhilfe durch Geschwister in Einkindfamilien (2 %) in Abbildung dürfte es sich um Messfehler handeln.

107 Effekte der Geschwisterkonstellation auf schulische Kompetenzen 105 Ein genauer Blick auf die Daten zeigte außerdem, dass bei Weitem nicht alle Kinder mit älteren Geschwistern Hausaufgabenhilfe durch Geschwister erhielten. 52 % der Kinder im Datensatz hatten ältere Geschwister, aber nur 11 % dieser Kinder (7 % insgesamt) gaben an, von Geschwistern Hausaufgabenhilfe zu erhalten. In Familien mit vier Kindern lag der Anteil an Hausaufgabenhilfe durch Geschwister jedoch immerhin bei 18 %. Kompetenzniveaus nach Anzahl der Kinder und Geburtsrangplatz Nachfolgend soll überprüft werden, ob sich für die Kompetenzwerte im vorliegenden Datensatz ähnliche Muster ergeben, wie bei Zajonc (1976, S. 228) oder Zajonc und Bargh (1980) berichtet. Dazu wurde in den Abbildungen bis die Lese-, Mathematik- und Naturwissenschaftskompetenz nach der Zahl der Kinder in der Familie und dem Geburtsrangplatz des im Rahmen von PIRLS & TIMSS 2011 getesteten Kinds dargestellt. Wie im Methodenteil bereits angesprochen, liegen für Familien mit mehr als vier Kindern keine ausreichenden Fallzahlen vor, sodass auf deren Darstellung verzichtet wird. Schon die Darstellung der Kompetenzwerte von Kindern aus Vierkindfamilien gerät deutlich an die Grenzen. Hier betragen die Fallzahlen für die Lese-/Mathematik-/Naturwissenschaftskompetenz n = 38/38/38 für Erstgeborene, n = 62/63/63 für Zweitgeborene, n = 103/102/102 für Drittgeborene und n = 102/102/102 für Viertgeborene. Im Groben bestätigte sich das Bild, das sich auch bei Zajonc (1976) oder Zajonc und Bargh (1980) zeigte: Die Erst- und Zweitgeborenen aus Zweikindfamilien liegen rein deskriptiv betrachtet mit ihren Kompetenzwerten über den Werten der Erst-, Zweit- und Drittgeborenen aus Dreikindfamilien und diese wiederum über den Werten der Erst-, Zweit-, Dritt- und Viertgeborenen aus Vierkindfamilien. Lediglich bei der Lese kompetenz ergab sich eine Abweichung von diesem Muster, hier liegen die Werte für die Erst- und Zweitgeborenen aus Vierkindfamilien höher als erwartet. Diese Abweichung vom erwarteten Muster ist schwer zu erklären, insbesondere da sie auch nur in einem der drei Kompetenzbereiche auftritt. Lesekompetenz Mathematikkompetenz hoch niedrig hoch niedrig Lesekompetenz nach Zahl der Kinder und Geburtsrangplatz des Zielkinds Erst- Einkindfamilien Zweikindfamilien Mathematikkompetenz nach Zahl der Kinder und Geburtsrangplatz des Zielkinds Erst- Dreikindfamilien Vierkindfamilien Abbildung 2.3.2: Lesekompetenz nach Zahl der Kinder und Geburtsrangplatz des Zielkinds (PIRLS 2011) Einkindfamilien Zweikindfamilien wicht = 10.81, p <.01; Naturwissenschaftskompetenz: B-Gewicht = 6.88, p <.05; die unstandardisierten B-Gewichte geben hier den Punktunterschied in den Kompetenzmessungen wieder). Die Unterschiede zwischen den Einzelkindern und den Erstgeborenen aus Drei- und Vier Zweitgeborene/r Dritt- Viert- Zweitgeborene/r Dritt- Viert- Dreikindfamilien Vierkindfamilien Abbildung 2.3.3: Mathematikkompetenz nach Zahl der Kinder und Geburtsrangplatz des Zielkinds (TIMSS 2011) In allen drei Kompetenzbereichen liegen die Werte der Einzelkinder nicht, wie vor dem Hintergrund eines reinen Ressourcenverdünnungsmodells zu erwarten wäre, über den Werten der Erstgeborenen aus Zweikindfamilien, sondern eher, wie vor dem Hintergrund des confluence model und dem damit verbundenen Einzelkindhandicap erwartet werden würde, auf der Höhe der Erstgeborenen aus Dreikindfamilien (Mathematik) oder zumindest zwischen den Erstgeborenen aus Zwei- und Dreikindfamilien (Lesen und Naturwissenschaft). In allen drei Kompetenzbereichen erwies sich der Unterschied zwischen den Einzelkindern und den Erstgeborenen aus Zweikindfamilien als signifikant (Lesekompetenz: B-Gewicht = 8.14, p <.05; Mathematik kompetenz: B-Ge

108 106 Effekte der Geschwisterkonstellation auf schulische Kompetenzen hoch Naturwissenschaftskompetenz niedrig Naturwissenschaftskompetenz nach Zahl der Kinder und Geburtsrangplatz des Zielkinds Erst- Einkindfamilien Zweikindfamilien Die regressionsanalytische Überprüfung eines Abfalls der schulischen Kompetenzwerte mit steigender Zahl der Kinder erwies sich für alle drei Kompetenzbereiche als signifikant (Lesekompetenz: Beta-Gewicht =.08, p <.01; Mathematikkompetenz: Beta-Gewicht =.06, p <.01; Naturwissenschaftskompetenz: Beta-Gewicht =.10, p <.01). Eine Überprüfung des kurvilinearen Verlaufs der Kompetenzwerte nach Geburtsrangplatz mittels Regressionsanalysen, die neben einem linearen Term außerdem einen quadrierten Term für den Geburtsrangplatz enthielten, 10 erbrachte dagegen bei Kontrolle der Zahl der Kinder weder für den linearen noch für den quadrierten Term s ignifikante Ergebnisse; dies gilt für alle drei Kompetenzbereiche. In den vor Zweitgeborene/r Dritt- Viert- Dreikindfamilien Vierkindfamilien Abbildung 2.3.4: Naturwissenschaftskompetenz nach Zahl der Kinder und Geburtsrangplatz des Zielkinds (TIMSS 2011) kindfamilien waren dagegen allesamt nicht signifikant, auch nicht im Falle der Lesekompetenz, wo die Erst- und Zweitgeborenen aus Vierkindfamilien vom üblichen Muster abweichend ungewöhnlich hohe Kompetenzwerte aufwiesen. Der prognostizierte mögliche kurvilineare Verlauf nach Geburtsrangplatz ab einer Familiengröße von vier Kindern zeigte sich ebenfalls deskriptiv in allen drei Kompetenzbereichen, auch wenn der Unterschied zwischen den Drittund den Viertgeborenen in keinem der Fälle signifikant wurde. Der erwartete Abfall der Letztgeborenen gegenüber den jeweils vorgeborenen Kindern, der gleichfalls erst ab einer Familiengröße von vier Kindern sichtbar werden sollte, war dagegen in den Daten nicht zu erkennen. liegenden Daten ergaben sich demnach keine signifikanten Effekte des Geburtsrangplatzes über einen Effekt der Zahl der Kinder hinaus. Der durch das confluence model prognostizierte mögliche Wieder anstieg der Werte später Geborener gegenüber mittleren Geburtsrangplätzen, der insbesondere in größeren Familien auftreten sollte, ließ sich somit inferenzstatistisch nicht absichern. Zusammengefasst kann festgehalten werden, dass sich eine höhere Zahl der Kinder, wie durch die Annahme der Ressourcenverdünnung und das confluence model prognostiziert, linear negativ auf die Kompetenzwerte der Zielkinder auswirkte. Der prognostizierte mögliche kurvilineare Verlauf des Geburtsrangplatzes ab einer Familiengröße von vier Kindern zeichnete sich lediglich deskriptiv ab. Mög licherweise wäre ein solcher Effekt deutlicher hervorgetreten, wenn größere Familien in der Stichprobe stärker vertreten gewesen wären. Für einen Abfall der Letztgeborenen gegenüber den Vorgeborenen ergaben sich ebenfalls keine Hinweise. Hierzu ist anzumerken, dass sich ein solcher Abfall der Letztgeborenen auch in den von Zajonc (1976, S. 192) sowie Zajonc und Bargh (1980) berichteten Daten keineswegs durchgängig zeigte. Was sich jedoch in den vorliegenden Daten abzuzeichnen scheint, sind relativ niedrige Werte von Einzelkindern. Diese niedrigen Werte sind mit einem reinen Ressourcenverdünnungsmodell nicht in Einklang zu bringen, denn gemäß diesem müssten Einzelkinder die höchsten Kompetenzwerte aufweisen, da sie in den alleinigen Genuss sämtlicher elterlicher Ressourcen kommen. Das confluence model hingegen postuliert ein Handicap von Einzelkindern, da diese keine jüngeren Geschwister haben, denen gegenüber sie lehrende Verhaltensweisen ausüben können. Ein solches Einzelkindhandicap sollte umso stärker ausgeprägt sein, je höher das Testalter von Kindern ist und der teaching effect Zeit hatte, seine Wirkung zu entfalten. Einschränkend angemerkt werden muss allerdings, dass es für die vorgefundenen niedrigen Werte von Einzelkindern auch alternative Erklärungen geben könnte, die hier nicht geprüft wurden, wie beispielsweise eine häufigere Herkunft aus alleinerziehenden Haushalten, was mit besonderen ökonomischen Härten einhergehen könnte, oder eine schwierige Persönlichkeit der Kinder, welche die Entscheidung für weiteren Nachwuchs verhindert hat (Downey, 2001; Steelman, 1985; Sulloway, 2007). Lernen von älteren versus Lernen durch jüngere Geschwister Die Prüfung der Hypothese, nach der jüngere Geschwister systematisch von älteren Geschwistern profitieren könnten, weil diese effektive Tutoren/Tutorinnen für jüngere Geschwister darstellen, ist im oberen Teil der Tabelle dokumentiert. Entgegen der Annahme wirkte sich das Vorhandensein älterer Geschwister in allen drei Kompetenzbereichen zunächst einmal signifikant negativ aus (vgl. 10 Kurvilineare Zusammenhänge können im regressionsanalytischen Ansatz mittels einfacher und quadrierter Terme geprüft werden (Aiken & West, 1991).

109 Effekte der Geschwisterkonstellation auf schulische Kompetenzen 107 Tabelle oberer Teil, Beta-Gewichte für Modell 1). Da Kinder mit älteren Geschwistern sehr wahrscheinlich häufiger aus größeren Familien stammen als die Referenzgruppe der Kinder ohne ältere Geschwister zu letzteren zählen auch die Einzelkinder und die Zahl der Kinder einen negativen Effekt auf die Kompetenzwerte hat, wurde in einem zweiten Modell die Zahl der Kinder kontrolliert. Die Beta-Gewichte des Modells 2 zeigen, dass sich der Effekt des Vorhandenseins älterer Geschwister durch die Kontrolle der Zahl der Kinder verringerte, allerdings blieb er im Falle der Lese- und der Naturwissenschaftskompetenz signifikant negativ. Die Analysen ergaben somit keine Hinweise darauf, dass jüngeren Geschwistern durch das Vorhandensein älterer Geschwister hinsichtlich schulischer Kompetenzen ein systematischer Vorteil erwächst. Sie scheinen im Gegenteil, auch bei Konstanthaltung der Familiengröße, eher einen Nachteil zu haben. Im unteren Teil der Tabelle ist die Prüfung der gegenteiligen Hypothese dargestellt. Diese besagt, dass älteren Geschwistern durch das Vorhandensein von jüngeren Geschwistern ein systematischer Vorteil erwächst, weil erstere davon profitieren, letzteren etwas beibringen zu können. Die Beta-Gewichte für das Vorhandensein eines jüngeren Geschwisters ohne die Kontrolle der Zahl der Kinder waren für alle drei Kompetenzbereiche niedrig und nur im Falle der Lesekompetenz schwach signifikant positiv (s. Tabelle unterer Teil, Beta-Gewichte für Modell 1). Da Kinder mit jüngeren Geschwistern auch hier eine höhere Wahrscheinlichkeit haben, aus Familien mit einer höheren Zahl an Kindern zu stammen als die Referenzgruppe, wurde wiederum ein zweites Modell unter Kontrolle der Zahl der Kinder berechnet. Bei konstanter Familiengröße erhöhten sich die Effekte für das Vorhandensein eines jüngeren Geschwisters und die entsprechenden Beta-Gewichte waren nun für alle drei Kompetenzbereiche signifikant positiv (s. Tabelle unterer Teil, Beta-Gewichte für Modell 2). Somit kann festgehalten werden, dass sich deutliche Hinweise darauf ergaben, dass Kinder mit jüngeren Geschwistern einen systematischen Vorteil in der Entwicklung ihrer schulischen Kompetenzen haben. Diskussion Die Ergebnisse unterstützen insgesamt einige zentrale Thesen, die vor dem Hintergrund des Erklärungsmodells der Ressourcenverdünnung sowie des confluence model formuliert wurden: Mit zunehmender Zahl der Kinder nahmen die Kompetenzwerte signifikant ab. Der Geburtsrangplatz dagegen hatte keinen signifikanten Effekt über die Zahl der Kinder hinaus, auch wenn sich deskriptiv, insbesondere in größeren Familien, ein kurvilinearer Verlauf der Kompetenzwerte nach Geburtsrangplatz abzeichnete. Wie eingangs beschrieben, hängen gemäß dem confluence model Effekte des Geburtsrangplatzes mit dem Testalter der Kinder zusammen. Negative Effekte des Geburtsrangplatzes wären eher bei höherem Testalter als dem hier vorliegenden zu erwarten, positive Effekte eher bei niedrigerem Testalter (Zajonc, 2001; Zajonc & Bargh, 1980). Gleichzeitig bestätigte sich, dass Kinder mit älteren Geschwistern seltener Hausaufgabenhilfe durch Eltern und Großeltern, häufiger aber von Geschwistern erhielten. Dieses Ergebnis stützt die Annahme des confluence model, nach dem ältere Geschwister lehrende Verhaltensweisen gegenüber ihren jüngeren Geschwistern ausüben. Die Zahl der Kinder wirkte sich ebenfalls in erwarteter Weise auf die Häufigkeit der Hausaufgabenhilfe durch Geschwister aus, nicht aber auf diejenige durch Eltern und Großeltern. Die Annahme der elterlichen Ressourcenverdünnung konnte mit Blick auf die Unterstützung bei Hausübungen somit nicht bestätigt werden. Das Vorhandensein von älteren Geschwistern zeigte keinen positiven, sondern im Gegenteil einen negativen Effekt auf die schulischen Kompetenzen. Dieses Ergebnis schließt keineswegs aus, dass jüngere Geschwister von den älteren lernen. Es bedeutet lediglich, dass jüngeren Geschwistern dadurch kein systematischer Vorteil gegenüber Kindern ohne ältere Geschwister erwächst. Umgekehrt zeigten Kinder mit jüngeren Geschwistern auch bei Konstanthaltung der Familiengröße höhere schulische Kompetenzen im Vergleich zu Kindern ohne jüngere Geschwister. Dieser Befund Lesekompetenz Mathematikkompetenz Naturwissenschaftskompetenz Modell 1 Modell 2 Modell 1 Modell 2 Modell 1 Modell 2 Ältere Geschwister vorhanden.09***.07**.05*.03.08***.04* Zahl der Kinder.05*.05*.08*** R Jüngere Geschwister vorhanden.04*.08***.03.06**.02.07*** Zahl der Kinder.12***.08***.13*** R Legende: *** p <.001; ** p <.01; * p <.05 Tabelle 2.3.1: Betagewichte einfacher und multipler Regressionen der Kompetenzwerte auf Geschwistervariablen (PIRLS & TIMSS 2011)

110 108 Effekte der Geschwisterkonstellation auf schulische Kompetenzen kann durch das im Rahmen des confluence model postulierte Lernen durch Lehren (teaching effect) erklärt werden. Im Unterschied zu Einzelkindern und zu Letztgeborenen haben ältere Geschwister ein jüngeres, dem sie etwas beibringen können. Kindern ohne ein jüngeres Geschwister fehlt diese Lerngelegenheit. Hinweise auf einen teaching effect erbrachte auch die deskriptive Darstellung der Kompetenzwerte nach Zahl der Kinder und dem Geburtsrangplatz: Im Vergleich mit den Erstgeborenen aus Zweikindfamilien wiesen die Einzelkinder signifikant niedrigere schulische Kompetenzwerte auf. Dieses Einzelkindhandicap ist nicht mit den Annahmen eines reinen Ressourcenverdünnungsmodells, aber mit dem durch das confluence model postulierten teaching effect vereinbar. Einzelkindern fehlt das jüngere Geschwister, demgegenüber sie lehrende Verhaltensweisen ausüben könnten. Bereits erwähnt wurde, dass es für dieses Einzelkindhandicap auch alternative Erklärungen geben könnte. Um solche alternativen Erklärungen in Zukunft ausschließen zu können, sollte in nachfolgenden Analysen für Größen kontrolliert werden, welche mit der Zahl der Kinder oder der Geschwisterposition im Zusammenhang stehen könnten. Dazu gehören in erster Linie der sozioökonomische Status der Familie und der Migrationshintergrund, aber auch die Herkunft aus einem alleinerziehenden Haushalt oder einer Stieffamilie sowie die Berufstätigkeit von Müttern. Ohne die kontrollierende Berücksichtigung dieser Größen müssen die hier favorisierten Erklärungen für den Einfluss der Zahl der Kinder und des Einzelkindhandicaps als vorläufig bezeichnet werden. 11 älteren Geschwistern weniger Unterstützung durch Eltern erhielten (vgl. Schmid, 2015). Abschließend bleibt noch anzumerken, dass die Geschwisterkonstellationsvariablen insgesamt nur relativ schwache Zusammenhänge mit den schulischen Kompetenzwerten aufwiesen. Der Anteil an aufgeklärter Varianz lag in den Modellen mit Kontrolle der Zahl der Kinder gerade einmal bei einem Prozent. Allerdings betrug der Unterschied zwischen Kindern ohne und mit älteren Geschwistern bei der Lesekompetenz immerhin 12 Testpunkte ohne die Kontrolle der Zahl der Kinder, und noch 9 Testpunkte mit entsprechender Kontrolle. Der Unterschied zwischen Buben und Mädchen lag in PIRLS 2011 im Vergleich dazu bei nur 8 Testpunkten zugunsten der Mädchen (Suchan, Wallner- Paschon, Bergmüller & Schreiner, 2012). Die Effekte der Geschwisterkonstellation liegen somit etwa in derselben Größenordnung wie der Geschlechtseffekt und sind damit als nicht ganz unerheblich zu bezeichnen. Im Rahmen von Schulleistungsstudien wäre allerdings relativ einfach nachprüfbar, inwieweit schulische Kompetenzvorteile älterer Geschwister tatsächlich dem postulierten teaching effect geschuldet sind. Dazu bedürfte es allerdings der Aufnahme einer weiteren Frage in den Fragebogen: Neben der Frage nach der erhaltenen Hausaufgabenhilfe durch Geschwister und andere Bezugspersonen müsste die Frage gestellt werden, wie häufig die Kinder selbst jüngeren Geschwistern Hausaufgabenhilfe erteilen oder anderen Kindern Nachhilfe geben. Mithilfe der entsprechenden Angaben könnte ein Mediationsmodell berechnet werden, das prüft, inwieweit der gefundene Kompetenzvorsprung älterer Geschwister tatsächlich auf solch lehrende Verhaltensweisen zurückzuführen ist. In einem ähnlichen Modell unter Hinzuziehung der Angaben zur erhaltenen Hausaufgabenhilfe durch Geschwister konnte bereits gezeigt werden, dass sich der Unterschied in der Lesekompetenz in PISA 2000 zwischen Kindern mit und ohne ältere Geschwister durch die geschwisterliche Hausaufgabenhilfe verringerte, die Hausaufgabenhilfe durch ältere Geschwister somit einen positiven Effekt erzielte, der allerdings den negativen Effekt nicht aufwiegen konnte, der sich dadurch ergab, dass Kinder mit 11 Entsprechende Analysen auf der Grundlage der deutschen PISA-Studie 2000 erbrachten auch unter Einbezug der genannten Kontrollgrößen weit gehend vergleichbare Ergebnisse (Schmid, 2015).

111 Effekte der Geschwisterkonstellation auf schulische Kompetenzen 109 Literatur Aiken, L. S. & West, S. G. (1991). Multiple regression. Testing and interpreting interactions. Thousand Oaks, CA: Sage. Azmitia, M. & Hesser, J. (1993). Why siblings are important agents of cognitive development: A comparison of siblings and peers. Child Development, 64, Azmitia, M. & Perlmutter, M. (1989). Social influences on children s cognition: State of the art and future directions. Advances in Child Development and Behaviour, 22, Bargh, J. A. & Shul, Y. (1980). On the cognitive benefit of teaching. Journal of Educational Psychology, 72 (5), Belmont, L. & Marolla, F. (1973). Birth order, family size, and intelligence. A study of a total population of 19-year-old men born in Netherlands is presented. Science, 182, Black, S. E., Devereux, P. J. & Salvanes, K. G. (2005). The more the merrier? The effect of family size and birth order on children s education. The Quarterly Journal of Economics, 120 (2), Blake, J. (1989). Family size and achievement. Los Angeles: University of California Press. Booth, A. L. & Kee, H. J. (2009). Birth order matters: The effect of family size and birth order on educational attainment. Journal of Population Economics, 22, Cicirelli, V. G. (1972). The effect of sibling relationship on concept learning of young children taught by childteachers. Child Development, 43, Cicirelli, V. G. (1974). Relationship of sibling structure and interaction to younger sib s cenceptual style. The Journal of Genetic Psychology, 125, Cicirelli, V. G. (1975). Effects of mother and older sibling on the problemsolving behavior of the younger child. Developmental Psychology, 11 (6), Cicirelli, V. G. (1976). Motherchild and sibling-sibling interactions on a problem solving task. Child Development, 47, Downey, D. B. (2001). Number of siblings and intellectual development. The resource dilution explanation. American Psychologist, 56 (6/7), Ernst, C. & Angst, J. (1983). Birth order: Its influence on personality. Berlin: Springer. Hertwig, R., Davis, J. N. & Sulloway, F. J. (2002). Parental investment: How an equity motive can produce inequality. Psychological Bulletin, 128 (5), Kagan, S. (1992). Cooperative learning. San Juan Capistrano, CA: Resources for Teacher. Kanazawa, S. (2012). Intelligence, birth order, and family size. Personality and Social Psychology Bulletin, 38 (9), Kasten, H. (1993). Die Geschwisterbeziehung. Göttingen: Hogrefe. Liegle, L. (2006). Bildung und Erziehung in früher Kindheit. Stuttgart: Kohlhammer. McGillicuddy-De Lisi, A. V. (1993). Sibling interactions and children s communicative competency. Journal of Applied Developmental Psychology, 14, Muthén, L. K. & Muthén, B. O. ( ). Mplus User s Guide. Seventh Edition. Los Angeles, CA: Muthén & Muthén. Retherford, R. D. & Sewell, W. H. (1991). Birth order and intelligence: Further tests of the confluence model. American Sociological Review, 56 (2),

112 110 Effekte der Geschwisterkonstellation auf schulische Kompetenzen Rodgers, J. L., Cleveland, H. H., van den Oord, E. & Rowe, D. C. (2000). Resolving the debate over birth order, family size, and intelligence. American Psychologist, 55 (6), Rogoff, B. (1990). Apprenticeship in thinking. Cognitive development in social context. New York NY: Oxford University Press. Schmid, C. (2015). Lernen von älteren oder Lernen durch jüngere Geschwister? Effekte der Geschwisterkonstellation auf die Lesekompetenz und Hausaufgabenhilfe in PISA Zeitschrift für Erziehungswissenschaft 18, 3, Schooler, C. (1972). Birth order effects: Not here not now! Psychological Bulletin, 78, Steelman, L. C. (1985). A tale of two variables: A review of the intellectual consequences of sibship size and birth order. Review of Educational Research, 55 (3), Suchan, B., Wallner-Paschon, C., Bergmüller, S. & Schreiner, C. (Hrsg.). (2012). PIRLS & TIMSS Schülerleistungen in Lesen, Mathematik und Naturwissenschaft in der Grundschule. Erste Ergebnisse. Graz: Leykam. Sulloway, F. J. (2007). Psychology. Birth order and intelligence. Science, 316 (5832), Taubmann, P. & Behrmann, J. R. (1986). Effects of number and position of siblings on child and adult outcomes. Social Biology, 33, Vygotsky, L. S. (1978). Mind in society: The development of higher psychological processes. Cambridge, MA: Havard University Press. Zajonc, R. B. (1976). Familiy configuration and intelligence. Science, 192 (4236), Zajonc, R. B. (1983). Validating the confluence model. Pschological Bulletin, 95 (3), Zajonc, R. B. (2001). The family dynamics of intellectual development. American Psychologist, 56 (6/7), Zajonc, R. B. & Bargh, J. (1980). The confluence model: parameter estimation for six divergent data sets on family factors and intelligence. Intelligence, 4, Zajonc, R. B. & Markus, G. B. (1975). Birth order and intellectual development. Psychological Review, 82 (1), Zajonc, R. B. & Mullally, P. R. (1997). Birth order: Reconciling conflicting effects. American Psychologist, 52 (7), Zajonc, R. B. & Sulloway, F. J. (2007). The confluence model: Birth order as a within-family or between-family dynamic? Personality and Social Psychology Bulletin, 33 (9),

113 III. Unterricht in Lesen, Mathematik & Naturwissenschaft an Österreichs Volksschulen

114

115 Hausaufgaben und deren Bedeutung für die Mathematik- und Leseleistung Hausaufgaben und deren Bedeutung für die Mathematik- und Leseleistung Gerda Hagenauer & Konrad Oberwimmer Die Effektivität von Hausaufgaben für die Leistung der Schüler/innen ist nach wie vor nicht eindeutig geklärt, weshalb diese Beziehung im Fokus des folgenden Beitrags steht. Im ersten Abschnitt wird die Hausaufgabenpraxis in Lesen und Mathematik unter deskriptiven Gesichtspunkten beschrieben. Im zweiten Abschnitt wird ein Modell zur Erklärung bzw. Vorhersage der Mathematik- und Leseleistung durch die Hausaufgabenpraxis geprüft. In der schulischen Praxis wird von Lehrkräften, Eltern und auch Schülerinnen und Schülern der Wert von Hausaufgaben für die schulische Leistung selten in Frage gestellt. Unter Hausaufgaben werden dabei solche Aufgaben verstanden, die vom Lehrer den Schülern zugewiesen werden und die von den Schülern außerhalb der Schule bearbeitet werden sollen (Mischo & Haag, 2006, S. 226; in Anlehnung an Trautwein und Köller, 2003a). In ganztägigen Schulformen liegt häufig eine in den Ganztagsbetrieb integrierte Hausaufgabenpraxis (Hascher & Bischof, 2000) vor. Es herrscht die gängige Überzeugung, dass bei Hausaufgaben durch die Wiederholung des Lernstoffs die Inhalte memorierend gefestigt und die Anwendung von Regeln bzw. Algorithmen geübt werden, was wiederum eine Leistungssteigerung nach sich ziehen sollte. Nach Ansicht der (meisten) Lehrkräfte stellen Hausaufgaben somit ein didaktisches Werkzeug zur Förderung schulischen Lernens dar (z. B. Trautwein, Niggli, Schnyder & Lüdtke, 2009). In der empirischen Bildungsforschung wird die Sinnhaftigkeit von Hausauf gaben allerdings kontrovers diskutiert (Trautwein & Köller, 2003a). Ein klar positiver Effekt von Hausaufgaben auf die schulische Leistung konnte in einer Zusammenschau unterschiedlichster Studien im deutschsprachigen Raum bisher nicht belegt werden (Trautwein, Schnyder, Niggli, Neumann & Lüdtke, 2009). Insbesondere im Grundschulalter ist der Link Hausaufgaben Leistung noch überwiegend ungeklärt, da sich bisher nur wenige Studien dieser Altersstufe gewidmet haben (Roßbach, 1995). Es besteht allerdings nicht nur Zweifel an der Effektivität von Hausaufgaben bezüglich der Schulleistung, die Hausaufgabenpraxis wurde ebenfalls im Hinblick auf die mit ihr einhergehende Belastung kritisch diskutiert (Spiel, Wagner & Fellner, 2002; Wagner, Hirten lehner, Bacher & Schober, 2010). Müssen Schüler/innen zu viele oder zu schwierige Hausaufgaben erledigen, steigt die Belastung durch die außerschulische Arbeit und negative Folgeeffekte sind sehr wahrscheinlich, z. B. das Erleben von negativen Emotionen oder auch die Beeinträchtigung der Eltern-Kind-Beziehung durch mögliche auftretende Konflikte bei der Hausaufgabener ledigung (z. B. bei einer mangelnden Arbeitsbereitschaft des Kinds; Xu & Corno, 1998). Somit können Hausaufgaben nicht nur zu Belastungen auf Schülerseite, sondern auch zu zeitlichen und emotionalen Belastungen der Eltern führen (Jäger, Stuck, Jäger-Flor & Riebel, 2010). Hausaufgaben als Mittel der Lernförderung bzw. Lernunterstützung sind folglich nur dann zu rechtfertigen, wenn diese tatsächlich zum gewünschten Lernerfolg führen, und dabei auch das Wohlbefinden aller Beteiligten, insbesondere jenes der Schüler/innen, nicht beeinträchtigt wird. Mit der Bedeutung von Hausaufgaben für die schulische Leistung befasst sich der folgende Beitrag. Nach einer deskriptiven Darstellung der Hausaufgabenpraxis in Lesen (PIRLS) und Mathematik (TIMSS) am Ende der Grundschulzeit in Österreich wird ein Modell aufgestellt, das mithilfe von Variablen der Hausaufgabenpraxis Teile der schulischen Leistung in Lesen und Mathematik zu erklären versucht. Die Hausaufgabenpraxis Im österreichischen Schulorganisationsgesetz (SchOG 17/2) wird die Vergabe von Hausaufgaben nur grob geregelt. Als Ziel von Hausaufgaben wird neben der Erziehung zur Selbstständigkeit (durch den Erwerb von Selbstregulation) die Vertiefung und Wiederholung des Gelernten angeführt. Dabei zählen Hausaufgaben zu den Mitarbeitsleistungen, sie sollen an die Belastbarkeit der Schüler/ innen angepasst werden, ihre Erledigung soll ohne fremde Hilfe gelingen und über die Art der Kontrolle dürfen Lehrpersonen frei entscheiden. Wie sich die Hausaufgabenpraxis auf Grundlage dieser relativ weit gefassten Regelung nun tatsächlich an österreichischen Grundschulen gestaltet, darauf soll im folgenden Abschnitt unter Bezugnahme auf Schüler-, Lehrer- und auch Elterneinschätzungen näher eingegangen werden. Diese Darstellung bezieht auch die aktuelle empirische Befundlage der Hausaufgabenforschung mit ein.

116 114 Hausaufgaben und deren Bedeutung für die Mathematik- und Leseleistung Dauer und Häufigkeit von Hausaufgaben in Lesen und Mathematik Bisherige Studien zeigen auf, dass für die Erzielung eines positiven Effekts der Hausaufgaben auf die Leistung weniger die Dauer der Erledigung, als vielmehr die Regel mäßigkeit der Hausaufgabenvergabe entscheidend ist (z. B. Lipowsky et al., 2004; Trautwein, Köller & Baumert, 2001 für Sekundarschüler/innen im Fach Mathematik). Die Hausaufgabendauer steht häufig negativ mit der schulischen Leistung in Verbindung. Dies ist insofern erwartungsgemäß, als zumeist leistungsschwächere Schüler/innen auch längere Zeit für die Hausaufgabenerledigung benötigen (De Jong et al., 2000; Trautwein, 2007). In PIRLS und TIMSS wurden sowohl Lehrpersonen als auch Schüler/innen zur Häufigkeit und Dauer der Hausaufgaben befragt. Abbildung vergleicht die Angaben der Schüler/innen und der Lehrpersonen zu diesen beiden Merkmalen. Bezüglich der Häufigkeit der Hausaufgaben geben über 80 % der Schüler/innen an, jeden oder fast jeden Tag Hausaufgaben in Mathematik zu erledigen. Ebenso viele Schüler/innen haben eine Lehrkraft, die diese Häufigkeit von Hausaufgaben nennt. Etwas weniger häufig kommen Lesehausaufgaben vor, aber auch diese werden mehrmals wöchentlich aufgegeben/erledigt. Nur etwa 1 % der Schüler/innen geben an, nie Mathematikhausaufgaben zu bearbeiten. Etwa so viele haben einen Lehrer/eine Lehrerin, der oder die nie Mathematikhausaufgaben vergibt. Hingegen wird ein Lesehausaufgaben-Verzicht von 7,5 % der Schüler/ innen berichtet, während nur 0,5 % von einer Lehrkraft unterrichtet werden, die angibt, nie Lesehausaufgaben zu vergeben. Diese Diskrepanz in den Antworthäufigkeiten von Schülerinnen und Schülern und Lehrkräften kann mit den vorliegenden Daten nicht geklärt werden. Es geht jedoch sowohl aus den Schülerangaben als auch aus den Lehrkräfteangaben klar hervor, dass Hausaufgaben einen integralen Bestandteil der schulischen Unterrichtspraxis darstellen. Während Schüler/innen und Lehrpersonen die Frage nach der Dauer der Hausaufgaben getrennt nach Lesen und Mathematik beantworteten, gaben die Eltern eine generelle Einschätzung der gesamten aufgewendeten Zeit für Hausaufgaben pro Tag ab. Der Großteil der Kinder in der 4. Klasse Grundschule benötigt nach Elternangaben zwischen 30 und 60 Minuten für die Erledigung der Hausaufgaben (46,4 %). 33,7 % der Kinder verbringen zwischen einer Viertel- und einer halben Stunde mit Hausaufgaben, weitere 4,6 % benötigen rund eine Viertelstunde. Lediglich 1,4 % der Eltern geben an, dass das Kind keine Hausaufgaben bekommt. Immerhin 13,8 % der Kinder benötigen täglich über eine Stunde für das Erledigen der Hausauf gaben. Die getrennte Bearbeitungsdauer von Lese- und Mathematikhausaufgaben aus Lehrpersonen- und Schülersicht ist in Abbildung dargestellt. Hier wird zum einen deutlich, dass die Mathematikhausaufgaben im Schnitt länger dauern als die Lesehausaufgaben, und zum anderen, dass die Lehrpersonen die Dauer der Hausaufgaben etwas höher einschätzen als die Schüler/innen. So geben beispielsweise 31,4 % der Schüler/innen an, die Mathematikhausaufgaben innerhalb von 15 Minuten lösen zu können, während im Vergleich nur 6,5 % einen Lehrer/eine Lehrerin haben, der oder die von diesem kurzen Zeitfenster ausgeht. Die höhere Einschätzung der Hausaufgabendauer durch die Lehrpersonen steht im Widerspruch zu bisherigen Befunden, die tendenziell eher gezeigt haben, dass Lehrpersonen die Dauer der Hausaufgaben unterschätzen, wobei sich diese Vergleichsbefunde überwiegend auf den Sekundarstufenbereich beziehen (im Überblick, siehe Spiel et al., 2002) Die Daten spiegeln demnach eine große zeitliche Streuung im Hinblick auf die Hausaufgabenbearbeitung wider. Dies zeigte sich auch in der von Spiel et al. (2002) durchgeführten Studie an Schülerinnen und Schülern der 3. Klasse Grundschule, in der sich eine Variation von 0,75 bis 11,25 Stunden Arbeitszeit pro Woche für die Schule (Hausaufgaben- und Übungszeit) aus den Angaben der Drittklässler errechnete. Häufigkeit der Hausaufgaben S/S: Lesen LP: Lesen S/S: Mathematik LP: Mathematik % 20 % 40 % 60 % 80 % 100 % jeden oder fast jeden Tag 1- bis 2-mal die Woche weniger als 1-mal die Woche nie Abbildung 3.1.1: Häufigkeit von Lese- und Mathematikhausaufgaben aus Schüler/innen (S/S)- und Lehrpersonensicht (LP) (PIRLS & TIMSS 2011)

117 Hausaufgaben und deren Bedeutung für die Mathematik- und Leseleistung 115 Werden die Häufigkeit und die Dauer der Hausaufgaben nun in einem weiteren Schritt klassenspezifisch betrachtet, d. h., werden die Angaben der Lehrkraft direkt mit den Angaben der eigenen Schüler/innen gefasst als Median ihrer Angaben verglichen, so bestätigt sich das eben berichtete Bild: Die Häufigkeit von Lese hausaufgaben (siehe Abbildung 3.1.3) und die Dauer von Mathematikhausaufgaben (siehe Abbildung 3.1.4) wird von Lehrkräften höher eingeschätzt als von ihren eigenen Schüler/innen. Es zeigen sich demnach auch im internen Klassen vergleich Unterschiede in den Einschätzungen. Ein wesentlicher Faktor, der die Bearbeitungszeit von Hausaufgaben beeinflusst, ist das Kompetenzniveau der Schüler/ innen. Die Daten aus PIRLS und TIMSS belegen, dass Schüler/innen auf den unteren Kompetenzstufen deutlich länger für das Erledigen von Mathematik- und Lesehausaufgaben benötigen als Schüler/innen auf den höheren Kompetenzstufen, wodurch sich auch hier die in empirischen Studien vielfach belegte negative Beziehung auf Schülerebene zwischen Hausaufgabendauer und Leistungsstärke bestätigen lässt (im Überblick, siehe z. B. Trautwein & Köller, 2003a). Leistungsschwache Schüler/innen stellen Dauer der Hausaufgaben S/S: Lesen LP: Lesen S/S: Mathematik LP: Mathematik % 20 % 40 % 60 % 80 % 100 % über 60 Minuten Minuten Minuten bis zu 15 Minuten Abbildung 3.1.2: Dauer von Lese- und Mathematikhausaufgaben aus Schüler/innen (S/S)- und Lehrpersonensicht (LP) (PIRLS & TIMSS 2011) Gegenüberstellung Lehrperson und Klasse (Median): Häufigkeit Hausaufgaben Lesen Mathematik % 20 % 40 % 60 % 80 % 100 % Lehrer kürzer als Klassenmedian gleiche Einschätzung Lehrer länger als Klassenmedian Abbildung 3.1.3: Einschätzung der Hausaufgabenhäufigkeit aus der Sicht der Klassenlehrperson im Vergleich zu den eigenen Schülerinnen und Schülern (PIRLS & TIMSS 2011) Gegenüberstellung Lehrperson und Klasse (Median): Dauer Hausaufgaben Lesen Mathematik % 20 % 40 % 60 % 80 % 100 % Lehrer kürzer als Klassenmedian gleiche Einschätzung Lehrer länger als Klassenmedian Abbildung 3.1.4: Einschätzung der Hausaufgabendauer aus der Sicht der Klassenlehrperson im Vergleich zu den eigenen Schülerinnen und Schülern (PIRLS & TIMSS 2011)

118 116 Hausaufgaben und deren Bedeutung für die Mathematik- und Leseleistung somit eine gefährdete Gruppe bezüglich einer zeitlichen Beund möglicherweise ebenso Überlastung ausgelöst durch die gängige Hausaufgabenpraxis dar. Die Unterschiede sind dabei besonders stark im Bereich Lesen ausgeprägt: 85,5 % der leistungsstarken Schüler/innen geben an, weniger als 15 Minuten für die Lesehausaufgaben zu benötigen, während von dieser kurzen Bearbeitungsdauer lediglich 49,8 % der Risikoschüler/innen berichten (Kompetenzstufe < 1). In Mathematik sind die leistungsschwachen Schüler/innen insbesondere durch eine lange Hausaufgabenzeit von über einer Stunde betroffen (12,7 % im Vergleich zu 0 % der Spitzenschüler/innen). Die exakten Unterschiede in Prozent sind Abbildung für die Lesehausaufgabendauer und Abbildung für die Mathematikhausaufgabendauer zu entnehmen. Unterstützung bei den Hausaufgaben Entsprechend dem Schulorganisationsgesetz sollten Hausaufgaben so vergeben werden, dass diese selbstständig von den Schülerinnen und Schülern gelöst werden können. Angaben aus PIRLS und TIMSS 2011 zur häuslichen Unterstützung bei den Hausaufgaben zeigen jedoch klar, dass Hausaufgaben sehr häufig nicht alleine, sondern mit Unterstützung gemacht werden. Diese Unterstützungsleistung ist in Mathematik häufiger vorzufinden als in Lesen. Während die Eltern in 43,2 % der Fälle angeben, dass das Kind keine Hilfe bei den Leseaufgaben benötigt, kommen bei den Mathematikhausaufgaben im Vergleich nur 21,7 % der Schüler/innen ohne elterliche Hilfe aus. Die Mutter ist dabei die zentrale Bezugsperson, die am häufigsten um Hilfe gefragt wird: 43 % der Kinder wenden sich bei Leseauf- Zeitliche Beanspruchung durch Lesehausaufgaben nach Kompetenz < Stufe Stufe Stufe Stufe Stufe % 20 % 40 % 60 % 80 % 100 % über 60 Minuten Minuten Minuten bis zu 15 Minuten Abbildung 3.1.5: Schüler/innen unterschiedlicher Kompetenzniveaus in Lesen und benötigte Zeit für Lesehausaufgaben (PIRLS & TIMSS 2011) Zeitliche Beanspruchung durch Mathematikhausaufgaben nach Kompetenz < Stufe Stufe Stufe Stufe Stufe % 20 % 40 % 60 % 80 % 100 % über 60 Minuten Minuten Minuten bis zu 15 Minuten Abbildung 3.1.6: Schüler/innen unterschiedlicher Kompetenzniveaus in Mathematik und benötigte Zeit für Mathematikhausaufgaben (PIRLS & TIMSS 2011)

119 Hausaufgaben und deren Bedeutung für die Mathematik- und Leseleistung 117 gaben und 52,4 % bei den Mathematikhausaufgaben an die Mutter. Der Vater wird bei den Mathematikhausaufgaben stärker zu Rate gezogen (13 %) als bei den Lesehausaufgaben (3 %). Neben den Eltern spielen auch institutionelle Nachmittagsbetreuungen eine Rolle bei der Hausaufgabenunterstützung (5 6 %). Die Unterstützungsleistung der Eltern ist nicht per se als positiv für die Leistungsentwicklung der Kinder zu beurteilen. Vielmehr ist deren Effektivität von der Qualität der gewährleisteten Unterstützung abhängig. Studien konnten belegen, dass kontrollierendes, produktorientiertes (lösungsorientiertes) und bewertendes Verhalten der Eltern von den Kindern als wenig unterstützend erlebt wird und die Hausaufgabenmotivation und infolge auch die Leistung negativ beeinflussen kann (Cooper, Lindsay & Nye, 2000; Mischo & Haag, 2006; Pomerantz & Eaton, 2001; Pomerantz, Wang & Ng, 2005; Wild & Gerber, 2007). Dieser negative Effekt kann durch die Selbstbestimmungstheorie der Motivation (Deci & Ryan, 1993) erklärt werden. Diese postuliert, dass autonome Lernumgebungen, in denen die drei grundlegenden Bedürfnisse nach Autonomie, sozialer Eingebundenheit und Kompetenz erfüllt werden, die Basis für das Entstehen von (Lern-)Motivation und infolge auch für die Leistung bilden. Den Eltern wurden bei PIRLS und TIMSS sieben Fragen zu ihrem Unterstützungsverhalten gestellt. Diese Verhaltensweisen werden im Folgenden deskriptiv dargestellt. Ob diese Unterstützungsleistung von den Kindern als (negativ) kontrollierend oder (positiv) begleitend/unterstützend erlebt wurde, kann aus den vorliegenden Daten jedoch nicht beantwortet werden. Abbildung zeigt, dass sich Eltern sehr häufig für die Hausaufgaben der Kinder interessieren und sich um eine gewissenhafte Erledigung kümmern. So geben immerhin zwischen 70 und 80 % der Eltern an, dass sie täglich oder fast Besprechen, was für die Schule zu tun ist Darauf achten, dass das Kind sich Zeit für Hausaufgaben nimmt Überprüfen, ob die Hausaufgaben gemacht wurden Mein Kind fragen, was es in der Schule gemacht hat Meinem Kind bei Schulaufgaben helfen Mit meinem Kind Lesen üben Mit meinem Kind Mathematik üben täglich die Hausaufgabenerledigung kontrollieren. Weiters achten sie darauf, dass sich das Kind Zeit für die Hausaufgaben nimmt, sowie zeigen ebenso daran Interesse, was das Kind in der Schule macht und was zu Hause für die Schule zu erledigen ist. Etwas weniger häufig werden die Kinder auch tatsächlich bei der Hausaufgabenerledigung unterstützt (47,3 % geben an, dies täglich/fast täglich zu tun) und am wenigsten oft wird mit dem Kind gemeinsam Lesen oder Mathematik geübt. Die hohe häusliche Unterstützung ist im Allgemeinen bezeichnend für das Grundschulalter, während diese im Sekundarschulalter abnimmt. Gründe hierfür könnten die erhöhte Selbstständigkeit der Schüler/ innen oder auch ein Anstieg der Komplexität des Lernstoffs bzw. der Aufgaben sein (siehe z. B. Jäger et al., 2010). Hausaufgabenpraxis in der Schule Nicht nur die Qualität der elterlichen Unterstützung spielt eine Rolle für die Effektivität der Hausaufgaben, sondern auch die Qualität der Hausaufgabenpraxis in der Schule. Didaktische Professionalität bezogen auf die Hausaufgabengestaltung lässt sich entsprechend empirischen Erkenntnissen durch einen differenzierten Einsatz von Hausaufgaben im Unterricht verbunden mit einem entsprechenden Monitoring und hoher Kompetenz in der kognitiv aktivierenden und motivierenden Aufgabenauswahl beschreiben (z. B. Dettmer, Trautwein & Lüdtke, 2009; Hascher & Hofmann, 2011). In PIRLS und TIMSS liegen Daten zur Individualisierung der Hausaufgabenvergabe und zur Kontrolle der Hausaufgabenerledigung vor. Die Daten lassen jedoch keine Rückschlüsse auf die Aufgabenqualität zu. Hausaufgabenvergabe In Österreichs Grundschulklassen haben Lehrkräfte eine heterogene Schülerschaft zu unterrichten. Um dieser Hetero - Elterliche Unterstützung % 20 % 40 % 60 % 80 % 100 % jeden oder fast jeden Tag 1- bis 2-mal die Woche 1- bis 2-mal im Monat nie oder fast nie Abbildung 3.1.7: Häusliche Unterstützung bei Hausaufgaben (Angaben der Eltern) (PIRLS & TIMSS 2011)

120 118 Hausaufgaben und deren Bedeutung für die Mathematik- und Leseleistung genität bestmöglich gerecht zu werden und Schüler innen und Schülern eine optimale Förderung zukommen zu lassen, wird als didaktisches Werkzeug die Individualisierung des Unterrichts und infolge auch die Individualisierung der Hausaufgabenpraxis empfohlen. Nach Grasedieck (2009) kann Individualisierung auf verschiedenen Ebenen ansetzen, z. B. Individualisierung unter Berücksichtigung des Interesses, der Lernmuster oder auch des Lerntempos. Bezugnehmend auf das Lerntempo sollte beispielsweise dem Umstand Rechnung getragen werden, dass leistungsschwächere Schüler/innen deutlich länger für die Erledigung von Hausaufgaben brauchen. Daher sollte auch die Länge der Hausaufgaben entsprechend individualisiert werden. Wesent lich hierbei ist jedoch, dass auch leistungsschwächere Schüler/ innen das mit den Hausaufgaben verbundene Lernziel erreichen können. Diese Form der individualisierten Hausaufgabenvergabe, die die Leistungsstärke der Schüler/innen berücksichtigt, wurde in PIRLS und TIMSS erfasst. Ähnlich, wie die Befunde von Hascher und Hofmann (2008; 2011) sowie von Schnyder et al. (2008) im Sekundarschulbereich zeigen, berichten auch die Grundschullehrer/innen selten von einer individualisierten Hausaufgabenvergabe: 75,2 % der Schüler/innen in Lesen und 82,3 % der Schüler/innen in Mathematik werden von einer Lehrkraft unterrichtet, welche die gleiche Hausaufgabe für alle Kinder einer Klasse standardmäßig einsetzt. In einzelnen Fällen wird bei der Hausaufgabenvergabe nach Leistungsstärke differenziert. Leistungsschwache Schüler/innen bekommen dann zumeist weniger Hausaufgaben, was zu einer zeitlichen Entlastung führen soll, oder andere Aufgaben, um eine möglichst optimale Passung zum Kompetenzniveau zu erzielen. Leistungsschwachen Schülerinnen und Schülern mehr Hausaufgaben zu erteilen, wird im schulischen Alltag entsprechend den Angaben der Lehrkräfte fast nie oder nur sehr selten realisiert. In den Fällen, in denen die Lehrkräfte die individualisierte Hausaufgabenpraxis einsetzen, orientieren sie sich demnach überwiegend am wünschenswerten pädagogischen Förderprinzip (= individuelle Hausaufgabe je nach Leistungsstand; Vermeidung Individualisierung der Lesehausaufgaben Die gleiche HA für alle S/S Schwache S/S weniger HA Schwache S/S mehr HA Schwache S/S eine individuelle HA % 20 % 40 % 60 % 80 % 100 % immer oder fast immer manchmal nie oder fast nie Abbildung 3.1.8: Häufigkeit der Vergabe von individualisierten Lesehausaufgaben in Abhängigkeit vom Leistungsniveau der Schüler/innen (S/S) (Angaben der Lehrkraft) (PIRLS & TIMSS 2011) Individualisierung der Mathematikhausaufgaben Die gleiche HA für alle S/S Schwache S/S weniger HA Schwache S/S mehr HA Schwache S/S eine individuelle HA % 20 % 40 % 60 % 80 % 100 % immer oder fast immer manchmal nie oder fast nie Abbildung 3.1.9: Häufigkeit der Vergabe von individualisierten Mathematikhausaufgaben in Abhängigkeit vom Leistungsniveau der Schüler/innen (S/S) (Angaben der Lehrkraft) (PIRLS & TIMSS 2011)

121 Hausaufgaben und deren Bedeutung für die Mathematik- und Leseleistung 119 von Überforderung) (siehe Abbildung und Abbildung 3.1.9). Hausaufgabenkontrolle Es ist davon auszugehen, dass Hausaufgaben, die nicht kontrolliert werden, entweder keinen Effekt oder womöglich sogar einen negativen Effekt im Hinblick auf die Leistungsentwicklung der Schüler/innen bewirken, da Fehlkonzepte, Missverständnisse, Fehler oder Schwächen nicht aufgedeckt und daher auch nicht bearbeitet werden können. Die Hausaufgabenkontrolle ist demnach ein wesentlicher Bestandteil qualitätsvoller Hausaufgabenpraxis. Aber auch in der Schule ist die Hausaufgabenkontrolle nicht per se ein leistungsfördernder Indikator, sondern sie muss im Hinblick auf ihre Qualität, d. h. auf die Art der Umsetzung diskutiert werden. So konnten bisherige Studien zur Hausaufgabenkontrolle in der Schule ähnlich wie im Elternhaus belegen, dass die Wahrnehmung der Hausaufgabenkontrolle durch die Schüler/innen (kontrollierend vs. unterstützend) eine entscheidende Rolle spielt, ob sich diese positiv oder negativ für die schulische Leistung erweist (z. B. Trautwein, Niggli, Schnyder & Lüdtke, 2009). In PIRLS und TIMSS haben die Lehrkräfte Angaben zur Hausaufgabenkontrolle gemacht. Sie wurden zum einen gefragt, ob sie Hausaufgaben auf deren Vollständigkeit kontrollieren, zum anderen, ob sie diese auch korrigieren und rückmelden bzw. in der Klasse besprechen. Die Abbildungen und illustrieren, dass die Hausaufgabenkontrolle sehr hoch ausgeprägt ist. Beinahe alle Schüler/innen (98,6 % in Mathematik und 89,9 % in Lesen) haben einen Lehrer/eine Lehrerin, der oder die kontrolliert, ob die Hausaufgaben vollständig erledigt wurden. Auch die Hausaufgabenkorrektur und -rückmeldung wird in Mathematik fast immer (96,3 %) und in Lesen in den überwiegenden Fällen (75,8 %) vorgenommen. Weniger häufig, aber immer noch regelmäßig werden Hausauf gaben in der Klasse gemeinsam (d. h. ohne Differenzierung) besprochen. Zusammenfassend spiegeln die Daten also ein hohes Hausaufgabenmonitoring in Österreichs Grundschulklassen wider. Es kann allerdings auch hier keine Aussage darüber getroffen werden, wie dieses Monitoring von den Schülerinnen und Schülern wahrgenommen wird ( kontrollierend vs. unterstützend ). Hausaufgabenmonitoring in Lesen Korrigieren und Rückmeldung geben Hausaufgaben in der Klasse besprechen Kontrollieren, ob Hausaufgaben vollständig erledigt % 20 % 40 % 60 % 80 % 100 % immer oder fast immer manchmal nie oder fast nie Abbildung : Art der Hausaufgabenüberprüfung in Lesen durch die Lehrkraft (Angaben der Lehrkraft) (PIRLS & TIMSS 2011) Hausaufgabenmonitoring in Mathematik Korrigieren und Rückmeldung geben 96.3 Hausaufgaben in der Klasse besprechen Kontrollieren, ob Hausaufgaben vollständig erledigt % 20 % 40 % 60 % 80 % 100 % immer oder fast immer manchmal nie oder fast nie Abbildung : Art der Hausaufgabenüberprüfung in Mathematik durch die Lehrkraft (Angaben der Lehrkraft) (PIRLS & TIMSS 2011)

122 120 Hausaufgaben und deren Bedeutung für die Mathematik- und Leseleistung Vorhersage der Lese- und Mathematikleistung durch die Hausaufgabenpraxis Bisher wurde die Hausaufgabenpraxis vornehmlich deskriptiv behandelt. Im Zuge dieser Analysen wurde der überwiegende Anteil an Indikatoren, die im folgenden Modell zur Erklärung, wie sehr die Schulleistung von der Hausaufgabenpraxis beeinflusst wird, bereits erläutert und in den Kontext der aktuellen Befundlage der Hausaufgabenforschung gesetzt. Im folgenden Abschnitt wird ein Modell zur Vorhersage der Leistung in Lesen und Mathematik abgeleitet und berechnet. Dabei wird der Forderung von Trautwein und Kolleginnen und Kollegen (z. B. 2009) nach Berücksichtigung der hierarchischen Struktur der Daten Rechnung getragen, indem Mehrebenenmodelle mit Prädiktoren auf Schülerebene (Level 1) und Klassenebene (Level 2) berechnet werden. Die Intraclasscorrelation beträgt.13 für Lesen und.20 für Mathematik, weshalb es notwendig und sinnvoll erscheint, mehrebenenanalytisch vorzugehen und Indikatoren ebenso auf der Klassenebene zu berücksichtigen. Modellspezifikation Die Mehrebenenmodelle sind als Random-Intercept- Modelle spezifiziert. Das bedeutet, dass zu individuellen Einflussfaktoren auf die Lese- bzw. Mathematikleistung (= Level 1: bspw. Lernressourcen im Elternhaus, Geschlecht oder Dauer der Hausaufgabenerledigung) ein unterschied licher Grundwert pro Klasse geschätzt wird, der von Faktoren auf Klassenebene abhängt (= Level 2: bspw. Schulstandort, Häufigkeit von Hausübungen in der Klasse oder individualisierender Umgang mit Hausübungen durch die Lehrkraft). Eine mögliche unterschiedliche Bedeutsamkeit der Faktoren der individuellen Ebene in verschiedenen Klassen wurde nicht modelliert. Die Modelle folgen einem schrittweisen Aufbau, der in Tabelle dargestellt ist. Modell 1 beinhaltet lediglich Kontrollvariablen auf individueller und Klassenebene, die nach bisherigen Untersuchungen vermutlich einen Einfluss auf die Lese- bzw. Mathematikleistung zeigen. In Modell 2 werden Variablen eingeführt, welche sich auf die individuelle Hausaufgabenpraxis und das elterliche Monitoring beziehen. Modell 3 ergänzt die Prädiktoren auf Klassenebene um die durchschnittliche Häufigkeit und Dauer der Hausauf gaben in der Klasse sowie das Monitoring und den differenzierenden Umgang mit Hausaufgaben durch die Lehrperson. Die Ergebnisse in Tabelle beschreiben unstandardisierte lineare Koeffizienten (Standardfehler und Signifikanz in Klammern). Diese sind so zu lesen, dass mit der Veränderung der Prädiktorvariablen um eine Einheit eine geschätzte Veränderung des Lese- oder Mathematikleistungswerts (auf individueller oder Klassenebene) um eine dem Koeffizienten entsprechende Anzahl an Einheiten einhergeht. Um diese Koeffizienten in Effektstärken interpretieren zu können, ist es notwendig zu beachten, ob es sich um Dummy-Variablen für Gruppenunterschiede handelt bzw. auf welchen Standardabweichungen die stetigen Variablen beruhen. Tabelle gibt darüber Auskunft. Fehlende Werte wurden nicht ersetzt, sondern listenweise ausgeschlossen. Im vollständigen Modell 3 mit allen Variablen befinden sich bei PIRLS noch 3600 Fälle (77 % der Stichprobe) und bei TIMSS 3548 Fälle (76 % der Stichprobe). Keine der in den Modellen verwendeten Variablen weist für sich genommen eine relative Häufigkeit an Missings über 10 % auf, sodass von unsystematischen Ausfällen ausgegangen werden kann. Die Modelle wurden in MPlus 7 geschätzt, dabei wurde der MLR-Schätzer verwendet, die entsprechenden Gewichte auf individueller und Klassenebene herangezogen und die Berechnung für alle fünf plausible values repliziert (und gemittelt), um exakte Standardfehler berichten zu können. Ergebnisse der mehrebenenanalytischen Überprüfungen Tabelle gibt die Ergebnisse der stufenweise aufgebauten Mehrebenenmodelle wieder. Als abhängige Variablen fungierten die Lese- und die Mathematikleistung. In Modell 1 werden Merkmale kontrolliert, die sich aus der bisherigen Forschung als relevant für die Lese- und Mathematikleistung herausgestellt haben (siehe z. B. Trautwein et al., 2002), lediglich die kognitive Grundfähigkeit der Schüler/innen (z. B. Intelligenz) kann auf Grundlage dieses Datenmaterials nicht kontrolliert werden. Die erfassten Merkmale erklären 26,2 % der Varianz/Streuung in der Leseleistung und 28,9 % der Varianz in der Mathematikleistung. Auf Individualebene zeigt sich wie erwartet, dass Mädchen die besseren Leserinnen sind, während Buben eine höhere Leistung in Mathematik aufweisen. Des Weiteren sind die Leistungen in Lesen und Mathematik besser, wenn die Lernressourcen zu Hause höher sind. Motivation und das (fachliche) Selbstkonzept sind eng miteinander verbunden (r = 0.46 bei PIRLS und r = 0.55 bei TIMSS), wobei die Modellschätzung vor allem dem (fachlichen) Selbstkonzept der Schüler/innen einen positiven Zusammenhang mit den Leistungsergebnissen zuschreibt. Als Indikator für die Deutschkenntnisse wurde die Angabe der Eltern herangezogen, ob das Kind bereits vor dem Schuleintritt Deutsch gesprochen hat. Auch hier zeigt sich erwartungsgemäß, dass jene Schüler/innen, die bereits vor Schuleintritt Deutsch sprechen konnten, bessere Leistungen in Lesen und Mathematik aufweisen. Auf Level 2 (Klassenebene) wurden Unterschiede im Hinblick auf die Umgebung des Schul standorts kontrolliert. Die Ergebnisse sprechen für bessere Leistungen in Lesen und Mathematik für Schüler/innen, die Schulen in Kleinstädten oder Dörfern besuchen, im Vergleich zu Schü-

123 Hausaufgaben und deren Bedeutung für die Mathematik- und Leseleistung 121 Typ UV AV Modell und Ebene Modell 1 Level 1 Modell 1 Level 2 Modell 2 Level 1 Modell 3 Level 2 Alle Modelle Bezeichnung Home Resources for Learning (HRL) TIMSS (Ö) Motivation Selbstkonzept Deutsch vor Schule Schulstandort Häufigkeit der fachspezifischen Hausaufgaben (HA) Dauer der fachspezifischen Hausaufgaben (HA) Elterliche Unterstützung und Monitoring Häufigkeit der Hausaufgaben im Klassendurchschnitt Dauer der Hausaufgaben im Klassendurchschnitt Monitoring durch Kontrolle und Rückmeldung zu den Hausaufgaben Monitoring durch Diskussion der Hausaufgaben in der Klasse Individualisierender Umgang mit Hausaufgaben durch Lehrperson Allgemeine Lese- bzw. Mathematikleistung Herkunft Std.-Abw. PIRLS (Ö) Std.-Abw. TIMSS (Ö) Schülerfragebogen: Internationaler Index Home Resources for Learning (HRL) a Schülerfragebogen: Der Koeffizient gibt die Veränderung des Schätzwerts für Buben an. Schülerfragebogen: Internationaler Index Students Like Reading bzw. Students Like Learning Mathematics Schülerfragebogen: Internationaler Index Students Confidence in Reading bzw. Student Confidence with Mathematics Elternfragebogen: Der Koeffizient gibt die Veränderung des Schätzwerts für Schüler/innen an, die nach Angabe der Eltern bereits vor der Schule Deutsch gesprochen haben. Schulfragebogen: Die Koeffizienten geben die Veränderung des Schätzwerts von der Referenzkategorie Großstadt dicht bevölkert an. Schülerfragebogen: Die Koeffizienten geben die Veränderung des Schätzwerts von der Referenzkategorie jeden Tag oder fast jeden Tag an. Schülerfragebogen: Die Koeffizienten geben die Veränderung des Schätzwerts von der Referenzkategorie 15 Minuten oder weniger an. Elternfragebogen: Mittelwertscore aus 5 Items b (PIRLS: alpha =.745; TIMSS: alpha =.768). Je höher, desto mehr elterliche Unterstützung und Monitoring bei den Hausaufgaben. Schülerfragebogen: Median der entsprechenden Frage (siehe Modell Level 1) pro Klasse; je höher, desto seltener beschäftigen sich die Schüler/innen der Klasse mit Hausaufgaben im Fach. Schülerfragebogen: Median der entsprechenden Frage (siehe Modell 2 Level 1) pro Klasse; je höher, desto mehr Zeit investieren die Schüler/innen der Klasse in die Hausaufgaben im Fach. Lehrerfragebogen: Die Koeffizienten geben die Veränderung des Schätzwerts von der Referenzkategorie immer oder fast immer an. Lehrerfragebogen: Die Koeffizienten geben die Veränderung des Schätzwerts von der Referenzkategorie immer oder fast immer an. Lehrerfragebogen: Die Koeffizienten geben die Veränderung des Schätzwerts für Lehrer/innen an, die wenigstens manchmal nicht allen Schüler/innen die gleiche Hausaufgabe geben. 5 Plausible Values lt. PIRLS-/TIMSS-Manual c a) Siehe dieser Index beinhaltet Merkmale der Eltern der Schüler/innen, welche auch für die Bestimmung eines sozioökonomischen Status relevant sind (höchste abgeschlossene Ausbildung der Eltern, höchster beruflicher Status der Eltern), sodass von einer starken Korrelation mit den bekannten und in PIRLS und TIMSS 2011 nicht verfügbaren sozioökonomischen Indizes (bspw. ESCS) ausgegangen werden kann. b) Items a, b, c, e und f/g der Frage 9 im Elternfragebogen (siehe c) Martin, M. O. & Mullis, I. V. S. (Eds.). (2012). Methods and procedures in TIMSS and PIRLS Chestnut Hill, MA: TIMSS & PIRLS International Study Center, Boston College. Online verfügbar unter: Tabelle 3.1.1: Analysevariablen

124 122 Hausaufgaben und deren Bedeutung für die Mathematik- und Leseleistung lerinnen und Schülern aus einer Großstadt. Zudem zeigen sich Schüler/innen aus entlegen-ländlichen Schulen besser in Mathematik als Schüler/innen aus den Großstädten. Es ist anzunehmen, dass bei diesen Unterschieden weitere vermittelnde Faktoren wirksam werden (z. B. die Qualität der häuslichen Förderung). Modell 2, in dem Merkmale der Hausaufgabenpraxis auf Schülerebene (Level 1) berücksichtigt werden (R2 Lesen = 31,8 %, R2 Mathematik = 33,7 %), ergibt, dass elterliches Unterstützungsverhalten/Monitoring sowohl mit der Lese- als auch der Mathematikleistung negativ in Verbindung steht. D. h., unter Kontrolle der Variablen im ersten Modell zeigt sich, dass die Schulleistung geringer ausgeprägt ist, wenn im Elternhaus bei Hausaufgaben stark geholfen/kontrolliert wird (siehe auch Cooper, Lindsay & Nye, 2000). Für diesen Befund können nun mehrere Erklärungen greifen. Zum einen könnte der bereits besprochene autonomieunterdrückende Effekt, der durch kontrollierende Hausaufgabenunterstützung ausgelöst werden kann, eintreten. Eine weitere Erklärungsmöglichkeit ergibt sich aus dem meist höheren Unterstützungsbedürfnis leistungsschwacher Schüler/innen bei der Hausaufgabenerledigung. Auch diese Denkrichtung würde den negativen Zusammenhang zwischen Leistung und Unterstützung durch die Eltern plausibel erklären und kann empirisch durch Befunde von Wild und Gerber (2007) im Längsschnitt gestützt werden (Klassenstufen 4 7; Mathematik). Diese Studie belegt, dass leistungsschwache Kinder nicht nur häufiger unterstützt werden, sondern dass diese Unterstützungsleistung auch stärker kontrollierend erfolgt. Hier spannt sich der Bogen zum ersten Erklärungsansatz (siehe auch Niggli et al., 2007). Im Hinblick auf die schulische Hausaufgabenpraxis spiegeln die Daten ein zum Teil konträres Bild bezüglich der Leseund Mathematikleistung auf Individualebene wider. Im Folgenden soll nur auf die Häufigkeit der Hausaufgabenvergabe und deren Relation zur Leistung Bezug genommen werden, da zwischen der Dauer der Hausaufgaben und der Leistungsstärke eine wechselseitige Beeinflussung zu vermuten ist. Bezogen auf die Häufigkeit von Hausaufgaben zeigt sich, dass die Leseleistung der Schüler/innen höher ist, wenn weniger Hausaufgaben zu erledigen sind, während Schüler/innen bessere Leistungen in Mathematik erbringen, wenn regelmäßig/häufig Hausaufgaben gegeben werden (z. B. auch Trautwein, 2007 für TIMSS Deutschland). Allerdings gilt ebenso, dass keine Hausaufgaben in Lesen negativ mit der Leseleistung der Schüler/ innen korrelieren ein Mindestmaß an Lesehausaufgaben scheint demnach auch für die Leseleistung bedeutsam zu sein. Zwischen der Leseleistung und der Regelmäßigkeit von Hausauf gaben liegt folglich ein kurvilinearer Zusammenhang vor, während sich für die Mathematikleistung ein linearer zeigt. Diese Ergebnisse lassen den Schluss zu, dass sich das beständige Üben von Inhalten durch eine regelmäßige Hausaufgabenvergabe positiv für die Entwicklung der Mathematikkompetenz erweist. Die Leistungsentwicklung in Lesen scheint dahingegen weniger von der Übungsund Festigungsfunktion der schulischen Hausaufgaben abhängig zu sein, sondern sie unterliegt vermutlich stärker der Selbststeuerung/Selbstregulierung der Schüler/innen. Möglicherweise spielen für die Leseleistung außerschulische Faktoren, wie z. B. der Zugang zu Büchern (Buchbesitz), der sich bereits in PIRLS 2006 als wesent licher Prädiktor für die Leseleistung erwiesen hat (Bergmüller & Böck, 2009), und motivationale Faktoren der Schüler/innen (z. B. deren Lesefreude) eine stärkere Rolle, da sie das (Lesen-) Üben mitbestimmen. Modell 3 berücksichtigt zusätzlich Merkmale auf Ebene 2, der Klassenebene. Es zeigen sich hier keine weiteren signifikanten Effekte. Die Erklärung der Varianz durch das Modell steigt ebenso nur geringfügig an (R2 Lesen = 33,7 %, R2 Mathematik = 34,5 %, das bedeutet eine Varianzsteigerung von knapp 2 Prozentpunkten pro Kompetenzbereich, siehe hierzu auch Wallner-Paschon & Schneider, 2009). Daher ist das Modell 2 zur Erklärung der Lese- und Mathematikleistung dem Modell 3 vorzuziehen. Resümee Der vorliegende Beitrag hat geprüft, inwieweit Hausaufgaben mit der Schülerleistung in Lesen und Mathematik in Verbindung stehen. Des Weiteren hat er die Hausaufgabenpraxis in Österreich am Ende der Grundschule beschreibend dargestellt. Diese Ergebnisse werden im Folgenden kurz zusammengefasst sowie überlegt, welche praktischen Konsequenzen diese nahelegen. Im Gegensatz zu den Befunden von PIRLS 2006 (Suchan & Breitfuß-Muhr, 2009), in denen kein Effekt der Hausaufgabenpraxis auf die Leseleistung aufgezeigt werden konnte, ergaben die in diesem Beitrag berechneten Modelle, gestützt auf die PIRLS- und TIMSS-2011-Daten, kleinere Effekte, die jedoch mit einer inkrementellen Varianzaufklärung von 6 % (nach Kontrolle einiger Drittvariablen) nicht sehr hoch sind. Diese relativ geringe Erklärungskraft stellt allerdings keinen überraschenden Befund dar, da sehr viele unterschiedliche Faktoren die Schulleistung determinieren (für ein Rahmenmodell schulischer Leistung siehe z. B. Helmke, Hosenfeld & Schrader, 2002, S. 426). Des Weiteren wurden wesentliche Variablen, welche die Effektivität der Hausaufgaben beeinflussen, wie sie beispielsweise im Prozessmodell der Wirkungsweise von Hausaufgaben von Kohler (2011) angeführt werden, bei den Erhebungen in PIRLS und TIMSS nicht berücksichtigt. Dazu zählen beispielsweise das Hausaufgabenverhalten der Schülerinnen und Schüler (z. B. Engagement, Selbstregulation, Motivation, Emotionsmanagement; Trautwein & Köller, 2003b; Xu, 2011) und die Funktionalität bzw. Dysfunktionalität des elterlichen Unterstützungsverhaltens (z. B. Adaptivität; Wild & Gerber, 2007). Auch die Qualität der Hausaufgaben

125 Hausaufgaben und deren Bedeutung für die Mathematik- und Leseleistung 123 Variablen PIRLS TIMSS Level 1 (Schüler-Ebene) Modell 1 Modell 2 Modell 3 Modell 1 Modell 2 Modell 3 HRL Geschlecht Motivation Selbstkonzept Deutsch vor Schule 14.3 (0.8**) 1.07 (2.08) 0.28 (0.58) 7.80 (0.58**) 12.4 (4.5**) 12.7 (0.7**) 0.76 (2.08) 0.51 (0.59) 6.51 (0.60**) 11.5 (4.5*) 12.7 (0.7**) 0.36 (2.11) 0.54 (0.62) 6.55 (0.61**) 12.0 (4.5**) 13.1 (0.7**) 4.03 (2.10) 1.21 (0.65) 10.2 (0.7**) 7.07 (3.87) 11.8 (0.8**) 5.41 (2.16*) 0.75 (0.66) 9.49 (0.68**) 5.54 (4.14) 11.8 (0.8**) 5.07 (2.19*) 0.70 (0.63) 9.59 (0.70**) 5.71 (4.12) Häufigkeit HA (vs. jeden Tag ) * 1- bis 2-mal pro Woche * weniger als einmal pro Woche * nie oder fast nie Zeit für HA (vs. < = 15 Min. ) * Minuten * Minuten * mehr als 60 Minuten 6.28 (2.59*) 11.5 (3.3**) 5.23 (4.15) 4.05 (2.69) 17.3 (4.4**) 28.1 (6.5**) 6.91 (2.73*) 11.8 (3.7**) 7.22 (4.43) 4.10 (2.80) 17.2 (4.5**) 27.6 (6.6**) 7.71 (3.09*) 8.46 (7.49) 22.2 (7.9**) 7.09 (2.24**) 11.1 (3.5**) 5.92 (5.07) 6.67 (3.21*) 9.35 (8.25) 23.2 (9.0**) 7.27 (2.34**) 11.3 (3.7**) 5.57 (5.15) Elterliche Unterstützung/Monitoring 17.8 (1.7**) 18.0 (1.7**) 17.4 (1.5**) 17.3 (1.6**) Level 2 (Klassen- bzw. Lehrer-Ebene) Modell 1 Modell 2 Modell 3 Modell 1 Modell 2 Modell 3 Standort (vs. Großstadt): * städt. Randbezirk * mittelgroße Stadt * Kleinstadt/Dorf * entlegen-ländlich 6.16 (4.58) 5.01 (5.01) 10.8 (4.7*) 12.6 (6.5) 7.10 (4.36) 6.92 (4.89) 14.6 (4.4**) 15.9 (5.9**) 5.58 (4.56) 4.12 (5.12) 11.4 (4.8*) 10.1 (6.2) 4.96 (5.63) 4.97 (6.07) 15.2 (5.1**) 24.7 (7.2**) 4.49 (5.61) 4.46 (5.98) 15.5 (4.9**) 25.8 (7.1**) 7.01 (5.67) 3.08 (5.94) 16.8 (4.9**) 26.3 (6.9**) Häufigkeit HA (Klassenmedian) ( je höher, desto seltener ) Zeit für HA (Klassenmedian) ( je höher, desto länger ) 2.90 (2.32) 4.73 (5.07) 9.77 (7.49) 4.06 (5.35) Monitoring d. Kontrolle und Rückmeldung (vs. immer ) * manchmal * nie oder fast nie 2.78 (3.66) 5.45 (11.28) 9.1 (11.5) [n = 0] Monitoring d. Diskussion (vs. immer ) * manchmal * nie oder fast nie Individualisierte Hausaufgaben (wenigstens manchmal ) R2 Ind. Level R2 Class Level R2 Total (3.39) 9.39 (8.79) 6.54 (3.60) (3.61) 12.6 (7.8) 7.02 (4.18) Anmerkungen: abhängige Variablen sind die Leseleistung (PIRLS) bzw. Mathematikleistung (TIMSS); unstandard. Regressionskoeffizienten mit Standardfehlern in Klammer; **... p <.01; *... p <.05; [n = 0]... unbesetzte Zelle (z. B. kognitives Anspruchsniveau; Dettmers et al., 2009) und deren Funktionen (z. B. Memorieren von Inhalten, Verbesserung von Fähigkeiten etc.) wurden nicht berücksichtigt. Zukünftige Untersuchungen sollten die Hausaufgabenpraxis daher deutlich differenzierter im Hinblick auf deren Qualität, Funktion und die sie beeinflussenden Rahmen bedingungen (Schüler- und Kontextmerkmale) erfassen. Tabelle 3.1.2: Ergebnisse der mehrebenenanalytischen Modellprüfung Die Ergebnisse zeigen, dass die überwiegende Mehrheit der Lehrpersonen in Österreichs Grundschulen häufig Hausaufgaben in Lesen und Mathematik vergibt. Dabei bestätigt sich für Mathematik im Einklang mit bisherigen Befunden das Bild, dass die Regelmäßigkeit von Hausaufgaben im Sinne eines kontinuierlichen Übens wesentlich mit der schulischen Leistungsstärke korreliert. Für Lesen ergibt sich ein anderes Muster: Sehr häufige Lesehausaufgaben (immer/

126 124 Hausaufgaben und deren Bedeutung für die Mathematik- und Leseleistung fast immer) gehen mit einer geringeren Leseleistung einher, während fehlende Lesehausaufgaben die schlechtesten Leseleistungen vorhersagen (= kurvilinearer Zusammenhang). Fehlende Hausaufgaben könnten somit das negative Potenzial besitzen, die Schere zwischen leistungsschwachen und leistungsstarken Schülerinnen und Schülern zu vergrößern und die bereits existente Leistungsheterogenität in den Klassenzimmern zusätzlich zu erhöhen. Aus den Befunden lässt sich für die konkrete Unterrichtspraxis demnach schlussfolgern, dass regelmäßige Hausaufgaben besonders förderlich für die schulische Leistung zu sein scheinen (z. B. auch Lipowsky et al, 2004; Trautwein, Köller & Baumert, 2001). Die additive Wirkung der Hausaufgabendauer für die unterschiedlichen Fächer ist hierbei zu beachten, damit der zeitliche Aufwand durch die Hausaufgaben pro Tag für Schüler/innen bewältigbar bleibt. Mehrmals wöchentlich jedoch nicht täglich Hausaufgaben in den verschiedenen Unterrichtsfächern könnten die Regelmäßigkeit des Übens gewährleisten und die zeitliche Überlastung der Schüler/ innen verhindern (siehe auch Trautwein, Köller & Baumert, 2001). Auch eine (in diesem Zusammenhang nicht kontrollierte) integrative Hausaufgabenpraxis ( Haus - Aufgaben in Form von selbstregulierten Übungsmöglichkeiten im regulären Unterricht) wäre eine Möglichkeit, das außerschulische Belastungserleben zu reduzieren (Hascher & Bischof, 2000). Wird nach der Bedeutung von Lese- und Mathematikhausaufgaben für die Entwicklung der Schülerleistung gewichtet, so ist insbesondere die regelmäßige Vergabe von Mathematikhausaufgaben von Relevanz, um ausreichend Übungsmöglichkeiten bzw. aktive Lernzeit zu gewährleisten ( time-on-task ; Carroll, 1963). Lesegelegenheiten, in denen das Lesen geübt werden kann, finden sich dahingegen auch außerschulisch häufiger, weshalb das regelmäßige Üben von Lesen weniger stark an die schulische Hausaufgabenpraxis gekoppelt ist. Voraussetzung für das selbstgesteuerte Lesen in der Freizeit ist jedoch die Entwicklung des Leseinteresses und der Zugang zu Lesegelegenheiten. Beide Faktoren werden in der Regel stark von der Herkunft der Kinder mitbestimmt. Die Hausaufgaben werden sowohl im Elternhaus als auch in der Schule zum Großteil kontrolliert und besprochen. Demnach ist das Hausaufgabenmonitoring sehr hoch ausgeprägt. Zu Hause übernehmen die Eltern häufig die Rolle des Lernbegleiters, hier insbesondere die Mutter sowohl in der unterstützenden (z. B. helfen) als auch in der kontrollierenden (z. B. Hausaufgabenerledigung kontrollieren) Funktion. Ein negativer Zusammenhang konnte zwischen dem elterlichen Monitoring und der schulischen Leistung aufgezeigt werden d. h., die Hausaufgaben wurden insbesondere bei leistungsschwachen Schülerinnen und Schülern stark kontrolliert bzw. deren Erledigung intensiv begleitet. Das Monitoring auf Klassenebene konnte dahingegen nicht signifikant mit der Leistung in Verbindung gebracht werden. Damit das Hausaufgabenmonitoring seine pädagogische Wirksamkeit im Sinne einer kontinuierlichen Lernbegleitung und -unterstützung entfalten kann, ist darauf zu achten, dass dieses in einer positiv-unterstützenden, angstfreien Atmosphäre stattfindet. Angst, Leistungsdruck und Furcht vor Fehlern könnten beispielsweise reduziert werden, indem Hausaufgaben nicht bewertet werden, und sich die Hausaufgabenerledigung und deren Kontrolle folglich als Lern- und weniger als Leistungssituation gestaltet (Hascher & Hagenauer, 2010). Literatur Bergmüller, S. & Böck, M. (2009). Leseeinstellung und Leseverhalten im Einflussbereich von Schule und Familie. In B. Suchan, C. Wallner-Paschon & C. Schreiner (Hrsg.), PIRLS Die Lesekompetenz am Ende der Volksschule. Österreichischer Expertenbericht (S ). Graz: Leykam. Carroll, J. B. (1963). A model of school learning. Teachers College Record, 64, Cooper, H., Lindsay, J. J. & Nye, B. (2000). Homework in the home: How student, family, and parenting-style differences relate to the homework process. Contemporary Educational Psychology, 25 (4), Deci, E. & Ryan, R. (1993). Die Selbstbestimmungstheorie der Motivation und ihre Bedeutung für die Pädagogik. Zeitschrift für Pädagogik, 39, De Jong, R., Westerhof, K. J. & Creemers, B. P. M. (2000). Homework and student math achievement in junior high schools. Educational Research and Evaluation, 72, Dettmers, S., Trautwein, U. & Lüdtke, O. (2009). Eine Frage der Qualität? Die Rolle der Hausaufgabenqualität für Hausaufgabenverhalten und Leistung. Unterrichtswissenschaft, 37 (3), Grasedieck, D. (2008). Welchen Wert haben Hausaufgaben? Plädoyer für individualisierte Hausaufgaben. Neue Didaktik, 1,

127 Hausaufgaben und deren Bedeutung für die Mathematik- und Leseleistung 125 Hascher, T. & Bischof, F. (2000). Integrierte und traditionelle Hausaufgaben in der Primarschule. Psychologie in Erziehung und Unterricht, 47 (4), Hascher, T. & Hagenauer, G. (2010). Lernen aus Fehlern. In C. Spiel, B. Schober, P. Wagner & R. Reimann (Hrsg.), Bildungspsychologie (S ). Göttingen: Hogrefe. Hascher, T. & Hofmann, F. (2008). Kompetenzbereich Hausaufgaben. In M. Gläser-Zikuda & J. Seifried (Hrsg.), Lehrerexpertise. Analyse und Bedeutung unterrichtlichen Handelns (S ). Münster: Waxmann. Hascher, T. & Hofmann, F. (2011). Hausaufgaben aus der Sicht von (angehenden) Lehrerinnen und Lehrern. DDS Die Deutsche Schule, 103 (3), Helmke, A., Hosenfeld, I. & Schrader, F.-W. (2002). Unterricht, Mathematikleistung und Lernmotivation. In A. Helmke & R. S. Jäger (Hrsg.), Das Projekt MARKUS. Mathematik-Gesamterhebung Rheinland-Pfalz: Kompetenzen, Unterrichtsmerkmale, Schulkontext (S ). Landau: Verlag Empirische Pädagogik. Kohler, B. (2011). Hausaufgaben. Überblick über didaktische Überlegungen und empirische Untersuchungen. DDS Die Deutsche Schule, 103 (3), Jäger, R. S., Stuck, A., Jäger-Flor, D. & Riebel, J. (2010). Hausaufgaben: Die andere Sicht der Medaille: die Sicht der Eltern. Empirische Pädagogik, 24 (1), Lipowsky, F., Rakoczy, K., Klieme, E., Reusser, K. & Pauli, C. (2004). Hausaufgabenpraxis im Mathematikunterricht ein Thema für die Unterrichtsqualitätsforschung. In J. Doll & M. Prenzel (Hrsg.), Bildungsqualität von Schule (S ). Münster: Waxmann. Mischo, C. & Haag, L. (2006). Hausaufgaben. In D. H. Rost (Hrsg.), Handwörterbuch Pädagogische Psychologie (3. überarb. und erw. Auflage) (S ). Weinheim: Beltz. Niggli, A., Trautwein, U., Schnyder, I., Lüdtke, O. & Neumann, M. (2007). Elterliche Unterstützung kann hilfreich sein, aber Einmischung schadet. Psychologie in Erziehung und Unterricht, 54 (1), Pomerantz, E. M. & Eaton, M. M. (2001). Maternal intrusive support in the academic context: transactional socialization processes. Developmental Psychology, 37 (2), Pomerantz, E. M., Wang, Q. & Ng, F. F.-Y. (2005). Mothers affect in the homework context: the importance of staying positive. Developmental Psychology, 41 (2), Roßbach, H.-G. (1995). Hausaufgaben in der Grundschule. DDS Die Deutsche Schule, 87 (1), Schnyder, I., Niggli, A. & Trautwein, U. (2008). Hausaufgabenqualität im Französischunterricht. Zeitschrift für Pädagogische Psychologie, 22 (3 4), Spiel, C., Wagner, P. & Fellner, G. (2002). Wie lange arbeiten Kinder zu Hause für die Schule? Eine Analyse in Gymnasium und Grundschule. Zeitschrift für Entwicklungspsychologie und Pädagogische Psychologie, 34 (3), Trautwein, U. (2007). The homework achievement relation reconsidered: Differentiating homework time, homework frequency and homework effort. Learning and Instruction, 17, Trautwein, U. & Köller, O. (2003a). The relationship between homework and achievement still much of a mystery. Educational Psychology Review, 15, Trautwein, U. & Köller, O. (2003b). Was lange währt, wird nicht immer gut. Zur Rolle selbstregulativer Strategien bei der Hausaufgabenerledigung. Zeitschrift für Pädagogische Psychologie, 17 (3/4), Trautwein, U., Köller, O. & Baumert, J. (2001). Lieber oft als viel: Hausaufgaben und die Entwicklung von Leistung und Interesse im Mathematik-Unterricht der 7. Jahrgangsstufe. Zeitschrift für Pädagogik, 47 (5),

128 126 Hausaufgaben und deren Bedeutung für die Mathematik- und Leseleistung Trautwein, U., Köller, O., Schmitz, B. & Baumert J. (2002). Do homework assignments enhance achievement? A multilevel analysis in the 7th grade mathematics. Contemporary Educational Psychology, 27, Trautwein, U., Niggli, A., Schnyder, I. & Lüdtke, O. (2009). Between-differences in homework assignments and the development of students homework effort, homework emotions, and achievement. Journal of Educational Psychology, 101 (1), Trautwein, U., Schnyder, I., Niggli, A., Neumann, M. & Lüdtke, O. (2009). Chameleon effects in homework research: The homework-achievement association depends on the measures used and the level of analysis chosen. Contemporary Educational Psychology, 34, Wagner, P., Hirtenlehner, H., Bacher, J. & Schober, B. (2010). Zeitliche Belastung von Schülern durch die häusliche Arbeit für die Schule. Empirische Pädagogik, 24 (1), Wallner-Paschon, C. & Schneider, P. (2009). Lesesozialisation im Elternhaus. In B. Suchań, C. Wallner-Paschon & C. Schreiner (Hrsg.), PIRLS Die Lesekompetenz am Ende der Volksschule. Österreichischer Expertenbericht (S ). Graz: Leykam. Wild, E. & Gerber, J. (2007). Charakteristika und Determinanten der Hausaufgabenpraxis in Deutschland von der vierten zur siebten Klassenstufe. Zeitschrift für Erziehungswissenschaft, 10 (3), Xu, J. (2011). Homework emotion management at the secondary school level: antecedents and homework completion. Teachers College Record, 113 (3), Xu, J. & Corno, L. (1998). Case studies of families doing third-grade homework. Teachers College Record, 100,

129 Innere Differenzierung im Mathematikunterricht Innere Differenzierung im Mathematikunterricht Ursula Schwantner Konzepte innerer Differenzierung nehmen einen wichtigen Stellenwert bei Reformbestrebungen im Schulsystem ein. Im vorliegenden Abschnitt werden Prozessstandards für innere Differenzierung dargestellt, die den Unterricht von der Planung bis hin zur Leistungsrückmeldung umfassen und die individuellen Lernprozesse der Schüler/innen fokussieren. Anhand von TIMSS-Daten wird analysiert, für wie notwendig Lehrer/innen und Schulleiter/innen innere Differenzierung erachten und inwieweit Prozessstandards für innere Differenzierung im Mathematikunterricht in der Volksschule aus Schüler-, Lehrer- und Schulleitersicht umgesetzt werden. Darüber hinaus wird untersucht, ob Unterricht stärker lehrer- oder schülergesteuert durchgeführt wird und wie innere Differenzierung mit Unterrichtssteuerung zusammenhängt. Die Analysen werden, wo möglich, mit Trendvergleichen zu TIMSS 2007 und Ergebnissen zum Leseunterricht aus PIRLS 2011 ergänzt. Einleitung Innere Differenzierung gilt als ein zentraler Indikator für die Qualität schulischer Prozesse und wird als wichtiger Bestandteil kompetenzorientierten Unterrichts angesehen (Vogtenhuber et al., 2012). Während das Konzept der Kompetenzorientierung vor allem in den letzten 15 Jahren durch international vergleichende Schülerleistungsstudien und die Entwicklung und Einführung von Bildungsstandards in der österreichischen Bildungsforschung an Bedeutung gewonnen hat, war innere Differenzierung bereits in den 1960er und 70er Jahren Gegenstand pädagogischer Reformbestrebungen. Grundlegend für das Konzept der inneren Differenzierung sind vor allem Erkenntnisse aus dem Bereich der pädagogischen Psychologie (u. a. basierend auf Entwicklungs-, Motivations-, Kognitions-, Persönlichkeits-, Sozial- und Lernpsychologie insbesondere konstruktivistischen Lerntheorien), die darlegen, dass Lernen ein komplexer individueller Prozess ist, der in Abhängigkeit von Lernvoraussetzungen und unter Einfluss verschiedener Faktoren zu unterschiedlichen Ergebnissen führt. Auch jüngere Ansätze wie die Neurodidaktik betonen die Unterschiedlichkeit der Lernenden und versuchen, zentrale Faktoren für Lehren und Lernen zu identifizieren sowie zu beschreiben, wie Lernen bei jedem Schüler/jeder Schülerin erfolgreich stattfinden kann (z. B. Braun & Meier, 2006; Roth, 2006). Neurodidaktik fokussiert den Lernprozess der Schüler/innen und unterstützt die Selbstorganisation und das selbstständige Erarbeiten von Lerninhalten im Gegensatz zur vermittlungsorientierten Didaktik, bei der die Lehrperson die grundlegenden Inhalte erschließt, systematisiert und für die Schüler/innen aufbereitet. Laut Roth (2006) muss Wissen... im Gehirn eines jeden Lernenden neu geschaffen werden (ebd., S. 49) und kann nicht übertragen werden. Die selbsttätige Aneignung von Wissen, die Verknüpfung mit Anwendungsbedingungen und deren adäquate und erfolgreiche Bewältigung in unterschiedlichen Anwendungssituationen und Aufgabenfeldern sind auch Kernbereiche kompetenzorientierten Unterrichts (vgl. Beer & Benischek, 2011). Innere Differenzierung berücksichtigt dabei die kognitiven, motivationalen und emotionalen Lern - voraussetzungen der Schüler/innen und ermöglicht es ihnen dadurch, die Lernprozesse selbst zu gestalten, zu steuern und sich nach besten Möglichkeiten zu entwickeln. Die individuelle Förderung eines jeden Kinds ist zudem fester Bestandteil im Grundschullehrplan (BGBl. Nr. 134/ 1963 in der Fassung BGBl. II Nr. 290/2008 vom 12. August 2008, S. 7 f.). Auch in der Verordnung zu den Bildungsstandards wird individuelle Förderung explizit gefordert (BGBl. II, 2009 Nr. 1, S. 2). Aktuell beschäftigt sich die Initiative SQA (Schulqualität Allgemeinbildung) des BMUKK (n. d.), deren Ziel eine Verankerung von Qualitätsentwicklung und -sicherung an allgemeinbildenden Schulen ist, mit der Weiterentwicklung des Lernens und Lehrens in Richtung Individualisierung und Kompetenzorientierung als Rahmenziele für das allgemeinbildende Schulwesen für die Jahre (BMUKK ). Die unterschiedlichen Voraussetzungen der Schüler/innen werden dabei als Ansatzpunkte für die Planung der pädagogischen Qualitätsentwicklung und -sicherung gesehen. Aufgrund der Wichtigkeit und Notwendigkeit, die dem Thema der inneren Differenzierung beigemessen wird, wurden die PIRLS-TIMSS-2011-Kontextfragebögen in Österreich um Zusatzfragen zur inneren Differenzierung erweitert und die nationale Schwerpunktsetzung zur inneren Differenzierung im Mathematikunterricht aus TIMSS 2007 weitergeführt (vgl. Schwantner, 2010). Somit ist es möglich, die Häufigkeit der Umsetzung bestimmter Differenzierungsmaßnahmen oder das Ausmaß an Lehreroder Schülersteuerung im Unterricht zwischen den beiden Erhebungszeitpunkten zu vergleichen. Der vorliegende Beitrag widmet sich zunächst den Prozessstandards für innere Differenzierung, die beschreiben, was

130 128 Innere Differenzierung im Mathematikunterricht innere Differenzierung ist und wodurch sich diese äußert. Danach wird anhand der Daten von TIMSS 2011 analysiert, für wie notwendig Lehrer/innen und Schulleiter/innen innere Differenzierung im Unterricht allgemein erachten, und inwieweit Prozessstandards für innere Differenzierung im Mathematikunterricht in der Volksschule umgesetzt werden. Abschließend wird dargestellt, inwieweit Unterricht lehrer- oder schülergesteuert durchgeführt wird und ob es einen Zusammenhang zwischen Unterrichtssteuerung und innerer Differenzierung gibt. Sowohl die Einschätzung der Umsetzung als auch der Unterrichtssteuerung wird zwischen den beiden Erhebungszeitpunkten verglichen. Wo es möglich und sinnvoll ist, fließen auch Ergebnisse zum Leseunterricht aus PIRLS 2011 ein (Details zum Leseunterricht s. Abschnitt 4.1). Prozessstandards für innere Differenzierung Die Prozessstandards für innere Differenzierung stellen Grundelemente eines differenzierten Unterrichts dar und beschreiben Verhaltensweisen von Lehrerinnen und Lehrern sowie Unterrichtsmerkmale, die darauf abzielen, die unterschiedlichen Voraussetzungen der Schüler/innen zu berücksichtigen und darauf einzugehen, sodass sich jeder Schüler/jede Schülerin bestmöglich entfalten kann (Schwantner, 2013, S. 61). Sie wurden von Schwantner (2013) aus dem theoretisch fundierten und empirisch überprüften Modell der inneren Differenzierung von Herber (1983) abgeleitet 1 und mit zentralen Merkmalen innerer Differenzierung aus der Forschungsliteratur abgestimmt. Dass die darin festgelegten Verhaltensweisen und Unterrichtsmerkmale für innere Differenzierung grundsätzlich als Standard erwünscht sind, zeigt eine Übereinstimmung mit den gesetzlichen Rahmenbedingungen für innere Differenzierung im Lehrplan der Volksschule sowie in der Lehrerausbildung (Schwantner, 2013, S. 44 ff.). Mithilfe der Definition der Prozessstandards für innere Differenzierung soll dem Problem begegnet werden, welches Altrichter et al. (2009) aufgrund definitorischer Schwierigkeiten orten und folgendermaßen schildern: Das Phänomen Individualisierung im Unterricht 2 kann nur anhand verschiedener konkreter Realisierungsformen also an verschiedenen Modellen individualisierten Unterrichts untersucht werden; diese sind komplex in dem Sinn, dass sie sich aus unterschiedlichen Kombinationen verschiedener didaktischer Bausteine (und zwar aus solchen, die die Modellkonstrukteur/inn/en [sic] bewusst geplant haben, als auch aus solchen, die während der Realisierung extemporierend hinzugefügt wurden) zusammensetzen (ebd., S. 345). Die Prozessstandards bilden somit den Rahmen für die Erfassung im Feld. Sie sind in Anlehnung an wesentliche Phasen von Unterricht in vier Bereiche gegliedert: (1) Planen, (2) Diagnostizieren, (3) Erarbeiten und (4) Rückmelden (Schwantner, 2013, S. 61 ff.). Die Bereiche werden im Folgenden näher erläutert. Planen und Diagnostizieren Die Bereiche Planen und Diagnostizieren basieren auf den ersten beiden Schritten des Modells der inneren Differenzierung von Herber (1983): (1) Festlegung und bildungstheoretische Begründung von Lernzielen und (2) Erfassung der Lernvoraussetzungen der Schüler/innen im Hinblick auf die Erreichbarkeit der Lernziele. Planen und Diagnostizieren sind dabei zwei ineinandergreifende Prozesse, die gemeinsam größtmögliche Adaptivität ermöglichen, indem die kognitiven, motivationalen und emotionalen Lernvoraussetzungen bestmöglich mit den Lernzielen abgestimmt werden. Dabei betont Herber (1983) sowohl die Erfassung der Lernvoraussetzungen der Schüler/innen als auch die selbstreflexive Feststellung der kognitiven und psychologischen Voraussetzungen der Lehrkraft (z. B. die Einschätzung der eigenen fachwissenschaftlichen Kenntnisse, die Reflexion über das eigene Lehrverhalten, ob gerne unterrichtet wird etc.). Bei der Planung werden die Kompetenzen, die die Schüler/innen vom fachwissenschaftlichen Standpunkt her (in Anlehnung an den Lehrplan) aufbauen sollen, festgelegt und in Fundamentum (Grundkompetenzen für alle Schüler/innen) und Additum (Erweiterungskompetenzen zur Entwicklung und Förderung spezifischer Interessen und Begabungen) gegliedert. Herber schafft dabei durch den Bezug auf den Lehrplan explizit eine curriculare Stabilität, die entscheidend für die formale Zuerkennung von Schulerfolg ist. Bei der Festlegung der Lernziele werden sowohl die kognitiven als auch die motivationalen Lernvoraussetzungen der Schüler/innen berücksichtigt. Möglichkeiten für Schüler/innen, sich selbst aktiv bei der Planung und Auswahl der Unterrichtsinhalte einzubringen, unterstützen dabei die Passung. Am Beginn eines neuen Stoffgebiets werden die kognitiven Lernvoraussetzungen erfasst, um Fehler und Lernschwierigkeiten, die bereits bei der Planung antizipiert wurden, aufzudecken, um darauf entsprechend zu reagieren, mit dem Ziel, dass alle Schüler/innen über die notwendigen Lernvoraussetzungen für ein neues Stoffgebiet verfügen. Die motivationalen und emotionalen Lernvoraussetzungen wie Interessen, Leistungsmotivation, Attribuierung von Erfolg und Misserfolg, Angst, Freude oder Trauer, bis hin zu gruppendynamischen und soziokulturellen Umweltbedingungen können anhand regelmäßiger Schülerbeobachtungen und aktiver Einbindung der Schüler/innen ermittelt und entsprechende Kompetenzen der Lehrer/ innen vorausgesetzt berücksichtigt werden (Herber, 1983). 1 Eine Kurzbeschreibung des Modells der inneren Differenzierung von Herber (1983) findet sich in Schwantner, 2010, S. 192 f.; eine ausführliche Beschreibung in Schwantner, Individualisierung im Unterricht wird hier synonym mit innerer Differenzierung verstanden.

131 Innere Differenzierung im Mathematikunterricht 129 Erarbeiten 3 Im Mittelpunkt des Bereichs Erarbeiten steht die Selbsttätigkeit der Schüler/innen, die dem Ablauf von Erarbeiten, Prüfen und Einüben folgt. Folgende Prozesse sind dabei zentral (Schwantner, 2013, S. 63 f.): Neue Problemstellungen/neue Stoffgebiete werden von den Schülerinnen und Schülern idealerweise anhand (eigens konzipierter) spezifischer Aufgaben, die die wesentliche Struktur der neuen Problemstellung/eines neuen Stoffgebiets repräsentieren selbstständig erarbeitet. Die individuellen, unterschiedlichen Lösungen der Schüler/innen werden gesammelt und besprochen sowie festgestellt, ob alle Schüler/innen die neue Problemstellung auf ihre Weise richtig lösen können. Zumindest sollten verschiedene Lösungswege gemeinsam erarbeitet werden, sodass jeder Schüler/jede Schülerin eigene Lösungswege entwickeln kann. Hilfestellungen durch die Lehrperson sollen anhand gezielter, direkter, sachbezogener Hinweise in Bezug auf den jeweiligen Lösungsweg des Schülers/der Schülerin erfolgen, sodass das Finden einer eigenständigen Lösung angeregt wird. Möglichkeiten zur Selbstkontrolle sollen bereitgestellt werden, um die Selbststeuerung der Schüler/innen zu fördern. Eingesetzte Übungsaufgaben sollen anschaulich und lebensnah sein, um die Schüler/innen anzusprechen. Aufgaben sollen sowohl für das Fundamentum als auch für das Additum und mit unterschiedlichem Schwierigkeitsgrad bereitgestellt werden. Die Schüler/innen wählen eigenverantwortlich unter den angebotenen Aufgaben. Freiräume für selbstbestimmtes Arbeiten werden dadurch geschaffen, indem die Schüler/innen parallel an unterschiedlichen Aufgaben arbeiten, die Sozialform frei wählen können (anstatt einer ausschließlich von der Lehrkraft vorgegebenen Variation der Sozialform) und auch die Aufgabenreihenfolge selbst wählen können. So kann sich jede/jeder in ihrem/seinem Tempo und nach ihren/seinen Fähigkeiten fortbewegen, während die Lehrkraft individuell angepasste Hilfestellungen geben kann. Rückmelden Rückmelden ist insofern ein wesentlicher Bestandteil innerer Differenzierung, als es zwei wichtige Funktionen erfüllt: Zum einen liefert Rückmelden Sachinformationen über das Ausmaß, in dem ein Lernziel erreicht wurde; zum anderen hat jede Rückmeldung auch affektive Begleittöne (Herber, 1983, S. 72) im Sinne einer Beurteilung, die die Motivation der Schüler/innen und das Vertrauen in die eigenen Fähigkeiten beeinflusst. In dieser Hinsicht ist es wichtig, dass Rückmeldung sachbezogen (lernziel- und aufgabenbezogen) und unter Heranziehen individueller Bezugsnormen (und nicht sozialer Bezugsnormen) erfolgt. Auf Basis der individuellen Rückmeldung können gemeinsam Strategien zur Verbesserung und Korrektur von Misserfolgen erarbeitet werden. Die dabei getroffenen individuellen Zielvereinbarungen stellen realistische Erfolge in Aussicht, die den Schülerinnen und Schülern das Gefühl geben, die an sie gestellten Anforderungen bewältigen und sich stetig verbessern zu können (Herber, 1983, S. 102; Schwantner, 2013, S. 64). Prozessstandards für innere Differenzierung im Rahmen von TIMSS 2011 Die konsequente Umsetzung der Prozessstandards in allen vier Bereichen von der Planung bis zur Leistungsrückmeldung ergibt eine Unterrichtskonzeption, die die individuellen Lernprozesse der Schüler/innen und den optimalen Lernerfolg eines jeden Schülers/einer jeden Schülerin fokussiert. Die Erhebung der Umsetzung der Prozess standards in allen vier Bereichen wäre jedoch im Rahmen von TIMSS 2011 zu umfangreich gewesen und musste daher beschränkt werden. Der Schwerpunkt wurde auf den Bereich Erarbeiten gelegt, da die Ermöglichung der selbsttätigen Auseinandersetzung mit dem Lernstoff ein wesentliches Element innerer Differenzierung darstellt, das zudem als bedeutsam für kompetenzorientierten Unterricht gilt (s. oben). Darüber hinaus können die Maßnahmen des Bereichs Erarbeiten, die direkt im Unterricht stattfinden, sowohl durch die Befragung der Lehrer/innen als auch der Schüler/innen erfasst werden. Dazu wurden zwei Skalen zur inneren Differenzierung im Mathematikunterricht aus TIMSS 2007 in etwas gekürzter Fassung in TIMSS 2011 aufgenommen, wodurch es möglich ist, die Umsetzung zwischen den beiden Erhebungszeitpunkten zu vergleichen. Ebenso für einen Trendvergleich wurde die Frage nach dem Ausmaß an Unterrichtssteuerung (Lehrervs. Schülersteuerung) aus TIMSS 2007 übernommen. In Anlehnung an die Erfassung der Wichtigkeitsüberzeugungen der Lehrer/innen und Schulleiter/innen gegenüber innerer Differenzierung bei TIMSS 2007 wurde bei TIMSS 2011 der Frage nachgegangen, für wie notwendig Lehrer/ innen und Schulleiter/innen generell innere Differenzierung erachten. Anmerkungen zur Interpretation der Ergebnisse zum Themenbereich innere Differenzierung Bei der Interpretation der Ergebnisse der Schulleiter- und Lehrerbefragung ist es wichtig zu berücksichtigen, dass die 3 Der Bereich Erarbeiten basiert auf den Schritten 3 ( Prototyp ) und 4 ( Diskrimination ) in Herbers Modell der inneren Differenzierung (Herber, 1983).

132 130 Innere Differenzierung im Mathematikunterricht TIMSS-Stichprobe repräsentativ für die Ziel-Schüler/innen gezogen wurde und daher die Aussagen der Lehrer/innen und Schulleiter/innen auf die Anteile der Schüler/innen bezogen werden. Auf Lehrerebene ist zudem zu beachten, dass die Analysen zur inneren Differenzierung allgemein und im Mathematikunterricht auf den Antworten jener Lehrer/innen beruhen, die den Mathematikteil des TIMSS-Fragebogens ausgefüllt haben. Notwendigkeit innerer Differenzierung aus Lehrer- und Schulleitersicht Wichtigkeitsüberzeugungen in Bezug auf innere Differenzierung spielen für die konkrete Umsetzung im Unterricht eine bedeutende Rolle. TIMSS 2007 zeigte, dass Lehrer/ innen häufiger Maßnahmen zur inneren Differenzierung im Mathematikunterricht umsetzen, je wichtiger diese für sie sind (Schwantner, 2013, S. 116 f.). Bei TIMSS 2011 wurden Lehrer/innen und Schulleiter/innen gebeten einzuschätzen, inwieweit sie es für notwendig halten, ihren Unterricht an die individuellen Lernvoraussetzungen eines jeden Schülers/einer jeden Schülerin anzupassen. Tabelle zeigt die Einschätzung der Notwendigkeit innerer Differenzierung aus Lehrersicht. Lehrkräfte von mehr als der Hälfte der Schüler/innen (58 %) geben dabei an, dies für sehr notwendig zu erachten, Lehrkräfte von 41 % antworteten mit notwendig. Demnach werden fast alle Schüler/innen in der 4. Klasse Volksschule von einer Lehrkraft unterrichtet, die von der Notwendigkeit, ihren Unterricht an die individuellen Lernvoraussetzungen eines jeden Schülers/einer jeden Schülerin anzupassen, überzeugt ist. Auch der Zusammenhang zwischen der Einschätzung der Notwendigkeit innerer Differenzierung durch die Lehrer/ innen bei TIMSS 2011 und der Umsetzung im Mathematikunterricht ist signifikant (r =.24, p =.000), allerdings deutlich geringer als der Zusammenhang zwischen der Wichtigkeitsüberzeugung und der Umsetzung bei TIMSS 2007 (r =.62, p =.000; s. Schwantner, 2013, S. 116). Dies könnte darin begründet sein, dass die Notwendigkeit bei TIMSS 2011 lediglich mit einer Frage erfasst wurde, wohingegen die Frage zur Wichtigkeit im Lehrerfragebogen bei TIMSS 2007 aus 14 Einzelitems bestand, die sich zum Großteil mit spezifischen Maßnahmen des Prozessstandardbereichs Erarbeiten decken (s. Schwantner, 2013, S. 89 f.). Die Einschätzung der Notwendigkeit, den Unterricht an die individuellen Lernvoraussetzungen der Kinder anzupassen, ist auch aus Sicht der Schulleiter/innen gegeben. Knapp drei Viertel (74 %) der Schüler/innen besucht eine Schule, deren Leiter/in dies als sehr notwendig erachtet, Schulleiter/ innen von einem Viertel der Schüler/innen erachten dies als notwendig (s. Tabelle 3.2.2). Vergleicht man die Antworthäufigkeiten der Lehrer/innen und Schulleiter/innen, so fällt auf, dass Schulleiter/innen es häufiger als sehr notwendig erachten, den Unterricht an die Lernvoraussetzung der Schüler/innen anzupassen, wohingegen Lehrer/innen dies häufiger nur als notwendig beurteilen. Insgesamt ist jedoch klar feststellbar, dass sowohl ein Großteil der Lehrer/innen als auch der Schulleiter/innen es für erforderlich halten, dass im Unterricht auf die Lernvoraussetzungen der einzelnen Schüler/innen eingegangen wird. Notwendigkeit innerer Differenzierung aus Lehrersicht Inwieweit halten Sie es für notwendig, Ihren Unterricht an die individuellen Lernvoraussetzungen eines jeden Schülers/einer jeden Schülerin anzupassen? Angaben in Prozent der Schüler/innen sehr notwendig notwendig wenig notwendig gar nicht notwendig Tabelle 3.2.1: Notwendigkeit innerer Differenzierung aus Lehrersicht (TIMSS 2011) Notwendigkeit innerer Differenzierung aus Schulleitersicht Inwieweit halten Sie es für notwendig, dass die Lehrkräfte Ihrer Schule ihren Unterricht an die individuellen Lernvoraussetzungen eines jeden Schülers/einer jeden Schülerin anpassen? Angaben in Prozent der Schüler/innen sehr notwendig notwendig wenig notwendig gar nicht notwendig Tabelle 3.2.2: Notwendigkeit innerer Differenzierung aus Sicht der Schulleiter/innen (TIMSS 2011)

133 Innere Differenzierung im Mathematikunterricht 131 Umsetzung innerer Differenzierung im Mathematikunterricht Im folgenden Abschnitt wird der Frage nachgegangen, wie oft in Anlehnung an die vorab beschriebenen Prozessstandards spezifische Maßnahmen innerer Differenzierung im Mathematikunterricht in der Volksschule aus Sicht der Schüler/innen und Lehrer/innen umgesetzt werden. Die Ergebnisse können dabei zwischen den zwei Erhebungszeitpunkten TIMSS 2007 und 2011 verglichen werden. Wo es möglich und sinnvoll ist, fließen ergänzend Ergebnisse zum Leseunterricht aus PIRLS 2011 ein. Abschließend wird dargestellt, wie Schulleiter/innen die Umsetzung innerer Differenzierung an ihrer Schule einschätzen. Umsetzung innerer Differenzierung im Mathematikunterricht aus Schülersicht Abbildung zeigt, wie oft aus Sicht der Schüler/innen Maßnahmen innerer Differenzierung der Prozessstandardbereiche Erarbeiten und Rückmelden im Mathematikunterricht vorkommen. Betrachtet man die Verteilung der Antworthäufigkeiten zum Prozessstandardbereich Erarbeiten, fällt auf, dass mehr als die Hälfte der Schüler/innen (61 %) regelmäßig die Gelegenheit bekommen, neue Aufgabenstellungen selbstständig zu erarbeiten. In Bezug auf den Umgang mit unterschiedlichen Lösungswegen ist festzustellen, dass es gängige Praxis ist, dass die Lehrkraft gemeinsam mit den Kindern verschiedene Lösungswege erarbeitet. Dies ist laut Angabe von 77 % der Schüler/innen regelmäßig der Fall. Demgegenüber kommt es seltener vor, dass die Lehrkräfte eigenständige Lösungen der Schüler/innen bei einer neuen Aufgabenstellung besprechen (46 % zumindest in den meisten Stunden). Ein Viertel der Schüler/innen gibt an, dass sie so gut wie nie bei einer neuen Aufgabe gefragt werden, wie sie diese gelöst haben. Maßnahmen, die den Kindern darüber hinaus Freiraum für selbstbestimmtes Arbeiten ermöglichen würden, und die relativ einfach umzusetzen wären, sind die freie Wahl der Sozialform und die freie Wahl der Aufgabenreihenfolge. Während etwas mehr als die Hälfte der Schüler/ innen (54 %) regelmäßig Gelegenheit hat, selbst zu bestimmen, in welcher Reihenfolge Aufgaben bearbeitet werden, kommt die freie Wahl der Sozialform nur sehr selten vor (24 % zumindest in den meisten Stunden). Fast die Hälfte der Kinder gibt an, fast nie aussuchen zu dürfen, ob sie alleine, zu zweit oder in einer kleinen Gruppe arbeiten. Zum Bereich Rückmelden zeigt das Ergebnis, dass 41 % der Schüler/innen regelmäßig Auskunft über ihren Lernstand bekommen. Fast ein Drittel der Schüler/innen gibt jedoch an, dass die Lehrkraft so gut wie nie mit ihnen bespricht, was sie schon gut können, und was sie noch mehr üben müssen. Für ein weiteres knappes Drittel kommt dies in einigen Stunden vor. Ein sehr ähnliches Ergebnis zeigt dieselbe Frage zum Leseunterricht im Rahmen von PIRLS , wobei die unterschiedlichen Antwortkategorien zu beachten sind (s. Abbildung 3.2.2). Erarbeiten Bei einer neuen Aufgabe darf ich selber probieren, wie das funktioniert. Bei einer neuen Aufgabe fragt mich die Lehrerin, auf welche Weise ich sie gelöst habe. Die Lehrerin erarbeitet mit uns verschiedene Wege, wie man eine Aufgabe lösen kann. Ich darf mir aussuchen, ob ich alleine, zu zweit oder in einer kleinen Gruppe arbeite. Wenn mehrere Übungen zu machen sind, darf ich mir aussuchen, in welcher Reihenfolge ich sie mache (auf einem Arbeitsblatt, im Mathematikbuch). Rückmelden Die Lehrerin bepricht mit mir, was ich bereits gut kann und was ich noch mehr üben muss % in jeder Stunde in den meisten Stunden in einigen Stunden nie oder fast nie Abbildung Umsetzung innerer Differenzierung aus Schülersicht (TIMSS 2011) 4 Die Angaben beziehen sich auf die 4670 Schüler/innen, die den Lese-Teil des PIRLS-TIMSS-2011-Schülerfragebogens ausgefüllt haben.

134 132 Innere Differenzierung im Mathematikunterricht Meine Lehrerin bespricht mit mir, was ich beim Lesen bereits gut kann und was ich noch mehr üben muss % % jeden Tag oder fast jeden Tag 1- bis 2-mal pro Monat 1- bis 2-mal pro Woche nie oder fast nie Abbildung Rückmeldung zum Lesen aus Schülersicht (PIRLS 2011) Umsetzung innerer Differenzierung im Mathematikunterricht aus Schülersicht im Trend Die etwas ausführlichere Befragung der Schüler/innen zur Umsetzung der Prozessstandards zur inneren Differenzierung im Mathematikunterricht bei TIMSS 2007 zeigte, dass jene Maßnahmen, die den Schülerinnen und Schülern selbstständiges Arbeiten und Freiräume ermöglichen, im Vergleich zu Maßnahmen, die eine Führung durch die Lehrperson beinhalten, eher selten vorkommen (Schwantner, 2013, S. 92). Bei TIMSS 2011 lässt sich bei allen sechs Items, die auf Freiräume für selbstbestimmtes Arbeiten f okussieren, eine leichte Zunahme bei den beiden Kategorien in jeder Stunde und in den meisten Stunden bei gleichzeitiger leichter Abnahme bei den beiden negativen Kategorien feststellen. So ist der Anteil an 10-Jährigen, die in jeder Stunde eine neue Aufgabenstellung selbst erarbeiten dürfen, um acht Prozentpunkte gestiegen. Etwas größer ist auch der Anteil an 10-Jährigen, die zumindest in den meisten Stunden nach ihrem individuellen Lösungsweg gefragt werden sowie die Sozialform oder die Aufgabenreihenfolge frei wählen dürfen. Ebenso höher ist der Anteil jener Schüler/innen, die angeben, zumindest in den meisten Stunden Rückmeldung über ihren Leistungsstand zu erhalten. Das Erarbeiten verschiedener Lösungswege gemeinsam mit der Lehrkraft ist hingegen von 2007 auf 2011 etwas zurückgegangen (Schwantner, 2013, S. 94 f.). Demnach zeigt sich eine leichte Tendenz, dass Maßnahmen, die eine selbsttätige Auseinandersetzung mit dem Lehrstoff ermöglichen und Freiräume schaffen, häufiger umgesetzt werden. Auch ein Mittelwertvergleich über die sechs korrespondierenden Items aus TIMSS 2007 und TIMSS 2011 zeigt, dass die Schüler/innen im Jahr 2011 insgesamt häufiger innere Differenzierung erleben als die Schüler/ innen im Jahr 2007 (t = 3.13, p =.000; s. Tabelle 3.2.3). Aufgrund der zugewiesenen Codes für die Ausprägungen (Wert 1 für in jeder Stunde und Wert 4 für nie oder fast nie ), bedeutet der geringere Mittelwert im Erhebungsjahr 2011, dass innere Differenzierung häufiger umgesetzt wird. MW Umsetzung innerer Differenzierung im Mathematikunterricht aus Lehrersicht Abbildung zeigt, wie oft nach Angaben der Lehrer/innen Differenzierungsmaßnahmen, die den beiden Prozessstandardbereichen Diagnostizieren und Erarbeiten zugeordnet sind, im Mathematikunterricht umgesetzt werden. Da bei den Lehrerangaben eine deutliche Tendenz zu den mittleren Antwortkategorien festzustellen ist, wurden die zwei Antwortkategorien, die eine regelmäßige Umsetzung repräsentieren, zu zumindest in den meisten Stunden zusammengefasst, und die beiden Antwortkategorien, die eine weniger regelmäßige Umsetzung repräsentieren, zu maximal in einigen Stunden 5. Im Hinblick auf das Diagnostizieren scheint das Erfassen des Vorwissens der Schüler/innen in Bezug auf ein neues Stoffgebiet ein regelmäßiger Bestandteil des Unterrichts zu sein. Mehr als die Hälfte der Schüler/innen werden von einer Lehrkraft unterrichtet, die dies regelmäßig durchführt. Im Hinblick auf lösungswegbezogenes Erarbeiten fällt auf, dass jene Maßnahme am häufigsten zu beobachten ist, die indirekt am meisten Lenkung durch die Lehrkraft erfordert, nämlich das gemeinsame Erarbeiten verschiedener Lösungswege. Etwas weniger häufig kommt es vor, dass Lehrer/innen den Lösungsweg einzelner Schüler/innen besprechen. Nur ein Viertel der Schüler/innen erhält nach Angaben der Lehrer/innen zumindest in den meisten Stunden Gelegenheit, eine neue Aufgabenstellung selbst zu erarbeiten, gegenüber 75 %, die dazu maximal in einigen Stunden Gelegenheit bekommen. Betrachtet man die strukturellen Maßnahmen zur Schaffung von Freiräumen, so wird die freie Wahl der Aufgabenreihenfolge deutlich öfter und regelmäßiger umgesetzt als die freie Wahl der Sozialform, die nur bei einem Viertel der Schüler/innen regelmäßig umgesetzt wird. Interessant ist, dass sich Schüler/innen im Leseunterricht öfter selbst aussuchen dürfen, ob sie allein, zu zweit oder in einer kleinen Gruppe arbeiten möchten (40 % zumindest in den meisten Stunden vs. 60 % maximal in einigen Stunden). SE t-wert DIFF Tabelle 3.2.3: Mittelwertvergleich der Items zur Umsetzung innerer Differenzierung aus Schülersicht zwischen TIMSS 2007 und TIMSS Die vier Antwortkategorien lauten gleich wie im Schülerfragebogen: in jeder Stunde/in den meisten Stunden/in einigen Stunden/nie oder fast nie.

135 Innere Differenzierung im Mathematikunterricht 133 Diagnostizieren Das Vorwissen der Schüler/innen in Bezug auf ein neues Stoffgebiet erfassen Erarbeiten Verschiedene Lösungswege für eine Aufgabenstellung mit den Schüler/innen erarbeiten Den Lösungsweg einzelner Schüler/innen zu einer Fragestellung besprechen Die Schüler/innen eine neue Aufgabenstellung selbst erarbeiten lassen Die Schüler/innen aussuchen lassen, in welcher Reihenfolge sie Aufgabestellungen/Übungen bearbeiten (z. B. im Lehrbuch, auf einem Arbeitsblatt) Die Schüler/innen aussuchen lassen, ob sie alleine, zu zweit oder in einer kleinen Gruppe arbeiten % zumindest in den meisten Stunden maximal in einigen Stunden Angaben in Prozent der Schüler/innen Abbildung 3.2.3: Umsetzung innerer Differenzierung im Mathematikunterricht aus Sicht der Lehrer/innen (TIMSS 2011) Mathematikunterricht Leseunterricht (TIMSS 2011) (PIRLS 2011) Ich unterrichte die ganze Klasse gemeinsam in Mathematik/Lesen Ich gebe individuell abgestimmten Mathematikunterricht/Leseunterricht Angaben in Prozent der Schüler/innen % mindestens oft maximal manchmal Abbildung 3.2.4: Gemeinsamer Unterricht versus Individualisierung im Mathematikunterricht (TIMSS 2011) und im Leseunterricht (PIRLS 2011) Das Ergebnis weist darauf hin, dass im (Mathematik-) Unterricht Maßnahmen vorrangig umgesetzt werden, die eine Lenkung durch die Lehrkraft und ein gemeinsames Vorgehen der Schüler/innen involvieren. Eine ergänzende Frage, die aus dem internationalen PIRLS-Fragebogenteil auf nationaler Ebene auch für Mathematik eingesetzt wurde, zeigt, dass 86 % der Schüler/innen von einer Lehrkraft unterrichtet werden, die angibt, die ganze Klasse oft gemeinsam in Mathematik zu unterrichten (s. Abbildung 3.2.4). Im Gegensatz dazu geben Lehrkräfte von weniger als einem Viertel der Kinder an, individuell abgestimmten Mathematikunterricht zu geben. Beim Lesen wird der Unterricht etwas häufiger individuell abgestimmt: gut ein Drittel der Kinder erhält nach Angaben der Lehrer/innen zumindest oft individuell abgestimmten Unterricht, jedoch berichten auch hier Lehrer/innen von 54 % der Kinder, die ganze Klasse oft gemeinsam zu unterrichten (s. Abbildung 3.2.4). Umsetzung innerer Differenzierung im Mathematikunterricht aus Lehrersicht im Trend Beim Vergleich der Ergebnisse zur Umsetzung innerer Differenzierung aus Lehrersicht zwischen den beiden Erhebungszeitpunkten TIMSS 2007 und TIMSS 2011 ist im Gegensatz zur Schülersicht, aus der im Mittel eine leichte Zunahme an innerer Differenzierung hervorgeht, ein leichter Rückgang zu verzeichnen. Am stärksten ist dieser bei der Maßnahme, die Schüler/innen eine neue Aufgabenstellung selbst erarbeiten zu lassen. Setzten diese Maßnahme im Jahr 2007 Lehrer/innen von 34 % der Kinder in den meisten Stunden um, machten dies im Jahr %. Der Rückgang bei den restlichen Maßnahmen beträgt zwischen minus neun Prozentpunkten (das Vorwissen der Schüler/innen erfassen) und minus 4 Prozentpunkten (den Lösungsweg einzelner Schüler/innen besprechen). Auch der Mittelwertvergleich über die sechs korrespon-

136 134 Innere Differenzierung im Mathematikunterricht dierenden Items aus TIMSS 2007 und TIMSS 2011 zur Umsetzung aus Lehrersicht zeigt eine signifikante Veränderung zwischen den beiden Erhebungszeitpunkten (t= 4.23, p=.000; s. Tabelle 3.2.4). Da aufgrund der Zuordnung der Codes zu den Antwortkategorien (1 = in jeder Stunde, 4 = nie oder fast nie ) ein geringerer Mittelwert eine höhere Umsetzungshäufigkeit anzeigt, wurde bei TIMSS 2007 aus Sicht der Lehrer/innen insgesamt häufiger differenziert als im Jahr MW SE t-wert DIFF Tabelle 3.2.4: Mittelwertvergleich der Items zur Umsetzung aus Lehrersicht zwischen TIMSS 2007 und TIMSS 2011 Übereinstimmung der Lehrer- und Schülersicht bei der Umsetzung innerer Differenzierung Das Ergebnis, dass innere Differenzierung aus Sicht der Lehrer/innen insgesamt abgenommen hat, aber aus Sicht der Schüler/innen häufiger vorkommt, kann zu einem großen Teil durch die geringe Übereinstimmung zwischen Lehrer- und Schülerangaben generell und zum anderen mit den spezifischen Entwicklungen der einzelnen Maßnahmen erklärt werden. Berechnet man das Übereinstimmungsmaß 6 zwischen den fünf korrespondierenden Items aus Lehrer- und Schülerfragebogen zur Umsetzung innerer Differenzierung, so zeigt sich, dass die Übereinstimmung bei beiden Erhebungszeitpunkten 7 nur gering ist. Die Kappa- Werte liegen je nach Maßnahme zwischen.008 und.135. Eine mögliche Erklärung dafür könnte das unterschiedliche Antwortverhalten von Lehrkräften und Schülerinnen/ Schülern sein. So tendieren Lehrer/innen bei ihren Angaben zu den mittleren beiden Antwortkategorien, während die Schülerangaben mehr über alle vier Antwortkategorien verteilt sind. Zwei der fünf Maßnahmen wurden bei beiden Erhebungen von den Kindern deutlich öfter angegeben als von den Lehrkräften: eine neue Aufgabenstellung selbst erarbeiten sowie verschiedene Lösungswege gemeinsam mit der Lehrperson erarbeiten. Die drei weiteren Maßnahmen werden hingegen von den Lehrkräften öfter und von den Kindern seltener angegeben. So berichten 49 % der Schüler/innen, dass sie die Sozialform nie oder fast nie frei wählen dürfen, wohingegen die Lehrer/innen von nur 16 % der Kinder angeben, dies nie oder fast nie zu erlauben. 23 % der Schüler/ innen geben an, dass sie sich nie oder fast nie die Reihenfolge der zu bearbeitenden Aufgaben aussuchen dürfen, was von Lehrkräften von nur 7 % der Kinder bestätigt wird. Ähnlich starke Unterschiede zeigen sich auch bei der Besprechung individueller Lösungswege. Hier gibt immerhin gut ein Viertel der Kinder an, dass dies nie oder fast nie vorkommt, während die Lehrkräfte in dieser Antwortkategorie rund 3 % der Kinder repräsentieren. Betrachtet man die unterschiedliche Entwicklung der Antworthäufigkeiten nach Maßnahmen, so fällt dies bei der Maßnahme, Schüler/innen eine neue Aufgabenstellung selbst erarbeiten lassen, am stärksten ins Gewicht: 2011 gibt es bei dieser Maßnahme aus Lehrersicht den stärksten Rückgang (minus 16 Prozentpunkte), während 2011 mehr Schüler/innen angeben, dass dies in jeder Stunde vorkommt (plus 8 Prozentpunkte). Zudem ist bei allen Maßnahmen aus Schülersicht ein leichtes Plus ersichtlich, während aus Lehrersicht bei allen Maßnahmen ein leichter Rückgang festzustellen ist. Einzige Ausnahme ist das Erarbeiten verschiedener Lösungswege für eine neue Aufgabenstellung mit den Schülerinnen und Schülern, das sowohl aus Lehrer- als auch aus Schülersicht insgesamt weniger oft umgesetzt wird. Umsetzung innerer Differenzierung aus Schulleitersicht Auch die Schulleiter/innen wurden bei TIMSS 2011 um ihre Einschätzung gebeten, inwieweit an ihrer Schule individualisierter Unterricht stattfindet. Abbildung zeigt, dass mehr als drei Viertel (79 %) der Schüler/innen eine Schule besuchen, deren Leiter/in davon ausgeht, dass Lehrer/ innen den Unterricht an die individuellen Lernvor- Inwieweit passen die Lehrkräfte Ihrer Schule den Unterricht tatsächlich an die individuellen Lernvoraussetzungen der Schüler/innen an? 79 0 % % in jeder oder fast jeder Klasse in einigen Klassen in ungefähr der Hälfte der Klassen in keiner Klasse Angaben in Prozent der Schüler/innen; Werte unter 1 % nicht eingetragen 16 5 Abbildung 3.2.5: Umsetzung innerer Differenzierung im Volksschulunterricht (TIMSS 2011) 6 Als Maß für die Berechnung der Übereinstimmung zwischen der Umsetzungshäufigkeit aus Lehrer- und Schülersicht wurde Cohens Kappa für verbundene Stichproben verwendet. Kappa liegt zwischen 1 und +1. Werte nahe 1 zeigen eine hohe Übereinstimmung in den Aussagen, nahe 0 keine Übereinstimmung und Werte nahe 1 eine hohe Diskrepanz. 7 Für TIMSS 2007 vgl. Schwantner, 2010, S. 199.

137 Innere Differenzierung im Mathematikunterricht 135 aussetzungen der Schüler/innen anpassen. 16 % gehen davon aus, dass dies in ca. der Hälfte der Klassen umgesetzt wird, 5 % in einigen Klassen. Die Erwartungen der Schulleiter/innen an die Umsetzung innerer Differenzierung sind damit durchaus hoch. Unterrichtssteuerung Im Folgenden wird das Ausmaß an Lehrer- und Schülersteuerung im Unterricht dargestellt und analysiert, ob differenzierter Unterricht mehr lehrer- oder schülergesteuert ist. Differenzierter Unterricht, der auf den Lernprozess der Schüler/innen fokussiert und selbstständiges Arbeiten ermöglicht, setzt eine gute Balance aus Lehrer- und Schülersteuerung voraus. Bezugnehmend auf die zu Beginn definierten Prozessstandards findet Lenkung durch die Lehrkraft im differenzierten Unterricht vor allem auf Basis der Festlegung und Gliederung der Lernziele in Fundamentum und Additum in Abstimmung mit den kognitiven und motivationalen Lernvoraussetzungen der Schüler/innen statt. Laut Herber (1983) ist es dabei wichtig, die Schüler/innen aktiv in die Planung einzubeziehen. Der Prozessstandardbereich Erarbeiten ist hingegen durchgehend von der Selbsttätigkeit der Schüler/innen gekennzeichnet, wobei die Lehrkraft mit gezielten Hilfestellungen und bereitgestellten Arbeitsaufgaben den Lernprozess unterstützt. Eine adäquate Rückmeldung wiederum gibt den Kindern Informationen darüber, was sie bereits gut können und wo noch Lernbedarf ist. Im Rahmen von TIMSS 2011 und 2007 wurden die Lehrer/innen gebeten, auf einer sechsstufigen Skala die Art der Unterrichtssteuerung einzuschätzen (1 = lehrergesteuert, 6 = schülergesteuert). Im Fragebogen wurde mit lehrergesteuert ein Unterricht beschrieben, der ein fixes Lernprogramm für alle Schüler/innen gleichermaßen vorsieht und dabei keine Wahlmöglichkeiten bietet und bei dem die ganze Klasse gemeinsam von Teilziel zu Teilziel geht. Als schülergesteuert wurde ein Unterricht beschrieben, bei dem die Schüler/innen aus einem Angebot frei wählen können, wie z. B. Themen, Materialien, die Sozialform oder das individuelle Lerntempo. Abbildung zeigt das Ausmaß an Lehrer- bzw. Schülersteuerung im österreichischen Mathematikunterricht bei TIMSS Es zeigt sich, dass Mathematikunterricht in der Volksschule eher lehrergesteuert durchgeführt wird (69 % in den Kategorien 1 3). Knapp ein Drittel der Schüler/innen wird von einer Lehrkraft unterrichtet, die mehr zu Schülersteuerung tendiert. Vergleicht man im Sinne einer ausgewogenen Balance aus Lehrer- und Schülersteuerung auf Basis der Prozessstandards nur die beiden mittleren Antwortkategorien (3 und 4), so ist auch hier die deutliche Mehrheit auf Seiten der Lehrersteuerung ersichtlich (26 % gegenüber 11 % Schülersteuerung). Die Berechnungen wurden auch mit den PIRLS-Daten zum Leseunterricht durchgeführt und zeigen ein übereinstimmendes Ergebnis. Unterrichtssteuerung in Mathematik im Trend Da die Unterrichtssteuerung sowohl bei TIMSS 2007 als auch bei TIMSS 2011 erhoben wurde, können die Ergebnisse zwischen den beiden Erhebungszeitpunkten ver glichen werden. Dabei zeigen sich nur sehr kleine Veränderungen in den Antwortverteilungen über die sechs Stufen, die durch zufällige Schwankungen bedingt und statistisch unbedeutend sind. Auch der Mittelwertvergleich 8 (s. Tabelle 3.2.5) zeigt keine statistisch signifikante Veränderung. MW SE t-wert DIFF Tabelle 3.2.5: Mittelwertvergleich der Unterrichtssteuerung aus Lehrersicht zwischen TIMSS 2007 und TIMSS 2011 Lehrer- vs. Schülersteuerung im Mathematikunterricht in Österreich Lehrersteuerung Schülersteuerung Wert 1: stark lehrergesteuert Wert 2 Wert 3 Wert 4 Wert 5 Wert 6: stark schülergesteuert Angaben in Prozent der Schüler/innen Abbildung 3.2.6: Lehrer- vs. Schülersteuerung im Mathematikunterricht in Österreich (TIMSS 2011) 8 Auf der sechsstufigen Skala steht 1 für lehrergesteuert und 6 für schülergesteuert. Je höher der Mittelwert ist, desto mehr Schülersteuerung liegt vor.

138 136 Innere Differenzierung im Mathematikunterricht Unterrichtssteuerung und innere Differenzierung Im Folgenden wird analysiert, wie sich der Zusammenhang zwischen innerer Differenzierung und Unterrichtssteuerung im Mathematikunterricht gestaltet. Sowohl bei TIMSS 2011 als auch bei TIMSS 2007 zeigt sich nach der oben vorgenommenen Definition erwartungskonform, dass eine höhere Umsetzungshäufigkeit von innerer Differenzierung im Mathematikunterricht mit einer stärkeren Schülersteuerung einhergeht 9. Der Zusammenhang ist dabei bei TIMSS 2007 um einiges stärker (r =.44, p =.000) als bei TIMSS 2011 (r =.28, p =.000). Dies lässt sich zum Großteil dadurch begründen, dass die Skala zur Umsetzung innerer Differenzierung aus Lehrersicht bei TIMSS 2007 insgesamt 14 Items umfasste, von denen bei TIMSS 2011 nur sechs eingesetzt wurden 10. Selbstständiges Arbeiten im Mathematik- und Leseunterricht Ergänzend zur Frage nach der Unterrichtssteuerung sind auch die Ergebnisse auf die Frage, wie oft Schüler/innen selbstständig arbeiten 11, interessant. Dabei wurde unterschieden, ob die Kinder nach einem festgelegten Plan/ einer festgelegten Zielvorgabe arbeiten oder selbstständig auf ein selbst gewähltes Ziel hinarbeiten. Wie vorab beschrieben, sind im Sinne der Prozessstandards beides adäquate Möglichkeiten, je nachdem, zu welchem Zeitpunkt (z. B. während der Planung oder der Erarbeitung) und wie die Lenkung erfolgt (z. B. durch Festlegung und Kommunikation der Fundamentums- und Additumsziele, gezielte Hilfestellungen bei individuellen Lösungsmöglichkeiten etc.). Abbildung zeigt die Ergebnisse zur Frage nach den Zielvorgaben bei selbstständigem Arbeiten getrennt für den Mathematik- und den Leseunterricht. Laut Angaben der Lehrer/innen ist dabei die überwiegende Form des selbstständigen Arbeitens durch einen festgelegten Plan oder eine festgelegte Zielvorgabe gelenkt. Gelegenheit, auf ein selbst gewähltes Ziel hinzuarbeiten, bieten Lehrkräfte im Mathematikunterricht von 17 %, im Leseunterricht von mehr als einem Drittel der Schüler/innen regelmäßig. Insgesamt kommen im Leseunterricht beide Formen des selbstständigen Arbeitens etwas häufiger vor. Abgesehen von den Zielvorgaben, die dem Prozessstandardbereich Planen zugeschrieben werden können, ist für das selbstständige Arbeiten wichtig, dass auch die Prozessstandards der Bereiche Diagnose, Erarbeiten und Rückmeldung umgesetzt werden. Nur über die Vernetzung aller vier Bereiche wird sichergestellt, dass (a) alle Schüler/innen über die kognitiven Voraussetzungen (z. B. Vorwissen) verfügen, um die Anforderungen selbstständig bewältigen zu können, (b) es adäquate Aufgaben gibt, die das selbstständige Erarbeiten eines Stoffgebiets durch die Schüler/innen unterstützen, (c) individuelle Lösungswege ermöglicht und besprochen werden, (d) genügend Freiräume geschaffen werden (z. B. freie Wahl der Sozialform, Selbstkontrolle), (e) die Schüler/innen über ihren Lernstand informiert sind (z. B. regelmäßiges sachbezogenes Feedback, das sich am individuellen Referenzrahmen orientiert) und ihren Lernprozess zunehmend eigenständig und selbstbestimmt gestalten können. Die Schüler/innen arbeiten selbstständig nach einem festgelegten Plan oder einer Zielvorgabe. Mathematikunterricht Leseunterricht (TIMSS 2011) (PIRLS 2011) Die Schüler/innen arbeiten selbstständig auf ein selbst gewähltes Ziel hin Angaben in Prozent der Schüler/innen % mindestens oft maximal manchmal Abbildung 3.2.7: Selbstständiges Arbeiten im Mathematikunterricht (TIMSS 2011) und im Leseunterricht (PIRLS 2011) 9 Aufgrund der vergebenen Codes für die Antwortkategorien (1 = in jeder Stunde und 4 = nie oder fast nie ) bei der Frage nach der Umsetzung innerer Differenzierung bedeuten geringere Werte eine höhere Umsetzungshäufigkeit. Bei der Unterrichtssteuerung zeigen höhere Werte eine stärkere Schülersteuerung an. Demnach bedeutet das negative Vorzeichen bei der Korrelation, dass niedrigere Werte bei der inneren Differenzierung (höhere Umsetzungshäufigkeit) mit höheren Werten bei der Steuerung (mehr Schülersteuerung) einhergehen, bzw. höhere Werte bei der inneren Differenzierung (geringere Umsetzungshäufigkeit) mit niedrigeren Werten bei der Unterrichtssteuerung (mehr Lehrersteuerung). 10 Bei TIMSS 2007 wurde der Faktor zur Umsetzung innerer Differenzierung aus Lehrersicht aus 14 Items gebildet. Der Faktor klärt 34 % der Varianz auf und die Reliabilität beträgt.85 (Cronbachs Alpha). Bei TIMSS 2011 wurde der Faktor zur Umsetzung innerer Differenzierung aus Lehrersicht aus sechs Items gebildet. Der Faktor klärt 43 % der Varianz auf. Die Reliabilität beträgt.72 (Cronbachs Alpha). Bei beiden Faktoren entsprechen aufgrund der vergebenen Codes für die Antwortkategorien (1 = in jeder Stunde ; 4 = nie oder fast nie ) niedrigere Werte einer höheren Umsetzungshäufigkeit. 11 Diese Frage war Teil des internationalen PIRLS-Lehrerfragebogens und wurde auf nationaler Ebene auch für TIMSS (nur für den Mathematikunterricht) übernommen.

139 Innere Differenzierung im Mathematikunterricht 137 Resümee Die vorliegenden Ergebnisse zum Mathematikunterricht bei TIMSS 2011 zeigen, dass innere Differenzierung aus Sicht der Lehrer/innen und Schulleiter/innen als notwendig erachtet wird. Die Erwartungen der Schulleiter/innen an die Umsetzung innerer Differenzierung sind dabei durchaus hoch. So gehen Schulleiter/innen überwiegend davon aus, dass Lehrer/innen den Unterricht an die individuellen Lernvoraussetzungen der Schüler/innen anpassen. Hinsichtlich der Umsetzung innerer Differenzierung im Mathematikunterricht in der vierten Klasse Volksschule geben die Ergebnisse der Schüler- und Lehrerbefragung einen guten Überblick. Generell ist zur Umsetzung der Prozessstandards anzumerken, dass es schwierig ist, ein einheitliches Maß dafür festzulegen, ab welcher Umsetzungshäufigkeit ein Prozessstandard als erfüllt gilt. So wird beispielsweise das Vorwissen der Schüler/innen in Bezug auf ein neues Stoffgebiet wohl immer erfasst, bevor ein neues Stoffgebiet begonnen wird. Eine neue Aufgabenstellung wird nur so oft selbstständig erarbeitet werden, wie es auch eine neue Aufgabenstellung gibt. Unter der Annahme, dass die Prozessstandards ein umfassendes Unterrichtskonzept repräsentieren, sollten jedoch alle Maßnahmen zumindest in den meisten Stunden vorkommen. Darauf bezogen zeigen die Ergebnisse zur Umsetzung der inneren Differenzierung, dass zentrale Prozessstandards der Bereiche Erarbeiten und Rückmelden eine selbsttätige Auseinandersetzung mit dem Lernstoff (z. B. selbstständiges Erarbeiten einer neuen Aufgabenstellung, eigenständige Lösungswege besprechen), Freiräume für selbstbestimmtes Arbeiten (z. B. durch die freie Wahl der Sozialform) und eine regelmäßige systematische Leistungsrückmeldung noch nicht hinreichend erfüllt sind. Zudem wird die überwiegende Mehrheit der Schüler/innen in Mathematik von einer Lehrkraft unterrichtet, die angibt, die ganze Klasse meistens gemeinsam zu unterrichten. Schüler/ innen, die laut Angaben der Lehrer/innen individuell abgestimmten Unterricht erhalten, sind dem - gegenüber sowohl im Mathematik- als auch im Leseunterricht in der Minderzahl. Dies deckt sich mit den Angaben der Volksschullehrerbefragung im Rahmen der Bildungsstandard-Baseline-Testung in der vierten Klasse im Jahr 2010 in Österreich. Auch hier zeigt sich, dass die Mehrheit der Kinder in der Gesamtgruppe unterrichtet wird, wenngleich diese Unterrichtsform laut Angaben der Autorinnen und Autoren zugunsten angeleiteter Kleingruppen-, Partner- und Einzelarbeit zurückgeht (Vogtenhuber et al., 2012, S. 80). Auffallend ist das Ergebnis, dass innere Differenzierung zwischen den zwei Erhebungszeitpunkten TIMSS 2007 und 2011 aus Sicht der Schüler/innen zugenommen hat, wohingegen diese aus Lehrersicht etwas zurückgegangen ist. Aus Schülerperspektive ist dabei vor allem in Bezug auf Maß nahmen, die Freiräume schaffen und selbstständiges Arbeiten ermöglichen, eine positive Entwicklung festzustellen. Die divergierende Entwicklung aus Schüler- und Lehrersicht kann zum Großteil durch generelle Divergenzen in den Schüler- und Lehrerangaben erklärt werden. Dazu ist kritisch anzumerken, dass es sich bei beiden um subjektive Einschätzungen handelt, die nicht überprüft wurden bzw. im Rahmen der vorliegenden Untersuchung auch nicht überprüft werden konnten (z. B. anhand von Verhaltensbeobachtungen). Vor allem bei der Selbstauskunft der Lehrer/ innen über die Häufigkeit der Umsetzung (aber auch bei der Einschätzung der Wichtigkeit von innerer Differenzierung und der Vorbereitung auf innere Differenzierung) kann nicht ausgeschlossen werden, dass diese einer sozial erwünschten Bewertung unterliegt. Die in den Ergebnissen ersichtliche Tendenz im Antwortverhalten der Lehrer/ innen zu den mittleren Antwortkategorien unterstützt diese Annahme. Eine Möglichkeit, das Ausmaß sozial erwünschen Antwortverhaltens zu kontrollieren, würde die Einbindung begleitender Dokumentenanalysen (z. B. klassenweise Durchsicht der angebotenen Aufgaben und der Unterrichtspläne) in die Erhebung bieten. Hinsichtlich Unterrichtssteuerung konnte festgestellt werden, dass diese überwiegend von der Lehrkraft ausgeht, obgleich in der Anregung der Selbststeuerung und Selbsttätigkeit der Schüler/innen ein großes Potenzial für mehr innere Differenzierung liegt, indem die Schüler/innen zunehmend zu Expertinnen und Experten ihres eigenen Lernprozesses werden. Diesbezüglich konnte auch keine Weitere ntwicklung im Vergleich zur Erhebung im Jahr 2007 festgestellt werden. Bezüglich Lenkung bei selbstständigem Arbeiten zeigt sich, dass dies überwiegend durch einen festgelegten Plan oder eine festlegte Zielvorgabe durch die Lehrkraft geschieht. Gelegenheit, auf ein selbstgewähltes Ziel hinzuarbeiten, gibt es nur für sehr wenige Schüler/innen. Dieses Ergebnis entspricht jenem der Volksschullehrerbefragung im Rahmen der Bildungsstandard- Baseline- Testung 2010: Laut Angaben der Lehrer/innen kommen auch hier Maßnahmen wie das selbstständige Arbeiten nach einer Zielvorgabe (z. B. Wochenplan) viel häufiger vor, als dass die Schüler/innen aus einer Auswahl von Lernzielen eines wählen, auf das sie selbstständig hinarbeiten (Vogtenhuber et al., 2012, S. 81). Insgesamt zeigen die Ergebnisse, dass innere Differenzierung bezogen auf die Prozessstandards noch nicht hinreichend umgesetzt wird. Aufgrund der Begrenztheit der Fragebogenerhebung ist es jedoch schwierig festzustellen, inwieweit innere Differenzierung überhaupt als Gesamtkonzept von der Planung und Vorbereitung, über die Diagnose und das Erarbeiten bis hin zur Leistungsrückmeldung realisiert wird. Die vorliegenden Daten geben vielmehr Auskunft über die Umsetzungshäufigkeit verschiedener Maßnahmen. In diesem Zusammenhang kommen auch Bohl, Batzel & Richey (2012) nach Sichtung diverser Forschungsbefunde aus Deutschland zum Thema Binnen-

140 138 Innere Differenzierung im Mathematikunterricht differenzierung zu dem Schluss: Die Forschungslage macht deutlich, dass innerhalb einer gewissen methodischen Vielfalt zumeist aus der Perspektive befragter Lehrkräfte durchaus differenziert wird. Inwiefern Differenzierungsmaßnahmen in den realen Mikroprozessen des Unterrichts (z. B. Aufgaben) realisiert werden, kann derzeit nicht umfassend geklärt werden (S. 54). In dieser Hinsicht geben die Befragungen über die Prozessstandards der inneren Differenzierung im Mathematikunterricht bei TIMSS 2007 und TIMSS 2011 zumindest einen guten Überblick über den Ist-Stand der inneren Differenzierung in der Volksschule. Für eine zuverlässigere und validere Erfassung im Sinne einer Umsetzung der Prozessstandards als umfassende Unterrichtskonzeption wären zuzüglich zur Befragung der Lehrer/innen und Schüler/innen systematische Unterrichtsbeobachtungen, ergänzt durch Dokumentenanalysen, notwendig. Literatur Altrichter H., Trautmann M., Wischer B., Sommerauer S. & Doppler, B. (2009). Unterrichten in heterogenen Gruppen: Das Qualitätspotenzial von Individualisierung, Differenzierung und Klassenschülerzahl. In W. Specht (Hrsg.), Nationaler Bildungsbericht Österreich Band 2. Fokussierte Analysen bildungspolitischer Schwerpunktthemen ( ). Graz: Leykam. Beer, R. & Benischek, I. (2011). Aspekte kompetenzorientierten Lernens und Lehrens. In BIFIE (Hrsg.), Kompetenzorientierter Unterricht in Theorie und Praxis (5 28). Graz: Leykam BMUKK (n. d.). SQA Schulqualität Allgemeinbildung des BMUKK. Zugriff am unter schulen/schubf/se/sqa.xml BMUKK ( ). Rundschreiben des Bundesministeriums für Unterricht, Kunst und Kultur Rundschreiben: ; BMUKK /0080-I/4/2013 ; SQA Schulqualität Allgemeinbildung: Richtlinien für das Schuljahr 2013/14. Zugriff am unter Bohl, T., Batzel, A. & Richey, P. (2012). Öffnung Differenzierung Individualisierung Adaptivität. Charakteristika, didaktische Implikationen und Forschungsbefunde verwandter Unterrichtskonzepte zum Umgang mit Heterogenität. In T. Bohl, M. Bönsch, M. Trautmann & B. Wischer (Hrsg.), Binnendifferenzierung. Teil 1: Didaktische Grundlagen und Forschungsergebnisse zur Binnendifferenzierung im Unterricht (40 69). Immenhausen bei Kassel: Prolog-Verlag. Herber, H.-J. (1983). Innere Differenzierung im Unterricht. Stuttgart: Kohlhammer. Schwantner, U. (2010). Differenzierende Maßnahmen im Mathematikunterricht. In B. Suchan, S. Wallner-Paschon & C. Schreiner (Hrsg.), TIMSS Mathematik & Naturwissenschaft in der Grundschule. Österreichischer Expertenbericht ( ). Graz: Leykam. Schwantner, U. (2013). Entwicklung von Prozessstandards für innere Differenzierung und deren Überprüfung im Mathematikunterricht in der 4. Schulstufe. Unveröffentlichte Dissertation: Universität Salzburg Vogtenhuber, S., Lassnigg, L., Bruneforth, M., Gumpoldsberger, H., Toferer, B., Schmich, J., Schwantner, U., Bergmüller, S. & Eder, F. (2012). Indikatoren C: Prozesse. In M. Bruneforth & L. Lassnigg (Hrsg.), Nationaler Bildungsbericht Österreich 2012, Band 1: Das Schulsystem im Spiegel von Daten und Indikatoren (61 110). Graz: Leykam.

141 Kommentar zu: Innere Differenzierung im Mathematikunterricht 139 Kommentar zu 3.2: Innere Differenzierung im Mathematikunterricht Franz Hofmann In diesem Kommentar wird der Befund zum Status quo innerer Differenzierung im Mathematikunterricht in der Volksschule vor dem Hintergrund gegenwärtiger bildungspolitischer Trends beleuchtet; angesichts der Tatsache, dass manche Lehrpersonen diese Trends (Standardisierung und Zentralisierung vs. Appell zur Individualisierung) als nur schwer vereinbar erachten, wird darüber reflektiert, in welchem Ausmaß sich daraus resultierende Unsicherheiten in den Daten spiegeln. Weiterführende Überlegungen betreffen die Frage, welche forschungsmethodischen Implikationen sich für ähnliche zukünftige Vorhaben ableiten lassen, damit ein qualitätsvoller Befund zur Frage der tatsächlichen Unterrichtsqualität in österreichischen Klassenzimmern erstellt werden kann. Zur gegenwärtigen Dynamik im Kontext dieser Thematik In der gegenwärtigen schulpädagogischen und didaktischen Diskussion, die großflächig betrachtet durch Begriffe wie Bildungsstandards, teilstandardisierte Reifeprüfung oder SQA 1 beeinflusst wird, haben didaktische Desiderate wie Kompetenzorientierung im Unterricht (vgl. Beer & Benischek, 2011; Paechter, 2012) oder Prinzipien wie innere Differenzierung im Unterricht (vgl. Altrichter et al., 2009) bisweilen keinen leichten Stand : Sehr schnell wähnen sich Lehrpersonen wie einschlägige Erfahrungen des Autors aus zahlreichen Fortbildungssituationen zeigen in einer antinomischen Situation: Die Perspektive, dass Abschlussprüfungen (zum Teil) zentral gesteuert und standardisiert ablaufen, löst bei manchen Lehrpersonen Ängste und Befürchtungen aus; so sind Lehrpersonen bisweilen verunsichert, ob ihre Schülerinnen und Schüler bei starker Individualisierung des Unterrichts (d. h. wenn ihre individuellen Interessen, ihre persönlich bevorzugten Arbeitsformen etc. im Unterricht im Vordergrund stehen) den Anforderungen von (auch) external gesteuerten Prüfungssettings gewachsen sind. Die Kompetenz, beide Entwicklungen (nationales Monitoring, Standardisierung sowie Externalisierung einerseits und Kompetenzorientierung s owie Differenzierung im Unterricht andererseits) komplementär zu begreifen (vgl. Hofmann, 2011; Racherbäumer & Kühn, 2013) und damit als Lehrperson handlungsfähig zu bleiben, ist derzeit als ein wichtiges Fortbildungsthema zu betrachten, weil Lehrpersonen hier eigenen Angaben zufolge Unterstützungsbedarf haben. Im Kontext des hiesigen Kommentars stellt sich freilich die Frage, in welchem Ausmaß auch Lehrpersonen der Volksschule von dieser widersprüchlichen Dynamik betroffen sind; die Tatsache, dass Bildungsstandard-Überprüfungen jeweils gegen Ende der 4. Schulstufe stattfinden, mag aber die einleitenden Überlegungen auch für diese Zielgruppe als relevant erscheinen lassen 2 ; eine mögliche Konsequenz im Hinblick auf das Antwortverhalten in Befragungen zum Thema innere Differenzierung könnte darin bestehen, dass sich Lehrpersonen durch die derzeitige Entwicklung in ihrer Bereitschaft zur Umsetzung von Maßnahmen innerer Differenzierung gebremst fühlen. Interpretation einiger Diskrepanzergebnisse vor dem Hintergrund der gegenwärtigen Dynamik Zur Diskrepanz zwischen Lehrer- und Schülereinschätzungen U. Schwantner widmet in ihrem Beitrag der Frage der Übereinstimmung der Lehrer- und Schülersicht bei der Umsetzung innerer Differenzierung breiten Raum: Sie kommt zum Ergebnis, dass Schüler/innen ein positiveres Bild im Hinblick auf die Häufigkeit der Realisierung von Maßnahmen innerer Differenzierung zeichnen als die Lehrpersonen; ein detaillierter Blick zeigt dabei, dass diese Diskrepanz insbesondere bei der Frage nach der Vielfalt von möglichen Lösungswegen ( verschiedene Lösungswege gemeinsam mit der Lehrperson erarbeiten ) und bei der Frage nach dem Ausmaß an Eigenständigkeit bei der Lösungsfindung ( eine neue Aufgabenstellung selbst erarbeiten ) existiert. Vor dem Hintergrund der einleitend geäußerten Dynamik könnte diese Diskrepanz folgendermaßen interpretiert werden: Die Ängste von Lehrpersonen, ihre Schüler/innen würden bei der Überprüfung der Bildungsstandards schlecht abschneiden, zeitigen die didaktische Konsequenz, dass Vielfalt zurückgefahren wird, weil Lehrpersonen befürchten 1 Vgl. die entsprechende ministerielle Website zu Schulqualität Allgemeinbildung (SQA) unter (Zugriff vom ). 2 Zudem sei an dieser Stelle angemerkt, dass die Lehrpersonen in der 4. Klasse Volksschule auch an der Entscheidung bezüglich der weiteren Schullaufbahn ihrer Schülerinnen und Schüler beteiligt sind (im Hinblick auf die mögliche Zuerkennung der AHS-Reife; vgl. Eder & Thonhauser, 2006).

142 140 Kommentar zu: Innere Differenzierung im Mathematikunterricht könnten, dass bestimmte Schüler/innen dadurch verwirrt werden und deshalb einheitlich klar auf der Tafel demonstrierte Lösungswege zu bevorzugen seien; eine weitere Konsequenz kann darin gesehen werden, dass die betreffenden Lehrpersonen weniger auf Eigenständigkeit setzen, weil eine solche ja im Klassen plenum zu einer großen Vielfalt an Lösungsvorschlägen führen würde, folgte man der Empfehlung von Herber, dass die Lehrperson unkommentiert Lösungsvorschläge an der Tafel sammeln und erst in weiterer Folge ohne Bezug auf die jeweiligen Urheber/ innen des Lösungsvorschlags unter Qualitätsdimensionen miteinander vergleichen sollte (vgl. Herber, 1983). Zu dieser Interpretation würde auch ein weiteres, allerdings umgekehrt gerichtetes Diskrepanzergebnis passen: Die befragten Schüler/innen berichten in geringerem Ausmaß als die Lehrpersonen, die Reihenfolge in der Aufgabenbearbeitung selbst bestimmen zu dürfen oder die Sozialform frei wählen zu dürfen; diese didaktischen Konzessionen sind im Vergleich zur im Unterricht zugelassenen Vielfalt an Denkwegen aus der Perspektive der Lehrperson als weniger risikoreich anzusehen. Ein weiterer Diskrepanzbefund, dass nämlich Schüler/innen vergleichsweise seltener berichten, ihre Lehrpersonen würden Lösungswege individuell mit ihnen besprechen, könnte sich so auch erklären lassen (wobei bei dieser Erklärung den Schülerinnen und Schülern die realitätsgerechteren Antworten zuzuschreiben wären): Wenn die Ermöglichung individueller Vielfalt von Lehrpersonen zugunsten eines plenarartigen Erarbeitens von (exemplarischen) Lösungen zurückgenommen wird, braucht es auch nicht mehr (so) viel Zeit zur Besprechung individuell generierter Lösungen, weil es davon immer weniger gibt. Eine Bestätigung erfährt diese Interpretation durch die von U. Schwantner berichteten Ergebnisse zur Frage, in welchem Ausmaß die befragten Volksschullehrer/innen lehrer- oder aber schülergesteuert unterrichten, wobei das Ergebnis für den Mathematikunterricht zu zwei Dritteln in die erst genannte Richtung geht; der für den Zeitraum zwischen 2007 und 2011 errechnete Trend zeigt hier übrigens keine statistisch bedeutsamen Veränderungen. Diskrepanz zwischen Ideal und Realität bei Erziehungszielen So kann mit einem Blick auf die hohe Wertschätzung, die Lehrpersonen für die Notwendigkeit innerer Differenzierung im Unterricht empfinden (alle Befragten halten es Schwantner zufolge für sehr notwendig oder zumindest notwendig, ihren Unterricht an die Voraussetzungen der Schüler/innen zu adaptieren [99 %]), festgehalten werden, dass es im Hinblick auf dieses didaktische Prinzip auch eine intrapersonale Diskrepanz gibt, wie eine Synopse mit den von den Lehrpersonen berichteten Unterrichtsaktivitäten zeigt: Hier ist man von 99 %-Angaben, eine einschlägige Maßnahme zumindest in den meisten Stunden zu realisieren, sehr weit entfernt; die Zustimmungsraten liegen da in einem Spektrum zwischen 54 % und 25 %. Auch dieser Befund ist nicht neu, wenn man ihn in einen Kontext zu Erziehungszielbefragungen insbesondere im Zusammenhang mit der Dualität zwischen Heteronomieund Autonomiezielen setzt (vgl. Patry & Hofmann, 1998): Lehrpersonen können sich sehr für Autonomieziele begeistern; wenn es aber um deren Realisierung in einer bestimmten Klasse an einem bestimmten Tag in einem bestimmten Unterrichtsfach geht, tauchen viele Gründe auf, atmosphärisch (d. h. im Hinblick auf die Interaktionsqualität, auf die Genese der Regeln des Zusammenlebens 3 ) oder didaktisch (d. h. bezogen auf Freiheitsgrade bei den Lernschritten) doch nicht zu viel davon zu gewähren, weil damit auch unerwünschte Wirkungen verbunden sein könnten, für deren Management Lehrpersonen ihre diesbezüglichen Kompetenzen als (noch) zu wenig elaboriert einschätzen (vgl. Hofmann & Patry, 1999). Kommentar zu den Ergebnissen vor dem Hintergrund der gewählten Forschungsmethode Die hier zu kommentierenden Ergebnisse wurden sowohl auf Lehrpersonen- als auch auf Schüler-Ebene durch die Verwendung von Fragebögen generiert. Diese forschungsmethodische Entscheidung gibt Anlass zu folgen den kommentierenden Überlegungen: Die Verwendung von Fragebögen bedeutet eine Beschränkung auf Selbstauskünfte, die mit Konsequenzen auf der Ebene der Datenqualität (insbesondere der Validität) verbunden ist: U. Schwantner merkt selbst an einer Stelle an, insbesondere die Lehrpersonen- Daten seien mit Verweis auf das Phänomen der sozialen Erwünschtheit mit Vorsicht zu interpretieren; diese Bedenken sind ernst zu nehmen. Zur Kontrolle der Wirkkraft dieses Phänomens hätten Unterrichts beobachtungen (also die Erhebung von Prozessmerk malen) Aufschluss dahingehend bringen können, in welcher Relation die berichteten Aktivitätsfrequenzen zum Prinzip der inneren Differenzierung zu tatsäch lichem Lehrerverhalten im Unterricht stehen (s. Kapitel 3. 2, Resümee); freilich ist anzumerken, dass solche Prozess analysen zeitlich aufwändig und daher teuer sind. 3 Eine Lehrperson hat im Kontext eines Schulentwicklungsprozesses, als es darum ging, ob mit jedem ersten Jahrgang die Regeln des Zusammenlebens neu ausverhandelt werden sollen oder das im ersten Jahr dieses Entwicklungsprozesses mit dem damaligen ersten Jahrgang generierte Regelwerk den nachfolgenden ersten Jahrgängen als Standardregelwerk ausgehändigt werden soll, gemeint: Man braucht doch das Rad [der Schul- und Klassenordnung] nicht jedes Jahr neu zu erfinden. Im Hinblick auf die Selbstverpflichtung macht es aber einen Unterschied, ob der Aushandlungsprozess stattgefunden hat oder ob die Schüler/innen mit einem Fremdprodukt konfrontiert und verpflichtet werden, es einzuhalten. Dann wird in aller Regel nur mehr der Sanktionskatalog besprochen.

143 Kommentar zu: Innere Differenzierung im Mathematikunterricht 141 Aus Forschungsarbeiten, die sich mit der Frage beschäftigen, in welchem Ausmaß implizite Motive didaktisches Handeln beeinflussen (vgl. Brunner, 2008), weiß man, dass Lehrpersonen, die sich unter einem Leistungsdruck oder als in Wettbewerbssituationen stehend empfinden (vgl. etwa den Druck, der bei einzelnen Lehrpersonen durch die Tatsache, dass ihre Klasse zu Bildungsstandards überprüft wird, entstehen kann), geschlossenen Unterricht (mit weniger Rücksichtnahme auf individuelle Bedürfnisse wie Fragen, Verstehensprobleme etc.) bevorzugen; das Gleiche gilt für Lehrpersonen, die sich ohnmächtig fühlen (etwa angesichts der einleitend beschriebenen antinomisch empfundenen bildungspolitischen Erwartungen, denen sie grundsätzlich im Sinne sorgfältigen Agierens ja entsprechen wollen): Auch solche Lehrpersonen bevor zugen geschlossenen Unterricht in der soeben kurz illustrierten Variante (vgl. zu diesem Aspekt ausführlicher Hofmann, 2011, S. 54). Es stellt sich in diesem Zusammenhang freilich die Frage, wie es um die Selbststeuerungsfähigkeiten von Lehr personen bestellt ist, die sie in die Lage versetzen würden, eigene Vorstellungen trotz bildungspolitischen Gegenwinds im Klassenzimmer zu realisieren, (vgl. Kuhl, 2004); diese Fähigkeiten werden ja auch in Kompetenzprofilen, die Lehrpersonen grundsätzlich aufweisen sollen, an namhafter Stelle genannt (vgl. etwa Kunter et al., 2011). Eigene noch nicht publizierte Daten geben Anlass zur Vermutung, dass auch die Einschätzung der Ausprägung dieser Kompetenz von der gewählten Forschungsmethode abhängt: Folgt man den Daten, die durch die Verwendung operanter Instrumente (vgl. etwa den Operanten Multi-Motivtest; Kuhl, 2013) generiert wurden, kommt man zum Ergebnis, dass die Selbststeuerungsfähigkeiten von Lehrpersonen (hier aber nicht auf Volks- oder allgemeinbildende Pflichtschule bezogen) vergleichsweise wenig ausgeprägt sind; legt man Lehrpersonen Fragebögen vor, in denen Selbststeuerung auf die Subkonstrukte Selbstregulation, Selbstkontrolle, Willens- und Handlungsbahnung und Selbstzugang operationalisiert ist (vgl. Fuhrmann & Kuhl, 1998), zeigen die Ergebnisse, dass im Durchschnitt gute bis sehr gute Selbststeuerungsfähigkeiten vorliegen. In dieser Richtung sind weitere Forschungsarbeiten notwendig und im Gange. positiv ist anzumerken, dass nicht nur Lehrpersonen, sondern auch deren Schüler/innen um ihre Einschätzung gebeten wurden; auf dieser Altersstufe ist bezogen auf die Schüler/innen noch nicht davon auszugehen, dass deren Angaben etwa durch Phänomene sozialer Erwünschtheit (oder anderer Verzerrungseffekte) beeinträchtigt wären. Aus dem Ergebnis wird deutlich, dass das Prinzip der inneren Differenzierung von Lehr- und Leitungspersonen hoch geschätzt wird und dass die Lehrpersonen durchaus geeignete Strategien kennen und anwenden, um es zu realisieren. Freilich wird aus der Befundlage auch deutlich, dass die Gewährung großer Freiräume für Schüler/ innen (Eigenständigkeit in der Bearbeitung, keine Einschränkungen im Hinblick auf die Lösungsfindung, sondern Ermutigung zur Findung eigener Lösungsansätze) hinter der Gewährung risikoärmerer didaktischer Freiräume (Aufgabenreihenfolge festlegen etc.) zurückbleibt. Als eine Erklärung für diesen Befund wird auf die gegenwärtige bildungspolitische Strategie verwiesen, Lehrpersonen mehr Autonomie im Prozess zu gewähren (vgl. sämtliche Diskussionen um schulautonome Möglichkeiten; Schratz & Hartmann, 2009), gleichzeitig aber stärkere Output- Maßnahmen zu etablieren. Freilich kann das Lehrpersonen, die eher gewissenhaft und sorgfältig agieren wollen, schnell unter Druck bringen, was zur Konsequenz hat, dass diese bei gering ausgeprägten Selbststeuerungsfähigkeiten im Unterricht eher auf Fremdsteuerung setzen; diese Vorgehensweise ist aber wiederum mit Maßnahmen der Individualisierung und inneren Differenzierung nur schwer vereinbar. Resümee Innere Differenzierung im Unterricht ist insbesondere aus schulpädagogischer Perspektive betrachtet ein in seiner Bedeutung (und wohl auch in seiner Realisierung) kaum zu unterschätzendes didaktisches Prinzip. Es ist zu begrüßen, dass empirisch darauf der Blick gerichtet wird und wie U. Schwantner das praktiziert hat dazu theoriengestützt Instrumente entwickelt und eingesetzt werden, um die Verbreitung entsprechender Praktiken abschätzen zu können;

144 142 Kommentar zu: Innere Differenzierung im Mathematikunterricht Literatur Altrichter, H., Trautmann, M., Wischer, B., Sommerauer, S. & Doppler, B. (2009). Unterrichten in heterogenen Gruppen: Das Qualitätspotenzial von Individualisierung, Differenzierung und Klassenschülerzahl. In W. Specht (Hrsg.), Fokussierte Analysen bildungspolitischer Schwerpunktthemen (Nationaler Bildungsbericht Österreich 2009 / hrsg. von Werner Specht, S ). Graz: Leykam. Beer, R. & Benischek, I. (2011). Aspekte kompetenzorientierten Lehrens und Lernens. In BIFIE (Hrsg.), Kompetenzorientierter Unterricht in Theorie und Praxis. [Information für Lehrer/innen] (S. 5 28). Graz: Leykam. Braun, A. K. & Meier, M. (2006). Wie Gehirne laufen lernen, oder: Früh übt sich, wer ein Meister werden will. In U. Herrmann (Hrsg.), Neurodidaktik, Weinheim: Beltz. Brunner, J. (2008). Motivstreben von LehrerInnen, die offenen, vs. LehrerInnen, die frontalen Unterricht machen. Masterarbeit, Universität. Salzburg. Eder, F., & Thonhauser, J. (2006). Bildungsaspirationen, Noten und Berechtigungen am Übergang von der Volksschule zur Sekundarstufe I. Erziehung und Unterricht, 156 (3 4), Fuhrmann, A. & Kuhl, J. (1998). Maintaining a healthy diet: Effects of personality and self-reward versus self-punishment on commitment to and enactment of self-chosen and assigned goals. Psychology and Health, 13, Hofmann, F. (2011). Bildungsstandards und Individualisierung ein Widerspruch? Unterschiedliche Reaktionsmuster von Lehrpersonen ein Hypothesen generierender Beitrag. In F. Hofmann, D. Martinek & U. Schwantner (Hrsg.), Binnendifferenzierter Unterricht und Bildungsstandards (k)ein Widerspruch? (Österreichische Beiträge zur Bildungsforschung. 7, S ). Wien: Lit Verl. Hofmann, F. & Patry, J.-L. (1999). Das Erziehungsziel Autonomie in der Unterrichtspraxis. Psychologie in Erziehung und Unterricht, 46, Herber, H.-J. (1983). Innere Differenzierung im Unterricht. Stuttgart: Verlag W. Kohlhammer. Kuhl, J. (2004). Was bedeutet Selbststeuerung und wie kann man sie entwickeln? Personalführung, 37 (4), Kuhl, J. (2013). Auswertungsmanual für den Operanten Multi-Motiv-Test OMT (Vollst. rev. Fassung). IMPART-Test-Manuale: Bd. 2. Münster: Sonderpunkt-Verl. Kunter, M., Baumert, J., Blum, W., Klusmann, U., Krauss, S. & Neubrand, M. (Hrsg.). (2011). Professionelle Kompetenz von Lehrkräften: Ergebnisse des Forschungsprogramms COACTIV. Münster u.a: Waxmann. Paechter, M. (Hrsg.). (2012). Handbuch kompetenzorientierter Unterricht: Handlungskompetenz, Schülerorientierung, Bildungsstandards, Unterrichtsentwicklung. Weinheim: Beltz. Patry, J.-L. & Hofmann, F. (1998). Erziehungsziel Autonomie Anspruch und Wirklichkeit. Psychologie in Erziehung und Unterricht, 45, Racherbäumer, K. & Kühn, S. M. (2013). Zentrale Prüfungen und individuelle Förderung: Gegensatz, oder zwei Seiten derselben Medaille? Zeitschrift für Bildungsforschung, 3 (1), Roth, G. (2006). Möglichkeiten und Grenzen von Wissensvermittlung und Wissenserwerb. Erklärungsansätze aus Lernpsychologie und Hirnforschung. In R. Caspary (Hrsg.), Lernen und Gehirn. Der Weg zu einer neuen Pädagogoik, Freiburg im Breisgau: Herder Verlag. Schratz, M. & Hartmann, M. (2009). Schulautonomie in Österreich: Bilanz und Perspektiven für eine eigenverantwortliche Schule. In W. Specht (Hrsg.), Fokussierte Analysen bildungspolitischer Schwerpunktthemen (Nationaler Bildungsbericht Österreich 2009, S ). Graz: Leykam.

145 Anhang

146

147 Anhangstabellen 145 Anhangstabellen Perzentile Land MW (SE) Perzentil AUT 529 (2.0) Effektstärke BEL (fr) 506 (2.9) BGR 532 (4.1) CZE 545 (2.2) DEU 541 (2.2) DNK 554 (1.7) ESP 513 (2.3) FIN 568 (1.9) FRA 520 (2.6) GBR (E) 552 (2.6) GBR (N) 558 (2.4) HUN 539 (2.9) IRL 552 (2.3) ITA 541 (2.2) LTU 528 (2.0) MLT 477 (1.4) NLD 546 (1.9) POL 526 (2.1) PRT 541 (2.6) ROU 502 (4.3) SVK 535 (2.8) SVN 530 (2.0) SWE 542 (2.1) Anmerkungen: MW = Mittelwert; SE = Standardfehler Effektstärke: Effektstärke bezieht sich auf den Vergleich des jeweiligen EU-Teilnehmerlands mit Österreich Anhangstabelle A.1: Lese-Gesamtskala EU-Teilnehmerländer (PIRLS 2011)

148 146 Anhangstabellen Perzentile Land MW (SE) Perzentil AUT 508 (2.6) Effektstärke BEL (fl) 549 (1.9) CZE 511 (2.4) DEU 528 (2.2) DNK 537 (2.6) ESP 482 (2.9) FIN 545 (2.3) GBR (E) 542 (3.5) GBR (N) 562 (2.9) HUN 515 (3.4) IRL 527 (2.6) ITA 508 (2.6) LTU 534 (2.4) MLT 496 (1.3) NLD 540 (1.7) POL 481 (2.2) PRT 532 (3.4) ROU 482 (5.8) SVK 507 (3.8) SVN 513 (2.2) SWE 504 (2.0) Anmerkungen: MW = Mittelwert; SE = Standardfehler Effektstärke: Effektstärke bezieht sich auf den Vergleich des jeweiligen EU-Teilnehmerlands mit Österreich Anhangstabelle A.2: Mathematik-Gesamtskala EU-Teilnehmerländer (TIMSS 2011)

149 Anhangstabellen 147 Perzentile Land MW (SE) Perzentil AUT 532 (2.8) Effektstärke BEL (fl) 509 (2.0) CZE 536 (2.5) DEU 528 (2.9) DNK 528 (2.8) ESP 505 (3.0) FIN 570 (2.6) GBR (E) 529 (2.9) GBR (N) 517 (2.6) HUN 534 (3.7) IRL 516 (3.4) ITA 524 (2.7) LTU 515 (2.4) MLT 446 (1.9) NLD 531 (2.2) POL 505 (2.6) PRT 522 (3.9) ROU 505 (5.9) SVK 532 (3.8) SVN 520 (2.7) SWE 533 (2.7) Anmerkungen: MW = Mittelwert; SE = Standardfehler Effektstärke: Effektstärke bezieht sich auf den Vergleich des jeweiligen EU-Teilnehmerlands mit Österreich Anhangstabelle A 3: Naturwissenschaft-Gesamtskala EU-Teilnehmerländer (TIMSS 2011)

150 148 Anhangstabellen Land MW (SE) Lesen (PIRLS 2001) Lesen (PIRLS 2006) Lesen (PIRLS 2011) Buben Mädchen MW (SE) Buben Mädchen MW (SE) Buben Mädchen MW (SE) MW (SE) MW (SE) MW (SE) MW (SE) MW (SE) MW (SE) MW (SE) MW (SE) AUT 538 (2.2) 533 (2.6) 543 (2.3) 10 (2.3) 529 (2.0) 525 (2.3) 533 (2.2) 8 (2.3) DEU 539 (1.9) 533 (2.5) 545 (2.2) 13 (2.7) 548 (2.2) 544 (2.5) 551 (2.5) 7 (2.6) 541 (2.2) 537 (2.7) 545 (2.3) 8 (2.5) SGP 528 (5.2) 516 (5.7) 540 (5.3) 24 (4.1) 558 (2.9) 550 (3.3) 567 (3.1) 17 (2.9) 567 (3.3) 559 (3.6) 576 (3.5) 17 (2.6) SVN 502 (2.0) 491 (2.4) 512 (2.5) 22 (2.8) 522 (2.1) 512 (2.7) 532 (2.1) 19 (2.5) 530 (2.0) 523 (2.7) 539 (2.2) 16 (3.1) Land MW (SE) Mathematik (TIMSS 1995) Mathematik (TIMSS 2007) Mathematik (TIMSS 2011) Buben Mädchen MW (SE) Buben Mädchen MW (SE) Buben Mädchen MW (SE) MW (SE) MW (SE) MW (SE) MW (SE) MW (SE) MW (SE) MW (SE) MW (SE) AUT 531 (3.2) 536 (3.2) 525 (4.5) 10 (4.2) 505 (2.0) 512 (2.3) 498 (2.5) 14 (2.6) 508 (2.6) 513 (3.3) 504 (2.7) 9 (2.8) DEU 525 (2.3) 531 (2.5) 519 (2.5) 12 (2.1) 528 (2.2) 532 (2.6) 523 (2.7) 8 (2.7) SGP 590 (4.6) 586 (5.0) 595 (5.5) 9 (5.0) 599 (3.7) 596 (4.1) 603 (3.8) 6 (2.7) 606 (3.2) 604 (3.5) 608 (3.6) 4 (3.0) SVN 462 (3.4) 466 (3.9) 457 (3.9) 9 (3.7) 502 (1.8) 504 (2.1) 499 (2.4) 5 (2.6) 513 (2.2) 518 (3.1) 508 (2.2) 10 (3.2) Land MW (SE) Naturwissenschaft (TIMSS 1995) Naturwissenschaft (TIMSS 2007) Naturwissenschaft (TIMSS 2011) Buben Mädchen MW (SE) Buben Mädchen MW (SE) Buben Mädchen Geschlechterdifferenz Geschlechterdifferenz Geschlechterdifferenz Geschlechterdifferenz Geschlechterdifferenz Geschlechterdifferenz Geschlechterdifferenz Geschlechterdifferenz Geschlechterdifferenz MW (SE) MW (SE) MW (SE) MW (SE) MW (SE) MW (SE) MW (SE) MW (SE) MW (SE) AUT 538 (3.9) 545 (4.1) 530 (4.8) 15 (4.2) 526 (2.5) 532 (2.9) 519 (2.7) 13 (2.6) 532 (2.8) 538 (3.6) 525 (2.8) 12 (2.9) DEU 528 (2.4) 535 (2.9) 520 (2.6) 15 (2.7) 528 (2.9) 534 (3.2) 522 (3.0) 12 (2.5) SGP 523 (5.1) 526 (5.9) 521 (5.6) 5 (5.4) 587 (4.1) 587 (4.4) 587 (4.3) 0 (3.0) 538 (3.4) 585 (3.7) 581 (3.7) 4 (2.7) SVN 464 (3.4) 470 (4.1) 458 (3.8) 12 (4.0) 518 (1.9) 518 (2.4) 518 (2.4) 0 (2.8) 520 (2.7) 523 (3.4) 517 (2.8) 6 (3.2) Anmerkung: MW = Mittelwert; SE = Standardfehler Anhangstabelle A.4 Mittelwerte und Geschlechterdifferenzen im Trend (PIRLS 2001, 2006 & 2011; TIMSS 1995, 2007 & 2011)

151 Anhangstabellen 149 Altersgruppe Anteil an der Population (%) 2 15-/16-Jährige 4. Schulstufe (10-Jährige) Studie PISA 2000 PISA 2003 PISA 2006 PISA 2009 PISA 2012 PIRLS 2006 PIRLS 2011 Geburtsjahrgang Schüler/innen mit Migrationshintergrund Generation Generation Anteil an Schülerinnen/Schülern mit Migrationshintergrund (%) Eltern in Exjugoslawien geboren 3 m Eltern in der Türkei geboren m Anderes Land oder gemischte Herkunft m Bei PIRLS ist jenes Jahr eingetragen, in dem die Mehrheit der getesteten Kinder geboren wurde; bei PISA wurden alle getesteten Schüler/innen im entsprechenden Jahr geboren. 2 Population bei PIRLS sind Schüler/innen der 4. Schulstufe; Population bei PISA sind Schüler/innen eines bestimmten Geburtsjahrgangs, die zum Testzeitpunkt 15/16 Jahre alt sind. 3 Folgende Staaten werden abgedeckt: Serbien, Montenegro, Kosovo, Bosnien-Herzegowina und Kroatien. Anhangstabelle A.5: Anteile der Schüler/innen mit Migrationshintergrund im Zeitverlauf (PISA 2000, 2003, 2006, 2009, 2012; PIRLS 2006, 2011)

152 150 Anhangstabellen m = Daten nicht erhoben Altersgruppe 15-/16-Jährige 4. Schulstufe (10-Jährige) Studie PISA 2000 PISA 2003 PISA 2006 PISA 2009 PISA 2012 PIRLS 2006 PIRLS 2011 Geburtsjahrgang Lesekompetenz 2 MW (SE) MW (SE) MW (SE) MW (SE) MW (SE) MW (SE) MW (SE) Schüler/innen ohne Migrationshintergrund Schüler/innen mit Migrationshintergrund 502 (2.8) 501 (3.8) 499 (3.4) 482 (2.9) 499 (2.7) 547 (1.9) 537 (1.7) 409 (7.2) 426 (8.1) 438 (13.9) 414 (6.2) 449 (5.7) 498 (3.4) 495 (3.6) 2. Generation 429 (10.6) 428 (13.5) 420 (18.8) 427 (6.0) 451 (5.9) 500 (3.9) 493 (3.5) 1. Generation 398 (8.9) 425 (8.0) 451 (12.6) 384 (10.3) 443 (9.4) 489 (6.4) 500 (7.3) Eltern in Exjugoslawien geboren 3 m 433 (9.1) 449 (10.4) 419 (7.5) 439 (7.5) 504 (5.3) 498 (4.8) Eltern in der Türkei geboren m 372 (16.4) 369 (24.2) 372 (8.0) 412 (9.4) 461 (5.2) 465 (5.2) Anderes Land oder gemischte Herkunft m 462 (11.3) 481 (9.9) 438 (8.4) 481 (8.7) 522 (5.3) 512 (4.6) 1 Bei PIRLS ist jenes Jahr eingetragen, in dem die Mehrheit der getesteten Kinder geboren wurde; bei PISA wurden alle getesteten Schüler/innen im entsprechenden Jahr geboren. 2 Eingetragen sind Mittelwerte der jeweiligen Leseleistungsskala. Standardfehler stehen in Klammern. 3 Folgende Staaten werden abgedeckt: Serbien, Montenegro, Kosovo, Bosnien-Herzegowina und Kroatien. m = Daten nicht erhoben Anhangstabelle A.6: Lesekompetenz der Schüler/innen mit Migrationshintergrund im Zeitverlauf (PISA 2000, 2003, 2006, 2009, 2012; PIRLS 2006, 2011)

153 Autorenverzeichnis 151 Autorenverzeichnis Dr. Karl Blüml Ehemaliger Landesschulinspektor für allgemeinbildende höhere Schulen; SOKO-Lesen am Stadtschulrat für Wien. Sandra Filzmoser, MA Ehemaliger Junior Researcher am Bundesinstitut für Bildungsforschung, Innovation und Entwicklung des österreichischen Schulwesens; Department Bildungsstandards & Internationale Assessments. Dipl.-Päd. Anna Glaeser, MA Researcher am Bundesinstitut für Bildungsforschung, Innovation und Entwicklung des österreichischen Schulwesens; Department Bildungsstandards & Internationale Assessments. Dr. Gerda Hagenauer Oberassistentin am Institut für Erziehungswissenschaft der Universität Bern; Abteilung für Schul- und Unterrichtsforschung. Dr. Barbara Herzog-Punzenberger Leiterin des Arbeitsbereichs Migration & Bildung an der Johannes-Kepler-Universität Linz, Institut für Pädagogik und Psychologie. AO Univ.-Prof. Dr. Franz Hofmann Leiter der Abteilung Bildungswissenschaft, Schulforschung und Schulpraxis an der Universität Salzburg; School of Education. Mag. Konrad Oberwimmer Wissenschaftlicher Mitarbeiter am Bundesinstitut für Bildungsforschung, Innovation und Entwicklung des österreichischen Schulwesens; Department Bildungsstandards & Internationale Assessments. Dipl.-Math. Alexander Robitzsch Measurement Statistician am Bundesinstitut für Bildungsforschung, Innovation und Entwicklung des österreichischen Schulwesens; Department Bildungsstandards & Internationale Assessments. Dr. Silvia Salchegger Researcher am Bundesinstitut für Bildungsforschung, Innovation und Entwicklung des österreichischen Schulwesens; Department Bildungsstandards & Internationale Assessments. Univ.-Prof. Dr. Christine Schmid Fachbereichsleiterin an der Universität Salzburg; Fachbereich Erziehungswissenschaft. Dr. Ursula Schwantner Research Fellow beim Australian Council for Educational Research. Dr. Birgit Suchań Researcher am Bundesinstitut für Bildungsforschung, Innovation und Entwicklung des österreichischen Schulwesens; Department Bildungsstandards & Internationale Assessments; Projektleiterin PISA; Lektorin an der Universität Salzburg am Fachbereich Erziehungswissenschaft. Mag. Christina Wallner-Paschon Researcher am Bundesinstitut für Bildungsforschung, Innovation und Entwicklung des österreichischen Schulwesens; Department Bildungsstandards & Internationale Assessments; Projektleiterin PIRLS; Lektorin an der Universität Salzburg am Fachbereich Erziehungswissenschaft.

154

155

156 Leykam Buchverlag ISBN

PISA 2012 Erste Ergebnisse

PISA 2012 Erste Ergebnisse PISA 2012 Erste Ergebnisse Pressekonferenz 3. Dezember 2013 BIFIE Bundesinstitut für Bildungsforschung, Innovation & Entwicklung des österreichischen Schulwesens Dir. MMag. Christian Wiesner Dr. Claudia

Mehr

Die Pressemitteilung. PISA 2012 Erste Ergebnisse Zusammenfassung. Wien,

Die Pressemitteilung. PISA 2012 Erste Ergebnisse Zusammenfassung. Wien, Die Pressemitteilung PISA 2012 Erste Ergebnisse Zusammenfassung Wien, 03. 12. 2013 Das BIFIE gibt in der heutigen Pressekonferenz eine erste Übersicht über die wichtigsten Ergebnisse von PISA 2012 aus

Mehr

TIMSS 2007 Internationaler Vergleich von Schülerleistungen in Mathematik- und Naturwissenschaft in der 4. Schulstufe (10-jährige Volksschüler/innen)

TIMSS 2007 Internationaler Vergleich von Schülerleistungen in Mathematik- und Naturwissenschaft in der 4. Schulstufe (10-jährige Volksschüler/innen) Pressemitteilung Wien, 09.12.2008 TIMSS 2007 Internationaler Vergleich von Schülerleistungen in Mathematik- und Naturwissenschaft in der 4. Schulstufe (10-jährige Volksschüler/innen) Die Studie im Überblick

Mehr

PISA Kennwerte zum Kompetenzstand von 15-Jährigen (Teil 1)

PISA Kennwerte zum Kompetenzstand von 15-Jährigen (Teil 1) PISA Kennwerte zum Kompetenzstand von 15-Jährigen (Teil 1) OECD- Durchschnitt 494 501 496 Naturwissenschaftliche Kompetenz Südkorea 538 536 554 Niederlande Finnland * bei der PISA-Studie (Programme for

Mehr

PISA Mathematik und Naturwissenschaften (Teil 1)

PISA Mathematik und Naturwissenschaften (Teil 1) PISA und (Teil 1) PISA-* insgesamt, ausgewählte europäische Staaten, Erhebung 2009 554 Finnland 541 520 517 Liechtenstein Schweiz * Informationen zur Interpretation der Punktzahldifferenzen erhalten Sie

Mehr

PISA 2012 Zusammenfassung erster Ergebnisse im Hinblick auf Geschlechterdifferenzen

PISA 2012 Zusammenfassung erster Ergebnisse im Hinblick auf Geschlechterdifferenzen bm:ukk, Abt. IT/1, Referat a Dr. Mark Német (Tel. DW 5902), Mag. Andreas Grimm (DW 4316) PISA 2012 Zusammenfassung erster Ergebnisse im Hinblick auf Geschlechterdifferenzen Differenz zwischen Knaben und

Mehr

PISA und außerschulische Jugendarbeit

PISA und außerschulische Jugendarbeit PISA und außerschulische Jugendarbeit Dialog Jugendforschung 27. Februar 2014 Dir. Mag. Martin Netzer, MBA Mag. Dr. Claudia Schreiner OECD/PISA Programme for International Student Assessment Kompetenzorientierte

Mehr

sofortige Gleichstellung mit Auflagen

sofortige Gleichstellung mit Auflagen Drucksache 17 / 18 181 Schriftliche Anfrage 17. Wahlperiode Schriftliche Anfrage der Abgeordneten Regina Kittler (LINKE) vom 08. März 2016 (Eingang beim Abgeordnetenhaus am 09. März 2016) und Antwort Anerkennung

Mehr

Die Überprüfung der Bildungsstandards 2012 Mathematik 8. Schulstufe

Die Überprüfung der Bildungsstandards 2012 Mathematik 8. Schulstufe Die Überprüfung der Bildungsstandards 2012 Mathematik 8. Schulstufe Bundesinstitut BIFIE Salzburg Zentrum für Bildungsmonitoring & Bildungsstandards Dr. Claudia Schreiner Die Standardüberprüfung 2012

Mehr

Ausländische Direktinvestitionen

Ausländische Direktinvestitionen From: Die OECD in Zahlen und Fakten 2011-2012 Wirtschaft, Umwelt, Gesellschaft Access the complete publication at: http://dx.doi.org/10.1787/9789264125476-de Ausländische Direktinvestitionen Please cite

Mehr

Nachhaltigkeitsindex. Pensionssysteme. Presseaussendung. Quelle: Allianz Asset Management.

Nachhaltigkeitsindex. Pensionssysteme. Presseaussendung. Quelle: Allianz Asset Management. Nachhaltigkeitsindex für Pensionssysteme Ergänzungsmaterial zur Presseaussendung Wien, 01. April 2014 Ranking nach Ländern 2014 (absolut) 1 Australien 2 Schweden 3 Neuseeland 4 Norwegen 5 Niederlande 6

Mehr

Arbeitslosigkeit nach der Finanz- und Wirtschaftskrise (Teil 1)

Arbeitslosigkeit nach der Finanz- und Wirtschaftskrise (Teil 1) (Teil 1) Ausgewählte europäische Staaten, im Jahr 2010 und Veränderung der Spanien 2010 20,1 77,9 Estland 16,9 207,3 Slowakei Irland 13,7 14,4 117,5 51,6 Griechenland Portugal 12,0 12,6 41,2 63,6 Türkei

Mehr

index 2013 Klimaschutz-Index Komponenten 7,5% 10% 7,5% 10% 10% 10% 4% 4% 20% 30% Emissionsniveau 10% 10% 30% Entwicklung der Emissionen KLIMASCHUTZ

index 2013 Klimaschutz-Index Komponenten 7,5% 10% 7,5% 10% 10% 10% 4% 4% 20% 30% Emissionsniveau 10% 10% 30% Entwicklung der Emissionen KLIMASCHUTZ Klimaschutz-Index Komponenten Komponenten des Klimaschutz-Index Nationale Klimapolitik Primärenergieverbrauch pro Kopf Internationale Klimapolitik 7,5% 7,5% CO 2 -Emissionen pro Kopf Effizienz-Trend Effizienz-Niveau

Mehr

XV. Zum Unterricht in der Muttersprache im Alter von 15/16 Jahren

XV. Zum Unterricht in der Muttersprache im Alter von 15/16 Jahren XV. Zum Unterricht in der Muttersprache im Alter von 15/16 Jahren Claudia Reiter Bitte zitieren als: Reiter, C. (2002). Zum Unterricht in der Muttersprache im Alter von 15/16 Jahren. In C. Reiter & G.

Mehr

Welt-Bruttoinlandsprodukt

Welt-Bruttoinlandsprodukt In Mrd., 2007 17.589 Mrd. US $ 1.782 Mrd. US $ Südosteuropa und GUS Europa Russland 1.285 Deutschland 3.302 Ukraine 141 15.242 Mrd. US $ Nordamerika Großbritannien Frankreich 2.738 2.567 Kasachstan 94

Mehr

Geschlechterdifferenzen im vorschulischen Bereich und in der Grundschule

Geschlechterdifferenzen im vorschulischen Bereich und in der Grundschule Seite 1 Geschlechterdifferenzen im vorschulischen Bereich und in der Grundschule Prof. Dr. Wilfried Bos München, DEUTSCHLAND HAT ZUKUNFT! hbw Haus der Bayerischen Wirtschaft Seite 2 Anteil weiblicher und

Mehr

PIRLS 2011 Die Lesekompetenz der 9- bis 10-Jährigen

PIRLS 2011 Die Lesekompetenz der 9- bis 10-Jährigen Überblick PIRLS 2011 Die Lesekompetenz der 9- bis 10-Jährigen KsL Symposium 30. April 2013 Details zur PIRLS-Studie (Stichprobe, Testaufgaben) Ergebnisse: internationaler Vergleich, Veränderung in der

Mehr

Verbrauch von Primärenergie pro Kopf

Verbrauch von Primärenergie pro Kopf Verbrauch von Primärenergie pro Kopf In Tonnen Öläquivalent*, nach nach Regionen Regionen und ausgewählten und ausgewählten Staaten, Staaten, 2007 2007 3,0

Mehr

5. Ausgaben für Bildungseinrichtungen 3 Jahre bis Schuleintritt 2009 (OECD-34)

5. Ausgaben für Bildungseinrichtungen 3 Jahre bis Schuleintritt 2009 (OECD-34) Kinderbetreuung international: Deutschland im Vergleich Das internationale Monitoring frühkindlicher Bildungs- und Betreuungssysteme wird hauptsächlich von der OECD und der EU (EUROSTAT) durchgeführt.

Mehr

Erste Ergebnisse zu PISA 2012

Erste Ergebnisse zu PISA 2012 PISA.ch: ein gemeinsames Programm von Bund und Kantonen / un programme commun de la Confédération et des cantons / un programma comune della Confederazione e dei Cantoni Erste Ergebnisse zu PISA 2012 PISA

Mehr

Wilfried Bos, Eva-Maria Lankes, Manfred Prenzel, Knut Schwippert, Renate Valtin, Gerd Walther (Hrsg.) IGLU

Wilfried Bos, Eva-Maria Lankes, Manfred Prenzel, Knut Schwippert, Renate Valtin, Gerd Walther (Hrsg.) IGLU Wilfried Bos, Eva-Maria Lankes, Manfred Prenzel, Knut Schwippert, Renate Valtin, Gerd Walther (Hrsg.) IGLU Einige Länder der Bundesrepublik Deutschland im nationalen und internationalen Vergleich Waxmann

Mehr

PISA 2012. Internationaler Vergleich von Schülerleistungen. Erste Ergebnisse Mathematik, Lesen, Naturwissenschaft

PISA 2012. Internationaler Vergleich von Schülerleistungen. Erste Ergebnisse Mathematik, Lesen, Naturwissenschaft PISA 2012 Internationaler Vergleich von Schülerleistungen Erste Ergebnisse Mathematik, Lesen, Naturwissenschaft Herausgegeben von Ursula Schwantner, Bettina Toferer & Claudia Schreiner Schwantner, U.,

Mehr

Frauen in politischen Spitzenpositionen der EU-Staaten sowie im EU-Bereich

Frauen in politischen Spitzenpositionen der EU-Staaten sowie im EU-Bereich Prof. Dr. Werner Zögernitz Wien, am 03.03.2014 Frauen in politischen Spitzenpositionen der EU-Staaten sowie im EU-Bereich Im Jahr 2013 hat sich die Europäische Union durch den Beitritt Kroatiens zahlenmäßig

Mehr

Steuerverwaltung des Kantons Graubünden Administraziun da taglia dal chantun Grischun Amministrazione imposte del Cantone dei Grigioni

Steuerverwaltung des Kantons Graubünden Administraziun da taglia dal chantun Grischun Amministrazione imposte del Cantone dei Grigioni Steuerverwaltung des Kantons Graubünden Administraziun da taglia dal chantun Grischun Amministrazione imposte del Cantone dei Grigioni Form. 122 7001 Chur, Steinbruchstrasse 18 Telefon 081 257 34 28 Telefax:

Mehr

EM2016-Fussball.de. Spielplan EM 2016 Qualifikation. Spieltag 1. Datum Uhrzeit Gruppe Heim Gast Ergebnis

EM2016-Fussball.de. Spielplan EM 2016 Qualifikation. Spieltag 1. Datum Uhrzeit Gruppe Heim Gast Ergebnis Spieltag 1 07.09.2014 18:00 D Georgien - Irland 18:00 I Dänemark - Armenien 18:00 F Ungarn - Nordirland 20:45 D Deutschland - Schottland 20:45 D Gibraltar - Polen 20:45 I Portugal - Albanien 20:45 F Färöer

Mehr

Grafiken zu Migrationshintergrund und Mehrsprachigkeit aus BIFIE-Publikationen

Grafiken zu Migrationshintergrund und Mehrsprachigkeit aus BIFIE-Publikationen Grafiken zu Migrationshintergrund und Mehrsprachigkeit aus BIFIE-Publikationen Nationaler Bildungsbericht 2012 PIRLS/TIMSS 2011 Bericht 2012 PISA 2009 Bericht 2010 OECD-Bericht PISA 2009 Daten Zusammengestellt

Mehr

équité au sein du système éducatif suisse TENDANCES Secrétariat général de la CDIP / Bernard Wicht

équité au sein du système éducatif suisse TENDANCES Secrétariat général de la CDIP / Bernard Wicht équité au sein du système éducatif suisse TENDANCES Secrétariat général de la CDIP / Bernard Wicht 2 1.Rapport OCDE 2012 2.Rapport UE 2014 3.PISA 2012 4.Rapport national suisse sur l éducation 2014 Rapport

Mehr

Erwerbstätigenquoten nach Anzahl der Kinder*

Erwerbstätigenquoten nach Anzahl der Kinder* Erwerbstätigenquoten nach Anzahl der Kinder* In Prozent, nach Frauen und Männern zwischen 25 bis 54 Jahren, Europäische Union **, 2009 Frauen 75,8 71,3 69,2 3 oder mehr 54,7 * Kinder sind all diejenigen

Mehr

Hintergrund (1.) Linzer Elternbefragung und erste Arbeiten zur indexbasierten Finanzierung des Schulsystems

Hintergrund (1.) Linzer Elternbefragung und erste Arbeiten zur indexbasierten Finanzierung des Schulsystems Übersicht 1. Hintergrund und Ausgangspunkt 2. Grundidee und Anforderungen 3. Beispiele 4. Verfahrensvorschlag und weitere Hintergrundinformation 5. Fazit und Bewertung Hintergrund (1.) Linzer Elternbefragung

Mehr

Die beste Bildung. Prof. Dr. Wilfried Bos Schulfreiheitskongress

Die beste Bildung. Prof. Dr. Wilfried Bos Schulfreiheitskongress Die beste Bildung Prof. Dr. Wilfried Bos Allgemeine Bildungsziele Was ist gute Bildung? Qualifizierung = Vermittlung von Kompetenzen instrumenteller Wert z.b. ökonomische Verwertbarkeit am Arbeitsmarkt

Mehr

PISA 2012. Internationaler Vergleich von Schülerleistungen. Problemlösen, Mathematik und Lesen im elektronischen Zeitalter

PISA 2012. Internationaler Vergleich von Schülerleistungen. Problemlösen, Mathematik und Lesen im elektronischen Zeitalter PISA 12 Internationaler Vergleich von Schülerleistungen Problemlösen, Mathematik und Lesen im elektronischen Zeitalter Herausgegeben von Claudia Schreiner, Silvia Salchegger & Birgit Suchań Schreiner,

Mehr

Reisekostenpauschale. in Euro. Afghanistan 925 1.500 1.800. Ägypten 500 1.500 1.800. Albanien 325 1.500 1.800. Algerien 475 1.500 1.

Reisekostenpauschale. in Euro. Afghanistan 925 1.500 1.800. Ägypten 500 1.500 1.800. Albanien 325 1.500 1.800. Algerien 475 1.500 1. Die u.g. n gelten für einen vierwöchigen Aufenthalt. Bei kürzerem oder längeren Aufenthalt verringert bzw. erhöht Afghanistan 925 1.500 1.800 Ägypten 500 1.500 1.800 Albanien 325 1.500 1.800 Algerien 475

Mehr

Anerkennung von ausländischen Schulzeugnissen. Ansprechpartnerinnen und Ansprechpartner

Anerkennung von ausländischen Schulzeugnissen. Ansprechpartnerinnen und Ansprechpartner Anerkennung von ausländischen Schulzeugnissen Ansprechpartnerinnen und Ansprechpartner A... 6 Afghanistan... 6 Ägypten... 6 Albanien... 6 Algerien... 6 Angola... 6 Äquatorialguinea... 6 Argentinien...

Mehr

Gleichstellung im Gespräch

Gleichstellung im Gespräch Gleichstellung im Gespräch. Daten und Fakten aus PISA & Co Dr. Claudia Schreiner Direktorin des BIFIE Bundesinstitut für Bildungsforschung, Innovation & Entwicklung des österreichischen Schulwesens Salzburg

Mehr

Gleichstellung im Gespräch

Gleichstellung im Gespräch Gleichstellung im Gespräch. Daten und Fakten aus PISA & Co Dr. Claudia Schreiner Direktorin des BIFIE Bundesinstitut für Bildungsforschung, Innovation & Entwicklung des österreichischen Schulwesens Salzburg

Mehr

EMAU Greifswald Studierende Köpfe (Ausländer) entsprechend amtl. Statistik SS15. Ausländische Studenten 1. Studienfach insgesamt Staatsangehörigkeit

EMAU Greifswald Studierende Köpfe (Ausländer) entsprechend amtl. Statistik SS15. Ausländische Studenten 1. Studienfach insgesamt Staatsangehörigkeit Ausländische Studenten 1. Studienfach insgesamt Staatsangehörigkeit 1 Aethiopien 2 Österreich 2 Ungarn 9 1 Ägypten 1 Armenien 16 China 1 Kroatien 1 Mazedonien 3 Österreich 3 Polen 5 Russische Foederation

Mehr

Seite 1 von 5. In folgenden Ländern kannst du surfen, MMS versenden und empfangen: Datenroaming Down- & Upload Preis pro 100 KB

Seite 1 von 5. In folgenden Ländern kannst du surfen, MMS versenden und empfangen: Datenroaming Down- & Upload Preis pro 100 KB Seite 1 von 5 bob weltweit für bigbob, bigbob 2009, bigbob 2011, bigbob 8,80, bob vierer 2008, bob vierer 2011, minibob, smartbob, smartbob 2011, smartbob XL, smartbob XL 9,90, superbob In folgenden Ländern

Mehr

PISA 2006 Internationaler Vergleich von Schülerleistungen. Erste Ergebnisse

PISA 2006 Internationaler Vergleich von Schülerleistungen. Erste Ergebnisse Claudia Schreiner (Hrsg.) PISA 2006 Internationaler Vergleich von Schülerleistungen Erste Ergebnisse Leykam 2007 Graz Bundesministerium für Unterricht, Kunst und Kultur 1014 Wien Minoritenplatz 5 Das Bundesministerium

Mehr

Ministerium für Schule und Weiterbildung des Landes NRW

Ministerium für Schule und Weiterbildung des Landes NRW Ministerium für Schule und Weiterbildung des Landes NRW Ergebnisse der Vergleichsarbeiten (VERA), Klasse 3, für das Land Nordrhein-Westfalen im Jahr 2007 21. August 2007 Am 8. und 10. Mai 2007 wurden in

Mehr

Bildungserfolg von Schülerinnen und Schülern mit Migrationshintergrund

Bildungserfolg von Schülerinnen und Schülern mit Migrationshintergrund Institut für Schulentwicklungsforschung Bildungserfolg von Schülerinnen und Schülern mit Migrationshintergrund Ergebnisse aus rezenten Schulleistungsuntersuchungen Menschen mit Zuwanderungsgeschichte in

Mehr

Weitere Informationen auf: Australien hat ein ähnliches Profil wie Neuseeland und Kanada.

Weitere Informationen auf:  Australien hat ein ähnliches Profil wie Neuseeland und Kanada. Länderprofil Radar gesellschaftlicher Australien befindet sich knapp in der Spitzengruppe. In allen Dimensionen ist Australien mindestens im oberen Mittelfeld. Zur Spitzengruppe gehört Australien bei den

Mehr

Cultural education as innovative factor for the school system

Cultural education as innovative factor for the school system Deutsche Übersetzung vom Vortrag Cultural education as innovative factor for the school system von Paul Collard auf der Konferenz am 31. Januar 2013 um 13:15 Uhr Was ist kulturelle Bildung und warum ist

Mehr

L O H N S T E U E R. Gesamtübersicht über die Kaufkraftzuschläge zum ( 3 Nr. 64 EStG) mit Zeitraum ab

L O H N S T E U E R. Gesamtübersicht über die Kaufkraftzuschläge zum ( 3 Nr. 64 EStG) mit Zeitraum ab L O H N S T E U E R Gesamtübersicht über die Kaufkraftzuschläge zum 1.10. 2014 Gesamtübersicht über die Kaufkraftzuschläge Afghanistan 1.1.02 0 Ägypten 1.1.01 0 Albanien 1.9.02 0 Algerien 1.6.01 0 Angola

Mehr

KPMG s s Corporate and Indirect Tax Rate Survey 2008

KPMG s s Corporate and Indirect Tax Rate Survey 2008 KPMG s s Corporate and Indirect Tax Rate Survey 2008 Zahlen, Fakten, Hintergründe nde TAX Jörg Walker Zürich, 10. September 2008 Methodik der Umfrage Teil 1: Corporate Tax Rate Survey: Untersuchung der

Mehr

STATISTIKEN ZU MIGRATION IN TIROL

STATISTIKEN ZU MIGRATION IN TIROL STATISTIKEN ZU MIGRATION IN TIROL 1. BEVÖLKERUNGSENTWICKLUNG. TIROLERiNNEN MIT NICHT- ÖSTERREICHISCHER STAATSANGEHÖRIGKEIT 1961-2009 (Kommentierte Fassung - Stand 2. Februar 2010) IMZ - Tirol S. 1 PERSONEN

Mehr

Institut für Bildungsevaluation Assoziiertes Institut der Universität Zürich. Check P Ergebnisrückmeldung für die Kantone

Institut für Bildungsevaluation Assoziiertes Institut der Universität Zürich. Check P Ergebnisrückmeldung für die Kantone Institut für Bildungsevaluation Assoziiertes Institut der Universität Zürich Check P6 2014 Ergebnisrückmeldung für die Jeannette Oostlander, Stéphanie Berger, Barbara Baumann & Martin Verner Zürich, Dezember

Mehr

($ ) ' & *&+%,- % . "/*% &" & -,- *! 3&&") 4' /*%- &"# $ -1/ /* '$ - 6,- . / *- ' &"($ /-7. ( 89!$ 4)// &"',- :!&")7 - - 7 / 7 - - - 7 -: *7 /

($ ) ' & *&+%,- % . /*% & & -,- *! 3&&) 4' /*%- &# $ -1/ /* '$ - 6,- . / *- ' &($ /-7. ( 89!$ 4)// &',- :!&)7 - - 7 / 7 - - - 7 -: *7 / !"#$ %&"'$ %&" ($ ) ' & *&+%, %. "/*% &" &, * 0%1/ 2%3*! 3&&") 4' /*% &"# $ 1/ /* 5 &"($ 3'&"($ + 3'&"($ &"#$ &" '$ 6,. / * ' &"($ /7. ( 89!$ 4)// &"', :!&")7, &"'8,!&") 7 / 7 7 : *7 / / / 1/ ;;'

Mehr

6. Tourismus. Vorbemerkungen

6. Tourismus. Vorbemerkungen 109 6. Tourismus Vorbemerkungen Beherbergungsstatistik Die Datengrundlage liefert das Gesetz über die Statistik der Beherbergung im Reiseverkehr vom 14. Juli 1980 (BGBl. I S. 953), das am 1. Januar 1981

Mehr

RENTENREFORMEN DIE INTERNATIONALE PERSPEKTIVE. Monika Queisser Leiterin der Abteilung für Sozialpolik OECD

RENTENREFORMEN DIE INTERNATIONALE PERSPEKTIVE. Monika Queisser Leiterin der Abteilung für Sozialpolik OECD RENTENREFORMEN DIE INTERNATIONALE PERSPEKTIVE Monika Queisser Leiterin der Abteilung für Sozialpolik OECD FINANZIELLE UND SOZIALE NACHHALTIGKEIT: EIN ZIELKONFLIKT? 2 Finanzielle Nachhaltigkeit: zukünftige

Mehr

Allgemeine bildungsökonomische Rahmenbedingungen in Deutschland

Allgemeine bildungsökonomische Rahmenbedingungen in Deutschland Executive Summary Der KfW-Studienkredit wurde von der KfW Bankengruppe im Jahr 2006 als bundesweites Angebot eingeführt. Er dient der Finanzierung der Lebenshaltungskosten während eines Hochschulstudiums.

Mehr

Mag. a Dr. in Silvia Bergmüller Researcher am Zentrum Salzburg (Bildungsmonitoring & Bildungsstandards) des Bundesinstituts

Mag. a Dr. in Silvia Bergmüller Researcher am Zentrum Salzburg (Bildungsmonitoring & Bildungsstandards) des Bundesinstituts Autorenverzeichnis Anhang Autorenverzeichnis DI Christian Auer Wissenschaftlicher Mitarbeiter der Statistik Austria, Direktion Bevölkerung, Bereich Wissenschaft, Technologie, Bildung. Arbeitsschwerpunkt:

Mehr

Beherbergung im Reiseverkehr in Hamburg Dezember Vorläufige Ergebnisse -

Beherbergung im Reiseverkehr in Hamburg Dezember Vorläufige Ergebnisse - Statistisches Amt für Hamburg und Schleswig-Holstein STATISTISCHE BERICHTE Kennziffer: G IV - m 2/5 HH Beherbergung im Reiseverkehr in Hamburg Dezember 205 - Vorläufige Ergebnisse - Herausgegeben am: 7.

Mehr

Beherbergung im Reiseverkehr in Hamburg Januar Vorläufige Ergebnisse -

Beherbergung im Reiseverkehr in Hamburg Januar Vorläufige Ergebnisse - Statistisches Amt für Hamburg und Schleswig-Holstein STATISTISCHE BERICHTE Kennziffer: G IV - m /6 HH Beherbergung im Reiseverkehr in Hamburg Januar 206 - Vorläufige Ergebnisse - Herausgegeben am: 8. März

Mehr

Preisliste "0180 Callthrough"

Preisliste 0180 Callthrough Deutschland Festnetz 01801110086 0,0390 Deutschland Mobilfunk 01805110086 0,1400 INTERNATIONAL Ägypten 01805110086 0,1400 Ägypten (Mobilfunk) 01803110086 0,0900 Albanien 01803110086 0,0900 Algerien 01803110086

Mehr

Direktinvestitionen lt. Zahlungsbilanzstatistik. Für den Berichtszeitraum 20 bis 201

Direktinvestitionen lt. Zahlungsbilanzstatistik. Für den Berichtszeitraum 20 bis 201 Direktinvestitionen lt. Für den Berichtszeitraum 20 bis 201 201 2 Inhalt I. Schaubilder 5 II. Tabellen 1.1 Transaktionswerte nach ausgewählten Ländergruppen und Ländern 11 1.1.1 Inländische Direktinvestitionen

Mehr

Beilage 3. F-G1 Blatt 1/2 04/2016. Dorfgastein. St. Johann im Pongau. Letzter Einsendetag: 15. des folgenden Monats!

Beilage 3. F-G1 Blatt 1/2 04/2016. Dorfgastein. St. Johann im Pongau. Letzter Einsendetag: 15. des folgenden Monats! Beilage 3 Bundesanstalt Statistik Österreich Direktion Raumwirtschaft, Tourismus Guglgasse 13, 1110 Wien Tel. +43(1) 711 28-7736, 7740, Fax. +43(1) 711 28-8002 http://www.statistik.at DVR 0000043 e-mail.

Mehr

Beilage 3. F-G1 Blatt 1/2 06/2016. St. Johann im Pongau. Dorfgastein. Letzter Einsendetag: 15. des folgenden Monats!

Beilage 3. F-G1 Blatt 1/2 06/2016. St. Johann im Pongau. Dorfgastein. Letzter Einsendetag: 15. des folgenden Monats! Beilage 3 Bundesanstalt Statistik Österreich Direktion Raumwirtschaft, Tourismus Guglgasse 13, 1110 Wien Tel. +43(1) 711 28-7736, 7740, Fax. +43(1) 711 28-8002 http://www.statistik.at DVR 0000043 e-mail.

Mehr

Symposium Fit für die Schule Sprachförderung im Kindergarten

Symposium Fit für die Schule Sprachförderung im Kindergarten Symposium Fit für die Schule Sprachförderung im Kindergarten Vortrag: Wirkungen des Kindergartenbesuches in internationalen Bildungsstudien Herausforderungen und Perspektiven von Johann Bacher, Abteilung

Mehr

DIENSTREISE: SPESEN FÜR ARBEITNEHMER

DIENSTREISE: SPESEN FÜR ARBEITNEHMER DIENSTREISE: SPESEN FÜR ARBEITNEHMER Spesen für Arbeitnehmer Auf Grundlage des Art. 77 (5) des polnischen Arbeitsgesetzbuches (kodeks pracy) bestimmen sich die Reisekosten für Inland- und Auslandsreisen

Mehr

INFOS FÜR MENSCHEN AUS DEM AUSLAND WENN SIE FÜR EINEN FREIWILLIGEN-DIENST NACH DEUTSCHLAND KOMMEN WOLLEN: IN DIESEM TEXT SIND ALLE WICHTIGEN INFOS.

INFOS FÜR MENSCHEN AUS DEM AUSLAND WENN SIE FÜR EINEN FREIWILLIGEN-DIENST NACH DEUTSCHLAND KOMMEN WOLLEN: IN DIESEM TEXT SIND ALLE WICHTIGEN INFOS. INFOS FÜR MENSCHEN AUS DEM AUSLAND WENN SIE FÜR EINEN FREIWILLIGEN-DIENST NACH DEUTSCHLAND KOMMEN WOLLEN: IN DIESEM TEXT SIND ALLE WICHTIGEN INFOS. Stand: 29. Mai 2015 Genaue Infos zu den Freiwilligen-Diensten

Mehr

Bildungsungleichheiten in Österreich Basisdaten

Bildungsungleichheiten in Österreich Basisdaten Bildungsungleichheiten in Österreich Basisdaten Johann Bacher Institut für Soziologie, Universität Linz johann.bacher@jku.at 1. Umfang und Struktur Abbildung 1: Besuch einer AHS-Oberstufe oder BHS in Abhängigkeit

Mehr

Die Globalisierung als Herausforderung für Bildung. Gliederung. Gliederung. Die Weltgesellschaft

Die Globalisierung als Herausforderung für Bildung. Gliederung. Gliederung. Die Weltgesellschaft Die Globalisierung als Herausforderung für Bildung Bildung im Wandel Studium Generale Marburg 2012 Prof. Dr. Annette Scheunpflug, Die (Luhmann) Niklas Luhmann: Die heutige Gesellschaft muss als beschrieben

Mehr

41 T Korea, Rep. 52,3. 42 T Niederlande 51,4. 43 T Japan 51,1. 44 E Bulgarien 51,1. 45 T Argentinien 50,8. 46 T Tschech.

41 T Korea, Rep. 52,3. 42 T Niederlande 51,4. 43 T Japan 51,1. 44 E Bulgarien 51,1. 45 T Argentinien 50,8. 46 T Tschech. Gesamtergebnis Table 1: Klimaschutz-Index 2012 Tabelle 1 Rang Land Punkt- Einzelwertung Tendenz zahl** Trend Niveau Politik 1* Rang Land Punkt- Einzelwertung Tendenz zahl** Trend Niveau Politik 21 - Ägypten***

Mehr

Straftaten und Justizwesen

Straftaten und Justizwesen Straftaten und Justizwesen Straftaten und Justizwesen Registrierte Straftaten, Polizisten und Strafgefangene je, ausgewählte europäische Staaten, verschiedene Jahre 15.005 Schweden 78 191 Polizisten (2006)

Mehr

EMAU Greifswald Studierende Köpfe (Ausländer) entsprechend amtl. Statistik WS 11/12

EMAU Greifswald Studierende Köpfe (Ausländer) entsprechend amtl. Statistik WS 11/12 Ausländische Studenten 1. Studienfach insgesamt Staatsangehörigkeit 1 Irland 1 Kirgisien 1 Schweiz 1 Togo 6 1 Arabische Republ.Syrien 1 Armenien 3 China (VR)(einschl.Tibet) 1 Dänemark 1 Ghana 1 Griechenland

Mehr

Internetnutzung (Teil 1)

Internetnutzung (Teil 1) (Teil 1) Internetnutzung (Teil 1) Europäische Union Union und und ausgewählte europäische Staaten, 2010 nie nutzen**, in Prozent regelmäßig nutzen*, in Prozent 5 Island 92 5 Norwegen 90 ** Privatpersonen,

Mehr

Interpretationshilfe Check P6

Interpretationshilfe Check P6 Interpretationshilfe Check P6 16. September 2016 Institut für Bildungsevaluation Assoziiertes Institut der Institut Universität für Bildungsevaluation Zürich Assoziiertes Institut der Universität Zürich

Mehr

Antrag auf Gleichwertigkeitsfeststellung

Antrag auf Gleichwertigkeitsfeststellung Antrag auf Gleichwertigkeitsfeststellung Hinweise Bitte füllen Sie diesen Antrag vollständig aus ( 15 BQFG). Die mit * gekennzeichneten Felder können Sie freiwillig ausfüllen sie ermöglichen eine schnellere

Mehr

Haupthandelsströme Erdgas

Haupthandelsströme Erdgas Haupthandelsströme Erdgas Haupthandelsströme Erdgas Handelsströme per Pipeline * und in Form von Flüssiggas (LNG) ** in Milliarden Kubikmeter, 2008 Handelsströme per Pipeline* und in Form von Flüssiggas

Mehr

o2 (Postpaid) - Seite 1/2 Stand:

o2 (Postpaid) - Seite 1/2 Stand: o (Postpaid) - Seite 1/ Reise Option Travel Day Pack EU Roaming Flat Voice & Data 1 GB für o Blue All-in S/M Consumer/SoHo für o Blue All-in S/M Consumer/SoHo für o Blue All-in L/XL/Premium Consumer/SoHO

Mehr

www.researcher24.de info@researcher24.de Fax: 04131-225 600-20 Hotline: 0180-30 20 500 *

www.researcher24.de info@researcher24.de Fax: 04131-225 600-20 Hotline: 0180-30 20 500 * Marken M0110 Rs24 Pro Marken Deutschland Identity 24.- 1,50 M0111 Rs24 Light Marken Deutschland 69.- 8.- M0112 Rs24 Pro Marken Deutschland 99.- 15.- M0113 Rs24 Pro Marken Deutschland Detailabfrage 2,50

Mehr

Antrag auf Gleichwertigkeitsfeststellung

Antrag auf Gleichwertigkeitsfeststellung Handwerkskammer Chemnitz Abteilung Berufsbildung Herrn Andrè Pollrich Limbacher Straße 195 09116 Chemnitz Antrag auf Gleichwertigkeitsfeststellung Hinweise: Bitte füllen Sie diesen Antrag vollständig aus

Mehr

Erwerbsbeteiligung und Arbeitslosigkeit im höheren Erwerbsalter ein statistischer Überblick

Erwerbsbeteiligung und Arbeitslosigkeit im höheren Erwerbsalter ein statistischer Überblick Erwerbsbeteiligung und Arbeitslosigkeit im höheren Erwerbsalter ein statistischer Überblick Menschen im höheren Erwerbsalter sind europaweit ein bislang unzureichend genutztes Arbeitskräftepotenzial. Ihre

Mehr

Ausländisches Wirtschaftsrecht

Ausländisches Wirtschaftsrecht Ausländisches Wirtschaftsrecht Systematischer Arbeitskatalog für die Praxis von Dr. jur. R. Böckl Rechtsanwalt in Bonn begründet von Dr. jur M. Wittenstein Rechtsanwalt und Notar in Frankfurt am Main AW

Mehr

Antrag auf Gleichwertigkeitsfeststellung

Antrag auf Gleichwertigkeitsfeststellung Antrag auf Gleichwertigkeitsfeststellung Information und Beratung Handwerkskammer Reutlingen, Hindenburgstraße 58, 72762 Reutlingen Karl-Heinz Goller, Telefon 07121 2142-260, E-Mail: karl-heinz.goller@hwk-reutlingen.de

Mehr

PISA Ergebnisse und Erkenntnisse für Deutschland

PISA Ergebnisse und Erkenntnisse für Deutschland Prof. Dr. Manfred Prenzel PISA 2012. Ergebnisse und Erkenntnisse für Deutschland Konferenz für Sozial- und Wirtschaftsdaten Berlin, 21. Februar 2014 Überblick (1) Die Anlage der Studie (2) Mathematische

Mehr

Wirtschaft International. Ausländische Unternehmen im IHK-Bezirk Frankfurt am Main

Wirtschaft International. Ausländische Unternehmen im IHK-Bezirk Frankfurt am Main Wirtschaft International Ausländische Unternehmen im IHK-Bezirk Frankfurt am Main Impressum Herausgegeben von: Industrie- und Handelskammer Frankfurt am Main Geschäftsfeld Wirtschaftspolitik und Metropolenentwicklung

Mehr

Beherbergungsstatistik (HESTA) Richtlinien und Wegleitung zum Ausfüllen des Formulars der Beherbergungsstatistik

Beherbergungsstatistik (HESTA) Richtlinien und Wegleitung zum Ausfüllen des Formulars der Beherbergungsstatistik Beherbergungsstatistik (HESTA) Richtlinien und Wegleitung zum Ausfüllen des Formulars der Beherbergungsstatistik Richtlinien Wer ist in der Tourismusstatistik zu erfassen? Alle in Ihrem Betrieb gegen Entgelt

Mehr

Die PISA-Studie: Konzepte und Methodik

Die PISA-Studie: Konzepte und Methodik Institut für Statistik der LMU München Dozenten: Prof. Dr. Thomas Augustin, Julia Kopf, Gero Walter, Andrea Wiencierz Seminar: Statistische Herausforderungen sozialwissenschaftlicher Studien Die PISA-Studie:

Mehr

EMAU Greifswald Studierende Köpfe (Ausländer) entsprechend amtl. Statistik WS15/16

EMAU Greifswald Studierende Köpfe (Ausländer) entsprechend amtl. Statistik WS15/16 1 Ungarn 6 1 Albanien 1 Armenien 17 China 1 Kamerun 1 Mazedonien 5 Russische Foederation 2 Ukraine 1 Ungeklärt 2 Vietnam 40 5 Armenien 1 Bosnien und Herzegowina 1 Brasilien 2 Bulgarien 3 China 1 Dänemark

Mehr

Weiterhin vergleichsweise tiefe Steuerbelastung in der Schweiz

Weiterhin vergleichsweise tiefe Steuerbelastung in der Schweiz Eidgenössisches Finanzdepartement EFD Medienmitteilung Datum 17. Oktober 2007 Weiterhin vergleichsweise tiefe Steuerbelastung in der Schweiz Die Fiskalquote der Schweiz beträgt für das Jahr 2006 29,4 Prozent

Mehr

Mit diesem Online-Portal greifen Sie zügig auf alle Abrechnungsinformationen zu und stärken die wirtschaftliche Basis Ihrer Praxis Tag für Tag!

Mit diesem Online-Portal greifen Sie zügig auf alle Abrechnungsinformationen zu und stärken die wirtschaftliche Basis Ihrer Praxis Tag für Tag! 1 Mit diesem Online-Portal greifen Sie zügig auf alle Abrechnungsinformationen zu und stärken die wirtschaftliche Basis Ihrer Praxis Tag für Tag! Testen Sie www.abrechnung-zahnmedizin.de jetzt KOSTENLOS!

Mehr

Öffentlicher Schuldenstand*

Öffentlicher Schuldenstand* Öffentlicher Schuldenstand* Öffentlicher Schuldenstand* In Prozent In Prozent des Bruttoinlandsprodukts des Bruttoinlandsprodukts (BIP), (BIP), ausgewählte ausgewählte europäische europäische Staaten,

Mehr

OECD-Veröffentlichung Bildung auf einen Blick. Wesentliche Ergebnisse der Ausgabe 2011

OECD-Veröffentlichung Bildung auf einen Blick. Wesentliche Ergebnisse der Ausgabe 2011 OECD-Veröffentlichung Bildung auf einen Blick Wesentliche Ergebnisse der Ausgabe 2011 Mit ihrer jährlich erscheinenden Publikation Education at a Glance/Bildung auf einen Blick bietet die OECD einen indikatorenbasierten

Mehr

Binnenmarktanzeiger Leistung nach Mitgliedstaat Rumänien

Binnenmarktanzeiger Leistung nach Mitgliedstaat Rumänien Binnenmarktanzeiger Leistung nach Mitgliedstaat Rumänien (Berichtszeitraum: 2013-2014) Umsetzung des EU-Rechts Mit einem Umsetzungsdefizit in Bezug auf den Binnenmarkt von 1,1 % (14 Richtlinien) zählt

Mehr

Bremer Institut für Pädagogik und Psychologie (bipp)

Bremer Institut für Pädagogik und Psychologie (bipp) Bremer Institut für Pädagogik und Psychologie (bipp) www.bipp-bremen.de Schule an der N.N. Str. - Förderzentrum - 28309 Bremen März 2004 Evaluation der Fördermaßnahme zur Senkung der Wiederholerquote sowie

Mehr

Thema: Standardisierte Leistungsmessung I. Vergleichsarbeiten/Parallelarbeiten

Thema: Standardisierte Leistungsmessung I. Vergleichsarbeiten/Parallelarbeiten Universität Duisburg-Essen Standort Essen Seminar: Schülerleistung beobachten und bewerten Dozentin: Dr. Isabell van Ackeren Protokollantin: Katrin Kaspari Protokoll vom 17. 01.2005 Thema: Standardisierte

Mehr

Abgehende Verbindungen von Deutschland ins Ausland

Abgehende Verbindungen von Deutschland ins Ausland Abgehende Verbindungen von Deutschland ins Ausland Leistung Aufenthaltsort Einheit Preis 1 Anrufe in ausländische Festnetze Deutschland Ländergruppe 1 pro Minute 2 0,29 Ländergruppe 2 pro Minute 2 0,29

Mehr

Fairteilung von Bildungschancen!

Fairteilung von Bildungschancen! Fairteilung von Bildungschancen! Mittelzuteilung auf Basis des Chancen-Index: Ein Modell für eine gerechte, transparente und bedarfsorientierte Schulfinanzierung. Wir wollen dass alle Kinder die Bildungsziele

Mehr

AUSLANDSBAFÖG ZUSTÄNDIGKEITEN

AUSLANDSBAFÖG ZUSTÄNDIGKEITEN AUSLANDSBAFÖG ZUSTÄNDIGKEITEN AFRIKA Alle Länder Studentenwerk Frankfurt (Oder) Paul-Feldner-Str. 8 15230 Frankfurt/Oder Telefon: 033556509-22 Telefax: 033556509-99 E-Mail: bafoeg@studentenwerk-frankfurt.de

Mehr

Eurobarometer-Umfrage*, Angaben in in Prozent der der Bevölkerung**, Europäische Union Union und und ausgewählte europäische Staaten, Ende 2005

Eurobarometer-Umfrage*, Angaben in in Prozent der der Bevölkerung**, Europäische Union Union und und ausgewählte europäische Staaten, Ende 2005 Eurobarometer-Umfrage*, Angaben in in Prozent der der Bevölkerung**, Europäische Union Union und und ausgewählte Anteil der Bevölkerung, der mindestens zwei gut genug spricht, um sich darin unterhalten

Mehr

Entwicklung des realen BIP im Krisenjahr 2009

Entwicklung des realen BIP im Krisenjahr 2009 Entwicklung des realen BIP im Krisenjahr 2009 Entwicklung des realen BIP im Krisenjahr 2009 Ausgewählte europäische Staaten, prozentuale Veränderung des des BIP BIP* * im Jahr im Jahr 2009 2009 im Vergleich

Mehr

Geschäftskunden-Preisliste

Geschäftskunden-Preisliste Geschäftskunden-Preisliste SDSL Internet Access 2 Mbit* SDSL Internet Access: 119,00 141,61 - Datenflatrate - 1 feste IP Adresse * Höhere Bandbreiten und zusätzliche Optionen nach Prüfung möglich oder

Mehr

Luxemburg. Norwegen. Schweiz. Island. Zypern. Niederlande. Österreich. Schweden. Deutschland. Dänemark. Frankreich. Irland.

Luxemburg. Norwegen. Schweiz. Island. Zypern. Niederlande. Österreich. Schweden. Deutschland. Dänemark. Frankreich. Irland. Einkommen (Teil 1) Einkommen (Teil 1) Medianes Nettoäquivalenzeinkommen* in in Euro Euro und und Kaufkraftstandards (KKS), (KKS), Index Index KKS KKS (Deutschland = 100), = 100), ausgewählte europäische

Mehr

BUNDESAMT FÜR MIGRATION UND FLÜCHTLINGE

BUNDESAMT FÜR MIGRATION UND FLÜCHTLINGE Seite 1/6 da da Gewährung Albanien 121 8.113 7.865 96,9% 248 3,1% 3.455 - - 9 0,3% 43 1,2% 25 0,7% 77 2,2% 2.831 81,9% 547 15,8% 5.472 138 Bosnien und Herzegowina 122 8.474 5.705 67,3% 2.769 32,7% 6.594

Mehr

ILNAS-EN 14804:2005. Anbieter von Sprachreisen - Anforderungen. Organisateurs de séjours ou stages linguistiques - Exigences

ILNAS-EN 14804:2005. Anbieter von Sprachreisen - Anforderungen. Organisateurs de séjours ou stages linguistiques - Exigences Anbieter von Sprachreisen - Anforderungen Organisateurs de séjours ou stages linguistiques - Exigences Language study tour providers - Requirements 06/2005 Nationales Vorwort Diese Europäische Norm EN

Mehr

Technisches Briefing PISA 2006

Technisches Briefing PISA 2006 Technisches Briefing PISA 2006 Karin Zimmer, Senior Analyst und Leiterin des PISA-Teams im OECD-Bildungsdirektorat, Paris Berlin, 27. November 2007 1 Überblick Was misst PISA? Erarbeitung der Testfragen

Mehr

Interkulturelles Lernen mit der ICUnet.AG. Frankfurt am Main 20. Oktober 2008

Interkulturelles Lernen mit der ICUnet.AG. Frankfurt am Main 20. Oktober 2008 Interkulturelles Lernen mit der ICUnet.AG Frankfurt am Main 20. Oktober 2008 ICUnet.AG 70 feste Mitarbeiter 200 externe Mitarbeiter Kompetenz für 60 Kulturräume und 20 Sprachen im Team 4.000 Trainingsteilnehmer

Mehr