Daten, Modelle, Allgemeinbildung Stochastikuntericht vor neuen Herausforderungen Universität Kassel biehler@mathematik.uni-kassel.de
1. Bildungsstandards und Entwicklungsziele für den Unterricht
Leitidee Daten und Zufall Aus: KMK Bildungsstandards Die Schülerinnen und Schüler werten graphische Darstellungen und Tabellen von statistischen Erhebungen aus planen statistische Erhebungen entsprechend der zu untersuchenden Fragestellung sammeln systematisch Daten, erfassen sie in Tabellen und stellen sie graphisch dar, auch unter Verwendung geeigneter Hilfsmittel (wie Software) interpretieren Daten unter Verwendung von Kenngrößen reflektieren und bewerten Argumente, die auf einer Datenanalyse basieren beschreiben Zufallserscheinungen in alltäglichen Situationen bestimmen Wahrscheinlichkeiten bei Zufallsexperimenten (a.a.o, S. 14)
Leitidee Daten und Zufall Aus: KMK Bildungsstandards Die Schülerinnen und Schüler werten graphische Darstellungen und Tabellen von statistischen Erhebungen aus planen statistische Erhebungen entsprechend der zu untersuchenden Fragestellung sammeln systematisch Daten, erfassen sie in Tabellen und stellen sie graphisch dar, auch unter Verwendung geeigneter Hilfsmittel (wie Software) interpretieren Daten unter Verwendung von Kenngrößen reflektieren und bewerten Argumente, die auf einer Datenanalyse basieren beschreiben Zufallserscheinungen in alltäglichen Situationen bestimmen Wahrscheinlichkeiten bei Zufallsexperimenten (a.a.o, S. 14)
Leitidee Daten und Zufall Aus: KMK Bildungsstandards Die Schülerinnen und Schüler werten graphische Darstellungen und Tabellen von statistischen Erhebungen aus planen statistische Erhebungen entsprechend der zu untersuchenden Fragestellung sammeln systematisch Daten, erfassen sie in Tabellen und stellen sie graphisch dar, auch unter Verwendung geeigneter Hilfsmittel (wie Software) interpretieren Daten unter Verwendung von Kenngrößen reflektieren und bewerten Argumente, die auf einer Datenanalyse basieren beschreiben Zufallserscheinungen in alltäglichen Situationen bestimmen Wahrscheinlichkeiten bei Zufallsexperimenten (a.a.o, S. 14)
Eine kleine Revolution Aufwertung der Stochastik überhaupt Zugunsten einer Dualität von Zufall und Daten, Data and chance Datenanalyse mit eigenständiger Bedeutung statt Primat des Wahrscheinlichkeitsbegriffs
Daten Integration von Daten in übliche Themen, z.b. Visualisierung von Zahlen, Funktionen; statistische Aspekte ernst nehmen Beschreibende Statistik -> anwendungsbezogene Datenanalyse: PPDAC: Problem Plan Daten Analyse (C)Konclusionen Verteilungen; Vergleich von Verteilungen
Wahrscheinlichkeit: Daten und Zufall Wahrscheinlichkeitsrechnung: Anreichern durch Simulation mit realen Zufallsgeräten und durch computergestützte Simulation Zusammenspiel Daten und Zufall: Experimentelle Daten (eigene Experimente, Simulation) und Theorie (Modelle)
Propädeutik: Schließen aus Daten Neubewertung von Hypothesen anhand von Daten Bayes Probleme mit natürlichen Häufigkeiten Wie sicher ist der AIDS-Test Wie schießt man von Stichproben auf die Grundgesamtheit? Repräsentative, Zufalls-Stichproben, verzerrte Stichproben Wie unsicher/genau ist eine Schätzung in einer Stichprobe?
Literatur
Computereinsatz? Datenerhebung Datenanalyse und präsentation Größere Datenmengen Daten drehen und wenden nach selbstgewählten Fragen Computergestützte Simulation Große Wiederholungszahlen Variation der Annahmen
Projekte Forschung und Entwicklung mit der Software Fathom http://www.mathematik.uni-kassel.de/~fathom
http://www.mathematik.uni-kassel.de/~luf/ Tobias Hofmann: Multimediale Lernumgebung zur Einarbeitung in Fathom Datenauswertung Simulation 4 Module
2. Curriculare Stränge, rote Fäden von Daten und Zufall
Curriculare Stränge 1. Darstellung von Daten [in Medien; Interpretation] 2. Beschreibende Statistik Erhebung von Daten Verteilungen 3. Wahrscheinlichkeit und Zufallsexperimente, Simulation 4. Beurteilende Statistik, Schließen aus Daten 5. Funktionen und Daten 6. Zusammenhänge zwischen 2 numerischen Merkmalen
Warum curriculare Stränge Gleiches Recht für alle! Wir fordern: Spiralcurriculum für die Leitidee Daten und Zufall!
Warum curriculare Stränge Stufig-spiraliger Aufbau analog zu anderen Themen, z.b. Geometrie Begriffe wie Mittelwerte Streuungsmaße Wahrscheinlichkeit Kompetenzen im PPDAC-Zyklus Daten erheben, Fragen stellen, Schlüsse ziehen, Kommunizieren und Begründen -> Leitidee Daten und Zufall sollte in jedem Schuljahr auftauchen
Datenkompetenz in der Grundschule
3.1. Strang 1: Darstellung von Daten
Start in Klasse 5 Multivariate Datenanalyse Wir lernen unsere Klasse kennen!
Manuelle Arbeit mit Datenkarten Name Alter Körpergröße Armlänge Anzahl der Geschwister Weitsprung 50m Lauf Auf rechteckiger Karte notieren, dann unterschiedlich anordnen: sortieren, trennen
http://www.stat4u.at/
Datendarstellungen und ihre Variation Interpretationsebenen Beispiel in Klasse 5
Beispiel : Was ist mit dem Tapir los?
Datendarstellungen und visualisierungen Aus: Neue Wege 5, S. 17 Gut gemeinter Einbau statistischer Aspekte Keine gute statistische Aufgabe Mehr Daten; Fragen; Interpretationen; Visualisierungsalternativen Datei
Tiere Affe Biber Chipmunk Dachs Eichhörnchen Elefant Esel Fledermaus Giraffe Hamster Hund Hyäne Kamel Kaninchen Katze Lemming Löwe Manatee Maus Meerschweinchen Opossum Pferd Ratte Rind Schwein Seehund Spitzmaus Stachelschwein Stinktier Tapir Tiger Tümmler Wal Wiesel Ziege Herzschläge Bar Chart 0 100 200 300 400 500 600 700 800 Umfangreichere Daten Visualisierung mit Software
Tiere Wal Kamel Elefant Löwe Pferd Tapir Esel Manatee Hyäne Tiger Giraffe Rind Schwein Ziege Seehund Hund Katze Dachs Biber Tümmler Stinktier Opossum Wiesel Affe Kaninchen Meerschweinchen Stachelschwein Ratte Eichhörnchen Lemming Hamster Maus Chipmunk Spitzmaus Fledermaus Herzschläge Tiere Bar Chart 0 100 200 300 400 500 600 700 800 Dot Plot Bitte nach Größe sortieren und interpretieren! Womit hängt die Herzfrequenz zusammen? Größe, Typ des Tieres? 0 100 200 300 400 500 600 700 800 Herzschläge
Was lernen wir von den Tieren? Tiere Wal Kamel Elefant Löwe Pferd Tapir Esel Manatee Hyäne Tiger Giraffe Rind Schwein Ziege Seehund Hund Katze Dachs Biber Tümmler Stinktier Opossum Wiesel Affe Kaninchen Meerschweinchen Stachelschwein Ratte Eichhörnchen Lemming Hamster Maus Chipmunk Spitzmaus Fledermaus Herzschläge Säulendiagramm 0 200 400 600 800
Was lernen wir von den Tieren? Tiere Wal Kamel Elefant Löwe Pferd Tapir Esel Manatee Hyäne Tiger Giraffe Rind Schwein Ziege Seehund Hund Katze Dachs Biber Tümmler Stinktier Opossum Wiesel Affe Kaninchen Meerschweinchen Stachelschwein Ratte Eichhörnchen Lemming Hamster Maus Chipmunk Spitzmaus Fledermaus Herzschläge Säulendiagramm 0 200 400 600 800 Tiere Wal Kamel Elefant Löwe Pferd Tapir Esel Manatee Hyäne Tiger Giraffe Rind Schwein Ziege Seehund Hund Katze Dachs Biber Tümmler Stinktier Opossum Wiesel Affe Kaninchen Meerschweinchen Stachelschwein Ratte Eichhörnchen Lemming Hamster Maus Chipmunk Spitzmaus Fledermaus Lebensspanne 0 5 10 15 20 25 30 35 Je schneller das Herz schlägt, desto kürzer das Leben! Jedenfalls tendenziell! Säulendiagramm
Einsichten Ordnen von Säulendiagrammen nach verschiedenen Kriterien Leseniveau von Säulendiagrammen: Lesen der Daten, Lesen zwischen den Daten und hinter den Daten Tendenzaussagen: Je schneller das Herz, desto tendenziell kürzer das Leben Basisoperationen zur Ordnung und Umordnung von Daten, zur geometrischen Kodierung von Zahlen Streudiagramme als Basisdarstellung
Beispiele Graphiken in Medien kritisch hinterfragen
http://btmdx1.mat.uni-bayreuth.de/smart/buch/smart_sinus_j05_angabe.pdf
Grundproblem Visualisierung durch Position zur Achse, nicht durch Länge oder Fläche Interpretation als Längenvisualisierung führt zu Fehlschlüssen Grundproblem bei allen Visualisierungen, auch bei Funktionen (Fensterabhängigkeit, Darstellungsverhältnis, Skalen)
Aus: Neue Wege 5, S. 19 Verbesserung der Aufgabe: Eine Zeitung berichtet: Zwischen 1987 bis 1990 hat sich die Menge der Ladendiebstähle auf ein Mehrfaches gesteigert! Nimm dazu Stellung! Achtung: Fehlinterpretation durch Vergleich der absoluten Längen, statt Bezug auf die Achse (Ähnlich: schwere Aufgabe in PISA)
http://www.roland-koch.de/down/2/wissenschaft_kunst_fraktion.pdf
Lesen zwischen den Daten, hinter den Daten Inflationsrate Anzahl der Studierenden Andere Bundesländer Etats anderer hessischer Ministerien.
Quelle: Hessenletter 37, 11. Juni 2004
Probleme bei Visualisierung mit Längen, Flächen, Volumina
http://btmdx1.mat.uni-bayreuth.de/smart/buch/smart_sinus_j05_angabe.pdf Zu Beschreibende Statistik
Vergleich von Standarddiagrammen (leicht mit EXCEL, wenn Daten schon ausgezählt) Landtagswahlen in Sachsen-Anhalt 1994 und 1998
Landtagswahlen in Sachsen-Anhalt 1994 und 1998 http://btmdx1.mat.uni-bayreuth.de/smart/buch/smart_sinus_j05_angabe.pdf
Aufgaben dazu Problem 1: Welche Kriterien ziehe ich zum Vergleich heran Absolute und relative Vergleiche bezogen auf verschiedene Zwecke Problem 2: Warum werden die Graphiken eigentlich nicht hinsichtlich der politischen Bedeutung interpretiert
Es fehlt ein Diagrammtyp: Anordnung der Verteilungen nebeneinander (untereinander)
3.2. Strang 2 Beschreibende Statistik ( Explorative Datenanalyse) Erhebung von Daten Verteilungen Vergleich von Verteilungen
Thema: Umfragen im Mathematikunterricht 2 Projekte mit der Reformschule Kassel (Gesamtschule, jahrgangsübergreifend Kl 6-8) Albert-Schweitzer-Gymnasium, Kassel, Kl. 9 Ca. 4 5 Wochen Unterricht Abschluss: Projekt mit selbstgewählten Fragestellungen mit eigener Präsentation
Prinzipien Integration des Lernens statistischer Darstellungen und Begriffe in einen Zyklus von Datenerhebung bis Auswertung Verwendung relativ komplexer Datensätze, die über die Schüler selber (mehrere Jahrgänge) erhoben wurden Online-Unterstüzung der Datenerhebung (Testdatei) Computereinsatz nach Vorbereitung mit händischen Aktivitäten
Beispiele für Fragen im Ausgangsdatensatz Verteilungen Verteilungsvergleiche TV-Konsum in Abhängigkeit von Geschlecht, Alter, Einfluss der Eltern, Jahrgangsstufe, Verfügbarkeit von TVs Einfluss der Eltern und Geschlecht Interesse an TV-Sendungen in Abhängigkeit von Geschlecht Zum Datensatz
Umsetzung von Rohdaten in Verteilungen:kategorial und numerisch (ohne Prozente)
Verändern von Histogrammen: Klasseneinteilung
Verteilung und typische Werte Reformschule TV-Befragung 60 50 40 30 20 10 Histogramm 0 10 20 30 40 50 60 70 TV_Gesamt 1. Stufe: Mittlerer Haufen (nicht eindeutig) so zwischen 2 und 10 Std. sehen die meisten fern Präzisierung durch verschiedene Mittelwerte + Streuung
Verteilungsbeschreibung mit Mittelwerten 1. Stufe: Berechnung von amittel und Zentralwert Interpretation als Gleichverteilungs- bzw. Halbierungswert Einbettung in Verteilungskontext Favorisierung je nach Passung als Beschreibung des mittleren Haufens
Streuung und Verteilungen Beispiel für unterschiedliche Streuung: qualitativ Reformschule TV-Befragung 70 60 50 Mädchen40 30 20 10 0 70 60 50 Geschlecht Junge40 30 20 10 Histogramm Median ( ) = 2 0 5 10 15 20 25 30 TV_Wochenende
Streuung und Verteilungen Beispiel 2 für unterschiedliche Streuung: qualitativ Reformschule TV-Befragung viel wenig gar nicht Punktdiagramm 0 10 20 30 40 50 60 TV_Gesamt Median ( ) = 5,5 Größere Abweichungen vom Median bei kein Einfluss Größere Streuung Rein visuell bei unterschiedlicher Datenanzahl: Fehlurteile möglich
Streuungsmaß für die Schule? Standardabweichung nicht verständig und intuitiv vermittelbar Alternative: Quartilabstand Boxplot als Visualisierung einer Viertelung der Daten
Verwirrend: die Einteilung in Quartilränge Auf den ersten Blick etwas verwirrend ist die Einteilung in so genannte Quartile. Die teilnehmenden Schulen jeder Aufgabengruppe wurden nach Punktzahl gelistet und dann in vier zahlenmäßig gleichgroße Gruppen (Quartile) geteilt. Die Punktzahlen der besten und der schlechtesten Schule in jeder der vier Gruppen bilden die»quartilsgrenzen«, die je nach Ergebnis von Jahr zu Jahr und von Schulform zu Schulform variieren. Bei der Aufgabengruppe A (Gymnasien) sind sie aktuell wie folgt Quartil I: 6 bis 17,32 Punkte; Quartil II: 17,34 bis 20,76 Punkte; Quartil lii: 20,77 bis 23,85 Punkte, Quartil IV: 23,9 bis 31,2 Punkte. http://www.weidigschule.de/projekte/mwett03.htm
http://schulamt-gross-gerau.bildung.hessen.de/fachberatung/mw/mw_0607/mw0607_1r_landesergebnisse.pdf
Boxplot und Quartile Stufe 1 Intervall von Q1 bis Q3 präzisiert den mittleren Haufen ohne Streuungsmaß Stufe 2 Qualitative Quartilabstandsvergleiche ohne numerische Werte Stufe 2 Quartilabstand kann die Ausdehnung des mittleren Haufen messens
Beispiel Verteilungsvergleich Grenzen visueller Vergleiche Kein Einfluss: größere Heterogenität und leichte Zunahme des Medians
Wahrscheinlichkeitsrechnung
Elementare Wahrscheinlichkeitsrechnung (mit Bruchrechung und frequentitischer Interpretation) Verbindung von kombinatorisch-theoretischer und experimenteller Methode Gesetz der großen Zahl Ws. auch in nicht-laplace-situationen
Gesetz der großen Zahl Einfaches Gesetz Multiples Gesetz
Höhere Wahrscheinlichkeitsrechnung in der Sek. I Mehrstufige Zufallsexperimente mit Pfadregeln Erwartungswertaufgaben Simulation komplexerer Situationen Gesetz der großen Zahl: 1/Wurzel(n) Gesetz
Rolle von Experimenten und Simulation Stütze bei der Modellierung Zufall erfahren, veranschaulichen Ws als erwartete relative Häufigkeit betonen Bestimmung von Wahrscheinlichkeiten vereinfachen (Elementarisieren) Experimentelles Pendant zu theoretischen Rechnungen (wechselseitige Kontrolle) Selbstzweck: Methoden mit eigener Bedeutung Zum Differenzspiel
Anfang der Wahrscheinlichkeitsrechnung Die Wahrscheinlichkeit von Augensummen Jemand bietet Dir ein Würfelspiel an. Dazu sollen zwei Würfel gleichzeitig geworfen und die Augensumme gezählt werden. Du darfst die vorher aussuchen, ob Du mit der Augensumme 5,6,7,8 (Ereignis A) oder mit allen übrigen Augensummen (Ereignis B) gewinnen möchtest. Begründe, ob Du eine der beiden Gewinnmöglichkeiten bevorzugen würdest. Müller, J. H. (2005). Die Wahrscheinlichkeit von Augensummen Stochastische Vorstellungen und stochastische Modellierung. Praxis der Mathematik, 47(4), 17-22
Theorie 1 Summe 2 3 4 Anteil 5 A 4 0,36 6 B 7 0,64 7 8 11 9 10 11 12 B ist günstiger!
Theorie 2 Summe Kombinationen 2 1/1 3 1/2 4 1/3,2/2 Anteil 5 1/4,2/3 A 11 0,52 6 1/5,2/4,3/3 B 10 0,48 7 1/6,2/5,3/4 8 2/6,3/5,4/4 21 9 3/6,4/5 10 4/6,5/5 11 5/6 12 6/6 A ist günstiger!
Theorie 3 Summe Kombinationen weitere Komb. 2 1/1 3 1/2 2/1 Anteil 4 1/3,2/2 3/1 5 1/4,2/3 4/1,3/2 A 11+9 20 0,56 6 1/5,2/4,3/3 5/1,4/2 B 10+6 16 0,44 7 1/6,2/5,3/4 6/1,5/2,4/3 8 2/6,3/5,4/4 6/2,5/3 36 9 3/6,4/5 6/4,5/4 10 4/6,5/5 6/4 11 5/6 6/5 12 6/6 A ist günstiger!
Theorienvergleich Ereignis A B % % Theorie 1 36 64 Theorie 2 52 48 Theorie 3 56 44 Zur fertigen Simulation Aufbau einer Simulation
N = 100
Simulation N = 5000