Statistik mit Tabellenkalkulation 4. Erstellen von Klassen Mit einem einfachen Befehl lässt sich eine Liste von Zahlen auf die Häufigkeit der einzelnen Werte untersuchen. Verwenden Sie dazu den Befehl ZÄHLENWENN(Bereich;Suchwert). Anhand des folgenden Beispiels wird klar, wie der Befehl zu verwenden ist. Tabelle mit Urliste und Klasseneinteilung Die Formeln für die absolute Häufigkeit Die Liste in Spalte A (Urliste) soll auf die Häufigkeit der einzelnen Zahlen untersucht werden. Es kommen die Zahlen 1 bis 4 vor. In Spalte C werden die möglichen Werte eingegeben. In Spalte D wird das Vorkommen der Zahlen aus Spalte C in der Urliste (Spalte A) gezählt. Beachten Sie, dass in der Formel einmal absolute und einmal relative Adressen verwendet werden. Aufgabe 4.1. Spezialwürfel Etwas stimmt nicht mit diesem Würfel. Welche Werte stehen wohl auf den 6 Seiten? Machen Sie zur Untersuchung eine Tabelle, in der die absolute und relative Häufigkeit ersichtlich wird. Schwieriger wird die Aufgabe, wenn Klassen mit mehreren verschiedenen Elementen gebildet werden sollen. Dann ist folgendes Vorgehen möglich: Bestimmen Sie das maximale und das minimale Element in der Urliste. Legen Sie die Klassenbreite so fest, dass etwa 10 bis 20 Klassen entstehen. Machen Sie eine Liste der Klassenminima. Runden Sie alle Werte in der Urliste in einer neuen Liste auf die Klassenminima ab. Zählen Sie die Häufigkeit der Werte in der neuen Liste. Berechnen Sie die Klassenmitten zu den Klassenminima. Seite 6
4.2. Ra226 a) Erstellen Sie eine Auswertung der ersten Messreihe mit 16 Klassen bei einer Klassenbreite von 5. Denken Sie bei der Bestimmung der Klassenmitte daran, dass es sich hier um eine diskrete Skala handelt. b) Stellen Sie das Resultat in einem Histogramm dar. Vergleichen Sie es mit der Grafik auf den Theorieblättern zur Statistik (S. 4). 4.3. Körpergrösse a) Die Stichprobe zeigt die Grösse von 200 Personen. Erstellen Sie eine Auswertung mit einer Klassenbreite von 5 cm. Hier liegt im Gegensatz zu Aufgabe 2 eine stetige Skala vor. b) Zeigen Sie das Resultat wieder in einem Diagramm. 5. Mittelwerte Der Mittelwert einer Liste kann problemlos mit einer Tabellenkalkulation bestimmt werden. Der entsprechende Befehl heisst MITTELWERT(Bereich). Excel kennt auch den Befehl MEDIAN(Bereich) und löst entsprechende Problemstellungen souverän. 5.1. Ruderer Die Datei enthält die Körpergewichte aller Ruderer (inkl. Steuermann) des Jahres 1992 im bekannten Wettstreit zwischen Oxford und Cambridge. a) Berechnen Sie Mittelwert und Median. b) Welcher Wert ist für welche Aussage der bessere? 5.2. Bohnen Bestimmen Sie Mittelwert und Median für die Zahl der Samen in den ausgezählten Bohnenschoten. 5.3. Kiefern Die Tabelle enthält die Höhe von 125 neunjährigen Kiefern. Die Klassenbreite beträgt 20 cm. Berechnen Sie den Mittelwert, in dem Sie die Klassenmitten mit der Klassenhäufigkeit gewichten. 5.4. Neugeborene Berechnen Sie die mittlere Grösse eines Neugeborenen. 5.5. Bevölkerung Berechnen Sie das Durchschnittsalter der Bevölkerung in den einzelnen Kantonen und in der gesamten Schweiz. Seite 7
6. Streuung und Normalverteilung Die Standardabweichung kennen alle Tabellenkalkulationsprogramme. Der entsprechende Befehl heisst STABW(Bereich). Hier wird die Standardabweichung einer Stichprobe berechnet (d.h. es wird durch n 1 dividiert). Die Standardabweichung einer Grundgesamtheit erhält man mit STABWN(Bereich). Maximum und Minimum einer Liste liefern MAX(Bereich) und MIN(Bereich). Die Quartile kann man über den Befehl QUARTILE(Bereich;Nummer) (Nummer ist 1, 2 oder 3) finden. Der Befehl arbeitet aber leicht anders, als wir ihn definiert haben. Den Quartilsabstand bekommt man mit QUARTILE(Bereich;3) QUARTILE(Bereich;1). Boxdiagramme kennt Excel nicht im Gegensatz zum TI 89/92. Sie sind im Folgenden kein Thema. 6.1. Licht a) Berechnen Sie übungshalber Mittelwert und Standardabweichung der ersten Datenserie ohne die Befehle MITTELWERT() und STABW(). b) Vergleichen Sie die Mittelwerte und die Standardabweichung der fünf Serien. Vergleichen Sie auch mit dem theoretischen Wert. c) Bestimmen Sie zusätzlich, die Spannweite der Daten (Differenz zwischen Maximum und Minimum). Stimmt deren Aussage mit derjenigen der Standardabweichung überein? 6.2. Kiefern Ergänzen Sie die bereits berechneten Daten um die Standardabweichung. Testen Sie, ob eine Normalverteilung vorliegt, in dem Sie die Häufigkeiten in den Bereichen um den Mittelwert mit den theoretischen Werten für die Normalverteilung vergleichen. 6.3. Neugeborene Ergänzen Sie die bereits berechneten Daten um die Standardabweichung. Testen Sie, ob eine Normalverteilung vorliegt. Zeichnen Sie dazu den Graphen der Gauss Funktion über das Histogramm. Seite 8
7. Lineare Regression Natürlich ermöglicht auch Excel lineare Regression. Alle wichtigen Grössen lassen sich problemlos berechnen. Die Steigung und der y Achsenabschnitt der Regressionsgeraden kann mit STEIGUNG(y Bereich;x Bereich) und ACHSENABSCHNITT(y Bereich;x Bereich) bestimmt werden. In Grafiken lassen sich zudem Regressionsgeraden direkt integrieren, indem die Datenpunkte ausgewählt und über das Kontextmenu Trendlinie hinzufügen aktiviert wird. 7.1. Störche Glauben Sie an den Storch? Nein? Dann sehen Sie sich die Datei einmal an! Die Tabelle zeigt die Einwohnerzahl und die Zahl der Storchenpaare in Oldenburg in den Jahren 1930 bis 1936. a) Tragen Sie die Zahl der Einwohner gegen die Zahl der Storchenpaare in einem Diagramm auf (Störche auf der x, Einwohner auf der y Achse). b) Bestimmen Sie die Regressionsgerade. Verwenden Sie übungshalber die Befehle STEIGUNG() und ACHSENBASCHNITT() nicht resp. kontrollieren Sie mit ihrer Hilfe Ihre Berechnung. c) Wie gut ist die Annäherung durch die Regressionsgerade? Berechnen Sie den Korrelationskoeffizienten. d) Ganz wichtig: Erörtern Sie Ihre Resultate! 7.2. Lungenkrebs 1955 wurde eine Statistik über Zigarettenkonsum und Lungenkrebs veröffentlicht. a) Tragen Sie die Daten in einem x y Diagramm gegeneinander auf. Fällt Ihnen etwas auf? Was machen Sie in der weiteren Rechnung mit dem auffälligen Datenpaar? b) Bestimmen Sie die Regressionsgerade. c) Wie gut ist die Annäherung durch die Regressionsgerade? Berechnen Sie den Korrelationskoeffizienten. d) Erörtern Sie das Resultat! Was schliessen Sie für das auffällige Datenpaar in Aufgabe a)? Seite 9
8. Statistik im Sport Michael Jordan gilt als einer der besten Basketballspieler aller Zeiten. Die Datei Jordan.xls enthält alle statistischen Daten seiner NBA Karriere. 8.1. Eine ganz wichtige Spalte fehlt in der Statistik: Die points per game (PPG). a) Berechnen Sie die mittlere Punktezahl pro Spiel für alle Saisons. In welcher Saison war Jordan in diesem Kriterium am besten? Welche Saison war diesbezüglich die durchschnittliche/mittlere? b) Machen Sie ein Boxplot Diagramm zu PPG. c) Zeigen Sie die Häufigkeit der PPG in einem Histogramm. Wählen Sie 1 als Klassenbreite. d) Ähnliche Statistiken sind möglich, wenn Sie die Kategorien FGM und FGA resp. FTM und FTA gesamthaft oder pro Spiel auswerten. 8.2. Jordan war bekannt dafür, im entscheidenden Moment am besten zu spielen. Vergleichen Sie dazu seine Leistungen der regular season mit den entsprechenden Kategorien in den playoffs. a) Wie fällt der Vergleich bei PPG aus? Wieviel war er in den playoffs jeweils besser? b) Gibt es andere Auffälligkeiten? 8.3. Untersuchen Sie Fragen, die Sie selber interessieren. 8.4. Finden Sie im Internet Daten von Sportlerinnen und Sportlern, die Sie ebenfalls interessieren und werten Sie diese statistisch aus. Seite 10