Beeinflusst der Wohnort die Bildungschancen?

Größe: px
Ab Seite anzeigen:

Download "Beeinflusst der Wohnort die Bildungschancen?"

Transkript

1 Maturarbeit von Neue Kantonsschule Aarau Betreuende Lehrperson: Michel Hauswirth 14. Oktober 2013

2 I. Abstract Zeitungsartikel wie jener in der NZZ vom 30. Juni 2013 lassen aufhorchen: Zugang zum Langzeitgymnasium erhalten heute nicht die klügsten Kinder, sondern jene Sprösslinge, deren Eltern die Vorbereitungskurse bezahlen können. 1 Ob sich eine solche Aussage auch im Kanton Aargau machen lässt, und von welchen anderen Faktoren gute Bildung abhängen könnte, habe ich untersucht. So habe ich den Gymnasiasten-, Bezirks-, Sekundar- und Realschüleranteil jeder Aargauer Gemeinde bestimmt. Diese Grössen stellte ich der Bevölkerungsdichte, dem Reinvermögen, den Wähleranteilen der vier grössten Parteien, dem Ausländeranteil und dem durchschnittlichen steuerbaren Einkommen pro steuerpflichtige Person gegenüber. Die meisten verwendeten Zahlen hatte ich aus der statistischen Datenbank des Kantons Aargau. Tatsächlich wird der Bezirks- und Realschüleranteil einer Gemeinde vom durchschnittlichen Einkommen pro steuerpflichtige Person, dem Reinvermögen und dem Ausländeranteil beeinflusst. Das Reinvermögen, die Bevölkerungsdichte, der FDP-, SP- und SVP Wähleranteil und das durchschnittliche Einkommen pro steuerpflichtige Person beeinflussen - wenn teilweise auch nur in geringem Masse - den Gymnasiastenanteil der Aargauer Gemeinden. II. Vorwort Ich möchte folgenden Personen danken, die mich während des Arbeitsprozesses unterstützt haben: Daniel Cahn für die Gewährung des kostenlosen Zugangs zur kantonalen statistischen Datenbank. Peter Hartmann (dipl. math. ETH / Executive MBA HSG, Inhaber der Firma AFO- Marketing, wo ich mein Praktikum gemacht habe) für die fachmännische Beratung und die Tipps, die er mir gegeben hat, vor allem bei der Datensammlung. Kerstin Gärtner (dipl. Wirtschaftsgeographin, Mitarbeiterin der AFO-Marketing) für die Hilfe beim Erstellen der Karten. Christiane Okonek (PD Dr. rer. pol., Mitarbeiterin der AFO-Marketing) hat mir den Umgang mit SPSS während meiner Praktikumszeit näher gebracht. 1 NZZ am Sonntag, 30.Juni 2013, S. 17, Ralf Margreiter 2

3 Prof. Dr. Werner Stahel, Seminar für Statistik, ETH Zürich, für die Beantwortung meiner Anfrage bezüglich eines Fehlers in der von mir verwendeten Fachliteratur. Weiter möchte ich mich bei Herrn Michel Hauswirth bedanken, der mich während des ganzen Arbeitsprozesses als Betreuungsperson unterstützt hat. 3

4 III. Inhaltsverzeichnis 1 Einleitung Motivation Ziele Theoretische Grundlagen Benutzung von SPSS Skalenniveaus von Daten Verwendete Funktionen im SPSS Lagemasse und Streuungsmasse in der Statistik Die Stärke des Zusammenhangs zwischen zwei Variablen Die grafische Beschreibung Der Korrelationskoeffizient von K. Pearson Der Korrelationskoeffizient nach Spearman Die einfache lineare Regression Die multiple lineare Regression Methode Datensammlung Datenaufbereitung Gymnasiastenanteil Bezirks-, Sekundar- und Realschüleranteil Bevölkerungsdichte Reinvermögen Wähleranteile der vier grössten Parteien Ausländeranteil Steuerbares Einkommen pro Monat Analyse Darstellung der Ergebnisse Analyse des Gymnasiastenanteils mit der Bevölkerungsdichte mit dem Reinvermögen mit den Wähleranteilen mit dem Ausländeranteil mit dem durchschnittlichen steuerbaren Einkommen

5 4.2 Formulierung einer multiplen linearen Regressionsgleichung Zusammenhänge auf der Sekundarstufe I Diskussion der Ergebnisse Interpretation der Ergebnisse im Hinblick auf die Fragestellungen Kritik am methodischen Vorgehen Fazit Blick in den Kanton Zürich Zusammenfassung Quellenverzeichnis Literaturverzeichnis Abbildungsverzeichnis Tabellenverzeichnis Anhang

6 1 Einleitung 1.1 Motivation Die Idee, meine Maturarbeit im Bereich der Datensammlung, Datenaufbereitung und Datenauswertung zu schreiben, entstand während meiner Praktikumszeit bei der Firma AFO-Marketing in Hünenberg, Kanton Zug. Kunden der AFO-Marketing sind Firmen, die Daten über ihre eigenen Kunden bei der AFO aufbereiten und auswerten lassen. So erfahren diese Firmen, welche Merkmale typisch für ihre Kunden sind (z.b. ob die Kunden v.a. männlich oder weiblich sind, zu welcher Alterskategorie sie gehören, wie kaufkräftig sie sind, ob sie eher allein oder in einem Mehrpersonenhaushalt leben, usw.). Dadurch kann die Firma ihre Zielgruppe besser charakterisieren und so beispielsweise gezielter Werbung schalten. Mein Interesse an diesem Gebiet wurde im Praktikum geweckt, da ich aktiv in den Arbeitsprozess miteinbezogen wurde und deshalb auch schon einiges über die Statistiksoftware SPSS und der Software ArcGIS, mit der sich die Daten in einer Karte darstellen lassen, erfuhr. Es beeindruckte mich, wie man mit nur wenigen Klicks im SPSS bereits interessante Aussagen machen kann, sofern aufbereitete Daten vorliegen. Das Thema Bildung im Kanton Aargau wählte ich aus, weil ich eine Fragestellung untersuchen wollte, die für jeden Aargauer Gymnasiasten von Interesse sein sollte. 1.2 Ziele Leitfrage: Welche in den aargauischen Gemeinden statistisch erhobenen Daten beeinflussen wie die Verteilung der Schüler auf die verschiedenen Leistungsniveaus der Schulen? Teilfragen: 1. Welche Aussagen lassen sich über die Verteilung der Schüler auf die verschiedenen Leistungsniveaus der Schulen in den Gemeinden des Kantons Aargau machen? 2. Welche statistisch erhobenen Daten beeinflussen die bei Teilfrage 1 herausgefundene Verteilung der Schüler wie? Hypothesen wie beispielsweise, dass kaufkräftige Gemeinden einen überdurchschnittlichen Anteil an Gymnasiasten haben, lassen sich mit der Beantwortung der Teilfragen klären. Weitere Hypothesen wären, dass weniger kaufkräftige Gemeinden einen höheren Anteil an 6

7 ausländischen Schülern haben oder, dass städtische Gemeinden einen höheren Anteil an Gymnasiasten haben als ländliche. Kurz gesagt will ich herausfinden, ob sich, wenn man gewisse statistisch erhobene Daten einer Aargauer Gemeinde (wie z.b. die Kaufkraft, den Ausländeranteil, die Bevölkerungsdichte, etc.) kennt, ableiten lässt, ob sie z.b. einen hohen Anteil an Bezirksschülern und infolgedessen auch einen hohen Anteil an Gymnasiasten hat. Aufgrund des obigen Abschnitts aus der Projektvereinbarung habe ich mich entschlossen, in den Theorieteil auch das Modell der statistischen linearen Regression und der multiplen linearen Regression aufzunehmen. 2 Theoretische Grundlagen 2.1 Benutzung von SPSS Skalenniveaus von Daten (vgl. Universität Zürich, Skalenniveau, 2010 und Wikipedia, Skalenniveau, 2013) Für die Wahl der Methode muss man zuerst wissen, welches Skalenniveau die einzelnen Variablen haben. Die Daten haben verschiedene Eigenschaften und Qualitäten, welche vom Skalenniveau bestimmt werden. So verwendet man beispielsweise bei unterschiedlichen Skalierungen auch unterschiedliche Korrelationskoeffizienten. Folgend stelle ich die drei wichtigsten Skalenniveaus vor: 1. Nominalskala: Den niedrigsten Informationsgehalt haben nominalskalierte Daten. Meistens handelt es sich um Kategorien, die zur Auswertung numerisch dargestellt werden. Beispiele dafür wären das Geschlecht (1 für weiblich, 2 für männlich) oder der Wohnort (1 für Bern, 2 für Zürich, 3 für Genf). 2. Ordinalskala oder auch Rangskala: Daten, die ordinalskaliert sind, ergeben eine klare Rangreihe. Man kann aber keine Aussagen über die absoluten Abstände zwischen den Werten machen. Ein Beispiel dafür sind Schulnoten. Es lässt sich hier keine numerische Aussage darüber machen, wie viel besser eine 6 als eine 3 ist. Auch muss der Abstand zwischen einer 3 und einer 4 nicht gleich gross sein wie der Abstand von einer 4 und einer Kardinalskala: Bei kardinalskalierten Merkmalen lässt sich eine Aussage über die Abstände der Daten machen. Ein Beispiel dafür ist die Körpergrösse. Jemand, der 200 cm gross ist, ist gegenüber jemandem, der 180 cm gross ist genau gleich viel 7

8 grösser als jemand der 185 cm gross ist gegenüber einem 165 cm grossen Menschen Verwendete Funktionen im SPSS Hier beschreibe ich, welche Funktionen, die ich im SPSS verwendet habe, wie aufgerufen und ausgeführt werden können Abbildung 2.1: Benutzeroberfläche von SPSS Das Streudiagramm (s. Kap ): Das Streudiagramm erstellt man über Diagramme => Veraltete Dialogfelder => Streu-/Punktdiagramm => Einfaches Streudiagramm => Definieren => Variable auf X- bzw. Y-Achse auswählen => Ok. Die Korrelationskoeffizienten (s. Kap /2.3.3): Die Korrelationskoeffizienten berechnet man über Analysieren => Korrelationen => Bivariat => Variablen auswählen. Die Bestimmung einer Regressionsgleichung (s. Kap. 2.4/2.5): Die Regressionsgleichung kann berechnet werden über Analysieren => Regression => Linear => abhängige und unabhängige Variable auswählen (s. Kap. 2.4) => Ok => In der Tabelle Koeffizienten unter nicht standardisierte Koeffizienten kann man die Regressionskoeffizienten ablesen. 8

9 2.2 Lagemasse und Streuungsmasse in der Statistik (vgl. Hatzinger & Nagel, 2013, S ) Masszahlen, die beschreiben, wo das Zentrum der Daten ist, nennt man Lagemasse. Masszahlen, welche angeben, wie stark die Daten variieren, nennt man Streuungsmasse. Ein Beispiel dazu: Die Körpergrösse variiert viel stärker als die Schuhgrössen variieren, die Streuungsmasse sollen daher für die Körpergrösse grössere Werte ergeben, als für die Schuhgrösse. Der folgende kleine, hypothetische Datensatz mit nur 10 Werten soll für die Erläuterung und Berechnung der verschiedenen Lage und Streuungsmasse dienen: 7, 10, 16, 9, 12, 13, 9, 8, 10, 9 Die zwei wichtigsten Lagemasse sind: Der Mittelwert : Man erhält ihn durch das Aufsummieren der Werte und anschliessendes Dividieren durch die Anzahl n der Werte: = Für unseren Beispieldatensatz bedeutet das: = = 10,3 Der Median : Zunächst werden die Daten sortiert und der Wert in der Mitte bestimmt. Ist die Anzahl von Werten ungerade, so ist der Wert eindeutig (der Wert der in der Rangliste in der Mitte liegt). Bei einer geraden Anzahl von Werten mittelt man die beiden Werte, die der Mitte am nächsten sind: 10, 12, 13, 16 Der Median ist also = 9,5 Der Median ist im Vergleich zum Mittelwert resistenter gegen Ausreisser. Zwei Streuungsmasse, die ich später noch brauchen werde: Die Varianz : Ist ein Mass für die Grösse der Abweichung von einem Mittelwert. Um sie zu erhalten berechnet man die Differenz der Beobachtungen vom Mittelwert, quadriert diese und zählt diese Quadrate zusammen und teilt durch n-1: 9

10 = Wobei für den Mittelwert steht. Diesen haben wir oben berechnet: Er beträgt 10,3. Für unser Zahlenbeispiel heisst das: = [ ] = 7,122 Die Standardabweichung s: Das ist die mittlere Abweichung einer Streuung. Um sie zu berechnen, zieht man die Wurzel aus der Varianz : s = s = 2, Die Stärke des Zusammenhangs zwischen zwei Variablen Die grafische Beschreibung (vgl. Hatzinger & Nagel, 2013, S ) Zur grafischen Beschreibung der Daten werden sogenannte Streudiagramme erstellt. Die Werte der einen Variable bestimmen die x-koordinate, die Werte der anderen Variable die y- Koordinate der Punkte. Folgendes Beispiel soll den Zusammenhang zwischen den gefahrenen Meilen und dem Preis von Gebrauchtwagen zeigen. Jeder Punkt des Streudiagramms stellt dabei einen Gebrauchtwagen dar. Der negative Zusammenhang ist sofort ersichtlich: Je höher der Meilenstand, desto geringer ist auch der Preis. Wenn man die Daten in einem Streudiagramm zeichnet, so erkennt man sofort, ob es sich um einen linearen Zusammenhang handelt und ob es allfällige Ausreisser gibt, die den Wert des Korrelationskoeffizienten stark beeinflussen können. (siehe Kap ) 10

11 Abbildung 2.2: Das Streudiagramm Der Korrelationskoeffizient von K. Pearson (vgl. Hatzinger & Nagel, 2013, S ) Dem Wunsch, den Zusammenhang zweier Variablen numerisch zu beschreiben, kommen Korrelationskoeffizienten nach. Wenn der Zusammenhang linear ist, kann der meist verwendete dieser Korrelationskoeffizienten angewendet werden, derjenige nach K. Pearson. und sind die Werte der zwei Variablen in Beobachtung i und sind die Mittelwerte der zwei Variablen Der Wert des Korrelationskoeffizienten ist unabhängig vom Massstab, das heisst es ist nicht von Bedeutung, ob etwa die Körpergrösse in Metern oder Zentimetern gemessen wird. Die Einheiten der Variablen spielen also keine Rolle für den Wert des Korrelationskoeffizienten, sofern innerhalb der einzelnen Variable immer die gleiche Einheit verwendet wird. Der Korrelationskoeffizient ist normiert und geht von -1 bis 1, wobei 1 bzw. -1 nur erreicht werden, wenn alle Punkte in einem Streudiagramm exakt auf einer Geraden mit positiver bzw. negativer Steigung liegen. Wenn der Korrelationskoeffizient ein negatives Vorzeichen hat, so bedeutet dies einen negativen Zusammenhang: Je höher die x-werte, desto niedriger sind durchschnittlich die y-werte. Ist der Korrelationskoeffizient positiv, so entspricht dies einem positiven Zusammenhang: Je höher die x-werte, desto höher sind durchschnittlich auch die y-werte. Je grösser der Betrag von r ist, desto stärker der Zusammenhang zwischen den zwei Variablen und desto konzentrierter liegen die Punkte um eine (gedachte) Gerade. Auf den folgenden Abbildungen sind drei Streudiagramme mit den zugehörigen 11

12 Korrelationskoeffizienten zu sehen. Im letzten Beispiel ist der Korrelationskoeffizient nach Pearson schlecht eingesetzt worden, da es sich nicht um einen linearen Zusammenhang handelt. Abbildung 2.3: Extrem hohe Korrelation Abbildung 2.4: Fast keine Korrelation Abbildung 2.5: Kein linearer Zusammenhang Obwohl die Berechnung des Korrelationskoeffizienten von Hand mühselig und fehleranfällig ist, will ich es hier mit einem sehr kleinen Datensatz probieren: Beispiel: Wir wollen die Stärke des Zusammenhangs zwischen dem Bruttolohn pro Monat und der Anzahl Bildungsjahre mit Hilfe des Korrelationskoeffizienten berechnen: Tabelle 1: Beispieldatensatz zur Berechnung des Korrelationskoeffizienten nach Pearson ( ) ( ( ( ) = 5 ; = = ( ) = 0,995 Das SPSS liefert die Bestätigung: 12

13 Abbildung 2.6: Bestätigung des Korrelationskoeffizienten vom SPSS Der Wert des Korrelationskoeffizienten wird in der Literatur unterschiedlich interpretiert. Doch ist man sich einig, dass bei einer sozialwissenschaftlichen Untersuchung schon ein geringerer Betrag des Korrelationskoeffizienten ausreicht, um als Korrelation eingestuft zu werden als bei einer mathematischen. Deshalb habe ich mich für folgende Interpretation, die sozialwissenschaftliche Gegebenheiten berücksichtigt, entschieden: (vgl. Haider, Deskriptive Statistik, 1999, S. 9) r > 0 bis 0.2 sehr geringe/schwache Korrelation r > 0.2 bis 0.5 mittlere Korrelation r > 0.5 bis 0.7 hohe Korrelation r > 0.7 bis 0.9 sehr hohe Korrelation r > 0.9 bis 1.0 extrem hohe Korrelation Der Korrelationskoeffizient nach Spearman (vgl. Hatzinger & Nagel, 2013, S. 231 und Toutenburg & Heumann, 2008, S. 127 ) Die Frage nach der Stärke des Zusammenhangs zwischen zwei Variablen ist auch in Fällen, in denen der Zusammenhang keiner linearen Beziehung folgt oder wenn die Variablen nur ordinalskaliert sind, von Interesse. Die Anwendung des Korrelationskoeffizienten nach Spearman kann aber auch bei intervallskalierten Daten sinnvoll sein, da er gegenüber Ausreissern robuster ist als der Korrelationskoeffizient nach Pearson. Der Korrelationskoeffizient nach Spearman wird auch Rangkorrelationskoeffizient genannt, da die Ursprungsdaten durch die Ränge der einzelnen Variablen ersetzt werden: = wobei = ist also die Differenz der Ränge. 13

14 Beispiel: Wir nehmen wieder unseren kleinen Datensatz, fügen aber, damit einen Datensatz hinzu: nicht eins wird, Tabelle 2: Beispieldatensatz zur Berechnung des Korrelationskoeffizienten nach Spearman Summe: 2 = = = = Das SPSS liefert die Bestätigung: Abbildung 2.7: Bestätigung des Rangkorrelationskoeffizienten vom SPSS 2.4 Die einfache lineare Regression (vgl. Hatzinger & Nagel, 2013, S ) Ich gehe nochmals auf das in Kap erwähnte Beispiel ein: Wir interessieren uns nun dafür, welche Form der Zusammenhang zwischen Meilenstand und Preis der Gebrauchtwagen hat, nicht aber für die Stärke des Zusammenhangs. Indem wir den Preis für einen Gebrauchtwagen in eine funktionale Form mit dem Meilenstand stellen, wollen wir den Preis durch den Meilenstand erklären. Bemerkung: Es ist mir bewusst, dass der Preis der Fahrzeuge noch von vielen anderen Faktoren wie z.b. der Farbe, der Anzahl an Services, usw. abhängig ist. Dazu mehr in Kapitel 2.5. Allgemein ausgedrückt soll eine Responsevariable (oder abhängige Variable) durch eine erklärende Variable (oder unabhängige Variable) beschrieben werden. 14

15 Abbildung 2.8: Die Regressionsgerade Das Streudiagramm der Gebrauchtwagendaten zeigt den negativen Zusammenhang zwischen den zwei Variablen: Je höher der Meilenstand, desto niedriger ist durchschnittlich der Preis. Weiter sehen wir eine Gerade eingezeichnet, die die Beziehung zwischen den zwei Variablen zwar vereinfacht, aber recht gut zusammenfasst. Die einfache Annäherung an die Realität nennt man auch Modell und die eingezeichnete Gerade ist die grafische Repräsentation des Modells: Preis= α+βmeilen Wenn ich nun das konkrete Beispiel allgemein formuliere kommen wir zum Modell der einfachen linearen Regression: Y α + βx + έ Y ist die abhängige Variable X ist die erklärende Variable α und β sind die Regressionskoeffizienten und stehen für Konstante und Anstieg der Regressionsgeraden έ ist ein Fehlerterm mit Mittelwert 0 und konstanter Varianz Für die erwarteten Werte von Y gilt die Regressionsgleichung: α + βx 15

16 Doch wie berechnet man die Werte α und β für diese lineare Gleichung? Auf dem Streudiagramm ist zu sehen, dass nur wenige Datenpunkte genau auf dem Graph der Geraden liegen. Der Abstand der Geraden zu einem Datenpunkt wird Residuum genannt. Man ermittelt nun die Regressionsgerade, indem man die Residuen aller Punkte minimiert. Dafür wird normalerweise das so genannte Verfahren der kleinsten Quadrate verwendet: Die Residuen aller Datenpunkte werden quadriert, summiert und dann minimiert (Extremalproblem). Die Regressionsgerade ist genau diejenige Gerade, bei der die Residuen minimal sind. (Vgl. Universität Zürich, Einfache lineare Regression, 2010) Doch wie erhält man nun die Steigung β und den y-achsenabschnitt α? Es gilt folgender Zusammenhang (vgl. Stahel, Lineare Regression, 2008, S.11 und , S. 8): β β und sind die Standardabweichungen der x- bzw. y-werte ist der Korrelationskoeffizient nach K. Pearson Ich möchte nun an unserem kleinen Beispieldatensatz die Regressionsgleichung berechnen: Tabelle 3: Beispieldatensatz zur Berechnung der Regressionsgleichung ( ) ( ( ( ) = = 9 500; = Entweder: β 4 oder: = = = 3 = 4272,002 16

17 β = 1416,667 = Bemerkung: Ich habe jeweils mit den exakten, im Taschenrechner gespeicherten Werten gerechnet. Das SPSS bestätigt: Abbildung 2.9: Bestätigung der Regressionsgleichung Die Schätzung für die Regressionsgleichung lautet: 3 4 Hier habe ich einen Fehler in der von mir verwendeten Fachliteratur gefunden. Im Buch hiess es: Abbildung 2.10: Fehler in der Fachliteratur b steht hier für die Steigung und a für den y-achsenabschnitt der Regressionsgeraden. Ich habe b zuerst mit der in Abbildung 2.10 ersichtlichen Formel ausgerechnet und bin dann natürlich nicht auf das von SPSS gelieferte Resultat gekommen. Ich suchte lange nach einem Fehler in meiner Rechnung, fand aber keinen. Schliesslich stellte ich fest, dass es das korrekte Resultat gäbe, wenn s y im Zähler und s x im Nenner stehen würden. Danach fand ich auch zahlreiche Internetquellen, bei denen in dieser Formel s y im Zähler und s x im Nenner stand. Grundsätzlich vertraue ich eher der Fachliteratur als dem Internet. Deshalb schrieb ich ein Mail an Prof. Dr. Werner Stahel vom Seminar für Statistik an der ETH Zürich, da ich am Besuchstag der ETH seine Vorlesung Das Modell der statistischen linearen Regression besucht hatte, worin ich mein Anliegen darlegte. 17

18 Er antwortete mir umgehend und bestätigte, dass im Buch ein Fehler vorliegt. Ich habe dem Verlag ein Mail geschrieben, indem ich ihn auf den Fehler aufmerksam machte. 2.5 Die multiple lineare Regression (vgl. Hatzinger & Nagel, 2013, S. 241) Kommen wir zurück auf das Beispiel mit der Beschreibung der Beziehung zwischen dem Preis eines Gebrauchtwagens und dem Meilenstand. Wie in Kapitel 2.4 erwähnt, ist der Preis eines Gebrauchtwagens nicht nur vom Meilenstand abhängig, sondern beispielsweise auch davon, wie oft der Wagen im Service war. Deshalb müssen wir das Modell der einfachen linearen Regression, wo nur eine erklärende Variable vorkommt, erweitern auf das Modell mit mehreren erklärenden Variablen. Dies führt zum Modell der multiplen linearen Regression: Y = α + β + β έ steht für weitere erklärende Variablen β steht für weitere Regressionskoeffizienten Für die erwarteten Werte von Y gilt die Regressionsgleichung: = α + β + β Bemerkung: Ich nehme die einfache lineare Regression und die multiple lineare Regression noch in den Theorieteil, damit man am Schluss mit den statistisch erhobenen Merkmalen, die ich in die Untersuchung miteinbeziehe, den zu erwartenden Gymnasiastenanteil jeder Gemeinde berechnen könnte. 18

19 3 Methode 3.1 Datensammlung Das Thema meiner Arbeit sollte nicht nur mich, sondern auch die im Kanton Aargau lebenden und an unserem Bildungssystem interessierten Bürger und vor allem auch viele Kantonsschüler ansprechen. Zu Beginn suchte ich im statistischen Jahrbuch danach, welche statistisch erhobenen Kennzahlen überhaupt mit der Schülerverteilung auf die verschiedenen Leistungsniveaus korrelieren könnten. Bald stiess ich auf der Webseite des Kantons Aargau 2 auf die statistische Datenbank. Da auf der Webseite in der Beschreibung der Datenbank zu lesen war, dass auch Daten auf Gemeindeebene und solche von früheren Jahren vorhanden sind, beantragte ich sofort den Zugang zur Datenbank. Dazu musste ich das Formular Vertrag über die Benutzung der Datenbank der «Statistik Aargau» ausfüllen. Darin heisst es u.a.: Dem Benutzer ist es untersagt, die Daten Dritten für deren eigene Arbeiten weiterzugeben oder sonstwie zugänglich zu machen 3. So ist es rechtlich bereits heikel, die Daten der Betreuungsperson und der zweitbeurteilenden Lehrperson weiterzugeben. Doch ist dies unumgänglich, wenn meine Zahlen nachvollziehbar sein sollen. Weiter heisst es darin, dass die Benutzung durch öffentliche Schulen des Kantons Aargau zwar kostenlos ist, für Privatpersonen jedoch 100 CHF pro Jahr koste. Als ich das ausgefüllte Formular abgeschickt hatte, schrieb ich an die Kontaktperson für die Benutzung der Datenbank, Herrn Daniel Cahn, ein Mail, in dem ich erklärte, ich sei ein Schüler der Neuen Kantonsschule Aarau und benötigte die Daten für meine Maturarbeit. Am nächsten Tag antwortete er, dass er mir den Zugang gratis gewähre. Auch die Zugangsdaten (Benutzername und Passwort) seien aufgeschaltet und ich könne nun auf die Datenbank zugreifen. Zuerst suchte ich nach Daten, die auf Gemeindeebene erhoben sind und überlegte dann, welche dieser Daten am ehesten mit dem Gymnasiastenanteil (s ) und ev. mit dem Bezirks-, Sekundar- und Realschüleranteil korrelieren könnten. So entschied ich mich für die Bevölkerungsdichte, das Reinvermögen, das durchschnittliche steuerbare Einkommen pro steuerpflichtige Person, den Ausländeranteil und für die Wähleranteile der vier grössten Parteien bei den Grossratswahlen vom _Benutzung_statistische_Datenbank.pdf, , S.1 19

20 Abbildung 3.1: Die statistische Datenbank des Kantons Aargau 3.2 Datenaufbereitung Zuerst musste ich sämtliche Daten auf den gleichen Stand bringen, indem ich die Gemeindefusionen von 2010 bis 2013 berücksichtigte. Heute zählt der Aargau 216 Gemeinden und ich wollte meine Daten auf diesen aktuellsten Stand bringen. Auf Wikipedia findet man alle Gemeindefusionen der Schweiz seit dem Jahr Da meine ältesten verwendeten Daten aus dem Jahre 2009 stammen und es in diesem Jahr im Kanton Aargau keine Gemeindefusionen gab, liste ich hier die Gemeindefusionen ab 2010 auf (vgl. Wikipedia, Gemeindefusionen in der Schweiz, 2013): Im Kanton Aargau haben sich per 1. Januar 2010: die Gemeinden Aarau und Rohr (AG) zur Gemeinde Aarau zusammengeschlossen. Die Gemeinden Hilfikon und Villmergen zur Gemeinde Villmergen zusammengeschlossen. die Gemeinden Brugg und Umiken zur Gemeinde Brugg zusammengeschlossen. die Gemeinden Etzgen, Hottwil, Mettau, Oberhofen (AG) und Wil (AG) zur Gemeinde Mettauertal zusammengeschlossen. die Gemeinden Ittenthal und Kaisten zur Gemeinde Kaisten zusammengeschlossen die Gemeinden Laufenburg und Sulz (AG) zur Gemeinde Laufenburg zusammengeschlossen 20

21 per 1. Januar 2012: die Gemeinden Benzenschwil und Merenschwand zur Gemeinde Merenschwand zusammengeschlossen. per 1. Januar 2013: die Gemeinden Gallenkirch, Linn, Oberbözberg und Unterbözberg zur Gemeinde Bözberg zusammengeschlossen. Diese Auflistung war für die Datenaufbereitung äusserst wichtig, da ich sie bei sämtlichen von mir verwendeten Daten konsultieren musste. Am Beispiel der Fusion der Gemeinden Aarau und Rohr zur Gemeinde Aarau stelle ich beispielhaft dar, wie ich bei allen weiteren Fusionen vorgegangen bin. Das Beispiel gehört zur Datenaufbereitung, um das durchschnittliche steuerbare Einkommen pro steuerpflichtige Person zu erhalten (s ) Tabelle 4: Beispiel einer Gemeindefusion Aarau alt Rohr alt Aarau neu Anzahl steuerpflichtige Personen Steuerbares Einkommen Das Bundesamt für Statistik weist jeder einzelnen Gemeinde eine eindeutige BFS Nummer zu. Wenn die Daten zu unterschiedlichen Zeitpunkten erhoben wurden (so wird beispielsweise der Bevölkerungsbestand jeder Gemeinde jährlich am und am erhoben), so wählte ich die Daten nach folgenden Kriterien aus: Einerseits sollten sie möglichst aktuell sein und andererseits sollte auch zeitlich keine zu grosse Abweichung zu Ende Jahr 2011 bestehen, da zu diesem Zeitpunkt die Zahlen erhoben wurden, woraus ich den Gymnasiastenanteil berechnete. Dies ist deshalb wichtig, weil der Gymnasiastenanteil später bei allen Auswertungen die abhängige Variable sein wird Gymnasiastenanteil Um den Gymnasiastenanteil zu berechnen habe ich die Anzahl der Gymnasiasten nach Wohnort mit 100 multipliziert und dann durch die Anzahl der 15- bis 19-Jährigen, die in der betreffenden Gemeinde wohnen, dividiert. Die Daten der Anzahl 15- bis 19-Jähriger wurden 21

22 am erhoben, die Zahlen der Gymnasiasten nach Wohnort am Die Zeitdiffernz ist also sehr klein, der Wert sollte dementsprechend auch genau sein. Doch fiel mir bald auf, dass einige grössere Gemeinden einen Gymnasiastenanteil von null Prozent aufweisen. Ich suchte die betreffenden Gemeinden auf einer Karte und stellte fest, dass sie sich alle in der Nähe der Kantonsgrenze befinden. Dies liess mich auf die Idee kommen, dass einige Aargauer Gymnasiasten das Gymnasium in einem angrenzenden Kanton besuchen. Bei den Auswertungen würde dies natürlich das Resultat massiv verfälschen. Also rief ich beim Departement für Bildung, Kultur und Sport (BKS) an und fragte, wo ich nachschauen könne, in welchen Gemeinden die Bezirksschüler der vierten Klasse die Möglichkeit haben, in ein ausserkantonales Gymnasium überzutreten. Die zuständige Person vom BKS erklärte mir, dass dies im regionalen Schulabkommen von 2009 geregelt sei und verwies mich auf die Webseite der Nordwestschweizerischen Erziehungsdirektorenkonferenz 4. Weiter erklärte sie, ich solle bei den an den Aargau grenzenden Kantonen die Listen öffnen und unter Gymnasiasten der Sekundarstufe II die entsprechenden Codes ablesen (z.b. AG 3/AG 8). In der Code-Liste per (deutschsprachige Fassung) kann man die entsprechenden Gemeinden und Bezirksschulkreise, die zu den Codes gehören, ablesen. So konnte ich bereits die Gemeinden Beinwil am See, Birrwil, Burg, Menziken, Reinach, Gontenschwil, Zetzwil, Schmiedrued, Sins, Auw, Islisberg und Arni als Gemeinden eruieren, in denen die Schüler das Gymnasium in einem Nachbarkanton besuchen. Für den Code AG 6 sind nur die Bezirksschulkreise angegeben. Also musste ich herausfinden, welche Gemeinden zum entsprechenden Bezirksschulkreis gehören. Diese Information fand ich auf der Webseite des Departements für Bildung, Kultur und Sport 5. Der Bezirksschulkreis Laufenburg läuft auf dieser Webseite unter Laufenburg-Mettauertal und umfasst folgende Gemeinden: Laufenburg, Sisseln, Kaisten, Ittenthal, Sulz, Etzgen, Mettau, Wil, Oberhofen, Hottwil, Gansingen und Schwaderloch. Der Bezirsschulkreis Rheinfelden läuft unter KS Unteres Fricktal und umfasst folgende Gemeinden: Rheinfelden, Kaiseraugst, Olsberg, Magden, Buus, Wintersingen, Maisprach, Mumpf, Obermumpf, Stein und Münchwilen. Der Bezirksschulkreis Möhlin läuft unter Möhlintal und umfasst die Gemeinden Möhlin, Wallbach, Zeiningen, Zuzgen, Hellikon, Wegenstetten, Schupfart, Mumpf (Wahlfreiheit zwischen Bezirksschulkreisen Möhlin und Rheinfelden) und Oberrüti. Der Bezirksschulkreis Frick läuft unter Frick-Staffelegg und umfasst: Frick, Eiken, Oeschgen, Gipf-Oberfrick, Wittnau, Wölflinswil, Oberhof, Densbüren, Herznach, Ueken, Zeihen, Hornussen, Bözen, Effingen, Elfingen, Stein und Münchwilen (die letzten beiden mit Wahlfreiheit zwischen den Bezirksschulkreisen Frick und Rheinfelden)

23 Da ich die Zahl der Aargauer, die das Gymnasium in einem Nachbarkanton besuchen, nicht kenne, müssen also alle oben erwähnten Gemeinden für die Analyse weggelassen werden. Nun muss man sich auch das Umgekehrte überlegen: Gibt es auch Ausserkantonale, die im Kanton Aargau das Gymnasium besuchen? Dies muss ich nicht näher abklären, denn ich habe den Anteil an Gymnasiasten nach Wohnort berechnet. Da in den Daten keine ausserkantonalen Gemeinden auftauchen, haben wir nun die korrekte Zahl an Gymnasiasten Bezirks-, Sekundar- und Realschüleranteil In der statistischen Datenbank war die Anzahl Bezirks-, Sekundar- und Realschüler nach Wohnort vorhanden. Da diese drei verschiedenen Leistungsniveaus zur obligatorischen Schulzeit gehören, kann davon ausgegangen werden, dass die Schülerzahlen der drei Leistungsniveaus addiert, der Anzahl der in der betreffenden Gemeinde wohnhaften Schüler der Sekundarstufe I entspricht. Also habe ich die Anzahl Bezirks-, Sekundar- und Realschüler zusammengezählt und davon je den prozentualen Anteil berechnet. Die Daten stammen vom Auch hier müssen die Gemeinden berücksichtigt werden, in denen die Schüler der Sekundarstufe I in einem Nachbarkanton die Schule besuchen. Deshalb muss zusätzlich zu den in Ziffer aufgeführten Gemeinden die Gemeinde Murgenthal für die Analyse weggelassen werden Bevölkerungsdichte Um die Bevölkerungsdichte zu berechnen, habe ich die Anzahl Einwohner pro Gemeinde am durch die jeweilige Gesamtfläche vom dividiert. Dies ergibt die Anzahl Einwohner pro Hektare. Ich will herausfinden, ob der Grad der Urbanisierung einen Einfluss auf den Gymnasiastenanteil hat Reinvermögen Definition: Das Reinvermögen ist das gesamte Vermögen abzüglich der Schulden. Das Reinvermögen pro Einwohner konnte ich aus der Datenbank kopieren. Die Daten stammen vom , denn aktuellere waren keine vorhanden. Die Zahlen für das Reinvermögen wurden also eins bis drei Jahre früher erhoben, als die meisten anderen in meiner Arbeit vorkommenden Merkmale, was den Stellenwert des Reinvermögens in der Analyse relativiert. Da beim Mittelwert Ausreisser (wie z.b. in der Gemeinde 23

24 Meisterschwanden, wo der Uhrenkönig Hayek wohnt) das Resultat stark verfälschen können, habe ich auch den Median genommen. Festzuhalten ist weiter, dass die Zahlen für das Reinvermögen für die Gemeinde Aarau fehlen Wähleranteile der vier grössten Parteien Um die Wähleranteile der vier im Aargau wählerstärksten Parteien zu bestimmen, dienten mir die Wahlresultate der Grossratswahlen vom Mir lagen die Zahl der Wählerstimmen jeder Partei und das Total der abgegebenen Stimmen vor. Die Zahl der Wählerstimmen für jede Partei multiplizierte ich mit 100 und dividierte dann durch das Total der abgegebenen Wählerstimmen. So erhielt ich die Wähleranteile. Da die Schweiz politisch sehr stabil ist und sich die Wähleranteile der Parteien normalerweise nur langsam verändern, kann davon ausgegangen werden, dass die Wähleranteile von 2012 ungefähr gleich sind wie z.b. Ende 2011 (Der Gymnasiastenanteil wurde mit Zahlen errechnet, die Ende 2011 erhoben wurden) Ausländeranteil Um den Ausländeranteil zu berechnen, habe ich die Anzahl Ausländer pro Gemeinde mit 100 multipliziert und durch die gesamte Wohnbevölkerung der Gemeinde dividiert. Die Zahlen stammen vom Ich wollte herausfinden, ob die weit verbreitete Meinung richtig ist, dass ein hoher Ausländeranteil einen tieferen Gymnasiastenanteil und somit ein tieferes Bildungsniveau zur Folge hat Steuerbares Einkommen pro Monat Das Schweizer Fernsehen strahlte von Ende Juli bis Anfang August dieses Jahres in der Sendung 10vor10 die Serie Die Reichen aus. Auf der Internetseite des Schweizer Fernsehens 6 gab es dazu eine interaktive Grafik, auf der man jede Gemeinde der Schweiz anklicken konnte und es erschienen die Anzahl steuerpflichtiger Personen, das durchschnittliche Einkommen pro Person pro Monat und die durchschnittlichen Gemeindesteuern pro Monat. Da diese Zahlen für meine Arbeit von Interesse waren, machte ich mich daran herauszufinden, wie der Verfasser des Online-Artikels auf diese Zahlen gekommen ist. Dank der Quellenangabe stiess ich bald auf die Webseite 7, wo in der Excel-Datei Alle Auswertungen in einer Excel-Tabelle im Sheet 142 in der letzten Spalte das gesamte steuerbare Einkommen der jeweiligen Gemeinde vorhanden ist. Im Sheet 131 ist - ebenfalls

25 in der letzten Spalte - die Anzahl der steuerpflichtigen Personen zu finden. Nun hat der Verfasser des Artikels das gesamte steuerbare Einkommen pro Gemeinde durch die Anzahl der steuerpflichtigen Personen der betreffenden Gemeinde geteilt. Dies ergibt dann das durchschnittliche Einkommen pro steuerpflichtige Person pro Jahr. Diese Zahl durch 12 geteilt, ergibt das durchschnittliche Einkommen pro steuerpflichtige Person pro Monat. Als ich die beiden oben erwähnten Sheets gefunden hatte, kopierte ich jeweils die beiden letzten Spalten in eine neue Excel Tabelle. Da in dieser Tabelle aber alle Gemeinden der Schweiz enthalten waren, schaute ich nach, von wo bis wo die BFS Nummern der Gemeinden des Kantons Aargau gehen und stellte fest, dass die erste Gemeinde Aarau die BFS Nummer 4001 und die letzte Gemeinde Bad Zurzach die BFS Nummer 4323 hat. Also liess ich durch den Filter im Excel nur die Gemeinden mit BFS Nummern zwischen 4001 und 4323 ausgeben. Wenn nun der Verfasser des Artikels z.b. für Aarau nicht das gleiche durchschnittliche steuerbare Einkommen erhalten hat wie ich, liegt das daran, dass er im Gegensatz zu mir die Gemeindefusionen nicht berücksichtigt hat. Ich habe also das gesamte steuerbare Einkommen und die Anzahl steuerpflichtiger Personen von Aarau und Rohr addiert und daraus das für Aarau neue durchschnittliche Einkommen pro Person und Monat berechnet(s. Tabelle 4). Die Daten stammen von der Steuerperiode 2009, denn aktuellere Daten waren keine vorhanden. Die für die Berechnung des durchschnittlichen steuerbaren Einkommens pro Gemeinde verwendeten Zahlen wurden also eins bis drei Jahre früher erhoben, als die meisten anderen in meiner Arbeit verwendeten. 3.3 Analyse Bei der Analyse der Daten werde ich wie folgt vorgehen: Zuerst werde ich sämtliche unabhängigen Merkmale, die ich untersucht habe, in einem Streudiagramm mit dem Gymnasiastenanteil und ev. mit dem Bezirks-, Sekundar- und Realschüleranteil als abhängige Variable vom SPSS aufzeichnen lassen. Daraus ist erkennbar, ob es eine lineare Beziehung zwischen den beiden Variablen gibt. Falls dies nicht der Fall ist, bestimme ich den Korrelationskoeffizienten nach Spearman. Falls ein linearer Zusammenhang besteht, kann man den Korrelationskoeffizienten nach Pearson bestimmen. Weiter werde ich bei den Merkmalen, bei denen ein deutlicher linearer Zusammenhang besteht, die Gleichung der Regressionsgeraden angeben, so dass man am Schluss durch die multiple lineare Regression den zu erwartenden Gymnasiastenanteil vorhersagen könnte, wenn man die statistisch erhobenen Kennzahlen (die unabhängigen Variablen) und die Regressionskoeffizienten der Regressionsgleichung kennt. 25

26 4 Darstellung der Ergebnisse 4.1 Analyse des Gymnasiastenanteils Auf folgender Karte sind alle Aargauer Gemeinden, auch diejenigen, deren Gymnasiasten die Möglichkeit haben ein ausserkantonales Gymnasium zu besuchen, eingezeichnet. Je grösser die Kreisfläche, desto höher ist der Gymnasiastenanteil. Abbildung 4.1: Der Gymnasiastenanteil Zu beachten ist bei den folgenden Teilkapiteln (Reinvermögen, Wähleranteile und dem durchschnittlichen Einkommen pro steuerpflichtige Person), dass die Gymnasiasten selber kaum zu diesem Resultat beitragen. 26

27 4.1.1 mit der Bevölkerungsdichte Abbildung 4.2: Bevölkerungsdichte Hier ist ein schwacher positiver linearer Zusammenhang ersichtlich. Die Varianz in den Daten ist sehr hoch. Der Korrelationskoeffizient nach Pearson beträgt 0,316. Es gibt also eine mittlere Korrelation. Die vier Gemeinden mit der grössten Bevölkerungsdichte sind Wettingen, Turgi, Brugg und Aarau. Ihr Gymnasiastenanteil liegt zwischen 15 und 25%. Der Mittelwert des Gymnasiastenanteils der von mir untersuchten Gemeinden beträgt 11,72 und der Median 11,18%. Die vier Gemeinden mit der grössten Bevölkerungsdichte liegen also alle deutlich über dem Mittelwert und dem Median. Wenn der lineare Zusammenhang zwischen den beiden Variablen und dementsprechend auch die Korrelationskoeffizienten so gering sind, ist es weniger sinnvoll die Regressionsgleichung zu bestimmen. Die Summe der Differenzen zwischen den erwarteten und den tatsächlichen Werten des Gymnasiastenanteils (oder umgekehrt) ist bei einem so schwachen Zusammenhang viel grösser, als wenn die Punkte des Streudiagramms alle beinahe auf der Regressionsgeraden lägen. Dieser Umstand ist mir auch bei jeder weiteren Regressionsgleichung, die ich bestimme, bewusst. Da ich aber am Schluss des Kapitels 4 eine multiple lineare Regression mit den am meisten korrelierenden Merkmalen formulieren will, werde ich die einfache Regressionsgleichung auch bei weiteren Merkmalen bestimmen. Da man auch ohne Zugang zur statistischen Datenbank ein Merkmal wie die Bevölkerungsdichte einer Gemeinde ohne weiteres erhältlich machen kann (z.b. auf 27

28 Wikipedia), möchte ich die Regressionsgleichung trotzdem formulieren. Für den erwarteten Gymnasiastenanteil einer Aargauer Gemeinde gilt: Ertwarteter Gymnasiastenanteil 4 45 Eine weitere Schwäche dieser Gleichung ist auch, dass der Gymnasiastenanteil nie unter 9,478 % fallen kann, da die Anzahl Einwohner pro Hektare nie negativ ist. Folgende Karte zeigt einerseits die Bevölkerungsdichte (Hintergrundfarbe der Gemeinde), andererseits die Höhe des Gymnasiastenanteils (Kreisfläche): Abbildung 4.3: Karte Bevölkerungsdichte - Gymnasiastenanteil mit dem Reinvermögen Abbildung 4.4: Reinvermögen Mittelwert Abbildung 4.5: Reinvermögen ohne Ausreisser Abbildung 4.6: Reinvermögen Median 28

29 Wenn man Abbildung 4.4 anschaut, kommt man klar zum Schluss, dass ein positiver linearer Zusammenhang besteht. Allerdings sticht auch sofort ins Auge, dass es, was den Mittelwert des Reinvermögens betrifft, einen gewaltigen Ausreisser (mit 102 beschriftet) und drei nicht so markante Ausreisser gibt. Der gewaltige Ausreisser ist die Gemeinde Meisterschwanden, in der der Uhrenkönig Hayek lebt. Sein Vermögen wurde im Jahr 2006 von der Wirtschaftszeitschrift Bilanz auf 3-4 Milliarden CHF geschätzt 8. Die drei anderen Ausreisser sind Geltwil, Bergdietikon und Oberwil-Lieli. Alle drei Gemeinden liegen an oder sehr nahe der Kantonsgrenze zu Zürich. Eine Erklärung dafür wäre, dass der niedrige Steuerfuss der Gemeinden reiche Spitzenverdienender aus dem Kanton Zürich anlockt. In knapp 63% der Gemeinden haben deren Bürger ein durchschnittliches Reinvermögen zwischen und CHF. Der Korrelationskoeffizient nach Pearson beträgt 0,235. Hier gibt es also eine mittlere Korrelation. Abbildung 4.5 zeigt ebenfalls den Mittelwert des Reinvermögens, nur sind die vier Ausreisser weggelassen worden. Da nun die Achsen nicht mehr gleich skaliert sind wie in Abbildung 4.4 ist der lineare Zusammenhang nicht mehr so offensichtlich. Da der Median robuster gegen Ausreisser ist, gleicht die Abbildung 4.5 ein wenig der Abbildung 4.6. Bei Abbildung 4.6 ist ein sehr schwacher positiver linearer Zusammenhang ersichtlich. Der Korrelationskoeffizient nach Pearson beträgt 0,122. Dies ist eine sehr geringe Korrelation. Bei 25% der Gemeinden liegt der Median des Reinvermögens zwischen und CHF, bei 21% zwischen und CHF. Die beiden Gemeinden mit dem höchsten Median sind wieder Oberwil-Lieli und Bergdietikon. Das heisst also, dass es in diesen Gemeinden nicht wie in Meisterschwanden einen grossen Ausreisser gibt, sondern dass viele Bürger ein grosses Reinvermögen haben. In einer Situation wie Meisterschwanden, wo es extreme Ausreisser gibt, ist der Median für die Gemeinde repräsentativer als der Mittelwert. 8 Vgl

30 4.1.3 mit den Wähleranteilen Abbildung 4.7: Wähleranteil SVP Abbildung 4.8: Wähleranteil SP Abbildung 4.9: Wähleranteil FDP Abbildung 4.10: Wähleranteil CVP Wähleranteil SVP: Es ist ein klarer linearer Zusammenhang ersichtlich: Je höher der Gymnasiastenanteil, desto kleiner ist der SVP Wähleranteil. Der Korrelationskoeffizient nach Pearson beträgt -0,371. Das ist eine mittlere Korrelation. 53,6% der Gemeinden haben einen SVP Wähleranteil zwischen 30 und 39,99%. Bei den 15 Gemeinden mit einem SVP Wähleranteil von mehr als 50% liegt der durchschnittliche Gymnasiastenanteil bei 10%, bei den drei Gemeinden mit einem SVP Wähleranteil von weniger als 20% liegt er bei 22,1%. Da die SVP bis 1971 Bauern- Gewerbe- und Bürgerpartei hiess, lässt sich daraus schliessen, dass sie also vor allem Bauern und Gewerbetreibende anspricht und weniger Akademiker. Weiter ist sie konservativ und betont auch immer wieder den grossen Stellenwert einer 30

31 Berufslehre. Ein weiterer Grund ist, dass SVP-Wähler oft auf dem Land leben, man kann zwischen Bevölkerungsdichte und SVP Wähleranteil eine hohe negative Korrelation ausmachen. In Kap ist der positive Zusammenhang zwischen Gymnasiastenanteil und Bevölkerungsdichte gezeigt worden. Die Regressionsgleichung lautet: Erw. Gymn.-anteil 35 4 Hier kann der Gymnasiastenanteil nicht grösser als 20,635% werden, da der SVP Wähleranteil nie negativ sein kann. Wähleranteil SP: Hier ist ein schwacher positiver linearer Zusammenhang festzustellen. Der Korrelationskoeffizient nach Pearson ist 0,330. Auch hier besteht also eine mittlere Korrelation. 61,4% der Gemeinden haben einen SP Wähleranteil zwischen 10 und 19,99%. 29,5% der Gemeinden haben einen SP Wähleranteil zwischen 0 und 9,99%. In diesen Gemeinden ist der durchschnittliche Gymnasiastenanteil 9,4%. Bei den 15 Gemeinden mit einem höheren SP Wähleranteil als 20% beträgt er 15,1%. Ein Grund dafür könnte sein, dass SP-Wähler oft in der Stadt leben und die positive Korrelation zwischen Bevölkerungsdichte und Gymnasiastenanteil habe ich in Kap gezeigt. Der Korrelationskoeffizient nach Pearson zwischen der Bevölkerungsdichte und dem SP- Wähleranteil beträgt 0,577. Es kann also von einer hohen Korrelation gesprochen werden. Früher galt die SP als Arbeiterpartei. Dass dieses Image nicht mehr aktuell ist, scheinen auch meine Resultate zu bestätigen. Die Regressionsgleichung lautet: Wähleranteil FDP: Hier ist ein sehr schwacher positiver linearer Zusammenhang ersichtlich. Der Korrelationskoeffizient nach Pearson beträgt 0,264. Auffällig ist, dass Abbildung 4.8 und 4.9 sehr ähnlich aussehen. 70,5% der Gemeinden haben einen FDP Wähleranteil zwischen 10 und 19,99%, davon haben 55,6% der Gemeinden einen Wähleranteil zwischen 10 und 14,99%. 12 Gemeinden haben einen FDP Wähleranteil von 20% oder mehr. In diesen Gemeinden ist der durchschnittliche Gymnasiastenanteil 12%. Bei den 22,3% der Gemeinden mit einem FDP Wähleranteil zwischen 0 und 9,99% ist er 9,4%. Früher galt die FDP als Akademikerpartei, aber offenbar wenden sich Akademiker auch zunehmend der SP zu. FDP-Wähler sind oft führende Köpfe in der Wirtschaft. Sie erleben also den Wert einer soliden Bildung täglich und wollen für die Wirtschaft auch genügend Fachkräfte ausbilden lassen. 31

32 Wähleranteil CVP: Es ist kein linearer Zusammenhang ersichtlich. Die Abbildung 4.10 gleicht einer Punktwolke, was auch im Korrelationskoeffizienten nach Spearman, der nur 0,01 beträgt, zum Ausdruck kommt. Bei den 24,1% der Gemeinden mit einem CVP Wähleranteil von mehr als 20% beträgt der Median des Gymnasiastenanteils 10,2%. Bei den Gemeinden mit einem CVP Wähleranteil zwischen 0 und 4,99% beträgt dieser Median 9,4%. Wie ihr Name Christlichdemokratische Volkspartei schon sagt, gehören ihre Wähler auch heute noch vorwiegend der katholischen Konfession an. Bildung und Konfession sind heute (im Gegensatz zum Mittelalter) völlig unabhängig voneinander, was auch mein Resultat widerspiegelt. Die drei Gemeinden mit den höchsten CVP Wähleranteilen sind Dietwil, Beinwil (Freiamt) und Geltwil, die alle im Freiamt liegen. Dies hat historische Gründe: Die katholischen Habsburger waren einst Schirmherren dieses Gebiets. Auch im Norden des Kantons liegen viele Gemeinden mit einem hohen CVP Wähleranteil mit dem Ausländeranteil Abbildung 4.11: Ausländeranteil Auch hier besteht kein linearer Zusammenhang. Der Korrelationskoeffizient nach Spearman beträgt 0,161. Bei den 18,1% der Gemeinden mit einem Ausländeranteil von weniger als 10% liegt der Median des Gymnasiastenanteils bei 9%. Bei den 10% der Gemeinden mit einem Ausländeranteil von über 30% liegt der Median des Gymnasiastenanteils bei 9,9%. Der Ausländeranteil einer Gemeinde beeinflusst also überraschenderweise den Gymnasiastenanteil nicht. Gründe dafür könnten sein, dass einerseits die Ausländer eher in städtischen Gemeinden wohnen (Korrelationskoeffizient nach Pearson: 0,643). Den positiven Zusammenhang zwischen Bevölkerungsdichte und Gymnasiastenanteil habe ich in Kap. 32

33 4.1.1 gezeigt. Andererseits ist bei der ausländischen Wohnbevölkerung einer Gemeinde in der Regel die ausländische Jugend überdurchschnittlich stark vertreten. Das Verhältnis zwischen der Anzahl Ausländer- und Schweizerkinder verschiebt sich immer mehr zugunsten der ausländischen Kinder, da die Geburtenrate ausländischer Frauen höher ist als diejenige der Schweizer Frauen. Somit steigt der Anteil ausländischer Gymnasiasten, während der Anteil Schweizer Gymnasiasten abnimmt mit dem durchschnittlichen steuerbaren Einkommen Abbildung 4.13: Korrekter y-achsenabschnitt Abbildung 4.12: Durchschnittliches steuerbares Einkommen pro steuerpflichtige Person Hier ist der lineare Zusammenhang klar ersichtlich: Je höher das durchschnittliche Einkommen pro steuerpflichtige Person, desto höher ist auch der Gymnasiastenanteil. Der Korrelationskoeffizient nach Pearson beträgt 0,452. Dies ist ebenfalls eine mittlere Korrelation, aber es ist die höchste aller von mir untersuchten mit der abhängigen Variable Gymnasiasten. Bei den 9,6% der Gemeinden mit einem höheren durchschnittlichen Einkommen pro steuerpflichtige Person als CHF liegt der Mittelwert des Gymnasiastenanteils bei 17,4%. Bei den 5,4% der Gemeinden mit einem tieferen durchschnittlichen Einkommen pro steuerpflichtige Person als CHF liegt der Mittelwert des Gymnasiastenanteils bei 9,1%. 54,2% der Gemeinden haben ein durchschnittliches steuerbares Einkommen pro steuerpflichtige Person zwischen und CHF. Auch hier bestimme ich die Regressionsgleichung: 33

34 Erwarteter Gymnasiastenanteil 4 4 Es ist zu sehen, dass der errechnete y-achsenabschnitt nicht mit demjenigen in Abbildung 4.12 übereinstimmt. Der Grund dafür ist, dass die Skala auf der x-achse erst mit knapp 5000 CHF beginnt. In Abbildung 4.13, wo das durchschnittliche Einkommen auf der x-achse bei null beginnt, ist zu sehen, dass der errechnete y-achsenanbschnitt mit dem in der Grafik übereinstimmt. Die drei Gemeinden mit dem höchsten durchschnittlichen Einkommen pro steuerpflichtige Person sind Oberwil-Lieli, Bergdietikon und Remetschwil. Oberwil-Lieli und Bergdietikon waren bereits unter den Top Drei beim Reinvermögen (Kap.4.1.2). Auch fällt bei vielen Gemeinden mit einem hohen durchschnittlichen Einkommen pro steuerpflichtige Person die geografische Nähe zum Kanton Zürich auf. In diesen Gemeinden wohnen also viele Pendler, die ihr Einkommen im Kanton Zürich erzielen, wo die Löhne den höheren Lebenskosten angepasst sind. Um den positiven Zusammenhang zu erklären, sehe ich zwei Möglichkeiten: Einerseits haben gut verdienende Eltern die Möglichkeit, die schulische Laufbahn ihrer Kinder finanziell (z.b. mit Nachhilfestunden) zu unterstützen. Andererseits haben die gut verdienenden Eltern wahrscheinlich selber eine höhere Schulbildung und legen deshalb auch mehr Wert auf die Ausbildung ihrer Kinder und könnten sie, wenn nötig, auch mit persönlichem Know-how unterstützen. 4.2 Formulierung einer multiplen linearen Regressionsgleichung Aus dem durchschnittlichen Einkommen pro steuerpflichtige Person, aus dem SVP- und SP Wähleranteil und aus der Bevölkerungsdichte als unabhängige Variablen will ich nun die Regressionsgleichung formulieren: Erwarteter Gymnasiastenanteil -13,814 +(0,003 steuerbares Einkommen pro stpfl. Person) +(0,205 SP Wähleranteil) +(0,263 Einwohner pro Hektare) -(0,007 SVP Wähleranteil) 34

35 4.3 Zusammenhänge auf der Sekundarstufe I Die folgende Tabelle enthält die Korrelationskoeffizienten der Bezirks-, Sekundar- und Realschüleranteile mit allen von mir untersuchten Merkmalen: Tabelle 5: Korrelationskoeffizienten Sekundarstufe I Bevdi RVM SVP SP FDP CVP AuslA deinkpstp Bez , ,034-0,015-0,330 0,459 Sek -0,266-0,024 0,209-0,186-0,134 0,026-0,066-0,164 Real 0,336-0,426-0,093 0,091 0,067-0,046 0,457-0,337 Legende: Bez/Sek/Real: Bezirks- Sekundar- und Realschüleranteil Bevdi: Bevölkerungsdichte RVM: Reinvermögen Median SVP/SP/FDP/CVP: Wähleranteile SVP, SP, FDP und CVP AuslA: Ausländeranteil deinkpstp: durchschnittliches Einkommen pro steuerpflichtige Person Kein linearer Zusammenhang ersichtlich: Korrelationskoeffizient nach Spearman Linearer Zusammenhang: Korrelationskoeffizient nach Pearson Da der Wert des Korrelationskoeffizienten nach Spearman häufig sehr nahe bei null ist und weil bei diesem Korrelationskoeffizienten kein linearer Zusammenhang besteht, gehe ich nur kurz auf die Werte des Korrelationskoeffizienten nach Pearson ein: Reinvermögen: Aus der Tabelle ersichtlich ist, dass bei Gemeinden mit einem grösseren Reinvermögen pro Person der Anteil Bezirksschüler grösser ist. Umgekehrt ist bei Gemeinden mit einem geringeren Reinvermögen pro Person der Anteil Realschüler höher. Ausländeranteil: In Gemeinden mit einem höheren Ausländeranteil gibt es einen kleineren Bezirksschüleranteil und umgekehrt bei einem höheren Ausländeranteil einen höheren Realschüleranteil. Bei der Analyse mit dem Gymnasiastenanteil war kein linearer Zusammenhang ersichtlich. Offenbar entscheiden sich auch viele aargauische Bezirksschüler mit Schweizerpass dafür, nach der Bezirksschule nicht das Gymnasium zu besuchen. Durchschnittliches Einkommen pro steuerpflichtige Person: In Gemeinden mit einem höheren durchschnittlichen Einkommen pro steuerpflichtige Person ist der 35

36 Bezirksschüleranteil grösser, umgekehrt gibt es bei einem tieferen durchschnittlichen Einkommen pro steuerpflichtige Person einen höheren Realschüleranteil. 5 Diskussion der Ergebnisse 5.1 Interpretation der Ergebnisse im Hinblick auf die Fragestellungen Es war bereits schwierig, aus den beinahe unzähligen statistisch erhobenen und in der Datenbank auf Gemeindeebene verfügbaren Daten, eine Auswahl zu treffen. Eine Aussage darüber zu machen, ob Geld mit guter Bildung in Zusammenhang steht, hat mich persönlich am meisten interessiert. Deshalb habe ich auch das Reinvermögen und das durchschnittliche Einkommen pro steuerpflichtige Person ausgewählt. Die anderen Merkmale habe ich ausgewählt, weil für mich am ehesten ein naheliegender Zusammenhang mit guter Bildung bestand. Die Leitfrage und die Teilfragen habe ich, was die von mir ausgewählten Merkmale angeht, beantwortet. Ich hätte mir allerdings gewünscht, dass wenigstens bei einem von mir untersuchten Merkmal, eine höhere Korrelation bestanden hätte, sodass die Theoriekapitel 2.4 (einfache lineare Regression) und 2.5 (multiple lineare Regression) auch in meiner praktischen Anwendung mehr Sinn gemacht hätten (s. Kap.4.1.1, zweiter Abschnitt). 5.2 Kritik am methodischen Vorgehen Die Datenaufbereitung, bei der ich die aus verschiedenen Jahren stammenden Daten auf den gleichen Stand brachte, indem ich die Gemeindefusionen berücksichtigte, beanspruchte sehr viel Zeit. Diese Datenaufbereitung von Hand erforderte höchste Sorgfalt, um Fehlerfreiheit garantieren zu können. Im Nachhinein gesehen hätte ich mich lieber noch länger mit dem Theorieteil befasst, um die SPSS-Kommandosprache (Syntax) soweit zu erlernen, dass das SPSS dies erledigt hätte. Erst als ich Zugang zur statistischen Datenbank hatte, wurde mir bewusst wie vielfältig unser Schulsystem ist. Allein auf der Mittelschulstufe gibt es neben den Gymnasiasten auch noch die Wirtschaftsmittelschule, die Fachmittelschule, die Informatikmittelschule und die Aargauische Maturitätsschule für Erwachsene. Um meine Fragestellungen umfassender beantworten zu können, hätte man möglichst alle Stufen (von der Primarschule bis zur Universität) miteinbeziehen sollen. Dies wäre aber schon deshalb nicht möglich gewesen, 36

37 weil in der statistischen Datenbank viele Daten im Bereich der Bildung nicht auf Gemeindeebene vorliegen. Weiter hätte man zu jedem der von mir untersuchten Merkmale noch mehr Aussagen machen können, z.b. über die Varianz. 5.3 Fazit Mit dem Gymnasiastenanteil als abhängige Variable korrelieren folgende Merkmale mittel bis schwach (absteigend sortiert nach dem Betrag des Korrelationskoeffizienten nach Pearson): Das durchschnittliche Einkommen pro steuerpflichtige Person Der SVP Wähleranteil bei den Grossratswahlen 2012 Der SP Wähleranteil bei den Grossratswahlen 2012 Die Bevölkerungsdichte Der FDP Wähleranteil bei den Grossratswahlen 2012 Das Reinvermögen (Mittelwert) Das Reinvermögen (Median) Kein linearer Zusammenhang konnte ich beim CVP Wähleranteil bei den Grossratswahlen 2012 und beim Ausländeranteil feststellen. Beim Bezirksschüleranteil korrelieren folgende Merkmale mittel: Das durchschnittliche Einkommen pro steuerpflichtige Person Das Reinvermögen (Median) Der Ausländeranteil Bei den anderen Merkmalen war kein linearer Zusammenhang ersichtlich. Beim Sekundarschüleranteil gibt es bei keinem einzigen Merkmal einen linearen Zusammenhang. Beim Realschüleranteil korrelieren dieselben Merkmale mittel wie beim Bezirksschüleranteil, allerdings in umgekehrter Richtung. Mit dem Gymnasiastenanteil als abhängige Variable gab es bei 6 von 8 (das Reinvermögen als ein Merkmal) untersuchten Merkmalen einen linearen Zusammenhang, was einem Anteil von 75% entspricht. Auf dem Niveau der Sekundarstufe I gab es nur in 6 von 24 Fällen einen linearen Zusammenhang, also in 25% der Fälle. Spannend wäre es nun herauszufinden, ob sich diese Entwicklung fortsetzt. Dies könnte man untersuchen, indem man als abhängige Variable z.b. den Anteil Studierender auf Universitätsstufe pro Gemeinde (nach Wohnort) 37

38 hätte. Läge auf dieser höheren Stufe in mehr als 75% der Fälle ein linearer Zusammenhang vor? 5.4 Blick in den Kanton Zürich Im NZZ-Zeitungsartikel Aufnahmeprüfungen fürs Gymi gehören abgeschafft vom 30. Juni 2013 schreibt Ralf Margreiter, der sich seit vielen Jahren mit der Frage von Bildungschancen befasst, dass Zugang zum Langzeitgymnasium heute nicht die klügsten, sondern jene Sprösslinge, deren Eltern die Vorbereitungskurse bezahlen könnten, erhalten. Das Langzeitgymnasium im Kanton Zürich schliesst direkt an die Primarschule an. Zuerst schreibt er, dass sich im Kanton Zürich eine florierende private Bildungsindustrie etabliert habe, um die Schüler auf die Aufnahmeprüfung für das Langzeitgymnasium vorzubereiten. Untersuchungen zufolge, besuchten heute zwei Drittel aller Langgymi- Kandidaten einen ausserschulischen Vorbereitungskurs. Zwischen null und über 40% eines Jahrgangs in einer Gemeinde gelangten ans Langzeitgymnasium. Krasse Unterschiede würden auch innerhalb der Stadt Zürich bestehen: Zürichberg-Sprösslinge hätten eine fünfmal höhere Chance, ans Langzeitgymnasium zu gelangen, als die Schwamendinger Kinder. Weiter schreibt Herr Margreiter, dass hohe Gymiquoten ziemlich präzise Gebiete mit tiefem Steuerfuss, hoher Steuerkraft und prestigeträchtigen Wohnlagen abbilden. Er sieht die Zugangschancen unfair verteilt. Der Prüfungserfolg sei dank den kostspieligen privaten Vorbereitungskursen mindestens teilweise käuflich und hänge vom Portemonnaie der Eltern ab. Der Kanton Zürich ist, was die finanzielle Situation seiner Bürger betrifft, ein Kanton der Extreme, verglichen mit dem Kanton Aargau. Deshalb ist es möglich, dass im Kanton Zürich viel Geld und gute Bildung stärker zusammenhängen als im Kanton Aargau. Provokative Aussagen, wie dass die Schwamendinger Kinder eine fünfmal geringere Chance als die Zürichberg-Sprösslinge haben, ins Langzeitgymnasium aufgenommen zu werden, wären aber auch im Kanton Aargau möglich, wenn man nur die Extremwerte miteinander vergleicht: Die Gemeinde Oberwil-Lieli mit dem grössten durchschnittlichen Einkommen pro steuerpflichtige Person hat einen 4,6 Mal höheren Gymnasiastenanteil als Hallwil mit dem kleinsten durchschnittlichen Einkommen pro steuerpflichtige Person. Oder: Die Gemeinde Oberwil-Lieli mit dem höchsten Reinvermögen (Median) hat einen knapp drei Mal höheren Gymnasiastenanteil als die Gemeinde Spreitenbach mit dem kleinsten Median beim Reinvermögen. Das Beispiel zeigt: Provokative Aussagen lassen sich, wenn man nur Extremwerte berücksichtigt, einfach machen. Mindestens für den Kanton Aargau gilt jedoch, sofern man 38

39 alle 9 Gemeinden in die Analyse miteinbezieht, dass es zwar auch eine schwache bis mittlere Korrelation gibt, der Zusammenhang jedoch nie so stark ist wie diese Extremwerte es vermuten lassen. 6 Zusammenfassung Meine Praktikumszeit bei der AFO-Marketing, die mir als sehr informativ und interessant in Erinnerung bleiben wird, brachte mich auf die Idee, mein dort erworbenes Wissen noch zu vertiefen und meine Maturarbeit im Bereich der Datensammlung, Datenaufbereitung und Datenanalyse zu schreiben. Da die Bildung im bisherigen Leben eines Kantonsschülers ein zentraler Bestandteil ist, dachte ich mir, dass die meisten Gymnasiasten auch an Fragestellungen im Zusammenhang mit der Bildung im Kanton Aargau interessiert wären. Deshalb wollte ich herausfinden, welche statistisch erhobenen Merkmale einer Aargauer Gemeinde wie stark die Verteilung der Schüler auf die verschiedenen Leistungsniveaus beeinflussen. Bei der Suche nach digital vorliegenden Daten stiess ich bald auf die statistische Datenbank des Kantons Aargau, wo Daten auch aus verschiedenen Jahren und auf Gemeindeebene vorlagen. Die Kontaktperson für die Benutzung der Datenbank, Herr Daniel Cahn, gewährte mir freundlicherweise kostenlosen Zugang. Aus einer riesigen Menge von statistisch erhobenen Daten wählte ich die Anzahl Gymnasiasten und die Anzahl der 15- bis 19- Jährigen nach Wohnort, woraus ich den Gymnasiastenanteil pro Gemeinde bildete, aus. Um auch Daten der Sekundarstufe I miteinbeziehen zu können, bildete ich die Summe der Bezirks-, Sekundar- und Realschüler pro Gemeinde und errechnete daraus die jeweiligen prozentualen Anteile. Die so erhaltenen Zahlen stellte ich mit der Bevölkerungsdichte, dem Reinvermögen, den Wähleranteilen der vier grössten Parteien bei den Grossratswahlen 2012, dem Ausländeranteil und dem durchschnittlichen Einkommen pro steuerpflichtige Person - immer pro Gemeinde - gegenüber. Da die Daten nicht alle vom gleichen Datum erhältlich waren und in den letzten Jahren einige Gemeindefusionen stattfanden, musste ich vorgängig, um von einheitlichen Daten ausgehen zu können, diese Gemeindefusionen berücksichtigen. In meinen Daten sind also, gemäss dem heutigen Stand, 216 Aargauer Gemeinden vorhanden. Da jedoch in einigen an der Kantonsgrenze liegenden Gemeinden die Schüler der Sekundarstufe I und die Gymnasiasten die Schule im Nachbarkanton besuchen und diese deshalb in meinen Daten nicht als Aargauer Schüler erscheinen, musste ich die betreffenden Gemeinden für die weiteren Arbeitsschritte weglassen. 9 Alle Gemeinden, deren Schüler nicht die Möglichkeit haben, eine ausserkantonale Schule zu besuchen. 39

40 Zunächst liess ich vom SPSS - mit der abhängigen Variable Gymansiastenanteil und mit allen von mir ausgewählten unabhängigen Variablen - Streudiagramme zeichnen. Darauf ist sowohl ersichtlich, ob ein linearer Zusammenhang vorliegt, wie auch, ob Ausreisser vorhanden sind, die den Wert des Korrelationskoeffizienten nach Pearson stark beeinflussen könnten. Sofern ein linearer Zusammenhang vorhanden war, berechnete ich den Wert des Korrelationskoeffizienten nach Pearson, andernfalls denjenigen nach Spearman. Dort, wo der lineare Zusammenhang am deutlichsten erkennbar war, berechnete ich noch die Koeffizienten der Regressionsgleichung. Kein linearer Zusammenhang mit dem Gymnasiastenanteil ist beim CVP Wähleranteil und beim Ausländeranteil ersichtlich. Beim Reinvermögen (Median) besteht eine schwache Korrelation, beim FDP Wähleranteil, bei der Bevölkerungsdichte, beim SP Wähleranteil, beim SVP Wähleranteil und beim durchschnittlichen Einkommen pro steuerpflichtige Person eine mittlere Korrelation. Beim Bezirks-, Sekundar- und Realschüleranteil als abhängige Variablen besteht, auf dem Leistungsniveau der Sekundarschule, mit keinem der untersuchten Merkmale ein linearer Zusammenhang. Auf der Real- und Bezirksschulstufe gibt es beim Reinvermögen (Median), beim Ausländeranteil und beim durchschnittlichen Einkommen pro steuerpflichtige Person einen linearen Zusammenhang und eine mittlere Korrelation. Es gibt also tatsächlich statistisch erhobene Daten vom Wohnort des Schülers, die den Gymnasiastenanteil und somit auch die Bildungschancen, beeinflussen. Schön wäre es gewesen, wenn in der statistischen Datenbank auch die Anzahl Studenten auf Universitätsniveau pro Wohnort vorhanden gewesen wären, um in die Analyse neben der Sekundarstufe I und II noch eine weitere Bildungsstufe miteinbeziehen zu können. 40

41 7 Quellenverzeichnis 7.1 Literaturverzeichnis Haider, G. (1999). Deskriptive Statistik. Gefunden am unter f Hatzinger, R. und Nagel, H. (2013). Statistik mit SPSS. Fallbeispiele und Methoden. 2., aktualisierte Auflage. München: Pearson. Margreiter, R. (2013). Aufnahmeprüfungen fürs Gymi gehören abgeschafft. NZZ am Sonntag, Ausgabe vom 30. Juni 2013, S. 17. Stahel, W. (2008). Lineare Regression. Gefunden am unter Toutenburg, H. und Heumann, C. (2008). Deskriptive Statistik. Eine Einführung in Methoden und Anwendungen mit R und SPSS. 6., aktualisierte und erweiterte Auflage. Berlin, Heidelberg: Springer. Universität Zürich. (2010). Einfache lineare Regression. Gefunden am unter Universität Zürich. (2010). Skalenniveau. Gefunden am unter Wikipedia. (2013). Gemeindefusionen in der Schweiz. Gefunden am unter Wikipedia. (2013). Skalenniveau. Gefunden am unter Abbildungsverzeichnis Abbildung 2.1: Benutzeroberfläche von SPSS... 8 Abbildung 2.2: Das Streudiagramm...11 Abbildung 2.3: Extrem hohe Korrelation...12 Abbildung 2.4: Fast keine Korrelation...12 Abbildung 2.5: Kein linearer Zusammenhang...12 Abbildung 2.6: Bestätigung des Korrelationskoeffizienten vom SPSS...13 Abbildung 2.7: Bestätigung des Rangkorrelationskoeffizienten vom SPSS...14 Abbildung 2.8: Die Regressionsgerade...15 Abbildung 2.9: Bestätigung der Regressionsgleichung...17 Abbildung 2.10: Fehler in der Fachliteratur...17 Abbildung 3.1: Die statistische Datenbank des Kantons Aargau...20 Abbildung 4.1: Der Gymnasiastenanteil...26 Abbildung 4.2: Bevölkerungsdichte

42 Abbildung 4.3: Karte Bevölkerungsdichte - Gymnasiastenanteil...28 Abbildung 4.4: Reinvermögen Mittelwert...28 Abbildung 4.5: Reinvermögen ohne Ausreisser...28 Abbildung 4.6: Reinvermögen Median...28 Abbildung 4.7: Wähleranteil SVP...30 Abbildung 4.8: Wähleranteil SP...30 Abbildung 4.9: Wähleranteil FDP...30 Abbildung 4.10: Wähleranteil CVP...30 Abbildung 4.11: Ausländeranteil...32 Abbildung 4.12: Durchschnittliches steuerbares Einkommen pro steuerpflichtige Person...33 Abbildung 4.13: Korrekter y-achsenabschnitt Tabellenverzeichnis Tabelle 1: Beispieldatensatz zur Berechnung des Korrelationskoeffizienten nach Pearson..12 Tabelle 2: Beispieldatensatz zur Berechnung des Korrelationskoeffizienten nach Spearman...14 Tabelle 3: Beispieldatensatz zur Berechnung der Regressionsgleichung...16 Tabelle 4: Beispiel einer Gemeindefusion...21 Tabelle 5: Korrelationskoeffizienten Sekundarstufe I

43 8 Anhang 43

44 44

45 45

46 46

Ausführliche Lösungen zu ausgewählten Aufgaben von ÜB 5 und 6. Streudiagramm

Ausführliche Lösungen zu ausgewählten Aufgaben von ÜB 5 und 6. Streudiagramm y Aufgabe 3 Ausführliche Lösungen zu ausgewählten Aufgaben von ÜB 5 und 6 a) Zur Erstellung des Streudiagramms zeichnet man jeweils einen Punkt für jedes Datenpaar (x i, y i ) aus der zweidimensionalen

Mehr

W-Seminar: Versuche mit und am Menschen 2017/2019 Skript

W-Seminar: Versuche mit und am Menschen 2017/2019 Skript 3. Deskriptive Statistik Die deskriptive (auch: beschreibende) Statistik hat zum Ziel, [ ] Daten durch Tabellen, Kennzahlen [ ] und Grafiken übersichtlich darzustellen und zu ordnen. Dies ist vor allem

Mehr

Rehwildabschuss 2014 pro Bezirk und Revier

Rehwildabschuss 2014 pro Bezirk und Revier - Gesamtabgang 4 1 Biberstein AARAU 177 19 20 105% 11. 1.5 1.0 40% 1 5% 21 2 Buchs-Suhret AARAU 407 28 1 111% 7.6 0.8 1.0 42% 4 11% 5 Densbüren-Ost AARAU 44 4 24 71% 7.0 2.4 1.2 46% 6 20% 0 4 Densbüren-West

Mehr

Arbeitslose nach Bezirk und Gemeinde

Arbeitslose nach Bezirk und Gemeinde Aarau Baden der n sicherzustellen, werden Gemeinden mit weniger als 5 Arbeitslosen und Aarau 374 492 57 63 34 Biberstein 17 21......... Buchs 174 265 25 23 19 Densbüren 9 15......... Erlinsbach 53 75 9

Mehr

Pastoralräume Dekanate Pfarreien Kirchgemeinden Politische Gemeinden

Pastoralräume Dekanate Pfarreien Kirchgemeinden Politische Gemeinden Pastoralräume Dekanate Pfarreien Kirchgemeinden Politische Gemeinden Pastoralraum Dekanat Pfarreien Kirchgemeinden Politische Gemeinden AG 1 Aarau Aarau Aarau Aarau, Biberstein, Küttigen, Ausnahmen Densbüren:

Mehr

Rehwildabschuss 2017 pro Bezirk und Revier

Rehwildabschuss 2017 pro Bezirk und Revier in planung schuss in % von pro 100 letze Jugend- 1 Biberstein AARAU 177 22 22 100% 12.4 1.2 1.1 32% 1 0 4% 23 2 Buchs-Suhret AARAU 407 32 34 106% 8.3 1.3 1.3 38% 14 10 29% 48 3 Densbüren-Ost AARAU 344

Mehr

Arbeitslose nach Bezirk und Gemeinde

Arbeitslose nach Bezirk und Gemeinde Bezirk Gemeinde Arbeitslose Aarau Baden Stellensuchende Langzeit- Arbeitslose Stellensuchende Zugänge Stellensuchende Abgänge Aarau 333 469 66 49 57 Biberstein 16 19......... Buchs (AG) 167 264 24 20 23

Mehr

AARGAUER KOMBI NORD 2018

AARGAUER KOMBI NORD 2018 AARGAUER KOMBI NORD 2018 TARIFE UND LEISTUNGEN für den Bezirk Brugg für den Bezirk Laufenburg für den Bezirk Rheinfelden AARGAUER WOCHE AG Bahnhofstrasse 4 5000 Aarau Tel. 062 823 83 88 VERLAG & HERAUSGEBER

Mehr

Departement Finanzen und Ressourcen Kantonales Steueramt

Departement Finanzen und Ressourcen Kantonales Steueramt Aarau 94 15 19 23 20 Aarburg 117 25 18 18 Abtwil 115 17 23 23 Ammerswil 105 18 20 23 Aristau 109 17 23 23 Arni 87 14 13 22 Attelwil 98 23 19 23 Auenstein 87 18 20 22 Auw 111 17 19 23 Bad Zurzach 100 23

Mehr

Arbeitslose nach Bezirk und Gemeinde

Arbeitslose nach Bezirk und Gemeinde Aarau Baden der n sicherzustellen, werden Gemeinden mit weniger als 5 Arbeitslosen und 1 Aarau 287 447 36 61 52 Biberstein 14 19...... 5 Buchs 126 176 30 17 37 Densbüren 7 12......... Erlinsbach 43 66...

Mehr

Arbeitslose nach Bezirk und Gemeinde

Arbeitslose nach Bezirk und Gemeinde Aarau Baden der n sicherzustellen, werden Gemeinden mit weniger als 5 Arbeitslosen und 1 Aarau 318 454 60 46 57 Biberstein 13 16......... Buchs 129 188 22 15 20 Densbüren 12 16......... Erlinsbach 42 62

Mehr

Aarau Aarburg Abtwil Ammerswil Aristau Arni (AG)

Aarau Aarburg Abtwil Ammerswil Aristau Arni (AG) DEPARTEMENT FINANZEN UND RESSOURCEN Kantonales Steueramt 1. Januar 2018 / 19. Februar 2018 VERZEICHNIS DER GEMEINDE- UND KIRCHENSTEUERFÜSSE für das Jahr 2018 (Steuerfuss Kanton 112 %) Gemeinde Steuerfuss

Mehr

Aarau Aarburg Abtwil Ammerswil Aristau Arni (AG)

Aarau Aarburg Abtwil Ammerswil Aristau Arni (AG) DEPARTEMENT FINANZEN UND RESSOURCEN Kantonales Steueramt 1. Januar 2017 VERZEICHNIS DER GEMEINDESTEUERFÜSSE für das Jahr 2017 (Steuerfuss Kanton 109 %) Gemeinde Steuerfuss christ-kt. 1 2 Aarau 97 15 18

Mehr

Hypothesentests mit SPSS

Hypothesentests mit SPSS Beispiel für eine einfache Regressionsanalyse (mit Überprüfung der Voraussetzungen) Daten: bedrohfb_v07.sav Hypothese: Die Skalenwerte auf der ATB-Skala (Skala zur Erfassung der Angst vor terroristischen

Mehr

Flächenstatistik der Aargauer Gemeinden

Flächenstatistik der Aargauer Gemeinden Flächenstatistik der Aargauer Gemeinden Los Losart I II III Summe Los Losart I II III Summe Bezirk: Aarau 4001 Aarau techn. Fläch 1'234 2 AV93 93 247 0 340 6 AV93 292 154 0 446 7 AV93 213 235 0 448 598

Mehr

TEIL 12: BIVARIATE ANALYSE FÜR METRISCH SKALIERTE VARIABLEN

TEIL 12: BIVARIATE ANALYSE FÜR METRISCH SKALIERTE VARIABLEN TEIL 12: BIVARIATE ANALYSE FÜR METRISCH SKALIERTE VARIABLEN GLIEDERUNG Bivariate Analyse für metrisch skalierte Variablen Grundlagen Streudiagramme und Visualisierungen von Zusammenhängen Positive lineare

Mehr

Einführung in die Statistik für Politikwissenschaftler Sommersemester 2011

Einführung in die Statistik für Politikwissenschaftler Sommersemester 2011 Einführung in die Statistik für Politikwissenschaftler Sommersemester 2011 Es können von den Antworten alle, mehrere oder keine Antwort(en) richtig sein. Nur bei einer korrekten Antwort (ohne Auslassungen

Mehr

Departement Finanzen und Ressourcen Kantonales Steueramt

Departement Finanzen und Ressourcen Kantonales Steueramt Aarau 94 15 19 23 20 Aarburg 124 25 18 18 Abtwil 112 17 22 23 Ammerswil 98 18 19 23 Aristau 109 17 23 23 Arni 87 14 13 22 Attelwil 98 23 19 23 Auenstein 92 18 19 22 Auw 111 17 19 23 Bad Zurzach 115 23

Mehr

TEIL 12: BIVARIATE ANALYSE FÜR METRISCH SKALIERTE VARIABLEN

TEIL 12: BIVARIATE ANALYSE FÜR METRISCH SKALIERTE VARIABLEN TEIL 12: BIVARIATE ANALYSE FÜR METRISCH SKALIERTE VARIABLEN Bivariate Analyse für metrisch skalierte Variablen Grundlagen Verfahren für metrische Daten nutzen den vollen mathematischen Informationsgehalt

Mehr

Deskription, Statistische Testverfahren und Regression. Seminar: Planung und Auswertung klinischer und experimenteller Studien

Deskription, Statistische Testverfahren und Regression. Seminar: Planung und Auswertung klinischer und experimenteller Studien Deskription, Statistische Testverfahren und Regression Seminar: Planung und Auswertung klinischer und experimenteller Studien Deskriptive Statistik Deskriptive Statistik: beschreibende Statistik, empirische

Mehr

Sommersemester Marktforschung

Sommersemester Marktforschung Dipl.-Kfm. Sascha Steinmann Universität Siegen Lehrstuhl für Marketing steinmann@marketing.uni-siegen.de Sommersemester 2010 Marktforschung Übungsaufgaben zu den Themen 3-6 mit Lösungsskizzen Aufgabe 1:

Mehr

3) Lagemaße: Mittelwert, Median, Modus

3) Lagemaße: Mittelwert, Median, Modus Thema: Beschreibende Statistik LE.1: 40 min Seite 9 3) Lagemaße: Mittelwert, Median, Modus Lagemaße In der beschreibenden Statistik werden Daten erhoben. Diese Daten weisen eine bestimmte Verteilung auf.

Mehr

der ordentlichen Beitragssätze aus dem Fonds zur Verhütung und Bekämpfung von Feuerschäden an Feuerwehr-Einrichtungen

der ordentlichen Beitragssätze aus dem Fonds zur Verhütung und Bekämpfung von Feuerschäden an Feuerwehr-Einrichtungen AGV Aargauische Gebäudeversicherung Feuerwehrwesen Aarau, 1. Januar 2016 /AF Verzeichnis der ordentlichen Beitragssätze aus dem Fonds zur Verhütung und Bekämpfung von Feuerschäden an Einrichtungen 2016

Mehr

Bitte am PC mit Windows anmelden!

Bitte am PC mit Windows anmelden! Einführung in SPSS Plan für heute: Grundlagen/ Vorwissen für SPSS Vergleich der Übungsaufgaben Einführung in SPSS http://weknowmemes.com/generator/uploads/generated/g1374774654830726655.jpg Standardnormalverteilung

Mehr

Skalenniveaus =,!=, >, <, +, -

Skalenniveaus =,!=, >, <, +, - ZUSAMMENHANGSMAßE Skalenniveaus Nominalskala Ordinalskala Intervallskala Verhältnisskala =,!= =,!=, >, < =,!=, >, ,

Mehr

Statistik K urs SS 2004

Statistik K urs SS 2004 Statistik K urs SS 2004 3.Tag Grundlegende statistische Maße Mittelwert (mean) Durchschnitt aller Werte Varianz (variance) s 2 Durchschnittliche quadrierte Abweichung aller Werte vom Mittelwert >> Die

Mehr

Auw, Muri. Baldingen, Tegerfelden. Hausen, Bremgarten-Mutschellen Benzenschwil Merenschwand, Muri. Berikon, Bremgarten-Mutschellen

Auw, Muri. Baldingen, Tegerfelden. Hausen, Bremgarten-Mutschellen Benzenschwil Merenschwand, Muri. Berikon, Bremgarten-Mutschellen LOCALITY PARISH Aarau Aarau Aarburg Aarburg Abtwil Abtwil, Aristau Aristau, Arni-Islisberg Islisberg, Attelwil Auenstein Auenstein Auw Auw, Bad Baldingen Baldingen, Beinwil Beinwil, Bellikon Hausen, Bremgarten-Mutschellen

Mehr

Spitex Organisationen AG mit Einzugsgebiet und HIN-Adressen Stand

Spitex Organisationen AG mit Einzugsgebiet und HIN-Adressen Stand Spitex Aarau 5000 Aarau 5000 Aarau 062 838 09 52 spitex-aarau@spitex-hin.ch 5032 Aarau Rohr Spitex Aarburg 4663 Aarburg 4663 Aarburg 062 791 01 04 spitex-aarburg@spitex-hin.ch Spitex Aare Nord 5024 Küttigen

Mehr

Statistik. Ronald Balestra CH St. Peter

Statistik. Ronald Balestra CH St. Peter Statistik Ronald Balestra CH - 7028 St. Peter www.ronaldbalestra.ch 17. Januar 2010 Inhaltsverzeichnis 1 Statistik 1 1.1 Beschreibende Statistik....................... 1 1.2 Charakterisierung von Häufigkeitsverteilungen...........

Mehr

Gibt es einen Zusammenhang zwischen Merkmalen? Korrelationen

Gibt es einen Zusammenhang zwischen Merkmalen? Korrelationen Arbeitsblatt SPSS Kapitel 8 Seite Gibt es einen Zusammenhang zwischen Merkmalen? Korrelationen Wie in allen Kapiteln gehen wir im Folgenden davon aus, dass Sie die Datei elporiginal.sav geöffnet haben.

Mehr

Ermitteln Sie auf 2 Dezimalstellen genau die folgenden Kenngrößen der bivariaten Verteilung der Merkmale Weite und Zeit:

Ermitteln Sie auf 2 Dezimalstellen genau die folgenden Kenngrößen der bivariaten Verteilung der Merkmale Weite und Zeit: 1. Welche der folgenden Kenngrößen, Statistiken bzw. Grafiken sind zur Beschreibung der Werteverteilung des Merkmals Konfessionszugehörigkeit sinnvoll einsetzbar? A. Der Modalwert. B. Der Median. C. Das

Mehr

Didaktisches Seminar über Stochastik. Themen: ffl Korrelation von zwei Zufallsvariablen

Didaktisches Seminar über Stochastik. Themen: ffl Korrelation von zwei Zufallsvariablen Didaktisches Seminar über Stochastik Themen: ffl Gemeinsame Verteilung von zwei Zufallsvariablen ffl Lineare Regression ffl Korrelation von zwei Zufallsvariablen Michael Ralph Pape Mai 1998 1 1 GEMEINSAME

Mehr

Anhörung "Neue Ressourcierung Volksschule"

Anhörung Neue Ressourcierung Volksschule Anhörung "Neue Ressourcierung Volksschule" Beilage Veränderungen der Ressourcenmengen der Schuljahre 2016/17 beziehungsweise 2017/18 (Modellberechnung) Stand: 04. Juni 2018 Aarau -3.1-2.9-1.2 0.9 Aarburg

Mehr

Modellberechnung der Schulleitungspensen gemäss neuem Berechnungsmodell

Modellberechnung der Schulleitungspensen gemäss neuem Berechnungsmodell Modellberechnung der Schulleitungspensen gemäss neuem Berechnungsmodell Veränderungen der Schulleitungspensen, berechnet anhand der Daten "Neue Ressourcierung Volksschule" auf Basis des Schuljahrs 2017/18

Mehr

Streuungsmaße von Stichproben

Streuungsmaße von Stichproben Streuungsmaße von Stichproben S P A N N W E I T E, V A R I A N Z, S T A N D A R D A B W E I C H U N G, Q U A R T I L E, K O V A R I A N Z, K O R R E L A T I O N S K O E F F I Z I E N T Zentrale Methodenlehre,

Mehr

Zählung der leer stehenden Wohnungen vom 1. Juni 2013

Zählung der leer stehenden Wohnungen vom 1. Juni 2013 I Presseinformation vom 7. August 2013 I Zählung der leer stehenden Wohnungen vom 1. Juni 2013 1. Einleitung Weite Kreise der Bauwirtschaft, der übrigen Wirtschaft und der Konjunkturforschung benötigen

Mehr

Zählung der leer stehenden Wohnungen per 1. Juni 2015

Zählung der leer stehenden Wohnungen per 1. Juni 2015 I Presseinformation vom 4. August 2015 I Zählung der leer stehenden Wohnungen per 1. Juni 2015 1. Einleitung Die Anzahl leer stehender Wohnungen und das Verhältnis dieser Zahl zum Wohnungsbestand sind

Mehr

Es können keine oder mehrere Antworten richtig sein. Eine Frage ist NUR dann richtig beantwortet, wenn ALLE richtigen Antworten angekreuzt wurden.

Es können keine oder mehrere Antworten richtig sein. Eine Frage ist NUR dann richtig beantwortet, wenn ALLE richtigen Antworten angekreuzt wurden. Teil III: Statistik Alle Fragen sind zu beantworten. Es können keine oder mehrere Antworten richtig sein. Eine Frage ist NUR dann richtig beantwortet, wenn ALLE richtigen Antworten angekreuzt wurden. Wird

Mehr

1 x 1 y 1 2 x 2 y 2 3 x 3 y 3... n x n y n

1 x 1 y 1 2 x 2 y 2 3 x 3 y 3... n x n y n 3.2. Bivariate Verteilungen zwei Variablen X, Y werden gemeinsam betrachtet (an jedem Objekt werden gleichzeitig zwei Merkmale beobachtet) Beobachtungswerte sind Paare von Merkmalsausprägungen (x, y) Beispiele:

Mehr

Das Postnetz im Kanton Aargau 2020

Das Postnetz im Kanton Aargau 2020 Das Postnetz im Kanton Aargau 2020 Regulatorisch relevante Formate Servicepunkte Total Eigenbetriebene Filialen und Partnerfilialen Hausservices Geschäftskundenstellen Aufgabe- /Abholstellen My Post 24-

Mehr

Departement Finanzen und Ressourcen Kantonales Steueramt

Departement Finanzen und Ressourcen Kantonales Steueramt Aarau 94 prov. 15 18 23 20 Aarburg 124 25 19 18 Abtwil 112 17 22 23 Ammerswil 98 18 19 23 Aristau 109 17 23 23 Arni 89 14 13 22 Attelwil 98 23 18 23 Auenstein 96 18 19 22 Auw 111 17 19 23 Bad Zurzach 115

Mehr

Statistik II. Lineare Regressionsrechnung. Wiederholung Skript 2.8 und Ergänzungen (Schira: Kapitel 4) Statistik II

Statistik II. Lineare Regressionsrechnung. Wiederholung Skript 2.8 und Ergänzungen (Schira: Kapitel 4) Statistik II Statistik II Lineare Regressionsrechnung Wiederholung Skript 2.8 und Ergänzungen (Schira: Kapitel 4) Statistik II - 09.06.2006 1 Mit der Kovarianz und dem Korrelationskoeffizienten können wir den statistischen

Mehr

Instrument zur Untersuchung eines linearen Zusammenhangs zwischen zwei (oder mehr) Merkmalen.

Instrument zur Untersuchung eines linearen Zusammenhangs zwischen zwei (oder mehr) Merkmalen. Gliederung Grundidee Einfaches lineares Modell KQ-Methode (Suche nach der besten Geraden) Einfluss von Ausreißern Güte des Modells (Bestimmtheitsmaß R²) Multiple Regression Noch Fragen? Lineare Regression

Mehr

Teil: lineare Regression

Teil: lineare Regression Teil: lineare Regression 1 Einführung 2 Prüfung der Regressionsfunktion 3 Die Modellannahmen zur Durchführung einer linearen Regression 4 Dummyvariablen 1 Einführung o Eine statistische Methode um Zusammenhänge

Mehr

3. Lektion: Deskriptive Statistik

3. Lektion: Deskriptive Statistik Seite 1 von 5 3. Lektion: Deskriptive Statistik Ziel dieser Lektion: Du kennst die verschiedenen Methoden der deskriptiven Statistik und weißt, welche davon für Deine Daten passen. Inhalt: 3.1 Deskriptive

Mehr

Inhaltsverzeichnis. 1 Über dieses Buch Zum Inhalt dieses Buches Danksagung Zur Relevanz der Statistik...

Inhaltsverzeichnis. 1 Über dieses Buch Zum Inhalt dieses Buches Danksagung Zur Relevanz der Statistik... Inhaltsverzeichnis 1 Über dieses Buch... 11 1.1 Zum Inhalt dieses Buches... 13 1.2 Danksagung... 15 2 Zur Relevanz der Statistik... 17 2.1 Beispiel 1: Die Wahrscheinlichkeit, krank zu sein, bei einer positiven

Mehr

4312 Magden 4253 Weber Kurt Mumpf 4255 Weber Kurt Wallbach Obermumpf 4256 Weber Kurt Wallbach Rheinfelden 4258 Weber Kurt

4312 Magden 4253 Weber Kurt Mumpf 4255 Weber Kurt Wallbach Obermumpf 4256 Weber Kurt Wallbach Rheinfelden 4258 Weber Kurt DEPARTEMENT FINANZEN UND RESSOURCEN Kantonales Steueramt Natürliche Personen 1. Januar 2017 ÜBERSICHT Steuerkreise gültig ab 1. Januar 2017 Steuerkreis 1 Keller Markus Hottiger Frank Bezirk Rheinfelden

Mehr

Pastoralräume Dekanate Pfarreien Kirchgemeinden Politische Gemeinden

Pastoralräume Dekanate Pfarreien Kirchgemeinden Politische Gemeinden Pastoralräume Dekanate Pfarreien Kirchgemeinden Politische Gemeinden 1 AG 1 Aarau Aarau Aarau Aarau, Biberstein, Küttigen, Ausnahmen Densbüren: Kirchgemeinde Aarau, Pfarrei Herznach, Ueken und PR AG 20,

Mehr

6 Korrelations- und Regressionsanalyse: Zusammenhangsanalyse stetiger Merkmale

6 Korrelations- und Regressionsanalyse: Zusammenhangsanalyse stetiger Merkmale 6 Korrelations- und Regressionsanalyse: Zusammenhangsanalyse stetiger Merkmale 397 6.1 Korrelationsanalyse Jetzt betrachten wir bivariate Merkmale (X, Y ), wobei sowohl X als auch Y stetig bzw. quasi-stetig

Mehr

Statistik II Übung 1: Einfache lineare Regression

Statistik II Übung 1: Einfache lineare Regression Statistik II Übung 1: Einfache lineare Regression Diese Übung beschäftigt sich mit dem Zusammenhang zwischen dem Lohneinkommen von sozial benachteiligten Individuen (16-24 Jahre alt) und der Anzahl der

Mehr

Statistik II (Sozialwissenschaften)

Statistik II (Sozialwissenschaften) Dr. Hans-Otfried Müller Institut für Mathematische Stochastik Fachrichtung Mathematik Technische Universität Dresden http://www.math.tu-dresden.de/sto/mueller/ Statistik II (Sozialwissenschaften) 2. Konsultationsübung,

Mehr

Bivariater Zusammenhang bei metrischen Variablen: Regression und Korrelation

Bivariater Zusammenhang bei metrischen Variablen: Regression und Korrelation Bivariater Zusammenhang bei metrischen Variablen: Regression und Korrelation PEΣO 12. November 2001 Von der Tabellenanalyse zur Regression Die bivariate Verteilung zweier metrischer Variablen kann konzeptionell

Mehr

Lage- und Streuungsparameter

Lage- und Streuungsparameter Lage- und Streuungsparameter Beziehen sich auf die Verteilung der Ausprägungen von intervall- und ratio-skalierten Variablen Versuchen, diese Verteilung durch Zahlen zu beschreiben, statt sie graphisch

Mehr

Kapitel 2. Mittelwerte

Kapitel 2. Mittelwerte Kapitel 2. Mittelwerte Im Zusammenhang mit dem Begriff der Verteilung, der im ersten Kapitel eingeführt wurde, taucht häufig die Frage auf, wie man die vorliegenden Daten durch eine geeignete Größe repräsentieren

Mehr

Inhaltsverzeichnis. Über die Autoren Einleitung... 21

Inhaltsverzeichnis. Über die Autoren Einleitung... 21 Inhaltsverzeichnis Über die Autoren.... 7 Einleitung... 21 Über dieses Buch... 21 Was Sie nicht lesen müssen... 22 Törichte Annahmen über den Leser... 22 Wie dieses Buch aufgebaut ist... 23 Symbole, die

Mehr

Verfahren zur Überprüfung von Zusammenhangshypothesen

Verfahren zur Überprüfung von Zusammenhangshypothesen Verfahren zur Überprüfung von Zusammenhangshypothesen 0. Allgemeines Wir haben uns bisher mit Unterschiedshypothesen beschäftigt (Unterschiede von Stichproben in Bezug auf abhängige Variablen). Im Folgenden

Mehr

1 Einfachregression 1.1In 10 Haushalten wurden Einkommen und Ausgaben für Luxusgüter erfragt:

1 Einfachregression 1.1In 10 Haushalten wurden Einkommen und Ausgaben für Luxusgüter erfragt: Beispiele zum Üben und Wiederholen zu Wirtschaftsstatistik 2 (Kurs 3) 1 Einfachregression 1.1In 10 Haushalten wurden Einkommen und Ausgaben für Luxusgüter erfragt: Haushaltseinkommen 12 24 30 40 80 60

Mehr

Trim Size: 176mm x 240mm Lipow ftoc.tex V1 - March 9, :34 P.M. Page 11. Über die Übersetzerin 9. Einleitung 19

Trim Size: 176mm x 240mm Lipow ftoc.tex V1 - March 9, :34 P.M. Page 11. Über die Übersetzerin 9. Einleitung 19 Trim Size: 176mm x 240mm Lipow ftoc.tex V1 - March 9, 2016 6:34 P.M. Page 11 Inhaltsverzeichnis Über die Übersetzerin 9 Einleitung 19 Was Sie hier finden werden 19 Wie dieses Arbeitsbuch aufgebaut ist

Mehr

Deskriptive Statistik

Deskriptive Statistik Deskriptive Statistik 1 Ziele In der deskriptiven (=beschreibenden) Statistik werden Untersuchungsergebnisse übersichtlich dargestellt, durch Kennzahlen charakterisiert und grafisch veranschaulicht. 2

Mehr

2. Generieren Sie deskriptive Statistiken (Mittelwert, Standardabweichung) für earny3 und kidsunder6yr3 und kommentieren Sie diese kurz.

2. Generieren Sie deskriptive Statistiken (Mittelwert, Standardabweichung) für earny3 und kidsunder6yr3 und kommentieren Sie diese kurz. Statistik II Übung : Einfache lineare Regression Diese Übung beschäftigt sich mit dem Zusammenhang zwischen dem Lohneinkommen von sozial benachteiligten Individuen (6-24 Jahre alt) und der Anzahl der unter

Mehr

Datenanalyse mit Excel und Gretl

Datenanalyse mit Excel und Gretl Dozent: Christoph Hindermann christoph.hindermann@uni-erfurt.de Datenanalyse mit Excel und Gretl Teil Titel 2: Gretl 1 Teil 2: Gretl Datenanalyse mit Excel und Gretl Teil Titel 2: Gretl 2 Modellannahmen

Mehr

Dr. Maike M. Burda. Welchen Einfluss hat die Körperhöhe auf das Körpergewicht? Eine Regressionsanalyse. HU Berlin, Econ Bootcamp

Dr. Maike M. Burda. Welchen Einfluss hat die Körperhöhe auf das Körpergewicht? Eine Regressionsanalyse. HU Berlin, Econ Bootcamp Dr. Maike M. Burda Welchen Einfluss hat die Körperhöhe auf das Körpergewicht? Eine Regressionsanalyse. HU Berlin, Econ Bootcamp 8.-10. Januar 2010 BOOTDATA.GDT: 250 Beobachtungen für die Variablen... cm:

Mehr

Regression ein kleiner Rückblick. Methodenseminar Dozent: Uwe Altmann Alexandra Kuhn, Melanie Spate

Regression ein kleiner Rückblick. Methodenseminar Dozent: Uwe Altmann Alexandra Kuhn, Melanie Spate Regression ein kleiner Rückblick Methodenseminar Dozent: Uwe Altmann Alexandra Kuhn, Melanie Spate 05.11.2009 Gliederung 1. Stochastische Abhängigkeit 2. Definition Zufallsvariable 3. Kennwerte 3.1 für

Mehr

Eine zweidimensionale Stichprobe

Eine zweidimensionale Stichprobe Eine zweidimensionale Stichprobe liegt vor, wenn zwei qualitative Merkmale gleichzeitig betrachtet werden. Eine Urliste besteht dann aus Wertepaaren (x i, y i ) R 2 und hat die Form (x 1, y 1 ), (x 2,

Mehr

» S C H R I T T - F Ü R - S C H R I T T - A N L E I T U N G «M U L T I P L E L I N E A R E R E G R E S S I O N M I T S P S S / I B M Daniela Keller

» S C H R I T T - F Ü R - S C H R I T T - A N L E I T U N G «M U L T I P L E L I N E A R E R E G R E S S I O N M I T S P S S / I B M Daniela Keller » SCHRITT-FÜR-SCHRITTANLEITUNG«MULTIPLE LINEARE REGRESSION MIT SPSS/IBM Daniela Keller Daniela Keller - MULTIPLE LINEARE REGRESSION MIT SPSS/IBM Impressum 2016 Statistik und Beratung Dipl.-Math. Daniela

Mehr

htw saar 1 EINFÜHRUNG IN DIE STATISTIK: BESCHREIBENDE STATISTIK

htw saar 1 EINFÜHRUNG IN DIE STATISTIK: BESCHREIBENDE STATISTIK htw saar 1 EINFÜHRUNG IN DIE STATISTIK: BESCHREIBENDE STATISTIK htw saar 2 Grundbegriffe htw saar 3 Grundgesamtheit und Stichprobe Ziel: Über eine Grundgesamtheit (Population) soll eine Aussage über ein

Mehr

BOXPLOT 1. Begründung. Boxplot A B C

BOXPLOT 1. Begründung. Boxplot A B C BOXPLOT 1 In nachstehender Tabelle sind drei sortierte Datenreihen gegeben. Zu welchem Boxplot gehört die jeweilige Datenreihe? Kreuze an und begründe Deine Entscheidung! Boxplot A B C Begründung 1 1 1

Mehr

Statistik II Übung 2: Multivariate lineare Regression

Statistik II Übung 2: Multivariate lineare Regression Statistik II Übung 2: Multivariate lineare Regression Diese Übung beschäftigt sich mit dem Zusammenhang zwischen Flugpreisen und der Flugdistanz, dem Passagieraufkommen und der Marktkonzentration. Verwenden

Mehr

STATISTIK I Übung 04 Spannweite und IQR. 1 Kurze Wiederholung. Was sind Dispersionsparameter?

STATISTIK I Übung 04 Spannweite und IQR. 1 Kurze Wiederholung. Was sind Dispersionsparameter? STATISTIK I Übung 04 Spannweite und IQR 1 Kurze Wiederholung Was sind Dispersionsparameter? Die sogenannten Dispersionsparameter oder statistischen Streuungsmaße geben Auskunft darüber, wie die Werte einer

Mehr

Durchführung einer Regression über das Resttermverfahren am Beispiel einer bilogarithmischen Funktion

Durchführung einer Regression über das Resttermverfahren am Beispiel einer bilogarithmischen Funktion Durchführung einer Regression über das Resttermverfahren am Beispiel einer bilogarithmischen Funktion Dipl.- Ing. Björnstjerne Zindler, M.Sc. Erstellt: 21. November 2014 Letzte Revision: 6. Dezember 2014

Mehr

Bivariate Regressionsanalyse

Bivariate Regressionsanalyse Universität Bielefeld 15. März 2005 Kovarianz, Korrelation und Regression Kovarianz, Korrelation und Regression Ausgangspunkt ist folgende Datenmatrix: Variablen 1 2... NI 1 x 11 x 12... x 1k 2 x 21 x

Mehr

Statistik I. Zusammenfassung und wichtiges zur Prüfungsvorbereitung. Malte Wissmann. 9. Dezember Universität Basel.

Statistik I. Zusammenfassung und wichtiges zur Prüfungsvorbereitung. Malte Wissmann. 9. Dezember Universität Basel. Zusammenfassung und wichtiges zur Prüfungsvorbereitung 9. Dezember 2008 Begriffe Kenntnis der wichtigen Begriffe und Unterscheidung dieser. Beispiele: Merkmal, Merkmalsraum, etc. Skalierung: Nominal etc

Mehr

Diese Publikation kann bei der Aargauischen Kantonalbank oder beim Kantonalen Statistischen Amt kostenlos bezogen werden.

Diese Publikation kann bei der Aargauischen Kantonalbank oder beim Kantonalen Statistischen Amt kostenlos bezogen werden. Die Broschüre Aargauer Zahlen wird von der Aargauischen Kantonalbank in enger Zusammenarbeit mit dem Kantonalen Statistischen Amt, Bleichemattstrasse 4, 5000 Aarau, Telefon 062 835 13 00, http://www.ag.ch/staag,

Mehr

Ganzrationale Funktionen

Ganzrationale Funktionen Eine Dokumentation von Sandro Antoniol Klasse 3f Mai 2003 Inhaltsverzeichnis: 1. Einleitung...3 2. Grundlagen...4 2.1. Symmetrieeigenschaften von Kurven...4 2.1.1. gerade Exponenten...4 2.1.2. ungerade

Mehr

Brückenkurs Statistik für Wirtschaftswissenschaften

Brückenkurs Statistik für Wirtschaftswissenschaften Peter von der Lippe Brückenkurs Statistik für Wirtschaftswissenschaften Weitere Übungsfragen UVK Verlagsgesellschaft mbh Konstanz Mit UVK/Lucius München UVK Verlagsgesellschaft mbh Konstanz und München

Mehr

Statistische Grundlagen I

Statistische Grundlagen I Statistische Grundlagen I Arten der Statistik Zusammenfassung und Darstellung von Daten Beschäftigt sich mit der Untersuchung u. Beschreibung von Gesamtheiten oder Teilmengen von Gesamtheiten durch z.b.

Mehr

Dr. Maike M. Burda. Welchen Einfluss hat die Körperhöhe auf das Körpergewicht? Eine Regressionsanalyse. HU Berlin, Econ Bootcamp 7.-9.

Dr. Maike M. Burda. Welchen Einfluss hat die Körperhöhe auf das Körpergewicht? Eine Regressionsanalyse. HU Berlin, Econ Bootcamp 7.-9. Dr. Maike M. Burda Welchen Einfluss hat die Körperhöhe auf das Körpergewicht? Eine Regressionsanalyse. HU Berlin, Econ Bootcamp 7.-9. Januar 2011 BOOTDATA11.GDT: 250 Beobachtungen für die Variablen...

Mehr

Diese Publikation kann bei der Aargauischen Kantonalbank oder beim Kantonalen Statistischen Amt kostenlos bezogen werden.

Diese Publikation kann bei der Aargauischen Kantonalbank oder beim Kantonalen Statistischen Amt kostenlos bezogen werden. 2006 Die Broschüre Aargauer Zahlen wird von der Aargauischen Kantonalbank in enger Zusammenarbeit mit dem Kantonalen Statistischen Amt, Bleichemattstrasse 4, 5000 Aarau, Telefon 062 835 13 00, http://www.ag.ch/staag,

Mehr

Die Funktion f wird als Regressionsfunktion bezeichnet.

Die Funktion f wird als Regressionsfunktion bezeichnet. Regressionsanalyse Mit Hilfe der Techniken der klassischen Regressionsanalyse kann die Abhängigkeit metrischer (intervallskalierter) Zielgrößen von metrischen (intervallskalierten) Einflussgrößen untersucht

Mehr

Karl Entacher. FH-Salzburg

Karl Entacher. FH-Salzburg Ahorn Versteinert Bernhard.Zimmer@fh-salzburg.ac.at Statistik @ HTK Karl Entacher FH-Salzburg karl.entacher@fh-salzburg.ac.at Beispiel 3 Gegeben sind 241 NIR Spektren (Vektoren der Länge 223) zu Holzproben

Mehr

Anwendungsaufgaben. a. Anhand des Streudiagramms (. Abb. 1) lässt sich ein linearer Zusammenhang vermuten. Aufgabe 1. Anhang 1: Lösungen der Aufgaben

Anwendungsaufgaben. a. Anhand des Streudiagramms (. Abb. 1) lässt sich ein linearer Zusammenhang vermuten. Aufgabe 1. Anhang 1: Lösungen der Aufgaben Anhang 1: Lösungen der Aufgaben 15 +1). Korrelationskoeffizienten unterschiedlicher Stichproben oder verschiedener Variablen können so miteinander verglichen werden, was mit der Kovarianz nicht möglich

Mehr

Übung 3 im Fach "Biometrie / Q1"

Übung 3 im Fach Biometrie / Q1 Universität Ulm, Institut für Epidemiologie und Medizinische Biometrie, D-89070 Ulm Institut für Epidemiologie und Medizinische Biometrie Leiter: Prof. Dr. D. Rothenbacher Schwabstr. 13, 89075 Ulm Tel.

Mehr

Basis-Kurs Statistik und SPSS für Mediziner Lösungen. SPSS-Übung Korrelation, Regression und diagnostische Tests

Basis-Kurs Statistik und SPSS für Mediziner Lösungen. SPSS-Übung Korrelation, Regression und diagnostische Tests Basis-Kurs Statistik und SPSS für Mediziner Lösungen SPSS-Übung Korrelation, Regression und diagnostische Tests Mit Datensatz Daten_SPSS_Kurs_I.sav Berechnung der Blutdruckreduktion vom Studienbeginn zum

Mehr

Steuerstatistik 2011 Juristische Personen

Steuerstatistik 2011 Juristische Personen stat.kurzinfo Nr. 9 I Juni 214 I Öffentliche Finanzen I statistik 211 Juristische Personen Pflichtige, Faktoren und n, 25 211 Jahr Pflichtige Reingewinn Ordentlich besteuerte Kapitalgesellschaften und

Mehr

Deskriptive Statistik Erläuterungen

Deskriptive Statistik Erläuterungen Grundlagen der Wirtschaftsmathematik und Statistik Erläuterungen Lernmaterial zum Modul - 40601 - der Fernuniversität Hagen 7 2.1 Einfache Lageparameter aus einer gegebenen Messreihe ablesen Erklärung

Mehr

Lösungen zur Biomathe-Klausur Gruppe C Montag, den 16. Juli 2001

Lösungen zur Biomathe-Klausur Gruppe C Montag, den 16. Juli 2001 Lösungen zur Biomathe-Klausur Gruppe C Montag, den 16. Juli 2001 1. Normalverteilung Der diastolische Blutdruck bei einer Gruppe von jungen Männern ist normalverteilt mit einem Erwartungswert von 65 mmhg

Mehr

Statistik eindimensionaler Größen

Statistik eindimensionaler Größen Statistik eindimensionaler Größen Michael Spielmann Inhaltsverzeichnis 1 Aufgabe der eindimensionalen Statistik 2 2 Grundbegriffe 2 3 Aufbereiten der Stichprobe 3 4 Die Kennzahlen Mittelwert und Streuung,

Mehr

Fundbüros der Gemeinden des Kantons Aargau ab 01. Januar 2010 Bezirk Aarau Gemeinde Fundbüro Adresse und Telefon

Fundbüros der Gemeinden des Kantons Aargau ab 01. Januar 2010 Bezirk Aarau Gemeinde Fundbüro Adresse und Telefon Fundbüros der Gemeinden des Kantons Aargau ab 01. Januar 2010 Bezirk Aarau Gemeinde Fundbüro Adresse und Telefon Aarau und Rohr Fundbüro Aarau Fundbüro der Stadt Aarau Stadtbüro Rathausgasse 1 5000 Aarau

Mehr

Deskriptive Beschreibung linearer Zusammenhänge

Deskriptive Beschreibung linearer Zusammenhänge 9 Mittelwert- und Varianzvergleiche Mittelwertvergleiche bei k > 2 unabhängigen Stichproben 9.4 Beispiel: p-wert bei Varianzanalyse (Grafik) Bedienungszeiten-Beispiel, realisierte Teststatistik F = 3.89,

Mehr

Biometrieübung 10 Lineare Regression. 2. Abhängigkeit der Körpergröße von der Schuhgröße bei Männern

Biometrieübung 10 Lineare Regression. 2. Abhängigkeit der Körpergröße von der Schuhgröße bei Männern Biometrieübung 10 (lineare Regression) - Aufgabe Biometrieübung 10 Lineare Regression Aufgabe 1. Düngungsversuch In einem Düngeversuch mit k=9 Düngungsstufen x i erhielt man Erträge y i. Im (X, Y)- Koordinatensystem

Mehr

Übungsklausur zur Vorlesung "Statistik I" (WiSe 2003/2004)

Übungsklausur zur Vorlesung Statistik I (WiSe 2003/2004) Universität Siegen, FB 1 Prof. W. Ludwig-Mayerhofer/ Dipl.Soz. Uta Liebeskind Übungsklausur zur Vorlesung "Statistik I" (WiSe 2003/2004) 1. Bitte vermerken Sie hinter dem jeweiligen Merkmal das Skalenniveau.

Mehr

Statistik II Übung 4: Skalierung und asymptotische Eigenschaften

Statistik II Übung 4: Skalierung und asymptotische Eigenschaften Statistik II Übung 4: Skalierung und asymptotische Eigenschaften Diese Übung beschäftigt sich mit der Skalierung von Variablen in Regressionsanalysen und mit asymptotischen Eigenschaften von OLS. Verwenden

Mehr

Kapitel 1: Deskriptive Statistik

Kapitel 1: Deskriptive Statistik Kapitel 1: Deskriptive Statistik Grafiken 1 Statistische Kennwerte 5 z-standardisierung 7 Grafiken Mit Hilfe von SPSS lassen sich eine Vielzahl unterschiedlicher Grafiken für unterschiedliche Zwecke erstellen.

Mehr

Was sind Zusammenhangsmaße?

Was sind Zusammenhangsmaße? Was sind Zusammenhangsmaße? Zusammenhangsmaße beschreiben einen Zusammenhang zwischen zwei Variablen Beispiele für Zusammenhänge: Arbeiter wählen häufiger die SPD als andere Gruppen Hochgebildete vertreten

Mehr

Deskriptive Statistik

Deskriptive Statistik Helge Toutenburg Christian Heumann Deskriptive Statistik Eine Einführung in Methoden und Anwendungen mit R und SPSS Siebte, aktualisierte und erweiterte Auflage Mit Beiträgen von Michael Schomaker 4ü Springer

Mehr

Der χ2-test Der χ2-test

Der χ2-test Der χ2-test Der χ 2 -Test Überblick Beim χ 2 -Test handelt es sich um eine Familie ähnlicher Tests, die bei nominal- oder ordinalskalierten Merkmalen mit zwei oder mehr Ausprägungen angewendet werden können. Wir behandeln

Mehr

Bivariate Zusammenhänge

Bivariate Zusammenhänge Bivariate Zusammenhänge 40 60 80 Bivariater Zusammenhang: Zusammenhang zwischen zwei Variablen weight (kg) Gibt es einen Zusammenhang zwischen Größe & Gewicht? (am Beispieldatensatz) Offensichtlich positiver

Mehr

1 Grundlagen der Wahrscheinlichkeitsrechnung Wahrscheinlichkeitsräume. Ein erster mathematischer Blick auf Zufallsexperimente...

1 Grundlagen der Wahrscheinlichkeitsrechnung Wahrscheinlichkeitsräume. Ein erster mathematischer Blick auf Zufallsexperimente... Inhaltsverzeichnis 1 Grundlagen der Wahrscheinlichkeitsrechnung 1 1.1 Wahrscheinlichkeitsräume Ein erster mathematischer Blick auf Zufallsexperimente.......... 1 1.1.1 Wahrscheinlichkeit, Ergebnisraum,

Mehr

Der χ 2 -Test. Überblick. Beispiel 1 (χ 2 -Anpassungstest)

Der χ 2 -Test. Überblick. Beispiel 1 (χ 2 -Anpassungstest) Der χ 2 -Test Überblick Beim χ 2 -Test handelt es sich um eine Familie ähnlicher Tests, die bei nominal- oder ordinalskalierten Merkmalen mit zwei oder mehr Ausprägungen angewendet werden können. Wir behandeln

Mehr