MODUL 4 UNIVARIATE DATENANALYSE HÄUFIGKEITEN UND DIAGRAMME PROSEMINAR ANALYSE UND DARSTELLUNG VON DATEN I (DESKRIPTIVE STATISTIK)



Ähnliche Dokumente
Lineargleichungssysteme: Additions-/ Subtraktionsverfahren

Zahlen auf einen Blick

Fallbeispiel: Eintragen einer Behandlung

1. Einführung. 2. Alternativen zu eigenen Auswertungen. 3. Erstellen eigener Tabellen-Auswertungen

Datenaufbereitung in SPSS. Daten zusammenfügen

Erstellen von x-y-diagrammen in OpenOffice.calc

Professionelle Seminare im Bereich MS-Office

4. Erstellen von Klassen

Einfache statistische Auswertungen mit dem Programm SPSS

Wie Sie mit Mastern arbeiten

Stellen Sie bitte den Cursor in die Spalte B2 und rufen die Funktion Sverweis auf. Es öffnet sich folgendes Dialogfenster

Outlook. sysplus.ch outlook - mail-grundlagen Seite 1/8. Mail-Grundlagen. Posteingang

So gehts Schritt-für-Schritt-Anleitung

Erstellen einer Collage. Zuerst ein leeres Dokument erzeugen, auf dem alle anderen Bilder zusammengefügt werden sollen (über [Datei] > [Neu])

Handbuch Fischertechnik-Einzelteiltabelle V3.7.3

Expertenrunde Gruppe 1: Wiederholungsgruppe EXCEL (Datenerfassung, Darstellungsformen, Verwertung)

104 WebUntis -Dokumentation

1 Mathematische Grundlagen

4. BEZIEHUNGEN ZWISCHEN TABELLEN

Stundenerfassung Version 1.8

EINFACHES HAUSHALT- KASSABUCH

Berechnung der Erhöhung der Durchschnittsprämien

Anleitung Postfachsystem Inhalt

Datenexport aus JS - Software

Pfötchenhoffung e.v. Tier Manager

Berechnungen in Access Teil I

Primzahlen und RSA-Verschlüsselung

Univariates Chi-Quadrat-Verfahren für ein dichotomes Merkmal und eine Messwiederholung: Test nach McNemar

Statistische Auswertung:

R ist freie Software und kann von der Website.

3. GLIEDERUNG. Aufgabe:

Auswerten mit Excel. Viele Video-Tutorials auf Youtube z.b.

Wie Sie mit Pivottabellen komplexe Daten perfekt analysieren und präsentieren

Dokumentation: ZIBXL - Auswertung der internen Umbuchungen

Stammdatenanlage über den Einrichtungsassistenten

Laufende Auswertung von Feedback-Fragebögen Eine Vorlage zur Auswertung eines Fragebogens und die Präsentation erstellen...

Geld Verdienen im Internet leicht gemacht

Computeria Rorschach Mit Excel Diagramme erstellen

geben. Die Wahrscheinlichkeit von 100% ist hier demnach nur der Gehen wir einmal davon aus, dass die von uns angenommenen

Bedienung des Web-Portales der Sportbergbetriebe

Grundlagen der Theoretischen Informatik, SoSe 2008

Einfache statistische Auswertungen mit dem TI-Nspire

4 Aufzählungen und Listen erstellen

Dokumentation. estat Version 2.0

Serienbrieferstellung in Word mit Kunden-Datenimport aus Excel

P&P Software - Adressexport an Outlook 05/29/16 14:44:26

Wie halte ich Ordnung auf meiner Festplatte?

Anzeige von eingescannten Rechnungen

Anleitung über den Umgang mit Schildern

QuickStart. «/ Scores» Kurzanleitung

Professionelle Seminare im Bereich MS-Office

Anwendungshinweise zur Anwendung der Soziometrie

STATISTIK. Erinnere dich

4.1 Wie bediene ich das Webportal?

Satzhilfen Publisher Seite Einrichten

FuxMedia Programm im Netzwerk einrichten am Beispiel von Windows 7

QM: Prüfen -1- KN

Dokumentation zur Versendung der Statistik Daten

CC Modul Leadpark. 1. Setup 1.1 Providerdaten 1.2 Einstellungen 1.3 Qualifizierungsstati 1.4 Reklamationsstati 1.5 Design 1.

Leere Zeilen aus Excel-Dateien entfernen

Handbuch ECDL 2003 Basic Modul 5: Datenbank Access starten und neue Datenbank anlegen

Excel Pivot-Tabellen 2010 effektiv

Datenexport mit orgamax

Word. Serienbrief erstellen

Urlaubsregel in David

Animationen erstellen

Hinweise zum Übungsblatt Formatierung von Text:

5 Zweisprachige Seiten

1. Einführung Erstellung einer Teillieferung Erstellung einer Teilrechnung 6

Arbeiten mit UMLed und Delphi

Schrittweise Anleitung zur Erstellung einer Angebotseite 1. In Ihrem Dashboard klicken Sie auf Neu anlegen, um eine neue Seite zu erstellen.

1 PIVOT TABELLEN. 1.1 Das Ziel: Basisdaten strukturiert darzustellen. 1.2 Wozu können Sie eine Pivot-Tabelle einsetzen?

Präventionsforum+ Erfahrungsaustausch. HANDOUT GRUPPEN-ADMINISTRATOREN Anlage zum Endnutzer-Handbuch. Stand: Änderungen vorbehalten

1 topologisches Sortieren

Handbuch. NAFI Online-Spezial. Kunden- / Datenverwaltung. 1. Auflage. (Stand: )

COMPUTERIA VOM SERIENBRIEFE UND ETIKETTENDRUCK

Arcavis Backend - Invoice Baldegger+Sortec AG

Informatik Kurs Simulation. Hilfe für den Consideo Modeler

Datenbanken Kapitel 2

Konzepte der Informatik

Antolin-Titel jetzt automatisch in WinBIAP kennzeichnen

LineQuest-Leitfaden LineQuest Dialog-Portal. Generieren der LineQuest-Auswertungsdatei

II. Daten sichern und wiederherstellen 1. Daten sichern

Wie melde ich meinen Verein bei BOOKANDPLAY an?

Inhalt. Allgemeine Einführung. Argumentationsvermögen. Räumliches Vorstellungsvermögen. Begabungen und Fähigkeiten messen

Professionelle Diagramme mit Excel 2010 erstellen. Peter Wies. 1. Ausgabe, 2. Aktualisierung, März Themen-Special W-EX2010DI

CAQ Software für Ihr Qualitätsmanagement. Ablauf für die Erfassung der Fehler in der Fertigung

Handbuch ECDL 2003 Basic Modul 6: Präsentation Diagramm auf einer Folie erstellen

Mediator 9 - Lernprogramm

Informationsblatt Induktionsbeweis

Die Textvorlagen in Microsoft WORD und LibreOffice Writer

Gratis Excel SVERWEIS Funktions-Anleitung, Tutorial, ebook, PDF-E-Book

HANDBUCH PHOENIX II - DOKUMENTENVERWALTUNG

Wo möchten Sie die MIZ-Dokumente (aufbereitete Medikamentenlisten) einsehen?

Handreichung zu Datenauswertungen im TILL Stand:

der Eingabe! Haben Sie das Ergebnis? Auf diesen schwarzen Punkt kommen wir noch zu sprechen.

Wir machen neue Politik für Baden-Württemberg

Dokumentation von Ük Modul 302

Erstellen einer digitalen Signatur für Adobe-Formulare

Zwischenablage (Bilder, Texte,...)

Transkript:

INSTITUT FÜR ERZIEHUNGSWISSENSCHAFT - UNIVERSITÄT SALZBURG PROSEMINAR ANALYSE UND DARSTELLUNG VON DATEN I (DESKRIPTIVE STATISTIK) GÜNTER HAIDER WS 1997/98 MODUL 4 UNIVARIATE DATENANALYSE HÄUFIGKEITEN UND DIAGRAMME 1

Empirische Verteilungen In den Modulen 1 bis 3 haben Sie gelernt, wie interessierende Merkmale identifiziert werden, aus der Analyse von Datenerhebungsinstrumenten detaillierte Datenbeschreibungen bzw. Kodierpläne entstehen und wie die erhobenen Daten dann in den Computer eingegeben werden. Nachdem wir nun ein fertig kodiertes Datenfile vorliegen haben, wollen wir uns der eigentlichen Aufgabe der Statistik zuwenden: Die gefundenen Daten zu analysieren. Dies heißt in der deskriptiven Statistik, die Werte der Personen - genauer die vorgefundene empirische Verteilung der Werte - innerhalb von Variablen so zusammenzufassen, daß ihr wesentlicher Inhalt klar und verständlich sowie in geordneter und übersichtlicher Form ausgedrückt oder dargestellt wird. Denn die Meßwerte, die in einer empirischen Untersuchung gesammelt wurden, sind zunächst ungeordnet und bieten auf den ersten Blick ein eher verwirrendes Bild. GROESSE/Körpergröße in cm 18 17 16 15 14 13 12 2 Laufende Schülernummer 3 4 5 men. Für eine systematische und genaue Beschreibung solcher Verteilungen von Meßwerten einer Variablen stehen drei verschiedene Formen der Darstellung zur Verfügung: * die zusammenfassende (klassifizierende) Darstellung aller beobachteten Werte in Tabellen (z.b. Häufigkeitstabellen), * die grafisch übersichtliche Darstellung in Form von Diagrammen (z.b. Stab-/Tortendiagramme) und * die numerische Darstellung durch charakteristische statistische Maßzahlen (z.b. Mittel- und Streuungswerte). Vorerst wollen wir uns nur mit der Verteilung der Meßwerte innerhalb einer Variable beschäftigen, der sogenannten univariaten Analyse bzw. der Analyse und Darstellung univariater Verteilungen. Wurden die Daten - so wie in den beiden letzten Modulen beschrieben - als Datenmatrix in SPSS aufbereitet, so besteht die univariate Analyse in der Auswertung der Meßwerte einer Spalte dieser Matrix. Ausgehend von der ungeordneten Auflistung aller Werte einer Variablen (der Urliste ) wird eine univariate Häufigkeitstabelle erstellt. Die errechneten Häufigkeiten lassen sich dann als Diagramme übersichtlich abbilden und für intervallskalierte Variablen werden Maßzahlen der zentralen Tendenz ( Mittelwerte ) und Maßzahlen für die Dispersion ( Streuungswerte ) berechnet. ÜBUNGSDATENFILE SL.SAV Alle Übungen in diesem und in den kommenden Modulen werden mithilfe des Datenfiles SL.SAV durchgeführt. Das Datenfile enthält 3 Variablen von insgesamt 651 Schülerinnen und Schülern. Eine genaue Dokumentation und eine Diskette erhalten Sie zusätzlich zu diesem Skriptum. 6 7 Die nebenstehende Grafik (ein Scatterplot) zeigt die Werte für die Körpergröße aller 651 Schüler in unserem Übungsdatensatz SL. An der x- Achse sind die fortlaufenden Nummern aufgetragen, auf der y-achse die Körpergröße der Schüler am Ende der Grundschulzeit - in cm. Man kann auf den ersten Blick erkennen, daß die Variable hauptsächlich Werte zwischen 13 und 15 cm annimmt, wobei der kleinste beobachtete Wert nahe 12 cm und der größte auftretende Wert etwa 175 cm beträgt. Am häufigsten scheinen Werte rund um 14 cm vorzukom- 2 Skriptum Deskriptive Statistik

Die univariate Häufigkeitstabelle Der Übungsdatensatz SL.SAV enthält unter anderem die Variable GROESSE - dabei handelt es sich um die Körpergröße aller beobachteten 651 Schüler, ausgedrückt in Zentimetern, gemessen am Ende der Grundschulzeit, also im Alter von etwa 1 Jahren. 145 135 134 143 135 14 137 14 141 147 139 13 133 126 Wert Häufigkeit 156 152 148 999 144 131 138 13 143 144 131 175 135 122 2 136 141 141 128 138 135 14 147 144 142 146 151 134 123 1 146 141 133 142 136 137 147 136 134 145 147 139 127 147 138 135 999 131 139 133 137 139 137 143 134 145 124 1 151 142 145 141 136 14 144 139 146 143 143 134 138 125 4 144 138 148 144 136 139 146 141 141 137 136 139 151 126 2 145 14 136 143 15 135 141 158 141 13 14 128 144 127 3 139 133 134 142 999 143 143 142 145 139 131 131 14 128 7 147 145 155 148 145 139 141 138 143 146 138 131 137 129 5 148 142 134 146 13 14 135 139 15 123 999 139 126 145 143 136 136 134 143 137 131 14 14 138 134 134 13 13 147 151 138 138 141 139 149 146 142 142 135 138 141 131 2 136 142 137 142 142 14 144 135 143 132 139 152 146 132 14 141 137 138 15 132 138 14 14 135 143 137 145 134 133 23 151 137 144 14 14 136 999 137 137 139 143 148 135 134 31 14 141 139 143 151 138 141 136 146 141 139 132 145 135 31 143 15 148 151 139 137 144 135 128 139 133 135 136 152 143 144 143 147 147 137 139 138 148 137 14 139 136 35 138 145 137 14 14 143 13 154 136 139 134 13 139 137 38 137 138 145 137 144 144 141 13 143 14 137 133 135 138 36 136 129 15 143 135 136 132 142 134 138 14 138 138 139 49 134 143 151 145 146 14 136 131 13 132 139 141 139 14 47 142 138 139 146 131 138 145 141 143 158 134 133 143 141 37 136 14 151 144 14 145 131 139 154 147 137 122 131 134 134 15 139 143 122 141 136 136 135 144 139 143 142 29 143 14 14 133 145 148 132 139 13 145 147 139 139 143 41 137 144 128 137 138 144 148 136 137 142 13 128 136 144 37 139 138 141 143 133 14 141 146 128 144 141 14 133 145 32 141 147 144 133 138 152 141 145 144 138 143 141 133 146 23 135 146 145 138 132 13 14 158 137 151 145 147 138 147 2 139 146 139 129 136 143 137 14 137 134 149 139 145 137 149 141 142 134 133 145 135 137 143 144 137 147 148 14 144 134 147 13 125 14 142 135 142 132 15 137 132 149 8 138 139 136 156 142 143 134 142 999 137 141 14 137 15 8 138 149 14 131 15 131 141 136 999 129 139 137 131 151 1 133 141 144 142 136 131 125 133 999 141 141 152 14 152 7 134 138 125 135 145 131 145 133 133 134 14 139 132 154 3 143 135 143 139 145 161 138 139 14 141 145 129 142 139 154 127 136 144 142 148 144 142 141 14 127 131 155 3 144 134 144 136 135 133 14 136 141 149 135 136 143 156 2 148 143 142 142 137 146 152 138 135 146 125 147 134 158 3 144 147 144 146 144 133 134 132 139 148 131 137 136 161 1 136 144 146 144 145 14 145 147 147 138 135 13 145 175 1 137 14 135 142 142 135 134 135 152 144 124 135 148 132 133 149 155 148 138 136 143 131 139 146 132 14 144 144 133 137 14 135 143 129 143 128 134 144 149 134 155 999 146 136 139 132 146 142 145 141 14 134 144 14 133 133 139 146 145 139 139 131 139 143 14 999 146 142 136 141 138 143 147 149 135 14 134 14 Auflistung aller Werte von GROESSE ( Urliste ) 641 999 1 651 Häufigkeit des Vorkommens bestimmter Werte von GROESSE Die Urliste (linke Tabelle) zeigt alle beobachteten Werte der 651 Personen (inklusive der 1 fehlenden Werte 999) - die ungeordnete Liste läßt noch keinen wirklichen Schluß auf die Verteilung der Werte zu. Ordnet man jedoch alle vorkommenden Werte aufsteigend und zählt man, wie oft jeder Wert in der gegebenen Verteilung vorkommt, so erhält man bereits eine sehr einfache Häufigkeitsverteilung. Man erkennt, daß extrem kleine und extrem große Werte eher selten vorkommen und daß die am häufigsten vorkommenden Werte etwa um 139 und 14 cm betragen. Um die Tabelle dieser intervallskalierten Variable etwas übersichtlicher zu gestalten, scheint es sinnvoll, die Werte zu größeren Klassen zusammenzufassen (zu klassifizieren). 3

Anzahl 5 4 3 2 1 175 174 173 172 171 17 169 168 167 166 165 164 163 162 161 16 159 158 157 156 155 154 153 152 151 15 149 148 147 146 145 144 143 142 141 14 139 138 137 136 135 134 133 132 131 13 129 128 127 126 125 124 123 122 GROESSE/Körpergröße in cm am Ende der GRUNDSCHULE Histogramm (Stabdiagramm) der Häufigkeiten der vorkommenden Werte in GROESSE Obwohl sich das obenstehende Histogramm von der univariaten Häufigkeitstabelle nur der Form nach unterscheidet, und obwohl beide eigentlich dieselben Informationen enthalten, vermittelt die grafische bzw. flächenmäßige Repräsentierung einen besseren Eindruck vom Gesamtmuster der Verteilung. Dieser Eindruck kann noch gesteigert werden, wenn wir die Daten verdichten, d.h. daß wir benachbarte Werte zu Klassen zusammenfassen (da es sich bei GROESSE um eine intervallskalierte Variable handelt, stellt dies ja auch meßtheoretisch kein Problem dar). Das wirft zunächst die Fragen nach der sinnvollen Anzahl der zu bildenden Klassen auf, als auch nach der damit verbundenen Problematik der Klassenbreite. Dafür gibt es nur unverbindliche Faustregeln - denn diese beiden Entscheidungen hängen von der Art der Verteilung der Meßwerte ab. Wählt man viele Klassen bei einer breiten Verteilung, geht leicht die Übersichtlichkeit verloren - wählt man zu große Klassenbreiten (wenige Klassen), so werden unter Umständen Besonderheiten der Verteilung versteckt. * Die Anzahl der Klassen sollte (natürlich nur bei entsprechender Anzahl von Personen) zwischen 8 und 12 liegen, sollte aber auch bei großen Stichproben oder breiten Verteilungen 2 nie überschreiten. * Alle Klassen sollten möglichst gleich breit sein, d.h. die Zahl der Einheiten (z.b. cm), die eine Klasse umfaßt, sollte stets gleich sein. Es dient der Übersichtlichkeit, wenn Klassenbreiten z.b. 5- er oder 1-er Einheiten gleichgesetzt werden. In unserem Beispiel mit der Variable GROESSE reichen die Meßwerte von 122 bis 175 cm und es bietet sich eine Klassenbreite von 5 cm an, d.h. die erste Klasse geht von 121 bis 125 cm, die zweite von 126 bis 13, die dritte von 131 bis 135, usw. bis 171 bis 175 cm, potentiell also 11 Klassen, von denen aber nur 1 eine Besetzung aufweisen. Anmerkung: Da es sich bei GROESSE um eine prinzipiell stetige Variable handelt, sollten die exakten Klassengrenzen eigentlich z.b. 12.51 bis 125.5 bzw. 125.51 bis 13.5 usw. sein. Da aber in der Untersuchung nur in ganzen Zentimetern gemessen wurde, hat dies praktisch wenig Bedeutung. 4 Skriptum Deskriptive Statistik

Die klassierte (gruppierte) Häufigkeitstabelle Bei größeren Stichproben und intervallskalierten Variablen ist die im vorigen Kapitel beschriebene Klassierung von Werten, d.h. ihre Zusammenfassung zu wenigen Gruppen aus Gründen der Übersichtlichkeit, sehr häufig sinnvoll, im speziellen wenn die Anzahl der vorkommenden verschiedenen Meßwerte sehr hoch ist. Legen wir die Regeln des vorigen Kapitels zugrunde, so ergibt sich für GROESSE die folgende klassierte (gruppierte) Verteilung: 25 2 15 5 121-125 126-13 131-135 136-14 141-145 146-15 151-155 156-16 161-165 166-17 171-175 Werteklasse Häufigkeit 121-125 8 126-13 3 131-135 119 136-14 25 141-145 176 146-15 73 151-155 23 156-16 5 161-165 1 171-175 1 641 Missing 1 651 Zu beachten ist, daß es in dieser klassierten Tabelle eine leere Werteklasse gibt (166-17), solche leeren ( unbesetzten ) Klassen werden meist in einer Häufigkeitstabelle nicht berücksichtigt - in Diagrammen allerdings sollten sie - der Übersichtlichkeit und Korrektheit halber -, enthalten sein. Wie klassiert man Daten in SPSS Die Prozedur, mit der Daten in SPSS zu Gruppen/Klassen zusammengefaßt werden, heißt RECODE und findet sich im Menü Transform. Nach Aufruf von RECODE (Untermenü into different variables ) steht folgende Eingabemaske bereit: Markieren Sie als Inputvariable GROESSE und klicken Sie auf den Pfeil. Dann geben Sie einen neuen Output-Variablen-Namen an (z.b. GROESSKL) und klicken auf Change. Danach wählen Sie den Menüpunkt Old and New Values, um die Klassengrenzen einzugeben. 5

Auf der linken Seite sind nun die alten Klassengrenzen einzugeben und auf der rechten Seite die neuen Werte für jede Klasse. * Klicken Sie links auf Range und geben Sie in die beiden Kästchen die Klassengrenzen für die erste Klasse (121 through 125) ein. * Geben Sie rechts unter New ValueŸValue den Wert 1 ein (für Klasse 1 ). * Klicken Sie dann auf Add, der Wert wird in eine Liste der Rekodierung aufgenommen. Wiederholen Sie diesen Vorgang für alle anderen Klassen. Dann sollte sich das folgende Bild ergeben: Wenn Sie alle 11 Klassen rekodiert haben (beim Rekodieren sollte kein numerisches Loch bleiben - vergessen Sie auch nicht, dem alten Wert system- or usermissing einen neuen Missing-Wert zuzuordnen, z.b. 999), klicken Sie auf Continue und auf OK und SPSS schafft am Ende der Datenmatrix eine neue Variable mit den klassierten Daten. Jeder Schüler in unserem Datenfile erhält einen Wert in dieser Variable, die seiner Zugehörigkeit zu den Klassen 1-11 entspricht. Beispiel: Ein Schüler mit dem Wert 152 in GROESSE erhält nun den Wert 7 in der neuen Variable GROES- SKL, ein Schüler mit 131 cm Körpergröße gehört zur Klasse 3 und erhält dementsprechend den Wert 3. Definieren Sie für diese neue Variable nun Typ, Labels und Missing Values. Wir haben deswegen die Variante Rekodieren in eine neue Variable gewählt, damit die ursprünglichen Daten nicht verlorengehen - falls wir beim Rekodieren einen Fehler gemacht haben, läßt er sich so ganz leicht wieder beheben. 6 Skriptum Deskriptive Statistik

FREQUENCIES - Absolute, relative und kumulierte Häufigkeiten Nach vollständiger Klassierung (Rekodierung) der Werte in GROESSE können wir nun SPSS veranlassen, uns eine vollständige Häufigkeitstabelle für unsere neue Variable GROESSKL zu berechnen und auszugeben. Der Befehl zur Erstellung einer Häufigkeitstabelle heißt FREQUENCIES und findet sich unter dem Menü StatisticsŸSummarizeŸFrequencies. Wenn Sie diese Prozedur aufrufen, bietet sich Ihnen die folgende Auswahl: Scrollen Sie mit den Pfeilen die Variablenliste hinunter, bis Sie den Namen GROESSKL finden - markieren Sie ihn und klicken Sie mit der Maus auf den Pfeil. Damit fügen Sie GROESSKL in die Liste der Variablen ein, von denen SPSS jetzt eine Häufigkeitstabelle anfertigen wird. Lassen Sie die anderen Menüpunkte diesmal noch unbeachtet und beenden Sie Ihre Auswahl, indem Sie auf OK klicken und damit den Rechenvorgang von SPSS starten. Die Berechnung geht in wenigen Zehntelsekunden vor sich. Wenn Sie die Rekodierung korrekt durchgeführt haben, dann sollte SPSS die folgende Häufigkeitstabelle ausgeben: In der 1.Spalte finden Sie die neuen Werte 1-11 zusammen mit den Labels (den Klassengrenzen). Die 2. Spalte ist mit Frequency überschrieben und enthält die abgezählten (absoluten) Häufigkeiten in jeder Klasse. Die 3. Spalte ( Percent ) enthält den prozentuellen Anteil (die relative Häufigkeit) jeder Klasse im Verhältnis zur Gesamtanzahl (% von 651). Die 4. Spalte ( Valid Percent ) enthält den prozentuellen Anteil jeder Klasse, wenn man die Missing-Werte außer acht läßt (% von 641). Valid Missing 1 121-125 2 126-13 3 131-135 4 136-14 5 141-145 6 146-15 7 151-155 8 156-16 9 161-165 11 171-175 999 Körpergröße / klassiert K rpergr sse / klassiert Valid Cumulative Frequency Percent Percent Percent 8 1,2 1,2 1,2 3 4,6 4,7 5,9 119 18,3 18,6 24,5 25 31,5 32, 56,5 176 27, 27,5 83,9 73 11,2 11,4 95,3 23 3,5 3,6 98,9 5,8,8 99,7 1,2,2 99,8 1,2,2, 641 98,5, 1 1,5 1 1,5 651, Mit FREQUENCIES erzeugte, vollständige Häufigkeitstabelle Die letzte Spalte ( Cumulative Percent ) enthält die Zeile für Zeile aufsummierten Valid Percent., d.h. in der zweite Zeile steht die Summe aus der 1. plus 2. Zeile, usw. Beispiel der Berechnung von relativen Häufigkeiten (Percent): 119 Schüler gehören der Größen-Klasse 3 (131-135 cm) an. Dividiert man nun diese Anzahl 119 durch ein Prozent der Gesamtanzahl (6,51) dann erhält man den Wert in Spalte 3: 18,3%. Den Valid-Percent-Wert erhält man, indem man 119 durch 6,41 dividiert (1% von 641 Schülern, ohne die 1 Missings), Ergebnis: 18.6 % (Spalte 4). 7

Häufigkeitstabellen lassen sich von jeder Variable anfertigen, gleichgültig welches Skalenniveau die Werte aufweisen. Ein weiteres Beispiel aus dem Übungsdatensatz SL.SAV, eine Häufigkeitstabelle der Variable DEUGS1 (Deutschnote in der 1.Klasse Volksschule): Valid Missing NOTE in DEUTSCH/im 1.GRUNDSCHULJAHR Grundschuljahr 1 2 3 4 5 999 Valid Cumulative Frequency Percent Percent Percent 22 33,8 35, 35, 221 33,9 35,1 7,1 118 18,1 18,8 88,9 52 8, 8,3 97,1 18 2,8 2,9, 629 96,6, 22 3,4 22 3,4 651, Das Ergebnis zeigt eine deutliche Ballung der Noten am oberen Ende, Einser und Zweier kommen praktisch gleich häufig vor und machen zusammen mehr als 2/3 der gesamten Werte aus (genauer 7.1%). Fünfer werden auf dieser Altersstufe nur in sehr seltenen Fällen vergeben - nur 18 Schüler, das sind 2.9% hatten in Deutsch einen Fleck in der 1.Klasse. Optionen bei Frequencies Wenn Sie das Auswahlfenster bei Frequencies betrachten, so offeriert Ihnen SPSS vor allem die beiden Optionen Charts... und Format... Die dritte Option Statistics besprechen wir näher erst im übernächsten Modul. Die Option Charts... Sie können zu jeder Häufigkeitstabelle automatisch ein Stabdiagramm, ein Tortendiagramm oder ein Histogramm ausgeben lassen, wobei Sie bei den beiden ersteren auch noch zwischen absoluten und relativen Häufigkeiten wählen können. NOTE in DEUTSCH/ im 1.GRUNDSCHULJAHR Pie Chart 3 Histogram Missing 5 4 1 2 3 2 Frequency 1, 2, 3, 4, 5, NOTE in DEUTSCH/ im 1.GRUNDSCHULJAHR Die Option Format... 4 Bar Chart Sie können hier auswählen, nach welchen Gesichtspunkten die einzelnen Werte sortiert in der Tabelle ausgegeben werden, nach auf- oder absteigender Größe der Meßwerte oder nach aufoder absteigender Anzahl der Häufigkeiten für jeden Meßwert. Außerdem lassen sich hier Häufigkeitstabellen abschalten für den Fall, daß sie mehr als 1 Kategorien/Klassen haben und daher etwas groß geraten könnten. Percent 3 2 1 1 2 3 NOTE in DEUTSCH/ im 1.GRUNDSCHULJAHR 4 5 8 Skriptum Deskriptive Statistik

ÜBUNGSFRAGEN UND PRAKTISCHE ÜBUNGEN zu Modul 4 Häufigkeiten und einfache Diagramme 1. Was bedeutet die Verteilung der Variablen x analysieren? 2. Welche drei grundsätzlichen Darstellungsformen der Verteilung von Meßwerten einer Variable gibt es? 3. Was heißt univariate Analyse? 4. Was versteht man unter der Urliste, was ist eine Häufigkeitstabelle? 5. Welche Variablen müssen klassiert (gruppiert) werden, damit sie übersichtlicher dargestellt werden können? 6. Welche Faustregeln gilt es bei der Festlegung der Klassenbreite und der Klassenanzahl zu beachten? 7. Übungsdatenfile SL.SAV: Suchen Sie die Variable IQTEST, lassen Sie sich Frequencies von der Original-Variable ausgeben und klassifizieren Sie zuerst auf einem Blatt die Variable sinnvoll. Führen Sie dann die entsprechende RECODE-Anweisung in SPSS durch (neue Variable IQTESTKL). Lassen Sie sich eine vollständige Häufigkeitstabelle der neuen Variable IQTESTKL ausgeben und interpretieren Sie die Zahlen. 8. Was sind absolute, relative und kumulierte Häufigkeiten und wie berechnet man sie? 9. Wodurch unterscheiden sich Percent und Valid Percent in einer Häufigkeitstabelle? 1. Ergänzen Sie in der folgenden Häufigkeitstabelle die fehlenden Ergebnisse: SCHULBILDUNG des Vaters (höchster Abschluß) Valid Missing 1 VOLKS/HAUPTSCH. 2 BERUFSSCHULE 3 BERUFSB.MITTL.SCHULE 4 Matura: BHS 5 Matura: AHS 999 Frequency 135 23 42 6,5 76,4 88, 551, Percent 651, Valid Percent Cumulative Percent 12. Erstellen Sie eine vollständige Häufigkeitstabelle der Variable KIGART, und drucken Sie dazu ein passendes Stab- und Tortendiagramm mit Prozenten aus. 13. Erzeugen Sie ein Histogramm der Häufigkeiten der Variablen GESCHW (Geschwisterzahl). Was unterscheidet ein Histogramm von einem Stabdiagramm? 14. Erzeugen Sie eine Häufigkeitstabelle von GESCHW und experimentieren Sie mit dem Output-Navigator: Verändern Sie die Spaltenbreiten, die Formatierung, die Anzahl der Spalten, usw. 9