Kapitel 34 Boxplots und Fehlerbalken



Ähnliche Dokumente
Zahlen auf einen Blick

Kapitel 33 Hoch-Tief-Diagramme

Kapitel 36 Streudiagramme

Einfache statistische Auswertungen mit dem Programm SPSS

Anleitung zur Verwendung der VVW-Word-Vorlagen

Word 2010 Grafiken exakt positionieren

Datenaufbereitung in SPSS. Daten zusammenfügen

Outlook. sysplus.ch outlook - mail-grundlagen Seite 1/8. Mail-Grundlagen. Posteingang

Erstellen von x-y-diagrammen in OpenOffice.calc

Dokumentation. estat Version 2.0

Excel Pivot-Tabellen 2010 effektiv

Stammdatenanlage über den Einrichtungsassistenten

Microsoft Access 2010 Navigationsformular (Musterlösung)

Wie Sie mit Mastern arbeiten

Lineargleichungssysteme: Additions-/ Subtraktionsverfahren

Anleitung zur Erstellung einer Gefährdungsbeurteilung

Word Aufbaukurs kompakt. Dr. Susanne Weber 1. Ausgabe, Oktober 2013 K-WW2013-AK

Kapitel 13 Häufigkeitstabellen

Animationen erstellen

Anwendungshinweise zur Anwendung der Soziometrie

Dokumentation IBIS Monitor

Um eine Person in Magnolia zu erfassen, gehen Sie wie folgt vor:

Inhaltsverzeichnis Grundlagen zu Diagrammen Ein Diagramm erstellen Diagrammtypen / -untertypen Säulendiagramm...

LEITFADEN ZUR SCHÄTZUNG DER BEITRAGSNACHWEISE

Die Textvorlagen in Microsoft WORD und LibreOffice Writer

4. Erstellen von Klassen

Professionelle Diagramme mit Excel 2013 erstellen. Sabine Spieß Themen-Special. 1. Ausgabe, Dezember 2013 W-EX2013DI

Handbuch ECDL 2003 Basic Modul 6: Präsentation Diagramm auf einer Folie erstellen

teamsync Kurzanleitung

4.1 Wie bediene ich das Webportal?

Kleine Einführung in die lineare Regression mit Excel

Excel Fortgeschrittene Techniken. Peter Wies. 1. Ausgabe, März 2013 EX2013F

Handbuch zum Statistiktool Pentaho Stand: Dezember 2013

1. Adressen für den Serienversand (Briefe Katalogdruck Werbung/Anfrage ) auswählen. Die Auswahl kann gespeichert werden.

Windows. Workshop Internet-Explorer: Arbeiten mit Favoriten, Teil 1

Professionelle Seminare im Bereich MS-Office

1 Einleitung. Lernziele. automatische Antworten bei Abwesenheit senden. Einstellungen für automatische Antworten Lerndauer. 4 Minuten.

Kreatives Gestalten mit Flash 5.0

3 gestapeltes säulendiagramm mit excel 2007 und 2010 realisieren

Angaben zu einem Kontakt...1 So können Sie einen Kontakt erfassen...4 Was Sie mit einem Kontakt tun können...7

Auf der linken Seite wählen Sie nun den Punkt Personen bearbeiten.

Zwischenablage (Bilder, Texte,...)

Lehrer: Einschreibemethoden

Wie halte ich Ordnung auf meiner Festplatte?

ECDL Europäischer Computer Führerschein. Jan Götzelmann. 1. Ausgabe, Juni 2014 ISBN

1. Allgemein Speichern und Zwischenspeichern des Designs Auswahl der zu bearbeitenden Seite Text ergänzen Textgrösse ändern 3

Access Grundlagen für Anwender. Andrea Weikert 1. Ausgabe, 1. Aktualisierung, Juli inkl. zusätzlichem Übungsanhang ACC2010-UA

Datentabelle für ein Diagramm in PowerPoint.

PowerPoint 2007 Folienmaster und Masterlayouts gestalten

Hinweise zum Übungsblatt Formatierung von Text:

Standard-Formatvorlagen in WORD und WRITER

Kurzanleitung JUNG Beschriftungs-Tool

Programme im Griff Was bringt Ihnen dieses Kapitel?

Gezielt über Folien hinweg springen

1 Möglichkeiten zur Darstellung von Daten

PowerPoint: Text. Text

Kurzanleitung. Kirschfestverein Naumburg e.v. t e c h n ische Abt e i lung. für Benutzer des CMS der Domain:

Laufende Auswertung von Feedback-Fragebögen Eine Vorlage zur Auswertung eines Fragebogens und die Präsentation erstellen...

Handbuch. NAFI Online-Spezial. Kunden- / Datenverwaltung. 1. Auflage. (Stand: )

Advance Steel Nachverfolgung von Änderungen während der Revisionsphasen im Projekt

1. Allgemeine Hinweise

Textgestaltung mit dem Editor TinyMCE Schritt für Schritt

FuxMedia Programm im Netzwerk einrichten am Beispiel von Windows 7

Microsoft Excel 2010 Mehrfachoperation

Anleitung zur Verwendung der VVW-Word-Vorlagen

Anleitung zur Erstellung von Serienbriefen (Word 2003) unter Berücksichtigung von Titeln (wie Dr., Dr. med. usw.)

Pfötchenhoffung e.v. Tier Manager

HOW TO Heat Mapping mit EasyMap

FTV 1. Semester. Spalte A Spalte B Spalte C Spalte D. Zeile 1 Zelle A1 Zelle B1 Zelle C1 Zelle D1. Zeile 3 Zelle A3 Zelle B3 Zelle C3 Zelle D3

Datenbanken Kapitel 2

TESTEN SIE IHR KÖNNEN UND GEWINNEN SIE!

UMSTELLUNG DER RÖNTGEN-SCHNITTSTELLE DÜRR-DBSWIN AUF DÜRR-VDDS

Berechnung der Erhöhung der Durchschnittsprämien

So gehts Schritt-für-Schritt-Anleitung

! Tipps und Tricks Sie können den Windows Explorer am einfachsten mit der Tastenkombination Windows+ E öffnen.

Einfache statistische Auswertungen mit dem TI-Nspire

Auswerten mit Excel. Viele Video-Tutorials auf Youtube z.b.

Vorgehensweise bei Lastschriftverfahren

Vermögensbildung: Sparen und Wertsteigerung bei Immobilien liegen vorn

Diagramme. Excel Aufbau ZID/Dagmar Serb V.02/Okt 2015

6. Benutzerdefinierte Zahlenformate

Erstellen und Bearbeiten von Inhalten (Assets)

Suche schlecht beschriftete Bilder mit Eigenen Abfragen

Histogramm und Wahrscheinlichkeitsnetz 1/16

HANDBUCH PHOENIX II - DOKUMENTENVERWALTUNG

ACDSee 10. ACDSee 10: Fotos gruppieren und schneller durchsuchen. Was ist Gruppieren? Fotos gruppieren. Das Inhaltsverzeichnis zum Gruppieren nutzen

Kapitel 17 Mehrfachantworten

Handbuch ECDL 2003 Professional Modul 1: Textverarbeitung Absätze formatieren

Da die Bedienung des Editors viele Möglichkeiten aufweist, aber auch etwas Übung voraussetzt, haben wir ihm ein eigenes Unterkapitel gewidmet.

MS Excel 2010 Kompakt

WinWerk. Prozess 6a Rabatt gemäss Vorjahresverbrauch. KMU Ratgeber AG. Inhaltsverzeichnis. Im Ifang Effretikon

Excel Allgemeine Infos

Last-Bibliothek. Inhaltsverzeichnis

FH-SY Chapter Version 3 - FH-SY.NET - FAQ -

Outlook und Outlook Express

So geht s Schritt-für-Schritt-Anleitung

Mediator 9 - Lernprogramm

HANDBUCH FÜR WORD-VORLAGE

1 PIVOT TABELLEN. 1.1 Das Ziel: Basisdaten strukturiert darzustellen. 1.2 Wozu können Sie eine Pivot-Tabelle einsetzen?

Microsoft Access 2013 Navigationsformular (Musterlösung)

Transkript:

Kapitel 34 Boxplots und Fehlerbalken Boxplots und Fehlerbalken sind dazu geeignet, die Lage und Verteilung der Werte einer Stichprobe grafisch darzustellen. Die beiden Diagrammtypen sind auf die Darstellungen folgender Informationen ausgerichtet: ¾ Boxplots: Ein Boxplot beschreibt die Verteilung der Werte. Es stellt die Quartile, extreme Werte und Ausreißer sowie den größten und den kleinsten nicht extremen Wert dar. Extrem große Werte bzw. Ausreißer nach oben sind dadurch gekennzeichnet, daß ihr Abstand zum 75%-Perzentil größer ist als das 1,5fache des Abstands zwischen dem 75%- und dem 25%-Perzentil. Extrem kleine Werte bzw. Ausreißer werden entsprechend an ihrem Abstand zum 25%-Perzentil gemessen. ¾ Fehlerbalken: Fehlerbalkendiagramme kennzeichnen die Lage des Mittelwerts einer Stichprobe und enthalten zudem Angaben über die geschätzte Lage des Mittelwertes in der Grundgesamtheit. Dabei kann wahlweise ein Konfidenzintervall für den Mittelwert der Grundgesamtheit, der Standardfehler des Mittelwertes oder die Standardabweichung dargestellt werden. 34.1 Boxplots 34.1.1 Einfaches Boxplot Boxplots bieten eine schnelle Übersicht über die Verteilung der Werte einer Stichprobe und sind insbesondere gut geeignet, die Verteilungen mehrerer (Teil-)Stichproben miteinander zu vergleichen. Daher kommen Boxplots häufig im Rahmen der Datenprüfung bereits vor dem Ausführen statistischer Prozeduren zur Anwendung, da Boxplots auch Hinweise auf mögliche Ausreißer und unplausible Werte in einer Stichprobe liefern. Dies ist auch der Grund dafür, daß Boxplots bei SPSS nicht nur mit dem Befehl GRAFIKEN BOXPLOT...

874 Kapitel 34 Boxplots und Fehlerbalken erstellt werden können, sondern auch bei der Prozedur EXPLORATIVE DA- TENANALYSE als Option angeboten werden. 385 Im folgenden soll in einem Boxplot-Diagramm die Verteilung des Nettoeinkommens der im Rahmen der ALLBUS-Umfrage 386 befragten Personen getrennt für die neuen und die alten Bundesländer dargestellt werden. Ein solches Diagramm wird mit den folgenden Einstellungen erzeugt: ¾ Daten: Die Datengrundlage bildet die Datei allbus.sav von der Begleit-CD. Die Fälle in dieser Datei müssen mit der Variablen v434 gewichtet werden. 387 ¾ Befehl: Um ein Boxplot-Diagramm zu erstellen, wählen Sie den Befehl GRAFIKEN BOXPLOT... ¾ Diagrammtyp: Der Befehl hat das Dialogfeld Boxplots geöffnet, in dem der genaue Diagrammtyp bestimmt wird. Wählen Sie hier die Optionen Einfach und Auswertung über Kategorien einer Variablen. Klicken Sie anschließend auf die Schaltfläche Definieren, die ein weiteres Dialogfeld öffnet. ¾ Beschreibung des Diagramms: Fügen Sie in dem nun geöffneten Dialogfeld die Variable v261 (Nettoeinkommen der/des Befragten) in das Feld Variable und v3 (Erhebungsgebiet: Ost-West) in das Feld Kategorienachse ein. Weitere Angaben sind nicht erforderlich, so daß das in Abbildung 34.1 wiedergegebene Diagramm mit der Schaltfläche OK erstellt werden kann. Die Grafik gibt jeweils für die neuen und die alten Bundesländer die Verteilung der Nettoeinkommen der befragten Personen wieder. Für jede der beiden Gruppen werden die Quartile, der größte und der kleinste nicht-extreme Wert sowie Ausreißer und extreme Werte dargestellt. Abbildung 34.2 skizziert die Bedeutung der Symbole am Beispiel des Boxplots für die alten Bundesländer. Die graue Box repräsentiert den Bereich der 50% mittleren Werte. Dies sind die Werte zwischen dem 25%- und dem 75%-Perzentil. Der Median, also das 50%-Perzentil, wird durch den schwarzen Strich innerhalb der Box dargestellt. Die horizontal verlaufenden Striche über und unter der Box kennzeichnen den größten und den kleinsten Wert, der nicht als extremer Wert oder als Ausreißer klassifiziert wird. Ausreißer werden durch kleine Kreise, extreme Werte durch Sternchen dargestellt. Ausreißer und extreme Werte sind folgendermaßen definiert: 388 385 Zur Explorativen Datenanalyse siehe Kapitel 15, Explorative Datenanalyse. 386 Zu den Daten der Begleit-CD siehe im einzelnen Kapitel 1, Überblick. 387 Zum Gewichten der Daten rufen Sie den Befehl DATEN, FÄLLE GEWICHTEN auf. Dieser Befehl öffnet ein Dialogfeld, in dem Sie die Option Fälle gewichten mit wählen und die Variable v434 in das Feld Häufigkeitsvariable verschieben müssen. Anschließend können Sie das Dialogfeld mit der Schaltfläche OK schließen. 388 Die folgenden Definitionen gelten für die Boxplots bei SPSS, stellen jedoch keine allgemeingültigen Definitionen von Ausreißern und Extremen Werten dar.

34.1 Boxplots 875 ¾ Ausreißer: Ausreißer sind Werte, deren Abstand vom 25%-Perzentil nach unten bzw. vom 75%-Perzentil nach oben zwischen dem 1,5fachen und dem 3fachen der Boxhöhe liegt. Die Boxhöhe gibt den Abstand zwischen dem 25%- und dem 75%-Perzentil wieder. ¾ Extreme Werte: Der Abstand extremer Werte von dem 25%- oder dem 75%- Perzentil beträgt mehr als das Dreifache der Boxhöhe. 12000 10000 305 674 826 8000 810 999 301 295 185 192 112 788 6000 238 98 198 BEFR.: NETTOEINKOMMEN 4000 2000 0-2000 N = 419 755 664 1051 995 123 ALTE BUNDESLAENDER NEUE BUNDESLAENDER ERHEBUNGSGEBIET: WEST - OST Analyse gewichtet nach V434 Abbildung 34.1: Einfaches Boxplot-Diagramm für die Verteilung des Nettoeinkommens in den alten und den neuen Bundesländern Sowohl in den neuen als auch in den alten Bundesländern wurden lediglich extreme Werte und Ausreißer beobachtet, die nach oben von den übrigen Werten abweichen. Besonders niedrige Werte, die so stark nach unten abweichen, daß sie als Ausreißer oder gar als extremer Wert klassifiziert werden, sind dagegen nicht in der Stichprobe enthalten. Die Zahlen, die neben den Ausreißern und extremen Werten angezeigt werden, geben die Nummern der Fälle wieder, in denen die entsprechenden Werte enthalten sind. Liegen die einzelnen Werte sehr nahe beieinander, überdecken sich die Symbole und Beschriftungen, so daß sie nicht immer gut zu erkennen sind. Dies ist zum Beispiel in dem Boxplot für die alten Bundesländer bei verschiedenen Ausreißern und extremen Werten der Fall. Wenn Sie das Diagramm im Grafikeditor öffnen, können Sie das Werkzeug Punkt identifizieren verwenden, um eine

876 Kapitel 34 Boxplots und Fehlerbalken Liste der zu einer Markierung gehörenden Fälle einblenden zu lassen. 389 Die Beschriftung der extremen Werte und der Ausreißer mit den Fallnummern entspricht der Voreinstellung, alternativ können Sie die Beobachtungen jedoch auch mit den Werten einer Variablen aus der Datendatei beschriften lassen. Hierzu wird beim Erstellen der Grafik die zur Beschriftung zu verwendende Variable angegeben. 390 Zudem besteht die Möglichkeit, nachträglich im Grafikeditor die Beschriftungen sowie generell die Anzeige von extremen Werten und Ausreißern auszuschalten. 391 Die beiden Zahlen, die direkt unter der horizontalen Achse ausgewiesen werden, geben die Anzahl der Fälle wieder, die in ein Boxplot eingegangen sind. Das Boxplot für die neuen Bundesländer basiert damit auf 123 Beobachtungen, das der alten Länder auf 419. In einer Fußnote wird allerdings darauf hingewiesen, daß dem Diagramm gewichtete Daten zugrundeliegen, wobei sich die Gewichte auch auf die ausgewiesenen Beobachtungen auswirken. Die Anzeige der Fallzahlen können Sie beim Bearbeiten eines Boxplots im Grafikeditor ausschalten. 392 Extreme Werte Ausreißer Größter nicht-extremer Wert 75%-Perzentil 50%-Perzentil (Median) 25%-Perzentil Kleinster nicht-extremer Wert Abbildung 34.2: Bedeutung der Symbole in einem Boxplot 34.1.2 Gruppiertes Boxplot Abbildung 34.3 zeigt ein gruppiertes Boxplot-Diagramm, das ebenfalls die Verteilung des Nettoeinkommens der Befragten aus der ALLBUS-Umfrage darstellt. Dabei wird jedoch nicht nur zwischen den beiden Erhebungsgebieten Alte Bun- 389 Siehe hierzu im einzelnen Abschnitt 36.7.2, Punkt identifizieren, S. 935. 390 Siehe hierzu Aufzählungspunkt Fallbeschriftung, S. 885. 391 Wählen Sie hierzu im Grafikeditor den Befehl DIAGRAMME, OPTIONEN. Die für Boxplots zur Verfügung stehenden Optionen sind im Abschnitt 34.5.1, Optionen für Boxplots, S. 893 beschrieben. 392 Verwenden Sie hierzu im Grafikeditor den Befehl DIAGRAMME, OPTIONEN, siehe auch Abschnitt 34.5.1, Optionen für Boxplots, S. 893.

34.1 Boxplots 877 desländer und Neue Bundesländer, sondern innerhalb der Erhebungsgebiete zudem zwischen Männern und Frauen unterschieden. Die abgebildete Grafik wurde mit den folgenden Einstellungen erzeugt: ¾ Daten: Die Datengrundlage bildet wieder die Datei allbus.sav von der Begleit- CD, wobei die Fälle auch hier mit der Variablen v434 gewichtet sind. 393 ¾ Befehl: Wählen Sie zum Erstellen des Diagramms den Befehl GRAFIKEN BOXPLOT... ¾ Diagrammtyp: Zur Beschreibung des Diagrammtyps werden in dem Dialogfeld Boxplots die Optionen Gruppiert und Auswertung über Kategorien einer Variablen gewählt. ¾ Beschreibung des Diagramms: Verschieben Sie in dem Dialogfeld zur Beschreibung des Diagramms die Variable v261 (Nettoeinkommen der/des Befragten) in das Feld Variable, v3 (Erhebungsgebiet: Ost-West) in das Feld Kategorienachse und v141 (Geschlecht der/des Befragten) in das Feld Gruppen definieren durch. Weitere Einstellungen werden nicht vorgenommen. Die beschriebenen Einstellungen werden in dem Dialogfeld aus Abbildung 34.7, S. 884 dargestellt. 12000 10000 305 674 826 8000 810 295 185 999 301 788 192 112 6000 98 238 BEFR.: NETTOEINKOMMEN 4000 2000 0-2000 N = 242 488 800 154 178 57 755 664 995 66 1051 Geschlecht Mann Frau ALTE BUNDESLAENDER NEUE BUNDESLAENDER ERHEBUNGSGEBIET: WEST - OST Analyse gewichtet nach V434 Abbildung 34.3: Gruppiertes Boxplot-Diagramm für die Verteilung des Nettoeinkommens in den alten und den neuen Bundesländern, jeweils getrennt für Männer und Frauen 393 Zum Gewichten der Daten vgl. Fn. 387, S. 874.

878 Kapitel 34 Boxplots und Fehlerbalken Für die neuen und die alten Bundesländer werden nun jeweils zwei Boxplots angezeigt, von denen sich eines auf die Männer und das andere auf die Frauen des jeweiligen Erhebungsgebiets bezieht. 394 In der Grafik ist zu erkennen, daß die Einkommensverteilung der neuen Bundesländer deutlich unter der Verteilung für das alte Bundesgebiet liegt. Zudem ist die Streuung der Werte in den neuen Ländern deutlich geringer. Innerhalb jedes dieser beiden Gebiete gilt wiederum, daß die Frauen niedrigere Einkommenswerte aufweisen als die Männer und die Einkommen der Frauen auch weniger stark streuen. So wurde weder in den neuen noch in den alten Bundesländern bei den Frauen ein extremer Wert beobachtet, während bei den Männern in beiden Erhebungsgebieten extrem große Werte auftraten. 34.2 Fehlerbalken Fehlerbalkendiagramme kennzeichnen die Lage des Mittelwerts einer Stichprobe und enthalten zudem Angaben über die wahrscheinliche Lage des Mittelwerts in der Grundgesamtheit. Hierzu kann ein Konfidenzintervall für den Mittelwert der Grundgesamtheit, der Standardfehler des Mittelwerts oder die Standardabweichung in der Grafik dargestellt werden. Dabei läßt sich das Niveau des Konfidenzintervalls frei bestimmen. Die Standardabweichung sowie der Standardfehler können für die Darstellung in der Grafik mit einem beliebigen Faktor multipliziert werden. 34.2.1 Einfache Fehlerbalken mit dem Konfidenzintervall Das Fehlerbalkendiagramm aus Abbildung 34.4 bezieht sich wie die Boxplots im vorhergehenden Abschnitt auf das Nettoeinkommen der Befragten aus der ALL- BUS-Umfrage, wobei auch hier die Ergebnisse für die neuen und die alten Bundesländer gegenübergestellt werden. Das abgebildete Diagramm wurde mit den folgenden Einstellungen erzeugt: ¾ Daten: Die Daten entstammen der Datei allbus.sav von der Begleit-CD, wobei die Fälle auch hier mit der Variablen v434 gewichtet sind. 395 ¾ Befehl: Zum Erstellen von Fehlerbalkendiagrammen dient der Befehl GRAFIKEN FEHLERBALKEN... ¾ Diagrammtyp: Zur Beschreibung des Diagrammtyps werden in dem Dialogfeld Fehlerbalken die Optionen Einfach und Auswertung über Kategorien einer Variablen gewählt. Klicken Sie anschließend auf die Schaltfläche Definieren, mit der Sie ein weiteres Dialogfeld öffnen. 394 In der abgebildeten Grafik wurden im Grafikeditor geringfügige Änderungen an den Beschriftungen vorgenommen. 395 Zum Gewichten der Daten vgl. Fn. 387, S. 874.

34.2 Fehlerbalken 879 ¾ Beschreibung des Diagramms: Verschieben Sie in dem nun geöffneten Dialogfeld die Variable v261 (Nettoeinkommen der/des Befragten) in das Feld Variable und v3 (Erhebungsgebiet: Ost-West) in das Feld Kategorienachse. Bei den übrigen Optionen werden die Voreinstellungen verwendet. Dies bedeutet insbesondere, daß in der Dropdown-Liste Bedeutung der Balken die Option Konfidenzintervall für Mittelwert ausgewählt ist und das Feld Niveau den Wert 95 aufweist. 2800 2600 2400 95% CI BEFR.: NETTOEINKOMMEN 2200 2000 1800 1600 1400 N = 419 123 ALTE BUNDESLAENDER NEUE BUNDESLAENDER ERHEBUNGSGEBIET: WEST - OST Fälle gewichtet nach V434 Abbildung 34.4: Einfaches Fehlerbalkendiagramm mit dem 95%-Konfidenzintervall des Mittelwerts für das Nettoeinkommen der Befragten aus den alten und den neuen Ländern Für die alten und die neuen Länder wird jeweils ein Fehlerbalken in der Grafik angezeigt. Die Quadrate beschreiben die Lage der Stichprobenmittelwerte, also die durchschnittlichen Nettoeinkommen der Befragten aus den neuen und den alten Ländern. 396 Damit beträgt das durchschnittliche Nettoeinkommen der Befragten aus den alten Bundesländern etwas über 2.600 DM, während der entsprechende Wert für die neuen Länder nur knapp über 1.600 DM liegt. Der senkrechte Strich, der oben und unten jeweils durch einen Querbalken begrenzt wird, stellt 396 In diesem Zusammenhang ist zu beachten, daß in der Grafik nur solche Personen berücksichtigt werden, für die eine gültige und positive Einkommensangabe vorliegt. Befragte ohne eigenes Einkommen wurden dagegen aus der Betrachtung ausgeschlossen, da die entsprechenden Werte in der Datendatei als fehlende Werte gekennzeichnet sind.

880 Kapitel 34 Boxplots und Fehlerbalken das 95%-Konfidenzintervall für den Mittelwert in der Grundgesamtheit dar. Dies bedeutet, daß der Mittelwert in der Grundgesamtheit mit einer Wahrscheinlichkeit von 95% in dem Bereich zwischen den beiden Querbalken liegt. Für die alten Bundesländer läßt sich somit aus den Stichprobenwerten schließen, daß das durchschnittliche Nettoeinkommen in der Grundgesamtheit mit 95%iger Wahrscheinlichkeit etwa zwischen 2.250 DM und 2.600 DM liegt. Der entsprechende Bereich für die neuen Länder erstreckt sich dagegen ungefähr von 1.300 DM bis 1.750 DM. Das Niveau des Intervalls konnte beim Erstellen der Grafik frei gewählt werden. Anstatt des 95%-Konfidenzintervalls hätte also auch der Bereich angezeigt werden können, in dem die Mittelwerte in der Grundgesamtheit mit einer Wahrscheinlichkeit von 99% oder einer Wahrscheinlichkeit von 90% liegen. 34.2.2 Gruppierte Fehlerbalken mit dem Standardfehler Abbildung 34.5 zeigt ein gruppiertes Fehlerbalkendiagramm, in dem die Fehlerbalken nicht das Konfidenzintervall, sondern den Standardfehler eines Mittelwerts darstellen. Inhaltlich wird wieder das Nettoeinkommen der Befragten aus der ALLBUS-Umfrage betrachtet, wobei nicht nur zwischen den neuen und den alten Bundesländern, sondern innerhalb jedes dieser beiden Gebiete zudem zwischen Männern und Frauen unterschieden wird, wodurch die Gruppierung in der Grafik zustande kommt. Zum Erstellen der Grafik sind die folgenden Schritte erforderlich: ¾ Daten: Die Datengrundlage bildet wieder die Datei allbus.sav von der Begleit- CD, wobei die Fälle auch hier mit der Variablen v434 gewichtet sind. 397 ¾ Befehl: Zum Erstellen von Fehlerbalken dient der Befehl GRAFIKEN FEHLERBALKEN... ¾ Diagrammtyp: In dem Dialogfeld Fehlerbalken werden die Optionen Gruppiert und Auswertung über Kategorien einer Variablen gewählt. ¾ Beschreibung des Diagramms: Verschieben Sie in dem Dialogfeld zur Beschreibung des Diagramms die Variable v261 (Nettoeinkommen der/des Befragten) in das Feld Variable, v3 (Erhebungsgebiet: Ost-West) in das Feld Kategorienachse und v141 in das Feld Gruppen definieren durch. Aus der Dropdown-Liste Bedeutung der Balken wird der Eintrag Standardfehler des Mittelwerts gewählt und in das Feld Multiplikator der Wert 1 eingegeben. Anschließend kann mit der Schaltfläche OK das Diagramm aus Abbildung 34.5 erstellt werden. Abbildung 34.10, S. 889 zeigt das Dialogfeld mit den Einstellungen, die für dieses Diagramm verwendet wurden. 397 Zum Gewichten der Daten vgl. Fn. 387, S. 874.

34.2 Fehlerbalken 881 4000 Mittelwert +- 1 SE BEFR.: NETTOEINKOMMEN 3000 2000 1000 N = 242 178 57 66 Geschlecht Mann Frau ALTE BUNDESLAENDER NEUE BUNDESLAENDER ERHEBUNGSGEBIET: WEST - OST Fälle gewichtet nach V434 Abbildung 34.5: Gruppiertes Fehlerbalkendiagramm mit dem Standardfehler des Mittelwerts für das Nettoeinkommen der Befragten aus den alten und den neuen Ländern, jeweils getrennt für Männer und Frauen Für die neuen und die alten Bundesländer werden jeweils zwei Fehlerbalken dargestellt, von denen sich einer auf die Männer (grauer Balken) und einer auf die Frauen (schwarzer Balken) des jeweiligen Gebiets bezieht. Im Gegensatz zum Fehlerbalkendiagramm aus Abbildung 34.4 beschreibt die Höhe der Balken in dieser Grafik jedoch nicht das Konfidenzintervall des Mittelwerts, sondern dessen Standardfehler. Dabei wird zu jeder Seite des Mittelwerts der volle Standardfehler abgetragen, die gesamte Höhe eines Fehlerbalkens entspricht damit dem doppelten des Standardfehlers. 398 Standardfehler des Mittelwerts Bei der Ziehung einer Stichprobe wird im allgemeinen aus einer sehr großen Grundgesamtheit eine vergleichsweise geringe Anzahl von Fällen zufällig ausgewählt. Wird anschließend für eine Variable der Stichprobenmittelwert berechnet, ist es möglich und wahrscheinlich, daß dieser Mittelwert nicht exakt mit dem ent- 398 Dies gilt, weil beim Erstellen der Grafik ein Multiplikator von 1 festgelegt wurde. Wäre der voreingestellte Multiplikator von 2 beibehalten worden, würde der Fehlerbalken zu jeder Seite des Mittelwerts das Doppelte des Standardfehlers abtragen.

882 Kapitel 34 Boxplots und Fehlerbalken sprechenden Mittelwert der Grundgesamtheit übereinstimmt, sondern mehr oder weniger stark von diesem abweicht. Zudem ist zu erwarten, daß sich nach der Ziehung einer zweiten Stichprobe mit gleich vielen Fällen aus derselben Grundgesamtheit für diese ein etwas anderer Mittelwert der betrachteten Variablen ergibt als bei der ersten Stichprobe. Bei der Ziehung weiterer Stichproben können sich wiederum leicht abweichende Mittelwerte ergeben, so daß die unterschiedlichen Mittelwerte der einzelnen Stichproben in ihrer Gesamtheit mehr oder weniger stark um den wahren Mittelwert der Grundgesamtheit streuen. Der Standardfehler des Mittelwerts ist nun ein Maß für die Stärke dieser Streuung der Stichprobenmittelwerte um den Mittelwert der Grundgesamtheit. Da die Streuung der Mittelwerte nicht beobachtet werden kann - denn im allgemeinen werden nicht zahlreiche unterschiedliche Stichproben gezogen, für die anschließend die Mittelwerte einer Variablen berechnet werden können, sondern es liegt nur eine einzige Stichrobe vor -, wird sie durch den Standardfehler geschätzt. Dieser wird berechnet aus der Standardabweichung der betrachteten Variablen in der Stichprobe, dividiert durch die Quadratwurzel der Stichprobengröße (Anzahl der Fälle in der Stichprobe): Standardfehler für den Mittelwert der Variablen X = S X = Dabei bezeichnet X den Mittelwert der Variablen X, S die Standardabweichung dieser Variablen und N die Anzahl der Fälle in der Stichprobe. Je geringer der Standardfehler des Mittelwerts ist, desto präziser und zuverlässiger sind die Rückschlüsse, die aufgrund der Stichprobenergebnisse auf die Grundgesamtheit gezogen werden können. Aus der Formel für den Standardfehler wird unmittelbar deutlich, daß dieser mit zunehmender Stichprobengröße abnimmt. Dies ist ein Grund dafür, daß sich auf der Grundlage großer Stichproben - unter sonst gleichen Umständen - zuverlässigere und exaktere Aussagen über die Grundgesamtheit treffen lassen, als es mit kleineren Stichproben möglich ist. S N 34.3 Erstellen von Boxplots 34.3.1 Übersicht Um ein einfaches oder ein gruppiertes Boxplot-Diagramm zu erstellen, wählen Sie den Befehl GRAFIKEN BOXPLOT... Dieser Befehl öffnet zunächst das in Abbildung 34.6 dargestellte Dialogfeld, in dem Sie die Art der darzustellenden Werte angeben und zwischen einfachem und gruppiertem Boxplot wählen können.

34.3 Erstellen von Boxplots 883 Abbildung 34.6: Dialogfeld des Befehls GRAFIKEN, BOXPLOT Durch die 2 2 Optionen können sich vier unterschiedliche Kombinationen von Diagrammtyp und Art der darzustellenden Werte ergeben, deren Bedeutung im folgenden kurz beschrieben wird, bevor die beiden Abschnitte 34.3.2, Boxplots für Kategorien einer Variablen erstellen, und 34.3.3, Boxplots für verschiedene Variablen erstellen, S. 885 auf das Erstellen der Boxplots getrennt für die beiden Arten der darzustellenden Werte eingehen. Einfache Boxplots ¾ Auswertung über Kategorien einer Variablen: Es wird eine Variable angegeben, für deren Werte die Verteilung durch die Boxplots dargestellt werden soll. Zusätzlich wird eine gruppierende Variable ausgewählt, durch deren unterschiedliche Werte die Fälle der Datendatei in Gruppen unterteilt werden. Für jede dieser Fallgruppen (Kategorien) wird in dem Diagramm ein eigenes Boxplot mit der Verteilung der Werte aus der ersten Variablen erstellt. ¾ Auswertung über verschiedene Variablen: Für jedes in der Grafik darzustellende Boxplot wird eine Variable angegeben. Die Boxplots in der Grafik stellen dann die Verteilungen der einzelnen Variablen dar. Gruppierte Boxplots ¾ Auswertung über Kategorien einer Variablen: Ein Diagramm wird hierbei durch insgesamt drei Variablen definiert. Eine Variable enthält die Werte, deren Verteilungen dargestellt werden sollen, eine zweite Variable unterteilt die Fälle der Datei in einzelne Fallgruppen (Kategorien), und eine dritte Variable unterteilt die Fallgruppen weiter in verschiedene Untergruppen. Für jede Falluntergruppe aus jeder Kategorie wird jeweils ein Boxplot für die Verteilung der Werte aus der ersten Variablen erstellt. Dabei erscheinen die Boxplots der verschiedenen Untergruppen einer Kategorie in der Grafik gruppiert nebeneinander. ¾ Auswertung über verschiedene Variablen: Es werden zwei oder mehr Variablen angegeben, für deren Werte die Verteilung durch Boxplots dargestellt werden soll. Mit einer zweiten Variablen werden die Fälle der Datei in einzel-

884 Kapitel 34 Boxplots und Fehlerbalken ne Fallgruppen (Kategorien) unterteilt. Für jede der auszuwertenden Variablen wird für die verschiedenen Fallgruppen jeweils ein Boxplot erstellt. Das Erstellen gruppierter Boxplots unterscheidet sich nur unwesentlich von der Vorgehensweise für einfache Diagramme. Ein größerer Unterschied besteht dagegen zwischen Grafiken für verschiedene Kategorien einer Variablen und Grafiken für verschiedene Variablen. Daher wird das Erstellen einfacher und gruppierter Boxplots jeweils gemeinsam für die beiden unterschiedlichen Arten darzustellender Werte erläutert. Für Boxplots können Sie anders als bei den meisten anderen Diagrammtypen beim Erstellen der Grafik weder Titel angeben noch die Grafikformate einer anderen Datei übernehmen. Allerdings besteht wie bei allen Diagrammen die Möglichkeit, Titel, Untertitel und Fußzeilen nachträglich im Grafikeditor in das bestehende Diagramm einzufügen. Ebenso können Sie dort auf das bestehende Diagramm die Formatierungen eines anderen Diagramms übertragen. 34.3.2 Boxplots für Kategorien einer Variablen erstellen Das Dialogfeld für gruppierte Boxplots weist gegenüber dem Dialogfeld des einfachen Diagramms lediglich ein zusätzliches Feld für die gruppierende Variable auf. Abbildung 34.7 gibt das Dialogfeld eines gruppierten Boxplots für verschiedene Kategorien einer Variablen wieder. Es stellt die Angaben für das Diagramm aus Abbildung 34.3, S. 877 dar. Das Feld Gruppen definieren durch wird in einem Dialogfeld einfacher Boxplots nicht angezeigt. Abbildung 34.7: Dialogfeld zum Erstellen eines gruppierten Boxplot-Diagramms für die Auswertung über Kategorien einer Variablen Die Variablenliste führt alle Variablen der Datendatei auf. Zur Definition der Kategorien und Gruppen sowie für die Fallbeschriftung können Sie sowohl numerische als auch lange und kurze Textvariablen verwenden. Die Variable, deren Werteverteilung durch die Boxplots beschrieben werden soll, muß natürlich ein numerisches Datenformat aufweisen. Nehmen Sie in dem Dialogfeld die folgenden Einstellungen vor:

34.3 Erstellen von Boxplots 885 ¾ Quellvariable angeben: Geben Sie in dem Feld Variable eine numerische Variable an, für deren Werte die Verteilungen durch die Boxplots dargestellt werden sollen. ¾ Kategorien definieren: Geben Sie in dem Feld Kategorienachse eine Variable zur Definition der Kategorien an. Die verschiedenen Werte dieser Variablen unterteilen die Fälle der Datendatei in Fallgruppen (Kategorien). Bei einem einfachen Boxplot wird für jede der Kategorien eine Box erstellt. In einem gruppierten Boxplot werden die Kategorien durch eine weitere Variable noch einmal in Untergruppen aufgeteilt, und es wird für jede der Untergruppen jeweils eine Box pro Kategorie erzeugt. ¾ Gruppen definieren: Das Dialogfeld gruppierter Boxplots enthält das Feld Gruppen definieren durch. Geben Sie in diesem Feld eine Variable zur Definition der Gruppen an. Durch die verschiedenen Werte dieser Variablen werden die einzelnen Kategorien (Fallgruppen in der Datendatei) erneut in Untergruppen aufgeteilt. Für jede dieser Untergruppen wird ein Boxplot pro Kategorie für die Verteilung der Werte aus der Quellvariablen dargestellt. ¾ Fallbeschriftung: Damit Sie Ausreißer und extreme Werte in der Datendatei identifizieren können, werden diese per Voreinstellung mit den Fallnummern aus der Datendatei beschriftet. Alternativ können Sie jedoch auch die Werte einer Variablen für die Beschriftung verwenden. Geben Sie hierzu den Namen der Variablen in dem Feld Fallbeschriftung an. 399 ¾ Optionen: Fehlende Werte. Fehlende Werte in der Kategorienvariablen oder der Gruppenvariablen bilden per Voreinstellung eine eigene Kategorie bzw. Gruppe. Dabei werden alle benutzer- und systemdefinierten fehlenden Werte jeweils zu einer Kategorie oder Gruppe zusammengefaßt. In dem Dialogfeld der Schaltfläche Optionen können Sie diese Berücksichtigung fehlender Werte ausschalten, indem Sie die Option Fehlende Werte als Kategorie anzeigen abwählen. Fälle mit fehlenden Werte in einer der verwendeten Variablen (mit Ausnahme der Variablen für die Fallbeschriftung) bleiben dann in der Grafik unberücksichtigt. 34.3.3 Boxplots für verschiedene Variablen erstellen Auch bei Boxplots für verschiedene Variablen unterscheiden sich die Dialogfelder für einfache und für gruppierte Diagramme lediglich darin, daß für gruppierte Diagramme ein zusätzliches Feld für eine gruppierende Variable vorgesehen ist. Abbildung 34.8 gibt das Dialogfeld zum Erstellen eines gruppierten Boxplots für verschiedene Variablen wieder. 399 Wenn Sie eine Variable für die Fallbeschriftung angeben, können Sie im Grafikeditor mit dem Befehl DIAGRAMM, OPTIONEN wieder zur Beschriftung mit den Fallnummern wechseln. Ebenso können Sie dort die Beschriftung vollkommen ausschalten. Siehe hierzu auch Abschnitt 34.5.1, Optionen für Boxplots, S. 893.

886 Kapitel 34 Boxplots und Fehlerbalken Abbildung 34.8: Dialogfeld zum Erstellen eines gruppierten Boxplots für verschiedene Variablen Die Variablenliste enthält alle Variablen der Datendatei. Zur Definition der Kategorien sowie für die Fallbeschriftung können Sie sowohl numerische als auch kurze und lange Textvariablen verwenden. Nehmen Sie zum Erstellen eines Diagramms folgende Angaben vor: ¾ Quellvariablen angeben: Geben Sie in dem Listenfeld Box entspricht die Variablen an, für deren Werte die Verteilungen dargestellt werden soll. In einem einfachen Boxplot wird für jede Variable eine Box erstellt. In gruppierten Plots werden die Fälle der Datendatei in Gruppen unterteilt. Für jede Variable wird jeweils die Verteilung der Werte in den einzelnen Fallgruppen durch eine Box beschrieben. Die Anzahl der Boxen ergibt sich damit aus der Zahl der Variablen, multipliziert mit der Anzahl der Gruppen. Sie müssen in dem Feld Box entspricht mindestens zwei Variablen angeben. Um lediglich die Verteilung einer Variablen in unterschiedlichen Fallgruppen darzustellen, verwenden Sie ein einfaches Boxplot für Kategorien einer Variablen. ¾ Kategorien definieren: Für gruppierte Boxplots werden die Fälle der Datendatei in einzelne Gruppen unterteilt. Geben Sie hierzu eine gruppierende Variable in dem Feld Kategorienachse an. Die unterschiedlichen Werte dieser Variablen bilden jeweils eine Gruppe. Für jede der Quellvariablen wird die Verteilung der Werte innerhalb der einzelnen Gruppen durch jeweils eine Box dargestellt. ¾ Fallbeschriftung: Sie können eine Variable angeben, deren Werte zur Beschriftung von Ausreißern und extremen Werten verwendet werden. Wenn Sie hier keine Variable angeben, werden die jeweiligen Fallnummern verwendet. 400 ¾ Optionen: Fehlende Werte. Fälle mit einem fehlendem Wert in einer der Quellvariablen werden aus dem gesamten Diagramm ausgeschlossen und damit auch nicht bei der Verteilung anderer Variablen berücksichtigt. In gruppierten Boxplots bilden fehlende Werte der Kategorienvariablen eine eigene 400 Siehe hierzu auch Fn. 399, S. 881.

34.4 Erstellen von Fehlerbalken 887 Kategorie. Dies sind jedoch lediglich Voreinstellungen, die Sie in dem Dialogfeld der Schaltfläche Optionen ändern können: y Fehlende Werte als Kategorie anzeigen: Wählen Sie diese Option ab, wenn bei gruppierten Boxplots für fehlende Werte in der Kategorienvariable keine eigene Kategorie gebildet werden soll. Fälle mit fehlenden Werten in der Kategorienvariablen bleiben dann unberücksichtigt. y Listenweiser Fallausschluß / Fälle Variable für Variable ausschließen: Per Voreinstellung ist die Option Listenweiser Fallausschluß ausgewählt. Wenn Sie statt dessen die Option Fälle Variable für Variable ausschließen verwenden, werden Fälle mit fehlenden Werten in den Quellvariablen lediglich für die Variablen ausgeschlossen, in denen der fehlende Wert enthalten ist. Die Verteilungen der unterschiedlichen Variablen bzw. der sich entsprechenden Gruppen der verschiedenen Variablen können dann auf verschiedenen Fällen sowie auf einer unterschiedlichen Anzahl an Fällen basieren. 34.4 Erstellen von Fehlerbalken 34.4.1 Übersicht Um ein einfaches oder ein gruppiertes Fehlerbalkendiagramm zu erstellen, wählen Sie den Befehl GRAFIKEN FEHLERBALKEN... Dieser Befehl öffnet zunächst das Dialogfeld aus Abbildung 34.6, in dem Sie die Art der darzustellenden Werte festlegen und zwischen einfachen und gruppierten Fehlerbalken wählen können. Abbildung 34.9: Dialogfeld des Befehls GRAFIKEN, FEHLERBALKEN Bei der Wahl des Diagrammtyps und der Art der darzustellenden Werte gibt es vier Kombinationsmöglichkeiten, deren Wirkung im folgenden kurz dargestellt wird. Die beiden nachfolgenden Abschnitte 34.4.2, Fehlerbalken für Kategorien

888 Kapitel 34 Boxplots und Fehlerbalken einer Variablen, und 34.4.3, Fehlerbalken für verschiedene Variablen, S. 891 beschreiben dann die weitere Vorgehensweise zum Erstellen der Diagramme. Einfache Fehlerbalken ¾ Auswertung über Kategorien einer Variablen: Zur Beschreibung des Diagramms werden eine Quellvariable und eine gruppierende Kategorienvariable angegeben. Durch die unterschiedlichen Werte der Kategorienvariablen werden die Fälle der Datendatei in Fallgruppen unterteilt. In dem Diagramm wird für jede dieser Fallgruppen ein Fehlerbalken erzeugt, der Angaben über den Mittelwert der Quellvariablen in der betreffenden Fallgruppe darstellt. ¾ Auswertung über verschiedene Variablen: Es werden eine oder mehrere Quellvariablen angegeben. Für jede dieser Variablen wird in dem Diagramm ein Fehlerbalken mit Angaben über deren Mittelwert dargestellt. Gruppierte Fehlerbalken ¾ Auswertung über Kategorien einer Variablen: Ein Diagramm wird durch drei Variablen beschrieben. Neben einer Quellvariablen wird eine Kategorienvariable angegeben, durch die die Fälle der Datei in Fallgruppen (Kategorien) unterteilt werden. Eine weitere gruppierende Variable unterteilt die Fallgruppen weiter in Untergruppen. Für jede dieser Untergruppen wird pro Kategorie ein Fehlerbalken erzeugt, der sich auf den Mittelwert der Quellvariablen in der betreffenden Untergruppe bezieht. ¾ Auswertung über verschiedene Variablen: Es werden zwei oder mehr Quellvariablen und eine Gruppenvariable angegeben. 401 Die Gruppenvariable unterteilt die Fälle der Datendatei in Fallgruppen, und in dem Diagramm wird für jede Quellvariable pro Fallgruppe ein Fehlerbalken erzeugt, der sich auf den Mittelwert der betreffenden Quellvariablen in der jeweiligen Fallgruppe bezieht. Das Erstellen gruppierter Fehlerbalken unterscheidet sich nur geringfügig von der Vorgehensweise für einfache Fehlerbalken. Deutlich größer ist der Unterschied dagegen zwischen Fehlerbalken für verschiedene Kategorien einer Variablen und Fehlerbalken für verschiedene Variablen. Aus diesem Grund wird im folgenden das Erstellen einfacher und gruppierter Fehlerbalken jeweils gemeinsam für die beiden unterschiedlichen Arten darzustellender Werte erläutert. 401 Möchten Sie nur eine Quellvariable getrennt für verschiedene Fallgruppen betrachten, können Sie ein einfaches Fehlerbalkendiagramm mit einer Auswertung über Kategorien einer Variablen erstellen.

34.4 Erstellen von Fehlerbalken 889 34.4.2 Fehlerbalken für Kategorien einer Variablen Das Dialogfeld zum Erstellen gruppierter Fehlerbalken weist gegenüber dem Dialogfeld für einfache Fehlerbalken ein zusätzliches Feld für die gruppierende Variable auf. Weitere Unterschiede bestehen nicht zwischen den beiden Dialogfeldern. In Abbildung 34.10 ist das Dialogfeld für gruppierte Fehlerbalken mit einer Auswertung über Kategorien einer Variablen dargestellt. Das Dialogfeld zeigt die Einstellungen, die für die Grafik aus Abbildung 34.5, S. 881 verwendet wurden. Abbildung 34.10: Dialogfeld zum Erstellen eines gruppierten Fehlerbalkendiagramms mit einer Auswertung über Kategorien einer Variablen ¾ Quellvariable angeben: Geben Sie in dem Feld Variable eine numerische Quellvariable an, für deren Werte die Fehlerbalken erstellt werden sollen. ¾ Kategorien definieren: Wählen Sie eine numerische oder Textvariable zur Definition der Kategorien aus, und geben Sie diese in dem Feld Kategorienachse an. Die Kategorien werden durch die unterschiedlichen Werte dieser Variablen gebildet. Bei einfachen Diagrammen wird für jede der Kategorien jeweils ein Fehlerbalken erstellt, der sich auf die Werte der Quellvariablen in der betreffenden Fallgruppe bezieht. In gruppierten Diagrammen werden die Kategorien noch weiter in Untergruppen aufgeteilt, und es wird jeweils ein Fehlerbalken für jede der Untergruppen erstellt. ¾ Gruppen definieren: Geben Sie für gruppierte Diagramme ein weitere Variable zur Definition der Gruppen an. Auch hierfür können Sie sowohl numerische als auch Textvariablen verwenden. Die durch die Kategorienvariable gebildeten Fallgruppen werden durch die verschiedenen Werte der Gruppenvariablen weiter unterteilt. Für jede der sich dadurch ergebenden Untergruppen wird in der Grafik pro Kategorie ein Fehlerbalken dargestellt, der sich auf die Werte der Quellvariablen in der betreffenden Untergruppe bezieht.

890 Kapitel 34 Boxplots und Fehlerbalken ¾ Bedeutung der Balken: Per Voreinstellung werden durch die Fehlerbalken die 95%-Konfidenzintervalle der Mittelwerte beschrieben. Sie können das Niveau der Intervalle ändern oder anstatt des Konfidenzintervalls den Standardfehler des Mittelwertes oder die Standardabweichung darstellen lassen. Die Bedeutung dieser drei Optionen wird weiter unten näher beschrieben. ¾ Optionen: Fehlende Werte. Fehlende Werte in der Kategorienvariablen oder der gruppierenden Variablen werden per Voreinstellung in dem Diagramm durch eine eigene Kategorie bzw. Gruppe berücksichtigt. Dabei wird nicht zwischen den verschiedenen benutzer- und systemdefinierten fehlenden Werten unterschieden. Sollen Fälle mit fehlenden Werten in diesen Variablen nicht berücksichtigt, sondern aus dem Diagramm ausgeschlossen werden, wählen Sie in dem Dialogfeld der Schaltfläche Optionen die Option Fehlende Werte als Kategorie anzeigen ab. ¾ Titel: In dem Dialogfeld der Schaltfläche Titel können Sie der Grafik zwei Titel-, eine Untertitel- und zwei Fußzeilen hinzufügen. Jede der Zeilen kann bis zu 72 Zeichen umfassen. Alle fünf Zeilen können Sie auch nachträglich im Grafikeditor hinzufügen, ändern oder löschen. Zum Dialogfeld Titel siehe auch S. 842. ¾ Vorlage: Sie können die Formatierungen wie zum Beispiel Farben, Rahmenstärken oder Schriftarten bereits bestehender Grafiken auf das neu zu erstellende Diagramm übertragen (siehe hierzu S. 843). Bedeutung der Balken In der Dropdown-Liste Bedeutung der Balken können Sie zwischen den drei folgenden Maßzahlen wählen, um diese durch die Fehlerbalken darstellen zu lassen: ¾ Konfidenzintervall für Mittelwert: Das Konfidenzintervall ist der Wertebereich, in dem der Mittelwert der Grundgesamtheit mit einer bestimmten Wahrscheinlichkeit liegt. Per Voreinstellung wird das Intervall für ein Niveau von 95% berechnet, so daß der Bereich angegeben wird, in dem der Mittelwert in der Grundgesamtheit mit einer Wahrscheinlichkeit von 95% liegt. In dem Feld Niveau können Sie die Wahrscheinlichkeit ändern. Zulässig sind Werte zwischen 50% und 99,9%, wobei der Wert bis zu zwei Dezimalstellen aufweisen kann. ¾ Standardfehler des Mittelwerts: Der Standardfehler kennzeichnet die Streuung der Stichprobenmittelwerte um den Mittelwert der Grundgesamtheit, die sich bei der Ziehung mehrerer gleich großer Stichproben ergeben würde (siehe hierzu auch Abschnitt Standardfehler des Mittelwerts, S. 881). Für die Darstellung des Standardfehlers in der Grafik können Sie einen Multiplikator angeben. Dies ist per Voreinstellung der Wert 2, so daß durch die Fehlerbalken zu jeder Seite des Stichprobenmittelwertes der doppelte Standardfehler abgetragen wird. Als Multiplikator sind Werte zwischen 1 und 99.999 zulässig. Der Wert kann mit bis zu drei Dezimalstellen angegeben werden, darf aber insgesamt - einschließlich des Dezimaltrennzeichens - nicht mehr als fünf Zeichen umfassen.

34.4 Erstellen von Fehlerbalken 891 ¾ Standardabweichung: Durch die Standardabweichung wird die Streuung der Stichprobenwerte um den Stichprobenmittelwert gekennzeichnet. Wie für den Standardfehler können Sie einen Multiplikator angeben. Bei dem voreingestellten Multiplikator von 2 wird durch einen Fehlerbalken zu jeder Seite des Stichprobenmittelwertes das Doppelte der Standardabweichung abgetragen. 34.4.3 Fehlerbalken für verschiedene Variablen Auch bei Fehlerbalken für verschiedene Variablen unterscheiden sich die Dialogfelder einfacher und gruppierter Diagramme lediglich darin, daß beim Erstellen eines gruppierten Diagramms ein zusätzliches Feld für die gruppierende Variable angeboten wird. Dies ist das Feld Kategorienachse in Abbildung 34.11, die das Dialogfeld für gruppierte Fehlerbalken mit einer Auswertung über verschiedene Variablen wiedergibt. Abbildung 34.11: Dialogfeld zum Erstellen gruppierter Fehlerbalken mit einer Auswertung über verschiedene Variablen ¾ Quellvariablen: Geben Sie in dem Listenfeld Variablen (in dem Dialogfeld für einfache Fehlerbalken heißt dieses Feld Fehlerbalken) die numerischen Variablen an, für deren Werte die Fehlerbalken erstellt werden sollen. Für gruppierte Diagramme müssen Sie hier mindestens zwei Quellvariablen angeben. Möchten Sie lediglich verschiedene Kategorien einer Variablen darstellen, verwenden Sie ein einfaches Fehlerbalkendiagramm für Kategorien einer Variablen. ¾ Kategorien definieren: Geben Sie für gruppierte Diagramme in dem Feld Kategorienachse eine Variable zur Definition der Kategorien an. Die verschiedenen Werte dieser Variablen unterteilen die Fälle der Datendatei in einzelne Fallgruppen. Für jede der Quellvariablen wird für jede Fallgruppe jeweils ein Fehlerbalken erstellt.

892 Kapitel 34 Boxplots und Fehlerbalken ¾ Bedeutung der Balken: Per Voreinstellung beschreiben die Fehlerbalken das 95%-Konfidenzintervall des Mittelwertes. In dem Feld Niveau können Sie das Niveau (die Wahrscheinlichkeit) für das Intervall mit einem Wert zwischen 50% und 99,9% festlegen. Statt des Konfidenzintervalls können Sie auch den Standardfehler des Mittelwertes oder die Standardabweichung der Stichprobenwerte darstellen lassen. Siehe hierzu auch Abschnitt Bedeutung der Balken, S. 890. ¾ Optionen: Fehlende Werte: Fälle, die in einer der Quellvariablen einen fehlenden Wert enthalten, werden aus dem gesamten Diagramm ausgeschlossen, sie werden also auch nicht in den Fehlerbalken anderer Variablen berücksichtigt. Bei Diagrammen mit gruppierten Fehlerbalken werden system- und benutzerdefinierte fehlende Werte der Kategorienvariablen gemeinsam durch eine eigene Kategorie repräsentiert. Dies sind die Voreinstellungen, die Sie in dem Dialogfeld der Schaltfläche Optionen ändern können: y Fehlende Werte als Kategorie anzeigen: Wählen Sie diese Option ab, wenn bei gruppierten Fehlerbalken keine Kategorie für fehlende Werte in der Kategorienvariablen gebildet werden soll. Fälle mit fehlenden Werten in dieser Variablen werden dann aus dem Diagramm ausgeschlossen. y Listenweiser Fallausschluß / Fälle Variable für Variable ausschließen: Per Voreinstellung ist die Option Listenweiser Fallausschluß ausgewählt. Wenn Sie statt dessen die Option Fälle Variable für Variable ausschließen verwenden, bleiben Fälle mit einem fehlenden Wert in einer Quellvariablen nur bei den Fehlerbalken unberücksichtigt, die sich auf die Variable mit dem fehlenden Wert bezieht. In die Fehlerbalken, die sich auf andere Quellvariablen beziehen, werden die betreffenden Fälle dagegen einbezogen. ¾ Titel: Sie können in dem Dialogfeld der Schaltfläche Titel zwei Titel-, eine Untertitel- und zwei Fußzeilen für die Grafik angeben. Jede dieser Zeilen kann bis zu 72 Zeichen umfassen. Alle Titelangaben können Sie auch nachträglich im Grafikeditor hinzufügen, ändern oder löschen. Zum Dialogfeld Titel siehe auch S. 842. ¾ Vorlage: Sie können die Formatierungen einer bereits bestehenden Grafik auf das neu zu erstellende Diagramm übertragen (siehe hierzu S. 843). 34.5 Optionen zum Verändern der Diagramme im Grafikeditor Alle Diagramme bei SPSS können nach dem Erstellen manuell verändert und bearbeitet werden. Neben allgemeinen Bearbeitungsmöglichkeiten wie dem Zuweisen von Farben und Rahmen oder dem Einfügen von Titeln und Textfeldern stehen je nach Diagrammtyp einige spezielle Optionen zur Verfügung, die auf die jeweilige Grafikart ausgerichtet sind. Um ein Diagramm bearbeiten zu können, muß es zunächst im Grafikeditor geöffnet werden. Hierzu können Sie im Ausga-

34.5 Optionen zum Verändern der Diagramme im Grafikeditor 893 benavigator auf das Diagramm doppelklicken, oder Sie können das Diagramm markieren und anschließend den Befehl BEARBEITEN OBJEKT: SPSS-DIAGRAMM ÖFFNEN wählen. Die allgemeinen Bearbeitungsmöglichkeiten für Diagramme sind in Kapitel 31, Diagramme - Überblick, beschrieben. Im folgenden werden die im Grafikeditor speziell für Boxplots und Fehlerbalken zur Verfügung stehenden Optionen dargestellt. 34.5.1 Optionen für Boxplots Wenn Sie ein Boxplot-Diagramm im Grafikeditor anzeigen, können Sie mit dem Befehl DIAGRAMME OPTIONEN... das Dialogfeld aus Abbildung 34.12 öffnen. In diesem Dialogfeld können Sie die Beschriftung von Ausreißern und Extremwerten verändern, die Anzeige von Häufigkeiten für die einzelnen Kategorien ausblenden und die Darstellung von Ausreißern und Extremwerten vollständig unterdrücken. Abbildung 34.12: Dialogfeld des Befehls DIAGRAMME, OPTIONEN aus dem Grafikeditor für ein Boxplot-Diagramm ¾ Anzeigen: Sie können für Ausreißer und Extremwerte getrennt bestimmen, ob diese in der Grafik angezeigt werden sollen: y Ausreißer: Wenn diese Option angekreuzt ist, werden Ausreißer in dem Diagramm einzeln dargestellt. Ausreißer sind so definiert, daß ihr Abstand vom 25%-Perzentil nach unten bzw. vom 75%-Perzentil nach oben zwischen dem 1,5fachen und dem 3fachen der Boxhöhe liegt. Die Boxhöhe gibt den Abstand zwischen dem 25%- und dem 75%-Perzentil wieder. y Extremwerte: Mit dieser Option werden die Extremwerte in dem Diagramm einzeln aufgeführt. Extremwerte liegen um mehr als das Dreifache der Boxhöhe über dem 75%- bzw. unter dem 25%-Perzentil.

894 Kapitel 34 Boxplots und Fehlerbalken ¾ Fallbeschriftungen: In der Dropdown-Liste können Sie die Beschriftung von Ausreißern und Extremwerten ein- und ausblenden. Mit der Option Wie vorgegeben werden genau die Beschriftungen angezeigt, die mit dem Werkzeug Punkt identifizieren 402 markiert wurden. Wenn die Fallbeschriftung mit der Option Ein oder der Option Wie vorgegeben eingeschaltet ist, können Sie zwischen den beiden folgenden Optionen für die Herkunft der Beschriftung wählen: y ID-Variable: Wenn Sie diese Option wählen, werden die Werte einer Beschriftungsvariablen für die Fallbeschriftung verwendet. Die Beschriftungsvariablen muß bereits beim Erstellen der Grafik festgelegt worden sein (siehe Aufzählungspunkt Fallbeschriftung, S. 885) und kann nicht nachträglich angegeben werden. Wenn Sie die Option ID-Variable auswählen, aber beim Erstellen der Grafik keine Beschriftungsvariable angegeben wurde, werden wie bei der folgenden Option die Fallnummern zur Beschriftung verwendet. y Fallnummer: Mit dieser Option werden Ausreißer und Extremwerte mit den jeweiligen Fallnummern aus der Datendatei beschriftet. ¾ Häufigkeiten für Kategorien: Per Voreinstellung wird unter der Kategorienachse für jedes Boxplot die Anzahl der Fälle angegeben, die durch das Boxplot repräsentiert werden. Um die Anzeige dieser Fallzahlen zu unterdrücken, wählen Sie diese Option ab. Die Fallzahlen können nicht angezeigt werden, wenn Sie die Achsen der Grafik mit dem Befehl FORMAT, ACHSEN VER- TAUSCHEN vertauscht haben, wenn also die senkrechte Achse die Kategorienachse und die waagerechte Achse die Skalenachse bilden. 34.5.2 Optionen für Fehlerbalken Für Fehlerbalken öffnet der Befehl DIAGRAMME OPTIONEN... das Dialogfeld aus Abbildung 34.13. Abbildung 34.13: Dialogfeld des Befehls DIAGRAMME, OPTIONEN aus dem Grafikeditor für ein Fehlerbalkendiagramm 402 Zu diesem Werkzeug siehe im einzelnen Abschnitt 36.7.3, Punkt identifizieren, S. 935.

34.5 Optionen zum Verändern der Diagramme im Grafikeditor 895 Mit der einzigen in diesem Dialogfeld angebotenen Option Häufigkeiten für Kategorien anzeigen legen Sie fest, ob unter der Kategorienachse für jeden Fehlerbalken die Anzahl der in den Fehlerbalken eingegangenen Fälle angezeigt werden soll. Wenn die Option angekreuzt ist, wird diese Fallzahl angegeben, andernfalls wird sie nicht dargestellt. Haben Sie das Diagramm mit dem Befehl FORMAT, ACHSEN VERTAUSCHEN gekippt, so daß die Kategorienachse die senkrechte und die Skalenachse die waagerechte Achse bilden, können die Fallzahlen nicht ausgewiesen werden. Daher ist in diesem Fall auch der Befehl DIAGRAMME, OPTIONEN inaktiv und kann somit nicht aufgerufen werden.