Deskriptive Statistik



Ähnliche Dokumente
1,11 1,12 1,13 1,14 1,15 1,16 1,17 1,17 1,17 1,18

2. Deskriptive Statistik 2.1. Häufigkeitstabellen, Histogramme, empirische Verteilungsfunktionen

- Beschreibung der Stichprobe(n-Häufigkeitsverteilung) <- Ermittlung deskriptiver Maßzahlen (Mittelungsmaße, Variationsmaße, Formparameter)

Expertenrunde Gruppe 1: Wiederholungsgruppe EXCEL (Datenerfassung, Darstellungsformen, Verwertung)

4. Erstellen von Klassen

Auswertung und Darstellung wissenschaftlicher Daten (1)

Willkommen zur Vorlesung Statistik

Felix Klug SS Tutorium Deskriptive Statistik

Lösungen zu Janssen/Laatz, Statistische Datenanalyse mit SPSS 1

Einfache statistische Auswertungen mit dem TI-Nspire

QM: Prüfen -1- KN

STATISTIK. Erinnere dich

Statistik I für Betriebswirte Vorlesung 2

Aufgabe 1: Nehmen Sie Stellung zu den folgenden Behauptungen (richtig/falsch mit stichwortartiger Begründung).

Standardisierung von Daten Darstellung von Daten in Texten, Tabellen und Abbildungen. Standardisierung von Daten

1 Darstellen von Daten

Professionelle Seminare im Bereich MS-Office

Evaluation der Normalverteilungsannahme

1 Verteilungen und ihre Darstellung

Statistik und Wahrscheinlichkeitsrechnung

90-minütige Klausur Statistik für Studierende der Kommunikationswissenschaft

Box-and-Whisker Plot -0,2 0,8 1,8 2,8 3,8 4,8

Kontingenzkoeffizient (nach Pearson)

Umfrage der Klasse 8c zum Thema "Smartphones"

Einfache Statistiken in Excel

Auswerten mit Excel. Viele Video-Tutorials auf Youtube z.b.

Fachhochschule Düsseldorf Wintersemester 2008/09

Lineargleichungssysteme: Additions-/ Subtraktionsverfahren

Korrelation - Regression. Berghold, IMI

Grundlagen der Datenanalyse am Beispiel von SPSS

Methoden der empirischen Sozialforschung I

Einführung in statistische Analysen

Statistische Auswertung:

Willkommen zur Vorlesung Statistik

Melanie Kaspar, Prof. Dr. B. Grabowski 1

Dokumentation. estat Version 2.0

Statistik für Studenten der Sportwissenschaften SS 2008

Primzahlen und RSA-Verschlüsselung

Auswertung mit dem Statistikprogramm SPSS:

Einfache statistische Auswertungen mit dem Programm SPSS

Varianzanalyse (ANOVA: analysis of variance)

Laufende Auswertung von Feedback-Fragebögen Eine Vorlage zur Auswertung eines Fragebogens und die Präsentation erstellen...

Franz Kronthaler. Statistik angewandt. Datenanalyse ist (k)eine Kunst. Excel Edition. ^ Springer Spektrum

W-Rechnung und Statistik für Ingenieure Übung 11

Anwendungshinweise zur Anwendung der Soziometrie

Univariate Häufigkeitsverteilungen Kühnel, Krebs 2001: Statistik für die Sozialwissenschaften, S.41-66

Einführung in die statistische Datenanalyse I

Anhand des bereits hergeleiteten Models erstellen wir nun mit der Formel

Analyse klassierter Daten: Vor der Analyse fasst man jeweils mehrere Merkmalsausprägungen in (Merkmalswerte-)Klassen zusammen.

Deskriptive Statistik

Kapitel 13 Häufigkeitstabellen

1. Einführung und statistische Grundbegriffe. Grundsätzlich unterscheidet man zwei Bedeutungen des Begriffs Statistik:

Etwas positive Tendenz ist beim Wechsel der Temperatur von 120 auf 170 zu erkennen.

Grundlagen der Inferenzstatistik

Analog zu Aufgabe 16.1 werden die Daten durch folgenden Befehl eingelesen: > kredit<-read.table("c:\\compaufg\\kredit.

2 Analyse statistischer Daten zu einem Merkmal Lösungshinweise

Deskription, Statistische Testverfahren und Regression. Seminar: Planung und Auswertung klinischer und experimenteller Studien

Zeichen bei Zahlen entschlüsseln

Profil A 49,3 48,2 50,7 50,9 49,8 48,7 49,6 50,1 Profil B 51,8 49,6 53,2 51,1 51,1 53,4 50, ,5 51,7 48,8

Modul 1 STATISTIK Eine erste Einführung

1 Mathematische Grundlagen

Leseprobe. Wilhelm Kleppmann. Versuchsplanung. Produkte und Prozesse optimieren ISBN: Weitere Informationen oder Bestellungen unter

Bitte am PC mit Windows anmelden!

Zusammenhänge zwischen metrischen Merkmalen

Erstellen von x-y-diagrammen in OpenOffice.calc

Das große ElterngeldPlus 1x1. Alles über das ElterngeldPlus. Wer kann ElterngeldPlus beantragen? ElterngeldPlus verstehen ein paar einleitende Fakten

Berechnungen in Access Teil I

Teil II: Einführung in die Statistik

Datenanalyse mit Excel. Wintersemester 2013/14

Messung von Veränderungen. Dr. Julia Kneer Universität des Saarlandes

Prüfung eines Datenbestandes

Einführung in Quantitative Methoden

Uli Greßler. Qualitätsmanagement. Überwachung der Produkt- und Prozessqualität. Arbeitsheft. 2. Auflage. Bestellnummer 04796

Binäre Bäume. 1. Allgemeines. 2. Funktionsweise. 2.1 Eintragen

Unterrichtsmaterialien in digitaler und in gedruckter Form. Auszug aus: Übungsbuch für den Grundkurs mit Tipps und Lösungen: Analysis

Excel Pivot-Tabellen 2010 effektiv

1 PIVOT TABELLEN. 1.1 Das Ziel: Basisdaten strukturiert darzustellen. 1.2 Wozu können Sie eine Pivot-Tabelle einsetzen?

Erweiterung der Aufgabe. Die Notenberechnung soll nicht nur für einen Schüler, sondern für bis zu 35 Schüler gehen:

Statistik II für Betriebswirte Vorlesung 2

Dossier: Rechnungen und Lieferscheine in Word

Würfelt man dabei je genau 10 - mal eine 1, 2, 3, 4, 5 und 6, so beträgt die Anzahl. der verschiedenen Reihenfolgen, in denen man dies tun kann, 60!.

a) Zeichnen Sie in das nebenstehende Streudiagramm mit Lineal eine Regressionsgerade ein, die Sie für passend halten.

Computeria Rorschach Mit Excel Diagramme erstellen

Individuelles Qualifikationsprofil für

Graphische Darstellung einer univariaten Verteilung:

Statistik I für Betriebswirte Vorlesung 5

Statistik mit Excel. für Praktiker: Statistiken aufbereiten und präsentieren HORST-DIETER RADKE

Suche schlecht beschriftete Bilder mit Eigenen Abfragen

Statistik I für Betriebswirte Vorlesung 9

Teil I: Deskriptive Statistik

geben. Die Wahrscheinlichkeit von 100% ist hier demnach nur der Gehen wir einmal davon aus, dass die von uns angenommenen

Fortgeschrittene Statistik Logistische Regression

Korrelation (II) Korrelation und Kausalität

Webalizer HOWTO. Stand:

Diese Ansicht erhalten Sie nach der erfolgreichen Anmeldung bei Wordpress.

Kurzanleitung. MEYTON Aufbau einer Internetverbindung. 1 Von 11

Multicheck Schülerumfrage 2013

Transkript:

Deskriptive Statistik In der beschreibenden Statistik werden Methoden behandelt, mit deren Hilfe man Daten übersichtlich darstellen und kennzeichnen kann. Die Urliste (=Daten in der Reihenfolge ihrer Erhebung) ist meist umfangreich und läßt kaum Aussagen über die Struktur der Population zu. Daher müssen die Werte geordnet und verdichtet werden. Tabellen und graphische Darstellungen Eine Form der Aufbereitung von umfangreichem Datenmaterial besteht darin, Untersuchungseinheiten mit gleichen oder ähnlichen Merkmalsausprägungen zu Klassen zusammenzufassen und festzustellen, wieviele Einheiten auf jede Klasse entfallen. So entsteht eine Häufigkeitsverteilung, die tabellarisch und graphisch dargestellt werden kann. Die Anzahl (n i, i=,..,k, k n) der Beobachtungen in einer Klasse wird als absolute Häufigkeit (Besetzungszahl) in dieser Klasse bezeichnet. Nach Division durch die Gesamtzahl der Beobachtungen (n) erhält man die relative Häufigkeit (h i ) einer Klasse. Während bei nominalen Daten die Reihenfolge der Klassen keine Rolle spielt, muß bei allen höheren Meßniveaus die Rangordnung der Klassen beachtet werden. Bei nominalen oder ordinalen Daten ergeben sich zumeist natürliche Klassengrenzen, doch bei größerem metrischen Datenmaterial ist es notwendig, eine Klasseneinteilung vorzunehmen. Klasseneinteilung, Klassierung Die Klasseneinteilung ist notwendig, um eine Überbewertung des Zufallseinflusses zu vermeiden und die Struktur (Verteilungstyp, Gesetzmäßigkeit) der Beobachtungsreihe besser erkennen zu können. Die Wahl einer geeigneten Klasseneinteilung ist stets willkürlich, aber es sollten einige Regeln beachtetet werden:. Die Klasseneinteilung muß alle Beobachtungswerte umfassen (also in der ersten Version auch extreme Werte).. Die Klassengrenzen sind so zu wählen, dass die Beobachtungswerte eindeutig den Klassen zugeordnet werden können, z.b. sollen die Klassenenden auf Werte, die meßtechnisch nicht vorkommen, fallen (etwa eine Dezimale mehr als gemessen wird) oder man verwendet halboffene Klassen (z.b. von 3 bis unter 40). Man wähle gleiche Klassenbreiten. 3. Die Klassenmitte repräsentiert die übrigen Meßwerte der Klasse. 4. Je kleiner die Klassenanzahl umso größer die Klassenbreite und umso größer ist der Informationsverlust. Je größer die Klassenanzahl, umso mehr kommt die nichtinteressierende Wirkung von Zufallseinflüssen zur Geltung. Die Erfahrung führt zu folgenden Faustregeln: k n, k 5log 0 n (k: Klassenanzahl, n: Anzahl der Beobachtungswerte) Statistische Datenanalyse am PC Andrea Berghold

Die gebräuchlichsten graphischen Darstellungsformen sind: Stab-, Balkendiagramm (bar chart) Kreisdiagramm (pie chart) Histogramm Häufigkeitspolygon Stamm- und Blatt Darstellung (stem and leaf plot) Beim Stabdiagramm ist die Höhe der Stäbe proportional zu den Besetzungszahlen bzw. rel. Häufigkeiten in den einzelnen Klassen. Breite und Abstand spielen keine Rolle. Es eignet sich für qualitative, ordinale und quantitativ diskrete Merkmale (z.b. Blutgruppe, Schulnoten, Anzahl kariöser Zähne bei Volksschulkindern) Das Kreisdiagramm (als spezielles Flächendiagramm) wird in Segmente proportional zu den beobachteten Anzahlen (rel. Häufigkeiten) zerlegt. Histogramme müssen flächentreu sein - d.h. die Fläche (und nicht die Höhe) muß proportional der Häufigkeit n i bzw.h i sein. Daher kann nur bei konstanter Klassenbreite (Δx) n i bzw. h i als Ordinate der Rechtecke verwendet werden. Die Polygondarstellung verwendet man meist, wenn mehrere Häufigkeitsverteilungen verschiedener Gruppen in einem gemeinsamen Diagramm verglichen werden sollen. Stamm- und Blatt- Darstellung: Das Histogramm stellt die Häufigkeit für alle Werte innerhalb einer bestimmten Klasse dar. Demzufolge kann man die Häufigkeit eines Einzelwertes dieser Klasse nicht mehr erkennen. Eine graphische Repräsentation der Häufigkeitsverteilung ohne diesen Informationsverlust ist die Stamm- und Blatt-Darstellung (stem and leaf plot). Im Stamm werden jene Ziffern, welche die Klasseneinteilung repräsentieren, eingetragen und im Blatt erfolgt die Eintragung der Ziffern der nächsten Stelle der Größe nach. Statistische Datenanalyse am PC Andrea Berghold

Kenngrößen Kenngrößen dienen dazu, die Datenmenge zu einigen wenigen Zahlen zu komprimieren, welche bestimmte Eigenschaften der Daten möglichst gut beschreiben. Wir wollen die mittlere Tendenz der Daten die Streuung der Daten um die mittlere Tendenz charakterisieren. Maßzahlen der Lage Lagemaßzahlen beschreiben zentrale Eigenschaften einer Verteilung. Sie charakterisieren das Zentrum der Häufigkeitsverteilung, also den Wert (Ort) mit der größten Häufigkeit bzw. Wahrscheinlichkeit des Auftretens. Darüber hinaus werden durch Lagemaßzahlen Positionsmerkmale (Ordnungsstatistiken) einer der Größe nach geordneten Datenmenge wiedergegeben (z.b. die Position in der Zahlenreihe, bis zu welcher 90 % der Beobachtungswerte auftreten). Die Statistik braucht eine Reihe verschieden definierter Lagemaßzahlen, um der Vielfalt der Verteilungen statistischer Datenmengen gerecht zu werden. Arithmetisches Mittel (mean) Gegeben sei eine Stichprobe x,x,...,x n vom Umfang n. Das arithmetische Mittel ist definiert als x = n n x i i= Nachteile des arithmetischen Mittels: Es gibt extremen Werten zu viel Gewicht, und ist daher nur verwendbar, wenn man es mit eingipfeligen nicht allzu schiefen Verteilungen zu tun hat. Die errechnete Durchschnittszahl hat im Falle diskreter Merkmale keine Entsprechung in der Wirklichkeit. (Beispiel: Die durchschnittliche Zahl der Verletzten auf der Autobahn an einem Urlaubswochenende beträgt 03.5 Personen). Median (median) Der Median oder Zentralwert ist die mittlere Beobachtung der Daten xi, i=,,...,n, die der Größe nach sortiert wurden x x x3... xn.er hat die Eigenschaft, dass mindestens 50% der Meßwerte kleiner oder gleich dem Median ~ x sind. Statistische Datenanalyse am PC Andrea Berghold 3

Für ungerades n ~ x = x( ( n+ ) / ) Für gerades n ~ x = x( n / ) + x( n / + ) ( ) Vorteile des Medians: Der Median ist unempfindlich gegenüber extremen Werten. Er eignet sich als Lokationsmaß für schiefe Verteilungen und ordinal skalierte Daten. α-quantil Der Median ist lediglich ein Spezialfall aus einer Familie von Kenngrößen, die auf der Rangordnung der Daten beruhen - die Quantile. Ein α-quantil x α ist derart definiert, dass mindestens α% der Meßwerte kleiner oder gleich diesem Wert x α sind. Die Berechnung erfolgt über x α = x ( k ), falls n α keine ganze Zahl ist (k=int(n α )+) x = α ( x ( k ) + x( k+ ) ), falls n α eine ganze Zahl ist (k=n α ) Spezielle α-quantile:.quartil (α = 0.5),.Quartil oder Median, 3.Quartil (α = 0.75), Perzentile (Fraktile) Modalwert (mode) Bei nominalskalierten Merkmalen ist der Modalwert x mod der einzige anzuwendende Kennwert. Er ist definiert als der Wert, der am häufigsten in der Meßwertreihe vorkommt. Bei quantitativen Merkmalswerten wird der Modalwert durch die Klassenmitte der am dichtesten besetzten Klasse repräsentiert. Er eignet sich für schiefe Häufigkeitsverteilungen oder zur Charakterisierung von mehrgipfeligen Verteilungen (bimodal, multimodal). Statistische Datenanalyse am PC Andrea Berghold 4

Beispiele einiger Maßzahlen der Lage und der Streuung (SPSS-Output entstanden durch Analysieren Deskriptive Statistiken ExplorativeDatenanalyse... ) Univariate Statistiken ZUNAHME GRUPPE Kontroll- Gruppe Mittelwert 95% Konfidenzintervall des Mittelwerts Untergrenze Obergrenze Standardf Statistik ehler 399,5385 0,90 375,767 43,3099 Therapie - Gruppe 5% getrimmtes Mittel Median Varianz Standardabweichung Minimum Maximum Spannweite Interquartilbereich Schiefe Kurtosis Mittelwert 95% Konfidenzintervall des Mittelwerts Untergrenze Obergrenze 399,487 403,0000 547,436 39,3375 35,00 475,00 50,00 50,0000,043,66,9,9 36,3333 6,698 3,477 340,894 5% getrimmtes Mittel Median Varianz Standardabweichung Minimum Maximum Spannweite Interquartilbereich Schiefe Kurtosis 35,859 3,5000 076,754 3,839 68,00 395,00 7,00 36,7500,4,47 -,305,98 Zulässige Lagemaße bei den verschiedenen Skalenniveaus: Skalenniveau Nominalskala Ordinalskala Metrische Skalen zulässige Lage-Kenngrößen Modalwert Modalwert, Median Modalwert, Median, Mittelwert Statistische Datenanalyse am PC Andrea Berghold 5

Maßzahlen der Streuung Durch Mittelwerte allein läßt sich eine Datenmenge nicht ausreichend charakterisieren, da sie keine Auskunft geben, wie die einzelnen Werte sich um den Mittelwert verteilen. Wie bei den Lagemaßen sind in der Statistik auch verschiedene Streuungsmaße üblich, um die unterschiedlichen Skalen und Verteilungen von Daten ausreichend gut beschreiben zu können. Spannweite (range) Das einfachste Maß für die Streuung ist die Spannweite, die Differenz aus dem größten und kleinsten Meßwert. Sie ist für kleine Proben brauchbar, wird aber durch extreme Werte sehr stark beeinflußt. R = Maximum - Minimum = x n x Varianz (variance) und Streuung (standard deviation) Die Varianz s gibt die durchschnittliche, quadrierte Abweichung der Meßwerte vom arithmetischen Mittel wieder. n s = ( x i x) n i= Die Standardabweichung: s = s Die Standardabweichung eignet sich wesentlich besser zur Einschätzung der Variabilität eines Merkmals als s, da sie die gleiche Dimension wie die Beobachtungen hat. Auch diese Maße werden durch Ausreißer beeinflußt. Interquartilsabstand (interquartile range) Eine weitere Kennzahl zur Beschreibung der Variabilität um den zentralen Wert ist der Interquartilsabstand IQR. Er ist die Differenz zwischen dem 75%-Quantil (3.Quartil) und dem 5%-Quantil (.Quartil). In diesem Bereich des IQR liegen somit 50% der Meßwerte. IQR = x 0 x,75 0,5 Der IQR ist gegenüber extremen Werten unempfindlich. Eine graphische Darstellung für den Median, die Spannweite und den Interquartilsabstand (5- Zahlen-Zusammenfassung) ist der Box-and-Whiskers Plot. Ausgehend von dieser Konstruktion gibt es zahlreiche Modifikationen. In SPSS ist folgender Boxplot realisiert. Die untere Grenze der Box stellt das 5% Quantil, die obere das 75% Quantil dar. Die Linien (whiskers) reichen bis zu den Werten, die innerhalb x 0.5 -.5 IQR (bzw. x 0.75 +.5 IQR) liegen. Gibt es Werte außerhalb dieser Grenze, Statistische Datenanalyse am PC Andrea Berghold 6

so werden sie bis x 0.5-3 IQR (bzw. x 0.75 + 3 IQR) durch O (outliers) gekennzeichnet. Werte, die diese Grenzen übersteigen, gelten als weit außerhalb und werden mit * (extremes) bezeichnet. * x > x 0.75 + 3 IQR O x > x 0.75 +.5 IQR x x 0.75 +.5 IQR oder x max x 0.75 x 0.5 x 0.5 x x 0.5 -.5 IQR oder x min O x < x 0.5 -.5 IQR * x < x 0.5-3 IQR Schematische Darstellung eines Boxplots Der Boxplot eignet sich besonders gut für den visuellen Vergleich mehrerer Meßwertreihen. 6 5 Einsekundenkapazität in l 4 3 Geschlecht weiblich 0 N = 04 5-8 Jahre 00 5 70 49 9- Jahre 5 3-6 Jahre männlich Altersgruppen Statistische Datenanalyse am PC Andrea Berghold 7

Variationskoeffizient: Ob die Streuung von Meßwerten als stark oder gering anzusehen ist, erweist sich oft erst, wenn man die Streuung im Verhältnis zum Mittelwert betrachtet. Der Quotient Vk = s x wird als Variationskoeffizient bezeichnet. Er wird häufig in Prozent angegeben. In der Praxis interpretiert man Vk bis zu 0% als geringe Variabilität, zwischen 0% und 5% als normal und über 5% als starke Streuung des Beobachtungsmaterials. Er ist gegen Ausreißer anfällig. Er wird zum Vergleich von Streuungen verschiedener Meßreihen verwendet (ist unabhängig von der gewählten Einheit). Skalenniveau Nominalskala Ordinalskala Metrische Skalen zulässige Streuungskenngrößen keine Spannweite, Quartilsabstand Spannweite, Quartilsabstand, Standardabweichung, Variationskoeffizient Zur deskriptiven Statistik existieren auch mehrere Web Applikationen, die eine anschauliche Darstellung der Methodik zeigen: z.b. JUMBO Münster: http://medweb.uni-muenster.de/institute/imib/lehre/skripte/biomathe/jumbo.html Statistische Datenanalyse am PC Andrea Berghold 8

Verwendung von SPSS in der Deskriptiven Analyse Metrisches Merkmal: Häufigkeiten: Mit dem Befehl Häufigkeiten... erfahren wir, wie oft eine Ausprägung eines zu untersuchenden Merkmals vorkommt. Zusätzlich können wir im Untermenü Statistik... zulässige Kenngrößen für dieses Merkmal auswählen und im Untermenü Diagramme... ein Histogramm auswählen. Deskriptive Statistik: (nur bei metrischen Merkmalen anwenden!) Mit dem Befehl Deskriptive Statistiken... aus dem Menü Analysieren DeskriptiveStatistiken kann man selbst auswählen, welche Kennzahlen für eine Variable ausgegeben werden sollen. Im Untermenü Optionen... steht zur Auswahl: Mittelwert, Summe; als Lagemaße der Streuung die Std.-Abweichung, Varianz, Spannweite, Minimum, Maximum sowie Std.-Fehler und als Maßzahlen zur Beschreibung der Verteilungsform die Kurtosis und Schiefe. Explorative Datenanalyse: Für eine deskriptive Datenanalyse eines metrischen Merkmals hält SPSS den Befehl Explorative Datenanalyse... im Menü Analysieren Deskriptive Statistiken bereit. Es werden bestimmte statistische Kennzahlen ausgegeben (siehe Beispiel Seite 5). Hier besteht außerdem die Möglichkeit die deskriptive Statistik nach einem Faktor gruppiert auszugeben. Im Beispiel auf Seite 5 wurde die Ausgabe aufgeteilt nach dem Faktor Gruppe, der Faktorstufen aufweist: Kontroll-Gruppe / Therapie-Gruppe. Grafiken: Zum Boxplot und Histogramm gelangt man über das Menü Grafiken. Ein anderer Weg führt im Zuge der Erstellung einer deskriptiven Analyse im Menü ExplorativeDatenanalyse zum Untermenü Diagramme... Hier besteht auch die Möglichkeit sich neben einem Boxplot und Histogramm ein Stengel-Blatt-Diagramm ausgeben zu lassen. Ordinales Merkmal: Häufigkeiten: Mit dem Befehl Häufigkeiten... erfahren wir, wie oft eine Ausprägung eines zu untersuchenden Merkmals vorkommt. Zusätzlich können wir im Untermenü Statistik... Statistische Datenanalyse am PC Andrea Berghold 9

zulässige Kenngrößen für dieses Merkmal auswählen und im Untermenü Diagramme... ein Balken- oder ein Kreisdiagramm auswählen. Explorative Datenanalyse: Für ordinale Merkmale steht uns ebenfalls die Explorative Datenanalyse... zur Verfügung, wo wir Median und Quartilsabstand bestimmen können. Grafiken: Neben der oben beschriebenen Möglichkeit über den Befehl Häufigkeiten lassen sich Boxplot, Balkendiagramm und Kreisdiagramm auch über das Menü Grafiken erstellen. Nominales Merkmal Häufigkeiten: Mit dem Befehl Häufigkeiten... erfahren wir die absoluten und relativen Häufigkeiten der einzelnen Ausprägungen des nominalen Merkmals und falls gewünscht ein Balken- oder Kreisdiagramm. Kreuztabellen Wollen wir nominale Merkmale (oder auch ordinale Merkmale mit wenigen Ausprägungen) zueinander in Beziehung setzen, so steht der Befehl Kreuztabellen zur Verfügung. Ein Merkmal ergibt die Spalten der Kreuztabelle, das. Merkmal die Zeilen. Man kann auch Prozentwerte für die Zellen anfordern. Grafiken: Neben der oben beschriebenen Möglichkeit über den Befehl Häufigkeiten lassen sich Balkenund Kreisdiagramm auch über das Menü Grafiken erstellen. Statistische Datenanalyse am PC Andrea Berghold 0

Kennzahlen zur Beschreibung der Verteilungsform Im folgenden werden Kennzahlen eingeführt, die als Maß für die Schiefe und die Wölbung einer eingipfeligen Verteilung herangezogen werden können. Mit Hilfe der verschiedenen Lagemaße lassen sich bereits Aussagen über die Schiefe einer eingipfeligen Verteilung treffen: Verteilungsform rechtsschief (linkssteil) linksschief (rechtssteil) symmetrisch Bedingung x > ~ x > x x < ~ x < x x = ~ x = x mod mod mod Schiefe (Skewness) Mit Hilfe des Schiefemasses g ist man nun in der Lage, durch einen einzigen Kennwert Auskunft über die Schiefe und deren Richtung zu erhalten. 3 ( xi x) n i= g = 3 ( xi x) n i= Ist g 0, so kann man davon ausgehen, dass die Meßwerte symmetrisch um x verteilt liegen. Bei linksschiefen Verteilungsformen wird g negativ, bei rechtschiefen positiv. Exzeß und Wölbung (Kurtosis) g n = n ( x x) 4 i i= ( xi x) i= Der Exzeß gibt an, ob, bei gleicher Varianz, das absolute Maximum der Verteilung größer als bei der Dichte der Normalverteilung ist. Der theoretische Wert von g für normalverteilte Merkmalswerte ist 0. Ist g > 0 (g < 0), so liegen im Zentrum der Verteilung mehr (weniger) Merkmalswerte als bei der Normalverteilung. 3 Statistische Datenanalyse am PC Andrea Berghold