Statistische Auswertungsverfahren mit SPSS. Prof. Dr. Andrea Raab Fachhochschule Ingolstadt

Größe: px
Ab Seite anzeigen:

Download "Statistische Auswertungsverfahren mit SPSS. Prof. Dr. Andrea Raab Fachhochschule Ingolstadt"

Transkript

1

2 Inhaltliche Übersicht Informationen zum Programm SPSS Grundlagen der Programmbedienung in SPSS Befragung und Datenerstellung Daten und Variablen Deskriptive Analysemethoden 2

3 Das Programmpaket SPSS für Windows SPSS früher: Statistical Package for Social Sciences heute: Statistical Product and Service Solution Marktführendes Produkt im Bereich der programmgestützten statistischen Analyse Ab Version 5.0 grafische Benutzeroberfläche (GUI) sowie Menüsystem und integrierte Grafik Derzeit aktuellste Version: SPSS Version 14.0 für Windows SPSS Version 13.0 (englisch) für Apple Macintosh (nur PowerPC, nicht Intel) Variablen (2 hoch 15) pro Datendatei nutzbar. SPSS-Paket bestehend aus einem Basismodul und verschiedensten Zusatzmodulen Die SPSS-Studentenversion ist ausschließlich in englischer Sprache und unter Windows verfügbar. (Inhalt: SPSS Base System; Beschränkt auf Verarbeitung von 1500 Fällen und 50 Variablen) 3

4 Das Programmpaket SPSS für Windows Basismodul grundlegende Funktionen, einfache und fortgeschrittene Methoden zur Datenanalyse und umfangreiche Grafikmöglichkeiten Zusatzmodule SPSS Advanced Models SPSS Categories SPSS Conjoint SPSS Data Entry Builder SPSS Exact Tests SPSS Maps SPSS Missing Value Analysis SPSS Regression Models SPSS Tables SPSS Trends... 4

5 Warum SPSS und nicht Excel? Arbeiten mit großen Datensätzen möglich ( Variablen (2 hoch 15) pro Datei benutzbar) Umfangreiche Datentransformationen und -funktionen Dokumentation und Automatisierung über SYNTAX-Sprache Großer Umfang an statistischen Funktionen und Prozeduren Deskriptive Statistik (Mittelwerte, Standardabweichungen, Häufigkeiten, Kreuztabellen) Inferenzstatistik (Chi-Quadrat, t-test, Einfaktorielle Varianzanalyse) Multivariate Verfahren (Clusteranalyse, Faktorenanalyse, Diskriminanzanalyse, Conjointanalyse, Multidimensionale Skalierung etc.) 5

6 Statistische Methoden Statistik beschreibende (deskriptive) Statistik - Daten sammeln - Daten präsentieren - Daten charakterisieren schließende (induktive) Statistik - Schätzen - Hypothesen testen 6

7 Statistische Methoden Deskriptive (beschreibende) Statistik Messwerte ordnen Anschauliche und übersichtliche Darstellung von Daten in Tabellen Diagrammen Säulen Balken Linien Punkt Flächen Netz Stengel/Blatt Hoch-Tief Box Streu Histogramme Induktive (schließende) Statistik Ermittlung von Vertrauensbereichen Überprüfung von Hypothesen 7

8 Statistische Methoden Vorgehen bei analytischer Statistik (nach Petersen, 1991) Grundgesamtheit Schluss von der bekannten Stichprobe auf die unbekannte Grundgesamtheit Formulierung des zu prüfenden Sachverhaltes Ermittlung von Schätzgrößen für die Kenngrößen Entnahme einer Stichprobe Prüfung der Hypothesen Parametertests Prüfung der Hypothesen Verteilungstests Erzeugen der Analysendaten Parameterhypothesen Verteilungshypothesen Aufbereitung der Daten tabellarisch rechnerisch graphisch Formulierung der Nullhypothesen und Alternativhypothesen 8

9 Begriffsdefinitionen Variablen/Merkmale und Merkmalsausprägungen In SPSS werden die Ausprägungen bestimmter Merkmale/Variablen betrachtet. Jedes Merkmal hat mindestens zwei Merkmalsausprägungen (konkreter Wert des Merkmals = Analysenergebnis) Bsp.: Geschlecht - männlich / weiblich Unabhängige (Faktor) und abhängige Variablen unabhängige Variablen können die Merkmalsausprägungen von abhängigen Variablen beeinflussen (z.b. Alter beeinflusst die Konsumgewohnheiten) Qualitative und quantitative Variablen ein Merkmal/Variable kann in seiner Ausprägung qualitativ beschreibend sein (z.b. Weinsorte, Freundlichkeit) ein Merkmal/Variable kann in seiner Ausprägung quantitativ vermessen worden sein (z.b. Gehalt, Semesteranzahl) 9

10 Begriffsdefinitionen uni-, bi- und multivariate Daten univariat nur ein Merkmal/Variable wird für jeden Fall gemessen/beschrieben bivariat Jeweils 2 Variablen werden für jeden Fall in Beziehung gesetzt (x i,y i ) multivariat Mehr als 2 Variablen werden für jeden Fall in Beziehung gesetzt (x i,y i,z i,...k i ) Beispiel: Beschreibung einer Kundengruppe Alter Einkommen Geschlecht Konsumgewohnheiten Lifestyle 10

11 Starten von SPSS Dialogfenster Durch Abbrechen kann dieses Fenster geschlossen werden Dialogfenster in Zukunft nicht mehr anzeigen v 11

12 Die SPSS Fenster SPSS Daten Editor SPSS Syntax Fenster SPSS Viewer 12

13 SPSS Daten-Editor Arbeitsfläche von SPSS Sämtliche mit SPSS durchführbare Analysen Variablenansicht zeigt alle Variablen und zugehörige Attribute (z.b. Name, Typ, etc.) Datenansicht zeigt die Beobachtungswerte aller in der aktuellen Datendatei enthaltenen Variablen. Dateityp: *.sav 13

14 SPSS Syntax Fenster Befehlseingabe für einzelne Prozeduren ermöglicht beispielsweise Berechnen von Variablen, Transformieren von Daten, Ausführen statistischer Prozeduren u.v.m. SPSS-Befehlssprache wird im Zuge der Vorlesung noch genauer bearbeitet werden Dateityp: *.sps 14

15 SPSS Viewer Ausgabe für Ergebnisse von Analysen oder Prozeduren Wird bei jeder Analyse oder Prozedur automatisch geöffnet Navigationsbereich Anzeige aller Ergebnisse als ein- und ausblendbare Gliederungspunkte Dateityp: *.spo 15

16 Definition der Variablen Variablentypen String-Variablen (Zeichenketten) Verwendung bei offener Fragestellung Numerische Variablen Vercodung von möglichen Antworten (Bsp.: Bundesland) Relative Ordnung von Merkmalen Exakte Messung eines Merkmals 16

17 Qualität der Daten, Skala und Skalenniveau Qualität der Daten wird u.a. bestimmt durch die Art und Weise der Messung Gut messbare Daten schlecht messbare Daten z.b. Körpergröße eines Menschen z.b. Motivation, Gesundheitszustand Skala Meßlatte, auf der die Ausprägungen einer Eigenschaft abgetragen werden können Skalenniveau Art und Weise, in der eine Eigenschaft eines Objektes in Zahlen ausgedrückt werden kann 17

18 Skalenniveau Variablen Qualitative Variablen Quantitative Variablen nominal skaliert ordinal skaliert metrisch skaliert 18

19 Skalenniveau - Nominalskala Ausprägungen einer Variablen bilden nur Kategorien Keinerlei Ordnungsvorschrift Dient lediglich zur Unterscheidung der einzelnen Kategorien Auswertungsmöglichkeiten eingeschränkt (z.b. Häufigkeitsauszählung; Berechnung eines Mittelwertes ist sinnlos!) Beispiele Geschlecht Familienstand Herkunft Kategorie

20 Skalenniveau - Ordinalskala Für die einzelnen Ausprägungen existiert eine Relation ( größer, kleiner ) Es kann eine Rangordnung erstellt werden Auswertungsmöglichkeiten: (z.b. Ranglisten; Median als Mittelwert ist sinnvoll!) Beispiel: Platzierungen Schulnoten (streng genommen ordinal) Keine Aussage über die Abstände zwischen den Rängen möglich! 20

21 Skalenniveau Intervallskala Eigenschaften der Nominal - und Ordinalskala die Differenzen, nicht jedoch die Quotienten sind interpretierbar Ausprägungen werden als Vielfaches einer elementaren Maßeinheit angegeben Beispiel Temperatur (hat keinen natürlichen Nullpunkt) Schulnoten (werden oft als quasi intervallskaliert behandelt) 21

22 Skalenniveau Verhältnisskala Angabe von Differenzen und Quotienten ist sinnvoll Beispiele Umsatz eines Unternehmens Alter Einwohnerzahlen 22 Intervall und Verhältnisskalen heißen metrisch skaliert, Nominal- und Ordinalskalen heißen nicht metrisch skaliert (eine Unterscheidung der beiden metrischen Niveaus kommt bei den meisten statistischen Verfahren keine Bedeutung zu)

23 Skalenniveau - Überblick Skala Information Beispiel Differenzierung Lagemaß Kenngrößen Streumaß Nominal A=B, A B Geschlecht: männlich/weiblich Klassifizierung bei qualitativen Merkmalen (gleich, ungleich) relative Häufigkeiten Modus Ordinal A=B, A B; A<B<C Rangordnung kalt < lau < warm < heiß, Schulnoten, Güteklasse Einstufung bei qualitativen Merkmalen (kleiner / größer) relative Häufigkeiten Modus Median (x ), Quantile (Q) Spannweite (R) Intervall Skala mit konstanten Abständen, Addition, Subtraktion, Mittelwert Kalenderdatum, Punkte im Intelligenztest absolute Differenzen von quantitativen Merkmalen relative Häufigkeiten Modus Median (x), arithmetisches Mittel Standardabweichung (s) Varianz (s 2 ) Verhältnis Multiplikation, Division Länge, Fläche relative und absolute Differenzen von quantitativen Merkmalen relative Häufigkeiten Modus Median (x) arithmetisches Mittel geometrisches Mittel Standardabweichung (s) Varianz (s 2) 23

24 Skalenniveau - Metrische Variablen Diskrete Variablen Ein Merkmal/Variable kann nur endlich viele Ausprägungen annehmen Anzahl der möglichen Ausprägungen ist abzählbar Bsp.: Kinderzahl, Einwohneranzahl, Digitaluhr Stetige Variablen Ein Merkmal/Variable kann unendlich viele Ausprägungen annehmen Mehr als abzählbare Ausprägungen eines Merkmals Aus messtechnischen Gründen oft nicht beliebig genau bestimmbar Bsp.: Umsatz, Alter, Einkommen, BMI = kg/m², Sanduhr 24

25 Praxisbeispiel: Befragung der Studenten Praxisbeispiel: Befragung der Studenten Ziele: 1. Erstellen eines praxisrelevanten Datensatzes 2. Auswertungen basierend auf diesen Datensatz 25

26 Näheres zur Variablenansicht Bezeichnung der Variable Anzahl der Zeichen Bezeichnung der Variablen und Werte in Datenansicht und Ausgaben Unterscheidung zwischen nominal, ordinal und metrisch (Bisher irrelevant für SPSS) Ausschlaggebend für die Verarbeitung der Variable in SPSS Benutzerdefiniert fehlende Werte Optionen für die Anzeige in der Datenansicht 26

27 Definition von Variablen Variablenname muss mit Buchstaben beginnen; restliche Zeichen sind Buchstaben, Ziffern, Punkte oder folgende #, _, $; keine Leerzeichen! darf nicht mit Punkt enden soll nicht mit Unterstrich enden auf 64 Zeichen beschränkt Name muss eindeutig sein Groß- und Kleinschreibung wird unterschieden Bestimmte Namen sind reserviert z.b. ALL, AND, NOT, WITH, OR Datentypen Numerisch Komma Punkt Wissenschaftliche Notation Datum Dollar Andere Währung String Messniveau Nominal Ordinal Metrisch 27

28 Deklaration von Variablen am Bsp. A1 Den einzelnen Werten werden Zahlen zugewiesen Um den von uns benutzerdefiniert fehlenden Wert weiß nicht von den anderen Nennungen zu trennen, geben wir ihm eine erhöhte Zahl (und trage diesen anschließend bei Fehlende Werte ein)

29 Deklaration von Variablen am Bsp. A1 Ein Zeichen lang Bezeichnung der Variable Benutzerdefiniert fehlender Wert: 8 (Weiß nicht) Typ: Numerisch Keine Dezimalstellen Wertelabels: 1 = sehr gut 4 = nicht gut 8 = weiß nicht String-Variablen bedürfen weniger Aufwand bei der Deklaration (am Bsp. A3). Jedoch erzeugen diese offenen Fragen meist viel Arbeit bei der Auswertung. Anzahl der Zeichen sinnvoll wählen 29

30 Datenansicht am Bsp. A1 In der Datenansicht werden die einzelnen Interviews in Zeilen dargestellt. Die Spalte a1 repräsentiert unsere neu erzeugte Variable Wie man sieht, wurden die Zahlen durch das jeweilige Wertelabel ersetzt. Man kann jene mit Hilfe des folgenden Buttons ein und ausblenden: 30

31 Praxisbeispiel: Befragung der Kursteilnehmer S1 1 2 x 1 31

32 Praxisbeispiel: Befragung der Kursteilnehmer A A

33 Praxisbeispiel: Befragung der Kursteilnehmer A3 A4_1 A4_2 A4_3 1. Nennung 2. Nennung 3. Nennung 33

34 Praxisbeispiel: Befragung der Kursteilnehmer M1_1 M1_2 M1_3 M1_4 M1_5 34

35 Praxisbeispiel: Befragung der Kursteilnehmer M2 1 2 M

36 Praxisbeispiel: Befragung der Kursteilnehmer B1 1 2 B B

37 Praxisbeispiel: Befragung der Kursteilnehmer F1 F1_1 F1_2 F1_3 x F1_8 = 1 37

38 Praxisbeispiel: Befragung der Kursteilnehmer F2_1 F2_2 F2_3 F2_4 F2_5 38

39 Praxisbeispiel: Befragung der Kursteilnehmer F3_ Jeweils mit 1 vercoden F3_s Bsp.: Befragter nutzt Fitness und Volleyball, d.h. die Variablen F3_5 und F3_8 nehmen den Wert 1 an. 39

40 Praxisbeispiel: Befragung der Kursteilnehmer ST_P ST_O ST2 ST3 ST

41 Praxisbeispiel: Befragung der Kursteilnehmer ST

42 Praxisbeispiel: Befragung der Kursteilnehmer ST ST7 ST8 ST

43 V2

44 Überblick Häufigkeiten Lage- und Streuparameter Explorative Datenanalyse Datenmodifikation 2

45 Dateneingabe Dateneingabe und -konsolidierung SPSS - Definition der Datenmatrix Variablennamen, Typ, Label, Missing Values - Keine Fehlerprüfung möglich Einlesen von Textdateien - Variablennamen in 1. Zeile - keine Leerzeilen oder -spalten, Überschriften, Texte o.ä. - Daten mit dem Assistenten für Textimport einlesen Einlesen von fremden Dateiformaten (z.b. Excel, Datenbanken) - Variablennamen in 1. Zeile - keine Leerzeilen oder -spalten, Überschriften, Texte o.ä. - Daten in SPSS einlesen mit Dateityp Excel (.xls) Option Read Variable Names aktivieren Data Entry - Definition der Datenmatrix - Eingabe mit Fehlerprüfung - Nur bei großen Datenmengen sinnvoll 3

46 Statistik Prozeduren in SPSS Variablenliste zu analysierende Variablen Analyse durchführen Übergabe in den Syntax Editor Einstellungen zurücksetzen Übertragung der Variablen in Analyse Mit der rechten Maustaste kann die wissensbasierte Datenbank von SPSS konsultiert werden. prozedurspezifische Steuerungsmöglichkeiten 4

47 Häufigkeiten Häufigkeiten: Analysieren > Deskriptive Statistik -> Häufigkeiten Die Werte können absolut oder prozentual dargestellt werden. Das Ergebnis wird in tabellarischer Form im Viewer ausgegeben. 5

48 Häufigkeiten Häufigkeiten: In der Variablenliste werden alle numerischen und String-Variablen angezeigt. Die Variable, für welche die statistische Maßzahlen berechnet werden sollen, wird aus der Variablenliste ausgewählt und mit der Pfeil-Schaltfläche in die Liste Variable(n) verschoben. 6

49 Häufigkeiten Häufigkeiten: M2. Besuchst du regelmäßig die Cafeteria der Mensa? (Ausgabe eines Balkendiagramms mit absoluten Diagrammwerten) 7

50 Häufigkeiten Auswertung des Fragebogens zum Kurs M2. Besuchst du regelmäßig die Cafeteria der Mensa? (Ausgabe eines Kuchendiagramms mit prozentualen Diagrammwerten) Regelmäßige r Be such der Cafete ria Gültig Fehlend Gesamt ja nein Gesamt System Gültige Kumulierte Häuf igkeit Prozent Prozente Prozente 92 71,3 72,4 72, ,1 27,6 100, ,4 100,0 2 1, ,0 Nahezu 3/4 der befragten Studenten besuchen regelmäßig die Mensa der FH Ingolstadt. 8

51 Häufigkeiten Auswertung des Fragebogens zum Kurs M3. Was würdest du zu einem Rauchverbot in der Cafeteria sagen? (Ausgabe eines Kuchendiagramms mit prozentualen Diagrammwerten) Me inung zu Rauchve rbot in der Cafete ria Gültig Fehlend Gesamt Ja, finde ich gut Nein, lehne ich ab Ist mir im Prinzip egal 8 Gesamt System Gültige Kumulierte Häufigkeit Prozent Prozente Prozente 37 28,7 33,0 33, ,2 34,8 67, ,8 20,5 88, ,1 11,6 100, ,8 100, , ,0 9

52 Häufigkeiten Auswertung des Fragebogens zum Kurs A1. Wie gefällt es Dir in Ingolstadt? (Ausgabe eines Balkendiagramms mit absoluten Diagrammwerten) Bewe rtung de r Stadt Ingols tadt Gültig Fehlend Gesamt Sehr gut Gut Weniger gut Nicht gut Weiß nicht Gesamt System Gültige Kumulierte Häufigkeit Prozent Prozente Prozente 33 25,6 25,8 25, ,6 64,1 89,8 8 6,2 6,3 96,1 4 3,1 3,1 99,2 1,8,8 100, ,2 100,0 1, ,0 Der Mehrzahl der Befragten gefällt Ingolstadt gut oder sogar sehr gut. 10

53 Häufigkeiten Auswertung des Fragebogens zum Kurs ST5. Wie viel Geld verwendest Du etwa im Monat für Abends zum Weggehen? (Ausgabe eines Balkendiagramms mit absoluten Diagrammwerten) Aus gabe n fürs Wegge he n Gültig Fehlend Gesamt 10! bis unter 30! 30! bis unter 50! 50! bis unter 70! 70! bis unter 100! 100! bis unter 130! 130! bis unter 150! 150! bis unter 200! mehr als 200! Gesamt System Gültige Kumulierte Häufigkeit Prozent Prozente Prozente 16 12,4 13,3 13, ,2 14,2 27, ,9 22,5 50, ,8 19,2 69,2 8 6,2 6,7 75,8 7 5,4 5,8 81,7 7 5,4 5,8 87, ,6 12,5 100, ,0 100,0 9 7, ,0 30% der Probanden geben fürs Weggehen mehr als 100 pro Abend aus. 11

54 Häufigkeiten Auswertung des Fragebogens zum Kurs ST6. Rauchst Du? (Ausgabe eines Kreisdiagramms mit prozentualen Diagrammwerten) Rauche r Gültig Fehlend Gesamt Nein, ich rauche nicht Ja, hin und w ieder Ja, regelmäßig Gesamt System Gültige Kumulierte Häuf igkeit Prozent Prozente Prozente 65 50,4 52,0 52, ,5 16,0 68, ,0 32,0 100, ,9 100,0 4 3, ,0 Über 50% der befragten Betriebswirtschaftsstudenten rauchen nicht. 12

55 Häufigkeiten Auswertung des Fragebogens zum Kurs ST7. Wie alt bist du? (Ausgabe eines Säulendiagramm mit absoluten Diagrammwerten) Gültig Fehlend Gesamt Gesamt System Alte r Gültige Kumulierte Häufigkeit Prozent Prozente Prozente 2 1,6 1,6 1, ,1 10,6 12,2 12 9,3 9,8 22, ,6 19,5 41, ,1 10,6 52, ,1 10,6 62,6 12 9,3 9,8 72, ,9 11,4 83,7 7 5,4 5,7 89,4 2 1,6 1,6 91,1 4 3,1 3,3 94,3 3 2,3 2,4 96,7 1,8,8 97,6 1,8,8 98,4 1,8,8 99,2 1,8,8 100, ,3 100,0 6 4, ,0 Die Mehrzahl der Teilnehmer geben... 13

56 Übungsblatt 2 Bitte bearbeiten Sie die Aufgabe 1 des Übungsblattes. 14

57 Überblick Häufigkeiten Lage- und Streuparameter Explorative Datenanalyse Datenmodifikation 15

58 Lage und Streuungsparameter Lageparameter die meist eingesetzten Maßzahlen sind Mittelwerte und Streuungswerte Anwendung i.d.r. nur bei metrischen Variablen wenn sinnvoll, sollten zu Mittelwerten immer geeignete Streuungsparameter angegeben werden, um die Häufigkeitsverteilung zu charakterisieren. Median Wert, der eine nach Größe sortierte Reihe von Merkmalsausprägungen in zwei gleich große Hälften teilt 50% der Fälle liegen oberhalb und 50% liegen unterhalb des Median Daten mindestens ordinalskaliert (Ordnung nach Größe zwingend) Anwendung: Bildung von Extremgruppen z.b. oberstes/unterstes Viertel der Einkommensvariable (Berechnung von Quartilen) Modalwert (Modus) Messwert, der in einem Datensatz am häufigsten vorkommt Gibt an, wo die größte Dichte einer Verteilung liegt nominale, ordinale und metrische Daten 16

59 Lage und Streuungsparameter Lageparameter Arithmetisches Mittel Maßzahl zur zentralen Tendenz von Daten Ermittlung der durchschnittlichen Merkmalsausprägung Daten mindestens intervallskaliert (in manchen Fällen auch ordinal) Alle Messwerte gehen mit vollem Gewicht in die Berechnung ein, so dass Extremwerte stark verzerren können prüfen ob es Ausreißer gibt Befragte, die mit weiß nicht oder die gar nicht geantwortet haben (und dafür z.b. die Codes 8, 9, oder 99 bekommen) müssen von der Mittelwertberechnung ausgeschlossen werden, indem sie als fehlende Werte definiert werden Das arithmetische Mittel ist nur dann ein wirklich guter mittlerer Kennwert einer Verteilung, wenn diese symmetrisch ist 17

60 Lage und Streuungsparameter Lageparameter Aus der Reihenfolge der drei Mittelwert arithmetisches Mitte, Modus und Median kann man Aussagen über die Form der Häufigkeitsverteilung von Variablen ableiten: 1. Linkssteile Verteilung Die Verteilung steigt links schnell an, erreicht ihren Gipfel und fällt dann langsam ab. Modus < Median < arithmetisches Mittel 2. Rechtssteile Verteilung Die Verteilung steigt links langsam an, erreicht ihren Gipfel und fällt rechts steil ab. arithmetisches Mittel < Median < Modus 3. Symmetrische Verteilung Alle drei Mittelwerte fallen auf einen Punkt. arithmetisches Mittel = Median = Modalwert 18 Die Form der Verteilung kann mittels SPSS festgestellt werden. Die Funktionen heißen Schiefe (Welche Seite der Verteilung ist länger?) und Kurtosis (Wölbung; je größer die Wölbung, desto stärker konzentrieren sich die Werte an einer bestimmten Stelle). Schiefe: rechtssteil < 0 < linkssteil Kurtosis: flachgipflig < 0 < hochgipflig

61 Lage und Streuungsparameter 19

62 Lage- und Streuungsparameter 20 Streuungsparameter Messung der Verteilung der Häufigkeitsverteilung um den Mittelwert Präzisiert die Aussage der Lageparameter Einfachste Streuungsparameter sind das Minimum (kleinste vorkommende Merkmalsausprägung) und das Maximum (größte vorkommende Merkmalsausprägung). Varianz Nur metrische Daten Bestimmung einer Art durchschnittliche Abweichung vom Mittelwert Je dichter die einzelnen Werte an dem Mittelwert liegen, desto kleiner ist die Varianz Die Varianz wird nicht in der Einheit der Variablenwerte gemessen Standardabweichung Nur metrische Daten Ermöglicht Vergleichbarkeit mit Mittelwerten Vergleichbarkeit bei Varianz nicht gegeben, da Einheit zum Quadrat Die Standardabweichung wird in der Einheit der Variablenwerte gemessen Spannweite Mindestens ordinalskalierte Daten Differenz zwischen dem größten und dem kleinsten Wert der Stichprobe Kann durch Ausreißer stark beeinflusst werden Standardfehler Nur metrische Daten Maß für die Streuung des Mittelwertes der Stichprobe bzw. verschiedener (potenzieller) Stichproben um den Mittelwert der Grundgesamtheit

63 Lage- und Streuungsparameter 21

64 Übungsblatt 2 Bitte bearbeiten Sie die Aufgabe 2 des Übungsblattes. 22

65 Überblick Häufigkeiten Lage- und Streuparameter Explorative Datenanalyse Datenmodifikation 23

66 Explorative Datenanalyse Explorative Datenanalyse Fehlerhaft erhobene oder eingegebene Daten bedeuten die Verzerrung der Ergebnisse, deshalb sollten Daten vor Beginn der Datenanalyse zunächst einer Plausibiltätsprüfung unterzogen werden Untersuchung und Begutachtung von Daten, von denen man nur geringes Wissen über deren Zusammenhänge hat Ziele der explorativen Datenanalyse 1. Überprüfung der Rohdaten und ggf. der Originalbelege 2. Prüfung der Verteilung der Werte und Identifikation von Ausreißern Stängel-Blatt-Diagramm Histogramm Perzentile M-Schätzer Ausreißer Schachtel-Diagramm Normalverteilungstest 3. Bildung von Hypothesen über Gründe und Zusammenhänge, die vorher nicht erkennbar waren 4. Hilfe zur Wahl des passenden statistischen Werkzeuges 24

67 Explorative Datenanalyse Explorative Datenanalyse 1. Grafische Darstellung der Werteverteilung Stängel-Blatt-Diagramm (Stem-and-Leaf) Histogramm 2. Lage der Werte beschreiben Perzentile Ausreißer-Analyse M-Schätzer Stängel-Blatt-Diagramm Histogramm Perzentile Ausreißer Schachtel-Diagramm M-Schätzer Normalverteilungstest 3. Test auf Normalverteilung 25

68 Explorative Datenanalyse Stem-and-Leaf Plot (Stängel-Blatt-Diagramm) Übersichtliche Darstellung von Variablen mit vielen unterschiedlichen Werten Liefert einen grafischen Eindruck von der Verteilung der Werte Erstellung per Hand Die n Beobachtungswerte werden der Größe nach geordnet 101, 103, 105, 111, 112, 112, 134 Wahl der Blatteinheit (stem width) (Zahl mit der multipliziert werden muss, um zum ursprünglichen Wert zurückzukehren) Üblicherweise 0,1 bzw. 1 bzw. 10 bzw. 100 So wählen, dass beim Teilen eine Nachkommastelle stehen bleibt. Hier: 10 Beobachtungswerte durch die Blatteinheit teilen 10,1 ; 10,3 ; 10,5 ; 11,1 ; 11,2 ; 11,2 ; 13,4 Den Modulus der Zahl (ohne Komma) bezeichnen wir als Stamm Den Wert hinter dem Komma als Blatt Frequency Stem & Leaf 3, , , , Stem width: 10,00 Each leaf: 1 case(s) 26

69 Explorative Datenanalyse Stem-and-Leaf Plot (Stängel-Blatt-Diagramm) ST8. Wie groß bist Du? (in cm) Größe Stem-and-Leaf Plot Frequency Stem & Leaf Gibt den ganzzahligen Teil der Werte wieder Gibt an, um welchen Faktor die Ursprungswerte von den im Diagramm angegebenen Werten abweichen Gibt die Anzahl der Werte an, die durch ein Blatt repräsentiert werden 1, , , , , , , , , Stem width: 10 Each leaf: 1 case(s) Gibt den Dezimalteil der Werte wieder 27

70 Explorative Datenanalyse Histogramm Das Histogramm vermittelt den gleichen Eindruck von der Werteverteilung wie das Stängel-Blatt- Diagramm, gibt aber keine Auskunft über die Verteilung der Werte innerhalb der einzelnen Klassen Werte werden in gruppierter Form (Werteklassen) betrachtet und durch Säulen dargestellt (Bereiche haben gleiche Breite). Die Werteklassen werden von SPSS automatisch gebildet. Nur metrische Daten * SPSS benötigt metrische Daten für die Darstellung eines Histogramms, in der Statistik gibt es Histogramme für ordinalskalierte Daten Wenig aussagekräftig, weil sich jeder einzelne Balken auf eine einzelne Kategorie bezieht. 28

71 Explorative Datenanalyse Explorative Datenanalyse 1. Grafische Darstellung der Werteverteilung Stängel-Blatt-Diagramm (Stem-and-Leaf) Histogramm 2. Lage der Werte beschreiben Perzentile Ausreißer-Analyse M-Schätzer Stängel-Blatt-Diagramm Histogramm Perzentile Ausreißer Schachtel-Diagramm M-Schätzer Normalverteilungstest 3. Test auf Normalverteilung 29

72 Explorative Datenanalyse Perzentile (auch Quantile, Fraktile) Ordnet man die Beobachtungswerte eines Merkmals der Reihe nach, so bestimmt sich der Wert eines x%-perzentils durch die Ausprägung des Falles an der x%ten Stelle. Das 40%-Perzentil dieser Verteilung hat den Wert 3 (0,4*15 = 6) Das 50%-Perzentil (Median) dieser Verteilung hat den Wert 4 (0,5*15 = 7,5 8) Fallnummer Ausprägung

73 Explorative Datenanalyse Perzentile (auch Quantile, Fraktile) 31

74 Explorative Datenanalyse Perzentile (auch Quantile, Fraktile) Die Explorative Datenanalyse gibt eine vorgegebene Auswahl an Perzentilen aus. Perze ntile Gew ichtetes Mittel (Definition 1) Tukey-A ngelpunkte A lter A lter Perzentile ,00 19,00 21,00 22,00 25,00 27,00 29,00 21,00 22,00 25,00 Mit Hilfe der Funktion Häufigkeiten lassen sich benutzerdefinierte Perzentile ausgeben (Analysieren > Deskriptive Statistik > Häufigkeiten > Statistik) Statistiken 32 Alter N Perzentile Gültig Fehlend ,00 20,00 21,00 21,00 22,00 23,00 24,00 25,00 27,00

75 Explorative Datenanalyse Ausreißeranalyse (Extremwerte) Durch das Anzeigen der Extremwerte (kleinste und größte Werte) können Ausreißer entdeckt werden. A lter a. b. Größte Werte Kleinste Werte Extremw erte Fallnummer Wert 96 ** a b Nur eine partielle Liste von Fällen mit dem Wert 29 w ird in der Tabelle der oberen Extremw erte angezeigt. Nur eine partielle Liste von Fällen mit dem Wert 19 w ird in der Tabelle der unteren Extremw erte angezeigt. 33

76 Explorative Datenanalyse Schachtel-Diagramm (Box Plot) Stellt die Lage der Werte und deren Streuung im Definitionsbereich dar Ausreißer und Extremwerte werden sichtbar gemacht 34 Ausreißer ( ): Extremwerte (*): Werte, die mehr als 1,5 Box-Längen vom 25%- oder 75%-Perzentil entfernt sind Werte, die mehr als 3 Box-Längen vom 25%- oder 75%-Perzentil entfernt sind

77 Explorative Datenanalyse Schachtel-Diagramm (Box Plot) Stellt die Lage der Werte und deren Streuung im Definitionsbereich dar Ausreißer und Extremwerte werden sichtbar gemacht Ausreißer höchster Wert, der kein Ausreißer ist 50% der Fälle 75% Perzentil Median 25% Perzentil niedrigster Wert, der kein Ausreißer ist 35 Ausreißer ( ): Extremwerte (*): Werte, die mehr als 1,5 Box-Längen vom 25%- oder 75%-Perzentil entfernt sind Werte, die mehr als 3 Box-Längen vom 25%- oder 75%-Perzentil entfernt sind

78 Explorative Datenanalyse M-Schätzer (Maximum-Likelihood-Schätzer) Mittelwertberechnung unter Berücksichtigung von Extremwerten Werte werden bei der Berechnung unterschiedlich stark gewichtet (je stärker ein Wert von den übrigen Werten abweicht, desto geringer ist das Gewicht) Datenbasis mit Fehleingaben Statistiken Berichtigte Datenbasis Statistiken Alter N Mittelwert Gültig Fehlend ,41 Alter N Mittelwert Gültig Fehlend ,79 M-Schätzer Alter M-Schätzer Tukey- M-Schätzer Andrewsnach Huber a Biweight b nach Hampel c Welle d 22,48 22,30 22,47 22,29 a. Die Gewichtungskonstante ist 1, b. Die Gewichtungskonstante ist 4,685. c. Die Gewichtungskonstanten sind 1,700, 3,400 und 8,500 d. Die Gewichtungskonstante ist 1,340*pi.

79 Explorative Datenanalyse Explorative Datenanalyse 1. Grafische Darstellung der Werteverteilung Stängel-Blatt-Diagramm (Stem-and-Leaf) Histogramm 2. Lage der Werte beschreiben Perzentile Ausreißer-Analyse M-Schätzer Stängel-Blatt-Diagramm Histogramm Perzentile Ausreißer Schachtel-Diagramm M-Schätzer Normalverteilungstest 3. Test auf Normalverteilung 37

80 Explorative Datenanalyse Test auf Normalverteilung Zahlreiche statistische Verfahren setzen voraus, dass die zu untersuchenden Daten annähernd normalverteilt sind SPSS bietet mit der Prozedur Explorative Datenanalyse folgende Möglichkeiten Daten auf Normalverteilung zu prüfen Normalverteilungsplots Empirisch beobachtete Werte werden den erwarteten Werten bei einer Normalverteilung gegenübergestellt Signifikanztests Errechnung einer Wahrscheinlichkeit, mit der das Zurückweisen der Hypothese, die Werte seien normalverteilt, fehlerhaft ist 38

81 Explorative Datenanalyse Normalverteilungsplots Theoretische Werte einer Normalverteilung Sind die empirischen Werte normalverteilt, müssen die einzelnen Punkte weitgehend dem Verlauf der Geraden folgen. Gravierender ist die Stärke der Abweichung in deren Form. Folgen die Werte einem klaren Muster, weichen die Werte systematisch von der Normalverteilung ab. Diese Grafik ist geeignet um ein Muster in den Abweichungen zu erkennen Wären die Stichprobenwerte normalverteilt, müssten die Punkte in der Grafik zufällig und nicht einem Muster folgend um die horizontale Linie streuen. 39 das Alter ist in der Grundgesamtheit nicht normalverteilt

82 Explorative Datenanalyse Signifikanztests Der Kolmogorov-Smirnov- und der Shapiro-Wilk-Test überprüfen beide die Nullhypothese, die Werte der untersuchten Variablen seien in der Grundgesamtheit normalverteilt Es wird eine Wahrscheinlichkeit errechnet, mit der das Zurückweisen dieser Hypothese falsch ist Je größer die Irrtumswahrscheinlichkeit, desto eher kann davon ausgegangen werden, dass die Werte normalverteilt sind. Kolmogorov-Smirnov: für große Stichproben geeignet Shapiro-Wilk-Test: ergänzend für kleine Stichproben (etwa weniger als 50) Tests auf Normalv erteilung Alter Kolmogorov-Smirnov a Shapiro-Wilk Statistik df Signifikanz Statistik df Signifikanz, ,000, ,000 a. Signifikanzkorrektur nach Lilliefors Irrtumswahrscheinlichkeit 40 Annahme einer Normalverteilung ist zurückzuweisen

83 Übungsblatt 2 Bitte bearbeiten Sie die Aufgabe 3 des Übungsblattes. 41

84 Überblick Häufigkeiten Lage- und Streuparameter Explorative Datenanalyse Datenmodifikation 42

1,11 1,12 1,13 1,14 1,15 1,16 1,17 1,17 1,17 1,18

1,11 1,12 1,13 1,14 1,15 1,16 1,17 1,17 1,17 1,18 3. Deskriptive Statistik Ziel der deskriptiven (beschreibenden) Statistik (explorativen Datenanalyse) ist die übersichtliche Darstellung der wesentlichen in den erhobenen Daten enthaltene Informationen

Mehr

Korrelation - Regression. Berghold, IMI

Korrelation - Regression. Berghold, IMI Korrelation - Regression Zusammenhang zwischen Variablen Bivariate Datenanalyse - Zusammenhang zwischen 2 stetigen Variablen Korrelation Einfaches lineares Regressionsmodell 1. Schritt: Erstellung eines

Mehr

Grundlagen der Datenanalyse am Beispiel von SPSS

Grundlagen der Datenanalyse am Beispiel von SPSS Grundlagen der Datenanalyse am Beispiel von SPSS Einführung Dipl. - Psych. Fabian Hölzenbein hoelzenbein@psychologie.uni-freiburg.de Einführung Organisatorisches Was ist Empirie? Was ist Statistik? Dateneingabe

Mehr

Einführung in SPSS. 1. Die Datei Seegräser

Einführung in SPSS. 1. Die Datei Seegräser Einführung in SPSS 1. Die Datei Seegräser An 25 verschiedenen Probestellen wurde jeweils die Anzahl der Seegräser pro m 2 gezählt und das Vorhandensein von Seeigeln vermerkt. 2. Programmaufbau Die wichtigsten

Mehr

Auswertung und Darstellung wissenschaftlicher Daten (1)

Auswertung und Darstellung wissenschaftlicher Daten (1) Auswertung und Darstellung wissenschaftlicher Daten () Mag. Dr. Andrea Payrhuber Zwei Schritte der Auswertung. Deskriptive Darstellung aller Daten 2. analytische Darstellung (Gruppenvergleiche) SPSS-Andrea

Mehr

Eine computergestützte Einführung mit

Eine computergestützte Einführung mit Thomas Cleff Deskriptive Statistik und Explorative Datenanalyse Eine computergestützte Einführung mit Excel, SPSS und STATA 3., überarbeitete und erweiterte Auflage ^ Springer Inhaltsverzeichnis 1 Statistik

Mehr

Auswertung mit dem Statistikprogramm SPSS: 30.11.05

Auswertung mit dem Statistikprogramm SPSS: 30.11.05 Auswertung mit dem Statistikprogramm SPSS: 30.11.05 Seite 1 Einführung SPSS Was ist eine Fragestellung? Beispiel Welche statistische Prozedur gehört zu welcher Hypothese? Statistische Berechnungen mit

Mehr

Kurze Einführung in IBM SPSS für Windows

Kurze Einführung in IBM SPSS für Windows Kurze Einführung in IBM SPSS für Windows SPSS Inc. Chicago (1968) SPSS GmbH Software München (1986) 1984: Datenanalyse Software für den PC 1992: Datenanalyse Software unter Windows 1993: Datenanalyse Software

Mehr

Deskriptive Statistik

Deskriptive Statistik Deskriptive Statistik In der beschreibenden Statistik werden Methoden behandelt, mit deren Hilfe man Daten übersichtlich darstellen und kennzeichnen kann. Die Urliste (=Daten in der Reihenfolge ihrer Erhebung)

Mehr

5.2 Optionen Auswahl der Statistiken, die bei der jeweiligen Prozedur zur Verfügung stehen.

5.2 Optionen Auswahl der Statistiken, die bei der jeweiligen Prozedur zur Verfügung stehen. 5 Statistik mit SPSS Die Durchführung statistischer Auswertungen erfolgt bei SPSS in 2 Schritten, der Auswahl der geeigneten Methode, bestehend aus Prozedur Variable Optionen und der Ausführung. 5.1 Variablen

Mehr

Einfache Statistiken in Excel

Einfache Statistiken in Excel Einfache Statistiken in Excel Dipl.-Volkswirtin Anna Miller Bergische Universität Wuppertal Schumpeter School of Business and Economics Lehrstuhl für Internationale Wirtschaft und Regionalökonomik Raum

Mehr

3 Zusammenhangsmaße Zusammenhangshypothesen

3 Zusammenhangsmaße Zusammenhangshypothesen 3 Zusammenhangsmaße Zusammenhangshypothesen Zusammenhänge (zwischen 2 Variablen) misst man mittels Korrelationen. Die Wahl der Korrelation hängt ab von: a) Skalenniveau der beiden Variablen: 1) intervallskaliert

Mehr

Kontingenzkoeffizient (nach Pearson)

Kontingenzkoeffizient (nach Pearson) Assoziationsmaß für zwei nominale Merkmale misst die Unabhängigkeit zweier Merkmale gibt keine Richtung eines Zusammenhanges an 46 o jl beobachtete Häufigkeiten der Kombination von Merkmalsausprägungen

Mehr

2. Deskriptive Statistik 2.1. Häufigkeitstabellen, Histogramme, empirische Verteilungsfunktionen

2. Deskriptive Statistik 2.1. Häufigkeitstabellen, Histogramme, empirische Verteilungsfunktionen 4. Datenanalyse und Modellbildung Deskriptive Statistik 2-1 2. Deskriptive Statistik 2.1. Häufigkeitstabellen, Histogramme, empirische Verteilungsfunktionen Für die Auswertung einer Messreihe, die in Form

Mehr

fh management, communication & it Constantin von Craushaar fh-management, communication & it Statistik Angewandte Statistik

fh management, communication & it Constantin von Craushaar fh-management, communication & it Statistik Angewandte Statistik fh management, communication & it Folie 1 Angewandte Statistik Übersicht Semester 1 Einführung ins SPSS Auswertung im SPSS anhand eines einfachen Beispieles Häufigkeitsauswertungen Grafiken Datenmanipulationen

Mehr

Evaluation der Normalverteilungsannahme

Evaluation der Normalverteilungsannahme Evaluation der Normalverteilungsannahme. Überprüfung der Normalverteilungsannahme im SPSS P. Wilhelm; HS SPSS bietet verschiedene Möglichkeiten, um Verteilungsannahmen zu überprüfen. Angefordert werden

Mehr

3.2 Bivariate Verteilungen

3.2 Bivariate Verteilungen 3.2 Bivariate Verteilungen zwei Variablen X, Y werden gemeinsam betrachtet (an jedem Objekt i, i = 1,..., n, werden gleichzeitig zwei Merkmale beobachtet) Beobachtungswerte sind Paare/Kombinationen von

Mehr

Häufigkeitstabellen. Balken- oder Kreisdiagramme. kritischer Wert für χ2-test. Kontingenztafeln

Häufigkeitstabellen. Balken- oder Kreisdiagramme. kritischer Wert für χ2-test. Kontingenztafeln Häufigkeitstabellen Menüpunkt Data PivotTable Report (bzw. entsprechendes Icon): wähle Data Range (Zellen, die die Daten enthalten + Zelle mit Variablenname) wähle kategoriale Variable für Spalten- oder

Mehr

Standardab er des. Testwert = 145.5 95% Konfidenzintervall. T df Sig. (2-seitig) Differenz Untere Obere -2.011 698.045-5.82-11.50 -.14.

Standardab er des. Testwert = 145.5 95% Konfidenzintervall. T df Sig. (2-seitig) Differenz Untere Obere -2.011 698.045-5.82-11.50 -.14. Aufgabe : einfacher T-Test Statistik bei einer Stichprobe Standardfehl Standardab er des Mittelwert weichung Mittelwertes 699 39.68 76.59 2.894 Test bei einer Sichprobe Testwert = 45.5 95% Konfidenzintervall

Mehr

6. METRISCHE UND KATEGORIALE MERKMALE

6. METRISCHE UND KATEGORIALE MERKMALE 6. METRISCHE UND KATEGORIALE MERKMALE wenn an einer Beobachtungseinheit eine (oder mehrere) metrische und eine (oder mehrere) kategoriale Variable(n) erhoben wurden Beispiel: Haushaltsarbeit von Teenagern

Mehr

Grundlagen Statistik Angewandte Statistik 3. Semester

Grundlagen Statistik Angewandte Statistik 3. Semester Angewandte Statistik 3. Semester Zur Person Constantin von Craushaar Consultant / Partner Innstat e.u. (www.innstat.com) info@innstat.com Grundlagen der Statistik Übersicht Semester 1 Einführung ins SPSS

Mehr

Einseitig gerichtete Relation: Mit zunehmender Höhe über dem Meeresspiegel sinkt im allgemeinen die Lufttemperatur.

Einseitig gerichtete Relation: Mit zunehmender Höhe über dem Meeresspiegel sinkt im allgemeinen die Lufttemperatur. Statistik Grundlagen Charakterisierung von Verteilungen Einführung Wahrscheinlichkeitsrechnung Wahrscheinlichkeitsverteilungen Schätzen und Testen Korrelation Regression Einführung Die Analyse und modellhafte

Mehr

Institut für Soziologie Dr. Christian Ganser. Methoden 2. Einführung, grundlegende PASW-Bedienung, univariate Statistik

Institut für Soziologie Dr. Christian Ganser. Methoden 2. Einführung, grundlegende PASW-Bedienung, univariate Statistik Institut für Soziologie Dr. Methoden 2 Einführung, grundlegende PASW-Bedienung, univariate Statistik Programm Wiederholung zentraler Aspekten der Übungen Literatur zur Veranstaltung Erste Schritte mit

Mehr

Methoden Quantitative Datenanalyse

Methoden Quantitative Datenanalyse Leitfaden Universität Zürich ISEK - Andreasstrasse 15 CH-8050 Zürich Telefon +41 44 635 22 11 Telefax +41 44 635 22 19 www.isek.uzh.ch 11. September 2014 Methoden Quantitative Datenanalyse Vorbereitung

Mehr

Kreuztabellenanalyse -Zusammenhangsmaße

Kreuztabellenanalyse -Zusammenhangsmaße Lehrveranstaltung Empirische Forschung und Politikberatung der Universität Bonn, WS 2007/2008 Kreuztabellenanalyse -Zusammenhangsmaße 14. Dezember 2007 Anja Hall, Bundesinstitut für Berufsbildung, AB 2.2:

Mehr

Einleitung 19. Teil I SPSS kennen lernen 25. Kapitel 1 In 25 Minuten zum SPSS-Profi 27

Einleitung 19. Teil I SPSS kennen lernen 25. Kapitel 1 In 25 Minuten zum SPSS-Profi 27 Inhaltsverzeichnis Einleitung 19 SPSS oder PASW oder was? 19 Über dieses Buch 20 Konventionen in diesem Buch 20 Was Sie nicht lesen müssen 21 Törichte Annahmen über den Leser 21 Wie dieses Buch aufgebaut

Mehr

Datenanalyse mit SPSS spezifische Analysen

Datenanalyse mit SPSS spezifische Analysen Datenanalyse mit SPSS spezifische Analysen Arnd Florack Tel.: 0251 / 83-34788 E-Mail: florack@psy.uni-muenster.de Raum 2.015 Sprechstunde: Dienstags 15-16 Uhr 25. Mai 2001 2 Auswertung von Häufigkeitsdaten

Mehr

Abhängigkeit zweier Merkmale

Abhängigkeit zweier Merkmale Abhängigkeit zweier Merkmale Johannes Hain Lehrstuhl für Mathematik VIII Statistik 1/33 Allgemeine Situation Neben der Untersuchung auf Unterschiede zwischen zwei oder mehreren Untersuchungsgruppen hinsichtlich

Mehr

90-minütige Klausur Statistik für Studierende der Kommunikationswissenschaft

90-minütige Klausur Statistik für Studierende der Kommunikationswissenschaft Prof. Dr. Helmut Küchenhoff SS08 90-minütige Klausur Statistik für Studierende der Kommunikationswissenschaft am 22.7.2008 Anmerkungen Überprüfen Sie bitte sofort, ob Ihre Angabe vollständig ist. Sie sollte

Mehr

Skript zur Übung: Grundlagen der empirischen Sozialforschung - Datenanalyse

Skript zur Übung: Grundlagen der empirischen Sozialforschung - Datenanalyse Skript zur Übung: Grundlagen der empirischen Sozialforschung - Datenanalyse Phasen des Forschungsprozesses Auswahl des Forschungsproblems Theoriebildung Theoretische Phase Konzeptspezifikation / Operationalisierung

Mehr

Verteilungsanalyse. Johannes Hain. Lehrstuhl für Mathematik VIII Statistik 1/35

Verteilungsanalyse. Johannes Hain. Lehrstuhl für Mathematik VIII Statistik 1/35 Verteilungsanalyse Johannes Hain Lehrstuhl für Mathematik VIII Statistik 1/35 Datentypen Als Sammeln von Daten bezeichnet man in der Statistik das Aufzeichnen von Fakten. Erhobene Daten klassifziert man

Mehr

Elisabeth Raab-Steiner/Michael Benesch. Der Fragebogen. Von der Forschungsidee zur SPSS/PASW-Auswertung. 2., aktualisierte Auflage. facultas.

Elisabeth Raab-Steiner/Michael Benesch. Der Fragebogen. Von der Forschungsidee zur SPSS/PASW-Auswertung. 2., aktualisierte Auflage. facultas. Elisabeth Raab-Steiner/Michael Benesch Der Fragebogen Von der Forschungsidee zur SPSS/PASW-Auswertung 2., aktualisierte Auflage facultas.wuv Inhaltsverzeichnis 1 Elementare Definitionen 11 1.1 Deskriptive

Mehr

Das Dialogfeld für die Regressionsanalyse ("Lineare Regression") findet sich im Statistik- Menu unter "Regression"-"Linear":

Das Dialogfeld für die Regressionsanalyse (Lineare Regression) findet sich im Statistik- Menu unter Regression-Linear: Lineare Regression Das Dialogfeld für die Regressionsanalyse ("Lineare Regression") findet sich im Statistik- Menu unter "Regression"-"Linear": Im einfachsten Fall werden mehrere Prädiktoren (oder nur

Mehr

Einführung in die Statistik mir R

Einführung in die Statistik mir R Einführung in die Statistik mir R ww w. syn t egris.de Überblick GESCHÄFTSFÜHRUNG Andreas Baumgart, Business Processes and Service Gunar Hofmann, IT Solutions Sven-Uwe Weller, Design und Development Jens

Mehr

Erste Schritte mit SPSS - eine Anleitung

Erste Schritte mit SPSS - eine Anleitung Der Internetdienst für Ihre Online-Umfragen Erste Schritte mit SPSS - eine Anleitung -1- Weitere in dieser Reihe bei 2ask erschienene Leitfäden Allgemeiner Leitfaden zur Fragebogenerstellung Sie möchten

Mehr

Multiple Regression. Ziel: Vorhersage der Werte einer Variable (Kriterium) bei Kenntnis der Werte von zwei oder mehr anderen Variablen (Prädiktoren)

Multiple Regression. Ziel: Vorhersage der Werte einer Variable (Kriterium) bei Kenntnis der Werte von zwei oder mehr anderen Variablen (Prädiktoren) Multiple Regression 1 Was ist multiple lineare Regression? Ziel: Vorhersage der Werte einer Variable (Kriterium) bei Kenntnis der Werte von zwei oder mehr anderen Variablen (Prädiktoren) Annahme: Der Zusammenhang

Mehr

Grundlagen quantitativer Sozialforschung Interferenzstatistische Datenanalyse in MS Excel

Grundlagen quantitativer Sozialforschung Interferenzstatistische Datenanalyse in MS Excel Grundlagen quantitativer Sozialforschung Interferenzstatistische Datenanalyse in MS Excel 16.11.01 MP1 - Grundlagen quantitativer Sozialforschung - (4) Datenanalyse 1 Gliederung Datenanalyse (inferenzstatistisch)

Mehr

Methoden der empirischen Sozialforschung I

Methoden der empirischen Sozialforschung I Methoden der empirischen Sozialforschung I Annelies Blom, PhD TU Kaiserslautern Wintersemester 2011/12 Übersicht Quantitative Datenauswertung: deskriptive und induktive Statistik Wiederholung: Die wichtigsten

Mehr

Inhaltsverzeichnis. Regressionsanalyse. http://mesosworld.ch - Stand vom: 20.1.2010 1

Inhaltsverzeichnis. Regressionsanalyse. http://mesosworld.ch - Stand vom: 20.1.2010 1 Inhaltsverzeichnis Regressionsanalyse... 2 Lernhinweise... 2 Einführung... 2 Theorie (1-8)... 2 1. Allgemeine Beziehungen... 3 2. 'Best Fit'... 3 3. 'Ordinary Least Squares'... 4 4. Formel der Regressionskoeffizienten...

Mehr

Grundlagen der Inferenzstatistik: Was Ihnen nicht erspart bleibt!

Grundlagen der Inferenzstatistik: Was Ihnen nicht erspart bleibt! Grundlagen der Inferenzstatistik: Was Ihnen nicht erspart bleibt! 1 Einführung 2 Wahrscheinlichkeiten kurz gefasst 3 Zufallsvariablen und Verteilungen 4 Theoretische Verteilungen (Wahrscheinlichkeitsfunktion)

Mehr

Bachelorabschlussseminar Dipl.-Kfm. Daniel Cracau

Bachelorabschlussseminar Dipl.-Kfm. Daniel Cracau 1 Einführung in die statistische Datenanalyse Bachelorabschlussseminar Dipl.-Kfm. Daniel Cracau 2 Gliederung 1.Grundlagen 2.Nicht-parametrische Tests a. Mann-Whitney-Wilcoxon-U Test b. Wilcoxon-Signed-Rank

Mehr

Grundbegriffe (1) Grundbegriffe (2)

Grundbegriffe (1) Grundbegriffe (2) Grundbegriffe (1) S.1 Äquivalenzklasse Unter einer Äquivalenzklasse versteht man eine Klasse von Objekten, die man hinsichtlich bestimmter Merkmalsausprägungen als gleich (äquivalent) betrachtet. (z.b.

Mehr

Kommentierter SPSS-Ausdruck zur logistischen Regression

Kommentierter SPSS-Ausdruck zur logistischen Regression Daten: POK V AG 3 (POKV_AG3_V07.SAV) Kommentierter SPSS-Ausdruck zur logistischen Regression Fragestellung: Welchen Einfluss hat die Fachnähe und das Geschlecht auf die interpersonale Attraktion einer

Mehr

SPSS 16 für b ummies

SPSS 16 für b ummies Felix Brosius SPSS 16 für b ummies WILEY- VCH WILEY-VCH Verlag GmbH & Co. KGaA Inhaltsverzeichnis Über den Autor 7 Einführung 21 Über dieses Buch 21 Konventionen in diesem Buch 22 Was Sie nicht lesen müssen

Mehr

2. Korrelation, lineare Regression und multiple Regression

2. Korrelation, lineare Regression und multiple Regression multiple 2.2 Lineare 2.2 Lineare 1 / 130 2.2 Lineare 2 / 130 2.1 Beispiel: Arbeitsmotivation Untersuchung zur Motivation am Arbeitsplatz in einem Chemie-Konzern 25 Personen werden durch Arbeitsplatz zufällig

Mehr

Modul G.1 WS 07/08: Statistik 17.01.2008 1. Die Korrelation ist ein standardisiertes Maß für den linearen Zusammenhangzwischen zwei Variablen.

Modul G.1 WS 07/08: Statistik 17.01.2008 1. Die Korrelation ist ein standardisiertes Maß für den linearen Zusammenhangzwischen zwei Variablen. Modul G.1 WS 07/08: Statistik 17.01.2008 1 Wiederholung Kovarianz und Korrelation Kovarianz = Maß für den linearen Zusammenhang zwischen zwei Variablen x und y Korrelation Die Korrelation ist ein standardisiertes

Mehr

Anhang A: Fragebögen und sonstige Unterlagen

Anhang A: Fragebögen und sonstige Unterlagen Anhang Anhang A: Fragebögen und sonstige Unterlagen A.: Flyer zur Probandenrekrutierung 46 A.: Fragebogen zur Meditationserfahrung 47 48 A.3: Fragebogen Angaben zur Person 49 5 5 A.4: Termin- und Einladungsschreiben

Mehr

2. Eindimensionale (univariate) Datenanalyse

2. Eindimensionale (univariate) Datenanalyse 2. Eindimensionale (univariate) Datenanalyse Dr. Antje Kiesel Institut für Angewandte Mathematik WS 2011/2012 Kennzahlen, Statistiken In der Regel interessieren uns nicht so sehr die beobachteten Einzeldaten

Mehr

Weitere (wählbare) Kontraste in der SPSS Prozedur Allgemeines Lineares Modell

Weitere (wählbare) Kontraste in der SPSS Prozedur Allgemeines Lineares Modell Einfaktorielle Versuchspläne 27/40 Weitere (wählbare) Kontraste in der SPSS Prozedur Allgemeines Lineares Modell Abweichung Einfach Differenz Helmert Wiederholt Vergleich Jede Gruppe mit Gesamtmittelwert

Mehr

SPSS-Skriptum. 1. Vorbereitungen für die Arbeit mit SPSS (im Seminar)

SPSS-Skriptum. 1. Vorbereitungen für die Arbeit mit SPSS (im Seminar) Die folgenden Erklärungen und Abbildungen sollen den Umgang mit SPSS im Rahmen des POK erleichtern. Diese beschreiben nicht alle Möglichkeiten, die SPSS bietet, sondern nur die Verfahren, die im Seminar

Mehr

Übungsserie Nr. 10 mit Lösungen

Übungsserie Nr. 10 mit Lösungen Übungsserie Nr. 10 mit Lösungen 1 Ein Untersuchungsdesign sieht einen multivariaten Vergleich einer Stichprobe von Frauen mit einer Stichprobe von Männern hinsichtlich der Merkmale X1, X2 und X3 vor (Codierung:

Mehr

Regressionsanalysen. Zusammenhänge von Variablen. Ziel der Regression. ( Idealfall )

Regressionsanalysen. Zusammenhänge von Variablen. Ziel der Regression. ( Idealfall ) Zusammenhänge von Variablen Regressionsanalysen linearer Zusammenhang ( Idealfall ) kein Zusammenhang nichtlinearer monotoner Zusammenhang (i.d.regel berechenbar über Variablentransformationen mittels

Mehr

Der Internetdienst für Ihre Online-Umfragen. Leitfaden statistische Auswertung

Der Internetdienst für Ihre Online-Umfragen. Leitfaden statistische Auswertung Der Internetdienst für Ihre Online-Umfragen Leitfaden statistische Auswertung Weitere in dieser Reihe bei 2ask erschienene Leitfäden Allgemeiner Leitfaden zur Fragebogenerstellung Sie möchten einen Fragebogen

Mehr

0 Einführung: Was ist Statistik

0 Einführung: Was ist Statistik 0 Einführung: Was ist Statistik 1 Datenerhebung und Messung Die Messung Skalenniveaus 2 Univariate deskriptive Statistik 3 Multivariate Statistik 4 Regression 5 Ergänzungen Grundbegriffe Statistische Einheit,

Mehr

Verteilungsanalyse. Johannes Hain. Lehrstuhl für Mathematik VIII Statistik 1/31

Verteilungsanalyse. Johannes Hain. Lehrstuhl für Mathematik VIII Statistik 1/31 Verteilungsanalyse Johannes Hain Lehrstuhl für Mathematik VIII Statistik 1/31 Datentypen Als Sammeln von Daten bezeichnet man in der Statistik das Aufzeichnen von Fakten. Erhobene Daten klassifziert man

Mehr

Analyse bivariater Kontingenztafeln

Analyse bivariater Kontingenztafeln Analyse bivariater Kontingenztafeln Werden zwei kategoriale Merkmale mit nicht zu vielen möglichen Ausprägungen gemeinsam analysiert, so kommen zur Beschreibung der gemeinsamen Verteilung im allgemeinen

Mehr

Univariate Lineare Regression. (eine unabhängige Variable)

Univariate Lineare Regression. (eine unabhängige Variable) Univariate Lineare Regression (eine unabhängige Variable) Lineare Regression y=a+bx Präzise lineare Beziehung a.. Intercept b..anstieg y..abhängige Variable x..unabhängige Variable Lineare Regression y=a+bx+e

Mehr

IBM SPSS Statistics Base 22

IBM SPSS Statistics Base 22 IBM SPSS Statistics Base 22 Hinweis Vor Verwendung dieser Informationen und des darin beschriebenen Produkts sollten die Informationen unter Bemerkungen auf Seite 199 gelesen werden. Produktinformation

Mehr

Statistik und Wahrscheinlichkeitsrechnung

Statistik und Wahrscheinlichkeitsrechnung Statistik und Wahrscheinlichkeitsrechnung Übung 2 28.02.2008 1 Inhalt der heutigen Übung Beschreibende Statistik Gemeinsames Lösen der Übungsaufgaben 2.1: Häufigkeitsverteilung 2.2: Tukey Boxplot 25:Korrelation

Mehr

SFB 833 Bedeutungskonstitution. Kompaktkurs. Datenanalyse. Projekt Z2 Tübingen, Mittwoch, 18. und 20. März 2015

SFB 833 Bedeutungskonstitution. Kompaktkurs. Datenanalyse. Projekt Z2 Tübingen, Mittwoch, 18. und 20. März 2015 SFB 833 Bedeutungskonstitution Kompaktkurs Datenanalyse Projekt Z2 Tübingen, Mittwoch, 18. und 20. März 2015 Messen und Skalen Relativ (Relationensystem): Menge A von Objekten und eine oder mehrere Relationen

Mehr

Multivariate Statistik

Multivariate Statistik Hermann Singer Multivariate Statistik 1 Auflage 15 Oktober 2012 Seite: 12 KAPITEL 1 FALLSTUDIEN Abbildung 12: Logistische Regression: Geschätzte Wahrscheinlichkeit für schlechte und gute Kredite (rot/blau)

Mehr

Allgemeines Lineares Modell: Univariate Varianzanalyse und Kovarianzanalyse

Allgemeines Lineares Modell: Univariate Varianzanalyse und Kovarianzanalyse Allgemeines Lineares Modell: Univariate Varianzanalyse und Kovarianzanalyse Univariate Varianz- und Kovarianzanlyse, Multivariate Varianzanalyse und Varianzanalyse mit Messwiederholung finden sich unter

Mehr

Statistik im Bachelor-Studium der BWL und VWL

Statistik im Bachelor-Studium der BWL und VWL Max C. Wewel Statistik im Bachelor-Studium der BWL und VWL Methoden, Anwendung, Interpretation Mit herausnehmbarer Formelsammlung ein Imprint von Pearson Education München Boston San Francisco Harlow,

Mehr

Varianzanalyse ANOVA

Varianzanalyse ANOVA Varianzanalyse ANOVA Johannes Hain Lehrstuhl für Mathematik VIII Statistik 1/23 Einfaktorielle Varianzanalyse (ANOVA) Bisher war man lediglich in der Lage, mit dem t-test einen Mittelwertsvergleich für

Mehr

8. Methoden der klassischen multivariaten Statistik

8. Methoden der klassischen multivariaten Statistik 8. Methoden der klassischen multivariaten Statistik 8.1. Darstellung von Daten Voraussetzungen auch in diesem Kapitel: Grundgesamtheit (Datenraum) Ω von Objekten (Fällen, Instanzen), denen J-Tupel von

Mehr

Institut für Soziologie. Methoden 2. Regressionsanalyse I: Einfache lineare Regression

Institut für Soziologie. Methoden 2. Regressionsanalyse I: Einfache lineare Regression Institut für Soziologie Methoden 2 Regressionsanalyse I: Einfache lineare Regression Programm Anwendungsbereich Vorgehensweise Interpretation Annahmen Zusammenfassung Übungsaufgabe Literatur # 2 Anwendungsbereich

Mehr

Eine Einführung in SPSS

Eine Einführung in SPSS Eine Einführung in SPSS Aufbau von SPSS 14 Bemerkung: SPSS 14 kann in den Subzentren in der Kopernikusgasse installiert werden, falls dies noch nicht geschehen ist. Dazu öffnet man den Application Explorer

Mehr

Grundlagen von Versuchsmethodik und Datenanalyse

Grundlagen von Versuchsmethodik und Datenanalyse Grundlagen von Versuchsmethodik und Datenanalyse Der Anfang: Hypothesen über Ursache-Wirkungs-Zusammenhänge Ursache Wirkung Koffein verbessert Kurzzeitgedächtnis Gewaltfilme führen zu aggressivem Verhalten

Mehr

Willkommen zur Vorlesung Statistik

Willkommen zur Vorlesung Statistik Willkommen zur Vorlesung Statistik Thema dieser Vorlesung: Varianzanalyse Prof. Dr. Wolfgang Ludwig-Mayerhofer Universität Siegen Philosophische Fakultät, Seminar für Sozialwissenschaften Prof. Dr. Wolfgang

Mehr

Quantitative Methoden der Bildungsforschung

Quantitative Methoden der Bildungsforschung Glieung Wieholung Korrelationen Grundlagen lineare Regression Lineare Regression in SPSS Übung Wieholung Korrelationen Standardisiertes Zusammenhangsmaß (unstandardisiert: Kovarianz) linearer Zusammenhang

Mehr

Analog zu Aufgabe 16.1 werden die Daten durch folgenden Befehl eingelesen: > kredit<-read.table("c:\\compaufg\\kredit.

Analog zu Aufgabe 16.1 werden die Daten durch folgenden Befehl eingelesen: > kredit<-read.table(c:\\compaufg\\kredit. Lösung 16.3 Analog zu Aufgabe 16.1 werden die Daten durch folgenden Befehl eingelesen: > kredit

Mehr

Kapitel 33 Hoch-Tief-Diagramme

Kapitel 33 Hoch-Tief-Diagramme Kapitel 33 Hoch-Tief-Diagramme 33.1 Diagrammtypen In einem Hoch-Tief-Diagramm werden Wertepaare oder -tripel dargestellt. Einen typischen Anwendungsfall für Hoch-Tief-Diagramme bildet die Darstellung von

Mehr

Einführung: Empirisch Forschungsmethoden Grundlagen von SPSS WS 2008/2009

Einführung: Empirisch Forschungsmethoden Grundlagen von SPSS WS 2008/2009 TUM School of Education Technische Universität München Einführung: Empirisch Forschungsmethoden Grundlagen von SPSS WS 2008/2009 Ariane S. Willems Lothstraße 17 80335 München Telefon: 089/289-24374 Email:

Mehr

3 Deskriptive Statistik in R (univariat)

3 Deskriptive Statistik in R (univariat) (univariat) Markus Burkhardt (markus.burkhardt@psychologie.tu-chemnitz.de) Inhalt 3.1 Ziel... 1 3.2 Häufigkeiten... 1 3.3 Deskriptive Kennziffern I Lagemaße... 2 3.4 Streuungsmaße... 5 3.5 Standardisierung:

Mehr

Stichprobenauslegung. für stetige und binäre Datentypen

Stichprobenauslegung. für stetige und binäre Datentypen Stichprobenauslegung für stetige und binäre Datentypen Roadmap zu Stichproben Hypothese über das interessierende Merkmal aufstellen Stichprobe entnehmen Beobachtete Messwerte abbilden Schluss von der Beobachtung

Mehr

Inhaltsverzeichnis. I Einführung in STATISTICA 1. 1 Erste Schritte in STATISTICA 3

Inhaltsverzeichnis. I Einführung in STATISTICA 1. 1 Erste Schritte in STATISTICA 3 I Einführung in STATISTICA 1 1 Erste Schritte in STATISTICA 3 2 Datenhaltung in STATISTICA 11 2.1 Die unterschiedlichen Dateitypen in STATISTICA....... 11 2.2 Import von Daten......... 12 2.3 Export von

Mehr

Varianzanalytische Methoden Zweifaktorielle Versuchspläne 4/13. Durchführung in SPSS (File Trait Angst.sav)

Varianzanalytische Methoden Zweifaktorielle Versuchspläne 4/13. Durchführung in SPSS (File Trait Angst.sav) Zweifaktorielle Versuchspläne 4/13 Durchführung in SPSS (File Trait Angst.sav) Analysieren > Allgemeines Lineares Modell > Univariat Zweifaktorielle Versuchspläne 5/13 Haupteffekte Geschlecht und Gruppe

Mehr

Linearer Zusammenhang von Datenreihen

Linearer Zusammenhang von Datenreihen Linearer Zusammenhang von Datenreihen Vielen Problemen liegen (möglicherweise) lineare Zusammenhänge zugrunde: Mein Internetanbieter verlangt eine Grundgebühr und rechnet minutenweise ab Ich bestelle ein

Mehr

Übungen zur Veranstaltung Statistik 2 mit SPSS

Übungen zur Veranstaltung Statistik 2 mit SPSS Raum 22, Tel. 39 4 Aufgabe 5. Wird der neue Film MatchPoint von Woody Allen von weiblichen und männlichen Zuschauern gleich bewertet? Eine Umfrage unter 00 Kinobesuchern ergab folgende Daten: Altersgruppe

Mehr

Prüfung zu Modul 26 (BA Bw) bzw. 10 (BA IB) (Wirtschaftsstatistik)

Prüfung zu Modul 26 (BA Bw) bzw. 10 (BA IB) (Wirtschaftsstatistik) 2 3 Klausur-Nr = Sitzplatz-Nr Prüfung zu Modul 26 (BA Bw) bzw. 10 (BA IB) (Wirtschaftsstatistik) Klausurteil 1: Beschreibende Statistik BeStat-1 (7 ) n = 400 Personen wurden gefragt, wie viele Stück eines

Mehr

IBM SPSS Statistics Base 21

IBM SPSS Statistics Base 21 IBM SPSS Statistics Base 21 Hinweis: Lesen Sie zunächst die allgemeinen Informationen unter Hinweise auf S. 343, bevor Sie dieses Informationsmaterial sowie das zugehörige Produkt verwenden. Diese Ausgabe

Mehr

Webergänzung zu Kapitel 10

Webergänzung zu Kapitel 10 Webergänzung zu Kapitel 10 10.1.4 Varianzanalyse (ANOVA: analysis of variance) Im Kapitel 10 haben wir uns hauptsächlich mit Forschungsbeispielen beschäftigt, die nur zwei Ergebnissätze hatten (entweder

Mehr

9. Schätzen und Testen bei unbekannter Varianz

9. Schätzen und Testen bei unbekannter Varianz 9. Schätzen und Testen bei unbekannter Varianz Dr. Antje Kiesel Institut für Angewandte Mathematik WS 2011/2012 Schätzen und Testen bei unbekannter Varianz Wenn wir die Standardabweichung σ nicht kennen,

Mehr

Grundbegriffe der Beschreibenden Statistik

Grundbegriffe der Beschreibenden Statistik Grundbegriffe der Beschreibenden Statistik 1. Datenmatrix und Messniveaus...3 1.1. Merkmale, Datenmatrix, uni- und multivariate Analysen...3 1.2. Messniveaus (Skalentypen)...4 2. Ausgewählte Verfahren

Mehr

Datenanalyse und Statistik

Datenanalyse und Statistik Datenanalyse und Statistik p. 1/44 Datenanalyse und Statistik Vorlesung 2 (Graphik I) K.Gerald van den Boogaart http://www.stat.boogaart.de Datenanalyse und Statistik p. 2/44 Daten Schätzung Test Mathe

Mehr

Medizinische Statistik

Medizinische Statistik FH JENA Medizinische Statistik Einführung in SPSS V22 J. Schütze / M. Walther 2015 Literatur: Bühl, A.: "SPSS 20 - Einführung in die moderne Datenanalyse, 13. Auflage, Pearson Studium, 2011 Kähler, W.-M.:

Mehr

Prof. Dr. Achim Bühl SPSS 20. Einführung in die moderne Datenanalyse. 13., aktualisierte Auflage. Higher Education

Prof. Dr. Achim Bühl SPSS 20. Einführung in die moderne Datenanalyse. 13., aktualisierte Auflage. Higher Education SPSS 20 SPSS 20 Prof. Dr. Achim Bühl Einführung in die moderne Datenanalyse 13., aktualisierte Auflage Higher Education Bibliografische Information der Deutschen Nationalbibliothek Die Deutsche Nationalbibliothek

Mehr

Kapitel 23 Lineare Regression

Kapitel 23 Lineare Regression Kapitel 23 Lineare Regression Sowohl einfache als auch multiple Regressionsanalysen können Sie mit dem Befehl STATISTIK REGRESSION LINEAR... durchführen. Dabei lassen sich mit Hilfe diverser Optionen zahlreiche

Mehr

T-TEST BEI EINER STICHPROBE:

T-TEST BEI EINER STICHPROBE: Kapitel 19 T-Test Mit Hilfe der T-TEST-Prozeduren werden Aussagen über Mittelwerte getroffen. Dabei wird versucht, aus den Beobachtungen einer Stichprobe Rückschlüsse auf die Grundgesamtheit zu ziehen.

Mehr

Multivariate Analyse: Einführung in das COX-Modell

Multivariate Analyse: Einführung in das COX-Modell Auswertung Multivariate Analyse: Einführung in das COX-Modell Deskriptive Statistik Häufigkeiten, Univariate Statistiken, Explorative Datenanalyse, Kreuztabellen) Induktive Statistik, Vergleich von Mittelwerten

Mehr

Univariate/ multivariate Ansätze. Klaus D. Kubinger. Test- und Beratungsstelle. Effektgrößen

Univariate/ multivariate Ansätze. Klaus D. Kubinger. Test- und Beratungsstelle. Effektgrößen Univariate/ multivariate Ansätze Klaus D. Kubinger Effektgrößen Rasch, D. & Kubinger, K.D. (2006). Statistik für das Psychologiestudium Mit Softwareunter-stützung zur Planung und Auswertung von Untersuchungen

Mehr

Varianzananalyse. How to do

Varianzananalyse. How to do Varianzananalyse How to do Die folgende Zusammenfassung zeigt beispielhaft, wie eine Varianzanalyse mit SPSS durchgeführt wird und wie die Ergebnisse in einem Empra-Bericht oder in einer Bachelor- oder

Mehr

5.2. Nichtparametrische Tests. 5.2.1. Zwei unabhängige Stichproben: U- Test nach MANN- WHITNEY

5.2. Nichtparametrische Tests. 5.2.1. Zwei unabhängige Stichproben: U- Test nach MANN- WHITNEY 5.2. Nichtparametrische Tests 5.2.1. Zwei unabhängige Stichproben: U- Test nach MANN- WHITNEY Voraussetzungen: - Die Verteilungen der beiden Grundgesamtheiten sollten eine ähnliche Form aufweisen. - Die

Mehr

Datentransformation mit SPSS

Datentransformation mit SPSS Datentransformation mit SPSS Das Statistikprogrammsystem SPSS for Windows hat die komfortabelsten Transformationsroutinen. In diesem Text werden nur die einfachsten Transformationen besprochen. Wichtig:

Mehr

12. Vergleich mehrerer Stichproben

12. Vergleich mehrerer Stichproben 12. Vergleich mehrerer Stichproben Dr. Antje Kiesel Institut für Angewandte Mathematik WS 2011/2012 Häufig wollen wir verschiedene Populationen, Verfahren, usw. miteinander vergleichen. Beipiel: Vergleich

Mehr

Übung Statistik I Statistik mit Stata SS07-14.05.2007 5. Dokumentation der Datenanalyse, Datentransformationen II und Univariate Statistiken II

Übung Statistik I Statistik mit Stata SS07-14.05.2007 5. Dokumentation der Datenanalyse, Datentransformationen II und Univariate Statistiken II Übung Statistik I Statistik mit Stata SS07-14.05.2007 5. Dokumentation der Datenanalyse, Datentransformationen II und Univariate Statistiken II Andrea Kummerer (M.A.) Oec R. I-53 Sprechstunde: Di. 15-16

Mehr

Neuerungen in Minitab 16

Neuerungen in Minitab 16 Neuerungen in Minitab 16 minitab@additive-net.de - Telefon: 06172 / 5905-30 Willkommen zu Minitab 16! Die neueste Version der Minitab Statistical Software umfasst mehr als siebzig neue Funktionen und Verbesserungen,

Mehr

Zusammenhänge zwischen metrischen Merkmalen

Zusammenhänge zwischen metrischen Merkmalen Zusammenhänge zwischen metrischen Merkmalen Darstellung des Zusammenhangs, Korrelation und Regression Daten liegen zu zwei metrischen Merkmalen vor: Datenpaare (x i, y i ), i = 1,..., n Beispiel: x: Anzahl

Mehr

Data Mining (ehem. Entscheidungsunterstützungssysteme)

Data Mining (ehem. Entscheidungsunterstützungssysteme) Data Mining (ehem. Entscheidungsunterstützungssysteme) Melanie Pfoh Anja Tetzner Christian Schieder Übung WS 2014/15 AGENDA TEIL 1 Aufgabe 1 (Wiederholung OPAL / Vorlesungsinhalte) ENTSCHEIDUNG UND ENTSCHEIDUNGSTHEORIE

Mehr