Einführung in die statistische Datenanalyse I

Größe: px
Ab Seite anzeigen:

Download "Einführung in die statistische Datenanalyse I"

Transkript

1 Einführung in die statistische Datenanalyse I Inhaltsverzeichnis 1. EINFÜHRUNG IN THEORIEGELEITETES WISSENSCHAFTLICHES ARBEITEN 2 2. KRITIERIEN ZUR AUSWAHL STATISTISCH METHODISCHER VERFAHREN 2 3. UNIVARIATE DATENANALYSE 4 4. HÄUFIGKEITSANALYSE VERTEILUNGSDISKUSSION 4 5. DER CHI-QUADRAT-TEST 7 6. BIVARIATE DATENANALYSE 8 1

2 1. Einführung in theoriegeleitetes wissenschaftliches Arbeiten Die drei Schritte des Forschungsablaufes: Entdeckungszusammenhang: Ausgehend von einem sozialen Problem, einer Theorie oder einem Auftrag definiert man eine Problemstellung. Begründungszusammenhang: Nach der Problemstellung definiert man eine Hypothese, die in weiterer Folge belegt oder auch widerlegt werden soll. Folglich muss man Indikatoren für die Hypothese definieren und Operationalisierungen vornehmen. Es folgt die Datenerhebung, die statistische Auswertung und Prüfung. Wird die Hypothese widerlegt, muss man eine neue definieren, ansonsten geht man weiter zu Schritt drei. Verwertungszusammenhang: Die Theorie wird bewiesen und es folgt die Darstellung und die Publikation. Das kann im Prinzip auch zu einer neuen Problemstellung führen. 2. Kritierien zur Auswahl statistisch methodischer Verfahren Diese Kriterien sind abhängig von der Fragestellung, der Zahl der gemeinsam zu analysierenden Variable/Merkmale und von den Datenniveaus. Abhängig von der Fragestellung wählt man zwischen deskriptiver oder schließender Statistik. Die deskriptive Statistik ist die rein beschreibende Statistik. Sie macht Angaben über die Erscheinungsform eines Sachverhaltes, z.b.: durch Benennung, Ordnung, Klassifizierung, Definition oder Angaben zur Häufigkeit. Daraus ist aber keine Erklärung des Sachverhaltes möglich, denn solche Erklärungen setzen die Beschreibung von mindestens zwei Sachverhalten voraus. Ein Sachverhalt alleine ist aber keine Erklärung, sondern kann eben nur mit einem zweiten Sachverhalt dazu werden. Die deskriptive Datenanalyse beschränkt sich auf die Beschreibung von Daten durch Kennziffern von Verteilungen. Die Frage, ob eine Verteilung durch Zufall bedingt ist, kann die deskriptive Statistik nicht lösen. In der schließenden Statistik muss man die statistische Signifikanz und die Kausalhypothesen überprüfen, das heißt, man überprüft den Zusammenhang zwischen zwei Merkmalen. Die statistische Signifikanzprüfung vergleicht zwei oder mehrere Verteilungen im Bezug auf ihren Unterschied: Unterschiede zwischen zwei Verteilungen werden dann als signifikant (bedeutsam) bezeichnet, wenn sie mit einer bestimmten Wahrscheinlichkeit nicht durch Zufall zu Stande gekommen sind. 2

3 Die Überprüfung erfolgt mittels Nullhypothese, die die optimale Zufallsverteilung definiert Die Definition der Nullhypothese ist von der Fragestellung abhängig. Eine Kausalhypothese enthält eine Ursachen-Wirkung Relation, sprich: Die Verteilung/Veränderung des Sachverhaltes bedingt, erklärt die Verteilung eines anderen Sachverhaltes. Abhängig von der Zahl der zu analysierenden Variable/Merkmale wählt man zwischen Univariater, Bivariater oder Multivariater Datenanalyse. In der Univariaten Datenanalyse wird die Verteilung einer Variable überprüft: Deskriptive Statistik Häufigkeitsanalyse Schließende Statistik Prüft Zufälligkeit von Ereignisfolgen Bei der Bivariaten Datenanalyse wird die Verteilung der Merkmale einer Variable in Abhängigkeit der Verteilung der Merkmale einer anderen Variable gesetzt: Deskriptive Statistik Häufigkeitsanalyse der Merkmalskombinationen mittels Kreuztabellenanalyse Schließende Statistik Prüft Kausalhypothesen. Des Weiteren ergeben sich die Stärke und die Richtung von Zusammenhängen, was zu je-desto Aussagen führt. Bei der Multivariaten Datenanalyse werden mehr als zwei Variablen zur Analyse herangezogen. Abhängig von den Datenniveaus wählt man zwischen kategorialen Date (z.b.: Schulnoten, Antwortkategorien,...) und metrischen Daten (z.b.: Einwohnerzahl, Flächenangaben,...). Die Datenniveaus bestimmt man mit statistischen Maßzahlen zur Beschreibung von Verteilungen und statistischen Analyseverfahren. Sie ergeben sich weiters aus den Eigenschaften der Merkmale, die gemessen wurden. Messen ist die Zuordnung von Zahlen zu Merkmalsträgern. An einem Merkmalsträgern können mehrere Merkmale gemessen werden, die Zuordnung von Zahlen zu Merkmalsträgern nennt man Codierung. Je nachdem, was und wie gemessen wurde, ergeben sich unterschiedliche Eigenschaften von Daten und daraus resultierende Eigenschaften von Daten: Gleichheit bzw. Ungleichheit Ordnung Gleichheit von Differenzen Gleichheit von Verhältnissen Je mehr Eigenschaften von Aussagequalitäten Daten besitzen, desto besser ist die Datenqualität. Die Daten werden nach der Qualität ihrer Eigenschaften in die unterschiedlichen Niveaus eingeteilt, die die Möglichkeiten der Datenmodifikation und der statistischen Analyseverfahren bestimmen. 3

4 Kategoriale Daten Nominaldaten Namen (Bezeichnungen) in Form von Zahlen, z.b.: Geschlecht, Familienstand. Eigenschaften: Gleichheit/Ungleichheit. Ordinaldaten Ranggordnete Daten. Bewertungen, aber keine genaue Aussage über den Abstand zwischen den Klassen, z.b.: Schulnoten, Soziale Schichtung. Eigenschaften: Gleichheit/Ungleichheit und Ordnung. Metrische Daten Intervall Daten Relativer Nullpunkt, keine Vergleichbarkeit von Verhältnissen möglich, z.b.: 20 C ist doppelt so warm wie 10 C, Temperatur in C. Eigenschaften: Gleichheit/Ungleichheit, Ordnung, Gleichheit von Differenzen. Ratio Daten Absoluter Nullpunkt, z.b.: Temperatur in K, Quadratmeter, Einwohner, Alter, Einkommen. Eigenschaften: Gleichheit/Ungleichheit, Ordnung, Gleichheit von Differenzen, Gleichheit von Verhältnissen. 3. Univariate Datenanalyse Die einfachste statistische Operation ist das Zählen. Es wird gezählt, wie oft Merkmale in einer Verteilung vorkommen. Das statistische Analyseverfahren dabei ist die Häufigkeitsanalyse. Mit ihr wird überprüft, wie oft einzelne Werte eines Merkmales in einer Verteilung vorkommen. Dabei differenziert man in absolute und relative Häufigkeiten: Absolute Häufigkeit: Anzahl des Auftretens von Werten Relative Häufigkeit: Prozentanteil des Auftretens von einzelnen Werten in Bezug auf die Zahl der analysierten Fälle 4. Häufigkeitsanalyse Verteilungsdiskussion Zur Beschreibung der Verteilung wählt man geeignete Maßzahlen aus. Sie hängen ab von der Datenqualität, dem Skalenniveau der Daten. Lageparameter beschreiben den durchschnittlichen Wert einer Verteilung. Sie geben in etwa die Mitte einer Verteilung an. Die Aussagekraft er Lageparameter ist abhängig von der Streuung der 4

5 Werte und der Verteilungsform. In Kombination können mittels Lageparameter Aussagen über die Verteilung der Merkmale getroffen werden. Arithmetisches Mittel: (Summe der Werte der Merkmale durch die Anzahl der Fälle). Diese Berechnung wird bei metrischen Daten angewendet, allerdings hat das arithmetische Mittel eine Schwachstelle: Ausreißer gehen gleichgewichtig in die Verteilung ein. Das kann bei bestimmten Verteilungen problematisch sein. Median: 50%-Grenze. 50% der Werte sind kleiner, 50% der Werte größer als der Medianwert. Ist der Median in der Zahlenreihenfolge vorhanden, so wird die Zahl verwendet, die genau in der Mitte liegt. Ist sie nicht vorhanden, wird ein Mischwert der beiden benachbarten Zahlen gebildet. Der Median wird bei metrischen und Ordinaldaten verwendet. Er ist auch robuster gegen Ausreißer, das heißt, er ist auch bei asymmetrischen und schiefen Verteilungen gut anwendbar. Modalwert: häufigster Wert einer Verteilung. Er kann bei nominal, ordinal und metrischen Datenniveau verwendet werden, ist allerdings der einzige Lageparameter, der auch für Nominaldaten verwendbar ist. Verteilungsformen: Geben Auskunft über die Messwerte des häufigen Extrems und es seltenen Extrems. Sie sind entweder rechtsschief bzw. linkssteil oder linksschief bzw. rechtssteil. Die optimale Zufallsverteilung tritt ein, wenn Mittelwert, Median und Modalwert identisch sind. Maße zur Kennzeichnung einer Verteilung Perzentile: Sie geben den Wert einer Verteilung an, unterhalb essen ein definierter Prozentsatz der Fälle mit geringerem Wert liegt. Der Prozentsatz definiert das Perzentil, die Perzentilgrenzen können frei gewählt werden. Quartile liegen bei 25%, 50% und 75%. Sie finden Verwendung im Ordinaldatenniveau. Streuungsparameter treffen Aussagen über die Gleichheit (Homogenität) bzw. Ungleichheit (Inhomogenität) der Merkmalsträger. Die Streuung bezeichnet den Wert, mit dem die Werte einer Verteilung voneinander abweichen. Je größer die Streuung, desto inhomogener ist die Verteilung. Es kommt das Ordinaldatenniveau zur Anwendung. Der Minimalwert ist der kleinste Wert der Verteilung, der Maximalwert der größte. Die Differenz zwischen beiden nennt man die Spannweite. Weitere Maße zur Kennzeichnung einer Verteilung Spannweite: Gibt Auskunft über die Daten. Z.B.: Das Alter der untersuchten Personen liegt reicht von Jahre. Das Problem ist, dass die Spannweite nur durch zwei einzelne Werte definiert wird. 5

6 Varianz: Ist die mittlere quadratische Abweichung der Werte vom Mittelwert. Es wird von jedem einzelnen Wert die Differenz zum Mittelwert berechnet. Das verwendete Datenniveau ist das metrische. Standardabweichung: Ist der Bezug der Varianz zur Maßeinheit der Verteilung. Sie ist die Quadratwurzel der Varianz. Variationskoeffizient: Streuungsparameter werden von der Dimension der den Maßeinheiten, in denen die Merkmale gemessen wurden beeinflusst. Der Vergleich der Streuungen (der Homogenität) von verschiedenen Verteilungen ist manchmal problematisch. Verteilungsformen müssen analysiert werden Normalverteilung: Sie kennzeichnet eine Verteilung von Merkmalen die sich aus zufälligen Einflüssen ergibt. Es ist die optimale Zufallsverteilung für metrische Merkmale. Je ähnlicher eine Verteilung der Normalverteilung ist, desto besser kennzeichnen die Lageparameter die Verteilung. Des Weiteren dient sie zur Hypothesenprüfung. Sie ist das theoretische Modell für die zufällige Verteilung von Merkmalen. So lässt sich prüfen, ob eine empirisch beobachtete Verteilung zufallsverteilt ist, oder nicht. Für die Hypothesenprüfung ist die Aussage zentral. Zu jeder Verteilung kann mittels Mittelwert und Streuungsparameter eine theoretische Normalverteilung berechnet werden. Diese berechnete Normalverteilung gibt an, wie die Werte verteilt wären, wenn sie zufällig zu Stande gekommen wären. Zu berücksichtigen ist allerdings, dass auch Abweichungen von theoretischer und beobachteter Verteilung zufallsbedingt sein können (Aufgabe der analytischen Statistik). Generelle Kennzeichen der Normalverteilung sind, dass der Mittelwert, der Median und der Modalwert identisch sind, dass sich 95% der Werte in einem Intervall von ± 2 Standardabweichungen liegen und dass sie symmetrisch ist. Schiefe (Skewness): Sie beschreibt die Symmetrie bzw. Assymmetrie von Verteilungen. Das Datenniveau ist metrisch. Von einer positiven Schiefe spricht man, wenn die Kurve linkssteil ist, von einer negativen, wenn sie rechtssteil ist. Sie trifft Aussagen über die Messwerte des häufigen und des seltenen Extrems. Steilheit (kurtosis): Sie definiert sich aus der Streuung der Werte um den Mittelwert. Je enger die Werte um den Mittelwert streuen, umso steiler ist die Verteilung, je weiter sie um den Mittelwert streuen, umso flacher ist sie. Schließende Statistik (Grundkonzeption) Forschungslogische Struktur: 1. Formulierung der Forschungs-/Erklärungshypothese 6

7 2. Formulierung der Gegenhypothese (= Nullhypothese H 0 ). Sie beschreibt was, bzw. welche Verteilung, zu erwarten ist. Wenn die Forschungshypothese nicht zutrifft, muss man auf die 0- Hypothese zurückgreifen. Analytische Statistik (Grundkonzeption) Forschungslogische Struktur: 3. Vergleich der beobachteten mit der erwarteten Verteilung. Weicht die beobachtete Verteilung nicht von der erwarteten ab, muss man die H 0 annehmen. Weicht die beobachtete Verteilung signifikant von der erwarteten ab, kann man die Forschungs-/Alternativhypothese annehmen. Signifikanz bedeutet, mit welcher Wahrscheinlichkeit die Abweichungen von erwarteten zu und beobachteten Werten zufällig sind. 4.Vergleich der beobachteten mit der erwarteten Verteilung methodische Vorgangsweise Vergleich der erwarteten Werte mit den beobachteten Werten Bestimmung der Abweichung der beobachteten Werte von erwarteten Werten Bestimmung der Wahrscheinlichkeit des Auftretens der festgestellten Abweichung 5. Der Chi-Quadrat-Test Dieser Test prüft, ob der Unterschied von Verteilungen von Merkmalen auf zufällige oder nicht zufällige Einflussfaktoren zu Stande gekommen ist. Zuerst wird definiert, welche Bedingungen für die Verteilung der beobachteten Merkmale bei Zutreffen der 0-Hypothese gelten würden. Für diese Bedingungen wird eine theoretische Verteilung der Merkmale ermittelt, das heißt, welche Verteilung der Merkmale zu erwarten wäre, wenn die erklärende Hypothese (Alternativhypothese) nicht zutrifft. Die tatsächliche beobachtete Variation der Merkmale wird mit der theoretisch erwarteten Verteilung der Merkmale verglichen. Folglich wird die Abweichung oder Übereinstimmung festgestellt. Die Signifikanzprüfung Sie ist nötig, um festzustellen, ob eine Forschungshypothese (= Annahme) anzunehmen oder abzulehnen ist. Unterscheidet sich die Verteilung signifikant von der theoretischen, so ist H 0 abzulehnen und H a anzunehmen. Unterscheidet sie sich nicht signifikant, muss man die Null- Hypothese annehmen. Beim Chi-Quadrat-Test ist die Signifikanzprüfung deshalb notwendig, weil die Abweichung von beobachteter und theoretischer Verteilung zufallsbedingt sein könnte. Dass die Abweichung nicht mehr auf zufällige Einflüsse zurückzuführen ist kann dann angenommen werden, wenn die Wahrscheinlichkeit der Abweichungen einen vordefinierten Prozentsatz nicht unterschreiten. Freiheitsgrade Bei einer Randverteilung können immer Zahl der Möglichkeiten minus 1 frei gewählt werden. Für jeden Freiheitsgrad gilt eine anderen Verteilung und Wahrscheinlichkeit von Chi-Quadrat. 7

8 Generell gilt: Je kleiner der Chi-Quadrat-Wert, desto größer die Wahrscheinlichkeit seines Auftretens. Je größer die Wahrscheinlichkeit des Auftretens eines Chi-Quadrat-Wertes, desto eher ist das Ergebnis zufällig. Und damit eine zufällige Abweichung der beobachteten von der erwarteten Verteilung gegeben, die allerdings von den Freiheitsgraden abhängt. Beobachtete und erwartete Verteilungen unterscheiden sich durch Zufallsfaktoren voneinander. Annahme und Verwerfung von H 0 bzw. H a Statistische Signifikanz ist dann gegeben, wenn die Variation von Merkmalen nicht mehr durch zufällige Einflussfaktoren zu Stande gekommen ist und wenn die Wahrscheinlichkeit der Abweichung der beobachteten Verteilung von der erwarteten Verteilung (jene Verteilung, wenn die Alternativhypothese nicht zutrifft) kleiner als 5% ist. Ist dies der Fall, so unterscheiden sich theoretische und beobachtete Werte signifikant. Vorraussetzungen von Chi-Quadrat Die erwarteten Häufigkeiten sollten 5 sein Bei maximal 20% der Zellen darf die erwartete Häufigkeit 5 sein. In diesem Fall sollte der Wert kleiner als 1 sein. Sind diese Bedingungen nicht erfüllt, so ist die Signifikanzprüfung mittels Chi-Quadrat nicht zulässig, gegebenenfalls sind die Werte zu klassifizieren (zusammen zu fassen). Mit den klassifizierten Werten kann eine neuerliche Signifikanzprüfung mittels Chi-Quadrat durchgeführt werden. 6. Bivariate Datenanalyse Mit ihr lässt sich der Zusammenhang zwischen zwei Variablen analysieren. Sie prüft das gemeinsame Vorkommen von definierten Merkmalen (Merkmalskombinationen) zweier Variablen. Man kann sie für das Nominal- und Ordinaldatenniveau verwenden. Als statistisches Verfahren dienen die Kreuztabellen. Das sind zwei- oder mehrdimensionale Tabellen, welche die Häufigkeit angeben, mit der bei untersuchten Objekten Kombinationen von Merkmalsausprägungen auftreten. Ein statistisch signifikanter Zusammenhang zwischen zwei Variablen ist dann gegeben, wenn bestimmte Merkmalsausprägungen dieser Variablen überdurchschnittlich (überzufällig) häufig miteinander auftreten. Ist ein statistisch signifikanter Zusammenhang gegeben, lautet die Aussage: Die Ausprägung der Merkmale der einen Variable ist abhängig von der Ausprägung der Merkmale der anderen Variable und umgekehrt. In der Bivariaten Datenanalyse prüft der Chi-Quadrat-Test auf: Abhängigkeit, bzw. Unabhängigkeit der Variablen Alternativhypothese (Merkmalsausprägungen sind assoziiert, bestimmte Kombinationen kommen überzufällig vor). 8

9 Nullhypothese (Variable sind unabhängig, in der Matrix herrscht Gleichverteilung. Bestimmte Kombinationen von Merkmalsausprägungen kommen nur zufällig gemeinsam vor. Wenn folglich die Nullhypothese angenommen wird, gilt auch die Matrix (Kreuztabelle) der erwarteten Häufigkeiten (= die durch Randverteilung reproduzierte Matrix). Bei totaler Unabhängigkeit der Werte nimmt Chi-Quadrat den Wert 0 an. Je mehr die beobachteten Merkmalskombinationen von den erwarteten Merkmalskombinationen abweichen, desto größer wird Chi-Quadrat und damit der Zusammenhang der Merkmale in der Tabelle. Assoziationsmaße Mittels Prüfung auf Signifikanz durch Chi-Quadrat wird lediglich festgestellt, ob ein Zusammenhang zwischen den Variablen besteht. Damit ist jedoch der volle Informationsgehalt der bivariaten Datenanalyse nicht ausgeschöpft. Signifikante Zusammenhänge zwischen zwei Variablen können unterschiedliche stark ausgeprägt sein. Ein eindeutiger Zusammenhang besteht, wenn in 100% der Fälle VAR0001 den Wert 1 annimmt, wenn VAR0002 den Wert 2 annimmt. Und umgekehrt. Nicht mehr ganz so eindeutig ist es, wenn das bei 90% der Fälle auftritt. Man spricht von einem schwächeren Zusammenhang. Ein schwacher Zusammenhang besteht, wenn dies nur mehr bei 70% der Fälle eintritt. Assoziationsmaße dienen folglich zur Feststellung von bivariaten Zusammenhängen von Nominalund Ordinaldaten und sind Assoziationsmaße des adäquaten Instruments. Einen Indikator zur Feststellung der Stärke des Zusammenhangs bietet der Chi-Quadrat-Wert. Je größer er ist desto stärker ist die Abweichung der beobachteten von der erwarteten Zufallsverteilung und damit die Stärke des Zusammenhanges. Es kann sein, dass Chi-Quadrat trotz gleicher Stärke des Zusammenhangs unterschiedliche Werte liefert, denn er hängt von der Fallzahl insgesamt ab. Damit ist Chi-Quadrat für Vergleiche und Bestimmung im Bezug auf die Stärke des Zusammenhanges nicht geeignet. Mit den Assoziationsmaßen kann man den Zusammenhang aber weiterhin messe. Die Vorraussetzung ist allerdings, dass der Chi-Quadrat-Wert signifikant ist, also unter 5% liegt. Die Funktion dabei ist jeweils die Normierung von Chi-Quadrat. Bei der Auswahl von Assoiationsmaßen muss man das Datenniveau berücksichtigen, danach wählt man zwischen: Phi Phi trifft vergleichbare Aussagen über die Stärke eines Zusammenhanges für 2x2 Tabellen. Kontingenzkoeffizient C Der Kontingenzkoeffizient eignet sich für quadratische Tabellen (Tabellen mit gleicher Zeilen- und Spaltenanzahl) in der Dimensionierung größer als 2x2 Cramer s V Cramer s V hingegen ist für größere Tabellen als 2x2 und auch Rechtecktabellen geeignet, weil die Zeilen- und Spaltendimension berücksichtig wird. 9

Business Value Launch 2006

Business Value Launch 2006 Quantitative Methoden Inferenzstatistik alea iacta est 11.04.2008 Prof. Dr. Walter Hussy und David Tobinski UDE.EDUcation College im Rahmen des dokforums Universität Duisburg-Essen Inferenzstatistik Erläuterung

Mehr

Willkommen zur Vorlesung Statistik (Master)

Willkommen zur Vorlesung Statistik (Master) Willkommen zur Vorlesung Statistik (Master) Thema dieser Vorlesung: Verteilungsfreie Verfahren Prof. Dr. Wolfgang Ludwig-Mayerhofer Universität Siegen Philosophische Fakultät, Seminar für Sozialwissenschaften

Mehr

Studiendesign/ Evaluierungsdesign

Studiendesign/ Evaluierungsdesign Jennifer Ziegert Studiendesign/ Evaluierungsdesign Praxisprojekt: Nutzerorientierte Evaluierung von Visualisierungen in Daffodil mittels Eyetracker Warum Studien /Evaluierungsdesign Das Design einer Untersuchung

Mehr

(VU) Übungen zur Einführung in die statistische Datenanalyse II. Inhalte Statistik I. Inhalte Statistik I Deskriptive Statistik

(VU) Übungen zur Einführung in die statistische Datenanalyse II. Inhalte Statistik I. Inhalte Statistik I Deskriptive Statistik II Übungen zur II Organisatorische Hinweise Keine Anwesenheitspflicht (aber empfehlenswert) Einführung in die statistische Datenanalyse II (VU) Lehrinhalte (.ppt Folien): elearning.univie.ac.at 3 Prüfungstermine:

Mehr

1,11 1,12 1,13 1,14 1,15 1,16 1,17 1,17 1,17 1,18

1,11 1,12 1,13 1,14 1,15 1,16 1,17 1,17 1,17 1,18 3. Deskriptive Statistik Ziel der deskriptiven (beschreibenden) Statistik (explorativen Datenanalyse) ist die übersichtliche Darstellung der wesentlichen in den erhobenen Daten enthaltene Informationen

Mehr

Prüfung eines Datenbestandes

Prüfung eines Datenbestandes Prüfung eines Datenbestandes auf Abweichungen einzelner Zahlen vom erwarteten mathematisch-statistischen Verhalten, die nicht mit einem Zufall erklärbar sind (Prüfung auf Manipulationen des Datenbestandes)

Mehr

Grundlagen der Inferenzstatistik

Grundlagen der Inferenzstatistik Grundlagen der Inferenzstatistik (Induktive Statistik oder schließende Statistik) Dr. Winfried Zinn 1 Deskriptive Statistik versus Inferenzstatistik Die Deskriptive Statistik stellt Kenngrößen zur Verfügung,

Mehr

Eine computergestützte Einführung mit

Eine computergestützte Einführung mit Thomas Cleff Deskriptive Statistik und Explorative Datenanalyse Eine computergestützte Einführung mit Excel, SPSS und STATA 3., überarbeitete und erweiterte Auflage ^ Springer Inhaltsverzeichnis 1 Statistik

Mehr

Einfache statistische Auswertungen mit dem Programm SPSS

Einfache statistische Auswertungen mit dem Programm SPSS Einfache statistische Auswertungen mit dem Programm SPSS Datensatz: fiktive_daten.sav Dipl. Päd. Anne Haßelkus Dr. Dorothea Dette-Hagenmeyer 11/2011 Überblick 1 Deskriptive Statistiken; Mittelwert berechnen...

Mehr

Teil II: Einführung in die Statistik

Teil II: Einführung in die Statistik Teil II: Einführung in die Statistik (50 Punkte) Bitte beantworten Sie ALLE Fragen. Es handelt sich um multiple choice Fragen. Sie müssen die exakte Antwortmöglichkeit angeben, um die volle Punktzahl zu

Mehr

Chi-Quadrat Verfahren

Chi-Quadrat Verfahren Chi-Quadrat Verfahren Chi-Quadrat Verfahren werden bei nominalskalierten Daten verwendet. Die einzige Information, die wir bei Nominalskalenniveau zur Verfügung haben, sind Häufigkeiten. Die Quintessenz

Mehr

Florian Frötscher und Demet Özçetin

Florian Frötscher und Demet Özçetin Statistische Tests in der Mehrsprachigkeitsforschung Aufgaben, Anforderungen, Probleme. Florian Frötscher und Demet Özçetin florian.froetscher@uni-hamburg.de SFB 538 Mehrsprachigkeit Max-Brauer-Allee 60

Mehr

Bachelorabschlussseminar Dipl.-Kfm. Daniel Cracau

Bachelorabschlussseminar Dipl.-Kfm. Daniel Cracau 1 Einführung in die statistische Datenanalyse Bachelorabschlussseminar Dipl.-Kfm. Daniel Cracau 2 Gliederung 1.Grundlagen 2.Nicht-parametrische Tests a. Mann-Whitney-Wilcoxon-U Test b. Wilcoxon-Signed-Rank

Mehr

Auswertung mit dem Statistikprogramm SPSS: 30.11.05

Auswertung mit dem Statistikprogramm SPSS: 30.11.05 Auswertung mit dem Statistikprogramm SPSS: 30.11.05 Seite 1 Einführung SPSS Was ist eine Fragestellung? Beispiel Welche statistische Prozedur gehört zu welcher Hypothese? Statistische Berechnungen mit

Mehr

Statistik. Jan Müller

Statistik. Jan Müller Statistik Jan Müller Skalenniveau Nominalskala: Diese Skala basiert auf einem Satz von qualitativen Attributen. Es existiert kein Kriterium, nach dem die Punkte einer nominal skalierten Variablen anzuordnen

Mehr

Univariate Häufigkeitsverteilungen Kühnel, Krebs 2001: Statistik für die Sozialwissenschaften, S.41-66

Univariate Häufigkeitsverteilungen Kühnel, Krebs 2001: Statistik für die Sozialwissenschaften, S.41-66 Univariate Häufigkeitsverteilungen Kühnel, Krebs 2001: Statistik für die Sozialwissenschaften, S.41-66 Gabriele Doblhammer: Empirische Sozialforschung Teil II, SS 2004 1/19 Skalenniveaus Skalenniveau Relation

Mehr

Von der Untersuchungsfrage zu statistischen Hypothesen, und wie war das nochmal mit dem α- und

Von der Untersuchungsfrage zu statistischen Hypothesen, und wie war das nochmal mit dem α- und Von der Untersuchungsfrage zu statistischen Hypothesen, und wie war das nochmal mit dem α- und β-fehler? Sven Garbade Fakultät für Angewandte Psychologie SRH Hochschule Heidelberg sven.garbade@hochschule-heidelberg.de

Mehr

Evaluation der Normalverteilungsannahme

Evaluation der Normalverteilungsannahme Evaluation der Normalverteilungsannahme. Überprüfung der Normalverteilungsannahme im SPSS P. Wilhelm; HS SPSS bietet verschiedene Möglichkeiten, um Verteilungsannahmen zu überprüfen. Angefordert werden

Mehr

Franz Kronthaler. Statistik angewandt. Datenanalyse ist (k)eine Kunst. Excel Edition. ^ Springer Spektrum

Franz Kronthaler. Statistik angewandt. Datenanalyse ist (k)eine Kunst. Excel Edition. ^ Springer Spektrum Franz Kronthaler Statistik angewandt Datenanalyse ist (k)eine Kunst Excel Edition ^ Springer Spektrum Inhaltsverzeichnis Teil I Basiswissen und Werkzeuge, um Statistik anzuwenden 1 Statistik ist Spaß 3

Mehr

Statistik II: Grundlagen und Definitionen der Statistik

Statistik II: Grundlagen und Definitionen der Statistik Medien Institut : Grundlagen und Definitionen der Statistik Dr. Andreas Vlašić Medien Institut (0621) 52 67 44 vlasic@medien-institut.de Gliederung 1. Hintergrund: Entstehung der Statistik 2. Grundlagen

Mehr

1 Verteilungen und ihre Darstellung

1 Verteilungen und ihre Darstellung GKC Statistische Grundlagen für die Korpuslinguistik Kapitel 2: Univariate Deskription von Daten 8.11.2004 Univariate (= eindimensionale) Daten bestehen aus Beobachtungen eines einzelnen Merkmals. 1 Verteilungen

Mehr

Kapitel 13 Häufigkeitstabellen

Kapitel 13 Häufigkeitstabellen Kapitel 13 Häufigkeitstabellen Die gesammelten und erfaßten Daten erscheinen in der Datendatei zunächst als unübersichtliche Liste von Werten. In dieser Form sind die Daten jedoch wenig aussagekräftig

Mehr

12. Vergleich mehrerer Stichproben

12. Vergleich mehrerer Stichproben 12. Vergleich mehrerer Stichproben Dr. Antje Kiesel Institut für Angewandte Mathematik WS 2011/2012 Häufig wollen wir verschiedene Populationen, Verfahren, usw. miteinander vergleichen. Beipiel: Vergleich

Mehr

Deskriptive Statistik

Deskriptive Statistik Deskriptive Statistik [descriptive statistics] Ziel der deskriptiven (beschreibenden) Statistik einschließlich der explorativen Datenanalyse [exploratory data analysis] ist zunächst die übersichtliche

Mehr

Parametrische vs. Non-Parametrische Testverfahren

Parametrische vs. Non-Parametrische Testverfahren Parametrische vs. Non-Parametrische Testverfahren Parametrische Verfahren haben die Besonderheit, dass sie auf Annahmen zur Verteilung der Messwerte in der Population beruhen: die Messwerte sollten einer

Mehr

Statistische Grundlagen I

Statistische Grundlagen I Statistische Grundlagen I Arten der Statistik Zusammenfassung und Darstellung von Daten Beschäftigt sich mit der Untersuchung u. Beschreibung von Gesamtheiten oder Teilmengen von Gesamtheiten durch z.b.

Mehr

Analyse bivariater Kontingenztafeln

Analyse bivariater Kontingenztafeln Analyse bivariater Kontingenztafeln Werden zwei kategoriale Merkmale mit nicht zu vielen möglichen Ausprägungen gemeinsam analysiert, so kommen zur Beschreibung der gemeinsamen Verteilung im allgemeinen

Mehr

Graphische Darstellung einer univariaten Verteilung:

Graphische Darstellung einer univariaten Verteilung: Graphische Darstellung einer univariaten Verteilung: Die graphische Darstellung einer univariaten Verteilung hängt von dem Messniveau der Variablen ab. Bei einer graphischen Darstellung wird die Häufigkeit

Mehr

Datenanalyse mit Excel. Wintersemester 2013/14

Datenanalyse mit Excel. Wintersemester 2013/14 Datenanalyse mit Excel 1 KORRELATIONRECHNUNG 2 Korrelationsrechnung Ziel der Korrelationsrechnung besteht im bivariaten Fall darin, die Stärke des Zusammenhangs zwischen zwei interessierenden statistischen

Mehr

Bitte schreiben Sie in Druckbuchstaben und vergessen Sie nicht zu unterschreiben. Name, Vorname:. Studiengang/ Semester:. Matrikelnummer:..

Bitte schreiben Sie in Druckbuchstaben und vergessen Sie nicht zu unterschreiben. Name, Vorname:. Studiengang/ Semester:. Matrikelnummer:.. Institut für Erziehungswissenschaft der Philipps-Universität Marburg Prof. Dr. Udo Kuckartz Arbeitsbereich Empirische Pädagogik/Methoden der Sozialforschung Wintersemester 004/005 KLAUSUR FEBRUAR 005 /

Mehr

Einfache Varianzanalyse für abhängige

Einfache Varianzanalyse für abhängige Einfache Varianzanalyse für abhängige Stichproben Wie beim t-test gibt es auch bei der VA eine Alternative für abhängige Stichproben. Anmerkung: Was man unter abhängigen Stichproben versteht und wie diese

Mehr

a) Zeichnen Sie in das nebenstehende Streudiagramm mit Lineal eine Regressionsgerade ein, die Sie für passend halten.

a) Zeichnen Sie in das nebenstehende Streudiagramm mit Lineal eine Regressionsgerade ein, die Sie für passend halten. Statistik für Kommunikationswissenschaftler Wintersemester 2009/200 Vorlesung Prof. Dr. Helmut Küchenhoff Übung Cornelia Oberhauser, Monia Mahling, Juliane Manitz Thema 4 Homepage zur Veranstaltung: http://www.statistik.lmu.de/~helmut/kw09.html

Mehr

Grundlagen der Datenanalyse

Grundlagen der Datenanalyse Schematischer Überblick zur Behandlung quantitativer Daten Theorie und Modellbildung Untersuchungsdesign Codierung / Datenübertragung (Erstellung einer Datenmatrix) Datenerhebung Fehlerkontrolle / -behebung

Mehr

Analytische Statistik I. Statistische Methoden in der Korpuslinguistik Heike Zinsmeister WS 2009/10

Analytische Statistik I. Statistische Methoden in der Korpuslinguistik Heike Zinsmeister WS 2009/10 Analytische Statistik I Statistische Methoden in der Korpuslinguistik Heike Zinsmeister WS 2009/10 Testen Anpassungstests (goodness of fit) Weicht eine gegebene Verteilung signifikant von einer bekannten

Mehr

Einführung in die Statistik mit EXCEL und SPSS

Einführung in die Statistik mit EXCEL und SPSS Christine Duller Einführung in die Statistik mit EXCEL und SPSS Ein anwendungsorientiertes Lehr- und Arbeitsbuch Zweite, überarbeitete Auflage Mit 71 Abbildungen und 26 Tabellen Physica-Verlag Ein Unternehmen

Mehr

Grundlagen quantitativer Sozialforschung Interferenzstatistische Datenanalyse in MS Excel

Grundlagen quantitativer Sozialforschung Interferenzstatistische Datenanalyse in MS Excel Grundlagen quantitativer Sozialforschung Interferenzstatistische Datenanalyse in MS Excel 16.11.01 MP1 - Grundlagen quantitativer Sozialforschung - (4) Datenanalyse 1 Gliederung Datenanalyse (inferenzstatistisch)

Mehr

6. METRISCHE UND KATEGORIALE MERKMALE

6. METRISCHE UND KATEGORIALE MERKMALE 6. METRISCHE UND KATEGORIALE MERKMALE wenn an einer Beobachtungseinheit eine (oder mehrere) metrische und eine (oder mehrere) kategoriale Variable(n) erhoben wurden Beispiel: Haushaltsarbeit von Teenagern

Mehr

Methoden der empirischen Sozialforschung I

Methoden der empirischen Sozialforschung I Methoden der empirischen Sozialforschung I Annelies Blom, PhD TU Kaiserslautern Wintersemester 2011/12 Übersicht Quantitative Datenauswertung: deskriptive und induktive Statistik Wiederholung: Die wichtigsten

Mehr

Regelmäßigkeit (Erkennen von Mustern und Zusammenhängen) versus Zufall

Regelmäßigkeit (Erkennen von Mustern und Zusammenhängen) versus Zufall Wahrscheinlichkeitstheorie Was will die Sozialwissenschaft damit? Regelmäßigkeit (Erkennen von Mustern und Zusammenhängen) versus Zufall Auch im Alltagsleben arbeiten wir mit Wahrscheinlichkeiten, besteigen

Mehr

Deskriptive Statistik

Deskriptive Statistik Fakultät für Humanwissenschaften Sozialwissenschaftliche Methodenlehre Prof. Dr. Daniel Lois Deskriptive Statistik Stand: April 2015 (V2) Inhaltsverzeichnis 1. Notation 2 2. Messniveau 3 3. Häufigkeitsverteilungen

Mehr

Lage- und Streuungsparameter

Lage- und Streuungsparameter Lage- und Streuungsparameter Beziehen sich auf die Verteilung der Ausprägungen von intervall- und ratio-skalierten Variablen Versuchen, diese Verteilung durch Zahlen zu beschreiben, statt sie graphisch

Mehr

Analytische Statistik II

Analytische Statistik II Analytische Statistik II Institut für Geographie 1 Schätz- und Teststatistik 2 Das Testen von Hypothesen Während die deskriptive Statistik die Stichproben nur mit Hilfe quantitativer Angaben charakterisiert,

Mehr

Beurteilung der biometrischen Verhältnisse in einem Bestand. Dr. Richard Herrmann, Köln

Beurteilung der biometrischen Verhältnisse in einem Bestand. Dr. Richard Herrmann, Köln Beurteilung der biometrischen Verhältnisse in einem Bestand Dr. Richard Herrmann, Köln Beurteilung der biometrischen Verhältnisse in einem Bestand 1 Fragestellung Methoden.1 Vergleich der Anzahlen. Vergleich

Mehr

9. Schätzen und Testen bei unbekannter Varianz

9. Schätzen und Testen bei unbekannter Varianz 9. Schätzen und Testen bei unbekannter Varianz Dr. Antje Kiesel Institut für Angewandte Mathematik WS 2011/2012 Schätzen und Testen bei unbekannter Varianz Wenn wir die Standardabweichung σ nicht kennen,

Mehr

Teil I: Deskriptive Statistik

Teil I: Deskriptive Statistik Teil I: Deskriptive Statistik 2 Grundbegriffe 2.1 Merkmal und Stichprobe 2.2 Skalenniveau von Merkmalen 2.3 Geordnete Stichproben und Ränge 2.1 Merkmal und Stichprobe An (geeignet ausgewählten) Untersuchungseinheiten

Mehr

Lage- und Streuungsmaße

Lage- und Streuungsmaße Sommersemester 2009 Modus Median Arithmetisches Mittel Symmetrie/Schiefe Wölbung/Exzess 4 6 8 10 ALQ Tutorien Begleitend zur Vorlesung, inhaltlich identisch mit der Übung Mögliche Zeiten: Do 10-12, Do

Mehr

Grundlagen der Datenanalyse am Beispiel von SPSS

Grundlagen der Datenanalyse am Beispiel von SPSS Grundlagen der Datenanalyse am Beispiel von SPSS Einführung Dipl. - Psych. Fabian Hölzenbein hoelzenbein@psychologie.uni-freiburg.de Einführung Organisatorisches Was ist Empirie? Was ist Statistik? Dateneingabe

Mehr

Sozialer Abstieg und Konsum

Sozialer Abstieg und Konsum Sozialer Abstieg und Konsum Auswirkungen finanzieller Verknappung auf das Konsumverhalten Inaugural-Dissertation zur Erlangung des akademischen Grades einer Doktorin der Wirtschaftswissenschaft des Fachbereichs

Mehr

Kontingenzkoeffizient (nach Pearson)

Kontingenzkoeffizient (nach Pearson) Assoziationsmaß für zwei nominale Merkmale misst die Unabhängigkeit zweier Merkmale gibt keine Richtung eines Zusammenhanges an 46 o jl beobachtete Häufigkeiten der Kombination von Merkmalsausprägungen

Mehr

2. Deskriptive Statistik 2.1. Häufigkeitstabellen, Histogramme, empirische Verteilungsfunktionen

2. Deskriptive Statistik 2.1. Häufigkeitstabellen, Histogramme, empirische Verteilungsfunktionen 4. Datenanalyse und Modellbildung Deskriptive Statistik 2-1 2. Deskriptive Statistik 2.1. Häufigkeitstabellen, Histogramme, empirische Verteilungsfunktionen Für die Auswertung einer Messreihe, die in Form

Mehr

Ein bisschen Statistik

Ein bisschen Statistik Prof. Dr. Beat Siebenhaar ein bisschen Statistik 1 Ein bisschen Statistik (orientiert an Hüsler/Zimmermann (006) mit Umsetzung auf die linguistische Fragen) 1. Datentypen und Grafik Grafische Darstellungen

Mehr

Kapitel 9: Verfahren für Nominaldaten

Kapitel 9: Verfahren für Nominaldaten Kapitel 9: Verfahren für Nominaldaten Eindimensionaler Chi²-Test Der eindimensionale χ²-test wird dann herangezogen, wenn die Versuchspersonen einer Population anhand eines Merkmals mit zwei oder mehr

Mehr

90-minütige Klausur Statistik für Studierende der Kommunikationswissenschaft

90-minütige Klausur Statistik für Studierende der Kommunikationswissenschaft Prof. Dr. Helmut Küchenhoff SS08 90-minütige Klausur Statistik für Studierende der Kommunikationswissenschaft am 22.7.2008 Anmerkungen Überprüfen Sie bitte sofort, ob Ihre Angabe vollständig ist. Sie sollte

Mehr

Skriptum zur Veranstaltung. Quantitative Methoden (Mathematik/Statistik) Teil Induktive Statistik. 1. Version (mehr Draft als Skriptum)

Skriptum zur Veranstaltung. Quantitative Methoden (Mathematik/Statistik) Teil Induktive Statistik. 1. Version (mehr Draft als Skriptum) Skriptum zur Veranstaltung Quantitative Methoden (Mathematik/Statistik) Teil Induktive Statistik 1. Version (mehr Draft als Skriptum) Anmerkungen, Aufzeigen von Tippfehlern und konstruktive Kritik erwünscht!!!

Mehr

Einige Statistische Tests für den Ein- Zwei- und k-stichprobenfall (Nach Sachs, Stat. Meth.)

Einige Statistische Tests für den Ein- Zwei- und k-stichprobenfall (Nach Sachs, Stat. Meth.) ue biostatistik: nichtparametrische testverfahren / ergänzung 1/6 h. Lettner / physik Statistische Testverfahren Einige Statistische Tests für den Ein- Zwei- und k-stichprobenfall (Nach Sachs, Stat. Meth.)

Mehr

Eine Einführung in R: Statistische Tests

Eine Einführung in R: Statistische Tests Eine Einführung in R: Statistische Tests Bernd Klaus, Verena Zuber Institut für Medizinische Informatik, Statistik und Epidemiologie (IMISE), Universität Leipzig http://www.uni-leipzig.de/ zuber/teaching/ws12/r-kurs/

Mehr

fh management, communication & it Constantin von Craushaar fh-management, communication & it Statistik Angewandte Statistik

fh management, communication & it Constantin von Craushaar fh-management, communication & it Statistik Angewandte Statistik fh management, communication & it Folie 1 Überblick Grundlagen (Testvoraussetzungen) Mittelwertvergleiche (t-test,..) Nichtparametrische Tests Korrelationen Regressionsanalyse... Folie 2 Überblick... Varianzanalyse

Mehr

Deskriptive Statistik

Deskriptive Statistik Deskriptive Statistik In der beschreibenden Statistik werden Methoden behandelt, mit deren Hilfe man Daten übersichtlich darstellen und kennzeichnen kann. Die Urliste (=Daten in der Reihenfolge ihrer Erhebung)

Mehr

Tabelle 6a: Deskriptive Statistiken der metrischen Variablen

Tabelle 6a: Deskriptive Statistiken der metrischen Variablen Ergebnisse 77 5 Ergebnisse Das folgende Kapitel widmet sich der statistischen Auswertung der Daten zur Ü- berprüfung der Hypothesen. Die hier verwendeten Daten wurden mit den in 4.3 beschriebenen Instrumenten

Mehr

QM: Prüfen -1- KN16.08.2010

QM: Prüfen -1- KN16.08.2010 QM: Prüfen -1- KN16.08.2010 2.4 Prüfen 2.4.1 Begriffe, Definitionen Ein wesentlicher Bestandteil der Qualitätssicherung ist das Prüfen. Sie wird aber nicht wie früher nach der Fertigung durch einen Prüfer,

Mehr

Willkommen zur Vorlesung Statistik

Willkommen zur Vorlesung Statistik Willkommen zur Vorlesung Statistik Thema dieser Vorlesung: Varianzanalyse Prof. Dr. Wolfgang Ludwig-Mayerhofer Universität Siegen Philosophische Fakultät, Seminar für Sozialwissenschaften Prof. Dr. Wolfgang

Mehr

Statistik II: Signifikanztests /1

Statistik II: Signifikanztests /1 Medien Institut : Signifikanztests /1 Dr. Andreas Vlašić Medien Institut (0621) 52 67 44 vlasic@medien-institut.de Gliederung 1. Noch einmal: Grundlagen des Signifikanztests 2. Der chi 2 -Test 3. Der t-test

Mehr

1.6 Der Vorzeichentest

1.6 Der Vorzeichentest .6 Der Vorzeichentest In diesem Kapitel soll der Vorzeichentest bzw. Zeichentest vorgestellt werden, mit dem man Hypothesen bezüglich des Medians der unabhängig und identisch stetig verteilten Zufallsvariablen

Mehr

Grundlagen von Versuchsmethodik und Datenanalyse

Grundlagen von Versuchsmethodik und Datenanalyse Grundlagen von Versuchsmethodik und Datenanalyse Der Anfang: Hypothesen über Ursache-Wirkungs-Zusammenhänge Ursache Wirkung Koffein verbessert Kurzzeitgedächtnis Gewaltfilme führen zu aggressivem Verhalten

Mehr

Etwas positive Tendenz ist beim Wechsel der Temperatur von 120 auf 170 zu erkennen.

Etwas positive Tendenz ist beim Wechsel der Temperatur von 120 auf 170 zu erkennen. Explorative Datenanalyse Erstmal die Grafiken: Aufreisskraft und Temperatur 3 1-1 N = 1 15 17 Temperatur Diagramm 3 1 95% CI -1 N = 1 15 17 Temperatur Etwas positive Tendenz ist beim Wechsel der Temperatur

Mehr

TÜV Service tested Prüfgrundlagen

TÜV Service tested Prüfgrundlagen TÜV Service tested Prüfgrundlagen 60 Grundsätzliche Prüfgrundlagen Für die Auszeichnung TÜV Service tested müssen drei Voraussetzungen erfüllt sein: 1. Die Gesamtzufriedenheit muss von den Kunden des Unternehmens

Mehr

Auswerten mit Excel. Viele Video-Tutorials auf Youtube z.b. http://www.youtube.com/watch?v=vuuky6xxjro

Auswerten mit Excel. Viele Video-Tutorials auf Youtube z.b. http://www.youtube.com/watch?v=vuuky6xxjro Auswerten mit Excel Viele Video-Tutorials auf Youtube z.b. http://www.youtube.com/watch?v=vuuky6xxjro 1. Pivot-Tabellen erstellen: In der Datenmaske in eine beliebige Zelle klicken Registerkarte Einfügen

Mehr

METHODENLEHRE I WS 2013/14 THOMAS SCHÄFER

METHODENLEHRE I WS 2013/14 THOMAS SCHÄFER METHODENLEHRE I WS 2013/14 THOMAS SCHÄFER DAS THEMA: INFERENZSTATISTIK IV INFERENZSTATISTISCHE AUSSAGEN FÜR ZUSAMMENHÄNGE UND UNTERSCHIEDE Inferenzstatistik für Zusammenhänge Inferenzstatistik für Unterschiede

Mehr

Empirische Methoden PM-EMP-P12-040828

Empirische Methoden PM-EMP-P12-040828 Studiengang Pflegemanagement Fach Empirische Methoden Art der Leistung Prüfungsleistung Klausur-Knz. Datum 28.08.2004 Die Klausur besteht aus 5 Aufgaben, von denen alle zu lösen sind. Ihnen stehen 90 Minuten

Mehr

Einfache Statistiken in Excel

Einfache Statistiken in Excel Einfache Statistiken in Excel Dipl.-Volkswirtin Anna Miller Bergische Universität Wuppertal Schumpeter School of Business and Economics Lehrstuhl für Internationale Wirtschaft und Regionalökonomik Raum

Mehr

Analog zu Aufgabe 16.1 werden die Daten durch folgenden Befehl eingelesen: > kredit<-read.table("c:\\compaufg\\kredit.

Analog zu Aufgabe 16.1 werden die Daten durch folgenden Befehl eingelesen: > kredit<-read.table(c:\\compaufg\\kredit. Lösung 16.3 Analog zu Aufgabe 16.1 werden die Daten durch folgenden Befehl eingelesen: > kredit

Mehr

Überblick über multivariate Verfahren in der Statistik/Datenanalyse

Überblick über multivariate Verfahren in der Statistik/Datenanalyse Überblick über multivariate Verfahren in der Statistik/Datenanalyse Die Klassifikation multivariater Verfahren ist nach verschiedenen Gesichtspunkten möglich: Klassifikation nach der Zahl der Art (Skalenniveau)

Mehr

Verteilungsanalyse. Johannes Hain. Lehrstuhl für Mathematik VIII Statistik 1/35

Verteilungsanalyse. Johannes Hain. Lehrstuhl für Mathematik VIII Statistik 1/35 Verteilungsanalyse Johannes Hain Lehrstuhl für Mathematik VIII Statistik 1/35 Datentypen Als Sammeln von Daten bezeichnet man in der Statistik das Aufzeichnen von Fakten. Erhobene Daten klassifziert man

Mehr

Überblick über die Verfahren für Ordinaldaten

Überblick über die Verfahren für Ordinaldaten Verfahren zur Analyse ordinalskalierten Daten 1 Überblick über die Verfahren für Ordinaldaten Unterschiede bei unabhängigen Stichproben Test U Test nach Mann & Whitney H Test nach Kruskal & Wallis parametrische

Mehr

Skript zur Übung: Grundlagen der empirischen Sozialforschung - Datenanalyse

Skript zur Übung: Grundlagen der empirischen Sozialforschung - Datenanalyse Skript zur Übung: Grundlagen der empirischen Sozialforschung - Datenanalyse Phasen des Forschungsprozesses Auswahl des Forschungsproblems Theoriebildung Theoretische Phase Konzeptspezifikation / Operationalisierung

Mehr

Güte von Tests. die Wahrscheinlichkeit für den Fehler 2. Art bei der Testentscheidung, nämlich. falsch ist. Darauf haben wir bereits im Kapitel über

Güte von Tests. die Wahrscheinlichkeit für den Fehler 2. Art bei der Testentscheidung, nämlich. falsch ist. Darauf haben wir bereits im Kapitel über Güte von s Grundlegendes zum Konzept der Güte Ableitung der Gütefunktion des Gauss im Einstichprobenproblem Grafische Darstellung der Gütefunktionen des Gauss im Einstichprobenproblem Ableitung der Gütefunktion

Mehr

Lösungen zu Janssen/Laatz, Statistische Datenanalyse mit SPSS 1

Lösungen zu Janssen/Laatz, Statistische Datenanalyse mit SPSS 1 LÖSUNG 2C a) Lösungen zu Janssen/Laatz, Statistische Datenanalyse mit SPSS 1 Bei HHEINK handelt es sich um eine metrische Variable. Bei den Analysen sollen Extremwerte ausgeschlossen werden. Man sollte

Mehr

- Eine typische Ausfallrate, wie sie bei vielen technischen Anwendungen zu sehen ist hat die Form einer Badewanne, deshalb nennt man diese Kurve auch

- Eine typische Ausfallrate, wie sie bei vielen technischen Anwendungen zu sehen ist hat die Form einer Badewanne, deshalb nennt man diese Kurve auch 1 2 - Eine typische Ausfallrate, wie sie bei vielen technischen Anwendungen zu sehen ist hat die Form einer Badewanne, deshalb nennt man diese Kurve auch Badewannenkurve. -mit der Badewannenkurve lässt

Mehr

Lösungen zu Janssen/Laatz, Statistische Datenanalyse mit SPSS 1

Lösungen zu Janssen/Laatz, Statistische Datenanalyse mit SPSS 1 LÖSUNG 3A Lösungen zu Janssen/Laatz, Statistische Datenanalyse mit SPSS 1 Mit den Berechnungsfunktionen LG10(?) und SQRT(?) in "Transformieren", "Berechnen" können logarithmierte Werte sowie die Quadratwurzel

Mehr

Willkommen zur Vorlesung Statistik

Willkommen zur Vorlesung Statistik Willkommen zur Vorlesung Statistik Thema dieser Vorlesung: Maßzahlen für zentrale Tendenz, Streuung und andere Eigenschaften von Verteilungen Prof. Dr. Wolfgang Ludwig-Mayerhofer Universität Siegen Philosophische

Mehr

Die ABSOLUTE HÄUFIGKEIT einer Merkmalsausprägung gibt an, wie oft diese in der Erhebung eingetreten ist.

Die ABSOLUTE HÄUFIGKEIT einer Merkmalsausprägung gibt an, wie oft diese in der Erhebung eingetreten ist. .3. Stochastik Grundlagen Die ABSOLUTE HÄUFIGKEIT einer Merkmalsausprägung gibt an, wie oft diese in der Erhebung eingetreten ist. Die RELATIVE HÄUFIGKEIT einer Merkmalsausprägung gibt an mit welchem Anteil

Mehr

1. Maße der zentralen Tendenz Beispiel: Variable Anzahl der Geschwister aus Jugend '92. Valid Cum Value Frequency Percent Percent Percent

1. Maße der zentralen Tendenz Beispiel: Variable Anzahl der Geschwister aus Jugend '92. Valid Cum Value Frequency Percent Percent Percent Deskriptive Statistik 1. Verteilungsformen symmetrisch/asymmetrisch unimodal(eingipflig) / bimodal (zweigipflig schmalgipflig / breitgipflig linkssteil / rechtssteil U-förmig / abfallend Statistische Kennwerte

Mehr

Datenanalyse und Statistik

Datenanalyse und Statistik Datenanalyse und Statistik p. 1/44 Datenanalyse und Statistik Vorlesung 2 (Graphik I) K.Gerald van den Boogaart http://www.stat.boogaart.de Datenanalyse und Statistik p. 2/44 Daten Schätzung Test Mathe

Mehr

Willkommen zur Vorlesung Statistik

Willkommen zur Vorlesung Statistik Willkommen zur Vorlesung Statistik Thema dieser Vorlesung: Analyse von Kreuztabellen Prof. Dr. Wolfgang Ludwig-Mayerhofer Universität Siegen Philosophische Fakultät, Seminar für Sozialwissenschaften Prof.

Mehr

3.2 Bivariate Verteilungen

3.2 Bivariate Verteilungen 3.2 Bivariate Verteilungen zwei Variablen X, Y werden gemeinsam betrachtet (an jedem Objekt i, i = 1,..., n, werden gleichzeitig zwei Merkmale beobachtet) Beobachtungswerte sind Paare/Kombinationen von

Mehr

Mittelwert und Standardabweichung

Mittelwert und Standardabweichung Professur E-Learning und Neue Medien Institut für Medienforschung Philosophische Fakultät Einführung in die Statistik Mittelwert und Standardabweichung Überblick Mittelwert Standardabweichung Weitere Maße

Mehr

0 Einführung: Was ist Statistik

0 Einführung: Was ist Statistik 0 Einführung: Was ist Statistik 1 Datenerhebung und Messung Die Messung Skalenniveaus 2 Univariate deskriptive Statistik 3 Multivariate Statistik 4 Regression 5 Ergänzungen Grundbegriffe Statistische Einheit,

Mehr

Tutorial: Homogenitätstest

Tutorial: Homogenitätstest Tutorial: Homogenitätstest Eine Bank möchte die Kreditwürdigkeit potenzieller Kreditnehmer abschätzen. Einerseits lebt die Bank ja von der Vergabe von Krediten, andererseits verursachen Problemkredite

Mehr

Box-and-Whisker Plot -0,2 0,8 1,8 2,8 3,8 4,8

Box-and-Whisker Plot -0,2 0,8 1,8 2,8 3,8 4,8 . Aufgabe: Für zwei verschiedene Aktien wurde der relative Kurszuwachs (in % beobachtet. Aus den jeweils 20 Quartaldaten ergaben sich die folgenden Box-Plots. Box-and-Whisker Plot Aktie Aktie 2-0,2 0,8,8

Mehr

Klausur in Statistik VWA Essen

Klausur in Statistik VWA Essen Prof. Dr. Peter von der Lippe Klausur in Statistik VWA Essen neue Regelung (verkürzter Stoff) Bitte schreiben Sie hier Ihren Namen auf das Deckblatt. Bitte neben dieser Aufgabenstellung keine weitere Blätter

Mehr

Einführung in statistische Testmethoden

Einführung in statistische Testmethoden Einführung in statistische Testmethoden und die Bearbeitung von Messdaten mit Excel 1. Beispielhafte Einführung in den Gebrauch von Testmethoden 2. Typen von Messwerten, Verteilungen 3. Mittelwert, Varianz,

Mehr

Einführung in die Statistik für Politikwissenschaftler Sommersemester 2011

Einführung in die Statistik für Politikwissenschaftler Sommersemester 2011 Einführung in die Statistik für Politikwissenschaftler Sommersemester 2011 Es können von den Antworten alle, mehrere oder keine Antwort(en) richtig sein. Nur bei einer korrekten Antwort (ohne Auslassungen

Mehr

Der χ 2 -Test (Chiquadrat-Test)

Der χ 2 -Test (Chiquadrat-Test) Der χ 2 -Test (Chiquadrat-Test) Der Grundgedanke Mit den χ 2 -Methoden kann überprüft werden, ob sich die empirischen (im Experiment beobachteten) Häufigkeiten einer nominalen Variable systematisch von

Mehr

Es können keine oder mehrere Antworten richtig sein. Eine Frage ist NUR dann richtig beantwortet, wenn ALLE richtigen Antworten angekreuzt wurden.

Es können keine oder mehrere Antworten richtig sein. Eine Frage ist NUR dann richtig beantwortet, wenn ALLE richtigen Antworten angekreuzt wurden. Teil III: Statistik Alle Fragen sind zu beantworten. Es können keine oder mehrere Antworten richtig sein. Eine Frage ist NUR dann richtig beantwortet, wenn ALLE richtigen Antworten angekreuzt wurden. Wird

Mehr

Kapitel 9: Verfahren für Nominaldaten

Kapitel 9: Verfahren für Nominaldaten Kapitel 9: Verfahren für Nominaldaten Eindimensionaler Chi²-Test 1 Der zweidimensionale Chi²-Test 4 Eindimensionaler Chi²-Test Der eindimensionale χ²-test wird dann herangezogen, wenn die Versuchspersonen

Mehr

Inhaltsverzeichnis. Teil 1 Basiswissen und Werkzeuge, um Statistik anzuwenden

Inhaltsverzeichnis. Teil 1 Basiswissen und Werkzeuge, um Statistik anzuwenden Inhaltsverzeichnis Teil 1 Basiswissen und Werkzeuge, um Statistik anzuwenden 1 Statistik ist Spaß 3 Warum Statistik? 3 Checkpoints 4 Daten 4 Checkpoints 7 Skalen - lebenslang wichtig bei der Datenanalyse

Mehr

Statistische Tests (Signifikanztests)

Statistische Tests (Signifikanztests) Statistische Tests (Signifikanztests) [testing statistical hypothesis] Prüfen und Bewerten von Hypothesen (Annahmen, Vermutungen) über die Verteilungen von Merkmalen in einer Grundgesamtheit (Population)

Mehr

Melanie Kaspar, Prof. Dr. B. Grabowski 1

Melanie Kaspar, Prof. Dr. B. Grabowski 1 7. Hypothesentests Ausgangssituation: Man muss sich zwischen 2 Möglichkeiten (=Hypothesen) entscheiden. Diese Entscheidung soll mit Hilfe von Beobachtungen ( Stichprobe ) getroffen werden. Die Hypothesen

Mehr

Monte Carlo Simulation (Grundlagen)

Monte Carlo Simulation (Grundlagen) Der Titel des vorliegenden Beitrages wird bei den meisten Lesern vermutlich Assoziationen mit Roulette oder Black Jack hervorrufen. Allerdings haben das heutige Thema und die Spieltische nur den Namen

Mehr