Analyse mehrdimensionaler Daten WS 2010/11

Größe: px
Ab Seite anzeigen:

Download "Analyse mehrdimensionaler Daten WS 2010/11"

Transkript

1 Analyse mehrdimensionaler Daten WS 2010/11 Fred Böker Institut für Statistik und Ökonometrie Platz der Göttinger Sieben 5 D Göttingen 4. Oktober 2010 Tel Fred.Boeker@Wi-Wiss.Uni-Goettingen.de

2 Inhaltsverzeichnis 1 Überblick Was sind multivariate Verfahren? Notation Zielsetzungen multivariater Analysen Einteilung multivariater Analyseverfahren Kurzbeschreibung, wichtigste Verfahren Multivariate Verteilungen Gemeinsame-, Rand- und bedingte Verteilungen Erwartungswert, Varianz, Kovarianz und Korrelation Multivariate Normalverteilung Bivariate Normalverteilung Andere multivariate Verteilungen Erste Schritte der Datenanalyse Einlesen und Überprüfen der Daten Erste Statistiken Hauptkomponentenanalyse Einführung Herleitung der Hauptkomponenten Weiteres zur Hauptkomponentenanalyse Auswahl der Hauptkomponenten Hauptkomponentenanalyse für multivariat normalverteilte Daten Zusammenfassung Faktorenanalyse Einführung Das Modell der Faktorenanalyse i

3 Inhaltsverzeichnis Schätzung der Faktorladungen Interpretation und Rotation Beispiel Faktorenanalyse in R Die multivariate Normalverteilung Definition der multivariaten Normalverteilung Eigenschaften der multivariaten Normalverteilung Schätzung der Parameter Die Wishart-Verteilung Gemeinsame Verteilung X und S Hotellings T 2 -Verteilung Verfahren, die auf Normalverteilung basieren Einleitung Einstichprobenverfahren Konfidenzintervalle und Hypothesentests Tests über Beziehungen zwischen den Variablen Zweistichprobenverfahren Diskriminanzanalyse Zweigruppenfall Verallgemeinerung auf mehr als zwei Populationen Fishers Methode für die Trennung mehrerer Gruppen Literatur 131 Formeln 133 Index Anhang aus Statistik-III-Skript: p-dimensionale Zufallsvariablen Definitionen, Eigenschaften Die p-dimensionale Normalverteilung Summen und Linearkombinationen von Zufallsvariablen Weiteres zur multivariaten Normalverteilung

4 Kapitel 1 Überblick 1.1 Was sind multivariate Verfahren? In dieser Vorlesung geht es um multivariate Verfahren. Neben multivariaten Verfahren gibt es univariate und bivariate Verfahren. In der Statististischen Methodenlehre I haben Sie univariate Verfahren kennengelernt, eindimensionale Verteilungen von Zufallsvariablen, Sie haben Stichproben kennengelernt, bei denen Sie je Merkmalsträger ein Merkmal beobachtet haben, z.b. die Brenndauer von n = 30 Glühbirnen oder die Körpergröße von n = 227 Studierenden. Brenndauer von 30 Glühbirnen Brenndauer Abbildung 1.1: Brenndauer von 30 Glühbirnen, Beobachtungen, Histogramm und Dichtefunktion Abbildung 1.1 zeigt ein Histogramm der Brenndauern von 30 Glühbirnen, die einzelnen Beobachtungen sind durch Striche auf der x-achse gekennzeichnet. An die Beobchtungen ist eine Dichtefunktion angepasst worden, offensichtlich eine Normalverteilung. Hätten Sie bei den Studierenden außer der Körpergröße auch noch das Gewicht der Studierenden als zweites Merkmal erhoben, so hätten Sie m = 2 Merkmale an n = 227 Merkmalsträgern beobachtet. Wir kommmen nicht viel weiter, wenn wir die beiden Merkmale separat 2

5 1.1. WAS SIND MULTIVARIATE VERFAHREN? 3 betrachten, wie in Abbildung 1.2, in der wir jeweils ein Histogramm der beiden Merkmale gezeichnet haben Körpergröße Gewicht Abbildung 1.2: Körpergröße und Gewicht von 227 Studierenden Wir müssen die beiden Merkmale gemeinsam betrachten. Wie gehören die beiden Merkmale zusammen? Welche Merkmale des Gewichts gehören zu welchen der Körpergröße? Um den Zusammenhang zwischen Körpergröße und Gewicht zu untersuchen, brauchen Sie bivariate Verfahren. Ein einfaches bivariates Verfahren ist z.b. der Scatterplot, eine Darstellung der beiden Variablen (siehe Abbildung 1.3). Größe und Gewicht von Studierenden Gewicht Größe Abbildung 1.3: Körpergröße und Gewicht von 227 Studierenden Unter Umständen wird in einer solchen Situation eine einfache Regressionsanalyse durchgeführt. Dabei betrachtet man meistens eine Variable (hier wohl die Körpergröße als unabhängige Variable und die andere als abhängige Variable (hier wohl das Gewicht). Statt unabhängiger Variable sagt man auch erklärende Variable (die Körpergröße,,erklärt das Gewicht). Bei der Regressionsanalyse geht es um Abhängigkeit (Dependenz). Man könnte in diesem Fall auch beide Variablen (Körpergröße und Gewicht) gleichwertig nebeneinander betrachten und sich für den Zusammenhang interessieren, indem man beispielsweise den Korrelationskoeffizienten berechnet. Dadurch wird der Zusammenhang (die Interdependenz) untersucht.

6 4 KAPITEL 1. ÜBERBLICK Eine andere Analyse wäre in folgender Situation nötig. Als zweite Variable wurde neben der Körpergröße das Geschlecht der Studierenden notiert. In Abbildung 1.4 sind die Histogramme der männlichen und weiblichen Studierenden nebeneinander dargestellt. Auffällig ist, dass das Histogramm der männlichen Studierenden breiter und flacher als das der weiblichen Studierenden ist Größe der Männer Größe der Frauen Abbildung 1.4: Körpergröße von männlichen und weiblichen Studierenden Abbildung 1.5 zeigt einen Boxplot der Körpergröße für die beiden Gruppen männlich und weiblich. In diesem Fall kann die zweite Variable Geschlecht nur zwei Werte männlich und weiblich annehmen. In diesem Fall wäre eventuell eine einfache Varianzanalyse angebracht. Boxplot der Körpergröße nach Geschlecht Körpergröße männlich weiblich Abbildung 1.5: Körpergröße nach Geschlecht Die Variable Geschlecht unterscheidet sich durch ihr Skalenniveau von den beiden anderen Variablen Körpergröße und Gewicht. Die Variable Geschlecht ist eine qualitative oder kategoriale Variable. Man spricht auch von nominalskalierten Variablen. Man kann für zwei Merkmalsträger nur feststellen, ob sie derselben oder verschiedenen Kategorien angehören. Man kann jedoch keinen Abstand zwischen den Kategorien und auch keine Richtung (kleiner oder größer, besser oder schlechter) angeben. Das gilt auch dann, wenn solche Variablen in der Datenmatrix häufig durch Zahlen codiert sind. In unserer Datenmatrix sind die Ausprägungen männlich und weiblich durch die Zahlen 0 und 1 codiert. Dennoch kann man

7 1.1. WAS SIND MULTIVARIATE VERFAHREN? 5 nicht sagen, dass der Abstand zwischen Männern und Frauen 1 ist. Auch wird nichts über eine Größenrelation ausgesagt. Das ist anders bei rangskalierten Variablen, z.b. Schulnoten mit den Ausprägungen,,sehr gut,,,gut,,,befriedigend,,,ausreichend,,,mangelhaft und,,ungenügend. Hier ist,,sehr gut besser als,,gut,,,befriedigend besser als,,ausreichend. Auch wenn für Schulnoten häufig die Ziffern 1 bis 6 vergeben werden, lässt sich wohl kaum behaupten, dass der Abstand zwischen,,sehr gut und,,gut genau so groß ist wie zwischen,,ausreichend und,,mangelhaft. Man spricht hier auch von ordinalskalierten Merkmalen. Die Variablen Körpergröße und Gewicht haben das höchste Skalenniveau. Es sind quantitative oder metrische Variablen. Sowohl die Differenzen als auch die Verhältnisse zwischen den Merkmalsausprägungen sind aussagekräftig (siehe z.b. Rinne (2000), S. 2). Tabelle 1.1 gibt einen Überblick über die verschiedenen Skalenniveaus. Tabelle 1.1: Klassifizierung von Merkmalen Mermale qualitative rangskalierte quantitative nominalskaliert ordinalskaliert metrisch Beispiele: Geschlecht Schulnote Gewicht Augenfarbe Rangplatz Verkaufszahl Automarke Güteklasse Lebensdauer Die drei bisher genannten Variablen Körpergröße, Gewicht, Geschlecht sind u.a. in der R- Einführungsveranstaltung zur Statistischen Methodenlehre I im WS 2000/2001 erhoben worden. Den Fragebogen, die Codes zum Fragebogen und die Ergebnisse der Befragung finden Sie im Internet unter der Instituts-Adresse dann unter Lehre, dann im aktuellen Semester, dann unter Multivariate Verfahren und dort unter Notizen. Öffnen Sie die Dateien durch Doppelklick im Internet, speichern Sie die Datensätze auf Ihrem Rechner und importieren Sie dann die Daten in R mit dem Befehl dget. Die Daten zur Befragung in Statistik I sind in Form einer Matrix gespeichert mit m = 30 Spalten und n = 239 Zeilen, d.h. n = 239 Studierende (Merkmalsträger, Elemente) wurden befragt. Insgesamt wurden durch die Befragung m = 30 Merkmale erfasst. Jede Zeile der Matrix steht für einen Merkmalsträger, jede Spalte für ein Merkmal oder jede Spalte enthält eine Variable. Eine erste Charakterisierung multivariater Verfahren besagt, dass darunter alle Verfahren fallen, die mehr als m = 2 Merkmale gleichzeitig untersuchen. Einige Autoren (siehe z.b. Bamberg/Baur (1996, S.231)) halten diese Definition für zu weit gefasst. Dann würden auch alle ökonometrischen und varianzanalytischen Verfahren darunterfallen. Bei diesen beiden Verfahrenstypen werden die Variablen a priori in endogene und exogene Variablen aufgeteilt. Die,,typischen multivariaten Verfahren behandeln alle Variablen als,,gleichberechtigt.

8 6 KAPITEL 1. ÜBERBLICK 1.2 Notation Wir bezeichnen die Anzahl der Variablen mit m und die Anzahl der Merkmalsträger (Objekte) mit n. Wir haben damit insgesamt n m Beobachtungen. Es sei x rj die r-te Beobachtung der j-ten Variablen, r = 1,..., n; j = 1,...m. Alternativ kann man auch sagen. Es sei x rj das j-te Merkmal beim r-ten Merkmalsträger, j = 1,..., m; r = 1,...n. Die Matrix, die in der r-ten Zeile und j-ten Spalte das Element x rj enthält, heißt Datenmatrix und wird mit dem Symbol X bezeichnet. X = x 11 x x 1m x 21 x x 2m x 31 x x 3m.... x n1 x n2... x nm Bitte beachten Sie, dass im Statistik III-Skript die Reihenfolge der Indizes vertauscht ist. Üblicherweise kommt zuerst der Zeilen-, dann der Spaltenindex. Da die Anzahl der Merkmalsträger (n) meistens sehr viel größer ist als die Anzahl der Merkmale (m) ist es sinnvoll, die Variablen in die Spalten zu schreiben und die Individuen in die Zeilen. Man kann die Datenmatrix X auch auffassen als n Zeilenvektoren x t 1,xt 2,...,xt n - der Zeilenvektor x t r = (x r1, x r2,...,x rm ) besteht also aus der r-ten Zeile der Datenmatrix, d.h. den Merkmalen des r-ten Individuums. Mit x t r wird das Transponierte des Vektors x r bezeichnet. Unter einem Vektor wird zunächst grundsätzlich ein Spaltenvektor verstanden. X = Jeder Vektor x t r; r = 1,...,n hat m Koordinaten und stellt damit einen Punkt im m- dimensionalen Raum dar. Jeder Punkt steht für einen Merkmalsträger, die Koordinaten dieses Punktes sind die Werte der Merkmale dieses Merkmalstägers. Man hat also n Punkte im m-dimensionalen Zeilenraum. Alternativ kann man X auch als m Spaltenvektoren y 1,y 2,...,y m auffassen. x t 1 x t 2 x t 3. x t n X = (y 1,y 2,...,y m ), wobei y i die Elemente der i-ten Spalte, also alle Beobachtungen des i-ten Merkmals oder der i-ten Variablen enthält, d.h. y t i = (x 1i, x 2i,...,x ni )

9 1.3. ZIELSETZUNGEN MULTIVARIATER ANALYSEN 7 Jeder Vektor y i stellt einen Punkt im n-dimensionalen Spaltenraum dar. Jetzt steht jeder Punkt für eine Variable, die Koordinaten entsprechen den Werten dieser Variablen an den verschiedenen Merkmalsträgern. Bei der Bezeichnung x rj wurden bewusst die Indizes r und j gewählt, um ganz klar zwischen dem Index für die Zeile (= Individuum) und der Spalte (= Variable) unterscheiden zu können. Wir werden also die Indizes i, j, k,... für die Variablen und r, s, t,... für die Individuen (Merkmalsträger) verwenden. 1.3 Zielsetzungen multivariater Analysen Dieser Abschnitt orientiert sich an Rinne (2000), Bamberg/Baur (1996) und Chatfield/Collins (1991). Es gibt eine Vielzahl multivariater Verfahren. Die Auswahl der geeigneten Methode hängt ab vom Typ der Variablen, dem gestellten Problem und den Zielsetzungen der Analyse. In vielen Fällen geht es um Vereinfachung. Man möchte einen großen Datensatz durch möglichst wenige Parameter beschreiben. Vielleicht sind einige der Variablen überflüssig, da (annähernd) die gleiche Information in anderen Variablen steckt. Man könnte dadurch eventuell Rechenzeiten sparen oder Erhebungskosten. Kendall (1980, S. 1, siehe auch Rinne (2000, S.3)) nennt die folgenden sechs Punkte als wichtigste Zielsetzungen multivariater Analysen. 1) Strukturelle Vereinfachung: Man möchte das Problem vereinfachen durch Elimination überflüssiger Variablen. Durch Transformation einer Menge interdependenter Variablen in eine Menge unabhängiger Variablen lässt sich eventuell die Komplexität des Problems verringern. 2) Klassifikation: Man kann sich fragen ob die Elemente Gruppen bilden, d.h. gehäuft im Merkmalsraum liegen, oder ob sie mehr oder minder gleichmäßig über den gesamten Merkmalsraum variieren. In Abbildung 1.6 sind deutlich zwei Gruppen zu erkennen. y Abbildung 1.6: Punktwolke mit zwei Gruppen y1 3) Gruppierung der Variablen: Hier geht es um die Frage, ob es unter den m Variablen verwandte Variablen gibt. Man beachte, dass es im vorigen Punkt - bei der Klassifizie-

10 8 KAPITEL 1. ÜBERBLICK rung - um Gruppen unter den Objekten (Merkmalsträgern, Zeilen) geht. Jetzt geht es um die Variablen (Spalten). 4) Analyse der Interdependenz (Zusammenhänge): Hier geht es um die Zusammenhänge zwischen Variablen, wobei die Möglichkeiten von der Unabhängigkeit bis zur Kollinearität reichen, eine Situation, in der eine Variable eine lineare (oder allgemeiner eine nichtlineare) Funktion der anderen Variablen ist. 5) Analyse der Dependenz (Abhängigkeit): Im vorigen Punkt waren bei der Untersuchung der gegenseitigen Beziehungen alle Variablen gleichberechtigt. Jetzt werden eine oder mehrere Variablen herausgehoben und untersucht, wie sie von den anderen abhängen. 6) Hypothesenformulierung und Überprüfung. Chatfield und Collins (1991) betonen, dass es bei vielen multivariaten Verfahren eher um das Aufstellen von Hypothesen als um das Überprüfen von Hypothesen geht. 1.4 Einteilung multivariater Analyseverfahren Bei Rinne (2000, S. 6) und auch Bamberg/Baur (1996) findet man die folgenden Einteilungsmöglichkeiten: nach dem Skalenniveau der Variablen danach, ob der deskriptive Charakter oder der Stichprobencharakter stärker betont wird danach, ob das Interesse primär auf die Variablen (Spalten) oder auf die Untersuchungsobjekte (Zeilen der Datenmatrix) gerichtet ist. Nach dem letzten Gesichtspunkt gelangt man zu einer Zweiteilung der multivariaten Verfahren in die sogenannten R-Techniken und die sogenannten Q-Techniken. a) Von einer R-Technik wird gesprochen, wenn das Hauptinteresse den Variablen gilt: Es sollen z.b. Zusammenhänge zwischen den Variablen aufgedeckt, redundante Variablen entfernt oder neue Variablen konstruiert werden. Zu den R-Techniken gehören die Regressionsanalyse, die Varianz- und Kovarianzanalyse, die Hauptkomponenten-, die Faktoren- und die kananonische Korrelationsanalyse. b) Von einer Q-Technik wird gesprochen, wenn das Hauptinteresse auf die Merkmalsträger gerichtet ist. Man möchte Zusammenhänge oder auch Unterschiede zwischen den Trägern erkennen, man möchte die Objekte gruppieren oder auch einer von mehreren Gruppen optimal zuordnen. Zu den Q-Techniken gehören die Cluster- und die Diskriminanzanalyse. Kendall (1980, S.12, siehe auch Rinne (2000, S.6)) teilt die Verfahren danach ein, ob sie Interdependenzen (Zusammenhänge) anzeigen sollen oder ob Dependenzen aufgedeckt werden sollen. Backhaus u.a (2000) sprechen von Strukturen-entdeckenden und Strukturenprüfenden Verfahren.

11 1.4. EINTEILUNG MULTIVARIATER ANALYSEVERFAHREN 9 a) Strukturen-entdeckende Verfahren sind solche multivariaten Verfahren, deren primäres Ziel in der Entdeckung von Zusammenhängen zwischen Variablen oder zwischen Objekten liegt. Der Anwender besitzt zu Beginn der Analyse noch keine Vorstellungen darüber, welche Beziehungszusammenhänge in einem Datensatz existieren. Zu diesen Verfahren gehören Clusteranalyse Hauptkomponentenanalyse Faktorenanalyse Multidimensionale Skalierung Kanonische Korrelation b) Strukturen-prüfende Verfahren sind solche multivariaten Verfahren, deren primäres Ziel in der Überprüfung von Zusammenhängen zwischen Variablen liegt. Der Anwender besitzt bereits eine auf sachlogischen oder theoretischen Überlegungen basierende Vorstellung über die Zusammenhänge zwischen Variablen und möchte diese mit Hilfe multivariater Verfahren überprüfen. In diesen Bereich gehören die Regressionsanalyse Varianzanalyse Diskriminanzanalyse Kontingenztafelanalyse Bei Backhaus u.a. (2000) findet man die folgende Charakterisierung (Tabelle 1.2) der strukturen-prüfenden Verfahren nach ihrem Skalenniveau: Tabelle 1.2: Überblick strukturen-prüfende Verfahren UNABHÄNGIGE VARIABLE metrisches Skalenniveau nominales Skalenniveau ABHÄNGIGE VARIABLE metrisches Regressions- Varianz- Skalenniveau analyse analyse nominales Diskriminanz- Kontingenz- Skalenniveau analyse analyse

12 10 KAPITEL 1. ÜBERBLICK 1.5 Kurzbeschreibung der wichtigsten multivariaten Verfahren Einen Überblick über die wichtigsten multivariaten Verfahren findet man z.b. bei Rinne (2000, S. 4), Backhaus u.a. (2000), Fahrmeir u.a. (1996). Regressionsanalyse: Vorausgesetzt wird für alle Variablen metrisches Skalenniveau. Man unterscheidet zwischen univariater und multivariater Regression. Dabei beziehen sich diese Begriffe auf die Anzahl q der abhängigen Variablen. Bei einer abhängigen Variablen handelt es sich um univariate Regression, bei mehr als einer abhängigen Variablen spricht man von multivariater Regression. Die Anzahl p der unabhängigen Variablen ist stets größer oder gleich 1. In der Regressionsanalyse geht es darum, die Koeffizienten der unterstellten (linearen) Funktion zwischen der(n) abhängigen Variablen und der(n) unabhängigen Variablen aus den Daten zu schätzen. Im Rahmen einer guten Modellanpassung geht es auch darum, die,,optimale Menge der erklärenden (unabhängigen) Variablen zu finden. Eventuell sind einige der Variablen zur Erklärung unnötig. Schließlich geht es darum, die abhängige(n) Variablen (Regressanden) aus der(n) unabhängigen Variablen (Regressoren),,optimal vorherzusagen. Ein Beispiel bildet die Frage, ob und wie die Absatzmenge eines Produkts vom Preis, den Werbeausgaben, der Zahl der Verkaufsstätten und dem Volkseinkommen abhängt. Korrelationsanalyse: Die Voraussetzungen sind wie in der Regressionsanalyse. Jedoch geht es hier um die Messung der Stärke des linearen Zusammenhangs zwischen einer Kriteriumsvariablen und einer oder mehreren Prädikatorvariablen durch den einfachen bzw. multiplen Korrelationskoeffizienten. Kanonische Korrelationsanalyse: Hier wird die Stärke des (linearen) Zusammenhangs zwischen zwei Gruppen von Variablen untersucht. Es werden sogenannte kanonische Variablen bestimmt. Das sind Linearkombinationen aus den Variablen in den beiden Gruppen. Man bestimmt die Korrelationskoeffizienten zwischen solchen Linearkombinationen und sucht nach der maximalen Korrelation, um den ersten kanonischen Korrelationskoeffizienten zu bestimmen. Die ersten kanonischen Variablen sind die Linearkombinationen mit der größten Korrelation. Das zweite Paar kanonischer Variablen wird analog bestimmt mit der Nebenbedingung, dass sie mit den zuvor bestimmten kanonischen Variablen unkorreliert sind. Die ursprüngliche Variablenfülle kann durch Übergang zu den kanonischen Variablen mit der höchsten Korrelation reduziert werden (siehe Rinne (2000), S. 69). Varianzanalyse: Die Varianzanalyse ist ein Verfahren, das die Wirkung einer (oder mehrerer) unabhängiger Variablen auf eine oder mehrere abhängige Variablen untersucht. Für die unabhängige Variable wird dabei nur Nominalskalierung verlangt, während die abhängige Variable metrisches Skalenniveau besitzen muss. Die unabhängigen Variablen heißen Faktoren, deren Ausprägungen Faktorstufen. Ist man nur an der Wirkung eines Faktors interressiert, so spricht man von einfacher Varianzanalyse. Soll der Effekt von r Faktoren untersucht werden, so spricht man von r -facher Varianzanalyse. Die Varianzanalyse wird typischerweise zur Auswertung von Experimenten verwendet. So könnte z.b. die Wirkung alternativer Verpackungsformen und verschiedener Plazierungen eines Produkts im Geschäft auf die Absatzmenge dieses Produkts untersucht werden. Untersucht man mehrere abhängige Variablen, so spricht man von multipler Varianzanalyse. Haben die Faktoren alle metrisches Skalenniveau, so ist eine Regressionsanalyse angebracht. Kovarianzanalyse: Die Kovarianzanalyse kann als Mischung von Varianzanalyse und Regressionsanalyse aufgefasst werden. Eine (metrische) Variable wird als lineare Funktion von q ( 1) nominalskalierten Variablen (Faktoren) und p ( 1 ) metrischen Variablen (Kova-

13 1.5. KURZBESCHREIBUNG, WICHTIGSTE VERFAHREN 11 riablen) modelliert. Primär interessiert der Einfluss der Faktoren auf die abhängige Variable. Es findet in gewissem Sinne eine Bereinigung um den Einfluss der Kovariablen statt. Bei Rinne (2000, S. 88) findet sich das folgende Beispiel: Es soll untersucht werden, ob drei Diätpläne zu unterschiedlichen Gewichtsabnahmen führen. Die abhängige Variable ist die Gewichtsabnahme, die Diätpläne sind Faktoren. Da die Gewichtsabnahme vom Anfangsgewicht abhängig ist, wird das Anfangsgewicht als Kovariable in das Modell aufgenommen. Kontingenztafelanalyse: Hat man m ( 2 ) nominalskalierte Variable, so kann man bei großer Beobachtungszahl n, die Elemente nach Häufigkeiten aller denkbaren Merkmalskombinationen auszählen und in Form einer Häufigkeitstabelle darstellen, z.b. Angehörige des öffentlichen Dienstes nach Laufbahngruppe und Geschlecht. Als drittes Merkmal könnte man untergliedern nach Bund, Ländern und Gemeinden. In diesen Bereich gehören die loglinearen Modelle, Logit-Analysen (siehe z.b. Bishop u.a. (1980) oder Fienberg (1980)). Faktoren- und Hauptkomponentenanalyse: Bei beiden Verfahren geht es um die Definition und Konstruktion hypothetischer Größen oder Variablen aus den in der Datenmatrix enthaltenen Variablen. Die neuen Größen heißen Faktoren, Dimensionen oder Hauptkomponenten. Diese neuen Größen können nicht beobachtet oder gemessen werden, sie sind,,hinter den Beobachtungen stehende Größen, die die gegebene Datenmatrix hinreichend genau abbilden sollen. Gleichzeitig fast im Widerspruch zur vorigen Forderung soll die Anzahl der Faktoren möglichst klein gehalten werden. Damit kommen subjektive Aspekte in das Verfahren hinein, insbesondere dann auch bei der Interpretation der Faktoren. Faktorenund Hauptkomponentenanalyse sollten nicht miteinander verwechselt werden. Die Hauptkomponentenanalyse besteht aus einer orthogonalen Transformation der Originalvariablen in eine Menge neuer, unkorrelierter Variablen, die sogenannten Hauptkomponenten. Diese sind Linearkombinationen der ursprünglichen Variablen. Ziel ist es, mit möglichst wenigen Hauptkomponenten auszukommen und dabei die Variation der Originalvariablen zu reproduzieren. Primärer Zweck ist die Datenreduktion. Hauptzweck der Faktorenanalyse ist die Erklärung der Korrelationsstruktur der Originalvariablen. Auch hier werden linearkombinierte und orthogonale Variablen aus den Ursprungsvariablen berechnet. Vorausgesetzt wird i.d.r. metrisches Skalenniveau. Die Faktorenanalyse wird dann eingesetzt, wenn eine Vielzahl von Variablen erhoben wurde und der Anwender an einer Reduktion bzw Bündelung der Variablen interessiert ist. Backhaus u.a. (2000) nennen als Beispiel die Verdichtung der zahlreichen technischen Eigenschaften eines Autos auf wenige Dimensionen wie Größe, Leistung und Sicherheit. Bei psychologischen Fragebögen ist es häufig der Fall, dass sehr viele unterschiedliche Fragen gestellt werden, die dann zu wenigen Eigenschaften gebündelt werden. Clusteranalyse: Während in der Faktorenanalyse die Variablen gebündelt werden, versucht man mit der Clusteranalyse die Objekte (Merkmalsträger) zu bündeln. Das Ziel ist also, die Objekte so zu Gruppen (Clustern) zusammenzufassen, dass die Objekte in einer Gruppe möglichst ähnlich und die Gruppen untereinander möglichst unähnlich sind. Vor der Analyse sind weder Anzahl der Gruppen, noch Lokalisation oder Homogenität der Gruppen bekannt, noch besitzt man Information über die Zuordnung der Elemente zu den Gruppen. Beispiele sind die Bildung von Persönlichkeitstypen auf der Basis psychografischer Merkmale. Diskriminanzanalyse: In der Diskriminanzanalyse geht es darum, schon vorgegebene Gruppen oder Klassen unter Heranziehung geeigneter, beobachtbarer Merkmale (diskriminatorische Variablen) möglichst gut zu trennen (diskriminieren) und die Gruppenzugehörigkeit noch nicht eingeordneter Elemente bei bekannten Werten der diskriminatorischen Varia-

14 12 KAPITEL 1. ÜBERBLICK blen mit möglichst geringer Fehlerquote zu bestimmen. Ein Beispiel ist die Kreditwürdigkeitsprüfung. Hier gibt es gute und schlechte Kunden. Bei bereits abgelaufenen Kreditgeschäften ist die Kreditwürdigkeit bekannt. Aus der Vielzahl der der Bank bekannten Merkmale des Kreditnehmers sind dann die Variablen herauszusuchen, die am besten zwischen guten und schlechten Kunden trennen. Genauer werden aus den Variablen Diskriminanzfunktionen gebildet, die den Merkmalsraum in disjunkte Klassen aufteilen. Im Titelbild zu diesem Skript sieht man zwei Dichtefunktionen bivariater Normalverteilungen. Es gibt also zwei Gruppen von Beobachtungen, je nachdem von welcher der beiden Verteilungen die Daten kommen. Es stellt sich nun die Frage, wie trennt man den Beobachtungsraum, um eine optimale Zuordnung zu erreichen. Als weitere multvariate Verfahren seien hier noch die folgenden Verfahren genannt: Multioder mehrdimensionale Skalierung, auch MDS abgkürzt (siehe Backhaus u.a. (2000), Rinne (2000), Fahrmeir u.a. (1996)), die Korrespondenzanalyse (siehe Greenacre (1984)), die LISREL-Analyse (siehe Backhaus u.a. (2000)) und das Conjoint Measurement (siehe Backhaus u.a. (2000). Einen tabellarischen Überblick der wichtigsten Verfahren findet man bei Fahrmeir u.a. (1996).

Klausur zur Vorlesung Multivariate Verfahren, SS 2006 6 Kreditpunkte, 90 min

Klausur zur Vorlesung Multivariate Verfahren, SS 2006 6 Kreditpunkte, 90 min Klausur, Multivariate Verfahren, SS 2006, 6 Kreditpunkte, 90 min 1 Prof. Dr. Fred Böker 08.08.2006 Klausur zur Vorlesung Multivariate Verfahren, SS 2006 6 Kreditpunkte, 90 min Gesamtpunkte: 39 Aufgabe

Mehr

Zeichen bei Zahlen entschlüsseln

Zeichen bei Zahlen entschlüsseln Zeichen bei Zahlen entschlüsseln In diesem Kapitel... Verwendung des Zahlenstrahls Absolut richtige Bestimmung von absoluten Werten Operationen bei Zahlen mit Vorzeichen: Addieren, Subtrahieren, Multiplizieren

Mehr

Lineargleichungssysteme: Additions-/ Subtraktionsverfahren

Lineargleichungssysteme: Additions-/ Subtraktionsverfahren Lineargleichungssysteme: Additions-/ Subtraktionsverfahren W. Kippels 22. Februar 2014 Inhaltsverzeichnis 1 Einleitung 2 2 Lineargleichungssysteme zweiten Grades 2 3 Lineargleichungssysteme höheren als

Mehr

Varianzanalyse (ANOVA: analysis of variance)

Varianzanalyse (ANOVA: analysis of variance) Varianzanalyse (AOVA: analysis of variance) Einfaktorielle VA Auf der Basis von zwei Stichproben wird bezüglich der Gleichheit der Mittelwerte getestet. Variablen müssen Variablen nur nominalskaliert sein.

Mehr

Willkommen zur Vorlesung Statistik

Willkommen zur Vorlesung Statistik Willkommen zur Vorlesung Statistik Thema dieser Vorlesung: Varianzanalyse Prof. Dr. Wolfgang Ludwig-Mayerhofer Universität Siegen Philosophische Fakultät, Seminar für Sozialwissenschaften Prof. Dr. Wolfgang

Mehr

Kontingenzkoeffizient (nach Pearson)

Kontingenzkoeffizient (nach Pearson) Assoziationsmaß für zwei nominale Merkmale misst die Unabhängigkeit zweier Merkmale gibt keine Richtung eines Zusammenhanges an 46 o jl beobachtete Häufigkeiten der Kombination von Merkmalsausprägungen

Mehr

2. Deskriptive Statistik 2.1. Häufigkeitstabellen, Histogramme, empirische Verteilungsfunktionen

2. Deskriptive Statistik 2.1. Häufigkeitstabellen, Histogramme, empirische Verteilungsfunktionen 4. Datenanalyse und Modellbildung Deskriptive Statistik 2-1 2. Deskriptive Statistik 2.1. Häufigkeitstabellen, Histogramme, empirische Verteilungsfunktionen Für die Auswertung einer Messreihe, die in Form

Mehr

Einfache Varianzanalyse für abhängige

Einfache Varianzanalyse für abhängige Einfache Varianzanalyse für abhängige Stichproben Wie beim t-test gibt es auch bei der VA eine Alternative für abhängige Stichproben. Anmerkung: Was man unter abhängigen Stichproben versteht und wie diese

Mehr

Stellen Sie bitte den Cursor in die Spalte B2 und rufen die Funktion Sverweis auf. Es öffnet sich folgendes Dialogfenster

Stellen Sie bitte den Cursor in die Spalte B2 und rufen die Funktion Sverweis auf. Es öffnet sich folgendes Dialogfenster Es gibt in Excel unter anderem die so genannten Suchfunktionen / Matrixfunktionen Damit können Sie Werte innerhalb eines bestimmten Bereichs suchen. Als Beispiel möchte ich die Funktion Sverweis zeigen.

Mehr

Korrelation - Regression. Berghold, IMI

Korrelation - Regression. Berghold, IMI Korrelation - Regression Zusammenhang zwischen Variablen Bivariate Datenanalyse - Zusammenhang zwischen 2 stetigen Variablen Korrelation Einfaches lineares Regressionsmodell 1. Schritt: Erstellung eines

Mehr

Anwendungshinweise zur Anwendung der Soziometrie

Anwendungshinweise zur Anwendung der Soziometrie Anwendungshinweise zur Anwendung der Soziometrie Einführung Die Soziometrie ist ein Verfahren, welches sich besonders gut dafür eignet, Beziehungen zwischen Mitgliedern einer Gruppe darzustellen. Das Verfahren

Mehr

Binäre abhängige Variablen

Binäre abhängige Variablen Binäre abhängige Variablen Thushyanthan Baskaran thushyanthan.baskaran@awi.uni-heidelberg.de Alfred Weber Institut Ruprecht Karls Universität Heidelberg Einführung Oft wollen wir qualitative Variablen

Mehr

Güte von Tests. die Wahrscheinlichkeit für den Fehler 2. Art bei der Testentscheidung, nämlich. falsch ist. Darauf haben wir bereits im Kapitel über

Güte von Tests. die Wahrscheinlichkeit für den Fehler 2. Art bei der Testentscheidung, nämlich. falsch ist. Darauf haben wir bereits im Kapitel über Güte von s Grundlegendes zum Konzept der Güte Ableitung der Gütefunktion des Gauss im Einstichprobenproblem Grafische Darstellung der Gütefunktionen des Gauss im Einstichprobenproblem Ableitung der Gütefunktion

Mehr

Webergänzung zu Kapitel 10

Webergänzung zu Kapitel 10 Webergänzung zu Kapitel 10 10.1.4 Varianzanalyse (ANOVA: analysis of variance) Im Kapitel 10 haben wir uns hauptsächlich mit Forschungsbeispielen beschäftigt, die nur zwei Ergebnissätze hatten (entweder

Mehr

Austausch- bzw. Übergangsprozesse und Gleichgewichtsverteilungen

Austausch- bzw. Übergangsprozesse und Gleichgewichtsverteilungen Austausch- bzw. Übergangsrozesse und Gleichgewichtsverteilungen Wir betrachten ein System mit verschiedenen Zuständen, zwischen denen ein Austausch stattfinden kann. Etwa soziale Schichten in einer Gesellschaft:

Mehr

90-minütige Klausur Statistik für Studierende der Kommunikationswissenschaft

90-minütige Klausur Statistik für Studierende der Kommunikationswissenschaft Prof. Dr. Helmut Küchenhoff SS08 90-minütige Klausur Statistik für Studierende der Kommunikationswissenschaft am 22.7.2008 Anmerkungen Überprüfen Sie bitte sofort, ob Ihre Angabe vollständig ist. Sie sollte

Mehr

Profil A 49,3 48,2 50,7 50,9 49,8 48,7 49,6 50,1 Profil B 51,8 49,6 53,2 51,1 51,1 53,4 50,7 50 51,5 51,7 48,8

Profil A 49,3 48,2 50,7 50,9 49,8 48,7 49,6 50,1 Profil B 51,8 49,6 53,2 51,1 51,1 53,4 50,7 50 51,5 51,7 48,8 1. Aufgabe: Eine Reifenfirma hat für Winterreifen unterschiedliche Profile entwickelt. Bei jeweils gleicher Geschwindigkeit und auch sonst gleichen Bedingungen wurden die Bremswirkungen gemessen. Die gemessenen

Mehr

9.2. DER SATZ ÜBER IMPLIZITE FUNKTIONEN 83

9.2. DER SATZ ÜBER IMPLIZITE FUNKTIONEN 83 9.. DER SATZ ÜBER IMPLIZITE FUNKTIONEN 83 Die Grundfrage bei der Anwendung des Satzes über implizite Funktionen betrifft immer die folgende Situation: Wir haben eine Funktion f : V W und eine Stelle x

Mehr

Messung von Veränderungen. Dr. Julia Kneer Universität des Saarlandes

Messung von Veränderungen. Dr. Julia Kneer Universität des Saarlandes von Veränderungen Dr. Julia Kneer Universität des Saarlandes Veränderungsmessung Veränderungsmessung kennzeichnet ein Teilgebiet der Methodenlehre, das direkt mit grundlegenden Fragestellungen der Psychologie

Mehr

Theoretische Grundlagen der Informatik WS 09/10

Theoretische Grundlagen der Informatik WS 09/10 Theoretische Grundlagen der Informatik WS 09/10 - Tutorium 6 - Michael Kirsten und Kai Wallisch Sitzung 13 02.02.2010 Inhaltsverzeichnis 1 Formeln zur Berechnung Aufgabe 1 2 Hamming-Distanz Aufgabe 2 3

Mehr

Auswerten mit Excel. Viele Video-Tutorials auf Youtube z.b. http://www.youtube.com/watch?v=vuuky6xxjro

Auswerten mit Excel. Viele Video-Tutorials auf Youtube z.b. http://www.youtube.com/watch?v=vuuky6xxjro Auswerten mit Excel Viele Video-Tutorials auf Youtube z.b. http://www.youtube.com/watch?v=vuuky6xxjro 1. Pivot-Tabellen erstellen: In der Datenmaske in eine beliebige Zelle klicken Registerkarte Einfügen

Mehr

Dieses erste Kreisdiagramm, bezieht sich auf das gesamte Testergebnis der kompletten 182 getesteten Personen. Ergebnis

Dieses erste Kreisdiagramm, bezieht sich auf das gesamte Testergebnis der kompletten 182 getesteten Personen. Ergebnis Datenanalyse Auswertung Der Kern unseres Projektes liegt ganz klar bei der Fragestellung, ob es möglich ist, Biere von und geschmacklich auseinander halten zu können. Anhand der folgenden Grafiken, sollte

Mehr

Basis und Dimension. Als nächstes wollen wir die wichtigen Begriffe Erzeugendensystem und Basis eines Vektorraums definieren.

Basis und Dimension. Als nächstes wollen wir die wichtigen Begriffe Erzeugendensystem und Basis eines Vektorraums definieren. Basis und Dimension Als nächstes wollen wir die wichtigen Begriffe Erzeugendensystem und Basis eines Vektorraums definieren. Definition. Sei V ein K-Vektorraum und (v i ) i I eine Familie von Vektoren

Mehr

Im Folgenden wird Ihnen an einem Beispiel erklärt, wie Sie Excel-Anlagen und Excel-Vorlagen erstellen können.

Im Folgenden wird Ihnen an einem Beispiel erklärt, wie Sie Excel-Anlagen und Excel-Vorlagen erstellen können. Excel-Schnittstelle Im Folgenden wird Ihnen an einem Beispiel erklärt, wie Sie Excel-Anlagen und Excel-Vorlagen erstellen können. Voraussetzung: Microsoft Office Excel ab Version 2000 Zum verwendeten Beispiel:

Mehr

Tutorial: Homogenitätstest

Tutorial: Homogenitätstest Tutorial: Homogenitätstest Eine Bank möchte die Kreditwürdigkeit potenzieller Kreditnehmer abschätzen. Einerseits lebt die Bank ja von der Vergabe von Krediten, andererseits verursachen Problemkredite

Mehr

1. Man schreibe die folgenden Aussagen jeweils in einen normalen Satz um. Zum Beispiel kann man die Aussage:

1. Man schreibe die folgenden Aussagen jeweils in einen normalen Satz um. Zum Beispiel kann man die Aussage: Zählen und Zahlbereiche Übungsblatt 1 1. Man schreibe die folgenden Aussagen jeweils in einen normalen Satz um. Zum Beispiel kann man die Aussage: Für alle m, n N gilt m + n = n + m. in den Satz umschreiben:

Mehr

Anhand des bereits hergeleiteten Models erstellen wir nun mit der Formel

Anhand des bereits hergeleiteten Models erstellen wir nun mit der Formel Ausarbeitung zum Proseminar Finanzmathematische Modelle und Simulationen bei Raphael Kruse und Prof. Dr. Wolf-Jürgen Beyn zum Thema Simulation des Anlagenpreismodels von Simon Uphus im WS 09/10 Zusammenfassung

Mehr

Bauteilattribute als Sachdaten anzeigen

Bauteilattribute als Sachdaten anzeigen Mit den speedikon Attributfiltern können Sie die speedikon Attribute eines Bauteils als MicroStation Sachdaten an die Elemente anhängen Inhalte Was ist ein speedikon Attribut?... 3 Eigene Attribute vergeben...

Mehr

Data Mining: Einige Grundlagen aus der Stochastik

Data Mining: Einige Grundlagen aus der Stochastik Data Mining: Einige Grundlagen aus der Stochastik Hagen Knaf Studiengang Angewandte Mathematik Hochschule RheinMain 21. Oktober 2015 Vorwort Das vorliegende Skript enthält eine Zusammenfassung verschiedener

Mehr

1 Mathematische Grundlagen

1 Mathematische Grundlagen Mathematische Grundlagen - 1-1 Mathematische Grundlagen Der Begriff der Menge ist einer der grundlegenden Begriffe in der Mathematik. Mengen dienen dazu, Dinge oder Objekte zu einer Einheit zusammenzufassen.

Mehr

Beispiel 48. 4.3.2 Zusammengesetzte Zufallsvariablen

Beispiel 48. 4.3.2 Zusammengesetzte Zufallsvariablen 4.3.2 Zusammengesetzte Zufallsvariablen Beispiel 48 Ein Würfel werde zweimal geworfen. X bzw. Y bezeichne die Augenzahl im ersten bzw. zweiten Wurf. Sei Z := X + Y die Summe der gewürfelten Augenzahlen.

Mehr

4. Jeder Knoten hat höchstens zwei Kinder, ein linkes und ein rechtes.

4. Jeder Knoten hat höchstens zwei Kinder, ein linkes und ein rechtes. Binäre Bäume Definition: Ein binärer Baum T besteht aus einer Menge von Knoten, die durch eine Vater-Kind-Beziehung wie folgt strukturiert ist: 1. Es gibt genau einen hervorgehobenen Knoten r T, die Wurzel

Mehr

Multicheck Schülerumfrage 2013

Multicheck Schülerumfrage 2013 Multicheck Schülerumfrage 2013 Die gemeinsame Studie von Multicheck und Forschungsinstitut gfs-zürich Sonderauswertung ICT Berufsbildung Schweiz Auswertung der Fragen der ICT Berufsbildung Schweiz Wir

Mehr

Physik & Musik. Stimmgabeln. 1 Auftrag

Physik & Musik. Stimmgabeln. 1 Auftrag Physik & Musik 5 Stimmgabeln 1 Auftrag Physik & Musik Stimmgabeln Seite 1 Stimmgabeln Bearbeitungszeit: 30 Minuten Sozialform: Einzel- oder Partnerarbeit Voraussetzung: Posten 1: "Wie funktioniert ein

Mehr

Primzahlen und RSA-Verschlüsselung

Primzahlen und RSA-Verschlüsselung Primzahlen und RSA-Verschlüsselung Michael Fütterer und Jonathan Zachhuber 1 Einiges zu Primzahlen Ein paar Definitionen: Wir bezeichnen mit Z die Menge der positiven und negativen ganzen Zahlen, also

Mehr

Einführung. Vorlesungen zur Komplexitätstheorie: Reduktion und Vollständigkeit (3) Vorlesungen zur Komplexitätstheorie. K-Vollständigkeit (1/5)

Einführung. Vorlesungen zur Komplexitätstheorie: Reduktion und Vollständigkeit (3) Vorlesungen zur Komplexitätstheorie. K-Vollständigkeit (1/5) Einführung 3 Vorlesungen zur Komplexitätstheorie: Reduktion und Vollständigkeit (3) Univ.-Prof. Dr. Christoph Meinel Hasso-Plattner-Institut Universität Potsdam, Deutschland Hatten den Reduktionsbegriff

Mehr

Formelsammlung zur Kreisgleichung

Formelsammlung zur Kreisgleichung zur Kreisgleichung Julia Wolters 6. Oktober 2008 Inhaltsverzeichnis 1 Allgemeine Kreisgleichung 2 1.1 Berechnung des Mittelpunktes und Radius am Beispiel..... 3 2 Kreis und Gerade 4 2.1 Sekanten, Tangenten,

Mehr

7 Rechnen mit Polynomen

7 Rechnen mit Polynomen 7 Rechnen mit Polynomen Zu Polynomfunktionen Satz. Zwei Polynomfunktionen und f : R R, x a n x n + a n 1 x n 1 + a 1 x + a 0 g : R R, x b n x n + b n 1 x n 1 + b 1 x + b 0 sind genau dann gleich, wenn

Mehr

Lichtbrechung an Linsen

Lichtbrechung an Linsen Sammellinsen Lichtbrechung an Linsen Fällt ein paralleles Lichtbündel auf eine Sammellinse, so werden die Lichtstrahlen so gebrochen, dass sie durch einen Brennpunkt der Linse verlaufen. Der Abstand zwischen

Mehr

Grundlagen der Datenanalyse am Beispiel von SPSS

Grundlagen der Datenanalyse am Beispiel von SPSS Grundlagen der Datenanalyse am Beispiel von SPSS Einführung Dipl. - Psych. Fabian Hölzenbein hoelzenbein@psychologie.uni-freiburg.de Einführung Organisatorisches Was ist Empirie? Was ist Statistik? Dateneingabe

Mehr

Daten sammeln, darstellen, auswerten

Daten sammeln, darstellen, auswerten Vertiefen 1 Daten sammeln, darstellen, auswerten zu Aufgabe 1 Schulbuch, Seite 22 1 Haustiere zählen In der Tabelle rechts stehen die Haustiere der Kinder aus der Klasse 5b. a) Wie oft wurden die Haustiere

Mehr

Lineare Gleichungssysteme

Lineare Gleichungssysteme Brückenkurs Mathematik TU Dresden 2015 Lineare Gleichungssysteme Schwerpunkte: Modellbildung geometrische Interpretation Lösungsmethoden Prof. Dr. F. Schuricht TU Dresden, Fachbereich Mathematik auf der

Mehr

Melanie Kaspar, Prof. Dr. B. Grabowski 1

Melanie Kaspar, Prof. Dr. B. Grabowski 1 7. Hypothesentests Ausgangssituation: Man muss sich zwischen 2 Möglichkeiten (=Hypothesen) entscheiden. Diese Entscheidung soll mit Hilfe von Beobachtungen ( Stichprobe ) getroffen werden. Die Hypothesen

Mehr

Outlook. sysplus.ch outlook - mail-grundlagen Seite 1/8. Mail-Grundlagen. Posteingang

Outlook. sysplus.ch outlook - mail-grundlagen Seite 1/8. Mail-Grundlagen. Posteingang sysplus.ch outlook - mail-grundlagen Seite 1/8 Outlook Mail-Grundlagen Posteingang Es gibt verschiedene Möglichkeiten, um zum Posteingang zu gelangen. Man kann links im Outlook-Fenster auf die Schaltfläche

Mehr

! " # $ " % & Nicki Wruck worldwidewruck 08.02.2006

!  # $  % & Nicki Wruck worldwidewruck 08.02.2006 !"# $ " %& Nicki Wruck worldwidewruck 08.02.2006 Wer kennt die Problematik nicht? Die.pst Datei von Outlook wird unübersichtlich groß, das Starten und Beenden dauert immer länger. Hat man dann noch die.pst

Mehr

Einfache statistische Auswertungen mit dem Programm SPSS

Einfache statistische Auswertungen mit dem Programm SPSS Einfache statistische Auswertungen mit dem Programm SPSS Datensatz: fiktive_daten.sav Dipl. Päd. Anne Haßelkus Dr. Dorothea Dette-Hagenmeyer 11/2011 Überblick 1 Deskriptive Statistiken; Mittelwert berechnen...

Mehr

50. Mathematik-Olympiade 2. Stufe (Regionalrunde) Klasse 11 13. 501322 Lösung 10 Punkte

50. Mathematik-Olympiade 2. Stufe (Regionalrunde) Klasse 11 13. 501322 Lösung 10 Punkte 50. Mathematik-Olympiade. Stufe (Regionalrunde) Klasse 3 Lösungen c 00 Aufgabenausschuss des Mathematik-Olympiaden e.v. www.mathematik-olympiaden.de. Alle Rechte vorbehalten. 503 Lösung 0 Punkte Es seien

Mehr

Statistische Auswertung:

Statistische Auswertung: Statistische Auswertung: Die erhobenen Daten mittels der selbst erstellten Tests (Surfaufgaben) Statistics Punkte aus dem Punkte aus Surftheorietest Punkte aus dem dem und dem Surftheorietest max.14p.

Mehr

Fortgeschrittene Statistik Logistische Regression

Fortgeschrittene Statistik Logistische Regression Fortgeschrittene Statistik Logistische Regression O D D S, O D D S - R A T I O, L O G I T T R A N S F O R M A T I O N, I N T E R P R E T A T I O N V O N K O E F F I Z I E N T E N, L O G I S T I S C H E

Mehr

Einführung in die Vektor- und Matrizenrechnung. Matrizen

Einführung in die Vektor- und Matrizenrechnung. Matrizen Einführung in die Vektor- und Matrizenrechnung Matrizen Definition einer Matrix Unter einer (reellen) m x n Matrix A versteht man ein rechteckiges Schema aus reellen Zahlen, die wie folgt angeordnet sind:

Mehr

Funktionsbeschreibung. Lieferantenbewertung. von IT Consulting Kauka GmbH

Funktionsbeschreibung. Lieferantenbewertung. von IT Consulting Kauka GmbH Funktionsbeschreibung Lieferantenbewertung von IT Consulting Kauka GmbH Stand 16.02.2010 odul LBW Das Modul LBW... 3 1. Konfiguration... 4 1.1 ppm... 4 1.2 Zertifikate... 5 1.3 Reklamationsverhalten...

Mehr

Korrelation (II) Korrelation und Kausalität

Korrelation (II) Korrelation und Kausalität Korrelation (II) Korrelation und Kausalität Situation: Seien X, Y zwei metrisch skalierte Merkmale mit Ausprägungen (x 1, x 2,..., x n ) bzw. (y 1, y 2,..., y n ). D.h. für jede i = 1, 2,..., n bezeichnen

Mehr

Kapitel 3 Frames Seite 1

Kapitel 3 Frames Seite 1 Kapitel 3 Frames Seite 1 3 Frames 3.1 Allgemeines Mit Frames teilt man eine HTML-Seite in mehrere Bereiche ein. Eine Seite, die mit Frames aufgeteilt ist, besteht aus mehreren Einzelseiten, die sich den

Mehr

Hauptseminar am Fachgebiet für Quantitative Methoden der Wirtschaftswissenschaften

Hauptseminar am Fachgebiet für Quantitative Methoden der Wirtschaftswissenschaften Hauptseminar am Fachgebiet für Quantitative Methoden der Wirtschaftswissenschaften Fehlende Daten in der Multivariaten Statistik SS 2011 Allgemeines Das Seminar richtet sich in erster Linie an Studierende

Mehr

Professionelle Seminare im Bereich MS-Office

Professionelle Seminare im Bereich MS-Office Der Name BEREICH.VERSCHIEBEN() ist etwas unglücklich gewählt. Man kann mit der Funktion Bereiche zwar verschieben, man kann Bereiche aber auch verkleinern oder vergrößern. Besser wäre es, die Funktion

Mehr

geben. Die Wahrscheinlichkeit von 100% ist hier demnach nur der Gehen wir einmal davon aus, dass die von uns angenommenen

geben. Die Wahrscheinlichkeit von 100% ist hier demnach nur der Gehen wir einmal davon aus, dass die von uns angenommenen geben. Die Wahrscheinlichkeit von 100% ist hier demnach nur der Vollständigkeit halber aufgeführt. Gehen wir einmal davon aus, dass die von uns angenommenen 70% im Beispiel exakt berechnet sind. Was würde

Mehr

Inhaltsverzeichnis. Fragestellungen und Methoden 11. Vorwort 15. Kapitel 1 Einführung 17. Kapitel 2 Statistische Grundbegriffe 23

Inhaltsverzeichnis. Fragestellungen und Methoden 11. Vorwort 15. Kapitel 1 Einführung 17. Kapitel 2 Statistische Grundbegriffe 23 Fragestellungen und Methoden 11 Vorwort 15 Kapitel 1 Einführung 17 1.1 KonzeptiondesBuchs... 18 1.2 AufbaudesBuchs... 19 1.3 Programmversionen von PASW bzw. SPSS..... 20 1.4 WiekanndiesesBuchverwendetwerden?...

Mehr

Universität Bonn 28. Juli 2010 Fachbereich Rechts- und Wirtschaftswissenschaften Statistische Abteilung Prof. Dr. A. Kneip. KLAUSUR Statistik B

Universität Bonn 28. Juli 2010 Fachbereich Rechts- und Wirtschaftswissenschaften Statistische Abteilung Prof. Dr. A. Kneip. KLAUSUR Statistik B Universität Bonn 28. Juli 2010 Fachbereich Rechts- und Wirtschaftswissenschaften Statistische Abteilung Prof. Dr. A. Kneip Sommersemester 2010 KLAUSUR Statistik B Hinweise zur Bearbeitung: Bei allen Teilaufgaben

Mehr

Leseprobe. Wilhelm Kleppmann. Versuchsplanung. Produkte und Prozesse optimieren ISBN: 978-3-446-42033-5. Weitere Informationen oder Bestellungen unter

Leseprobe. Wilhelm Kleppmann. Versuchsplanung. Produkte und Prozesse optimieren ISBN: 978-3-446-42033-5. Weitere Informationen oder Bestellungen unter Leseprobe Wilhelm Kleppmann Versuchsplanung Produkte und Prozesse optimieren ISBN: -3-44-4033-5 Weitere Informationen oder Bestellungen unter http://www.hanser.de/-3-44-4033-5 sowie im Buchhandel. Carl

Mehr

Die Optimalität von Randomisationstests

Die Optimalität von Randomisationstests Die Optimalität von Randomisationstests Diplomarbeit Elena Regourd Mathematisches Institut der Heinrich-Heine-Universität Düsseldorf Düsseldorf im Dezember 2001 Betreuung: Prof. Dr. A. Janssen Inhaltsverzeichnis

Mehr

Name (in Druckbuchstaben): Matrikelnummer: Unterschrift:

Name (in Druckbuchstaben): Matrikelnummer: Unterschrift: 20-minütige Klausur zur Vorlesung Lineare Modelle im Sommersemester 20 PD Dr. Christian Heumann Ludwig-Maximilians-Universität München, Institut für Statistik 2. Oktober 20, 4:5 6:5 Uhr Überprüfen Sie

Mehr

5 Zusammenhangsmaße, Korrelation und Regression

5 Zusammenhangsmaße, Korrelation und Regression 5 Zusammenhangsmaße, Korrelation und Regression 5.1 Zusammenhangsmaße und Korrelation Aufgabe 5.1 In einem Hauptstudiumsseminar des Lehrstuhls für Wirtschafts- und Sozialstatistik machten die Teilnehmer

Mehr

9. Schätzen und Testen bei unbekannter Varianz

9. Schätzen und Testen bei unbekannter Varianz 9. Schätzen und Testen bei unbekannter Varianz Dr. Antje Kiesel Institut für Angewandte Mathematik WS 2011/2012 Schätzen und Testen bei unbekannter Varianz Wenn wir die Standardabweichung σ nicht kennen,

Mehr

Tevalo Handbuch v 1.1 vom 10.11.2011

Tevalo Handbuch v 1.1 vom 10.11.2011 Tevalo Handbuch v 1.1 vom 10.11.2011 Inhalt Registrierung... 3 Kennwort vergessen... 3 Startseite nach dem Login... 4 Umfrage erstellen... 4 Fragebogen Vorschau... 7 Umfrage fertigstellen... 7 Öffentliche

Mehr

Gibt es einen Geschmacksunterschied zwischen Coca Cola und Cola Zero?

Gibt es einen Geschmacksunterschied zwischen Coca Cola und Cola Zero? Gibt es einen Geschmacksunterschied zwischen Coca Cola und Cola Zero? Manche sagen: Ja, manche sagen: Nein Wie soll man das objektiv feststellen? Kann man Geschmack objektiv messen? - Geschmack ist subjektiv

Mehr

Einführung in SPSS. 1. Die Datei Seegräser

Einführung in SPSS. 1. Die Datei Seegräser Einführung in SPSS 1. Die Datei Seegräser An 25 verschiedenen Probestellen wurde jeweils die Anzahl der Seegräser pro m 2 gezählt und das Vorhandensein von Seeigeln vermerkt. 2. Programmaufbau Die wichtigsten

Mehr

Name:... Matrikel-Nr.:... 3 Aufgabe Handyklingeln in der Vorlesung (9 Punkte) Angenommen, ein Student führt ein Handy mit sich, das mit einer Wahrscheinlichkeit von p während einer Vorlesung zumindest

Mehr

Zahlenwinkel: Forscherkarte 1. alleine. Zahlenwinkel: Forschertipp 1

Zahlenwinkel: Forscherkarte 1. alleine. Zahlenwinkel: Forschertipp 1 Zahlenwinkel: Forscherkarte 1 alleine Tipp 1 Lege die Ziffern von 1 bis 9 so in den Zahlenwinkel, dass jeder Arm des Zahlenwinkels zusammengezählt das gleiche Ergebnis ergibt! Finde möglichst viele verschiedene

Mehr

TESTEN SIE IHR KÖNNEN UND GEWINNEN SIE!

TESTEN SIE IHR KÖNNEN UND GEWINNEN SIE! 9 TESTEN SIE IHR KÖNNEN UND GEWINNEN SIE! An den SeniorNETclub 50+ Währinger Str. 57/7 1090 Wien Und zwar gleich in doppelter Hinsicht:!"Beantworten Sie die folgenden Fragen und vertiefen Sie damit Ihr

Mehr

Würfelt man dabei je genau 10 - mal eine 1, 2, 3, 4, 5 und 6, so beträgt die Anzahl. der verschiedenen Reihenfolgen, in denen man dies tun kann, 60!.

Würfelt man dabei je genau 10 - mal eine 1, 2, 3, 4, 5 und 6, so beträgt die Anzahl. der verschiedenen Reihenfolgen, in denen man dies tun kann, 60!. 040304 Übung 9a Analysis, Abschnitt 4, Folie 8 Die Wahrscheinlichkeit, dass bei n - maliger Durchführung eines Zufallexperiments ein Ereignis A ( mit Wahrscheinlichkeit p p ( A ) ) für eine beliebige Anzahl

Mehr

Kommunikations-Management

Kommunikations-Management Tutorial: Wie importiere und exportiere ich Daten zwischen myfactory und Outlook? Im vorliegenden Tutorial lernen Sie, wie Sie in myfactory Daten aus Outlook importieren Daten aus myfactory nach Outlook

Mehr

4. BEZIEHUNGEN ZWISCHEN TABELLEN

4. BEZIEHUNGEN ZWISCHEN TABELLEN 4. BEZIEHUNGEN ZWISCHEN TABELLEN Zwischen Tabellen können in MS Access Beziehungen bestehen. Durch das Verwenden von Tabellen, die zueinander in Beziehung stehen, können Sie Folgendes erreichen: Die Größe

Mehr

Grundfunktionen und Bedienung

Grundfunktionen und Bedienung Kapitel 13 Mit der App Health ist eine neue Anwendung in ios 8 enthalten, die von vorangegangenen Betriebssystemen bislang nicht geboten wurde. Health fungiert dabei als Aggregator für die Daten von Fitness-

Mehr

Analog zu Aufgabe 16.1 werden die Daten durch folgenden Befehl eingelesen: > kredit<-read.table("c:\\compaufg\\kredit.

Analog zu Aufgabe 16.1 werden die Daten durch folgenden Befehl eingelesen: > kredit<-read.table(c:\\compaufg\\kredit. Lösung 16.3 Analog zu Aufgabe 16.1 werden die Daten durch folgenden Befehl eingelesen: > kredit

Mehr

Auftragsbearbeitung 3.1

Auftragsbearbeitung 3.1 Auftragsbearbeitung / Bearbeitung bestehender Aufträge Automatische / manuelle Soll/Ist-Aufteilung (Stempelungen) Auf Aufträge kann über das Programm 15.2.1 gestempelt werden (PC in der Werkstatt auf dem

Mehr

Kapitalerhöhung - Verbuchung

Kapitalerhöhung - Verbuchung Kapitalerhöhung - Verbuchung Beschreibung Eine Kapitalerhöhung ist eine Erhöhung des Aktienkapitals einer Aktiengesellschaft durch Emission von en Aktien. Es gibt unterschiedliche Formen von Kapitalerhöhung.

Mehr

2. Im Admin Bereich drücken Sie bitte auf den roten Button Webseite bearbeiten, sodass Sie in den Bearbeitungsbereich Ihrer Homepage gelangen.

2. Im Admin Bereich drücken Sie bitte auf den roten Button Webseite bearbeiten, sodass Sie in den Bearbeitungsbereich Ihrer Homepage gelangen. Bildergalerie einfügen Wenn Sie eine Vielzahl an Bildern zu einem Thema auf Ihre Homepage stellen möchten, steht Ihnen bei Schmetterling Quadra das Modul Bildergalerie zur Verfügung. Ihre Kunden können

Mehr

Das große ElterngeldPlus 1x1. Alles über das ElterngeldPlus. Wer kann ElterngeldPlus beantragen? ElterngeldPlus verstehen ein paar einleitende Fakten

Das große ElterngeldPlus 1x1. Alles über das ElterngeldPlus. Wer kann ElterngeldPlus beantragen? ElterngeldPlus verstehen ein paar einleitende Fakten Das große x -4 Alles über das Wer kann beantragen? Generell kann jeder beantragen! Eltern (Mütter UND Väter), die schon während ihrer Elternzeit wieder in Teilzeit arbeiten möchten. Eltern, die während

Mehr

(λ Ri I A+BR)v Ri = 0. Lässt sich umstellen zu

(λ Ri I A+BR)v Ri = 0. Lässt sich umstellen zu Herleitung der oppenecker-formel (Wiederholung) Für ein System ẋ Ax + Bu (B habe Höchstrang) wird eine Zustandsregelung u x angesetzt. Der geschlossene egelkreis gehorcht der Zustands-Dgl. ẋ (A B)x. Die

Mehr

WinWerk. Prozess 6a Rabatt gemäss Vorjahresverbrauch. KMU Ratgeber AG. Inhaltsverzeichnis. Im Ifang 16 8307 Effretikon

WinWerk. Prozess 6a Rabatt gemäss Vorjahresverbrauch. KMU Ratgeber AG. Inhaltsverzeichnis. Im Ifang 16 8307 Effretikon WinWerk Prozess 6a Rabatt gemäss Vorjahresverbrauch 8307 Effretikon Telefon: 052-740 11 11 Telefax: 052-740 11 71 E-Mail info@kmuratgeber.ch Internet: www.winwerk.ch Inhaltsverzeichnis 1 Ablauf der Rabattverarbeitung...

Mehr

1.3 Die Beurteilung von Testleistungen

1.3 Die Beurteilung von Testleistungen 1.3 Die Beurteilung von Testleistungen Um das Testergebnis einer Vp zu interpretieren und daraus diagnostische Urteile ableiten zu können, benötigen wir einen Vergleichsmaßstab. Im Falle des klassischen

Mehr

METHODENLEHRE I WS 2013/14 THOMAS SCHÄFER

METHODENLEHRE I WS 2013/14 THOMAS SCHÄFER METHODENLEHRE I WS 2013/14 THOMAS SCHÄFER DAS THEMA: INFERENZSTATISTIK IV INFERENZSTATISTISCHE AUSSAGEN FÜR ZUSAMMENHÄNGE UND UNTERSCHIEDE Inferenzstatistik für Zusammenhänge Inferenzstatistik für Unterschiede

Mehr

Handbuch ECDL 2003 Basic Modul 5: Datenbank Grundlagen von relationalen Datenbanken

Handbuch ECDL 2003 Basic Modul 5: Datenbank Grundlagen von relationalen Datenbanken Handbuch ECDL 2003 Basic Modul 5: Datenbank Grundlagen von relationalen Datenbanken Dateiname: ecdl5_01_00_documentation_standard.doc Speicherdatum: 14.02.2005 ECDL 2003 Basic Modul 5 Datenbank - Grundlagen

Mehr

Statistik II Wahrscheinlichkeitsrechnung und induktive Statistik Erste Klausur zum Sommersemester 2005 26. Juli 2005

Statistik II Wahrscheinlichkeitsrechnung und induktive Statistik Erste Klausur zum Sommersemester 2005 26. Juli 2005 Statistik II Wahrscheinlichkeitsrechnung und induktive Statistik Erste Klausur zum Sommersemester 2005 26. Juli 2005 Aufgabe 1: Grundzüge der Wahrscheinlichkeitsrechnung 19 P. Als Manager eines großen

Mehr

Quantitative Methoden der Bildungsforschung

Quantitative Methoden der Bildungsforschung Glieung Wieholung Korrelationen Grundlagen lineare Regression Lineare Regression in SPSS Übung Wieholung Korrelationen Standardisiertes Zusammenhangsmaß (unstandardisiert: Kovarianz) linearer Zusammenhang

Mehr

OECD Programme for International Student Assessment PISA 2000. Lösungen der Beispielaufgaben aus dem Mathematiktest. Deutschland

OECD Programme for International Student Assessment PISA 2000. Lösungen der Beispielaufgaben aus dem Mathematiktest. Deutschland OECD Programme for International Student Assessment Deutschland PISA 2000 Lösungen der Beispielaufgaben aus dem Mathematiktest Beispielaufgaben PISA-Hauptstudie 2000 Seite 3 UNIT ÄPFEL Beispielaufgaben

Mehr

Kapitel 15. Lösung linearer Gleichungssysteme

Kapitel 15. Lösung linearer Gleichungssysteme Kapitel 15. Lösung linearer Gleichungssysteme Lineare Gleichungssysteme Wir befassen uns nun mit der Lösung im allgemeinen nichthomogener linearer Gleichungssysteme in zweifacher Hinsicht. Wir studieren

Mehr

Bedienungsanleitung. Matthias Haasler. Version 0.4. für die Arbeit mit der Gemeinde-Homepage der Paulus-Kirchengemeinde Tempelhof

Bedienungsanleitung. Matthias Haasler. Version 0.4. für die Arbeit mit der Gemeinde-Homepage der Paulus-Kirchengemeinde Tempelhof Bedienungsanleitung für die Arbeit mit der Gemeinde-Homepage der Paulus-Kirchengemeinde Tempelhof Matthias Haasler Version 0.4 Webadministrator, email: webadmin@rundkirche.de Inhaltsverzeichnis 1 Einführung

Mehr

Überblick über die Verfahren für Ordinaldaten

Überblick über die Verfahren für Ordinaldaten Verfahren zur Analyse ordinalskalierten Daten 1 Überblick über die Verfahren für Ordinaldaten Unterschiede bei unabhängigen Stichproben Test U Test nach Mann & Whitney H Test nach Kruskal & Wallis parametrische

Mehr

Skript und Aufgabensammlung Terme und Gleichungen Mathefritz Verlag Jörg Christmann Nur zum Privaten Gebrauch! Alle Rechte vorbehalten!

Skript und Aufgabensammlung Terme und Gleichungen Mathefritz Verlag Jörg Christmann Nur zum Privaten Gebrauch! Alle Rechte vorbehalten! Mathefritz 5 Terme und Gleichungen Meine Mathe-Seite im Internet kostenlose Matheaufgaben, Skripte, Mathebücher Lernspiele, Lerntipps, Quiz und noch viel mehr http:// www.mathefritz.de Seite 1 Copyright

Mehr

Verteilungsmodelle. Verteilungsfunktion und Dichte von T

Verteilungsmodelle. Verteilungsfunktion und Dichte von T Verteilungsmodelle Verteilungsfunktion und Dichte von T Survivalfunktion von T Hazardrate von T Beziehungen zwischen F(t), S(t), f(t) und h(t) Vorüberlegung zu Lebensdauerverteilungen Die Exponentialverteilung

Mehr

Zusammenhänge zwischen metrischen Merkmalen

Zusammenhänge zwischen metrischen Merkmalen Zusammenhänge zwischen metrischen Merkmalen Darstellung des Zusammenhangs, Korrelation und Regression Daten liegen zu zwei metrischen Merkmalen vor: Datenpaare (x i, y i ), i = 1,..., n Beispiel: x: Anzahl

Mehr

Erstellen von x-y-diagrammen in OpenOffice.calc

Erstellen von x-y-diagrammen in OpenOffice.calc Erstellen von x-y-diagrammen in OpenOffice.calc In dieser kleinen Anleitung geht es nur darum, aus einer bestehenden Tabelle ein x-y-diagramm zu erzeugen. D.h. es müssen in der Tabelle mindestens zwei

Mehr

Konzepte der Informatik

Konzepte der Informatik Konzepte der Informatik Vorkurs Informatik zum WS 2011/2012 26.09. - 30.09.2011 17.10. - 21.10.2011 Dr. Werner Struckmann / Christoph Peltz Stark angelehnt an Kapitel 1 aus "Abenteuer Informatik" von Jens

Mehr

Einführung in. Logische Schaltungen

Einführung in. Logische Schaltungen Einführung in Logische Schaltungen 1/7 Inhaltsverzeichnis 1. Einführung 1. Was sind logische Schaltungen 2. Grundlegende Elemente 3. Weitere Elemente 4. Beispiel einer logischen Schaltung 2. Notation von

Mehr

Uli Greßler. Qualitätsmanagement. Überwachung der Produkt- und Prozessqualität. Arbeitsheft. 2. Auflage. Bestellnummer 04796

Uli Greßler. Qualitätsmanagement. Überwachung der Produkt- und Prozessqualität. Arbeitsheft. 2. Auflage. Bestellnummer 04796 Uli Greßler Qualitätsmanagement Überwachung der Produt- und Prozessqualität Arbeitsheft 2. Auflage Bestellnummer 04796 Haben Sie Anregungen oder Kritipunte zu diesem Produt? Dann senden Sie eine E-Mail

Mehr

Direkter Verkauf von Produkten. 2.2.2.3.1. Antwortprofil

Direkter Verkauf von Produkten. 2.2.2.3.1. Antwortprofil 2.2.2.3. Direkter Verkauf von Produkten 2.2.2.3.1. Antwortprofil Bei der Zielsetzung direkter Verkauf von Produkten kristallisieren sich insbesondere zwei Methoden heraus, die mit dieser Zielsetzung zum

Mehr