Multivariate Verfahren
|
|
- Lukas Gerhard Winter
- vor 7 Jahren
- Abrufe
Transkript
1 Multivariate Verfahren Prof. Dr. Jörg Rahnenführer Raum tu-.de Voraussetzungen: Vordiplom in Statistik, Mathematik, Datenanalyse, Informatik Zeiten und Räume Vorlesung (4V): Mo , M/E 21 Do , M/E 21 Übung (2Ü): Fr M/E 25 Fr M/E 27 M.Sc. Katrin Knies Raum Leistungsnachweis Mündliche Prüfung Statistik: Spezialgebiete Datenwissenschaft Zulassungsvoraussetzungen zur mündlichen Prüfung 50% der Übungspunkte 50% der Punkte aus Übungen und Klausur (Gewichtung 80% Klausur) Jörg Rahnenführer, Multivariate Verfahren, WS0809, TU Dortmund Multivariate Verfahren Wichtigste Grundlage der Vorlesung ist ein Skript von Prof. Dr. Roland Fried, TU Dortmund, Fakultät Statistik: Multivariate Statistik (Wintersemester 2006/07) Skript beruht teilweise auf früheren Skripten von Prof. Dr. Claudia Becker, Universität Halle-Wittenberg Prof. Dr. Isabel Molina, Universidad Carlos III de Madrid Andere Literatur Backhaus, K. et al., Multivariate Analysemethoden, 10. Auflage, Berlin Johnson, R.A. und D.W. Wichern, Applied Multivariate Statistical Analysis, 5. Auflage, New Jersey Fahrmeir, L., A. Hamerle und G. Tutz (Hrsg.), Multivariate statistische Verfahren, 2. Auflage, Berlin Jörg Rahnenführer, Multivariate Verfahren, WS0809, TU Dortmund
2 Themengebiete der Vorlesung 0 Multivariate Analysemethoden 1 Multivariate Zufallsvariablen 2 Die multivariate Normalverteilung 3 Normalverteilungsmodelle 4 Hauptkomponentenanalyse 5 Faktorenanalyse 6 Kanonische Korrelationsanalyse 7 Korrespondenzanalyse 8 Clusteranalyse 9 Diskriminanzanalyse 10 Graphische Modelle Jörg Rahnenführer, Multivariate Verfahren, WS0809, TU Dortmund Multivariate Analysemethoden Jörg Rahnenführer, Multivariate Verfahren, WS0809, TU Dortmund
3 Multivariate Analysemethoden Häufige Situation: mehrdimensionale (multivariate) Daten Beschreibung der Untersuchungsobjekte ( Individuen ) durch mehrere Variablen Multivariate Verfahren dienen zur Analyse solcher mehrdimensionaler Daten, insbesondere der Zusammenhänge unter den Variablen Beispiele Messwerte bei Menschen Alter, Geschlecht, Körpergröße, Gewicht, Puls, Blutdruck Risikofaktoren bei Krebspatienten Ausdehnung des Tumors, Vorhandensein von Metastasen, Rauchen Jörg Rahnenführer, Multivariate Verfahren, WS0809, TU Dortmund Multivariate Analysemethoden Auswahl geeigneter multivariater Analysemethoden Verschiedene Arten der Zusammenhangsanalyse adressieren verschiedene Fragestellungen Korrelationsanalyse Hypothesentests für eine oder mehrere Populationen Multivariate Varianzanalyse, multiple multivariate Regression Hauptkomponentenanalyse Faktorenanalyse Korrespondenzanalyse Clusteranalyse Diskriminanzanalyse Graphische Modelle Jörg Rahnenführer, Multivariate Verfahren, WS0809, TU Dortmund
4 Multivariate Analysemethoden Korrelationsanalyse Ziel: Bestimmung von paarweisen, multiplen und partiellen Korrelationen Beispiel: Gewicht, Körpergröße und Alter von Personen Paarweise Scatterplots für Gewicht, Körpergröße und Alter von n = 21 Individuen Scatterplot kann als sehr einfaches multivariates Verfahren betrachtet werden Gewicht Körpergröße Jörg Rahnenführer, Multivariate Verfahren, WS0809, TU Dortmund Multivariate Analysemethoden Korrelationsanalyse Ziel: Bestimmung von paarweisen, multiplen und partiellen Korrelationen Beispiel: Gewicht, Körpergröße und Alter von Personen Paarweise Scatterplots Körpergröße Gewicht Alter Alter Jörg Rahnenführer, Multivariate Verfahren, WS0809, TU Dortmund
5 Multivariate Analysemethoden Hypothesentests für eine oder mehrere Populationen Ziel: Unterscheidung von Populationen anhand von mehrdimensionalen Merkmalen Beispiel: Gefälschte Banknoten Daten: n e = 100 echte und n f = 100 falsche Schweizer Banknoten Jörg Rahnenführer, Multivariate Verfahren, WS0809, TU Dortmund Multivariate Analysemethoden Multivariate Varianzanalyse Frage: Wirken mehrere Variablen einzeln und/oder gemeinsam auf eine oder mehrere interessierende Merkmale? Beispiel Werkstatt Fertigung von Autorädern in verschiedenen Werkstätten mit jeweils mehreren Maschinen Zwei Qualitätsmerkmale zur Beurteilung der gefertigten Räder Gibt es Qualitätsunterschiede zwischen den Maschinen innerhalb einer Werkstatt, oder zwischen den Werkstätten? Multiple Multivariate Regression Funktionaler Zusammenhang zwischen mehreren Einfluss- und einer oder mehreren Zielgrößen Beispiel Prostatakrebs Untersuchung des Einflusses verschiedener Prädiktoren auf eine Zielvariable Jörg Rahnenführer, Multivariate Verfahren, WS0809, TU Dortmund
6 Multivariate Analysemethoden Daten zum Prostatakrebs von Stamey et al. (1989) Prädiktoren: lcavol log cancer volume lweight log prostate weight age lbph log benign hyperplasia amount svi seminal vesicle invasion lcp log capsular penetration gleason gleason score pgg45 percent gleason scores 4 or 5 Zielvariable: log(psa) (prostate specific antigen) level Daten standardisiert auf Varianz 1 Jörg Rahnenführer, Multivariate Verfahren, WS0809, TU Dortmund Lineare Regression: Prostatakrebs Kovarianz-Matrix: lcavol lweight age lbph svi lcp gleason lweight age lbph svi lcp gleason pgg Jörg Rahnenführer, Multivariate Verfahren, WS0809, TU Dortmund
7 Lineare Regression: Prostatakrebs Modell für log PSA Prädiktoren auf Varianz 1 normalisiert Term Intercept Coefficient 2.48 Std. Error 0.09 Z Score Test auf Ausschließung einer Gruppe von Termen durch F-test (ANOVA) lcavol lweight Z-score misst somit den Effekt für das Entfernen einer Variable aus dem Modell lcp ist nicht signifikant wennlcalvol im Modell enthalten ist, ansonsten schon! age lbph svi lcp gleason pgg Jörg Rahnenführer, Multivariate Verfahren, WS0809, TU Dortmund Multivariate Analysemethoden Hauptkomponentenanalyse Bestimmung weniger Richtungen, die möglichst viel Varianz erklären Iterative Bestimmung orthogonaler Vektoren Erste Hauptkomponente entspricht der linearen Transformation der Daten auf die Richtung mit maximaler Varianz Jörg Rahnenführer, Multivariate Verfahren, WS0809, TU Dortmund
8 Multivariate Analysemethoden Faktorenanalyse Ähneln sich mehrere Merkmale so stark, dass wir sie als ein einziges latentes Merkmal betrachten können? Beispiel Wichtige Charakteristika für Einstellungschancen von Bewerbern? Bei diesen Charakteristika kann es sich um abstrakte Faktoren handeln, wie etwa Kontaktfähigkeit oder emotionale Kompetenz. Korrespondenzanalyse Beziehungen zwischen kategoriellen Variablen an mehreren Individuen Beispiel Betrachtung der Haarfarbe und Augenfarbe von Menschen Jörg Rahnenführer, Multivariate Verfahren, WS0809, TU Dortmund Multivariate Analysemethoden Clusteranalyse Auffinden von Gruppen ähnlicher Objekte Beispiel Marketinganalyse zur Einteilung von Produkten in homogen Untergruppen Ein Handyhersteller stellt auf Basis einer Verbraucherbefragung fest, dass alle drei von ihm hergestellte Handytypen in die gleiche Untergruppe eingeordnet werden, sich aus Verbrauchersicht also kaum unterscheiden Einen oder zwei dieser Typen durch einen neuen, mit anderen Leistungsmerkmalen ausgestatteten Typen ersetzen, um so einen neuen Kundenkreis anzusprechen? Wichtigste Zutaten der Clusteranalyse Distanzmaß oder Ähnlichkeitsmaß zwischen Objekten Clusteralgorithmus zum Auffinden kompakter Gruppen Jörg Rahnenführer, Multivariate Verfahren, WS0809, TU Dortmund
9 Multivariate Analysemethoden Diskriminanzanalyse Einordnung von Objekten in gegebene Klassen Beispiel Kreditwürdigkeit Beurteilung der Kreditwürdigkeit von Firmen an Hand von Bilanzkennzahlen, unter Zurückgreifen auf Erfahrungswerte Betrachtung einer Lernstichprobe von Firmen mit bekannten Bilanzkennzahlen und Kreditwürdigkeit Entscheidung über die Kreditwürdigkeit eines neuen Antragstellers mit dieser Vorinformation Beispiel Krebsdiagnose Prognose von Therapieerfolg anhand von klinischen und genetischen Messungen Jörg Rahnenführer, Multivariate Verfahren, WS0809, TU Dortmund Multivariate Analysemethoden Graphische Modelle Unterscheidung mittelbarer und unmittelbarer Zusammenhänge unter mehreren Variablen Beispiel Examensnoten in Mechanik Me, Vektorrechnung Ve, Algebra Al, Analysis An, Statistik St (gemessen in Prozentzahlen) von 88 Studenten Jörg Rahnenführer, Multivariate Verfahren, WS0809, TU Dortmund
10 1. Multivariate Zufallsvariablen Jörg Rahnenführer, Multivariate Verfahren, WS0809, TU Dortmund Multivariate Zufallsvariablen 1.1 Multivariate Verteilungen Zufallsvektor: gemeinsame Darstellung d eindimensionaler Zufallsvariablen. Wie im univariaten Fall unterscheidet man zwischen diskret und stetig. Mischformen: Zufallsvektor mit diskreten und stetigen Merkmalen (Komponenten). Jörg Rahnenführer, Multivariate Verfahren, WS0809, TU Dortmund
11 Multivariate Zufallsvariablen Beispiele für multivariate Verteilungen Biometrie Klinische Messungen bei Krebspatienten (Örtliche Ausdehnung des Primärtumors, Existenz von regionären Lymphknotenmetastasen, Existenz von Fernmetastasen, Blutwerte, Raucherstatus, genetische Mutationen) Genexpressionswerte (Messungen der Aktivität von Tausenden Genen gleichzeitig) Ökonometrie Aktienkurse verschiedener Unternehmen Daten zu Konsum, Investition, Import, Export (BIP) Technometrie Zur Risikoanalyse technischer Systeme Einstellungen verschiedener technischer Parameter, technologische Bauteilqualität Jörg Rahnenführer, Multivariate Verfahren, WS0809, TU Dortmund Multivariate Zufallsvariablen Jörg Rahnenführer, Multivariate Verfahren, WS0809, TU Dortmund
12 Multivariate Verteilungsfunktion Die folgende Definition d-variater Verteilungs- und Dichtefunktionen verallgemeinert die entsprechenden Begriffe f ur eindimensionale Zufallsvariablen: Jörg Rahnenführer, Multivariate Verfahren, WS0809, TU Dortmund Multivariate Dichte Jörg Rahnenführer, Multivariate Verfahren, WS0809, TU Dortmund
13 Multivariate Dichte Jörg Rahnenführer, Multivariate Verfahren, WS0809, TU Dortmund Multivariate Verteilungsfunktion Jörg Rahnenführer, Multivariate Verfahren, WS0809, TU Dortmund
14 Multivariate Verteilungsfunktion Jörg Rahnenführer, Multivariate Verfahren, WS0809, TU Dortmund Erwartungswert Jörg Rahnenführer, Multivariate Verfahren, WS0809, TU Dortmund
15 Erwartungswert Jörg Rahnenführer, Multivariate Verfahren, WS0809, TU Dortmund Kovarianz Jörg Rahnenführer, Multivariate Verfahren, WS0809, TU Dortmund
16 Kovarianz Jörg Rahnenführer, Multivariate Verfahren, WS0809, TU Dortmund
17 Kovarianz Eine Kovarianzmatrix ist symmetrisch, damit diagonalisierbar (mittels Hauptachsentransformation) und folglich positiv semidefinit. Die Berechnungen erfolgen mittels einfacher Matrizenrechnung, meist unter Ausnutzung der Linearität des Erwartungswertes Jörg Rahnenführer, Multivariate Verfahren, WS0809, TU Dortmund Bedingte Erwartungen Die bedingte Erwartung ist eines der tiefsten und wichtigsten Konzepte der Wahrscheinlichkeitstheorie, aber auch offensichtlich eines der am schwersten zu vermittelnden Konzepte Allgemeine Definition: Die Funktion Y=E(X ) heißt dann bedingte Erwartung von X Wir betrachten nur Spezialfälle Die σ-algebra wird ersetzt durch eine Zufallsvariable Die Zufallsvariable ist entweder stetig oder diskret verteilt Jörg Rahnenführer, Multivariate Verfahren, WS0809, TU Dortmund
18 Bedingte Erwartungen E(XX 2 )-E(X)E(X 2 ) Jörg Rahnenführer, Multivariate Verfahren, WS0809, TU Dortmund Bedingte Erwartungen Jörg Rahnenführer, Multivariate Verfahren, WS0809, TU Dortmund
19 Bedingte Erwartungen Jörg Rahnenführer, Multivariate Verfahren, WS0809, TU Dortmund Bedingte Erwartungen Jörg Rahnenführer, Multivariate Verfahren, WS0809, TU Dortmund
20 Bedingte Erwartungen Jörg Rahnenführer, Multivariate Verfahren, WS0809, TU Dortmund Bedingte Erwartungen Interpretation des bedingten Erwartungswertes Bedingte Erwartung als orthogonale Projektion h(x 1 ) ist eine bzgl. X 1 messbare Funktion, die X 2 besonders gut approximiert Jörg Rahnenführer, Multivariate Verfahren, WS0809, TU Dortmund
21 Multivariate Zufallsvariablen Jörg Rahnenführer, Multivariate Verfahren, WS0809, TU Dortmund Multivariate Zufallsvariablen Empirische Größen entsprechen den theoretischen Größen, wobei die multivariaten Verteilungen durch die empirischen Verteilungen ersetzt sind Jörg Rahnenführer, Multivariate Verfahren, WS0809, TU Dortmund
22 Multivariate Zufallsvariablen Jörg Rahnenführer, Multivariate Verfahren, WS0809, TU Dortmund Multivariate Zufallsvariablen Jörg Rahnenführer, Multivariate Verfahren, WS0809, TU Dortmund
23 Multivariate Zufallsvariablen Für lineare Transformationen können Mittelwerte und Kovarianzen leicht berechnet werden Jörg Rahnenführer, Multivariate Verfahren, WS0809, TU Dortmund Multivariate Zufallsvariablen Empirische Mittelwerte und Kovarianzen im (Größe/Gewicht)-Datensatz Jörg Rahnenführer, Multivariate Verfahren, WS0809, TU Dortmund
24 Multivariate Zufallsvariablen Wichtigste Transformation eines Datensatzes zur Normalisierung bzgl. Mittelwert und Kovarianz Jörg Rahnenführer, Multivariate Verfahren, WS0809, TU Dortmund Multivariate Zufallsvariablen Jordan sche Zerlegung Charakterisierung von symmetrischen Matrizen Hilfsmittel zur Berechnung von Hauptkomponenten Jörg Rahnenführer, Multivariate Verfahren, WS0809, TU Dortmund
25 Multivariate Zufallsvariablen Beispiel 1.26 Beispiel 1.27 (Fortsetzung von Beispiel 1.2) Jörg Rahnenführer, Multivariate Verfahren, WS0809, TU Dortmund Multivariate Zufallsvariablen Jörg Rahnenführer, Multivariate Verfahren, WS0809, TU Dortmund
26 Multivariate Zufallsvariablen Jörg Rahnenführer, Multivariate Verfahren, WS0809, TU Dortmund Multivariate Zufallsvariablen Verallgemeinerung der inversen Matrix auf singuläre und nichtquadratische Matrizen Häufigste Anwendung: Lösung linearer Gleichungssysteme Kann mit Hilfe von Singulärwertzerlegung berechnet werden Jörg Rahnenführer, Multivariate Verfahren, WS0809, TU Dortmund
27 Multivariate Zufallsvariablen Zusammenhang von theoretischen und empirischen Größen Jörg Rahnenführer, Multivariate Verfahren, WS0809, TU Dortmund Multivariate Zufallsvariablen Wichtigster Satz der Statistik: ZENTRALER GRENZWERTSATZ Jörg Rahnenführer, Multivariate Verfahren, WS0809, TU Dortmund
28 Multivariate Zufallsvariablen Jörg Rahnenführer, Multivariate Verfahren, WS0809, TU Dortmund Multivariate Zufallsvariablen Zentraler Grenzwertsatz für Transformationen des empirischen Mittelwerts Jörg Rahnenführer, Multivariate Verfahren, WS0809, TU Dortmund
29 Multivariate Zufallsvariablen Jörg Rahnenführer, Multivariate Verfahren, WS0809, TU Dortmund
30 2. Die multivariate Normalverteilung Jörg Rahnenführer, Multivariate Verfahren, WS0809, TU Dortmund Theorie der Multinormalverteilung Multivariate Normalverteilung ist die wichtigste multivariate Verteilung Normalverteilung eignet sich zur Modellierung von Größen, die durch das Zusammenwirken vieler Zufallseinflüsse entstehen Messfehler, Abweichungen vom Sollwert, physikalische Größen wie Länge, Gewicht, Volumen etc. Die multivariate Normalverteilung ist die einzige multivariate Verteilung, deren Komponenten stochastisch unabhängig sind und deren Dichte zugleich rotationssymmetrisch ist Eine multivariate Verteilung ist genau dann eine multivariate Normalverteilung, wenn alle Linearkombinationen der Komponenten univariate Normalverteilungen sind Jörg Rahnenführer, Multivariate Verfahren, WS0809, TU Dortmund
31 Theorie der Multinormalverteilung Univariate Normalverteilung Jörg Rahnenführer, Multivariate Verfahren, WS0809, TU Dortmund Theorie der Multinormalverteilung Multivariate Normalverteilung Eindeutig bestimmt durch Erwartungswertvektor und Kovarianzmatrix Jörg Rahnenführer, Multivariate Verfahren, WS0809, TU Dortmund
32 Theorie der Multinormalverteilung Standardnormalverteilung Jörg Rahnenführer, Multivariate Verfahren, WS0809, TU Dortmund Theorie der Multinormalverteilung Jörg Rahnenführer, Multivariate Verfahren, WS0809, TU Dortmund
33 Theorie der Multinormalverteilung Die Kovarianzmatrix ist symmetrisch und beinhaltet alle Kovarianzen von Paaren von den Komponenten der multivariaten Verteilung Jörg Rahnenführer, Multivariate Verfahren, WS0809, TU Dortmund Theorie der Multinormalverteilung Jörg Rahnenführer, Multivariate Verfahren, WS0809, TU Dortmund
34 Theorie der Multinormalverteilung Höhenlinien bei der (Standard-)Normalverteilung Jörg Rahnenführer, Multivariate Verfahren, WS0809, TU Dortmund Theorie der Multinormalverteilung Höhenlinien Jörg Rahnenführer, Multivariate Verfahren, WS0809, TU Dortmund
35 Theorie der Multinormalverteilung Jörg Rahnenführer, Multivariate Verfahren, WS0809, TU Dortmund Theorie der Multinormalverteilung Lineare Transformationen Jörg Rahnenführer, Multivariate Verfahren, WS0809, TU Dortmund
36 Theorie der Multinormalverteilung Beweis durch Berechnung der Kovarianzmatrix mit gemischtem Term Σ 12 = AΣB T Jörg Rahnenführer, Multivariate Verfahren, WS0809, TU Dortmund Theorie der Multinormalverteilung Approximation und bedingte Verteilung Jörg Rahnenführer, Multivariate Verfahren, WS0809, TU Dortmund
37 Theorie der Multinormalverteilung Für eine multivariate Normalverteilung ist die bedingte Erwartung linear in x 1 und die bedingte Varianz unabhängig von x 1. Die beste Approximation von X 2 durch X 1 fällt mit der besten linearen Approximation BX 1 +b von X 2 durch X 1 zusammen. Jörg Rahnenführer, Multivariate Verfahren, WS0809, TU Dortmund Theorie der Multinormalverteilung Jörg Rahnenführer, Multivariate Verfahren, WS0809, TU Dortmund
38 Theorie der Multinormalverteilung Spezialfall d=k+1 Multiple Korrelation: maximale Korrelation zwischen X d und einer Linearkombination BX 1, für k = 1 gewöhnliche Korrelation Jörg Rahnenführer, Multivariate Verfahren, WS0809, TU Dortmund
39 Theorie der Multinormalverteilung Multiple Korrelation zwischen X 1 und (X 2,X 3 ) ist (notwendigerweise) größer als die (univariaten) Korrelationen zwischen X 1 und X 2 und zwischen X 1 und X 3 Jörg Rahnenführer, Multivariate Verfahren, WS0809, TU Dortmund Theorie der Multinormalverteilung Jörg Rahnenführer, Multivariate Verfahren, WS0809, TU Dortmund
40 Theorie der Multinormalverteilung Jörg Rahnenführer, Multivariate Verfahren, WS0809, TU Dortmund Stichprobenverteilungen Bei multivariaten Datenanalysen geht man oft von einer multivariaten Normalverteilung aus, kennt aber Erwartungswert und Kovarianzmatrix nicht. Übergang von theoretischen zu empirischen Größen Jörg Rahnenführer, Multivariate Verfahren, WS0809, TU Dortmund
41 Stichprobenverteilungen Jörg Rahnenführer, Multivariate Verfahren, WS0809, TU Dortmund Stichprobenverteilungen Test, ob die Korrelation in einem bestimmten Intervall liegt (Konfidenzintervalle) Jörg Rahnenführer, Multivariate Verfahren, WS0809, TU Dortmund
42 Stichprobenverteilungen Übung: Nachrechnen mit r 12 = 0.73, n = 100 Jörg Rahnenführer, Multivariate Verfahren, WS0809, TU Dortmund Stichprobenverteilungen Bei der Kovarianzmatrix stoßen wir auf die Wishart-Verteilung (multivariate Erweiterung der χ 2 -Verteilung) Jörg Rahnenführer, Multivariate Verfahren, WS0809, TU Dortmund
43 Stichprobenverteilungen Jörg Rahnenführer, Multivariate Verfahren, WS0809, TU Dortmund Stichprobenverteilungen (Im Wesentlichen Projektionsmatrizen) Ü: Warum folgt dies? Jörg Rahnenführer, Multivariate Verfahren, WS0809, TU Dortmund
44 Stichprobenverteilungen Hotteling s T 2 -Verteilung (multivariate Erweiterung der t-verteilung) Jörg Rahnenführer, Multivariate Verfahren, WS0809, TU Dortmund Stichprobenverteilungen Zusammenhang zwischen Hotteling s T 2 -Verteilung und F-Verteilung Jörg Rahnenführer, Multivariate Verfahren, WS0809, TU Dortmund
45 Schätztheorie Allgemeines Schätzen (mit parametrischen Familien) Jörg Rahnenführer, Multivariate Verfahren, WS0809, TU Dortmund Schätztheorie Scorefunktion und Fisher-Informationsmatrix für Normalverteilungen Jörg Rahnenführer, Multivariate Verfahren, WS0809, TU Dortmund
46 Schätztheorie Der ML-Schätzer ist also unter Regularitätsbedingungen asymptotisch unverzerrt, effizient und normalverteilt. Jörg Rahnenführer, Multivariate Verfahren, WS0809, TU Dortmund Schätztheorie Jörg Rahnenführer, Multivariate Verfahren, WS0809, TU Dortmund
47 3. Normalverteilungsmodelle Jörg Rahnenführer, Multivariate Verfahren, WS0809, TU Dortmund Parametertests Jörg Rahnenführer, Multivariate Verfahren, WS0809, TU Dortmund
48 Parametertests Asymptotische Verteilung für Likelihood-Quotienten (LR) Test Jörg Rahnenführer, Multivariate Verfahren, WS0809, TU Dortmund Parametertests Jörg Rahnenführer, Multivariate Verfahren, WS0809, TU Dortmund
49 Parametertests Jörg Rahnenführer, Multivariate Verfahren, WS0809, TU Dortmund Parametertests Jörg Rahnenführer, Multivariate Verfahren, WS0809, TU Dortmund
50 Parametertests Hier wird das Maximum über alle Vektoren a gebildet, so dass das Konfidenzintervall für beliebiges festes a gilt Jörg Rahnenführer, Multivariate Verfahren, WS0809, TU Dortmund Parametertests Jörg Rahnenführer, Multivariate Verfahren, WS0809, TU Dortmund
51 Parametertests Jörg Rahnenführer, Multivariate Verfahren, WS0809, TU Dortmund Parametertests d = = 3 p = 1- pchisq(2.7365,3) Jörg Rahnenführer, Multivariate Verfahren, WS0809, TU Dortmund
52 Parametertests Spezialfall für Likelihood-Quotienten Test Test auf einen bestimmten Koeffizientenvektor im linearen Modell Exakte Verteilung der LR Jörg Rahnenführer, Multivariate Verfahren, WS0809, TU Dortmund Lineare Restriktionen Testen von linearen Hypothesen (lineare Restriktionen) Jörg Rahnenführer, Multivariate Verfahren, WS0809, TU Dortmund
53 Lineare Restriktionen Es soll getestet werden, ob jeweils die i-te Komponente des Vektors (X 1,...,X k ) und des Vektors (X k+1,...,x d ) denselben Erwartungswert haben Linke Formulierung der Nullhypothese entspricht der anschaulichen Formulierung, rechte der Formulierung mit Kontrastmatrix C=(diag(1,...,1),diag(-1,...,-1)) mit jeweils k Einträgen 1 bzw. -1 Jörg Rahnenführer, Multivariate Verfahren, WS0809, TU Dortmund Lineare Restriktionen Banknoten-Beispiel: Sind die Abstände von inneren Rechteck zum unteren Rand (x 4 ) bzw. oberen Rand (x 5 ) gleich? signifikant wegen F 1,99 (13.638) = Jörg Rahnenführer, Multivariate Verfahren, WS0809, TU Dortmund
54 Lineare Restriktionen Es soll getestet werden, ob alle Komponenten des Vektos (X k+1,...,x d ) den Erwartungswert 0 haben Jörg Rahnenführer, Multivariate Verfahren, WS0809, TU Dortmund Lineare Restriktionen Repeated Measures (wiederholte Messungen) n Beobachtungen mit d Messungen (Bedingungen, Behandlungen, Prüfungen, ) In Matrixschreibweise: Kovarianzmatrix unbekannt, siehe Satz 3.10 Jörg Rahnenführer, Multivariate Verfahren, WS0809, TU Dortmund
55 Lineare Restriktionen Repeated Measures (wiederholte Messungen) n Beobachtungen mit d Messungen (Bedingungen, Behandlungen, Prüfungen, ) Satz 3.5 lieferte Jörg Rahnenführer, Multivariate Verfahren, WS0809, TU Dortmund Lineare Restriktionen Jörg Rahnenführer, Multivariate Verfahren, WS0809, TU Dortmund
56 Lineare Restriktionen Jörg Rahnenführer, Multivariate Verfahren, WS0809, TU Dortmund Lineare Restriktionen Umschreiben der Teststatistik zeigt wiederum, dass man einen exakten F-Test verwenden kann: Jörg Rahnenführer, Multivariate Verfahren, WS0809, TU Dortmund
57 Lineare Restriktionen Pivot-Statistik: Verteilung der Statistik hängt nicht vom unbekannten Parameter ab Jörg Rahnenführer, Multivariate Verfahren, WS0809, TU Dortmund Lineare Restriktionen Jörg Rahnenführer, Multivariate Verfahren, WS0809, TU Dortmund
58 Lineare Restriktionen Wert der Teststatistik ist hoch-signifikant Die meisten Konfidenzintervalle für die sechs Einzelhypothesen umschließen auch nicht die 0 Jörg Rahnenführer, Multivariate Verfahren, WS0809, TU Dortmund Lineare Restriktionen Jörg Rahnenführer, Multivariate Verfahren, WS0809, TU Dortmund
59 Lineare Restriktionen Jörg Rahnenführer, Multivariate Verfahren, WS0809, TU Dortmund Lineare Restriktionen Jörg Rahnenführer, Multivariate Verfahren, WS0809, TU Dortmund
60 Lineare Restriktionen Zum Vergleich: Bei der Annahme gleicher Kovarianzmatrizen hatten wir folgende Konfidenzintervalle erhalten: Jörg Rahnenführer, Multivariate Verfahren, WS0809, TU Dortmund Lineare Restriktionen Jörg Rahnenführer, Multivariate Verfahren, WS0809, TU Dortmund
61 Lineare Restriktionen Übung: Nachrechnen der Signifikanzwerte Jörg Rahnenführer, Multivariate Verfahren, WS0809, TU Dortmund Lineare Restriktionen Jörg Rahnenführer, Multivariate Verfahren, WS0809, TU Dortmund
62 Lineare Restriktionen Jörg Rahnenführer, Multivariate Verfahren, WS0809, TU Dortmund Lineare Restriktionen Sind Profile parallel? Keine Ablehnung Sind Profile gleich? Ablehnung Sind Profile horizontal? Ablehnung Jörg Rahnenführer, Multivariate Verfahren, WS0809, TU Dortmund
63 4. Hauptkomponentenanalyse Jörg Rahnenführer, Multivariate Verfahren, WS0809, TU Dortmund Hauptkomponentenanalyse Problemstellung Beobachtungen X 1,, X n von d quantitativen Merkmalen, n Objekte. Problem für großes d: schwere Überschaubarkeit / Strukturerkennung Lösungsansatz (Pearson, 1901, Hotelling, 1933): Konstruktion unkorrelierter Linearkombinationen (Hauptkomponenten, HK) der beobachteten Variablen, die sukzessive einen sinkenden Prozentsatz der Datenvariabilität erklären Durch Auswahl von p < d Hauptkomponenten Repräsentation der Daten in einem niedriger dimensionalen Raum mit möglichst kleinem Informationsverlust Jörg Rahnenführer, Multivariate Verfahren, WS0809, TU Dortmund
64 Hauptkomponentenanalyse 1. Hauptkomponente: Richtung der größten Varianz 2. Hauptkomponente: Richtung der größten Varianz, orthogonal zur 1. Hauptkomponente Jörg Rahnenführer, Multivariate Verfahren, WS0809, TU Dortmund Hauptkomponentenanalyse Beispiel mit d=2 und 2 Hauptkomponenten Zur Veranschaulichung, üblicherweise zur Dimensionsreduktion verwendetes Verfahren Jörg Rahnenführer, Multivariate Verfahren, WS0809, TU Dortmund
65 Hauptkomponentenanalyse Jörg Rahnenführer, Multivariate Verfahren, WS0809, TU Dortmund Hauptkomponentenanalyse Jörg Rahnenführer, Multivariate Verfahren, WS0809, TU Dortmund
66 Hauptkomponentenanalyse Die Verkaufszahlen für beide Produkte sind positiv korreliert Geschäfte, die von einem Produkt viel verkaufen, verkaufen in der Regel auch viel von dem zweiten Produkt Somit ist die wesentliche Information in der summe der verkauften Produkte enthalten Jörg Rahnenführer, Multivariate Verfahren, WS0809, TU Dortmund Hauptkomponentenanalyse Jörg Rahnenführer, Multivariate Verfahren, WS0809, TU Dortmund
67 Hauptkomponentenanalyse Jörg Rahnenführer, Multivariate Verfahren, WS0809, TU Dortmund Hauptkomponentenanalyse Jörg Rahnenführer, Multivariate Verfahren, WS0809, TU Dortmund
68 Hauptkomponentenanalyse Jörg Rahnenführer, Multivariate Verfahren, WS0809, TU Dortmund Hauptkomponentenanalyse Aus der Definition der Hauptkomponenten folgt direkt die Diagonalform der Kovarianzmatrix der transformierten Daten Jörg Rahnenführer, Multivariate Verfahren, WS0809, TU Dortmund
69 Hauptkomponentenanalyse Hauptkomponentenzerlegung entspricht der Spektralzerlegung der Kovarianzmatrix Jörg Rahnenführer, Multivariate Verfahren, WS0809, TU Dortmund Hauptkomponentenanalyse Jörg Rahnenführer, Multivariate Verfahren, WS0809, TU Dortmund
70 Hauptkomponentenanalyse Jörg Rahnenführer, Multivariate Verfahren, WS0809, TU Dortmund Hauptkomponentenanalyse Die totale Varianz von Y 1,...,Y d und der HKn stimmen überein Jörg Rahnenführer, Multivariate Verfahren, WS0809, TU Dortmund
71 Hauptkomponentenanalyse Jörg Rahnenführer, Multivariate Verfahren, WS0809, TU Dortmund Hauptkomponentenanalyse Jörg Rahnenführer, Multivariate Verfahren, WS0809, TU Dortmund
Multivariate Verfahren
Multivariate Verfahren Prof. Dr. Jörg Rahnenführer Raum 720 Email: rahnenfuehrer@statistik. tu-.de Voraussetzungen: Vordiplom in Statistik, Mathematik, Datenanalyse, Informatik Zeiten und Räume Vorlesung
MehrMultivariate Verfahren
Multivariate Verfahren Prof. Dr. Jörg Rahnenführer Raum 720 Email: rahnenfuehrer@statistik. tu-.de Voraussetzungen: Vordiplom in Statistik, Mathematik, Datenanalyse, Informatik Zeiten und Räume Vorlesung
Mehr1 Beispiele multivariater Datensätze... 3
Inhaltsverzeichnis Teil I Grundlagen 1 Beispiele multivariater Datensätze... 3 2 Elementare Behandlung der Daten... 15 2.1 Beschreibung und Darstellung univariater Datensätze... 15 2.1.1 Beschreibung und
Mehr3. Gemeinsame und bedingte Verteilung, stochastische Unabhängigkeit
3. Gemeinsame und bedingte Verteilung, stochastische Unabhängigkeit Lernziele dieses Kapitels: Mehrdimensionale Zufallsvariablen (Zufallsvektoren) (Verteilung, Kenngrößen) Abhängigkeitsstrukturen Multivariate
MehrStatistische Datenanalyse
Werner A. Stahel Statistische Datenanalyse Eine Einführung für Naturwissenschaftler 3., durchgesehene Auflage vieweg VII 1 Einleitung 1 1.1 Was ist Statistische Datenanalyse? 1 1.2 Ziele 6 1.3 Hinweise
Mehr2 Multivariate Normalverteilung
2 Multivariate Normalverteilung 2. Multivariate Normalverteilung Definition 2.. Normalverteilung Eine univariat normalverteilte Zufallsvariable X besitzt ie Dichte ) (x µ)2 f (x) = exp ( x R. 2π σ 2σ 2
Mehr1 Multivariate Zufallsvariablen
1 Multivariate Zufallsvariablen 1.1 Multivariate Verteilungen Definition 1.1. Zufallsvariable, Zufallsvektor (ZV) Sei Ω die Ergebnismenge eines Zufallsexperiments. Eine (univariate oder eindimensionale)
Mehr1 Grundlagen der Wahrscheinlichkeitsrechnung Wahrscheinlichkeitsräume. Ein erster mathematischer Blick auf Zufallsexperimente...
Inhaltsverzeichnis 1 Grundlagen der Wahrscheinlichkeitsrechnung 1 1.1 Wahrscheinlichkeitsräume Ein erster mathematischer Blick auf Zufallsexperimente.......... 1 1.1.1 Wahrscheinlichkeit, Ergebnisraum,
MehrUwe Hassler. Statistik im. Bachelor-Studium. Eine Einführung. für Wirtschaftswissenschaftler. ^ Springer Gabler
Uwe Hassler Statistik im Bachelor-Studium Eine Einführung für Wirtschaftswissenschaftler ^ Springer Gabler 1 Einführung 1 2 Beschreibende Methoden univariater Datenanalyse 5 2.1 Grundbegriffe 5 2.2 Häufigkeitsverteilungen
Mehr1 Gemischte Lineare Modelle
1 Gemischte Lineare Modelle Wir betrachten zunächst einige allgemeine Aussagen für Gemischte Lineare Modelle, ohne zu tief in die mathematisch-statistische Theorie vorzustoßen. Danach betrachten wir zunächst
Mehr5 Allgemeine Verfahren zum Testen von Hypothesen
5 Allgemeine Verfahren zum Testen von Hypothesen 5.1 Likelihood Schätzung für multivariate Daten Statistisches Modell: Einfache Zufallsstichprobe X 1,..., X n (unabhängige Wiederholungen von X IR d ).
MehrKlausur zur Vorlesung Analyse mehrdimensionaler Daten, Lösungen WS 2010/2011; 6 Kreditpunkte, 90 min
Klausur, Analyse mehrdimensionaler Daten, WS 2010/2011, 6 Kreditpunkte, 90 min 1 Prof. Dr. Fred Böker 21.02.2011 Klausur zur Vorlesung Analyse mehrdimensionaler Daten, Lösungen WS 2010/2011; 6 Kreditpunkte,
Mehr6.1 Definition der multivariaten Normalverteilung
Kapitel 6 Die multivariate Normalverteilung Wir hatten die multivariate Normalverteilung bereits in Abschnitt 2.3 kurz eingeführt. Wir werden sie jetzt etwas gründlicher behandeln, da die Schätzung ihrer
MehrStatistische Analyseverfahren Abschnitt 2: Zufallsvektoren und mehrdimensionale Verteilungen
Statistische Analyseverfahren Abschnitt 2: Zufallsvektoren und mehrdimensionale Verteilungen Prof. Dr. Hans-Jörg Starkloff TU Bergakademie Freiberg Institut für Stochastik Oktober 2018 Prof. Dr. Hans-Jörg
MehrZufallsvariablen. Diskret. Stetig. Verteilung der Stichprobenkennzahlen. Binomial Hypergeometrisch Poisson. Normal Lognormal Exponential
Zufallsvariablen Diskret Binomial Hypergeometrisch Poisson Stetig Normal Lognormal Exponential Verteilung der Stichprobenkennzahlen Stetige Zufallsvariable Verteilungsfunktion: Dichtefunktion: Integralrechnung:
MehrDas (multiple) Bestimmtheitsmaß R 2. Beispiel: Ausgaben in Abhängigkeit vom Einkommen (I) Parameterschätzer im einfachen linearen Regressionsmodell
1 Lineare Regression Parameterschätzung 13 Im einfachen linearen Regressionsmodell sind also neben σ ) insbesondere β 1 und β Parameter, deren Schätzung für die Quantifizierung des linearen Zusammenhangs
MehrMultivariate Statistik
Multivariate Statistik von Univ.-Prof. Dr. Rainer Schlittgen Oldenbourg Verlag München I Daten und ihre Beschreibung 1 1 Einführung 3 1.1 Fragestellungen 3 1.2 Datensituation 8 1.3 Literatur und Software
MehrAngewandte Statistik mit R. Eine Einführung für Ökonomen und
Reiner Hellbrück Angewandte Statistik mit R Eine Einführung für Ökonomen und Sozialwissenschaftler 3. Auflage Springer Gabler Inhaltsverzeichnis Vorwort zur dritten Auflage Vorwort zur ersten Auflage Vorwort
MehrDeskription, Statistische Testverfahren und Regression. Seminar: Planung und Auswertung klinischer und experimenteller Studien
Deskription, Statistische Testverfahren und Regression Seminar: Planung und Auswertung klinischer und experimenteller Studien Deskriptive Statistik Deskriptive Statistik: beschreibende Statistik, empirische
MehrStatistik Testverfahren. Heinz Holling Günther Gediga. Bachelorstudium Psychologie. hogrefe.de
rbu leh ch s plu psych Heinz Holling Günther Gediga hogrefe.de Bachelorstudium Psychologie Statistik Testverfahren 18 Kapitel 2 i.i.d.-annahme dem unabhängig. Es gilt also die i.i.d.-annahme (i.i.d = independent
MehrAngewandte Statistik mit R
Reiner Hellbrück Angewandte Statistik mit R Eine Einführung für Ökonomen und Sozialwissenschaftler 2., überarbeitete Auflage B 374545 GABLER Inhaltsverzeichnis Vorwort zur zweiten Auflage Tabellenverzeichnis
MehrMultivariate Verteilungen. Gerhard Tutz LMU München
Multivariate Verteilungen Gerhard Tutz LMU München INHALTSVERZEICHNIS 1 Inhaltsverzeichnis 1 Multivariate Normalverteilung 3 Wishart Verteilung 7 3 Hotellings T Verteilung 11 4 Wilks Λ 14 INHALTSVERZEICHNIS
Mehr4 Statistik normalverteilter Daten
4 Statistik normalverteilter Daten 4.1 Eine Stichprobe a Die drei Grundfragen. Die schliessende Statistik bildet die Brücke zwischen den Wahrscheinlichkeitsmodellen, die unser Denken strukturieren, und
MehrStatistik II. IV. Hypothesentests. Martin Huber
Statistik II IV. Hypothesentests Martin Huber 1 / 22 Übersicht Weitere Hypothesentests in der Statistik 1-Stichproben-Mittelwert-Tests 1-Stichproben-Varianz-Tests 2-Stichproben-Tests Kolmogorov-Smirnov-Test
MehrStatistik II. Version A. 1. Klausur Sommersemester 2011 Hamburg, BITTE LESERLICH IN DRUCKBUCHSTABEN AUSFÜLLEN!
Statistik II Version A 1. Klausur Sommersemester 2011 Hamburg, 27.07.2011 BITTE LESERLICH IN DRUCKBUCHSTABEN AUSFÜLLEN! Nachname:............................................................................
MehrLehr- und Übungsbuch der angewandten Statistik. Von Dr. Bärbel Elpelt und. O. Prof. Dr. Joachim Hartung Fachbereich Statistik der Universität Dortmund
Grundkurs Statistik Lehr- und Übungsbuch der angewandten Statistik Von Dr. Bärbel Elpelt und O. Prof. Dr. Joachim Hartung Fachbereich Statistik der Universität Dortmund Mit ausführlichen Übungs- und Klausurteilen
MehrStatistik in Geodäsie, Geoinformation und Bauwesen
Wilhelm Benning Statistik in Geodäsie, Geoinformation und Bauwesen 2., überarbeitete und erweiterte Auflage Herbert Wichmann Verlag Heidelberg Matrix-Theorie 1 1.1 Matrizen und Vektoren 1 1.2 Matrixverknüpfungen
MehrInhaltsverzeichnis. Vorwort. Abbildungsverzeichnis. Tabellenverzeichnis. 1 Einleitung Gegenstand Aufbau 4
Inhaltsverzeichnis Vorwort Abbildungsverzeichnis Tabellenverzeichnis v xv xvii 1 Einleitung 1 1.1 Gegenstand 1 1.2 Aufbau 4 2 Datenerhebung - ganz praktisch 7 2.1 Einleitung 7 2.2 Erhebungsplan 7 2.2.1
MehrInhalt. I Einführung. Kapitel 1 Konzept des Buches Kapitel 2 Messen in der Psychologie... 27
Inhalt I Einführung Kapitel 1 Konzept des Buches........................................ 15 Kapitel 2 Messen in der Psychologie.................................. 27 2.1 Arten von psychologischen Messungen....................
MehrForschungsstatistik I
Prof. Dr. G. Meinhardt 6. Stock, Taubertsberg 2 R. 06-206 (Persike) R. 06-214 (Meinhardt) Sprechstunde jederzeit nach Vereinbarung Forschungsstatistik I Dr. Malte Persike persike@uni-mainz.de http://psymet03.sowi.uni-mainz.de/
MehrVorwort zur 3. Auflage 15. Vorwort zur 2. Auflage 15. Vorwort 16 Kapitel 0 Einführung 19. Teil I Beschreibende Statistik 29
Inhaltsübersicht Vorwort zur 3. Auflage 15 Vorwort zur 2. Auflage 15 Vorwort 16 Kapitel 0 Einführung 19 Teil I Beschreibende Statistik 29 Kapitel 1 Eindimensionale Häufigkeitsverteilungen 31 Kapitel 2
MehrÄhnlichkeits- und Distanzmaße
Ähnlichkeits- und Distanzmaße Jörg Rahnenführer, Multivariate Verfahren, WS89, TU Dortmund 11.1.8-1 - Ähnlichkeits- und Distanzmaße Jörg Rahnenführer, Multivariate Verfahren, WS89, TU Dortmund 11.1.8 -
MehrLösung Übungsblatt 5
Lösung Übungsblatt 5 5. Januar 05 Aufgabe. Die sogenannte Halb-Normalverteilung spielt eine wichtige Rolle bei der statistischen Analyse von Ineffizienzen von Produktionseinheiten. In Abhängigkeit von
MehrStatistik für Bachelorund Masterstudenten
Walter Zucchini Andreas Schlegel Oleg Nenadic Stefan Sperlich Statistik für Bachelorund Masterstudenten Eine Einführung für Wirtschaftsund Sozialwissenschaftler 4y Springer 1 Der Zufall in unserer Welt
MehrÜbung zu Empirische Ökonomie für Fortgeschrittene SS 2009
Übung zu Empirische Ökonomie für Fortgeschrittene Steen Elstner, Klaus Wohlrabe, Steen Henzel SS 9 1 Wichtige Verteilungen Die Normalverteilung Eine stetige Zufallsvariable mit der Wahrscheinlichkeitsdichte
MehrPhilipp Sibbertsen Hartmut Lehne. Statistik. Einführung für Wirtschafts- und. Sozialwissenschaftler. 2., überarbeitete Auflage. 4^ Springer Gabler
Philipp Sibbertsen Hartmut Lehne Statistik Einführung für Wirtschafts- und Sozialwissenschaftler 2., überarbeitete Auflage 4^ Springer Gabler Inhaltsverzeichnis Teil I Deskriptive Statistik 1 Einführung
MehrVorlesung: Statistik II für Wirtschaftswissenschaft
Vorlesung: Statistik II für Wirtschaftswissenschaft Prof. Dr. Helmut Küchenhoff Institut für Statistik, LMU München Sommersemester 2017 Einführung 1 Wahrscheinlichkeit: Definition und Interpretation 2
MehrMultivariate Lineare Modelle SS Einführung. 1. Organisation. 2. Übersicht. 3. Arbeiten mit SAS
Multivariate Lineare Modelle SS 2009 0 Einführung 1. Organisation 2. Übersicht 3. Arbeiten mit SAS 1 0.1 Organisation Lehrziele: Theorie von multivariaten linearen Modellen Praktische Anwendung mit SAS
Mehr2.Tutorium Multivariate Verfahren
2.Tutorium Multivariate Verfahren - Multivariate Verteilungen - Hannah Busen: 27.04.2015 und 04.05.2015 Nicole Schüller: 28.04.2015 und 05.05.2015 Institut für Statistik, LMU München 1 / 21 Gliederung
MehrStatistik, Datenanalyse und Simulation
Dr. Michael O. Distler distler@kph.uni-mainz.de Mainz, 5. Juli 2011 Zunächst: PCA (Hauptkomponentenanalyse) ist eine mathematische Prozedur, die eine Anzahl von (möglicherweise korrelierten) Variablen
MehrEinführung in die Statistik
Einführung in die Statistik Analyse und Modellierung von Daten Von Prof. Dr. Rainer Schlittgen 4., überarbeitete und erweiterte Auflage Fachbereich Materialwissenschaft! der Techn. Hochschule Darmstadt
Mehr3 Grundlagen statistischer Tests (Kap. 8 IS)
3 Grundlagen statistischer Tests (Kap. 8 IS) 3.1 Beispiel zum Hypothesentest Beispiel: Betrachtet wird eine Abfüllanlage für Mineralwasser mit dem Sollgewicht µ 0 = 1000g und bekannter Standardabweichung
MehrAuswertung von Messdaten
Auswertung von Messdaten Statistische Methoden fur Geo- Lind Ingenieurwissenschaften von Prof Dr.-Ing. Wilhelm Caspary, Univ.-Prof. Dr. rer. nat. Klaus Wichmann Olden bou rgverlag Mu nchen Wien Inhaltsverzcichnis
MehrBeispiel: Multiples Modell/Omitted Variable Bias I
4 Multiple lineare Regression Konfidenzintervalle und Tests 4.3 Beispiel: Multiples Modell/Omitted Variable Bias I Beispieldatensatz mit Daten zur Lohnhöhe (y i ), zu den Ausbildungsjahren über den Hauptschulabschluss
Mehr1.1.1 Ergebnismengen Wahrscheinlichkeiten Formale Definition der Wahrscheinlichkeit Laplace-Experimente...
Inhaltsverzeichnis 0 Einführung 1 1 Zufallsvorgänge und Wahrscheinlichkeiten 5 1.1 Zufallsvorgänge.......................... 5 1.1.1 Ergebnismengen..................... 6 1.1.2 Ereignisse und ihre Verknüpfung............
MehrMehrdimensionale Zufallsvariablen
Mehrdimensionale Zufallsvariablen Im Folgenden Beschränkung auf den diskreten Fall und zweidimensionale Zufallsvariablen. Vorstellung: Auswerten eines mehrdimensionalen Merkmals ( ) X Ỹ also z.b. ω Ω,
MehrSchätzung im multiplen linearen Modell VI
Schätzung im multiplen linearen Modell VI Wie im einfachen linearen Regressionsmodell definiert man zu den KQ/OLS-geschätzten Parametern β = ( β 0, β 1,..., β K ) mit ŷ i := β 0 + β 1 x 1i +... β K x Ki,
Mehr13 Mehrdimensionale Zufallsvariablen Zufallsvektoren
3 Mehrdimensionale Zufallsvariablen Zufallsvektoren Bisher haben wir uns ausschließlich mit Zufallsexperimenten beschäftigt, bei denen die Beobachtung eines einzigen Merkmals im Vordergrund stand. In diesem
MehrSo berechnen Sie einen Schätzer für einen Punkt
htw saar 1 EINFÜHRUNG IN DIE STATISTIK: SCHÄTZEN UND TESTEN htw saar 2 Schätzen: Einführung Ziel der Statistik ist es, aus den Beobachtungen eines Merkmales in einer Stichprobe Rückschlüsse über die Verteilung
MehrWahrscheinlichkeitsrechnung und Statistik
10. Vorlesung - 2018 Grundbegriffe der Statistik statistische Einheiten = Objekte an denen interessierende Größen erfaßt werden z.b. Bevölkerung einer Stadt; Schüler einer bestimmten Schule; Patienten
Mehr1.5 Mehrdimensionale Verteilungen
Poisson eine gute Näherung, da np = 0 und 500p = 5 00 = n. Wir erhalten somit als Näherung Exakte Rechnung ergibt P(2 X 0) = k=2 0 k=2 π (k) = 0,26424. 0 ( ) 00 P(2 X 0) = 0,0 k 0,99 00 k = 0,264238. k.4.2.4
MehrEinführung in die Statistik
Einführung in die Statistik Analyse und Modellierung von Daten von Prof. Dr. Rainer Schlittgen Universität Hamburg 12., korrigierte Auflage Oldenbourg Verlag München Inhaltsverzeichnis 1 Statistische Daten
MehrStatistik, Geostatistik
Geostatistik Statistik, Geostatistik Statistik Zusammenfassung von Methoden (Methodik), die sich mit der wahrscheinlichkeitsbezogenen Auswertung empirischer (d.h. beobachteter, gemessener) Daten befassen.
MehrChi-Quadrat-Verteilung
Chi-Quadrat-Verteilung Wikipedia http://de.wikipedia.org/wiki/chi-quadrat-verteilung 1 von 7 6/18/2009 6:13 PM Chi-Quadrat-Verteilung aus Wikipedia, der freien Enzyklopädie Die Chi-Quadrat-Verteilung ist
MehrVorlesung: Statistik II für Wirtschaftswissenschaft
Vorlesung: Statistik II für Wirtschaftswissenschaft Prof. Dr. Helmut Küchenhoff Institut für Statistik, LMU München Sommersemester 2017 6 Genzwertsätze Einführung 1 Wahrscheinlichkeit: Definition und Interpretation
MehrPrüfungsfächer: Die Prüfung erstreckt sich auf die folgenden Prüfungsfächer: Maß- und Integrationstheorie Wahrscheinlichkeitstheorie Statistik
B Zulassungsprüfung in Stochastik Zielsetzung: Durch die Zulassungsprüfung in Stochastik soll der Nachweis geführt werden, dass die Bewerber über solide Grundkenntnisse in Wahrscheinlichkeitstheorie und
MehrStatistik mit und ohne Zufall
Christoph Weigand Statistik mit und ohne Zufall Eine anwendungsorientierte Einführung Mit 118 Abbildungen und 10 Tabellen Physica-Verlag Ein Unternehmen von Springer Inhaltsverzeichnis Teil I Deskriptive
Mehr7.1 Korrelationsanalyse. Statistik. Kovarianz. Pearson-Korrelation. Institut für angewandte Statistik & EDV Universität für Bodenkultur Wien
Statistik 7.1 Korrelationsanalyse Institut für angewandte Statistik & EDV Universität für Bodenkultur Wien Sommersemester 2012 7 Regressions- und Korrelationsanalyse Kovarianz Pearson-Korrelation Der (lineare)
Mehrsimple lineare Regression kurvilineare Regression Bestimmtheitsmaß und Konfidenzintervall
Regression Korrelation simple lineare Regression kurvilineare Regression Bestimmtheitsmaß und Konfidenzintervall Zusammenhänge zw. Variablen Betrachtet man mehr als eine Variable, so besteht immer auch
MehrSTATISTISCHE METHODEN UND IHRE ANWENDUNGEN
STATISTISCHE METHODEN UND IHRE ANWENDUNGEN Von Dr. rer. nat. Erwin Kreyszig o. Professor für Statistik an der Universität Karlsruhe mit 82 Abbildungen und zahlreichen Tabellen Vierter, unveränderter Nachdruck
MehrAnhang aus Statistik-III-Skript: p-dimensionale Zufallsvariablen
Kapitel 9 Anhang aus Statistik-III-Skript: p-dimensionale Zufallsvariablen 9 Definitionen, Eigenschaften Wir betrachten jetzt p Zufallsvariablen X, X 2,, X p Alle Definitionen, Notationen und Eigenschaften
MehrEmpirische Wirtschaftsforschung
Empirische Wirtschaftsforschung Prof. Dr. Bernd Süßmuth Universität Leipzig Institut für Empirische Wirtschaftsforschung Volkswirtschaftslehre, insbesondere Ökonometrie 1 4. Basiskonzepte der induktiven
Mehr0 sonst. a) Wie lautet die Randwahrscheinlichkeitsfunktion von Y? 0.5 y = 1
Aufgabe 1 (2 + 2 + 2 + 1 Punkte) Gegeben sei folgende gemeinsame Wahrscheinlichkeitsfunktion f(x, y) = P (X = x, Y = y) der Zufallsvariablen X und Y : 0.2 x = 1, y = 1 0.3 x = 2, y = 1 f(x, y) = 0.45 x
MehrStatistik II. Weitere Statistische Tests. Statistik II
Statistik II Weitere Statistische Tests Statistik II - 19.5.2006 1 Überblick Bisher wurden die Test immer anhand einer Stichprobe durchgeführt Jetzt wollen wir die statistischen Eigenschaften von zwei
MehrDeskriptive Beschreibung linearer Zusammenhänge
9 Mittelwert- und Varianzvergleiche Mittelwertvergleiche bei k > 2 unabhängigen Stichproben 9.4 Beispiel: p-wert bei Varianzanalyse (Grafik) Bedienungszeiten-Beispiel, realisierte Teststatistik F = 3.89,
MehrEinfache lineare Modelle mit Statistik-Software R Beispiel (Ausgaben in Abhängigkeit vom Einkommen)
3 Einfache lineare Regression Einfache lineare Modelle mit R 36 Einfache lineare Modelle mit Statistik-Software R Beispiel (Ausgaben in Abhängigkeit vom Einkommen) > summary(lm(y~x)) Call: lm(formula =
MehrEinfache lineare Modelle mit Statistik-Software R Beispiel (Ausgaben in Abhängigkeit vom Einkommen)
3 Einfache lineare Regression Einfache lineare Modelle mit R 3.6 Einfache lineare Modelle mit Statistik-Software R Beispiel (Ausgaben in Abhängigkeit vom Einkommen) > summary(lm(y~x)) Call: lm(formula
MehrLineare Modelle. Algebraische Grundlagen und statistische Anwendungen
Lineare Modelle Algebraische Grundlagen und statistische Anwendungen Von Univ.-Prof. Dr.-Ing. Wilhelm Caspary und Univ.-Prof. Dr. rer. nat. Klaus Wichmann R. Oldenbourg Verlag München Wien V INHALTSVERZEICHNIS
MehrMathematische Werkzeuge R. Neubecker, WS 2016 / 2017
Mustererkennung Mathematische Werkzeuge R. Neubecker, WS 2016 / 2017 Optimierung: Lagrange-Funktionen, Karush-Kuhn-Tucker-Bedingungen Optimierungsprobleme Optimierung Suche nach dem Maximum oder Minimum
MehrStatistik für Psychologen, Pädagogen und Mediziner
Thomas Köhler Statistik für Psychologen, Pädagogen und Mediziner Ein Lehrbuch ^~i: Verlag W. Kohlhammer 1 Einführung: Begriffsklärungen und Überblick 11 1.1 Aufgaben und Subdisziplinen der Statistik 11
MehrMultivariate Verfahren
Multivariate Verfahren Oliver Muthmann 31. Mai 2007 Gliederung 1 Einführung 2 Varianzanalyse (MANOVA) 3 Regressionsanalyse 4 Faktorenanalyse Hauptkomponentenanalyse 5 Clusteranalyse 6 Zusammenfassung Komplexe
MehrTests einzelner linearer Hypothesen I
4 Multiple lineare Regression Tests einzelner linearer Hypothesen 4.5 Tests einzelner linearer Hypothesen I Neben Tests für einzelne Regressionsparameter sind auch Tests (und Konfidenzintervalle) für Linearkombinationen
MehrMathematische Werkzeuge R. Neubecker, WS 2018 / 2019 Optimierung Lagrange-Funktionen, Karush-Kuhn-Tucker-Bedingungen
Mustererkennung Mathematische Werkzeuge R. Neubecker, WS 018 / 019 Optimierung Lagrange-Funktionen, Karush-Kuhn-Tucker-Bedingungen 1 Optimierung Optimierungsprobleme Suche nach dem Maximum oder Minimum
MehrTheorie Parameterschätzung Ausblick. Schätzung. Raimar Sandner. Studentenseminar "Statistische Methoden in der Physik"
Studentenseminar "Statistische Methoden in der Physik" Gliederung 1 2 3 Worum geht es hier? Gliederung 1 2 3 Stichproben Gegeben eine Beobachtungsreihe x = (x 1, x 2,..., x n ): Realisierung der n-dimensionalen
MehrQuantitative Methoden der Agrarmarktanalyse und des Agribusiness
Quantitative Methoden der Agrarmarktanalyse und des Agribusiness Teil Quantitative Methoden der Agrarmarktanalyse Vorlesung: Montag und Mittwoch 8:30-10:00 Dr. Bernhard Brümmer Tel.: 0431-880-4449, Fax:
MehrLösungen der Aufgaben zur Vorbereitung auf die Klausur Mathematik für Informatiker II
Universität des Saarlandes Fakultät für Mathematik und Informatik Sommersemester 2004 Prof. Dr. Joachim Weickert Dr. Bernhard Burgeth Lösungen der Aufgaben zur Vorbereitung auf die Klausur Mathematik für
MehrLineare statistische Methoden
Lineare statistische Methoden Von Universitätsprofessor Dr. Ulrich Kockelkorn R.01denbourg Verlag München Wien Inhaltsverzeichnis Vorwort 11 I Das Handwerkszeug 15 1 Das mathematische Handwerkszeug 17
MehrStatistik für Human- und Sozialwissenschaftler
Jürgen Bortz Statistik für Human- und Sozialwissenschaftler Sechste, vollständig überarbeitete und aktualisierte Auflage mit 84 Abbildungen und 242 Tabellen 4y Springer Inhaltsverzeichnis* > Vorbemerkungen:
MehrEinige Konzepte aus der Wahrscheinlichkeitstheorie (Wiederh.)
Einige Konzepte aus der Wahrscheinlichkeitstheorie (Wiederh.) 1 Zusammenfassung Bedingte Verteilung: P (y x) = P (x, y) P (x) mit P (x) > 0 Produktsatz P (x, y) = P (x y)p (y) = P (y x)p (x) Kettenregel
MehrDr. Maike M. Burda. Welchen Einfluss hat die Körperhöhe auf das Körpergewicht? Eine Regressionsanalyse. HU Berlin, Econ Bootcamp 7.-9.
Dr. Maike M. Burda Welchen Einfluss hat die Körperhöhe auf das Körpergewicht? Eine Regressionsanalyse. HU Berlin, Econ Bootcamp 7.-9. Januar 2011 BOOTDATA11.GDT: 250 Beobachtungen für die Variablen...
MehrInhaltsverzeichnis. Robert Galata, Sandro Scheid. Deskriptive und Induktive Statistik für Studierende der BWL. Methoden - Beispiele - Anwendungen
Inhaltsverzeichnis Robert Galata, Sandro Scheid Deskriptive und Induktive Statistik für Studierende der BWL Methoden - Beispiele - Anwendungen Herausgegeben von Robert Galata, Markus Wessler ISBN (Buch):
MehrLineare Regression und Varianzanalyse
Lineare Regression und Varianzanalyse Von Prof. Dr. Fritz Pokropp Universität der Bundeswehr Hamburg R. Oldenbourg Verlag München Wien Inhaltsverzeichnis 1 Einleitung 1 1.1 Grundstruktur linearer Modelle
MehrStatistik. Für Sozialwissenschaftler. Dritte, neu bearbeitete Auflage Mit 71 Abbildungen und 224 Tabellen
Jürgen Bortz Statistik Für Sozialwissenschaftler Dritte, neu bearbeitete Auflage Mit 71 Abbildungen und 224 Tabellen Springer-Verlag Berlin Heidelberg Newlfork London Paris Tokyo Inhaltsverzeichnis Einleitung
MehrKonfidenzintervalle. Gesucht: U = U(X 1,..., X n ), O = O(X 1,..., X n ), sodass für das wahre θ gilt
Konfidenzintervalle Annahme: X 1,..., X n iid F θ. Gesucht: U = U(X 1,..., X n ), O = O(X 1,..., X n ), sodass für das wahre θ gilt P θ (U θ O) = 1 α, α (0, 1). Das Intervall [U, O] ist ein Konfidenzintervall
MehrStatistik I für Betriebswirte Vorlesung 14
Statistik I für Betriebswirte Vorlesung 14 Dr. Andreas Wünsche TU Bergakademie Freiberg Institut für Stochastik 13. Juli 017 Dr. Andreas Wünsche Statistik I für Betriebswirte Vorlesung 14 Version: 8. Juli
MehrWahrscheinlichkeitsrechnung und Statistik
9. Vorlesung - 2017 Monte Carlo Methode für numerische Integration Sei g : [0, 1] R stetige Funktion; man möchte 1 0 g(t)dt numerisch approximieren mit Hilfe von Zufallszahlen: Sei (U n ) n eine Folge
Mehr7.2 Theoretische Kennwerte
7.2 Theoretische Kennwerte Theoretische Varianz und Standardabweichung Definition und Notation Verschiebungsformel für die theoretische Varianz 391 7.2 Theoretische Kennwerte Interpretation der theoretischen
MehrBSc Bioinformatik Wintersemester 2013/2014 Nachklausur zur Statistik I Freie Universität Berlin
Sc ioinformatik Wintersemester 013/014 Nachklausur zur Statistik I Freie Universität erlin 4. pril 014 Matrikelnummer Nachname Vorname Unterschrift ufgabe 1 (4 Punkte): Zu einem Wahrscheinlichkeitsraum
MehrWillkommen zur Vorlesung Statistik (Master)
Willkommen zur Vorlesung Statistik (Master) Thema dieser Vorlesung: Verteilungen stetiger Zufallsvariablen Prof. Dr. Wolfgang Ludwig-Mayerhofer Universität Siegen Philosophische Fakultät, Seminar für Sozialwissenschaften
Mehr2.1 Gemeinsame-, Rand- und bedingte Verteilungen
Kapitel Multivariate Verteilungen 1 Gemeinsame-, Rand- und bedingte Verteilungen Wir hatten in unserer Datenmatrix m Spalten, dh m Variablen Demnach brauchen wir jetzt die wichtigsten Begriffe für die
Mehr3.3 Wahlpichtmodule Mathematik
3.3 Wahlpichtmodule Mathematik Wie in der Prüfungsordung angegeben, muss ein Wahlpichtmodul aus dem Gebiet der Mathematik stammen. Dieses kann aus den Modulen Analysis 2, Mathematische Logik und Einführung
MehrBiostatistik Erne Einfuhrung fur Biowissenschaftler
Matthias Rudolf Wiltrud Kuhlisch Biostatistik Erne Einfuhrung fur Biowissenschaftler PEARSON Studium Inhaltsverzeichnis Vorwort xi Kapitel 1 Einfiihrung 1 1.1 Biostatistik als Bestandteil biowissenschafllicher
MehrWS 2014/15. (d) Bestimmen Sie die Wahrscheinlichkeitsfunktion von X. (e) Bestimmen Sie nun den Erwartungswert und die Varianz von X.
Fragenkatalog zur Übung Methoden der empirischen Sozialforschung WS 2014/15 Hier finden Sie die denkbaren Fragen zum ersten Teil der Übung. Das bedeutet, dass Sie zu diesem Teil keine anderen Fragen im
MehrMultivariate Statistische Methoden
Multivariate Statistische Methoden und ihre Anwendung in den Wirtschafts- und Sozialwissenschaften Von Prof. Dr. Hans Peter Litz Carl von Ossietzky Universität Oldenburg v..v.-'... ':,. -X V R.Oldenbourg
Mehr