Faktoren- und Hauptkomponentenanalyse

Größe: px
Ab Seite anzeigen:

Download "Faktoren- und Hauptkomponentenanalyse"

Transkript

1 Ziel: Anwendung von Verfahren der Dimensionsreduzierung Graphische Methoden zur Darstellung der Erkennen von Strukturen in Daten an ausgewählten Anwendungsbeispielen Betreuer: Dr. Jörg Kraft IAAC, Lehrbereich Umweltanalytik Lessingstraße 8, Raum 324 Tel.: (9) Grundlagen: Dimensionsreduzierung von Datensätzen: PCA Das Ziel der Hauptkomponentenanalyse (principal component analysis, PCA) ist es eine Vielzahl von Variablen (=Dimensionen) auf einige wenige Komponenten ( latente Variablen, Faktoren) zu reduzieren. Dies entspricht einer dimensionsreduzierenden Transformation. Mit Hilfe der PCA werden aus der Korrelations- oder Kovarianzmatrix sogenannte Hauptkomponenten (principal components, PC) extrahiert, die unkorreliert (orthogonal) sind und die den Informationsgehalt der ursprünglichen Matrix weitgehend reproduzieren können. Die Hauptkomponenten sind Linearkombinationen der ursprünglichen Variablen und werden nacheinander so extrahiert, daß jeweils die maximale verbleibende Varianz der Daten erklärt wird. Je stärker die ursprünglichen Variablen korreliert sind, umso weniger Seite 1 von 7

2 Hauptkomponenten sind notwendig. Die Zahl der Hauptkomponenten wird z.b. mit dem Scree-Plot bestimmt. Als Ergebnis einer PCA erhält man zwei Matrizen, die Matrix der Faktorladungen (loadings), die dem Variablenraum entspricht, und die Matrix der Faktorwerte (scores), die den Objektraum repräsentiert. Diese Matrizen bilden das Datenmaterial für Plots der Faktorwerte (score plot) bzw. -ladungen (plot of loadings), mit denen eine 2- oder 3-dimensionale Projektion der Anordnung der Objekte bzw. Variablen erhalten werden kann. Bei ausreichend repräsentativen Daten und linearen Zusammenhängen können die Hauptkomponenten häufig interpretiert werden. Die Hauptkomponenten können als Basis für weitere Auswertungen dienen, z.b. für die Clusteranalyse, multiple lineare Regression (principal component regression, PCR, vgl. Praktikumsversuch C2) oder als Eingänge eines künstlichen neuronalen Netzes. Einschränkungen und Alternativen Da die PCA auf der Berechnung der Korrelationsmatrix beruht, wird eine annähernd multivariate Normalverteilung der Daten vorausgesetzt. Eine nichtparametrische Alternative zur PCA bildet die Multidimensionale Skalierung (Multidimensional Scaling, MDS, auch als Non-linear Mapping, NLM, bezeichnet). Das Ziel der MDS entspricht dem der PCA, jedoch beruht die Berechnung auf anderen Prinzipien, Bei der MDS werden die Objekte in einem Raum mit einer Zahl von vorher spezifizierten Dimensionen (meist 2 oder 3) so bewegt, daß ein Anpassungsparameter iterativ minimiert wird, der Anpassungsfehler (stress) also möglichst gering wird. Dieser Parameter beruht auf der Rangordnung der Distanzen. Seite 2 von 7

3 Durchführung: 1. Übung Hauptkomponentenanalyse (PCA) von Weindaten Programm: Datensatz: Beschreibung: Factor Analysis Modul von STATISTICA WEINSTD.STA In Weinen aus verschiedenen Anbaugebieten und Rebsorten wurden die anorganischen Spurenbestandteile mittels der ICP- OES bestimmt. Kann man aus dem erhaltenen Elementmuster Hinweise auf das Anbaugebiet oder die Rebsorte des Weins erhalten? Protokollieren Sie die durchgeführten Schritte der Hauptkomponentenanalyse! Tab.: Mit Hilfe von ICP-OES untersuchte Weine (Datensatz WEINSTD.STA) Code Lage Anbaugebiet Rebsorte Jahrgang FS Freyburg/Unstrut Saale-Unstrut Silvaner 1993 FR Freyburg/Unstrut Saale-Unstrut Riesling 1993 FM Freyburg/Unstrut Saale-Unstrut Müller-Thurgau 1993 GW Geisenheim Rheingau Weißburgunder 1993 GR Geisenheim Rheingau Riesling 1993 GS Geisenheim Rheingau Silvaner 1993 BG Blankenhornsberg Baden Gewürztraminer 1993 BS Blankenhornsberg Baden Silvaner 1993 BR Blankenhornsberg Baden Riesling 1993 DR Durbach Baden Riesling 1993 DK Durbach Baden Kerner 1993 DG Durbach Baden Gewürztraminer 1993 NM Nierstein Rheinhessen Müller-Thurgau 1994 NR Nierstein Rheinhessen Riesling 1994 Seite 3 von 7

4 Code Lage Anbaugebiet Rebsorte Jahrgang OS Oppenheim Rheinhessen Silvaner 1994 OM Oppenheim Rheinhessen Müller-Thurgau 1994 OR Oppenheim Rheinhessen Riesling 1994 Die PCA ist (neben der Clusteranalyse, vgl. Praktikumsversuch Clusteranalyse und Display-Methoden) geeignet, um sich einen Überblick über den Datensatz zu verschaffen. Spezifizieren Sie die Variablenliste, d.h. die betrachteten Elementkonzentrationen und starten Sie die Analyse. Es erscheint eine Dialogbox, in der Sie die Anzahl der zu extrahierenden Hauptkomponenten beeinflussen können. Wählen sie zunächst fünf Faktoren und starten Sie die Berechnung der PCA. Im Hinblick auf die Aufgabenstellung sind folgende Punkte interessant: Wieviele Hauptkomponenten sollten extrahiert werden? Hierzu sollten Sie sich den Scree Plot ansehen. Als Scree werden die Ablagerungen bezeichnet, die sich an Steilküsten bilden. Üblicherweise werden nur die Hauptkomponenten extrahiert, die sich im steil abfallenden Teil des Plots befinden, also in diesem Fall drei Hauptkomponenten. Sie brauchen also bei den weiteren Auswertungen und Plots nur die ersten drei Faktoren zu berücksichtigen. 5.0 Scree-Plot Eigenwert Hauptkomponente Zusammenhänge und Einflüsse der Variablen können in einem Faktorladungsplot (plot of loadings) dargestellt werden. Sie können eine 2D- oder 3D-Darstellung erhalten. Der größte Anteil der Varianz wird durch die ersten beiden Seite 4 von 7

5 Hauptkomponenten erklärt, daher bietet sich ein Plot dieser Faktorladungen an. Variablen in der Nähe des Ursprungs (z.b. B) haben nur einen kleinen Einfluß, während z.b. P in Faktor 1 hoch geladen ist. Gruppierungen von Variablen können ähnlich wie bei der Clusteranalyse interpretiert werden. 1.0 Plot der Faktorladungen (PCA) 0.8 FE NA MG SR AL_308 CA ZN_206 MN PC B CU K P -0.2 BA RB V PC 1 Strukturen bei den Objekten können mit Hilfe des Score-Plots (Plot der Faktorwerte) aufgezeigt werden. Dieser Plot kann jedoch nicht direkt abgerufen werden, sondern die Scores müssen zunächst abgespeichert werden (Save factor scores). Zusammen mit den Scores können auch andere Variablen gesichert werden. Hier sollten Sie LAGE, GEBIET und SORTE auswählen. Nachdem sie die Scores gesichert haben, können Sie diese als STATISTICA-Datenfile laden und mit dem Menüpunkt Graphs/Stats Categorized Graphs/Scatterplot einen nach der Variable GEBIET kategorisierten Plot erzeugen (Overlaid). Ebenfalls geeignet ist eine Scatterplotmatrix. Die Weine zeigen eine gute Gruppierung nach dem Gebiet, wobei Rheingau und Rheinhessen etwas überlappen. Mit der Interpreation von Faktoren bzw. Hauptkomponenten sollte man vorsichtig sein. Eine Hypothese wäre, daß Faktor 1 den Einfluß der Sonnenscheindauer repräsentiert, jedoch müßten zur Erhärtung weitere Daten gewonnen werden. Sehen Sie sich auch die Kategorisierung nach der Rebsorte an. Seite 5 von 7

6 Score-Plot WEINSTD.STA PC FR FS FM GS GR NR OM OR GW NM OS BG DK DR DG GEBIET: SaaleUns GEBIET: Rheingau GEBIET: Baden GEBIET: Rheinhes -1.5 BR BS PC1 2. Übung Hauptkomponentenanalyse (PCA) von Olivenöldaten Programm: Factor Analysis Modul von STATISTICA Führen Sie eine Hauptkomponentanalyse für den Datensatz Olivenöle (OLIV_2.STA) durch. Protokollieren Sie Ihre angewendeten Schritte und interpretieren Sie das Ergebnis anhand der Grafiken, bzw. Tabellen. 4 Score-Plot OLIV_2.STA PC REGION: NORTH_AP REGION: CALABRIA REGION: SOUTH_AP REGION: SICILY REGION: INLAND_S REGION: COAST_SA REGION: UMBRIA REGION: EAST_LIG REGION: WEST_LIG PC1 Seite 6 von 7

7 Literatur: Brereton, R.G. (Hrsg.): Multivariate Pattern Recognition in Chemistry. Elsevier, Amsterdam 1992 Smith, G.L.: Principal component analysis: An introduction. Anal. Proc. 28, 150 (1991) Wernecke, K.-D.: Angewandte Statistik für die Praxis. Addison-Wesley, Bonn 1995 Wold, S., Esbensen, K., Geladi, P.: Principal components analysis, Chemometrics. Intell. Lab. Syst. 2, 37 (1987) Einax, J. W., Zwanziger, H. W,, Geiß, S.: Chemometrics in Environmental Analysis. VCH, Weinheim, 1997 Massart D. L., Vandeginste B. G. M., Buydens L. M. C., De Jong S., Lewi P. J., Smeyers-Verbeke J.: Handbook of chemometrics and qualimetrics; data handling in science and technology, Parts A and B, Vols. 20A and 20B. Elsevier, Amsterdam, Seite 7 von 7

Faktoren- und Hauptkomponentenanalyse

Faktoren- und Hauptkomponentenanalyse Ziel: Anwendung von Verfahren der Dimensionsreduzierung Erkennen von Strukturen in Daten an ausgewählten Anwendungsbeispielen Betreuer: Dipl.-Chem. Stefan Möller IAAC, Lehrbereich Umweltanalytik Lessingstraße

Mehr

Clusteranalyse und Display-Methoden

Clusteranalyse und Display-Methoden Ziel: Erkennen von Strukturen in Daten Vergleich der Algorithmen für die Clusteranalyse Beurteilung verschiedener Displaymethoden Stabilitätsdiagramme Betreuer: Dipl.-Chem. Stefan Hesse IAAC, Lehrbereich

Mehr

Statistik, Datenanalyse und Simulation

Statistik, Datenanalyse und Simulation Dr. Michael O. Distler distler@kph.uni-mainz.de Mainz, 5. Juli 2011 Zunächst: PCA (Hauptkomponentenanalyse) ist eine mathematische Prozedur, die eine Anzahl von (möglicherweise korrelierten) Variablen

Mehr

Exploratorische Faktorenanalyse. Exploratorische Faktorenanalyse. Exploratorische Faktorenanalyse

Exploratorische Faktorenanalyse. Exploratorische Faktorenanalyse. Exploratorische Faktorenanalyse Exploratorische Faktorenanalyse Der Begriff Faktorenanalyse umfasst eine Gruppe multivariater Analyseverfahren, mit denen zugrundeliegende gemeinsame Dimensionen von Variablenmengen (z.b. Fragebogenitems)

Mehr

Inhaltsverzeichnis. Vorwort. 1 Einführung in die multivariate Datenanalyse 1

Inhaltsverzeichnis. Vorwort. 1 Einführung in die multivariate Datenanalyse 1 V Inhaltsverzeichnis Vorwort XI 1 Einführung in die multivariate Datenanalyse 1 1.1 Was ist multivariate Datenanalyse? 1 1.2 Datensätze in der multivariaten Datenanalyse 4 1.3 Ziele der multivariaten Datenanalyse

Mehr

9 Faktorenanalyse. Wir gehen zunächst von dem folgenden Modell aus (Modell der Hauptkomponentenanalyse): Z = F L T

9 Faktorenanalyse. Wir gehen zunächst von dem folgenden Modell aus (Modell der Hauptkomponentenanalyse): Z = F L T 9 Faktorenanalyse Ziel der Faktorenanalyse ist es, die Anzahl der Variablen auf wenige voneinander unabhängige Faktoren zu reduzieren und dabei möglichst viel an Information zu erhalten. Hier wird davon

Mehr

1 Beispiele multivariater Datensätze... 3

1 Beispiele multivariater Datensätze... 3 Inhaltsverzeichnis Teil I Grundlagen 1 Beispiele multivariater Datensätze... 3 2 Elementare Behandlung der Daten... 15 2.1 Beschreibung und Darstellung univariater Datensätze... 15 2.1.1 Beschreibung und

Mehr

Explorative Faktorenanalyse

Explorative Faktorenanalyse Explorative Faktorenanalyse 1 Einsatz der Faktorenanalyse Verfahren zur Datenreduktion Analyse von Datenstrukturen 2 -Ich finde es langweilig, mich immer mit den selben Leuten zu treffen -In der Beziehung

Mehr

Hauptkomponenten-basierte Klassifikationsverfahren (PCA)

Hauptkomponenten-basierte Klassifikationsverfahren (PCA) Hauptkomponenten-basierte Klassifikationsverfahren (PCA) Projektseminar: Wetterlagen und Feinstaub - Übung Dozent: Claudia Weitnauer Referent: Esther Oßwald, Julian Dare Datum: 30.05.2011 Übersicht 1 Einleitung

Mehr

6. Faktorenanalyse (FA) von Tests

6. Faktorenanalyse (FA) von Tests 6. Faktorenanalyse (FA) von Tests 1 6. Faktorenanalyse (FA) von Tests 1 6.1. Grundzüge der FA nach der Haupkomponentenmethode (PCA) mit anschliessender VARIMAX-Rotation:... 2 6.2. Die Matrizen der FA...

Mehr

Multivariate Analysemethoden

Multivariate Analysemethoden Multivariate Analysemethoden 22.10.2007 Günter Meinhardt Johannes Gutenberg Universität Mainz Die Konfiguration von Entitäten definiert ihre wechselseitige Ähnlichkeit. Wechselseitige Ählichkeitsmuster

Mehr

Multivariate Statistik

Multivariate Statistik Multivariate Statistik von Univ.-Prof. Dr. Rainer Schlittgen Oldenbourg Verlag München I Daten und ihre Beschreibung 1 1 Einführung 3 1.1 Fragestellungen 3 1.2 Datensituation 8 1.3 Literatur und Software

Mehr

Wahrscheinlichkeitsrechnung und Statistik für Biologen Diskriminanzanalyse

Wahrscheinlichkeitsrechnung und Statistik für Biologen Diskriminanzanalyse Wahrscheinlichkeitsrechnung und Statistik für Biologen Diskriminanzanalyse Noémie Becker & Dirk Metzler http://evol.bio.lmu.de/_statgen 3. Juli 2013 Übersicht 1 Ruf des Kleinspechts 2 Modell Vorgehen der

Mehr

METHODENPRAKTIKUM II Kurs 1. Prof. Dr. Beat Fux SUZ Frühlingssemester 2009

METHODENPRAKTIKUM II Kurs 1. Prof. Dr. Beat Fux SUZ Frühlingssemester 2009 METHODENPRAKTIKUM II Kurs 1 Prof. Dr. Beat Fux SUZ Frühlingssemester 2009 Ziel der Faktorenanalyse Struktur hinter den Korrelationen zwischen Variablen entdecken Reduzierung einer Vielzahl von Variablen

Mehr

Die Faktorenanalyse. Anwendung dann, wenn zwischen beobachtbaren und nicht direkt beobachtbaren Variablen ein kausales Verhältnis vermutet wird

Die Faktorenanalyse. Anwendung dann, wenn zwischen beobachtbaren und nicht direkt beobachtbaren Variablen ein kausales Verhältnis vermutet wird Die Faktorenanalyse Zielsetzung Datenreduktion: eine größere Anzahl von Variablen auf eine kleinere Anzahl unabhängiger Einflussgrößen zurückführen Grundlegende Idee Direkt beobachtbare Variablen spiegeln

Mehr

Statistische Versuchsplanung und Optimierung

Statistische Versuchsplanung und Optimierung und Optimierung Ziel: Anwendung der statistischen Versuchsplanung zur Optimierung von Analysenverfahren bzw. chemischen Prozessen Betreuer: Dipl.-Chem. Gisa Baumbach IAAC, Lehrbereich Umweltanalytik Lessingstr.8,

Mehr

Multivariate Diskriminanzanalyse

Multivariate Diskriminanzanalyse Zie: Anwendung der mutivariaten Diskriminanzanayse Betreuer: Dipomchemikerin Kristin Schaefer IAAC, Lehrbereich Umwetanaytik Lessingstraße 8, Raum 324 Te.: (9) 4 8 93 E-Mai: k.schaefer@uni-jena.de Seite

Mehr

Principal Component Analysis (PCA) (aka Hauptkomponentenanalyse)

Principal Component Analysis (PCA) (aka Hauptkomponentenanalyse) Principal Component Analysis (PCA) (aka Hauptkomponentenanalyse) Seminar für Statistik Markus Kalisch 25.11.2014 1 Unsupervised Learning Supervised Learning: Erkläre Zielgrösse durch erklärende Variablen

Mehr

Die Rücktransformation: Z = A t (Y µ) = Y = AZ + µ

Die Rücktransformation: Z = A t (Y µ) = Y = AZ + µ Die Rücktransformation: Z = A t (Y µ) = Y = AZ + µ Kleine Eigenwerte oder Eigenwerte gleich Null: k Eigenwerte Null = Rang(Σ) = m k Eigenwerte fast Null = Hauptkomponenten beinahe konstant Beschränkung

Mehr

Lösung zu Kapitel 11: Beispiel 2

Lösung zu Kapitel 11: Beispiel 2 Lösung zu Kapitel 11: Beispiel 2 Die Daten beziehen sich auf 48 Bewerbungen um eine Position in einem Unternehmen. Diese Bewerbungen wurden anhand von 15 Variablen bewertet (Datenfile: bewerbung.csv).

Mehr

Statistische Methoden in der Wirtschaftsund Sozialgeographie

Statistische Methoden in der Wirtschaftsund Sozialgeographie Statistische Methoden in der Wirtschaftsund Sozialgeographie Ort: Zeit: Multimediapool Rechenzentrum Mittwoch 0.5--45 Uhr Material: http://www.geomodellierung.de Thema: Beschreibung und Analyse Wirtschafts-

Mehr

Multivariate Verfahren

Multivariate Verfahren Multivariate Verfahren Oliver Muthmann 31. Mai 2007 Gliederung 1 Einführung 2 Varianzanalyse (MANOVA) 3 Regressionsanalyse 4 Faktorenanalyse Hauptkomponentenanalyse 5 Clusteranalyse 6 Zusammenfassung Komplexe

Mehr

Selbstständiges Lernen

Selbstständiges Lernen Kapitel 5 Spezialvorlesung Modul 10-202-2206 (Fortgeschrittene Methoden in der Bioinformatik) Jana Hertel Professur für Bioinformatik Institut für Informatik Universität Leipzig Machine learning in bioinformatics

Mehr

Zur Erklärung menschlicher Verhaltensweisen oder allgemeiner sozialer Phänomene ist häufig eine Vielzahl von Einflussfaktoren zu berücksichtigen.

Zur Erklärung menschlicher Verhaltensweisen oder allgemeiner sozialer Phänomene ist häufig eine Vielzahl von Einflussfaktoren zu berücksichtigen. 4.3 Faktorenanalyse Problemstellung Zur Erklärung menschlicher Verhaltensweisen oder allgemeiner sozialer Phänomene ist häufig eine Vielzahl von Einflussfaktoren zu berücksichtigen. Je größer jedoch die

Mehr

5.Tutorium Multivariate Verfahren

5.Tutorium Multivariate Verfahren 5.Tutorium Multivariate Verfahren - Hauptkomponentenanalyse - Nicole Schüller: 27.06.2016 und 04.07.2016 Hannah Busen: 28.06.2016 und 05.07.2016 Institut für Statistik, LMU München 1 / 18 Gliederung 1

Mehr

Einer Reihe von Merkmalen zugrunde liegende, gemeinsame Faktoren ermitteln.

Einer Reihe von Merkmalen zugrunde liegende, gemeinsame Faktoren ermitteln. Faktoranalysen Aufbau 1. Sinn und Zweck 2. Eigenschaften der Merkmale 3. Extraktion der Faktoren 4. Anzahl der Faktoren 5. Rotation der Faktoren 6. Interpretation der Faktoren Sinn und Zweck Einer Reihe

Mehr

Partial-Least-Square PLS und Kennzahl VIP

Partial-Least-Square PLS und Kennzahl VIP Voraussetzung und verwandte hemen Für diese Beschreibungen sind Grundlagen der Statistik vorteilhaft. Weiterführende und verwandte hemen sind: www.versuchsmethoden.de/multiple_regression.pdf www.versuchsmethoden.de/hauptkomponentenanalyse.pdf

Mehr

Klausur zur Vorlesung Analyse mehrdimensionaler Daten, Lösungen WS 2010/2011; 6 Kreditpunkte, 90 min

Klausur zur Vorlesung Analyse mehrdimensionaler Daten, Lösungen WS 2010/2011; 6 Kreditpunkte, 90 min Klausur, Analyse mehrdimensionaler Daten, WS 2010/2011, 6 Kreditpunkte, 90 min 1 Prof. Dr. Fred Böker 21.02.2011 Klausur zur Vorlesung Analyse mehrdimensionaler Daten, Lösungen WS 2010/2011; 6 Kreditpunkte,

Mehr

Nichtmetrische multidimensionale Skalierung (NMDS) Dr. Heike Culmsee Vegetationsanalyse & Phytodiversität

Nichtmetrische multidimensionale Skalierung (NMDS) Dr. Heike Culmsee Vegetationsanalyse & Phytodiversität Nichtmetrische multidimensionale Skalierung (NMDS) Dr. Heike Culmsee Vegetationsanalyse & Phytodiversität Übersicht Ordinationsverfahren Linear methods Weighted averaging Multidimensional scaling Unconstrained

Mehr

Lösung zu Kapitel 11: Beispiel 1

Lösung zu Kapitel 11: Beispiel 1 Lösung zu Kapitel 11: Beispiel 1 Eine Untersuchung bei 253 Personen zur Kundenzufriedenheit mit einer Einzelhandelskette im Südosten der USA enthält Variablen mit sozialstatistischen Daten der befragten

Mehr

Schnelle Diskriminanzanalyse mit vielen Variablen

Schnelle Diskriminanzanalyse mit vielen Variablen Schnelle Diskriminanzanalyse mit vielen Variablen Bernd Heinen SAS Institute GmbH In der Neckarhelle 162 Heidelberg Bernd.heinen@jmp.com Zusammenfassung Diskriminanzanalyse erfordert die Schätzung der

Mehr

Klassifikation und Ähnlichkeitssuche

Klassifikation und Ähnlichkeitssuche Klassifikation und Ähnlichkeitssuche Vorlesung XIII Allgemeines Ziel Rationale Zusammenfassung von Molekülen in Gruppen auf der Basis bestimmter Eigenschaften Auswahl von repräsentativen Molekülen Strukturell

Mehr

Multivariate Statistische Methoden

Multivariate Statistische Methoden Multivariate Statistische Methoden und ihre Anwendung in den Wirtschafts- und Sozialwissenschaften Von Prof. Dr. Hans Peter Litz Carl von Ossietzky Universität Oldenburg v..v.-'... ':,. -X V R.Oldenbourg

Mehr

Lineare Algebra und Datenwissenschaften in Ingenieur- und Informatikstudiengängen

Lineare Algebra und Datenwissenschaften in Ingenieur- und Informatikstudiengängen Lineare Algebra und Datenwissenschaften in Ingenieur- und Informatikstudiengängen Heiko Knospe Technische Hochschule Köln heiko.knospe@th-koeln.de 6. September 26 / 2 Einleitung Das Management und die

Mehr

Übung zum Projektseminar Wetterlagen und Feinstaub

Übung zum Projektseminar Wetterlagen und Feinstaub Universität Augsburg Fakultät für Angewandte Informatik Institut für Physische Geographie und Quantitative Methoden Prof. Dr. Jucundus Jacobeit Übung zum Projektseminar Wetterlagen und Feinstaub Montag

Mehr

Multivariate Statistische Methoden und ihre Anwendung

Multivariate Statistische Methoden und ihre Anwendung Multivariate Statistische Methoden und ihre Anwendung in den Wirtschafts- und Sozialwissenschaften Von Prof. Dr. Hans Peter Litz Carl von Ossietzky Universität Oldenburg R. Oldenbourg Verlag München Wien

Mehr

Grundzüge der Faktorenanalyse

Grundzüge der Faktorenanalyse SEITE Grundzüge der Faktorenanalyse Bei der Faktorenanalyse handelt es sich um ein Verfahren, mehrere Variablen durch möglichst wenige gemeinsame, hinter ihnen stehende Faktoren zu beschreiben. Beispiel:

Mehr

Vergleich von Partial Cox Regression und Lasso zur Analyse von U berlebenszeiten bei hochdimensionalen Daten

Vergleich von Partial Cox Regression und Lasso zur Analyse von U berlebenszeiten bei hochdimensionalen Daten Vergleich von Partial Cox Regression und Lasso zur Analyse von U berlebenszeiten bei hochdimensionalen Daten Claudia-Martina Messow Robertson Centre for Biostatistics, University of Glasgow Situation Methoden

Mehr

Einführung in die Hauptkomponentenanalyse und Faktorenanalyse mit SPSS. Datenanalyse HS09 Susan Kriete Dodds 18. November 2009

Einführung in die Hauptkomponentenanalyse und Faktorenanalyse mit SPSS. Datenanalyse HS09 Susan Kriete Dodds 18. November 2009 Einführung in die Hauptkomponentenanalyse und Faktorenanalyse mit SPSS Datenanalyse HS09 Susan Kriete Dodds 18. November 2009 Hauptkomponentenanalyse Öffne die Datei Kamera.csv Analysieren > Dimensionsreduzierung

Mehr

Konfirmatorische Faktorenanalyse. Regressionsmodelle für Politikwissenschaftler

Konfirmatorische Faktorenanalyse. Regressionsmodelle für Politikwissenschaftler Konfirmatorische Faktorenanalyse Regressionsmodelle für Politikwissenschaftler Was ist ein Faktor? Faktor oder latente Variable Regressionsmodelle für Politikwissenschaftler Konfirmatorische Faktorenanalyse

Mehr

Graphisch gestützte Datenanalyse

Graphisch gestützte Datenanalyse Graphisch gestützte Datenanalyse Von Dr. Rainer Schnell R. Oldenbourg Verlag München Wien Inhalt 1 Grundprinzipien graphischer Datenanalyse 1 1.1 Ablauf einer graphisch gestützten Datenanalyse 2 1.2 Datenanalyseplots

Mehr

Konfirmatorische Faktorenanalyse

Konfirmatorische Faktorenanalyse Konfirmatorische Faktorenanalyse Regressionsmodelle für Politikwissenschaftler Was ist ein Faktor? Faktor oder latente Variable nicht direkt beobachtbare Größe die beobachtbare Variablen ( Indikatoren

Mehr

Konzepte II. Netzwerkanalyse für Politikwissenschaftler

Konzepte II. Netzwerkanalyse für Politikwissenschaftler Konzepte II Netzwerkanalyse für Politikwissenschaftler Wiederholung Räumliche Distanzen und MDS Hauptkomponenten Neuere Entwicklungen Netzwerkanalyse für Politikwissenschaftler Konzepte II (1/20) Worum

Mehr

Klausurvorbereitung Multivariate Statistik

Klausurvorbereitung Multivariate Statistik Klausurvorbereitung Multivariate Statistik Aufgabe 1 (15 Punkte) Daten der Erdbeerernte für 20 Betriebe werden untersucht. Angegeben werden die Variablen Größe, Sonne und Ertrag, die die Gröÿe des Anbaugebietes

Mehr

Principal Component Analysis (PCA)

Principal Component Analysis (PCA) Principal Component Analysis (PCA) Motivation: Klassifikation mit der PCA Berechnung der Hauptkomponenten Theoretische Hintergründe Anwendungsbeispiel: Klassifikation von Gesichtern Weiterführende Bemerkungen

Mehr

Hauptkomponentenanalyse. Die Schritte bei einer Hauptkomponentenanalyse

Hauptkomponentenanalyse. Die Schritte bei einer Hauptkomponentenanalyse Die Schritte bei einer FACTOR /VARIABLES f06_r f06_r f06_r f06_4r f06_5r f06_6r f06_7r f06_8r f06_9r f06_0r /MISSING LISTWISE /ANALYSIS f06_r f06_r f06_r f06_4r f06_5r f06_6r f06_7r f06_8r f06_9r f06_0r

Mehr

Eigene MC-Fragen Kap. 4 Faktorenanalyse, Aggregation, Normierung. 1. Welche Aussage zu den Prinzipien der Faktorenanalyse ist zutreffend?

Eigene MC-Fragen Kap. 4 Faktorenanalyse, Aggregation, Normierung. 1. Welche Aussage zu den Prinzipien der Faktorenanalyse ist zutreffend? Eigene MC-Fragen Kap. 4 Faktorenanalyse, Aggregation, Normierung 1. Welche Aussage zu den Prinzipien der Faktorenanalyse ist zutreffend? a) Die Faktorenanalyse hat ihren Ursprung in der theoretischen Intelligenzforschung.

Mehr

Lösungen zu Janssen/Laatz, Statistische Datenanalyse mit SPSS 1

Lösungen zu Janssen/Laatz, Statistische Datenanalyse mit SPSS 1 LÖSUNG 13 a) Lösungen zu Janssen/Laatz, Statistische Datenanalyse mit SPSS 1 Die Variablen sollten hoch miteinander korrelieren. Deshalb sollten die einfachen Korrelationskoeffizienten hoch ausfallen.

Mehr

Modulklausur Multivariate Verfahren

Modulklausur Multivariate Verfahren Name, Vorname Matrikelnummer Modulklausur 31821 Multivariate Verfahren Datum Punkte Note Termin: 28. März 2014, 9.00-11.00 Uhr Erstprüfer: Univ.-Prof. Dr. H. Singer Hinweise zur Bearbeitung der Modulklausur

Mehr

Aufgaben zur Multivariaten Statistik

Aufgaben zur Multivariaten Statistik Prof. Dr. Reinhold Kosfeld Fachbereich Wirtschaftswissenschaften Universität Kassel Aufgaben zur Multivariaten Statistik Teil : Aufgaben zur Einleitung. Was versteht man unter einer univariaten, bivariaten

Mehr

Statistikpraktikum. Carsten Rezny. Sommersemester Institut für angewandte Mathematik Universität Bonn

Statistikpraktikum. Carsten Rezny. Sommersemester Institut für angewandte Mathematik Universität Bonn Statistikpraktikum Carsten Rezny Institut für angewandte Mathematik Universität Bonn Sommersemester 2014 Mehrdimensionale Datensätze: Multivariate Statistik Multivariate Statistik Mehrdimensionale Datensätze:

Mehr

Multivariate Lineare Modelle SS Einführung. 1. Organisation. 2. Übersicht. 3. Arbeiten mit SAS

Multivariate Lineare Modelle SS Einführung. 1. Organisation. 2. Übersicht. 3. Arbeiten mit SAS Multivariate Lineare Modelle SS 2009 0 Einführung 1. Organisation 2. Übersicht 3. Arbeiten mit SAS 1 0.1 Organisation Lehrziele: Theorie von multivariaten linearen Modellen Praktische Anwendung mit SAS

Mehr

13 Dimensionsreduktion

13 Dimensionsreduktion 13 Dimensionsreduktion 13.0 Dimensionsreduktion Dimensionsreduktion 13 Dimensionsreduktion (aus: C. Weihs und J. Jessenberger (1998): Statistische Methoden zur Qualitätssicherung und -optimierung in der

Mehr

6-Variablen-Fall. Dipl.-Ök. John Yun Bergische Universität Wuppertal Gaußstraße Wuppertal

6-Variablen-Fall. Dipl.-Ök. John Yun Bergische Universität Wuppertal Gaußstraße Wuppertal Dipl.-Ök. John Yun Bergische Universität Wuppertal Gaußstraße 20 42097 Wuppertal Allgemein 6 Konstrukte: - Preisorientierung (6 Items) - Werbeakzeptanz (6 Items) - Qualitätsbewusstsein (6 Items) - Trendbewusstsein

Mehr

Statistische Datenanalyse

Statistische Datenanalyse Werner A. Stahel Statistische Datenanalyse Eine Einführung für Naturwissenschaftler 3., durchgesehene Auflage vieweg VII 1 Einleitung 1 1.1 Was ist Statistische Datenanalyse? 1 1.2 Ziele 6 1.3 Hinweise

Mehr

6-Variablen-Fall. Dipl.-Ök. John Yun Bergische Universität Wuppertal Gaußstraße Wuppertal

6-Variablen-Fall. Dipl.-Ök. John Yun Bergische Universität Wuppertal Gaußstraße Wuppertal Dipl.-Ök. John Yun Bergische Universität Wuppertal Gaußstraße 20 42097 Wuppertal Allgemein 6 Konstrukte: - soziale Kontakte (6 Items) - Markenbewusstsein (6 Items) - Werbeakzeptanz (6 Items) - materielle

Mehr

Musterlösung. Modulklausur Multivariate Verfahren

Musterlösung. Modulklausur Multivariate Verfahren Musterlösung Modulklausur 31821 Multivariate Verfahren 27. März 2015 Aufgabe 1 Kennzeichnen Sie die folgenden Aussagen über die beiden Zufallsvektoren ([ ] [ ]) ([ ] [ ]) 2 1 0 1 25 2 x 1 N, x 3 0 1 2

Mehr

Prof. Dr. Fred Böker

Prof. Dr. Fred Böker Statistik III WS 2004/2005; 8. Übungsblatt: Lösungen 1 Prof. Dr. Fred Böker 07.12.2004 Lösungen zum 8. Übungsblatt Aufgabe 1 Die Zufallsvariablen X 1 X 2 besitzen eine gemeinsame bivariate Normalverteilung

Mehr

Skript Einführung in SPSS

Skript Einführung in SPSS SPSSinteraktiv Faktorenanalyse - 1 - Skript Einführung in SPSS Faktorenanalyse Explorative Faktorenanalyse Hauptkomponentenanalyse (PCA) Hinweise zum Schreiben des statistischen Reports 1. Sämtliche Tabellen

Mehr

Multivariate Verfahren

Multivariate Verfahren Multivariate Verfahren Lineare Regression Zweck: Vorhersage x Dimensionsreduktion x x Klassifizierung x x Hauptkomponentenanalyse Korrespondenzanalyse Clusteranalyse Diskriminanzanalyse Eigenschaften:

Mehr

Konzepte II. Netzwerkanalyse für Politikwissenschaftler. Wiederholung

Konzepte II. Netzwerkanalyse für Politikwissenschaftler. Wiederholung Konzepte II Netzwerkanalyse für Politikwissenschaftler Netzwerkanalyse für Politikwissenschaftler Konzepte II (1/20) Worum geht es? Bisher: Eigenschaften einzelner Punkte bzw. des Netzwerkes Definiert

Mehr

Statistik II: Klassifikation und Segmentierung

Statistik II: Klassifikation und Segmentierung Medien Institut : Klassifikation und Segmentierung Dr. Andreas Vlašić Medien Institut (0621) 52 67 44 vlasic@medien-institut.de Gliederung 1. Faktorenanalyse 2. Clusteranalyse 3. Key Facts 2 I 14 Ziel

Mehr

Faktorenanalyse. Fakultät für Human und Sozialwissenschaften Professur für Forschungsmethodik und Evaluation in der Psychologie

Faktorenanalyse. Fakultät für Human und Sozialwissenschaften Professur für Forschungsmethodik und Evaluation in der Psychologie Faktorenanalyse Fakultät für Human und Sozialwissenschaften Professur für Forschungsmethodik und Evaluation in der Psychologie Seminar: Multivariate Analysemethoden Seminarleiter: Dr. Thomas Schäfer Referenten:

Mehr

Lehrinhalte Statistik (Sozialwissenschaften)

Lehrinhalte Statistik (Sozialwissenschaften) Lehrinhalte Technische Universität Dresden Institut für Mathematische Stochastik Dresden, 13. November 2007 Seit 2004 Vorlesungen durch Klaus Th. Hess und Hans Otfried Müller. Statistik I: Beschreibende

Mehr

Clusteranalyse. Anwendungsorientierte Einführung. R. Oldenbourg Verlag München Wien. Von Dr. Johann Bacher

Clusteranalyse. Anwendungsorientierte Einführung. R. Oldenbourg Verlag München Wien. Von Dr. Johann Bacher Clusteranalyse Anwendungsorientierte Einführung Von Dr. Johann Bacher R. Oldenbourg Verlag München Wien INHALTSVERZEICHNIS Vorwort XI 1 Einleitung 1 1.1 Primäre Zielsetzung clusteranalytischer Verfahren

Mehr

Lösungen zu Janssen/Laatz, Statistische Datenanalyse mit SPSS 1. LÖSUNG 13 a.

Lösungen zu Janssen/Laatz, Statistische Datenanalyse mit SPSS 1. LÖSUNG 13 a. Lösungen zu Janssen/Laatz, Statistische Datenanalyse mit SPSS 1 LÖSUNG 13 a. Die Variablen sollten hoch miteinander korrelieren. Deshalb sollten die einfachen Korrelationskoeffizienten hoch ausfallen.

Mehr

Mustererkennung. Merkmalsreduktion. R. Neubecker, WS 2016 / Übersicht

Mustererkennung. Merkmalsreduktion. R. Neubecker, WS 2016 / Übersicht Mustererkennung Merkmalsreduktion R. Neubecker, WS 2016 / 2017 Übersicht 2 Merkmale Principal Component Analysis: Konzept Mathematische Formulierung Anwendung Eigengesichter 1 Merkmale 3 (Zu) Viele Merkmale

Mehr

6.1 Definition der multivariaten Normalverteilung

6.1 Definition der multivariaten Normalverteilung Kapitel 6 Die multivariate Normalverteilung Wir hatten die multivariate Normalverteilung bereits in Abschnitt 2.3 kurz eingeführt. Wir werden sie jetzt etwas gründlicher behandeln, da die Schätzung ihrer

Mehr

9. November Ruhr-Universität Bochum. Methodenlehre III, WS 2009/2010. Prof. Dr. Holger Dette. Matrizenrechnung. 2. Multiple Korrelationen

9. November Ruhr-Universität Bochum. Methodenlehre III, WS 2009/2010. Prof. Dr. Holger Dette. Matrizenrechnung. 2. Multiple Korrelationen Ruhr-Universität Bochum 9. November 2009 1 / 62 Methodenlehre III NA 3/73 Telefon: 0234 322 8284 Email: holger.dette@rub.de Internet: www.ruhr-uni-bochum.de/mathematik3/index.html Vorlesung: Montag, 8.30-10.00

Mehr

So lösen Sie das multivariate lineare Regressionsproblem von Christian Herta

So lösen Sie das multivariate lineare Regressionsproblem von Christian Herta Multivariate Lineare Regression Christian Herta Oktober, 2013 1 von 34 Christian Herta Multivariate Lineare Regression Lernziele Multivariate Lineare Regression Konzepte des Maschinellen Lernens: Kostenfunktion

Mehr

13.0 Dimensionsreduktion Dimensionsreduktion. 13 Dimensionsreduktion Hauptkomponentenanalyse Dimensionsreduktion

13.0 Dimensionsreduktion Dimensionsreduktion. 13 Dimensionsreduktion Hauptkomponentenanalyse Dimensionsreduktion 13 Dimensionsreduktion 13.0 Dimensionsreduktion Dimensionsreduktion 13 Dimensionsreduktion (aus: C. Weihs und J. Jessenberger (1998): Statistische Methoden zur Qualitätssicherung und -optimierung in der

Mehr

13.1 Hauptkomponentenanalyse. 13 Dimensionsreduktion Hauptkomponentenanalyse Hauptkomponentenanalyse

13.1 Hauptkomponentenanalyse. 13 Dimensionsreduktion Hauptkomponentenanalyse Hauptkomponentenanalyse 13.0 Dimensionsreduktion Dimensionsreduktion (aus: C. Weihs und J. Jessenberger (1998): Statistische Methoden zur Qualitätssicherung und -optimierung in der Industrie; Wiley-VCH, Weinheim, 141 161) Jetzt

Mehr

Wahrscheinlichkeitsrechnung und Statistik für Biologen Diskriminanzanalyse

Wahrscheinlichkeitsrechnung und Statistik für Biologen Diskriminanzanalyse Wahrscheinlichkeitsrechnung und Statistik für Biologen Diskriminanzanalyse Martin Hutzenthaler & Dirk Metzler http://evol.bio.lmu.de/_statgen 6. Juli 2010 Übersicht 1 Ruf des Kleinspechts 2 Modell Vorgehen

Mehr

Veranschaulichung: Einführung in die Faktorenanalyse mit SAS. 1. Faktorenanalyse: Wie? Inhalt. 1. Faktorenanalyse: Wozu?

Veranschaulichung: Einführung in die Faktorenanalyse mit SAS. 1. Faktorenanalyse: Wie? Inhalt. 1. Faktorenanalyse: Wozu? Einführung in die Faktorenanalyse mit SAS Benutzertreffen am URZ Christoph Witzel 6. Juni 2003 1. Faktorenanalyse: Wozu? Veranschaulichung: Variablen seien: Wie oft Personen Fußball spielen, Rad fahren,

Mehr

y = b 0 + b 1 x 1 x 1 ε 1. ε n b + b 1 1 x n 2) Hat die Größe x einen Einfluss auf y, d.h. gilt die Hypothese: H : b 1 = 0

y = b 0 + b 1 x 1 x 1 ε 1. ε n b + b 1 1 x n 2) Hat die Größe x einen Einfluss auf y, d.h. gilt die Hypothese: H : b 1 = 0 8 Lineare Modelle In diesem Abschnitt betrachten wir eine spezielle Klasse von statistischen Modellen, in denen die Parameter linear auftauchen Wir beginnen mit zwei Beispielen Beispiel 8 (lineare Regression)

Mehr

Multivariate Verteilungen. Gerhard Tutz LMU München

Multivariate Verteilungen. Gerhard Tutz LMU München Multivariate Verteilungen Gerhard Tutz LMU München INHALTSVERZEICHNIS 1 Inhaltsverzeichnis 1 Multivariate Normalverteilung 3 Wishart Verteilung 7 3 Hotellings T Verteilung 11 4 Wilks Λ 14 INHALTSVERZEICHNIS

Mehr

Multivariate Statistik

Multivariate Statistik Multivariate Statistik Lehr- und Handbuch der angewandten Statistik Von o. Prof. Dr. Joachim Härtung Fachbereich Statistik der Universität Dortmund und Dr. Bärbel Elpelt mit 138 Abbildungen und zahlreichen

Mehr

Wahrscheinlichkeitsrechnung und Statistik

Wahrscheinlichkeitsrechnung und Statistik 9. Vorlesung - 2017 Monte Carlo Methode für numerische Integration Sei g : [0, 1] R stetige Funktion; man möchte 1 0 g(t)dt numerisch approximieren mit Hilfe von Zufallszahlen: Sei (U n ) n eine Folge

Mehr

Anwendungen mit SAS: Direkt aus der Praxis! Block 3

Anwendungen mit SAS: Direkt aus der Praxis! Block 3 Anwendungen mit SAS: Direkt aus der Praxis! Block 3 Supervised Learning - Die Logistische Regression Fachhochschule Koblenz Fachbereich Mathematik und Technik Dr. Denise Rey 30. Januar 2009 1 Inhalt 1.

Mehr

GHF SoSe 2011 HS MD-SDL

GHF SoSe 2011 HS MD-SDL GHF SoSe 2011 HS MD-SDL 6/28/2011 1 Bitte recherchieren Sie die verschiedenen Bestimmungsstücke des Validitätskonzepts Bitte überlegen Sie sich Strategien zur Prüfung dieser verschiedenen Bestimmungsstücke

Mehr

1 Übungsaufgaben zur Regressionsanalyse

1 Übungsaufgaben zur Regressionsanalyse 1 Übungsaufgaben zur Regressionsanalyse 1 1 Übungsaufgaben zur Regressionsanalyse 1.1 Übungsaufgaben zu Seite 1 und 2 1. Wie lautet die Regressionsfunktion? 2. Welche Absatzmenge ist im Durchschnitt bei

Mehr

Mod. 2 p. 1. Prof. Dr. Christoph Kleinn Institut für Waldinventur und Waldwachstum Arbeitsbereich Fernerkundung und Waldinventur

Mod. 2 p. 1. Prof. Dr. Christoph Kleinn Institut für Waldinventur und Waldwachstum Arbeitsbereich Fernerkundung und Waldinventur Histogramme der Grauwerte der TM Kanäle 1-7 für das Beispielsbild. - Kanäle 4 und 5 zeigen mehr Differenzierung als die anderen (Kontrast=das Verhältnis der hellsten zur dunkelsten Fläche in der Landschaft).

Mehr

1. Referenzpunkt Transformation

1. Referenzpunkt Transformation 2.3 Featurereduktion Idee: Anstatt Features einfach wegzulassen, generiere einen neuen niedrigdimensionalen Featureraum aus allen Features: Redundante Features können zusammengefasst werden Irrelevantere

Mehr

Faktorenanalyse und Hauptkomponentenanalyse

Faktorenanalyse und Hauptkomponentenanalyse Faktorenanalyse und Hauptkomponentenanalyse Man habe n Personen auf m Variablen untersucht Insbesondere habe man: n Personen Index i m Variablen Index j r Faktoren Index l Die Faktoren sind latente Variablen,

Mehr

Hauptkomponentenanalyse PCA

Hauptkomponentenanalyse PCA Hauptkoponentenanalyse PCA Die Hauptkoponentenanalyse (Principal Coponent Analysis, PCA) ist eine Methode zur linearen Transforation der Variablen, so dass: öglichst wenige neue Variablen die relevante

Mehr

Sparse Hauptkomponentenanalyse

Sparse Hauptkomponentenanalyse Sparse Referent: Thomas Klein-Heßling LMU München 20. Januar 2017 1 / 36 1 Einführung 2 3 4 5 2 / 36 Einführung Ziel: vorhandene Datenmenge verstehen Daten komprimieren Bei der Sparse (SPCA) handelt es

Mehr

Inhaltsverzeichnis. Bibliografische Informationen digitalisiert durch

Inhaltsverzeichnis. Bibliografische Informationen   digitalisiert durch Grundlagen 1 1.1 Einleitung 1 1.2 Grundbegriffe 2 1.2.1 Systemgrenzen 3 1.2.2 Qualitätsmerkmal 4 1.2.3 Parameter und Faktoren 5 1.2.4 Stufen 6 1.2.5 Vergleich zu traditionellen Verfahren 6 1.3 Auswertung

Mehr

Lineare Transformationen und Determinanten. 10-E Ma 1 Lubov Vassilevskaya

Lineare Transformationen und Determinanten. 10-E Ma 1 Lubov Vassilevskaya Lineare Transformationen und Determinanten 10-E Ma 1 Lubov Vassilevskaya Lineare Transformation cc Definition: V und W sind zwei Vektorräume. Eine Funktion T nennt man eine lineare Transformation von V

Mehr

11. Übungsblatt zur Vorlesung Ökonometrie SS 2014

11. Übungsblatt zur Vorlesung Ökonometrie SS 2014 Universität des Saarlandes Lehrstab Statistik Dr. Martin Becker Dipl.-Kfm. Andreas Recktenwald 11. Übungsblatt zur Vorlesung Ökonometrie SS 2014 Aufgabe 45 Die in Aufgabe 43 getroffene Annahme heteroskedastischer

Mehr

Faktorenanalysen mit SPSS. Explorative Faktorenanalyse als Instrument der Dimensionsreduzierung. Interpretation des SPSS-Output s

Faktorenanalysen mit SPSS. Explorative Faktorenanalyse als Instrument der Dimensionsreduzierung. Interpretation des SPSS-Output s Explorative Faktorenanalyse als Instrument der Dimensionsreduzierung Beispiel: Welche Dimensionen charakterisieren die Beurteilung des sozialen Klimas in der Nachbarschaft? Variablen: q27a bis q27g im

Mehr

Angewandte Statistik mit R. Eine Einführung für Ökonomen und

Angewandte Statistik mit R. Eine Einführung für Ökonomen und Reiner Hellbrück Angewandte Statistik mit R Eine Einführung für Ökonomen und Sozialwissenschaftler 3. Auflage Springer Gabler Inhaltsverzeichnis Vorwort zur dritten Auflage Vorwort zur ersten Auflage Vorwort

Mehr

Holger Dette. 30. Oktober 2015

Holger Dette. 30. Oktober 2015 Ruhr-Universität Bochum 30. Oktober 2015 1 / 1 Methodenlehre III Prof. Dr. NA 3/73 Telefon: 0234 32 28284 Email: holger.dette@rub.de Internet: www.ruhr-uni-bochum.de/mathematik3/index.html Vorlesung: Montag,

Mehr

Trim Size: 176mm x 240mm Lipow ftoc.tex V1 - March 9, :34 P.M. Page 11. Über die Übersetzerin 9. Einleitung 19

Trim Size: 176mm x 240mm Lipow ftoc.tex V1 - March 9, :34 P.M. Page 11. Über die Übersetzerin 9. Einleitung 19 Trim Size: 176mm x 240mm Lipow ftoc.tex V1 - March 9, 2016 6:34 P.M. Page 11 Inhaltsverzeichnis Über die Übersetzerin 9 Einleitung 19 Was Sie hier finden werden 19 Wie dieses Arbeitsbuch aufgebaut ist

Mehr

Statistik-Quiz Sommersemester

Statistik-Quiz Sommersemester Statistik-Quiz Sommersemester Seite 1 von 8 Statistik-Quiz Sommersemester Die richtigen Lösungen sind mit gekennzeichnet. 1 In einer Gruppe von 337 Probandinnen und Probanden wurden verschiedene Merkmale

Mehr

Inhaltsverzeichnis 1. EINLEITUNG...1

Inhaltsverzeichnis 1. EINLEITUNG...1 VII Inhaltsverzeichnis Vorwort...V Verzeichnis der Abbildungen...XII Verzeichnis der Tabellen... XVI Verzeichnis der Übersichten...XXII Symbolverzeichnis... XXIII 1. EINLEITUNG...1 2. FAKTORENANALYSE...5

Mehr

Optimierung der Variablen-Selektion für die PLS-Regression

Optimierung der Variablen-Selektion für die PLS-Regression Optimierung der Variablen-Selektion für die PLS-Regression Michael Judas Stefaan De Smet Institut für Sicherheit und Qualität bei Fleisch, MRI Standort Kulmbach Laboratory for Animal Nutrition and Animal

Mehr

Herleitung der Hauptkomponenten: Y t = (Y 1,..., Y m ) Erwartung:µ Kovarianz:Σ. Z j = a 1j Y 1 + a 2j Y a mj Y m = a t j Y

Herleitung der Hauptkomponenten: Y t = (Y 1,..., Y m ) Erwartung:µ Kovarianz:Σ. Z j = a 1j Y 1 + a 2j Y a mj Y m = a t j Y Herleitung der Hauptkomponenten: Y t = (Y 1,..., Y m ) Erwartung:µ Kovarianz:Σ Z j = a 1j Y 1 + a 2j Y 2 +... + a mj Y m = a t j Y a t j = (a 1j, a 2j,..., a mj ) Z 1, Z 2,...,Z m unkorreliert Varianzen

Mehr

Universität Potsdam Institut für Informatik Lehrstuhl Maschinelles Lernen. Sparse PCA. Tobias Scheffer Michael Großhans Paul Prasse Uwe Dick

Universität Potsdam Institut für Informatik Lehrstuhl Maschinelles Lernen. Sparse PCA. Tobias Scheffer Michael Großhans Paul Prasse Uwe Dick Universität Potsdam Institut für Informatik Lehrstuhl Maschinelles Lernen Sparse PCA obias Scheffer Michael Großhans Paul Prasse Uwe Dick Vektorraummodell Jedes Dokument wird als Vektor dargestellt, beispielsweise

Mehr