Faktoren- und Hauptkomponentenanalyse
|
|
- Achim Hausler
- vor 5 Jahren
- Abrufe
Transkript
1 Ziel: Anwendung von Verfahren der Dimensionsreduzierung Graphische Methoden zur Darstellung der Erkennen von Strukturen in Daten an ausgewählten Anwendungsbeispielen Betreuer: Dr. Jörg Kraft IAAC, Lehrbereich Umweltanalytik Lessingstraße 8, Raum 324 Tel.: (9) Grundlagen: Dimensionsreduzierung von Datensätzen: PCA Das Ziel der Hauptkomponentenanalyse (principal component analysis, PCA) ist es eine Vielzahl von Variablen (=Dimensionen) auf einige wenige Komponenten ( latente Variablen, Faktoren) zu reduzieren. Dies entspricht einer dimensionsreduzierenden Transformation. Mit Hilfe der PCA werden aus der Korrelations- oder Kovarianzmatrix sogenannte Hauptkomponenten (principal components, PC) extrahiert, die unkorreliert (orthogonal) sind und die den Informationsgehalt der ursprünglichen Matrix weitgehend reproduzieren können. Die Hauptkomponenten sind Linearkombinationen der ursprünglichen Variablen und werden nacheinander so extrahiert, daß jeweils die maximale verbleibende Varianz der Daten erklärt wird. Je stärker die ursprünglichen Variablen korreliert sind, umso weniger Seite 1 von 7
2 Hauptkomponenten sind notwendig. Die Zahl der Hauptkomponenten wird z.b. mit dem Scree-Plot bestimmt. Als Ergebnis einer PCA erhält man zwei Matrizen, die Matrix der Faktorladungen (loadings), die dem Variablenraum entspricht, und die Matrix der Faktorwerte (scores), die den Objektraum repräsentiert. Diese Matrizen bilden das Datenmaterial für Plots der Faktorwerte (score plot) bzw. -ladungen (plot of loadings), mit denen eine 2- oder 3-dimensionale Projektion der Anordnung der Objekte bzw. Variablen erhalten werden kann. Bei ausreichend repräsentativen Daten und linearen Zusammenhängen können die Hauptkomponenten häufig interpretiert werden. Die Hauptkomponenten können als Basis für weitere Auswertungen dienen, z.b. für die Clusteranalyse, multiple lineare Regression (principal component regression, PCR, vgl. Praktikumsversuch C2) oder als Eingänge eines künstlichen neuronalen Netzes. Einschränkungen und Alternativen Da die PCA auf der Berechnung der Korrelationsmatrix beruht, wird eine annähernd multivariate Normalverteilung der Daten vorausgesetzt. Eine nichtparametrische Alternative zur PCA bildet die Multidimensionale Skalierung (Multidimensional Scaling, MDS, auch als Non-linear Mapping, NLM, bezeichnet). Das Ziel der MDS entspricht dem der PCA, jedoch beruht die Berechnung auf anderen Prinzipien, Bei der MDS werden die Objekte in einem Raum mit einer Zahl von vorher spezifizierten Dimensionen (meist 2 oder 3) so bewegt, daß ein Anpassungsparameter iterativ minimiert wird, der Anpassungsfehler (stress) also möglichst gering wird. Dieser Parameter beruht auf der Rangordnung der Distanzen. Seite 2 von 7
3 Durchführung: 1. Übung Hauptkomponentenanalyse (PCA) von Weindaten Programm: Datensatz: Beschreibung: Factor Analysis Modul von STATISTICA WEINSTD.STA In Weinen aus verschiedenen Anbaugebieten und Rebsorten wurden die anorganischen Spurenbestandteile mittels der ICP- OES bestimmt. Kann man aus dem erhaltenen Elementmuster Hinweise auf das Anbaugebiet oder die Rebsorte des Weins erhalten? Protokollieren Sie die durchgeführten Schritte der Hauptkomponentenanalyse! Tab.: Mit Hilfe von ICP-OES untersuchte Weine (Datensatz WEINSTD.STA) Code Lage Anbaugebiet Rebsorte Jahrgang FS Freyburg/Unstrut Saale-Unstrut Silvaner 1993 FR Freyburg/Unstrut Saale-Unstrut Riesling 1993 FM Freyburg/Unstrut Saale-Unstrut Müller-Thurgau 1993 GW Geisenheim Rheingau Weißburgunder 1993 GR Geisenheim Rheingau Riesling 1993 GS Geisenheim Rheingau Silvaner 1993 BG Blankenhornsberg Baden Gewürztraminer 1993 BS Blankenhornsberg Baden Silvaner 1993 BR Blankenhornsberg Baden Riesling 1993 DR Durbach Baden Riesling 1993 DK Durbach Baden Kerner 1993 DG Durbach Baden Gewürztraminer 1993 NM Nierstein Rheinhessen Müller-Thurgau 1994 NR Nierstein Rheinhessen Riesling 1994 Seite 3 von 7
4 Code Lage Anbaugebiet Rebsorte Jahrgang OS Oppenheim Rheinhessen Silvaner 1994 OM Oppenheim Rheinhessen Müller-Thurgau 1994 OR Oppenheim Rheinhessen Riesling 1994 Die PCA ist (neben der Clusteranalyse, vgl. Praktikumsversuch Clusteranalyse und Display-Methoden) geeignet, um sich einen Überblick über den Datensatz zu verschaffen. Spezifizieren Sie die Variablenliste, d.h. die betrachteten Elementkonzentrationen und starten Sie die Analyse. Es erscheint eine Dialogbox, in der Sie die Anzahl der zu extrahierenden Hauptkomponenten beeinflussen können. Wählen sie zunächst fünf Faktoren und starten Sie die Berechnung der PCA. Im Hinblick auf die Aufgabenstellung sind folgende Punkte interessant: Wieviele Hauptkomponenten sollten extrahiert werden? Hierzu sollten Sie sich den Scree Plot ansehen. Als Scree werden die Ablagerungen bezeichnet, die sich an Steilküsten bilden. Üblicherweise werden nur die Hauptkomponenten extrahiert, die sich im steil abfallenden Teil des Plots befinden, also in diesem Fall drei Hauptkomponenten. Sie brauchen also bei den weiteren Auswertungen und Plots nur die ersten drei Faktoren zu berücksichtigen. 5.0 Scree-Plot Eigenwert Hauptkomponente Zusammenhänge und Einflüsse der Variablen können in einem Faktorladungsplot (plot of loadings) dargestellt werden. Sie können eine 2D- oder 3D-Darstellung erhalten. Der größte Anteil der Varianz wird durch die ersten beiden Seite 4 von 7
5 Hauptkomponenten erklärt, daher bietet sich ein Plot dieser Faktorladungen an. Variablen in der Nähe des Ursprungs (z.b. B) haben nur einen kleinen Einfluß, während z.b. P in Faktor 1 hoch geladen ist. Gruppierungen von Variablen können ähnlich wie bei der Clusteranalyse interpretiert werden. 1.0 Plot der Faktorladungen (PCA) 0.8 FE NA MG SR AL_308 CA ZN_206 MN PC B CU K P -0.2 BA RB V PC 1 Strukturen bei den Objekten können mit Hilfe des Score-Plots (Plot der Faktorwerte) aufgezeigt werden. Dieser Plot kann jedoch nicht direkt abgerufen werden, sondern die Scores müssen zunächst abgespeichert werden (Save factor scores). Zusammen mit den Scores können auch andere Variablen gesichert werden. Hier sollten Sie LAGE, GEBIET und SORTE auswählen. Nachdem sie die Scores gesichert haben, können Sie diese als STATISTICA-Datenfile laden und mit dem Menüpunkt Graphs/Stats Categorized Graphs/Scatterplot einen nach der Variable GEBIET kategorisierten Plot erzeugen (Overlaid). Ebenfalls geeignet ist eine Scatterplotmatrix. Die Weine zeigen eine gute Gruppierung nach dem Gebiet, wobei Rheingau und Rheinhessen etwas überlappen. Mit der Interpreation von Faktoren bzw. Hauptkomponenten sollte man vorsichtig sein. Eine Hypothese wäre, daß Faktor 1 den Einfluß der Sonnenscheindauer repräsentiert, jedoch müßten zur Erhärtung weitere Daten gewonnen werden. Sehen Sie sich auch die Kategorisierung nach der Rebsorte an. Seite 5 von 7
6 Score-Plot WEINSTD.STA PC FR FS FM GS GR NR OM OR GW NM OS BG DK DR DG GEBIET: SaaleUns GEBIET: Rheingau GEBIET: Baden GEBIET: Rheinhes -1.5 BR BS PC1 2. Übung Hauptkomponentenanalyse (PCA) von Olivenöldaten Programm: Factor Analysis Modul von STATISTICA Führen Sie eine Hauptkomponentanalyse für den Datensatz Olivenöle (OLIV_2.STA) durch. Protokollieren Sie Ihre angewendeten Schritte und interpretieren Sie das Ergebnis anhand der Grafiken, bzw. Tabellen. 4 Score-Plot OLIV_2.STA PC REGION: NORTH_AP REGION: CALABRIA REGION: SOUTH_AP REGION: SICILY REGION: INLAND_S REGION: COAST_SA REGION: UMBRIA REGION: EAST_LIG REGION: WEST_LIG PC1 Seite 6 von 7
7 Literatur: Brereton, R.G. (Hrsg.): Multivariate Pattern Recognition in Chemistry. Elsevier, Amsterdam 1992 Smith, G.L.: Principal component analysis: An introduction. Anal. Proc. 28, 150 (1991) Wernecke, K.-D.: Angewandte Statistik für die Praxis. Addison-Wesley, Bonn 1995 Wold, S., Esbensen, K., Geladi, P.: Principal components analysis, Chemometrics. Intell. Lab. Syst. 2, 37 (1987) Einax, J. W., Zwanziger, H. W,, Geiß, S.: Chemometrics in Environmental Analysis. VCH, Weinheim, 1997 Massart D. L., Vandeginste B. G. M., Buydens L. M. C., De Jong S., Lewi P. J., Smeyers-Verbeke J.: Handbook of chemometrics and qualimetrics; data handling in science and technology, Parts A and B, Vols. 20A and 20B. Elsevier, Amsterdam, Seite 7 von 7
Faktoren- und Hauptkomponentenanalyse
Ziel: Anwendung von Verfahren der Dimensionsreduzierung Erkennen von Strukturen in Daten an ausgewählten Anwendungsbeispielen Betreuer: Dipl.-Chem. Stefan Möller IAAC, Lehrbereich Umweltanalytik Lessingstraße
MehrClusteranalyse und Display-Methoden
Ziel: Erkennen von Strukturen in Daten Vergleich der Algorithmen für die Clusteranalyse Beurteilung verschiedener Displaymethoden Stabilitätsdiagramme Betreuer: Dipl.-Chem. Stefan Hesse IAAC, Lehrbereich
MehrStatistik, Datenanalyse und Simulation
Dr. Michael O. Distler distler@kph.uni-mainz.de Mainz, 5. Juli 2011 Zunächst: PCA (Hauptkomponentenanalyse) ist eine mathematische Prozedur, die eine Anzahl von (möglicherweise korrelierten) Variablen
MehrExploratorische Faktorenanalyse. Exploratorische Faktorenanalyse. Exploratorische Faktorenanalyse
Exploratorische Faktorenanalyse Der Begriff Faktorenanalyse umfasst eine Gruppe multivariater Analyseverfahren, mit denen zugrundeliegende gemeinsame Dimensionen von Variablenmengen (z.b. Fragebogenitems)
MehrInhaltsverzeichnis. Vorwort. 1 Einführung in die multivariate Datenanalyse 1
V Inhaltsverzeichnis Vorwort XI 1 Einführung in die multivariate Datenanalyse 1 1.1 Was ist multivariate Datenanalyse? 1 1.2 Datensätze in der multivariaten Datenanalyse 4 1.3 Ziele der multivariaten Datenanalyse
Mehr9 Faktorenanalyse. Wir gehen zunächst von dem folgenden Modell aus (Modell der Hauptkomponentenanalyse): Z = F L T
9 Faktorenanalyse Ziel der Faktorenanalyse ist es, die Anzahl der Variablen auf wenige voneinander unabhängige Faktoren zu reduzieren und dabei möglichst viel an Information zu erhalten. Hier wird davon
Mehr1 Beispiele multivariater Datensätze... 3
Inhaltsverzeichnis Teil I Grundlagen 1 Beispiele multivariater Datensätze... 3 2 Elementare Behandlung der Daten... 15 2.1 Beschreibung und Darstellung univariater Datensätze... 15 2.1.1 Beschreibung und
MehrExplorative Faktorenanalyse
Explorative Faktorenanalyse 1 Einsatz der Faktorenanalyse Verfahren zur Datenreduktion Analyse von Datenstrukturen 2 -Ich finde es langweilig, mich immer mit den selben Leuten zu treffen -In der Beziehung
MehrHauptkomponenten-basierte Klassifikationsverfahren (PCA)
Hauptkomponenten-basierte Klassifikationsverfahren (PCA) Projektseminar: Wetterlagen und Feinstaub - Übung Dozent: Claudia Weitnauer Referent: Esther Oßwald, Julian Dare Datum: 30.05.2011 Übersicht 1 Einleitung
Mehr6. Faktorenanalyse (FA) von Tests
6. Faktorenanalyse (FA) von Tests 1 6. Faktorenanalyse (FA) von Tests 1 6.1. Grundzüge der FA nach der Haupkomponentenmethode (PCA) mit anschliessender VARIMAX-Rotation:... 2 6.2. Die Matrizen der FA...
MehrMultivariate Analysemethoden
Multivariate Analysemethoden 22.10.2007 Günter Meinhardt Johannes Gutenberg Universität Mainz Die Konfiguration von Entitäten definiert ihre wechselseitige Ähnlichkeit. Wechselseitige Ählichkeitsmuster
MehrMultivariate Statistik
Multivariate Statistik von Univ.-Prof. Dr. Rainer Schlittgen Oldenbourg Verlag München I Daten und ihre Beschreibung 1 1 Einführung 3 1.1 Fragestellungen 3 1.2 Datensituation 8 1.3 Literatur und Software
MehrWahrscheinlichkeitsrechnung und Statistik für Biologen Diskriminanzanalyse
Wahrscheinlichkeitsrechnung und Statistik für Biologen Diskriminanzanalyse Noémie Becker & Dirk Metzler http://evol.bio.lmu.de/_statgen 3. Juli 2013 Übersicht 1 Ruf des Kleinspechts 2 Modell Vorgehen der
MehrMETHODENPRAKTIKUM II Kurs 1. Prof. Dr. Beat Fux SUZ Frühlingssemester 2009
METHODENPRAKTIKUM II Kurs 1 Prof. Dr. Beat Fux SUZ Frühlingssemester 2009 Ziel der Faktorenanalyse Struktur hinter den Korrelationen zwischen Variablen entdecken Reduzierung einer Vielzahl von Variablen
MehrDie Faktorenanalyse. Anwendung dann, wenn zwischen beobachtbaren und nicht direkt beobachtbaren Variablen ein kausales Verhältnis vermutet wird
Die Faktorenanalyse Zielsetzung Datenreduktion: eine größere Anzahl von Variablen auf eine kleinere Anzahl unabhängiger Einflussgrößen zurückführen Grundlegende Idee Direkt beobachtbare Variablen spiegeln
MehrStatistische Versuchsplanung und Optimierung
und Optimierung Ziel: Anwendung der statistischen Versuchsplanung zur Optimierung von Analysenverfahren bzw. chemischen Prozessen Betreuer: Dipl.-Chem. Gisa Baumbach IAAC, Lehrbereich Umweltanalytik Lessingstr.8,
MehrMultivariate Diskriminanzanalyse
Zie: Anwendung der mutivariaten Diskriminanzanayse Betreuer: Dipomchemikerin Kristin Schaefer IAAC, Lehrbereich Umwetanaytik Lessingstraße 8, Raum 324 Te.: (9) 4 8 93 E-Mai: k.schaefer@uni-jena.de Seite
MehrPrincipal Component Analysis (PCA) (aka Hauptkomponentenanalyse)
Principal Component Analysis (PCA) (aka Hauptkomponentenanalyse) Seminar für Statistik Markus Kalisch 25.11.2014 1 Unsupervised Learning Supervised Learning: Erkläre Zielgrösse durch erklärende Variablen
MehrDie Rücktransformation: Z = A t (Y µ) = Y = AZ + µ
Die Rücktransformation: Z = A t (Y µ) = Y = AZ + µ Kleine Eigenwerte oder Eigenwerte gleich Null: k Eigenwerte Null = Rang(Σ) = m k Eigenwerte fast Null = Hauptkomponenten beinahe konstant Beschränkung
MehrLösung zu Kapitel 11: Beispiel 2
Lösung zu Kapitel 11: Beispiel 2 Die Daten beziehen sich auf 48 Bewerbungen um eine Position in einem Unternehmen. Diese Bewerbungen wurden anhand von 15 Variablen bewertet (Datenfile: bewerbung.csv).
MehrStatistische Methoden in der Wirtschaftsund Sozialgeographie
Statistische Methoden in der Wirtschaftsund Sozialgeographie Ort: Zeit: Multimediapool Rechenzentrum Mittwoch 0.5--45 Uhr Material: http://www.geomodellierung.de Thema: Beschreibung und Analyse Wirtschafts-
MehrMultivariate Verfahren
Multivariate Verfahren Oliver Muthmann 31. Mai 2007 Gliederung 1 Einführung 2 Varianzanalyse (MANOVA) 3 Regressionsanalyse 4 Faktorenanalyse Hauptkomponentenanalyse 5 Clusteranalyse 6 Zusammenfassung Komplexe
MehrSelbstständiges Lernen
Kapitel 5 Spezialvorlesung Modul 10-202-2206 (Fortgeschrittene Methoden in der Bioinformatik) Jana Hertel Professur für Bioinformatik Institut für Informatik Universität Leipzig Machine learning in bioinformatics
MehrZur Erklärung menschlicher Verhaltensweisen oder allgemeiner sozialer Phänomene ist häufig eine Vielzahl von Einflussfaktoren zu berücksichtigen.
4.3 Faktorenanalyse Problemstellung Zur Erklärung menschlicher Verhaltensweisen oder allgemeiner sozialer Phänomene ist häufig eine Vielzahl von Einflussfaktoren zu berücksichtigen. Je größer jedoch die
Mehr5.Tutorium Multivariate Verfahren
5.Tutorium Multivariate Verfahren - Hauptkomponentenanalyse - Nicole Schüller: 27.06.2016 und 04.07.2016 Hannah Busen: 28.06.2016 und 05.07.2016 Institut für Statistik, LMU München 1 / 18 Gliederung 1
MehrEiner Reihe von Merkmalen zugrunde liegende, gemeinsame Faktoren ermitteln.
Faktoranalysen Aufbau 1. Sinn und Zweck 2. Eigenschaften der Merkmale 3. Extraktion der Faktoren 4. Anzahl der Faktoren 5. Rotation der Faktoren 6. Interpretation der Faktoren Sinn und Zweck Einer Reihe
MehrPartial-Least-Square PLS und Kennzahl VIP
Voraussetzung und verwandte hemen Für diese Beschreibungen sind Grundlagen der Statistik vorteilhaft. Weiterführende und verwandte hemen sind: www.versuchsmethoden.de/multiple_regression.pdf www.versuchsmethoden.de/hauptkomponentenanalyse.pdf
MehrKlausur zur Vorlesung Analyse mehrdimensionaler Daten, Lösungen WS 2010/2011; 6 Kreditpunkte, 90 min
Klausur, Analyse mehrdimensionaler Daten, WS 2010/2011, 6 Kreditpunkte, 90 min 1 Prof. Dr. Fred Böker 21.02.2011 Klausur zur Vorlesung Analyse mehrdimensionaler Daten, Lösungen WS 2010/2011; 6 Kreditpunkte,
MehrNichtmetrische multidimensionale Skalierung (NMDS) Dr. Heike Culmsee Vegetationsanalyse & Phytodiversität
Nichtmetrische multidimensionale Skalierung (NMDS) Dr. Heike Culmsee Vegetationsanalyse & Phytodiversität Übersicht Ordinationsverfahren Linear methods Weighted averaging Multidimensional scaling Unconstrained
MehrLösung zu Kapitel 11: Beispiel 1
Lösung zu Kapitel 11: Beispiel 1 Eine Untersuchung bei 253 Personen zur Kundenzufriedenheit mit einer Einzelhandelskette im Südosten der USA enthält Variablen mit sozialstatistischen Daten der befragten
MehrSchnelle Diskriminanzanalyse mit vielen Variablen
Schnelle Diskriminanzanalyse mit vielen Variablen Bernd Heinen SAS Institute GmbH In der Neckarhelle 162 Heidelberg Bernd.heinen@jmp.com Zusammenfassung Diskriminanzanalyse erfordert die Schätzung der
MehrKlassifikation und Ähnlichkeitssuche
Klassifikation und Ähnlichkeitssuche Vorlesung XIII Allgemeines Ziel Rationale Zusammenfassung von Molekülen in Gruppen auf der Basis bestimmter Eigenschaften Auswahl von repräsentativen Molekülen Strukturell
MehrMultivariate Statistische Methoden
Multivariate Statistische Methoden und ihre Anwendung in den Wirtschafts- und Sozialwissenschaften Von Prof. Dr. Hans Peter Litz Carl von Ossietzky Universität Oldenburg v..v.-'... ':,. -X V R.Oldenbourg
MehrLineare Algebra und Datenwissenschaften in Ingenieur- und Informatikstudiengängen
Lineare Algebra und Datenwissenschaften in Ingenieur- und Informatikstudiengängen Heiko Knospe Technische Hochschule Köln heiko.knospe@th-koeln.de 6. September 26 / 2 Einleitung Das Management und die
MehrÜbung zum Projektseminar Wetterlagen und Feinstaub
Universität Augsburg Fakultät für Angewandte Informatik Institut für Physische Geographie und Quantitative Methoden Prof. Dr. Jucundus Jacobeit Übung zum Projektseminar Wetterlagen und Feinstaub Montag
MehrMultivariate Statistische Methoden und ihre Anwendung
Multivariate Statistische Methoden und ihre Anwendung in den Wirtschafts- und Sozialwissenschaften Von Prof. Dr. Hans Peter Litz Carl von Ossietzky Universität Oldenburg R. Oldenbourg Verlag München Wien
MehrGrundzüge der Faktorenanalyse
SEITE Grundzüge der Faktorenanalyse Bei der Faktorenanalyse handelt es sich um ein Verfahren, mehrere Variablen durch möglichst wenige gemeinsame, hinter ihnen stehende Faktoren zu beschreiben. Beispiel:
MehrVergleich von Partial Cox Regression und Lasso zur Analyse von U berlebenszeiten bei hochdimensionalen Daten
Vergleich von Partial Cox Regression und Lasso zur Analyse von U berlebenszeiten bei hochdimensionalen Daten Claudia-Martina Messow Robertson Centre for Biostatistics, University of Glasgow Situation Methoden
MehrEinführung in die Hauptkomponentenanalyse und Faktorenanalyse mit SPSS. Datenanalyse HS09 Susan Kriete Dodds 18. November 2009
Einführung in die Hauptkomponentenanalyse und Faktorenanalyse mit SPSS Datenanalyse HS09 Susan Kriete Dodds 18. November 2009 Hauptkomponentenanalyse Öffne die Datei Kamera.csv Analysieren > Dimensionsreduzierung
MehrKonfirmatorische Faktorenanalyse. Regressionsmodelle für Politikwissenschaftler
Konfirmatorische Faktorenanalyse Regressionsmodelle für Politikwissenschaftler Was ist ein Faktor? Faktor oder latente Variable Regressionsmodelle für Politikwissenschaftler Konfirmatorische Faktorenanalyse
MehrGraphisch gestützte Datenanalyse
Graphisch gestützte Datenanalyse Von Dr. Rainer Schnell R. Oldenbourg Verlag München Wien Inhalt 1 Grundprinzipien graphischer Datenanalyse 1 1.1 Ablauf einer graphisch gestützten Datenanalyse 2 1.2 Datenanalyseplots
MehrKonfirmatorische Faktorenanalyse
Konfirmatorische Faktorenanalyse Regressionsmodelle für Politikwissenschaftler Was ist ein Faktor? Faktor oder latente Variable nicht direkt beobachtbare Größe die beobachtbare Variablen ( Indikatoren
MehrKonzepte II. Netzwerkanalyse für Politikwissenschaftler
Konzepte II Netzwerkanalyse für Politikwissenschaftler Wiederholung Räumliche Distanzen und MDS Hauptkomponenten Neuere Entwicklungen Netzwerkanalyse für Politikwissenschaftler Konzepte II (1/20) Worum
MehrKlausurvorbereitung Multivariate Statistik
Klausurvorbereitung Multivariate Statistik Aufgabe 1 (15 Punkte) Daten der Erdbeerernte für 20 Betriebe werden untersucht. Angegeben werden die Variablen Größe, Sonne und Ertrag, die die Gröÿe des Anbaugebietes
MehrPrincipal Component Analysis (PCA)
Principal Component Analysis (PCA) Motivation: Klassifikation mit der PCA Berechnung der Hauptkomponenten Theoretische Hintergründe Anwendungsbeispiel: Klassifikation von Gesichtern Weiterführende Bemerkungen
MehrHauptkomponentenanalyse. Die Schritte bei einer Hauptkomponentenanalyse
Die Schritte bei einer FACTOR /VARIABLES f06_r f06_r f06_r f06_4r f06_5r f06_6r f06_7r f06_8r f06_9r f06_0r /MISSING LISTWISE /ANALYSIS f06_r f06_r f06_r f06_4r f06_5r f06_6r f06_7r f06_8r f06_9r f06_0r
MehrEigene MC-Fragen Kap. 4 Faktorenanalyse, Aggregation, Normierung. 1. Welche Aussage zu den Prinzipien der Faktorenanalyse ist zutreffend?
Eigene MC-Fragen Kap. 4 Faktorenanalyse, Aggregation, Normierung 1. Welche Aussage zu den Prinzipien der Faktorenanalyse ist zutreffend? a) Die Faktorenanalyse hat ihren Ursprung in der theoretischen Intelligenzforschung.
MehrLösungen zu Janssen/Laatz, Statistische Datenanalyse mit SPSS 1
LÖSUNG 13 a) Lösungen zu Janssen/Laatz, Statistische Datenanalyse mit SPSS 1 Die Variablen sollten hoch miteinander korrelieren. Deshalb sollten die einfachen Korrelationskoeffizienten hoch ausfallen.
MehrModulklausur Multivariate Verfahren
Name, Vorname Matrikelnummer Modulklausur 31821 Multivariate Verfahren Datum Punkte Note Termin: 28. März 2014, 9.00-11.00 Uhr Erstprüfer: Univ.-Prof. Dr. H. Singer Hinweise zur Bearbeitung der Modulklausur
MehrAufgaben zur Multivariaten Statistik
Prof. Dr. Reinhold Kosfeld Fachbereich Wirtschaftswissenschaften Universität Kassel Aufgaben zur Multivariaten Statistik Teil : Aufgaben zur Einleitung. Was versteht man unter einer univariaten, bivariaten
MehrStatistikpraktikum. Carsten Rezny. Sommersemester Institut für angewandte Mathematik Universität Bonn
Statistikpraktikum Carsten Rezny Institut für angewandte Mathematik Universität Bonn Sommersemester 2014 Mehrdimensionale Datensätze: Multivariate Statistik Multivariate Statistik Mehrdimensionale Datensätze:
MehrMultivariate Lineare Modelle SS Einführung. 1. Organisation. 2. Übersicht. 3. Arbeiten mit SAS
Multivariate Lineare Modelle SS 2009 0 Einführung 1. Organisation 2. Übersicht 3. Arbeiten mit SAS 1 0.1 Organisation Lehrziele: Theorie von multivariaten linearen Modellen Praktische Anwendung mit SAS
Mehr13 Dimensionsreduktion
13 Dimensionsreduktion 13.0 Dimensionsreduktion Dimensionsreduktion 13 Dimensionsreduktion (aus: C. Weihs und J. Jessenberger (1998): Statistische Methoden zur Qualitätssicherung und -optimierung in der
Mehr6-Variablen-Fall. Dipl.-Ök. John Yun Bergische Universität Wuppertal Gaußstraße Wuppertal
Dipl.-Ök. John Yun Bergische Universität Wuppertal Gaußstraße 20 42097 Wuppertal Allgemein 6 Konstrukte: - Preisorientierung (6 Items) - Werbeakzeptanz (6 Items) - Qualitätsbewusstsein (6 Items) - Trendbewusstsein
MehrStatistische Datenanalyse
Werner A. Stahel Statistische Datenanalyse Eine Einführung für Naturwissenschaftler 3., durchgesehene Auflage vieweg VII 1 Einleitung 1 1.1 Was ist Statistische Datenanalyse? 1 1.2 Ziele 6 1.3 Hinweise
Mehr6-Variablen-Fall. Dipl.-Ök. John Yun Bergische Universität Wuppertal Gaußstraße Wuppertal
Dipl.-Ök. John Yun Bergische Universität Wuppertal Gaußstraße 20 42097 Wuppertal Allgemein 6 Konstrukte: - soziale Kontakte (6 Items) - Markenbewusstsein (6 Items) - Werbeakzeptanz (6 Items) - materielle
MehrMusterlösung. Modulklausur Multivariate Verfahren
Musterlösung Modulklausur 31821 Multivariate Verfahren 27. März 2015 Aufgabe 1 Kennzeichnen Sie die folgenden Aussagen über die beiden Zufallsvektoren ([ ] [ ]) ([ ] [ ]) 2 1 0 1 25 2 x 1 N, x 3 0 1 2
MehrProf. Dr. Fred Böker
Statistik III WS 2004/2005; 8. Übungsblatt: Lösungen 1 Prof. Dr. Fred Böker 07.12.2004 Lösungen zum 8. Übungsblatt Aufgabe 1 Die Zufallsvariablen X 1 X 2 besitzen eine gemeinsame bivariate Normalverteilung
MehrSkript Einführung in SPSS
SPSSinteraktiv Faktorenanalyse - 1 - Skript Einführung in SPSS Faktorenanalyse Explorative Faktorenanalyse Hauptkomponentenanalyse (PCA) Hinweise zum Schreiben des statistischen Reports 1. Sämtliche Tabellen
MehrMultivariate Verfahren
Multivariate Verfahren Lineare Regression Zweck: Vorhersage x Dimensionsreduktion x x Klassifizierung x x Hauptkomponentenanalyse Korrespondenzanalyse Clusteranalyse Diskriminanzanalyse Eigenschaften:
MehrKonzepte II. Netzwerkanalyse für Politikwissenschaftler. Wiederholung
Konzepte II Netzwerkanalyse für Politikwissenschaftler Netzwerkanalyse für Politikwissenschaftler Konzepte II (1/20) Worum geht es? Bisher: Eigenschaften einzelner Punkte bzw. des Netzwerkes Definiert
MehrStatistik II: Klassifikation und Segmentierung
Medien Institut : Klassifikation und Segmentierung Dr. Andreas Vlašić Medien Institut (0621) 52 67 44 vlasic@medien-institut.de Gliederung 1. Faktorenanalyse 2. Clusteranalyse 3. Key Facts 2 I 14 Ziel
MehrFaktorenanalyse. Fakultät für Human und Sozialwissenschaften Professur für Forschungsmethodik und Evaluation in der Psychologie
Faktorenanalyse Fakultät für Human und Sozialwissenschaften Professur für Forschungsmethodik und Evaluation in der Psychologie Seminar: Multivariate Analysemethoden Seminarleiter: Dr. Thomas Schäfer Referenten:
MehrLehrinhalte Statistik (Sozialwissenschaften)
Lehrinhalte Technische Universität Dresden Institut für Mathematische Stochastik Dresden, 13. November 2007 Seit 2004 Vorlesungen durch Klaus Th. Hess und Hans Otfried Müller. Statistik I: Beschreibende
MehrClusteranalyse. Anwendungsorientierte Einführung. R. Oldenbourg Verlag München Wien. Von Dr. Johann Bacher
Clusteranalyse Anwendungsorientierte Einführung Von Dr. Johann Bacher R. Oldenbourg Verlag München Wien INHALTSVERZEICHNIS Vorwort XI 1 Einleitung 1 1.1 Primäre Zielsetzung clusteranalytischer Verfahren
MehrLösungen zu Janssen/Laatz, Statistische Datenanalyse mit SPSS 1. LÖSUNG 13 a.
Lösungen zu Janssen/Laatz, Statistische Datenanalyse mit SPSS 1 LÖSUNG 13 a. Die Variablen sollten hoch miteinander korrelieren. Deshalb sollten die einfachen Korrelationskoeffizienten hoch ausfallen.
MehrMustererkennung. Merkmalsreduktion. R. Neubecker, WS 2016 / Übersicht
Mustererkennung Merkmalsreduktion R. Neubecker, WS 2016 / 2017 Übersicht 2 Merkmale Principal Component Analysis: Konzept Mathematische Formulierung Anwendung Eigengesichter 1 Merkmale 3 (Zu) Viele Merkmale
Mehr6.1 Definition der multivariaten Normalverteilung
Kapitel 6 Die multivariate Normalverteilung Wir hatten die multivariate Normalverteilung bereits in Abschnitt 2.3 kurz eingeführt. Wir werden sie jetzt etwas gründlicher behandeln, da die Schätzung ihrer
Mehr9. November Ruhr-Universität Bochum. Methodenlehre III, WS 2009/2010. Prof. Dr. Holger Dette. Matrizenrechnung. 2. Multiple Korrelationen
Ruhr-Universität Bochum 9. November 2009 1 / 62 Methodenlehre III NA 3/73 Telefon: 0234 322 8284 Email: holger.dette@rub.de Internet: www.ruhr-uni-bochum.de/mathematik3/index.html Vorlesung: Montag, 8.30-10.00
MehrSo lösen Sie das multivariate lineare Regressionsproblem von Christian Herta
Multivariate Lineare Regression Christian Herta Oktober, 2013 1 von 34 Christian Herta Multivariate Lineare Regression Lernziele Multivariate Lineare Regression Konzepte des Maschinellen Lernens: Kostenfunktion
Mehr13.0 Dimensionsreduktion Dimensionsreduktion. 13 Dimensionsreduktion Hauptkomponentenanalyse Dimensionsreduktion
13 Dimensionsreduktion 13.0 Dimensionsreduktion Dimensionsreduktion 13 Dimensionsreduktion (aus: C. Weihs und J. Jessenberger (1998): Statistische Methoden zur Qualitätssicherung und -optimierung in der
Mehr13.1 Hauptkomponentenanalyse. 13 Dimensionsreduktion Hauptkomponentenanalyse Hauptkomponentenanalyse
13.0 Dimensionsreduktion Dimensionsreduktion (aus: C. Weihs und J. Jessenberger (1998): Statistische Methoden zur Qualitätssicherung und -optimierung in der Industrie; Wiley-VCH, Weinheim, 141 161) Jetzt
MehrWahrscheinlichkeitsrechnung und Statistik für Biologen Diskriminanzanalyse
Wahrscheinlichkeitsrechnung und Statistik für Biologen Diskriminanzanalyse Martin Hutzenthaler & Dirk Metzler http://evol.bio.lmu.de/_statgen 6. Juli 2010 Übersicht 1 Ruf des Kleinspechts 2 Modell Vorgehen
MehrVeranschaulichung: Einführung in die Faktorenanalyse mit SAS. 1. Faktorenanalyse: Wie? Inhalt. 1. Faktorenanalyse: Wozu?
Einführung in die Faktorenanalyse mit SAS Benutzertreffen am URZ Christoph Witzel 6. Juni 2003 1. Faktorenanalyse: Wozu? Veranschaulichung: Variablen seien: Wie oft Personen Fußball spielen, Rad fahren,
Mehry = b 0 + b 1 x 1 x 1 ε 1. ε n b + b 1 1 x n 2) Hat die Größe x einen Einfluss auf y, d.h. gilt die Hypothese: H : b 1 = 0
8 Lineare Modelle In diesem Abschnitt betrachten wir eine spezielle Klasse von statistischen Modellen, in denen die Parameter linear auftauchen Wir beginnen mit zwei Beispielen Beispiel 8 (lineare Regression)
MehrMultivariate Verteilungen. Gerhard Tutz LMU München
Multivariate Verteilungen Gerhard Tutz LMU München INHALTSVERZEICHNIS 1 Inhaltsverzeichnis 1 Multivariate Normalverteilung 3 Wishart Verteilung 7 3 Hotellings T Verteilung 11 4 Wilks Λ 14 INHALTSVERZEICHNIS
MehrMultivariate Statistik
Multivariate Statistik Lehr- und Handbuch der angewandten Statistik Von o. Prof. Dr. Joachim Härtung Fachbereich Statistik der Universität Dortmund und Dr. Bärbel Elpelt mit 138 Abbildungen und zahlreichen
MehrWahrscheinlichkeitsrechnung und Statistik
9. Vorlesung - 2017 Monte Carlo Methode für numerische Integration Sei g : [0, 1] R stetige Funktion; man möchte 1 0 g(t)dt numerisch approximieren mit Hilfe von Zufallszahlen: Sei (U n ) n eine Folge
MehrAnwendungen mit SAS: Direkt aus der Praxis! Block 3
Anwendungen mit SAS: Direkt aus der Praxis! Block 3 Supervised Learning - Die Logistische Regression Fachhochschule Koblenz Fachbereich Mathematik und Technik Dr. Denise Rey 30. Januar 2009 1 Inhalt 1.
MehrGHF SoSe 2011 HS MD-SDL
GHF SoSe 2011 HS MD-SDL 6/28/2011 1 Bitte recherchieren Sie die verschiedenen Bestimmungsstücke des Validitätskonzepts Bitte überlegen Sie sich Strategien zur Prüfung dieser verschiedenen Bestimmungsstücke
Mehr1 Übungsaufgaben zur Regressionsanalyse
1 Übungsaufgaben zur Regressionsanalyse 1 1 Übungsaufgaben zur Regressionsanalyse 1.1 Übungsaufgaben zu Seite 1 und 2 1. Wie lautet die Regressionsfunktion? 2. Welche Absatzmenge ist im Durchschnitt bei
MehrMod. 2 p. 1. Prof. Dr. Christoph Kleinn Institut für Waldinventur und Waldwachstum Arbeitsbereich Fernerkundung und Waldinventur
Histogramme der Grauwerte der TM Kanäle 1-7 für das Beispielsbild. - Kanäle 4 und 5 zeigen mehr Differenzierung als die anderen (Kontrast=das Verhältnis der hellsten zur dunkelsten Fläche in der Landschaft).
Mehr1. Referenzpunkt Transformation
2.3 Featurereduktion Idee: Anstatt Features einfach wegzulassen, generiere einen neuen niedrigdimensionalen Featureraum aus allen Features: Redundante Features können zusammengefasst werden Irrelevantere
MehrFaktorenanalyse und Hauptkomponentenanalyse
Faktorenanalyse und Hauptkomponentenanalyse Man habe n Personen auf m Variablen untersucht Insbesondere habe man: n Personen Index i m Variablen Index j r Faktoren Index l Die Faktoren sind latente Variablen,
MehrHauptkomponentenanalyse PCA
Hauptkoponentenanalyse PCA Die Hauptkoponentenanalyse (Principal Coponent Analysis, PCA) ist eine Methode zur linearen Transforation der Variablen, so dass: öglichst wenige neue Variablen die relevante
MehrSparse Hauptkomponentenanalyse
Sparse Referent: Thomas Klein-Heßling LMU München 20. Januar 2017 1 / 36 1 Einführung 2 3 4 5 2 / 36 Einführung Ziel: vorhandene Datenmenge verstehen Daten komprimieren Bei der Sparse (SPCA) handelt es
MehrInhaltsverzeichnis. Bibliografische Informationen digitalisiert durch
Grundlagen 1 1.1 Einleitung 1 1.2 Grundbegriffe 2 1.2.1 Systemgrenzen 3 1.2.2 Qualitätsmerkmal 4 1.2.3 Parameter und Faktoren 5 1.2.4 Stufen 6 1.2.5 Vergleich zu traditionellen Verfahren 6 1.3 Auswertung
MehrLineare Transformationen und Determinanten. 10-E Ma 1 Lubov Vassilevskaya
Lineare Transformationen und Determinanten 10-E Ma 1 Lubov Vassilevskaya Lineare Transformation cc Definition: V und W sind zwei Vektorräume. Eine Funktion T nennt man eine lineare Transformation von V
Mehr11. Übungsblatt zur Vorlesung Ökonometrie SS 2014
Universität des Saarlandes Lehrstab Statistik Dr. Martin Becker Dipl.-Kfm. Andreas Recktenwald 11. Übungsblatt zur Vorlesung Ökonometrie SS 2014 Aufgabe 45 Die in Aufgabe 43 getroffene Annahme heteroskedastischer
MehrFaktorenanalysen mit SPSS. Explorative Faktorenanalyse als Instrument der Dimensionsreduzierung. Interpretation des SPSS-Output s
Explorative Faktorenanalyse als Instrument der Dimensionsreduzierung Beispiel: Welche Dimensionen charakterisieren die Beurteilung des sozialen Klimas in der Nachbarschaft? Variablen: q27a bis q27g im
MehrAngewandte Statistik mit R. Eine Einführung für Ökonomen und
Reiner Hellbrück Angewandte Statistik mit R Eine Einführung für Ökonomen und Sozialwissenschaftler 3. Auflage Springer Gabler Inhaltsverzeichnis Vorwort zur dritten Auflage Vorwort zur ersten Auflage Vorwort
MehrHolger Dette. 30. Oktober 2015
Ruhr-Universität Bochum 30. Oktober 2015 1 / 1 Methodenlehre III Prof. Dr. NA 3/73 Telefon: 0234 32 28284 Email: holger.dette@rub.de Internet: www.ruhr-uni-bochum.de/mathematik3/index.html Vorlesung: Montag,
MehrTrim Size: 176mm x 240mm Lipow ftoc.tex V1 - March 9, :34 P.M. Page 11. Über die Übersetzerin 9. Einleitung 19
Trim Size: 176mm x 240mm Lipow ftoc.tex V1 - March 9, 2016 6:34 P.M. Page 11 Inhaltsverzeichnis Über die Übersetzerin 9 Einleitung 19 Was Sie hier finden werden 19 Wie dieses Arbeitsbuch aufgebaut ist
MehrStatistik-Quiz Sommersemester
Statistik-Quiz Sommersemester Seite 1 von 8 Statistik-Quiz Sommersemester Die richtigen Lösungen sind mit gekennzeichnet. 1 In einer Gruppe von 337 Probandinnen und Probanden wurden verschiedene Merkmale
MehrInhaltsverzeichnis 1. EINLEITUNG...1
VII Inhaltsverzeichnis Vorwort...V Verzeichnis der Abbildungen...XII Verzeichnis der Tabellen... XVI Verzeichnis der Übersichten...XXII Symbolverzeichnis... XXIII 1. EINLEITUNG...1 2. FAKTORENANALYSE...5
MehrOptimierung der Variablen-Selektion für die PLS-Regression
Optimierung der Variablen-Selektion für die PLS-Regression Michael Judas Stefaan De Smet Institut für Sicherheit und Qualität bei Fleisch, MRI Standort Kulmbach Laboratory for Animal Nutrition and Animal
MehrHerleitung der Hauptkomponenten: Y t = (Y 1,..., Y m ) Erwartung:µ Kovarianz:Σ. Z j = a 1j Y 1 + a 2j Y a mj Y m = a t j Y
Herleitung der Hauptkomponenten: Y t = (Y 1,..., Y m ) Erwartung:µ Kovarianz:Σ Z j = a 1j Y 1 + a 2j Y 2 +... + a mj Y m = a t j Y a t j = (a 1j, a 2j,..., a mj ) Z 1, Z 2,...,Z m unkorreliert Varianzen
MehrUniversität Potsdam Institut für Informatik Lehrstuhl Maschinelles Lernen. Sparse PCA. Tobias Scheffer Michael Großhans Paul Prasse Uwe Dick
Universität Potsdam Institut für Informatik Lehrstuhl Maschinelles Lernen Sparse PCA obias Scheffer Michael Großhans Paul Prasse Uwe Dick Vektorraummodell Jedes Dokument wird als Vektor dargestellt, beispielsweise
Mehr