Einführung in die Cluster-Analyse mit SPSS
|
|
- Gundi Waltz
- vor 7 Jahren
- Abrufe
Transkript
1 Einführung in die -Analyse mit SPSS SPSS-Benutzertreffen am URZ Carina Ortseifen. Juli 00 Inhalt. analyse im allgemeinen Definition, Distanzmaße, Gruppierung, Kriterien. analyse mit SPSS a) Hierarchische analyse Prozedur b) zentrenanalyse Prozedur Quick. Literatur. (dt.: Traube, Haufen) heuristisches Verfahren zur systematischen Klassifizierung von Beobachtungen, z.b. Personen, Autos, Schallplatten) Ziel: Auffinden von Gruppen, in denen sich Beobachtungen befinden, die innerhalb der Gruppe möglichst ähnlich sind und extern (zwischen den Gruppen) verschieden. Anwendungsgebiete: Sozialwissenschaften, Biologie, Wirtschaftswissenschaften, Marktforschung Ähnlichkeit / Unähnlichkeit Die Ähnlichkeit bzw. Unähnlichkeit wird auf der Basis von Merkmalen definiert. Z.B. gleiches Alter, gleiche Haarfarbe. Andere Begriffe für Unähnlichkeit: Distanz Ähnlichkeit: Proximität Beispiel Zehn Fälle, zwei stetige Merkmale A/B B c a b Euklidische Distanz c: a + b = c Euklidische Distanz allgemein P Merkmale: p dii = xij xij ( ) i= Beispiel für Fälle A und B, 7 Merkmale: A: 7 8 B: / A d ab = ( 9) + ( 7 )... + ( ) = 9, 0
2 Distanzmaße für metrische Variabl. Euklidische Distanz City Block-Distanz Summe der absoluten Differenzen = Spezialfälle der Minkowski-Distanz Hohe Unterschiede werden stark gewichtet. Maße sind translationsinvariant, aber nicht skaleninvariant. (Einkommen in Dollar oder Euro) Distanzmaße für metrische Var. () Mahalanobis-Distanz d ij =(x i -x j ) S - (x i -x j ) wobei S - die Inverse der Stichproben-Varianz-Kovarianzmatrix der p Merkmale ist. Translations- und Skaleninvariant Dichotome Merkmale (Beispiel) Zwei Beobachtungen, A und B, 9 Merkmale, die angeben, ob ein Sachverhalt gegeben ist oder nicht A: B: B A 0 a b 0 c d Ähnlichkeitskoeffizient von Jaccard p ij =a / (a+b+c) (d spielt keine Rolle) Das entsprechende Distanzmaß ist: d ij =- p ij = (b+c) / (a+b+c) p ij nimmt Werte zwischen 0 und an. Für das Beispiel: p AB = /6 = 0.. Distanzmaße für binäre Merkmale (Simple) Matching Koeffizient p ij =a+d / (a+b+c+d) Jaccard- (Tanimoto-) Koeffizient p ij =a / (a+b+c) RR-Koeffizient p ij =a / (a+b+c+d) Dice-Koeffizient p ij = a / ( a+b+c) Mögliche Probleme Ungleiche Skala Standardisierung Ungleiches Skalenniveau der Merkmale binäre Merkmale als metrische betrachten metrische Merkmale binär kodieren Aggregation der verschiedenen Distanzmaße Merkmale sind korreliert Berechnung von Faktorwerten Mahalanobis-Distanz Ordinalskalierte Merkmale Merkmale am Median dichotomisieren Merkmale als metrische Daten behandeln
3 -Analyse-Verfahren Nicht-Hierarchische Verfahren Start bildung Ziel Hierarchische Verfahren Nichthierarchische Verfahren(*) feinste Partionierung, Vorgabe einer jedes Objekt bildet ein Startgruppierung eigenes Fusionierung von n Das zuvor festgelegte Kriterium ist erfüllt. Verschieben der Objekte Das zuvor festgelegte Kriterium ist erfüllt. * Auch: Partitionierendes -Analyse Verfahren, zentrenanalyse Objekte werden solange in verschiedene Gruppen sortiert, bis die beste Lösung im Sinne des Kriteriums gefunden ist. Problem: enormer Arbeits- und Zeitaufwand (bei 0 Objekten gibt es schon 97 verschiedene Möglichkeiten), deshalb sind meist nur Annäherungen möglich. Hierarchische Verfahren. Berechnung der Distanzen zwischen den n. Fusionierung der beiden, die die geringste Distanz zueinander haben. Berechnung des Ende-Kriteriums Wenn erfüllt, dann Ende; sonst weiter.. Berechnung der neuen Distanzen. Zurück zu Punkt Beispiel Zehn Fälle, zwei stetige Merkmale A/B B Single Linkage Complete L. Zentroid Average Linkage A Distanzen zwischen den n Single Linkage: Nächst gelegener Nachbar Kleinste Distanz zwischen einem Objekt des einen s und einem Objekt des anderen s Ketten-Tendenz Complete Linkage: Entferntester Nachbar größte Distanz zwischen einem Objekt des einen s und einem Objekt des anderen s anfällig für Ausreißer Distanzen zwischen n () AverageLinkage: Linkagezwischen den Gruppen Durchschnitt aller Distanz zwischen den Objekten der beiden betrachteten tendiert dazu mit kleinen Varianzen zu verbinden, neigt zu n mit gleicher Varianz Linkage innerhalb der Gruppen Zentroid: Zentroid ing Quadrierte Euklidische Distanz zwischen -Mittelwerten nur für metrische Merkmale, robust gegenüber Ausreißern)
4 Distanzen zwischen n: Ward Distanz ist die Anova-Quadratsumme zwischen zwei n (nur für intervallskalierte normalverteilte Daten) vereinigt diejenigen Elemente, deren Fusion die Gesamtvarianz innerhalb der am geringsten erhöht findet mit annährend gleicher Besetzungszahl anfällig für Ausreißer Bewertungskriterium Distanz zwischen zwei n Bestimmtheitsmaß r (RSQ) Semipartielles Bestimmheitsmaß Pseudo-F Pseudo-t Überprüfung der -Lösung Inhaltliche Interpretation Deskriptive Unterschiede zwischen den n auf weiteren Variablen Diskriminanzanalytische Überprüfung variable als Gruppenvariable Graphische Veranschaulichung Eiszapfen, Dendogramm, Plot. -Analyse in SPSS Prozeduren für -Analysen: Analysieren > Klassifizieren CLUSTER (hierarchische Methoden) QUICK CLUSTER (besonders für große Tabellen, nicht-hierarchisch, k- means) TWO STEP CLUSTER (für sehr große Tabellen, verarbeitet gleichzeitig unterschiedlich skalierte Variablen) a. Hierarchische analyse Variablenauswahl Probanden wurden gefragt, wie viele Stunden pro Woche sie für Sport, Medien, Hobbies aufbringen. data list free / nr sport medien hobbies. begin data end data. formats nr, sport, medien, hobbies (f.0). Distanzmatrix Zuordnung zugehörigkeit Dendrogramm Eiszapfendiagramm zugehörigkeit als neue Variable verfahren Distanzmaß Transformation
5 Ergebnisse Verarbeitete Fälle a Fälle Gültig Fehlend Gesamt N Prozent N Prozent N Prozent 00,0 0,0 00,0 a. Single Linkage Schritt Zusammengeführte Zuordnungsübersicht Erstes Vorkommen des s Nächster Koeffizienten Schritt, , ,000, Näherungsmatrix Fall Quadriertes euklidisches Distanzmaß,000,000,000,000 6,000,000,000,000 8,000 8,000,000,000,000 9,000 77,000,000 8,000 9,000,000,000 6,000 8,000 77,000,000,000 Dies ist eine Unähnlichkeitsmatrix -Zugehörigkeit Fall Bewertungskriterium = Quadrierte Eukl. Distanz Diagramme Plot der -Lösung Vertikales Eiszapfendiagramm Fall Anzahl der X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X 6 * * H I E R A R C H I C A L C L U S T E R A N A L Y S I S * * Dendrogram using Single Linkage Rescaled Distance Combine C A S E Label Num òûòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòø ò ùòòòòòòòòòòòòòòòø òûòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòò ó ò ó òòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòò 0-6 Single Linkage 7 Syntax der Prozedur wird fast vollständig von der Dialogbox abgedeckt. Ausnahme: Matrix In Out Einlesen bzw. Rausschreiben von Distanz-/Ähnlichkeitsmatrizen Beispiel: CLUSTER sport medien hobbies /METHOD SINGLE /MEASURE= SEUCLID /PRINT SCHEDULE CLUSTER() /PRINT DISTANCE /PLOT DENDROGRAM VICICLE /SAVE CLUSTER() /MATRIX OUT("d:\test.sav"). b. zentrenanalyse Prozedur Quick Nearest Centroid Sorting-Verfahren Distanzmaß: Quadr. eukl. Distanz. Schritt: Festlegung der Startwerte (n Beobachtungen mit Mindestdistanz). Schritt: Zuordnung der übrigen Beobachtungen zu den Startwerten Evtl.. Schritt: Berechnung der Zentroide und erneute Zuordnung. Schritt: Wiederholung der Schritte - bis sich Zentroide nicht mehr ändern
6 Beispiel HOBBIES Anfängliche zentren Iterationsprotokoll a Änderung in zentren Iteration,707,707,000,000,000,000 a. Konvergenz wurde aufgrund geringer oder keiner Änderungen der zentren erreicht. Die maximale Änderung der absoluten Koordinaten für jedes Zentrum ist,000. Die aktuelle Iteration lautet. Der Mindestabstand zwischen den anfänglichen Zentren beträgt 6,6. -Zugehörigkeit zentren der endgültigen Lösung Fallnummer NR Distanz,707,707,000,707,707 HOBBIES 6 8 -Zugehörigkeit Distanz von zentrum Statistiken (Anfängl. zentren, ANOVA- Tabelle, information) Behandlung fehlender Werte Distanz zwischen zentren der endgültigen Lösung HOBBIES, 8,6, 6,8 8,6 6,8 ANOVA Anzahl der Fälle in jedem Gültig Fehlend,000,000,000,000,000 Fehler Mittel der Mittel der Quadrate df Quadrate df F Sig. 0,0,0,00,0,00,00 9,000,00 8,70,0 7,000,0 Die F-Tests sollten nur für beschreibende Zwecke verwendet werden, da die so gewählt wurden, daß die Differenzen zwischen Fällen in unterschiedlichen n maximiert werden. Dabei werden die beobachteten Signifikanzniveaus nicht korrigiert und können daher nicht als Tests für die Hypothese der Gleichheit der mittelwerte interpretiert werden. Literatur SPSSBASE.PDF (Online Doku, SPSS-Systemordner) The SPSS TwoStep Component. White Paper Technical Report von A. Bühl, P. Zöfel: SPSS Version 0. Addison-Wesley, 000. F. Brosius: SPSS 8. mitp, 998. E. Bellgardt: Statistik mit SPSS. Verlag Vahlen, 997. Bortz, J. : Statistik für Sozialwissenschaftler Springer Lehrbuch,.Aufl. 99. Späth, H. :-Analyse-Algorithmen zur Objektklassifizierung und Datenreduktion. Oldenbourg, 977. Backhaus et.al.: Multivariate Analysemethoden Springer Lehrbuch, 8. Auflage, 996.
Einführung in die Cluster-Analyse mit SAS
Einführung in die Cluster-Analyse mit SAS Benutzertreffen am URZ Carina Ortseifen 4. Juli 2003 Inhalt 1. Clusteranalyse im allgemeinen Definition, Distanzmaße, Gruppierung, Kriterien 2. Clusteranalyse
Mehr4.4 Hierarchische Clusteranalyse-Verfahren
Clusteranalyse 18.05.04-1 - 4.4 Hierarchische Clusteranalyse-Verfahren Ablauf von hierarchischen Clusteranalyse-Verfahren: (1) Start jedes Objekt sein eigenes Cluster, also Start mit n Clustern (2) Fusionierung
MehrMETHODENPRAKTIKUM II Kurs 1. Prof. Dr. Beat Fux SUZ Frühlingssemester 2009
METHODENPRAKTIKUM II Kurs 1 Prof. Dr. Beat Fux SUZ Frühlingssemester 2009 Prüfung von Modellannahmen (Regression) Stichprobengrösse Ausreisser Linearität Multikollinearität Normalverteilung Homoskedastizität
Mehr4 Clusteranalyse 4.1 Einführung
Clusteranalyse.0.0 - - Clusteranalyse. Einführung p Merkmale: X, X,..., X p (metrisch; auch ordinal möglich, falls geeignet nummeriert; nominalskaliert?!) Zu den Merkmalen werden n Datensätze bzw. Datenobjekte
MehrLösungen zu den Aufgaben zur Multivariaten Statistik Teil 4: Aufgaben zur Clusteranalyse
Prof. Dr. Reinhold Kosfeld Fachbereich Wirtschaftswissenschaften Universität Kassel Lösungen zu den Aufgaben zur Multivariaten Statistik Teil 4: Aufgaben zur Clusteranalyse 1. Erläutern Sie, wie das Konstrukt
MehrMultivariate Verfahren
Multivariate Verfahren Lineare Regression Zweck: Vorhersage x Dimensionsreduktion x x Klassifizierung x x Hauptkomponentenanalyse Korrespondenzanalyse Clusteranalyse Diskriminanzanalyse Eigenschaften:
MehrÄhnlichkeits- und Distanzmaße
Ähnlichkeits- und Distanzmaße Jörg Rahnenführer, Multivariate Verfahren, WS89, TU Dortmund 11.1.8-1 - Ähnlichkeits- und Distanzmaße Jörg Rahnenführer, Multivariate Verfahren, WS89, TU Dortmund 11.1.8 -
MehrStatistik IV für Studenten mit dem Nebenfach Statistik Lösungen zu Blatt 9 Gerhard Tutz, Jan Ulbricht SS 07
Statistik IV für Studenten mit dem Nebenfach Statistik Lösungen zu Blatt 9 Gerhard Tutz, Jan Ulbricht SS 07 Ziel der Clusteranalyse: Bilde Gruppen (cluster) aus einer Menge multivariater Datenobjekte (stat
MehrStrukturerkennende Verfahren
Strukturerkennende Verfahren Viele Verfahren der multivariaten Datenanalyse dienen dazu, die in den Daten vorliegenden Strukturen zu erkennen und zu beschreiben. Dabei kann es sich um Strukturen sehr allgemeiner
MehrClusteranalyse. Gliederung. 1. Einführung 2. Vorgehensweise. 3. Anwendungshinweise 4. Abgrenzung zu Faktorenanalyse 5. Fallbeispiel & SPSS
Clusteranalyse Seminar Multivariate Verfahren SS 2010 Seminarleiter: Dr. Thomas Schäfer Theresia Montag, Claudia Wendschuh & Anne Brantl Gliederung 1. Einführung 2. Vorgehensweise 1. Bestimmung der 2.
MehrDr. Ralf Gutfleisch, Stadt Frankfurt a.m.
Zentrale Fragestellungen: Was Wie Wann ist eine Clusteranalyse? wird eine Clusteranalyse angewendet? wird eine Clusteranalyse angewendet? Clusteranalyse = Gruppenbildungsverfahren = eine Vielzahl von Objekten
MehrZiel: Unterteilung beobachteter Objekte in homogene Gruppen. Vorab meist weder Anzahl noch Charakteristika der Gruppen bekannt.
8 Clusteranalyse Ziel: Unterteilung beobachteter Objekte in homogene Gruppen. Vorab meist weder Anzahl noch Charakteristika der Gruppen bekannt. Anwendungsbeispiele: Mikrobiologie: Ermittlung der Verwandtschaft
MehrEntscheidungen bei der Durchführung einer Cluster-Analyse
7712Clusterverfahren Entscheidungen bei der Durchführung einer Cluster-Analyse nach: Eckes, Thomas, und Helmut Roßbach, 1980: Clusteranalysen; Stuttgart:Kohlhammer A. Auswahl der Merkmale Festlegung des
MehrClusteranalyse. Florian Löwenstein. Clusteranalyse eoda GmbH
Florian Löwenstein www.eoda.de 1 Übersicht Hypothesenfreies Verfahren Gehört zur Familie der Data-Mining-Techniken Ganze Verfahrensfamilie Ziel: Informationsreduktion und damit verbunden Abstraktion Typische
MehrAufgaben zur Multivariaten Statistik
Prof. Dr. Reinhold Kosfeld Fachbereich Wirtschaftswissenschaften Universität Kassel Aufgaben zur Multivariaten Statistik Teil : Aufgaben zur Einleitung. Was versteht man unter einer univariaten, bivariaten
MehrInhaltsverzeichnis. 1 Über dieses Buch Zum Inhalt dieses Buches Danksagung Zur Relevanz der Statistik...
Inhaltsverzeichnis 1 Über dieses Buch... 11 1.1 Zum Inhalt dieses Buches... 13 1.2 Danksagung... 15 2 Zur Relevanz der Statistik... 17 2.1 Beispiel 1: Die Wahrscheinlichkeit, krank zu sein, bei einer positiven
MehrMaterialband. Marktforschung
Materialband Marktforschung Multivariate statistische Verfahren 5. Sem. Prof. Dr. Rößler Themenbereiche 1 Regressionsanalyse 2 Varianzanalyse 3 Diskriminanzanalyse 4 Faktorenanalyse 5 Clusteranalyse Regressionsanalyse
MehrClusteranalyse. Clusteranalyse. Fragestellung und Aufgaben. Abgrenzung Clusteranalyse - Diskriminanzanalyse. Rohdatenmatrix und Distanzmatrix
TECHNISCHE UNIVERSITÄT MÜNCHEN-WEIHENSTEPHAN MATHEMATIK UND STATISTIK INFORMATIONS- UND DOKUMENTATIONSZENTRUM R. Biometrische und Ökonometrische Methoden II SS 00 Fragestellung und Aufgaben Abgrenzung
Mehrz Partitionierende Klassifikationsverfahren
4.4 Partitionierende Klassifikationsverfahren Partitionierenden Verfahren: - gegeben: eine Zerlegung der Objektmenge in G Cluster, die jedoch nicht als "optimal" angesehen wird; - Verbesserung der Ausgangspartition
MehrClusteranalyse und Display-Methoden
Ziel: Erkennen von Strukturen in Daten Vergleich der Algorithmen für die Clusteranalyse Beurteilung verschiedener Displaymethoden Stabilitätsdiagramme Betreuer: Dipl.-Chem. Stefan Hesse IAAC, Lehrbereich
MehrClusteranalyse mit SPSS
Autor: Thomas Nirschl, Amt für Stadtforschung und Statistik, Stadt Nürnberg Clusteranalyse mit SPSS Das Statistikpaket SPSS (aktuell in der Version 17 vorliegend) stellt dem Anwender eine große Vielfalt
Mehr6. Multivariate Verfahren Zufallszahlen
4. Zufallszahlen 6. Multivariate Verfahren Zufallszahlen - werden nach einem determinist. Algorithmus erzeugt Pseudozufallszahlen - wirken wie zufäll. Zahlen (sollen sie jedenfalls) Algorithmus: Startwert
MehrClustering 2010/06/11 Sebastian Koch 1
Clustering 2010/06/11 1 Motivation Quelle: http://www.ha-w.de/media/schulung01.jpg 2010/06/11 2 Was ist Clustering Idee: Gruppierung von Objekten so, dass: Innerhalb einer Gruppe sollen die Objekte möglichst
MehrKlassifikation und Ähnlichkeitssuche
Klassifikation und Ähnlichkeitssuche Vorlesung XIII Allgemeines Ziel Rationale Zusammenfassung von Molekülen in Gruppen auf der Basis bestimmter Eigenschaften Auswahl von repräsentativen Molekülen Strukturell
MehrDie Faktorenanalyse. Anwendung dann, wenn zwischen beobachtbaren und nicht direkt beobachtbaren Variablen ein kausales Verhältnis vermutet wird
Die Faktorenanalyse Zielsetzung Datenreduktion: eine größere Anzahl von Variablen auf eine kleinere Anzahl unabhängiger Einflussgrößen zurückführen Grundlegende Idee Direkt beobachtbare Variablen spiegeln
Mehr4.Tutorium Multivariate Verfahren
4.Tutorium Multivariate Verfahren - Clusteranalyse - Hannah Busen: 01.06.2015 und 08.06.2015 Nicole Schüller: 02.06.2015 und 09.06.2015 Institut für Statistik, LMU München 1 / 17 Gliederung 1 Idee der
MehrDeskriptive Statistik
Deskriptive Statistik 1 Ziele In der deskriptiven (=beschreibenden) Statistik werden Untersuchungsergebnisse übersichtlich dargestellt, durch Kennzahlen charakterisiert und grafisch veranschaulicht. 2
MehrCharakterisierung von 1D Daten
Charakterisierung von D Daten Mittelwert: µ, Schätzung m x = x i / n Varianz σ2, Schätzung: s2 = (s: Standardabweichung) Höhere Momente s 2 = ( x i m x ) 2 n ( ) Eine Normalverteilung ist mit Mittelwert
MehrÄhnlichkeits- und Distanzmaße
Einheit 1 Ähnlichkeits- und Distanzmaße IFAS JKU Linz c 2015 Multivariate Verfahren 1 0 / 41 Problemstellung Ziel: Bestimmung von Ähnlichkeit zwischen n Objekten, an denen p Merkmale erhoben wurden. Die
MehrMultivariate Verfahren
Multivariate Verfahren Oliver Muthmann 31. Mai 2007 Gliederung 1 Einführung 2 Varianzanalyse (MANOVA) 3 Regressionsanalyse 4 Faktorenanalyse Hauptkomponentenanalyse 5 Clusteranalyse 6 Zusammenfassung Komplexe
MehrPräsentation der Ergebnisse von Clusteranalysen Antje Seidel-Schulze, Difu Berlin
Präsentation der Ergebnisse von Clusteranalysen VDSt-Frühjahrstagung 1.4.2008 in Saarbrücken Gliederung Interpretation der Ausgabedatei von SPSS Distanz- bzw. Näherungsmatrix Zuordnungsübersicht Dendrogramme
MehrMusterlösung. Modulklausur Multivariate Verfahren
Musterlösung Modulklausur 31821 Multivariate Verfahren 27. März 2015 Aufgabe 1 Kennzeichnen Sie die folgenden Aussagen über die beiden Zufallsvektoren ([ ] [ ]) ([ ] [ ]) 2 1 0 1 25 2 x 1 N, x 3 0 1 2
MehrInhaltsverzeichnis 1. EINLEITUNG...1
VII Inhaltsverzeichnis Vorwort...V Verzeichnis der Abbildungen...XII Verzeichnis der Tabellen... XVI Verzeichnis der Übersichten...XXII Symbolverzeichnis... XXIII 1. EINLEITUNG...1 2. FAKTORENANALYSE...5
MehrFaktorenanalysen mit SPSS. Explorative Faktorenanalyse als Instrument der Dimensionsreduktion. Interpretation des SPSS-Output s
Explorative Faktorenanalyse als Instrument der Dimensionsreduktion Beispiel: Welche Dimensionen charakterisieren die Beurteilung des sozialen Klimas in der Nachbarschaft? Variablen: q27a bis q27g im Datensatz
MehrFaktorenanalysen mit SPSS. Explorative Faktorenanalyse als Instrument der Dimensionsreduzierung. Interpretation des SPSS-Output s
Explorative Faktorenanalyse als Instrument der Dimensionsreduzierung Beispiel: Welche Dimensionen charakterisieren die Beurteilung des sozialen Klimas in der Nachbarschaft? Variablen: q27a bis q27g im
MehrDr. Reinhard Strüby SAS Deutschland Business Competence Center Analytical Solutions Copyright 2004, SAS Institute Inc. All rights reserved.
Clusterverfahren bewährte statistische Technik und Basis für Data Mining Analysen Dr. Reinhard Strüby SAS Deutschland Business Competence Center Analytical Solutions Copyright 2004, SAS Institute Inc.
Mehr4.3 Hierarchische Klassifikationsverfahren
4.3 Hierarchische Klassifikationsverfahren Hierarchische Klassifikationsverfahren: Einsatz zum Zwecke einer Aufdeckung von lusterstrukturen, wenn keine Kenntnisse über die Gruppenzahl verfügbar sind Agglomerativen
MehrHäufigkeitsauszählungen, zentrale statistische Kennwerte und Mittelwertvergleiche
Lehrveranstaltung Empirische Forschung und Politikberatung der Universität Bonn, WS 2007/2008 Häufigkeitsauszählungen, zentrale statistische Kennwerte und Mittelwertvergleiche 30. November 2007 Michael
MehrHierarchische Clusteranalyse
Hierarchische Clusteranalyse Unter dem Menupunkt Statistik - Klassifizieren finden sich sowohl agglomerative ( hierarchische ) als auch partitionierende ( Clusterzentren ) Clusteranalyseverfahren. Da die
Mehrder Datenauswertung (Übung)
Fortgeschrittene Verfahren der Datenauswertung (Übung) 4.Veranstaltung, 23.01.2015 Multidimensionale Skalierung Dipl.-Kffr. Vanessa Pfegfeidel Prof. Dr. Dirk Temme Lehrstuhl für Methoden der empirischen
MehrDeskription, Statistische Testverfahren und Regression. Seminar: Planung und Auswertung klinischer und experimenteller Studien
Deskription, Statistische Testverfahren und Regression Seminar: Planung und Auswertung klinischer und experimenteller Studien Deskriptive Statistik Deskriptive Statistik: beschreibende Statistik, empirische
MehrStatistik II: Klassifikation und Segmentierung
Medien Institut : Klassifikation und Segmentierung Dr. Andreas Vlašić Medien Institut (0621) 52 67 44 vlasic@medien-institut.de Gliederung 1. Faktorenanalyse 2. Clusteranalyse 3. Key Facts 2 I 14 Ziel
MehrComputergestützte Methoden. Master of Science Prof. Dr. G. H. Franke WS 07/08
Computergestützte Methoden Master of Science Prof. Dr. G. H. Franke WS 07/08 1 Seminarübersicht 1. Einführung 2. Recherchen mit Datenbanken 3. Erstellung eines Datenfeldes 4. Skalenniveau und Skalierung
MehrAngewandte Statistik mit R. Eine Einführung für Ökonomen und
Reiner Hellbrück Angewandte Statistik mit R Eine Einführung für Ökonomen und Sozialwissenschaftler 3. Auflage Springer Gabler Inhaltsverzeichnis Vorwort zur dritten Auflage Vorwort zur ersten Auflage Vorwort
MehrVII Unüberwachte Data-Mining-Verfahren
VII Unüberwachte Data-Mining-Verfahren Clusteranalyse Assoziationsregeln Generalisierte Assoziationsregeln mit Taxonomien Formale Begriffsanalyse Self Organizing Maps Institut AIFB, 00. Alle Rechte vorbehalten.
Mehrhtw saar 1 EINFÜHRUNG IN DIE STATISTIK: BESCHREIBENDE STATISTIK
htw saar 1 EINFÜHRUNG IN DIE STATISTIK: BESCHREIBENDE STATISTIK htw saar 2 Grundbegriffe htw saar 3 Grundgesamtheit und Stichprobe Ziel: Über eine Grundgesamtheit (Population) soll eine Aussage über ein
Mehr5. Clusteranalyse. Lernziele: Grundlegende Algorithmen der Clusteranalyse kennen, ihre Eigenschaften
5. Clusteranalyse Lernziele: Grundlegende Algorithmen der Clusteranalyse kennen, ihre Eigenschaften benennen und anwenden können, einen Test auf das Vorhandensein einer Clusterstruktur kennen, verschiedene
Mehr1 Beispiele multivariater Datensätze... 3
Inhaltsverzeichnis Teil I Grundlagen 1 Beispiele multivariater Datensätze... 3 2 Elementare Behandlung der Daten... 15 2.1 Beschreibung und Darstellung univariater Datensätze... 15 2.1.1 Beschreibung und
MehrDie Clusteranalyse 24.06.2009. Clusteranalyse. Grundidee Mögliche Anwendungsgebiete gg Vorgehensweise Beispiele. methodenlehre ll Clusteranalyse
Clusteranalyse Thomas Schäfer SS 2009 1 Die Clusteranalyse Grundidee Mögliche Anwendungsgebiete gg Vorgehensweise Beispiele Thomas Schäfer SS 2009 2 1 Die Clusteranalyse Grundidee: Eine heterogene Gesamtheit
Mehr1 Übungsaufgaben zur Regressionsanalyse
1 Übungsaufgaben zur Regressionsanalyse 1 1 Übungsaufgaben zur Regressionsanalyse 1.1 Übungsaufgaben zu Seite 1 und 2 1. Wie lautet die Regressionsfunktion? 2. Welche Absatzmenge ist im Durchschnitt bei
MehrEinführung in die Varianzanalyse mit SPSS
Einführung in die Varianzanalyse mit SPSS SPSS-Benutzertreffen am URZ Carina Ortseifen 6. Mai 00 Inhalt. Varianzanalyse. Prozedur ONEWAY. Vergleich von k Gruppen 4. Multiple Vergleiche 5. Modellvoraussetzungen
Mehr5. Clusteranalyse Vorbemerkungen. 5. Clusteranalyse. Grundlegende Algorithmen der Clusteranalyse kennen, ihre Eigenschaften
5. Clusteranalyse Vorbemerkungen 5. Clusteranalyse Lernziele: Grundlegende Algorithmen der Clusteranalyse kennen, ihre Eigenschaften benennen und anwenden können, einen Test auf das Vorhandensein einer
MehrEinführung in SPSS. Sitzung 4: Bivariate Zusammenhänge. Knut Wenzig. 27. Januar 2005
Sitzung 4: Bivariate Zusammenhänge 27. Januar 2005 Inhalt der letzten Sitzung Übung: ein Index Umgang mit missing values Berechnung eines Indexes Inhalt der letzten Sitzung Übung: ein Index Umgang mit
MehrKorrespondenzanalyse
Seite 1 von 5 Korrespondenzanalyse Ziel der Korrespondenzanalyse... 1 Anforderungen an die Daten (Stärke des Verfahrens)... 1 Einordnung in die multivariaten Verfahren... 1 Normierung der Daten... 1 Festlegung
MehrKap. 5 Spatial (räumliches) Data Mining
Kap. 5 Spatial (räumliches) Data Mining Univ.-Prof. Dr.-Ing. Wolfgang Reinhardt AGIS / Inst. Für Angewandte Informatik (INF4) Universität der Bundeswehr München Wolfgang.Reinhardt@unibw.de www.agis.unibw.de
MehrClusteranalyse. Mathematische Symbole Anzahl der Objekte, Versuchspersonen
Clusteranalyse Ziel: Auffinden von Gruppen ( Cluster ) ähnlicher Obekte (bezogen auf die ausgewählten Variablen). Obekte i selben Cluster haben ähnliche Eigenschaften, Obekte in verschiedenen Clustern
MehrHaben Sie schon mal geclustert? Beitrag zum Workshop Clusteranalyse auf der Frühjahrstagung der Städtestatistik 2008 in Saarbrücken
Haben Sie schon mal geclustert? Beitrag zum Workshop Clusteranalyse auf der Frühjahrstagung der Städtestatistik 2008 in Saarbrücken Dr. Ralf Gutfleisch, Frankfurt am Main Haben Sie schon mal geclustert?
Mehr3 Diskriminationsanalyse 3.1 Diskriminationsanalyse mit zwei Gruppen
Lineare Diskrimination mit zwei Gruppen 6.5.3 - - 3 Diskriminationsanalyse 3. Diskriminationsanalyse mit zwei Gruppen Schreibweise: p unabhängige Merkmale: X, X,..., X p (metrisch; auch ordinal möglich,
MehrDeskriptive Statistik
Helge Toutenburg Christian Heumann Deskriptive Statistik Eine Einführung in Methoden und Anwendungen mit R und SPSS Siebte, aktualisierte und erweiterte Auflage Mit Beiträgen von Michael Schomaker 4ü Springer
MehrEinführung in die Statistik für Politikwissenschaftler Sommersemester 2011
Einführung in die Statistik für Politikwissenschaftler Sommersemester 2011 Es können von den Antworten alle, mehrere oder keine Antwort(en) richtig sein. Nur bei einer korrekten Antwort (ohne Auslassungen
MehrMultivariate Statistische Methoden und ihre Anwendung
Multivariate Statistische Methoden und ihre Anwendung in den Wirtschafts- und Sozialwissenschaften Von Prof. Dr. Hans Peter Litz Carl von Ossietzky Universität Oldenburg R. Oldenbourg Verlag München Wien
MehrEinführung in die Statistik
Elmar Klemm Einführung in die Statistik Für die Sozialwissenschaften Westdeutscher Verlag INHALTSVERZEICHNIS 1. Einleitung und Begrifflichkeiten 11 1.1 Grundgesamtheit, Stichprobe 12 1.2 Untersuchungseinheit,
MehrKarl Entacher. FH-Salzburg
Ahorn Versteinert Bernhard.Zimmer@fh-salzburg.ac.at Statistik @ HTK Karl Entacher FH-Salzburg karl.entacher@fh-salzburg.ac.at Beispiel 3 Gegeben sind 241 NIR Spektren (Vektoren der Länge 223) zu Holzproben
MehrEmpirische Analysen mit dem SOEP
Empirische Analysen mit dem SOEP Methodisches Lineare Regressionsanalyse & Logit/Probit Modelle Kurs im Wintersemester 2007/08 Dipl.-Volksw. Paul Böhm Dipl.-Volksw. Dominik Hanglberger Dipl.-Volksw. Rafael
MehrSPSS-Ausgabe 1: Univariate Varianzanalyse. Profildiagramm. [DatenSet1] D:\Sozialwiss2006_7\STAT2\Daten\mathsalaries.sav. Seite 1
SPSS-Ausgabe : Univariate Varianzanalyse [DatenSet] D:\Sozialwiss2006_7\STAT2\Daten\mathsalaries.sav Tests der Zwischensubjekteffekte Abhängige Variable: Einkommen Quelle Korrigiertes Modell Konstanter
MehrHypothesentests mit SPSS
Beispiel für eine einfache Regressionsanalyse (mit Überprüfung der Voraussetzungen) Daten: bedrohfb_v07.sav Hypothese: Die Skalenwerte auf der ATB-Skala (Skala zur Erfassung der Angst vor terroristischen
MehrAngewandte Statistik mit R
Reiner Hellbrück Angewandte Statistik mit R Eine Einführung für Ökonomen und Sozialwissenschaftler 2., überarbeitete Auflage B 374545 GABLER Inhaltsverzeichnis Vorwort zur zweiten Auflage Tabellenverzeichnis
MehrChemometrie: von Daten zu Information
Chemometrie: von Daten zu Information Chemometrie: Definition Warnungen Daten von Anscombe: numerisch x y x y x y x y 0 8.04 0 9.4 0 7.46 8 6.58 8 6.95 8 8.4 8 6.77 8 5.76 3 7.58 3 8.74 3 2.74 8 7.7 9
MehrAlgorithmen zur Kundensegmentierung
Algorithmen zur Kundensegmentierung Heuristische, semiparametrische und parametrische Clusterverfahren Patrick Mair Inhalt Einführung Nichtprobabilistische Clusterung Hierarchische Clusterverfahren k-means
Mehr3. Lektion: Deskriptive Statistik
Seite 1 von 5 3. Lektion: Deskriptive Statistik Ziel dieser Lektion: Du kennst die verschiedenen Methoden der deskriptiven Statistik und weißt, welche davon für Deine Daten passen. Inhalt: 3.1 Deskriptive
MehrStatistik für Human- und Sozialwissenschaftler
Jürgen Bortz Statistik für Human- und Sozialwissenschaftler Sechste, vollständig überarbeitete und aktualisierte Auflage mit 84 Abbildungen und 242 Tabellen 4y Springer Inhaltsverzeichnis* > Vorbemerkungen:
MehrAufgabenstellung Klausur
Aufgabenstellung Klausur Methoden der Marktforschung 02.03.2004 Der Automobilhersteller People Car möchte nach erfolgreicher Markteinführung des neuen Modells Wolf in Deutschland dieses Modell auch auf
MehrMultivariate Statistische Methoden
Multivariate Statistische Methoden und ihre Anwendung in den Wirtschafts- und Sozialwissenschaften Von Prof. Dr. Hans Peter Litz Carl von Ossietzky Universität Oldenburg v..v.-'... ':,. -X V R.Oldenbourg
MehrMultivariate statistische Analyseverfahren
Prof. Dr. Petra Stein Universität Duisburg-Essen Institut für Soziologie Wintersemester 2011/2012 Multivariate statistische Analyseverfahren MA Soziologie, MA Survey Methodology Verfahren mit abhängigen
MehrMathematisch-Statistische Verfahren des Risiko-Managements - SS
Clusteranalyse Mathematisch-Statistische Verfahren des Risiko-Managements - SS 2004 Allgemeine Beschreibung (I) Der Begriff Clusteranalyse wird vielfach als Sammelname für eine Reihe mathematisch-statistischer
MehrDie Funktion f wird als Regressionsfunktion bezeichnet.
Regressionsanalyse Mit Hilfe der Techniken der klassischen Regressionsanalyse kann die Abhängigkeit metrischer (intervallskalierter) Zielgrößen von metrischen (intervallskalierten) Einflussgrößen untersucht
MehrPrüfen von Unterschiedshypothesen für ordinale Variablen: Mann-Whitney Test und Ko
Prüfen von Unterschiedshypothesen für ordinale Variablen: Mann-Whitney Test und Ko Sven Garbade Fakultät für Angewandte Psychologie SRH Hochschule Heidelberg sven.garbade@hochschule-heidelberg.de Statistik
MehrMethoden der Klassifikation und ihre mathematischen Grundlagen
Methoden der Klassifikation und ihre mathematischen Grundlagen Mengenlehre und Logik A B "Unter einer 'Menge' verstehen wir jede Zusammenfassung M von bestimmten wohlunterschiedenen Objekten unserer Anschauung
MehrEigene MC-Fragen SPSS. 1. Zutreffend auf die Datenerfassung und Datenaufbereitung in SPSS ist
Eigene MC-Fragen SPSS 1. Zutreffend auf die Datenerfassung und Datenaufbereitung in SPSS ist [a] In der Variablenansicht werden für die betrachteten Merkmale SPSS Variablen definiert. [b] Das Daten-Editor-Fenster
MehrMultivariate Analysemethoden
Multivariate Analysemethoden Multivariate Distanz Multivariate Normalverteilung Minimum Distance Classifier Bayes Classifier Günter Meinhardt Johannes Gutenberg Universität Mainz Ziele Methoden Multivariate
MehrKorrespondenzanalyse. Gliederung. Helge Siems. Theoretische Grundlagen und die Anwendung in SPSS.
Korrespondenzanalyse Theoretische Grundlagen und die Anwendung in SPSS. Ein Vortrag von Jana Bombik, Erdmute Jahn, Claudia Philipp und Helge Siems an der Hochschule Harz im Rahmen der Vertiefungsrichtung
MehrGibt es einen Zusammenhang zwischen Merkmalen? Korrelationen
Arbeitsblatt SPSS Kapitel 8 Seite Gibt es einen Zusammenhang zwischen Merkmalen? Korrelationen Wie in allen Kapiteln gehen wir im Folgenden davon aus, dass Sie die Datei elporiginal.sav geöffnet haben.
MehrKapitel 6. Zusammenfassung der wichtigsten Ergebnisse dieser Arbeit
Kapitel 6 Zusammenfassung der wichtigsten Ergebnisse dieser Arbeit 159 160 Kapitel 6. Zusammenfassung der Ergebnisse Im Fokus der vorliegenden Arbeit steht die Frage nach der Eignung verschiedener Matchingverfahren
MehrW-Seminar: Versuche mit und am Menschen 2017/2019 Skript
3. Deskriptive Statistik Die deskriptive (auch: beschreibende) Statistik hat zum Ziel, [ ] Daten durch Tabellen, Kennzahlen [ ] und Grafiken übersichtlich darzustellen und zu ordnen. Dies ist vor allem
MehrForschungsmethodik II, SS 2010
Forschungsmethodik II, SS 2010 Michael Kickmeier-Rust Teil 5, 26. Mai 2010 Prinzipien statistischer Verfahren: Conclusio 1 Prinzipien statistischer Verfahren > χ 2 Beispiel: 4-Felder χ 2 Beobachtet: Erwartet:
MehrMehrdimensionale Skalierung
Mehrdimensionale Skalierung Datenanalyse Dietmar Maringer Abteilung für Quantitative Methoden, WWZ der Universität Basel Herbstsemester 2010 D Maringer: Datenanalyse Mehrdimensionale Skalierung (1) Problemstellung
MehrUnivariate Kennwerte mit SPSS
Univariate Kennwerte mit SPSS In diesem Paper wird beschrieben, wie eindimensionale Tabellen und Kennwerte mit SPSS erzeugt werden. Eine Herleitung der Kennwerte und eine inhaltliche Interpretation der
MehrLehrbuch der Statistik
Jürgen Bortz Lehrbuch der Statistik Für Sozialwissenschaftler Zweite, vollständig neu bearbeitete und erweiterte Auflage Mit 71 Abbildungen und 223 Tabellen Springer-Verlag Berlin Heidelberg New York Tokyo
MehrStatistik. Für Sozialwissenschaftler. Dritte, neu bearbeitete Auflage Mit 71 Abbildungen und 224 Tabellen
Jürgen Bortz Statistik Für Sozialwissenschaftler Dritte, neu bearbeitete Auflage Mit 71 Abbildungen und 224 Tabellen Springer-Verlag Berlin Heidelberg Newlfork London Paris Tokyo Inhaltsverzeichnis Einleitung
MehrInhaltsverzeichnis Grundlagen aufigkeitsverteilungen Maßzahlen und Grafiken f ur eindimensionale Merkmale
1. Grundlagen... 1 1.1 Grundgesamtheit und Untersuchungseinheit................ 1 1.2 Merkmal oder statistische Variable........................ 2 1.3 Datenerhebung.........................................
MehrStatistische Methoden in den Umweltwissenschaften
Statistische Methoden in den Umweltwissenschaften Korrelationsanalysen Kreuztabellen und χ²-test Themen Korrelation oder Lineare Regression? Korrelationsanalysen - Pearson, Spearman-Rang, Kendall s Tau
MehrConstantin von Craushaar FH-Management & IT Statistik Angewandte Statistik (Übungen) Folie 1
FHManagement & IT Folie 1 Angewandte Statistik Übersicht Semester 1 Einführung ins SPSS Auswertung im SPSS anhand eines einfachen Beispieles Häufigkeitsauswertungen Grafiken Datenmanipulationen Mehrfachantworten
Mehr0 Einführung: Was ist Statistik
0 Einführung: Was ist Statistik 1 Datenerhebung und Messung 2 Univariate deskriptive Statistik Häufigkeitsverteilungen Statistische Kennwerte 3 Multivariate Statistik 4 Regression 5 Ergänzungen Deskriptive
MehrWolf falsch eingeschätzt und deshalb falsche Werbemaßnahmen ergriffen.
Aufgabenstellung Klausur Methoden der Marktforschung 0.08.004 Der Automobilhersteller People Car verkauft eine neue Variante seines Erfolgsmodells Wolf zunächst nur auf einem Testmarkt. Dabei muss das
MehrMultivariate Analysemethoden
Multivariate Analysemethoden.0.008 Günter Meinhardt Johannes Gutenberg Universität Mainz a) Ein Punkt ist, was keine Teile hat b) Eine Linie ist ein Länge ohne Breite p) Es soll gefordert werden, dass
MehrTeil: lineare Regression
Teil: lineare Regression 1 Einführung 2 Prüfung der Regressionsfunktion 3 Die Modellannahmen zur Durchführung einer linearen Regression 4 Dummyvariablen 1 Einführung o Eine statistische Methode um Zusammenhänge
Mehr(x i x) 2. (x i a) 2, x i x med. x i a. i=1. 3 Lage- und Streuungsmaße 134
Lagemaße als Lösung eines Optimierungsproblems 3.1 Lagemaße Gegeben sei die Urliste x 1,...,x n eines intervallskalierten Merkmals X, die zu einer Zahl a zusammengefasst werden soll. Man könnte sagen,
MehrEinfache statistische Auswertungen mit dem Programm SPSS
Einfache statistische Auswertungen mit dem Programm SPSS Datensatz: fiktive_daten.sav Dipl. Päd. Anne Haßelkus Dr. Dorothea Dette-Hagenmeyer 11/2011 Überblick 1 Deskriptive Statistiken; Mittelwert berechnen...
Mehr