4 PROBABILISTISCHE CLUSTERANALYSEVERFAHREN

Save this PDF as:
 WORD  PNG  TXT  JPG

Größe: px
Ab Seite anzeigen:

Download "4 PROBABILISTISCHE CLUSTERANALYSEVERFAHREN"

Transkript

1 4 PROBABILISTISCHE CLUSTERANALYSEVERFAHREN 4.1 Einleitende Übersicht Die probabilistischen Clusteranalyseverfahren unterscheiden sich von den im vorausehenden Kapitel behandelten deterministischen Verfahren dadurch, daß ein Objekt jedem Cluster nur mit einer bestimmten Wahrscheinlichkeit π(k/) anehört. 1 π(k/) ist die Wahrscheinlichkeit, mit der Objekt dem Cluster k anehört. Wir werden diese Wahrscheinlichkeit im folenden als Zuordnunswahrscheinlichkeit bezeichnen. Auch die Bezeichnun Rekrutierunswahrscheinlichkeiten ("recruitment probabilities") ist üblich (Lazarsfeld und Henry 1968: 36-39). In diesem Kapitel werden folende probabilistische Verfahren behandelt: Latente Profilanalyse (Analyse latenter Klassen für quantitative Variablen, Abschnitt 4.) Analyse latenter Klassen für nominalskalierte Variablen (Abschnitt 4.3) Analyse latenter Klassen für ordinalskalierte Variablen (Abschnitt 4.4) Analyse latenter Klassen für emischte Variablen (Abschnitt 4.5) Alle Verfahren lassen sich als Verallemeinerun des K-Means-Verfahren entwickeln. Die Verfahren einen sich somit - wie das K-Means-Verfahren - nur für eine objektorientierte Clusteranalyse. Technisch bestehen die Modifikationen im folenden: 1. Der Schritt des Alorithmus der K-Means-Verfahren, in dem jedes Objekt dem Cluster zueordnet wird, zu dem die quadrierte euklidische Distanz minimal ist, wird dahinehend eändert, daß die Zuordnunswahrscheinlichkeiten π(k/) berechnet werden. Dazu sind in Abhänikeit vom Meßniveau bestimmte Verteilunsannahmen erforderlich. Ferner eht in die Berechnun die Annahme der lokalen Unabhänikeit ein (siehe dazu später).. Die Klassenzentren x und Klassenanteilswerte π(k) (Schritt 3 des Alorithmus des j K-Means-Verfahrens) werden als Maximum-Likelihood-Schätzer berechnet. Das 1 Zur Beschreibun der Modellannahmen werden im folenden riechische Buchstaben verwendet, für deren eschätzte Werte arabische.

2 heißt, sie werden so bestimmt, daß die empirische Verteilun der Objekte bestmölich durch das Modell reproduziert wird. Mit Ausnahme dieser beiden Modifikationen erfolt die Berechnun nach dem Alorithmus der K-Means-Verfahren. Dieser Alorithmus für probabilistische Clusteranalyseverfahren wird in der Literatur als EM-Alorithmus (=Expected-Maximum- Likelihood-Estimator) bezeichnet und eht auf Goodman (1974) zurück. Der EM-Alorithmus hat sich seit seiner Einführun in zahlreichen Anwendunssituationen bewährt (siehe z.b. Bock und Aitkin 1981, DeSoete und DeSarbo 1991, Laneheine und Van de Pol 1990, Ridon und Tsutakawa 1983, Van de Pol und de Leeuw 1986 u.a.). Das Konverenzverhalten zur Lösun einer Schätzaufabe wurde von Dempster, Laird und Rubin (1977) untersucht. Das Konzept der lokalen Unabhänikeit ist für die in diesem Kapitel behandelten Verfahren zentral. Es ist aus der Analyse latenter Strukturen mit der Analyse latenter Klassen als Submodell von Lazarsfeld und Henry (1968) bekannt (siehe dazu auch z.b. Denz 198) und eht von folender Modellvorstellun aus: 1. Den Daten lieen K unbekannte (=nicht beobachtete) Klassen zurunde. Diese werden als latente Klassen bezeichnet und. erklären die Zusammenhäne zwischen den untersuchten beobachteten (=manifesten) Variablen. Werden die (latenten) Klassen also als Kontrollvariablen in die Analyse eineführt, verschwinden die empirischen Zusammenhäne. Die manifesten Variablen sind innerhalb jeder Klasse unabhäni. Ween der Beziehun zur Analyse latenter Klassen von Lazarsfeld und Henry (1968) wurde für die in diesem Kapitel behandelten Verfahren die Bezeichnun Analyse latenter Klassen ewählt (Ausnahme: Latente Profilanalyse). Anstelle von "Clustern" wird von "latenten Klassen" oder kurz von "Klassen" esprochen, obwohl man sich selbstverständlich unter den "Klassen" "Cluster" vorstellen kann. Die behandelten Verfahren lassen sich vorstellen als: 1. Verallemeinerun des K-Means-Verfahrens: Die Annahme einer deterministischen Zuordnun der Objekte zu den Klassen wird fallenelassen.. Verallemeinerun der klassischen Analyse latenter Klassen von Lazarsfeld und Henry (1968): Neben dichotomen Variablen können nominalskalierte Variablen mit beliebi vielen Auspräunen, ordinalskalierte und/oder quantitative Variablen untersucht werden. 3. Submodelle von Mischverteilunsverfahren: Mischverteilunsverfahren (Kaufmann und Pape 1984: , Wolfe 1970 u.a.) ehen allemein von folender Pro-

3 blemstellun aus: Die empirische Verteilun der Objekte in den untersuchten Variablen ist eine Mischun von Wahrscheinlichkeitsverteilunen, z.b. von K m-dimensionalen Normalverteilunen mit den Mittelwertsvektoren µ k und den Kova- rianzmatrizen COV k mit den Elementen σ( k) jj* (σ( k) jj* = Kovarianz (j j*) bzw. Varianz (j=j*) zwischen den Variablen j und j* in der k-ten Normalverteilun). Aufabe von Mischverteilunsverfahren ist die Schätzun des Mischunsverhältnisses und der Parameter der einzelnen Wahrscheinlichkeitsverteilunen. Werden bestimmte zusätzliche Annahmen etroffen, können die Mischverteilunen durch die hier behandelten Verfahren eschätzt werden. So z.b. eht die latente Profilanalyse von der Modellvorstellun aus, daß K m-dimensionale Normalverteilunen vorlieen, wobei die Variablen innerhalb der (latenten) Klassen unabhäni sind. 4. Schließlich können die probabilistischen Clusteranalyseverfahren als Clusteranalyseverfahren interpretiert werden, die eine Modellierun zufällier Meßfehler erlauben (Espeland und Handelman 1989, Van de Pol und de Leeuw 1986 u.a.). Ein weiterer Unterschied zu den deterministischen Verfahren des Kapitels 3 besteht darin, daß das durch unterschiedliche Skaleneinheiten und Meßniveaus bedinte Problem der Nichtverleichbarkeit nicht auftritt, da zur Berechnun der Zuordnunswahrscheinlichkeiten π(k/) mit im Intervall [0,1] normierten Wahrscheinlichkeiten p(x j /k) erechnet wird. Umekehrt haben natürlich die probabilistischen Clusteranalyseverfahren auch bestimmte Nachteile. Diese bestehen zum einen darin, daß rößere Stichproben für eine konverente Lösun - insbesondere für die latente Profilanalyse - benötit werden als für die K-Means-Verfahren. Wenn wir das in Abschnitt durcheführte Rechenexperiment zur Veranschaulichun des Konverenzverhaltens aufreifen (siehe Tabelle 3.7.1), so wird bei zufällien Startwerten selbst bei einer Stichprobenröße von für die latente Profilanalyse keine konverente Lösun efunden. 1 Mit der Zahl der Variablen verbessert sich das Konverenzverhalten entscheidend (siehe Tabelle 4.1.1). Wie beim K-Means-Verfahren konverieren die Schätzunen ab einer Stichprobe von 500. Bei den in der Tabelle wiedereebenen Simulationserebnissen wurde von folenden Annahmen auseanen: Es lieen zwei leich roße Klassen vor. Klasse 1 besitzt in den Variablen X 1 und X eine Normalverteilun mit einem Mittelwert von -1 und einer Varianz von 1, Klasse eine Normalverteilun mit einem Mittelwert von +1 und einer Varianz von ebenfalls 1. Ab einer Stichprobe von n=500 werden die wahren Klassenmittelwerte somit relativ ut eschätzt. 1 Ein ähnlich schlechtes Konverenzverhalten berichten Kaufmann und Pape (1984: 433).

4 Allemein hänt das Konverenzverhalten bei der latenten Profilanalyse von dem Überlappunsanteil ab (Kaufmann und Pape 1984: 433). Um so eriner der Überlappunsanteil ist, desto besser konveriert das Verfahren asymptotisch. Das heißt, zur Schätzun der Modellparameter wird eine kleinere Stichprobe benötit. Das Konverenzverhalten der latenten Klassenanalyse für ordinale und nominale Variablen ist allemein besser, da bei diesen beiden Verfahren wenier Parameter zu schätzen sind. Tabelle 4.1.1: Veranschaulichun des asymptotischen Konverenzverhaltens der probabilistischen Clusteranalyseverfahren am Beispiel der latenten Profilanalyse Stichprobenröße C1 C Stichprobenröße C C Ein weiterer "Nachteil" der Verfahren kann darin esehen werden, daß strenenommen vor der Analyse die Identifikation des zu schätzenden Modells untersucht werden muß. Ein zu schätzendes Modell M wird dann als identifiziert bezeichnet, wenn die zu schätzenden Modellparameter P eindeuti bestimmt sind. Das heißt, es darf kein anderes Modell M* mit anderen Modellparametern P* eben, das dieselben Modelldaten produziert. Eine notwendie Bedinun für die Eindeutikeit (=Identifikation) eines Modells ist, daß die Zahl der empirischen Informationen rößer der Zahl der zu schätzenden Modellparameter ist (siehe dazu die Ausführunen). Bei Anwendun der latenten Profilanalyse kann immer davon auseanen werden, daß das untersuchte Modell identifiziert ist, da die notwendie Bedinun (mehr empirische Informationen als Modellparameter) i.d.r. erfüllt ist und Mischunen von m-dimensionalen Verteilunen identifizierbar sind (Kaufmann und Pape 1984: 4-43). Bei den anderen Verfahren muß dies nicht unbedint der Fall sein. Die Identifikation eines Modells kann dadurch eprüft werden, daß die esuchten Modellparameter als Funktion der empirischen Daten ausedrückt werden (Bacher 1990: 9-95, Lazarsfeld und Henry 1968: 59-68). Mitunter erfordert dieses Vorehen aber komplexe mathematische Operationen. Deshalb wurden Verfahren zur computerunterstützten Identifikationsprüfun entwickelt (Van de Pol, Laneheine und de Jon 1989: 9). Dabei wird eprüft, ob lineare Abhänikeiten zwischen den eschätzten Parametern bestehen. Ist dies der Fall,

5 ist das Modell nicht identifiziert. Umekehrt kann allerdins aus dem Fehlen von linearen Abhänikeiten nicht abeleitet werden, daß ein Modell identifiziert ist.

6 4. Latente Profilanalyse 4..1 Modellansatz und Alorithmus Das Modell der latenten Profilanalyse bzw. der Analyse latenter Klassen für quantitative Variablen wurde im Rahmen der Analyse latenter Strukturen (Lazarsfeld und Henry 1968: 8-39, Gibson 1966) entwickelt. Die Modellannahmen 1 sind: 1. Es lieen K latente Klassen vor.. Diese besitzen Anteilswerte von π(k) in der Grundesamtheit. 3. Jede Klasse k besitzt in jeder Klassifikationsvariablen j eine Normalverteilun mit dem Mittelwert (=Klassenzentrum) µ kj und der Varianz σ kj. 4. In jeder Klasse k sind die Variablen j und j* unabhäni. Die Normalverteilun in den Variablen können wir uns wie folt zustandeekommen vorstellen: Der empirisch beobachtete Wert x j eines Objekts aus k in der Variablen X j setzt sich aus einem zufällien Fehlerterm ε j und dem Klassenmittelwert µ kj zusammen: x j = µ kj + ε j. Der zufällie Fehlerterm ε j ist die Realisierun einer normalverteilten Zufallsvariablen ξ kj mit Erwartunswert 0 und Varianz σ kj. Er kann durch zufällie Meßfehler und/oder zufällie individuelle Unterschiede in den einzelnen Variablen entstehen. Da die Abweichunen ε j = x j - µ kj zufälli auftreten, sind sie in zwei Variablen j und j* unabhäni. Wäre dies nicht der Fall, würde es weni Sinn machen, von Zufällikeit zu sprechen. Formal ausedrückt sind somit die Ausnahmen: 1. x j = µ kj + ε j für alle, die Elemente aus k sind.. ε j ist die Realisierun einer normalverteilten Zufallsvariablen ξ kj. 3. ξ kj besitzt einen Erwartunswert von 0 und eine Varianz von σ kj. 4. Die Zufallsvariablen ξ kj sind unabhäni. Es ilt also COV(ξ kj,ξ kj* ) = 0. wobei x j der empirische Wert des Objekts aus der Klasse k in der Variablen j ist. µ kj ist der Klassenmittelwert in der Variablen j und ε j der zufällie Fehlerterm. Aus diesen Modellannahmen lassen sich folende Aussaen über die Mittelwerte, Varianzen und Kovarianzen der Gesamtpopulation ableiten (Lazarsfeld und Henry 1968: 9-31): 1 Zur Beschreibun der Modellannahmen werden im folenden riechische Buchstaben verwendet, für deren eschätzte Werte arabische. In dem klassischen Ansatz der latenten Profilanalyse ist eine Verteilunsannahme nicht erforderlich, da die Modellparameter nicht über die Maximum-Likelihood-Methode eschätzt werden.

7 (4..1) µ j = π ( k) µ kj. k ( µ µ ) ( µ ) (4..) σ = π ( µ. jj* k ) kj j kj* j* k (4..3) = σ = π ( k) σ + π ( k) ( µ µ ) σ. j jj k kj k Der Gesamtmittelwert einer Variablen ist leich dem ewichteten Mittelwert der Klassenzentren. Die Kovarianz zwischen zwei Variablen j und j* hänt nur von den Abweichunen der Klassenzentren von den Gesamtmittelwerten ab, die Varianz einer Variablen daeen auch noch von den Fehlerstreuunen (siehe dazu auch Abschnitt 3..7). Lazarsfeld und Henry (1968: 31-33) sowie Gibson (1966) entwickelten auf der Grundlae der Modellleichunen (4..5) bis (4..7) soenannte "accountin-equations", die eine Schätzun der Modellparameter mit Hilfe einer Eienwertzerleun ermölichen. Diese hat mehrere Nachteile (Van de Pol und de Leeuw 1986). So z.b. können neative Zuordnunswahrscheinlichkeiten entstehen. Eine andere Schätzmethode besteht in der Verwendun des in Abschnitt 4.1 erwähnten EM-Alorithmus. Die Modellparameter werden so eschätzt, daß die Likelihood- Funktion (4..4) L = π( k) π( / k) k bzw. ihr Loarithmus (4..5) l = ln( L ) = ln π ( k ) π ( / k ) k ein Maximum wird. π(k) ist dabei der "wahre" Anteil der Klasse k und π(/k) ist die (bedinte) Wahrscheinlichkeit des Auftretens des Merkmalsvektors der Person in der Klasse k. Die bedinte Wahrscheinlichkeit π(/k) ist ween der lokalen Unabhänikeit (siehe Abschnitt 4.1) leich dem Produkt der (bedinten) Auftrittswahrscheinlichkeiten π( xi / k) des Wertes von in den Variablen j für die Klasse k: (4..6) π( / k) = π( x / k). j j Die Auftrittswahrscheinlichkeit π(x j /k) ist bei der latenten Profilanalyse als Wert der Dichtefunktion der Normalverteilun mit dem Mittelwert µ kj und der Varianz σ kj definiert: (4..7) π kj j ( x µ ) / σ j kj kj ( xj / k) ϕ( xj / µ kj, σ kj ) = e σ kj π =, wobei ϕ(...) die Dichtefunktion der Normalverteilun ist. Betrachten wir dazu ein Beispiel: Die Klasse k soll in der Variablen j einen Mittelwert µ kj von -1 und eine Varianz σ kj von haben. Das Objekt besitzt in der Variablen j einen Wert von -. Die Auftrittswahrscheinlichkeit des Wertes von - in der Klasse k ist entsprechend (4..11)

8 leich dem Wert der Dichtefunktion der Normalverteilun mit den Modellparametern der Klasse k: π ( x j = / k) = ϕ( x j = / µ kj = 1, σ kj = ) = π e 0.5 ( ( 1) ) / = Der Wert von - tritt also mit einer Wahrscheinlichkeit von in der Klasse k auf. Dieser Wert eribt sich auch, wenn mit (--(-1))/ = der z-wert berechnet und die Dichtefunktion der Standardnormalverteilun dividiert mit der Standardabweichun verwendet wird. Die esuchten Parameter π(k), µ kj und σ kj werden nun so bestimmt, daß die Lo-Likelihood-Funktion ein Maximum ist. Das heißt, es werden Schätzunen esucht, die (theoretische) Modelldaten mit einer Verteilun erzeuen, die der empirischen Verteilun der Objekte bestmölich anepaßt ist. In die Schätzun ehen die Nebenbedinunen π( k ) = 1 und π(k)>0 für alle k ein. Die erste Nebenbedinun besat, daß die Summe der Klassenanteilswerte leich 1 sein soll. Die zweite Nebenbedinun bedeutet, daß keine Klasse leer sein soll. Unter Berücksichtiun dieser Nebenbedinun sind bei K Klassen und m Variablen folende Parameter zu schätzen: K-1 Klassenanteilswerte π(k) (ein Klassenanteilswert ist ween der Nebenbedinun π( k ) = 1 fixiert) K m Klassenzentren oder Klassenmittelwerte µ kj (in jeder Klasse für jede Variable ein Klassenzentrum) K m Klassenstreuunen oder Klassenvarianzen σ kj (in jeder Klasse für jede Variable eine Klassenvarianz) K (1 + m) - 1 Gesamtzahl zu schätzender Parameter Insesamt sind also K (1 + m) - 1 Parameter zu bestimmen. Wird beispielsweise eine 6-Klassenlösun bei drei Variablen (m=3) esucht, sind 6 (1 + 3) - 1 = 41 Parameter zu schätzen. Die notwendie Bedinun für ein identifiziertes Modell ist somit, daß mindestens 41 unterschiedliche Datensätze vorlieen. Die notwendie Bedinun wird i.d.r. bei der latenten Profilanalyse immer erfüllt sein. Wie bereits erwähnt, ist beim Vorlieen der notwendien Identifikationsbedinun das Modell der latenten Profilanalyse dann auch identifiziert. Beim EM-Alorithmus wird nun anenommen, daß die Zuordnunswahrscheinlichkeiten π(k/), mit der die Klasse k bei den Objekten auftritt, bekannt sind. Dadurch vereinfacht sich die Lo-Likelihood-Funktion zu (Van de Pol und de Leeuw 1986): l = π ( k / ) ( ln( π ( k)) + ln( π ( / k) ) k (4..8). = π ( k / ) ln( π ( k) + π ( k / ) π ( x / k) k k j j

9 Die Schätzaufabe zerfällt also zum einen in die Schätzun der Anteilswerte π(k) und zum anderen in die Schätzun der Parameter der einzelnen Normalverteilunen. Die Schätzwerte sind (Bock 1974: 58, Kaufmann und Pape 1984: 43) 1 : (4..9) p( k) = π ( k / )/ n, (4..10) x = π( k/ ) x π( k/ ), kj j ( x x ) kj = j kj (4..11) s π ( k / ) π ( k / ), wobei der Schätzwert von π(k) mit p(k) bezeichnet wurde. Der Schätzwert von µ kj wurde mit x kj und jener von σ mit s bezeichnet. Die Schätzwerte kann man sich wie kj kj folt vorstellen: Zur Berechnun der Parameter der Klasse k werden die Datensätze mit π(k/) ewichtet und ausezählt. Dadurch erhält man die Mittelwerte und Varianzen der Klasse k in den Variablen. Die ewichtete Fallzahl dividiert durch die unewichtete Fallzahl eribt den Anteil der Klasse k. Bei den bisherien Ausführunen wurde davon auseanen, daß die Zuordnunswahrscheinlichkeiten π(k/) bekannt sind. Dies ist natürlich nicht der Fall. Sie können aber ihrerseits aus den eschätzten Modellparametern mit Hilfe des Satzes von Bayes (Fisz 1980: 40-41) berechnet werden mit: (4..1) p( k) p ( / k) pk ( / ) = pk ( ) p ( / k), k wobei p(k/) der Schätzwert von π(k/) ist. p(k) ist der Schätzwert von π(k) und p(/k) der Schätzwert von π(/k). Damit haben wir das Grundprinzip des EM-Alorithmus skizziert. Es besteht aus zwei Schritten: 1. E-Schritt: Die Zuordnunswahrscheinlichkeiten π(k/) werden aufrund der eschätzten Modellparameter (=Erwartunswerte) berechnet. Die eschätzten Modellparameter werden dabei als eeben anenommen.. M-Schritt: Die Modellparameter π(k), µ kj und σ kj werden aufrund der Schätzwerte der Zuordnunswahrscheinlichkeiten nach der Maximum-Likelihood-Methode eschätzt. Die Zuordnunswahrscheinlichkeiten werden dabei als eeben anenommen. 1 Bock (1974: 58) sowie Kaufmann und Pape (1984: 43) leiten die Schätzunsfunktion direkt aus der Gleichun (4..5) ab.

10 Diese Schritte werden solane wiederholt, bis eine konverente Lösun efunden ist. Es eribt sich folender Schätzalorithmus: Schritt 1: Berechnun oder Einabe der Startwerte. Schritt : Berechnun der Zuordnunswahrscheinlichkeiten. Entsprechend der Gleichun (4..1) werden die Zuordnunswahrscheinlichkeiten berechnet mit: ( i 1) ( i 1) () i pk ( ) p ( / k) pk ( / ) = ( i 1) ( i 1 ) pk ( ) p ( / k), k wobei aufrund der Gleichunen (4..10) und (4..11) ( i 1) ( i 1) ( p ( / k) = px ( j / k) = xj x i i ( / 1) ( 1) ϕ kj, skj ) j ist. Der hochestellte Index in Klammern ist der Iterationszähler. Beim ersten Durchlaufen ist i=0. Schritt 3: Neuberechnun der Modellparameter. Die Modellparameter werden entsprechend den Gleichunen (4..9) bis (4..11) neu berechnet mit: () i () i pk ( ) = pk ( / ) / n. () i () i () i kj = ( / ) j ( / ). x p k x p k ( i) ( i) ( i) ( x x ) skj = p( k / ) j kj p( k / ). Schritt 4: Prüfun der Konverenz. Der Alorithmus wird dann abebrochen, wenn (a) die Verbesserun der Lo-Likelihood-Funktion kleiner einem voreebenen Schwellenwert (z.b ) und/oder (b) die maximale Abweichun der aufeinanderfolenden Schätzwerte kleiner einem zweiten Schwellenwert (z.b ) ist. j ( i) Der Alorithmus ist mit jenem des K-Means-Verfahren strukturleich. Das asymptotische Konverenzverhalten (n ) dieses Alorithmus wurde bereits im einleitenden Abschnitt beschrieben. (...)

11 4.. Modellprüfrößen Bestimmun der Klassenzahl Zur Bestimmun der Klassenzahl wird das Verfahren wiederum mit einer unterschiedlichen Anzahl von Klassen durcherechnet. Für die Wertedaten von Denz (1989) ereben sich die in der Tabelle 4.. darestellten Werte für die Lo-Likelihood- Funktion, wenn die Gesamtpunktewerte für die postmaterialistische und materialistische Wertorientierun als Klassifikationsvariablen in die Analyse einbezoen und die Startwerte mit dem Quick-Clusterin-Verfahren berechnet werden. Tabelle 4..1: Modellprüfrößen der latenten Profilanalyse für die Wertedaten von Denz (Startwerte aus dem Quick-Clusterin-Verfahren) Klassenzahl Wert der Lo- Likelihood- Funktion prozentuelle Verbesserun eenüber Nullmodell Informationsmaß von AKAIKE prozentuelle Verbesserun eenüber vorausehender Lösun K L K PV0 K IA K PV K KW Aus den Werten der Lo-Likelihood-Funktion 1 L K lassen sich folende Modellprüfrößen berechnen: Prozentuelle Verbesserun PV0 K eenüber dem Nullmodell der 1-Klassenlösun: Diese wird analo zu ETA berechnet mit LK (4..13) PV0K = 1 bzw. PV0K( in %) = 100 PV0K, L 1 wobei L 1 der Absolutbetra der Lo-Likelihood-Funktion für die 1-Klassenlösun und L K der Absolutbetra der Lo-Likelihood-Funktion der K-Klassenlösun ist. Für die 5-Klassenlösun beispielsweise beträt die prozentuelle Verbesserun 19.3 Prozent, 1 Allemein bedeutet ein kleinerer neativer Wert eine bessere Modellanpassun.

12 da der Absolutbetra L 1 = und L 5 = ist. PV0 5 ist daher leich / =0.193 (=19.3 Prozent). Prozentuelle Verbesserun PV K eenüber der vorausehenden Klassenlösun: Diese Maßzahl ist analo dem PRE-Koeffizienten beim K-Means-Verfahren definiert mit (4..14) PV K LK = 1 bzw. PVK( in %) = 100 PVK. L K 1 Für die 5-Klassenlösun eribt sich mit L 5-1 = L 4 = und L 5 = ein Wert von / = (=4.1 Prozent.). Informationsmaß von Akaike (Akaike 1974, Kaufmann und Pape 1984: 443): Dieses ist definiert mit (4..15) IA K = L K - m K, wobei m K die Zahl der zu schätzenden Parameter ist. Für die latente Profilanalyse ohne Restriktionen ist m K leich (K-1)+m K+m K, da (K-1) Klassenanteilswerte und jeweils m K Klassenmittelwerte bzw. Klassenvarianzen zu schätzen sind (m=zahl der Variablen). Für K=5 eribt sich in unserem Beispiel eine Zahl zu schätzender Parameter von (5-1) = 4. Das Informationsmaß für die 5-Klassenlösun ist daher = Das Informationsmaß von Akaike berücksichtit somit wie die F-MAX-Statistik die Tatsache, daß bei einer rößeren Klassenzahl in der Tendenz "automatisch" eine bessere Modellanpassun erzielt wird. Chi-Quadrat-Test für die Likelihood-Quotienten-Teststatistik: Ween der Maximum- Likelihood-Schätzun ist die Teststatistik - (L K-1 - L K ) approximativ Chi-Quadratverteilt mit df = m K - m K-1 Freiheitsraden. Bei kleinen Stichproben ist diese Approximation schlecht, es sollte daher die modifizierte Likelihood-Quotienten- Teststatistik nach Wolfe verwendet werden (Kaufmann und Pape 1984: 443): (4..16) LQ ( Wolfe) = ( n 1 m K / ) ( L L ). K n K 1 K Diese Teströße ist approximativ Chi-Quadrat-verteilt mit m Freiheitsraden. Mit dieser Teststatistik wird eprüft, ob die K-Klassenlösun eine sinifikant bessere Modellanpassun erbrint als die (K-1)-Klassenlösun. Sie entspricht somit den Bealschen F-Werten. Sollen allerdins die Klassenlösunen mit K-h (h>1) Klassen mit der K- Klassenlösun verlichen werden, muß die ewöhnliche Likelihood-Quotienten-Statistik - (L K-h - L K ) verwendet werden. Für den Verleich der 4- und 5-Klassenlösun eribt sich ein Wert von 1 ( ( ) ) LQ5 ( Wolfe) = (1 1 ) = 5,

13 da n = 1, m =, K = 5 sowie L 4 = und L 5 = sind. Bei Freiheitsraden ist dieser zu einem Sinifikanzniveau von 100 Prozent von 0 verschieden. Die ewöhnliche Likelihood-Quotienten-Statistik ist in dem Beispiel leich und besitzt 5 Freiheitsrade. Auch sie ist zum Niveau von 100 Prozent sinifikant von 0 verschieden. Die 5-Klassenlösun verbessert somit die 4- Klassenlösun sinifikant. Übersicht 4..1: Beziehun zwischen den Modellprüfrößen der latenten Profilanalyse und jenen des K-Means-Verfahrens Modellprüfrößen der latenten Profilanalyse Prozentuelle Verbesserun eenüber 1-Klassenlösun (=PV0 K ) Prozentuelle Verbesserun eenüber vorausehender Lösun (=PV K ) Informationsmaß von Akaike (=IA K ) Likelihood-Quotienten- Statistiken (ewöhnliche LQ-Statistik und LQ K (Wolfe)) Modellprüfrößen des K- Means-Verfahren Erklärte Streuun (=ETA K ) PRE-Koeffizient (=PRE K ) Maximaler F-MAX-Wert (=F-MAX K ) Bealsche F-Werte Anwendun zur Bestimmun der Klassenzahl Es werden nur jene Lösunen ausewählt, für die PV0 K einen bestimmten Wert überschreitet. Es wird (werden) jene Lösun(en) ausewählt, bei der (denen) PV K im Verleich zu der vorausehenden Lösun relativ roß ist. Es wird jene Lösun mit dem maximalen Informationsmaß (=kleinster neativer Wert) ausewählt. Es wird jene Lösun ausewählt, die (a) im Verleich zu allen vorausehenden Lösunen sinifikant und (b) im Verleich zu allen nachfolenden Lösunen nicht sinifikant ist. Die bereits erwähnte Analoie der Modellprüfrößen zu den Modellprüfrößen des K- Means-Verfahrens ilt auch für das Vorehen bei der Bestimmun der Klassenzahl (siehe Übersicht 4..1). Wendet man die einzelnen Strateien an, würden wir uns für folende Lösunen entscheiden: Prozentuelle Verbesserun PV K eenüber vorausehender Lösun: Für die -, 3-, 5-, 9- und 1-Klassenlösun, da hier die prozentuelle Verbesserun relativ roß ist. Absolut betrachtet sind die prozentuellen Verbesserunen aber erin (<10 Prozent).

14 Informationsmaß von Akaike: Für die 1-Klassenlösun, da hier der Wert des Informationsmaßes mit am rößten ist (=kleinster neativer Wert). Allerdins ist der Wert der 5-Klassenlösun mit nur erinfüi kleiner. Likelihood-Quotienten-Test: Für eine Analyse mit einer rößeren Klassenzahl, da die 1-Klassenlösun (=1-Spalte) eenüber den vorausehenden Klassenlösunen sinifikant ist. Prozentuelle Verbesserun eenüber Nullmodell der 1. Klassenlösun: Mitunter würden wir uns hier für die 9-Klassenlösun entscheiden, da für sie - im Verleich zur -, 3- und 5-Klassenlösun - die prozentuelle Verbesserun rößer 0 Prozent ist. Wir wollen im folenden zunächst die 5-Klassenlösun weiter untersuchen Modellprüfrößen für eine bestimmte Klassenlösun Für eine bestimmte Klassenlösun, z.b. für die 5-Klassenlösun, können zur Beschreibun die entsprechenden Modellprüfrößen verwendet werden. Darüber hinaus können - wie beim K-Means-Verfahren - varianzanalytische Maßzahlen verwendet werden, insbesondere die erklärte Streuun. In unserem Beispiel eribt sich eine erklärte Streuun von 60.9 Prozent. Die erklärte Streuun bei der latenten Profilanalyse ist i.d.r. kleiner als beim K-Means-Verfahren, da die Fehlerstreuun nicht minimiert wird. Beim K- Means-Verfahren eribt sich eine erklärte Streuun von 7.5 Prozent für die 5-Clusterlösun, wenn mit Quick-Clusterin-Startwerten erechnet wird Zufallstestun einer Klassenlösun Wie beim K-Means-Verfahren kann auch bei der latenten Profilanalyse mit Hilfe des Nullmodells einer homoenen, normalverteilten Population eprüft werden, ob eine bestimmte Klassenlösun überzufälli ist. Dazu werden wiederum Zufallsdatenmatrizen für das homoene Nullmodell erzeut. Für diese wird eprüft, wie ut sie durch die berechnete Klassenlösun reproduziert werden können. Es wird also wiederum das Modell mit voreebener Klassenstruktur verwendet. Eribt sich eine annähernd leich ute Reproduktion - emessen durch den Wert der Lo-Likelihood-Funktion -, wird man die Lösun als Zufallsprodukt betrachten. Führt man 0 Simulationen durch, ereben sich die in der Tabelle 4..3 darestellten Werte. Tabelle 4..: Simulationswerte für die Lo-Likelihood-Funktion aus einer Zufallstestun

15 Alle berechneten Lo-Likelihood-Werte sind unter der Annahme einer homoenen Population deutlich kleiner dem empirischen Wert von Der Mittelwert der Simulationswerte ist leich , die Standardabweichun hat einen Wert von Konstruieren wir eine z-teststatistik mit z=(t-e(t))/σ(t), wobei t der Wert der empirischen Lo-Likelihood-Funktion (t=l K ), E(t) der Mittelwert der Lo-Likelihood- Werte der simulierten Daten und σ(t) deren Standardabweichun ist, eribt sich ein Wert von Dieser ist rößer einem kritischen Schwellenwert von. Wir können daher die 5-Klassenlösun als überzufälli betrachten Beschreibun und Interpretation einer Klassenlösun Bei der Beschreibun und Interpretation einer Klassenlösun wird analo wie beim K- Means-Verfahren voreanen. Das bedeutet u.a.: 1. Für jede Variable kann eprüft werden, ob sie sinifikant zur Trennun der Klassen beiträt. Dazu wird die durch eine Variable erklärte Streuun und ein entsprechender F-Wert berechnet. Da im Unterschied zum K-Means-Verfahren nicht die Streuunsquadratsumme in den Klassen minimiert wird, ist die Durchführun eines Sinifikanztests für den F- Wert anemessener.. Es können die paarweisen Unterschiede zwischen den Klassen berechnet werden. 3. Die Variablen innerhalb einer Klasse können zu Variablenruppen zusammenefaßt werden. 4. Es können z-werte zur Beantwortun der Frae, ob sinifikante Abweichunen von den Gesamtmittelwerten vorlieen, berechnet werden. 5. Zur Beschreibun und Validitätsprüfun können Deskriptionsvariablen in die Analyse einbezoen werden. Wir wollen hier nicht die einzelnen Schritte durchehen, sondern die 5-Klassenlösun der latenten Profilanalyse mit der 5-Klassenlösun des K-Means-Verfahrens verleichen. Die bei beiden Verfahren berechneten Klassenzentren und Klassenrößen enthält die Tabelle Die Klassenlösunen stimmen hinsichtlich der Klassenzentren sehr ut überein. Die Klasse C1 läßt sich als Anti-Postmaterialisten interpretieren, die allerdins bei beiden Verfahren nur einen Anteil von 0.9 Prozent besitzt. Die zweite Klasse läßt sich als Konsenstypus mit erinerem Interesse und einer leichteren materialistischen Wertepräferenz interpretieren. Klasse 3 könnte als Cluster der Anti- Materialisten bezeichnet werden. Wie bei den Anti-Postmaterialisten ist der Anteilswert dieser Klasse allerdins erin. Klasse C4 läßt sich als emäßite Postmaterialisten interpretieren. Sie besitzt den rößten Anteilswert (latente Profilanalyse=70.1 Prozent,

16 K-Means=55.5 Prozent). Die letzte Klasse schließlich läßt sich als Klasse der Postmaterialisten bezeichnen. Bezülich der Klassenanteilswerte treten etwas rößere Unterschiede auf. So z.b. besitzt die Klasse C5 bei der latenten Profilanalyse einen Anteil von 1.7 Prozent, beim K-Means-Verfahren daeen von 5.7 Prozent. Dies ist auf den unterschiedlichen Modellansatz zurückzuführen. Beim K-Means-Verfahren werden die Objekte deterministisch den Klassen zueordnet. Besitzt beispielsweise ein Objekt die Zuordnunswahrscheinlichkeit 0.4 für die erste Klasse und die Zuordnunswahrscheinlichkeiten von 0.19 für die anderen fünf Klassen, wird es deterministisch der ersten Klasse zueordnet (Kaufmann und Pape 1984: 449). Die beim K-Means-Verfahren berechneten Anteilswerte der Klassen vermitteln daher nur eine sehr robe Vorstellun über die Größe der Klassen, wenn Überlappunen vorlieen. Bei beiden Verfahren sind zwei Klassen bzw. zwei Cluster schwach besetzt, nämlich die als Anti-Postmaterialisten und Anti-Materialisten bezeichneten Cluster. Dies ist eine Konsequenz des Startwertverfahrens. Das Quick-Clusterin führt dazu, daß als Startcluster maximal etrennte Cluster berechnet werden. Welche Erebnisse bei einem anderen Startwertverfahren erzielt werden, wird zu Ende dieses Abschnitts beschrieben. Wir wollen uns zunächst mit dem Problem der Überlappunen beschäftien. Tabelle 4..3: Erebnisse der 5-Klassenlösun der latenten Profilanalyse und des K- Means-Verfahrens für die Wertedaten von Denz (Startwertverfahren für beide Verfahren=Quick-Clusterin) C1 C C3 C4 C5 Latente Profilanalyse Anteilsw. in % Mittelw. GMAT GPMAT Standardabw. GMAT GPMAT K-Means-Verfahren Anteilsw. p(k) in % Mittelw. GMAT GPMAT Standardabw. GMAT GPMAT GMAT = Gesamtpunktwert für Materialismus, GPMAT = Gesamtpunktwert für Postmaterialismus Es wurde bereits darauf hinewiesen, daß der Überlappunsanteil entscheidend die Konverenz und Stabilität der Erebnisse der latenten Profilanalyse beeinflußt. Eine Grobabschätzun des Überlappunsanteils kann dadurch durcheführt werden, daß die Zuordnunswahrscheinlichkeiten dichotomisiert und alle Auspräunskombinationen

17 berechnet werden. Als Dichotomisierunsschwelle kann man dabei 1/K wählen, also jenen Wert, der sich eribt, wenn ein Objekt jeder Klasse mit der leichen Wahrscheinlichkeit anehört. Für die 5-Klassenlösun eribt sich folendes Bild (siehe Tabelle 4..5): (...) 4.3 Analyse latenter Klassen für nominalskalierte Variablen Modellansatz und Alorithmus Im Unterschied zur latenten Profilanalyse setzt die Analyse latenter Klassen für nominalskalierte Variablen - wie ihr Name sat - nur nominalskalierte Variablen voraus. Die Modellannahmen sind: 1. Es lieen K latente Klassen (=Muster) mit den Mittelwerten π(k) vor.. Die Wahrscheinlichkeit, daß in der latenten Klasse k die nominalen Variablen j mit der Auspräun i auftritt, ist leich π(i(j)/k). 3. Ween der Annahme der lokalen Unabhänikeit ist die Auftrittswahrscheinlichkeit des Merkmalsvektors eines Objekts, wenn die Klasse k vorliet, leich: (4.3.1) π( / k) = π( x 1/ k) π( x / k) K π( xm / k) = π( xj / k), wobei x j der Wert des Objekts in der nominalen Variablen j ist. π(x j /k) ist die bedinte Wahrscheinlichkeit des Auftretens der Auspräun des Objekts in der Variablen j für die Klasse k. Die Modellparameter sind somit: 1. Die Anteilswerte π(k) der latenten Klassen k (k=1,...,k). Die bedinten Auftrittswahrscheinlichkeiten π(j(i)/k) für das Auftreten der Auspräunen i in den nominalen Variablen j in den latenten Klassen k. Die bedinten Auftrittswahrscheinlichkeiten entsprechen den Klassenzentren der latenten Profilanalyse. Im Unterschied zur latenten Profilanalyse stellen die Klassenvarianzen keine Modellparameter dar, da sie mit π(j(i)/k) (1-π(j(i)/k)) aus den bedinten Auftrittswahrscheinlichkeiten berechnet werden können. Die Schätzun der Modellparameter erfolt wiederum über den EM-Alorithmus. Dazu werden die j

18 nominalen Variablen in ihre Dummies aufelöst. Wir wollen mit x j(i) den Wert des Objekts in der i-ten Dummy-Variablen (=Auspräun) der nominalen Variablen j bezeichnen. x j(i) ist leich 1, wenn Objekt in der nominalen Variablen j die Auspräun i besitzt, andernfalls 0. Mit π(k/) sollen wiederum die (wahren) Zuordnunswahrscheinlichkeiten der Objekte zu den Klassen k und mit p(k) und p(j(i)/k) die Schätzwerte der esuchten Modellparameter bezeichnet werden. Unter Verwendun dieser Notation ereben sich folende Schätzleichunen (Van de Pol und de Leeuw 1986) 1 : (4.3.) pk ( ) = π ( k/ ) n. (4.3.3) p(()/ j i k) = π( k/ ) x π ( k/ ). j() i Die beiden Schätzleichunen (4.3.) und (4.3.3) sind vollkommen strukturleich jenen der latenten Profilanalyse (Gleichunen 4..9 und 4..11). Die Auftrittswahrscheinlichkeiten π(j(i)/k) sind die Klassenzentren der Dummies der nominalen Variablen. Im Unterschied zur latenten Profilanalyse werden die Wahrscheinlichkeiten π(x j /k) des Auftretens der Werte des Objektes in den Variablen j, wenn die Klasse k vorliet, nicht über die Dichtefunktion der Normalverteilun berechnet, sondern mit: (4.3.4) π( xj / k) = π( ji ( )/ k) für x j(i) = 1. Die Wahrscheinlichkeit π(x j /k) ist also leich der Auftrittswahrscheinlichkeit der Auspräun i der nominalen Variablen j, die das Objekt besitzt. Hat beispielsweise das Objekt in der nominalen Variablen j die Auspräun 1, so ist die Wahrscheinlichkeit π( xi / k) leich der Auftrittswahrscheinlichkeit der Auspräun 1 in der Klasse k, also leich π(j(1)/k). Das zurundelieende Verteilunsmodell ist das einer Polynomialverteilun (Fisz 1980: ). Die Zuordnunswahrscheinlichkeiten π(k/) werden wie bei der latenten Profilanalyse über den Satz von Bayes bestimmt. Der EM-Alorithmus sieht folendermaßen aus: Schritt 1: Berechnun oder Einabe von Startwerten für die Modellparameter. Schritt : Berechnun der Zuordnunswahrscheinlichkeiten nach Bayes mit 1 1 Van de Pol und de Leeuw (1986) entwickeln die Schätzleichunen für das allemeine latente Markovmodell (siehe dazu auch Laneheine und Van de Pol 1990). Dieses enthält als Submodell die Analyse latenter Klassen für nominalskalierte Variablen. Die Schätzleichunen für die Analyse latenter Klassen sind beispielsweise auch in Andersen (1991: 46-49) wiedereeben. Laneheine (1988) ibt einen Überblick über neue Ansätze der Analyse latenter Klassen. 1 Aus Gründen der einfacheren Schreibweise wurde auf den Index für die i-te Iteration verzichtet.

19 (4.3.5) pk ( / ) = p( k) p ( / k), pk ( ) p ( / k) wobei die Wahrscheinlichkeit p(/k) des Auftretens des Objekts in der Klasse k entsprechend der Gleichun (4.3.1) eschätzt wird. Die dafür benötiten Auftrittswahrscheinlichkeiten π(x j /k) werden entsprechend Gleichun (4.3.7) berechnet. Schritt 3: Schätzun der Modellparameter entsprechend den Gleichunen (4.3.) und (4.3.3). Für Zuordnunswahrscheinlichkeiten π(k/) werden die Schätzwerte p(k/) aus dem zweiten Schritt verwendet. Schritt 4: Prüfun der Konverenz analo der latenten Profilanalyse. In die Schätzun ehen folende Nebenbedinunen ein: (4.3.6) π( k) = 1. k (4.3.7) π(k) > 0. (4.3.8) π( ji ()/ k) = 1 für alle Variablen i und Klassen k. i Die beiden ersten Nebenbedinunen haben wir bereits bei der latenten Profilanalyse eineführt. Sie besaen, daß die Summe der Klassenanteilswerte leich 1 und keine Klasse leer sein soll. Die dritte Nebenbedinun bedeutet, daß die Summe der Auftrittswahrscheinlichkeiten der Auspräunen einer Variablen in einer Klasse k leich 1 sein soll. Unter Berücksichtiun der Nebenbedinunen sind somit bei K Klassen und m nominalen Variablen folende Modellparameter zu schätzen: K-1 Klassenanteilswerte π(k). Ween der Nebenbedinun Σπ(k) = 1 ist ein Klassenanteilswert fixiert. m ( Auftrittswahrscheinlichkeiten π(j(i)/k). Ween der Nebenbedinun (4.3.6) sind in jeder Klasse für jede Variable m j K m j 1) j= 1-1 Auftrittswahrscheinlichkeiten zu schätzen (m j = Zahl der Auspräunen der Variablen j), insesamt also die aneebene Zahl. K 1 m j m + 1 j Gesamtzahl zu schätzender Parameter Wird also für drei nominale Variablen mit jeweils drei Auspräunen eine -Klassenlösun esucht, sind (Σ3-3 +1) -1 = 13 Modellparameter zu schätzen. Diesen stehen = 7 unterschiedliche Datenvektoren eenüber. Die notwendie Bedinun für ein identifiziertes Modell, daß mehr oder zumindest leichviele empirische Informationen (=unterschiedliche Merkmalsvektoren) als Modellparameter vorlieen, ist somit erfüllt. Die allemeine Bedinun lautet: Die Zahl der Auspräunskombinationen der nomina-

20 len Variablen muß rößer/leich der Zahl der zu schätzenden Parameter sein. Sind nicht alle Auspräunskombinationen besetzt, kann das Modell empirisch nicht identifiziert sein. In unserem Beispiel wäre dies der Fall, wenn nur 1 der 7 mölichen Kombinationen empirisch besetzt sind. In diesem Fall macht eine Schätzun keinen Sinn. Vor einer Analyse sollte daher immer eprüft werden, ob die notwendie Identifikationsbedinun erfüllt ist. Praktisch kann diese Bedinun z.b. mit dem Quick-Clusterin- Verfahren überprüft werden. Dazu wird die Clusterzahl leich der Zahl zu schätzender Parameter esetzt. Wir wollen diese Zahl mit m K bezeichnen. Findet das Quick-Clusterin-Verfahren keine m K Cluster, ist die notwendie Bedinun der Modellidentifikation nicht erfüllt. Wir wollen den Alorithmus anhand eines Rechenbeispiels veranschaulichen. Geeben sind zwei dichotome nominalskalierte Variablen X 1 und X mit jeweils drei Auspräunen. Es soll eine -Klassenlösun berechnet werden. Für den Iterationsschritt (i) sollen folende Schätzwerte vorlieen: C1 (k=1) C (k=) p(k) p(1(1)/k) p(1()/k) p(1(3)/k) p((1)/k) p(()/k) p((3)/k) Die Interpretation der Schätzwerte soll exemplarisch für die latente Klasse 1 (=C1) darestellt werden. Die latente Klasse 1 (k=1) hat einen Anteilswert von 0.5. Die Auspräun 1 der nominalen Variablen 1 tritt mit einer Wahrscheinlichkeit von 0.8 (=p(1(1)/1) auf, die Auspräun der nominalen Variablen 1 mit einer Wahrscheinlichkeit von 0. und die Auspräun 3 mit einer Wahrscheinlichkeit von 0. Da die Auftrittswahrscheinlichkeiten als Mittelwerte der Dummies (=Anteilswerte) interpretiert werden können, ist auch folende Interpretation mölich: In der Klasse 1 tritt mit 80 Prozent die Auspräun 1 in der Variablen 1 auf und mit 0 Prozent die Auspräun. Für die zweite Variable ist die Auftrittswahrscheinlichkeit der Auspräun 1 leich 0.6 (=p((1)/1)) usw. An den Schätzwerten lassen sich auch die darestellten Nebenbedinunen veranschaulichen. Die Summe der Anteilswerte der beiden Klassen ist leich 1. Da beide Klassen einen Anteilswert von 0.5 haben, ist auch die zweite Nebenbedinun, daß keine Klasse leer ist, erfüllt. Die dritte Nebenbedinun besat, daß die Summe der Auftrittswahrscheinlichkeiten jeder Variablen in jeder Klasse leich 1 ist. Auch diese Nebenbedinun ist erfüllt. Für die nominale Variable 1 in der Klasse 1 ilt beispielsweise:

21 p(1(1)/1) + p(1()/1) + p(1(3)/1) = 1, wie man leicht nachrechnen kann. Die Berechnun der Zuordnunswahrscheinlichkeiten p(k/) zeit Tabelle Sie soll für das erste Objekt A darestellt werden. Objekt A besitzt in der Variablen X1 die Auspräun 1 und in der Variablen X ebenfalls die Auspräun 1. Die Wahrscheinlichkeit für das Auftreten dieses Antwortmusters in der ersten latenten Klasse ist leich = 0.48, da p(1(1)/1) = 0.8 und p((1)/1) = 0.6 ist. Die Auftrittswahrscheinlichkeit des Objekts A für die latente Klasse ist leich = Der Likelihood-Wert (=PGES in der Tabelle) des Objekts A ist - wie bei der latenten Profilanalyse - leich = 0.4, da p(1) = 0.5, p() = 0.5 und p(a/1) = 0.48 und p(a/) = 0 ist. Daraus eribt sich ein Lo-Likelihood-Wert von Die Zuordnunswahrscheinlichkeiten für das Objekt A lassen sich über den Satz von Bayes berechnen. Für p(1/a) eribt sich eine Wert von p( 1/ A) = = 1, da p(a/1) = 0.48 und p(a/) = 0 ist. Die Auftrittswahrscheinlichkeit der Klasse 1 für das Objekt A ist leich 1, jene der Klasse leich 0. Das Objekt A ist also mit einer Wahrscheinlichkeit von 1 der Klasse 1 zueordnet.

22 Tabelle 4.3.1: Veranschaulichun der Berechnun der Zuordnunswahrscheinlichkeiten für die Analyse latenter Klassen für nominalskalierte Variablen Objek t Variablen Auftrittswahr. der Objekte Lo-Likelihood-Werte Zuordnunswahr. X1 X p(/1) p(/) PGES ML p(/1) p(/) A B C D E Σ Für die anderen Objekte können die Zuordnunswahrscheinlichkeiten analo berechnet werden. Es ereben sich die in der Tabelle darestellten Werte. Zur Neuberechnun der Modellparameter werden die nominalen Variablen in ihre Dummies aufelöst und mit den entsprechenden Zuordnunswahrscheinlichkeiten multipliziert. Da beide Variablen drei Auspräunen haben, wird jede nominale Variable in drei Dummies aufelöst. Tabelle 4.3. zeit exemplarisch die Berechnun der Modellparameter für die erste nominale Variable in der ersten Klasse. Da das Objekt A in der nominalen Variablen 1 die Auspräun 1 besitzt, ist der Wert in der Dummy- Variablen X 1(1) leich 1. Dieser wird mit der Zuordnunswahrscheinlichkeit des Objekts A zur ersten Klasse (=1) multipliziert. Analo wird für die anderen Dummies und die weiteren Objekte voreanen. Berechnet man die Spaltensumme der Zuordnunswahrscheinlichkeiten für die Klasse 1 (=Spalte "p(/1)"), eribt sich die mit den Zuordnunswahrscheinlichkeiten ewichtete Fallzahl der Klasse 1. Der Spaltensummenwert ist leich.5. Division mit der Fallzahl eribt entsprechend Gleichun (4.3.) den Anteilswert der Klasse 1. In unserem Beispiel ist dieser leich 0.5. Bilden wir die Spaltensummen der mit den Zuordnunswahrscheinlichkeiten multiplizierten (ewichteten) Dummies und dividieren diese mit der ewichteten Fallzahl, erhalten wir entsprechend Gleichun (4.3.3) die Schätzwerte für die Auftrittswahrscheinlichkeiten der Auspräunen der nominalen Variablen 1 in der Klasse 1. Es ereben sich Werte von 0.8, 0. und 0.0. Sie sind also mit den Werten der vorausehenden Iteration identisch. Dies ilt auch für die anderen Modellparameter. Damit dürfte das Grundprinzip der Schätzun der Modellparameter hinlänlich verdeutlicht worden sein. Abschließend ist auf eine Besonderheit des Alorithmus hinzuweisen: Besitzt ein Schätzwert für eine Auftrittswahrscheinlichkeit p(i(j)/k) den Wert 0 oder 1, wird er während der Iteration nicht mehr eändert. Bei der Einabe von Startwerten ist also darauf zu achten, daß keine Werte von 0 oder 1 eineeben werden, da diese dann nicht mehr eändert werden. Für die Auswahl eines Startwertverfahrens

23 bedeutet dies, daß Startwerte aus dem Quick-Clusterin- oder Repräsentanten- Verfahren ausscheiden, da sie ein typisches Objekt für jede Klasse auswählen. Da bei einem Objekt nur eine Auspräun auftreten kann, ist die Auftrittswahrscheinlichkeit in dieser Auspräun leich 1, alle anderen Auftrittswahrscheinlichkeiten leich 0. Tabelle 4.3.: Neuberechnun der Modellparameter für die erste Variable in der ersten Klasse Zuordnunswahr. Dummies multipliziert mit Zuordnunswahrscheinlichkeiten Variablen X1 X p(/1) p(/) X1(1) X1() X1(3) usw. A B C D E p(1(1)/1)= p(1()/1)= p(1(3)/1)=.00/.5= 0.50/.5= 0.00/.5= p(1)=.50/5 = Modellprüfun und Interpretation Es können die für die latente Profilanalyse entwickelten Modellprüfrößen verwendet werden. Ihre Anwendun soll anhand der Analyse der Freizeitaktivitäten von Kindern darestellt werden (siehe Abschnitte.3,.4.,.4.3, 3.5). Für eine erste Analyse wurde anenommen, daß vier bis acht latente Klassen vorhanden sind. Die entsprechenden Teströßen zeit die Tabelle Tabelle 4.3.3: Erebnisse der Analyse latenter Klassen für die Freizeitaktivitäten von Kindern Klassenzahl prozentuelle Verbesserun eenüber Nullmodell in % Wert der Lo-Likelihood-Funktion Informationsmaß von AKAIKE Sinifikanz der LQ- Statistik von Wolfe in % prozentuelle Verbesserun e. vorausehender Lösun in % K L K PV0 K IA K LQ K (Wolfe) PV K 1(a) (b) - (b) - (b) (c) - (c) (a) unser Proramm berechnet automatisch immer aus Modelltestründen die 1-Klassenlösun,

24 (b) nicht definiert, (c) diese Werte werden nicht berechnet, da keine vorausehende 3-Klassenlösun vorliet. Betrachten wir zunächst die prozentuellen Verbesserunen PV K eenüber der jeweils vorausehenden Lösun, so zeit sich, daß die 7- und 8-Klassenlösun kaum mehr den Wert der Lo-Likelihood-Funktion der vorausehenden Lösun verbessern: Die 6- Klassenlösun verbessert die 5-Klassenlösun nur mehr um 9.1 Prozent, die 8- Klassenlösun die 7-Klassenlösun um 7.7 Prozent. Diese Zunahmen in der Lo- Likelihood-Funktion sind auch nicht mehr sinifikant. Wir würden uns daher für die 6- Klassenlösun entscheiden. Der maximale Wert des Informationsmaßes von Akaike liet allerdins für die 8-Klassenlösun vor. Mitunter ist somit eine weitere Analyse mit mehr Klassen erforderlich, um das tatsächliche Maximum zu bestimmen. Wir wollen hier aber die 6-Klassenlösun weiter beschreiben. Die Erebnisse sind in der Tabelle darestellt. Da sehr viele Variablen untersucht werden, wird man zur Erleichterun der Interpretation untersuchen, ob in den einzelnen Klassen Variablenruppen ebildet werden können. Technisch bedeutet dies, daß der in Abschnitt darestellte Alorithmus zur Bildun von Variablenruppen einesetzt wird. Dabei ereben sich die in der Tabelle darestellten Variablenruppen. Die letzten drei Klassen lassen sich relativ einfach interpretieren: Klasse 4 ist der Typus der sehr aktiven Kinder, Klasse 5 der Typus der inaktiven oder deprivierten Kinder und Klasse 6 der Typus der Mittelaktiven, wobei Fernsehen und Radfahren überzufälli häufi auftreten. Die Klassen 1 bis 3 haben daeen ein selektives Freizeitmuster. Klasse 3 ist zum einen stark spielorientiert (alleine Spielen, mit Freunden spielen, Computerspiele). Zum anderen wird Musik ehört, mit der Familie etwas unternommen sowie Sport betrieben und Rad efahren. Wir können uns darunter einen Typus von Kindern vorstellen, für den das Spielen im Vorderrund steht. Die Klasse daeen ist dadurch ekennzeichnet, daß nur drei Freizeitaktivitäten häufi auseübt werden. Der Typus läßt sich wie folt beschreiben: Die Kinder sind zum einen in der Wohnun sehr zurückezoen. Sie lesen in der Freizeit ein Buch, im Freien spielen sie mit Freunden oder fahren Rad. Wir wollen diesen Typus als eher zurückezoenen Freizeittypus bezeichnen. Die Klasse 1 ist im Unterschied zur Klasse durch eine stärkere Familienorientierun ekennzeichnet. Mit der Familie wird etwas emeinsam unternommen, u.a. ein Spazieran, oder es wird emeinsam ebastelt oder emeinsam fernesehen. Daneben wird noch ein Buch elesen, radefahren, Musik ehört, Sport betrieben und alleine oder mit Freunden emeinsam espielt. Ein Name für diesen Typus läßt sich nur schwer finden, unter Umständen könnte er als familienorientierter Typus bezeichnet werden.

25 Zusammenfassend läßt sich somit festhalten, daß zwar eine inhaltliche Interpretation mölich ist, daß man diese aber in einer konfirmatorischen Analyse zu verbessern versuchen wird.

26 Tabelle 4.3.4: 6-Klassenlösun bei einer Analyse der Freizeitaktivitäten von Kindern (n=745) C1 C C3 C4 C5 C6 Anteilsw. p(k) Ausruhen ja Ausruhen nein Freunde ja Freunde nein Familie ja Familie nein Basteln ja Basteln nein Comics ja Comics nein Musizieren ja Musizieren nein Haustiere ja Haustiere nein Kino ja Kino nein Konzert ja Konzert nein Musikhören ja Musikhören nein Kirche ja Kirche nein Fernsehen ja Fernsehen nein Computer ja Computer nein Buch ja Buch nein Vereinsv. ja Vereinsv. nein Radfahren ja Radfahren nein Spazieren ja Spazieren nein alleine Sp. ja alleine Sp. nein Parties ja Parties nein Sport ja Sport nein

Literatur: Mankiw, Kap. 31 und 32, Bofinger, kap. 16 bis 18, Arnold, Kap. V. Aufschwung: Wachstumsrate BIP steigt. Abschwung: Wachstumsrate BIP fällt

Literatur: Mankiw, Kap. 31 und 32, Bofinger, kap. 16 bis 18, Arnold, Kap. V. Aufschwung: Wachstumsrate BIP steigt. Abschwung: Wachstumsrate BIP fällt 1 12. Kurzfristie wirtschaftliche Schwankunen Literatur: Mankiw, Kap. 31 und 32, Bofiner, kap. 16 bis 18, Arnold, Kap. V Beriffe: Aufschwun: Wachstumsrate BIP steit Abschwun: Wachstumsrate BIP fällt Rezession:

Mehr

Fehlerrechnung in der Optik

Fehlerrechnung in der Optik HTL Saalfelden Fehlerrechnun in der Optik Seite von 6 Heinrich Schmidhuber heinrich_schmidh@hotmail.com Fehlerrechnun in der Optik Mathematische / Fachliche Inhalte in Stichworten: Fehlerarten, Fehlerfortplanzun,

Mehr

Reiner Winter. Analysis. Aufgaben mit Musterlösungen

Reiner Winter. Analysis. Aufgaben mit Musterlösungen Reiner Winter Analysis Aufaben mit Musterlösunen. Aufabe: Geeben sei die Funktion ƒ(x) 5 x5 4 x mit x IR +... Untersuchen Sie die Funktion ƒ(x) auf Symmetrie, Nullstellen, Extrempunkte und Wendepunkte.

Mehr

Proseminar: Grundlagen der digitalen Bildverarbeitung

Proseminar: Grundlagen der digitalen Bildverarbeitung Proseminar: Grundlaen der diitalen Bildverarbeitun Thema: Punktoperatoren Referent: Alexander Perzylo Betreuer: Dimitris Golias.05.004 Überblick Bildbearbeitunsoperatoren Hilfsmittel der Operatoren Punktoperatoren:

Mehr

Übungen zur Klassischen Theoretischen Physik III (Theorie C Elektrodynamik) WS 12-13

Übungen zur Klassischen Theoretischen Physik III (Theorie C Elektrodynamik) WS 12-13 Karlsruher Institut für Technoloie Institut für Theorie der Kondensierten Materie Übunen zur Klassischen Theoretischen Physik III Theorie C Elektrodynamik WS -3 Prof. Dr. Alexander Mirlin Blatt 4 Dr. Ior

Mehr

Güte von Tests. die Wahrscheinlichkeit für den Fehler 2. Art bei der Testentscheidung, nämlich. falsch ist. Darauf haben wir bereits im Kapitel über

Güte von Tests. die Wahrscheinlichkeit für den Fehler 2. Art bei der Testentscheidung, nämlich. falsch ist. Darauf haben wir bereits im Kapitel über Güte von s Grundlegendes zum Konzept der Güte Ableitung der Gütefunktion des Gauss im Einstichprobenproblem Grafische Darstellung der Gütefunktionen des Gauss im Einstichprobenproblem Ableitung der Gütefunktion

Mehr

Einführung in die Fehlerrechnung (statistische Fehler und Fehlerfortpflanzung) anhand eines Beispielexperiments (Brennweitenbestimmung einer Linse)

Einführung in die Fehlerrechnung (statistische Fehler und Fehlerfortpflanzung) anhand eines Beispielexperiments (Brennweitenbestimmung einer Linse) Physiklabor Prof. Dr. M. Wülker Einführun in die Fehlerrechnun (statistische Fehler und Fehlerfortpflanzun) anhand eines Beispielexperiments (Brennweitenbestimmun einer Linse) Diese Einführun erläutert

Mehr

9. Schätzen und Testen bei unbekannter Varianz

9. Schätzen und Testen bei unbekannter Varianz 9. Schätzen und Testen bei unbekannter Varianz Dr. Antje Kiesel Institut für Angewandte Mathematik WS 2011/2012 Schätzen und Testen bei unbekannter Varianz Wenn wir die Standardabweichung σ nicht kennen,

Mehr

Clusteranalyse K-Means-Verfahren

Clusteranalyse K-Means-Verfahren Workshop Clusteranalyse Clusteranalyse K-Means-Verfahren Graz, 8. 9. Oktober 2009 Johann Bacher Johannes Kepler Universität Linz Linz 2009 1 1. Fragestellung und Algorithmus Bestimmung von Wertetypen (Bacher

Mehr

Luftdichte und Luftfeuchte

Luftdichte und Luftfeuchte M2 Luftdichte und Luftfeuchte Durch äun werden Masse und Volumen der Luft in einem Glaskolben bestimmt und unter Berücksichtiun des Luftdrucks und der Luftfeuchtikeit die Luftnormdichte berechnet. 1. Theoretische

Mehr

Protokoll M1 - Dichtebestimmung

Protokoll M1 - Dichtebestimmung Protokoll M1 - Dichtebestimmun Martin Braunschwei 15.04.2004 Andreas Bück 1 Aufabenstellun 1. Die Dichte eines Probekörpers (Kuel) ist aus seiner Masse und den eometrischen Abmessunen zu bestimmen. Die

Mehr

Die Welt des Zufalls M. Disertori

Die Welt des Zufalls M. Disertori 1 Zufallsexperimente. 1.1 Ein Glücksspiel: Münzen werfen Die Welt des Zufalls M. Disertori Anna und Tom spielen folendes Glücksspiel: Sie werfen eine Münze. Jedesmal, wenn Kopf fällt, zahlt Tom an Anna

Mehr

I. Dokumenteninformationen

I. Dokumenteninformationen Seite 0 von 7 I. Dokumenteninformationen U-Werte eneiter Verlasunen Autoren Headline Subline Stichwörter 9815 Zeichen (esamt inkl. Leerzeichen), 3 Bilder Bilder Zeichen Titel/Rubrik Ausabe Seite 1 von

Mehr

Kontingenzkoeffizient (nach Pearson)

Kontingenzkoeffizient (nach Pearson) Assoziationsmaß für zwei nominale Merkmale misst die Unabhängigkeit zweier Merkmale gibt keine Richtung eines Zusammenhanges an 46 o jl beobachtete Häufigkeiten der Kombination von Merkmalsausprägungen

Mehr

(0 4) 4 :( 2) Bestimmung von Geradengleichungen Aufgabe 1

(0 4) 4 :( 2) Bestimmung von Geradengleichungen Aufgabe 1 Bestimmun von Geradenleichunen Auabe Geeben ist die Geradenleichun (x) = -x +. Gesucht sind die Schnittpunkte mit den Koordinatenachsen. Lösun: Mit der y-achse (x=0): S y (0 ) Mit der x-achse (y=0): x

Mehr

Willkommen zur Vorlesung Statistik (Master)

Willkommen zur Vorlesung Statistik (Master) Willkommen zur Vorlesung Statistik (Master) Thema dieser Vorlesung: Verteilungsfreie Verfahren Prof. Dr. Wolfgang Ludwig-Mayerhofer Universität Siegen Philosophische Fakultät, Seminar für Sozialwissenschaften

Mehr

Fehlerrechnung - Physikalisches Anfängerpraktikum

Fehlerrechnung - Physikalisches Anfängerpraktikum Fehlerrechnun - Physikalisches Anfänerpraktikum Philipp B.Bahavar 1. November 01 1 Grundrößen der Fehlerrechnun 1.1 Der Mittelwert 1.1.1 Definition x = x = 1 n Im Folenden steht x für den Mittelwert einer

Mehr

5. Schließende Statistik. 5.1. Einführung

5. Schließende Statistik. 5.1. Einführung 5. Schließende Statistik 5.1. Einführung Sollen auf der Basis von empirischen Untersuchungen (Daten) Erkenntnisse gewonnen und Entscheidungen gefällt werden, sind die Methoden der Statistik einzusetzen.

Mehr

Physik 1 ET, WS 2012 Aufgaben mit Lösung 2. Übung (KW 44) Schräger Wurf ) Bootsfahrt )

Physik 1 ET, WS 2012 Aufgaben mit Lösung 2. Übung (KW 44) Schräger Wurf ) Bootsfahrt ) Physik ET, WS Aufaben mit Lösun. Übun (KW 44). Übun (KW 44) Aufabe (M.3 Schräer Wurf ) Ein Ball soll vom Punkt P (x, y ) (, ) aus unter einem Winkel α zur Horizontalen schrä nach oben eworfen werden. (a)

Mehr

Willkommen zur Vorlesung Statistik

Willkommen zur Vorlesung Statistik Willkommen zur Vorlesung Statistik Thema dieser Vorlesung: Varianzanalyse Prof. Dr. Wolfgang Ludwig-Mayerhofer Universität Siegen Philosophische Fakultät, Seminar für Sozialwissenschaften Prof. Dr. Wolfgang

Mehr

Multivariate Verfahren

Multivariate Verfahren Multivariate Verfahren Lineare Reression Zweck: Vorhersae Dimensionsreduktion Klassifizierun Hauptkomponentenanalyse Korrespondenzanalyse Clusteranalyse Diskriminanzanalyse Eienschaften: nicht-linear verteilunsfrei

Mehr

Auswertung des Versuchs P1-31,40,41 : Geometrische Optik

Auswertung des Versuchs P1-31,40,41 : Geometrische Optik Auswertun des Versuchs P1-31,40,41 : Geometrische Optik Marc Ganzhorn Tobias Großmann Aufabe 1.1: Brennweite einer dünnen Sammellinse Mit Hilfe eines Maßstabes und eines Schirmes haben wir die Brennweite

Mehr

12. Vergleich mehrerer Stichproben

12. Vergleich mehrerer Stichproben 12. Vergleich mehrerer Stichproben Dr. Antje Kiesel Institut für Angewandte Mathematik WS 2011/2012 Häufig wollen wir verschiedene Populationen, Verfahren, usw. miteinander vergleichen. Beipiel: Vergleich

Mehr

Schweine bis 140 kg mästen?

Schweine bis 140 kg mästen? Schweine bis 140 mästen? Für weiter steiende Endewichte sprechen weder die Preismasken noch der zum Mastende überproportional zunehmende Futterverbrauch. Doch Ereinisse, wie z.b. die Dioxinkrise oder der

Mehr

Aufgabe 11: Windanlage

Aufgabe 11: Windanlage Zentrale schritliche Abiturprüunen im Fach Mathematik Auabe 11: Windanlae Das Foto zeit einen Darrieus-Windenerie-Konverter. Der Wind setzt die drei Blätter um die vertikale Achse in Drehun; die Blätter

Mehr

Zur Berechnung von ψ-werten für Baukonstruktionen im Bereich bodenberührter Bauteile

Zur Berechnung von ψ-werten für Baukonstruktionen im Bereich bodenberührter Bauteile Ao. Univ. Prof. ipl.-in. r. tehn. Klaus Kreč, Büro für Bauphysik, Shönber am Kamp, Österreih raft, 24. 8. 2009 Zur Berehnun von ψ-werten für Baukonstruktionen im Bereih bodenberührter Bauteile I. Vorbemerkun

Mehr

Einfache Varianzanalyse für abhängige

Einfache Varianzanalyse für abhängige Einfache Varianzanalyse für abhängige Stichproben Wie beim t-test gibt es auch bei der VA eine Alternative für abhängige Stichproben. Anmerkung: Was man unter abhängigen Stichproben versteht und wie diese

Mehr

Verteilungsmodelle. Verteilungsfunktion und Dichte von T

Verteilungsmodelle. Verteilungsfunktion und Dichte von T Verteilungsmodelle Verteilungsfunktion und Dichte von T Survivalfunktion von T Hazardrate von T Beziehungen zwischen F(t), S(t), f(t) und h(t) Vorüberlegung zu Lebensdauerverteilungen Die Exponentialverteilung

Mehr

4.3 Systeme von starren Körpern. Aufgaben

4.3 Systeme von starren Körpern. Aufgaben Technische Mechanik 3 4.3-1 Prof. Dr. Wandiner ufabe 1: 4.3 Ssteme von starren Körpern ufaben h S L h D L L L D h H L H SH Ein PKW der Masse m mit Vorderradantrieb zieht einen Seelfluzeuanhäner der Masse

Mehr

Webergänzung zu Kapitel 10

Webergänzung zu Kapitel 10 Webergänzung zu Kapitel 10 10.1.4 Varianzanalyse (ANOVA: analysis of variance) Im Kapitel 10 haben wir uns hauptsächlich mit Forschungsbeispielen beschäftigt, die nur zwei Ergebnissätze hatten (entweder

Mehr

Fortgeschrittene Statistik Logistische Regression

Fortgeschrittene Statistik Logistische Regression Fortgeschrittene Statistik Logistische Regression O D D S, O D D S - R A T I O, L O G I T T R A N S F O R M A T I O N, I N T E R P R E T A T I O N V O N K O E F F I Z I E N T E N, L O G I S T I S C H E

Mehr

geben. Die Wahrscheinlichkeit von 100% ist hier demnach nur der Gehen wir einmal davon aus, dass die von uns angenommenen

geben. Die Wahrscheinlichkeit von 100% ist hier demnach nur der Gehen wir einmal davon aus, dass die von uns angenommenen geben. Die Wahrscheinlichkeit von 100% ist hier demnach nur der Vollständigkeit halber aufgeführt. Gehen wir einmal davon aus, dass die von uns angenommenen 70% im Beispiel exakt berechnet sind. Was würde

Mehr

Working Paper Zum Stand der Kausalanalyse mit Strukturgleichungsmodellen: Methodische Trends und Software-Entwicklungen

Working Paper Zum Stand der Kausalanalyse mit Strukturgleichungsmodellen: Methodische Trends und Software-Entwicklungen econstor www.econstor.eu Der Open-Access-Publikationsserver der ZBW Leibniz-Informationszentrum Wirtschaft The Open Access Publication Server of the ZBW Leibniz Information Centre for Economics Hildebrandt,

Mehr

DIE SOZIALVERSICHERUNG

DIE SOZIALVERSICHERUNG SBK-Schulunsmappe zum Thema Sozialversicherun EINLEITUNG So können Sie sicher starten Ein neuer Lebensabschnitt hat für Sie beonnen: die berufliche Ausbildun. Wie fühlen Sie sich? Sicher super endlich

Mehr

90-minütige Klausur Statistik für Studierende der Kommunikationswissenschaft

90-minütige Klausur Statistik für Studierende der Kommunikationswissenschaft Prof. Dr. Helmut Küchenhoff SS08 90-minütige Klausur Statistik für Studierende der Kommunikationswissenschaft am 22.7.2008 Anmerkungen Überprüfen Sie bitte sofort, ob Ihre Angabe vollständig ist. Sie sollte

Mehr

Einfache statistische Auswertungen mit dem Programm SPSS

Einfache statistische Auswertungen mit dem Programm SPSS Einfache statistische Auswertungen mit dem Programm SPSS Datensatz: fiktive_daten.sav Dipl. Päd. Anne Haßelkus Dr. Dorothea Dette-Hagenmeyer 11/2011 Überblick 1 Deskriptive Statistiken; Mittelwert berechnen...

Mehr

O01. Linsen und Linsensysteme

O01. Linsen und Linsensysteme O0 Linsen und Linsensysteme In optischen Systemen spielen Linsen eine zentrale Rolle. In diesem Versuch werden Verahren zur Bestimmun der Brennweite und der Hauptebenen von Linsen und Linsensystemen vorestellt..

Mehr

HTL Steyr Ausflussvorgänge Seite 1 von 10

HTL Steyr Ausflussvorgänge Seite 1 von 10 HTL Steyr Ausflussvoräne Seite 1 von 10 Ausflussvoräne Nietrost Bernhard, bernhard.nietrost@htl-steyr.ac.at Mathematische / Fachliche Inhalte in Stichworten: Differentialleichunen 1. Ordnun, analytische

Mehr

Klausur zu Methoden der Statistik I (mit Kurzlösung) Wintersemester 2007/2008. Aufgabe 1

Klausur zu Methoden der Statistik I (mit Kurzlösung) Wintersemester 2007/2008. Aufgabe 1 Lehrstuhl für Statistik und Ökonometrie der Otto-Friedrich-Universität Bamberg Prof. Dr. Susanne Rässler Klausur zu Methoden der Statistik I (mit Kurzlösung) Wintersemester 2007/2008 Aufgabe 1 Ihnen liegt

Mehr

Binäre abhängige Variablen

Binäre abhängige Variablen Binäre abhängige Variablen Thushyanthan Baskaran thushyanthan.baskaran@awi.uni-heidelberg.de Alfred Weber Institut Ruprecht Karls Universität Heidelberg Einführung Oft wollen wir qualitative Variablen

Mehr

Tutorial: Homogenitätstest

Tutorial: Homogenitätstest Tutorial: Homogenitätstest Eine Bank möchte die Kreditwürdigkeit potenzieller Kreditnehmer abschätzen. Einerseits lebt die Bank ja von der Vergabe von Krediten, andererseits verursachen Problemkredite

Mehr

Clusteranalyse. Anwendungsorientierte Einführung. R. Oldenbourg Verlag München Wien. Von Dr. Johann Bacher

Clusteranalyse. Anwendungsorientierte Einführung. R. Oldenbourg Verlag München Wien. Von Dr. Johann Bacher Clusteranalyse Anwendungsorientierte Einführung Von Dr. Johann Bacher R. Oldenbourg Verlag München Wien INHALTSVERZEICHNIS Vorwort XI 1 Einleitung 1 1.1 Primäre Zielsetzung clusteranalytischer Verfahren

Mehr

1.3 Die Beurteilung von Testleistungen

1.3 Die Beurteilung von Testleistungen 1.3 Die Beurteilung von Testleistungen Um das Testergebnis einer Vp zu interpretieren und daraus diagnostische Urteile ableiten zu können, benötigen wir einen Vergleichsmaßstab. Im Falle des klassischen

Mehr

Bestimmung der Molaren Masse nach Dumas (MOL) Gruppe 8 Simone Lingitz, Sebastian Jakob

Bestimmung der Molaren Masse nach Dumas (MOL) Gruppe 8 Simone Lingitz, Sebastian Jakob Bestiun der Molaren Masse nach Duas (MO Gruppe 8 Sione initz, Sebastian Jakob 1. Grundlaen In diese ersuch wird nach de erfahren von Duas die Molare Masse von hlorofor bestit. Dazu wird anenoen, daß hlorofor

Mehr

Mathematik: Mag. Schmid Wolfgang Arbeitsblatt Semester ARBEITSBLATT 12 WINKELBERECHNUNGEN. a) WINKEL ZWISCHEN ZWEI GERADEN

Mathematik: Mag. Schmid Wolfgang Arbeitsblatt Semester ARBEITSBLATT 12 WINKELBERECHNUNGEN. a) WINKEL ZWISCHEN ZWEI GERADEN ARBEITSBLATT 12 WINKELBERECHNUNGEN a) WINKEL ZWISCHEN ZWEI GERADEN Diese Formel haben wir a bereits kennenelernt: Satz: Der Winkel zwischen zwei Vektoren a und b, berechnet sich nach der Formel: a b cos

Mehr

a) Zeichnen Sie in das nebenstehende Streudiagramm mit Lineal eine Regressionsgerade ein, die Sie für passend halten.

a) Zeichnen Sie in das nebenstehende Streudiagramm mit Lineal eine Regressionsgerade ein, die Sie für passend halten. Statistik für Kommunikationswissenschaftler Wintersemester 2009/200 Vorlesung Prof. Dr. Helmut Küchenhoff Übung Cornelia Oberhauser, Monia Mahling, Juliane Manitz Thema 4 Homepage zur Veranstaltung: http://www.statistik.lmu.de/~helmut/kw09.html

Mehr

Clustering B EM-Algorithmus Automatische Bestimmung der Clusteranzahl

Clustering B EM-Algorithmus Automatische Bestimmung der Clusteranzahl Clustering B EM-Algorithmus Automatische Bestimmung der Clusteranzahl Daniel Birkmaier, Erlangen, 04.07.2013 Inhalt EM-Algorithmus Grundlegendes Details Anwendung Beispiel Automatische Bestimmung der Cluster-Anzahl

Mehr

Grundlagen der Inferenzstatistik: Was Ihnen nicht erspart bleibt!

Grundlagen der Inferenzstatistik: Was Ihnen nicht erspart bleibt! Grundlagen der Inferenzstatistik: Was Ihnen nicht erspart bleibt! 1 Einführung 2 Wahrscheinlichkeiten kurz gefasst 3 Zufallsvariablen und Verteilungen 4 Theoretische Verteilungen (Wahrscheinlichkeitsfunktion)

Mehr

Farbe als Qualitätskriterium

Farbe als Qualitätskriterium Erschienen in Farbe & Lack, 119/5 (2013) 20 bis 27. Farbe als Qualitätskriterium Wie sich Ausreißer oder Fehlcharen durch Farbmessun finden lassen Geor Meichsner und Renate Hiesen, Hochschule Esslinen

Mehr

Statistische Thermodynamik I Lösungen zur Serie 1

Statistische Thermodynamik I Lösungen zur Serie 1 Statistische Thermodynamik I Lösungen zur Serie Zufallsvariablen, Wahrscheinlichkeitsverteilungen 4. März 2. Zwei Lektoren lesen ein Buch. Lektor A findet 2 Druckfehler, Lektor B nur 5. Von den gefundenen

Mehr

JAVÍTÁSI-ÉRTÉKELÉSI ÚTMUTATÓ

JAVÍTÁSI-ÉRTÉKELÉSI ÚTMUTATÓ Fizika német nyelven középszint 1012 ÉRETTSÉGI VIZSGA 11. május 17. FIZIKA NÉMET NYELVEN KÖZÉPSZINTŰ ÍRÁSBELI ÉRETTSÉGI VIZSGA JAVÍTÁSI-ÉRTÉKELÉSI ÚTMUTATÓ NEMZETI ERŐFORRÁS MINISZTÉRIUM KORREKTUR- UND

Mehr

Monte-Carlo Simulation

Monte-Carlo Simulation Monte-Carlo Simulation Sehr häufig hängen wichtige Ergebnisse von unbekannten Werten wesentlich ab, für die man allerhöchstens statistische Daten hat oder für die man ein Modell der Wahrscheinlichkeitsrechnung

Mehr

Kanzlei-Rechnungswesen / Rechnungswesen Mahnwesen und Zahlungsvorschlag

Kanzlei-Rechnungswesen / Rechnungswesen Mahnwesen und Zahlungsvorschlag Kanzlei-Rechnunswesen / Rechnunswesen Mahnwesen und Zahlunsvorschla Herauseber: DATEV eg, 90329 Nürnber Alle in dieser Unterlae verwendeten personen- und firmenbezoenen Bezeichnunen und Anschriften sind

Mehr

Universität Bonn 28. Juli 2010 Fachbereich Rechts- und Wirtschaftswissenschaften Statistische Abteilung Prof. Dr. A. Kneip. KLAUSUR Statistik B

Universität Bonn 28. Juli 2010 Fachbereich Rechts- und Wirtschaftswissenschaften Statistische Abteilung Prof. Dr. A. Kneip. KLAUSUR Statistik B Universität Bonn 28. Juli 2010 Fachbereich Rechts- und Wirtschaftswissenschaften Statistische Abteilung Prof. Dr. A. Kneip Sommersemester 2010 KLAUSUR Statistik B Hinweise zur Bearbeitung: Bei allen Teilaufgaben

Mehr

Analyse klassierter Daten: Vor der Analyse fasst man jeweils mehrere Merkmalsausprägungen in (Merkmalswerte-)Klassen zusammen.

Analyse klassierter Daten: Vor der Analyse fasst man jeweils mehrere Merkmalsausprägungen in (Merkmalswerte-)Klassen zusammen. 4. Analyse univariater Daten: Übersicht Mathematik ist die Wissenschaft der reinen Zahl, Statistik die der empirischen Zahl Von univariaten Daten spricht man, wenn bei der Datenerhebung nur ein Merkmal

Mehr

Lineare Gleichungssysteme

Lineare Gleichungssysteme Brückenkurs Mathematik TU Dresden 2015 Lineare Gleichungssysteme Schwerpunkte: Modellbildung geometrische Interpretation Lösungsmethoden Prof. Dr. F. Schuricht TU Dresden, Fachbereich Mathematik auf der

Mehr

Klausur Sommersemester 2010

Klausur Sommersemester 2010 Klausur Sommersemester 2010 Lehrstuhl: Wirtschaftspolitik Prüfungsfach: Empirische Wirtschaftsforschung Prüfer: Prof. Dr. K. Kraft Datum: 04.08.2010 Hilfsmittel: Nicht-programmierbarer Taschenrechner Klausurdauer:

Mehr

Regelmäßigkeit (Erkennen von Mustern und Zusammenhängen) versus Zufall

Regelmäßigkeit (Erkennen von Mustern und Zusammenhängen) versus Zufall Wahrscheinlichkeitstheorie Was will die Sozialwissenschaft damit? Regelmäßigkeit (Erkennen von Mustern und Zusammenhängen) versus Zufall Auch im Alltagsleben arbeiten wir mit Wahrscheinlichkeiten, besteigen

Mehr

Mathematische und statistische Methoden II

Mathematische und statistische Methoden II Methodenlehre e e Prof. Dr. G. Meinhardt 6. Stock, Wallstr. 3 (Raum 06-206) Sprechstunde jederzeit nach Vereinbarung und nach der Vorlesung. Mathematische und statistische Methoden II Dr. Malte Persike

Mehr

Dossier: Rechnungen und Lieferscheine in Word

Dossier: Rechnungen und Lieferscheine in Word www.sekretaerinnen-service.de Dossier: Rechnungen und Lieferscheine in Word Es muss nicht immer Excel sein Wenn Sie eine Vorlage für eine Rechnung oder einen Lieferschein erstellen möchten, brauchen Sie

Mehr

R ist freie Software und kann von der Website. www.r-project.org

R ist freie Software und kann von der Website. www.r-project.org R R ist freie Software und kann von der Website heruntergeladen werden. www.r-project.org Nach dem Herunterladen und der Installation von R kann man R durch Doppelklicken auf das R-Symbol starten. R wird

Mehr

Daniel Bilic; Martin Raiber; Hannes Heinzmann

Daniel Bilic; Martin Raiber; Hannes Heinzmann Physik- Praktikum Daniel Bilic; Martin Raiber; Hannes Heinzmann M5 Schwinunen mit Auftrieb 1. Vertikale Schwinun eines Reaenzlases im Wasser Versuchsdurchführun: a) Wir füllten ein Reaenzlas so weit mit

Mehr

Nichtlineare Optimierung ohne Nebenbedingungen

Nichtlineare Optimierung ohne Nebenbedingungen Kapitel 2 Nichtlineare Optimierung ohne Nebenbedingungen In diesem Abschnitt sollen im wesentlichen Verfahren zur Bestimmung des Minimums von nichtglatten Funktionen in einer Variablen im Detail vorgestellt

Mehr

Teil II: Aufgaben zur Differential- und Integralrechnung Ohne Lösungsweg

Teil II: Aufgaben zur Differential- und Integralrechnung Ohne Lösungsweg Staatliche Studienakademie Leipzi Brückenkurs Mathematik Studienrichtun Informatik 1. - 15. September 11 Teil II: Aufaben zur Differential- und Interalrechnun Ohne Lösunswe 1. Aufabe: Bilden Sie die ersten

Mehr

Computerviren, Waldbrände und Seuchen - ein stochastisches Modell für die Reichweite einer Epidemie

Computerviren, Waldbrände und Seuchen - ein stochastisches Modell für die Reichweite einer Epidemie Computerviren, Waldbrände und Seuchen - ein stochastisches für die Reichweite einer Epidemie Universität Hildesheim Schüler-Universität der Universität Hildesheim, 21.06.2012 Warum Mathematik? Fragen zum

Mehr

Forschungsstatistik I

Forschungsstatistik I Prof. Dr. G. Meinhardt. Stock, Nordflügel R. 0-49 (Persike) R. 0- (Meinhardt) Sprechstunde jederzeit nach Vereinbarung Forschungsstatistik I Dr. Malte Persike persike@uni-mainz.de WS 008/009 Fachbereich

Mehr

, dt. $+ f(x) = , - + < x < +, " > 0. " 2# Für die zugehörige Verteilungsfunktion F(x) ergibt sich dann: F(x) =

, dt. $+ f(x) = , - + < x < +,  > 0.  2# Für die zugehörige Verteilungsfunktion F(x) ergibt sich dann: F(x) = 38 6..7.4 Normalverteilung Die Gauß-Verteilung oder Normal-Verteilung ist eine stetige Verteilung, d.h. ihre Zufallsvariablen können beliebige reelle Zahlenwerte annehmen. Wir definieren sie durch die

Mehr

Physikalische Chemie Praktikum. Mischphasenthermodynamik: Siedediagramm eines binären Systems

Physikalische Chemie Praktikum. Mischphasenthermodynamik: Siedediagramm eines binären Systems Hochschule Emden / Leer Physikalische Chemie Praktikum Vers.Nr.19 Juni 2015 Mischphasenthermodynamik: Siedediaramm eines binären Systems Allemeine Grundlaen: Gesetze von Dalton, Raoult, Henry, Dampfdruckdiaramm,

Mehr

W-Rechnung und Statistik für Ingenieure Übung 11

W-Rechnung und Statistik für Ingenieure Übung 11 W-Rechnung und Statistik für Ingenieure Übung 11 Christoph Kustosz (kustosz@statistik.tu-dortmund.de) Mathematikgebäude Raum 715 Christoph Kustosz (kustosz@statistik.tu-dortmund.de) W-Rechnung und Statistik

Mehr

Überblick über die Verfahren für Ordinaldaten

Überblick über die Verfahren für Ordinaldaten Verfahren zur Analyse ordinalskalierten Daten 1 Überblick über die Verfahren für Ordinaldaten Unterschiede bei unabhängigen Stichproben Test U Test nach Mann & Whitney H Test nach Kruskal & Wallis parametrische

Mehr

(sin φ +tan αcos φ) (4)

(sin φ +tan αcos φ) (4) PDDr.S.Mertens Theoretische Physik I Mechanik J. Unterhinninhofen, M. Hummel Blatt WS 8/9 1.1.8 1. Wurf am Abhan. Sie stehen an einem Abhan, der den Steiunswinkel α hat, und wollen (4Pkt.) einen Stein

Mehr

5.2. Nichtparametrische Tests. 5.2.1. Zwei unabhängige Stichproben: U- Test nach MANN- WHITNEY

5.2. Nichtparametrische Tests. 5.2.1. Zwei unabhängige Stichproben: U- Test nach MANN- WHITNEY 5.2. Nichtparametrische Tests 5.2.1. Zwei unabhängige Stichproben: U- Test nach MANN- WHITNEY Voraussetzungen: - Die Verteilungen der beiden Grundgesamtheiten sollten eine ähnliche Form aufweisen. - Die

Mehr

Modellbildungen zum Kugelstoßen

Modellbildungen zum Kugelstoßen Bernhard Ubbenjans Hümmlin Gymnasium Mühlenber 7 Leistunskurs Mathematik 694 Börer Söel Facharbeit im Leistunsfach Mathematik zum Thema Modellbildunen zum Kuelstoßen Verfasser: Bernhard Ubbenjans Gliederun.

Mehr

1. Lineare Funktionen

1. Lineare Funktionen Grundwissen zu den Geraden. Lineare Funktionen Geraden sind die Graphen linearer Funktionen. Dazu müssen wir zuerst den Beriff Funktion und dann den Beriff linear klären.. Funktion Eine Funktion ist eine

Mehr

Betragsgleichungen und die Methode der Fallunterscheidungen

Betragsgleichungen und die Methode der Fallunterscheidungen mathe online Skripten http://www.mathe-online.at/skripten/ Betragsgleichungen und die Methode der Fallunterscheidungen Franz Embacher Fakultät für Mathematik der Universität Wien E-mail: franz.embacher@univie.ac.at

Mehr

Datenanalyse mit Excel. Wintersemester 2013/14

Datenanalyse mit Excel. Wintersemester 2013/14 Datenanalyse mit Excel 1 KORRELATIONRECHNUNG 2 Korrelationsrechnung Ziel der Korrelationsrechnung besteht im bivariaten Fall darin, die Stärke des Zusammenhangs zwischen zwei interessierenden statistischen

Mehr

Die Analyse sozialen Wandels auf Basis wiederholter Querschnittserhebungen

Die Analyse sozialen Wandels auf Basis wiederholter Querschnittserhebungen Die Analyse sozialen Wandels auf Basis wiederholter Querschnittserhebungen Beitrag für den RatSWD-Nachwuchsworkshop: Längsschnittanalysen auf der Basis amtlicher Sozial- und Wirtschaftsdaten, Berlin, 25.-26.

Mehr

Ausarbeitung des Seminarvortrags zum Thema

Ausarbeitung des Seminarvortrags zum Thema Ausarbeitung des Seminarvortrags zum Thema Anlagepreisbewegung zum Seminar Finanzmathematische Modelle und Simulationen bei Raphael Kruse und Prof. Dr. Wolf-Jürgen Beyn von Imke Meyer im W9/10 Anlagepreisbewegung

Mehr

14. Google Explained: Eigenwerte, Graphen, Flüsse

14. Google Explained: Eigenwerte, Graphen, Flüsse 4. Goole Eplained: Eienwerte, Graphen, Flüsse 4.. Eienwerte und Eienvektoren Def D 4- Eienwerte und Eienvektoren Geeben sei eine nn-matri A. Ein Vektor v0 heißt Eienvektor zu A, wenn Av die leiche oder

Mehr

$ % + 0 sonst. " p für X =1 $

$ % + 0 sonst.  p für X =1 $ 31 617 Spezielle Verteilungen 6171 Bernoulli Verteilung Wir beschreiben zunächst drei diskrete Verteilungen und beginnen mit einem Zufallsexperiment, indem wir uns für das Eintreffen eines bestimmten Ereignisses

Mehr

Dr. Maike M. Burda. Welchen Einfluss hat die Körperhöhe auf das Körpergewicht? Eine Regressionsanalyse. HU Berlin, Econ Bootcamp

Dr. Maike M. Burda. Welchen Einfluss hat die Körperhöhe auf das Körpergewicht? Eine Regressionsanalyse. HU Berlin, Econ Bootcamp Dr. Maike M. Burda Welchen Einfluss hat die Körperhöhe auf das Körpergewicht? Eine Regressionsanalyse. HU Berlin, Econ Bootcamp 8.-10. Januar 2010 BOOTDATA.GDT: 250 Beobachtungen für die Variablen... cm:

Mehr

Dipl.-Ing. Peter Zeh VDI Laborversuche Elektronik HTW Berlin 2014-03-12

Dipl.-Ing. Peter Zeh VDI Laborversuche Elektronik HTW Berlin 2014-03-12 Dipl.-In. Peter Zeh VDI Laborversuche Elektronik HTW Berlin 24-3-2 Name, Vorname Sinum Datum:. Studienan: B2GEIT 2. Gruppe: 3. Anlaenverzeichnis: Note:. Lernziele Aufbau von Messschaltunen, Uman mit Funktionsenerator

Mehr

Zuschauer beim Berlin-Marathon

Zuschauer beim Berlin-Marathon Zuschauer beim Berlin-Marathon Stefan Hougardy, Stefan Kirchner und Mariano Zelke Jedes Computerprogramm, sei es ein Betriebssystem, eine Textverarbeitung oder ein Computerspiel, ist aus einer Vielzahl

Mehr

Herzlich Willkommen zur Vorlesung Statistik

Herzlich Willkommen zur Vorlesung Statistik Herzlich Willkommen zur Vorlesung Statistik Thema dieser Vorlesung: Kovarianz und Korrelation Prof. Dr. Wolfgang Ludwig-Mayerhofer Universität Siegen Philosophische Fakultät, Seminar für Sozialwissenschaften

Mehr

Ausgleichung nach der Methode der kleinsten Quadrate mit der a posteriori Schätzung der Gewichte

Ausgleichung nach der Methode der kleinsten Quadrate mit der a posteriori Schätzung der Gewichte Paper-ID: VGI 199727 Ausleichun nach der Methode der kleinsten Quadrate mit der a posteriori Schätzun der Gewichte Florijan Vodopivec 1, Dusan Kooj 2 1 University of Ljubljana, Faculty for Civil and Enineerin

Mehr

Statistik I für Betriebswirte Vorlesung 5

Statistik I für Betriebswirte Vorlesung 5 Statistik I für Betriebswirte Vorlesung 5 PD Dr. Frank Heyde TU Bergakademie Freiberg Institut für Stochastik 07. Mai 2015 PD Dr. Frank Heyde Statistik I für Betriebswirte Vorlesung 5 1 Klassische Wahrscheinlichkeitsdefinition

Mehr

Informationsblatt Induktionsbeweis

Informationsblatt Induktionsbeweis Sommer 015 Informationsblatt Induktionsbeweis 31. März 015 Motivation Die vollständige Induktion ist ein wichtiges Beweisverfahren in der Informatik. Sie wird häufig dazu gebraucht, um mathematische Formeln

Mehr

Einführung in die Geostatistik (7) Fred Hattermann (Vorlesung), hattermann@pik-potsdam.de Michael Roers (Übung), roers@pik-potsdam.

Einführung in die Geostatistik (7) Fred Hattermann (Vorlesung), hattermann@pik-potsdam.de Michael Roers (Übung), roers@pik-potsdam. Einführung in die Geostatistik (7) Fred Hattermann (Vorlesung), hattermann@pik-potsdam.de Michael Roers (Übung), roers@pik-potsdam.de 1 Gliederung 7 Weitere Krigingverfahren 7.1 Simple-Kriging 7.2 Indikator-Kriging

Mehr

Business Value Launch 2006

Business Value Launch 2006 Quantitative Methoden Inferenzstatistik alea iacta est 11.04.2008 Prof. Dr. Walter Hussy und David Tobinski UDE.EDUcation College im Rahmen des dokforums Universität Duisburg-Essen Inferenzstatistik Erläuterung

Mehr

Bestimmung einer ersten

Bestimmung einer ersten Kapitel 6 Bestimmung einer ersten zulässigen Basislösung Ein Problem, was man für die Durchführung der Simplexmethode lösen muss, ist die Bestimmung einer ersten zulässigen Basislösung. Wie gut das geht,

Mehr

Austausch- bzw. Übergangsprozesse und Gleichgewichtsverteilungen

Austausch- bzw. Übergangsprozesse und Gleichgewichtsverteilungen Austausch- bzw. Übergangsrozesse und Gleichgewichtsverteilungen Wir betrachten ein System mit verschiedenen Zuständen, zwischen denen ein Austausch stattfinden kann. Etwa soziale Schichten in einer Gesellschaft:

Mehr

Anhand des bereits hergeleiteten Models erstellen wir nun mit der Formel

Anhand des bereits hergeleiteten Models erstellen wir nun mit der Formel Ausarbeitung zum Proseminar Finanzmathematische Modelle und Simulationen bei Raphael Kruse und Prof. Dr. Wolf-Jürgen Beyn zum Thema Simulation des Anlagenpreismodels von Simon Uphus im WS 09/10 Zusammenfassung

Mehr

Charakteristikenmethode im Beispiel

Charakteristikenmethode im Beispiel Charakteristikenmethode im Wir betrachten die PDE in drei Variablen xu x + yu y + (x + y )u z = 0. Das charakteristische System lautet dann ẋ = x ẏ = y ż = x + y und besitzt die allgemeine Lösung x(t)

Mehr

Einige Statistische Tests für den Ein- Zwei- und k-stichprobenfall (Nach Sachs, Stat. Meth.)

Einige Statistische Tests für den Ein- Zwei- und k-stichprobenfall (Nach Sachs, Stat. Meth.) ue biostatistik: nichtparametrische testverfahren / ergänzung 1/6 h. Lettner / physik Statistische Testverfahren Einige Statistische Tests für den Ein- Zwei- und k-stichprobenfall (Nach Sachs, Stat. Meth.)

Mehr

Strukturgleichungsmodellierung

Strukturgleichungsmodellierung Strukturgleichungsmodellierung FoV Methodenlehre FSU-Jena Dipl.-Psych. Norman Rose Parameterschätzung, Modelltest & Fit Indizes bei SEM Forschungsorientierte Vertiefung - Methodenlehre Dipl.-Psych. Norman

Mehr

Aufgabe 1 (8= Punkte) 13 Studenten haben die folgenden Noten (ganze Zahl) in der Statistikklausur erhalten:

Aufgabe 1 (8= Punkte) 13 Studenten haben die folgenden Noten (ganze Zahl) in der Statistikklausur erhalten: Aufgabe 1 (8=2+2+2+2 Punkte) 13 Studenten haben die folgenden Noten (ganze Zahl) in der Statistikklausur erhalten: Die Zufallsvariable X bezeichne die Note. 1443533523253. a) Wie groß ist h(x 5)? Kreuzen

Mehr

Gibt es einen Geschmacksunterschied zwischen Coca Cola und Cola Zero?

Gibt es einen Geschmacksunterschied zwischen Coca Cola und Cola Zero? Gibt es einen Geschmacksunterschied zwischen Coca Cola und Cola Zero? Manche sagen: Ja, manche sagen: Nein Wie soll man das objektiv feststellen? Kann man Geschmack objektiv messen? - Geschmack ist subjektiv

Mehr

METHODENLEHRE I WS 2013/14 THOMAS SCHÄFER

METHODENLEHRE I WS 2013/14 THOMAS SCHÄFER METHODENLEHRE I WS 2013/14 THOMAS SCHÄFER DAS THEMA: INFERENZSTATISTIK IV INFERENZSTATISTISCHE AUSSAGEN FÜR ZUSAMMENHÄNGE UND UNTERSCHIEDE Inferenzstatistik für Zusammenhänge Inferenzstatistik für Unterschiede

Mehr

Grammatiken. Einführung

Grammatiken. Einführung Einführung Beispiel: Die arithmetischen Ausdrücke über der Variablen a und den Operationen + und können wie folgt definiert werden: a, a + a und a a sind arithmetische Ausdrücke Wenn A und B arithmetische

Mehr

Theoretische Grundlagen der Informatik WS 09/10

Theoretische Grundlagen der Informatik WS 09/10 Theoretische Grundlagen der Informatik WS 09/10 - Tutorium 6 - Michael Kirsten und Kai Wallisch Sitzung 13 02.02.2010 Inhaltsverzeichnis 1 Formeln zur Berechnung Aufgabe 1 2 Hamming-Distanz Aufgabe 2 3

Mehr