4 PROBABILISTISCHE CLUSTERANALYSEVERFAHREN

Größe: px
Ab Seite anzeigen:

Download "4 PROBABILISTISCHE CLUSTERANALYSEVERFAHREN"

Transkript

1 4 PROBABILISTISCHE CLUSTERANALYSEVERFAHREN 4.1 Einleitende Übersicht Die probabilistischen Clusteranalyseverfahren unterscheiden sich von den im vorausehenden Kapitel behandelten deterministischen Verfahren dadurch, daß ein Objekt jedem Cluster nur mit einer bestimmten Wahrscheinlichkeit π(k/) anehört. 1 π(k/) ist die Wahrscheinlichkeit, mit der Objekt dem Cluster k anehört. Wir werden diese Wahrscheinlichkeit im folenden als Zuordnunswahrscheinlichkeit bezeichnen. Auch die Bezeichnun Rekrutierunswahrscheinlichkeiten ("recruitment probabilities") ist üblich (Lazarsfeld und Henry 1968: 36-39). In diesem Kapitel werden folende probabilistische Verfahren behandelt: Latente Profilanalyse (Analyse latenter Klassen für quantitative Variablen, Abschnitt 4.) Analyse latenter Klassen für nominalskalierte Variablen (Abschnitt 4.3) Analyse latenter Klassen für ordinalskalierte Variablen (Abschnitt 4.4) Analyse latenter Klassen für emischte Variablen (Abschnitt 4.5) Alle Verfahren lassen sich als Verallemeinerun des K-Means-Verfahren entwickeln. Die Verfahren einen sich somit - wie das K-Means-Verfahren - nur für eine objektorientierte Clusteranalyse. Technisch bestehen die Modifikationen im folenden: 1. Der Schritt des Alorithmus der K-Means-Verfahren, in dem jedes Objekt dem Cluster zueordnet wird, zu dem die quadrierte euklidische Distanz minimal ist, wird dahinehend eändert, daß die Zuordnunswahrscheinlichkeiten π(k/) berechnet werden. Dazu sind in Abhänikeit vom Meßniveau bestimmte Verteilunsannahmen erforderlich. Ferner eht in die Berechnun die Annahme der lokalen Unabhänikeit ein (siehe dazu später).. Die Klassenzentren x und Klassenanteilswerte π(k) (Schritt 3 des Alorithmus des j K-Means-Verfahrens) werden als Maximum-Likelihood-Schätzer berechnet. Das 1 Zur Beschreibun der Modellannahmen werden im folenden riechische Buchstaben verwendet, für deren eschätzte Werte arabische.

2 heißt, sie werden so bestimmt, daß die empirische Verteilun der Objekte bestmölich durch das Modell reproduziert wird. Mit Ausnahme dieser beiden Modifikationen erfolt die Berechnun nach dem Alorithmus der K-Means-Verfahren. Dieser Alorithmus für probabilistische Clusteranalyseverfahren wird in der Literatur als EM-Alorithmus (=Expected-Maximum- Likelihood-Estimator) bezeichnet und eht auf Goodman (1974) zurück. Der EM-Alorithmus hat sich seit seiner Einführun in zahlreichen Anwendunssituationen bewährt (siehe z.b. Bock und Aitkin 1981, DeSoete und DeSarbo 1991, Laneheine und Van de Pol 1990, Ridon und Tsutakawa 1983, Van de Pol und de Leeuw 1986 u.a.). Das Konverenzverhalten zur Lösun einer Schätzaufabe wurde von Dempster, Laird und Rubin (1977) untersucht. Das Konzept der lokalen Unabhänikeit ist für die in diesem Kapitel behandelten Verfahren zentral. Es ist aus der Analyse latenter Strukturen mit der Analyse latenter Klassen als Submodell von Lazarsfeld und Henry (1968) bekannt (siehe dazu auch z.b. Denz 198) und eht von folender Modellvorstellun aus: 1. Den Daten lieen K unbekannte (=nicht beobachtete) Klassen zurunde. Diese werden als latente Klassen bezeichnet und. erklären die Zusammenhäne zwischen den untersuchten beobachteten (=manifesten) Variablen. Werden die (latenten) Klassen also als Kontrollvariablen in die Analyse eineführt, verschwinden die empirischen Zusammenhäne. Die manifesten Variablen sind innerhalb jeder Klasse unabhäni. Ween der Beziehun zur Analyse latenter Klassen von Lazarsfeld und Henry (1968) wurde für die in diesem Kapitel behandelten Verfahren die Bezeichnun Analyse latenter Klassen ewählt (Ausnahme: Latente Profilanalyse). Anstelle von "Clustern" wird von "latenten Klassen" oder kurz von "Klassen" esprochen, obwohl man sich selbstverständlich unter den "Klassen" "Cluster" vorstellen kann. Die behandelten Verfahren lassen sich vorstellen als: 1. Verallemeinerun des K-Means-Verfahrens: Die Annahme einer deterministischen Zuordnun der Objekte zu den Klassen wird fallenelassen.. Verallemeinerun der klassischen Analyse latenter Klassen von Lazarsfeld und Henry (1968): Neben dichotomen Variablen können nominalskalierte Variablen mit beliebi vielen Auspräunen, ordinalskalierte und/oder quantitative Variablen untersucht werden. 3. Submodelle von Mischverteilunsverfahren: Mischverteilunsverfahren (Kaufmann und Pape 1984: , Wolfe 1970 u.a.) ehen allemein von folender Pro-

3 blemstellun aus: Die empirische Verteilun der Objekte in den untersuchten Variablen ist eine Mischun von Wahrscheinlichkeitsverteilunen, z.b. von K m-dimensionalen Normalverteilunen mit den Mittelwertsvektoren µ k und den Kova- rianzmatrizen COV k mit den Elementen σ( k) jj* (σ( k) jj* = Kovarianz (j j*) bzw. Varianz (j=j*) zwischen den Variablen j und j* in der k-ten Normalverteilun). Aufabe von Mischverteilunsverfahren ist die Schätzun des Mischunsverhältnisses und der Parameter der einzelnen Wahrscheinlichkeitsverteilunen. Werden bestimmte zusätzliche Annahmen etroffen, können die Mischverteilunen durch die hier behandelten Verfahren eschätzt werden. So z.b. eht die latente Profilanalyse von der Modellvorstellun aus, daß K m-dimensionale Normalverteilunen vorlieen, wobei die Variablen innerhalb der (latenten) Klassen unabhäni sind. 4. Schließlich können die probabilistischen Clusteranalyseverfahren als Clusteranalyseverfahren interpretiert werden, die eine Modellierun zufällier Meßfehler erlauben (Espeland und Handelman 1989, Van de Pol und de Leeuw 1986 u.a.). Ein weiterer Unterschied zu den deterministischen Verfahren des Kapitels 3 besteht darin, daß das durch unterschiedliche Skaleneinheiten und Meßniveaus bedinte Problem der Nichtverleichbarkeit nicht auftritt, da zur Berechnun der Zuordnunswahrscheinlichkeiten π(k/) mit im Intervall [0,1] normierten Wahrscheinlichkeiten p(x j /k) erechnet wird. Umekehrt haben natürlich die probabilistischen Clusteranalyseverfahren auch bestimmte Nachteile. Diese bestehen zum einen darin, daß rößere Stichproben für eine konverente Lösun - insbesondere für die latente Profilanalyse - benötit werden als für die K-Means-Verfahren. Wenn wir das in Abschnitt durcheführte Rechenexperiment zur Veranschaulichun des Konverenzverhaltens aufreifen (siehe Tabelle 3.7.1), so wird bei zufällien Startwerten selbst bei einer Stichprobenröße von für die latente Profilanalyse keine konverente Lösun efunden. 1 Mit der Zahl der Variablen verbessert sich das Konverenzverhalten entscheidend (siehe Tabelle 4.1.1). Wie beim K-Means-Verfahren konverieren die Schätzunen ab einer Stichprobe von 500. Bei den in der Tabelle wiedereebenen Simulationserebnissen wurde von folenden Annahmen auseanen: Es lieen zwei leich roße Klassen vor. Klasse 1 besitzt in den Variablen X 1 und X eine Normalverteilun mit einem Mittelwert von -1 und einer Varianz von 1, Klasse eine Normalverteilun mit einem Mittelwert von +1 und einer Varianz von ebenfalls 1. Ab einer Stichprobe von n=500 werden die wahren Klassenmittelwerte somit relativ ut eschätzt. 1 Ein ähnlich schlechtes Konverenzverhalten berichten Kaufmann und Pape (1984: 433).

4 Allemein hänt das Konverenzverhalten bei der latenten Profilanalyse von dem Überlappunsanteil ab (Kaufmann und Pape 1984: 433). Um so eriner der Überlappunsanteil ist, desto besser konveriert das Verfahren asymptotisch. Das heißt, zur Schätzun der Modellparameter wird eine kleinere Stichprobe benötit. Das Konverenzverhalten der latenten Klassenanalyse für ordinale und nominale Variablen ist allemein besser, da bei diesen beiden Verfahren wenier Parameter zu schätzen sind. Tabelle 4.1.1: Veranschaulichun des asymptotischen Konverenzverhaltens der probabilistischen Clusteranalyseverfahren am Beispiel der latenten Profilanalyse Stichprobenröße C1 C Stichprobenröße C C Ein weiterer "Nachteil" der Verfahren kann darin esehen werden, daß strenenommen vor der Analyse die Identifikation des zu schätzenden Modells untersucht werden muß. Ein zu schätzendes Modell M wird dann als identifiziert bezeichnet, wenn die zu schätzenden Modellparameter P eindeuti bestimmt sind. Das heißt, es darf kein anderes Modell M* mit anderen Modellparametern P* eben, das dieselben Modelldaten produziert. Eine notwendie Bedinun für die Eindeutikeit (=Identifikation) eines Modells ist, daß die Zahl der empirischen Informationen rößer der Zahl der zu schätzenden Modellparameter ist (siehe dazu die Ausführunen). Bei Anwendun der latenten Profilanalyse kann immer davon auseanen werden, daß das untersuchte Modell identifiziert ist, da die notwendie Bedinun (mehr empirische Informationen als Modellparameter) i.d.r. erfüllt ist und Mischunen von m-dimensionalen Verteilunen identifizierbar sind (Kaufmann und Pape 1984: 4-43). Bei den anderen Verfahren muß dies nicht unbedint der Fall sein. Die Identifikation eines Modells kann dadurch eprüft werden, daß die esuchten Modellparameter als Funktion der empirischen Daten ausedrückt werden (Bacher 1990: 9-95, Lazarsfeld und Henry 1968: 59-68). Mitunter erfordert dieses Vorehen aber komplexe mathematische Operationen. Deshalb wurden Verfahren zur computerunterstützten Identifikationsprüfun entwickelt (Van de Pol, Laneheine und de Jon 1989: 9). Dabei wird eprüft, ob lineare Abhänikeiten zwischen den eschätzten Parametern bestehen. Ist dies der Fall,

5 ist das Modell nicht identifiziert. Umekehrt kann allerdins aus dem Fehlen von linearen Abhänikeiten nicht abeleitet werden, daß ein Modell identifiziert ist.

6 4. Latente Profilanalyse 4..1 Modellansatz und Alorithmus Das Modell der latenten Profilanalyse bzw. der Analyse latenter Klassen für quantitative Variablen wurde im Rahmen der Analyse latenter Strukturen (Lazarsfeld und Henry 1968: 8-39, Gibson 1966) entwickelt. Die Modellannahmen 1 sind: 1. Es lieen K latente Klassen vor.. Diese besitzen Anteilswerte von π(k) in der Grundesamtheit. 3. Jede Klasse k besitzt in jeder Klassifikationsvariablen j eine Normalverteilun mit dem Mittelwert (=Klassenzentrum) µ kj und der Varianz σ kj. 4. In jeder Klasse k sind die Variablen j und j* unabhäni. Die Normalverteilun in den Variablen können wir uns wie folt zustandeekommen vorstellen: Der empirisch beobachtete Wert x j eines Objekts aus k in der Variablen X j setzt sich aus einem zufällien Fehlerterm ε j und dem Klassenmittelwert µ kj zusammen: x j = µ kj + ε j. Der zufällie Fehlerterm ε j ist die Realisierun einer normalverteilten Zufallsvariablen ξ kj mit Erwartunswert 0 und Varianz σ kj. Er kann durch zufällie Meßfehler und/oder zufällie individuelle Unterschiede in den einzelnen Variablen entstehen. Da die Abweichunen ε j = x j - µ kj zufälli auftreten, sind sie in zwei Variablen j und j* unabhäni. Wäre dies nicht der Fall, würde es weni Sinn machen, von Zufällikeit zu sprechen. Formal ausedrückt sind somit die Ausnahmen: 1. x j = µ kj + ε j für alle, die Elemente aus k sind.. ε j ist die Realisierun einer normalverteilten Zufallsvariablen ξ kj. 3. ξ kj besitzt einen Erwartunswert von 0 und eine Varianz von σ kj. 4. Die Zufallsvariablen ξ kj sind unabhäni. Es ilt also COV(ξ kj,ξ kj* ) = 0. wobei x j der empirische Wert des Objekts aus der Klasse k in der Variablen j ist. µ kj ist der Klassenmittelwert in der Variablen j und ε j der zufällie Fehlerterm. Aus diesen Modellannahmen lassen sich folende Aussaen über die Mittelwerte, Varianzen und Kovarianzen der Gesamtpopulation ableiten (Lazarsfeld und Henry 1968: 9-31): 1 Zur Beschreibun der Modellannahmen werden im folenden riechische Buchstaben verwendet, für deren eschätzte Werte arabische. In dem klassischen Ansatz der latenten Profilanalyse ist eine Verteilunsannahme nicht erforderlich, da die Modellparameter nicht über die Maximum-Likelihood-Methode eschätzt werden.

7 (4..1) µ j = π ( k) µ kj. k ( µ µ ) ( µ ) (4..) σ = π ( µ. jj* k ) kj j kj* j* k (4..3) = σ = π ( k) σ + π ( k) ( µ µ ) σ. j jj k kj k Der Gesamtmittelwert einer Variablen ist leich dem ewichteten Mittelwert der Klassenzentren. Die Kovarianz zwischen zwei Variablen j und j* hänt nur von den Abweichunen der Klassenzentren von den Gesamtmittelwerten ab, die Varianz einer Variablen daeen auch noch von den Fehlerstreuunen (siehe dazu auch Abschnitt 3..7). Lazarsfeld und Henry (1968: 31-33) sowie Gibson (1966) entwickelten auf der Grundlae der Modellleichunen (4..5) bis (4..7) soenannte "accountin-equations", die eine Schätzun der Modellparameter mit Hilfe einer Eienwertzerleun ermölichen. Diese hat mehrere Nachteile (Van de Pol und de Leeuw 1986). So z.b. können neative Zuordnunswahrscheinlichkeiten entstehen. Eine andere Schätzmethode besteht in der Verwendun des in Abschnitt 4.1 erwähnten EM-Alorithmus. Die Modellparameter werden so eschätzt, daß die Likelihood- Funktion (4..4) L = π( k) π( / k) k bzw. ihr Loarithmus (4..5) l = ln( L ) = ln π ( k ) π ( / k ) k ein Maximum wird. π(k) ist dabei der "wahre" Anteil der Klasse k und π(/k) ist die (bedinte) Wahrscheinlichkeit des Auftretens des Merkmalsvektors der Person in der Klasse k. Die bedinte Wahrscheinlichkeit π(/k) ist ween der lokalen Unabhänikeit (siehe Abschnitt 4.1) leich dem Produkt der (bedinten) Auftrittswahrscheinlichkeiten π( xi / k) des Wertes von in den Variablen j für die Klasse k: (4..6) π( / k) = π( x / k). j j Die Auftrittswahrscheinlichkeit π(x j /k) ist bei der latenten Profilanalyse als Wert der Dichtefunktion der Normalverteilun mit dem Mittelwert µ kj und der Varianz σ kj definiert: (4..7) π kj j ( x µ ) / σ j kj kj ( xj / k) ϕ( xj / µ kj, σ kj ) = e σ kj π =, wobei ϕ(...) die Dichtefunktion der Normalverteilun ist. Betrachten wir dazu ein Beispiel: Die Klasse k soll in der Variablen j einen Mittelwert µ kj von -1 und eine Varianz σ kj von haben. Das Objekt besitzt in der Variablen j einen Wert von -. Die Auftrittswahrscheinlichkeit des Wertes von - in der Klasse k ist entsprechend (4..11)

8 leich dem Wert der Dichtefunktion der Normalverteilun mit den Modellparametern der Klasse k: π ( x j = / k) = ϕ( x j = / µ kj = 1, σ kj = ) = π e 0.5 ( ( 1) ) / = Der Wert von - tritt also mit einer Wahrscheinlichkeit von in der Klasse k auf. Dieser Wert eribt sich auch, wenn mit (--(-1))/ = der z-wert berechnet und die Dichtefunktion der Standardnormalverteilun dividiert mit der Standardabweichun verwendet wird. Die esuchten Parameter π(k), µ kj und σ kj werden nun so bestimmt, daß die Lo-Likelihood-Funktion ein Maximum ist. Das heißt, es werden Schätzunen esucht, die (theoretische) Modelldaten mit einer Verteilun erzeuen, die der empirischen Verteilun der Objekte bestmölich anepaßt ist. In die Schätzun ehen die Nebenbedinunen π( k ) = 1 und π(k)>0 für alle k ein. Die erste Nebenbedinun besat, daß die Summe der Klassenanteilswerte leich 1 sein soll. Die zweite Nebenbedinun bedeutet, daß keine Klasse leer sein soll. Unter Berücksichtiun dieser Nebenbedinun sind bei K Klassen und m Variablen folende Parameter zu schätzen: K-1 Klassenanteilswerte π(k) (ein Klassenanteilswert ist ween der Nebenbedinun π( k ) = 1 fixiert) K m Klassenzentren oder Klassenmittelwerte µ kj (in jeder Klasse für jede Variable ein Klassenzentrum) K m Klassenstreuunen oder Klassenvarianzen σ kj (in jeder Klasse für jede Variable eine Klassenvarianz) K (1 + m) - 1 Gesamtzahl zu schätzender Parameter Insesamt sind also K (1 + m) - 1 Parameter zu bestimmen. Wird beispielsweise eine 6-Klassenlösun bei drei Variablen (m=3) esucht, sind 6 (1 + 3) - 1 = 41 Parameter zu schätzen. Die notwendie Bedinun für ein identifiziertes Modell ist somit, daß mindestens 41 unterschiedliche Datensätze vorlieen. Die notwendie Bedinun wird i.d.r. bei der latenten Profilanalyse immer erfüllt sein. Wie bereits erwähnt, ist beim Vorlieen der notwendien Identifikationsbedinun das Modell der latenten Profilanalyse dann auch identifiziert. Beim EM-Alorithmus wird nun anenommen, daß die Zuordnunswahrscheinlichkeiten π(k/), mit der die Klasse k bei den Objekten auftritt, bekannt sind. Dadurch vereinfacht sich die Lo-Likelihood-Funktion zu (Van de Pol und de Leeuw 1986): l = π ( k / ) ( ln( π ( k)) + ln( π ( / k) ) k (4..8). = π ( k / ) ln( π ( k) + π ( k / ) π ( x / k) k k j j

9 Die Schätzaufabe zerfällt also zum einen in die Schätzun der Anteilswerte π(k) und zum anderen in die Schätzun der Parameter der einzelnen Normalverteilunen. Die Schätzwerte sind (Bock 1974: 58, Kaufmann und Pape 1984: 43) 1 : (4..9) p( k) = π ( k / )/ n, (4..10) x = π( k/ ) x π( k/ ), kj j ( x x ) kj = j kj (4..11) s π ( k / ) π ( k / ), wobei der Schätzwert von π(k) mit p(k) bezeichnet wurde. Der Schätzwert von µ kj wurde mit x kj und jener von σ mit s bezeichnet. Die Schätzwerte kann man sich wie kj kj folt vorstellen: Zur Berechnun der Parameter der Klasse k werden die Datensätze mit π(k/) ewichtet und ausezählt. Dadurch erhält man die Mittelwerte und Varianzen der Klasse k in den Variablen. Die ewichtete Fallzahl dividiert durch die unewichtete Fallzahl eribt den Anteil der Klasse k. Bei den bisherien Ausführunen wurde davon auseanen, daß die Zuordnunswahrscheinlichkeiten π(k/) bekannt sind. Dies ist natürlich nicht der Fall. Sie können aber ihrerseits aus den eschätzten Modellparametern mit Hilfe des Satzes von Bayes (Fisz 1980: 40-41) berechnet werden mit: (4..1) p( k) p ( / k) pk ( / ) = pk ( ) p ( / k), k wobei p(k/) der Schätzwert von π(k/) ist. p(k) ist der Schätzwert von π(k) und p(/k) der Schätzwert von π(/k). Damit haben wir das Grundprinzip des EM-Alorithmus skizziert. Es besteht aus zwei Schritten: 1. E-Schritt: Die Zuordnunswahrscheinlichkeiten π(k/) werden aufrund der eschätzten Modellparameter (=Erwartunswerte) berechnet. Die eschätzten Modellparameter werden dabei als eeben anenommen.. M-Schritt: Die Modellparameter π(k), µ kj und σ kj werden aufrund der Schätzwerte der Zuordnunswahrscheinlichkeiten nach der Maximum-Likelihood-Methode eschätzt. Die Zuordnunswahrscheinlichkeiten werden dabei als eeben anenommen. 1 Bock (1974: 58) sowie Kaufmann und Pape (1984: 43) leiten die Schätzunsfunktion direkt aus der Gleichun (4..5) ab.

10 Diese Schritte werden solane wiederholt, bis eine konverente Lösun efunden ist. Es eribt sich folender Schätzalorithmus: Schritt 1: Berechnun oder Einabe der Startwerte. Schritt : Berechnun der Zuordnunswahrscheinlichkeiten. Entsprechend der Gleichun (4..1) werden die Zuordnunswahrscheinlichkeiten berechnet mit: ( i 1) ( i 1) () i pk ( ) p ( / k) pk ( / ) = ( i 1) ( i 1 ) pk ( ) p ( / k), k wobei aufrund der Gleichunen (4..10) und (4..11) ( i 1) ( i 1) ( p ( / k) = px ( j / k) = xj x i i ( / 1) ( 1) ϕ kj, skj ) j ist. Der hochestellte Index in Klammern ist der Iterationszähler. Beim ersten Durchlaufen ist i=0. Schritt 3: Neuberechnun der Modellparameter. Die Modellparameter werden entsprechend den Gleichunen (4..9) bis (4..11) neu berechnet mit: () i () i pk ( ) = pk ( / ) / n. () i () i () i kj = ( / ) j ( / ). x p k x p k ( i) ( i) ( i) ( x x ) skj = p( k / ) j kj p( k / ). Schritt 4: Prüfun der Konverenz. Der Alorithmus wird dann abebrochen, wenn (a) die Verbesserun der Lo-Likelihood-Funktion kleiner einem voreebenen Schwellenwert (z.b ) und/oder (b) die maximale Abweichun der aufeinanderfolenden Schätzwerte kleiner einem zweiten Schwellenwert (z.b ) ist. j ( i) Der Alorithmus ist mit jenem des K-Means-Verfahren strukturleich. Das asymptotische Konverenzverhalten (n ) dieses Alorithmus wurde bereits im einleitenden Abschnitt beschrieben. (...)

11 4.. Modellprüfrößen Bestimmun der Klassenzahl Zur Bestimmun der Klassenzahl wird das Verfahren wiederum mit einer unterschiedlichen Anzahl von Klassen durcherechnet. Für die Wertedaten von Denz (1989) ereben sich die in der Tabelle 4.. darestellten Werte für die Lo-Likelihood- Funktion, wenn die Gesamtpunktewerte für die postmaterialistische und materialistische Wertorientierun als Klassifikationsvariablen in die Analyse einbezoen und die Startwerte mit dem Quick-Clusterin-Verfahren berechnet werden. Tabelle 4..1: Modellprüfrößen der latenten Profilanalyse für die Wertedaten von Denz (Startwerte aus dem Quick-Clusterin-Verfahren) Klassenzahl Wert der Lo- Likelihood- Funktion prozentuelle Verbesserun eenüber Nullmodell Informationsmaß von AKAIKE prozentuelle Verbesserun eenüber vorausehender Lösun K L K PV0 K IA K PV K KW Aus den Werten der Lo-Likelihood-Funktion 1 L K lassen sich folende Modellprüfrößen berechnen: Prozentuelle Verbesserun PV0 K eenüber dem Nullmodell der 1-Klassenlösun: Diese wird analo zu ETA berechnet mit LK (4..13) PV0K = 1 bzw. PV0K( in %) = 100 PV0K, L 1 wobei L 1 der Absolutbetra der Lo-Likelihood-Funktion für die 1-Klassenlösun und L K der Absolutbetra der Lo-Likelihood-Funktion der K-Klassenlösun ist. Für die 5-Klassenlösun beispielsweise beträt die prozentuelle Verbesserun 19.3 Prozent, 1 Allemein bedeutet ein kleinerer neativer Wert eine bessere Modellanpassun.

12 da der Absolutbetra L 1 = und L 5 = ist. PV0 5 ist daher leich / =0.193 (=19.3 Prozent). Prozentuelle Verbesserun PV K eenüber der vorausehenden Klassenlösun: Diese Maßzahl ist analo dem PRE-Koeffizienten beim K-Means-Verfahren definiert mit (4..14) PV K LK = 1 bzw. PVK( in %) = 100 PVK. L K 1 Für die 5-Klassenlösun eribt sich mit L 5-1 = L 4 = und L 5 = ein Wert von / = (=4.1 Prozent.). Informationsmaß von Akaike (Akaike 1974, Kaufmann und Pape 1984: 443): Dieses ist definiert mit (4..15) IA K = L K - m K, wobei m K die Zahl der zu schätzenden Parameter ist. Für die latente Profilanalyse ohne Restriktionen ist m K leich (K-1)+m K+m K, da (K-1) Klassenanteilswerte und jeweils m K Klassenmittelwerte bzw. Klassenvarianzen zu schätzen sind (m=zahl der Variablen). Für K=5 eribt sich in unserem Beispiel eine Zahl zu schätzender Parameter von (5-1) = 4. Das Informationsmaß für die 5-Klassenlösun ist daher = Das Informationsmaß von Akaike berücksichtit somit wie die F-MAX-Statistik die Tatsache, daß bei einer rößeren Klassenzahl in der Tendenz "automatisch" eine bessere Modellanpassun erzielt wird. Chi-Quadrat-Test für die Likelihood-Quotienten-Teststatistik: Ween der Maximum- Likelihood-Schätzun ist die Teststatistik - (L K-1 - L K ) approximativ Chi-Quadratverteilt mit df = m K - m K-1 Freiheitsraden. Bei kleinen Stichproben ist diese Approximation schlecht, es sollte daher die modifizierte Likelihood-Quotienten- Teststatistik nach Wolfe verwendet werden (Kaufmann und Pape 1984: 443): (4..16) LQ ( Wolfe) = ( n 1 m K / ) ( L L ). K n K 1 K Diese Teströße ist approximativ Chi-Quadrat-verteilt mit m Freiheitsraden. Mit dieser Teststatistik wird eprüft, ob die K-Klassenlösun eine sinifikant bessere Modellanpassun erbrint als die (K-1)-Klassenlösun. Sie entspricht somit den Bealschen F-Werten. Sollen allerdins die Klassenlösunen mit K-h (h>1) Klassen mit der K- Klassenlösun verlichen werden, muß die ewöhnliche Likelihood-Quotienten-Statistik - (L K-h - L K ) verwendet werden. Für den Verleich der 4- und 5-Klassenlösun eribt sich ein Wert von 1 ( ( ) ) LQ5 ( Wolfe) = (1 1 ) = 5,

13 da n = 1, m =, K = 5 sowie L 4 = und L 5 = sind. Bei Freiheitsraden ist dieser zu einem Sinifikanzniveau von 100 Prozent von 0 verschieden. Die ewöhnliche Likelihood-Quotienten-Statistik ist in dem Beispiel leich und besitzt 5 Freiheitsrade. Auch sie ist zum Niveau von 100 Prozent sinifikant von 0 verschieden. Die 5-Klassenlösun verbessert somit die 4- Klassenlösun sinifikant. Übersicht 4..1: Beziehun zwischen den Modellprüfrößen der latenten Profilanalyse und jenen des K-Means-Verfahrens Modellprüfrößen der latenten Profilanalyse Prozentuelle Verbesserun eenüber 1-Klassenlösun (=PV0 K ) Prozentuelle Verbesserun eenüber vorausehender Lösun (=PV K ) Informationsmaß von Akaike (=IA K ) Likelihood-Quotienten- Statistiken (ewöhnliche LQ-Statistik und LQ K (Wolfe)) Modellprüfrößen des K- Means-Verfahren Erklärte Streuun (=ETA K ) PRE-Koeffizient (=PRE K ) Maximaler F-MAX-Wert (=F-MAX K ) Bealsche F-Werte Anwendun zur Bestimmun der Klassenzahl Es werden nur jene Lösunen ausewählt, für die PV0 K einen bestimmten Wert überschreitet. Es wird (werden) jene Lösun(en) ausewählt, bei der (denen) PV K im Verleich zu der vorausehenden Lösun relativ roß ist. Es wird jene Lösun mit dem maximalen Informationsmaß (=kleinster neativer Wert) ausewählt. Es wird jene Lösun ausewählt, die (a) im Verleich zu allen vorausehenden Lösunen sinifikant und (b) im Verleich zu allen nachfolenden Lösunen nicht sinifikant ist. Die bereits erwähnte Analoie der Modellprüfrößen zu den Modellprüfrößen des K- Means-Verfahrens ilt auch für das Vorehen bei der Bestimmun der Klassenzahl (siehe Übersicht 4..1). Wendet man die einzelnen Strateien an, würden wir uns für folende Lösunen entscheiden: Prozentuelle Verbesserun PV K eenüber vorausehender Lösun: Für die -, 3-, 5-, 9- und 1-Klassenlösun, da hier die prozentuelle Verbesserun relativ roß ist. Absolut betrachtet sind die prozentuellen Verbesserunen aber erin (<10 Prozent).

14 Informationsmaß von Akaike: Für die 1-Klassenlösun, da hier der Wert des Informationsmaßes mit am rößten ist (=kleinster neativer Wert). Allerdins ist der Wert der 5-Klassenlösun mit nur erinfüi kleiner. Likelihood-Quotienten-Test: Für eine Analyse mit einer rößeren Klassenzahl, da die 1-Klassenlösun (=1-Spalte) eenüber den vorausehenden Klassenlösunen sinifikant ist. Prozentuelle Verbesserun eenüber Nullmodell der 1. Klassenlösun: Mitunter würden wir uns hier für die 9-Klassenlösun entscheiden, da für sie - im Verleich zur -, 3- und 5-Klassenlösun - die prozentuelle Verbesserun rößer 0 Prozent ist. Wir wollen im folenden zunächst die 5-Klassenlösun weiter untersuchen Modellprüfrößen für eine bestimmte Klassenlösun Für eine bestimmte Klassenlösun, z.b. für die 5-Klassenlösun, können zur Beschreibun die entsprechenden Modellprüfrößen verwendet werden. Darüber hinaus können - wie beim K-Means-Verfahren - varianzanalytische Maßzahlen verwendet werden, insbesondere die erklärte Streuun. In unserem Beispiel eribt sich eine erklärte Streuun von 60.9 Prozent. Die erklärte Streuun bei der latenten Profilanalyse ist i.d.r. kleiner als beim K-Means-Verfahren, da die Fehlerstreuun nicht minimiert wird. Beim K- Means-Verfahren eribt sich eine erklärte Streuun von 7.5 Prozent für die 5-Clusterlösun, wenn mit Quick-Clusterin-Startwerten erechnet wird Zufallstestun einer Klassenlösun Wie beim K-Means-Verfahren kann auch bei der latenten Profilanalyse mit Hilfe des Nullmodells einer homoenen, normalverteilten Population eprüft werden, ob eine bestimmte Klassenlösun überzufälli ist. Dazu werden wiederum Zufallsdatenmatrizen für das homoene Nullmodell erzeut. Für diese wird eprüft, wie ut sie durch die berechnete Klassenlösun reproduziert werden können. Es wird also wiederum das Modell mit voreebener Klassenstruktur verwendet. Eribt sich eine annähernd leich ute Reproduktion - emessen durch den Wert der Lo-Likelihood-Funktion -, wird man die Lösun als Zufallsprodukt betrachten. Führt man 0 Simulationen durch, ereben sich die in der Tabelle 4..3 darestellten Werte. Tabelle 4..: Simulationswerte für die Lo-Likelihood-Funktion aus einer Zufallstestun

15 Alle berechneten Lo-Likelihood-Werte sind unter der Annahme einer homoenen Population deutlich kleiner dem empirischen Wert von Der Mittelwert der Simulationswerte ist leich , die Standardabweichun hat einen Wert von Konstruieren wir eine z-teststatistik mit z=(t-e(t))/σ(t), wobei t der Wert der empirischen Lo-Likelihood-Funktion (t=l K ), E(t) der Mittelwert der Lo-Likelihood- Werte der simulierten Daten und σ(t) deren Standardabweichun ist, eribt sich ein Wert von Dieser ist rößer einem kritischen Schwellenwert von. Wir können daher die 5-Klassenlösun als überzufälli betrachten Beschreibun und Interpretation einer Klassenlösun Bei der Beschreibun und Interpretation einer Klassenlösun wird analo wie beim K- Means-Verfahren voreanen. Das bedeutet u.a.: 1. Für jede Variable kann eprüft werden, ob sie sinifikant zur Trennun der Klassen beiträt. Dazu wird die durch eine Variable erklärte Streuun und ein entsprechender F-Wert berechnet. Da im Unterschied zum K-Means-Verfahren nicht die Streuunsquadratsumme in den Klassen minimiert wird, ist die Durchführun eines Sinifikanztests für den F- Wert anemessener.. Es können die paarweisen Unterschiede zwischen den Klassen berechnet werden. 3. Die Variablen innerhalb einer Klasse können zu Variablenruppen zusammenefaßt werden. 4. Es können z-werte zur Beantwortun der Frae, ob sinifikante Abweichunen von den Gesamtmittelwerten vorlieen, berechnet werden. 5. Zur Beschreibun und Validitätsprüfun können Deskriptionsvariablen in die Analyse einbezoen werden. Wir wollen hier nicht die einzelnen Schritte durchehen, sondern die 5-Klassenlösun der latenten Profilanalyse mit der 5-Klassenlösun des K-Means-Verfahrens verleichen. Die bei beiden Verfahren berechneten Klassenzentren und Klassenrößen enthält die Tabelle Die Klassenlösunen stimmen hinsichtlich der Klassenzentren sehr ut überein. Die Klasse C1 läßt sich als Anti-Postmaterialisten interpretieren, die allerdins bei beiden Verfahren nur einen Anteil von 0.9 Prozent besitzt. Die zweite Klasse läßt sich als Konsenstypus mit erinerem Interesse und einer leichteren materialistischen Wertepräferenz interpretieren. Klasse 3 könnte als Cluster der Anti- Materialisten bezeichnet werden. Wie bei den Anti-Postmaterialisten ist der Anteilswert dieser Klasse allerdins erin. Klasse C4 läßt sich als emäßite Postmaterialisten interpretieren. Sie besitzt den rößten Anteilswert (latente Profilanalyse=70.1 Prozent,

16 K-Means=55.5 Prozent). Die letzte Klasse schließlich läßt sich als Klasse der Postmaterialisten bezeichnen. Bezülich der Klassenanteilswerte treten etwas rößere Unterschiede auf. So z.b. besitzt die Klasse C5 bei der latenten Profilanalyse einen Anteil von 1.7 Prozent, beim K-Means-Verfahren daeen von 5.7 Prozent. Dies ist auf den unterschiedlichen Modellansatz zurückzuführen. Beim K-Means-Verfahren werden die Objekte deterministisch den Klassen zueordnet. Besitzt beispielsweise ein Objekt die Zuordnunswahrscheinlichkeit 0.4 für die erste Klasse und die Zuordnunswahrscheinlichkeiten von 0.19 für die anderen fünf Klassen, wird es deterministisch der ersten Klasse zueordnet (Kaufmann und Pape 1984: 449). Die beim K-Means-Verfahren berechneten Anteilswerte der Klassen vermitteln daher nur eine sehr robe Vorstellun über die Größe der Klassen, wenn Überlappunen vorlieen. Bei beiden Verfahren sind zwei Klassen bzw. zwei Cluster schwach besetzt, nämlich die als Anti-Postmaterialisten und Anti-Materialisten bezeichneten Cluster. Dies ist eine Konsequenz des Startwertverfahrens. Das Quick-Clusterin führt dazu, daß als Startcluster maximal etrennte Cluster berechnet werden. Welche Erebnisse bei einem anderen Startwertverfahren erzielt werden, wird zu Ende dieses Abschnitts beschrieben. Wir wollen uns zunächst mit dem Problem der Überlappunen beschäftien. Tabelle 4..3: Erebnisse der 5-Klassenlösun der latenten Profilanalyse und des K- Means-Verfahrens für die Wertedaten von Denz (Startwertverfahren für beide Verfahren=Quick-Clusterin) C1 C C3 C4 C5 Latente Profilanalyse Anteilsw. in % Mittelw. GMAT GPMAT Standardabw. GMAT GPMAT K-Means-Verfahren Anteilsw. p(k) in % Mittelw. GMAT GPMAT Standardabw. GMAT GPMAT GMAT = Gesamtpunktwert für Materialismus, GPMAT = Gesamtpunktwert für Postmaterialismus Es wurde bereits darauf hinewiesen, daß der Überlappunsanteil entscheidend die Konverenz und Stabilität der Erebnisse der latenten Profilanalyse beeinflußt. Eine Grobabschätzun des Überlappunsanteils kann dadurch durcheführt werden, daß die Zuordnunswahrscheinlichkeiten dichotomisiert und alle Auspräunskombinationen

17 berechnet werden. Als Dichotomisierunsschwelle kann man dabei 1/K wählen, also jenen Wert, der sich eribt, wenn ein Objekt jeder Klasse mit der leichen Wahrscheinlichkeit anehört. Für die 5-Klassenlösun eribt sich folendes Bild (siehe Tabelle 4..5): (...) 4.3 Analyse latenter Klassen für nominalskalierte Variablen Modellansatz und Alorithmus Im Unterschied zur latenten Profilanalyse setzt die Analyse latenter Klassen für nominalskalierte Variablen - wie ihr Name sat - nur nominalskalierte Variablen voraus. Die Modellannahmen sind: 1. Es lieen K latente Klassen (=Muster) mit den Mittelwerten π(k) vor.. Die Wahrscheinlichkeit, daß in der latenten Klasse k die nominalen Variablen j mit der Auspräun i auftritt, ist leich π(i(j)/k). 3. Ween der Annahme der lokalen Unabhänikeit ist die Auftrittswahrscheinlichkeit des Merkmalsvektors eines Objekts, wenn die Klasse k vorliet, leich: (4.3.1) π( / k) = π( x 1/ k) π( x / k) K π( xm / k) = π( xj / k), wobei x j der Wert des Objekts in der nominalen Variablen j ist. π(x j /k) ist die bedinte Wahrscheinlichkeit des Auftretens der Auspräun des Objekts in der Variablen j für die Klasse k. Die Modellparameter sind somit: 1. Die Anteilswerte π(k) der latenten Klassen k (k=1,...,k). Die bedinten Auftrittswahrscheinlichkeiten π(j(i)/k) für das Auftreten der Auspräunen i in den nominalen Variablen j in den latenten Klassen k. Die bedinten Auftrittswahrscheinlichkeiten entsprechen den Klassenzentren der latenten Profilanalyse. Im Unterschied zur latenten Profilanalyse stellen die Klassenvarianzen keine Modellparameter dar, da sie mit π(j(i)/k) (1-π(j(i)/k)) aus den bedinten Auftrittswahrscheinlichkeiten berechnet werden können. Die Schätzun der Modellparameter erfolt wiederum über den EM-Alorithmus. Dazu werden die j

18 nominalen Variablen in ihre Dummies aufelöst. Wir wollen mit x j(i) den Wert des Objekts in der i-ten Dummy-Variablen (=Auspräun) der nominalen Variablen j bezeichnen. x j(i) ist leich 1, wenn Objekt in der nominalen Variablen j die Auspräun i besitzt, andernfalls 0. Mit π(k/) sollen wiederum die (wahren) Zuordnunswahrscheinlichkeiten der Objekte zu den Klassen k und mit p(k) und p(j(i)/k) die Schätzwerte der esuchten Modellparameter bezeichnet werden. Unter Verwendun dieser Notation ereben sich folende Schätzleichunen (Van de Pol und de Leeuw 1986) 1 : (4.3.) pk ( ) = π ( k/ ) n. (4.3.3) p(()/ j i k) = π( k/ ) x π ( k/ ). j() i Die beiden Schätzleichunen (4.3.) und (4.3.3) sind vollkommen strukturleich jenen der latenten Profilanalyse (Gleichunen 4..9 und 4..11). Die Auftrittswahrscheinlichkeiten π(j(i)/k) sind die Klassenzentren der Dummies der nominalen Variablen. Im Unterschied zur latenten Profilanalyse werden die Wahrscheinlichkeiten π(x j /k) des Auftretens der Werte des Objektes in den Variablen j, wenn die Klasse k vorliet, nicht über die Dichtefunktion der Normalverteilun berechnet, sondern mit: (4.3.4) π( xj / k) = π( ji ( )/ k) für x j(i) = 1. Die Wahrscheinlichkeit π(x j /k) ist also leich der Auftrittswahrscheinlichkeit der Auspräun i der nominalen Variablen j, die das Objekt besitzt. Hat beispielsweise das Objekt in der nominalen Variablen j die Auspräun 1, so ist die Wahrscheinlichkeit π( xi / k) leich der Auftrittswahrscheinlichkeit der Auspräun 1 in der Klasse k, also leich π(j(1)/k). Das zurundelieende Verteilunsmodell ist das einer Polynomialverteilun (Fisz 1980: ). Die Zuordnunswahrscheinlichkeiten π(k/) werden wie bei der latenten Profilanalyse über den Satz von Bayes bestimmt. Der EM-Alorithmus sieht folendermaßen aus: Schritt 1: Berechnun oder Einabe von Startwerten für die Modellparameter. Schritt : Berechnun der Zuordnunswahrscheinlichkeiten nach Bayes mit 1 1 Van de Pol und de Leeuw (1986) entwickeln die Schätzleichunen für das allemeine latente Markovmodell (siehe dazu auch Laneheine und Van de Pol 1990). Dieses enthält als Submodell die Analyse latenter Klassen für nominalskalierte Variablen. Die Schätzleichunen für die Analyse latenter Klassen sind beispielsweise auch in Andersen (1991: 46-49) wiedereeben. Laneheine (1988) ibt einen Überblick über neue Ansätze der Analyse latenter Klassen. 1 Aus Gründen der einfacheren Schreibweise wurde auf den Index für die i-te Iteration verzichtet.

19 (4.3.5) pk ( / ) = p( k) p ( / k), pk ( ) p ( / k) wobei die Wahrscheinlichkeit p(/k) des Auftretens des Objekts in der Klasse k entsprechend der Gleichun (4.3.1) eschätzt wird. Die dafür benötiten Auftrittswahrscheinlichkeiten π(x j /k) werden entsprechend Gleichun (4.3.7) berechnet. Schritt 3: Schätzun der Modellparameter entsprechend den Gleichunen (4.3.) und (4.3.3). Für Zuordnunswahrscheinlichkeiten π(k/) werden die Schätzwerte p(k/) aus dem zweiten Schritt verwendet. Schritt 4: Prüfun der Konverenz analo der latenten Profilanalyse. In die Schätzun ehen folende Nebenbedinunen ein: (4.3.6) π( k) = 1. k (4.3.7) π(k) > 0. (4.3.8) π( ji ()/ k) = 1 für alle Variablen i und Klassen k. i Die beiden ersten Nebenbedinunen haben wir bereits bei der latenten Profilanalyse eineführt. Sie besaen, daß die Summe der Klassenanteilswerte leich 1 und keine Klasse leer sein soll. Die dritte Nebenbedinun bedeutet, daß die Summe der Auftrittswahrscheinlichkeiten der Auspräunen einer Variablen in einer Klasse k leich 1 sein soll. Unter Berücksichtiun der Nebenbedinunen sind somit bei K Klassen und m nominalen Variablen folende Modellparameter zu schätzen: K-1 Klassenanteilswerte π(k). Ween der Nebenbedinun Σπ(k) = 1 ist ein Klassenanteilswert fixiert. m ( Auftrittswahrscheinlichkeiten π(j(i)/k). Ween der Nebenbedinun (4.3.6) sind in jeder Klasse für jede Variable m j K m j 1) j= 1-1 Auftrittswahrscheinlichkeiten zu schätzen (m j = Zahl der Auspräunen der Variablen j), insesamt also die aneebene Zahl. K 1 m j m + 1 j Gesamtzahl zu schätzender Parameter Wird also für drei nominale Variablen mit jeweils drei Auspräunen eine -Klassenlösun esucht, sind (Σ3-3 +1) -1 = 13 Modellparameter zu schätzen. Diesen stehen = 7 unterschiedliche Datenvektoren eenüber. Die notwendie Bedinun für ein identifiziertes Modell, daß mehr oder zumindest leichviele empirische Informationen (=unterschiedliche Merkmalsvektoren) als Modellparameter vorlieen, ist somit erfüllt. Die allemeine Bedinun lautet: Die Zahl der Auspräunskombinationen der nomina-

20 len Variablen muß rößer/leich der Zahl der zu schätzenden Parameter sein. Sind nicht alle Auspräunskombinationen besetzt, kann das Modell empirisch nicht identifiziert sein. In unserem Beispiel wäre dies der Fall, wenn nur 1 der 7 mölichen Kombinationen empirisch besetzt sind. In diesem Fall macht eine Schätzun keinen Sinn. Vor einer Analyse sollte daher immer eprüft werden, ob die notwendie Identifikationsbedinun erfüllt ist. Praktisch kann diese Bedinun z.b. mit dem Quick-Clusterin- Verfahren überprüft werden. Dazu wird die Clusterzahl leich der Zahl zu schätzender Parameter esetzt. Wir wollen diese Zahl mit m K bezeichnen. Findet das Quick-Clusterin-Verfahren keine m K Cluster, ist die notwendie Bedinun der Modellidentifikation nicht erfüllt. Wir wollen den Alorithmus anhand eines Rechenbeispiels veranschaulichen. Geeben sind zwei dichotome nominalskalierte Variablen X 1 und X mit jeweils drei Auspräunen. Es soll eine -Klassenlösun berechnet werden. Für den Iterationsschritt (i) sollen folende Schätzwerte vorlieen: C1 (k=1) C (k=) p(k) p(1(1)/k) p(1()/k) p(1(3)/k) p((1)/k) p(()/k) p((3)/k) Die Interpretation der Schätzwerte soll exemplarisch für die latente Klasse 1 (=C1) darestellt werden. Die latente Klasse 1 (k=1) hat einen Anteilswert von 0.5. Die Auspräun 1 der nominalen Variablen 1 tritt mit einer Wahrscheinlichkeit von 0.8 (=p(1(1)/1) auf, die Auspräun der nominalen Variablen 1 mit einer Wahrscheinlichkeit von 0. und die Auspräun 3 mit einer Wahrscheinlichkeit von 0. Da die Auftrittswahrscheinlichkeiten als Mittelwerte der Dummies (=Anteilswerte) interpretiert werden können, ist auch folende Interpretation mölich: In der Klasse 1 tritt mit 80 Prozent die Auspräun 1 in der Variablen 1 auf und mit 0 Prozent die Auspräun. Für die zweite Variable ist die Auftrittswahrscheinlichkeit der Auspräun 1 leich 0.6 (=p((1)/1)) usw. An den Schätzwerten lassen sich auch die darestellten Nebenbedinunen veranschaulichen. Die Summe der Anteilswerte der beiden Klassen ist leich 1. Da beide Klassen einen Anteilswert von 0.5 haben, ist auch die zweite Nebenbedinun, daß keine Klasse leer ist, erfüllt. Die dritte Nebenbedinun besat, daß die Summe der Auftrittswahrscheinlichkeiten jeder Variablen in jeder Klasse leich 1 ist. Auch diese Nebenbedinun ist erfüllt. Für die nominale Variable 1 in der Klasse 1 ilt beispielsweise:

21 p(1(1)/1) + p(1()/1) + p(1(3)/1) = 1, wie man leicht nachrechnen kann. Die Berechnun der Zuordnunswahrscheinlichkeiten p(k/) zeit Tabelle Sie soll für das erste Objekt A darestellt werden. Objekt A besitzt in der Variablen X1 die Auspräun 1 und in der Variablen X ebenfalls die Auspräun 1. Die Wahrscheinlichkeit für das Auftreten dieses Antwortmusters in der ersten latenten Klasse ist leich = 0.48, da p(1(1)/1) = 0.8 und p((1)/1) = 0.6 ist. Die Auftrittswahrscheinlichkeit des Objekts A für die latente Klasse ist leich = Der Likelihood-Wert (=PGES in der Tabelle) des Objekts A ist - wie bei der latenten Profilanalyse - leich = 0.4, da p(1) = 0.5, p() = 0.5 und p(a/1) = 0.48 und p(a/) = 0 ist. Daraus eribt sich ein Lo-Likelihood-Wert von Die Zuordnunswahrscheinlichkeiten für das Objekt A lassen sich über den Satz von Bayes berechnen. Für p(1/a) eribt sich eine Wert von p( 1/ A) = = 1, da p(a/1) = 0.48 und p(a/) = 0 ist. Die Auftrittswahrscheinlichkeit der Klasse 1 für das Objekt A ist leich 1, jene der Klasse leich 0. Das Objekt A ist also mit einer Wahrscheinlichkeit von 1 der Klasse 1 zueordnet.

22 Tabelle 4.3.1: Veranschaulichun der Berechnun der Zuordnunswahrscheinlichkeiten für die Analyse latenter Klassen für nominalskalierte Variablen Objek t Variablen Auftrittswahr. der Objekte Lo-Likelihood-Werte Zuordnunswahr. X1 X p(/1) p(/) PGES ML p(/1) p(/) A B C D E Σ Für die anderen Objekte können die Zuordnunswahrscheinlichkeiten analo berechnet werden. Es ereben sich die in der Tabelle darestellten Werte. Zur Neuberechnun der Modellparameter werden die nominalen Variablen in ihre Dummies aufelöst und mit den entsprechenden Zuordnunswahrscheinlichkeiten multipliziert. Da beide Variablen drei Auspräunen haben, wird jede nominale Variable in drei Dummies aufelöst. Tabelle 4.3. zeit exemplarisch die Berechnun der Modellparameter für die erste nominale Variable in der ersten Klasse. Da das Objekt A in der nominalen Variablen 1 die Auspräun 1 besitzt, ist der Wert in der Dummy- Variablen X 1(1) leich 1. Dieser wird mit der Zuordnunswahrscheinlichkeit des Objekts A zur ersten Klasse (=1) multipliziert. Analo wird für die anderen Dummies und die weiteren Objekte voreanen. Berechnet man die Spaltensumme der Zuordnunswahrscheinlichkeiten für die Klasse 1 (=Spalte "p(/1)"), eribt sich die mit den Zuordnunswahrscheinlichkeiten ewichtete Fallzahl der Klasse 1. Der Spaltensummenwert ist leich.5. Division mit der Fallzahl eribt entsprechend Gleichun (4.3.) den Anteilswert der Klasse 1. In unserem Beispiel ist dieser leich 0.5. Bilden wir die Spaltensummen der mit den Zuordnunswahrscheinlichkeiten multiplizierten (ewichteten) Dummies und dividieren diese mit der ewichteten Fallzahl, erhalten wir entsprechend Gleichun (4.3.3) die Schätzwerte für die Auftrittswahrscheinlichkeiten der Auspräunen der nominalen Variablen 1 in der Klasse 1. Es ereben sich Werte von 0.8, 0. und 0.0. Sie sind also mit den Werten der vorausehenden Iteration identisch. Dies ilt auch für die anderen Modellparameter. Damit dürfte das Grundprinzip der Schätzun der Modellparameter hinlänlich verdeutlicht worden sein. Abschließend ist auf eine Besonderheit des Alorithmus hinzuweisen: Besitzt ein Schätzwert für eine Auftrittswahrscheinlichkeit p(i(j)/k) den Wert 0 oder 1, wird er während der Iteration nicht mehr eändert. Bei der Einabe von Startwerten ist also darauf zu achten, daß keine Werte von 0 oder 1 eineeben werden, da diese dann nicht mehr eändert werden. Für die Auswahl eines Startwertverfahrens

23 bedeutet dies, daß Startwerte aus dem Quick-Clusterin- oder Repräsentanten- Verfahren ausscheiden, da sie ein typisches Objekt für jede Klasse auswählen. Da bei einem Objekt nur eine Auspräun auftreten kann, ist die Auftrittswahrscheinlichkeit in dieser Auspräun leich 1, alle anderen Auftrittswahrscheinlichkeiten leich 0. Tabelle 4.3.: Neuberechnun der Modellparameter für die erste Variable in der ersten Klasse Zuordnunswahr. Dummies multipliziert mit Zuordnunswahrscheinlichkeiten Variablen X1 X p(/1) p(/) X1(1) X1() X1(3) usw. A B C D E p(1(1)/1)= p(1()/1)= p(1(3)/1)=.00/.5= 0.50/.5= 0.00/.5= p(1)=.50/5 = Modellprüfun und Interpretation Es können die für die latente Profilanalyse entwickelten Modellprüfrößen verwendet werden. Ihre Anwendun soll anhand der Analyse der Freizeitaktivitäten von Kindern darestellt werden (siehe Abschnitte.3,.4.,.4.3, 3.5). Für eine erste Analyse wurde anenommen, daß vier bis acht latente Klassen vorhanden sind. Die entsprechenden Teströßen zeit die Tabelle Tabelle 4.3.3: Erebnisse der Analyse latenter Klassen für die Freizeitaktivitäten von Kindern Klassenzahl prozentuelle Verbesserun eenüber Nullmodell in % Wert der Lo-Likelihood-Funktion Informationsmaß von AKAIKE Sinifikanz der LQ- Statistik von Wolfe in % prozentuelle Verbesserun e. vorausehender Lösun in % K L K PV0 K IA K LQ K (Wolfe) PV K 1(a) (b) - (b) - (b) (c) - (c) (a) unser Proramm berechnet automatisch immer aus Modelltestründen die 1-Klassenlösun,

24 (b) nicht definiert, (c) diese Werte werden nicht berechnet, da keine vorausehende 3-Klassenlösun vorliet. Betrachten wir zunächst die prozentuellen Verbesserunen PV K eenüber der jeweils vorausehenden Lösun, so zeit sich, daß die 7- und 8-Klassenlösun kaum mehr den Wert der Lo-Likelihood-Funktion der vorausehenden Lösun verbessern: Die 6- Klassenlösun verbessert die 5-Klassenlösun nur mehr um 9.1 Prozent, die 8- Klassenlösun die 7-Klassenlösun um 7.7 Prozent. Diese Zunahmen in der Lo- Likelihood-Funktion sind auch nicht mehr sinifikant. Wir würden uns daher für die 6- Klassenlösun entscheiden. Der maximale Wert des Informationsmaßes von Akaike liet allerdins für die 8-Klassenlösun vor. Mitunter ist somit eine weitere Analyse mit mehr Klassen erforderlich, um das tatsächliche Maximum zu bestimmen. Wir wollen hier aber die 6-Klassenlösun weiter beschreiben. Die Erebnisse sind in der Tabelle darestellt. Da sehr viele Variablen untersucht werden, wird man zur Erleichterun der Interpretation untersuchen, ob in den einzelnen Klassen Variablenruppen ebildet werden können. Technisch bedeutet dies, daß der in Abschnitt darestellte Alorithmus zur Bildun von Variablenruppen einesetzt wird. Dabei ereben sich die in der Tabelle darestellten Variablenruppen. Die letzten drei Klassen lassen sich relativ einfach interpretieren: Klasse 4 ist der Typus der sehr aktiven Kinder, Klasse 5 der Typus der inaktiven oder deprivierten Kinder und Klasse 6 der Typus der Mittelaktiven, wobei Fernsehen und Radfahren überzufälli häufi auftreten. Die Klassen 1 bis 3 haben daeen ein selektives Freizeitmuster. Klasse 3 ist zum einen stark spielorientiert (alleine Spielen, mit Freunden spielen, Computerspiele). Zum anderen wird Musik ehört, mit der Familie etwas unternommen sowie Sport betrieben und Rad efahren. Wir können uns darunter einen Typus von Kindern vorstellen, für den das Spielen im Vorderrund steht. Die Klasse daeen ist dadurch ekennzeichnet, daß nur drei Freizeitaktivitäten häufi auseübt werden. Der Typus läßt sich wie folt beschreiben: Die Kinder sind zum einen in der Wohnun sehr zurückezoen. Sie lesen in der Freizeit ein Buch, im Freien spielen sie mit Freunden oder fahren Rad. Wir wollen diesen Typus als eher zurückezoenen Freizeittypus bezeichnen. Die Klasse 1 ist im Unterschied zur Klasse durch eine stärkere Familienorientierun ekennzeichnet. Mit der Familie wird etwas emeinsam unternommen, u.a. ein Spazieran, oder es wird emeinsam ebastelt oder emeinsam fernesehen. Daneben wird noch ein Buch elesen, radefahren, Musik ehört, Sport betrieben und alleine oder mit Freunden emeinsam espielt. Ein Name für diesen Typus läßt sich nur schwer finden, unter Umständen könnte er als familienorientierter Typus bezeichnet werden.

25 Zusammenfassend läßt sich somit festhalten, daß zwar eine inhaltliche Interpretation mölich ist, daß man diese aber in einer konfirmatorischen Analyse zu verbessern versuchen wird.

26 Tabelle 4.3.4: 6-Klassenlösun bei einer Analyse der Freizeitaktivitäten von Kindern (n=745) C1 C C3 C4 C5 C6 Anteilsw. p(k) Ausruhen ja Ausruhen nein Freunde ja Freunde nein Familie ja Familie nein Basteln ja Basteln nein Comics ja Comics nein Musizieren ja Musizieren nein Haustiere ja Haustiere nein Kino ja Kino nein Konzert ja Konzert nein Musikhören ja Musikhören nein Kirche ja Kirche nein Fernsehen ja Fernsehen nein Computer ja Computer nein Buch ja Buch nein Vereinsv. ja Vereinsv. nein Radfahren ja Radfahren nein Spazieren ja Spazieren nein alleine Sp. ja alleine Sp. nein Parties ja Parties nein Sport ja Sport nein

Einführung in die Fehlerrechnung (statistische Fehler und Fehlerfortpflanzung) anhand eines Beispielexperiments (Brennweitenbestimmung einer Linse)

Einführung in die Fehlerrechnung (statistische Fehler und Fehlerfortpflanzung) anhand eines Beispielexperiments (Brennweitenbestimmung einer Linse) Physiklabor Prof. Dr. M. Wülker Einführun in die Fehlerrechnun (statistische Fehler und Fehlerfortpflanzun) anhand eines Beispielexperiments (Brennweitenbestimmun einer Linse) Diese Einführun erläutert

Mehr

Fehlerrechnung in der Optik

Fehlerrechnung in der Optik HTL Saalfelden Fehlerrechnun in der Optik Seite von 6 Heinrich Schmidhuber heinrich_schmidh@hotmail.com Fehlerrechnun in der Optik Mathematische / Fachliche Inhalte in Stichworten: Fehlerarten, Fehlerfortplanzun,

Mehr

Luftdichte und Luftfeuchte

Luftdichte und Luftfeuchte M2 Luftdichte und Luftfeuchte Durch äun werden Masse und Volumen der Luft in einem Glaskolben bestimmt und unter Berücksichtiun des Luftdrucks und der Luftfeuchtikeit die Luftnormdichte berechnet. 1. Theoretische

Mehr

Literatur: Mankiw, Kap. 31 und 32, Bofinger, kap. 16 bis 18, Arnold, Kap. V. Aufschwung: Wachstumsrate BIP steigt. Abschwung: Wachstumsrate BIP fällt

Literatur: Mankiw, Kap. 31 und 32, Bofinger, kap. 16 bis 18, Arnold, Kap. V. Aufschwung: Wachstumsrate BIP steigt. Abschwung: Wachstumsrate BIP fällt 1 12. Kurzfristie wirtschaftliche Schwankunen Literatur: Mankiw, Kap. 31 und 32, Bofiner, kap. 16 bis 18, Arnold, Kap. V Beriffe: Aufschwun: Wachstumsrate BIP steit Abschwun: Wachstumsrate BIP fällt Rezession:

Mehr

Working Paper Zum Stand der Kausalanalyse mit Strukturgleichungsmodellen: Methodische Trends und Software-Entwicklungen

Working Paper Zum Stand der Kausalanalyse mit Strukturgleichungsmodellen: Methodische Trends und Software-Entwicklungen econstor www.econstor.eu Der Open-Access-Publikationsserver der ZBW Leibniz-Informationszentrum Wirtschaft The Open Access Publication Server of the ZBW Leibniz Information Centre for Economics Hildebrandt,

Mehr

I. Dokumenteninformationen

I. Dokumenteninformationen Seite 0 von 7 I. Dokumenteninformationen U-Werte eneiter Verlasunen Autoren Headline Subline Stichwörter 9815 Zeichen (esamt inkl. Leerzeichen), 3 Bilder Bilder Zeichen Titel/Rubrik Ausabe Seite 1 von

Mehr

Zur Berechnung von ψ-werten für Baukonstruktionen im Bereich bodenberührter Bauteile

Zur Berechnung von ψ-werten für Baukonstruktionen im Bereich bodenberührter Bauteile Ao. Univ. Prof. ipl.-in. r. tehn. Klaus Kreč, Büro für Bauphysik, Shönber am Kamp, Österreih raft, 24. 8. 2009 Zur Berehnun von ψ-werten für Baukonstruktionen im Bereih bodenberührter Bauteile I. Vorbemerkun

Mehr

Multivariate Verfahren

Multivariate Verfahren Multivariate Verfahren Lineare Reression Zweck: Vorhersae Dimensionsreduktion Klassifizierun Hauptkomponentenanalyse Korrespondenzanalyse Clusteranalyse Diskriminanzanalyse Eienschaften: nicht-linear verteilunsfrei

Mehr

Übungen zur Klassischen Theoretischen Physik III (Theorie C Elektrodynamik) WS 12-13

Übungen zur Klassischen Theoretischen Physik III (Theorie C Elektrodynamik) WS 12-13 Karlsruher Institut für Technoloie Institut für Theorie der Kondensierten Materie Übunen zur Klassischen Theoretischen Physik III Theorie C Elektrodynamik WS -3 Prof. Dr. Alexander Mirlin Blatt 4 Dr. Ior

Mehr

Ausgleichung nach der Methode der kleinsten Quadrate mit der a posteriori Schätzung der Gewichte

Ausgleichung nach der Methode der kleinsten Quadrate mit der a posteriori Schätzung der Gewichte Paper-ID: VGI 199727 Ausleichun nach der Methode der kleinsten Quadrate mit der a posteriori Schätzun der Gewichte Florijan Vodopivec 1, Dusan Kooj 2 1 University of Ljubljana, Faculty for Civil and Enineerin

Mehr

Farbe als Qualitätskriterium

Farbe als Qualitätskriterium Erschienen in Farbe & Lack, 119/5 (2013) 20 bis 27. Farbe als Qualitätskriterium Wie sich Ausreißer oder Fehlcharen durch Farbmessun finden lassen Geor Meichsner und Renate Hiesen, Hochschule Esslinen

Mehr

Speicherverwaltung. Robert K. Akakpo

Speicherverwaltung. Robert K. Akakpo Speicherverwaltun Robert K. Akakpo Aenda Grundlaen Monoprorammierun Mehrprorammbetrieb Virtuelle Speicherverwaltun Grundlaen Die verschiedenen Arten von Speicher Grundlaen Damit ein Computer ein Proramm

Mehr

1. Lineare Funktionen

1. Lineare Funktionen Grundwissen zu den Geraden. Lineare Funktionen Geraden sind die Graphen linearer Funktionen. Dazu müssen wir zuerst den Beriff Funktion und dann den Beriff linear klären.. Funktion Eine Funktion ist eine

Mehr

5. Schließende Statistik. 5.1. Einführung

5. Schließende Statistik. 5.1. Einführung 5. Schließende Statistik 5.1. Einführung Sollen auf der Basis von empirischen Untersuchungen (Daten) Erkenntnisse gewonnen und Entscheidungen gefällt werden, sind die Methoden der Statistik einzusetzen.

Mehr

Kontingenzkoeffizient (nach Pearson)

Kontingenzkoeffizient (nach Pearson) Assoziationsmaß für zwei nominale Merkmale misst die Unabhängigkeit zweier Merkmale gibt keine Richtung eines Zusammenhanges an 46 o jl beobachtete Häufigkeiten der Kombination von Merkmalsausprägungen

Mehr

Kanzlei-Rechnungswesen / Rechnungswesen Mahnwesen und Zahlungsvorschlag

Kanzlei-Rechnungswesen / Rechnungswesen Mahnwesen und Zahlungsvorschlag Kanzlei-Rechnunswesen / Rechnunswesen Mahnwesen und Zahlunsvorschla Herauseber: DATEV eg, 90329 Nürnber Alle in dieser Unterlae verwendeten personen- und firmenbezoenen Bezeichnunen und Anschriften sind

Mehr

O01. Linsen und Linsensysteme

O01. Linsen und Linsensysteme O0 Linsen und Linsensysteme In optischen Systemen spielen Linsen eine zentrale Rolle. In diesem Versuch werden Verahren zur Bestimmun der Brennweite und der Hauptebenen von Linsen und Linsensystemen vorestellt..

Mehr

Güte von Tests. die Wahrscheinlichkeit für den Fehler 2. Art bei der Testentscheidung, nämlich. falsch ist. Darauf haben wir bereits im Kapitel über

Güte von Tests. die Wahrscheinlichkeit für den Fehler 2. Art bei der Testentscheidung, nämlich. falsch ist. Darauf haben wir bereits im Kapitel über Güte von s Grundlegendes zum Konzept der Güte Ableitung der Gütefunktion des Gauss im Einstichprobenproblem Grafische Darstellung der Gütefunktionen des Gauss im Einstichprobenproblem Ableitung der Gütefunktion

Mehr

Willkommen zur Vorlesung Statistik (Master)

Willkommen zur Vorlesung Statistik (Master) Willkommen zur Vorlesung Statistik (Master) Thema dieser Vorlesung: Verteilungsfreie Verfahren Prof. Dr. Wolfgang Ludwig-Mayerhofer Universität Siegen Philosophische Fakultät, Seminar für Sozialwissenschaften

Mehr

14. Google Explained: Eigenwerte, Graphen, Flüsse

14. Google Explained: Eigenwerte, Graphen, Flüsse 4. Goole Eplained: Eienwerte, Graphen, Flüsse 4.. Eienwerte und Eienvektoren Def D 4- Eienwerte und Eienvektoren Geeben sei eine nn-matri A. Ein Vektor v0 heißt Eienvektor zu A, wenn Av die leiche oder

Mehr

4.3 Systeme von starren Körpern. Aufgaben

4.3 Systeme von starren Körpern. Aufgaben Technische Mechanik 3 4.3-1 Prof. Dr. Wandiner ufabe 1: 4.3 Ssteme von starren Körpern ufaben h S L h D L L L D h H L H SH Ein PKW der Masse m mit Vorderradantrieb zieht einen Seelfluzeuanhäner der Masse

Mehr

Performanceanalyse im E-Brokerage

Performanceanalyse im E-Brokerage Universität Ausbur Prof. Dr. Hans Ulrich Buhl Kernkompetenzzentrum Finanz- & Informationsmanaement Lehrstuhl für BWL, Wirtschaftsinformatik, Informations- & Finanzmanaement Diskussionspapier WI-90 Performanceanalyse

Mehr

Herzlich Willkommen zur Vorlesung Statistik

Herzlich Willkommen zur Vorlesung Statistik Herzlich Willkommen zur Vorlesung Statistik Thema dieser Vorlesung: Kovarianz und Korrelation Prof. Dr. Wolfgang Ludwig-Mayerhofer Universität Siegen Philosophische Fakultät, Seminar für Sozialwissenschaften

Mehr

Erschienen in: Bauphysik 22 (2000), H. 4, S. 270-273 1

Erschienen in: Bauphysik 22 (2000), H. 4, S. 270-273 1 Erschienen in: Bauphysik 22 (2000), H. 4, S. 270-273 1 Hauser, G. und Höttes, K. Bauphysik in Kürze: U-Werte von Fenstern Der letzte Beitra in der Reihe "Bauphysik in Kürze" behandelte den neuen Berechnunsansatz

Mehr

Business Value Launch 2006

Business Value Launch 2006 Quantitative Methoden Inferenzstatistik alea iacta est 11.04.2008 Prof. Dr. Walter Hussy und David Tobinski UDE.EDUcation College im Rahmen des dokforums Universität Duisburg-Essen Inferenzstatistik Erläuterung

Mehr

White Paper Personalbeschaffung 2.0. Wie Sie mit der richtigen Ansprache zum Employer-of-choice werden

White Paper Personalbeschaffung 2.0. Wie Sie mit der richtigen Ansprache zum Employer-of-choice werden White Paper Personalbeschaffun 2. Wie Sie mit der richtien Ansprache zum Employer-of-choice werden Nutzun verschiedener Kanäle beim Recruitin in Deutschland im Jahr 212 9 8 7 6 5 4 3 2 1 84 % 84 % 74 %

Mehr

Physikalische Chemie Praktikum. Mischphasenthermodynamik: Siedediagramm eines binären Systems

Physikalische Chemie Praktikum. Mischphasenthermodynamik: Siedediagramm eines binären Systems Hochschule Emden / Leer Physikalische Chemie Praktikum Vers.Nr.19 Juni 2015 Mischphasenthermodynamik: Siedediaramm eines binären Systems Allemeine Grundlaen: Gesetze von Dalton, Raoult, Henry, Dampfdruckdiaramm,

Mehr

, dt. $+ f(x) = , - + < x < +, " > 0. " 2# Für die zugehörige Verteilungsfunktion F(x) ergibt sich dann: F(x) =

, dt. $+ f(x) = , - + < x < +,  > 0.  2# Für die zugehörige Verteilungsfunktion F(x) ergibt sich dann: F(x) = 38 6..7.4 Normalverteilung Die Gauß-Verteilung oder Normal-Verteilung ist eine stetige Verteilung, d.h. ihre Zufallsvariablen können beliebige reelle Zahlenwerte annehmen. Wir definieren sie durch die

Mehr

Schweine bis 140 kg mästen?

Schweine bis 140 kg mästen? Schweine bis 140 mästen? Für weiter steiende Endewichte sprechen weder die Preismasken noch der zum Mastende überproportional zunehmende Futterverbrauch. Doch Ereinisse, wie z.b. die Dioxinkrise oder der

Mehr

Kennzeichnung Honig. Musteretikett. Honig. 500 g. Imkerei Muster Musterplatz 1 1234 Musterdorf

Kennzeichnung Honig. Musteretikett. Honig. 500 g. Imkerei Muster Musterplatz 1 1234 Musterdorf Kennzeichnun Honi Musteretikett Honi 500 Bezeichnun des Lebensmittels Nettofüllmene Name oder Firma und Anschrift des Lebensmittelunternehmers Imkerei Muster Musterplatz 1 1234 Musterdorf Mindestens haltbar

Mehr

Bestimmung der Dichte eines festen Körpers aus dem Auftrieb in Flüssigkeiten Versuchsprotokoll

Bestimmung der Dichte eines festen Körpers aus dem Auftrieb in Flüssigkeiten Versuchsprotokoll Bestimmun der Dichte eines festen Körpers aus dem Auftrieb in Flüssikeiten Versuchsprotokoll Tobias Brinkert email: Homepae: 27.0.200 Version: 1.3 Inhaltsverzeichnis

Mehr

Willkommen zur Vorlesung Statistik

Willkommen zur Vorlesung Statistik Willkommen zur Vorlesung Statistik Thema dieser Vorlesung: Varianzanalyse Prof. Dr. Wolfgang Ludwig-Mayerhofer Universität Siegen Philosophische Fakultät, Seminar für Sozialwissenschaften Prof. Dr. Wolfgang

Mehr

Account-Manager und Customer

Account-Manager und Customer Matchin von Key-Account Account-Manaer und Customer Eine Anwendun der Theorie der Ähnlichkeit im Service Enineerin Konferenz Dienstleistunsentwicklun Wissen, Kreativität, Lernen Stuttart, 6.06.2005 ; Stephan

Mehr

Physik 1 ET, WS 2012 Aufgaben mit Lösung 2. Übung (KW 44) Schräger Wurf ) Bootsfahrt )

Physik 1 ET, WS 2012 Aufgaben mit Lösung 2. Übung (KW 44) Schräger Wurf ) Bootsfahrt ) Physik ET, WS Aufaben mit Lösun. Übun (KW 44). Übun (KW 44) Aufabe (M.3 Schräer Wurf ) Ein Ball soll vom Punkt P (x, y ) (, ) aus unter einem Winkel α zur Horizontalen schrä nach oben eworfen werden. (a)

Mehr

Körper können als thermisch dünn bezeichnet werden, wenn die Biotzahl

Körper können als thermisch dünn bezeichnet werden, wenn die Biotzahl 7 7 Instationäre Wärmeleitn Unter instationärer Wärmeleitn wird die Erwärmn nd Kühln von festen Körpern verstanden, die emperatr ist also abhäni von der Zeit Unterschieden wird zwischen thermisch dünnen

Mehr

Versicherungsmathematik. Mathematische Grundlagenseminare

Versicherungsmathematik. Mathematische Grundlagenseminare Versicherunsmathematik Mathematische Grundlaenseminare Mathematische Grundlaenseminare für alle Mitarbeiter aus der Versicherunswirtschaft Einstie in die Versicherunsmathematik leicht emacht! Ob es Ihnen

Mehr

a) Zeichnen Sie in das nebenstehende Streudiagramm mit Lineal eine Regressionsgerade ein, die Sie für passend halten.

a) Zeichnen Sie in das nebenstehende Streudiagramm mit Lineal eine Regressionsgerade ein, die Sie für passend halten. Statistik für Kommunikationswissenschaftler Wintersemester 2009/200 Vorlesung Prof. Dr. Helmut Küchenhoff Übung Cornelia Oberhauser, Monia Mahling, Juliane Manitz Thema 4 Homepage zur Veranstaltung: http://www.statistik.lmu.de/~helmut/kw09.html

Mehr

9. Schätzen und Testen bei unbekannter Varianz

9. Schätzen und Testen bei unbekannter Varianz 9. Schätzen und Testen bei unbekannter Varianz Dr. Antje Kiesel Institut für Angewandte Mathematik WS 2011/2012 Schätzen und Testen bei unbekannter Varianz Wenn wir die Standardabweichung σ nicht kennen,

Mehr

Dipl.-Ing. Peter Zeh VDI Laborversuche Elektronik HTW Berlin 2014-03-12

Dipl.-Ing. Peter Zeh VDI Laborversuche Elektronik HTW Berlin 2014-03-12 Dipl.-In. Peter Zeh VDI Laborversuche Elektronik HTW Berlin 24-3-2 Name, Vorname Sinum Datum:. Studienan: B2GEIT 2. Gruppe: 3. Anlaenverzeichnis: Note:. Lernziele Aufbau von Messschaltunen, Uman mit Funktionsenerator

Mehr

White Paper. Crossmedia Marketing. Wie Sie mit konvergenten Inhalten effizienter kommunizieren

White Paper. Crossmedia Marketing. Wie Sie mit konvergenten Inhalten effizienter kommunizieren White Paper Crossmedia Marketin Wie Sie mit konverenten Inhalten effizienter kommunizieren peshkova - Fotolia.com 2 WhitePaper/ Crossmedia Marketin Crossmedia Marketin - die Konverenz der Inhalte Stellen

Mehr

13 Übungen Reihen- und Parallelschaltungen

13 Übungen Reihen- und Parallelschaltungen 13 Übunen Reihen- und Parallelschaltunen Fertie bei allen Aufaben eine Schaltunsskizze an und zeichne die esuchten Größen ein! Auf Geeben Gesucht 13.1 Reihenschaltun = 2 kω, = 5 kω, U = Schaltun skizzieren

Mehr

Monte-Carlo Simulation

Monte-Carlo Simulation Monte-Carlo Simulation Sehr häufig hängen wichtige Ergebnisse von unbekannten Werten wesentlich ab, für die man allerhöchstens statistische Daten hat oder für die man ein Modell der Wahrscheinlichkeitsrechnung

Mehr

Grundlagen der Inferenzstatistik: Was Ihnen nicht erspart bleibt!

Grundlagen der Inferenzstatistik: Was Ihnen nicht erspart bleibt! Grundlagen der Inferenzstatistik: Was Ihnen nicht erspart bleibt! 1 Einführung 2 Wahrscheinlichkeiten kurz gefasst 3 Zufallsvariablen und Verteilungen 4 Theoretische Verteilungen (Wahrscheinlichkeitsfunktion)

Mehr

12. Vergleich mehrerer Stichproben

12. Vergleich mehrerer Stichproben 12. Vergleich mehrerer Stichproben Dr. Antje Kiesel Institut für Angewandte Mathematik WS 2011/2012 Häufig wollen wir verschiedene Populationen, Verfahren, usw. miteinander vergleichen. Beipiel: Vergleich

Mehr

Vom 09. Februar 2011. I. Aufbau, Regelstudienzeit, akademische Grade und Zweck der Abschlüsse

Vom 09. Februar 2011. I. Aufbau, Regelstudienzeit, akademische Grade und Zweck der Abschlüsse Erste Änderun Fachspezifische Prüfuns- und Studienordnun für den Masterstudienan Desin an der Hochschule für Anewandte Wissenschaften Hambur (Hambur University of Applied Sciences) Vom 09. Februar 2011

Mehr

Geometrie-Dossier Symmetrie in der Ebene

Geometrie-Dossier Symmetrie in der Ebene Geometrie-oier Symmetrie in der Ebene Name: Inhalt: Symmetrieeienchaft und bbildun: eriffe chenymmetrie und Geradenpieelun rehymmetrie und rehun Punktymmetrie und Punktpieelun Verwendun: iee Geometriedoier

Mehr

Analyse von Tabellen und kategorialen Daten

Analyse von Tabellen und kategorialen Daten Hans-Jürgen Andreß Jacques A. Hagenaars Steffen Kühnel Analyse von Tabellen und kategorialen Daten Log-lineare Modelle, latente Klassenanalyse, logistische Regression und GSK-Ansatz Mit 32 Abbildungen

Mehr

DIE SOZIALVERSICHERUNG

DIE SOZIALVERSICHERUNG SBK-Schulunsmappe zum Thema Sozialversicherun EINLEITUNG So können Sie sicher starten Ein neuer Lebensabschnitt hat für Sie beonnen: die berufliche Ausbildun. Wie fühlen Sie sich? Sicher super endlich

Mehr

Bestimmung der Molaren Masse nach Dumas (MOL) Gruppe 8 Simone Lingitz, Sebastian Jakob

Bestimmung der Molaren Masse nach Dumas (MOL) Gruppe 8 Simone Lingitz, Sebastian Jakob Bestiun der Molaren Masse nach Duas (MO Gruppe 8 Sione initz, Sebastian Jakob 1. Grundlaen In diese ersuch wird nach de erfahren von Duas die Molare Masse von hlorofor bestit. Dazu wird anenoen, daß hlorofor

Mehr

Seminare Arbeitsrecht 2016

Seminare Arbeitsrecht 2016 AUS DER BRANCHE FÜR DIE BRANCHE Seminare Arbeitsrecht 2016 Mitarbeiter von Personalabteilunen I Führunskräfte I Ausbildunsbeauftrate Inhalt Unser Seminaranebot Betriebsverfassunsrecht I 4 Betriebsverfassunsrecht

Mehr

Sicherheitsaspekte. Szenarien. Angriffsarten. Discretionary Access Control. Sicherheit im DBMS. Identifikation und Authentisierung

Sicherheitsaspekte. Szenarien. Angriffsarten. Discretionary Access Control. Sicherheit im DBMS. Identifikation und Authentisierung Sicherheitsaspekte Sicherheit im DBMS Identifikation und Authentisierun Autorisierun und Zuriffskontrolle Auditin Szenarien Literaturdatenbank in der Hochschule: erines Sicherheitsbedürfnis ERP-Datenbank

Mehr

Performanceattribution im Private Banking

Performanceattribution im Private Banking Universität Ausbur Prof. Dr. Hans Ulrich Buhl Kernkompetenzzentrum Finanz- & Informationsmanaement Lehrstuhl für BWL, Wirtschaftsinformatik, Informations- & Finanzmanaement Diskussionspapier WI-74 Performanceattribution

Mehr

Datenanalyse mit Excel. Wintersemester 2013/14

Datenanalyse mit Excel. Wintersemester 2013/14 Datenanalyse mit Excel 1 KORRELATIONRECHNUNG 2 Korrelationsrechnung Ziel der Korrelationsrechnung besteht im bivariaten Fall darin, die Stärke des Zusammenhangs zwischen zwei interessierenden statistischen

Mehr

Schwingungen und Wellen Zusammenfassung Abitur

Schwingungen und Wellen Zusammenfassung Abitur Schwinunen und Wellen Zusammenfassun Abitur Raphael Michel 12. März 2013 1 Mechanische Schwinunen 1.1 Harmonische Schwinunen Die Federkraft ist definiert durch F = D s. Für die Elonation, Geschwindikeit

Mehr

Praktische Ausbildung und Training. Optische Koordinatenmesstechnik

Praktische Ausbildung und Training. Optische Koordinatenmesstechnik Master Studienan Laser- & Optotechnoloien University of Applied Sciences Jena Pratium Optische Koordinatenmesstechni Pratiumsverantwortlicher: Dipl.-In. Thomas Wese Pratische Ausbildun und Trainin Optische

Mehr

Schätzverfahren ML vs. REML & Modellbeurteilung mittels Devianz, AIC und BIC. Referenten: Linda Gräfe & Konstantin Falk

Schätzverfahren ML vs. REML & Modellbeurteilung mittels Devianz, AIC und BIC. Referenten: Linda Gräfe & Konstantin Falk Schätzverfahren ML vs. REML & Modellbeurteilung mittels Devianz, AIC und BIC Referenten: Linda Gräfe & Konstantin Falk 1 Agenda Schätzverfahren ML REML Beispiel in SPSS Modellbeurteilung Devianz AIC BIC

Mehr

Teil I: Deskriptive Statistik

Teil I: Deskriptive Statistik Teil I: Deskriptive Statistik 2 Grundbegriffe 2.1 Merkmal und Stichprobe 2.2 Skalenniveau von Merkmalen 2.3 Geordnete Stichproben und Ränge 2.1 Merkmal und Stichprobe An (geeignet ausgewählten) Untersuchungseinheiten

Mehr

Klausur zu Methoden der Statistik I (mit Kurzlösung) Wintersemester 2007/2008. Aufgabe 1

Klausur zu Methoden der Statistik I (mit Kurzlösung) Wintersemester 2007/2008. Aufgabe 1 Lehrstuhl für Statistik und Ökonometrie der Otto-Friedrich-Universität Bamberg Prof. Dr. Susanne Rässler Klausur zu Methoden der Statistik I (mit Kurzlösung) Wintersemester 2007/2008 Aufgabe 1 Ihnen liegt

Mehr

Webergänzung zu Kapitel 10

Webergänzung zu Kapitel 10 Webergänzung zu Kapitel 10 10.1.4 Varianzanalyse (ANOVA: analysis of variance) Im Kapitel 10 haben wir uns hauptsächlich mit Forschungsbeispielen beschäftigt, die nur zwei Ergebnissätze hatten (entweder

Mehr

Analyse klassierter Daten: Vor der Analyse fasst man jeweils mehrere Merkmalsausprägungen in (Merkmalswerte-)Klassen zusammen.

Analyse klassierter Daten: Vor der Analyse fasst man jeweils mehrere Merkmalsausprägungen in (Merkmalswerte-)Klassen zusammen. 4. Analyse univariater Daten: Übersicht Mathematik ist die Wissenschaft der reinen Zahl, Statistik die der empirischen Zahl Von univariaten Daten spricht man, wenn bei der Datenerhebung nur ein Merkmal

Mehr

White Paper Personalbeschaffung 2.0. Wie Sie mit der richtigen Ansprache zum Employer-of-choice werden

White Paper Personalbeschaffung 2.0. Wie Sie mit der richtigen Ansprache zum Employer-of-choice werden White Paper Personalbeschaffun 2. Wie Sie mit der richtien Ansprache zum Employer-of-choice werden 84 % 84 % 8 74 % 7 6 45 % 5 35 % 4 3 2 1 Online Stellenbörsen Firmen HR Website Social Media Print Personalberater/

Mehr

Institut für Soziologie. Methoden 2. Regressionsanalyse I: Einfache lineare Regression

Institut für Soziologie. Methoden 2. Regressionsanalyse I: Einfache lineare Regression Institut für Soziologie Methoden 2 Regressionsanalyse I: Einfache lineare Regression Programm Anwendungsbereich Vorgehensweise Interpretation Annahmen Zusammenfassung Übungsaufgabe Literatur # 2 Anwendungsbereich

Mehr

Regelmäßigkeit (Erkennen von Mustern und Zusammenhängen) versus Zufall

Regelmäßigkeit (Erkennen von Mustern und Zusammenhängen) versus Zufall Wahrscheinlichkeitstheorie Was will die Sozialwissenschaft damit? Regelmäßigkeit (Erkennen von Mustern und Zusammenhängen) versus Zufall Auch im Alltagsleben arbeiten wir mit Wahrscheinlichkeiten, besteigen

Mehr

Klausur Sommersemester 2010

Klausur Sommersemester 2010 Klausur Sommersemester 2010 Lehrstuhl: Wirtschaftspolitik Prüfungsfach: Empirische Wirtschaftsforschung Prüfer: Prof. Dr. K. Kraft Datum: 04.08.2010 Hilfsmittel: Nicht-programmierbarer Taschenrechner Klausurdauer:

Mehr

= 2,7 g/cm³ = 2,7 kg/dm³ = 2700 kg/m³ = 2,7 t/m³. Dichte, Dichtebestimmung (Werkstoffprüfung) Dichteberechnung. Umrechnung der Einheiten

= 2,7 g/cm³ = 2,7 kg/dm³ = 2700 kg/m³ = 2,7 t/m³. Dichte, Dichtebestimmung (Werkstoffprüfung) Dichteberechnung. Umrechnung der Einheiten Dichte, Dichtebestiun (Werkstoffprüfun) Die Dichtewerte für Gase, Flüssikeiten und Feststoff befinden sich auf Seite Die Dichte ibt an, wie viel Masse (Gra, Kilora, Tonnen) sich in eine Einheitsvoluen

Mehr

Infoblatt 02/15. Nährwertkennzeichnung Rechtliche Vorgaben und geplante Neuerungen

Infoblatt 02/15. Nährwertkennzeichnung Rechtliche Vorgaben und geplante Neuerungen Infoblatt 02/15 für die fleischverarbeitende Industrie und für das entsprechende Gewerbe in der Schweiz und in Liechtenstein Nährwertkennzeichnun Rechtliche Voraben und eplante Neuerunen Industriestr.

Mehr

Elektronik Design. P r o t o k o l l

Elektronik Design. P r o t o k o l l Elektronik Desin P r o t o k o l l Subtraktive DKL-Fertiun In Metalresisttechnik rtour Karauiozian karart@web.de Helmut Kleber helmutkleber@mx.de 8.06.003 INHLTSVERZEICHNISS Zielstellun....- 3 - Herstellun

Mehr

Quantitative Grundlagen. Mathematische Grundlagenseminare für alle Mitarbeiter aus der Versicherungswirtschaft

Quantitative Grundlagen. Mathematische Grundlagenseminare für alle Mitarbeiter aus der Versicherungswirtschaft Quantitative Grundlaen Mathematische Grundlaenseminare für alle Mitarbeiter aus der Versicherunswirtschaft Mathematische Grundlaenseminare für alle Mitarbeiter aus der Versicherunswirtschaft Einstie in

Mehr

6. Bayes-Klassifikation. (Schukat-Talamazzini 2002)

6. Bayes-Klassifikation. (Schukat-Talamazzini 2002) 6. Bayes-Klassifikation (Schukat-Talamazzini 2002) (Böhm 2003) (Klawonn 2004) Der Satz von Bayes: Beweis: Klassifikation mittels des Satzes von Bayes (Klawonn 2004) Allgemeine Definition: Davon zu unterscheiden

Mehr

Einführung in die Geostatistik (7) Fred Hattermann (Vorlesung), hattermann@pik-potsdam.de Michael Roers (Übung), roers@pik-potsdam.

Einführung in die Geostatistik (7) Fred Hattermann (Vorlesung), hattermann@pik-potsdam.de Michael Roers (Übung), roers@pik-potsdam. Einführung in die Geostatistik (7) Fred Hattermann (Vorlesung), hattermann@pik-potsdam.de Michael Roers (Übung), roers@pik-potsdam.de 1 Gliederung 7 Weitere Krigingverfahren 7.1 Simple-Kriging 7.2 Indikator-Kriging

Mehr

90-minütige Klausur Statistik für Studierende der Kommunikationswissenschaft

90-minütige Klausur Statistik für Studierende der Kommunikationswissenschaft Prof. Dr. Helmut Küchenhoff SS08 90-minütige Klausur Statistik für Studierende der Kommunikationswissenschaft am 22.7.2008 Anmerkungen Überprüfen Sie bitte sofort, ob Ihre Angabe vollständig ist. Sie sollte

Mehr

13 410-2007/12-01 Bestell-Art.-Nr.: 11 706

13 410-2007/12-01 Bestell-Art.-Nr.: 11 706 Herauseber: DATEV eg, 90329 Nürnber Alle in dieser Unterlae verwendeten personen- und firmenbezoenen Bezeichnunen und Anschriften sind speziell für diese Unterlae erstellt. Sollten dennoch Ähnlichkeiten

Mehr

Multivariate Statistik

Multivariate Statistik Hermann Singer Multivariate Statistik 1 Auflage 15 Oktober 2012 Seite: 12 KAPITEL 1 FALLSTUDIEN Abbildung 12: Logistische Regression: Geschätzte Wahrscheinlichkeit für schlechte und gute Kredite (rot/blau)

Mehr

Multinomiale logistische Regression

Multinomiale logistische Regression Multinomiale logistische Regression Die multinomiale logistische Regression dient zur Schätzung von Gruppenzugehörigkeiten bzw. einer entsprechenden Wahrscheinlichkeit hierfür, wobei als abhänginge Variable

Mehr

Fortgeschrittene Statistik Logistische Regression

Fortgeschrittene Statistik Logistische Regression Fortgeschrittene Statistik Logistische Regression O D D S, O D D S - R A T I O, L O G I T T R A N S F O R M A T I O N, I N T E R P R E T A T I O N V O N K O E F F I Z I E N T E N, L O G I S T I S C H E

Mehr

Einfache Varianzanalyse für abhängige

Einfache Varianzanalyse für abhängige Einfache Varianzanalyse für abhängige Stichproben Wie beim t-test gibt es auch bei der VA eine Alternative für abhängige Stichproben. Anmerkung: Was man unter abhängigen Stichproben versteht und wie diese

Mehr

Grundlagen quantitativer Sozialforschung Interferenzstatistische Datenanalyse in MS Excel

Grundlagen quantitativer Sozialforschung Interferenzstatistische Datenanalyse in MS Excel Grundlagen quantitativer Sozialforschung Interferenzstatistische Datenanalyse in MS Excel 16.11.01 MP1 - Grundlagen quantitativer Sozialforschung - (4) Datenanalyse 1 Gliederung Datenanalyse (inferenzstatistisch)

Mehr

Mathematische Grundlagenseminare. Einführung in aktuarielle und aufsichtsrechtliche Fragestellungen

Mathematische Grundlagenseminare. Einführung in aktuarielle und aufsichtsrechtliche Fragestellungen Mathematische Grundlaenseminare Einführun in aktuarielle und aufsichtsrechtliche Fraestellunen Mathematische Grundlaenseminare Einstie in die Versicherunsmathematik leicht emacht Die Beherrschun der Statistik

Mehr

Schwanger? Ausgerechnet jetzt? Adoption: ein möglicher Ausweg für Sie und Ihr Kind

Schwanger? Ausgerechnet jetzt? Adoption: ein möglicher Ausweg für Sie und Ihr Kind Schwaner? Auserechnet jetzt? Adoption: ein mölicher Auswe für Sie und Ihr Kind www.mffi.nrw.de Inhalt 4 6 10 12 14 Vorwort Kapitel 1: Der Schwanerschaftskonflikt Unewollt schwaner was nun? Kapitel 2: Verfahrensablauf

Mehr

Übungsserie Nr. 10 mit Lösungen

Übungsserie Nr. 10 mit Lösungen Übungsserie Nr. 10 mit Lösungen 1 Ein Untersuchungsdesign sieht einen multivariaten Vergleich einer Stichprobe von Frauen mit einer Stichprobe von Männern hinsichtlich der Merkmale X1, X2 und X3 vor (Codierung:

Mehr

Lineare Strukturgleichungsmodelle (LISREL) Konfirmatorische Faktorenanalyse (CFA)

Lineare Strukturgleichungsmodelle (LISREL) Konfirmatorische Faktorenanalyse (CFA) Interdisziplinäres Seminar Lineare Strukturgleichungsmodelle (LISREL) Konfirmatorische Faktorenanalyse (CFA) WS 2008/09 19.11.2008 Julia Schiele und Lucie Wink Dozenten: Prof. Dr. Bühner, Prof. Dr. Küchenhoff

Mehr

Kapitel 4: Binäre Regression

Kapitel 4: Binäre Regression Kapitel 4: Binäre Regression Steffen Unkel (basierend auf Folien von Nora Fenske) Statistik III für Nebenfachstudierende WS 2013/2014 4.1 Motivation Ausgangssituation Gegeben sind Daten (y i, x i1,...,

Mehr

Christoph Müller christoph.mueller@psychonomics.de +49 221 42061 328

Christoph Müller christoph.mueller@psychonomics.de +49 221 42061 328 Christoph Müller christoph.mueller@psychonomics.de +49 221 42061 328 12 Stand: 2. November 2010 Für weitere Fraen: Christoph Müller, christoph.mueller@psychonomics.de, T +49 221 42061 328 Komplexer Markt

Mehr

ε heteroskedastisch BINARY CHOICE MODELS Beispiele: Wahlentscheidung Kauf langlebiger Konsumgüter Arbeitslosigkeit Schätzung mit OLS?

ε heteroskedastisch BINARY CHOICE MODELS Beispiele: Wahlentscheidung Kauf langlebiger Konsumgüter Arbeitslosigkeit Schätzung mit OLS? BINARY CHOICE MODELS 1 mit Pr( Y = 1) = P Y = 0 mit Pr( Y = 0) = 1 P Beispiele: Wahlentscheidung Kauf langlebiger Konsumgüter Arbeitslosigkeit Schätzung mit OLS? Y i = X i β + ε i Probleme: Nonsense Predictions

Mehr

Einfache statistische Auswertungen mit dem Programm SPSS

Einfache statistische Auswertungen mit dem Programm SPSS Einfache statistische Auswertungen mit dem Programm SPSS Datensatz: fiktive_daten.sav Dipl. Päd. Anne Haßelkus Dr. Dorothea Dette-Hagenmeyer 11/2011 Überblick 1 Deskriptive Statistiken; Mittelwert berechnen...

Mehr

Test für medizinische Studiengänge II Originalversion II des TMS. 5. aktualisierte Auflage 2008 Hogrefe Verlag ISBN: 978-3-8017-2169-5

Test für medizinische Studiengänge II Originalversion II des TMS. 5. aktualisierte Auflage 2008 Hogrefe Verlag ISBN: 978-3-8017-2169-5 Löunwee und Erklärunen für die Aufaben 7-96 ( Quantitative und formale Probleme ) Seite - 55 de Übunbuche Tet für mediziniche Studienäne II Oriinalverion II de TMS 5. aktualiierte Auflae 008 Horefe Verla

Mehr

Einfache statistische Testverfahren

Einfache statistische Testverfahren Einfache statistische Testverfahren Johannes Hain Lehrstuhl für Mathematik VIII (Statistik) 1/29 Hypothesentesten: Allgemeine Situation Im Folgenden wird die statistische Vorgehensweise zur Durchführung

Mehr

Dichte besitzt Messing bei einer Temperatur von 35 C? (1 cm³ Messing vergrößert seinen Rauminhalt beim Erwärmen um 1 K um 0, cm³).

Dichte besitzt Messing bei einer Temperatur von 35 C? (1 cm³ Messing vergrößert seinen Rauminhalt beim Erwärmen um 1 K um 0, cm³). Aufaben Länen- und oluenausdehnun 0. Mit eine tahlaßband, das für eine Teperatur von 0 eeicht ist, wird bei einer Teperatur von 5 die Läne der eite eines Gartens eessen. Welche Aussae ist richti? a) Die

Mehr

DIPLOMVORPRÜFUNG GRUNDZÜGE DER STATISTIK, TEIL B WINTERSEMESTER 2006/07 28.02.2007

DIPLOMVORPRÜFUNG GRUNDZÜGE DER STATISTIK, TEIL B WINTERSEMESTER 2006/07 28.02.2007 Wirtschaftswissenschaftliches Prüfungsamt DIPLOMVORPRÜFUNG GRUNDZÜGE DER STATISTIK, TEIL B WINTERSEMESTER 006/07 8.0.007 Lösung Prof. Dr. R Friedmann / Dr. R. Hauser Hinweise für die Klausurteilnehmer

Mehr

Monte-Carlo-Simulation

Monte-Carlo-Simulation Modellierung und Simulation Monte-Carlo-Simulation Universität Hamburg Johannes Schlundt 7. Januar 2013 Monte-Carlo-Simulation Johannes S. 1/31 Inhalt Motivation Geschichtliche Entwicklung Monte-Carlo-Simulation

Mehr

Data Mining: Einige Grundlagen aus der Stochastik

Data Mining: Einige Grundlagen aus der Stochastik Data Mining: Einige Grundlagen aus der Stochastik Hagen Knaf Studiengang Angewandte Mathematik Hochschule RheinMain 21. Oktober 2015 Vorwort Das vorliegende Skript enthält eine Zusammenfassung verschiedener

Mehr

Verteilungsmodelle. Verteilungsfunktion und Dichte von T

Verteilungsmodelle. Verteilungsfunktion und Dichte von T Verteilungsmodelle Verteilungsfunktion und Dichte von T Survivalfunktion von T Hazardrate von T Beziehungen zwischen F(t), S(t), f(t) und h(t) Vorüberlegung zu Lebensdauerverteilungen Die Exponentialverteilung

Mehr

Wärme- und Stofftransport in gekrümmten Kanälen beim Übergang von freier zu erzwungener Konvektion

Wärme- und Stofftransport in gekrümmten Kanälen beim Übergang von freier zu erzwungener Konvektion Lehrstuhl für Thermodynamik Technische Universität München Wärme- und Stofftransport in ekrümmten Kanälen beim Überan von freier zu erzwunener Konvektion Annett Hartmann Vollständier Abdruck der von der

Mehr

Statistische Thermodynamik I Lösungen zur Serie 1

Statistische Thermodynamik I Lösungen zur Serie 1 Statistische Thermodynamik I Lösungen zur Serie Zufallsvariablen, Wahrscheinlichkeitsverteilungen 4. März 2. Zwei Lektoren lesen ein Buch. Lektor A findet 2 Druckfehler, Lektor B nur 5. Von den gefundenen

Mehr

Mathematische und statistische Methoden II

Mathematische und statistische Methoden II Methodenlehre e e Prof. Dr. G. Meinhardt 6. Stock, Wallstr. 3 (Raum 06-206) Sprechstunde jederzeit nach Vereinbarung und nach der Vorlesung. Mathematische und statistische Methoden II Dr. Malte Persike

Mehr

$ % + 0 sonst. " p für X =1 $

$ % + 0 sonst.  p für X =1 $ 31 617 Spezielle Verteilungen 6171 Bernoulli Verteilung Wir beschreiben zunächst drei diskrete Verteilungen und beginnen mit einem Zufallsexperiment, indem wir uns für das Eintreffen eines bestimmten Ereignisses

Mehr

Binäre abhängige Variablen

Binäre abhängige Variablen Binäre abhängige Variablen Thushyanthan Baskaran thushyanthan.baskaran@awi.uni-heidelberg.de Alfred Weber Institut Ruprecht Karls Universität Heidelberg Einführung Oft wollen wir qualitative Variablen

Mehr

geben. Die Wahrscheinlichkeit von 100% ist hier demnach nur der Gehen wir einmal davon aus, dass die von uns angenommenen

geben. Die Wahrscheinlichkeit von 100% ist hier demnach nur der Gehen wir einmal davon aus, dass die von uns angenommenen geben. Die Wahrscheinlichkeit von 100% ist hier demnach nur der Vollständigkeit halber aufgeführt. Gehen wir einmal davon aus, dass die von uns angenommenen 70% im Beispiel exakt berechnet sind. Was würde

Mehr

- Eine typische Ausfallrate, wie sie bei vielen technischen Anwendungen zu sehen ist hat die Form einer Badewanne, deshalb nennt man diese Kurve auch

- Eine typische Ausfallrate, wie sie bei vielen technischen Anwendungen zu sehen ist hat die Form einer Badewanne, deshalb nennt man diese Kurve auch 1 2 - Eine typische Ausfallrate, wie sie bei vielen technischen Anwendungen zu sehen ist hat die Form einer Badewanne, deshalb nennt man diese Kurve auch Badewannenkurve. -mit der Badewannenkurve lässt

Mehr

Planen mit mathematischen Modellen 00844: Computergestützte Optimierung. Autor: Dr. Heinz Peter Reidmacher

Planen mit mathematischen Modellen 00844: Computergestützte Optimierung. Autor: Dr. Heinz Peter Reidmacher Planen mit mathematischen Modellen 00844: Computergestützte Optimierung Leseprobe Autor: Dr. Heinz Peter Reidmacher 11 - Portefeuilleanalyse 61 11 Portefeuilleanalyse 11.1 Das Markowitz Modell Die Portefeuilleanalyse

Mehr