9 Verallgemeinerte Lineare Modelle

Größe: px
Ab Seite anzeigen:

Download "9 Verallgemeinerte Lineare Modelle"

Transkript

1 9 Verallgemenerte Lneare Modelle 9.1 Das Modell der Posson-Regresson a Während sch de logstsche Regresson mt bnären Zelgrössen befasst, lefert de Posson- Regresson Modelle für andere Zähldaten. Wr wollen desen Fall ncht mehr ausführlch behandeln, sondern hn benützen, um auf ene allgemenere Klasse von Modellen vorzubereten. b Bespel gehemmte Reprodukton. In ener Stude zur Schädlchket von Flugbenzn wurde de Reprodukton von Cerodaphna n Abhänggket von verschedenen Konzentratonen des Schadstoffs für zwe Stämme von Organsmen untersucht (Quelle: Myers, Montgomery and Vnng (2001), example 4.5). We Abbldung 9.1.b zegt, fällt de Anzahl der reproduzerenden Organsmen stark ab; de Abnahme könnte etwa exponentelle Form haben. Anzahl Konzentraton Abbldung 9.1.b: Anzahl reproduzerende Indvduen m Bespel der gehemmten Reprodukton. De beden Stämme snd mt verschedenen Symbolen angegeben. c Vertelung. DeZelgrösse Y steneanzahlvonindvduen.deswegenlegt esnahe,hre Vertelung, gegeben de Engangsgrössen, als Posson-vertelt anzunehmen, Y P λ. Der Parameter λ wrd von den Regressoren x abhängen. Ernnern wr uns, dass der Parameter λ der Posson-Vertelung glech hrem Erwartungswert st. Für desen Erwartungswert nehmen wr nun, we n der multplen lnearen und der logstschen Regresson, an, dass er ene Funkton der Regressoren st, zusammen also Y P λ, E Y = λ = h x, und de Y sollen stochastsch unabhängg sen. Verson Dezember 2009, c W. Stahel

2 154 9 VERALLGEMEINERTE LINEARE MODELLE d Lnk-Funkton. Da der Erwartungswert ncht negatv sen kann, st ene lneare Funkton β 0 + j β jx (j) weder ncht geegnet als Funkton h. Für bnäre Zelgrössen verwendeten wr desen lnearen Prädktor trotzdem und setzten hn glech ener Transformaton des Erwartungswertes, g E Y = η = x T β. (Wrschreben,wefrüher,derKürzehalber x T β statt β 0+ j β jx (j) oderstatt j β jx (j), wenn ken Achsenabschntt β 0 m Modell vorkommen soll.) Als Transformatons-Funkton egnet sch der Logarthmus, denn er macht aus den postven Erwartungswerten transformerte Werte, de kene Begrenzung haben. Der Logarthmus des Erwartungswertes der Zelgrösse Y st also gemäss dem Modell ene lneare Funkton der Regressoren x. Man nennt solche Modelle log-lnear. De Posson-Regresson kombnert nun de logarthmsche Lnk-Funkton mt der Annahme der Posson-Vertelung für de Zelgrösse. e Der Logarthmus verwandelt, we wr berets n der lnearen und der logstschen Regresson erörtert haben, multplkatve Effekte n addtve Terme m Berech des lnearen Prädktors, oder umgekehrt: Wenn g λ = log λ st, glt E Y = λ = exp x T β = e β0 e β 1x (1)... e βmx(m) = e β0 exp β 1 x(1)... exp β m x(m). De Zunahme von x (j) um ene Enhet bewrkt ene Multplkaton des Erwartungswertes λ umden Faktor β j, derauch als Untrsk bezechnet wrd.ist β j postv, so st β j > 1, und der Erwartungswert wrd mt zunehmendem x (j) grösser. f Im Bespel der gehemmten Reprodukton snd de Konzentraton C des Benzns und der verwendete Stamm S de Engangsgrössen. De erwartete Anzahl nmmt mt der Erhöhung der Konzentraton um ene Enhet gemäss enem Haupteffekt-Modell log E Y = η = β 0 +β C C +β S S um enen Faktor exp β C ab, was ener exponentellen Abnahme glech kommt, deren Geschwndgket für bede Stämme glech st. De beden Stämme unterscheden sch durch enen konstanten Faktor exp β S. Wenn de Geschwndgketen für de beden Stämme unterschedlch sen sollen oder, anders gesagt, der Untersched zwschen den Stämmen für de verschedenen Konzentratonen ncht den glechen Faktor ergeben soll, dann braucht das Modell enen Wechselwrkungs-Term β CS C S. g Bespel Schffs-Havaren. Grosse Wellen können an Lastschffen Schäden verursachen. Wovon hängen dese Havaren ab? Um dese Frage zu beantworten, wurden 7 Flotten verglechbarer Schffe n je zwe Beobachtungsperoden untersucht(quelle: McCullagh and Nelder (1989, p. 205), Tel der Daten). Für jede deser 7 2 Beobachtungsenheten wurde de Summe der Betrebsmonate über de Schffe (M) erhoben und de Anzahl Y der Schadenseregnsse eruert. In der Tabelle n Abbldung 9.1.g snd ausserdem de Beobachtungsperode (P), de Bauperode (C) und Schffstyp (T) notert. De Daten ergeben sch also aus ener Grupperung von ursprünglchen Angaben über enzelne Schffe, de entsprechend der Bauperode, dem Schffstyp und der Beobachungsperode zusammengefasst wurden. Der wchtgste und offenschtlchste Zusammenhang derjenge zwschen Anzahl Schadenseregnsse und Anzahl Betrebsmonate st n der Abbldung grafsch festgehalten.

3 9.1. DAS MODELL DER POISSON-REGRESSION 155 Anz.Schaeden Betrebsmonate T C P M Y Abbldung 9.1.g: Daten zum Bespel der Schffs-Havaren. T: Schffstyp, C: Bauperode, P: Beobachtungsperode, M: Betrebsmonate, Y: Anzahl Havaren Es nteressert uns, welchen Enfluss de Engangsgrössen auf de Schadensfälle haben. Welcher Schffstyp st anfällger? Gbt es Unterschede zwschen den beden Beobachtungsperoden? h Für deses Bespel st das folgende Modell plausbel: log E Y = β 0 +β M log M +β T T +β P P +γ 1 (C1) +γ 2 (C2) +γ 3 (C3) wobe C1, C2 und C3 dummy Varable snd, de der Varablen C (Bauperode) entsprechen, welche her als Faktor enbezogen wrd. In der Sprache der Modell-Formeln wrd das verenfacht zu Y log10(m) + T + P + C. Weshalb wurde her de Summe M der Betrebsmonate logarthmert? Es st plausbel, anzunehmen, dass de erwartete Anzahl Schadensfälle exakt proportonal zu M st, also, wenn man de anderen Enflussgrössen weglässt, E Y = αm, und deshalb log E Y = β 0 + β M log M mt β 0 = log α und β M = 1. Wr werden also erwarten, dass de Schätzung β M ungefähr 1 ergbt. Dass sch ene allfällge Veränderung zwschen den Beobachtungsperoden P bzw. den Schffstypen T ebenfalls multplkatv auswrken sollte, st sehr plausbel. Der Faktor exp β P beschrebt dann de Veränderung des Rskos, d.h. we vel mal mehr Schäden n der zweten Perode zu erwarten snd. Term ohne Koeffzent. Nochmals zum Enfluss der Betrebsmonate: Da wr für β M aus guten Gründen den Wert 1 erwarten, muss deser Koeffzent egentlch ncht aus den Daten geschätzt werden. In der gewöhnlchen lnearen Regresson lesse sch ene solche Idee enfach umsetzen: Wr würden statt der Anzahl der Schäden Y de Rate Y /M der Zelgrösse verwenden (und M für ene Gewchtung verwenden). Her geht das schef, wel Y /M kene Posson-Vertelung hat. Deshalb muss das Programm de Opton ener Vorgabe für jede Beobachtung vorsehen. In der S-Funkton glm gbt es dafür en Argument offset.

4 156 9 VERALLGEMEINERTE LINEARE MODELLE j Im Bespel wurden de Schffe, de egentlch de natürlchen Beobachtungsenheten wären, zu Gruppen zusammengefasst, und de Zelgrösse war dann de Summe der Zahlen der Havaren für de enzelnen Schffe. We n 7.1.f erwähnt, st dese Stuaton häufg. Es entstehen mestens Kreuztabellen. Wr werden n Kaptel 14.S.0.b sehen, dass de Posson- Regresson (oder besser -Varanzanalyse) für hre Analyse ene entschedende Rolle spelt. 9.2 Das Verallgemenerte Lneare Modell a b Logstsche und Posson-Regresson blden zwe Spezalfälle der Verallgemenerten Lnearen Modelle (generalzed lnear models), und auch de gewöhnlche lneare Regresson gehört dazu. Wr haben berets de wchtgste Annahme, de allen gemensam st, formulert: Der Erwartungswert der Zelgrösse, geegnet transformert, st glech ener lnearen Funkton der Parameter β j, genannt der lneare Prädktor, g E Y = η = x T β. De Funkton g, de Erwartungswerte von Y n Werte für den lnearen Prädktor η verwandelt, wrd Lnk-Funkton genannt. In der gewöhnlchen lnearen Regresson st g de Identtät, n der logstschen de Logt- Funkton und n der Posson-Regresson der Logarthmus. Damt st nochnchtsüberdeform der Vertelung von Y gesagt. Indergewöhnlchen Regresson wurde ene Normalvertelung angenommen, mt ener Varanz, de ncht vom Erwartungswert abhängt. Es war snnvoll, de addtve Zufallsabwechung E enzuführen und für se m üblchen Fall ene (Normal-) Vertelung anzunehmen, de für alle glech war. Das wäre für de logstsche und de Posson-Regresson falsch. Her st de Vertelung von Y jewels durch den Erwartungswert (und m l m Fall von grupperten Daten n der logstschen Regresson) berets festgelegt. De Verallgemenerten Lnearen Modelle lassen her enen grossen Spelraum offen. De Vertelung von Y, gegeben hr Erwartungswert, soll zu ener parametrschen Famle gehören, de hrersets der grossen Klasse der Exponentalfamlen angehört. Dese st so wet gefasst, dass möglchst vele üblche Modelle dazugehören, dass aber trotzdem nützlche mathematsche Theore gemacht werden kann, de zum Bespel sagt, we Parameter geschätzt und getestet werden können. c Exkurs: Exponentalfamlen. Ene Vertelung gehört ener so genannten enfachen Exponentalfamle an, wenn sch hre Dchte f y oder Wahrschenlchketsfunkton P Y = y schreben lässt als yθ b θ exp ω +c y;φ,ω. φ Das seht komplzert aus! Es st, we beabschtgt, allgemen genug, um nützlche und bekannte Spezalfälle zu umfassen. Was bedeuten de enzelnen Grössen? Der Parameter θ hesst der kanonsche Parameter. De Engangs-Varablen werden, wenn wr weder zu den Verallgemenerten Lnearen Modellen zurückkehren, desen kanonschen Parameter kontrolleren. φ st en weterer Parameter, der mt der Varanz zu tun hat und Dspersons- Parameter genannt wrd. Er st normalerwese en Störparameter und wrd mt

5 9.2. DAS VERALLGEMEINERTE LINEARE MODELL 157 der Regresson nchts zu tun haben. (Genau genommen st de Famle nur ene Exponental-Famle, wenn φ als fest angenommen wrd.) De Grösse ω st ene feste Zahl, de bekannt st, aber von Beobachtung zu Beobachtung verscheden sen kann. Se hat de Bedeutung enes Gewchtes der Beobachtung. Man könnte se auch n de Grösse φ hnennehmen. Be mehreren Beobachtungen wrd ω von abhängen, während φ für alle glech st. (Be grupperten Daten n der logstschen Regresson wrd ω l = m l sen, we wr glech feststellen werden.) De Funkton b. legt fest, um welche Exponentalfamle es sch handelt. De Funkton c. wrd benötgt, um de Dchte oder Wahrschenlchketsfunkton auf ene Gesamt-Wahrschenlchket von 1 zu normeren. d Erwartungswert und Varanz können allgemen ausgerechnet werden, µ = E Y = b θ, var Y = b θ φ/ω. Da de Abletung b. der Funkton b jewels umkehrbar st, kann man auch θ aus dem Erwartungswert µ ausrechnen, θ = (b ) 1 µ. Nunkannmanauchde b θ drektalsfunktonvon µ schreben, V µ = b (b ) 1 µ. Man nennt dese Funkton de Varanzfunkton, da gemäss der vorhergehenden Glechung var Y = V µ φ/ω glt. e Wr wollen nun enge Vertelungen betrachten, de sch n deser Form darstellen lassen. Zunächst zur Normalvertelung! Ihre logarthmerte Dchte st log f y;µ,σ 2 = log 2π o σ 1 2 ( y µ σ ) 2 = µy 1 2 µ2 σ 2 y 2 /(2σ 2 ) 1 2 log 2π o σ 2 (wobewr π o = schrebenzurunterschedungvomparameter π).seentsprcht mt θ = µ, b θ = θ 2 /2, φ = σ 2, ω = 1 c y;φ,ω = y 2 /(2φ) (1/2)log 2π o φ der vorhergehenden Form auch wenn man sch zum Seufzer: Weso auch enfach, wenn es komplzert auch geht! veranlasst seht. De obgen Formeln fürerwartungswertundvaranz sndraschnachgeprüft: b θ = θ = µ und b θ = 1 und damt var Y = φ/ω = σ 2.

6 158 9 VERALLGEMEINERTE LINEARE MODELLE f Bnomalvertelung. In 8.2.g wurde der Antel Ỹ l von Erfolgen unter m l Versuchen als Zelgrösse verwendet und festgestellt, dass m l Ỹ l bnomal vertelt st. De Wahrschenlchketen, ( ohne und Index l geschreben, snd dann P Y = y = m ) my π my (1 π) m my und hre logarthmerten Werte kann man schreben als Her st log P Y = y ( = log m my) +(my)log π +mlog 1 π (my)log 1 π = mylog π/(1 π) +mlog 1 π +log ( m my). θ = log π/(1 π) = π = e θ /(1+e θ ) b θ = log 1+exp θ, ω = m, φ = 1 ( c y;φ;ω = m ) my Für Erwartungswert und Varanz glt µ = b θ = exp θ /(1+exp θ ) = π und var Y = b θ = exp θ (1+exp θ ) (exp θ ) 2 /(1+exp(θ)) 2 = π(1 π). Für bnäre Varable glt de Formel natürlch auch, mt m = 1. g Posson-Vertelung. De Wahrschenlchketen snd Her erhält man P Y = y = 1 y! λy e λ, log P Y = y = log y! +ylog λ λ. θ = log(λ), b θ = exp(θ) = λ φ = 1, ω = 1, c y;φ;ω = log y! µ = b θ = exp(θ), var Y = b θ = exp θ h Wetere wchtge Vertelungen, de n de gewünschte Form gebracht werden können, snd de Exponentalvertelung und allgemener de Gamma-Vertelung und de Webull- Vertelung, de für kontnuerlche postve Grössen we Überlebenszeten geegnet snd und deshalb unter anderem n der Zuverlässgkets-Theore ene wchtge Rolle spelen. Zurück zum Regressonsmodell: Be logstscher und Posson-Regresson haben wr den Zusammenhang zwschen Zel- und Enflussgrössen mt Hlfe der Lnk-Funkton g modellert. Se hat zunächst den Zweck, de möglchen Erwartungswerte auf den Berech der möglchen Werte des lnearen Prädktors also alle (reellen) Zahlen auszudehnen. De nahelegenden Lnk-Funktonen snd g µ = log µ, wenn E Y >0 sen muss, aber sonst belebg st, g µ = logt µ = log µ/(1 µ), wenn E Y zwschen 0 und 1 legen muss, g µ = µ, wenn E Y kenen Enschränkungen unterlegt, De Lnk-Funkton verknüpft den Erwartungswert µ mt dem lnearen Prädktor η, und µ st senersets ene Funkton des kanonschen Parameters θ. Des kann man zusammen schreben als η = g b θ = g θ.

7 9.3. SCHÄTZUNGEN UND TESTS 159 j De bsher betrachteten verallgemenerten lnearen Modelle haben noch ene spezelle Egenschaft: De gewählte Lnk-Funkton führt den Erwartungswert µ n den kanonschen Parameter θ über. Damt wrd θ = η oder g glech der Identtät. Es wrd also angenommen, dass de Kovarablen-Effekte lnear auf den kanonschen Parameter wrken. Dese Funktonen nennt man kanonsche Lnk-Funktonen. k Prnzpell kann man aber auch andere Lnk-Funktonen verwenden. Wenn bespelswese 0 < E Y < 1 gelten muss, lässt sch jede kumulatve Vertelungsfunkton als nverse Lnk-Funkton ensetzen (8.2.j). Wenn es kene konkreten Gründe für ene spezelle Lnk- Funkton gbt, verwendet man aber n der Regel de kanonsche. Zum enen bestzen kanonsche verallgemenerte lneare Modelle bessere theoretsche Egenschaften (Exstenz und Endeutgket des ML-Schätzers). Zum andern verenfachen sch dadurch de Schätzglechungen. Wenn sch n der Praxs auf Grund der Resduenanalyse en Hnwes auf en schlecht passendes Modell zegt, st es oft snnvoll, we n der multplen lnearen Regresson, zunächst durch Transformatonen der Engangsgrössen zu versuchen, de Anpassung des Modells zu verbessern. Wenn das nchts hlft, wrd man de Lnk-Funkton ändern. 9.3 Schätzungen und Tests a Der Vortel ener Zusammenfassung der betrachteten Modelle zu enem allgemenen Modell besteht darn, dass theoretsche Überlegungen und sogar Berechnungsmethoden für alle gemensam hergeletet werden können. De Schätzung der Parameter erfolgt nach der Methode der Maxmalen Lkelhood, und de Tests und Vertrauensntervalle beruhen auf genäherten Vertelungen, de für Maxmum-Lkelhood-Schätzungen allgemen hergeletet werden können. b Lkelhood. De Parameter, de uns nteresseren, snd de Koeffzenten β j. Se bestmmen den Erwartungswert µ für jede Beobachtung, und deser bestmmt schlesslch θ (sehe 9.2.d). Wr nehmen an, dass φ für alle Beobachtungen glech st. Der Betrag ener Beobachtung zur Log-Lkelhood ll st glech ll y ;β = log P Y =y x,β = ( y θ b θ ) ω /φ+c y ;φ,ω, θ = g x T β. Für Posson-vertelte Zelgrössen mt der kanonschen Lnk-Funkton erhält man ll y ;β = y log λ λ log(y!) = y η e η log(y!), η = x T β. Da es sch um unabhängge Beobachtungen handelt, erhält man de Log-Lkelhood als Summe ll y;β = ll y ;β. c Maxmum-Lkelhood-Schätzung. Wr leten her de Schätzungen für den Spezalfall der Posson-Regresson mt log-lnk her. De analoge, allgemene Herletung der Schätzglechungen, ene Skzzerung des Schätzalgorthmus und enge Egenschaften der Schätzer fndet man m Anhang 9.A. De Abletung der Log-Lkelhood nach den Parametern setzt sch, we de Log-Lkelhood, aus Beträgen der enzelnen Beobachtungen zusammen, de Scores genannt werden, s (j) ll β β = = ll β j η η η = (y λ ) x (j). β j

8 160 9 VERALLGEMEINERTE LINEARE MODELLE Setzt man alle Komponenten glech null, s β = s β = 0, so entstehen de mplzten Glechungen, de de Maxmum-Lkelhood-Schätzung β bestmmen; für den Posson-Fall (y λ ) x (j) = 0. Zur Lösung deser Glechungen geht man so vor, we das für de logstsche Regresson n 8.3.e skzzert wurde und we es n Anhang 9.b beschreben st. d Schätzung des Dspersons-Parameters. Im allgemenen Modell muss auch der Dspersons-Parameter φ geschätzt werden, und auch das erfolgt durch Maxmeren der Lkelhood. Für de spezfschen Modelle kommt dabe ene recht enfache Formel heraus. Für de Normalvertelung kommt, bs auf enen Faktor (n p)/n, de üblche Schätzung der Varanz heraus. Für bnomal- und Posson-vertelte Zelgrössen muss ken Dspersons- Parameter geschätzt werden wr werden n 9.4 dese gute Nachrcht allerdngs weder enschränken. e Um Tests und Vertrauensbereche festzulegen, braucht man de Vertelung der Schätzungen. Es lässt sch zegen, dass als asymptotsche Näherung ene multvarate Normalvertelung glt, β a N β, V (β), wobe de Kovaranzmatrx V (β) normalerwese von β abhängen wrd. (Genaueres steht m Anhang, 9.e.) Damt lassen sch genäherte P-Werte für Tests und Vertrauensntervalle angeben. In der lnearen Regresson galt de Vertelung exakt, mt V (β) = σ 2 (X T X) 1, und das ergab exakte P-Werte und Vertrauensntervalle. f Für das Bespel der gehemmten Reprodukton zegt Tabelle 9.3.f den Aufruf der S-Funkton regr und de Computer-Ausgabe, de de berets bekannte Form hat. Bede Engangsgrössen erwesen sch als hoch sgnfkant. Call: regr(formula = count ~., data = d.cerofuel, famly = posson, calcdsp = F) Terms: coef stcoef sgnf df p.value (Intercept) fuel stran devance df p.value Model Resdual Null NA Famly s posson. Dsperson parameter taken to be 1. AIC: Tabelle 9.3.f: Computer-Ausgabe von regr für das Bespel der gehemmten Reprodukton

9 9.3. SCHÄTZUNGEN UND TESTS 161 g Devanz. Für de logstsche Regresson wurde de Lkelhood, de mt der Anpassung der Modell-Parameter errecht wrd, mt ener maxmalen Lkelhood verglchen, und das lässt sch auch n den andern Verallgemenerten Lnearen Modellen tun. De maxmale Lkelhood entsteht, ndem en maxmales Modell angepasst wrd, das für jede Beobachtung den am besten passenden kanonschen Parameter θ bestmmt. De Devanz st allgemen defnert als D y; µ = 2(ll (M) ll β ) = 2 φ θ = g x T β ω ( ) y ( θ θ ) b θ +b θ wobe y der Vektor aller beobachteten Werte st und µ der Vektor der zugehörgen angepassten Erwartungswerte. Der Tel der Log-Lkelhood-Funkton, der ncht von θ abhängt, fällt dabe weg. In der Formel st θ der Parameter, der am besten zu y passt. Er st jewels bestmmt durch y = E Y = b θ. En Dspersons-Parameter φ lässt sch für das maxmale Modell ncht mehr schätzen; man verwendet den geschätzten Wert des betrachteten Modells. Be der Bnomal- und der Posson-Vertelung fällt deses Problem weg, da φ = 1 st. h Im Posson-Modell snd de geschätzten Parameter m maxmalen Modell glech θ = log y und man erhält D y; µ = 2 (y ) (log y log µ ) e log y +e log µ = 2 y log y / µ (y µ ) Für bnomal vertelte Zelgrössen wurde de Devanz n 8.3. angegeben. Mt Hlfe der Devanz lassen sch auch allgemen de Fragen beantworten, de für de logstsche Regresson berets angesprochen wurden: Verglech von Modellen. Überprüfung des Gesamt-Modells. Anpassungstest. De entsprechenden Devanz-Dfferenzen snd unter gewssen Bedngungen näherungswese chquadrat-vertelt. Für de Resduen-Devanz bnärer Zelgrössen snd dese Bedngungen, we erwähnt (8.3.k), ncht erfüllt. * De Bedngungen snd also für enmal ncht harmlos. Das legt daran, dass m maxmalen Modell M (9.3.g) für jede Beobachtung en Parameter geschätzt wrd; mt der Anzahl Beobachtungen geht also auch de Anzahl Parameter gegen unendlch, und das st für asymptotsche Betrachtungen gefährlch! j De Devanz wrd für de Normalvertelung zur Summe der quadrerten Resduen, de ja be der Schätzung nach dem Prnzp der Klensten Quadrate mnmert wrd. Für andere Vertelungen haben de rohen Resduen (8.4.a) verschedene Varanz und sollten mt entsprechenden Gewchten summert werden. De Grösse T = ω (y µ ) 2 φ V µ hesst Pearson-Chquadrat-Statstk. Wenn φ ncht aus den Daten geschätzt werden

10 162 9 VERALLGEMEINERTE LINEARE MODELLE muss, folgt se n der Regel genähert ener Chquadrat-Vertelung. Wenn T zu gross wrd, müssen wr auf sgnfkante Abwechung vom Modell schlessen. Das legt enen Anpassungstest fest. Vorher haben wr de Resduen-Devanz als Teststatstk für genau den glechen Zweck verwendet. Se hatte näherungswese ebenfalls de gleche Chquadrat-Vertelung. De beden Teststatstken snd asymptotsch äquvalent. 9.4 Übergrosse Streuung a De Resduen-Devanz des angepassten Modells kann man für enen Anpassungstest verwenden, falls der Dspersons-Parameter ncht aus den Daten geschätzt werden muss. Im Fall von bnomal und Posson-vertelten Zelgrössen st de Varanz ja durch das Modell festgelegt, und der Anpassungstest kann zur Ablehnung des Modells führen. De Devanz msst n gewssem Snne de Streuung der Daten und der Test verglecht dese geschätzte Streuung mt der Varanz, de unter dem Modell zu erwarten wäre. En statstsch sgnfkanter, erhöhter Wert bedeutet also, dass de Daten genauer de Resduen ene übergrosse Streuung zegen. Man sprcht von over-dsperson. Im Bespel der gehemmten Reprodukton war de Resduen-Devanz knapp sgnfkant; es st also ene übergrosse Streuung angezegt. b Damt wr dennoch Statstk treben können, brauchen wr en neues Modell. Statt ener Posson-Vertelung könnten wr bespelswese ene so genannte Negatve Bnomalvertelung postuleren. Es zegt sch aber, dass es gar ncht nötg st, sch auf ene bestmmte Vertelungsfamle festzulegen. Wesentlch st nur, we de Varanz V µ φ/ω der Vertelung von Y von hrem Erwartungwert µ abhängt. Des bestmmt de asymptotschen Vertelungen der geschätzten Parameter. De enfachste Art, ene grössere Streuung als m Posson- oder Bnomalmodell zuzulassen, besteht darn, de jewelge Varanzfunkton bezubehalten und den Dspersons-Parameter φ ncht mehr auf 1 festzulegen. Deser wrd dann zu enem Störparameter. Da damt ken Wahrschenlchkets-Modell endeutg festgelegt st, sprcht man von Quas- Modellen und von Quas-Lkelhood. c DerParameter φ lässtschanalogzurvaranzdernormalvertelungschätzen φ = 1 ω (y µ ) 2 n p V µ. Man telt also de Pearson-Statstk durch hre Frehetsgrade. Üblcher st es aber, statt der Pearson-Statstk de Devanz zu verwenden, de ja, we gesagt (9.3.j), näherungswese das Gleche st. Das ergbt φ = (1/(n p))d y; µ. Im Bespel der gehemmten Reprodukton erhält man mt den Angaben von 9.3.f φ = 88/67 = 1.3. d Im Anhang (9.e) kann man sehen, dass de Kovaranzmatrx der asymptotschen Vertelung der geschätzten Koeffzenten den Faktor φ enthält. (* H enthält den Faktor 1/φ, sehe 9.c.) Durch de Enführung enes Dspersons-Parameters werden deshalb enfach Konfdenzntervalle um den Faktor ˆφ breter und de Werte der Teststatstken um 1 / φ klener. De Funkton regr verwendet den geschätzten Streuungsparameter φ zur Berechnung der Tests von Koeffzenten und von Vertrauensntervallen, sofern der mttlere Wert der Zelgrösse gross genug st (momentan wrd als Grenze 3 verwendet) ausser, des werde mt dem Argument calcdsp=false unterdrückt (we es n 9.3.f getan wurde).

11 9.5. RESIDUEN-ANALYSE 163 e Beachte: Der Schluss glt ncht n umgekehrter Rchtung. Wenn der Dspersons-Parameter klener als 1 st, verklenern sch ncht de Konfdenzntervalle. Häufg st en klener Dspersons-Parameter en Hnwes darauf, dass n enem Modell für grupperte Beobachtungen de Unabhänggketsannahme zwschen den Enzel-Beobachtungen ncht erfüllt st. Dese Erschenung trtt n der Ökologe mmer weder auf, wenn de Anzahl Arten auf ener Untersuchungsfläche als Zelgrösse benützt wrd. De Posson-Vertelung st her ncht adäquat, da Eregnsse mt ganz verschedenen Wahrschenlchketen gezählt werden. Ene häufge Art st vellecht auf allen Untersuchungsflächen anzutreffen, und wenn es vorwegend solche Arten hätte, wäre de Varaton der Artenzahl scher wesentlch klener, als das von ener Posson-Vertelung festgelegt wrd. Ene Posson-vertelte Varable zählt unabhängge Eregnsse, de glechartg und deshalb glech wahrschenlch snd. f Quas-Modelle. De Idee, enen Dspersons-Parameter enzuführen, ohne en genaues Modell festzulegen, lässt sch verallgemenern: Das Wesentlche am Modell snd de Lnkund de Varanzfunkton. Man legt also nur fest, we der Erwartungswert und de Varanz von Y vom lnearen Prädktor η abhängt. 9.5 Resduen-Analyse a Für de Defnton von Resduen gbt es de ver für de logstsche Regresson engeführten Vorschläge: Rohe Resduen oder response resduals: R = Y µ. We erwähnt, haben dese Resduen verschedene Varanzen. De Prädktor-Resduen(workng resduals oder lnk resduals) erhält man, ndem man de Response-Resduen n der Skala des Prädktors ausdrückt: R (L) = R g µ, Pearson-Resduen: De rohen Resduen werden durch hre Standardabwechung, ohne Dspersons-Parameter φ, dvdert, R (P) = R / V µ /ω. Dese unskalerten Pearson-Resduen denen dazu, den Dspersons-Parameter zu schätzen oder zu prüfen, ob er glech 1 sen kann, we des für das Bnomal- und das Posson-Modell gelten muss (vgl. 9.4). De Grössen R (P) / φ nennen wr skalerte Pearson-Resduen, Devanz-Resduen:JedeBeobachtungergbtenenBetrag d /φ zurdevanz(9.3.g), wobe ) d = 2ω (Y ( θ θ ) b θ +b θ. Für de Normalvertelung snd des de quadrerten Resduen. Um snnvolle Resduen zu erhalten, zeht man daraus de Wurzel und setzt als Vorzechen dejengen der rohen Resduen, also R (D) = sgn Y µ d.

12 164 9 VERALLGEMEINERTE LINEARE MODELLE Se werden unskalerte Devanz-Resduen genannt unskalert, wel weder der Faktor φ weggelassen wurde. Wenn man hn enbezeht, erhält man de skalerten Devanz-Resduen. b De wchtgsten grafschen Darstellungen der Resduen-Analyse snd: Tukey-Anscombe-Plot: Prädktor-Resduen R (L) werden gegen den lnearen Prädktor η aufgetragen. De Resduen sollten über den ganzen Berech um 0 herum streuen. Wenn ene Glättung (von Auge oder berechnet) ene Abwechung zegt, soll man ene Transformaton von Engangs-Varablen (sehe term plot, unten) oder allenfalls ene andere Lnk-Funkton prüfen. Rearson Resduen angepasste Werte Abbldung 9.5.b: Tukey-Amscombe Plot zum Bespel der Schffs-Havaren c Scale Plot. Absolute (Pearson-) Resduen gegen angepasste Werte µ auftragen. Wenn ene Glättung enen Trend zegt, st de Varanzfunkton ncht passend. Man kann versuchen, se drekt zu modelleren, sehe 9.4.f. d Resduen gegen Engangs-Varable. Prädktor-Resduen R (L) werden gegen Engangs-Varable x (j) aufgetragen. Gekrümmte Glättungen deuten we n der lnearen Regresson an, we de Engangsgrössen transformert werden sollten. De Funkton plresx lefert weder ene Referenzlne für gleche Werte des lnearen Prädktors. Da de Resduen mt verschedenen Gewchten zur Regresson betragen, sollten se dem entsprechend verscheden gross gezechnet werden. Weder st es üblcher, de partellen Resduen zu verwenden und den Effekt der Engangs-Varablen mt enzuzechnen, also enen partal resdual plot oder term plot zu erstellen (vergleche 8.4.j).

13 9.S. S-FUNKTIONEN 165 Partal for TYPE Partal for factor(cons) TYPE CONS Partal for OPER OPER Partal for log(months) MONTHS Abbldung 9.5.d: Partal resdual Plots zu dem Havare-Modell e Leverage Plot. De Prädktor-Resduen R (L) werden gegen de fast ungewchteten Hebelarm-Werte h aufgetragen und de Gewchte w durch verscheden grosse Kres- Symbole dargestellt (vergleche 8.4.k). f Abbldungen 9.5.b und 9.5.d zegen Resduenplots zum Modell m Bespel Schffs-Havaren. Be so klener Beobachtungszahl snd Abwechungen kaum auszumachen. 9.S S-Funktonen a Zur von Verallgemenerten Lnearen Modellen denen de S-Funktonen glm oder regr, de wr schon für de logstsche Regresson verwendet haben. De Angabe famly=posson legt de gewählte Vertelungsfamle fest. summary, plot, drop1,...

14 166 9 VERALLGEMEINERTE LINEARE MODELLE 9.A Anhang: Genaueres zur Schätzung der Parameter und zur asymptotschen Vertelung a Maxmum Lkelhood. Der Betrag ll ener Beobachtung zur Log-Lkelhood st n 9.3.b angegeben. Um de Maxmum-Lkelhood-Schätzung zu bestmmen, wrd man we üblch de Abletungen der Summe deser Beträge nach den Parametern glech null setzen. De Abletung von ll nach den Parametern hat her und auch später ene fundamentale Bedeutung. Se wrd Score-Funkton genannt. Wr erhalten we n 9.3.c s (j) y,x ;β = ll β β j = l θ θ dθ dµ µ dµ dη η η β j. (Für Funktonen f x enes enzgen Argumentes schreben wr de (gewöhnlche) Abletung als df/dx.) Da µ(θ) = b θ und η = x T β st, werden de Abletungen zu ll θ θ = (y b θ ) ω /φ = (y µ ) ω /φ dµ dθ θ = b θ = V µ = dθ dµ µ = 1/V µ dµ dη η = (g 1 ) η η, = x (j). β j (In der mttleren Zele wurde de Regel für de Abletung ener Umkehrfunkton verwendet: (f 1 ) y = 1/f x mt y = f x.) Zusammen erhält man s (j) y,x ;β = (y µ ) ω φv µ (g 1 ) η x (j). Setzt man alle Komponenten der Scores-Summe glech null, s y,x ;β = 0, so entstehen de mplzten Glechungen, de de Maxmum-Lkelhood-Schätzungen β j bestmmen. b Algorthmus. Für de Lösung deser mplzten Glechungen wrd en Algorthmus angewandt, der allgemen für Maxmum-Lkelhood-Schätzungen geegnet st und Scorng- Algorthmus hesst. Er st mt dem allgemen bekannten Newton-Raphson-Algorthmus für numersche Optmerung verwandt. Deser st en teratves Rechenschema: Ausgehend von enem Startwert β (0) wrd ene Verbesserung β berechnet, de zu ener Verbesserung der Zelfunkton n unserem Fall zu ener Erhöhung der Log-Lkelhood führt. Solche Schrtte werden wederholt, bs de Verbesserungen sehr klen werden. Der Verbesserungsschrtt des Newton-Raphson-Algorthmus verlangt de Berechnung von Abletungen der Funktonen s (j) β, de null werden sollen, also von zweten Abletungen der Zelfunkton. Das ergbt ene ganze Matrx H β = s β / β = [ s (j) β / β k ] jk, de Hessesche Matrx genannt wrd. De Funkton s β st n der Nähe enes Vektors β (s) gemäss lnearer Näherung glech s β s β (s) + H β (s) (β β (s) ). Wenn man de rechte Sete glech null setzt, erhält man de Korrektur β = β (s+1) β (s) = (H β (s) ) 1 s β (s). So wet de allgemene Idee des Newton-Raphson-Algorthmus.

15 Anhang: Schätzung der Parameter und asymptotsche Vertelung 167 c Be der Maxmum-Lkelhood-Schätzung st de Funkton s de Summe s y,x ;β, also β = H β (s) 1 s y,x ;β (s) mt H β = s y,x ;β / β. De Idee des Scorng-Algorthmus besteht darn, de Summanden n H durch hren Erwartungswert H unter der (vorläufg) geschätzten Vertelung zu ersetzen. Man erhält, da de Vertelung der Beobachtungen von den x abhängt, weterhn ene Summe, H β (s) = E s Y,x ;β / β. De Abletungen s (j) / β (k) schreben wr als s (j) Y,x ;β β (k) = µ β (k) ω φv µ (g 1 ) η x (j) +(Y µ ) ω φ β (k) (g 1 ) η V µ x (j). Den komplzerteren zweten Tel müssen wr glücklcherwese ncht ausrechnen, da sen Erwartungswertnull st es st ja nur Y zufällg, und E Y µ = 0. Der erste Tel hängt ncht von Y ab; man muss also gar kenen Erwartungswert blden. Es st µ / β (k) = (g 1 ) η x (k). Deshalb wrd H β = x x T ((g 1 ) η ) 2 Damt st der Scorng-Algorthmus festgelegt. 1 V µ ω φ. De Matrx H hat auch ene zentrale Bedeutung be der asymptotschen Vertelung der Schätzung und trägt deshalb enen Namen: Se hesst Fsher-Informaton und wrd als J n β notert. Der Index n soll daran ernnern, dass es sch um de Summe der Fsher- Informatonen aller Beobachtungen handelt. d Wr wollen ene Überlegung anführen, de uns zu Vertrauterem führt: Man kann unschwer sehen, dass de Korrektur-Schätzung β m Scorng-Algorthmus als Lösung enes gewchteten Klenste-Quadrate-Problems geschreben werden kann. En solches Problem besteht n der Mnmerung des Ausdrucks w (ỹ x T β)2 mt vorgegebenen Gewchten w. (De w snd ncht de ω des verallgemenerten lnearen Modells! Wr schreben ỹ statt enfach y, um ene Verwechslung mt den bsher verwendeten y zu vermeden.) De Lösung deses Problems lautet ( β = w x x T ) 1 w x ỹ. Dese Schätzung besteht also auch aus ener Matrx, de ene Summe darstellt und nvertert wrd, multplzert mt ener Summe von Vektoren. Wenn wr Gewchte w enführen als w = ( (g 1 ) η ) 2 1 V µ ω φ, dann stmmt de zu nverterende Matrx n beden Fällen überen. Nun setzen wr ỹ = r (L), wobe r (L) = (y µ ) dη dµ µ = r g µ

16 168 9 VERALLGEMEINERTE LINEARE MODELLE de Prädktor-Resduen snd, de n 9.5.a erwähnt wurden. Jetzt stmmt auch s β mt x w ỹ überen, und de Lösung β des gewchteten Klenste-Quadrate-Problems lefert de Korrektur β. Es st üblch, auf beden Seten noch de vorhergehende Schätzung β (s) dazu zu zählen rechts n der Form (H β ) 1 H β β (s). Man erhält β (s+1) = β (s) + β = (H β (s) ) 1 = (H β (s) ) 1 H β (s) β (s) +(H β (s) ) y 1 s,x ;β (s) w x (x T β(s) +r (L) ). Man kann also de korrgerte Schätzung β (s+1) drekt als gewchtete Klenste-Quadrate- Lösung erhalten, ndem man ỹ = x T β(s) +r (L) statt ỹ = r (L) setzt. e Asymptotsche Vertelung. De Enkledung des Verbesserungsschrttes des Scorng- Algorthmus als gewchtetes Klenste-Quadrate-Problem st nützlch, um de Vertelung der Schätzfunkton β zu studeren. Man kann zegen, dass de asymptotsche Vertelung gerade de st, de de gewchtete Klenste-Quadrate-Schätzung hat, wenn man vergsst, dass de Beobachtungen ỹ und de Gewchte w von den Schätzwerten selber abhängen (und de Lösungswerte β ensetzt). Das gleche Ergebns lefert auch de allgemene Theore der Maxmum-Lkelhood-Schätzung: Der geschätzte Parametervektor st asymptotsch normalvertelt und erwartungstreu mt der nversen Fsher-Informaton als Kovaranzmatrx, β a N p β, (H β ) 1. (* Der Zusammenhang zwschen dem Scorng-Algorthmus und der asymptotschen Vertelung glt allgemen für Maxmum-Lkelhood- und M-Schätzungen. Interesserte können versuchen, des mt Hlfe der Enflussfunkton, de n der robusten Statstk engeführt wurde, nachzuvollzehen.) Mt desem Ergebns lassen sch n der üblchen Wese Tests und Vertrauensntervalle angeben, de asymptotsch den rchtgen Fehler erster Art respektve den rchtgen Vertrauenskoeffzenten haben. Tests, de auf der genäherten asymptotschen Normalvertelung der Schätzungen beruhen, hessen Wald-Tests.

17 8 17 VERALLGEMEINERTE LINEARE MODELLE

18 9 Lteraturverzechns Agrest, A. (2002). Categorcal Data Analyss, 2nd edn, Wley, N.Y. Agrest, A. (2007). An Introducton to categorcal data analyss, Wley Seres n Probablty & Math. Statstcs, 2nd edn, Wley, New York. Bates, D. M. and Watts, D. G. (1988). Nonlnear Regresson Analyss and ts Applcatons, Wley, N.Y. Chambers, J. M. and Haste, T. J. (1992). Statstcal Models n S, Wadsworth & Brooks/Cole, Pacfc Grove, Cal. Chatterjee, S. and Prce, B. (2000). Regresson Analyss By Example, 3rd edn, Wley, N.Y. Chrstensen, R. (1990). Log-lnear models, Sprnger, N.Y. Cleveland, W. S. (1994). The Elements of Graphng Data, 2nd edn, Hobart Press, Summt, New Jersey. Clogg, C. C. and Shhadeh, E. S. (1994). Statstcal models for ordnal varables, Sage, Thousand Oaks, CA. Cohen, A. (1980). On the graphcal dsplay of the sgnfcant components n a two-way contngency table, Communcatons n Statstcs Theory and Methods A9: Collet, D. (1991, 1999). Modellng bnary data, Chapman & Hall/CRC Press LLC, Boca Raton, Florda. Collet, D. (1994). Modellng Survval Data n Medcal Research, Texts n Statstcal Scence, Chapman and Hall, London. Cook, R. D. and Wesberg, S. (1999). Appled regresson ncludng computng and graphcs, Wley, N.Y. Cox, D. R. (1989). Analyss of Bnary Data, 2nd edn, Chapman and Hall, London. Cox, D. R. and Snell, E. J. (1981). Appled Statstcs, Chapman and Hall, London. Crowder, M. J., Kmber, A. C., Smth, R. L. and Sweetng, T. J. (1991). Statstcal Analyss of Relablty Data, Chapman and Hall. Danel, C. and Wood, F. S. (1980). Fttng Equatons to Data, 2nd edn, Wley, N.Y. Daves, P. (1995). Data features, Statstca Neerlandca 49: Devore, J. L. (2004). Probablty and Statstcs for Engneerng and the Scences, 6th edn, Duxbury Press, Belmont, Calforna. Dobson, A. J. (2002). An Introducton to Generalzed Lnear Models, 2nd edn, Chapman and Hall, London. Draper, N. and Smth, H. (1998). Appled Regresson Analyss, 3rd edn, Wley, N.Y. Fahrmer, L. and Tutz, G. (2001). Multvarate Statstcal Modellng Based on Generalzed Lnear Models, 2nd edn, Sprnger-Verlag, New York.

19 10 17 VERALLGEMEINERTE LINEARE MODELLE Fox, J. (2002). An R and S-Plus companon to appled regresson, Sage, Thousand Oaks, CA. Fox, J. and Monette, G. (1992). Generalzed collnearty dagnostcs, Journal of the Amercan Statstcal Assocaton 87: Fuller, W. A. (1987). Measurement Error Models, Wley, N.Y. Haaland, P. D. (1989). Expermental Desgn n Botechnology, Marcel Dekker, N.Y. Hampel, F. (1974). The nfluence curve and ts role n robust estmaton, Journal of the Amercan Statstcal Assocaton 69: Hampel, F. R., Ronchett, E. M., Rousseeuw, P. J. and Stahel, W. A. (1986). Robust Statstcs: The Approach Based on Influence Functons, Wley, N.Y. Harrell, F. E. J. (2002). Regresson Modelng Strateges. Wth Applcatons to Lnear Models, Logstc Regresson, and Survval Analyss, Sprnger Seres n Statstcs, Sprnger, NY. Corrected second prntng Hartung, J., Elpelt, B. und Klösener, K. (2002). Statstk. Lehr- und Handbuch der angewandten Statstk, 13. Aufl., Oldenbourg, München. Haste, T. J. and Tbshran, R. J. (1990). Generalzed Addtve Models, number 43 n Monographs on Statstcs and Appled Probablty, Chapman and Hall, London. Haste, T., Tbshran, R. and Fredman, J. (2001). The Elements of Statstcal Learnng: Data Mnng, Inference, and Predcton, Sprnger Seres n Statstcs, Sprnger-Verlag, New York. Hockng, R. R. (1996). Methods and Applcatons of Lnear Models; Regresson and the Analyss of Varance, Wley Seres n Probablty and Statstcs, Wley, N.Y. Hosmer, D. W. and Lemeshow, S. (2000). Appled Logstc Regresson, 2nd edn, Wley, N.Y. Huber, P. J. (1964). Robust estmaton of a locaton parameter, 35: Huber, P. J. and Ronchett, E. M. (2009). Robust Statstcs, 2nd edn, Wley. Kalbflesch, J. and Prentce, R. L. (2002). The Statstcal Analyss of Falure Tme Data, 2nd edn, Wley, N.Y. Lndsey, J. K.(1995). Modellng Frequency and Count Data, number 15 n Oxford Statstcal Scence Seres, Clarendon Press, Oxford. Maronna, R. A., Martn, R. D. and Yoha, V. J. (2006). Robust Statstcs, Theory and Methods, Wley Seres n Problty and Statstcs, Wley, Chchester, England. McCullagh, P. and Nelder, J. A. (1989). Generalzed Lnear Models, 2nd edn, Chapman and Hall, London. Mosteller, F. and Tukey, J. W. (1977). Data Analyss and Regresson: A Second Course n Statstcs, Addson-Wesley, Readng, Massachusetts. Myers, R. H., Montgomery, D. C. and Vnng, G. G. (2001). Generalzed Lnear Models. Wth Applcatons n Engneerng and the Scences, Wley Seres n Probablty and Statstcs, Wley, NY. Pokropp, F. (1994). Lneare Regresson und Varanzanalyse, Oldenbourg. Rce, J. A. (2007). Mathematcal Statstcs and Data Analyss, 3rd edn, Duxbury Press, Belmont, Calforna. Rpley, B. D. (1996). Pattern Recognton and Neural Networks, Cambrdge Unv. Press, Cambrdge, UK. Rousseeuw, P. J. and Leroy, A. M. (1987). Robust Regresson & Outler Detecton, Wley, N.Y. Ryan, T. P. (1997). Modern Regresson Methods, Seres n Probablty and Statstcs, Wley, N.Y. ncludes dsk

20 Anhang: Schätzung der Parameter und asymptotsche Vertelung 11 Sachs, L. (2004). Angewandte Statstk, 11. Aufl., Sprnger, Berln. Schlttgen, R. (2003). Enführung n de Statstk. Analyse und Modellerung von Daten, 10. Aufl., Oldenbourg, München. schoen, nkl. Senstvty und breakdown, enfache regr mt resanal Sen, A. and Srvastava, M. (1990). Regresson Analyss; Theory, Methods, and Applcatons, Sprnger-Verlag, N.Y. Stahel, W. A. (2000). Statstsche Datenanalyse: Ene Enführung für Naturwssenschaftler, 3. Aufl., Veweg, Wesbaden. Stahel, W. A. (2007). Statstsche Datenanalyse: Ene Enführung für Naturwssenschaftler, 5. Aufl., Veweg, Wesbaden. van der Waerden, B. L. (1971). Mathematsche Statstk, 3. Aufl., Sprnger, Berln. Venables, W. N. and Rpley, B. D. (1997). Modern Appled Statstcs wth S-Plus, Statstcs and Computng, 2nd edn, Sprnger, Berln. Wesberg, S. (2005). Appled Lnear Regresson, 3rd edn, Wley, N.Y. Wetherll, G. (1986). Regresson Analyss wth Applcatons, number 27 n Monographs on Statstcs and Appled Probablty, Chapmann and Hall, London.

5 Gemischte Verallgemeinerte Lineare Modelle

5 Gemischte Verallgemeinerte Lineare Modelle 5 Gemschte Verallgemenerte Lneare Modelle Wr betrachten zunächst enge allgemene Aussagen für Gemschte Verallgemenerte Lneare Modelle. Se y der beobachtbare Zufallsvektor und u der Vektor der ncht-beobachtbaren

Mehr

Logistische Regression

Logistische Regression Logstsche Regresson 2..2 Enführung Bespele Medkament, Phase-I study (FDA): Suche Doss, sd. max. /3 von (gesunden) Probanden Nebenwrkungen zegt. Terversuch: Be welcher Doss überleben 5% der Mäuse (=LD5)?

Mehr

3 Multiple lineare Regression

3 Multiple lineare Regression 3.1 Modell und Statstk 34 3 Multple lneare Regresson 3.1 Modell und Statstk a Zusammenhang zwschen ener Zelgrösse Y und mehreren Engangsgrössen X (1), X (2),..., X (m) Y = β 0 + β 1 x (1) + β 2 x (2) Parameter:

Mehr

1 Einführung in die statistische Regression Beispiele zur linearen Regression Fragestellungen Ausblick...

1 Einführung in die statistische Regression Beispiele zur linearen Regression Fragestellungen Ausblick... Inhalt 1 Enführung n de statstsche Regresson 1 1.1 Bespele zur lnearen Regresson........................ 1 1.2 Fragestellungen.................................. 8 1.3 Ausblck......................................

Mehr

Definition des linearen Korrelationskoeffizienten

Definition des linearen Korrelationskoeffizienten Defnton des lnearen Korrelatonskoeffzenten r xy x y y r x xy y 1 x x y y x Der Korrelatonskoeffzent st en Indkator dafür, we gut de Punkte (X,Y) zu ener Geraden passen. Sen Wert legt zwschen -1 und +1.

Mehr

b Example: Shrinked blood vessels Y : shrinked: yes (1) / no (0) erkl.: Breath Volume (Vol) and Frequency (Rate) Ziel: P Y = 1 Vol,Rate modellieren!

b Example: Shrinked blood vessels Y : shrinked: yes (1) / no (0) erkl.: Breath Volume (Vol) and Frequency (Rate) Ziel: P Y = 1 Vol,Rate modellieren! Logstc Regresson. Introducton Only partally translated at ths tme b Example: Shrnked blood vessels Y : shrnked: yes () / no () erkl.: Breath Volume (Vol) and Frequency (Rate) Zel: P Y = Vol,Rate modelleren!

Mehr

1.1 Beispiele zur linearen Regression

1.1 Beispiele zur linearen Regression 1.1. BEISPIELE ZUR LINEAREN REGRESSION 0 REGRESSION 1: Multple neare Regresson 1 Enführung n de statstsche Regressonsrechnung 1.1 Bespele zur lnearen Regresson b Bespel Sprengungen. Erschütterung Funkton

Mehr

2 Zufallsvariable und Verteilungen

2 Zufallsvariable und Verteilungen Zufallsvarable und Vertelungen 7 Zufallsvarable und Vertelungen Wr wollen uns jetzt mt Zufallsexpermenten beschäftgen, deren Ausgänge durch (reelle) Zahlen beschreben werden können, oder be denen man jedem

Mehr

Beschreibung des Zusammenhangs zweier metrischer Merkmale. Streudiagramme Korrelationskoeffizienten Regression

Beschreibung des Zusammenhangs zweier metrischer Merkmale. Streudiagramme Korrelationskoeffizienten Regression Beschrebung des Zusammenhangs zweer metrscher Merkmale Streudagramme Korrelatonskoeffzenten Regresson Alter und Gewcht be Kndern bs 36 Monaten Knd Monate Gewcht 9 9 5 8 3 4 7.5 4 3 6 5 3 6 4 3.5 7 35 5

Mehr

Grundgedanke der Regressionsanalyse

Grundgedanke der Regressionsanalyse Grundgedanke der Regressonsanalse Bsher wurden durch Koeffzenten de Stärke von Zusammenhängen beschreben Mt der Regressonsrechnung können für ntervallskalerte Varablen darüber hnaus Modelle geschätzt werden

Mehr

Arbeitsgruppe Radiochemie Radiochemisches Praktikum P 06. Einführung in die Statistik. 1. Zählung von radioaktiven Zerfällen und Statistik 2

Arbeitsgruppe Radiochemie Radiochemisches Praktikum P 06. Einführung in die Statistik. 1. Zählung von radioaktiven Zerfällen und Statistik 2 ETH Arbetsgruppe Radocheme Radochemsches Praktkum P 06 Enführung n de Statstk INHALTSVERZEICHNIS Sete 1. Zählung von radoaktven Zerfällen und Statstk 2 2. Mttelwert und Varanz 2 3. Momente ener Vertelung

Mehr

Die Annäherung der Binomialverteilung durch die Normalverteilung am Beispiel eines Modells der Schadenversicherung

Die Annäherung der Binomialverteilung durch die Normalverteilung am Beispiel eines Modells der Schadenversicherung am Bespel enes Modells der chadenverscherung Für das Modell ener chadenverscherung se gegeben: s w s. n 4 chaden enes Verscherungsnehmers, wenn der chadenfall entrtt Wahrschenlchket dafür, dass der chadenfall

Mehr

Lineare Regression Teil des Weiterbildungskurses in angewandter Statistik

Lineare Regression Teil des Weiterbildungskurses in angewandter Statistik 0 Lneare Regresson Tel des Weterbldungskurses n angewandter Statstk der ETH Zürch Folen Werner Stahel, September 2017 1.1 Bespele zur lnearen Regresson 1 1 Enführung n de statstsche Regressonsrechnung

Mehr

5 Allgemeinere Regressions-Modelle

5 Allgemeinere Regressions-Modelle 5 Allgemenere Regressons-Modelle 5.1 Modelle für Ausfall-Zeten oder -Belastungen a Bespel. Kohlenstoff-Fasern verschedener Länge (1, 10, 20, 50 mm): Resskräfte (falure stress) gemessen, je für 57 bs 70

Mehr

(Theoretische) Konfidenzintervalle für die beobachteten Werte: Die Standardabweichung des Messfehlers wird Standardmessfehler genannt:

(Theoretische) Konfidenzintervalle für die beobachteten Werte: Die Standardabweichung des Messfehlers wird Standardmessfehler genannt: (Theoretsche Konfdenzntervalle für de beobachteten Werte: De Standardabwechung des Messfehlers wrd Standardmessfehler genannt: ( ε ( 1- REL( Mt Hlfe der Tschebyscheff schen Unglechung lassen sch be bekanntem

Mehr

-70- Anhang: -Lineare Regression-

-70- Anhang: -Lineare Regression- -70- Anhang: -Lneare Regressn- Für ene Messgröße y f(x) gelte flgender mathematsche Zusammenhang: y a+ b x () In der Regel läßt sch durch enen Satz vn Messwerten (x, y ) aber kene Gerade zechnen, da de

Mehr

Abbildung 3.1: Besetzungszahlen eines Fermigases im Grundzustand (a)) und für eine angeregte Konfiguration (b)).

Abbildung 3.1: Besetzungszahlen eines Fermigases im Grundzustand (a)) und für eine angeregte Konfiguration (b)). 44 n n F F a) b) Abbldung 3.: Besetzungszahlen enes Fermgases m Grundzustand (a)) und für ene angeregte Konfguraton (b)). 3.3 Ferm Drac Statstk In desem Abschntt wollen wr de thermodynamschen Egenschaften

Mehr

Daten sind in Tabellenform gegeben durch die Eingabe von FORMELN können mit diesen Daten automatisierte Berechnungen durchgeführt werden.

Daten sind in Tabellenform gegeben durch die Eingabe von FORMELN können mit diesen Daten automatisierte Berechnungen durchgeführt werden. Ene kurze Enführung n EXCEL Daten snd n Tabellenform gegeben durch de Engabe von FORMELN können mt desen Daten automatserte Berechnungen durchgeführt werden. Menüleste Symbolleste Bearbetungszele aktve

Mehr

Y : Ader-Verengung ja (1) / nein (0)

Y : Ader-Verengung ja (1) / nein (0) 2 Logstsche Regresson 2. Enletung b Bespel Ader-Verengung Y : Ader-Verengung ja () / nen (0) Eng.: Atem-Volumen (Vol) und Atem-Frequenz (Rate) Zel: P Y = Vol, Rate modelleren! c P Y = = h x (), x (2),...,

Mehr

Übungsklausur zur Vorlesung Wahrscheinlichkeit und Regression Lösungen. Übungsklausur Wahrscheinlichkeit und Regression Die Lösungen

Übungsklausur zur Vorlesung Wahrscheinlichkeit und Regression Lösungen. Übungsklausur Wahrscheinlichkeit und Regression Die Lösungen Übungsklausur Wahrschenlchket und Regresson De Lösungen. Welche der folgenden Aussagen treffen auf en Zufallsexperment zu? a) En Zufallsexperment st en emprsches Phänomen, das n stochastschen Modellen

Mehr

Statistik der Extremwertverteilungen

Statistik der Extremwertverteilungen KAPITEL 6 Statstk der Extremwertvertelungen In desem Kaptel beschäftgen wr uns mt statstschen Anwendungen der Extremwertvertelungen. Wr werden zwe verschedene Zugänge zur Modellerung von Extremwerten betrachten.

Mehr

Klausur zur Vorlesung Lineare Modelle SS 2006 Diplom, Klausur A

Klausur zur Vorlesung Lineare Modelle SS 2006 Diplom, Klausur A Lneare Modelle m SS 2006, Prof. Dr. W. Zucchn 1 Klausur zur Vorlesung Lneare Modelle SS 2006 Dplom, Klausur A Aufgabe 1 (18 Punkte) a) Welcher grundsätzlche Untersched besteht n der Interpretaton von festen

Mehr

Mehrfachregression: Einfluss mehrerer Merkmale auf ein metrisches Merkmal. Designmatrix Bestimmtheitsmaß F-Test T-Test für einzelne Regressoren

Mehrfachregression: Einfluss mehrerer Merkmale auf ein metrisches Merkmal. Designmatrix Bestimmtheitsmaß F-Test T-Test für einzelne Regressoren Mehrfachregresson: Enfluss mehrerer Merkmale auf en metrsches Merkmal Desgnmatrx Bestmmthetsmaß F-Test T-Test für enzelne Regressoren Mehrfachregresson Bvarat: x b b y + = 0 ˆ k k x b x b x b b y + + +

Mehr

Erwartungswert, Varianz, Standardabweichung

Erwartungswert, Varianz, Standardabweichung RS 24.2.2005 Erwartungswert_Varanz_.mcd 4) Erwartungswert Erwartungswert, Varanz, Standardabwechung Be jedem Glücksspel nteresseren den Speler vor allem de Gewnnchancen. 1. Bespel: Setzen auf 1. Dutzend

Mehr

Rotation (2. Versuch)

Rotation (2. Versuch) Rotaton 2. Versuch Bekannt snd berets Vektorfelder be denen das Lnenntegral über ene geschlossene Kurve Null wrd Stchworte: konservatve Kraft Potentalfelder Gradentenfeld. Es gbt auch Vektorfelder be denen

Mehr

Bedingte Entropie. Bedingte Entropie. Bedingte Entropie. Kapitel 4: Bedingte Entropie I(X;Y) H(X Y) H(Y) H(X) H(XY)

Bedingte Entropie. Bedingte Entropie. Bedingte Entropie. Kapitel 4: Bedingte Entropie I(X;Y) H(X Y) H(Y) H(X) H(XY) Bedngte Entrope Kaptel : Bedngte Entrope Das vorherge Theorem kann durch mehrfache Anwendung drekt verallgemenert werden H (... H ( = Ebenso kann de bedngt Entrope defnert werden Defnton: De bedngte Entrope

Mehr

1 Mehrdimensionale Analysis

1 Mehrdimensionale Analysis 1 Mehrdmensonale Analyss Bespel: De Gesamtmasse der Erde st ene Funton der Erddchte ρ Erde und des Erdradus r Erde De Gesamtmasse der Erde st dann m Erde = V Erde ρ Erde Das Volumen ener Kugel mt Radus

Mehr

Lineare Regression. Werner Stahel Seminar für Statistik, ETH Zürich. Januar 2006. Unterlagen zum Block Rg1 des Kurses in Angewandter Statistik

Lineare Regression. Werner Stahel Seminar für Statistik, ETH Zürich. Januar 2006. Unterlagen zum Block Rg1 des Kurses in Angewandter Statistik Lneare Regresson Werner Stahel Semnar für Statstk, ETH Zürch Januar 2006 Unterlagen zum Block Rg1 des Kurses n Angewandter Statstk 2 3 Inhaltsverzechns 1 Enführung n de statstsche Regressonsrechnung 1

Mehr

Konkave und Konvexe Funktionen

Konkave und Konvexe Funktionen Konkave und Konvexe Funktonen Auch wenn es n der Wrtschaftstheore mest ncht möglch st, de Form enes funktonalen Zusammenhangs explzt anzugeben, so kann man doch n velen Stuatonen de Klasse der n Frage

Mehr

Statistik und Wahrscheinlichkeitsrechnung

Statistik und Wahrscheinlichkeitsrechnung Statstk und Wahrschenlchketsrechnung Statstk und Wahrschenlchketsrechnung 5. Vorlesung Dr. Jochen Köhler.03.0 Statstk und Wahrschenlchketsrechnung Wchtg!!! Vorlesung Do 4.03.0 HCI G3 Übung 5 D 9.03.0 Fnk

Mehr

6. Modelle mit binären abhängigen Variablen

6. Modelle mit binären abhängigen Variablen 6. Modelle mt bnären abhänggen Varablen 6.1 Lneare Wahrschenlchketsmodelle Qualtatve Varablen: Bnäre Varablen: Dese Varablen haben genau zwe möglche Kategoren und nehmen deshalb genau zwe Werte an, nämlch

Mehr

Facility Location Games

Facility Location Games Faclty Locaton Games Semnar über Algorthmen SS 2006 Klaas Joeppen 1 Abstract Wr haben berets sehr häufg von Nash-Glechgewchten und vor allem von deren Exstenz gesprochen. Das Faclty Locaton Game betet

Mehr

Gauss sche Fehlerrrechnung

Gauss sche Fehlerrrechnung Gauss sche Fehlerrrechnung T. Ihn 24. Oktober 206 Inhaltsverzechns Modell und Lkelhood 2 Alle Standardabwechungen σ snd bekannt, bzw. de Kovaranzmatrx der Daten st bekannt: Mnmeren der χ 2 -Funkton. 6

Mehr

3. Lineare Algebra (Teil 2)

3. Lineare Algebra (Teil 2) Mathematk I und II für Ingeneure (FB 8) Verson /704004 Lneare Algebra (Tel ) Parameterdarstellung ener Geraden Im folgenden betrachten wr Geraden m eukldschen Raum n, wobe uns hauptsächlch de Fälle n bzw

Mehr

14 Schätzmethoden. Eigenschaften von Schätzungen ˆθ. Sei ˆθ n eine Schätzung eines Parameters θ, die auf n Beobachtungen beruht.

14 Schätzmethoden. Eigenschaften von Schätzungen ˆθ. Sei ˆθ n eine Schätzung eines Parameters θ, die auf n Beobachtungen beruht. 14 Schätzmethoden Egenschaften von Schätzungen ˆθ Se ˆθ n ene Schätzung enes Parameters θ, de auf n Beobachtungen beruht. ˆθn n θ Konsstenz (Mnmalforderung) Eˆθ n = θ Erwartungstreue Eˆθ n n θ Asymptotsche

Mehr

wird auch Spannweite bzw. Variationsbreite genannt ist definiert als die Differenz zwischen dem größten und kleinsten Messwert einer Verteilung:

wird auch Spannweite bzw. Variationsbreite genannt ist definiert als die Differenz zwischen dem größten und kleinsten Messwert einer Verteilung: Streuungswerte: 1) Range (R) ab metrschem Messnveau ) Quartlabstand (QA) und mttlere Quartlabstand (MQA) ab metrschem Messnveau 3) Durchschnttlche Abwechung (AD) ab metrschem Messnveau 4) Varanz (s ) ab

Mehr

Ein semi-bayes'scher Anpassungstest für das logistische Regressionsmodell mit schwach besetzten Zellen

Ein semi-bayes'scher Anpassungstest für das logistische Regressionsmodell mit schwach besetzten Zellen En sem-bayes'scher Anpassungstest für das logstsche Regressonsmodell mt schwach besetzten Zellen Olver Kuß Insttut für Medznsche Epdemologe, Bometre und Informatk, Unverstät Halle-Wttenberg, Magdeburger

Mehr

Fallstudie 1 Diskrete Verteilungen Abgabe: Aufgabentext und Lösungen schriftlich bis zum

Fallstudie 1 Diskrete Verteilungen Abgabe: Aufgabentext und Lösungen schriftlich bis zum Abgabe: Aufgabentext und Lösungen schrftlch bs zum 15. 6. 2012 I. Thema: Zehen mt und ohne Zurücklegen Lesen Se sch zunächst folgenden Text durch! Wr haben bsher Stchprobenzehungen aus Grundgesamtheten

Mehr

Die hierzu formulierte Nullhypothese H lautet: X wird durch die Verteilungsdichtefunktion h(x)

Die hierzu formulierte Nullhypothese H lautet: X wird durch die Verteilungsdichtefunktion h(x) ZZ Lösung zu Aufgabe : Ch²-Test Häufg wrd be der Bearbetung statstscher Daten ene bestmmte Vertelung vorausgesetzt. Um zu überprüfen ob de Daten tatsächlch der Vertelung entsprechen, wrd en durchgeführt.

Mehr

EINFÜHRUNG IN DIE POISSON REGRESSION

EINFÜHRUNG IN DIE POISSON REGRESSION INTERDISZIPLINÄRES SEMINAR STATISTISCHE VERFAHREN IN DEN GEOWISSENSCHAFTEN EINFÜHRUNG IN DIE POISSON REGRESSION VON MARGRET OELKER BETREUT DURCH VIOLA SVEJDAR MÜNCHEN, 5. NOVEMBER 2009. EINLEITUNG BEISPIEL

Mehr

3.3 Lineare Abbildungen und Matrizen

3.3 Lineare Abbildungen und Matrizen 33 LINEARE ABBILDUNGEN UND MATRIZEN 87 33 Lneare Abbldungen und Matrzen Wr wollen jetzt de numersche Behandlung lnearer Abbldungen zwschen Vektorräumen beschreben be der vorgegebene Basen de Hauptrolle

Mehr

Kapitel V. Parameter der Verteilungen

Kapitel V. Parameter der Verteilungen Kaptel V Parameter der Vertelungen D. 5.. (Erwartungswert) Als Erwartungswert ener Zufallsvarablen X bezechnet man: E( X ) : Dabe se vorausgesetzt: = = + p falls X dskret f d falls X stetg und = + p

Mehr

Sei T( x ) die Tangente an den Graphen der Funktion f(x) im Punkt ( x 0, f(x 0 ) ) : T( x ) = f(x 0 ) + f (x 0 ) ( x - x 0 ).

Sei T( x ) die Tangente an den Graphen der Funktion f(x) im Punkt ( x 0, f(x 0 ) ) : T( x ) = f(x 0 ) + f (x 0 ) ( x - x 0 ). Taylorentwcklung (Approxmaton durch Polynome). Problemstellung Se T( x ) de Tangente an den Graphen der Funkton f(x) m Punkt ( x 0, f(x 0 ) ) : T( x ) = f(x 0 ) + f (x 0 ) ( x - x 0 ). Dann kann man de

Mehr

(2) i = 0) in Abhängigkeit des Zeitunterschieds x ZeitBus ZeitAuto für seinen Arbeitsweg.) i = 1) oder Bus ( y

(2) i = 0) in Abhängigkeit des Zeitunterschieds x ZeitBus ZeitAuto für seinen Arbeitsweg.) i = 1) oder Bus ( y 5. Probt-Modelle Ökonometre II - Peter Stalder "Bnar Choce"-Modelle - Der Probt-Ansatz Ene ncht drekt beobachtbare stochastsche Varable hängt von x ab: x u 2 u ~ N(0, ( Beobachtet wrd ene bnäre Varable

Mehr

Kurs Mikroökonometrie Rudolf Winter-Ebmer Thema 3: Binary Choice Models Probit & Logit. Wahlentscheidung Kauf langlebiger Konsumgüter Arbeitslosigkeit

Kurs Mikroökonometrie Rudolf Winter-Ebmer Thema 3: Binary Choice Models Probit & Logit. Wahlentscheidung Kauf langlebiger Konsumgüter Arbeitslosigkeit BINARY CHOICE MODELS 1 mt Pr( Y = 1) = P Y = 0 mt Pr( Y = 0) = 1 P Bespele: Wahlentschedung Kauf langlebger Konsumgüter Arbetslosgket Schätzung mt OLS? Y = X β + ε Probleme: Nonsense Predctons ( < 0, >

Mehr

Streuungs-, Schiefe und Wölbungsmaße

Streuungs-, Schiefe und Wölbungsmaße aptel IV Streuungs-, Schefe und Wölbungsmaße B... Lagemaße von äufgketsvertelungen geben allen weng Auskunft über ene äufgketsvertelung. Se beschreben zwar en Zentrum deser Vertelung, geben aber kenen

Mehr

Standardnormalverteilung / z-transformation

Standardnormalverteilung / z-transformation Standardnormalvertelung / -Transformaton Unter den unendlch velen Normalvertelungen gbt es ene Normalvertelung, de sch dadurch ausgeechnet st, dass se enen Erwartungswert von µ 0 und ene Streuung von σ

Mehr

nonparametrische Tests werden auch verteilungsfreie Tests genannt, da sie keine spezielle Verteilung der Daten in der Population voraussetzen

nonparametrische Tests werden auch verteilungsfreie Tests genannt, da sie keine spezielle Verteilung der Daten in der Population voraussetzen arametrsche vs. nonparametrsche Testverfahren Verfahren zur Analyse nomnalskalerten Daten Thomas Schäfer SS 009 1 arametrsche vs. nonparametrsche Testverfahren nonparametrsche Tests werden auch vertelungsfree

Mehr

Lineare Regression. Werner Stahel Seminar für Statistik, ETH Zürich. Mai 2012

Lineare Regression. Werner Stahel Seminar für Statistik, ETH Zürich. Mai 2012 Lneare Regresson Werner Stahel Semnar für Statstk, ETH Zürch Ma 2012 Unterlagen zum Modul G3: Wahrschenlchket und Statstk des Zertfkatskurses über Rsko und Scherhet Dese Unterlagen stammen aus enem umfangrechen

Mehr

Analysis I. Vorlesung 17. Logarithmen. R R, x exp x,

Analysis I. Vorlesung 17. Logarithmen. R R, x exp x, Prof. Dr. H. Brenner Osnabrück WS 2013/2014 Analyss I Vorlesung 17 Logarthmen Satz 17.1. De reelle Exponentalfunkton R R, x exp x, st stetg und stftet ene Bjekton zwschen R und R +. Bewes. De Stetgket

Mehr

Prof. Dr. Roland Füss Statistik II SS 2008

Prof. Dr. Roland Füss Statistik II SS 2008 5. Spezelle Testverfahren Zahlreche parametrsche und nchtparametrsche Testverfahren, de nach Testvertelung (Bnomal, t-test etc.), Analysezel (Anpassungs- und Unabhänggketstest) oder Konstrukton der Prüfgröße

Mehr

Universität Potsdam Institut für Informatik Lehrstuhl Maschinelles Lernen. Bayessches Lernen

Universität Potsdam Institut für Informatik Lehrstuhl Maschinelles Lernen. Bayessches Lernen Unverstät Potsdam Insttut für Informatk Lehrstuhl Maschnelles Lernen Bayessches Lernen Chrstoph Sawade/Nels Landwehr/Paul Prasse Domnk Lahmann Tobas Scheffer Überblck Wahrschenlchketen, Erwartungswerte,

Mehr

Lösungen der Aufgaben zu Kapitel 2

Lösungen der Aufgaben zu Kapitel 2 Lösungen der Aufgaben zu Kaptel Abschntt 1 Aufgabe 1 Wr benutzen de Potenzrechenregeln, um ene Potenz von mt geradem Eponenten n oder mt ungeradem Eponenten n + 1 we folgt darzustellen: n n und n+1 n n

Mehr

Übung zur Vorlesung - Theorien Psychometrischer Tests II

Übung zur Vorlesung - Theorien Psychometrischer Tests II Übung zur Vorlesung - Theoren Psychometrscher Tests II N. Rose 9. Übung (15.01.2009) Agenda Agenda 3-parametrsches logstsches Modell nach Brnbaum Lnkfunktonen 3PL-Modell nach Brnbaum Modellglechung ( =

Mehr

Der Erweiterungsfaktor k

Der Erweiterungsfaktor k Der Erweterungsfaktor k Wahl des rchtgen Faktors S. Meke, PTB-Berln, 8.40 Inhalt: 1. Was macht der k-faktor? 2. Welche Parameter legen den Wert des k-faktors fest? 3. Wo trtt der k-faktor auf? 4. Zusammenhang

Mehr

4 Residuen-Analyse. 4.1 Problemstellung

4 Residuen-Analyse. 4.1 Problemstellung 4 Resduen-Analyse 4.1 Problemstellung a Modell-Annahmen. De engeführten Schätz- und Testmethoden beruhen auf Annahmen: Für de Zufallsabwechungen wurde E N 0, σ 2 (unabhängg) angenommen. Das kann man aufspalten:

Mehr

Rückblick Regression II: Anpassung an Polynome

Rückblick Regression II: Anpassung an Polynome Rückblck Regresson II: Anpassung an Polynome T. Keßlng: Auswertung von Messungen und Fehlerrechnung - Fehlerrechnung und Korrelaton 0.06.08 Vorlesung 0- Temperaturmessung mt Thermospannung Wr erhalten

Mehr

Elemente der Mathematik - Sommer 2016

Elemente der Mathematik - Sommer 2016 Elemente der Mathematk - Sommer 2016 Prof Dr Matthas Lesch, Regula Krapf Lösungen Übungsblatt 3 Aufgabe 9 (10 Punkte) Das Horner-Schema st ene Methode zum Auswerten enes Polynoms n a0 x an der Stelle s

Mehr

Zulassungsprüfung Stochastik,

Zulassungsprüfung Stochastik, Zulassungsprüfung Stochastk, 11.5.13 Wr gehen stets von enem Maßraum (, A, µ) bzw. enem Wahrschenlchketsraum (,A,P) aus. De Borel σ-algebra auf R n wrd mt B n bezechnet, das Lebesgue Maß auf R n wrd mt

Mehr

Asymptotische Stochastik (SS 2010) Übungsblatt 1 P X. 0, n.

Asymptotische Stochastik (SS 2010) Übungsblatt 1 P X. 0, n. Insttut für Stochastk PD. Dr. Deter Kadelka Danel Gentner Asymptotsche Stochastk (SS 2) Übungsblatt Aufgabe (Arten von Konvergenz reeller Zufallsvarablen und deren Zusammenhänge) Es seen X,, n N reelle

Mehr

6.5. Rückgewinnung des Zeitvorgangs: Rolle der Pole und Nullstellen

6.5. Rückgewinnung des Zeitvorgangs: Rolle der Pole und Nullstellen 196 6.5. Rückgewnnung des Zetvorgangs: Rolle der Pole und Nullstellen We n 6.2. und 6.. gezegt wurde, st de Übertragungsfunkton G( enes lnearen zetnvaranten Systems mt n unabhänggen Spechern ene gebrochen

Mehr

Kapitel 4: Unsicherheit in der Modellierung Modellierung von Unsicherheit. Machine Learning in der Medizin 104

Kapitel 4: Unsicherheit in der Modellierung Modellierung von Unsicherheit. Machine Learning in der Medizin 104 Kaptel 4: Unscherhet n der Modellerung Modellerung von Unscherhet Machne Learnng n der Medzn 104 Regresson Modellerung des Datengenerators: Dchteschätzung der gesamten Vertelung, t pt p p Lkelhood: L n

Mehr

Alternative Darstellung des 2-Stichprobentests für Anteile. Beobachtete Response No Response Total absolut DCF CF

Alternative Darstellung des 2-Stichprobentests für Anteile. Beobachtete Response No Response Total absolut DCF CF Alternatve Darstellung des -Stchprobentests für Antele DCF CF Total n= 111 11 3 Response 43 6 69 Resp. Rate 0,387 0,3 0,309 Beobachtete Response No Response Total absolut DCF 43 68 111 CF 6 86 11 69 154

Mehr

Lösungen zum 3. Aufgabenblock

Lösungen zum 3. Aufgabenblock Lösungen zum 3. Aufgabenblock 3. Aufgabenblock ewerber haben n enem Test zur sozalen Kompetenz folgende ntervallskalerte Werte erhalten: 96 131 11 1 85 113 91 73 7 a) Zegen Se für desen Datensatz, dass

Mehr

Statistik Exponentialfunktion

Statistik Exponentialfunktion ! " Statstk " Eponentalfunkton # $ % & ' $ ( )&* +, - +. / $ 00, 1 +, + ) Ensemble von radoaktven Atomkernen Zerfallskonstante λ [1/s] Lebensdauer τ 1/λ [s] Anzahl der pro Zetenhet zerfallenden Kerne:

Mehr

Lineare Regression (1) - Einführung I -

Lineare Regression (1) - Einführung I - Lneare Regresson (1) - Enführung I - Mttels Regressonsanalysen und kompleeren, auf Regressonsanalysen aserenden Verfahren können schenar verschedene, jedoch nenander üerführare Fragen untersucht werden:

Mehr

3 Multiple lineare Regression

3 Multiple lineare Regression 3 Multple lneare Regresson 3.1 Modell und Statstk a De Abhänggket ener Zelgrösse von ener Ausgangsgrösse kann n enem enfachen Streudagramm dargestellt werden. Oft wrd dadurch das Wesentlche des Zusammenhangs

Mehr

Teil E: Qualitative abhängige Variable in Regressionsmodellen

Teil E: Qualitative abhängige Variable in Regressionsmodellen Tel E: Qualtatve abhängge Varable n Regressonsmodellen 1. Qualtatve abhängge Varable Grundlegendes Problem: In velen Fällen st de abhängge Varable nur über enen bestmmten Werteberech beobachtbar. Bsp.

Mehr

Beschreibende Statistik Mittelwert

Beschreibende Statistik Mittelwert Beschrebende Statstk Mttelwert Unter dem arthmetschen Mttel (Mttelwert) x von n Zahlen verstehen wr: x = n = x = n (x +x +...+x n ) Desen Mttelwert untersuchen wr etwas genauer.. Zege für n = 3: (x x )

Mehr

Exkurs: Entropie in der Wahrscheinlichkeitstheorie

Exkurs: Entropie in der Wahrscheinlichkeitstheorie Exkurs: Entrope n der Wahrschenlchketstheore a) Physk/Thermodynamk: S = k B ln(w) mt W=Anzahl glech-wahrschenlcher Möglchketen (Mkrozustände) a) Informatonstheore: Shannon (1948) Entrope wobe p = f /N

Mehr

Stochastische Prozesse

Stochastische Prozesse INSTITUT FÜR STOCHASTIK SS 009 UNIVERSITÄT KARLSRUHE Blatt 4 Prv.-Doz. Dr. D. Kadelka Dpl.-Math. W. Lao Übungen zur Vorlesung Stochastsche Prozesse Musterlösungen Aufgabe 16: (Success Run, Fortsetzung)

Mehr

P[bk t c se(b k) k bk t c se(b k)] 1 (5.1.3)

P[bk t c se(b k) k bk t c se(b k)] 1 (5.1.3) Kaptel 5: Inferenz m multplen Modell 5 Inferenz m multplen Modell 5. Intervallschätzung m multplen Regressonsmodell Analog zum enfachen Regressonsmodell glt: Dem Intervallschätzer der Parameter legt zugrunde,

Mehr

e dt (Gaußsches Fehlerintegral)

e dt (Gaußsches Fehlerintegral) Das Gaußsche Fehlerntegral Φ Ac 5-8 Das Gaußsche Fehlerntegral Φ st denert als das Integral über der Standard-Normalvertelung j( ) = -,5 n den Grenzen bs, also F,5 t ( ) = - e dt (Gaußsches Fehlerntegral)

Mehr

1 Finanzmathematik. 1.1 Das Modell. Sei Xt

1 Finanzmathematik. 1.1 Das Modell. Sei Xt 1.1 Das Modell Se Xt der Pres enes Assets zur Zet t und X = X ) 1 d der Rd +-dmensonale Presprozess. Das Geld kann auch zu dem rskolosen Znssatz r be ener Bank angelegt werden. Der Wert deser Anlage wrd

Mehr

Vorlesung: Multivariate Statistik für Psychologen

Vorlesung: Multivariate Statistik für Psychologen Vorlesung: Multvarate Statstk für Psychologen 3. Vorlesung: 14.04.2003 Agenda 1. Organsatorsches 2. Enfache Regresson. Grundlagen.. Grunddee und Zele der enfachen Regresson Bespele Statstsches Modell Modell

Mehr

12 UMPU Tests ( UMP unbiased )

12 UMPU Tests ( UMP unbiased ) 89 1 UMPU Tests ( UMP unbased ) Nach Bemerkung 11.8(b) exstert m Allgemenen ken zwesetger UMP- Test zu enem Nveau α. Deshalb Enschränkung auf unverfälschte Tests: ϕ Φ α heßt unverfälscht (unbased) zum

Mehr

Resultate / "states of nature" / mögliche Zustände / möglicheentwicklungen

Resultate / states of nature / mögliche Zustände / möglicheentwicklungen Pay-off-Matrzen und Entschedung unter Rsko Es stehen verschedene Alternatven (Strategen) zur Wahl. Jede Stratege führt zu bestmmten Resultaten (outcomes). Man schätzt dese Resultate für jede Stratege und

Mehr

Mathematische und statistische Methoden II

Mathematische und statistische Methoden II Methodenlehre e e Prof. Dr. G. Menhardt 6. Stock, Wallstr. 3 (Raum 06-206) Sprechstunde jederzet nach Verenbarung und nach der Vorlesung. Mathematsche und statstsche Methoden II Dr. Malte Perske perske@un-manz.de

Mehr

8 Logistische Regressionsanalyse

8 Logistische Regressionsanalyse wwwstatstkpaketde 8 Logstsche Regressonsanalyse De logstsche Regressonsanalyse dent der Untersuchung des Enflusses ener quanttatven Varable auf ene qualtatve (n unserem Fall dchotomen Varable Wr gehen

Mehr

Ökonomische und ökonometrische Evaluation. 1.3 Ökonometrische Grundkonzepte

Ökonomische und ökonometrische Evaluation. 1.3 Ökonometrische Grundkonzepte Ökonomsche und ökonometrsche Evaluaton 90 Emprsche Analyse des Arbetsangebots Zele: Bestmmung von Arbetsangebotselastztäten als Test der theoretschen Modelle Smulaton oder Evaluaton der Wrkungen von Insttutonen

Mehr

Regressionsgerade. x x 1 x 2 x 3... x n y y 1 y 2 y 3... y n

Regressionsgerade. x x 1 x 2 x 3... x n y y 1 y 2 y 3... y n Regressonsgerade x x x x 3... x n y y y y 3... y n Bem Auswerten von Messrehen wrd häufg ene durch theoretsche Überlegungen nahegelegte lneare Bezehung zwschen den x- und y- Werten gesucht, d.h. ene Gerade

Mehr

z.b. Münzwurf: Kopf = 1 Zahl = 2 oder z.b. 2 Würfel: Merkmal = Summe der Augenzahlen, also hier: Bilde die Summe der Augenzahlen der beiden Würfel!

z.b. Münzwurf: Kopf = 1 Zahl = 2 oder z.b. 2 Würfel: Merkmal = Summe der Augenzahlen, also hier: Bilde die Summe der Augenzahlen der beiden Würfel! Aufgabe : Vorbemerkung: Ene Zufallsvarable st ene endeutge Funkton bzw. ene Abbldungsvorschrft, de angbt, auf welche Art aus enem Elementareregns ene reelle Zahl gewonnen wrd. x 4 (, ) z.b. Münzwurf: Kopf

Mehr

STATISTIK AUF DEM KREIS

STATISTIK AUF DEM KREIS - 17 - STATISTIK AUF DEM KREIS nach K. E. SElkrk, Unversty of Nottngham Orgnalttel n 'Teachng Statstcs' Vol. 4 (1982) Nr. 3: Statstcs on a Crcle tlbersetzung und Bearbetung: B. Wollrng De mesten Zufallsgrößen,

Mehr

8. Verallgemeinerte Lineare Modelle GLM s

8. Verallgemeinerte Lineare Modelle GLM s 8. Verallgemenerte Lneare Modelle GLM s 1 8. Verallgemenerte Lneare Modelle: 8.1. Grundlagen 2 8.1. Grundlagen 8. Verallgemenerte Lneare Modelle: 8.1. Grundlagen 8.1.1. Defnton: Generalserte Lneare Modelle

Mehr

Empirische Wirtschaftsforschung

Empirische Wirtschaftsforschung Emprsche Wrtschaftsforschung Prof. Dr. Bernd Süßmuth Unverstät Lepzg Insttut für Emprsche Wrtschaftsforschung Volkswrtschaftslehre, nsbesondere Ökonometre 5. Enfaches OLS-Regressonsmodell 5.1. Herletung

Mehr

Vorlesung 3 Differentialgeometrie in der Physik 13

Vorlesung 3 Differentialgeometrie in der Physik 13 Vorlesung 3 Dfferentalgeometre n der Physk 13 Bemerkung. Ist M Manngfaltgket, p M und φ : U R n Karte mt p U, so nennt man U auch Koordnatenumgebung und φ auch Koordnatensystem n p. Bespel 2.4 Seen R >

Mehr

Multivariate Analysemethoden

Multivariate Analysemethoden Multvarate Analysemethoden q-q-plot Methode zur Prüfung der Multvaraten Normalvertelung Günter Menhardt Johannes Gutenberg Unverstät Manz Prüfung der NV-Annahme Vertelungsanpassung/Prüfung Prüfung der

Mehr

ANOVA (Analysis of Variance) Varianzanalyse. Statistik Methoden. Ausgangssituation ANOVA. Ao.Prof.DI.Dr Josef Haas

ANOVA (Analysis of Variance) Varianzanalyse. Statistik Methoden. Ausgangssituation ANOVA. Ao.Prof.DI.Dr Josef Haas Ao.Prof.DI.Dr Josef Haas josef.haas@medungraz.at ANOVA (Analyss of Varance) Varanzanalyse Statstk Methoden Verglech von Mttelwerten Ao.Unv.Prof.DI.Dr. Josef Haas josef.haas@medungraz.at Ausgangsstuaton

Mehr

Das zum dualen Problem (10.2) gehörige Barriere-Problem lautet analog

Das zum dualen Problem (10.2) gehörige Barriere-Problem lautet analog 60 Kaptel 2. Lneare Optmerung 10 Innere-Punkte-Verfahren Lteratur: Geger, Kanzow, 2002, Kaptel 4.1 Innere-Punkte-Verfahren (IP-Verfahren) oder nteror pont methods bewegen sch m Gegensatz zum Smplex-Verfahren

Mehr

Lineare Regression - Mathematische Grundlagen

Lineare Regression - Mathematische Grundlagen FKULTÄT FÜR MTHEMTIK U TURWISSESCHFTE ISTITUT FÜR PHYSIK FCHGEBIET EXPERIMETLPHYSIK I r. rer. nat. orbert Sten, pl.-ing (FH) Helmut Barth Lneare Regresson - Mathematsche Grundlagen. llgemene Gerade Wr

Mehr

Multilineare Algebra und ihre Anwendungen. Nr. 6: Normalformen. Verfasser: Yee Song Ko Adrian Jenni Rebecca Huber Damian Hodel

Multilineare Algebra und ihre Anwendungen. Nr. 6: Normalformen. Verfasser: Yee Song Ko Adrian Jenni Rebecca Huber Damian Hodel ultlneare Algebra und hre Anwendungen Nr. : Normalformen Verfasser: Yee Song Ko Adran Jenn Rebecca Huber Daman Hodel 9.5.7 - - ultlneare Algebra und hre Anwendungen Jordan sche Normalform Allgemene heore

Mehr

16. Vorlesung Sommersemester

16. Vorlesung Sommersemester 16. Vorlesung Sommersemester 1 Das Egenwertproblem In allgemener Form hat das Egenwertproblem de Form A x = λ x, (1) wobe A ene n n-matrx, x en n-dmensonaler Vektor und λ der Egenwert st (n Englsch: egenvector,

Mehr

Invariantentheorie. Vorlesung 3. Lineare Operationen

Invariantentheorie. Vorlesung 3. Lineare Operationen Prof. Dr. H. Brenner Osnabrück WS 2012/2013 Invarantentheore Vorlesung 3 Lneare Operatonen Ene Operaton ener Gruppe G auf ener (geometrschen) Menge M st das gleche we en Gruppenhomomorphsmus der Gruppe

Mehr

9 Komplexe Zahlen ( ) ( ) 9.1 Ziele. 9.2 Warum braucht man komplexe Zahlen? 9.3 Darstellung von komplexen Zahlen. r 2. j 2. j 1.

9 Komplexe Zahlen ( ) ( ) 9.1 Ziele. 9.2 Warum braucht man komplexe Zahlen? 9.3 Darstellung von komplexen Zahlen. r 2. j 2. j 1. Mathematk I / Komplexe Zahlen 9 Komplexe Zahlen 9. Zele Am Ende deses Kaptels hast Du ene Grundvorstellung was komplexe Zahlen snd. Du kannst se grafsch darstellen und enfache Berechnungen durchführen.

Mehr

Diskrete Mathematik 1 WS 2008/09

Diskrete Mathematik 1 WS 2008/09 Ruhr-Unverstät Bochum Lehrstuhl für Kryptologe und IT-Scherhet Prof. Dr. Alexander May M. Rtzenhofen, M. Mansour Al Sawad, A. Meurer Lösungsblatt zur Vorlesung Dskrete Mathematk 1 WS 2008/09 Blatt 7 /

Mehr

Die kanonische Zustandssumme (System) und ihr Zusammenhang mit der molekularen Zustandssumme (Einzelmolekül) unterscheidbare Teilchen:

Die kanonische Zustandssumme (System) und ihr Zusammenhang mit der molekularen Zustandssumme (Einzelmolekül) unterscheidbare Teilchen: De molekulare Zustandssumme βε = e mt β = De kanonsche Zustandssumme (System) und hr Zusammenhang mt der molekularen Zustandssumme (Enzelmolekül) unterschedbare elchen: Q = ununterschedbareelchen Q : =!

Mehr

Übung zur Vorlesung - Theorien Psychometrischer Tests II

Übung zur Vorlesung - Theorien Psychometrischer Tests II Übung zur Vorlesung - Theoren Psychometrscher Tests II N. Rose 8. Übung (08.01.2008) Agenda Agenda Verglech Rasch-Modell vs. 2-parametrsches logstsches Modell nach Brnbaum 2PL-Modelle n Mplus Verglech

Mehr

7 Eine und zwei kategorielle Variable

7 Eine und zwei kategorielle Variable 7 Ene und zwe kategorelle Varable 7.1 Enletung a b In Umfragen wrd für jede Frage vorzugswese ene Lste von Auswahlantworten angeboten. Es wrd bespelswese gefragt, welches von 5 Produkten man bevorzugt.

Mehr