Statistische Methoden: Tests, Regression und multivariate Verfahren

Größe: px
Ab Seite anzeigen:

Download "Statistische Methoden: Tests, Regression und multivariate Verfahren"

Transkript

1 (CM)²-Nachwuchsring, Workshop Statistik, 25.Januar 2013 Statistische Methoden: Tests, Regression und multivariate Verfahren Ralf Korn ((CM)², TU Kaiserslautern, Fraunhofer ITWM)

2 0. Einige Probleme aus der Anwendung mit Statistikbezug Biologie: Tests zur Unterscheidung verschiedener Populationen Auswirkungen verschiedener Behandlungen (z.b. Düngung) Materialdynamik/-erzeugung/-auswahl Vorhersage von Eigenschaften/Verhalten von Material bzw. von Grenzwerten Finanz- und Versicherungsmathematik Kreditbewertung ( Rating ), Einteilung in verschiedenen Ausfallklassen Erkennen von Falschgeld Aufgaben: Vergleich, Vorhersage, Klassifikation => Tests, Regression, mehrdimensionale Daten, Diskriminanzanalyse, Hauptkomponentenanalyse,

3 1. Wichtige Testverfahren - Grundlagen Was ist ein statistischer Test? Ein Test überprüft anhand relevanter Daten, ob eine Hypothese ( Nullhypothese ) mit einer gegebenen Restfehlerwahrscheinlichkeit ( Siginifikanzniveau ) abgelehnt werden kann oder nicht. Das fälschliche Ablehnen dieser Hypothese wird als Fehler 1. Art bezeichnet, das fälschliche Beibehalten als Fehler 2.Art Bsp. 1: (ähnlich, wie viele Bsp. aus Statistik II für WIs (Franke)) Ein Hersteller eines neuen Lacks soll eine mittlere Trockenzeit von µ 0 =10 min haben. Um das zu überprüfen, nimmt ein Institut 50 Proben und erhält das Stichprobenmittel und die Stichprobenstandardabweichung von : X = 10, 89 min, S = 1, 54 min Klar: das Stichprobenmittel ist größer als 10 min, aber ist das nur ein Messfehler? => Nötig: Annahmen über die Verteilung der Trockenzeiten X i, i = 1,..., 50. Welche Restfehlerw-keit soll beim Ablehnen der Nullhypothese H 0 :µ =10 nicht überschritten werden ( Signifikanzniveau )?

4 1. Wichtige Testverfahren - Die t-tests a) Der 1-Stichproben-t-Test Wann verwendbar? Vergleich des Mittelwerts einer normal verteilten Stichprobe mit gegebenem Wert µ 0 Was wird als Input benötigt? N = Stichprobengröße, µ 0 = Vergleichswert für den Mittelwert X N = Stichprobenmittelwert, 2 S N = Stichprobenstandardabweichung Was wird getestet? i) H 1 : µ > µ 0 H 0 : µ = µ 0 vs. ii) H 1 : µ < µ 0 iii) H 1 : µ µ 0 Bsp.1 (Fortsetzung) Wir nehmen für die Trockenzeit des Lacks X i an, dass gilt Xi ( 2 ) N µ,σ, wobei σ² unbekannt ist und die Nullhypothese H 0 :µ =10 überprüft werden soll.

5 1-Stichproben-t-Test (X 1,..., X N u.i.v. N(µ, σ²), σ² unbekannt) 1. Hypothesenwahl: Wähle die zu testende Hypothese i) H 1 : µ > µ 0 H 0 : µ = µ 0 vs. ii) H 1 : µ < µ 0 iii) H 1 : µ µ 0 2. Wahl des Signifikanzniveaus: Lege α fest. 3. Berechnung der Teststatistik: X N µ 0 Berechne t : = N SN 4. Entscheidung: t > t N 11, α, im Falli) Lehne H 0 ab, falls t < t N 1, α, im Fallii), t > t N 11, α / 2, im Falliii) sonst behalte H 0 bei.

6 Bem.: a) Gaaanz wichtig: Teste nach Möglichkeit immer einseitig! b) Der 1-Stichproben-t-Test kann auch für den Vergleich der Mittelwerte zweier verbundener Stichproben (also immer Paare von zwei abhängigen Beobachtungen ( Wert vor Behandlung, Wert nach Behandlung )) verwendet werden, wenn man annimmt, dass die Differenzen der beiden jeweiligen Komponenten normal verteilt sind. Bsp. 1 (Fortsetzung): Wir vermuten µ>10 und wählen H 1 : µ >10. Wir wählen das S-niveau α=0,05. 10, => t : = 50 = 4, 087 > 1, 645 = t49; , 54 Auf dem S-niveau 0,05 wurde gezeigt, dass die mittlere Trockenzeit größer 10 min ist. Bsp. 2 (Beeinflusst ein Medikament den Blutdruck) N = 20 Personen, X i = Blutdruck der i. Person vor Medikamenteneinnahme, Y i = Blutdruck der i. Person nach Medikamenteneinnahme Bilde die Differenzen der beiden Werte und teste für die Differenzen: H 0 : µ = 0 ( keinen Einfluss ) gegen H 1 : µ 0 ( Einfluss )

7 Wähle als Signifikanzniveau α= 0,01 Berechne: => D = 10, 8 min, S = 20, 5 min t , 8 = 20 = < 2,862 = t 20, 5 19; => H 0 kann nicht abgelehnt werden, obwohl vieles für die Ablehnung spricht!!! Was ist ein p-wert? Der p-wert ist das Signifikanzniveau (also die Schranke für den Fehler 1.Art), so dass der Test bei den vorliegenden Daten gerade noch ablehnen würde, für kleinere Signifikanzniveaus aber nicht (wird oft von Statistikprogrammpaketen angegeben) z.b.: p-wert = => Die Nullhypothese wird dann abgelehnt, wenn das vor (!) dem Durchführen des Tests festgelegte Signifikanzniveau größer/gleich 0,0432 ist. In Bsp. 2 ist der p-wert kleiner (!) als 0,05 (!!!).

8 1. Wichtige Testverfahren - Die t-tests b) Der 2-Stichproben-t-Test Wann verwendbar? Vergleich der Mittelwerte zweier unabhängiger normal verteilter Stichproben mit gleicher Varianz. Was wird als Input benötigt? N, M = Stichprobengrößen, X N, Y M = Stichprobenmittelwerte, Was wird getestet? i) H 1 : µ 1 > µ 2 H 0 : µ 1 = µ 2 vs. ii) H 1 : µ 1 < µ 2 iii) H 1 : µ 1 µ 2 2 S N, 2 S M = Stichprobenstandardabweichungen

9 2-Stichproben-t-Test (X 1,...,X N u.i.v. N(µ 1,σ²), Y 1,..., Y M u.i.v. N(µ 2,σ²), σ² unbekannt) 1. Hypothesenwahl: Wähle die zu testende Hypothese i) H 1 : µ 1 > µ 2 H 0 : µ 1 = µ 2 vs. ii) H 1 : µ 1 < µ 2 iii) H 1 : µ 1 µ 2 2. Wahl des Signifikanzniveaus: Lege α fest. 3. Berechnung der Teststatistik: ( ) + ( ) 2 2 N M 1 1 X N YM S N 1 S M 1 Berechne t : = +, S N M N,M : = SN,M N + M 2 4. Entscheidung: t > t, im Falli) Lehne H 0 ab, falls N + M 2, 1 α t < t, im Fallii) N + M 2, α t > t N + M 2, 1 α / 2, im Falliii) sonst behalte H 0 bei.,

10 Bsp. 3: Es wird vermutet, dass sich der elektrische Widerstand von Kupfer senkt, wenn es mit einem geringen Anteil andrer Metalle legiert wird. H 0 : µ 1 = µ 2 vs. ii) H 1 : µ 1 > µ 2 Gewähltes Signifikanzniveau α= 0,05 Experiment: 60 Messungen X 1,, X 60 bei Standardkupferdraht, 40 Messungen Y 1,, Y 40 bei legiertem Kupferdraht Zahlen: X = 0, 125, Y = 0, 114, S = 0, 005, S = 0, ,X 40,X t : = + 0, 125 0, 114 = 8, 18 > 1, 644 = t 29, => ; also kann auf dem S-niveau von 5% festgestellt werden, dass der legierte Kupferdraht einen niedrigeren elektrischen Widerstand besitzt. Achtung: Es muss eigentlich noch mit einem F-Test überprüft werden, ob die Hypothese gleicher Varianzen in beiden Gruppen aufrecht erhalten werden kann!!!,

11 1. Wichtige Testverfahren - Die t-tests c) Einige Kommentare Bei den t-tests müssen die Daten nicht zwingend normal-verteilt sein, sondern lediglich die Mittelwerte der Daten! Die t-tests funktionieren deshalb oft auch gut bei nicht-normal verteilten Daten, insbesonders bei großen Stichprobengrößen Im Fall nicht-gleicher Varianzen existieren im 2-Stichproben-t-Test geeignete Varianten, so dass er mit diesen durchgeführt werden kann Auf den Mehrstichprobenfall in Form der Varianzanalyse wird hier nicht eingegangen

12 1. Wichtige Testverfahren - Die Rang-Tests Will man / Kann man bei vorhandenen Daten keine Verteilungsannahme unterstellen, so bieten die Rang-Tests eine sehr gute Alternative zu den t-tests an (selbst, wenn tatsächlich Normalverteilung vorliegt!) Prinzipielle Vorgehensweise: Ordne die vorhandenen Daten gemäß ihrer Werte an, ordne den Daten ihre jeweiligen Ränge innerhalb der Gesamtstichprobe zu, vergleiche die ermittelten Rangsummen mit Werten, die man bei Gültigkeit der Nullhypothese erwartet hätte.

13 1. Wichtige Testverfahren - Die Rang-Tests a) Der Vorzeichen-Rang-Test Wann verwendbar? Ein Stichprobe mit mindestens ordinalen Daten wird auf Symmetrie um einen bestimmten Wert ξ 0 getestet (bei Normalverteilung Test für den Mittelwert), wobei wir voraussetzen, dass die zugrunde liegende Verteilung symmetrisch ist. Was wird als Input benötigt? R = Rangzahl von X in der Gesamtstichprobe (beginnend mit der kleinsten Zahl) i i Was wird getestet? Teste, ob die Verteilung einer Stichprobe X 1,, X N symmetrisch um den Wert ξ 0 ist. i) H 1 : ξ > ξ 0 H 0 : ξ = ξ 0 vs. ii) H 1 : ξ < ξ 0 iii) H 1 : ξ ξ 0

14 Vorzeichen-RangTest (X 1,...,X N Stichprobe (von mdst. ordinalen Daten) mit symmetrischer Verteilung um einen Punkt ξ) 1. Hypothesenwahl: Wähle die zu testende Hypothese i) H 1 : ξ > ξ 0 H 0 : ξ = ξ 0 vs. ii) H 1 : ξ < ξ 0 iii) H 1 : ξ ξ 0 2. Wahl des Signifikanzniveaus: Lege α fest. 3. Berechnung der Teststatistik: Ordne jedem X i seinen Rang Ri in der Stichprobe zu (beginnend mit dem kleinsten Wert) und bilde T + : R = 4. Entscheidung: (bei N 20) + T > w, im Falli) Lehne H 0 ab, falls + i:x N, 1 α i >ξ > N, 1 α / 2 oder < N, α / 2 i T < w, im Fallii) N, α T w T w, im Falliii) sonst behalte H 0 bei.,

15 Bem.: a) Bei gleichen Werten ordnen wir den vorkommenden Werten die mittlere Rangzahl zu. b) Für kleine N sind die Quantile w N,a tabelliert. c) Für N >> 20 kann man statt T + die Teststatistik (*) T* : = + ( + ) ( + )( + ) T N N 1 / 4 N N 1 2N 1 / 24 verwenden, die asymptotisch N(0,1)-verteilt ist. Man vergleicht dann in 4. mit den Quantilen der N(0,1)-Verteilung. Diese Approximation gilt nur, falls in den Daten keine gleichen Werte auftreten (sonst ist eine Modifikation zu wählen (hier nicht behandelt). Beispiel: Die folgenden Daten seien Punktzahlen aus einer Klausur. Wir testen, ob sie (mit α=0.05) symmetrisch um ξ 0 = 61 sind: 72, 55,67, 53, 69, 71, 55, 68, 65, 72, 69 T + = 53. Da w11; w11; werden = = gilt, kann die Nullhypothese nicht abgelehnt

16 1. Wichtige Testverfahren - Die Rang-Tests b) Der Wilcoxon-Rangsummen-Test (Mann-Whitney-Test, U-Test, ) als Alternative zum 2-Stichproben-t-Test Wann verwendbar? Vergleich, ob zwei Stichproben X 1,, X n und Y 1,, Y m dieselbe Verteilung besitzen, wobei vorausgesetzt wird, dass mindestens ordinale Daten vorliegen (und die Verteilungsfunktionen F(x) = G(x +c) erfüllen) Vorgehen Verteile Ränge an die Gesamtstichprobe (hoher Rang = guter Wert), S 1,, S n seien die Ränge der ersten Stichprobe N = n + m, W S s = S Rangsumme der ersten Stichprobe i= 1 1 W W n( n 1) x,y S 2 i = + Mann-Whitney-Statistik

17 Was wird getestet? i) H 1 : c > 0 H 0 : c = 0 vs. ii) H 1 : c < 0 iii) H 1 : c 0 Um die Nullhypothese zu testen, kann man für kleine n, m auf tabellierte Werte wn,m; der Mann-Whitney-U-Statistik zurück greifen. Für n, m 4 und N 20 gilt die Normalapproximation ( ) (1) ( 1 ) nm nm n + m + Wx,y N,, 2 12 woraus folgt, dass (2) nm Wx,y 2 Z = N 0, 1 nm( n+ m+ 1) 12 ( ) gilt und man mit den Quantilen der Standardnormalverteilung vergleichen kann. α

18 Wilcoxon-Rangsummen-Test (X 1,, X n und Y 1,, Y m Stichproben (von mdst. ordinalen Daten) mit Verteilungsfunktionen F(x) = G(x +c) für ein c) 1. Hypothesenwahl: Wähle die zu testende Hypothese i) H 1 : c > 0 H 0 : c = 0 vs. ii) H 1 : c < 0 iii) H 1 : c 0 2. Wahl des Signifikanzniveaus: Lege α fest. 3. Berechnung der Teststatistik: Verteile Ränge an die Gesamtstichprobe, S 1,, S n seien die Ränge der ersten Stichprobe und berechne W S s 1 = S, W = W n( n + 1) i= 1 i x,y S 4. Entscheidung: (bei n+m < 20 oder n < 4 oder m < 4) W > w, im Falli) Lehne H 0 ab, falls sonst behalte H 0 bei. x,y 2 n,m; 1 α W < w, im Fallii) x,y n,m; α W > w oder W < w, im Falliii) x,y n,m; 1 α / 2 x,y n,m; α / 2,

19 Bem.: a) Ordnet man bei nicht eindeutigen Rängen einzelnen Beobachtungen den jeweils mittleren Rang zu, so bleiben die obigen Ergebnisse approximativ richtig. b) Selbst bei Vorliegen normal verteilter Daten ist der Wilcoxon-Rangsummen-Test fast genauso gut wie der 2-Stichproben-t-Test. Beispiel: Ist das Nettoeinkommen geschlechterabhängig? Daten der Allgemeinen Bevölkerungsumfrage der Sozialwissenschaften 2006 mit 20 zufälligen Personen (Quelle: wikipedia) Rang Nettoeinkommen Geschlecht M W M W M W M M W W M M W M W M M M M M 1 n = 13, m = 7, ( ) W = W n n + 1 = 43 > 20 = w x,y S 2 13, 7; 0, 95 => Man kann auf dem 5%-Niveau davon ausgehen, dass Männer ein höheres Nettoeinkommen haben.

20 2. Regressionsverfahren Hauptziel der Regression: Ermittele aus Datenpaaren (x i, y i ) eine funktionale Beziehung (1) y g ( x) Fehler = +, um y-werte aus gegebenen x-werten vorhersagen zu können. => Gesucht ist also die Funktion g(.) (=> Unterschied zu Interpolation!) Vorgehen: Wähle eine geeignete Funktionenfamilie aus, deren Mitglieder g θ, θ Θ durch einen (evtl. mehrdim.) Parameter parametrisiert sind Bestimme den Parameter ( ) 2 i θ i (2) h N ( θ ) : = y g ( x ) i= 1 * θ, so dass die Summe der Fehlerquadrate minimal für θ Θ wird ( Methode der kleinsten Quadrate ).

21 Wann ist dieses Problem explizit lösbar? Spezialfall Lineare Regression θ = b,...,b linear in g(.) ein, also gilt z.b. Gehen die Parameter ( 1 m ) (3) ( ) ( ) y b f x... b f x, i,...,n, i = 1 1 i + + m m i + ε i = 1 wobei die f i (.) bekannte ( gegebene ) Funktionen und die ε i Fehler sind mit 2 (4) u.i.v., E ( ) 0, Var ( ) ε ε = ε = ν, i i i so spricht man von linearer Regression. Beispiele: (5) y = b1 + b2 x + ε, i = 1,...,n, Regressionsgerade i i i m i i m i (6) y = b1 + b2 x + b x + ε, i = 1,...,n, Regressionspolynom d m d Trig. Regr.funkt. (7) 1 ( ) ( ) y = b + b cos ϕ x + c sin ψ x + ε, i = 1,...,n, i j j i j j i i j= 1 j= 1

22 Im Fall der Regressionsgerade gilt: (8) ( y y )( x x ) n * i= 1 i n i n * * 2 = 2 1 = n n 2 ( x ) i 1 i x = n b, b y b x d.h. die Steigung ergibt sich als Stichprobenkovarianz von x und y geteilt durch die Stichprobenvarianz von x, der y-achsenabschnitt ist so gewählt, dass der tatsächliche Mittelwert der y-werte gleich dem vorhergesagten Mittelwert entspricht. n, Bsp: Größe und Gewicht Daten von 10 Männern (Größe cm, Gewicht kg) (187,72), (170,60), (180,73), (184,74) (178,72), (180,70), (172,62), (176,70) (186,80), (177,67) => Regressionsgerade: (9) y = x

23 Allgemeiner Fall Nicht-lineare Regression a) Logit- und Probit-Modell zur Vorhersage von Wahrscheinlichkeiten Idee: Schätze z.b. Ausfallwahrscheinlichkeiten von Krediten aus Fundamentaldaten Problem: W-keiten sollen zwischen 0 und 1 liegen, also Regressionsgerade ungeeignet Ansatz: Wähle als Regressionsfunktion eine Wahrscheinlichkeitsverteilung, deren Parameter in Abhängigkeit von Inputdaten geschätzt werden sollen 1 = i = i = = Logit-Modell ( ( ( i) ( i) )) 1+ exp β 0 + β 1 x βmxm ( i) ( i) P Y = 1 x = P y = 1 = Φ β + β x β x Probit-Modell (10) P ( Y 1 x ) P ( y 1) (11) ( ) ( ) ( ) i i m m Beachte: Die zu schätzenden Parameter stehen innerhalb einer nicht-linearen Funktion! Man erhält die Parameter durch Anwendung eines nicht-linearen Optimierungsverfahrens (z.b. Newton-Raphson,.) b) Allgemeiner Fall findet z.b. Anwendung bei Parameterkalibrierung/Parameteridentifikation

24 Bem.: a) Wann gilt bei der Regression ein linearer Zusammenhang? Im Fall einer Regressionsgeraden geht man von linearem Zusammenhang aus, wenn (11) corr(y, X)² 0,8 gilt ( Faustregel ). Im allgemeinen multiplen Modell ( 1) ( p) (12) Y = b + b X b X + ε i 0 1 i p i i benötigt man den Begriff der multiplen Korrelation, für den dann ebenfalls ( ) ( ) (13) ( 1 ) 2 p 1 p ρ Y, X,..., X : = ρ Y,E Y X,..., X 0, 8 gelten muss. ( ) 2 ( ) ( ( ) ( ) ) b) Im Fall normal-verteilter Fehler sind die kleinsten Quadrate-Schätzer bei der linearen Regression auch Maximum-Likelihood-Schätzer. c) Oft transformiert man in Anwendungen die Y-Daten solange, bis sich ein nahezu linearer Zusammenhang zwischen den X- und den Y-Daten ergibt, den man dann durch eine Regressionsgerade schätzt und dann den ursprünglichen Zsh. zwischen X- und Y- Daten durch Rücktransformation erhält. Hier ist Vorsicht bei der Interpretation geboten!

25 3. Darstellung mehrdimensionaler Daten mit der Gesichterdarstellung Grundlegende Aspekte: Oftmals sind einzelne Objekte (Personen, Wirkstoffe, Kredite, ) nur aufgrund der Erhebung von mehreren Eigenschaften unterscheidbar Optisch sind in Diagrammen oder Punktwolken kaum mehr als zwei Merkmale so darstellbar, dass ein Vergleich leicht möglich ist Alternative: Gesichterdarstellung (siehe Flury/Riedwyl) Beispiel: Identifiziere Falschgeld aufgrund von Messungen x 1,, x 6

26 Beispiel: Identifiziere Falschgeld aufgrund von Messungen x 1,, x 6 Daten der echten Scheine =>

27 Beispiel: Identifiziere Falschgeld aufgrund von Messungen x 1,, x 6 Eindimensional: große Überschneidungen der Wertebereiche! => Wie trennt man die Datensätze???

28 Beispiel: Identifiziere Falschgeld aufgrund von Messungen x 1,, x 6 Idee: Verwende menschliche Gesichter zur Darstellung mehrerer Variablen auf einen Blick! Mögliche Variablen (18 Stück (teils Paare!)) 1 Größe Augen 2 Größe Pupillen 3 Stellung Pupillen 4 Schräge Augen 5/6 Waagr./Senkr. Versch. Augen 7/8 Krümmung/Dichte A.brauen 9/10 Waagr./Senkr. Versch. A.brauen 11/12 Obere/Untere Grenze Haare 13 Untere Grenze Gesicht 14/15 Helligkeit/Schräge Haare 16 Nase 17/18 Öffnung/Krümmung Mund

29 Beispiel: Identifiziere Falschgeld aufgrund von Messungen x 1,, x 6 Vergleich auf einen Blick!

30 4. Klassifikation mit Diskriminanzanalyse Hauptziel: Finde Kriterien, um zwei (oder mehrere) Populationen aufgrund von beobachteten Daten zu trennen ( Klassifikation ). Basis: Es sind bereits Gruppen vorhanden (z.b. durch ihre Verteilung oder aber durch Daten gegeben, bei denen man die Gruppenzugehörigkeit kennt). Ziel: Entscheide, zu welcher Population P i, i=1,,k eine Beobachtung x = (x 1, x p ) Idee: Bestimme für eine Beobachtung x die jeweilige Distanz zum Zentrum der verschiedenen Gruppen und ordne die Beobachtung dann der Gruppe zu, zu der x die kleinste Entfernung besitzt Wie macht man das?

31 Bsp. 1: Zwei Normalverteilungen Gruppe ( X,Y ) N, Gruppe ( X,Y ) N,

32 a) Klassifikation bei bekannter a-priori-verteilung und beliebiger Populationsverteilung Vor.: q i = bekannte a-priori W-keit der Population P i f i (x) = bekannte Dichten der Beobachtung x gegeben der Zugehörigkeit zu Pop.P i C(j i) = Kosten für eine Fehlklassifikation eines Individuums aus P i in P j Klassifikationsregel: Klassifiziere x in die Population P k falls für k gilt (1) qi fi ( x) C ( k i) = min qi fi ( x) C ( j i), j i k i j also wähle die Population, für die die gewichteten Kosten der Fehlklassifikation am geringsten sind. Sind insbesondere alle Fehlklassifikationskosten gleich, so wähle k gemäß (2) q f ( x) max q f ( x) =, k k i i j d.h. wähle die Population mit höchster a-posteriori W-keit.

33 b) Klassifikation bei bekannter a-priori-verteilung und bekannter Normalverteilung (und gleichen Fehlklassifikationskosten) Vor.: ( i) P i N µ, Σ, mit bekanntem Erwartungswertvektor und gleicher Kovarianzmatrix ( ) Klassifikationsregel: Klassifiziere x in die Population P k falls für alle j gilt q j (3) ukj ( x) ln, wobei q k ( ) ( ) (4) ( ) 1 ( k j ) 1 ( ( k ) ( j) ) 1 ( ( k ) ( j) u ) kj x : = x' Σ µ µ µ + µ ' Σ µ µ 2 bzw ( j) 1 j D x D x j k, wobei D x = x µ ' Σ x µ 2 ln q. (5) ( ) ( ) ( ) ( ) ( ( ) ) ( ) k j j j kj u heißt lineare Diskriminanzfunktion zwischen P k und P j. Die Regel heißt nach (5) auch Klassifiziere in die Population, zu deren Mittelwert der gewichtete quadratische Abstand minimal ist.

34 Bem.: u x = eine Im Fall gleicher a-priori W-keiten für die einzelnen Populationen ist ( ) 0 kj Hyperebene, so dass alle Beobachtungen oberhalb zu k klassifiziert werden. c) Klassifikation bei bekannter a-priori-verteilung und unbekannter Normalverteilung Verwende die Regel aus b), wobei in den Abstandsfunktionen die Mittelwerte und die Kovarianzmatrizen (bei ungleichen Kovarianzmatrizen in den Populationen) durch ihre empirischen Schätzer ersetzt werden.

35 5. Datenreduktion mit Hauptkomponenten- und Faktorenanalyse Idee: Oft muss man nicht einen kompletten Datensatz in seiner vollen Dimension behandeln, sondern es genügt, nur die wichtige Information zu betrachten => Datenreduktion ( Modellreduktion ) Vor.: Es liegen p-dim. Daten X = X,..., X vor, deren Komponenten nicht linear abhängig sind. ( 1 p ) Ziel: Suche Linearkombinationen (1) Uk = bk1 X bkp X p, so dass (2) p 2 bki = 1, i= 1 (3) Ul unkorreliert zu U 1,...,U l 1, l = 1,..., p, wobei die Varianz von U l maximal unter allen solchen Linearkombinationen sei. U i heißt dann i. Hauptkomponente von X 1,..., X p.

36 Bem.:a) Berechnung der Hauptkomponenten: Es sei S die (empirische) Kovarianzmatrix von X, S positiv definit mit Eigenwerten (4) λ1... λ p und zugehörigen normierten Eigenvektoren (wie in (2)) ( 1) ( p) (5) b,...,b. Dann gilt für die i. Hauptkomponente ( i) (6) U = b X i ( ) T (=> Algorithmus zur Berechnung der Hauptkomponenten) b) Die Interpretation der Hauptkomponenten ergibt sich aus den Koeffizienten der Hauptkomponententransformation B = (b (1),,b (p) ). c) Es gilt, dass die totale Varianz von X gleich der totalen Varianz von U ist, d.h. p p p (7) Var ( X ) = λ = Var ( U ) d) Datenreduktion. i i i i= 1 i= 1 i= 1 Falls die ersten j Hauptkomponenten fast die gesamte Varianz erklären, genügt es bei vielen Anwendungen nur diese Hauptkomponenten zu betrachten (=>Datenreduktion).

37 Beispiele (Daten Prof. Unwin (Augsburg))

38 Hauptkomponenten (unsere b heißen hier e ) Ist das Ergebnis wirklich überraschend? Interpretation? Varianzen der einzelnen Zeiten: Hier könnte man alle bis auf die erste Hauptkomponente weglassen.

39 Interpretation? Jetzt bräuchte man wohl mdsts. 3-4 Faktoren

40 Faktoren und Interpretation Die standardisierten Hauptkomponenten (8) 1 F j : = λ j U heißen Faktoren. Offenbar gilt 1, falls i = j (9) Cov( F i,fj ) = 0, falls i j Ziel: Bessere Interpretierbarkeit der Faktoren Varimax-Kriterium nach Kaiser: j Drehe die Faktormatrix F mit einer orthogonalen Abbildung A so, dass die rotierten Faktoren (10) F ɶ : = AF eine Kovarianzmatrix mit Einfachstruktur (nur Werte nahe 0 oder nahe ±1) besitzen. Oft in Statistik-Paketen implementiert, analytisch nur für p=2 gelöst.

41 6. Schluss Statistik ist wichtig zum Aufbereiten von Daten und zum wissenschaftlichen Beleg neuer (Alternativ-) Hypothesen. Sauberes statistisches Arbeiten ( Vorgehen nach Lehrbuch ) ist heutzutage wichtiger denn je. Nicht nur das Beherrschen von Standardverfahren ist nötig, es müssen auch die Grundprinzipien und Hauptideen (einseitig zweiseitig, nur ablehnen beweist, oft decken nur multiple Untersuchungen Effekte auf, ) verstanden werden Typischerweise sind echte Daten bei weitem nicht so einfach und aussagekräftig wie Lehrbuchbeispiele Statistik-Pakete (R, S, Splus, SAS, ) sind oft weit entwickelt und angenehm, aber im Detail ist ein genaues Nachlesen in der Dokumentation notwendig Und schließlich: Der gute Statistiker produziert nicht einfach viele Zahlen, er versteht sie auch und kann sie interpretieren

Statistik II für Betriebswirte Vorlesung 2

Statistik II für Betriebswirte Vorlesung 2 PD Dr. Frank Heyde TU Bergakademie Freiberg Institut für Stochastik Statistik II für Betriebswirte Vorlesung 2 21. Oktober 2014 Verbundene Stichproben Liegen zwei Stichproben vor, deren Werte einander

Mehr

Güte von Tests. die Wahrscheinlichkeit für den Fehler 2. Art bei der Testentscheidung, nämlich. falsch ist. Darauf haben wir bereits im Kapitel über

Güte von Tests. die Wahrscheinlichkeit für den Fehler 2. Art bei der Testentscheidung, nämlich. falsch ist. Darauf haben wir bereits im Kapitel über Güte von s Grundlegendes zum Konzept der Güte Ableitung der Gütefunktion des Gauss im Einstichprobenproblem Grafische Darstellung der Gütefunktionen des Gauss im Einstichprobenproblem Ableitung der Gütefunktion

Mehr

9. Schätzen und Testen bei unbekannter Varianz

9. Schätzen und Testen bei unbekannter Varianz 9. Schätzen und Testen bei unbekannter Varianz Dr. Antje Kiesel Institut für Angewandte Mathematik WS 2011/2012 Schätzen und Testen bei unbekannter Varianz Wenn wir die Standardabweichung σ nicht kennen,

Mehr

Motivation. Wilcoxon-Rangsummentest oder Mann-Whitney U-Test. Wilcoxon Rangsummen-Test Voraussetzungen. Bemerkungen

Motivation. Wilcoxon-Rangsummentest oder Mann-Whitney U-Test. Wilcoxon Rangsummen-Test Voraussetzungen. Bemerkungen Universität Karlsruhe (TH) Forschungsuniversität gegründet 825 Wilcoxon-Rangsummentest oder Mann-Whitney U-Test Motivation In Experimenten ist die Datenmenge oft klein Daten sind nicht normalverteilt Dann

Mehr

Profil A 49,3 48,2 50,7 50,9 49,8 48,7 49,6 50,1 Profil B 51,8 49,6 53,2 51,1 51,1 53,4 50,7 50 51,5 51,7 48,8

Profil A 49,3 48,2 50,7 50,9 49,8 48,7 49,6 50,1 Profil B 51,8 49,6 53,2 51,1 51,1 53,4 50,7 50 51,5 51,7 48,8 1. Aufgabe: Eine Reifenfirma hat für Winterreifen unterschiedliche Profile entwickelt. Bei jeweils gleicher Geschwindigkeit und auch sonst gleichen Bedingungen wurden die Bremswirkungen gemessen. Die gemessenen

Mehr

Melanie Kaspar, Prof. Dr. B. Grabowski 1

Melanie Kaspar, Prof. Dr. B. Grabowski 1 7. Hypothesentests Ausgangssituation: Man muss sich zwischen 2 Möglichkeiten (=Hypothesen) entscheiden. Diese Entscheidung soll mit Hilfe von Beobachtungen ( Stichprobe ) getroffen werden. Die Hypothesen

Mehr

Tutorial: Homogenitätstest

Tutorial: Homogenitätstest Tutorial: Homogenitätstest Eine Bank möchte die Kreditwürdigkeit potenzieller Kreditnehmer abschätzen. Einerseits lebt die Bank ja von der Vergabe von Krediten, andererseits verursachen Problemkredite

Mehr

Bachelorabschlussseminar Dipl.-Kfm. Daniel Cracau

Bachelorabschlussseminar Dipl.-Kfm. Daniel Cracau 1 Einführung in die statistische Datenanalyse Bachelorabschlussseminar Dipl.-Kfm. Daniel Cracau 2 Gliederung 1.Grundlagen 2.Nicht-parametrische Tests a. Mann-Whitney-Wilcoxon-U Test b. Wilcoxon-Signed-Rank

Mehr

Überblick über die Verfahren für Ordinaldaten

Überblick über die Verfahren für Ordinaldaten Verfahren zur Analyse ordinalskalierten Daten 1 Überblick über die Verfahren für Ordinaldaten Unterschiede bei unabhängigen Stichproben Test U Test nach Mann & Whitney H Test nach Kruskal & Wallis parametrische

Mehr

Statistik II für Betriebswirte Vorlesung 3

Statistik II für Betriebswirte Vorlesung 3 PD Dr. Frank Heyde TU Bergakademie Freiberg Institut für Stochastik Statistik II für Betriebswirte Vorlesung 3 5. November 2013 Beispiel: Aktiensplit (Aczel & Sounderpandan, Aufg. 14-28) Ein Börsenanalyst

Mehr

Willkommen zur Vorlesung Statistik

Willkommen zur Vorlesung Statistik Willkommen zur Vorlesung Statistik Thema dieser Vorlesung: Varianzanalyse Prof. Dr. Wolfgang Ludwig-Mayerhofer Universität Siegen Philosophische Fakultät, Seminar für Sozialwissenschaften Prof. Dr. Wolfgang

Mehr

Allgemeine Regressionsanalyse. Kovariablen / Prädiktoren / unabhängige Variablen X j R d, evtl. deterministisch

Allgemeine Regressionsanalyse. Kovariablen / Prädiktoren / unabhängige Variablen X j R d, evtl. deterministisch Prof. Dr. J. Franke Statistik II für Wirtschaftswissenschaftler 9.1 Allgemeine Regressionsanalyse Daten (X j, Y j ), j = 1,..., N unabhängig Kovariablen / Prädiktoren / unabhängige Variablen X j R d, evtl.

Mehr

Füllmenge. Füllmenge. Füllmenge. Füllmenge. Mean = 500,0029 Std. Dev. = 3,96016 N = 10.000. 485,00 490,00 495,00 500,00 505,00 510,00 515,00 Füllmenge

Füllmenge. Füllmenge. Füllmenge. Füllmenge. Mean = 500,0029 Std. Dev. = 3,96016 N = 10.000. 485,00 490,00 495,00 500,00 505,00 510,00 515,00 Füllmenge 2.4 Stetige Zufallsvariable Beispiel. Abfüllung von 500 Gramm Packungen einer bestimmten Ware auf einer automatischen Abfüllanlage. Die Zufallsvariable X beschreibe die Füllmenge einer zufällig ausgewählten

Mehr

Universität Bonn 28. Juli 2010 Fachbereich Rechts- und Wirtschaftswissenschaften Statistische Abteilung Prof. Dr. A. Kneip. KLAUSUR Statistik B

Universität Bonn 28. Juli 2010 Fachbereich Rechts- und Wirtschaftswissenschaften Statistische Abteilung Prof. Dr. A. Kneip. KLAUSUR Statistik B Universität Bonn 28. Juli 2010 Fachbereich Rechts- und Wirtschaftswissenschaften Statistische Abteilung Prof. Dr. A. Kneip Sommersemester 2010 KLAUSUR Statistik B Hinweise zur Bearbeitung: Bei allen Teilaufgaben

Mehr

Klausur zur Vorlesung Multivariate Verfahren, SS 2006 6 Kreditpunkte, 90 min

Klausur zur Vorlesung Multivariate Verfahren, SS 2006 6 Kreditpunkte, 90 min Klausur, Multivariate Verfahren, SS 2006, 6 Kreditpunkte, 90 min 1 Prof. Dr. Fred Böker 08.08.2006 Klausur zur Vorlesung Multivariate Verfahren, SS 2006 6 Kreditpunkte, 90 min Gesamtpunkte: 39 Aufgabe

Mehr

Einfache Varianzanalyse für abhängige

Einfache Varianzanalyse für abhängige Einfache Varianzanalyse für abhängige Stichproben Wie beim t-test gibt es auch bei der VA eine Alternative für abhängige Stichproben. Anmerkung: Was man unter abhängigen Stichproben versteht und wie diese

Mehr

Binäre abhängige Variablen

Binäre abhängige Variablen Binäre abhängige Variablen Thushyanthan Baskaran thushyanthan.baskaran@awi.uni-heidelberg.de Alfred Weber Institut Ruprecht Karls Universität Heidelberg Einführung Oft wollen wir qualitative Variablen

Mehr

90-minütige Klausur Statistik für Studierende der Kommunikationswissenschaft

90-minütige Klausur Statistik für Studierende der Kommunikationswissenschaft Prof. Dr. Helmut Küchenhoff SS08 90-minütige Klausur Statistik für Studierende der Kommunikationswissenschaft am 22.7.2008 Anmerkungen Überprüfen Sie bitte sofort, ob Ihre Angabe vollständig ist. Sie sollte

Mehr

Biostatistik, WS 2015/2016 Der zwei-stichproben-t-test

Biostatistik, WS 2015/2016 Der zwei-stichproben-t-test 1/29 Biostatistik, WS 2015/2016 Der zwei-stichproben-t-test (t-test für ungepaarte Stichproben) Matthias Birkner http://www.staff.uni-mainz.de/birkner/biostatistik1516/ 11.12.2015 2/29 Inhalt 1 t-test

Mehr

Abituraufgabe zur Stochastik, Hessen 2009, Grundkurs (TR)

Abituraufgabe zur Stochastik, Hessen 2009, Grundkurs (TR) Abituraufgabe zur Stochastik, Hessen 2009, Grundkurs (TR) Eine Firma stellt USB-Sticks her. Sie werden in der Fabrik ungeprüft in Packungen zu je 20 Stück verpackt und an Händler ausgeliefert. 1 Ein Händler

Mehr

METHODENLEHRE I WS 2013/14 THOMAS SCHÄFER

METHODENLEHRE I WS 2013/14 THOMAS SCHÄFER METHODENLEHRE I WS 2013/14 THOMAS SCHÄFER DAS THEMA: INFERENZSTATISTIK IV INFERENZSTATISTISCHE AUSSAGEN FÜR ZUSAMMENHÄNGE UND UNTERSCHIEDE Inferenzstatistik für Zusammenhänge Inferenzstatistik für Unterschiede

Mehr

Korrelation (II) Korrelation und Kausalität

Korrelation (II) Korrelation und Kausalität Korrelation (II) Korrelation und Kausalität Situation: Seien X, Y zwei metrisch skalierte Merkmale mit Ausprägungen (x 1, x 2,..., x n ) bzw. (y 1, y 2,..., y n ). D.h. für jede i = 1, 2,..., n bezeichnen

Mehr

Eine Einführung in R: Statistische Tests

Eine Einführung in R: Statistische Tests Eine Einführung in R: Statistische Tests Bernd Klaus, Verena Zuber Institut für Medizinische Informatik, Statistik und Epidemiologie (IMISE), Universität Leipzig http://www.uni-leipzig.de/ zuber/teaching/ws12/r-kurs/

Mehr

Die Optimalität von Randomisationstests

Die Optimalität von Randomisationstests Die Optimalität von Randomisationstests Diplomarbeit Elena Regourd Mathematisches Institut der Heinrich-Heine-Universität Düsseldorf Düsseldorf im Dezember 2001 Betreuung: Prof. Dr. A. Janssen Inhaltsverzeichnis

Mehr

Primzahlen und RSA-Verschlüsselung

Primzahlen und RSA-Verschlüsselung Primzahlen und RSA-Verschlüsselung Michael Fütterer und Jonathan Zachhuber 1 Einiges zu Primzahlen Ein paar Definitionen: Wir bezeichnen mit Z die Menge der positiven und negativen ganzen Zahlen, also

Mehr

Einige Statistische Tests für den Ein- Zwei- und k-stichprobenfall (Nach Sachs, Stat. Meth.)

Einige Statistische Tests für den Ein- Zwei- und k-stichprobenfall (Nach Sachs, Stat. Meth.) ue biostatistik: nichtparametrische testverfahren / ergänzung 1/6 h. Lettner / physik Statistische Testverfahren Einige Statistische Tests für den Ein- Zwei- und k-stichprobenfall (Nach Sachs, Stat. Meth.)

Mehr

13. Lineare DGL höherer Ordnung. Eine DGL heißt von n-ter Ordnung, wenn Ableitungen y, y, y,... bis zur n-ten Ableitung y (n) darin vorkommen.

13. Lineare DGL höherer Ordnung. Eine DGL heißt von n-ter Ordnung, wenn Ableitungen y, y, y,... bis zur n-ten Ableitung y (n) darin vorkommen. 13. Lineare DGL höherer Ordnung. Eine DGL heißt von n-ter Ordnung, wenn Ableitungen y, y, y,... bis zur n-ten Ableitung y (n) darin vorkommen. Sie heißt linear, wenn sie die Form y (n) + a n 1 y (n 1)

Mehr

Fortgeschrittene Statistik Logistische Regression

Fortgeschrittene Statistik Logistische Regression Fortgeschrittene Statistik Logistische Regression O D D S, O D D S - R A T I O, L O G I T T R A N S F O R M A T I O N, I N T E R P R E T A T I O N V O N K O E F F I Z I E N T E N, L O G I S T I S C H E

Mehr

Statistische Auswertung:

Statistische Auswertung: Statistische Auswertung: Die erhobenen Daten mittels der selbst erstellten Tests (Surfaufgaben) Statistics Punkte aus dem Punkte aus Surftheorietest Punkte aus dem dem und dem Surftheorietest max.14p.

Mehr

5 Zusammenhangsmaße, Korrelation und Regression

5 Zusammenhangsmaße, Korrelation und Regression 5 Zusammenhangsmaße, Korrelation und Regression 5.1 Zusammenhangsmaße und Korrelation Aufgabe 5.1 In einem Hauptstudiumsseminar des Lehrstuhls für Wirtschafts- und Sozialstatistik machten die Teilnehmer

Mehr

Gemischte Modelle. Fabian Scheipl, Sonja Greven. SoSe 2011. Institut für Statistik Ludwig-Maximilians-Universität München

Gemischte Modelle. Fabian Scheipl, Sonja Greven. SoSe 2011. Institut für Statistik Ludwig-Maximilians-Universität München Gemischte Modelle Fabian Scheipl, Sonja Greven Institut für Statistik Ludwig-Maximilians-Universität München SoSe 2011 Inhalt Amsterdam-Daten: LMM Amsterdam-Daten: GLMM Blutdruck-Daten Amsterdam-Daten:

Mehr

Plotten von Linien ( nach Jack Bresenham, 1962 )

Plotten von Linien ( nach Jack Bresenham, 1962 ) Plotten von Linien ( nach Jack Bresenham, 1962 ) Ac Eine auf dem Bildschirm darzustellende Linie sieht treppenförmig aus, weil der Computer Linien aus einzelnen (meist quadratischen) Bildpunkten, Pixels

Mehr

Statistische Thermodynamik I Lösungen zur Serie 1

Statistische Thermodynamik I Lösungen zur Serie 1 Statistische Thermodynamik I Lösungen zur Serie Zufallsvariablen, Wahrscheinlichkeitsverteilungen 4. März 2. Zwei Lektoren lesen ein Buch. Lektor A findet 2 Druckfehler, Lektor B nur 5. Von den gefundenen

Mehr

Grundlagen der Inferenzstatistik

Grundlagen der Inferenzstatistik Grundlagen der Inferenzstatistik (Induktive Statistik oder schließende Statistik) Dr. Winfried Zinn 1 Deskriptive Statistik versus Inferenzstatistik Die Deskriptive Statistik stellt Kenngrößen zur Verfügung,

Mehr

Name (in Druckbuchstaben): Matrikelnummer: Unterschrift:

Name (in Druckbuchstaben): Matrikelnummer: Unterschrift: 20-minütige Klausur zur Vorlesung Lineare Modelle im Sommersemester 20 PD Dr. Christian Heumann Ludwig-Maximilians-Universität München, Institut für Statistik 2. Oktober 20, 4:5 6:5 Uhr Überprüfen Sie

Mehr

50. Mathematik-Olympiade 2. Stufe (Regionalrunde) Klasse 11 13. 501322 Lösung 10 Punkte

50. Mathematik-Olympiade 2. Stufe (Regionalrunde) Klasse 11 13. 501322 Lösung 10 Punkte 50. Mathematik-Olympiade. Stufe (Regionalrunde) Klasse 3 Lösungen c 00 Aufgabenausschuss des Mathematik-Olympiaden e.v. www.mathematik-olympiaden.de. Alle Rechte vorbehalten. 503 Lösung 0 Punkte Es seien

Mehr

Abschlussprüfung Realschule Bayern II / III: 2009 Haupttermin B 1.0 B 1.1

Abschlussprüfung Realschule Bayern II / III: 2009 Haupttermin B 1.0 B 1.1 B 1.0 B 1.1 L: Wir wissen von, dass sie den Scheitel hat und durch den Punkt läuft. Was nichts bringt, ist beide Punkte in die allgemeine Parabelgleichung einzusetzen und das Gleichungssystem zu lösen,

Mehr

1. Man schreibe die folgenden Aussagen jeweils in einen normalen Satz um. Zum Beispiel kann man die Aussage:

1. Man schreibe die folgenden Aussagen jeweils in einen normalen Satz um. Zum Beispiel kann man die Aussage: Zählen und Zahlbereiche Übungsblatt 1 1. Man schreibe die folgenden Aussagen jeweils in einen normalen Satz um. Zum Beispiel kann man die Aussage: Für alle m, n N gilt m + n = n + m. in den Satz umschreiben:

Mehr

Austausch- bzw. Übergangsprozesse und Gleichgewichtsverteilungen

Austausch- bzw. Übergangsprozesse und Gleichgewichtsverteilungen Austausch- bzw. Übergangsrozesse und Gleichgewichtsverteilungen Wir betrachten ein System mit verschiedenen Zuständen, zwischen denen ein Austausch stattfinden kann. Etwa soziale Schichten in einer Gesellschaft:

Mehr

Varianzanalyse (ANOVA: analysis of variance)

Varianzanalyse (ANOVA: analysis of variance) Varianzanalyse (AOVA: analysis of variance) Einfaktorielle VA Auf der Basis von zwei Stichproben wird bezüglich der Gleichheit der Mittelwerte getestet. Variablen müssen Variablen nur nominalskaliert sein.

Mehr

Business Value Launch 2006

Business Value Launch 2006 Quantitative Methoden Inferenzstatistik alea iacta est 11.04.2008 Prof. Dr. Walter Hussy und David Tobinski UDE.EDUcation College im Rahmen des dokforums Universität Duisburg-Essen Inferenzstatistik Erläuterung

Mehr

Lineare Funktionen. 1 Proportionale Funktionen 3 1.1 Definition... 3 1.2 Eigenschaften... 3. 2 Steigungsdreieck 3

Lineare Funktionen. 1 Proportionale Funktionen 3 1.1 Definition... 3 1.2 Eigenschaften... 3. 2 Steigungsdreieck 3 Lineare Funktionen Inhaltsverzeichnis 1 Proportionale Funktionen 3 1.1 Definition............................... 3 1.2 Eigenschaften............................. 3 2 Steigungsdreieck 3 3 Lineare Funktionen

Mehr

Zusammenhänge zwischen metrischen Merkmalen

Zusammenhänge zwischen metrischen Merkmalen Zusammenhänge zwischen metrischen Merkmalen Darstellung des Zusammenhangs, Korrelation und Regression Daten liegen zu zwei metrischen Merkmalen vor: Datenpaare (x i, y i ), i = 1,..., n Beispiel: x: Anzahl

Mehr

Statistik II Wahrscheinlichkeitsrechnung und induktive Statistik Erste Klausur zum Sommersemester 2005 26. Juli 2005

Statistik II Wahrscheinlichkeitsrechnung und induktive Statistik Erste Klausur zum Sommersemester 2005 26. Juli 2005 Statistik II Wahrscheinlichkeitsrechnung und induktive Statistik Erste Klausur zum Sommersemester 2005 26. Juli 2005 Aufgabe 1: Grundzüge der Wahrscheinlichkeitsrechnung 19 P. Als Manager eines großen

Mehr

1.3 Die Beurteilung von Testleistungen

1.3 Die Beurteilung von Testleistungen 1.3 Die Beurteilung von Testleistungen Um das Testergebnis einer Vp zu interpretieren und daraus diagnostische Urteile ableiten zu können, benötigen wir einen Vergleichsmaßstab. Im Falle des klassischen

Mehr

Das große ElterngeldPlus 1x1. Alles über das ElterngeldPlus. Wer kann ElterngeldPlus beantragen? ElterngeldPlus verstehen ein paar einleitende Fakten

Das große ElterngeldPlus 1x1. Alles über das ElterngeldPlus. Wer kann ElterngeldPlus beantragen? ElterngeldPlus verstehen ein paar einleitende Fakten Das große x -4 Alles über das Wer kann beantragen? Generell kann jeder beantragen! Eltern (Mütter UND Väter), die schon während ihrer Elternzeit wieder in Teilzeit arbeiten möchten. Eltern, die während

Mehr

Lineargleichungssysteme: Additions-/ Subtraktionsverfahren

Lineargleichungssysteme: Additions-/ Subtraktionsverfahren Lineargleichungssysteme: Additions-/ Subtraktionsverfahren W. Kippels 22. Februar 2014 Inhaltsverzeichnis 1 Einleitung 2 2 Lineargleichungssysteme zweiten Grades 2 3 Lineargleichungssysteme höheren als

Mehr

Die Gleichung A x = a hat für A 0 die eindeutig bestimmte Lösung. Für A=0 und a 0 existiert keine Lösung.

Die Gleichung A x = a hat für A 0 die eindeutig bestimmte Lösung. Für A=0 und a 0 existiert keine Lösung. Lineare Gleichungen mit einer Unbekannten Die Grundform der linearen Gleichung mit einer Unbekannten x lautet A x = a Dabei sind A, a reelle Zahlen. Die Gleichung lösen heißt, alle reellen Zahlen anzugeben,

Mehr

Webergänzung zu Kapitel 10

Webergänzung zu Kapitel 10 Webergänzung zu Kapitel 10 10.1.4 Varianzanalyse (ANOVA: analysis of variance) Im Kapitel 10 haben wir uns hauptsächlich mit Forschungsbeispielen beschäftigt, die nur zwei Ergebnissätze hatten (entweder

Mehr

ε heteroskedastisch BINARY CHOICE MODELS Beispiele: Wahlentscheidung Kauf langlebiger Konsumgüter Arbeitslosigkeit Schätzung mit OLS?

ε heteroskedastisch BINARY CHOICE MODELS Beispiele: Wahlentscheidung Kauf langlebiger Konsumgüter Arbeitslosigkeit Schätzung mit OLS? BINARY CHOICE MODELS 1 mit Pr( Y = 1) = P Y = 0 mit Pr( Y = 0) = 1 P Beispiele: Wahlentscheidung Kauf langlebiger Konsumgüter Arbeitslosigkeit Schätzung mit OLS? Y i = X i β + ε i Probleme: Nonsense Predictions

Mehr

Zeichen bei Zahlen entschlüsseln

Zeichen bei Zahlen entschlüsseln Zeichen bei Zahlen entschlüsseln In diesem Kapitel... Verwendung des Zahlenstrahls Absolut richtige Bestimmung von absoluten Werten Operationen bei Zahlen mit Vorzeichen: Addieren, Subtrahieren, Multiplizieren

Mehr

i x k k=1 i u i x i v i 1 0,2 24 24 0,08 2 0,4 30 54 0,18 3 0,6 54 108 0,36 4 0,8 72 180 0,60 5 1,0 120 300 1,00 2,22 G = 1 + 1 n 2 n i=1

i x k k=1 i u i x i v i 1 0,2 24 24 0,08 2 0,4 30 54 0,18 3 0,6 54 108 0,36 4 0,8 72 180 0,60 5 1,0 120 300 1,00 2,22 G = 1 + 1 n 2 n i=1 1. Aufgabe: Der E-Commerce-Umsatz (in Millionen Euro) der fünf größten Online- Shopping-Clubs liegt wie folgt vor: Club Nr. Umsatz 1 120 2 72 3 54 4 30 5 24 a) Bestimmen Sie den Ginikoeffizienten. b) Zeichnen

Mehr

Lineare Gleichungssysteme

Lineare Gleichungssysteme Lineare Gleichungssysteme 1 Zwei Gleichungen mit zwei Unbekannten Es kommt häufig vor, dass man nicht mit einer Variablen alleine auskommt, um ein Problem zu lösen. Das folgende Beispiel soll dies verdeutlichen

Mehr

Der Provider möchte möglichst vermeiden, dass die Werbekampagne auf Grund des Testergebnisses irrtümlich unterlassen wird.

Der Provider möchte möglichst vermeiden, dass die Werbekampagne auf Grund des Testergebnisses irrtümlich unterlassen wird. Hypothesentest ================================================================== 1. Ein Internetprovider möchte im Fichtelgebirge eine Werbekampagne durchführen, da er vermutet, dass dort höchstens 40%

Mehr

Beurteilung der biometrischen Verhältnisse in einem Bestand. Dr. Richard Herrmann, Köln

Beurteilung der biometrischen Verhältnisse in einem Bestand. Dr. Richard Herrmann, Köln Beurteilung der biometrischen Verhältnisse in einem Bestand Dr. Richard Herrmann, Köln Beurteilung der biometrischen Verhältnisse in einem Bestand 1 Fragestellung Methoden.1 Vergleich der Anzahlen. Vergleich

Mehr

6. Bayes-Klassifikation. (Schukat-Talamazzini 2002)

6. Bayes-Klassifikation. (Schukat-Talamazzini 2002) 6. Bayes-Klassifikation (Schukat-Talamazzini 2002) (Böhm 2003) (Klawonn 2004) Der Satz von Bayes: Beweis: Klassifikation mittels des Satzes von Bayes (Klawonn 2004) Allgemeine Definition: Davon zu unterscheiden

Mehr

Ein möglicher Unterrichtsgang

Ein möglicher Unterrichtsgang Ein möglicher Unterrichtsgang. Wiederholung: Bernoulli Experiment und Binomialverteilung Da der sichere Umgang mit der Binomialverteilung, auch der Umgang mit dem GTR und den Diagrammen, eine notwendige

Mehr

Korrelation - Regression. Berghold, IMI

Korrelation - Regression. Berghold, IMI Korrelation - Regression Zusammenhang zwischen Variablen Bivariate Datenanalyse - Zusammenhang zwischen 2 stetigen Variablen Korrelation Einfaches lineares Regressionsmodell 1. Schritt: Erstellung eines

Mehr

Stochastische Eingangsprüfung, 17.05.2008

Stochastische Eingangsprüfung, 17.05.2008 Stochastische Eingangsprüfung, 17.5.8 Wir gehen stets von einem Wahrscheinlichkeitsraum (Ω, A, P) aus. Aufgabe 1 ( Punkte) Sei X : Ω [, ) eine integrierbare Zufallsvariable mit XdP = 1. Sei Q : A R, Q(A)

Mehr

Kontingenzkoeffizient (nach Pearson)

Kontingenzkoeffizient (nach Pearson) Assoziationsmaß für zwei nominale Merkmale misst die Unabhängigkeit zweier Merkmale gibt keine Richtung eines Zusammenhanges an 46 o jl beobachtete Häufigkeiten der Kombination von Merkmalsausprägungen

Mehr

Beispiel 48. 4.3.2 Zusammengesetzte Zufallsvariablen

Beispiel 48. 4.3.2 Zusammengesetzte Zufallsvariablen 4.3.2 Zusammengesetzte Zufallsvariablen Beispiel 48 Ein Würfel werde zweimal geworfen. X bzw. Y bezeichne die Augenzahl im ersten bzw. zweiten Wurf. Sei Z := X + Y die Summe der gewürfelten Augenzahlen.

Mehr

Rekursionen. Georg Anegg 25. November 2009. Methoden und Techniken an Beispielen erklärt

Rekursionen. Georg Anegg 25. November 2009. Methoden und Techniken an Beispielen erklärt Methoden und Techniken an Beispielen erklärt Georg Anegg 5. November 009 Beispiel. Die Folge {a n } sei wie folgt definiert (a, d, q R, q ): a 0 a, a n+ a n q + d (n 0) Man bestimme eine explizite Darstellung

Mehr

Willkommen zur Vorlesung Statistik (Master)

Willkommen zur Vorlesung Statistik (Master) Willkommen zur Vorlesung Statistik (Master) Thema dieser Vorlesung: Verteilungsfreie Verfahren Prof. Dr. Wolfgang Ludwig-Mayerhofer Universität Siegen Philosophische Fakultät, Seminar für Sozialwissenschaften

Mehr

Lineare Gleichungssysteme

Lineare Gleichungssysteme Brückenkurs Mathematik TU Dresden 2015 Lineare Gleichungssysteme Schwerpunkte: Modellbildung geometrische Interpretation Lösungsmethoden Prof. Dr. F. Schuricht TU Dresden, Fachbereich Mathematik auf der

Mehr

Gleichungen Lösen. Ein graphischer Blick auf Gleichungen

Gleichungen Lösen. Ein graphischer Blick auf Gleichungen Gleichungen Lösen Was bedeutet es, eine Gleichung zu lösen? Was ist überhaupt eine Gleichung? Eine Gleichung ist, grundsätzlich eine Aussage über zwei mathematische Terme, dass sie gleich sind. Ein Term

Mehr

A1.7: Entropie natürlicher Texte

A1.7: Entropie natürlicher Texte A1.7: Entropie natürlicher Texte Anfang der 1950er Jahre hat Claude E. Shannon die Entropie H der englischen Sprache mit einem bit pro Zeichen abgeschätzt. Kurz darauf kam Karl Küpfmüller bei einer empirischen

Mehr

Überblick über die Tests

Überblick über die Tests Anhang A Überblick über die Tests A.1 Ein-Stichproben-Tests A.1.1 Tests auf Verteilungsannahmen ˆ Shapiro-Wilk-Test Situation: Test auf Normalverteilung H 0 : X N(µ, σ 2 ) H 1 : X nicht normalverteilt

Mehr

Korrelation. Übungsbeispiel 1. Übungsbeispiel 4. Übungsbeispiel 2. Übungsbeispiel 3. Korrel.dtp Seite 1

Korrelation. Übungsbeispiel 1. Übungsbeispiel 4. Übungsbeispiel 2. Übungsbeispiel 3. Korrel.dtp Seite 1 Korrelation Die Korrelationsanalyse zeigt Zusammenhänge auf und macht Vorhersagen möglich Was ist Korrelation? Was sagt die Korrelationszahl aus? Wie geht man vor? Korrelation ist eine eindeutige Beziehung

Mehr

Vorkurs Mathematik Übungen zu Polynomgleichungen

Vorkurs Mathematik Übungen zu Polynomgleichungen Vorkurs Mathematik Übungen zu en 1 Aufgaben Lineare Gleichungen Aufgabe 1.1 Ein Freund von Ihnen möchte einen neuen Mobilfunkvertrag abschließen. Es gibt zwei verschiedene Angebote: Anbieter 1: monatl.

Mehr

Tangentengleichung. Wie lautet die Geradengleichung für die Tangente, y T =? Antwort:

Tangentengleichung. Wie lautet die Geradengleichung für die Tangente, y T =? Antwort: Tangentengleichung Wie Sie wissen, gibt die erste Ableitung einer Funktion deren Steigung an. Betrachtet man eine fest vorgegebene Stelle, gibt f ( ) also die Steigung der Kurve und somit auch die Steigung

Mehr

Dieses erste Kreisdiagramm, bezieht sich auf das gesamte Testergebnis der kompletten 182 getesteten Personen. Ergebnis

Dieses erste Kreisdiagramm, bezieht sich auf das gesamte Testergebnis der kompletten 182 getesteten Personen. Ergebnis Datenanalyse Auswertung Der Kern unseres Projektes liegt ganz klar bei der Fragestellung, ob es möglich ist, Biere von und geschmacklich auseinander halten zu können. Anhand der folgenden Grafiken, sollte

Mehr

Klausur zu Methoden der Statistik I (mit Kurzlösung) Wintersemester 2007/2008. Aufgabe 1

Klausur zu Methoden der Statistik I (mit Kurzlösung) Wintersemester 2007/2008. Aufgabe 1 Lehrstuhl für Statistik und Ökonometrie der Otto-Friedrich-Universität Bamberg Prof. Dr. Susanne Rässler Klausur zu Methoden der Statistik I (mit Kurzlösung) Wintersemester 2007/2008 Aufgabe 1 Ihnen liegt

Mehr

DIFFERENTIALGLEICHUNGEN

DIFFERENTIALGLEICHUNGEN DIFFERENTIALGLEICHUNGEN GRUNDBEGRIFFE Differentialgleichung Eine Gleichung, in der Ableitungen einer unbekannten Funktion y = y(x) bis zur n-ten Ordnung auftreten, heisst gewöhnliche Differentialgleichung

Mehr

W-Rechnung und Statistik für Ingenieure Übung 11

W-Rechnung und Statistik für Ingenieure Übung 11 W-Rechnung und Statistik für Ingenieure Übung 11 Christoph Kustosz (kustosz@statistik.tu-dortmund.de) Mathematikgebäude Raum 715 Christoph Kustosz (kustosz@statistik.tu-dortmund.de) W-Rechnung und Statistik

Mehr

Würfelt man dabei je genau 10 - mal eine 1, 2, 3, 4, 5 und 6, so beträgt die Anzahl. der verschiedenen Reihenfolgen, in denen man dies tun kann, 60!.

Würfelt man dabei je genau 10 - mal eine 1, 2, 3, 4, 5 und 6, so beträgt die Anzahl. der verschiedenen Reihenfolgen, in denen man dies tun kann, 60!. 040304 Übung 9a Analysis, Abschnitt 4, Folie 8 Die Wahrscheinlichkeit, dass bei n - maliger Durchführung eines Zufallexperiments ein Ereignis A ( mit Wahrscheinlichkeit p p ( A ) ) für eine beliebige Anzahl

Mehr

Info zum Zusammenhang von Auflösung und Genauigkeit

Info zum Zusammenhang von Auflösung und Genauigkeit Da es oft Nachfragen und Verständnisprobleme mit den oben genannten Begriffen gibt, möchten wir hier versuchen etwas Licht ins Dunkel zu bringen. Nehmen wir mal an, Sie haben ein Stück Wasserrohr mit der

Mehr

Professionelle Seminare im Bereich MS-Office

Professionelle Seminare im Bereich MS-Office Der Name BEREICH.VERSCHIEBEN() ist etwas unglücklich gewählt. Man kann mit der Funktion Bereiche zwar verschieben, man kann Bereiche aber auch verkleinern oder vergrößern. Besser wäre es, die Funktion

Mehr

Stichprobenauslegung. für stetige und binäre Datentypen

Stichprobenauslegung. für stetige und binäre Datentypen Stichprobenauslegung für stetige und binäre Datentypen Roadmap zu Stichproben Hypothese über das interessierende Merkmal aufstellen Stichprobe entnehmen Beobachtete Messwerte abbilden Schluss von der Beobachtung

Mehr

6.2 Scan-Konvertierung (Scan Conversion)

6.2 Scan-Konvertierung (Scan Conversion) 6.2 Scan-Konvertierung (Scan Conversion) Scan-Konvertierung ist die Rasterung von einfachen Objekten (Geraden, Kreisen, Kurven). Als Ausgabemedium dient meist der Bildschirm, der aus einem Pixelraster

Mehr

4. Erstellen von Klassen

4. Erstellen von Klassen Statistik mit Tabellenkalkulation 4. Erstellen von Klassen Mit einem einfachen Befehl lässt sich eine Liste von Zahlen auf die Häufigkeit der einzelnen Werte untersuchen. Verwenden Sie dazu den Befehl

Mehr

3. LINEARE GLEICHUNGSSYSTEME

3. LINEARE GLEICHUNGSSYSTEME 176 3. LINEARE GLEICHUNGSSYSTEME 90 Vitamin-C-Gehalt verschiedener Säfte 18,0 mg 35,0 mg 12,5 mg 1. a) 100 ml + 50 ml + 50 ml = 41,75 mg 100 ml 100 ml 100 ml b) : Menge an Kirschsaft in ml y: Menge an

Mehr

Name: Klasse: Datum: Klassenarbeit Wachstumsvorgänge Kl10-Gruppe B

Name: Klasse: Datum: Klassenarbeit Wachstumsvorgänge Kl10-Gruppe B Name: Klasse: Datum: Teil B Klassenarbeit Wachstumsvorgänge Kl0-Gruppe B. Gegeben ist die Exponentialfunktion y=f x =0.8 2 x ; x R. (9P) a) Geben Sie die folgenden Eigenschaften dieser Funktion an! Wertebereich,

Mehr

Quantitative Methoden der Bildungsforschung

Quantitative Methoden der Bildungsforschung Glieung Wieholung Korrelationen Grundlagen lineare Regression Lineare Regression in SPSS Übung Wieholung Korrelationen Standardisiertes Zusammenhangsmaß (unstandardisiert: Kovarianz) linearer Zusammenhang

Mehr

Gibt es einen Geschmacksunterschied zwischen Coca Cola und Cola Zero?

Gibt es einen Geschmacksunterschied zwischen Coca Cola und Cola Zero? Gibt es einen Geschmacksunterschied zwischen Coca Cola und Cola Zero? Manche sagen: Ja, manche sagen: Nein Wie soll man das objektiv feststellen? Kann man Geschmack objektiv messen? - Geschmack ist subjektiv

Mehr

Monte-Carlo-Simulationen mit Copulas. Kevin Schellkes und Christian Hendricks 29.08.2011

Monte-Carlo-Simulationen mit Copulas. Kevin Schellkes und Christian Hendricks 29.08.2011 Kevin Schellkes und Christian Hendricks 29.08.2011 Inhalt Der herkömmliche Ansatz zur Simulation logarithmischer Renditen Ansatz zur Simulation mit Copulas Test und Vergleich der beiden Verfahren Fazit

Mehr

Interne und externe Modellvalidität

Interne und externe Modellvalidität Interne und externe Modellvalidität Interne Modellvalidität ist gegeben, o wenn statistische Inferenz bzgl. der untersuchten Grundgesamtheit zulässig ist o KQ-Schätzer der Modellparameter u. Varianzschätzer

Mehr

Die Pareto Verteilung wird benutzt, um Einkommensverteilungen zu modellieren. Die Verteilungsfunktion ist

Die Pareto Verteilung wird benutzt, um Einkommensverteilungen zu modellieren. Die Verteilungsfunktion ist Frage Die Pareto Verteilung wird benutzt, um Einkommensverteilungen zu modellieren. Die Verteilungsfunktion ist k a F (x) =1 k>0,x k x Finden Sie den Erwartungswert und den Median der Dichte für a>1. (Bei

Mehr

Name: Klasse: Datum: Klassenarbeit Wachstumsvorgänge Kl10-Gruppe A

Name: Klasse: Datum: Klassenarbeit Wachstumsvorgänge Kl10-Gruppe A Name: Klasse: Datum: Teil B Klassenarbeit Wachstumsvorgänge Kl10-Gruppe A 1. Gegeben ist die Exponentialfunktion y=f x = 0,5 x ; x R. (9P) a) Geben Sie die folgenden Eigenschaften dieser Funktion an! Wertebereich,

Mehr

Das Mathematik-Abitur im Saarland

Das Mathematik-Abitur im Saarland Informationen zum Abitur Das Mathematik-Abitur im Saarland Sie können Mathematik im Abitur entweder als grundlegenden Kurs (G-Kurs) oder als erhöhten Kurs (E-Kurs) wählen. Die Bearbeitungszeit für die

Mehr

Übungskomplex Felder (1) Eindimensionale Felder Mehrdimensionale Felder

Übungskomplex Felder (1) Eindimensionale Felder Mehrdimensionale Felder Übungskomplex Felder (1) Eindimensionale Felder Mehrdimensionale Felder Hinweise zur Übung Benötigter Vorlesungsstoff Ab diesem Übungskomplex wird die Kenntnis und praktische Beherrschung der Konzepte

Mehr

Franz Kronthaler. Statistik angewandt. Datenanalyse ist (k)eine Kunst. Excel Edition. ^ Springer Spektrum

Franz Kronthaler. Statistik angewandt. Datenanalyse ist (k)eine Kunst. Excel Edition. ^ Springer Spektrum Franz Kronthaler Statistik angewandt Datenanalyse ist (k)eine Kunst Excel Edition ^ Springer Spektrum Inhaltsverzeichnis Teil I Basiswissen und Werkzeuge, um Statistik anzuwenden 1 Statistik ist Spaß 3

Mehr

Mathematischer Vorbereitungskurs für Ökonomen

Mathematischer Vorbereitungskurs für Ökonomen Mathematischer Vorbereitungskurs für Ökonomen Dr. Thomas Zehrt Wirtschaftswissenschaftliches Zentrum Universität Basel Gleichungen Inhalt: 1. Grundlegendes 2. Lineare Gleichungen 3. Gleichungen mit Brüchen

Mehr

Physik & Musik. Stimmgabeln. 1 Auftrag

Physik & Musik. Stimmgabeln. 1 Auftrag Physik & Musik 5 Stimmgabeln 1 Auftrag Physik & Musik Stimmgabeln Seite 1 Stimmgabeln Bearbeitungszeit: 30 Minuten Sozialform: Einzel- oder Partnerarbeit Voraussetzung: Posten 1: "Wie funktioniert ein

Mehr

Prüfung eines Datenbestandes

Prüfung eines Datenbestandes Prüfung eines Datenbestandes auf Abweichungen einzelner Zahlen vom erwarteten mathematisch-statistischen Verhalten, die nicht mit einem Zufall erklärbar sind (Prüfung auf Manipulationen des Datenbestandes)

Mehr

Behörde für Bildung und Sport Abitur 2008 Lehrermaterialien zum Leistungskurs Mathematik

Behörde für Bildung und Sport Abitur 2008 Lehrermaterialien zum Leistungskurs Mathematik Abitur 8 II. Insektenpopulation LA/AG In den Tropen legen die Weibchen einer in Deutschland unbekannten Insektenpopulation jedes Jahr kurz vor Beginn der Regenzeit jeweils 9 Eier und sterben bald darauf.

Mehr

Klausur Nr. 1. Wahrscheinlichkeitsrechnung. Keine Hilfsmittel gestattet, bitte alle Lösungen auf dieses Blatt.

Klausur Nr. 1. Wahrscheinlichkeitsrechnung. Keine Hilfsmittel gestattet, bitte alle Lösungen auf dieses Blatt. Klausur Nr. 1 2014-02-06 Wahrscheinlichkeitsrechnung Pflichtteil Keine Hilfsmittel gestattet, bitte alle Lösungen auf dieses Blatt. Name: 0. Für Pflicht- und Wahlteil gilt: saubere und übersichtliche Darstellung,

Mehr