Vorschau. Statistische Methodenlehre

Größe: px
Ab Seite anzeigen:

Download "Vorschau. Statistische Methodenlehre"

Transkript

1 Vorschau Statistische Methodenlehre

2 KE Merkmale Seite: Merkmale Bei einer statistischen Analyse werden, wie oben gesagt wurde, statistische Einheiten erfasst. Man interessiert sich jedoch meistens nicht für die Einheit schlechthin (Ausnahme: wenn man die Anzahl von Einheiten, die zu einer Masse gehören, ermitteln will), sondern für irgendwelche Eigenschaften der Einheiten. Weiter oben wurde z.b. darauf hingewiesen, dass bei einer Volkszählung Angaben über Alter, Geschlecht, Religionszugehörigkeit, Beruf, Einkommen usw. der erfassten Personen erfragt wird. Eine Eigenschaft einer statistischen Einheit, für die man sich bei einer statistischen Untersuchung interessiert, heißt Merkmal. Merkmal Für allgemeine Aussagen werden die Merkmale mit großen lateinischen Buchstaben bezeichnet: X, Y, Z, A, B,.... Da die Merkmale an den statistischen Einheiten erhoben werden, werden letztere auch als Merkmalsträger bezeichnet. Merkmalsträger Beispiel 9: a) statistische Einheit: Student Merkmale: Alter, Schulabschluss, Studienfach, Statistiknote b) statistische Einheit: landwirtschaftlicher Betrieb Merkmale: Ackernutzfläche, Rinderbestand, Milchproduktion in einem Monat Welche Merkmale bei den statistischen Einheiten erfasst werden, hängt von der jeweiligen Aufgabenstellung ab. Wegen des mitunter erheblichen Erhebungsaufwands ist es bei statistischen Untersuchungen manchmal empfehlenswert, möglichst viele Merkmale zu erfassen, auch wenn zunächst noch nicht sicher ist, ob alle erfassten Merkmale für die Analyse wirklich benötigt werden. Beispiel 10: Soll das Sparverhalten der Bundesbürger untersucht werden, so ist von vornherein nicht mit Sicherheit zu sagen, ob z.b. das Zinsniveau das Sparverhalten wesentlich beeinflusst. Man wird also das Merkmal Zinsniveau zunächst miterfassen und erst im Verlauf der statistischen Untersuchung entscheiden, ob es für die weitere Analyse berücksichtigt werden muss oder nicht.

3 KE Zentralwert oder Median Seite: 35 In vielen Analysen reicht es aus, eine empirische Verteilung mittels mehrerer Charakteristika in Form des sogenannten Bo-Plots grafisch darzustellen. In der einfachsten Variante werden die fünf Kennzahlen 0,25, 0,5, 0,75, min und ma herangezogen. Bei einem einfachen Bo-Plot werden die Quartile 0,25 und 0,75 durch eine Bo dargestellt, in deren Inneren der Median als Punkt oder als Linie dargestellt ist. Die Etremwerte min und ma werden mit der Bo durch Striche ( whisker ) verbunden. Bo-Plot Folgende Grafik zeigt eine Variante des einfachen Bo-Plots, bei der nicht die Etremwerte mit der Bo verbunden sind sondern der größte und der kleinste normale Wert, der noch nicht als Ausreißer angesehen wird. Ausreißer werden hierbei mittels eines Kreises dargestellt. Als Ausreißer gelten Werte, die weiter als 1,5 Bolängen unterhalb bzw. oberhalb der Bo liegen. Zugrundegelegt wurden die Arbeitslosenzahlen aus 33 Agenturen für Arbeit in NRW im Februar Abbildung 11: Arbeitslosenzahlen nach Altersklassen sortiert, Bo-Plot erstellt mit SPSS 15.0

4 Seite: 14 1 HÄUFIGKEITSVERTEILUNGEN ZWEIER MERKMALE KE 3 In den Wirtschaftswissenschaften und den anderen Anwendungsgebieten der Statistik (z.b. der Medizin oder Biologie) lassen sich Zusammenhänge nicht immer eindeutig durch eine Funktion beschreiben. Das wollen wir uns an dem folgenden Beispiel klarmachen. Beispiel 4: Bei 40 Personen wurden die Körpergrößen (in cm) und Körpergewicht y(in kg) gemessen. Für jede Person erhält man dann ein Paar von Messergebnissen ( i, y i ). i gibt die Körpergröße und y i das Körpergewicht der Person Nummer i an. Die Messergebnisse sind in der folgenden Tabelle enthalten. Größe Gewicht i in cm y i in kg i y i i y i i y i Diese Wertepaare kann man in einem (, y)-koordinatensystem grafisch als Punkte darstellen, so wie im folgenden Bild. 3abb1.nb 1 Gewicht in kg y Größe in cm Abbildung 1: Grafische Darstellung

5 KE Das gemeinsame Auftreten von Merkmalen Seite: 15 Abbildung 1 macht deutlich, dass zwischen Körpergröße und Körpergewicht der untersuchten Personen kein eindeutiger Zusammenhang besteht. Man kann die beiden Merkmale nicht über eine einfache Funktion zueinander in Beziehung setzen. Andererseits ist aus der Zeichnung zu erkennen, dass größere Leute im Schnitt auch schwerer sind. Körpergröße und Körpergewicht hängen offensichtlich voneinander ab, wobei diese Beziehung aber nur tendenziell gilt. Bei großen Personen wird man im Durchschnitt ein höheres Gewicht registrieren als bei kleineren. Im Einzelfall muss diese Aussage nicht zutreffen, wie ein Vergleich der beiden in Abbildung 1 besonders kenntlich gemachten Punkte zeigt. Im einen Punkt hat man eine Person, die 180 cm groß und 65 kg schwer ist und im anderen Fall eine, die nur 160 cm groß, aber 75 kg schwer. Das Beispiel zeigt deutlich das wichtigste Problem bei der Betrachtung des gemeinsamen Auftretens mehrerer Merkmale. Zwischen den Ausprägungen der Merkmale besteht ein tendenzieller Zusammenhang. Dieser lässt sich aber für die Beobachtungswerte nicht auf eine eindeutige Form bringen. Deshalb untersucht man vor allem zwei Fragen: Wie ausgeprägt ist ein Zusammenhang? Tritt er sehr deutlich hervor, ist er nur schwach oder ist gar kein Zusammenhang vorhanden? Von welchem Typ ist ein Zusammenhang oder die durchschnittliche Tendenz eines Zusammenhangs? Ist er linear oder quadratisch oder von einer anderen Form?

6 KE Grafische Darstellung zweidimensionaler Verteilungen Seite: Grafische Darstellung zweidimensionaler Verteilungen Ein wichtiger Gesichtspunkt, der bei der grafischen Darstellung zweidimensionaler Verteilungen zu beachten ist, ist die Übersichtlichkeit. Inwieweit die Übersichtlichkeit gewährleistet werden kann, hängt nicht nur von der Darstellungsform sondern auch von der Struktur des Datensatzes ab. Desweiteren wird die Wahl der Darstellungsform von der zugrundeliegenden Zielsetzung bestimmt. Im folgenden sind für das Beispiel 6 und die Aufgabe 2 zwei verschiedene Darstellungsformen gewählt. Eine dreidimensionale Grafik und ein zweidimensionales Säulendiagramm, bei dem die Säulen nach dem zweiten Merkmal unterteilt sind. 3abb3neu.nb 1 Anlageart I A V abb3neu.nb 1 F I A V M Geschlecht Anlageart Geschlecht I A V M F Mathematiknote Englischnote Mathematiknote Englischnote Abbildung 3: Häufigkeitsverteilungen der Daten aus Beispiel 6 und Aufgabe 2.

7 KE Lineare Kleinste-Quadrate-Regression Seite: Lineare Kleinste-Quadrate-Regression Aufgabe der Regressionsrechnung ist es, die Tendenz des Zusammenhangs zwischen quantitativen Merkmalen durch eine einzige Funktionsgleichung ŷ = f() zu beschreiben. Da y in Abhängigkeit von beschrieben wird, spricht man auch von y--regressionsfunktion. Das ŷ wird bei Regressionsfunktionen aus folgendem Grund verwendet: Regressionsfunktionen beschreiben im allgemeinen nicht einen eindeutigen Zusammenhang, sondern nur die durchschnittliche Tendenz eines statistischen Zusammenhangs zwischen Merkmalen. Die einzelnen Paare von Beobachtungswerten ( j, y j ) werden im allgemeinen nicht auf der Regressionsfunktion liegen, sondern um die Funktion herum streuen. Es wird also nicht ein Zusammenhang zwischen den Ausprägungen des Merkmals X und den genauen Werten des Merkmals beschrieben, sondern ein Zusammenhang zwischen den Ausprägungen des Merkmals X und den zugehörigen durchschnittlichen Werten des Merkmals Y. Zu einem gegebenen -Wert lässt sich über die Regressionsfunktion nicht eindeutig ein y-wert bestimmen, sondern nur der Durchschnittswert y des Merkmals Y zu diesem -Wert. Bei der Bestimmung einer Regressionsfunktion geht man folgendermaßen vor: Der Typ der Regressionsfunktion wird vorgegeben. Man legt fest, ob der Zusammenhang zwischen den quantitativen Merkmalen durch eine Gerade: ŷ = a + b Parabel: ŷ = a + b + c 2 Potenzfunktion: ŷ = a b Eponentialfunktion: ŷ = ab oder einen anderen Funktionstyp beschrieben werden soll. Mit der Vorgabe eines Funktionstyps ist das Problem der Bestimmung einer Regressionsfunktion aber noch nicht gelöst. Aus den unendlich vielen Geraden (oder Parabeln oder Eponentialfunktionen oder Funktionen eines anderen Typs) ist diejenige herauszusuchen, die den Zusammenhang möglichst gut beschreibt.

8 Seite: 46 4 REGRESSIONSRECHNUNG KE 3 Kriterium der Kleinsten Quadrate Die Koeffizienten der Regressionsfunktion werden so bestimmt, dass die Summe der quadrierten Abweichungen der Beobachtungswerte y, von den Regressionsfunktionswerten f( i ) ein Minimum wird (Kriterium der Kleinsten- Quadrate). Für den Fall einer linearen y--regressionsfunktion besagt das Kriterium der Kleinsten-Quadrate, dass die Koeffizienten a und b der linearen y-- Regressionsfunktion ŷ = a + b so zu bestimmen sind, dass die Summe der Quadrate der Abweichungen u i = y i ŷ i der y-koordinaten y i der beobachteten Wertepaare ( i ; y i ) von den durch die Regressionsfunktion bestimmten Koordinaten ŷ i = a + b i, ein Minimum wird. Wenn insgesamt n Wertepaare vorliegen, bestimmt man also a und b so, dass die Funktion n n f(a, b) = (y i ŷ i ) 2 = (y i a b i ) 2 i=1 i=1 3abb6.nb 1 ein Minimum wird. Abbildung 6 verdeutlicht den Zusammenhang. y H i,ỳ i =a+b i ) ù i =y i -ỳ i a H i,y i L Abbildung 6: Streuungsdiagramm mit Regressionsgerade

9 KE Korrelationskoeffizient eines linearen Zusammenhangs Seite: Korrelationskoeffizient eines linearen Zusammenhangs Wir haben in Abschnitt 1.6 die Kovarianz als Parameter für die gemeinsame Streuung zweier Merkmale eingeführt. Dividiert man die Kovarianz Cov(XY ) durch das Produkt der Standardabweichungen ( s bzw. s y ) der Randverteilungen der beiden Merkmale, so erhält man den Korrelationskoeffizienten, der nach dem englischen Statistiker Pearson benannt wurde. Der Pearsonsche Korrelationskoeffizient r = Cov(X, Y ) n i=1 = ( i )(y i y) s s n y i=1 ( i ) 2 n i=1 (y i y) 2 n i=1 = iy i n y ( n i=1 2 i n2 )( n i=1 y2 i ny2 ) ist ein Maß für den Grad des linearen Zusammenhangs zweier quantitativer Merkmale. Pearsonscher Korrelationskoeffizient Beispiel 20: Für die Häufigkeitsverteilung in Beispiel 10, wurde als Kovarianz COV(X, Y ) = 0, 08 errechnet. Bei Vorliegen einer zweidimensionalen Häufigkeitsverteilung erfolgt die Berechnung der einzelnen Standardabweichungen für X und Y über die entsprechende Randverteilung. s = 1 50 ( ) = 2, 4 = 1, 55 und s y = 1 50 ( ) = 0, 8 = 0, 89. Für den Pearsonschen Korrelationskoeffizienten ergibt sich damit r = 0, 08 1, 55 0, 89 = 0,

10 Seite: 62 5 KORRELATIONSRECHNUNG KE 3 Der Pearsonsche Korrelationskoeffizient kann Werte im Bereich von 1 bis +1 annehmen, d.h. es gilt: 1 r 1. Liegt überhaupt kein linearer Zusammenhang vor, so gilt r = 0. Liegen alle Beobachtungswerte auf einer steigenden Geraden, so gilt r = 1. Liegen alle Wertepaare auf einer fallenden Geraden, so gilt: r = 1. Je enger sich die Beobachtungswerte um eine Gerade scharen, desto näher kommt der Wert des Korrelationkoeffizienten +1 oder -1. Abbildung 12 verdeutlicht das. 3abb12.nb 1 y r = 1 y r = -1 y r ª 1 y r ª 0 y r ª -1 Abbildung 12: Streuungsdiagramm mit unterschiedlichen Korrelationskoeffizienten

11 Seite: 34 3 DIE WAHRSCHEINLICHKEIT KE Statistische Definition der Wahrscheinlichkeit Die in diesem Abschnitt behandelte statistische Definition der Wahrscheinlichkeit beruht auf einem Zusammenhang zwischen relativen Häufigkeiten und Wahrscheinlichkeiten. Wir betrachten ein Zufallseperiment, das wir unter völlig gleichen Bedingungen beliebig oft durchführen können. Wir führen dieses Zufallseperiment nacheinander n-mal durch und registrieren nach jeder Durchführung die relative Häufigkeit für das Auftreten des Ereignisses A. Wenn wir diese relativen Häufigkeiten näher betrachten, werden wir folgendes feststellen: Bei den ersten Versuchen schwanken die berechneten relativen Häufigkeiten für das Auftreten des Ereignisses A sehr stark. Je größer die Anzahl der Versuche des Zufallseperimentes ist, desto enger schwanken die relativen Häufigkeiten um einen festen Wert. Dazu betrachten wir folgendes Beispiel. Beispiel 20: Ein Würfel wurde 200-mal hintereinander geworfen Nach jedem Durchgang wurde die relative Häufigkeit für das Ereignis A= Auftreten der Augenzahl 6 registriert. Für jeden Durchgang ist die Anzahl n der Würfe (-Achse) und die zugehörige relative Häufigkeit f n (A) (y-achse) in Bild 3 grafisch dargestellt. Dieser Vorgang wurde 9 mal wiederholt. Frequenz.nb Abbildung 3: Relative Häufigkeit für das Auftreten von Augenzahl 6 in Abhängigkeit der Anzahl der Würfelwürfe

12 KE Statistische Definition der Wahrscheinlichkeit Seite: 35 In Beispiel 20 schwanken die relativen Häufigkeiten immer weniger um den Wert 1. Je häufiger man das Zufallseperiment durchführt, desto 6 besser stabilisieren sich die relativen Häufigkeiten. Offensichtlich streben die relativen Häufigkeiten einem Grenzwert zu. Dieser Grenzwert ist die Wahrscheinlichkeit für das Ereignis A. Diese Eigenschaft der relativen Häufigkeit führt uns zu der statistischen Definition der Wahrscheinlichkeit. Nach der statistischen Definition ist die Wahrscheinlichkeit für das Auftreten des Ereignisses A gleich dem Grenzwert der relativen Häufigkeiten, den man erhält, wenn man das Zufallseperiment unendlich oft durchführt: P (A) = lim n f n (A). statistische Definition der Wahrscheinlichkeit Da es uns in der Wirklichkeit nicht möglich ist, ein Zufallseperiment unendlich oft durchzuführen, ist es natürlich ebenso unmöglich, auf die angegebene Art eine Wahrscheinlichkeit zu bestimmen. Die Bedeutung der statistischen Definition der Wahrscheinlichkeit ergibt sich für uns daraus, dass wir über die Berechnung von relativen Häufigkeiten zumindest eine Annäherung an die dem Zufallseperiment zugrunde liegenden Wahrscheinlichkeiten bekommen. Bei zahlreichen Fragestellungen der angewandten Wahrscheinlichkeitsrechnung und Statistik, bei denen es unmöglich ist, auf andere Art Wahrscheinlichkeiten zu ermitteln, verwendet man die beobachteten relativen Häufigkeiten als Näherungen oder Schätzungen für die (unbekannten) Wahrscheinlichkeiten. Die statistische Definition der Wahrscheinlichkeit verschafft uns den leichtesten Zugang zum Wahrscheinlichkeitsbegriff und stellt außerdem für zahlreiche praktische Fragestellungen, wie bereits erwähnt, die einzige Möglichkeit zur Bestimmung von Wahrscheinlichkeiten dar. Man spricht dann manchmal auch von sogenannten empirischen Wahrscheinlichkeiten. empirische Wahrscheinlichkeit

13 Seite: 32 6 NORMALVERTEILUNG KE 8 6 Normalverteilung 6.1 Definition der Normalverteilung Die Normalverteilung ist die wichtigste stetige Verteilung. Sie spielt bei nahezu allen Anwendungen der Statistik eine große Rolle. Normalverteilung Dichtefunktion Erwartungswert und Varianz Die Dichtefunktion der Normalverteilung lautet: f X () = 1 ) ( σ 2π ep ( µ)2 2σ 2 Die Verteilungsfunktion der Normalverteilung ist nicht mehr mit Hilfe elementarer Funktionen darstellbar. Die Parameter der Normalverteilung lauten: E(X) = µ und Var(X) = σ 2. Eine normalverteilte Zufallsvariable X wird als N(µ, σ 2 )- verteilt bezeichnet. Die Schreibweise lautet X N(µ, σ 2 ). Erwartungswert und Varianz bzw. Standardabweichung der Normalverteilung lassen sich also unmittelbar aus der Dichtefunktion ablesen. Aus der Dichtefunktion ergibt sich, dass die Normalverteilung in einem konkreten Fall durch die Angabe von µ und σ 2 jeweils spezifiziert werden muss. Es gibt also nicht nur eine Normalverteilung, sondern eine ganze Klasse von Normalverteilungen. Die Dichtefunktion der Normalverteilung hat folgende typische Gestalt: 8abb7.nb 1 fhl m-s m m+s Abbildung 6: Dichtefunktion der Normalverteilung

14 KE Definition der Normalverteilung Seite: 33 Die Dichtefunktion ist symmetrisch und hat ihren Gipfel bei = µ. An den Stellen = µ σ und = µ + σ befinden sich Wendepunkte. In der Abbildung 7 sind Normalverteilungen für verschiedene Werte von µ und σ 2 dargestellt. 8abb813.nb 1 fhl Dichtefunktion NH0,1L fhl Dichtefunktion NH1,1L fhl Dichtefunktion NH0,2L fhl Dichtefunktion NH1,2L fhl Dichtefunktion NH0,3L fhl Dichtefunktion NH1,3L Abbildung 7: Verschiedene Normalverteilungen Die Normalverteilung mit dem Erwartungswert 0 und der Varianz 1, also N(0, 1), heißt Standardnormalverteilung. Standardnormalverteilung Will man die Wahrscheinlichkeit dafür bestimmen, dass ein normalverteiltes Merkmal X zwischen 1 und 2 liegt, d.h., sucht man P ( 1 X 2 ), so müsste man dazu das folgende Integral ausrechnen:

15 Seite: 12 2 SCHÄTZFUNKTIONEN UND PUNKTSCHÄTZUNG KE 10 2 Schätzfunktionen und Punktschätzung 2.1 Schätzfunktionen Die Ausführungen dieses Abschnitts knüpfen unmittelbar an Kurseinheit 9, insbesondere die Abschnitte 4 und 5 an. Dabei beschäftigen wir uns hier zunächst mit Punktschätzungen, die auf den folgenden Grundgedanken aufbauen: Es soll ein unbekannter Parameter (z.b. µ, Θ oder σ 2 oder ein anderer) der Grundgesamtheit geschätzt werden. Diesen unbekannten Parameter bezeichnen wir allgemein mit q. Für die Schätzung wird der Grundgesamtheit eine Zufallsstichprobe entnommen. Ihre Elemente werden als Realisationen der Zufallsvariablen X 1, X 2,..., X n aufgefasst. Aus den Stichprobenwerten muss nun ein geeigneter Schätzwert ˆq für den unbekannten Parameter q berechnet werden. Zur Ermittlung eines Schätzwertes ˆq für den Parameter q dient die Stichprobenfunktion ˆQ n = ˆQ n (X 1,..., X n ), die vom Umfang und den Elementen der Stichprobe abhängt. Schätzfunktion Eine für Schätzungen verwendete Stichprobenfunktion heißt auch Schätzfunktion. Schätzwert Punktschätzung Der sich für bestimmte Stichprobenwerte 1, 2,..., n ergebende Wert ˆq der Schätzfunktion heißt Schätzwert oder Punktschätzung. Als Schätzfunktion verwendet man in vielen Fällen den Stichprobenparameter, der dem zu schätzenden Parameter der Grundgesamtheit entspricht, wie die folgenden Beispiele zeigen. Beispiel 1: a) Die Schätzfunktion n X = 1 n i=1 X i liefert einen Schätzwert ˆµ für den Mittelwert (Parameter µ) der Grundgesamtheit bzw. für den Erwartungswert E(X i ) der Zufallsvariablen X i.

16 KE Schätzfunktionen Seite: 13 b) Die Schätzfunktion P = X n = 1 n n X i mit X i = i=1 { 0 für A tritt ein 1 für A tritt ein liefert einen Schätzwert ˆΘ für den Anteilswert Θ der Grundgesamtheit bzw. für die unbekannte Wahrscheinlichkeit Θ für das Auftreten des interessierenden Ereignisses A. Der aus den Stichprobenwerten 1, 2,..., n berechnete Wert der Schätzfunktion ist der Schätzwert für den unbekannten, wahren Wert des Parameters der Grundgesamtheit. Eine Schätzfunktion ˆQ für einen Parameter q ist eine Zufallsvariable, die bei einem Merkmal durch eine Dichtefunktion f ˆQ(ˆq) beschrieben werden kann. In Abbildung 2 sind die Dichtefunktionen von drei Schätzfunktionen für denselben Parameter q eingezeichnet. 10abb1.nb 1 f Q` i Hq` il f Q` 2 f Q` 1 f Q` 3 EHQ` il i=1,2 EHQ` 3L q` i Abbildung 1: Dichtefunktion drei verschiedener Schätzfunktionen für denselben Parameter q

17 KE Der Vorzeichentest Seite: Der Vorzeichentest Es wird von zwei beliebig verteilten Grundgesamtheiten ausgegangen, und es soll die Hypothese geprüft werden, ob beide Grundgesamtheiten die gleiche Verteilung haben. Aus beiden Grundgesamtheiten werden Stichproben vom Umfang n gezogen (X 1,..., X n und Y 1,..., Y n ), wobei man die einzelnen Stichprobenwerte als Paare (X i, Y i ) erhält. Die Zufallsvariable Z i definiert man als Z i = X i Y i und es sei 1 falls Z i > 0 D i = 0 falls Z i < 0 i = 1,..., n Ist Z i = X i Y i = 0, so lässt man das entsprechende Wertepaar unberücksichtigt und reduziert entsprechend n. Ist die Nullhypothese, dass beide Grundgesamtheiten die gleiche Verteilung besitzen, richtig, dann muss die Anzahl der positiven Differenzen genau so groß sein wie die der negativen Differenzen. Die Summe D n = n i=1 D i ist also B(n; 0, 5)-verteilt und wird als Prüfgröße des Vorzeichentests verwendet. D n entspricht der Anzahl der positiven Differenzen. Testgröße D n Die zu einem gegebenen Signifikanzniveau α gehörenden Annahmebereichsgrenzen c u und c o können dann mittels der Binomialverteilung bestimmt werden, indem man die Werte bestimmt, bei der die Verteilungsfunktion F X () den Wert α bzw. 1 α annimmt. Da die 2 2 Binomialverteilung eine diskrete Verteilung ist, wird man dabei meistens auf benachbarte Werte zurückgreifen müssen, die einem kleineren Signifikanzniveau entsprechen.

18 Seite: 54 4 VERTEILUNGSFREIE TESTVERFAHREN KE 12 Beispiel 16: Die Untersuchung des Weizenertrages bei der Verwendung zweier unterschiedlicher Düngemittel A und B unter sonst gleichen Bedingungen hat folgendes Ergebnis geliefert (die Düngemittel wurden jeweils auf benachbarten Flächenstücken angewendet, die fortlaufend nummeriert worden sind): Fläche Düngemittel A Düngemittel B Differenz Fläche Düngemittel A Düngemittel B Differenz Es ist zu testen, ob die Düngemittel signifikant unterschiedliche Ergebnisse liefern. Die Nullhypothese lautet: Beide Düngemittel liefern den gleichen Durchschnittsertrag. Für die Anzahl D n der positiven Vorzeichen, die Testgröße, erhalten wir die Ausprägung d n = 15. D n ist B(20; 0, 5)-verteilt. Bei einem Signifikanzniveau von 0,05 erhalten wir als Annahmegrenzen c u = 6 und c o = 14. Da d n = 15 > 14 = c o ist, wird die Nullhypothese abgelehnt.

19 Seite: 14 3 DER FORSCHUNGSPROZESS KE 13 3 Der Forschungsprozeß Phasen des Forschungsprozesses Im Rahmen des quantifizierenden Paradigmas lassen sich Phasen des Forschungsprozesses unterscheiden, die möglicherweise mehrmals durchlaufen werden. Ein grafisches Schema ist Abb. 1 zu entnehmen (vgl. Schnell et al. 1999, S. 8, Bortz, 1999, S. 3). Nach Bortz (1999, S. 3 ff) werden die Stadien 1. Erkundungsphase, 2. Theoretische Phase 3. Planungsphase 4. Untersuchungsphase 5. Auswertungsphase 6. Entscheidungsphase unterschieden. Eploration theoretische Struktur 3.1 Erkundungsphase In der Erkundungsphase muss das Problemfeld eploriert werden (Literaturrecherche, Kontakt zu einschlägigen Forschern und Praktikern bzw. den entsprechenden Institutionen oder Firmen). Dabei soll die eigene Studie in einen theoretischen Kontet eingeordnet werden. Je nach Gegenstand gibt es elaborierte Theorien oder man betritt wissenschaftliches Neuland. Aus Theorien können dann Folgerungen und Hypothesen abgeleitet werden. In der eplorativen Phase ist ein besonders starkes Wechselspiel zwischen Theorie und Empirie zu beobachten, das die größte Nähe zu den qualitativen Methoden aufweist. Auch sind hier erste Voruntersuchungen (eplorative Studien) einzuordnen. 3.2 Theoretische Phase Empirische Überprüfungen einer Theorie sind nur sinnvoll, wenn zumindest ihre theoretische Struktur bestimmte Gütekriterien erfüllt. Man muss prüfen, ob 1. die Theorie präzise formuliert ist, 2. ob sie einen Informationsgehalt besitzt,

20 KE Theoretische Phase Seite: 15 Abbildung 1: Phasen der empirischen Forschung (Bortz, 1999)

21 Seite: 16 3 DER FORSCHUNGSPROZESS KE logisch konsistent ist, 4. mit anderen Theorien vereinbar 5. und empirisch überhaupt überprüfbar ist. Erläuterungen zu den einzelnen Punkten: Indikatoren Operationalisierung Likert-Skala Falsifikatoren Konditionalsatz 1. Grundlegend ist die möglichst präzise Definition der Begriffe, die in einer Theorie vorkommen (Konzeptspezifikation, Operationalisierung). Beispielsweise ist der Begriff ethnische Identität zunächst unklar, da zuerst die Teilbegriffe Ethnisch und Identität definiert und abgegrenzt werden müssen. Damit in Zusammenhang steht die Frage, ob es beobachtbare Sachverhalte (Indikatoren) gibt, die mit den theoretischen Begriffen möglichst übereinstimmen. Die Frage, wie den Begriffen die Indikatoren zugeordet werden, wird unter dem Titel Operationalisierung geklärt. Dies beinhaltet Anweisungen, wie Messungen vorgenommen werden sollen. Etwa wird Intelligenz durch Ausfüllen eines Intelligenz-Tests und einer bestimmten Aggregationsmethode der Teilaufgaben (items) operationalisiert. Meistens ist dies die Summe (der Rohwerte; Likert-Skala) und darauf folgende Standardisierungen. 2. Der Informationsgehalt (empirische Gehalt) der Aussagen einer Theorie bezieht sich auf ihre Falsifikatoren. Betrachtet man sogenannte Konditionalsätze (wenn-dann-satz oder je-desto-satz), so steigt der Informationsgehalt mit der Zahl der Ereignisse, die mit dem dann (bzw. desto)-teil in Widerspruch stehen. Beispielsweise ist für den Satz A: Wenn der Blutalkoholspiegel 0.5 Promille übersteigt, sinkt die Reaktionsfähigkeit der Nachweis einer verbesserten Reaktionsfähigkeit ein Falsifikator. Dagegen sind Sätze wie B: Wenn der Hahn kräht auf dem Mist, ändert sich das Wetter oder es bleibt wie es ist nicht falsifizierbar, da der Dann-Teil immer wahr ist. Auch verringern vage, unpräzise Begriffe den Informationsgehalt eines Satzes, etwa kann die Reaktionsfähigkeit durch präzise Reaktionszeitmessungen oder lediglich durch Beobachtung ermittelt werden. Im ersteren Fall gibt es mehr Ereignisse, die dem Satz widersprechen.

22 KE Theoretische Phase Seite: Theoretische Aussagen sollten keine Tautologien oder Kontradiktionen sein, die immer wahr oder falsch sind. Etwa ist Satz B Tautologien, tautologisch, da er immer wahr ist (und daher auch nicht empirisch überprüft werden muss). Versteckte Tautologien stecken in Kontradiktionen Kann-Sätzen, etwa C: Rauchen kann Krebs verursachen. In diesem Fall ist sowohl das Auftreten als auch das Nicht-Auftreten von Krebs mit der Aussage vereinbar. Überprüfbar wird der Satz erst durch eine Häufigkeits- oder Wahrscheinlichkeitsaussage, etwa D: Bei Rauchern ist die Wahrscheinlichkeit für Krebs höher als bei Nichtrauchern. Entsprechend müssen die bedingten Häufigkeiten für Krebs in den Gruppen der Raucher/Nichtraucher ermittelt und getestet werden, jedoch ist im Einzelfall keine empirische Überprüfung möglich. 4. Liegen mehrere Theorien vor, die sich auf den gleichen Gegenstandsbereich beziehen, so muss untersucht werden, ob logische Widersprüche zwischen den Theorien bestehen. Sind keine logischen Widersprüche auffindbar, so bedeutet dies nicht, dass die logische Theorien wahr sind. Dies kann, wie gesagt, nur durch empirische Widersprüche Überprüfung herausgefunden werden. 5. Schließlich muss die empirische Überprüfbarkeit (bzw. Falsifizierbarkeit) der Theorie analysiert werden. Es ist möglich, dass eine Verifikation, Theorie im Prinzip falsifizierbar ist, jedoch beim gegenwärtigen Falsifikation Stand der Forschung die Begriffe noch nicht genau oder weit genug meßbar sind. Dann müssen erst geeignete Meßinstrumente entwickelt werden. Beispiel 4: In der physikalischen Forschung sind bestimmte Theorien erst dann überprüfbar, wenn neue Beschleuniger gebaut werden, die Prozesse mit hoher Energie zum Nachweis bestimmter Elementarteilchen erlauben. Im Allgemeinen kann eine Theorie nicht vollständig überprüft werden, sondern nur bestimmte Folgerungen und deduzierte Teilaspekte.

Demokurs. Modul Grundlagen der Wirtschaftsmathematik Grundlagen der Statistik

Demokurs. Modul Grundlagen der Wirtschaftsmathematik Grundlagen der Statistik Demokurs Modul 31101 Grundlagen der Wirtschaftsmathematik und Statistik Kurs 40601 Grundlagen der Statistik 13. Juli 2010 KE 1 2.4 Schiefe und Wölbung einer Verteilung Seite: 53 2.4 Schiefe und Wölbung

Mehr

Welche der folgenden Aussagen sind richtig? (x aus 5) A Ein metrisches Merkmal, das überabzählbar viele Ausprägungen besitzt heißt diskret.

Welche der folgenden Aussagen sind richtig? (x aus 5) A Ein metrisches Merkmal, das überabzählbar viele Ausprägungen besitzt heißt diskret. Grundlagen der Statistik 25.9.2014 7 Aufgabe 7 Welche der folgenden Aussagen sind richtig? (x aus 5) A Ein metrisches Merkmal, das überabzählbar viele Ausprägungen besitzt heißt diskret. B Ein Merkmal

Mehr

Statistische Tests (Signifikanztests)

Statistische Tests (Signifikanztests) Statistische Tests (Signifikanztests) [testing statistical hypothesis] Prüfen und Bewerten von Hypothesen (Annahmen, Vermutungen) über die Verteilungen von Merkmalen in einer Grundgesamtheit (Population)

Mehr

Vorlesung Gesamtbanksteuerung Mathematische Grundlagen II Dr. Klaus Lukas Carsten Neundorf. Vorlesung 04 Mathematische Grundlagen II,

Vorlesung Gesamtbanksteuerung Mathematische Grundlagen II Dr. Klaus Lukas Carsten Neundorf. Vorlesung 04 Mathematische Grundlagen II, Vorlesung Gesamtbanksteuerung Mathematische Grundlagen II Dr. Klaus Lukas Carsten Neundorf 1 Was sollen Sie heute lernen? 2 Agenda Wiederholung stetige Renditen deskriptive Statistik Verteilungsparameter

Mehr

Mehrdimensionale Zufallsvariablen

Mehrdimensionale Zufallsvariablen Mehrdimensionale Zufallsvariablen Im Folgenden Beschränkung auf den diskreten Fall und zweidimensionale Zufallsvariablen. Vorstellung: Auswerten eines mehrdimensionalen Merkmals ( ) X Ỹ also z.b. ω Ω,

Mehr

Wahrscheinlichkeitsverteilungen

Wahrscheinlichkeitsverteilungen Universität Bielefeld 3. Mai 2005 Wahrscheinlichkeitsrechnung Wahrscheinlichkeitsrechnung Das Ziehen einer Stichprobe ist die Realisierung eines Zufallsexperimentes. Die Wahrscheinlichkeitsrechnung betrachtet

Mehr

5. Spezielle stetige Verteilungen

5. Spezielle stetige Verteilungen 5. Spezielle stetige Verteilungen 5.1 Stetige Gleichverteilung Eine Zufallsvariable X folgt einer stetigen Gleichverteilung mit den Parametern a und b, wenn für die Dichtefunktion von X gilt: f x = 1 für

Mehr

So berechnen Sie einen Schätzer für einen Punkt

So berechnen Sie einen Schätzer für einen Punkt htw saar 1 EINFÜHRUNG IN DIE STATISTIK: SCHÄTZEN UND TESTEN htw saar 2 Schätzen: Einführung Ziel der Statistik ist es, aus den Beobachtungen eines Merkmales in einer Stichprobe Rückschlüsse über die Verteilung

Mehr

Statistik II. Version A. 1. Klausur Sommersemester 2011 Hamburg, BITTE LESERLICH IN DRUCKBUCHSTABEN AUSFÜLLEN!

Statistik II. Version A. 1. Klausur Sommersemester 2011 Hamburg, BITTE LESERLICH IN DRUCKBUCHSTABEN AUSFÜLLEN! Statistik II Version A 1. Klausur Sommersemester 2011 Hamburg, 27.07.2011 BITTE LESERLICH IN DRUCKBUCHSTABEN AUSFÜLLEN! Nachname:............................................................................

Mehr

6. Schätzverfahren für Parameter

6. Schätzverfahren für Parameter 6. Schätzverfahren für Parameter Ausgangssituation: Ein interessierender Zufallsvorgang werde durch die ZV X repräsentiert X habe eine unbekannte Verteilungsfunktion F X (x) Wir interessieren uns für einen

Mehr

Klausur zur Vorlesung

Klausur zur Vorlesung Institut für Mathematische Stochastik WS 2006/2007 Universität Karlsruhe 12. Februar 2007 Priv.-Doz. Dr. D. Kadelka Dipl.-Math. W. Lao Aufgabe 1 (15 Punkte) Klausur zur Vorlesung Statistik für Biologen

Mehr

Vorlesung Gesamtbanksteuerung Mathematische Grundlagen II Dr. Klaus Lukas Carsten Neundorf

Vorlesung Gesamtbanksteuerung Mathematische Grundlagen II Dr. Klaus Lukas Carsten Neundorf Vorlesung Gesamtbanksteuerung Mathematische Grundlagen II Dr. Klaus Lukas Carsten Neundorf 1 Agenda Wiederholung stetige Renditen deskriptive Statistik Verteilungsparameter Erwartsungswert und Varianz

Mehr

5. Schließende Statistik (Inferenzstatistik, konfirmatorische Verfahren)

5. Schließende Statistik (Inferenzstatistik, konfirmatorische Verfahren) 5. Schließende Statistik (Inferenzstatistik, konfirmatorische Verfahren) 5.1. Einführung Schätzen unbekannter Parameter im Modell, z.b. Wahrscheinlichkeiten p i (Anteile in der Gesamtmenge), Erwartungswerte

Mehr

Dr. Maike M. Burda. Welchen Einfluss hat die Körperhöhe auf das Körpergewicht? Eine Regressionsanalyse. HU Berlin, Econ Bootcamp

Dr. Maike M. Burda. Welchen Einfluss hat die Körperhöhe auf das Körpergewicht? Eine Regressionsanalyse. HU Berlin, Econ Bootcamp Dr. Maike M. Burda Welchen Einfluss hat die Körperhöhe auf das Körpergewicht? Eine Regressionsanalyse. HU Berlin, Econ Bootcamp 8.-10. Januar 2010 BOOTDATA.GDT: 250 Beobachtungen für die Variablen... cm:

Mehr

Klassifikation von Signifikanztests

Klassifikation von Signifikanztests Klassifikation von Signifikanztests nach Verteilungsannahmen: verteilungsabhängige = parametrische Tests verteilungsunabhängige = nichtparametrische Tests Bei parametrischen Tests werden im Modell Voraussetzungen

Mehr

Statistik. Sommersemester Prof. Dr. Stefan Etschberger HSA. für Betriebswirtschaft und International Management

Statistik. Sommersemester Prof. Dr. Stefan Etschberger HSA. für Betriebswirtschaft und International Management Statistik für Betriebswirtschaft und International Management Sommersemester 2014 Prof. Dr. Stefan Etschberger HSA Streuungsparameter Varianz Var(X) bzw. σ 2 : [x i E(X)] 2 f(x i ), wenn X diskret Var(X)

Mehr

Goethe-Universität Frankfurt

Goethe-Universität Frankfurt Goethe-Universität Frankfurt Fachbereich Wirtschaftswissenschaft PD Dr. Martin Biewen Dr. Ralf Wilke Sommersemester 2006 Klausur Statistik II 1. Alle Aufgaben sind zu beantworten. 2. Bitte runden Sie Ihre

Mehr

Wahrscheinlichkeitsrechnung und Statistik. 11. Vorlesung /2019

Wahrscheinlichkeitsrechnung und Statistik. 11. Vorlesung /2019 Wahrscheinlichkeitsrechnung und Statistik 11. Vorlesung - 2018/2019 Quantil der Ordnung α für die Verteilung des beobachteten Merkmals X ist der Wert z α R für welchen gilt z 1 2 heißt Median. P(X < z

Mehr

Bestimmte Zufallsvariablen sind von Natur aus normalverteilt. - naturwissenschaftliche Variablen: originär z.b. Intelligenz, Körpergröße, Messfehler

Bestimmte Zufallsvariablen sind von Natur aus normalverteilt. - naturwissenschaftliche Variablen: originär z.b. Intelligenz, Körpergröße, Messfehler 6.6 Normalverteilung Die Normalverteilung kann als das wichtigste Verteilungsmodell der Statistik angesehen werden. Sie wird nach ihrem Entdecker auch Gaußsche Glockenkurve genannt. Die herausragende Stellung

Mehr

1. Einführung in die induktive Statistik

1. Einführung in die induktive Statistik Wichtige Begriffe 1. Einführung in die induktive Statistik Grundgesamtheit: Statistische Masse, die zu untersuchen ist, bzw. über die Aussagen getroffen werden soll Stichprobe: Teil einer statistischen

Mehr

Wichtige Definitionen und Aussagen

Wichtige Definitionen und Aussagen Wichtige Definitionen und Aussagen Zufallsexperiment, Ergebnis, Ereignis: Unter einem Zufallsexperiment verstehen wir einen Vorgang, dessen Ausgänge sich nicht vorhersagen lassen Die möglichen Ausgänge

Mehr

Ermitteln Sie auf 2 Dezimalstellen genau die folgenden Kenngrößen der bivariaten Verteilung der Merkmale Weite und Zeit:

Ermitteln Sie auf 2 Dezimalstellen genau die folgenden Kenngrößen der bivariaten Verteilung der Merkmale Weite und Zeit: 1. Welche der folgenden Kenngrößen, Statistiken bzw. Grafiken sind zur Beschreibung der Werteverteilung des Merkmals Konfessionszugehörigkeit sinnvoll einsetzbar? A. Der Modalwert. B. Der Median. C. Das

Mehr

Statistik Klausur Sommersemester 2013 Hamburg, BITTE LESERLICH IN DRUCKBUCHSTABEN AUSFÜLLEN!

Statistik Klausur Sommersemester 2013 Hamburg, BITTE LESERLICH IN DRUCKBUCHSTABEN AUSFÜLLEN! Statistik 2 1. Klausur Sommersemester 2013 Hamburg, 26.07.2013 A BITTE LESERLICH IN DRUCKBUCHSTABEN AUSFÜLLEN! Nachname:............................................................................ Vorname:.............................................................................

Mehr

7.5 Erwartungswert, Varianz

7.5 Erwartungswert, Varianz 7.5 Erwartungswert, Varianz Def. 7.5.: a) X sei eine diskrete ZV, die bei unendl. vielen Werten x k folgende Zusatzbedingung erfüllt: x k p k

Mehr

Wahrscheinlichkeitsrechnung und Statistik

Wahrscheinlichkeitsrechnung und Statistik 10. Vorlesung - 2018 Grundbegriffe der Statistik statistische Einheiten = Objekte an denen interessierende Größen erfaßt werden z.b. Bevölkerung einer Stadt; Schüler einer bestimmten Schule; Patienten

Mehr

Statistik Testverfahren. Heinz Holling Günther Gediga. Bachelorstudium Psychologie. hogrefe.de

Statistik Testverfahren. Heinz Holling Günther Gediga. Bachelorstudium Psychologie. hogrefe.de rbu leh ch s plu psych Heinz Holling Günther Gediga hogrefe.de Bachelorstudium Psychologie Statistik Testverfahren 18 Kapitel 2 i.i.d.-annahme dem unabhängig. Es gilt also die i.i.d.-annahme (i.i.d = independent

Mehr

73 Hypothesentests Motivation Parametertest am Beispiel eines Münzexperiments

73 Hypothesentests Motivation Parametertest am Beispiel eines Münzexperiments 73 Hypothesentests 73.1 Motivation Bei Hypothesentests will man eine gewisse Annahme über eine Zufallsvariable darauf hin überprüfen, ob sie korrekt ist. Beispiele: ( Ist eine Münze fair p = 1 )? 2 Sind

Mehr

Willkommen zur Vorlesung Statistik (Master)

Willkommen zur Vorlesung Statistik (Master) Willkommen zur Vorlesung Statistik (Master) Thema dieser Vorlesung: Verteilungen stetiger Zufallsvariablen Prof. Dr. Wolfgang Ludwig-Mayerhofer Universität Siegen Philosophische Fakultät, Seminar für Sozialwissenschaften

Mehr

1 Grundlagen der Wahrscheinlichkeitsrechnung Wahrscheinlichkeitsräume. Ein erster mathematischer Blick auf Zufallsexperimente...

1 Grundlagen der Wahrscheinlichkeitsrechnung Wahrscheinlichkeitsräume. Ein erster mathematischer Blick auf Zufallsexperimente... Inhaltsverzeichnis 1 Grundlagen der Wahrscheinlichkeitsrechnung 1 1.1 Wahrscheinlichkeitsräume Ein erster mathematischer Blick auf Zufallsexperimente.......... 1 1.1.1 Wahrscheinlichkeit, Ergebnisraum,

Mehr

5. Schließende Statistik (Inferenzstatistik, konfirmatorische Verfahren)

5. Schließende Statistik (Inferenzstatistik, konfirmatorische Verfahren) 5. Schließende Statistik (Inferenzstatistik, konfirmatorische Verfahren) 5.1. Einführung Schätzen unbekannter Parameter im Modell, z.b. Wahrscheinlichkeiten p i (Anteile in der Gesamtmenge), Erwartungswerte

Mehr

Statistik K urs SS 2004

Statistik K urs SS 2004 Statistik K urs SS 2004 3.Tag Grundlegende statistische Maße Mittelwert (mean) Durchschnitt aller Werte Varianz (variance) s 2 Durchschnittliche quadrierte Abweichung aller Werte vom Mittelwert >> Die

Mehr

Wahrscheinlichkeitsrechnung und Statistik

Wahrscheinlichkeitsrechnung und Statistik 10. Vorlesung - 017 Quantil der Ordnung α für die Verteilung des beobachteten Merkmals X ist der Wert z α R für welchen gilt z 1 heißt Median. P(X < z α ) α P(X z α ). Falls X stetige zufällige Variable

Mehr

Statistik. Sommersemester Stefan Etschberger. für Betriebswirtschaft, Internationales Management, Wirtschaftsinformatik und Informatik

Statistik. Sommersemester Stefan Etschberger. für Betriebswirtschaft, Internationales Management, Wirtschaftsinformatik und Informatik Stefan Etschberger für Betriebswirtschaft, Internationales Management, Wirtschaftsinformatik und Informatik Sommersemester 2017 Rechenregeln für den Erwartungswert Ist f symmetrisch bzgl. a, so gilt E(X)

Mehr

Statistik I für Betriebswirte Vorlesung 13

Statistik I für Betriebswirte Vorlesung 13 Statistik I für Betriebswirte Vorlesung 13 Prof. Dr. Hans-Jörg Starkloff TU Bergakademie Freiberg Institut für Stochastik 4. Juli 2016 Prof. Dr. Hans-Jörg Starkloff Statistik I für Betriebswirte Vorlesung

Mehr

Die Familie der χ 2 (n)-verteilungen

Die Familie der χ 2 (n)-verteilungen Die Familie der χ (n)-verteilungen Sind Z 1,..., Z m für m 1 unabhängig identisch standardnormalverteilte Zufallsvariablen, so genügt die Summe der quadrierten Zufallsvariablen χ := m Z i = Z 1 +... +

Mehr

Die Familie der χ 2 (n)-verteilungen

Die Familie der χ 2 (n)-verteilungen Die Familie der χ (n)-verteilungen Sind Z 1,..., Z m für m 1 unabhängig identisch standardnormalverteilte Zufallsvariablen, so genügt die Summe der quadrierten Zufallsvariablen χ := m Z i = Z 1 +... +

Mehr

Biomathematik für Mediziner

Biomathematik für Mediziner Institut für Medizinische Biometrie, Informatik und Epidemiologie der Universität Bonn (Direktor: Prof. Dr. Max P. Baur) Biomathematik für Mediziner Klausur SS 2002 Aufgabe 1: Franz Beckenbauer will, dass

Mehr

Zufallsvariablen [random variable]

Zufallsvariablen [random variable] Zufallsvariablen [random variable] Eine Zufallsvariable (Zufallsgröße) X beschreibt (kodiert) die Versuchsausgänge ω Ω mit Hilfe von Zahlen, d.h. X ist eine Funktion X : Ω R ω X(ω) Zufallsvariablen werden

Mehr

WS 2014/15. (d) Bestimmen Sie die Wahrscheinlichkeitsfunktion von X. (e) Bestimmen Sie nun den Erwartungswert und die Varianz von X.

WS 2014/15. (d) Bestimmen Sie die Wahrscheinlichkeitsfunktion von X. (e) Bestimmen Sie nun den Erwartungswert und die Varianz von X. Fragenkatalog zur Übung Methoden der empirischen Sozialforschung WS 2014/15 Hier finden Sie die denkbaren Fragen zum ersten Teil der Übung. Das bedeutet, dass Sie zu diesem Teil keine anderen Fragen im

Mehr

Biomathematik für Mediziner, Klausur WS 2000/2001 Seite 1

Biomathematik für Mediziner, Klausur WS 2000/2001 Seite 1 Biomathematik für Mediziner, Klausur WS 2000/2001 Seite 1 Aufgabe 1: Von 2 gleichartigen Maschinen eines pharmazeutischen Betriebes stellt die erste 40% und die zweite 60% der Produkte her. Dabei verursacht

Mehr

Statistik I für Betriebswirte Vorlesung 14

Statistik I für Betriebswirte Vorlesung 14 Statistik I für Betriebswirte Vorlesung 14 Dr. Andreas Wünsche TU Bergakademie Freiberg Institut für Stochastik 13. Juli 017 Dr. Andreas Wünsche Statistik I für Betriebswirte Vorlesung 14 Version: 8. Juli

Mehr

Vorlesung: Statistik II für Wirtschaftswissenschaft

Vorlesung: Statistik II für Wirtschaftswissenschaft Vorlesung: Statistik II für Wirtschaftswissenschaft Prof. Dr. Helmut Küchenhoff Institut für Statistik, LMU München Sommersemester 2017 Einführung 1 Wahrscheinlichkeit: Definition und Interpretation 2

Mehr

Dr. Maike M. Burda. Welchen Einfluss hat die Körperhöhe auf das Körpergewicht? Eine Regressionsanalyse. HU Berlin, Econ Bootcamp 7.-9.

Dr. Maike M. Burda. Welchen Einfluss hat die Körperhöhe auf das Körpergewicht? Eine Regressionsanalyse. HU Berlin, Econ Bootcamp 7.-9. Dr. Maike M. Burda Welchen Einfluss hat die Körperhöhe auf das Körpergewicht? Eine Regressionsanalyse. HU Berlin, Econ Bootcamp 7.-9. Januar 2011 BOOTDATA11.GDT: 250 Beobachtungen für die Variablen...

Mehr

Dr. W. Kuhlisch Dresden, Institut für Mathematische Stochastik

Dr. W. Kuhlisch Dresden, Institut für Mathematische Stochastik Dr. W. Kuhlisch Dresden, 12. 08. 2014 Institut für Mathematische Stochastik Klausur Statistik für Studierende der Fachrichtungen Hydrologie und Altlasten/Abwasser zugelassene Hilfsmittel: Taschenrechner

Mehr

3.Wiederholung: Toleranzbereiche Für EX Geg:

3.Wiederholung: Toleranzbereiche Für EX Geg: 3.Wiederholung: Toleranzbereiche Für EX Geg: Vl. 24.2.2017 Schätzfunktion für Güte: Ist X Problem: Feb 17 13:21 > Wir berechnen Bereiche (Toleranzbereiche) für sind untere und obere Grenzen, berechnet

Mehr

STATISTISCHE METHODEN UND IHRE ANWENDUNGEN

STATISTISCHE METHODEN UND IHRE ANWENDUNGEN STATISTISCHE METHODEN UND IHRE ANWENDUNGEN Von Dr. rer. nat. Erwin Kreyszig o. Professor für Statistik an der Universität Karlsruhe mit 82 Abbildungen und zahlreichen Tabellen Vierter, unveränderter Nachdruck

Mehr

Sommersemester Marktforschung

Sommersemester Marktforschung Dipl.-Kfm. Sascha Steinmann Universität Siegen Lehrstuhl für Marketing steinmann@marketing.uni-siegen.de Sommersemester 2010 Marktforschung Übungsaufgaben zu den Themen 3-6 mit Lösungsskizzen Aufgabe 1:

Mehr

Institut für Biometrie und klinische Forschung. WiSe 2012/2013

Institut für Biometrie und klinische Forschung. WiSe 2012/2013 Klinische Forschung WWU Münster Pflichtvorlesung zum Querschnittsfach Epidemiologie, Biometrie und Med. Informatik Praktikum der Medizinischen Biometrie (3) Überblick. Deskriptive Statistik I 2. Deskriptive

Mehr

Didaktisches Seminar über Stochastik. Themen: ffl Korrelation von zwei Zufallsvariablen

Didaktisches Seminar über Stochastik. Themen: ffl Korrelation von zwei Zufallsvariablen Didaktisches Seminar über Stochastik Themen: ffl Gemeinsame Verteilung von zwei Zufallsvariablen ffl Lineare Regression ffl Korrelation von zwei Zufallsvariablen Michael Ralph Pape Mai 1998 1 1 GEMEINSAME

Mehr

Biomathematik für Mediziner, Klausur WS 1999/2000 Seite 1

Biomathematik für Mediziner, Klausur WS 1999/2000 Seite 1 Biomathematik für Mediziner, Klausur WS 1999/2000 Seite 1 Aufgabe 1: Wieviele der folgenden Variablen sind quantitativ stetig? Schulnoten, Familienstand, Religion, Steuerklasse, Alter, Reaktionszeit, Fahrzeit,

Mehr

Stichprobenverteilung bei unterschiedlichen Auswahlsätzen

Stichprobenverteilung bei unterschiedlichen Auswahlsätzen Stichprobenverteilung bei unterschiedlichen Auswahlsätzen Begleitende Unterlagen zur Übung Induktive Statistik Michael Westermann Universität Essen Inhaltsverzeichnis 1 Einleitung.......................................................

Mehr

Kapitel 12 Stetige Zufallsvariablen Dichtefunktion und Verteilungsfunktion. stetig. Verteilungsfunktion

Kapitel 12 Stetige Zufallsvariablen Dichtefunktion und Verteilungsfunktion. stetig. Verteilungsfunktion Kapitel 1 Stetige Zufallsvariablen 1.1. Dichtefunktion und Verteilungsfunktion stetig Verteilungsfunktion Trägermenge T, also die Menge der möglichen Realisationen, ist durch ein Intervall gegeben Häufig

Mehr

Nachklausur zur Vorlesung

Nachklausur zur Vorlesung Institut für Mathematische Stochastik WS 003/004 Universität Karlsruhe 30. April 004 Priv.-Doz. Dr. D. Kadelka Nachklausur zur Vorlesung Statistik für Biologen Musterlösungen Aufgabe 1 Gemessen wurde bei

Mehr

Klassifikation von Signifikanztests

Klassifikation von Signifikanztests Klassifikation von Signifikanztests Nach Verteilungsannahmen: verteilungsabhängig: parametrischer [parametric] Test verteilungsunabhängig: nichtparametrischer [non-parametric] Test Bei parametrischen Tests

Mehr

Mathematik IV für Maschinenbau und Informatik (Stochastik) Universität Rostock, Institut für Mathematik Sommersemester 2007

Mathematik IV für Maschinenbau und Informatik (Stochastik) Universität Rostock, Institut für Mathematik Sommersemester 2007 Mathematik IV für Maschinenbau und Informatik Stochastik Universität Rostock, Institut für Mathematik Sommersemester 007 Prof. Dr. F. Liese Dipl.-Math. M. Helwich Serie Termin: 9. Juni 007 Aufgabe 3 Punkte

Mehr

Wirtschaftsstatistik für Studienanfänger

Wirtschaftsstatistik für Studienanfänger Günter Deweß / Helga Hartwig Wirtschaftsstatistik für Studienanfänger Begriffe - Aufgaben - Lösungen EAG. LE Edition am Gutenbergplatz Leipzig Inhalt Beschreibende Statistik: Daten und Maßzahlen 1 Grundgesamtheiten,

Mehr

1 EINLEITUNG Allgemeines Kapitelübersicht Gebrauch dieses Buches Verwenden zusätzlicher Literatur...

1 EINLEITUNG Allgemeines Kapitelübersicht Gebrauch dieses Buches Verwenden zusätzlicher Literatur... Inhaltsverzeichnis 1 EINLEITUNG... 1 1.1 Allgemeines... 1 1.2 Kapitelübersicht... 2 1.3 Gebrauch dieses Buches... 3 1.4 Verwenden zusätzlicher Literatur... 4 DESKRIPTIVE STATISTIK 2 GRUNDLAGEN... 5 2.1

Mehr

i =1 i =2 i =3 x i y i 4 0 1

i =1 i =2 i =3 x i y i 4 0 1 Aufgabe (5+5=0 Punkte) (a) Bei einem Minigolfturnier traten 6 Spieler gegeneinander an. Die Anzahlen der von ihnen über das gesamte Turnier hinweg benötigten Schläge betrugen x = 24, x 2 = 27, x = 2, x

Mehr

1.5.4 Quantile und Modi. Bem [Quantil, Modus]

1.5.4 Quantile und Modi. Bem [Quantil, Modus] 1.5.4 Quantile und Modi 1.5 Erwartungswert und Varianz Bem. 1.73. [Quantil, Modus] und Vertei- Analog zu Statistik I kann man auch Quantile und Modi definieren. Gegeben sei eine Zufallsvariable X mit Wahrscheinlichkeitsverteilung

Mehr

Brückenkurs Statistik für Wirtschaftswissenschaften

Brückenkurs Statistik für Wirtschaftswissenschaften Peter von der Lippe Brückenkurs Statistik für Wirtschaftswissenschaften Weitere Übungsfragen UVK Verlagsgesellschaft mbh Konstanz Mit UVK/Lucius München UVK Verlagsgesellschaft mbh Konstanz und München

Mehr

2.3 Intervallschätzung

2.3 Intervallschätzung 2.3.1 Motivation und Hinführung Bsp. 2.11. [Wahlumfrage] Der wahre Anteil der rot-grün Wähler 2009 war genau 33.7%. Wie groß ist die Wahrscheinlichkeit, in einer Zufallsstichprobe von 1000 Personen genau

Mehr

Statistik und Wahrscheinlichkeitsrechnung

Statistik und Wahrscheinlichkeitsrechnung Statistik und Wahrscheinlichkeitsrechnung Dr. Jochen Köhler 1 Inhalt der heutigen Vorlesung Statistik und Wahrscheinlichkeitsrechnung Zusammenfassung der vorherigen Vorlesung Übersicht über Schätzung und

Mehr

3) Testvariable: T = X µ 0

3) Testvariable: T = X µ 0 Beispiel 4.9: In einem Molkereibetrieb werden Joghurtbecher abgefüllt. Der Sollwert für die Füllmenge dieser Joghurtbecher beträgt 50 g. Aus der laufenden Produktion wurde eine Stichprobe von 5 Joghurtbechern

Mehr

Bereiche der Statistik

Bereiche der Statistik Bereiche der Statistik Deskriptive / Exploratorische Statistik Schließende Statistik Schließende Statistik Inferenz-Statistik (analytische, schließende oder konfirmatorische Statistik) baut auf der beschreibenden

Mehr

13 Mehrdimensionale Zufallsvariablen Zufallsvektoren

13 Mehrdimensionale Zufallsvariablen Zufallsvektoren 3 Mehrdimensionale Zufallsvariablen Zufallsvektoren Bisher haben wir uns ausschließlich mit Zufallsexperimenten beschäftigt, bei denen die Beobachtung eines einzigen Merkmals im Vordergrund stand. In diesem

Mehr

Eindimensionale Zufallsvariablen

Eindimensionale Zufallsvariablen Eindimensionale Grundbegriffe Verteilungstypen Diskrete Stetige Spezielle Maßzahlen für eindimensionale Erwartungswert Varianz Standardabweichung Schwankungsintervalle Bibliografie Bleymüller / Gehlert

Mehr

Übungsscheinklausur,

Übungsscheinklausur, Mathematik IV für Maschinenbau und Informatik (Stochastik) Universität Rostock, Institut für Mathematik Sommersemester 27 Prof. Dr. F. Liese Übungsscheinklausur, 3.7.27 Dipl.-Math. M. Helwich Name:...

Mehr

Empirische Wirtschaftsforschung

Empirische Wirtschaftsforschung Empirische Wirtschaftsforschung Prof. Dr. Bernd Süßmuth Universität Leipzig Institut für Empirische Wirtschaftsforschung Volkswirtschaftslehre, insbesondere Ökonometrie 1 4. Basiskonzepte der induktiven

Mehr

Zufallsvariablen. Diskret. Stetig. Verteilung der Stichprobenkennzahlen. Binomial Hypergeometrisch Poisson. Normal Lognormal Exponential

Zufallsvariablen. Diskret. Stetig. Verteilung der Stichprobenkennzahlen. Binomial Hypergeometrisch Poisson. Normal Lognormal Exponential Zufallsvariablen Diskret Binomial Hypergeometrisch Poisson Stetig Normal Lognormal Exponential Verteilung der Stichprobenkennzahlen Stetige Zufallsvariable Verteilungsfunktion: Dichtefunktion: Integralrechnung:

Mehr

Welche der folgenden Aussagen ist/sind richtig? Kreuzen Sie bitte jede zutreffende Aussage an.

Welche der folgenden Aussagen ist/sind richtig? Kreuzen Sie bitte jede zutreffende Aussage an. AUFGABE 1) Z-TRANSFORMATION (4 PUNKTE) Welche der folgenden Aussagen ist/sind richtig? Kreuzen Sie bitte jede zutreffende Aussage an. Eine z-transformierte Verteilung hat einen Mittelwert von 0 und eine

Mehr

Chi-Quadrat-Verteilung

Chi-Quadrat-Verteilung Chi-Quadrat-Verteilung Wikipedia http://de.wikipedia.org/wiki/chi-quadrat-verteilung 1 von 7 6/18/2009 6:13 PM Chi-Quadrat-Verteilung aus Wikipedia, der freien Enzyklopädie Die Chi-Quadrat-Verteilung ist

Mehr

Grundlagen der Statistik

Grundlagen der Statistik www.nwb.de NWB Studium Betriebswirtschaft Grundlagen der Statistik Band 2: Wahrscheinlichkeitsrechnung und induktive Statistik Von Professor Dr. Jochen Schwarze 9., vollständig überarbeitete Auflage STUDIUM

Mehr

Verteilungen eindimensionaler stetiger Zufallsvariablen Stetige Verteilungen. Chi-Quadrat-Verteilung Studentverteilung Fisher-Verteilung

Verteilungen eindimensionaler stetiger Zufallsvariablen Stetige Verteilungen. Chi-Quadrat-Verteilung Studentverteilung Fisher-Verteilung Verteilungen eindimensionaler stetiger Zufallsvariablen Stetige Verteilungen Chi-Quadrat-Verteilung Studentverteilung Fisher-Verteilung Typisierung der stetigen theoretischen Verteilungen Bibliografie:

Mehr

8. Konfidenzintervalle und Hypothesentests

8. Konfidenzintervalle und Hypothesentests 8. Konfidenzintervalle und Hypothesentests Dr. Antje Kiesel Institut für Angewandte Mathematik WS 2011/2012 Beispiel. Sie wollen den durchschnittlichen Fruchtsaftgehalt eines bestimmten Orangennektars

Mehr

Klassifikation von Signifikanztests

Klassifikation von Signifikanztests Klassifikation von Signifikanztests nach Verteilungsannahmen: verteilungsabhängige = parametrische Tests verteilungsunabhängige = nichtparametrische Tests Bei parametrischen Tests werden im Modell Voraussetzungen

Mehr

Statistik II für Betriebswirte Vorlesung 2

Statistik II für Betriebswirte Vorlesung 2 Statistik II für Betriebswirte Vorlesung 2 Prof. Dr. Hans-Jörg Starkloff TU Bergakademie Freiberg Institut für Stochastik 26. Oktober 2016 Prof. Dr. Hans-Jörg Starkloff Statistik II für Betriebswirte Vorlesung

Mehr

SozialwissenschaftlerInnen II

SozialwissenschaftlerInnen II Statistik für SozialwissenschaftlerInnen II Henning Best best@wiso.uni-koeln.de Universität zu Köln Forschungsinstitut für Soziologie Statistik für SozialwissenschaftlerInnen II p.1 Wahrscheinlichkeitsfunktionen

Mehr

Statistik I für Betriebswirte Vorlesung 3

Statistik I für Betriebswirte Vorlesung 3 Statistik I für Betriebswirte Vorlesung 3 Dr. Andreas Wünsche TU Bergakademie Freiberg Institut für Stochastik 15. April 2019 Dr. Andreas Wünsche Statistik I für Betriebswirte Vorlesung 3 Version: 1. April

Mehr

Teil VIII. Zentraler Grenzwertsatz und Vertrauensintervalle. Woche 6: Zentraler Grenzwertsatz und Vertrauensintervalle. Lernziele. Typische Situation

Teil VIII. Zentraler Grenzwertsatz und Vertrauensintervalle. Woche 6: Zentraler Grenzwertsatz und Vertrauensintervalle. Lernziele. Typische Situation Woche 6: Zentraler Grenzwertsatz und Vertrauensintervalle Patric Müller ETHZ Teil VIII Zentraler Grenzwertsatz und Vertrauensintervalle WBL 17/19, 29.05.2017 Wahrscheinlichkeit

Mehr

Statistik für NichtStatistiker

Statistik für NichtStatistiker Statistik für NichtStatistiker Zufall und Wahrscheinlichkeit von Prof. Dr. Karl Bosch 5., verbesserte Auflage R. Oldenbourg Verlag München Wien Inhaltsverzeichnis 1. ZufalLsexperimente und zufällige Ereignisse

Mehr

Lösungen zu Übungsblatt 9 Höhere Mathematik2/Stochastik 2 Master KI/PI

Lösungen zu Übungsblatt 9 Höhere Mathematik2/Stochastik 2 Master KI/PI Lösungen zu Übungsblatt 9 Höhere Mathematik/Stochastik Anpassung von Verteilungen Zu Aufgabe ) a) Zeichnen des Histogranmmes: Um das Histogramm zu zeichnen, benötigen wir die Höhe der Balken. Die Höhe

Mehr

2.3 Intervallschätzung

2.3 Intervallschätzung 2.3.1 Motivation und Hinführung Bsp. 2.15. [Wahlumfrage] Der wahre Anteil der rot-grün Wähler unter allen Wählern war 2009 auf eine Nachkommastelle gerundet genau 33.7%. Wie groß ist die Wahrscheinlichkeit,

Mehr

Aufgabe 1 (8= Punkte) 13 Studenten haben die folgenden Noten (ganze Zahl) in der Statistikklausur erhalten:

Aufgabe 1 (8= Punkte) 13 Studenten haben die folgenden Noten (ganze Zahl) in der Statistikklausur erhalten: Aufgabe 1 (8=2+2+2+2 Punkte) 13 Studenten haben die folgenden Noten (ganze Zahl) in der Statistikklausur erhalten: Die Zufallsvariable X bezeichne die Note. 1443533523253. a) Wie groß ist h(x 5)? Kreuzen

Mehr

Wahrscheinlichkeitsrechnung und Statistik

Wahrscheinlichkeitsrechnung und Statistik 9. Vorlesung - 2017 Monte Carlo Methode für numerische Integration Sei g : [0, 1] R stetige Funktion; man möchte 1 0 g(t)dt numerisch approximieren mit Hilfe von Zufallszahlen: Sei (U n ) n eine Folge

Mehr

Deskriptive Beschreibung linearer Zusammenhänge

Deskriptive Beschreibung linearer Zusammenhänge 9 Mittelwert- und Varianzvergleiche Mittelwertvergleiche bei k > 2 unabhängigen Stichproben 9.4 Beispiel: p-wert bei Varianzanalyse (Grafik) Bedienungszeiten-Beispiel, realisierte Teststatistik F = 3.89,

Mehr

Modellanpassung und Parameterschätzung. A: Übungsaufgaben

Modellanpassung und Parameterschätzung. A: Übungsaufgaben 7 Modellanpassung und Parameterschätzung 1 Kapitel 7: Modellanpassung und Parameterschätzung A: Übungsaufgaben [ 1 ] Bei n unabhängigen Wiederholungen eines Bernoulli-Experiments sei π die Wahrscheinlichkeit

Mehr

Statistik I für Betriebswirte Vorlesung 4

Statistik I für Betriebswirte Vorlesung 4 Statistik I für Betriebswirte Vorlesung 4 Prof. Dr. Hans-Jörg Starkloff TU Bergakademie Freiberg Institut für Stochastik 25. April 2016 Prof. Dr. Hans-Jörg Starkloff Statistik I für Betriebswirte Vorlesung

Mehr

Statistische Methoden in den Umweltwissenschaften

Statistische Methoden in den Umweltwissenschaften Statistische Methoden in den Umweltwissenschaften Stetige und diskrete Wahrscheinlichkeitsverteilungen Lageparameter Streuungsparameter Diskrete und stetige Zufallsvariablen Eine Variable (oder Merkmal

Mehr

5.4 Verteilungsfunktion Verteilungsfunktion diskreten Zufallsvariablen stetigen Zufallsvariablen Verteilungsfunktion

5.4 Verteilungsfunktion Verteilungsfunktion diskreten Zufallsvariablen stetigen Zufallsvariablen Verteilungsfunktion 5. Verteilungsfunktion Die Verteilungsfunktion gibt an welche Wahrscheinlichkeit sich bis zu einem bestimmten Wert der Zufallsvarialben X kumuliert Die Verteilungsfunktion F() gibt an, wie groß die die

Mehr

Statistik und Wahrscheinlichkeitsrechnung

Statistik und Wahrscheinlichkeitsrechnung Statistik und Wahrscheinlichkeitsrechnung 11. Vorlesung Jochen Köhler 10.05.011 1 Inhalt der heutigen Vorlesung Zusammenfassung Parameterschätzung Übersicht über Schätzung und Modellbildung Modellevaluation

Mehr

7. Übung: Aufgabe 1. b), c), e) Aufgabe 2. a), c), e) Aufgabe 3. c), e) Aufgabe 4. Aufgabe 5. Aufgabe 6. Aufgabe 7. Aufgabe 8. Aufgabe 9.

7. Übung: Aufgabe 1. b), c), e) Aufgabe 2. a), c), e) Aufgabe 3. c), e) Aufgabe 4. Aufgabe 5. Aufgabe 6. Aufgabe 7. Aufgabe 8. Aufgabe 9. 7. Übung: Aufgabe 1 b), c), e) Aufgabe a), c), e) Aufgabe 3 c), e) Aufgabe 4 b) Aufgabe 5 a) Aufgabe 6 b) Aufgabe 7 e) Aufgabe 8 c) Aufgabe 9 a), c), e) Aufgabe 10 b), d) Aufgabe 11 a) Aufgabe 1 b) Aufgabe

Mehr

Einführung in die computergestützte Datenanalyse

Einführung in die computergestützte Datenanalyse Karlheinz Zwerenz Statistik Einführung in die computergestützte Datenanalyse 6., überarbeitete Auflage DE GRUYTER OLDENBOURG Vorwort Hinweise zu EXCEL und SPSS Hinweise zum Master-Projekt XI XII XII TEIL

Mehr

Biometrie und Methodik (Statistik) - WiSem08/09 Probeklausur 1

Biometrie und Methodik (Statistik) - WiSem08/09 Probeklausur 1 Biometrie und Methodik (Statistik) - WiSem08/09 Probeklausur 1 Aufgabe 1 (10 Punkte). 10 Schüler der zehnten Klasse unterziehen sich zur Vorbereitung auf die Abschlussprüfung einem Mathematiktrainingsprogramm.

Mehr