Heinz Holling & Günther Gediga. Statistik - Deskriptive Verfahren. Lösungen zu den Übungen

Größe: px
Ab Seite anzeigen:

Download "Heinz Holling & Günther Gediga. Statistik - Deskriptive Verfahren. Lösungen zu den Übungen"

Transkript

1 Heinz Holling & Günther Gediga Statistik - Deskriptive Verfahren Lösungen zu den Übungen Version

2 Inhaltsverzeichnis 1 Lösung zu Übung 1; Kap Lösung zu Übung 2; Kap Lösung zu Übung 3; Kap Lösung zu Übung 4; Kap Lösung zu Übung 5; Kap Lösung zu Übung 6; Kap Lösung zu Übung 7; Kap Lösung zu Übung 8; Kap Lösung zu Übung 9; Kap Lösung zu Übung 10; Kap Lösung zu Übung 11 Kap Lösung zu Übung 12 Kap

3 1 Lösung zu Übung 1; Kap Jahreseinkommen: Die Messung kann über das Brutto- oder Nettogehalt in EURO oder durch Hochrechnen eines Monatsgehalts erfolgen. Es handelt sich hier um eine Messung auf Verhältnisskaleniveau (absoluter Nullpunkt vorhanden, Abstände interpretierbar). 2. soziale Schicht: Die Messung kann durch die Einteilung in drei Kategorien (Unter-, Mittel- und Oberschicht, in der Literatur oft anzutreffen) erfolgen oder auch durch die Erhebung der Ausprägungen verschiedener Merkmale wie Zugehörigkeit zu bestimmten Einkommenskategorien, Schulabschluss, Wohnsituation. Die Messung erfolgt hier auf dem Niveau einer Ordinalskala (Ausprägungen können geordnet werden, Abstände nicht interpretierbar). 3. Depressivität: Zur Messung kann hier ein Fragebogen eingesetzt werden. Dabei gibt die Person beispielsweise den Grad ihrer Zustimmung (etwa fünf Antwortkategorien von stimme überhaupt nicht zu bis stimme voll zu ) zu Aussagen wie Ich habe häufig traurige Gedanken., Ich habe Schwierigkeiten aufzustehen. oder Ich finde alles uninteressant. an. Ordnet man den Antwortmöglichkeiten die Zahlen 1 5 (entsprechend stärkerer Zustimmung) zu, so kann man die Zahlenwerte, die den Antworten entsprechen, über alle Aussagen im Fragebogen summieren. In der Regel geht man davon aus, dass hiermit eine Messung auf dem Niveau einer Intervallskala möglich ist, weil die Abstände zwischen den fünf Antwortkategorien als gleich groß angenommen werden. 4. Geschlecht: Das Geschlecht wird in die Kategorien männlich und weiblich eingeteilt. Es kommt also nur in zwei Ausprägungen vor. Den Kategorien können beliebige Zahlen (zum Beispiel männlich 0 und weiblich 1) zugeordnet werden. Diese zugeordneten Zahlen müssen eindeutig für nur eine der beiden Kategorien stehen und sind selbst nicht interpretierbar. Die Messung erfolgt also auf dem Niveau einer Nominalskala. 5. Temperatur: Zur Messung wird in der Regel ein Thermometer eingesetzt. Es gibt keinen natürlichen Nullpunkt. Die Temperatur kann beispielsweise in Fahrenheit und in Celsius angegeben werden. Wasser friert bei 32 F bzw. 0 C. Die Aussage, 20 C seien doppelt so viel wie 10 C, ist nicht sinnvoll. Die Messung erfolgt damit auf dem Niveau der Intervallskala und nicht auf dem Niveau einer Verhältniskala. Es ist kein absoluter Nullpunkt vorhanden; Vergleiche von Differenzen zwischen Temperaturen sind jedoch sinnvoll). 6. Schulnoten: Bei den Schulnoten können die Kategorien 1 6 in eine hierarchische Ordnung gebracht werden. Das bedeutet für das deutsche Schulsystem, 1 ist die beste Leistung und 6 die schlechteste. Schulnoten haben also mindestens Ordinalskalenniveau. Strittig ist jedoch, ob die Abstände zwischen den Noten interpretierbar sind. Der Abstand zwischen den Noten 1 und 2 müsste dann beispielsweise den gleichen Leistungsunterschied abbilden wie der Abstand zwischen den Noten 4 und 5. Würde man davon ausgehen, dass die Abstände gleich gross sind, könnte die Messung auch auf dem Niveau einer Intervallskala erfolgen. 7. Bindungstypen: Die Messung der Bindungstypen erfolgt über die Methode der Beobachtung. Ainsworth und Mitarbeiter entwickelten ein Laborverfahren, mit dem es möglich war, das Verhalten von Kindern, die von der Mutter getrennt eine Zeit lang mit einer fremden Person alleine gelassen wurden, systematisch zu beobachten. Anhand des Verhaltens der Kinder, welches beim Weggehen und der 3

4 Rückkehr der Mutter beobachtet wurde, wurde der Bindungstyp bestimmt. Die drei Bindungstypen können als Kategorien aufgefasst werden, denen die Babys eindeutig zugeordnet werden. Die Kategorien sind nicht geordnet und die Messung erfolgt damit auf Nominalskalenniveau. 4

5 2 Lösung zu Übung 2; Kap Balkendiagramm: 2. Stamm-Blatt Diagramm: Einheiten: Stamm:10, Blätter: Aufgrund der geringen Datenmenge in dieser Aufgabe sind das Balkendiagramm und das Stamm- Blatt-Diagramm gleich informativ, da die einzelnen Ausprägungen und die Anzahl der Ausprägungen aus beiden Diagrammformen direkt abgelesen werden können. Das Balkendiagramm hat gegenüber dem Stamm-Blatt-Diagramm in diesem Fall jedoch den Vorteil, dass die Verteilung der IQ-Werte besser abgelesen werden kann. 5

6 3. Empirische Verteilungsfunktion: 6

7 3 Lösung zu Übung 3; Kap Zunächst wird der Mittelwert ȳ der Beobachtungen bestimmt. Die Summe aller Beobachtungen hat den Wert 11 i=1 y i = 74, woraus sich der Mittelwert ȳ = 74/11 = ergibt. Die Varianz wird mit der angegebenen rechentechnisch günstigen Formel s 2 Y = 1 ( n n 1 i=1 y2 i nȳ2) unter Verwendung der folgenden Tabelle berechnet: i y i yi Die Summe n i=1 y2 i = 596 der quadrierten Beobachtungen finden wir in der letzten Zeile und dritten Spalte der Tabelle. Der Mittelwert von ȳ = wurde bereits berechnet. Beide Werte werden nun in die oben angegebene Formel eingesetzt. Wir erhalten somit für die Varianz das Ergebnis s 2 Y = 1 10 ( ) = 1 10 ( ) = 98.18/10 = Die Standardabweichung ist s Y = 9.82 = 3.13, d. h. die Wurzel aus der Varianz. Der Index Y am Symbol s 2 für die Varianz bzw. s für die Standardabweichung dient hier nur dazu, um zu verdeutlichen, dass die ursprüngliche (nicht transformierte) Variable Y betrachtet wird. Bei der Berechnung des Mittelwertes wurden mehr Nachkommastellen verwendet, damit das Ergebnis für die Varianz und die Standardabweichung hinreichend genau wird. 2. Jede der ursprünglichen Beobachtungen y i kann in eine Beobachtung y i auf der Selbsteinschätzungsskala, welche von 0 bis 100 reicht, umgerechnet werden, indem man die in der Aufgabenstellung angegebene Formel y i = 5y i + 50 verwendet. Bei dieser Formel handelt es sich um eine lineare Transformation der Form y i = by i + a (hier ist b = 5 und a = 50). Man könnte nun tatsächlich jede einzelne der ursprünglichen Beobachtungen transformieren und dann erneut den Mittelwert, die Varianz und die Standardabweichung für die transformierte Variable Y auf die gleiche Weise wie in Teilaufgabe 1) ausrechnen. Dies ist aber nicht erforderlich, da wir wissen, wie sich der Mittelwert, die Varianz und die Standardabweichung bei linearen Transformationen verändern. Konkret bedeutet das, dass der Mittelwert ȳ der transformierten Beobachtungen ausgerechnet werden kann, indem man die lineare Transformation auf den Mittelwert ȳ = der nicht transformierten Beobachtungen anwendet. Als Ergebnis erhalten wir dann ȳ = 5ȳ + 50 = = Die Varianz s 2 Y der transformierten Beobachtungen kann aus der Varianz s 2 Y der ursprünglichen Beobachtungen berechnet werden, indem man s 2 Y mit dem Quadrat der Steigung b der linearen 7

8 Transformation, also b 2 = 5 2 = 25, multipliziert. Es ergibt sich somit der Wert s 2 Y = = Die Standardabweichung von Y ergibt sich aus der Standardabweichung von Y durch Multiplikation mit der Steigung b = 5, d. h. s Y = bs Y = = Bemerkungen: Eigentlich müsste das Quadrat der Standardabweichung s Y exakt mit der Varianz s 2 Y der transformierten Beobachtungen übereinstimmen. Das ist hier nicht der Fall und liegt daran, dass wir s 2 Y und s Y in Teilaufgabe 1) nur auf zwei Nachkommastellen genau bestimmt hatten, also Rundungsfehler vorliegen, die aber vernachlässigbar klein sind. Beachten Sie, dass die Steigung b bei der Berechnung von s 2 Y quadriert wird, wogegen b bei der Berechnung der Standardabweichung s Y nicht quadriert wird. Weiterhin gilt s Y = bs Y nur dann, wenn die Steigung b positiv ist. Bei einer negativen Steigung b ist die Formel s Y = b s Y zu verwenden. Der Betrag einer negativen Zahl ist die Zahl ohne das Vorzeichen, z. B. 3 = 3. Die Spannweite und die Varianz sind anfällig gegenüber Ausreißern, während der Interquartilabstand gegenüber Ausreißern robust ist. Ausreißer beeinflussen das Minimum und/oder das Maximum der Beobachtungen in einem Datensatz und wirken sich somit unmittelbar auf die Spannweite aus. In die Berechnung der Varianz gehen alle Beobachtungen ein. Sehr große oder sehr kleine Beobachtungen, d. h. Ausreißer, liegen weiter vom Mittelwert entfernt als die typischen Beobachtungen in einem Datensatz. Bei der Berechnung der Varianz werden diese großen Abweichungen quadriert. Ihr Einfluss auf die Varianz wird dadurch noch verstärkt. Die Berechnung des Interquartilabstands basiert auf dem unteren und dem oberen Quartil. Das untere Quartil teilt den Datensatz im Verhältnis 1 zu 3 in Beobachtungen ein, die höchstens so groß bzw. mindestens so groß wie das Quartil sind. Ausreißer mit kleinen Werten werden bei der Bestimmung des unteren Quartils als Werte gezählt, die zu den 25% der kleinsten Beobachtungen im Datensatz gehören. Wie klein ein Ausreißer ist, spielt für die Berechnung des unteren Quartils bei größeren Datensätzen keine Rolle. Entsprechend erkennt man, dass auch das obere Quartil nicht von Ausreißern beeinflusst wird. Lediglich bei relativ kleinen Datensätzen können Ausreißer einen Einfluss auf die Quartile und damit auf den Interquartilabstand ausüben. 8

9 4 Lösung zu Übung 4; Kap. 7 Die transformierten Werte sind in der folgenden Tabelle dargestellt (Messwerte, die in der Stichprobe mehrfach auftauchen, sind hier nur einmal aufgeführt): y i z i Z i T i Zur Berechnung der Formel ist wie folgt vorzugehen: Zunächst ist die Formel T = z nach z aufzulösen. Das Ergebnis kann nun in die Formel Z = z eingesetzt werden. Es ergibt sich: (T 50) Z = Nach Vereinfachung erhält man die gewünschte Formel: Z = 50 + T 9

10 5 Lösung zu Übung 5; Kap Der Mittelwert der Beobachtungen ist ȳ = 1422/15 = Der Modalwert y mod ist die Beobachtung, welche am häufigsten im Datensatz vorkommt. Im vorliegenden Fall tritt der Wert 97 dreimal auf, während alle anderen Werte seltener vorkommen. Also ist y mod = 97. Der Median y med wird mit Hilfe der Regel zur Bestimmung von Quantilen berechnet, da der Median ja das 0.5-Quantil ist. Im ersten Schritt werden die Beobachtungen der Größe nach angeordnet, was folgende Liste liefert: 79, 81, 82, 88, 91, 91, 95, 96, 97, 97, 97, 98, 100, 114, 116. Im zweiten Schritt zur Bestimmung des p-quantils wird das Produkt np aus dem Stichprobenumfang n und p berechnet. Hier ist n = 15 und speziell beim Median p = 0.5, d. h. np = 7.5. Da np keine ganze Zahl ist, wird der Wert zu 8 aufgerundet. Der Median ist dann der (von links gezählt) achte Werte in der Liste der geordneten Beobachtungen, also y med = Der Mittelwert ist kleiner als der Median und der Median wiederum kleiner als der Modalwert, d. h. ȳ < y med < y mod. Aufgrund der Lageregeln kann die Verteilung der Beobachtungen als (tendenziell) rechtssteil (linksschief) bezeichnet werden. 3. Zunächst wird die Fünf-Punkte-Zusammenfassung bestimmt. Danach wird geprüft, ob Ausreißer oder Extremwerte vorliegen. Beim Vorhandensein von Ausreißern oder Extremwerten wird ein modifizierter Box-Plot erstellt, andernfalls ein nicht modifizierter Box-Plot. Aus der Liste der geordneten Beobachtungen in Teilaufgabe 1) kann direkt das Minimum y min = 79 und das Maximum y max = 116 der Beobachtungen abgelesen werden. Der Median y med = 96 wurde in Aufgabenteil 1) bestimmt. Es fehlen also noch die beiden Quartile. Für das untere Quartil y 0.25 ist np = = 3.75 keine ganze Zahl. Der Wert wird daher zu 4 aufgerundet. Das untere Quartil ist dann an der vierten Position in der Liste der geordneten Beobachtungen zu finden. Also gilt y 0.25 = 88. Entsprechend ergibt sich als oberes Quartil y 0.75 = 98. Es ist nun zu überlegen, ob Ausreißer und/oder Extremwerte vorliegen. Ob eine Beobachtung ein Ausreißer oder Extremwert ist, hängt davon ab, ob sie sehr weit vom unteren oder oberen Quartil entfernt ist. Beobachtungen, die mindestens um das Anderthalbfache aber höchstens das Dreifache des Interquartilabstands d Q kleiner als das untere Quartil sind bzw. die mindestens um das Anderthalbfache aber höchstens das Dreifache von d Q größer als das obere Quartil sind, werden im modifizierten Box-Plot separat als Ausreißer eingezeichnet. Als Symbol verwenden wir beim Zeichnen einen Punkt. Beobachtungen, die noch weiter von den Quartilen entfernt liegen, werden ebenfalls separat im modifizierten Box-Plot als Extremwerte eingezeichnet. Um zu entscheiden, ob eine Beobachtung ein Extremwert ist, hat man festgelegt, dass die Extremwerte mehr als das Dreifache des Interquartilabstands vom unteren bzw. oberen Quartil entfernt sein müssen. Als Symbol für die Extremwerte verwenden wir einen Stern. Für den vorliegenden Datensatz ist der Interquartilabstand d Q = y 0.75 y 0.25 = = 10. Es gibt genau zwei Beobachtungen, die das Kriterium für Ausreißer erfüllen, nämlich die Werte 114 und 116, da diese größer als y d Q = 113 sind. Extremwerte kommen nicht vor. Insgesamt ergibt sich der folgende Box-Plot. 10

11 4. Der Box-Plot kann wie folgt interpretiert werden: Der Median der Testergebnisse in der Stichprobe liegt beim Wert 96. Ausgehend von den Quartilen kann man erkennen, dass circa 50% der Schüler ein Ergebnis zwischen den Werten 88 und 98 erreicht haben. Machen Sie sich dazu klar, dass mindestens 25% der Beobachtungen höchstens so groß sind wie das untere Quartil und mindestens 25% der Beobachtungen mindestens so groß sind wie das obere Quartil. Für den Rest zwischen den beiden Quartilen bleiben also ungefähr 50% der Beobachtungen übrig. Das niedrigste Testergebnis liegt beim Wert 79. Weiterhin liegen zwei Ausreißer mit hohen Testergebnissen vor. Bei der Datenanalyse würde man häufig zunächst prüfen, ob die Ausreißer eventuell durch Eingabefehler (z.b. Tippen einer 114 statt einer 111) zustande gekommen sind. Können Eingabefehler ausgeschlossen werden, würde man je nach Fragestellung eventuell untersuchen, ob die Schüler mit den hohen Testergebnissen vielleicht aus einer anderen Klassenstufe kommen etc. Die Verteilung der Daten erscheint rechtssteil. Das erkennt man daran, dass der Median sehr nahe beim oberen Quartil liegt. Die Begründung dafür, dass ein nahe beim oberen Quartil liegender Median auf eine rechtssteile Verteilung hindeutet lautet wie folgt: In dem kleinen Bereich zwischen dem Median und dem oberen Quartil liegen ca. 25% der Daten, ebenso wie in dem größeren Bereich zwischen Median und unterem Quartil. In einem Histogramm würde sich dieser Sachverhalt so zeigen, dass die Säulen über den Klassen im Bereich zwischen dem Median und dem oberen Quartil tendenziell höher sind als über den Klassen im Bereich zwischen Median und unterem Quartil. Da dieser Bereich größer als der Bereich zwischen dem Median und dem oberen Quartil ist, entsteht folglich der optische Eindruck einer rechtssteilen und linksschiefen Verteilung. Man gelangt also sowohl bei der Verwendung der Lageregel in Teilaufgabe 2) als auch der Verwendung des Box-Plots zur gleichen Beurteilung der Schiefe der Verteilung. 11

12 6 Lösung zu Übung 6; Kap Um die Kovarianz einer Variablen X mit einer anderen zu berechnen, kann man sich der folgenden rechentechnisch günstigen Variante bedienen: s xy = 1 n 1 n x i y i n xȳ. Nun ist die Kovarianz von X mit sich selbst von Interesse, y wird daher durch x ersetzt, d.h. s xx = 1 n 1 i=1 n x 2 i n x 2. Das ist wiederum die rechentechnisch günstige Variante der Varianz einer Variablen. Man kann das auch ausgehend von der Definitionsformel der Kovarianz sehen: s xx = 1 n 1 n i=1 i=1 (x i x) (x i x) = 1 n 1 n (x i x) 2 = s 2 x. Es fällt also auf, dass die Kovarianz einer Variablen mit sich selbst gleich der Varianz der Variablen ist. Wir berechnen also nun die Varianz unter Verwendung der rechentechnisch günstigen Formel: i=1 s 2 x =.10 ( ) = Unter Verwendung der rechentechnisch günstigen Formel für die Kovarianz, ergibt sich mit n i=1 x iy i = 381, x = und ȳ = folgende Rechnung. s xy = 1 n 1 n x i y i n xȳ i=1 s xy =.10 (381 ( )) = Die Korrelation ist r xy = sxy s xs y, so dass nur noch die Standardabweichungen der Variablen benötigt werden. Diese ergeben sich als s x = 5.54 und s y = 3.12, so dass r xy = =.945. Dasselbe Ergebnisse hätte sich natürlich auch bei Anwendung der rechentechnisch günstigen Formel für die Korrelation ergeben, wenn man berücksichtigt, dass n i=1 y2 i = 596: r = =

13 7 Lösung zu Übung 7; Kap Da die Beobachtungen in der Aufgabenstellung schon als Ränge vorliegen, kann der Rangkorrelationskoeffizient r s berechnet werden, indem man die Formel zu Berechnung der normalen Korrelation r auf die Daten anwendet. Da keine Bindungen vorliegen, kann hier auch die vereinfachte Formel angewendet werden: r s = 1 6 n i=1 d2 i (n 2 1)n = =.794. Man würde die Übereinstimmung zwischen den beiden Richtern hier als zufrieden stellend bewerten. 2. Da die Beurteilung des Schweregrads der Verbrechen mittels einer Rangreihe eine auf dem Niveau einer Ordinalskala gemessene Variable darstellt, kommen zur Beurteilung der Übereinstimmung der beiden Richter noch alle weiteren Assoziationsmaße für ordinale Variablen in Betracht. Zusätzlich zur Rangkorrelation wurden die Koeffizienten γ (Gamma) und Kendalls τ b (Tau-b) behandelt. Diese beiden Koeffizienten basieren auf dem Konzept der konkordanten und diskordanten Paare, wobei bei τ b zusätzlich noch die so genannten Bindungen berücksichtigt werden. Zur Bestimmung der Anzahl C der konkordanten Paare, der Anzahl D der diskordanten Paare, der Anzahl T x der Paare mit Bindungen in X (Richter 1) und der Anzahl T y der Paare mit Bindungen in Y (Richter 2) sind insgesamt 10 9/2 = 45 verschiedene Paare von Zeilen in der Tabelle zu betrachten. Es ergeben sich die folgenden Zahlen: C = 36, D = 9, T x = 0, T y = 0 und T xy = 0. Aus diesen Anzahlen berechnet man γ = C D C + D = =.6 und τ b = C D C + D + Tx C + D + Ty = = Die Koeffizienten γ und τ b stimmen überein. Das liegt daran, dass die Rangreihen der Richter keine Bindungen enthalten. Die Koeffizienten γ und τ b sind kleiner als der Rangkorrelationskoeffizient r s. Dieser Unterschied muss nicht verwundern, wenn man sich klar macht, dass die Koeffizienten verschiedene Aspekte des Zusammenhangs erfassen. 13

14 8 Lösung zu Übung 8; Kap Zur Berechnung der Zusammenhangsmaße ist zunächst die Berechnung des χ 2 -Wertes erforderlich: Größe des Unternehmens Fragebogen Fragebogen nicht Gesamt ausgefüllt ausgefüllt klein mittel groß Gesamt Mit und ñ ij = n i n j n und daraus ergibt sich der Wert: χ 2 = χ 2 = k i=1 j= ( ) = 4.87 V = ( ) m (n ij ñ ij ) 2 ñ ij ( ) χ 2 n min(k 1, m 1) = ( ) ( ) ( ) = Cramers V beträgt.16 und deutet somit auf einen eher geringen Zusammenhang zwischen Unternehmensgröße und Ausfüllen des Fragebogens hin. Zur Berechnung von K muss zunächst K bestimmt werden: K = χ 2 χ 2 + n = =.024 =.15 Der Korrigierte Kontingenzkoeffizient K beträgt dann mit K max = 1/2 =.71: K = K/K max =.15/.71 =.21 K beträgt.21. Es fällt auf, dass sich die Ergebnisse für die beiden Zusammenhangsmaße unterscheiden. Dies verwundert nicht, da auch die Berechnungsvorschriften verschieden sind. Cramers V ist bei 3 2-Tabellen generell gegenüber K vorzuziehen, weil nur V auch hier den maximalen Fall von Eins annehmen kann. 3. Als geeignetes PRE-Maß ist hier λ heranzuziehen. Dazu benötigt man die Werte für Fehler 1 und Fehler 2 : Fehler 1 = n max n j = = 98. j 14

15 Fehler 2 = k i=1 (n i max n ij ) = (61 36) + (70 38) + (69 41) = 85. i λ = Fehler 1 Fehler = =.13. Fehler 1 98 Durch Kenntnis der Unternehmensgröße kann die Vorhersage, ob ein Fragebogen ausgefüllt wurde oder nicht, um 13 Prozent verbessert werden im Vergleich zur Vorhersage ohne Kenntnis der Unternehmensgröße. 15

16 9 Lösung zu Übung 9; Kap. 8 Als Maß der Beurteilerübereinstimmung empfiehlt sich Cohens κ. Zur Berechnung werden die Werte auf der Hauptdiagonalen der Indifferenztabelle benötigt. Diese betragen: n 11 : = 14, n 22 : = 12.25, n 33 : = 7.5 Im Anschluss können P a und P c berechnet werden: P a = ( )/100 =.49 P c = ( )/100 =.3375 Daraus folgt: κ = P a P c = = P c =.23 16

17 10 Lösung zu Übung 10; Kap. 9 Bei der Regression von Gewicht auf Körpergröße ergaben sich im SPSS-Output folgende fehlende Werte: 1. SEE: = Der Standardfehler des Schätzers wird durch die Wurzel des Mittels der Quadrate der Residuen SSE = MS E berechnet. Für den vorliegenden Fall schwanken die Gewichtswerte mit einer Standardabweichung von 6.70 kg um die durch die Regressionsgleichung vorhergesagten Werte. 2. SS R : SS T - SS E = = Dies ist die Summe der erklärten Abweichungsquadrate. 3. R 2 : SS R /SS T = / = Prozent der Gesamtvariation des Gewichtes wird durch die Körpergröße erklärt. 4. R:+.789 =.888, r=+.888 In diesem Beispiel korrelieren Gewicht und Körpergröße mit r=

18 11 Lösung zu Übung 11 Kap die Mittelwerte betragen X 1 = 4, X2 = 0.5, Ȳ = die Varianzen betragen s 2 X 1 = 7.429, s 2 X 2 = 0.268, s 2 Y = die Korrelationen betragen r(x 1, X 2 ) = 0, r(x 1, Y ) = 0.260, r(x 2, Y ) = der Determinationskoeffizient R 2 der Regressionsgeraden Ŷ = a + b 1 X 1 ist der Determinationskoeffizient R 2 der Regressionsgeraden Ŷ = a + b 1 X 1 + b 2 X 2 ist

19 12 Lösung zu Übung 12 Kap Berechnen Sie die Regressionsgerade mit GS als Prädiktor und SQ als abhängiger Variablen. b = a = Wie hoch ist der Determinationskoeffizient der Regressionsanalyse aus Teil 1? R 2 = Berechnen Sie den F -Wert für die Regressionsanalysen aus Teil 1. F = /( ) * 694 = Zu klären ist, ob es über den Zusammenhang zwischen GS und der Schulqualität hinaus noch einen zusätzlichen Einfluss von M Q (also der Managementqualität) gibt. Bestimmen Sie hierfür den inkrementellen Determinationskoeffizienten und den inkrementellen F-Wert für MQ gegeben GS. r SQ(MQ GS) = r 2 SQ(MQ GS) = 0,2756 F = 0,2756 / ( (1-0,2756-0,0155) / 693 ) = 269,4 19

Heinz Holling & Günther Gediga. Statistik - Deskriptive Verfahren

Heinz Holling & Günther Gediga. Statistik - Deskriptive Verfahren Heinz Holling & Günther Gediga Statistik - Deskriptive Verfahren Übungen Version 15.12.2010 Inhaltsverzeichnis 1 Übung 1; Kap. 4 3 2 Übung 2; Kap. 5 4 3 Übung 3; Kap. 6 5 4 Übung 4; Kap. 7 6 5 Übung 5;

Mehr

Inhaltsverzeichnis. 1 Über dieses Buch Zum Inhalt dieses Buches Danksagung Zur Relevanz der Statistik...

Inhaltsverzeichnis. 1 Über dieses Buch Zum Inhalt dieses Buches Danksagung Zur Relevanz der Statistik... Inhaltsverzeichnis 1 Über dieses Buch... 11 1.1 Zum Inhalt dieses Buches... 13 1.2 Danksagung... 15 2 Zur Relevanz der Statistik... 17 2.1 Beispiel 1: Die Wahrscheinlichkeit, krank zu sein, bei einer positiven

Mehr

W-Seminar: Versuche mit und am Menschen 2017/2019 Skript

W-Seminar: Versuche mit und am Menschen 2017/2019 Skript 3. Deskriptive Statistik Die deskriptive (auch: beschreibende) Statistik hat zum Ziel, [ ] Daten durch Tabellen, Kennzahlen [ ] und Grafiken übersichtlich darzustellen und zu ordnen. Dies ist vor allem

Mehr

Statistik I für Humanund Sozialwissenschaften

Statistik I für Humanund Sozialwissenschaften Statistik I für Humanund Sozialwissenschaften 1 Übung Lösungsvorschlag Gruppenübung G 1 Auf einer Touristeninsel in der Karibik wurden in den letzten beiden Juliwochen morgens zur gleichen Zeit die folgenden

Mehr

1 x 1 y 1 2 x 2 y 2 3 x 3 y 3... n x n y n

1 x 1 y 1 2 x 2 y 2 3 x 3 y 3... n x n y n 3.2. Bivariate Verteilungen zwei Variablen X, Y werden gemeinsam betrachtet (an jedem Objekt werden gleichzeitig zwei Merkmale beobachtet) Beobachtungswerte sind Paare von Merkmalsausprägungen (x, y) Beispiele:

Mehr

Einführung in die Statistik für Politikwissenschaftler Sommersemester 2011

Einführung in die Statistik für Politikwissenschaftler Sommersemester 2011 Einführung in die Statistik für Politikwissenschaftler Sommersemester 2011 Es können von den Antworten alle, mehrere oder keine Antwort(en) richtig sein. Nur bei einer korrekten Antwort (ohne Auslassungen

Mehr

Mathematische und statistische Methoden II

Mathematische und statistische Methoden II Methodenlehre e e Prof. Dr. G. Meinhardt 6. Stock, Wallstr. 3 (Raum 06-206) Sprechstunde jederzeit nach Vereinbarung und nach der Vorlesung. Mathematische und statistische Methoden II Dr. Malte Persike

Mehr

Ermitteln Sie auf 2 Dezimalstellen genau die folgenden Kenngrößen der bivariaten Verteilung der Merkmale Weite und Zeit:

Ermitteln Sie auf 2 Dezimalstellen genau die folgenden Kenngrößen der bivariaten Verteilung der Merkmale Weite und Zeit: 1. Welche der folgenden Kenngrößen, Statistiken bzw. Grafiken sind zur Beschreibung der Werteverteilung des Merkmals Konfessionszugehörigkeit sinnvoll einsetzbar? A. Der Modalwert. B. Der Median. C. Das

Mehr

Statistik I. 1. Klausur Wintersemester 2010/2011 Hamburg, Art der Anmeldung: STiNE FlexNow Zulassung unter Vorbehalt

Statistik I. 1. Klausur Wintersemester 2010/2011 Hamburg, Art der Anmeldung: STiNE FlexNow Zulassung unter Vorbehalt Statistik I 1. Klausur Wintersemester 2010/2011 Hamburg, 11.02.2011 BITTE LESERLICH IN DRUCKBUCHSTABEN AUSFÜLLEN! Nachname:............................................................................ Vorname:.............................................................................

Mehr

Lage- und Streuungsparameter

Lage- und Streuungsparameter Lage- und Streuungsparameter Beziehen sich auf die Verteilung der Ausprägungen von intervall- und ratio-skalierten Variablen Versuchen, diese Verteilung durch Zahlen zu beschreiben, statt sie graphisch

Mehr

Ausführliche Lösungen zu ausgewählten Aufgaben von ÜB 5 und 6. Streudiagramm

Ausführliche Lösungen zu ausgewählten Aufgaben von ÜB 5 und 6. Streudiagramm y Aufgabe 3 Ausführliche Lösungen zu ausgewählten Aufgaben von ÜB 5 und 6 a) Zur Erstellung des Streudiagramms zeichnet man jeweils einen Punkt für jedes Datenpaar (x i, y i ) aus der zweidimensionalen

Mehr

Deskription, Statistische Testverfahren und Regression. Seminar: Planung und Auswertung klinischer und experimenteller Studien

Deskription, Statistische Testverfahren und Regression. Seminar: Planung und Auswertung klinischer und experimenteller Studien Deskription, Statistische Testverfahren und Regression Seminar: Planung und Auswertung klinischer und experimenteller Studien Deskriptive Statistik Deskriptive Statistik: beschreibende Statistik, empirische

Mehr

Skalenniveaus =,!=, >, <, +, -

Skalenniveaus =,!=, >, <, +, - ZUSAMMENHANGSMAßE Skalenniveaus Nominalskala Ordinalskala Intervallskala Verhältnisskala =,!= =,!=, >, < =,!=, >, ,

Mehr

htw saar 1 EINFÜHRUNG IN DIE STATISTIK: BESCHREIBENDE STATISTIK

htw saar 1 EINFÜHRUNG IN DIE STATISTIK: BESCHREIBENDE STATISTIK htw saar 1 EINFÜHRUNG IN DIE STATISTIK: BESCHREIBENDE STATISTIK htw saar 2 Grundbegriffe htw saar 3 Grundgesamtheit und Stichprobe Ziel: Über eine Grundgesamtheit (Population) soll eine Aussage über ein

Mehr

Eine zweidimensionale Stichprobe

Eine zweidimensionale Stichprobe Eine zweidimensionale Stichprobe liegt vor, wenn zwei qualitative Merkmale gleichzeitig betrachtet werden. Eine Urliste besteht dann aus Wertepaaren (x i, y i ) R 2 und hat die Form (x 1, y 1 ), (x 2,

Mehr

3. Lektion: Deskriptive Statistik

3. Lektion: Deskriptive Statistik Seite 1 von 5 3. Lektion: Deskriptive Statistik Ziel dieser Lektion: Du kennst die verschiedenen Methoden der deskriptiven Statistik und weißt, welche davon für Deine Daten passen. Inhalt: 3.1 Deskriptive

Mehr

Grundlagen der empirischen Sozialforschung

Grundlagen der empirischen Sozialforschung Grundlagen der empirischen Sozialforschung Sitzung 11 - Datenanalyseverfahren Jan Finsel Lehrstuhl für empirische Sozialforschung Prof. Dr. Petra Stein 5. Januar 2009 1 / 22 Online-Materialien Die Materialien

Mehr

Deskriptive Statistik

Deskriptive Statistik Deskriptive Statistik 1 Ziele In der deskriptiven (=beschreibenden) Statistik werden Untersuchungsergebnisse übersichtlich dargestellt, durch Kennzahlen charakterisiert und grafisch veranschaulicht. 2

Mehr

Sommersemester Marktforschung

Sommersemester Marktforschung Dipl.-Kfm. Sascha Steinmann Universität Siegen Lehrstuhl für Marketing steinmann@marketing.uni-siegen.de Sommersemester 2010 Marktforschung Übungsaufgaben zu den Themen 3-6 mit Lösungsskizzen Aufgabe 1:

Mehr

Wiederholung Statistik I. Statistik für SozialwissenschaftlerInnen II p.8

Wiederholung Statistik I. Statistik für SozialwissenschaftlerInnen II p.8 Wiederholung Statistik I Statistik für SozialwissenschaftlerInnen II p.8 Konstanten und Variablen Konstante: Merkmal hat nur eine Ausprägung Variable: Merkmal kann mehrere Ausprägungen annehmen Statistik

Mehr

BOXPLOT 1. Begründung. Boxplot A B C

BOXPLOT 1. Begründung. Boxplot A B C BOXPLOT 1 In nachstehender Tabelle sind drei sortierte Datenreihen gegeben. Zu welchem Boxplot gehört die jeweilige Datenreihe? Kreuze an und begründe Deine Entscheidung! Boxplot A B C Begründung 1 1 1

Mehr

Statistik I für Studierende der Wirtschaftswissenschaften Übungsblatt 12 Prof. Dr. Christian Heumann WS 2015/16

Statistik I für Studierende der Wirtschaftswissenschaften Übungsblatt 12 Prof. Dr. Christian Heumann WS 2015/16 Statistik I für Studierende der Wirtschaftswissenschaften Übungsblatt 2 Prof. Dr. Christian Heumann WS 205/6 Aufgabe : Der Datensatz Theater (verfügbar auf der Homepage) beinhaltet Informationen über eine

Mehr

Was sind Zusammenhangsmaße?

Was sind Zusammenhangsmaße? Was sind Zusammenhangsmaße? Zusammenhangsmaße beschreiben einen Zusammenhang zwischen zwei Variablen Beispiele für Zusammenhänge: Arbeiter wählen häufiger die SPD als andere Gruppen Hochgebildete vertreten

Mehr

Einführung in Quantitative Methoden

Einführung in Quantitative Methoden Einführung in Quantitative Methoden Mag. Dipl.Ing. Dr. Pantelis Christodoulides & Mag. Dr. Karin Waldherr SS 2014 Christodoulides / Waldherr Einführung in Quantitative Methoden- 2.VO 1/57 Die Deskriptivstatistik

Mehr

Statistik. Jan Müller

Statistik. Jan Müller Statistik Jan Müller Skalenniveau Nominalskala: Diese Skala basiert auf einem Satz von qualitativen Attributen. Es existiert kein Kriterium, nach dem die Punkte einer nominal skalierten Variablen anzuordnen

Mehr

Ü B U N G S S K R I P T S T A T I S T I K

Ü B U N G S S K R I P T S T A T I S T I K Ü B U N G S S K R I P T S T A T I S T I K A. Ploner H. Strelec C. Yassouridis Universität für Bodenkultur Department für Raum, Landschaft und Infrastruktur Institut für Angewandte Statistik & EDV Peter-Jordan-Strasse

Mehr

Die Beziehung zwischen ordinal skalierten Variablen

Die Beziehung zwischen ordinal skalierten Variablen Die Beziehung zwischen ordinal skalierten Variablen Schüler Englisch Deutsch a 5 5 b 4 besser 4 besser Konkordante Paare: Die Untersuchungseinheiten können im Hinblick auf X und Y dieselbe Rangordnung

Mehr

Statistik und Wahrscheinlichkeitsrechnung

Statistik und Wahrscheinlichkeitsrechnung Statistik und Wahrscheinlichkeitsrechnung 3. Vorlesung Dr. Jochen Köhler 1 Inhalte der heutigen Vorlesung Ziel: Daten Modellbildung Probabilistisches Modell Wahrscheinlichkeit von Ereignissen Im ersten

Mehr

Bivariate Verteilungen

Bivariate Verteilungen Bivariate Verteilungen Tabellarische Darstellung: Bivariate Tabellen entstehen durch Kreuztabulation zweier Variablen. Beispiel: X Y Student(in) Herkunft Fakultät 0001 Europa Jura 000 Nicht-Europa Medizin

Mehr

Das harmonische Mittel

Das harmonische Mittel Das harmonische Mittel x H := 1 1 n n 1 x i Das harmonische Mittel entspricht dem Mittel durch Transformation t 1 t Beispiel: x 1,..., x n Geschwindigkeiten, mit denen konstante Wegstrecken l zurückgelegt

Mehr

Klausur Statistik I Dr. Andreas Voß Wintersemester 2005/06

Klausur Statistik I Dr. Andreas Voß Wintersemester 2005/06 Klausur Statistik I Dr. Andreas Voß Wintersemester 2005/06 Hiermit versichere ich, dass ich an der Universität Freiburg mit dem Hauptfach Psychologie eingeschrieben bin Name: Mat.Nr.: Unterschrift: Bearbeitungshinweise:

Mehr

Statistische Methoden in den Umweltwissenschaften

Statistische Methoden in den Umweltwissenschaften Statistische Methoden in den Umweltwissenschaften Korrelationsanalysen Kreuztabellen und χ²-test Themen Korrelation oder Lineare Regression? Korrelationsanalysen - Pearson, Spearman-Rang, Kendall s Tau

Mehr

Biomathematik für Mediziner, Klausur WS 1999/2000 Seite 1

Biomathematik für Mediziner, Klausur WS 1999/2000 Seite 1 Biomathematik für Mediziner, Klausur WS 1999/2000 Seite 1 Aufgabe 1: Wieviele der folgenden Variablen sind quantitativ stetig? Schulnoten, Familienstand, Religion, Steuerklasse, Alter, Reaktionszeit, Fahrzeit,

Mehr

Bitte am PC mit Windows anmelden!

Bitte am PC mit Windows anmelden! Einführung in SPSS Plan für heute: Grundlagen/ Vorwissen für SPSS Vergleich der Übungsaufgaben Einführung in SPSS http://weknowmemes.com/generator/uploads/generated/g1374774654830726655.jpg Standardnormalverteilung

Mehr

Karl Entacher. FH-Salzburg

Karl Entacher. FH-Salzburg Ahorn Versteinert Bernhard.Zimmer@fh-salzburg.ac.at Statistik @ HTK Karl Entacher FH-Salzburg karl.entacher@fh-salzburg.ac.at Beispiel 3 Gegeben sind 241 NIR Spektren (Vektoren der Länge 223) zu Holzproben

Mehr

BIOMETRIE I - KLINISCHE EPIDEMIOLOGIE

BIOMETRIE I - KLINISCHE EPIDEMIOLOGIE BIOMETRIE I - KLINISCHE EPIDEMIOLOGIE Wintersemester 2003/04 - Übung zur Vorlesung Biometrie I Ein Lösungsvorschlag von Christian Brockly Lösungsvorschlag zur Übung Biometrie I Bei diesem Dokument handelt

Mehr

Anteile Häufigkeiten Verteilungen Lagemaße Streuungsmaße Merkmale von Verteilungen. Anteile Häufigkeiten Verteilungen

Anteile Häufigkeiten Verteilungen Lagemaße Streuungsmaße Merkmale von Verteilungen. Anteile Häufigkeiten Verteilungen DAS THEMA: VERTEILUNGEN LAGEMAßE - STREUUUNGSMAßE Anteile Häufigkeiten Verteilungen Lagemaße Streuungsmaße Merkmale von Verteilungen Anteile Häufigkeiten Verteilungen Anteile und Häufigkeiten Darstellung

Mehr

Zusammenhänge zwischen metrischen Merkmalen

Zusammenhänge zwischen metrischen Merkmalen Zusammenhänge zwischen metrischen Merkmalen Darstellung des Zusammenhangs, Korrelation und Regression Daten liegen zu zwei metrischen Merkmalen vor: Datenpaare (x i, y i ), i = 1,..., n Beispiel: x: Anzahl

Mehr

6 Korrelations- und Regressionsanalyse: Zusammenhangsanalyse stetiger Merkmale

6 Korrelations- und Regressionsanalyse: Zusammenhangsanalyse stetiger Merkmale 6 Korrelations- und Regressionsanalyse: Zusammenhangsanalyse stetiger Merkmale 397 6.1 Korrelationsanalyse Jetzt betrachten wir bivariate Merkmale (X, Y ), wobei sowohl X als auch Y stetig bzw. quasi-stetig

Mehr

Statistik Skalen (Gurtner 2004)

Statistik Skalen (Gurtner 2004) Statistik Skalen (Gurtner 2004) Nominalskala: Daten haben nur Namen(Nomen) und (eigentlich) keinen Zahlenwert Es kann nur der Modus ( ofteste Wert) berechnet werden Beispiel 1: Die Befragung von 48 Personen

Mehr

Statistik I. 2. Klausur Wintersemester 2011/2012 Hamburg, BITTE LESERLICH IN DRUCKBUCHSTABEN AUSFÜLLEN!

Statistik I. 2. Klausur Wintersemester 2011/2012 Hamburg, BITTE LESERLICH IN DRUCKBUCHSTABEN AUSFÜLLEN! Statistik I A 2. Klausur Wintersemester 2011/2012 Hamburg, 20.03.2012 BITTE LESERLICH IN DRUCKBUCHSTABEN AUSFÜLLEN! Nachname:............................................................................

Mehr

Statistik eindimensionaler Größen

Statistik eindimensionaler Größen Statistik eindimensionaler Größen Michael Spielmann Inhaltsverzeichnis 1 Aufgabe der eindimensionalen Statistik 2 2 Grundbegriffe 2 3 Aufbereiten der Stichprobe 3 4 Die Kennzahlen Mittelwert und Streuung,

Mehr

6Korrelationsanalyse:Zusammengangsanalysestetiger Merkmale

6Korrelationsanalyse:Zusammengangsanalysestetiger Merkmale 6Korrelationsanalyse:Zusammengangsanalysestetiger Merkmale Jetzt betrachten wir bivariate Merkmale (X, Y ), wobei sowohl X als auch Y stetig bzw. quasi-stetig und mindestens ordinalskaliert, typischerweise

Mehr

Kapitel 1 Beschreibende Statistik

Kapitel 1 Beschreibende Statistik Beispiel 1.25: fiktive Aktienkurse Zeitpunkt i 0 1 2 Aktienkurs x i 100 160 100 Frage: Wie hoch ist die durchschnittliche Wachstumsrate? Dr. Karsten Webel 53 Beispiel 1.25: fiktive Aktienkurse (Fortsetzung)

Mehr

Assoziation & Korrelation

Assoziation & Korrelation Statistik 1 für SoziologInnen Assoziation & Korrelation Univ.Prof. Dr. Marcus Hudec Einleitung Bei Beobachtung von Merkmalen stellt sich die Frage, ob es Zusammenhänge oder Abhängigkeiten zwischen den

Mehr

Deskriptive Statistik

Deskriptive Statistik Deskriptive Statistik Deskriptive Statistik: Ziele Daten zusammenfassen durch numerische Kennzahlen. Grafische Darstellung der Daten. Quelle: Ursus Wehrli, Kunst aufräumen 1 Modell vs. Daten Bis jetzt

Mehr

Inhaltsverzeichnis Grundlagen aufigkeitsverteilungen Maßzahlen und Grafiken f ur eindimensionale Merkmale

Inhaltsverzeichnis Grundlagen aufigkeitsverteilungen Maßzahlen und Grafiken f ur eindimensionale Merkmale 1. Grundlagen... 1 1.1 Grundgesamtheit und Untersuchungseinheit................ 1 1.2 Merkmal oder statistische Variable........................ 2 1.3 Datenerhebung.........................................

Mehr

Deskriptive Statistik Aufgaben und Lösungen

Deskriptive Statistik Aufgaben und Lösungen Grundlagen der Wirtschaftsmathematik und Statistik Aufgaben und en Lernmaterial zum Modul - 40601 - der Fernuniversität Hagen Inhaltsverzeichnis 1 Daten und Meßskalen 5 1.1 Konkrete Beispiele...................................

Mehr

Eigene MC-Fragen SPSS. 1. Zutreffend auf die Datenerfassung und Datenaufbereitung in SPSS ist

Eigene MC-Fragen SPSS. 1. Zutreffend auf die Datenerfassung und Datenaufbereitung in SPSS ist Eigene MC-Fragen SPSS 1. Zutreffend auf die Datenerfassung und Datenaufbereitung in SPSS ist [a] In der Variablenansicht werden für die betrachteten Merkmale SPSS Variablen definiert. [b] Das Daten-Editor-Fenster

Mehr

Lösungen zur Klausur zur Statistik Übung am

Lösungen zur Klausur zur Statistik Übung am Lösungen zur Klausur zur Statistik Übung am 28.06.2013 Fabian Kleine Staatswissenschaftliche Fakultät Aufgabe 1 Gegeben sei die folgende geordneten Urliste des Merkmals Y. 30 Punkte Y : 5 5 5 5 10 10 10

Mehr

Deskriptive Statistik. (basierend auf Slides von Lukas Meier)

Deskriptive Statistik. (basierend auf Slides von Lukas Meier) Deskriptive Statistik (basierend auf Slides von Lukas Meier) Deskriptive Statistik: Ziele Daten zusammenfassen durch numerische Kennzahlen. Grafische Darstellung der Daten. Quelle: Ursus Wehrli, Kunst

Mehr

1. Maße der zentralen Tendenz Beispiel: Variable Anzahl der Geschwister aus Jugend '92. Valid Cum Value Frequency Percent Percent Percent

1. Maße der zentralen Tendenz Beispiel: Variable Anzahl der Geschwister aus Jugend '92. Valid Cum Value Frequency Percent Percent Percent Deskriptive Statistik 1. Verteilungsformen symmetrisch/asymmetrisch unimodal(eingipflig) / bimodal (zweigipflig schmalgipflig / breitgipflig linkssteil / rechtssteil U-förmig / abfallend Statistische Kennwerte

Mehr

Dr. Maike M. Burda. Welchen Einfluss hat die Körperhöhe auf das Körpergewicht? Eine Regressionsanalyse. HU Berlin, Econ Bootcamp

Dr. Maike M. Burda. Welchen Einfluss hat die Körperhöhe auf das Körpergewicht? Eine Regressionsanalyse. HU Berlin, Econ Bootcamp Dr. Maike M. Burda Welchen Einfluss hat die Körperhöhe auf das Körpergewicht? Eine Regressionsanalyse. HU Berlin, Econ Bootcamp 8.-10. Januar 2010 BOOTDATA.GDT: 250 Beobachtungen für die Variablen... cm:

Mehr

Der Mittelwert (arithmetisches Mittel)

Der Mittelwert (arithmetisches Mittel) Der Mittelwert (arithmetisches Mittel) x = 1 n n x i bekanntestes Lagemaß instabil gegen extreme Werte geeignet für intervallskalierte Daten Deskriptive Statistik WiSe 2015/2016 Helmut Küchenhoff (Institut

Mehr

Streuungsmaße von Stichproben

Streuungsmaße von Stichproben Streuungsmaße von Stichproben S P A N N W E I T E, V A R I A N Z, S T A N D A R D A B W E I C H U N G, Q U A R T I L E, K O V A R I A N Z, K O R R E L A T I O N S K O E F F I Z I E N T Zentrale Methodenlehre,

Mehr

Statistik und Wahrscheinlichkeitsrechnung

Statistik und Wahrscheinlichkeitsrechnung Statistik und Wahrscheinlichkeitsrechnung Übung 3 1 Inhalt der heutigen Übung Vorrechnen der Hausübung B.7 Beschreibende Statistik Gemeinsames Lösen der Übungsaufgaben C.1: Häufigkeitsverteilung C.2: Tukey

Mehr

Parametrische vs. Non-Parametrische Testverfahren

Parametrische vs. Non-Parametrische Testverfahren Parametrische vs. Non-Parametrische Testverfahren Parametrische Verfahren haben die Besonderheit, dass sie auf Annahmen zur Verteilung der Messwerte in der Population beruhen: die Messwerte sollten einer

Mehr

VS PLUS

VS PLUS VS PLUS Zusatzinformationen zu Medien des VS Verlags Statistik II Inferenzstatistik 2010 Übungsaufgaben und Lösungen Inferenzstatistik 2 [Übungsaufgaben und Lösungenn - Inferenzstatistik 2] ÜBUNGSAUFGABEN

Mehr

Statistik K urs SS 2004

Statistik K urs SS 2004 Statistik K urs SS 2004 3.Tag Grundlegende statistische Maße Mittelwert (mean) Durchschnitt aller Werte Varianz (variance) s 2 Durchschnittliche quadrierte Abweichung aller Werte vom Mittelwert >> Die

Mehr

Musterlösung zur Aufgabensammlung Statistik I Teil 3

Musterlösung zur Aufgabensammlung Statistik I Teil 3 Musterlösung zur Aufgabensammlung Statistik I Teil 3 2008, Malte Wissmann 1 Zusammenhang zwischen zwei Merkmalen Nominale, Ordinale Merkmale und Mischungen Aufgabe 12 a) x\ y 1.Klasse 2.Klasse 3.Klasse

Mehr

Herzlich willkommen zur Vorlesung Statistik. Streuungsmaße oder die Unterschiedlichkeit der Daten nebst kurzen Ausführungen zu Schiefe und Wölbung

Herzlich willkommen zur Vorlesung Statistik. Streuungsmaße oder die Unterschiedlichkeit der Daten nebst kurzen Ausführungen zu Schiefe und Wölbung FB 1 W. Ludwig-Mayerhofer Statistik 1 Herzlich willkommen zur Vorlesung Statistik smaße oder die Unterschiedlichkeit der Daten nebst kurzen Ausführungen zu Schiefe und Wölbung FB 1 W. Ludwig-Mayerhofer

Mehr

Kapitel 7. Regression und Korrelation. 7.1 Das Regressionsproblem

Kapitel 7. Regression und Korrelation. 7.1 Das Regressionsproblem Kapitel 7 Regression und Korrelation Ein Regressionsproblem behandelt die Verteilung einer Variablen, wenn mindestens eine andere gewisse Werte in nicht zufälliger Art annimmt. Ein Korrelationsproblem

Mehr

Weitere Lagemaße: Quantile/Perzentile I

Weitere Lagemaße: Quantile/Perzentile I 3 Auswertung von eindimensionalen Daten Lagemaße 3.3 Weitere Lagemaße: Quantile/Perzentile I Für jeden Median x med gilt: Mindestens 50% der Merkmalswerte sind kleiner gleich x med und ebenso mindestens

Mehr

Lösung Aufgabe 19. ( ) = [Mio Euro]. Empirische Varianz s 2 = 1 n

Lösung Aufgabe 19. ( ) = [Mio Euro]. Empirische Varianz s 2 = 1 n Statistik I für Statistiker, Mathematiker und Informatiker Lösungen zu Blatt 4 Gerhard Tutz, Jan Ulbricht, Jan Gertheiss WS 07/08 Lösung Aufgabe 9 (a) Lage und Streuung: Arithmetisches Mittel x = n i=

Mehr

Dr. Maike M. Burda. Welchen Einfluss hat die Körperhöhe auf das Körpergewicht? Eine Regressionsanalyse. HU Berlin, Econ Bootcamp 7.-9.

Dr. Maike M. Burda. Welchen Einfluss hat die Körperhöhe auf das Körpergewicht? Eine Regressionsanalyse. HU Berlin, Econ Bootcamp 7.-9. Dr. Maike M. Burda Welchen Einfluss hat die Körperhöhe auf das Körpergewicht? Eine Regressionsanalyse. HU Berlin, Econ Bootcamp 7.-9. Januar 2011 BOOTDATA11.GDT: 250 Beobachtungen für die Variablen...

Mehr

Die erhobenen Daten werden zunächst in einer Urliste angeschrieben. Daraus ermittelt man:

Die erhobenen Daten werden zunächst in einer Urliste angeschrieben. Daraus ermittelt man: Die erhobenen Daten werden zunächst in einer Urliste angeschrieben. Daraus ermittelt man: a) Die absoluten Häufigkeit: Sie gibt an, wie oft ein Variablenwert vorkommt b) Die relative Häufigkeit: Sie erhält

Mehr

Einführung in die Korrelationsrechnung

Einführung in die Korrelationsrechnung Einführung in die Korrelationsrechnung Sven Garbade Fakultät für Angewandte Psychologie SRH Hochschule Heidelberg sven.garbade@hochschule-heidelberg.de Statistik 1 S. Garbade (SRH Heidelberg) Korrelationsrechnung

Mehr

Die erhobenen Daten werden zunächst in einer Urliste angeschrieben. Daraus ermittelt man:

Die erhobenen Daten werden zunächst in einer Urliste angeschrieben. Daraus ermittelt man: Die erhobenen Daten werden zunächst in einer Urliste angeschrieben. Daraus ermittelt man: a) Die absoluten Häufigkeit: Sie gibt an, wie oft ein Variablenwert vorkommt b) Die relative Häufigkeit: Sie erhält

Mehr

Statistik und Wahrscheinlichkeitsrechnung

Statistik und Wahrscheinlichkeitsrechnung Statistik und Wahrscheinlichkeitsrechnung Dr. Jochen Köhler 26.02.2008 1 Warum Statistik und Wahrscheinlichkeits rechnung im Ingenieurwesen? Zusammenfassung der letzten Vorlesung Statistik und Wahrscheinlichkeitsrechnung

Mehr

Statistik Klausur Wintersemester 2013/2014 Hamburg, BITTE LESERLICH IN DRUCKBUCHSTABEN AUSFÜLLEN!

Statistik Klausur Wintersemester 2013/2014 Hamburg, BITTE LESERLICH IN DRUCKBUCHSTABEN AUSFÜLLEN! Statistik 1 1. Klausur Wintersemester 2013/2014 Hamburg, 12.02.2014 BITTE LESERLICH IN DRUCKBUCHSTABEN AUSFÜLLEN! Nachname:............................................................................ Vorname:.............................................................................

Mehr

Einführung in Quantitative Methoden

Einführung in Quantitative Methoden Einführung in Quantitative Methoden Mag. Dipl.Ing. Dr. Pantelis Christodoulides & Mag. Dr. Karin Waldherr SS 2011 Christodoulides / Waldherr Einführung in Quantitative Methoden- 2.VO 1/62 Summenzeichen

Mehr

Mathematische und statistische Methoden I

Mathematische und statistische Methoden I Prof. Dr. G. Meinhardt 6. Stock, Wallstr. 3 (Raum 06-06) Sprechstunde jederzeit nach Vereinbarung und nach der Vorlesung. Mathematische und statistische Methoden I Dr. Malte Persike persike@uni-mainz.de

Mehr

Aufgabe 3 Bei 16 PKWs desselben Typs wurde der Benzinverbrauch pro 100 km gemessen. Dabei ergab sich die folgende Urliste (in Liter pro 100km):

Aufgabe 3 Bei 16 PKWs desselben Typs wurde der Benzinverbrauch pro 100 km gemessen. Dabei ergab sich die folgende Urliste (in Liter pro 100km): Mathematik II für Naturwissenschaften Dr. Christine Zehrt 21.02.19 Übung 1 (für Pharma/Geo/Bio/Stat) Uni Basel Besprechung der Lösungen: 26./27. Februar 2019 in den Übungsstunden Bestimmen Sie zu den folgenden

Mehr

5.5 PRE-Maße (Fehlerreduktionsmaße) 6

5.5 PRE-Maße (Fehlerreduktionsmaße) 6 359 5.5 PRE-Maße (Fehlerreduktionsmaße) 6 5.5.1 Die grundlegende Konstruktion Völlig andere, sehr allgemeine Grundidee zur Beschreibung von Zusammenhängen. Grundlegendes Prinzip vieler statistischer Konzepte.

Mehr

Merkmalstypen Univ.-Prof. Dr. rer. nat. et med. habil. Andreas Faldum

Merkmalstypen Univ.-Prof. Dr. rer. nat. et med. habil. Andreas Faldum 1 Merkmalstypen Quantitativ: Geordnete Werte, Vielfache einer Einheit Stetig: Prinzipiell sind alle Zwischenwerte beobachtbar Beispiele: Gewicht, Größe, Blutdruck Diskret: Nicht alle Zwischenwerte sind

Mehr

Statistik I. Zusammenfassung und wichtiges zur Prüfungsvorbereitung. Malte Wissmann. 9. Dezember Universität Basel.

Statistik I. Zusammenfassung und wichtiges zur Prüfungsvorbereitung. Malte Wissmann. 9. Dezember Universität Basel. Zusammenfassung und wichtiges zur Prüfungsvorbereitung 9. Dezember 2008 Begriffe Kenntnis der wichtigen Begriffe und Unterscheidung dieser. Beispiele: Merkmal, Merkmalsraum, etc. Skalierung: Nominal etc

Mehr

Tutorium Mathematik in der gymnasialen Oberstufe 1. Veranstaltung: Beschreibende Statistik 19. Oktober 2016

Tutorium Mathematik in der gymnasialen Oberstufe 1. Veranstaltung: Beschreibende Statistik 19. Oktober 2016 Tutorium Mathematik in der gymnasialen Oberstufe 1. Veranstaltung: Beschreibende Statistik 19. Oktober 2016 1. Daten erfassen 1. Aufgabe: Würfeln Sie 30-mal mit einem regelmäßigen Oktaeder und dokumentieren

Mehr

beruflicher Bildungsabschluss incl. Hochschulabschl. 4Kat.(m) Häufigkeit Prozent Gültig Lehre/Beruffachgesundh.Schule ,2 59,2 59,2

beruflicher Bildungsabschluss incl. Hochschulabschl. 4Kat.(m) Häufigkeit Prozent Gültig Lehre/Beruffachgesundh.Schule ,2 59,2 59,2 Häufigkeiten Deskriptive Statistiken Häufigkeiten Beruflicher Bildungsabschluss (Mbfbil4) Zielvariablenliste OK Er erscheint: Statistiken beruflicher Bildungsabschluss incl. N Gültig 3445 Fehlend 0 beruflicher

Mehr

Deskriptive Statistik

Deskriptive Statistik Deskriptive Statistik Lösungen+ Aufgabe 1.1 (a) Sammelnde Statistik: Wahl einer zufälligen Stichprobe aus der Grundgesamtheit. (b) Beschreibende (deskriptive) Statistik: Aufbereitung der Stichprobe (oder

Mehr

Statistik I. 2. Klausur Wintersemester 2011/2012 Hamburg, BITTE LESERLICH IN DRUCKBUCHSTABEN AUSFÜLLEN!

Statistik I. 2. Klausur Wintersemester 2011/2012 Hamburg, BITTE LESERLICH IN DRUCKBUCHSTABEN AUSFÜLLEN! Statistik I A 2. Klausur Wintersemester 2011/2012 Hamburg, 20.03.2012 BITTE LESERLICH IN DRUCKBUCHSTABEN AUSFÜLLEN! Nachname:............................................................................

Mehr

Kapitel 3: Lagemaße. Ziel. Komprimierung der Daten zu einer Kenngröße, welche die Lage, das Zentrum der Daten beschreibt

Kapitel 3: Lagemaße. Ziel. Komprimierung der Daten zu einer Kenngröße, welche die Lage, das Zentrum der Daten beschreibt Kapitel 3: Lagemaße Ziel Komprimierung der Daten zu einer Kenngröße, welche die Lage, das Zentrum der Daten beschreibt Dr. Matthias Arnold 52 Definition 3.1 Seien x 1,...,x n Ausprägungen eines kardinal

Mehr

Verfahren für metrische Variable

Verfahren für metrische Variable Verfahren für metrische Variable Grafische Methoden Histogramm Mittelwertsplot Boxplot Lagemaße Mittelwert, Median, Quantile Streuungsmaße Standardabweichung, Interquartilsabstand Lagemaße und Streumaße

Mehr

Univariate Häufigkeitsverteilungen Kühnel, Krebs 2001: Statistik für die Sozialwissenschaften, S.41-66

Univariate Häufigkeitsverteilungen Kühnel, Krebs 2001: Statistik für die Sozialwissenschaften, S.41-66 Univariate Häufigkeitsverteilungen Kühnel, Krebs 2001: Statistik für die Sozialwissenschaften, S.41-66 Gabriele Doblhammer: Empirische Sozialforschung Teil II, SS 2004 1/19 Skalenniveaus Skalenniveau Relation

Mehr

Übungsrunde 2, Gruppe 2 LVA , Übungsrunde 1, Gruppe 2, Markus Nemetz, TU Wien, 10/2006

Übungsrunde 2, Gruppe 2 LVA , Übungsrunde 1, Gruppe 2, Markus Nemetz, TU Wien, 10/2006 1 1.2.3.4. 1.1 Angabe Übungsrunde 2, Gruppe 2 LVA 107.369, Übungsrunde 1, Gruppe 2, 24.10. Markus Nemetz, markus.nemetz@tuwien.ac.at, TU Wien, 10/2006 Bestimmen Sie für den Datensatz bulb.dat die Quartile,

Mehr

Diese Lücken sollten nicht auch bei Ihnen vorhanden sein: Aufgrund einer statistischen Untersuchung entsteht eine geordnete bzw. ungeordnete, die durc

Diese Lücken sollten nicht auch bei Ihnen vorhanden sein: Aufgrund einer statistischen Untersuchung entsteht eine geordnete bzw. ungeordnete, die durc SS 2017 Torsten Schreiber 222 Diese Lücken sollten nicht auch bei Ihnen vorhanden sein: Aufgrund einer statistischen Untersuchung entsteht eine geordnete bzw. ungeordnete, die durch Summierung je Ausprägung

Mehr

Mathematische und statistische Methoden I

Mathematische und statistische Methoden I Prof. Dr. G. Meinhardt Methodenlehre Mathematische und statistische Methoden I Sprechstunde jederzeit nach Vereinbarung und nach der Vorlesung Wallstr. 3, 6. Stock, Raum 06-206 Dr. Malte Persike persike@uni-mainz.de

Mehr

Deskriptive Statistik Winfried Zinn

Deskriptive Statistik Winfried Zinn Deskriptive Statistik Winfried Zinn Inhalte Statistik 1 1. Themenblock: Grundlagen der beschreibenden Statistik: Skalenniveaus Häufigkeitsverteilungen Mittelwerte (Lagemaße) Standardabweichung und Varianzen

Mehr

Statistik I für Betriebswirte Vorlesung 9

Statistik I für Betriebswirte Vorlesung 9 Statistik I für Betriebswirte Vorlesung 9 Dr. Andreas Wünsche TU Bergakademie Freiberg Institut für Stochastik Vorlesung am 8. Juni 2017 im Audi-Max (AUD-1001) Dr. Andreas Wünsche Statistik I für Betriebswirte

Mehr

Deskriptive Statistik Lösungen zu Blatt 5 Christian Heumann, Susanne Konrath SS Lösung Aufgabe 27. f X Y (a i b j ) = f i j = f ij f j

Deskriptive Statistik Lösungen zu Blatt 5 Christian Heumann, Susanne Konrath SS Lösung Aufgabe 27. f X Y (a i b j ) = f i j = f ij f j 1 Deskriptive Statistik Lösungen zu Blatt 5 Christian Heumann, Susanne Konrath SS 2011 Lösung Aufgabe 27 (a) Notation: X: Rauchen, Y : chronische Bronchitis S X {ja, nein} {a 1, a 2 }, S Y {ja, nein} {b

Mehr

Forschungsstatistik I, WS2008/2009

Forschungsstatistik I, WS2008/2009 Forschungsstatistik I, WS2008/2009 Abschlussklausur - Deskriptive Statistik, Korrelation & Regression 1. Termin Forschungsstatistik I WS2008/2009 Abschlussklausur - Deskriptive Statistik Name: Matrikel-Nr.:

Mehr

Geg.: Eine Menge von Elementen, z.b.

Geg.: Eine Menge von Elementen, z.b. 1.3 Zweidimensionale Häufigkeitsverteilungen Geg.: Eine Menge von Elementen, z.b. Schüler einer Schule Soldaten eines Bataillons Schrauben einer Stichprobe Tage eines Jahrhunderts Betrachtet werden zwei

Mehr

STATISTIK I Übung 07 Box-Plots und Stem-and-Leaf-Diagramme. 1 Kurze Wiederholung. Warum nur zwei grafische Darstellungsformen?

STATISTIK I Übung 07 Box-Plots und Stem-and-Leaf-Diagramme. 1 Kurze Wiederholung. Warum nur zwei grafische Darstellungsformen? STATISTIK I Übung 07 Box-Plots und Stem-and-Leaf-Diagramme 1 Kurze Wiederholung Warum nur zwei grafische Darstellungsformen? Im Rahmen der Vorlesungen haben wir kurz eine ganze Reihe grafischer Darstellungsformen

Mehr

ÜBUNGSAUFGABEN ZUR DESKRIPTIVEN UND EXPLORATIVEN DATENANALYSE

ÜBUNGSAUFGABEN ZUR DESKRIPTIVEN UND EXPLORATIVEN DATENANALYSE ÜBUNGSAUFGABEN ZUR DESKRIPTIVEN UND EXPLORATIVEN DATENANALYSE 1.1 Füllen Sie bitte folgenden Lückentext aus. Daten, die in Untersuchungen erhoben werden, muss man grundsätzlich nach ihrem unterscheiden.

Mehr

Beschreibende Statistik Eindimensionale Daten

Beschreibende Statistik Eindimensionale Daten Mathematik II für Biologen 16. April 2008 Stichproben Geordnete Stichprobe Rang Maße für die mittlere Lage der Daten Robustheit Quantile Maße für die Streuung der Daten Erkennung potentieller Eindimensionales

Mehr

Forschungsstatistik I

Forschungsstatistik I Psychologie Prof. Dr. G. Meinhardt 6. Stock, TB II R. 06-206 (Persike) R. 06-321 (Meinhardt) Sprechstunde jederzeit nach Vereinbarung Forschungsstatistik I Dr. Malte Persike persike@uni-mainz.de http://psymet03.sowi.uni-mainz.de/

Mehr

Assoziation & Korrelation

Assoziation & Korrelation Statistik 1 für SoziologInnen Assoziation & Korrelation Univ.Prof. Dr. Marcus Hudec Einleitung Bei Beobachtung von 2 Merkmalen stellt sich die Frage, ob es Zusammenhänge oder Abhängigkeiten zwischen den

Mehr