Stochastik und Statistik für Ingenieure Vorlesung 10

Größe: px
Ab Seite anzeigen:

Download "Stochastik und Statistik für Ingenieure Vorlesung 10"

Transkript

1 Prof. Dr. Hans-Jörg Starkloff TU Bergakademie Freiberg Institut für Stochastik Stochastik und Statistik für Ingenieure Vorlesung Dezember 2012

2 4.2. Graphiken und statistische Maßzahlen (Kenngrößen, Parameter) für Daten Graphiken und statistische Maßzahlen dienen dazu, einen Überblick über die vorliegenden Daten zu erhalten, Vorstellungen über mögliche zugrundeliegende Verteilungen, Eigenschaften oder Besonderheiten zu entwickeln oder einfache Beschreibungen der Daten mit wenigen, möglichst aussagekräftigen Kenngrößen zu ermöglichen. In Abhängigkeit von den Skalenniveaus und anderen Eigenschaften der Daten (wie z.b. univariate, bivariate oder multivariate Datensätze) können unterschiedliche Graphiken und Kenngrößen genutzt werden. Im Rahmen dieser Vorlesung werden nicht alle Möglichkeiten vorgestellt, sondern nur eine Auswahl von häufiger verwendeten bzw. aussagekräftigen Graphiken und Maßzahlen. Prof. Dr. Hans-Jörg Starkloff (TUBAF) Stochastik/Statistik für Ingenieure Vorlesung 10 1

3 Fragestellungen im Zusammenhang mit den Graphiken Für welche Daten eignet sich die Graphik? Wie ist die Graphik aufgebaut? Wie interpretiert man die Graphik? Welche Informationen kann die Graphik liefern und warum? Welche Informationen kann die Graphik nicht liefern und warum? Versucht man mit einer vorliegenden Graphik zu täuschen, etwas bestimmtes zu suggerieren? (Zitat, zu finden z.b. in Benesch, Schlüsselkonzepte zur Statistik, Springer, 2013, S.2: Die Statistik ist dem Politiker, was die Laterne dem Betrunkenen ist: Sie dient zum Festhalten, nicht der Erleuchtung. ) Prof. Dr. Hans-Jörg Starkloff (TUBAF) Stochastik/Statistik für Ingenieure Vorlesung 10 2

4 Graphiken für univariate stetige Daten (a) Punktdiagramme Ein Punktdiagramm kann für ein stetiges Merkmal erstellt werden. Dabei werden die Beobachtungswerte durch Punkte auf einem geeigneten Abschnitt der reellen Zahlengeraden markiert. Man erhält einen Überblick über den Bereich, in dem Beobachtungswerte liegen und wie stark sie streuen. Teilweise kann man Teilbereiche erkennen, in denen sich die Beobachtungswerte häufen oder seltener vorkommen. Ebenfalls kann man sehr große oder sehr kleine Beobachtungswerte, die von der Masse der Werte relativ weit entfernt sind und eventuell als Ausreißer zu behandeln sind, erkennen. Die Zusatzinformationen zum Datensatz muss ggf. mit genutzt werden (falls Daten transformiert sind etc.). Prof. Dr. Hans-Jörg Starkloff (TUBAF) Stochastik/Statistik für Ingenieure Vorlesung 10 3

5 Probleme mit Punktdiagrammen Zusammenfallende oder sehr nah beieinander liegende Beobachtungswerte sind im Diagramm nicht mehr unterscheidbar, so dass Punkte durch Überdeckung verloren gehen können. Diese Problem kann man beheben, indem man die Punktpositionen in die ungenutzte Richtung (vertikal bei horizontalen Punktdiagrammen) durch systematisches Stapeln (gestapeltes Punktdiagramm) oder durch zufälliges Verzittern (verzittertes Punktdiagramm) verschiebt. Ein verzittertes Punktdiagramm sieht nach jedem Neuzeichnen anders aus. Beim gestapelten Punktdiagramm können Muster vorgegaukelt werden, die aber nur sehr zufällig und damit wenig aussagekräftig sind. Die Verteilung der Punkte kann nicht immer gut erfasst werden. Prof. Dr. Hans-Jörg Starkloff (TUBAF) Stochastik/Statistik für Ingenieure Vorlesung 10 4

6 Punktdiagramm für Datensatz Lichtgeschwindigkeitsmessungen > data(morley) > lightspeeds=morley$speed > stripchart(lightspeeds, main= Punktdiagramm Lichtgeschwindigkeitsmessungen ) Punktdiagramm Lichtgeschwindigkeitsmessungen Prof. Dr. Hans-Jörg Starkloff (TUBAF) Stochastik/Statistik für Ingenieure Vorlesung 10 5

7 Gestapeltes Punktdiagramm für Beispiel > stripchart(lightspeeds,method= stack, main= Gestapeltes Punktdiagramm Lichtgeschwindigkeitsmessungen ) Gestapeltes Punktdiagramm Lichtgeschwindigkeitsmessungen Prof. Dr. Hans-Jörg Starkloff (TUBAF) Stochastik/Statistik für Ingenieure Vorlesung 10 6

8 Verzittertes Punktdiagramm für Beispiel > stripchart(lightspeeds,method= jitter, main= Verzittertes Punktdiagramm Lichtgeschwindigkeitsmessungen ) Verzittertes Punktdiagramm Lichtgeschwindigkeitsmessungen Prof. Dr. Hans-Jörg Starkloff (TUBAF) Stochastik/Statistik für Ingenieure Vorlesung 10 7

9 (b) Histogramme Ausgangspunkt für ein Histogramm ist eine Klasseneinteilung der Beobachtungswerte. Dazu wird ein Intervall, in dem alle Beobachtungswerte liegen, in eine endliche Anzahl disjunkter Teilintervalle, die sogenannten Klassen oder Gruppen zerlegt. Jede Klasse ist dann eindeutig durch die Klassenmitte und die Klassenbreite bzw. durch die untere und obere Klassengrenze bestimmt. Die Anzahl der Klassen sollte nicht zu klein und nicht zu groß sein. Die Klassenbreiten sollten übereinstimmen (ggf. mit Ausnahme der Randklassen). Nach Festlegung einer Klasseneinteilung werden die absoluten Klassenhäufigkeiten bestimmt, d.h. für jede Klasse wird die Anzahl der Beobachtungswerte in der Klasse gezählt. Dann werden in einem Koordinatensystem aneinanderstoßende Rechtecke mit den Klassenintervallen als Basis und Höhen proportional zur Klassenhäufigkeit gezeichnet. Prof. Dr. Hans-Jörg Starkloff (TUBAF) Stochastik/Statistik für Ingenieure Vorlesung 10 8

10 Histogramm für Beispiel Lichtgeschwindigkeiten > hist(lightspeeds) Histogram of lightspeeds Frequency lightspeeds Prof. Dr. Hans-Jörg Starkloff (TUBAF) Stochastik/Statistik für Ingenieure Vorlesung 10 9

11 Histogramm und gestapeltes Punktdiagramm für Beispiel > hist(lightspeeds) > stripchart(lightspeeds,method= stack,add=t,col=2) Histogram of lightspeeds Frequency lightspeeds Prof. Dr. Hans-Jörg Starkloff (TUBAF) Stochastik/Statistik für Ingenieure Vorlesung 10 10

12 Histogramm mit 3 Klassen und Punktdiagramm für Beispiel > b=c(299600,299800,300000,300200) > hist(lightspeeds,breaks=b) > stripchart(lightspeeds,method= stack,add=t,col=2) Histogram of lightspeeds Frequency lightspeeds Prof. Dr. Hans-Jörg Starkloff (TUBAF) Stochastik/Statistik für Ingenieure Vorlesung 10 11

13 Histogramm mit 50 Klassen und Punktdiagramm für Beispiel > b=c(seq(299600,300100,by=10)) > hist(lightspeeds,breaks=b) > stripchart(lightspeeds,method= stack,add=t,col=2) Histogram of lightspeeds Frequency lightspeeds Prof. Dr. Hans-Jörg Starkloff (TUBAF) Stochastik/Statistik für Ingenieure Vorlesung 10 12

14 Bemerkungen zu Histogrammen Die Gestalt eines Histogramms hängt stark von der gewählten Klasseneinteilung (und auch des gewählten Gesamtintervalls) ab, deshalb sollte man ggf. etwas experimentieren, um ein möglichst aussagekräftiges Histogramm zu erzeugen. Durch die Klasseneinteilung geht Information verloren. Man kann eventuell Ausreißer am linken oder rechten Rand erkennen. Man kann eventuell Verteilungseigenschaften, wie Symmetrie oder Schiefe erkennen (oder erahnen). Bei unterschiedlichen Klassenbreiten sollten die Flächeninhalte der Rechtecke proportional zu den Häufigkeiten sein. Statt der absoluten Häufigkeiten können die Höhen der Rechtecke auch so normiert werden, dass der Gesamtflächeninhalt unter allen Rechtecken gleich 1 ist. Dann ist ein (meist nicht sehr belastbarer) Vergleich mit einer Verteilungsdichte möglich. Prof. Dr. Hans-Jörg Starkloff (TUBAF) Stochastik/Statistik für Ingenieure Vorlesung 10 13

15 Histogramm mit Normalverteilungsdichteschätzung für Beispiel > hist(lightspeeds,freq=f) > curve(dnorm(x,mean(lightspeeds),sd(lightspeeds)),add=t,col=2) Histogram of lightspeeds Density lightspeeds Prof. Dr. Hans-Jörg Starkloff (TUBAF) Stochastik/Statistik für Ingenieure Vorlesung 10 14

16 (c) Kenngrößen und Parameter zur Beschreibung von Daten Lageparameter Mittelwerte (arithmetisch, geometrisch, harmonisch) empirischer Median empirische Quantile (Quartile, Dezentile,... ) Variabililitätsparameter (Streuparameter) empirische Varianz empirische Standardabweichung Spannweite empirischer (Inter-)Quartilsabstand IQR empirischer Variationskoeffizient empirische geometrische Standardabweichung Formparameter (später) empirische Schiefe empirische Wölbung Prof. Dr. Hans-Jörg Starkloff (TUBAF) Stochastik/Statistik für Ingenieure Vorlesung 10 15

17 (c01) Arithmetischer Mittelwert Für reelle Beobachtungswerte x 1, x 2,..., x n ist der arithmetische Mittelwert definiert durch x = 1 n x i = 1 n n (x 1 + x x n ). i=1 In der Statistik wird er als Realisierung des Stichprobenmittelwerts (eine spezielle Stichproben- oder Schätzfunktion) X = 1 n n X i = 1 n (X 1 + X X n ) i=1 einer mathematischen Stichprobe (X 1, X 2,..., X n ) (unabhängige und identisch verteilte Zufallsgrößen) betrachtet. Diese liefert unter geeigneten Voraussetzungen eine erwartungstreue und konsistente Schätzfunktion für den Erwartungswert der Zufallsgrößen X i : ÊX = X. Prof. Dr. Hans-Jörg Starkloff (TUBAF) Stochastik/Statistik für Ingenieure Vorlesung 10 16

18 Arithmetischer Mittelwert in R Der Befehl in R zur Berechnung des (arithmetischen) Mittelwertes ist mean(). > mean(lightspeeds) [1] Histogram of lightspeeds Ein Histogramm mit Mittelwertslinie kann dann so erzeugt werden: > hist(lightspeeds) > abline(v=mean(lightspeeds),col=2) Frequency lightspeeds Prof. Dr. Hans-Jörg Starkloff (TUBAF) Stochastik/Statistik für Ingenieure Vorlesung 10 17

19 (c02) Geometrischer Mittelwert Für nichtnegative reelle Beobachtungswerte (einer ratio-skala) x 1, x 2,..., x n ist der geometrische Mittelwert definiert durch x G = n n x i = (x 1 x 2... x n ) 1 n. i=1 Bemerkung: Es gilt immer x G x. Anwendung findet er zum Beispiel, wenn eine logarithmische Skala (Transformation) sinnvoll ist oder die Merkmalsausprägungen relative Änderungen sind, so bei der Mittelung von Wachstumsfaktoren. In R kann man die Exponentialfunktion zur Berechnung von geometrischen Mittelwerten nutzen: ( ) 1 n x G = exp ln(x i ). n i=1 Prof. Dr. Hans-Jörg Starkloff (TUBAF) Stochastik/Statistik für Ingenieure Vorlesung 10 18

20 Beispiel zum geometrischen Mittelwert Beispiel: Zeitpunkt Zustandswert Merkmalswert=Wachstumsfaktor x 1 = 0.81 x 2 = x G = aber x = (obwohl insgesamt keine Änderung des Zustandswerts zum Ausgangszeitpunkt vorliegt). In R ergibt zum Beispiel: > x=c(81/100,100/81) > exp(mean(log(x))) [1] 1 > mean(x) [1] Bemerkung: log(x) berechnet in R den Vektor der natürlichen Logarithmen des Vektors x. Prof. Dr. Hans-Jörg Starkloff (TUBAF) Stochastik/Statistik für Ingenieure Vorlesung 10 19

21 (c03) Harmonischer Mittelwert In manchen Situationen ist für nur positive (oder nur negative) Beobachtungswerte x 1, x 2,..., x n der harmonische Mittelwert x H = besser geeignet, so z.b. Mittelwertbildung von Anteilen oder Prozentzahlen oder bei der Berechnung von Durchschittsgeschwindigkeiten (gleichlange Teilstrecken) oder Durchschnittspreisen. Gilt x i > 0 für alle i = 1,..., n, dann gilt immer n n i=1 1 x i x H x G x. Im Fall von x 1 = x 2 =... = x n = x > 0 erhält man x H = x G = x = x. Prof. Dr. Hans-Jörg Starkloff (TUBAF) Stochastik/Statistik für Ingenieure Vorlesung 10 20

22 Beispiel zum harmonischen Mittelwert Beispiel: Konstante Geschwindigkeiten auf jeweiligen Teilstrecken Teil-/Gesamtstrecke Streckenlänge in km Zeit in h Geschwindigkeit in km/h x 1 = 50 x 2 = = x H = 2 = 66.66, aber x = 75 und x G = In R (ab dem Zeichen # beginnt ein Kommentar): > x=c(50,100) > 1/mean(1/x) # Harmonisches Mittel [1] > mean(x) # Arithmetisches Mittel [1] 75 > exp(mean(log(x))) # Geometrisches Mittel [1] Prof. Dr. Hans-Jörg Starkloff (TUBAF) Stochastik/Statistik für Ingenieure Vorlesung 10 21

23 (c04) Empirischer Median Der empirische Median oder Zentralwert der Beobachtungsreihe x 1, x 2,..., x n ist dadurch gekennzeichnet, dass jeweils 50 % der Beobachtungswerte einen Wert größer oder gleich bzw. kleiner oder gleich dem empirischen Median annehmen. Sind x (1) x (2)... x (n) die der Größe nach geordneten Beobachtungswerte, kann der (empirische) Median x durch x n+1 2 ), falls n ungerade, x = (, falls n gerade, bestimmt werden. 1 2 x ( n 2 ) + x ( n 2 +1) ) Prof. Dr. Hans-Jörg Starkloff (TUBAF) Stochastik/Statistik für Ingenieure Vorlesung 10 22

24 Beispiele zum empirischen Median Beobachtungswerte 4, 5, 1, 3, 6, 7, 8 n = 7, x = 5, x = Beobachtungswerte 4, 5, 1, 3, 6, 7 n = 6, x = 4.5, x = Beobachtungswerte 9, 10, 8, 11, 12, 9, 1000 n = 7, x = 10, x = Der Median ist weniger empfindlich gegenüber Ausreißern in der Beobachtungsreihe, d.h. Werte, die weit von den übrigen entfernt liegen, beeinflussen den Median nicht (oder kaum). Dies trifft auf den arithmetischen Mittelwert im Allgemeinen nicht zu. In R: > median(lightspeeds) [1] Der Median kann sogar für Daten auf einer nur ordinalen Skala genutzt werden (wenn z.b. die Addition, die zur Bildung des arithmetischen Mittelwerts notwendig ist, gar keinen Sinn macht). Prof. Dr. Hans-Jörg Starkloff (TUBAF) Stochastik/Statistik für Ingenieure Vorlesung 10 23

25 Histogramm mit Linie für Mittelwert (rot) und Median (blau) für Beispiel > hist(lightspeeds) > abline(v=mean(lightspeeds),col=2) > abline(v=median(lightspeeds),col=4) Histogram of lightspeeds Frequency lightspeeds Prof. Dr. Hans-Jörg Starkloff (TUBAF) Stochastik/Statistik für Ingenieure Vorlesung 10 24

26 (c05) Empirische Quantile Ein Ordnen der Datenreihe x 1, x 2,..., x n der Größe nach ergibt die geordnete Datenreihe (geordnete Stichprobe, Variationsreihe) x min := x (1) x (2)... x (n 1) x (n) =: x max. Andere Bezeichnungen für die Variationsreihe sind x 1 x 2... x n oder x 1:n x 2:n... x n:n. Das empirisches p Quantil mit 0 < p < 1 ist ein Zahlenwert ˆx p (oder bezeichnet mit x p ) für den gilt, dass p 100% der Werte in der Variationsreihe kleiner oder gleich ˆx p und (1 p) 100% der Werte größer oder gleich ˆx p sind. ˆx p = x (k), falls np keine ganze Zahl ist, k ist ( ) x(k) + x (k+1), dann die auf np folgende ganze Zahl; falls np =: k eine ganze Zahl ist. 1 2 Prof. Dr. Hans-Jörg Starkloff (TUBAF) Stochastik/Statistik für Ingenieure Vorlesung 10 25

27 Beispiel zu empirischen Quantilen 10 Beobachtungswerte: 1, 3, 7, 2, 20, 9, 15, 2, 11, 10. Variationsreihe: Quantil : p = 0.05, np = 0.5 k = 1, ˆx 0.05 = x (1) = Quantil : p = 0.10, np = 1 = k ˆx 0.05 = 1 2 (x (1) + x (2) ) = Quantil : p = 0.20, np = 2 = k ˆx 0.20 = 1 2 (x (2) + x (3) ) = Quantil : p = 0.25, np = 2.5 k = 3, ˆx 0.25 = x (3) = Quantil : p = 0.50, np = 5 = k ˆx 0.50 = 1 2 (x (5) + x (6) ) = 8 = x. Prof. Dr. Hans-Jörg Starkloff (TUBAF) Stochastik/Statistik für Ingenieure Vorlesung 10 26

28 Spezielle Quantile Das 0.5 Quantil ist der Median. Das 0.25 Quantil heißt auch unteres oder erstes Quartil (oder auch unterer Viertelwert). Das 0.75 Quantil heißt auch oberes oder drittes Quartil (oder auch oberer Viertelwert). Das n 10 Quantil mit n {1, 2, 3, 4, 5, 6, 7, 8, 9} heißt auch n tes Dezentil. Als 0 Quantil kann man das Minumum x min = x (1) ansehen. Als 1 Quantil kann man das Maximum x max = x (n) ansehen. Prof. Dr. Hans-Jörg Starkloff (TUBAF) Stochastik/Statistik für Ingenieure Vorlesung 10 27

29 Berechnung von Quantilen mit R Der Befehl quantile() erzeugt als Ausgabe eine Tabelle mit Werten für das Minimum, das Maximum, den Median und die Quartile. Beispiel: > quantile(lightspeeds) 0% 25% 50% 75% 100% Sollen für bestimmte Niveaus p die zugehörigen Quantile berechnet werden, können diese dem Befehl mit übergeben werden. Beispiele: > quantile(lightspeeds,c(0.1,0.2,0.3)) 10% 20% 30% > quantile(lightspeeds,seq(0.8,0.95,0.05)) 80% 85% 90% 95% Prof. Dr. Hans-Jörg Starkloff (TUBAF) Stochastik/Statistik für Ingenieure Vorlesung 10 28

30 (c06) Empirische Varianz Für reelle Beobachtungswerte x 1, x 2,..., x n ist die empirische Varianz ( s 2 = 1 n n ) (x i x) 2 = 1 x 2 i nx 2. n 1 n 1 i=1 In der Statistik wird sie als Realisierung des Stichprobenvarianz S 2 = 1 n 1 i=1 n (X i X) 2 i=1 einer mathematischen Stichprobe (X 1, X 2,..., X n ) betrachtet. Diese liefert unter geeigneten Voraussetzungen durch die Wahl des Nenners n 1 eine erwartungstreue und konsistente Schätzfunktion für die Varianz der Zufallsgrößen X i : VarX = S 2. Prof. Dr. Hans-Jörg Starkloff (TUBAF) Stochastik/Statistik für Ingenieure Vorlesung 10 29

31 (c07) Empirische Standardabweichung So wie die (theoretische) Standardabweichung einer Zufallsgröße als Quadratwurzel aus der Varianz definiert wird, wird die empirische Standardabweichung als Quadratwurzel aus der empirischen Varianz definiert: s = s 2 = 1 n (x i x) n 1 2. Sowohl die empirische Varianz als auch die empirische Standardabweichung sind empfindlich gegenüber Ausreißern. Außerdem können beide Maßzahlen nur bei bestimmten Verteilungen, wie z.b. der Normalverteilung, gut interpretiert werden. Bei Merkmalswerten mit (physikalischen etc.) Maßeinheiten kommt bei der empirischen Varianz diese Maßeinheit im Quadrat vor, bei der empirischen Standardabweichung die Maßeinheit selber. i=1 Prof. Dr. Hans-Jörg Starkloff (TUBAF) Stochastik/Statistik für Ingenieure Vorlesung 10 30

32 (c08) Spannweite Die Spannweite (oder Variationsbreite) ist die Differenz der extremalen Werte, = x max x min = x (n) x (1). Sie gibt folglich die Länge des kleinsten Intervalls an, in das alle Beobachtungswerte fallen. Die Spannweite ist empfindlich gegenüber Ausreißern, das sie nur von den extremen Werten abhängt. Die bisher behandelten drei Streumaße lassen sich wie folgt in R berechnen: > var(lightspeeds) # empirische Varianz [1] > sd(lightspeeds) # empirische Standardabweichung [1] > max(lightspeeds)-min(lightspeeds) # Spannweite [1] 450 Prof. Dr. Hans-Jörg Starkloff (TUBAF) Stochastik/Statistik für Ingenieure Vorlesung 10 31

33 (c09) Empirischer Interquartilsabstand Der empirische Interquartilsabstand ist die Differenz des oberen und des unteren Quartils, IQR(x) = ˆx 0.75 ˆx Da die sehr großen und sehr kleinen Beobachtungswerte bei der Berechnung des Interquartilsabstands keine Rolle spielen, ist er relativ unempfindlich gegenüber Ausreißern. In dem Intervall der Länge des Interquartilabstandes vom unteren zum oberen Quartil liegt die Hälfte der Beobachtungswerte. Über die andere Hälfte der Beobachtungswerte kann allerdings mit Hilfe dieser Kenngröße nichts wesentliches ausgesagt werden. In R: > IQR(lightspeeds) [1] 85 Prof. Dr. Hans-Jörg Starkloff (TUBAF) Stochastik/Statistik für Ingenieure Vorlesung 10 32

34 (c10) Streumaße für die ratio-skala Für Merkmalswerte in der ratio-skala können Streumaße durch Quotientenbildung in Bezug zu Lagemaßen gebracht werden. Dadurch entstehen einheitenlose Maßzahlen, die z.b. zum Vergleich unterschiedlicher Daten genutzt werden können. Der empirische Variationskoeffizient ist definiert durch v(x) = s x, er ist eine Schätzung für den theoretischen Variationskoeffizienten. In R: > sd(lightspeeds)/mean(lightspeeds) [1] Prof. Dr. Hans-Jörg Starkloff (TUBAF) Stochastik/Statistik für Ingenieure Vorlesung 10 33

35 Geometrische Standardabweichung Die (theoretische) geometrische Standardabweichung einer positiven Zufallsgröße X ist definiert durch ( ) exp Var (ln(x)), den entsprechenden empirischen Wert für eine Datenreihe dazu erhält man, in dem man die Standardabweichung durch die empirische Standardabweichung ersetzt. In R: > exp(sd(log(lightspeeds))) [1] Prof. Dr. Hans-Jörg Starkloff (TUBAF) Stochastik/Statistik für Ingenieure Vorlesung 10 34

36 (d) Box-Plot Ein Box-Plot ( Box-Whisker-Plot, Kasten-Diagramm) ist eine aussagekräftige graphische Darstellung der Fünfer-Charakteristik, bestehend aus Median x = ˆx 0.5, den empirischen Quartilen (Viertelwerten) ˆx 0.25 und ˆx 0.75 und den Ausreißergrenzen A u, A o. Die Ausreißergrenzen werden dabei definiert durch A u = ˆx IQR(x) und A o = ˆx IQR(x). Dies betrifft die sogenannten inneren Zäune; ( inner fences ) für manche Fragen verwendet man auch die sogenannten äußere Zäune ( outer fences ), definiert durch ±3 IQR(x). Die Grenzen für die Box ( hinges, Tukeys Scharniere (Türangel) ) werden durch das untere und das obere Quartil bestimmt. Eine gerade Linie kennzeichnet innerhalb der Box den Median. Prof. Dr. Hans-Jörg Starkloff (TUBAF) Stochastik/Statistik für Ingenieure Vorlesung 10 35

37 Fortsetzung Box-Plots Die untere Begrenzungslinie wird dabei nicht durch die untere Ausreißergrenze definiert, sondern durch den kleinsten Wert, der A u ist, bzw. sie ist = x min falls x min A u. Analog wird die obere Begrenzungslinie definiert durch den größten Wert, der A o ist bzw. = x max falls x max A u. Diese Grenzen heißen auch Whisker-Grenzen ( whisker : Schnurrhaare der Katze). Ausreißer (d.h. Datenwerte außerhalb der Ausreißergrenzen) werden extra durch Punkte angegeben. Dabei werden ein einfacheres Symbol für näher liegende Ausreißer und ein auffälligeres Symbol für die sogenannten fernen Ausreißer (extreme oder krasse Ausreißer) verwendet, die außerhalb der äußeren Zäune liegen (bzw. z.b. bei Prof. van den Boogaart mehr als 2.5 IQR(x) von der Box enfernt liegen). Prof. Dr. Hans-Jörg Starkloff (TUBAF) Stochastik/Statistik für Ingenieure Vorlesung 10 36

38 Erzeugung von Box-Plots in R In R: > boxplot(lightspeeds) erzeugt ein vertikales Box-Plot vom Datensatz lightspeeds, ein horizontales Box-Plot wird erzeugt durch > boxplot(lightspeeds,horizontal=true) Die Kenngrößen in diesem Datensatz waren: Median x = ˆx 0.95 = ; unteres Quartil ˆx 0.25 = ; oberes Quartil ˆx 0.75 = ; Quartilsabstand IQR(x) = 85 ; untere Ausreißergrenze obere Ausreißergrenze A u = ˆx IQR(x) = ; A u = ˆx IQR(x) = Prof. Dr. Hans-Jörg Starkloff (TUBAF) Stochastik/Statistik für Ingenieure Vorlesung 10 37

39 Vertikales Box-Plot für Beispiel Lichtgeschwindigkeiten > boxplot(lightspeeds,main= Box-Plot Lichtgeschwindigkeiten ) Box Plot Lichtgeschwindigkeiten Prof. Dr. Hans-Jörg Starkloff (TUBAF) Stochastik/Statistik für Ingenieure Vorlesung 10 38

40 Horizontales Box-Plot für Beispiel Lichtgeschwindigkeiten > boxplot(lightspeeds,horizontal=true, main= Box-Plot Lichtgeschwindigkeiten ) Box Plot Lichtgeschwindigkeiten Prof. Dr. Hans-Jörg Starkloff (TUBAF) Stochastik/Statistik für Ingenieure Vorlesung 10 39

41 Horizontales Box-Plot mit Punktdiagramm für Beispiel > boxplot(lightspeeds,horizontal=true, main= Box-Plot Lichtgeschwindigkeiten ) > stripchart(lightspeeds,method= stack,col=2,add=true) Box Plot Lichtgeschwindigkeiten Prof. Dr. Hans-Jörg Starkloff (TUBAF) Stochastik/Statistik für Ingenieure Vorlesung 10 40

42 Daten für Box-Plots in R Die Zahlenwerte für das Box-Whisker-Plot, aus denen sich die graphische Darstellung ergibt, können durch den Funktionsaufruf boxplot()$stats abgefragt werden. Im Beispiel: > boxplot(lightspeeds)$stats [,1] [1,] [2,] [3,] [4,] [5,] Prof. Dr. Hans-Jörg Starkloff (TUBAF) Stochastik/Statistik für Ingenieure Vorlesung 10 41

43 Horizontales Box-Plot für Beispiel mit Statgraphics Prof. Dr. Hans-Jörg Starkloff (TUBAF) Stochastik/Statistik für Ingenieure Vorlesung 10 42

44 Gekerbte Box-Whisker-Plots Als zusätzliche Information werden manchmal zusätzlich Kerben ( notches ) zur Kennzeichnung eines 95%-Konfidenzintervalles für den Median (unter Normalverteilungsannahme berechnet) mit eingezeichnet. Ein 95%-Konfidenzintervall für den Median ist dabei ein zufälliges Intervall, welches unter der bestimmten Verteilungsannahme den tatsächlichen oder wahren Median mit einer Wahrscheinlichkeit von 0.95 überdeckt. Für vorliegende Beobachtungswerte kann dann ein konkretes Intervall berechnet werden. In R kann ein solches gekerbtes Box-Plot durch den zusätzlichen Parameter notch=true im Befehl boxplot() erzeugt werden. Die Zahlenwerte dazu können mit boxplot()$conf abgefragt werden. Prof. Dr. Hans-Jörg Starkloff (TUBAF) Stochastik/Statistik für Ingenieure Vorlesung 10 43

45 Gekerbtes Box-Plot für Beispiel Lichtgeschwindigkeiten > boxplot(lightspeeds,main= Box-Plot Lichtgeschwindigkeiten, notch=true) > boxplot(lightspeeds)$conf [,1] [1,] [2,] gekerbtes Box Plot Lichtgeschwindigkeiten Prof. Dr. Hans-Jörg Starkloff (TUBAF) Stochastik/Statistik für Ingenieure Vorlesung 10 44

Statistik für Ingenieure Vorlesung 9

Statistik für Ingenieure Vorlesung 9 Statistik für Ingenieure Vorlesung 9 Prof. Dr. Hans-Jörg Starkloff TU Bergakademie Freiberg Institut für Stochastik 19. Dezember 2016 4.2. Grafiken und statistische Maßzahlen (Kenngrößen, Parameter) für

Mehr

Statistik für Ingenieure Vorlesung 9

Statistik für Ingenieure Vorlesung 9 Statistik für Ingenieure Vorlesung 9 Prof. Dr. Hans-Jörg Starkloff TU Bergakademie Freiberg Institut für Stochastik 9. Januar 2018 4.2.3. Kenngrößen und Parameter zur Beschreibung univariater Daten Lageparameter

Mehr

Statistik für Ingenieure Vorlesung 10

Statistik für Ingenieure Vorlesung 10 Statistik für Ingenieure Vorlesung 10 Prof. Dr. Hans-Jörg Starkloff TU Bergakademie Freiberg Institut für Stochastik 9. Januar 2017 (f) Empirische Varianz Für reelle Beobachtungswerte x 1, x 2,..., x n

Mehr

Statistik I für Betriebswirte Vorlesung 9

Statistik I für Betriebswirte Vorlesung 9 Statistik I für Betriebswirte Vorlesung 9 Dr. Andreas Wünsche TU Bergakademie Freiberg Institut für Stochastik Vorlesung am 8. Juni 2017 im Audi-Max (AUD-1001) Dr. Andreas Wünsche Statistik I für Betriebswirte

Mehr

Statistik für Ingenieure Vorlesung 8

Statistik für Ingenieure Vorlesung 8 Statistik für Ingenieure Vorlesung 8 Prof. Dr. Hans-Jörg Starkloff TU Bergakademie Freiberg Institut für Stochastik 19. Dezember 2017 Nutzung von Statistik-Computerprogrammen Statistische Untersuchungen

Mehr

Statistik I für Betriebswirte Vorlesung 9

Statistik I für Betriebswirte Vorlesung 9 Statistik I für Betriebswirte Vorlesung 9 Prof. Dr. Hans-Jörg Starkloff TU Bergakademie Freiberg Institut für Stochastik 06. Juni 2016 Prof. Dr. Hans-Jörg Starkloff Statistik I für Betriebswirte Vorlesung

Mehr

Statistik I für Betriebswirte Vorlesung 4

Statistik I für Betriebswirte Vorlesung 4 Statistik I für Betriebswirte Vorlesung 4 Prof. Dr. Hans-Jörg Starkloff TU Bergakademie Freiberg Institut für Stochastik 25. April 2016 Prof. Dr. Hans-Jörg Starkloff Statistik I für Betriebswirte Vorlesung

Mehr

Verfahren für metrische Variable

Verfahren für metrische Variable Verfahren für metrische Variable Grafische Methoden Histogramm Mittelwertsplot Boxplot Lagemaße Mittelwert, Median, Quantile Streuungsmaße Standardabweichung, Interquartilsabstand Lagemaße und Streumaße

Mehr

Stochastik und Statistik Vorlesung 2 (Graphik I)

Stochastik und Statistik Vorlesung 2 (Graphik I) Stochastik und Statistik Vorlesung 2 (Graphik I) K.Gerald van den Boogaart http://www.math-inf.uni-greifswald.de/statistik Stochastik und Statistik p.1/44 Daten Schätzung Test Mathe Die Datenminen Riesige

Mehr

Stochastik und Statistik Vorlesung 2 (Graphik I)

Stochastik und Statistik Vorlesung 2 (Graphik I) Stochastik und Statistik Vorlesung 2 (Graphik I) K.Gerald van den Boogaart http://www.stat.boogaart.de Stochastik und Statistik p.1/44 Daten Schätzung Test Mathe Die Datenminen Riesige Halde mit nichtrepräsentativen

Mehr

Datenanalyse und Statistik

Datenanalyse und Statistik Datenanalyse und Statistik Vorlesung 2 (Graphik I) K.Gerald van den Boogaart http://www.stat.boogaart.de Datenanalyse und Statistik p.1/44 Daten Schätzung Test Mathe Die Datenminen Riesige Halde mit nichtrepräsentativen

Mehr

Statistik für Ingenieure Vorlesung 3

Statistik für Ingenieure Vorlesung 3 Statistik für Ingenieure Vorlesung 3 Prof. Dr. Hans-Jörg Starkloff TU Bergakademie Freiberg Institut für Stochastik 14. November 2017 3. Zufallsgrößen 3.1 Zufallsgrößen und ihre Verteilung Häufig sind

Mehr

3. Deskriptive Statistik

3. Deskriptive Statistik 3. Deskriptive Statistik Eindimensionale (univariate) Daten: Pro Objekt wird ein Merkmal durch Messung / Befragung/ Beobachtung erhoben. Resultat ist jeweils ein Wert (Merkmalsausprägung) x i : - Gewicht

Mehr

Stochastik und Statistik

Stochastik und Statistik Stochastik und Statistik p. 1/44 Stochastik und Statistik Vorlesung 2 (Graphik I) K.Gerald van den Boogaart http://www.stat.boogaart.de Stochastik und Statistik p. 2/44 Daten Schätzung Test Mathe Die Datenminen

Mehr

5 Exkurs: Deskriptive Statistik

5 Exkurs: Deskriptive Statistik 5 EXKURS: DESKRIPTIVE STATISTIK 6 5 Ekurs: Deskriptive Statistik Wir wollen zuletzt noch kurz auf die deskriptive Statistik eingehen. In der Statistik betrachtet man für eine natürliche Zahl n N eine Stichprobe

Mehr

Empirische Verteilungsfunktion

Empirische Verteilungsfunktion Empirische Verteilungsfunktion H(x) := Anzahl der Werte x ist. Deskriptive

Mehr

Kapitel 1 Beschreibende Statistik

Kapitel 1 Beschreibende Statistik Beispiel 1.25: fiktive Aktienkurse Zeitpunkt i 0 1 2 Aktienkurs x i 100 160 100 Frage: Wie hoch ist die durchschnittliche Wachstumsrate? Dr. Karsten Webel 53 Beispiel 1.25: fiktive Aktienkurse (Fortsetzung)

Mehr

Diese Lücken sollten nicht auch bei Ihnen vorhanden sein: Aufgrund einer statistischen Untersuchung entsteht eine geordnete bzw. ungeordnete, die durc

Diese Lücken sollten nicht auch bei Ihnen vorhanden sein: Aufgrund einer statistischen Untersuchung entsteht eine geordnete bzw. ungeordnete, die durc SS 2017 Torsten Schreiber 222 Diese Lücken sollten nicht auch bei Ihnen vorhanden sein: Aufgrund einer statistischen Untersuchung entsteht eine geordnete bzw. ungeordnete, die durch Summierung je Ausprägung

Mehr

Übungsrunde 2, Gruppe 2 LVA , Übungsrunde 1, Gruppe 2, Markus Nemetz, TU Wien, 10/2006

Übungsrunde 2, Gruppe 2 LVA , Übungsrunde 1, Gruppe 2, Markus Nemetz, TU Wien, 10/2006 1 1.2.3.4. 1.1 Angabe Übungsrunde 2, Gruppe 2 LVA 107.369, Übungsrunde 1, Gruppe 2, 24.10. Markus Nemetz, markus.nemetz@tuwien.ac.at, TU Wien, 10/2006 Bestimmen Sie für den Datensatz bulb.dat die Quartile,

Mehr

Lösungen. w58r4p Lösungen. w58r4p. Name: Klasse: Datum:

Lösungen. w58r4p Lösungen. w58r4p. Name: Klasse: Datum: Testen und Fördern Name: Klasse: Datum: 1) Ermittle jeweils das arithmetische Mittel. Ordne die Datenerhebungen nach der Größe der arithmetischen Mittel. Beginne mit dem Größten. 45, 39, 44, 48, 42, 39,

Mehr

2. Deskriptive Statistik

2. Deskriptive Statistik Philipps-Universitat Marburg 2.1 Stichproben und Datentypen Untersuchungseinheiten: mogliche, statistisch zu erfassende Einheiten je Untersuchungseinheit: ein oder mehrere Merkmale oder Variablen beobachten

Mehr

Kreisdiagramm, Tortendiagramm

Kreisdiagramm, Tortendiagramm Kreisdiagramm, Tortendiagramm Darstellung der relativen (absoluten) Häufigkeiten als Fläche eines Kreises Anwendung: Nominale Merkmale Ordinale Merkmale (Problem: Ordnung nicht korrekt wiedergegeben) Gruppierte

Mehr

Weitere Lagemaße: Quantile/Perzentile I

Weitere Lagemaße: Quantile/Perzentile I 3 Auswertung von eindimensionalen Daten Lagemaße 3.3 Weitere Lagemaße: Quantile/Perzentile I Für jeden Median x med gilt: Mindestens 50% der Merkmalswerte sind kleiner gleich x med und ebenso mindestens

Mehr

Statistik und Wahrscheinlichkeitsrechnung

Statistik und Wahrscheinlichkeitsrechnung Statistik und Wahrscheinlichkeitsrechnung 3. Vorlesung Dr. Jochen Köhler 1 Inhalte der heutigen Vorlesung Ziel: Daten Modellbildung Probabilistisches Modell Wahrscheinlichkeit von Ereignissen Im ersten

Mehr

1 45, 39, 44, 48, 42, 39, 40, , 31, 46, 35, 31, 42, 51, , 42, 33, 46, 33, 44, 43

1 45, 39, 44, 48, 42, 39, 40, , 31, 46, 35, 31, 42, 51, , 42, 33, 46, 33, 44, 43 1) Ermittle jeweils das arithmetische Mittel. Ordne die Datenerhebungen nach der Größe der arithmetischen Mittel. Beginne mit dem Größten. 1 45, 39, 44, 48, 42, 39, 40, 31 2 35, 31, 46, 35, 31, 42, 51,

Mehr

Deskriptive Statistik

Deskriptive Statistik Deskriptive Statistik Deskriptive Statistik: Ziele Daten zusammenfassen durch numerische Kennzahlen. Grafische Darstellung der Daten. Quelle: Ursus Wehrli, Kunst aufräumen 1 Modell vs. Daten Bis jetzt

Mehr

Statistik I für Betriebswirte Vorlesung 3

Statistik I für Betriebswirte Vorlesung 3 Statistik I für Betriebswirte Vorlesung 3 Dr. Andreas Wünsche TU Bergakademie Freiberg Institut für Stochastik 15. April 2019 Dr. Andreas Wünsche Statistik I für Betriebswirte Vorlesung 3 Version: 1. April

Mehr

Beschreibende Statistik Kenngrößen in der Übersicht (Ac )

Beschreibende Statistik Kenngrößen in der Übersicht (Ac ) Beschreibende Statistik Kenngrößen in der Übersicht (Ac 006-019) Boxplot Im folgenden wird die Berechnungsweise des TI 83 (sowie von SPSS, s. unten) verwendet. Diese geht auf eine Festlegung von Moore

Mehr

Mathematische Statistik. Zur Notation

Mathematische Statistik. Zur Notation Mathematische Statistik dient dazu, anhand von Stichproben Informationen zu gewinnen. Während die Wahrscheinlichkeitsrechnung Prognosen über das Eintreten zufälliger (zukünftiger) Ereignisse macht, werden

Mehr

Statistik K urs SS 2004

Statistik K urs SS 2004 Statistik K urs SS 2004 3.Tag Grundlegende statistische Maße Mittelwert (mean) Durchschnitt aller Werte Varianz (variance) s 2 Durchschnittliche quadrierte Abweichung aller Werte vom Mittelwert >> Die

Mehr

Der Mittelwert (arithmetisches Mittel)

Der Mittelwert (arithmetisches Mittel) Der Mittelwert (arithmetisches Mittel) x = 1 n n x i bekanntestes Lagemaß instabil gegen extreme Werte geeignet für intervallskalierte Daten Deskriptive Statistik WiSe 2015/2016 Helmut Küchenhoff (Institut

Mehr

Deskriptive Statistik

Deskriptive Statistik Deskriptive Statistik 1 Ziele In der deskriptiven (=beschreibenden) Statistik werden Untersuchungsergebnisse übersichtlich dargestellt, durch Kennzahlen charakterisiert und grafisch veranschaulicht. 2

Mehr

Deskriptive Statistik. (basierend auf Slides von Lukas Meier)

Deskriptive Statistik. (basierend auf Slides von Lukas Meier) Deskriptive Statistik (basierend auf Slides von Lukas Meier) Deskriptive Statistik: Ziele Daten zusammenfassen durch numerische Kennzahlen. Grafische Darstellung der Daten. Quelle: Ursus Wehrli, Kunst

Mehr

Deskription, Statistische Testverfahren und Regression. Seminar: Planung und Auswertung klinischer und experimenteller Studien

Deskription, Statistische Testverfahren und Regression. Seminar: Planung und Auswertung klinischer und experimenteller Studien Deskription, Statistische Testverfahren und Regression Seminar: Planung und Auswertung klinischer und experimenteller Studien Deskriptive Statistik Deskriptive Statistik: beschreibende Statistik, empirische

Mehr

4 Statistische Maßzahlen

4 Statistische Maßzahlen 4 Statistische Maßzahlen 4.1 Maßzahlen der mittleren Lage 4.2 Weitere Maßzahlen der Lage 4.3 Maßzahlen der Streuung 4.4 Lineare Transformationen, Schiefemaße 4.5 Der Box Plot Ziel: Charakterisierung einer

Mehr

Statistik für Ingenieure Vorlesung 5

Statistik für Ingenieure Vorlesung 5 Statistik für Ingenieure Vorlesung 5 Prof. Dr. Hans-Jörg Starkloff TU Bergakademie Freiberg Institut für Stochastik 28. November 2017 3.4 Wichtige stetige Verteilungen 3.4.1 Exponentialverteilung Parameter:

Mehr

Statistik I für Betriebswirte Vorlesung 2

Statistik I für Betriebswirte Vorlesung 2 Statistik I für Betriebswirte Vorlesung 2 PD Dr. Frank Heyde TU Bergakademie Freiberg Institut für Stochastik 16. April 2015 PD Dr. Frank Heyde Statistik I für Betriebswirte Vorlesung 2 1 ii) empirische

Mehr

Stochastik und Statistik für Ingenieure Vorlesung 4

Stochastik und Statistik für Ingenieure Vorlesung 4 Prof. Dr. Hans-Jörg Starkloff TU Bergakademie Freiberg Institut für Stochastik Stochastik und Statistik für Ingenieure Vorlesung 4 30. Oktober 2012 Quantile einer stetigen Zufallsgröße Die reelle Zahl

Mehr

Herzlich willkommen zur Vorlesung Statistik. Streuungsmaße oder die Unterschiedlichkeit der Daten nebst kurzen Ausführungen zu Schiefe und Wölbung

Herzlich willkommen zur Vorlesung Statistik. Streuungsmaße oder die Unterschiedlichkeit der Daten nebst kurzen Ausführungen zu Schiefe und Wölbung FB 1 W. Ludwig-Mayerhofer Statistik 1 Herzlich willkommen zur Vorlesung Statistik smaße oder die Unterschiedlichkeit der Daten nebst kurzen Ausführungen zu Schiefe und Wölbung FB 1 W. Ludwig-Mayerhofer

Mehr

Institut für Biometrie und klinische Forschung. WiSe 2012/2013

Institut für Biometrie und klinische Forschung. WiSe 2012/2013 Klinische Forschung WWU Münster Pflichtvorlesung zum Querschnittsfach Epidemiologie, Biometrie und Med. Informatik Praktikum der Medizinischen Biometrie () Überblick. Deskriptive Statistik I - Grundlegende

Mehr

Teil VII. Deskriptive Statistik. Woche 5: Deskriptive Statistik. Arbeitsschritte der Datenanalyse. Lernziele

Teil VII. Deskriptive Statistik. Woche 5: Deskriptive Statistik. Arbeitsschritte der Datenanalyse. Lernziele Woche 5: Deskriptive Statistik Teil VII Patric Müller Deskriptive Statistik ETHZ WBL 17/19, 22.05.2017 Wahrscheinlichkeit und Statistik Patric Müller WBL 2017 Wahrscheinlichkeit

Mehr

Statistik für Ingenieure Vorlesung 6

Statistik für Ingenieure Vorlesung 6 Statistik für Ingenieure Vorlesung 6 Prof. Dr. Hans-Jörg Starkloff TU Bergakademie Freiberg Institut für Stochastik 05. Dezember 2017 3.4.3 Stetige Gleichverteilung Parameter: Intervall [a, b] R. Zufallsgröße

Mehr

Statistik I für Betriebswirte Vorlesung 13

Statistik I für Betriebswirte Vorlesung 13 Statistik I für Betriebswirte Vorlesung 13 Prof. Dr. Hans-Jörg Starkloff TU Bergakademie Freiberg Institut für Stochastik 4. Juli 2016 Prof. Dr. Hans-Jörg Starkloff Statistik I für Betriebswirte Vorlesung

Mehr

Einführung in Quantitative Methoden

Einführung in Quantitative Methoden Einführung in Quantitative Methoden Mag. Dipl.Ing. Dr. Pantelis Christodoulides & Mag. Dr. Karin Waldherr SS 2014 Christodoulides / Waldherr Einführung in Quantitative Methoden- 2.VO 1/57 Die Deskriptivstatistik

Mehr

4 Statistische Maßzahlen

4 Statistische Maßzahlen 4 Statistische Maßzahlen 4.1 Maßzahlen der mittleren Lage 4.2 Weitere Maßzahlen der Lage 4.3 Maßzahlen der Streuung 4.4 Lineare Transformationen, Schiefemaße 4.5 Der Box Plot Ziel: Charakterisierung einer

Mehr

4. Kumulierte Häufigkeiten und Quantile

4. Kumulierte Häufigkeiten und Quantile 4. Kumulierte Häufigkeiten und Quantile Statistik für SoziologInnen 1 4. Kumulierte Häufigkeiten und Quantile Kumulierte Häufigkeiten Oft ist man nicht an der Häufigkeit einzelner Merkmalsausprägungen

Mehr

Grundlagen der Wahrscheinlichkeitstheorie und Statistik für Studierende der Informatik

Grundlagen der Wahrscheinlichkeitstheorie und Statistik für Studierende der Informatik INSTITUT FÜR STOCHASTIK WS 2007/08 UNIVERSITÄT KARLSRUHE Blatt 1 Dr. B. Klar Übungen zur Vorlesung Grundlagen der Wahrscheinlichkeitstheorie und Statistik für Studierende der Informatik Musterlösungen

Mehr

Statistik I für Betriebswirte Vorlesung 14

Statistik I für Betriebswirte Vorlesung 14 Statistik I für Betriebswirte Vorlesung 14 Prof. Dr. Hans-Jörg Starkloff TU Bergakademie Freiberg Institut für Stochastik 11. Juli 016 Prof. Dr. Hans-Jörg Starkloff Statistik I für Betriebswirte Vorlesung

Mehr

Statistik I für Betriebswirte Vorlesung 14

Statistik I für Betriebswirte Vorlesung 14 Statistik I für Betriebswirte Vorlesung 14 Dr. Andreas Wünsche TU Bergakademie Freiberg Institut für Stochastik 13. Juli 017 Dr. Andreas Wünsche Statistik I für Betriebswirte Vorlesung 14 Version: 8. Juli

Mehr

Die erhobenen Daten werden zunächst in einer Urliste angeschrieben. Daraus ermittelt man:

Die erhobenen Daten werden zunächst in einer Urliste angeschrieben. Daraus ermittelt man: Die erhobenen Daten werden zunächst in einer Urliste angeschrieben. Daraus ermittelt man: a) Die absoluten Häufigkeit: Sie gibt an, wie oft ein Variablenwert vorkommt b) Die relative Häufigkeit: Sie erhält

Mehr

Datenanalyse und Statistik

Datenanalyse und Statistik Datenanalyse und Statistik p. 1/44 Datenanalyse und Statistik Vorlesung 2 (Graphik I) K.Gerald van den Boogaart http://www.stat.boogaart.de Datenanalyse und Statistik p. 2/44 Daten Schätzung Test Mathe

Mehr

Ermitteln Sie auf 2 Dezimalstellen genau die folgenden Kenngrößen der bivariaten Verteilung der Merkmale Weite und Zeit:

Ermitteln Sie auf 2 Dezimalstellen genau die folgenden Kenngrößen der bivariaten Verteilung der Merkmale Weite und Zeit: 1. Welche der folgenden Kenngrößen, Statistiken bzw. Grafiken sind zur Beschreibung der Werteverteilung des Merkmals Konfessionszugehörigkeit sinnvoll einsetzbar? A. Der Modalwert. B. Der Median. C. Das

Mehr

Mathematische und statistische Methoden II

Mathematische und statistische Methoden II Methodenlehre e e Prof. Dr. G. Meinhardt 6. Stock, Wallstr. 3 (Raum 06-206) Sprechstunde jederzeit nach Vereinbarung und nach der Vorlesung. Mathematische und statistische Methoden II Dr. Malte Persike

Mehr

Mathematik für Biologen

Mathematik für Biologen Mathematik für Biologen Prof. Dr. Rüdiger W. Braun Heinrich-Heine-Universität Düsseldorf 20. Oktober 2010 1 empirische Verteilung 2 Lageparameter Modalwert Arithmetisches Mittel Median 3 Streuungsparameter

Mehr

Statistik für Ingenieure Vorlesung 10

Statistik für Ingenieure Vorlesung 10 Statistik für Ingenieure Vorlesung 10 Prof. Dr. Hans-Jörg Starkloff TU Bergakademie Freiberg Institut für Stochastik 16. Januar 2018 4.2.5. Kenngrößen für kategorielle Daten Für eine diskrete Wahrscheinlichkeitsverteilung

Mehr

Fachrechnen für Tierpfleger

Fachrechnen für Tierpfleger Z.B.: Fachrechnen für Tierpfleger A10. Statistik 10.1 Allgemeines Was ist Statistik? 1. Daten sammeln: Durch Umfragen, Zählung, Messung,... 2. Daten präsentieren: Tabellen, Grafiken 3. Daten beschreiben/charakterisieren:

Mehr

Das harmonische Mittel

Das harmonische Mittel Das harmonische Mittel x H := 1 1 n n 1 x i Das harmonische Mittel entspricht dem Mittel durch Transformation t 1 t Beispiel: x 1,..., x n Geschwindigkeiten, mit denen konstante Wegstrecken l zurückgelegt

Mehr

Kapitel 3: Lagemaße. Ziel. Komprimierung der Daten zu einer Kenngröße, welche die Lage, das Zentrum der Daten beschreibt

Kapitel 3: Lagemaße. Ziel. Komprimierung der Daten zu einer Kenngröße, welche die Lage, das Zentrum der Daten beschreibt Kapitel 3: Lagemaße Ziel Komprimierung der Daten zu einer Kenngröße, welche die Lage, das Zentrum der Daten beschreibt Dr. Matthias Arnold 52 Definition 3.1 Seien x 1,...,x n Ausprägungen eines kardinal

Mehr

1 Univariate Statistiken

1 Univariate Statistiken 1 Univariate Statistiken Im ersten Kapitel berechnen wir zunächst Kenngrößen einer einzelnen Stichprobe bzw. so genannte empirische Kenngrößen, wie beispielsweise den Mittelwert. Diese können, unter gewissen

Mehr

Verteilungsfunktion und Quantile

Verteilungsfunktion und Quantile Statistik 1 für SoziologInnen Verteilungsfunktion und Quantile Univ.Prof. Dr. Marcus Hudec Kumulierte Häufigkeiten Hinweis: Damit das Kumulieren inhaltlich sinnvoll ist, muss das Merkmal zumindest ordinal

Mehr

Die mit * gekennzeichneten Abschnitte beinhalten Themen, die über die Anforderungen des Gegenstandskatalogs hinausgehen.

Die mit * gekennzeichneten Abschnitte beinhalten Themen, die über die Anforderungen des Gegenstandskatalogs hinausgehen. Die mit * gekennzeichneten Abschnitte beinhalten Themen, die über die Anforderungen des Gegenstandskatalogs hinausgehen. 1 Einleitung...1 1.1 Die Bedeutung der Statistik für die Medizin...1 1.2 Die medizinische

Mehr

htw saar 1 EINFÜHRUNG IN DIE STATISTIK: BESCHREIBENDE STATISTIK

htw saar 1 EINFÜHRUNG IN DIE STATISTIK: BESCHREIBENDE STATISTIK htw saar 1 EINFÜHRUNG IN DIE STATISTIK: BESCHREIBENDE STATISTIK htw saar 2 Grundbegriffe htw saar 3 Grundgesamtheit und Stichprobe Ziel: Über eine Grundgesamtheit (Population) soll eine Aussage über ein

Mehr

Verteilungsfunktion und Quantile

Verteilungsfunktion und Quantile Statistik 1 für SoziologInnen Verteilungsfunktion und Quantile Univ.Prof. Dr. Marcus Hudec Kumulierte Häufigkeiten Hinweis: Damit das Kumulieren inhaltlich sinnvoll ist, muss das auszuwertende Merkmal

Mehr

Die erhobenen Daten werden zunächst in einer Urliste angeschrieben. Daraus ermittelt man:

Die erhobenen Daten werden zunächst in einer Urliste angeschrieben. Daraus ermittelt man: Die erhobenen Daten werden zunächst in einer Urliste angeschrieben. Daraus ermittelt man: a) Die absoluten Häufigkeit: Sie gibt an, wie oft ein Variablenwert vorkommt b) Die relative Häufigkeit: Sie erhält

Mehr

Uwe Hassler. Statistik im. Bachelor-Studium. Eine Einführung. für Wirtschaftswissenschaftler. ^ Springer Gabler

Uwe Hassler. Statistik im. Bachelor-Studium. Eine Einführung. für Wirtschaftswissenschaftler. ^ Springer Gabler Uwe Hassler Statistik im Bachelor-Studium Eine Einführung für Wirtschaftswissenschaftler ^ Springer Gabler 1 Einführung 1 2 Beschreibende Methoden univariater Datenanalyse 5 2.1 Grundbegriffe 5 2.2 Häufigkeitsverteilungen

Mehr

3. Lektion: Deskriptive Statistik

3. Lektion: Deskriptive Statistik Seite 1 von 5 3. Lektion: Deskriptive Statistik Ziel dieser Lektion: Du kennst die verschiedenen Methoden der deskriptiven Statistik und weißt, welche davon für Deine Daten passen. Inhalt: 3.1 Deskriptive

Mehr

Verteilungsfunktion und Quantile

Verteilungsfunktion und Quantile Statistik 1 für SoziologInnen Verteilungsfunktion und Quantile Univ.Prof. Dr. Marcus Hudec Kumulierte Häufigkeiten Hinweis: Damit das Kumulieren inhaltlich sinnvoll ist, muss das Merkmal zumindest ordinal

Mehr

Wahrscheinlichkeitsrechnung und Statistik

Wahrscheinlichkeitsrechnung und Statistik 9. Vorlesung - 2017 Monte Carlo Methode für numerische Integration Sei g : [0, 1] R stetige Funktion; man möchte 1 0 g(t)dt numerisch approximieren mit Hilfe von Zufallszahlen: Sei (U n ) n eine Folge

Mehr

Ü B U N G S S K R I P T S T A T I S T I K

Ü B U N G S S K R I P T S T A T I S T I K Ü B U N G S S K R I P T S T A T I S T I K A. Ploner H. Strelec C. Yassouridis Universität für Bodenkultur Department für Raum, Landschaft und Infrastruktur Institut für Angewandte Statistik & EDV Peter-Jordan-Strasse

Mehr

(x i x) 2. (x i a) 2, x i x med. x i a. i=1. 3 Lage- und Streuungsmaße 134

(x i x) 2. (x i a) 2, x i x med. x i a. i=1. 3 Lage- und Streuungsmaße 134 Lagemaße als Lösung eines Optimierungsproblems 3.1 Lagemaße Gegeben sei die Urliste x 1,...,x n eines intervallskalierten Merkmals X, die zu einer Zahl a zusammengefasst werden soll. Man könnte sagen,

Mehr

Die Familie der χ 2 (n)-verteilungen

Die Familie der χ 2 (n)-verteilungen Die Familie der χ (n)-verteilungen Sind Z 1,..., Z m für m 1 unabhängig identisch standardnormalverteilte Zufallsvariablen, so genügt die Summe der quadrierten Zufallsvariablen χ := m Z i = Z 1 +... +

Mehr

Die Familie der χ 2 (n)-verteilungen

Die Familie der χ 2 (n)-verteilungen Die Familie der χ (n)-verteilungen Sind Z 1,..., Z m für m 1 unabhängig identisch standardnormalverteilte Zufallsvariablen, so genügt die Summe der quadrierten Zufallsvariablen χ := m Z i = Z 1 +... +

Mehr

Einführung in die Statistik

Einführung in die Statistik Einführung in die Statistik Analyse und Modellierung von Daten von Prof. Dr. Rainer Schlittgen Universität Hamburg 12., korrigierte Auflage Oldenbourg Verlag München Inhaltsverzeichnis 1 Statistische Daten

Mehr

Statistik I für Betriebswirte Vorlesung 13

Statistik I für Betriebswirte Vorlesung 13 Statistik I für Betriebswirte Vorlesung 13 Dr. Andreas Wünsche TU Bergakademie Freiberg Institut für Stochastik 6. Juli 2017 Dr. Andreas Wünsche Statistik I für Betriebswirte Vorlesung 13 Version: 7. Juli

Mehr

PROC MEANS. zum Berechnen statistischer Maßzahlen (für quantitative Merkmale)

PROC MEANS. zum Berechnen statistischer Maßzahlen (für quantitative Merkmale) PROC MEAS zum Berechnen statistischer Maßzahlen (für quantitative Merkmale) Allgemeine Form: PROC MEAS DATA=name Optionen ; VAR variablenliste ; CLASS vergleichsvariable ; Beispiel und Beschreibung der

Mehr

Einführung in Quantitative Methoden

Einführung in Quantitative Methoden Einführung in Quantitative Methoden Mag. Dipl.Ing. Dr. Pantelis Christodoulides & Mag. Dr. Karin Waldherr SS 2011 Christodoulides / Waldherr Einführung in Quantitative Methoden- 2.VO 1/62 Summenzeichen

Mehr

Wirtschaftswissenschaftliches Prüfungsamt Bachelor-Prüfung Deskriptive Statistik und Wahrscheinlichkeitsrechnung Wintersemester 2010/11.

Wirtschaftswissenschaftliches Prüfungsamt Bachelor-Prüfung Deskriptive Statistik und Wahrscheinlichkeitsrechnung Wintersemester 2010/11. Wirtschaftswissenschaftliches Prüfungsamt Bachelor-Prüfung Deskriptive Statistik und Wahrscheinlichkeitsrechnung Wintersemester 2010/11 Namensschild Dr. Martin Becker Hinweise für die Klausurteilnehmer

Mehr

Verteilungsfunktion und dquantile

Verteilungsfunktion und dquantile Statistik 1 für SoziologInnen Verteilungsfunktion und dquantile Univ.Prof. Dr. Marcus Hudec Kumulierte Häufigkeiten Hinweis: Damit die Kumulation inhaltlich sinnvoll ist, muss das Merkmal zumindest ordinal

Mehr

Biostatistik, Sommer 2017

Biostatistik, Sommer 2017 1/51 Biostatistik, Sommer 2017 Wahrscheinlichkeitstheorie: Verteilungen, Kenngrößen Prof. Dr. Achim Klenke http://www.aklenke.de 8. Vorlesung: 09.06.2017 2/51 Inhalt 1 Verteilungen Normalverteilung Normalapproximation

Mehr

Einführung in die Statistik

Einführung in die Statistik Einführung in die Statistik Analyse und Modellierung von Daten Von Prof. Dr. Rainer Schlittgen 4., überarbeitete und erweiterte Auflage Fachbereich Materialwissenschaft! der Techn. Hochschule Darmstadt

Mehr

P (X = 2) = 1/36, P (X = 3) = 2/36,...

P (X = 2) = 1/36, P (X = 3) = 2/36,... 2.3 Zufallsvariablen 2.3 Zufallsvariablen Meist sind die Ereignisse eines Zufallseperiments bereits reelle Zahlen. Ist dies nicht der Fall, kann man Ereignissen eine reelle Zahl zuordnen. Zum Beispiel

Mehr

Der Modus ist. Der Median ist. 3. Übung. Aufgabe 1. a) der häufigste Wert. b) der Wert unter dem 50 % aller anderen Werte liegen.

Der Modus ist. Der Median ist. 3. Übung. Aufgabe 1. a) der häufigste Wert. b) der Wert unter dem 50 % aller anderen Werte liegen. 3. Übung Aufgabe 1 Der Modus ist a) der häufigste Wert. b) der Wert unter dem 50 % aller anderen Werte liegen. c) der Durchschnitt aller Werte. d) der Wert mit der größten Häufigkeitsdichte. e) der Schwerpunkt

Mehr

Statistik und Wahrscheinlichkeitsrechnung

Statistik und Wahrscheinlichkeitsrechnung Statistik und Wahrscheinlichkeitsrechnung Dr. Jochen Köhler 26.02.2008 1 Warum Statistik und Wahrscheinlichkeits rechnung im Ingenieurwesen? Zusammenfassung der letzten Vorlesung Statistik und Wahrscheinlichkeitsrechnung

Mehr

1. Maße der zentralen Tendenz Beispiel: Variable Anzahl der Geschwister aus Jugend '92. Valid Cum Value Frequency Percent Percent Percent

1. Maße der zentralen Tendenz Beispiel: Variable Anzahl der Geschwister aus Jugend '92. Valid Cum Value Frequency Percent Percent Percent Deskriptive Statistik 1. Verteilungsformen symmetrisch/asymmetrisch unimodal(eingipflig) / bimodal (zweigipflig schmalgipflig / breitgipflig linkssteil / rechtssteil U-förmig / abfallend Statistische Kennwerte

Mehr

Orientierungshilfe für den ersten Hausaufgabenzettel

Orientierungshilfe für den ersten Hausaufgabenzettel Orientierungshilfe für den ersten Hausaufgabenzettel 6. November 01 Diese Zusammenfassung des ersten Übungszettels soll einen kleinen Überblick geben, wie die Aufgaben hätten bearbeitet werden können.

Mehr

Statistik und Wahrscheinlichkeitsrechnung

Statistik und Wahrscheinlichkeitsrechnung Statistik und Wahrscheinlichkeitsrechnung Übung 3 1 Inhalt der heutigen Übung Vorrechnen der Hausübung B.7 Beschreibende Statistik Gemeinsames Lösen der Übungsaufgaben C.1: Häufigkeitsverteilung C.2: Tukey

Mehr

4. Kumulierte Häufigkeiten und Quantile

4. Kumulierte Häufigkeiten und Quantile 4. Kumulierte Häufigkeiten und Quantile Kumulierte Häufigkeiten Oft ist man nicht an der Häufigkeit einzelner Merkmalsausprägungen interessiert, sondern an der Häufigkeit von Intervallen. Typische Fragestellung:

Mehr

Stochastik-Praktikum

Stochastik-Praktikum Stochastik-Praktikum Deskriptive Statistik Peter Frentrup Humboldt-Universität zu Berlin 7. November 2017 (Humboldt-Universität zu Berlin) Zufallszahlen und Monte Carlo 7. November 2017 1 / 27 Übersicht

Mehr

Streuungsmaße. Die angegebenen Maßzahlen sind empirisch, d.h. sie sind Schätzungen für die wahre Varianz (empirische) Varianz (Streuung) s 2 = 1 n

Streuungsmaße. Die angegebenen Maßzahlen sind empirisch, d.h. sie sind Schätzungen für die wahre Varianz (empirische) Varianz (Streuung) s 2 = 1 n Streuungsmaße Diskrete Stetige Die angegebenen Maßzahlen sind empirisch, d.h. sie sind Schätzungen für die wahre (empirische) (Streuung) s 2 = 1 n (X i X) 2 n 1 i=1 s 2 n var(x) Warum Division durch (n

Mehr

Über dieses Buch Die Anfänge Wichtige Begriffe... 21

Über dieses Buch Die Anfänge Wichtige Begriffe... 21 Inhalt Über dieses Buch... 12 TEIL I Deskriptive Statistik 1.1 Die Anfänge... 17 1.2 Wichtige Begriffe... 21 1.2.1 Das Linda-Problem... 22 1.2.2 Merkmale und Merkmalsausprägungen... 23 1.2.3 Klassifikation

Mehr

Statistische Methoden in den Umweltwissenschaften

Statistische Methoden in den Umweltwissenschaften Statistische Methoden in den Umweltwissenschaften Stetige und diskrete Wahrscheinlichkeitsverteilungen Lageparameter Streuungsparameter Diskrete und stetige Zufallsvariablen Eine Variable (oder Merkmal

Mehr