Stochastik und Statistik für Ingenieure Vorlesung 10
|
|
- Alfred Fromm
- vor 7 Jahren
- Abrufe
Transkript
1 Prof. Dr. Hans-Jörg Starkloff TU Bergakademie Freiberg Institut für Stochastik Stochastik und Statistik für Ingenieure Vorlesung Dezember 2012
2 4.2. Graphiken und statistische Maßzahlen (Kenngrößen, Parameter) für Daten Graphiken und statistische Maßzahlen dienen dazu, einen Überblick über die vorliegenden Daten zu erhalten, Vorstellungen über mögliche zugrundeliegende Verteilungen, Eigenschaften oder Besonderheiten zu entwickeln oder einfache Beschreibungen der Daten mit wenigen, möglichst aussagekräftigen Kenngrößen zu ermöglichen. In Abhängigkeit von den Skalenniveaus und anderen Eigenschaften der Daten (wie z.b. univariate, bivariate oder multivariate Datensätze) können unterschiedliche Graphiken und Kenngrößen genutzt werden. Im Rahmen dieser Vorlesung werden nicht alle Möglichkeiten vorgestellt, sondern nur eine Auswahl von häufiger verwendeten bzw. aussagekräftigen Graphiken und Maßzahlen. Prof. Dr. Hans-Jörg Starkloff (TUBAF) Stochastik/Statistik für Ingenieure Vorlesung 10 1
3 Fragestellungen im Zusammenhang mit den Graphiken Für welche Daten eignet sich die Graphik? Wie ist die Graphik aufgebaut? Wie interpretiert man die Graphik? Welche Informationen kann die Graphik liefern und warum? Welche Informationen kann die Graphik nicht liefern und warum? Versucht man mit einer vorliegenden Graphik zu täuschen, etwas bestimmtes zu suggerieren? (Zitat, zu finden z.b. in Benesch, Schlüsselkonzepte zur Statistik, Springer, 2013, S.2: Die Statistik ist dem Politiker, was die Laterne dem Betrunkenen ist: Sie dient zum Festhalten, nicht der Erleuchtung. ) Prof. Dr. Hans-Jörg Starkloff (TUBAF) Stochastik/Statistik für Ingenieure Vorlesung 10 2
4 Graphiken für univariate stetige Daten (a) Punktdiagramme Ein Punktdiagramm kann für ein stetiges Merkmal erstellt werden. Dabei werden die Beobachtungswerte durch Punkte auf einem geeigneten Abschnitt der reellen Zahlengeraden markiert. Man erhält einen Überblick über den Bereich, in dem Beobachtungswerte liegen und wie stark sie streuen. Teilweise kann man Teilbereiche erkennen, in denen sich die Beobachtungswerte häufen oder seltener vorkommen. Ebenfalls kann man sehr große oder sehr kleine Beobachtungswerte, die von der Masse der Werte relativ weit entfernt sind und eventuell als Ausreißer zu behandeln sind, erkennen. Die Zusatzinformationen zum Datensatz muss ggf. mit genutzt werden (falls Daten transformiert sind etc.). Prof. Dr. Hans-Jörg Starkloff (TUBAF) Stochastik/Statistik für Ingenieure Vorlesung 10 3
5 Probleme mit Punktdiagrammen Zusammenfallende oder sehr nah beieinander liegende Beobachtungswerte sind im Diagramm nicht mehr unterscheidbar, so dass Punkte durch Überdeckung verloren gehen können. Diese Problem kann man beheben, indem man die Punktpositionen in die ungenutzte Richtung (vertikal bei horizontalen Punktdiagrammen) durch systematisches Stapeln (gestapeltes Punktdiagramm) oder durch zufälliges Verzittern (verzittertes Punktdiagramm) verschiebt. Ein verzittertes Punktdiagramm sieht nach jedem Neuzeichnen anders aus. Beim gestapelten Punktdiagramm können Muster vorgegaukelt werden, die aber nur sehr zufällig und damit wenig aussagekräftig sind. Die Verteilung der Punkte kann nicht immer gut erfasst werden. Prof. Dr. Hans-Jörg Starkloff (TUBAF) Stochastik/Statistik für Ingenieure Vorlesung 10 4
6 Punktdiagramm für Datensatz Lichtgeschwindigkeitsmessungen > data(morley) > lightspeeds=morley$speed > stripchart(lightspeeds, main= Punktdiagramm Lichtgeschwindigkeitsmessungen ) Punktdiagramm Lichtgeschwindigkeitsmessungen Prof. Dr. Hans-Jörg Starkloff (TUBAF) Stochastik/Statistik für Ingenieure Vorlesung 10 5
7 Gestapeltes Punktdiagramm für Beispiel > stripchart(lightspeeds,method= stack, main= Gestapeltes Punktdiagramm Lichtgeschwindigkeitsmessungen ) Gestapeltes Punktdiagramm Lichtgeschwindigkeitsmessungen Prof. Dr. Hans-Jörg Starkloff (TUBAF) Stochastik/Statistik für Ingenieure Vorlesung 10 6
8 Verzittertes Punktdiagramm für Beispiel > stripchart(lightspeeds,method= jitter, main= Verzittertes Punktdiagramm Lichtgeschwindigkeitsmessungen ) Verzittertes Punktdiagramm Lichtgeschwindigkeitsmessungen Prof. Dr. Hans-Jörg Starkloff (TUBAF) Stochastik/Statistik für Ingenieure Vorlesung 10 7
9 (b) Histogramme Ausgangspunkt für ein Histogramm ist eine Klasseneinteilung der Beobachtungswerte. Dazu wird ein Intervall, in dem alle Beobachtungswerte liegen, in eine endliche Anzahl disjunkter Teilintervalle, die sogenannten Klassen oder Gruppen zerlegt. Jede Klasse ist dann eindeutig durch die Klassenmitte und die Klassenbreite bzw. durch die untere und obere Klassengrenze bestimmt. Die Anzahl der Klassen sollte nicht zu klein und nicht zu groß sein. Die Klassenbreiten sollten übereinstimmen (ggf. mit Ausnahme der Randklassen). Nach Festlegung einer Klasseneinteilung werden die absoluten Klassenhäufigkeiten bestimmt, d.h. für jede Klasse wird die Anzahl der Beobachtungswerte in der Klasse gezählt. Dann werden in einem Koordinatensystem aneinanderstoßende Rechtecke mit den Klassenintervallen als Basis und Höhen proportional zur Klassenhäufigkeit gezeichnet. Prof. Dr. Hans-Jörg Starkloff (TUBAF) Stochastik/Statistik für Ingenieure Vorlesung 10 8
10 Histogramm für Beispiel Lichtgeschwindigkeiten > hist(lightspeeds) Histogram of lightspeeds Frequency lightspeeds Prof. Dr. Hans-Jörg Starkloff (TUBAF) Stochastik/Statistik für Ingenieure Vorlesung 10 9
11 Histogramm und gestapeltes Punktdiagramm für Beispiel > hist(lightspeeds) > stripchart(lightspeeds,method= stack,add=t,col=2) Histogram of lightspeeds Frequency lightspeeds Prof. Dr. Hans-Jörg Starkloff (TUBAF) Stochastik/Statistik für Ingenieure Vorlesung 10 10
12 Histogramm mit 3 Klassen und Punktdiagramm für Beispiel > b=c(299600,299800,300000,300200) > hist(lightspeeds,breaks=b) > stripchart(lightspeeds,method= stack,add=t,col=2) Histogram of lightspeeds Frequency lightspeeds Prof. Dr. Hans-Jörg Starkloff (TUBAF) Stochastik/Statistik für Ingenieure Vorlesung 10 11
13 Histogramm mit 50 Klassen und Punktdiagramm für Beispiel > b=c(seq(299600,300100,by=10)) > hist(lightspeeds,breaks=b) > stripchart(lightspeeds,method= stack,add=t,col=2) Histogram of lightspeeds Frequency lightspeeds Prof. Dr. Hans-Jörg Starkloff (TUBAF) Stochastik/Statistik für Ingenieure Vorlesung 10 12
14 Bemerkungen zu Histogrammen Die Gestalt eines Histogramms hängt stark von der gewählten Klasseneinteilung (und auch des gewählten Gesamtintervalls) ab, deshalb sollte man ggf. etwas experimentieren, um ein möglichst aussagekräftiges Histogramm zu erzeugen. Durch die Klasseneinteilung geht Information verloren. Man kann eventuell Ausreißer am linken oder rechten Rand erkennen. Man kann eventuell Verteilungseigenschaften, wie Symmetrie oder Schiefe erkennen (oder erahnen). Bei unterschiedlichen Klassenbreiten sollten die Flächeninhalte der Rechtecke proportional zu den Häufigkeiten sein. Statt der absoluten Häufigkeiten können die Höhen der Rechtecke auch so normiert werden, dass der Gesamtflächeninhalt unter allen Rechtecken gleich 1 ist. Dann ist ein (meist nicht sehr belastbarer) Vergleich mit einer Verteilungsdichte möglich. Prof. Dr. Hans-Jörg Starkloff (TUBAF) Stochastik/Statistik für Ingenieure Vorlesung 10 13
15 Histogramm mit Normalverteilungsdichteschätzung für Beispiel > hist(lightspeeds,freq=f) > curve(dnorm(x,mean(lightspeeds),sd(lightspeeds)),add=t,col=2) Histogram of lightspeeds Density lightspeeds Prof. Dr. Hans-Jörg Starkloff (TUBAF) Stochastik/Statistik für Ingenieure Vorlesung 10 14
16 (c) Kenngrößen und Parameter zur Beschreibung von Daten Lageparameter Mittelwerte (arithmetisch, geometrisch, harmonisch) empirischer Median empirische Quantile (Quartile, Dezentile,... ) Variabililitätsparameter (Streuparameter) empirische Varianz empirische Standardabweichung Spannweite empirischer (Inter-)Quartilsabstand IQR empirischer Variationskoeffizient empirische geometrische Standardabweichung Formparameter (später) empirische Schiefe empirische Wölbung Prof. Dr. Hans-Jörg Starkloff (TUBAF) Stochastik/Statistik für Ingenieure Vorlesung 10 15
17 (c01) Arithmetischer Mittelwert Für reelle Beobachtungswerte x 1, x 2,..., x n ist der arithmetische Mittelwert definiert durch x = 1 n x i = 1 n n (x 1 + x x n ). i=1 In der Statistik wird er als Realisierung des Stichprobenmittelwerts (eine spezielle Stichproben- oder Schätzfunktion) X = 1 n n X i = 1 n (X 1 + X X n ) i=1 einer mathematischen Stichprobe (X 1, X 2,..., X n ) (unabhängige und identisch verteilte Zufallsgrößen) betrachtet. Diese liefert unter geeigneten Voraussetzungen eine erwartungstreue und konsistente Schätzfunktion für den Erwartungswert der Zufallsgrößen X i : ÊX = X. Prof. Dr. Hans-Jörg Starkloff (TUBAF) Stochastik/Statistik für Ingenieure Vorlesung 10 16
18 Arithmetischer Mittelwert in R Der Befehl in R zur Berechnung des (arithmetischen) Mittelwertes ist mean(). > mean(lightspeeds) [1] Histogram of lightspeeds Ein Histogramm mit Mittelwertslinie kann dann so erzeugt werden: > hist(lightspeeds) > abline(v=mean(lightspeeds),col=2) Frequency lightspeeds Prof. Dr. Hans-Jörg Starkloff (TUBAF) Stochastik/Statistik für Ingenieure Vorlesung 10 17
19 (c02) Geometrischer Mittelwert Für nichtnegative reelle Beobachtungswerte (einer ratio-skala) x 1, x 2,..., x n ist der geometrische Mittelwert definiert durch x G = n n x i = (x 1 x 2... x n ) 1 n. i=1 Bemerkung: Es gilt immer x G x. Anwendung findet er zum Beispiel, wenn eine logarithmische Skala (Transformation) sinnvoll ist oder die Merkmalsausprägungen relative Änderungen sind, so bei der Mittelung von Wachstumsfaktoren. In R kann man die Exponentialfunktion zur Berechnung von geometrischen Mittelwerten nutzen: ( ) 1 n x G = exp ln(x i ). n i=1 Prof. Dr. Hans-Jörg Starkloff (TUBAF) Stochastik/Statistik für Ingenieure Vorlesung 10 18
20 Beispiel zum geometrischen Mittelwert Beispiel: Zeitpunkt Zustandswert Merkmalswert=Wachstumsfaktor x 1 = 0.81 x 2 = x G = aber x = (obwohl insgesamt keine Änderung des Zustandswerts zum Ausgangszeitpunkt vorliegt). In R ergibt zum Beispiel: > x=c(81/100,100/81) > exp(mean(log(x))) [1] 1 > mean(x) [1] Bemerkung: log(x) berechnet in R den Vektor der natürlichen Logarithmen des Vektors x. Prof. Dr. Hans-Jörg Starkloff (TUBAF) Stochastik/Statistik für Ingenieure Vorlesung 10 19
21 (c03) Harmonischer Mittelwert In manchen Situationen ist für nur positive (oder nur negative) Beobachtungswerte x 1, x 2,..., x n der harmonische Mittelwert x H = besser geeignet, so z.b. Mittelwertbildung von Anteilen oder Prozentzahlen oder bei der Berechnung von Durchschittsgeschwindigkeiten (gleichlange Teilstrecken) oder Durchschnittspreisen. Gilt x i > 0 für alle i = 1,..., n, dann gilt immer n n i=1 1 x i x H x G x. Im Fall von x 1 = x 2 =... = x n = x > 0 erhält man x H = x G = x = x. Prof. Dr. Hans-Jörg Starkloff (TUBAF) Stochastik/Statistik für Ingenieure Vorlesung 10 20
22 Beispiel zum harmonischen Mittelwert Beispiel: Konstante Geschwindigkeiten auf jeweiligen Teilstrecken Teil-/Gesamtstrecke Streckenlänge in km Zeit in h Geschwindigkeit in km/h x 1 = 50 x 2 = = x H = 2 = 66.66, aber x = 75 und x G = In R (ab dem Zeichen # beginnt ein Kommentar): > x=c(50,100) > 1/mean(1/x) # Harmonisches Mittel [1] > mean(x) # Arithmetisches Mittel [1] 75 > exp(mean(log(x))) # Geometrisches Mittel [1] Prof. Dr. Hans-Jörg Starkloff (TUBAF) Stochastik/Statistik für Ingenieure Vorlesung 10 21
23 (c04) Empirischer Median Der empirische Median oder Zentralwert der Beobachtungsreihe x 1, x 2,..., x n ist dadurch gekennzeichnet, dass jeweils 50 % der Beobachtungswerte einen Wert größer oder gleich bzw. kleiner oder gleich dem empirischen Median annehmen. Sind x (1) x (2)... x (n) die der Größe nach geordneten Beobachtungswerte, kann der (empirische) Median x durch x n+1 2 ), falls n ungerade, x = (, falls n gerade, bestimmt werden. 1 2 x ( n 2 ) + x ( n 2 +1) ) Prof. Dr. Hans-Jörg Starkloff (TUBAF) Stochastik/Statistik für Ingenieure Vorlesung 10 22
24 Beispiele zum empirischen Median Beobachtungswerte 4, 5, 1, 3, 6, 7, 8 n = 7, x = 5, x = Beobachtungswerte 4, 5, 1, 3, 6, 7 n = 6, x = 4.5, x = Beobachtungswerte 9, 10, 8, 11, 12, 9, 1000 n = 7, x = 10, x = Der Median ist weniger empfindlich gegenüber Ausreißern in der Beobachtungsreihe, d.h. Werte, die weit von den übrigen entfernt liegen, beeinflussen den Median nicht (oder kaum). Dies trifft auf den arithmetischen Mittelwert im Allgemeinen nicht zu. In R: > median(lightspeeds) [1] Der Median kann sogar für Daten auf einer nur ordinalen Skala genutzt werden (wenn z.b. die Addition, die zur Bildung des arithmetischen Mittelwerts notwendig ist, gar keinen Sinn macht). Prof. Dr. Hans-Jörg Starkloff (TUBAF) Stochastik/Statistik für Ingenieure Vorlesung 10 23
25 Histogramm mit Linie für Mittelwert (rot) und Median (blau) für Beispiel > hist(lightspeeds) > abline(v=mean(lightspeeds),col=2) > abline(v=median(lightspeeds),col=4) Histogram of lightspeeds Frequency lightspeeds Prof. Dr. Hans-Jörg Starkloff (TUBAF) Stochastik/Statistik für Ingenieure Vorlesung 10 24
26 (c05) Empirische Quantile Ein Ordnen der Datenreihe x 1, x 2,..., x n der Größe nach ergibt die geordnete Datenreihe (geordnete Stichprobe, Variationsreihe) x min := x (1) x (2)... x (n 1) x (n) =: x max. Andere Bezeichnungen für die Variationsreihe sind x 1 x 2... x n oder x 1:n x 2:n... x n:n. Das empirisches p Quantil mit 0 < p < 1 ist ein Zahlenwert ˆx p (oder bezeichnet mit x p ) für den gilt, dass p 100% der Werte in der Variationsreihe kleiner oder gleich ˆx p und (1 p) 100% der Werte größer oder gleich ˆx p sind. ˆx p = x (k), falls np keine ganze Zahl ist, k ist ( ) x(k) + x (k+1), dann die auf np folgende ganze Zahl; falls np =: k eine ganze Zahl ist. 1 2 Prof. Dr. Hans-Jörg Starkloff (TUBAF) Stochastik/Statistik für Ingenieure Vorlesung 10 25
27 Beispiel zu empirischen Quantilen 10 Beobachtungswerte: 1, 3, 7, 2, 20, 9, 15, 2, 11, 10. Variationsreihe: Quantil : p = 0.05, np = 0.5 k = 1, ˆx 0.05 = x (1) = Quantil : p = 0.10, np = 1 = k ˆx 0.05 = 1 2 (x (1) + x (2) ) = Quantil : p = 0.20, np = 2 = k ˆx 0.20 = 1 2 (x (2) + x (3) ) = Quantil : p = 0.25, np = 2.5 k = 3, ˆx 0.25 = x (3) = Quantil : p = 0.50, np = 5 = k ˆx 0.50 = 1 2 (x (5) + x (6) ) = 8 = x. Prof. Dr. Hans-Jörg Starkloff (TUBAF) Stochastik/Statistik für Ingenieure Vorlesung 10 26
28 Spezielle Quantile Das 0.5 Quantil ist der Median. Das 0.25 Quantil heißt auch unteres oder erstes Quartil (oder auch unterer Viertelwert). Das 0.75 Quantil heißt auch oberes oder drittes Quartil (oder auch oberer Viertelwert). Das n 10 Quantil mit n {1, 2, 3, 4, 5, 6, 7, 8, 9} heißt auch n tes Dezentil. Als 0 Quantil kann man das Minumum x min = x (1) ansehen. Als 1 Quantil kann man das Maximum x max = x (n) ansehen. Prof. Dr. Hans-Jörg Starkloff (TUBAF) Stochastik/Statistik für Ingenieure Vorlesung 10 27
29 Berechnung von Quantilen mit R Der Befehl quantile() erzeugt als Ausgabe eine Tabelle mit Werten für das Minimum, das Maximum, den Median und die Quartile. Beispiel: > quantile(lightspeeds) 0% 25% 50% 75% 100% Sollen für bestimmte Niveaus p die zugehörigen Quantile berechnet werden, können diese dem Befehl mit übergeben werden. Beispiele: > quantile(lightspeeds,c(0.1,0.2,0.3)) 10% 20% 30% > quantile(lightspeeds,seq(0.8,0.95,0.05)) 80% 85% 90% 95% Prof. Dr. Hans-Jörg Starkloff (TUBAF) Stochastik/Statistik für Ingenieure Vorlesung 10 28
30 (c06) Empirische Varianz Für reelle Beobachtungswerte x 1, x 2,..., x n ist die empirische Varianz ( s 2 = 1 n n ) (x i x) 2 = 1 x 2 i nx 2. n 1 n 1 i=1 In der Statistik wird sie als Realisierung des Stichprobenvarianz S 2 = 1 n 1 i=1 n (X i X) 2 i=1 einer mathematischen Stichprobe (X 1, X 2,..., X n ) betrachtet. Diese liefert unter geeigneten Voraussetzungen durch die Wahl des Nenners n 1 eine erwartungstreue und konsistente Schätzfunktion für die Varianz der Zufallsgrößen X i : VarX = S 2. Prof. Dr. Hans-Jörg Starkloff (TUBAF) Stochastik/Statistik für Ingenieure Vorlesung 10 29
31 (c07) Empirische Standardabweichung So wie die (theoretische) Standardabweichung einer Zufallsgröße als Quadratwurzel aus der Varianz definiert wird, wird die empirische Standardabweichung als Quadratwurzel aus der empirischen Varianz definiert: s = s 2 = 1 n (x i x) n 1 2. Sowohl die empirische Varianz als auch die empirische Standardabweichung sind empfindlich gegenüber Ausreißern. Außerdem können beide Maßzahlen nur bei bestimmten Verteilungen, wie z.b. der Normalverteilung, gut interpretiert werden. Bei Merkmalswerten mit (physikalischen etc.) Maßeinheiten kommt bei der empirischen Varianz diese Maßeinheit im Quadrat vor, bei der empirischen Standardabweichung die Maßeinheit selber. i=1 Prof. Dr. Hans-Jörg Starkloff (TUBAF) Stochastik/Statistik für Ingenieure Vorlesung 10 30
32 (c08) Spannweite Die Spannweite (oder Variationsbreite) ist die Differenz der extremalen Werte, = x max x min = x (n) x (1). Sie gibt folglich die Länge des kleinsten Intervalls an, in das alle Beobachtungswerte fallen. Die Spannweite ist empfindlich gegenüber Ausreißern, das sie nur von den extremen Werten abhängt. Die bisher behandelten drei Streumaße lassen sich wie folgt in R berechnen: > var(lightspeeds) # empirische Varianz [1] > sd(lightspeeds) # empirische Standardabweichung [1] > max(lightspeeds)-min(lightspeeds) # Spannweite [1] 450 Prof. Dr. Hans-Jörg Starkloff (TUBAF) Stochastik/Statistik für Ingenieure Vorlesung 10 31
33 (c09) Empirischer Interquartilsabstand Der empirische Interquartilsabstand ist die Differenz des oberen und des unteren Quartils, IQR(x) = ˆx 0.75 ˆx Da die sehr großen und sehr kleinen Beobachtungswerte bei der Berechnung des Interquartilsabstands keine Rolle spielen, ist er relativ unempfindlich gegenüber Ausreißern. In dem Intervall der Länge des Interquartilabstandes vom unteren zum oberen Quartil liegt die Hälfte der Beobachtungswerte. Über die andere Hälfte der Beobachtungswerte kann allerdings mit Hilfe dieser Kenngröße nichts wesentliches ausgesagt werden. In R: > IQR(lightspeeds) [1] 85 Prof. Dr. Hans-Jörg Starkloff (TUBAF) Stochastik/Statistik für Ingenieure Vorlesung 10 32
34 (c10) Streumaße für die ratio-skala Für Merkmalswerte in der ratio-skala können Streumaße durch Quotientenbildung in Bezug zu Lagemaßen gebracht werden. Dadurch entstehen einheitenlose Maßzahlen, die z.b. zum Vergleich unterschiedlicher Daten genutzt werden können. Der empirische Variationskoeffizient ist definiert durch v(x) = s x, er ist eine Schätzung für den theoretischen Variationskoeffizienten. In R: > sd(lightspeeds)/mean(lightspeeds) [1] Prof. Dr. Hans-Jörg Starkloff (TUBAF) Stochastik/Statistik für Ingenieure Vorlesung 10 33
35 Geometrische Standardabweichung Die (theoretische) geometrische Standardabweichung einer positiven Zufallsgröße X ist definiert durch ( ) exp Var (ln(x)), den entsprechenden empirischen Wert für eine Datenreihe dazu erhält man, in dem man die Standardabweichung durch die empirische Standardabweichung ersetzt. In R: > exp(sd(log(lightspeeds))) [1] Prof. Dr. Hans-Jörg Starkloff (TUBAF) Stochastik/Statistik für Ingenieure Vorlesung 10 34
36 (d) Box-Plot Ein Box-Plot ( Box-Whisker-Plot, Kasten-Diagramm) ist eine aussagekräftige graphische Darstellung der Fünfer-Charakteristik, bestehend aus Median x = ˆx 0.5, den empirischen Quartilen (Viertelwerten) ˆx 0.25 und ˆx 0.75 und den Ausreißergrenzen A u, A o. Die Ausreißergrenzen werden dabei definiert durch A u = ˆx IQR(x) und A o = ˆx IQR(x). Dies betrifft die sogenannten inneren Zäune; ( inner fences ) für manche Fragen verwendet man auch die sogenannten äußere Zäune ( outer fences ), definiert durch ±3 IQR(x). Die Grenzen für die Box ( hinges, Tukeys Scharniere (Türangel) ) werden durch das untere und das obere Quartil bestimmt. Eine gerade Linie kennzeichnet innerhalb der Box den Median. Prof. Dr. Hans-Jörg Starkloff (TUBAF) Stochastik/Statistik für Ingenieure Vorlesung 10 35
37 Fortsetzung Box-Plots Die untere Begrenzungslinie wird dabei nicht durch die untere Ausreißergrenze definiert, sondern durch den kleinsten Wert, der A u ist, bzw. sie ist = x min falls x min A u. Analog wird die obere Begrenzungslinie definiert durch den größten Wert, der A o ist bzw. = x max falls x max A u. Diese Grenzen heißen auch Whisker-Grenzen ( whisker : Schnurrhaare der Katze). Ausreißer (d.h. Datenwerte außerhalb der Ausreißergrenzen) werden extra durch Punkte angegeben. Dabei werden ein einfacheres Symbol für näher liegende Ausreißer und ein auffälligeres Symbol für die sogenannten fernen Ausreißer (extreme oder krasse Ausreißer) verwendet, die außerhalb der äußeren Zäune liegen (bzw. z.b. bei Prof. van den Boogaart mehr als 2.5 IQR(x) von der Box enfernt liegen). Prof. Dr. Hans-Jörg Starkloff (TUBAF) Stochastik/Statistik für Ingenieure Vorlesung 10 36
38 Erzeugung von Box-Plots in R In R: > boxplot(lightspeeds) erzeugt ein vertikales Box-Plot vom Datensatz lightspeeds, ein horizontales Box-Plot wird erzeugt durch > boxplot(lightspeeds,horizontal=true) Die Kenngrößen in diesem Datensatz waren: Median x = ˆx 0.95 = ; unteres Quartil ˆx 0.25 = ; oberes Quartil ˆx 0.75 = ; Quartilsabstand IQR(x) = 85 ; untere Ausreißergrenze obere Ausreißergrenze A u = ˆx IQR(x) = ; A u = ˆx IQR(x) = Prof. Dr. Hans-Jörg Starkloff (TUBAF) Stochastik/Statistik für Ingenieure Vorlesung 10 37
39 Vertikales Box-Plot für Beispiel Lichtgeschwindigkeiten > boxplot(lightspeeds,main= Box-Plot Lichtgeschwindigkeiten ) Box Plot Lichtgeschwindigkeiten Prof. Dr. Hans-Jörg Starkloff (TUBAF) Stochastik/Statistik für Ingenieure Vorlesung 10 38
40 Horizontales Box-Plot für Beispiel Lichtgeschwindigkeiten > boxplot(lightspeeds,horizontal=true, main= Box-Plot Lichtgeschwindigkeiten ) Box Plot Lichtgeschwindigkeiten Prof. Dr. Hans-Jörg Starkloff (TUBAF) Stochastik/Statistik für Ingenieure Vorlesung 10 39
41 Horizontales Box-Plot mit Punktdiagramm für Beispiel > boxplot(lightspeeds,horizontal=true, main= Box-Plot Lichtgeschwindigkeiten ) > stripchart(lightspeeds,method= stack,col=2,add=true) Box Plot Lichtgeschwindigkeiten Prof. Dr. Hans-Jörg Starkloff (TUBAF) Stochastik/Statistik für Ingenieure Vorlesung 10 40
42 Daten für Box-Plots in R Die Zahlenwerte für das Box-Whisker-Plot, aus denen sich die graphische Darstellung ergibt, können durch den Funktionsaufruf boxplot()$stats abgefragt werden. Im Beispiel: > boxplot(lightspeeds)$stats [,1] [1,] [2,] [3,] [4,] [5,] Prof. Dr. Hans-Jörg Starkloff (TUBAF) Stochastik/Statistik für Ingenieure Vorlesung 10 41
43 Horizontales Box-Plot für Beispiel mit Statgraphics Prof. Dr. Hans-Jörg Starkloff (TUBAF) Stochastik/Statistik für Ingenieure Vorlesung 10 42
44 Gekerbte Box-Whisker-Plots Als zusätzliche Information werden manchmal zusätzlich Kerben ( notches ) zur Kennzeichnung eines 95%-Konfidenzintervalles für den Median (unter Normalverteilungsannahme berechnet) mit eingezeichnet. Ein 95%-Konfidenzintervall für den Median ist dabei ein zufälliges Intervall, welches unter der bestimmten Verteilungsannahme den tatsächlichen oder wahren Median mit einer Wahrscheinlichkeit von 0.95 überdeckt. Für vorliegende Beobachtungswerte kann dann ein konkretes Intervall berechnet werden. In R kann ein solches gekerbtes Box-Plot durch den zusätzlichen Parameter notch=true im Befehl boxplot() erzeugt werden. Die Zahlenwerte dazu können mit boxplot()$conf abgefragt werden. Prof. Dr. Hans-Jörg Starkloff (TUBAF) Stochastik/Statistik für Ingenieure Vorlesung 10 43
45 Gekerbtes Box-Plot für Beispiel Lichtgeschwindigkeiten > boxplot(lightspeeds,main= Box-Plot Lichtgeschwindigkeiten, notch=true) > boxplot(lightspeeds)$conf [,1] [1,] [2,] gekerbtes Box Plot Lichtgeschwindigkeiten Prof. Dr. Hans-Jörg Starkloff (TUBAF) Stochastik/Statistik für Ingenieure Vorlesung 10 44
Statistik für Ingenieure Vorlesung 9
Statistik für Ingenieure Vorlesung 9 Prof. Dr. Hans-Jörg Starkloff TU Bergakademie Freiberg Institut für Stochastik 19. Dezember 2016 4.2. Grafiken und statistische Maßzahlen (Kenngrößen, Parameter) für
MehrStatistik für Ingenieure Vorlesung 9
Statistik für Ingenieure Vorlesung 9 Prof. Dr. Hans-Jörg Starkloff TU Bergakademie Freiberg Institut für Stochastik 9. Januar 2018 4.2.3. Kenngrößen und Parameter zur Beschreibung univariater Daten Lageparameter
MehrStatistik für Ingenieure Vorlesung 10
Statistik für Ingenieure Vorlesung 10 Prof. Dr. Hans-Jörg Starkloff TU Bergakademie Freiberg Institut für Stochastik 9. Januar 2017 (f) Empirische Varianz Für reelle Beobachtungswerte x 1, x 2,..., x n
MehrStatistik I für Betriebswirte Vorlesung 9
Statistik I für Betriebswirte Vorlesung 9 Dr. Andreas Wünsche TU Bergakademie Freiberg Institut für Stochastik Vorlesung am 8. Juni 2017 im Audi-Max (AUD-1001) Dr. Andreas Wünsche Statistik I für Betriebswirte
MehrStatistik für Ingenieure Vorlesung 8
Statistik für Ingenieure Vorlesung 8 Prof. Dr. Hans-Jörg Starkloff TU Bergakademie Freiberg Institut für Stochastik 19. Dezember 2017 Nutzung von Statistik-Computerprogrammen Statistische Untersuchungen
MehrStatistik I für Betriebswirte Vorlesung 9
Statistik I für Betriebswirte Vorlesung 9 Prof. Dr. Hans-Jörg Starkloff TU Bergakademie Freiberg Institut für Stochastik 06. Juni 2016 Prof. Dr. Hans-Jörg Starkloff Statistik I für Betriebswirte Vorlesung
MehrStatistik I für Betriebswirte Vorlesung 4
Statistik I für Betriebswirte Vorlesung 4 Prof. Dr. Hans-Jörg Starkloff TU Bergakademie Freiberg Institut für Stochastik 25. April 2016 Prof. Dr. Hans-Jörg Starkloff Statistik I für Betriebswirte Vorlesung
MehrVerfahren für metrische Variable
Verfahren für metrische Variable Grafische Methoden Histogramm Mittelwertsplot Boxplot Lagemaße Mittelwert, Median, Quantile Streuungsmaße Standardabweichung, Interquartilsabstand Lagemaße und Streumaße
MehrStochastik und Statistik Vorlesung 2 (Graphik I)
Stochastik und Statistik Vorlesung 2 (Graphik I) K.Gerald van den Boogaart http://www.math-inf.uni-greifswald.de/statistik Stochastik und Statistik p.1/44 Daten Schätzung Test Mathe Die Datenminen Riesige
MehrStochastik und Statistik Vorlesung 2 (Graphik I)
Stochastik und Statistik Vorlesung 2 (Graphik I) K.Gerald van den Boogaart http://www.stat.boogaart.de Stochastik und Statistik p.1/44 Daten Schätzung Test Mathe Die Datenminen Riesige Halde mit nichtrepräsentativen
MehrDatenanalyse und Statistik
Datenanalyse und Statistik Vorlesung 2 (Graphik I) K.Gerald van den Boogaart http://www.stat.boogaart.de Datenanalyse und Statistik p.1/44 Daten Schätzung Test Mathe Die Datenminen Riesige Halde mit nichtrepräsentativen
MehrStatistik für Ingenieure Vorlesung 3
Statistik für Ingenieure Vorlesung 3 Prof. Dr. Hans-Jörg Starkloff TU Bergakademie Freiberg Institut für Stochastik 14. November 2017 3. Zufallsgrößen 3.1 Zufallsgrößen und ihre Verteilung Häufig sind
Mehr3. Deskriptive Statistik
3. Deskriptive Statistik Eindimensionale (univariate) Daten: Pro Objekt wird ein Merkmal durch Messung / Befragung/ Beobachtung erhoben. Resultat ist jeweils ein Wert (Merkmalsausprägung) x i : - Gewicht
MehrStochastik und Statistik
Stochastik und Statistik p. 1/44 Stochastik und Statistik Vorlesung 2 (Graphik I) K.Gerald van den Boogaart http://www.stat.boogaart.de Stochastik und Statistik p. 2/44 Daten Schätzung Test Mathe Die Datenminen
Mehr5 Exkurs: Deskriptive Statistik
5 EXKURS: DESKRIPTIVE STATISTIK 6 5 Ekurs: Deskriptive Statistik Wir wollen zuletzt noch kurz auf die deskriptive Statistik eingehen. In der Statistik betrachtet man für eine natürliche Zahl n N eine Stichprobe
MehrEmpirische Verteilungsfunktion
Empirische Verteilungsfunktion H(x) := Anzahl der Werte x ist. Deskriptive
MehrKapitel 1 Beschreibende Statistik
Beispiel 1.25: fiktive Aktienkurse Zeitpunkt i 0 1 2 Aktienkurs x i 100 160 100 Frage: Wie hoch ist die durchschnittliche Wachstumsrate? Dr. Karsten Webel 53 Beispiel 1.25: fiktive Aktienkurse (Fortsetzung)
MehrDiese Lücken sollten nicht auch bei Ihnen vorhanden sein: Aufgrund einer statistischen Untersuchung entsteht eine geordnete bzw. ungeordnete, die durc
SS 2017 Torsten Schreiber 222 Diese Lücken sollten nicht auch bei Ihnen vorhanden sein: Aufgrund einer statistischen Untersuchung entsteht eine geordnete bzw. ungeordnete, die durch Summierung je Ausprägung
MehrÜbungsrunde 2, Gruppe 2 LVA , Übungsrunde 1, Gruppe 2, Markus Nemetz, TU Wien, 10/2006
1 1.2.3.4. 1.1 Angabe Übungsrunde 2, Gruppe 2 LVA 107.369, Übungsrunde 1, Gruppe 2, 24.10. Markus Nemetz, markus.nemetz@tuwien.ac.at, TU Wien, 10/2006 Bestimmen Sie für den Datensatz bulb.dat die Quartile,
MehrLösungen. w58r4p Lösungen. w58r4p. Name: Klasse: Datum:
Testen und Fördern Name: Klasse: Datum: 1) Ermittle jeweils das arithmetische Mittel. Ordne die Datenerhebungen nach der Größe der arithmetischen Mittel. Beginne mit dem Größten. 45, 39, 44, 48, 42, 39,
Mehr2. Deskriptive Statistik
Philipps-Universitat Marburg 2.1 Stichproben und Datentypen Untersuchungseinheiten: mogliche, statistisch zu erfassende Einheiten je Untersuchungseinheit: ein oder mehrere Merkmale oder Variablen beobachten
MehrKreisdiagramm, Tortendiagramm
Kreisdiagramm, Tortendiagramm Darstellung der relativen (absoluten) Häufigkeiten als Fläche eines Kreises Anwendung: Nominale Merkmale Ordinale Merkmale (Problem: Ordnung nicht korrekt wiedergegeben) Gruppierte
MehrWeitere Lagemaße: Quantile/Perzentile I
3 Auswertung von eindimensionalen Daten Lagemaße 3.3 Weitere Lagemaße: Quantile/Perzentile I Für jeden Median x med gilt: Mindestens 50% der Merkmalswerte sind kleiner gleich x med und ebenso mindestens
MehrStatistik und Wahrscheinlichkeitsrechnung
Statistik und Wahrscheinlichkeitsrechnung 3. Vorlesung Dr. Jochen Köhler 1 Inhalte der heutigen Vorlesung Ziel: Daten Modellbildung Probabilistisches Modell Wahrscheinlichkeit von Ereignissen Im ersten
Mehr1 45, 39, 44, 48, 42, 39, 40, , 31, 46, 35, 31, 42, 51, , 42, 33, 46, 33, 44, 43
1) Ermittle jeweils das arithmetische Mittel. Ordne die Datenerhebungen nach der Größe der arithmetischen Mittel. Beginne mit dem Größten. 1 45, 39, 44, 48, 42, 39, 40, 31 2 35, 31, 46, 35, 31, 42, 51,
MehrDeskriptive Statistik
Deskriptive Statistik Deskriptive Statistik: Ziele Daten zusammenfassen durch numerische Kennzahlen. Grafische Darstellung der Daten. Quelle: Ursus Wehrli, Kunst aufräumen 1 Modell vs. Daten Bis jetzt
MehrStatistik I für Betriebswirte Vorlesung 3
Statistik I für Betriebswirte Vorlesung 3 Dr. Andreas Wünsche TU Bergakademie Freiberg Institut für Stochastik 15. April 2019 Dr. Andreas Wünsche Statistik I für Betriebswirte Vorlesung 3 Version: 1. April
MehrBeschreibende Statistik Kenngrößen in der Übersicht (Ac )
Beschreibende Statistik Kenngrößen in der Übersicht (Ac 006-019) Boxplot Im folgenden wird die Berechnungsweise des TI 83 (sowie von SPSS, s. unten) verwendet. Diese geht auf eine Festlegung von Moore
MehrMathematische Statistik. Zur Notation
Mathematische Statistik dient dazu, anhand von Stichproben Informationen zu gewinnen. Während die Wahrscheinlichkeitsrechnung Prognosen über das Eintreten zufälliger (zukünftiger) Ereignisse macht, werden
MehrStatistik K urs SS 2004
Statistik K urs SS 2004 3.Tag Grundlegende statistische Maße Mittelwert (mean) Durchschnitt aller Werte Varianz (variance) s 2 Durchschnittliche quadrierte Abweichung aller Werte vom Mittelwert >> Die
MehrDer Mittelwert (arithmetisches Mittel)
Der Mittelwert (arithmetisches Mittel) x = 1 n n x i bekanntestes Lagemaß instabil gegen extreme Werte geeignet für intervallskalierte Daten Deskriptive Statistik WiSe 2015/2016 Helmut Küchenhoff (Institut
MehrDeskriptive Statistik
Deskriptive Statistik 1 Ziele In der deskriptiven (=beschreibenden) Statistik werden Untersuchungsergebnisse übersichtlich dargestellt, durch Kennzahlen charakterisiert und grafisch veranschaulicht. 2
MehrDeskriptive Statistik. (basierend auf Slides von Lukas Meier)
Deskriptive Statistik (basierend auf Slides von Lukas Meier) Deskriptive Statistik: Ziele Daten zusammenfassen durch numerische Kennzahlen. Grafische Darstellung der Daten. Quelle: Ursus Wehrli, Kunst
MehrDeskription, Statistische Testverfahren und Regression. Seminar: Planung und Auswertung klinischer und experimenteller Studien
Deskription, Statistische Testverfahren und Regression Seminar: Planung und Auswertung klinischer und experimenteller Studien Deskriptive Statistik Deskriptive Statistik: beschreibende Statistik, empirische
Mehr4 Statistische Maßzahlen
4 Statistische Maßzahlen 4.1 Maßzahlen der mittleren Lage 4.2 Weitere Maßzahlen der Lage 4.3 Maßzahlen der Streuung 4.4 Lineare Transformationen, Schiefemaße 4.5 Der Box Plot Ziel: Charakterisierung einer
MehrStatistik für Ingenieure Vorlesung 5
Statistik für Ingenieure Vorlesung 5 Prof. Dr. Hans-Jörg Starkloff TU Bergakademie Freiberg Institut für Stochastik 28. November 2017 3.4 Wichtige stetige Verteilungen 3.4.1 Exponentialverteilung Parameter:
MehrStatistik I für Betriebswirte Vorlesung 2
Statistik I für Betriebswirte Vorlesung 2 PD Dr. Frank Heyde TU Bergakademie Freiberg Institut für Stochastik 16. April 2015 PD Dr. Frank Heyde Statistik I für Betriebswirte Vorlesung 2 1 ii) empirische
MehrStochastik und Statistik für Ingenieure Vorlesung 4
Prof. Dr. Hans-Jörg Starkloff TU Bergakademie Freiberg Institut für Stochastik Stochastik und Statistik für Ingenieure Vorlesung 4 30. Oktober 2012 Quantile einer stetigen Zufallsgröße Die reelle Zahl
MehrHerzlich willkommen zur Vorlesung Statistik. Streuungsmaße oder die Unterschiedlichkeit der Daten nebst kurzen Ausführungen zu Schiefe und Wölbung
FB 1 W. Ludwig-Mayerhofer Statistik 1 Herzlich willkommen zur Vorlesung Statistik smaße oder die Unterschiedlichkeit der Daten nebst kurzen Ausführungen zu Schiefe und Wölbung FB 1 W. Ludwig-Mayerhofer
MehrInstitut für Biometrie und klinische Forschung. WiSe 2012/2013
Klinische Forschung WWU Münster Pflichtvorlesung zum Querschnittsfach Epidemiologie, Biometrie und Med. Informatik Praktikum der Medizinischen Biometrie () Überblick. Deskriptive Statistik I - Grundlegende
MehrTeil VII. Deskriptive Statistik. Woche 5: Deskriptive Statistik. Arbeitsschritte der Datenanalyse. Lernziele
Woche 5: Deskriptive Statistik Teil VII Patric Müller Deskriptive Statistik ETHZ WBL 17/19, 22.05.2017 Wahrscheinlichkeit und Statistik Patric Müller WBL 2017 Wahrscheinlichkeit
MehrStatistik für Ingenieure Vorlesung 6
Statistik für Ingenieure Vorlesung 6 Prof. Dr. Hans-Jörg Starkloff TU Bergakademie Freiberg Institut für Stochastik 05. Dezember 2017 3.4.3 Stetige Gleichverteilung Parameter: Intervall [a, b] R. Zufallsgröße
MehrStatistik I für Betriebswirte Vorlesung 13
Statistik I für Betriebswirte Vorlesung 13 Prof. Dr. Hans-Jörg Starkloff TU Bergakademie Freiberg Institut für Stochastik 4. Juli 2016 Prof. Dr. Hans-Jörg Starkloff Statistik I für Betriebswirte Vorlesung
MehrEinführung in Quantitative Methoden
Einführung in Quantitative Methoden Mag. Dipl.Ing. Dr. Pantelis Christodoulides & Mag. Dr. Karin Waldherr SS 2014 Christodoulides / Waldherr Einführung in Quantitative Methoden- 2.VO 1/57 Die Deskriptivstatistik
Mehr4 Statistische Maßzahlen
4 Statistische Maßzahlen 4.1 Maßzahlen der mittleren Lage 4.2 Weitere Maßzahlen der Lage 4.3 Maßzahlen der Streuung 4.4 Lineare Transformationen, Schiefemaße 4.5 Der Box Plot Ziel: Charakterisierung einer
Mehr4. Kumulierte Häufigkeiten und Quantile
4. Kumulierte Häufigkeiten und Quantile Statistik für SoziologInnen 1 4. Kumulierte Häufigkeiten und Quantile Kumulierte Häufigkeiten Oft ist man nicht an der Häufigkeit einzelner Merkmalsausprägungen
MehrGrundlagen der Wahrscheinlichkeitstheorie und Statistik für Studierende der Informatik
INSTITUT FÜR STOCHASTIK WS 2007/08 UNIVERSITÄT KARLSRUHE Blatt 1 Dr. B. Klar Übungen zur Vorlesung Grundlagen der Wahrscheinlichkeitstheorie und Statistik für Studierende der Informatik Musterlösungen
MehrStatistik I für Betriebswirte Vorlesung 14
Statistik I für Betriebswirte Vorlesung 14 Prof. Dr. Hans-Jörg Starkloff TU Bergakademie Freiberg Institut für Stochastik 11. Juli 016 Prof. Dr. Hans-Jörg Starkloff Statistik I für Betriebswirte Vorlesung
MehrStatistik I für Betriebswirte Vorlesung 14
Statistik I für Betriebswirte Vorlesung 14 Dr. Andreas Wünsche TU Bergakademie Freiberg Institut für Stochastik 13. Juli 017 Dr. Andreas Wünsche Statistik I für Betriebswirte Vorlesung 14 Version: 8. Juli
MehrDie erhobenen Daten werden zunächst in einer Urliste angeschrieben. Daraus ermittelt man:
Die erhobenen Daten werden zunächst in einer Urliste angeschrieben. Daraus ermittelt man: a) Die absoluten Häufigkeit: Sie gibt an, wie oft ein Variablenwert vorkommt b) Die relative Häufigkeit: Sie erhält
MehrDatenanalyse und Statistik
Datenanalyse und Statistik p. 1/44 Datenanalyse und Statistik Vorlesung 2 (Graphik I) K.Gerald van den Boogaart http://www.stat.boogaart.de Datenanalyse und Statistik p. 2/44 Daten Schätzung Test Mathe
MehrErmitteln Sie auf 2 Dezimalstellen genau die folgenden Kenngrößen der bivariaten Verteilung der Merkmale Weite und Zeit:
1. Welche der folgenden Kenngrößen, Statistiken bzw. Grafiken sind zur Beschreibung der Werteverteilung des Merkmals Konfessionszugehörigkeit sinnvoll einsetzbar? A. Der Modalwert. B. Der Median. C. Das
MehrMathematische und statistische Methoden II
Methodenlehre e e Prof. Dr. G. Meinhardt 6. Stock, Wallstr. 3 (Raum 06-206) Sprechstunde jederzeit nach Vereinbarung und nach der Vorlesung. Mathematische und statistische Methoden II Dr. Malte Persike
MehrMathematik für Biologen
Mathematik für Biologen Prof. Dr. Rüdiger W. Braun Heinrich-Heine-Universität Düsseldorf 20. Oktober 2010 1 empirische Verteilung 2 Lageparameter Modalwert Arithmetisches Mittel Median 3 Streuungsparameter
MehrStatistik für Ingenieure Vorlesung 10
Statistik für Ingenieure Vorlesung 10 Prof. Dr. Hans-Jörg Starkloff TU Bergakademie Freiberg Institut für Stochastik 16. Januar 2018 4.2.5. Kenngrößen für kategorielle Daten Für eine diskrete Wahrscheinlichkeitsverteilung
MehrFachrechnen für Tierpfleger
Z.B.: Fachrechnen für Tierpfleger A10. Statistik 10.1 Allgemeines Was ist Statistik? 1. Daten sammeln: Durch Umfragen, Zählung, Messung,... 2. Daten präsentieren: Tabellen, Grafiken 3. Daten beschreiben/charakterisieren:
MehrDas harmonische Mittel
Das harmonische Mittel x H := 1 1 n n 1 x i Das harmonische Mittel entspricht dem Mittel durch Transformation t 1 t Beispiel: x 1,..., x n Geschwindigkeiten, mit denen konstante Wegstrecken l zurückgelegt
MehrKapitel 3: Lagemaße. Ziel. Komprimierung der Daten zu einer Kenngröße, welche die Lage, das Zentrum der Daten beschreibt
Kapitel 3: Lagemaße Ziel Komprimierung der Daten zu einer Kenngröße, welche die Lage, das Zentrum der Daten beschreibt Dr. Matthias Arnold 52 Definition 3.1 Seien x 1,...,x n Ausprägungen eines kardinal
Mehr1 Univariate Statistiken
1 Univariate Statistiken Im ersten Kapitel berechnen wir zunächst Kenngrößen einer einzelnen Stichprobe bzw. so genannte empirische Kenngrößen, wie beispielsweise den Mittelwert. Diese können, unter gewissen
MehrVerteilungsfunktion und Quantile
Statistik 1 für SoziologInnen Verteilungsfunktion und Quantile Univ.Prof. Dr. Marcus Hudec Kumulierte Häufigkeiten Hinweis: Damit das Kumulieren inhaltlich sinnvoll ist, muss das Merkmal zumindest ordinal
MehrDie mit * gekennzeichneten Abschnitte beinhalten Themen, die über die Anforderungen des Gegenstandskatalogs hinausgehen.
Die mit * gekennzeichneten Abschnitte beinhalten Themen, die über die Anforderungen des Gegenstandskatalogs hinausgehen. 1 Einleitung...1 1.1 Die Bedeutung der Statistik für die Medizin...1 1.2 Die medizinische
Mehrhtw saar 1 EINFÜHRUNG IN DIE STATISTIK: BESCHREIBENDE STATISTIK
htw saar 1 EINFÜHRUNG IN DIE STATISTIK: BESCHREIBENDE STATISTIK htw saar 2 Grundbegriffe htw saar 3 Grundgesamtheit und Stichprobe Ziel: Über eine Grundgesamtheit (Population) soll eine Aussage über ein
MehrVerteilungsfunktion und Quantile
Statistik 1 für SoziologInnen Verteilungsfunktion und Quantile Univ.Prof. Dr. Marcus Hudec Kumulierte Häufigkeiten Hinweis: Damit das Kumulieren inhaltlich sinnvoll ist, muss das auszuwertende Merkmal
MehrDie erhobenen Daten werden zunächst in einer Urliste angeschrieben. Daraus ermittelt man:
Die erhobenen Daten werden zunächst in einer Urliste angeschrieben. Daraus ermittelt man: a) Die absoluten Häufigkeit: Sie gibt an, wie oft ein Variablenwert vorkommt b) Die relative Häufigkeit: Sie erhält
MehrUwe Hassler. Statistik im. Bachelor-Studium. Eine Einführung. für Wirtschaftswissenschaftler. ^ Springer Gabler
Uwe Hassler Statistik im Bachelor-Studium Eine Einführung für Wirtschaftswissenschaftler ^ Springer Gabler 1 Einführung 1 2 Beschreibende Methoden univariater Datenanalyse 5 2.1 Grundbegriffe 5 2.2 Häufigkeitsverteilungen
Mehr3. Lektion: Deskriptive Statistik
Seite 1 von 5 3. Lektion: Deskriptive Statistik Ziel dieser Lektion: Du kennst die verschiedenen Methoden der deskriptiven Statistik und weißt, welche davon für Deine Daten passen. Inhalt: 3.1 Deskriptive
MehrVerteilungsfunktion und Quantile
Statistik 1 für SoziologInnen Verteilungsfunktion und Quantile Univ.Prof. Dr. Marcus Hudec Kumulierte Häufigkeiten Hinweis: Damit das Kumulieren inhaltlich sinnvoll ist, muss das Merkmal zumindest ordinal
MehrWahrscheinlichkeitsrechnung und Statistik
9. Vorlesung - 2017 Monte Carlo Methode für numerische Integration Sei g : [0, 1] R stetige Funktion; man möchte 1 0 g(t)dt numerisch approximieren mit Hilfe von Zufallszahlen: Sei (U n ) n eine Folge
MehrÜ B U N G S S K R I P T S T A T I S T I K
Ü B U N G S S K R I P T S T A T I S T I K A. Ploner H. Strelec C. Yassouridis Universität für Bodenkultur Department für Raum, Landschaft und Infrastruktur Institut für Angewandte Statistik & EDV Peter-Jordan-Strasse
Mehr(x i x) 2. (x i a) 2, x i x med. x i a. i=1. 3 Lage- und Streuungsmaße 134
Lagemaße als Lösung eines Optimierungsproblems 3.1 Lagemaße Gegeben sei die Urliste x 1,...,x n eines intervallskalierten Merkmals X, die zu einer Zahl a zusammengefasst werden soll. Man könnte sagen,
MehrDie Familie der χ 2 (n)-verteilungen
Die Familie der χ (n)-verteilungen Sind Z 1,..., Z m für m 1 unabhängig identisch standardnormalverteilte Zufallsvariablen, so genügt die Summe der quadrierten Zufallsvariablen χ := m Z i = Z 1 +... +
MehrDie Familie der χ 2 (n)-verteilungen
Die Familie der χ (n)-verteilungen Sind Z 1,..., Z m für m 1 unabhängig identisch standardnormalverteilte Zufallsvariablen, so genügt die Summe der quadrierten Zufallsvariablen χ := m Z i = Z 1 +... +
MehrEinführung in die Statistik
Einführung in die Statistik Analyse und Modellierung von Daten von Prof. Dr. Rainer Schlittgen Universität Hamburg 12., korrigierte Auflage Oldenbourg Verlag München Inhaltsverzeichnis 1 Statistische Daten
MehrStatistik I für Betriebswirte Vorlesung 13
Statistik I für Betriebswirte Vorlesung 13 Dr. Andreas Wünsche TU Bergakademie Freiberg Institut für Stochastik 6. Juli 2017 Dr. Andreas Wünsche Statistik I für Betriebswirte Vorlesung 13 Version: 7. Juli
MehrPROC MEANS. zum Berechnen statistischer Maßzahlen (für quantitative Merkmale)
PROC MEAS zum Berechnen statistischer Maßzahlen (für quantitative Merkmale) Allgemeine Form: PROC MEAS DATA=name Optionen ; VAR variablenliste ; CLASS vergleichsvariable ; Beispiel und Beschreibung der
MehrEinführung in Quantitative Methoden
Einführung in Quantitative Methoden Mag. Dipl.Ing. Dr. Pantelis Christodoulides & Mag. Dr. Karin Waldherr SS 2011 Christodoulides / Waldherr Einführung in Quantitative Methoden- 2.VO 1/62 Summenzeichen
MehrWirtschaftswissenschaftliches Prüfungsamt Bachelor-Prüfung Deskriptive Statistik und Wahrscheinlichkeitsrechnung Wintersemester 2010/11.
Wirtschaftswissenschaftliches Prüfungsamt Bachelor-Prüfung Deskriptive Statistik und Wahrscheinlichkeitsrechnung Wintersemester 2010/11 Namensschild Dr. Martin Becker Hinweise für die Klausurteilnehmer
MehrVerteilungsfunktion und dquantile
Statistik 1 für SoziologInnen Verteilungsfunktion und dquantile Univ.Prof. Dr. Marcus Hudec Kumulierte Häufigkeiten Hinweis: Damit die Kumulation inhaltlich sinnvoll ist, muss das Merkmal zumindest ordinal
MehrBiostatistik, Sommer 2017
1/51 Biostatistik, Sommer 2017 Wahrscheinlichkeitstheorie: Verteilungen, Kenngrößen Prof. Dr. Achim Klenke http://www.aklenke.de 8. Vorlesung: 09.06.2017 2/51 Inhalt 1 Verteilungen Normalverteilung Normalapproximation
MehrEinführung in die Statistik
Einführung in die Statistik Analyse und Modellierung von Daten Von Prof. Dr. Rainer Schlittgen 4., überarbeitete und erweiterte Auflage Fachbereich Materialwissenschaft! der Techn. Hochschule Darmstadt
MehrP (X = 2) = 1/36, P (X = 3) = 2/36,...
2.3 Zufallsvariablen 2.3 Zufallsvariablen Meist sind die Ereignisse eines Zufallseperiments bereits reelle Zahlen. Ist dies nicht der Fall, kann man Ereignissen eine reelle Zahl zuordnen. Zum Beispiel
MehrDer Modus ist. Der Median ist. 3. Übung. Aufgabe 1. a) der häufigste Wert. b) der Wert unter dem 50 % aller anderen Werte liegen.
3. Übung Aufgabe 1 Der Modus ist a) der häufigste Wert. b) der Wert unter dem 50 % aller anderen Werte liegen. c) der Durchschnitt aller Werte. d) der Wert mit der größten Häufigkeitsdichte. e) der Schwerpunkt
MehrStatistik und Wahrscheinlichkeitsrechnung
Statistik und Wahrscheinlichkeitsrechnung Dr. Jochen Köhler 26.02.2008 1 Warum Statistik und Wahrscheinlichkeits rechnung im Ingenieurwesen? Zusammenfassung der letzten Vorlesung Statistik und Wahrscheinlichkeitsrechnung
Mehr1. Maße der zentralen Tendenz Beispiel: Variable Anzahl der Geschwister aus Jugend '92. Valid Cum Value Frequency Percent Percent Percent
Deskriptive Statistik 1. Verteilungsformen symmetrisch/asymmetrisch unimodal(eingipflig) / bimodal (zweigipflig schmalgipflig / breitgipflig linkssteil / rechtssteil U-förmig / abfallend Statistische Kennwerte
MehrOrientierungshilfe für den ersten Hausaufgabenzettel
Orientierungshilfe für den ersten Hausaufgabenzettel 6. November 01 Diese Zusammenfassung des ersten Übungszettels soll einen kleinen Überblick geben, wie die Aufgaben hätten bearbeitet werden können.
MehrStatistik und Wahrscheinlichkeitsrechnung
Statistik und Wahrscheinlichkeitsrechnung Übung 3 1 Inhalt der heutigen Übung Vorrechnen der Hausübung B.7 Beschreibende Statistik Gemeinsames Lösen der Übungsaufgaben C.1: Häufigkeitsverteilung C.2: Tukey
Mehr4. Kumulierte Häufigkeiten und Quantile
4. Kumulierte Häufigkeiten und Quantile Kumulierte Häufigkeiten Oft ist man nicht an der Häufigkeit einzelner Merkmalsausprägungen interessiert, sondern an der Häufigkeit von Intervallen. Typische Fragestellung:
MehrStochastik-Praktikum
Stochastik-Praktikum Deskriptive Statistik Peter Frentrup Humboldt-Universität zu Berlin 7. November 2017 (Humboldt-Universität zu Berlin) Zufallszahlen und Monte Carlo 7. November 2017 1 / 27 Übersicht
MehrStreuungsmaße. Die angegebenen Maßzahlen sind empirisch, d.h. sie sind Schätzungen für die wahre Varianz (empirische) Varianz (Streuung) s 2 = 1 n
Streuungsmaße Diskrete Stetige Die angegebenen Maßzahlen sind empirisch, d.h. sie sind Schätzungen für die wahre (empirische) (Streuung) s 2 = 1 n (X i X) 2 n 1 i=1 s 2 n var(x) Warum Division durch (n
MehrÜber dieses Buch Die Anfänge Wichtige Begriffe... 21
Inhalt Über dieses Buch... 12 TEIL I Deskriptive Statistik 1.1 Die Anfänge... 17 1.2 Wichtige Begriffe... 21 1.2.1 Das Linda-Problem... 22 1.2.2 Merkmale und Merkmalsausprägungen... 23 1.2.3 Klassifikation
MehrStatistische Methoden in den Umweltwissenschaften
Statistische Methoden in den Umweltwissenschaften Stetige und diskrete Wahrscheinlichkeitsverteilungen Lageparameter Streuungsparameter Diskrete und stetige Zufallsvariablen Eine Variable (oder Merkmal
Mehr