3 Häufigkeitsverteilungen
|
|
- Andrea Kappel
- vor 6 Jahren
- Abrufe
Transkript
1 3 Häufigkeitsverteilungen 3.1 Absolute und relative Häufigkeiten 3.2 Klassierung von Daten 3.3 Verteilungsverläufe 3.1 Absolute und relative Häufigkeiten Datenaggregation: Bildung von Häufigkeiten X nominal oder ordinalskaliertes Merkmal mit k Ausprägungen A 1, A 2,..., A k. Beispiel: X = Blutgruppe mit den k = 4 Ausprägungen A 1 = 0 A 2 = A A 3 = B A 4 = AB StatBio 50
2 An n Untersuchungseinheiten, diese seien von 1 bis n durchnummeriert, wurden die Merkmalsausprägungen x 1,..., x n beobachtetet. Absolute Häufigkeit (frequency): Anzahl der Untersuchungseinheiten, die Ausprägung A j besitzen, formal h j = Anzahl der Daten x i mit x i = A j j = 1,..., k (der Buchstabe j ist hier ein sogenannter Laufindex, der zwischen 1 und k variiert). Es gilt h h k = k j=1 h j = n Relative Häufigkeit (relative frequency): r j = h j /n, j = 1,..., k StatBio 51
3 Es gilt 0 r j 1 und k j=1 r j = k j=1 h j n = 1 n k j=1 h j = n n = 1 Angabe relativer Häufigkeiten in Prozent (Bezeichnung %): Prozentuale Häufigkeiten (percentage): p j = 100 r j j = 1,..., k Es gilt 0 p j 100 und k p j = k 100 r j = 100 ( k r j ) = 100 j=1 j=1 j=1 }{{} =1 StatBio 52
4 Definition: Die Zusammenstellung der Merkmalsausprägungen mit den dazugehörigen (absoluten, relativen oder prozentualen) Häufigkeiten heißt Häufigkeitsverteilung (frequency distribution) des betreffenden Merkmals. Bemerkung: Da die Häufigkeitsverteilung auf Daten basiert, nennt man sie auch empirische Verteilung. Eine Häufigkeitsverteilung lässt sich übersichtlich in einer Häufigkeitstabelle (frequency table) darstellen: StatBio 53
5 Tabelle 3 1 Häufigkeitstabelle Ausprägung absolute relative prozentuale Häufigkeit Häufigkeit Häufigkeit A 1 h 1 r 1 p 1 % A 2. h 2. r 2. p 2 %. A k h k r k p r % Summe n 1 100% Aus einer Häufigkeitsverteilung lassen sich erste Einsichten in die Struktur der Daten gewinnen. Zum Beispiel lassen sich die folgenden Fragen beantworten: Wie groß ist der Stellenwert einer einzelnen Merkmalsausprägung (Frage nach der Gewichtigkeit einer Ausprägung)? Welche Ausprägung besitzt den höchsten Stellenwert, trat also am häufigsten auf? StatBio 54
6 Wie stark unterscheiden sich einzelne Ausprägungen im Hinblick auf ihre zugehörigen Häufigkeiten? Bei ordinalen Daten können wir noch zusätzlich fragen: Treten kleine Ausprägungswerte in etwa so häufig auf wie große Ausprägungswerte? Treten die häufigsten Werte in der,,mitte, also bei den mittleren Ausprägungswerten auf? Beispiel 3.1: An 69 Personen wurde die Blutgruppe festgestellt. Es ergab sich die folgende Häufigkeitsverteilung: Tabelle 3 2 Häufigkeitsverteilung des Merkmals Blutgruppe Blutgruppe A j h j r j A 1 = A 2 = A A 3 = B A 4 = AB Summe 69 1 StatBio 55
7 Graphische Darstellungen: Säulendiagramm,Stabdiagramm (bar chart): Zeigt absolute bzw. relative Häufigkeiten als Funktion der Merkmalsausprägungen; Abszisse: Ausprägungen, Ordinate: Häufigkeiten. Darstellungsmittel ist die Höhe der Säule, d.h. die Höhe repräsentiert die (absolute oder relative) Häufigkeit. Abbildung 3 1 Säulendiagramm zu Tabelle 3 2 StatBio 56
8 Kreisdiagramm,Tortendiagramm (pie chart): Zeigt Kreissektoren als Funktion der Merkmalsausprägungen; besonders geeignet für nominale Daten Winkel, der einen Kreisausschnitt einer Kategorie festlegt, ist proportional zur relativen Häufigkeit: r j = Winkel des Kreissektors für A j in Grad 360 also = α j 360 α j = r j 360, j = 1,..., k Es gilt dann α i α j = r i r j = h i h j für 1 i, j k StatBio 57
9 Fortsetzung von Bsp. 3.1: (Blutgruppen Daten aus Tabelle 3 2) Gruppe 0 A B AB α j Abbildung 3 2 Kreisdiagramm zu Tabelle 3 2 StatBio 58
10 3.2 Klassierung von Daten Sind bei einem Merkmal unendlich viele Ausprägungen möglich, so ist die Anfertigung einer Häufigkeitsverteilung kaum zu empfehlen (auch unter Berücksichtigung einer vorgegebenen Messgenauigkeit). Es entstehen bei der Angabe aller Häufigkeiten sehr viele Nullen, hervorgerufen durch nicht beobachtete Merkmalswerte. Idee: Einteilung aller (reellen) Stichprobenwerte x 1,..., x n in sogenannte Klassen. Bezüglich der Klassenbildung gibt es zwar keine allgemein gültigen, strengen Regeln, aber einige Grundsätze, die es zu beachten gilt: Regel 1: Die Klassengrenzen sollten einfache Zahlenwerte sein. Regel 2: Klassen dürfen sich nicht überschneiden. StatBio 59
11 Regel 3: Die Klassen müssen alle Beobachtungen erfassen. Regel 4: Die Klassenbreiten sind konstant zu wählen. Regel 5: Die Anzahl der Klassen ist geeignet zu wählen. Die Klassen müssen so gewählt werden (Regel 2), dass die Zuordnung einer Beobachtung zu einer Klasse eindeutig ist. Dazu muss geklärt sein, welcher Klasse eine Beobachtung zugeordnet wird, die auf eine Klassengrenze fällt. Die Eindeutigkeit der Zuordnung wird dadurch erreicht, dass man die Klassen als halboffene Intervalle festlegt (z. B. links offen und rechts abgeschlossen). Die Klassenanzahl richtet sich nach dem Stichprobenumfang. Als Anhaltspunkt dient die Regel k n. Einige Zahlenwerte: StatBio 60
12 n n mögliche Wahl von k , ,7, ,9,10,11 Bei k Klassen (c 0, c 1 ], (c 1, c 2 ],..., (c k 1, c k ] sind die Zahlen c 0,..., c k sind so gewählt, dass c 0 < c 1 <... < c k gilt. Per Definition gehört eine Beobachtung x i zur Klasse (c j 1, c j ], falls c j 1 < x i c j gilt. Man spricht von Klassierung (grouped data) auch von Klassenbildung bzw. Gruppierung der Daten. StatBio 61
13 Damit Regel 3 erfüllt ist, muss die unterste Klassengrenze kleiner sein als die kleinste Beobachtung: c 0 < x (1). Oder man wählt als untere Intervallgrenze die kleinste Beobachtung, also c 0 = x (1), wobei dann diese Intervallgrenze zur Klasse gehören muss. Die oberste Klassengrenze c k muss mindestens so groß sein wie die größte Beobachtung: c k x (n). Unter der absoluten Häufigkeit bezüglich der Klasse (c j 1, c j ] versteht man die Anzahl der Beobachtungen, die zur Klasse (c j 1, c j ] gehören, formal h j = Anzahl der x i mit c j 1 < x i c j j = 1,..., k. Für die absoluten Klassenhäufigkeiten gilt aufgrund der Regeln 2 und 3 k j=1 h j = n StatBio 62
14 Die relative Häufigkeit bezüglich der Klasse (c j 1, c j ] ist r j = h j n, j = 1,..., k Für die relativen Klassenhäufigkeiten gilt k r j = 1 n k h j = 1 j=1 j=1 Diese Häufigkeiten geben also an, wie sich die Stichprobenwerte auf die einzelnen Klassen verteilen. Bei Klassierung der Daten geht man davon aus, dass sich alle Beobachtungswerte einer Klasse (c j 1, c j ] gleichmäßig über die Klasse verteilen (Gleichverteilung innerhalb der Klasse), so dass die Klassenmitte c j 1 + c j 2 StatBio 63
15 Repräsentant dieser Klasse ist. Fortsetzung von Bsp. 2.1: Plasma Daten Tabelle 3 3 Häufigkeitsverteilung der Plasma Daten aus Tabelle 2 5 Klasse h j r j [3.20,3.40] (3.40,3.60] (3.60,3.80] (3.80,4.00] (4.00,4.20] (4.20,4.40] 0 0 (4.40,4.60 ] Histogramm Die graphische Darstellung der (absoluten oder relativen) Klassenhäufigkeiten erfolgt durch ein Histogramm (histogram). StatBio 64
16 Dieses zeigt (absolute oder relative) Klassenhäufigkeiten als Funktion der Klassen. Über den Klassen werden Rechtecke (Balken) abgetragen, wobei die Höhen der Rechtecke die (absoluten oder relativen) Klassenhäufigkeiten wiedergeben. (Die Höhe als Darstellungsmittel ist nur erlaubt, wenn Regel 4 erfüllt ist!!!) Abbildung 3 3 Histogramm zu Tabelle 3 3 StatBio 65
17 Vorsicht bei ungleichen Klassenbreiten! Das Darstellungsmittel ist dann die Fläche des Rechtecks, d.h. die Fläche (nicht die Höhe!) entspricht der Häufigkeit (sonst kann es zu Fehlinterpretationen kommen!). Als Höhe des Rechtecks wählt man die Häufigkeit, dividiert durch die Klassenbreite, also h j c j c j 1 bzw. r j c j c j 1, j = 1,..., k Die Fläche F j des Rechtecks (Höhe Breite) über der Klasse (c j 1, c j ] ist dann h j bzw. r j. StatBio 66
18 3.3 Verteilungsverläufe Gleichverteilung (uniform distribution) Alle Merkmalsausprägungen treten (annähernd) gleich häufig auf. Abbildung 3 4 Beispiel für eine Gleichverteilung StatBio 67
19 Linksschiefe Verteilung (negatively skewed) Verteilungsfläche fällt nach links langsamer ab als nach rechts; Linksschiefe=Rechtssteilheit. Abbildung 3 5 Beispiel für eine linksschiefe Verteilung StatBio 68
20 Rechtsschiefe Verteilung (positively skewed) Verteilungsfläche fällt nach rechts langsamer ab als nach links (kommt in der Praxis häufiger vor); Rechtsschiefe=Linkssteilheit. Abbildung 3 6 Beispiel für eine rechtsschiefe Verteilung StatBio 69
21 Symmetrische Verteilung Weder rechts noch linksschief; es gibt eine Symmetrieachse, sodass sich die rechte Verteilungsfläche spiegelbildlich zur linken Verteilungsfläche verhält. Abbildung 3 7 Beispiel für eine symmetrische Verteilung mit angepasster Normalverteilung StatBio 70
22 Multimodale Verteilung unimodal=eingipflig bimodal=zweigipflig multimodal=mehrgipflig Die Verteilungen in den Abbildungen 3 5, 3 6 und 3 7 sind unimodal. Abbildung 3 8 Beispiel für eine bimodale Verteilung Bemerkung: Multimodalität deutet auf eine geschichtete Stichprobe (stratified sample) hin. StatBio 71
23 Beachte: Bei relativen Häufigkeiten gilt stets Gesamtfläche der Balken = 1 bzw. bei Angaben in Prozent Gesamtfläche der Balken = 100 Referenzverteilungen Keine empirische Verteilung; Referenzverteilungen sind theoretische Verteilungen, deren Verlaufsformen durch mathematische Funktionen beschrieben werden. Wichtige Beispiele: StatBio 72
24 Normalverteilung (Gaußsche Glockenkurve): ϕ(x) = c e x2 /2 Abbildung 3 9 Die Dichte ϕ Diese Verteilung ist unimodal und symmetrisch um die y Achse: ϕ(x) = ϕ( x). Die Konstante c wird so gewählt, dass ϕ(x) dx = 1 gilt. Lösung: c = 1 2π StatBio 73
25 Chi Quadrat Verteilung f n (x) = { 0, x 0 c n e x/2 x n/2 1, x > 0 n N. Dabei wird die Konstante c n so gewählt, dass f n (x) dx = 1 gilt. Die Funktion f n heißt Dichte der χ 2 Verteilung mit n Freiheitsgraden. Abbildung 3 10 Die Dichten f 4 (links) und f 8 Diese Verteilungen sind unimodal und rechtsschief. StatBio 74
Deskriptive Statistik
Deskriptive Statistik [descriptive statistics] Ziel der deskriptiven (beschreibenden) Statistik einschließlich der explorativen Datenanalyse [exploratory data analysis] ist zunächst die übersichtliche
Mehr1 Verteilungen und ihre Darstellung
GKC Statistische Grundlagen für die Korpuslinguistik Kapitel 2: Univariate Deskription von Daten 8.11.2004 Univariate (= eindimensionale) Daten bestehen aus Beobachtungen eines einzelnen Merkmals. 1 Verteilungen
MehrDeskriptive Statistik
Deskriptive Statistik In der beschreibenden Statistik werden Methoden behandelt, mit deren Hilfe man Daten übersichtlich darstellen und kennzeichnen kann. Die Urliste (=Daten in der Reihenfolge ihrer Erhebung)
MehrFachhochschule Düsseldorf Wintersemester 2008/09
Fachhochschule Düsseldorf Wintersemester 2008/09 Teilfachprüfung Statistik im Studiengang Wirtschaft Prüfungsdatum: 26.01.2009 Prüfer: Prof. Dr. H. Peters, Diplom-Vw. Lothar Schmeink Prüfungsform: 2-stündige
MehrFelix Klug SS 2011. 2. Tutorium Deskriptive Statistik
2. Tutorium Deskriptive Statistik Felix Klug SS 2011 Skalenniveus Weitere Beispiele für Skalenniveus (Entnommen aus Wiederholungsblatt 1.): Skalenniveu Nominalskala Ordinalskala Intervallskala Verhältnisskala
Mehr4. Auswertung eindimensionaler Daten
4. Auswertung eindimensionaler Daten Ziel dieses Kapitels: Präsentation von Methoden zur statistischen Auswertung eines einzelnen Merkmals 64 Bezeichnungen (Wiederholung): Merkmalsträger: e 1,..., e n
MehrBeschreibende Statistik
Beschreibende Statistik Daten graphisch darstellen 21. April 2009 Dr. Katja Krüger Universität Paderborn Grundlagen der Schulmathematik SoSe 2009 1 Daten graphisch darstellen warum? Die rasche und sichere
MehrKapitel 13 Häufigkeitstabellen
Kapitel 13 Häufigkeitstabellen Die gesammelten und erfaßten Daten erscheinen in der Datendatei zunächst als unübersichtliche Liste von Werten. In dieser Form sind die Daten jedoch wenig aussagekräftig
MehrAnalyse klassierter Daten: Vor der Analyse fasst man jeweils mehrere Merkmalsausprägungen in (Merkmalswerte-)Klassen zusammen.
4. Analyse univariater Daten: Übersicht Mathematik ist die Wissenschaft der reinen Zahl, Statistik die der empirischen Zahl Von univariaten Daten spricht man, wenn bei der Datenerhebung nur ein Merkmal
Mehr2. Eindimensionale (univariate) Datenanalyse
2. Eindimensionale (univariate) Datenanalyse Dr. Antje Kiesel Institut für Angewandte Mathematik WS 2011/2012 Kennzahlen, Statistiken In der Regel interessieren uns nicht so sehr die beobachteten Einzeldaten
Mehr1,11 1,12 1,13 1,14 1,15 1,16 1,17 1,17 1,17 1,18
3. Deskriptive Statistik Ziel der deskriptiven (beschreibenden) Statistik (explorativen Datenanalyse) ist die übersichtliche Darstellung der wesentlichen in den erhobenen Daten enthaltene Informationen
MehrHäufigkeitstabellen. Balken- oder Kreisdiagramme. kritischer Wert für χ2-test. Kontingenztafeln
Häufigkeitstabellen Menüpunkt Data PivotTable Report (bzw. entsprechendes Icon): wähle Data Range (Zellen, die die Daten enthalten + Zelle mit Variablenname) wähle kategoriale Variable für Spalten- oder
Mehr1. Einführung und statistische Grundbegriffe. Grundsätzlich unterscheidet man zwei Bedeutungen des Begriffs Statistik:
. Einführung und statistische Grundbegriffe Grundsätzlich unterscheidet man zwei Bedeutungen des Begriffs Statistik: Quantitative Information Graphische oder tabellarische Darstellung von Datenmaterial
MehrVisualisierung, WS07/08 9. November 2007. Visualisierung. Visuelle Variablen, Standardgraphen
Visualisierung, Standardgraphen Detlef Krömker Uni Frankfurt, Graphische Datenverarbeitung Wolfgang Müller PH Weingarten, Mediendidaktik und Visualisierung 09.11.2007 Visualisierung - D.Krömker, W.Müller
MehrEin bisschen Statistik
Prof. Dr. Beat Siebenhaar ein bisschen Statistik 1 Ein bisschen Statistik (orientiert an Hüsler/Zimmermann (006) mit Umsetzung auf die linguistische Fragen) 1. Datentypen und Grafik Grafische Darstellungen
MehrBox-and-Whisker Plot -0,2 0,8 1,8 2,8 3,8 4,8
. Aufgabe: Für zwei verschiedene Aktien wurde der relative Kurszuwachs (in % beobachtet. Aus den jeweils 20 Quartaldaten ergaben sich die folgenden Box-Plots. Box-and-Whisker Plot Aktie Aktie 2-0,2 0,8,8
MehrStatistik II für Betriebswirte Vorlesung 3
PD Dr. Frank Heyde TU Bergakademie Freiberg Institut für Stochastik Statistik II für Betriebswirte Vorlesung 3 5. November 2013 Beispiel: Aktiensplit (Aczel & Sounderpandan, Aufg. 14-28) Ein Börsenanalyst
MehrAnalog zu Aufgabe 16.1 werden die Daten durch folgenden Befehl eingelesen: > kredit<-read.table("c:\\compaufg\\kredit.
Lösung 16.3 Analog zu Aufgabe 16.1 werden die Daten durch folgenden Befehl eingelesen: > kredit
Mehr2.3 Univariate Datenanalyse in R
2.3. UNIVARIATE DATENANALYSE IN R 47 2.3 Univariate Datenanalyse in R Wir wollen nun lernen, wie man in R Daten elementar analysiert. R bietet eine interaktive Umgebung, Befehlsmodus genannt, in der man
MehrHistogramme in der Datenbankoptimierung. Marian Marx 26.06.2008
Histogramme in der Datenbankoptimierung Marian Marx 26.06.2008 Inhaltsverzeichnis 1. Histogramme im Allgemeinen 1.1 Definition Histogramm 1.2 Beispiel Histogramm 2. Histogramme in der Datenbankoptimierung
Mehr- Eine typische Ausfallrate, wie sie bei vielen technischen Anwendungen zu sehen ist hat die Form einer Badewanne, deshalb nennt man diese Kurve auch
1 2 - Eine typische Ausfallrate, wie sie bei vielen technischen Anwendungen zu sehen ist hat die Form einer Badewanne, deshalb nennt man diese Kurve auch Badewannenkurve. -mit der Badewannenkurve lässt
MehrDie Einteilung nach Maßstabsgruppen kann sich auf folgende Grobgliederungen beschränken: Thematische Plankarten: größer 1 : 10 000
Maßstabsgruppen Die Einteilung nach Maßstabsgruppen kann sich auf folgende Grobgliederungen beschränken: Thematische Plankarten: größer 1 : 10 000 Thematische Karten Großer Maßstäbe 1 : 10 000 bis größer
MehrStatistik I (B) Universität Mannheim Lehrstuhl für Statistik Toni Stocker FSS 2007
Statistik I (B) Universität Mannheim Lehrstuhl für Statistik Toni Stocker FSS 2007 Foliensymbolik... Beginn eines neuen Kapitels (Folienkopf) Übung... Aufgaben für die Übungen R Programmcode 2 Einführung
MehrStatistik I für Wirtschaftswissenschaftler Klausur am 01.07.2005, 14.00 16.00.
1 Statistik I für Wirtschaftswissenschaftler Klausur am 01.07.2005, 14.00 16.00. Bitte unbedingt beachten: a) Gewertet werden alle 9 gestellten Aufgaben. b) Lösungswege sind anzugeben. Die Angabe des Endergebnisses
MehrFüllmenge. Füllmenge. Füllmenge. Füllmenge. Mean = 500,0029 Std. Dev. = 3,96016 N = 10.000. 485,00 490,00 495,00 500,00 505,00 510,00 515,00 Füllmenge
2.4 Stetige Zufallsvariable Beispiel. Abfüllung von 500 Gramm Packungen einer bestimmten Ware auf einer automatischen Abfüllanlage. Die Zufallsvariable X beschreibe die Füllmenge einer zufällig ausgewählten
MehrBeschreibende Statistik Daten darstellen und charakterisieren
Beschreibende Statistik Daten darstellen und charakterisieren Roland Heynkes 1. April 2006, Aachen Die beschreibende (descriptive) Statistik versucht, große und unübersichtliche, experimentell sowie durch
MehrZuammenfassung: Reelle Funktionen
Zuammenfassung: Reelle Funktionen 1 Grundlegendes a) Zahlenmengen IN = {1; 2; 3; 4;...} Natürliche Zahlen IN 0 = IN {0} Natürliche Zahlen mit 0 ZZ = {... ; 2; 1; 0; 1; 2;...} Ganze Zahlen Q = { z z ZZ,
Mehrh i Deskriptive Statistik 1-dimensionale Daten Daten und Häufigkeiten Seite 1 Nominal Ordinal Metrisch (Kardinal) Metrisch - klassiert
Deskriptive Statistik dimesioale Date Date ud Häufigkeite Seite Nomial Ordial Metrisch (Kardial Metrisch klassiert Beschreibug: Date habe keie atürliche Reihefolge. Bsp: Farbe, Religio, Geschlecht, Natioalität...
MehrWillkommen zur Vorlesung Statistik
Willkommen zur Vorlesung Statistik Thema dieser Vorlesung: Maßzahlen für zentrale Tendenz, Streuung und andere Eigenschaften von Verteilungen Prof. Dr. Wolfgang Ludwig-Mayerhofer Universität Siegen Philosophische
Mehr, dt. $+ f(x) = , - + < x < +, " > 0. " 2# Für die zugehörige Verteilungsfunktion F(x) ergibt sich dann: F(x) =
38 6..7.4 Normalverteilung Die Gauß-Verteilung oder Normal-Verteilung ist eine stetige Verteilung, d.h. ihre Zufallsvariablen können beliebige reelle Zahlenwerte annehmen. Wir definieren sie durch die
MehrStatistik I für Wirtschaftswissenschaftler Klausur am 06.07.2007, 14.00 16.00.
1 Statistik I für Wirtschaftswissenschaftler Klausur am 06.07.2007, 14.00 16.00. Bitte unbedingt beachten: a) Gewertet werden alle 9 gestellten Aufgaben. b) Lösungswege sind anzugeben. Die Angabe des Endergebnisses
MehrEvaluation der Normalverteilungsannahme
Evaluation der Normalverteilungsannahme. Überprüfung der Normalverteilungsannahme im SPSS P. Wilhelm; HS SPSS bietet verschiedene Möglichkeiten, um Verteilungsannahmen zu überprüfen. Angefordert werden
MehrStatistische Datenauswertung. Andreas Stoll Kantonsschule Olten
Statistische Datenauswertung Andreas Stoll Beschreibende vs. schliessende Statistik Wir unterscheiden grundsätzlich zwischen beschreibender (deskriptiver) und schliessender (induktiver) Statistik. Bei
MehrEinführung in die Geostatistik (2) Fred Hattermann (Vorlesung), hattermann@pik-potsdam.de Michael Roers (Übung), roers@pik-potsdam.
Einführung in die Geostatistik () Fred Hattermann (Vorlesung), hattermann@pik-potsdam.de Michael Roers (Übung), roers@pik-potsdam.de Gliederung Allgemeine Statistik. Deskriptive Statistik. Wahrscheinlichkeitstheorie.3
MehrGrundbegriffe (1) Grundbegriffe (2)
Grundbegriffe (1) S.1 Äquivalenzklasse Unter einer Äquivalenzklasse versteht man eine Klasse von Objekten, die man hinsichtlich bestimmter Merkmalsausprägungen als gleich (äquivalent) betrachtet. (z.b.
MehrStatistik I für Betriebswirte Vorlesung 5
Statistik I für Betriebswirte Vorlesung 5 PD Dr. Frank Heyde TU Bergakademie Freiberg Institut für Stochastik 07. Mai 2015 PD Dr. Frank Heyde Statistik I für Betriebswirte Vorlesung 5 1 Klassische Wahrscheinlichkeitsdefinition
MehrEntscheidungsbaumverfahren
Entscheidungsbaumverfahren Allgemeine Beschreibung Der Entscheidungsbaum ist die Darstellung einer Entscheidungsregel, anhand derer Objekte in Klassen eingeteilt werden. Die Klassifizierung erfolgt durch
MehrGrundlagen der Datenanalyse
Schematischer Überblick zur Behandlung quantitativer Daten Theorie und Modellbildung Untersuchungsdesign Codierung / Datenübertragung (Erstellung einer Datenmatrix) Datenerhebung Fehlerkontrolle / -behebung
Mehr2. Deskriptive Statistik 2.1. Häufigkeitstabellen, Histogramme, empirische Verteilungsfunktionen
4. Datenanalyse und Modellbildung Deskriptive Statistik 2-1 2. Deskriptive Statistik 2.1. Häufigkeitstabellen, Histogramme, empirische Verteilungsfunktionen Für die Auswertung einer Messreihe, die in Form
MehrExpertenrunde Gruppe 1: Wiederholungsgruppe EXCEL (Datenerfassung, Darstellungsformen, Verwertung)
Epertenrunde Gruppe 1: Wiederholungsgruppe EXCEL (Datenerfassung, Darstellungsformen, Verwertung) Im Folgenden wird mit Hilfe des Programms EXEL, Version 007, der Firma Microsoft gearbeitet. Die meisten
MehrKontingenzkoeffizient (nach Pearson)
Assoziationsmaß für zwei nominale Merkmale misst die Unabhängigkeit zweier Merkmale gibt keine Richtung eines Zusammenhanges an 46 o jl beobachtete Häufigkeiten der Kombination von Merkmalsausprägungen
MehrMATHEMATIKLEHRPLAN 4. SCHULJAHR SEKUNDARSTUFE
Europäische Schulen Büro des Generalsekretärs Abteilung für pädagogische Entwicklung Ref.:2010-D-581-de-2 Orig.: EN MATHEMATIKLEHRPLAN 4. SCHULJAHR SEKUNDARSTUFE Kurs 4 Stunden/Woche VOM GEMISCHTER PÄDAGOGISCHER
MehrDatenanalyse und Statistik
Datenanalyse und Statistik p. 1/44 Datenanalyse und Statistik Vorlesung 2 (Graphik I) K.Gerald van den Boogaart http://www.stat.boogaart.de Datenanalyse und Statistik p. 2/44 Daten Schätzung Test Mathe
MehrWahrscheinlichkeitsrechnung anhand realer Situationen
MaMaEuSch Management Mathematics for European Schools http://www.mathematik.unikl.de/ mamaeusch Wahrscheinlichkeitsrechnung anhand realer Situationen Paula Lagares Barreiro 1 Frederico Perea Rojas-Marcos
MehrStatistik mit Excel 2010. Themen-Special. Peter Wies. 1. Ausgabe, September 2011 W-EX2010S
Statistik mit Excel 2010 Peter Wies 1. Ausgabe, September 2011 Themen-Special W-EX2010S 3 Statistik mit Excel 2010 - Themen-Special 3 Statistische Maßzahlen In diesem Kapitel erfahren Sie wie Sie Daten
Mehr4. Erstellen von Klassen
Statistik mit Tabellenkalkulation 4. Erstellen von Klassen Mit einem einfachen Befehl lässt sich eine Liste von Zahlen auf die Häufigkeit der einzelnen Werte untersuchen. Verwenden Sie dazu den Befehl
MehrVorlesung. Funktionen/Abbildungen 1
Vorlesung Funktionen/Abbildungen 1 1 Grundlagen Hinweis: In dieser Vorlesung werden Funktionen und Abbildungen synonym verwendet. In der Schule wird eine Funktion häufig als eindeutige Zuordnung definiert.
MehrStatistische Auswertung der Daten von Blatt 13
Statistische Auswertung der Daten von Blatt 13 Problemstellung 1 Graphische Darstellung der Daten 1 Diskussion der Normalverteilung 3 Mittelwerte und deren Konfidenzbereiche 3 Signifikanz der Behandlung
MehrÜberblick über die Verfahren für Ordinaldaten
Verfahren zur Analyse ordinalskalierten Daten 1 Überblick über die Verfahren für Ordinaldaten Unterschiede bei unabhängigen Stichproben Test U Test nach Mann & Whitney H Test nach Kruskal & Wallis parametrische
MehrWillkommen zur Vorlesung Statistik (Master)
Willkommen zur Vorlesung Statistik (Master) Thema dieser Vorlesung: Verteilungsfreie Verfahren Prof. Dr. Wolfgang Ludwig-Mayerhofer Universität Siegen Philosophische Fakultät, Seminar für Sozialwissenschaften
MehrStichprobenauslegung. für stetige und binäre Datentypen
Stichprobenauslegung für stetige und binäre Datentypen Roadmap zu Stichproben Hypothese über das interessierende Merkmal aufstellen Stichprobe entnehmen Beobachtete Messwerte abbilden Schluss von der Beobachtung
Mehra) Zeichnen Sie in das nebenstehende Streudiagramm mit Lineal eine Regressionsgerade ein, die Sie für passend halten.
Statistik für Kommunikationswissenschaftler Wintersemester 2009/200 Vorlesung Prof. Dr. Helmut Küchenhoff Übung Cornelia Oberhauser, Monia Mahling, Juliane Manitz Thema 4 Homepage zur Veranstaltung: http://www.statistik.lmu.de/~helmut/kw09.html
MehrSkript zur Übung: Grundlagen der empirischen Sozialforschung - Datenanalyse
Skript zur Übung: Grundlagen der empirischen Sozialforschung - Datenanalyse Phasen des Forschungsprozesses Auswahl des Forschungsproblems Theoriebildung Theoretische Phase Konzeptspezifikation / Operationalisierung
MehrGrundbegriffe der Beschreibenden Statistik
Grundbegriffe der Beschreibenden Statistik 1. Datenmatrix und Messniveaus...3 1.1. Merkmale, Datenmatrix, uni- und multivariate Analysen...3 1.2. Messniveaus (Skalentypen)...4 2. Ausgewählte Verfahren
MehrEin möglicher Unterrichtsgang
Ein möglicher Unterrichtsgang. Wiederholung: Bernoulli Experiment und Binomialverteilung Da der sichere Umgang mit der Binomialverteilung, auch der Umgang mit dem GTR und den Diagrammen, eine notwendige
MehrTeil II. Nichtlineare Optimierung
Teil II Nichtlineare Optimierung 60 Kapitel 1 Einleitung In diesem Abschnitt wird die Optimierung von Funktionen min {f(x)} x Ω betrachtet, wobei Ω R n eine abgeschlossene Menge und f : Ω R eine gegebene
MehrBegriffsbestimmung CRISP-DM-Modell Betriebswirtschaftliche Einsatzgebiete des Data Mining Web Mining und Text Mining
Gliederung 1. Einführung 2. Grundlagen Data Mining Begriffsbestimmung CRISP-DM-Modell Betriebswirtschaftliche Einsatzgebiete des Data Mining Web Mining und Text Mining 3. Ausgewählte Methoden des Data
MehrNichtlineare Optimierung ohne Nebenbedingungen
Kapitel 2 Nichtlineare Optimierung ohne Nebenbedingungen In diesem Abschnitt sollen im wesentlichen Verfahren zur Bestimmung des Minimums von nichtglatten Funktionen in einer Variablen im Detail vorgestellt
MehrGegeben ist die Funktion f durch. Ihr Schaubild sei K.
Aufgabe I 1 Gegeben ist die Funktion f durch. Ihr Schaubild sei K. a) Geben Sie die maximale Definitionsmenge D f an. Untersuchen Sie K auf gemeinsame Punkte mit der x-achse. Bestimmen Sie die Intervalle,
MehrStochastische Modelle
Klausur (Teilprüfung) zur Vorlesung Stochastische Modelle (WS04/05 Februar 2005, Dauer 90 Minuten) 1. Es sollen für eine Zufallsgröße X mit der Dichte Zufallszahlen generiert werden. (a) Zeigen Sie, dass
MehrPeter Hautz Skript zur Einführung Version 3.1
Peter Hautz Skript zur Einführung Version 3. Abb. aus: The Cartoon Guide to Statistics by Larry Gonick & Woollcott Smith (993) Statistik Skript zur Einführung Version 3. Universität der Künste Berlin Studiengang
Mehr5. Arbeit und Energie
Inhalt 5.1 Arbeit 5.2 Konservative Kräfte 5.3 Potentielle Energie 5.4 Kinetische Energie 5.1 Arbeit 5.1 Arbeit Konzept der Arbeit führt zur Energieerhaltung. 5.1 Arbeit Wird Masse m mit einer Kraft F von
MehrEinführung in die statistische Datenanalyse I
Einführung in die statistische Datenanalyse I Inhaltsverzeichnis 1. EINFÜHRUNG IN THEORIEGELEITETES WISSENSCHAFTLICHES ARBEITEN 2 2. KRITIERIEN ZUR AUSWAHL STATISTISCH METHODISCHER VERFAHREN 2 3. UNIVARIATE
MehrKommentierte Musterlösung zur Klausur HM I für Naturwissenschaftler
Kommentierte Musterlösung zur Klausur HM I für Naturwissenschaftler Wintersemester 3/4 (.3.4). (a) Für z = + i und z = 3 4i berechne man z z und z z. Die Ergebnisse sind in kartesischer Form anzugeben.
MehrVeranstaltung Statistik (BWL) an der FH Frankfurt/Main im WS 2004/05 (Dr. Faik) Klausur 09.02.2005 - GRUPPE A - BEARBEITER/IN (NAME, VORNAME):
Veranstaltung Statistik (BWL) an der FH Frankfurt/Main im WS 2004/05 (Dr. Faik) Klausur 09.02.2005 - GRUPPE A - BEARBEITER/IN (NAME, VORNAME): MATRIKELNUMMER: Alte Prüfungsordnung/Neue Prüfungsordnung
Mehrx 2 2x + = 3 + Es gibt genau ein x R mit ax + b = 0, denn es gilt
- 17 - Die Frage ist hier also: Für welche x R gilt x = x + 1? Das ist eine quadratische Gleichung für x. Es gilt x = x + 1 x x 3 = 0, und man kann quadratische Ergänzung machen:... ( ) ( ) x x + = 3 +
MehrJOHANNES BONNEKOH. Analysis. Allgemeine Hochschulreife und Fachabitur
JOHANNES BONNEKOH Analysis Allgemeine Hochschulreife und Fachabitur Vorwort Vorwort Mathematik ist eine Sprache, die uns hilft die Natur und allgemeine naturwissenschaftliche Vorgänge zu beschreiben. Johannes
MehrWirtschaftsstatistik. Konzentrations- und Disparitätsmessung 16.10.2007
Wirtschaftsstatistik Konzentrations- und Disparitätsmessung 16.10.2007 Begriffe Konzentration und Disparität Laut Oxford Advanced Learner s Dictionary by OUP, bzw. WordNet by Princeton University concentration:
MehrQualitätsmanagement: Wichtige Begriffe und Formeln aus der Statistik
Qualitätsmanagement: Begriffe und Formeln aus der Statistik 1 von 50 Qualitätsmanagement: Wichtige Begriffe und Formeln aus der Statistik Quellen: Diverse Online UNI- & FH-Skripten Inhaltsverzeichnis EINLEITUNG...
MehrGenexpression. Expression eines einzelnen Gens. Expressionsmessung. Genexpressionsmessung. Transkription (Vorgang) Genexpression
Genexpressionsmessung Genexpression Transkription (Vorgang) Genexpression (quantitativ) Wieviele m-rna Moleküle eines bestimmten Gens sind in den Zellen? Genomische Datenanalyse 8. Kapitel Wie mißt man
Mehrklar. Um die zweite Bedingung zu zeigen, betrachte u i U i mit u i = 0. Das mittlere -Zeichen liefert s
Nachtrag zur allgemeinen Vektorraum-Theorie. 1.5.15. Direkte Summen. Sei V ein Vektorraum, seien U 1,..., U t Unterräume, wir schreiben V = U 1 U 2 U t = t i=1 U i falls die folgenden beiden Bedingungen
MehrMINT-Circle-Schülerakademie
1 Einführung MINT-Circle-Schülerakademie Kurze Einführung, was Maple ist, wozu es dienen kann, wo es verwendet wird. Zur Einführung die folgenden Aufgaben bearbeiten lassen. Aufgabe 1. Gib unter Maple
Mehr5. Schließende Statistik. 5.1. Einführung
5. Schließende Statistik 5.1. Einführung Sollen auf der Basis von empirischen Untersuchungen (Daten) Erkenntnisse gewonnen und Entscheidungen gefällt werden, sind die Methoden der Statistik einzusetzen.
MehrMethoden der empirischen Sozialforschung I
Methoden der empirischen Sozialforschung I Annelies Blom, PhD TU Kaiserslautern Wintersemester 2011/12 Übersicht Quantitative Datenauswertung: deskriptive und induktive Statistik Wiederholung: Die wichtigsten
MehrDatenanalyse aus einer unklassierten Häufigkeitstabelle
Datenanalyse aus einer unklassierten Häufigkeitstabelle Worum geht es in diesem Modul? Häufigkeitstabelle Stabdiagramm Die empirische Verteilungsfunktion Quantile Worum geht es in diesem Modul? Nachdem
MehrThemenkreise der Klasse 5
Mathematik Lernzielkatalog bzw. Inhalte in der MITTELSTUFE Am Ende der Mittelstufe sollten die Schüler - alle schriftlichen Rechenverfahren beherrschen. - Maßeinheiten umformen und mit ihnen rechnen können.
MehrEine Einführung in R: Statistische Tests
Eine Einführung in R: Statistische Tests Bernd Klaus, Verena Zuber Institut für Medizinische Informatik, Statistik und Epidemiologie (IMISE), Universität Leipzig http://www.uni-leipzig.de/ zuber/teaching/ws12/r-kurs/
MehrNumerisches Programmieren
Technische Universität München WS /3 Institut für Informatik Prof Dr Hans-Joachim Bungartz Dipl-Inf Christoph Riesinger Dipl-Inf Dipl-Math Jürgen Bräckle Numerisches Programmieren Programmieraufgabe: Polnominterpolation,
MehrTECHNISCHE UNIVERSITÄT MÜNCHEN
TECHISCHE UIVERSITÄT MÜCHE Zentrum Mathematik PRF. R.R. JÜRGE RICHTER-GEBERT, VAESSA KRUMMECK, MICHAEL PRÄHFER Höhere Mathematik für Informatiker I (Wintersemester 003/004) Aufgabenblatt 1 (4. ktober 003)
MehrDie Gleichung A x = a hat für A 0 die eindeutig bestimmte Lösung. Für A=0 und a 0 existiert keine Lösung.
Lineare Gleichungen mit einer Unbekannten Die Grundform der linearen Gleichung mit einer Unbekannten x lautet A x = a Dabei sind A, a reelle Zahlen. Die Gleichung lösen heißt, alle reellen Zahlen anzugeben,
MehrKlausur zu Methoden der Statistik I (mit Kurzlösung) Wintersemester 2007/2008. Aufgabe 1
Lehrstuhl für Statistik und Ökonometrie der Otto-Friedrich-Universität Bamberg Prof. Dr. Susanne Rässler Klausur zu Methoden der Statistik I (mit Kurzlösung) Wintersemester 2007/2008 Aufgabe 1 Ihnen liegt
MehrPrimzahlen zwischen 50 und 60. Primzahlen zwischen 70 und 80. Primzahlen zwischen 10 und 20. Primzahlen zwischen 40 und 50. den Term 2*x nennt man
die kleinste Primzahl zwischen 0 und 60 zwischen 0 und 10 zwischen 60 und 70 zwischen 70 und 80 zwischen 80 und 90 zwischen 90 und 100 zwischen 10 und 20 zwischen 20 und 0 zwischen 0 und 40 zwischen 40
MehrVorübung 1 Beschriften Sie die Tabelle wie in der Abbildung dargestellt.
Diese Anleitung führt in einige Grundfunktionen des Tabellenkalkulationsprogramms Microsoft Excel ein. Sie erstellen nach einigen Vorübungen mit Excel ein kleines Programm, das auf der Grundlage der Gesamtpunktzahl
MehrMedizinische Biometrie (L5)
Medizinische Biometrie (L5) Vorlesung II Daten Deskription Prof. Dr. Ulrich Mansmann Institut für Medizinische Informationsverarbeitung, Biometrie und Epidemiologie mansmann@ibe.med.uni-muenchen.de IBE,
MehrR ist freie Software und kann von der Website. www.r-project.org
R R ist freie Software und kann von der Website heruntergeladen werden. www.r-project.org Nach dem Herunterladen und der Installation von R kann man R durch Doppelklicken auf das R-Symbol starten. R wird
MehrPolarisation des Lichts
PeP Vom Kerzenlicht zum Laser Versuchsanleitung Versuch 4: Polarisation des Lichts Polarisation des Lichts Themenkomplex I: Polarisation und Reflexion Theoretische Grundlagen 1.Polarisation und Reflexion
MehrPhysikalisches Grundpraktikum Fehlerrechnung
Fachrichtungen der Physik UNIVERSITÄT DES SAARLANDES Physikalisches Grundpraktikum Fehlerrechnung WWW-Adresse Grundpraktikum Physik: http://grundpraktikum.physik.uni-saarland.de/ Kontaktadressen der Praktikumsleiter:
MehrAuswertung und Darstellung wissenschaftlicher Daten (1)
Auswertung und Darstellung wissenschaftlicher Daten () Mag. Dr. Andrea Payrhuber Zwei Schritte der Auswertung. Deskriptive Darstellung aller Daten 2. analytische Darstellung (Gruppenvergleiche) SPSS-Andrea
MehrTrendlinien in Diagrammen (Excel 2010)
Trendlinien in Diagrammen (Excel 2010) Trendlinien in Diagrammen (Excel 2010)... 1 Allgemeines... 2 Informationen über Prognosen und das Anzeigen von Trends in Diagrammen... 3 AUSWÄHLEN DES PASSENDEN TRENDLINIETYPS
MehrGrundlagen der Informatik. Prof. Dr. Stefan Enderle NTA Isny
Grundlagen der Informatik Prof. Dr. Stefan Enderle NTA Isny 2 Datenstrukturen 2.1 Einführung Syntax: Definition einer formalen Grammatik, um Regeln einer formalen Sprache (Programmiersprache) festzulegen.
MehrDer Chi Quadrat Test nicht nur für die digitalen Ziffernanalyse geeignet
Der Chi Quadrat Test nicht nur für die digitalen Ziffernanalyse geeignet 1. Einleitung Seit Anfang 2002 finden elektronische Betriebsprüfungen auf der Grundlage der Grundsätze zum Datenzugriff und zur
MehrMathematische und statistische Methoden II
Methodenlehre e e Prof. Dr. G. Meinhardt 6. Stock, Wallstr. 3 (Raum 06-206) Sprechstunde jederzeit nach Vereinbarung und nach der Vorlesung. Mathematische und statistische Methoden II Dr. Malte Persike
MehrSingle Parity check Codes (1)
Single Parity check Codes (1) Der Single Parity check Code (SPC) fügt zu dem Informationsblock u = (u 1, u 2,..., u k ) ein Prüfbit (englisch: Parity) p hinzu: Die Grafik zeigt drei Beispiele solcher Codes
Mehr2 Analyse statistischer Daten zu einem Merkmal Lösungshinweise
6 2 Analyse statistischer Daten zu einem Merkmal Lösungshinweise 2 Analyse statistischer Daten zu einem Merkmal Lösungshinweise : In der folgenden Tabelle ist eine Teilstichprobe zu den Studierenden in
MehrSeminar zum Thema Künstliche Intelligenz:
Wolfgang Ginolas Seminar zum Thema Künstliche Intelligenz: Clusteranalyse Wolfgang Ginolas 11.5.2005 Wolfgang Ginolas 1 Beispiel Was ist eine Clusteranalyse Ein einfacher Algorithmus 2 bei verschieden
MehrStandardisierte kompetenzorientierte schriftliche Reifeprüfung. Mathematik. Probeklausur März 2014. Teil-1-Aufgaben
Standardisierte kompetenzorientierte schriftliche Reifeprüfung Mathematik Probeklausur März 2014 Teil-1-Aufgaben Beurteilung Jede Aufgabe in Teil 1 wird mit 0 oder 1 Punkt bewertet, jede Teilaufgabe in
Mehr1. Grundbegriffe und graphische Darstellungen
Prof. Dr. Ralf Runde FSK-Aufgaben Statistik A/Deskriptive Statistik 1. Grundbegriffe und graphische Darstellungen FSK 1.1: Bei n = 20 Studierenden wurden die Punkte X der letzten Statistik-Klausur in der
MehrAbitur - Grundkurs Mathematik. Sachsen-Anhalt 2002. Gebiet G1 - Analysis
Abitur - Grundkurs Mathematik Sachsen-Anhalt Gebiet G - Analsis Aufgabe.. Der Graph einer ganzrationalen Funktion f dritten Grades mit einer Funktionsgleichung der Form f a b c d a,b,c,d, R schneidet die
Mehr