Statistische Formelsammlung Begleitende Materialien zur Statistik - Vorlesung des Grundstudiums im Fachbereich IK



Ähnliche Dokumente
15.4 Diskrete Zufallsvariablen

h i Deskriptive Statistik 1-dimensionale Daten Daten und Häufigkeiten Seite 1 Nominal Ordinal Metrisch (Kardinal) Metrisch - klassiert

Statistik Einführung // Konfidenzintervalle für einen Parameter 7 p.2/39

Wissenschaftliches Arbeiten Studiengang Energiewirtschaft

2 Vollständige Induktion

Statistik I/Empirie I

3. Einführung in die Statistik

n 1,n 2,n 3,...,n k in der Stichprobe auftreten. Für die absolute Häufigkeit können wir auch die relative Häufigkeit einsetzen:

Statistische Maßzahlen. Statistik Vorlesung, 10. März, Beispiel. Der Median. Beispiel. Der Median für klassifizierte Werte.

Auch im Risikofall ist das Entscheidungsproblem gelöst, wenn eine dominante Aktion in A existiert.

Statistik mit Excel Themen-Special. Peter Wies. 1. Ausgabe, Februar 2014 W-EX2013S

Formelsammlung Mathematik

Übungen zur Vorlesung Funktionentheorie Sommersemester Musterlösung zu Blatt 0

Statistik. Prof. Dr. K. Melzer.

Innerbetriebliche Leistungsverrechnung

Wahrscheinlichkeit & Statistik

Beschreibende Statistik Kenngrößen in der Übersicht (Ac)

Kapitel 6: Statistische Qualitätskontrolle

Stochastik für WiWi - Klausurvorbereitung

BINOMIALKOEFFIZIENTEN. Stochastik und ihre Didaktik Referentin: Iris Winkler

Testumfang für die Ermittlung und Angabe von Fehlerraten in biometrischen Systemen

Übungsblatt 1 zur Vorlesung Angewandte Stochastik

AUFGABENSTELLUNG (ZUSAMMENFASSUNG) 2 SPEZIFIKATION 2. Datenfluß und Programmablauf 2. Vorbedingung 3. Nachbedingung 3. Schleifeninvariante 3

Arbeitsplätze in SAP R/3 Modul PP

Es werden 120 Schüler befragt, ob sie ein Handy besitzen. Das Ergebnis der Umfrage lautet: Von 120 Schülern besitzen 99 ein Handy.

Empirische Methoden I

Korrekturrichtlinie zur Studienleistung Wirtschaftsmathematik am Betriebswirtschaft BB-WMT-S

Formelsammlung. zur Klausur. Beschreibende Statistik

Parameter von Häufigkeitsverteilungen

Gliederung. Value-at-Risk

Stichproben im Rechnungswesen, Stichprobeninventur

Versicherungstechnik

Allgemeine Lösungen der n-dimensionalen Laplace-Gleichung und ihre komplexe Variable

Kapitel 4: Stationäre Prozesse

7.2 Grundlagen der Wahrscheinlichkeitsrechnung

... a ik) i=1...m, k=1...n A = = ( a mn

1 Analysis T1 Übungsblatt 1

Aufgaben und Lösungen der Probeklausur zur Analysis I

2. Diophantische Gleichungen

SBP Mathe Aufbaukurs 1. Absolute und relative Häufigkeit. Das arithmetische Mittel und seine Eigenschaften. Das arithmetische Mittel und Häufigkeit

h i :=h a i f i = h a i n Absolute Häufigkeit: Relative Häufigkeit: h 2 h 4 h 6 :=h der Elemente mit der Ausprägung i=6 zu der Anzahl n aller Werte

Univariate Verteilungen

Evaluierung einer Schulungsmaßnahme: Punktezahl vor der Schulung Punktezahl nach der Schulung. Autoritarismusscore vor/nach Projekt

Institut für Stochastik Prof. Dr. N. Bäuerle Dipl.-Math. S. Urban

Kryptologie: Kryptographie und Kryptoanalyse Kryptologie ist die Wissenschaft, die sich mit dem Ver- und Entschlüsseln von Informationen befasst.

Ausgangspunkt: Über einen endlichen Zeitraum wird aus einem Kapital (Rentenbarwert RBW v n,i

Statistik Einführung // Beschreibende Statistik 2 p.2/61

Sind Sie mit unserem Angebot zufrieden? ja nein weiß nicht

Klasse: Platzziffer: Punkte: / Graph zu f

Finanzmathematische Formeln und Tabellen

Lerneinheit 2: Grundlagen der Investition und Finanzierung

Prof. Dr. Roland Füss Statistik II SS 2008

Formelsammlung zur Statistik

Weitere Lagemaße: Quantile/Perzentile I

Kleines Matrix-ABC. Fachgebiet Regelungstechnik Leiter: Prof. Dr.-Ing. Johann Reger. 1 Elementares

Satz Ein Boolescher Term t ist eine Tautologie genau dann, wenn t unerfüllbar ist.

Vorlesung Informationssysteme

Nachklausur - Analysis 1 - Lösungen

( ) Formelsammlung. Kombinatorik. Permutation: ohne Wiederholung. n! = n (n - 1) (n - 2) n= alle Elemente. Permutation: mit Wiederholung

5 Bernoulli-Kette. 5.1 Bernoulli-Experiment. Jakob Bernoulli Schweizer Mathematiker und Physiker Einleitung

Der natürliche Werkstoff Holz - Statistische Betrachtungen zum uniaxialen Zugversuch am Beispiel von Furnier

GIBS. Übungsaufgaben zur Vertiefung. V1. Beschriften Sie die Konstruktionen! n n n n ' ' ' ' Modul 1.5. Geometrische Optik 1 58.

Reader Teil 1: Beschreibende Statistik

Datenauswertung. Prof. Dr. Josef Brüderl Universität Mannheim. Frühjahrssemester 2007

Weitere Lagemaße: Quantile/Perzentile II. Weitere Lagemaße: Quantile/Perzentile I. Weitere Lagemaße: Quantile/Perzentile IV

Variiert man zusätzlich noch die Saatstärke (z.b. 3 Stärkearten), würde man von einer zweifaktoriellen Varianzanalyse sprechen.

Kapitel 6: Quadratisches Wachstum

Prof. Dr.-Ing. Bernd Kochendörfer. Bauwirtschaft und Baubetrieb. Investitionsrechnung

Statistik I für Studierende der Soziologie

Projektmanagement Solarkraftwerke

2.2.1 Lagemaße. Exkurs: Quantile. und n. p n

6 Vergleich mehrerer unverbundener Stichproben

Vl Statistische Prozess und Qualitätskontrolle und Versuchsplanung Übung 3

Die Gasgesetze. Die Beziehung zwischen Volumen und Temperatur (Gesetz von J.-L. und J. Charles): Gay-Lussac

e) ( 4a + 8b + 9a + 18b ) : a + 2b f) 2 log (x) + 3 log (2y) 0.5 log (z)

Zur Definition. der wirksamen. Wärmespeicherkapazität

Vl Statistische Prozess- und Qualitätskontrolle und Versuchsplanung Übung 5

LOHN Betriebswirtschaftliche Planung & Controlling

VAIO-Link Kundenservice Broschüre

Umrechnung einer tatsächlichen Häufigkeitsverteilung in eine prozentuale Häufigkeitsverteilung

SUCHPROBLEME UND ALPHABETISCHE CODES

Streuungsmaße. Prof. Dr. Paul Reuber. Institut für Geographie. Seminar Methoden der empirischen Humangeographie

2. Schätzverfahren 2.1 Punktschätzung wirtschaftlicher Kennzahlen. Allgemein: Punktschätzung eines Parameters:

Elementare Wahrscheinlichkeitsrechnung und Statistik

= 3. = 14,38... = x neu x = 0, = 97,87...%. Wie verändert sich der arithmetische Mittelwert von 20 Zahlen, wenn...

Qualitätskennzahlen für IT-Verfahren in der öffentlichen Verwaltung Lösungsansätze zur Beschreibung von Metriken nach V-Modell XT

Beurteilung des Businessplans zur Tragfähigkeitsbescheinigung

Kapitel 3: Bedingte Wahrscheinlichkeiten und Unabhängigkeit

Lehrstuhl für Empirische Wirtschaftsforschung und Ökonometrie Dr. Roland Füss Statistik II: Schließende Statistik SS 2007

Der Modus. Lageparameter. Beispiel (Einrichtungen) Beispiel (Lieblingsfarben) Modus. Untersuchungseinheiten U 1,...,U n. Merkmal X

Statistik und Wahrscheinlichkeitsrechnung

3. Tilgungsrechnung Tilgungsarten

Lösungen der Aufgaben zur Vorbereitung auf die Klausur Mathematik für Informatiker I

Kennwerte Univariater Verteilungen

x 1, x 2,..., x n ist eine Liste von n reellen Zahlen. Das arithmetische Mittel x der Zahlen ist x = x 1 + x x n n

Grundgesamtheitsanaylsen und Stichproben. Betrachtungen zur Stichprobenfindung

LOHN KUG, ATZ, Pfändung, Darlehen und Bescheinigungswesen

Gruppe 108: Janina Bär Christian Hörr Robert Rex

Wirksamkeit, Effizienz

Mathematischer Vorkurs zum Studium der Physik

Transkript:

Statistische Formelsammlug Begleitede Materialie zur Statistik - Vorlesug des Grudstudiums im Fachbereich IK Erstellt im Rahme des studierede Projektes PROST Studiejahr 00/00 uter Aleitug vo Frau Prof. Dr. rer. at. Kira Kleke vo J.Gelwert, C.Seeger, E.Zotou

Statistik 4 Deskriptive Statistik 4 Aalytische Statistik 4 Grudbegriffe der Statistik 5 Urliste 5 Grudgesamtheit 5 Stichprobe 5 Vollerhebug 5 Merkmalsträger 5 Merkmal 5 Merkmalsauspräguge 6 Quatitative ud qualitative Merkmale 6 quatitativ 6 stetige / metrische Variable 6 diskrete Variable 6 qualitativ 6 omiale Variable 6 ordiale Variable 6 Deskriptive Statistik 7 Mittelwerte 7 Arithmetisches Mittel 7 Geometrisches Mittel 7 Schätzug des arithmetische Mittels für klassierte Date 8 Media 9 Modus 9 Streuugsmaße 0 Spaweite 0 Variaz ud Stadardabeichug 0 i der Stichprobe 0 i der Grudgesamtheit 0 Quartile Quartilsabstad Variatioskoeffiziet Welches Streuugsmaß bei welchem Mittelwert? Häufigkeite Häufigkeitstabelle Kreuztabelle 3 Klassebildug 4 Grafike der deskriptive Statistik 5 Kreisdiagramm 5 Stabdiagramm 5 Balkediagramm 5 Stem & Leaf 5 Box-Plot 6 Histogramm 6 Verlaufskurve 6 Aalytische Statistik 7 Wahrscheilichkeitsrechug 7 Ereigisraum 7 Defiitioe der Wahrscheilichkeit 7 Additiossatz 7

allgemeier Additiossatz 7 spezieller Additiossatz 7 stochastische (U-)Abhägigkeit vo Ereigisse 8 bedigte Wahrscheilichkeit 8 Multiplikatiossatz 8 allgemeier Multiplikatiossatz 8 spezieller Multiplikatiossatz 8 Kombiatorik 9 Fakultät 9 Biomialkoeffiziet 9 Wahrscheilichkeitsverteiluge 9 Verteilugsfuktio 9 Biomialverteilug 9 Gauß- oder Normalverteilug 0 stadardisierte Normalverteilug 0 beliebige Zufallsvariable 0 Trasformatio der Stadardormalverteilug 0 Parameter i der Grudgesamtheit 0 Kofidezitervalle für eie ubekate Mittelwert für eie ubekate Proportio Fallzahlbestimmug Bestimmug des erforderliche (Midest-) Stichprobeumfags bei Schätzug eies (prozetuale) Ateils π Bestimmug der erforderliche (Midest-)Fallzahl bei der Schätzug eies (ubekate) Mittelwertes µ Stichwortliste 3 3

Statistik Statistik ist eie Wisseschaft, dere Zweck es ist, Iformatioe i Form vo Zahle oder adere Date zusammezutrage, das gesammelte Material aufzubereite ud die Iformatioe schließlich so zu verdichte, dass sie aussagekräftig, verstädlich ud überschaubar werde. Sie ist eie gute Möglichkeit, Fakte exakt ud überzeuged darzustelle. Sie fidet Awedug sowohl i aturwisseschaftliche als auch wirtschaftliche, soziologische ud politische Bereiche. Sie uterteilt sich i zwei Disziplie: Deskriptive Statistik Deskriptive Statistik bedeutet beschreibede Statistik ud meit die reie Beschreibug des erhobee Datebestades (i der Regel die Stichprobe). Etspreched der Fragestellug werde Date erhobe, ausgewertet ud dargestellt. Deskriptive Statistik ist also eie Zusammefassug vo uüberschaubar viele Eizeldate bzw. ei überschaubares Komprimiere vo viele Eizeliformatioe. Die zusammefassede Darstellug erfolgt durch die Berechug der Maßzahle ud die Erstellug vo Häufigkeitstabelle ud Grafike. Aalytische Statistik auch: Schließede Statistik, Iterferezstatistik, iduktive Statistik. Die aalytische Statistik (isbesodere mit Hilfe der Wahrscheilichkeitsrechug) befasst sich damit, wie aufgrud vo Date der Stichprobe Rückschlüsse bzw. allgemeigültige Aussage über die zugrude liegede Grudgesamtheit hergeleitet werde köe. 4

Grudbegriffe der Statistik Urliste Die Urliste ist die Liste der Eizeldate, so wie erhobe, och icht sortiert oder gruppiert. x, x, x 3, x 4...x sortierte Urliste Hier werde die Auspräguge i eie aufsteigede Reihefolge gebracht. x (), x (), x (3), x (4)...x () d.h. x () x () x (3) x (4)...x () Grudgesamtheit Die Grudgesamtheit ist die Mege aller iteressierede Utersuchugsobjekte. Stichprobe Uter Stichprobe versteht ma eie Teilmege der Grudgesamtheit, die ausgewählt wird. Sie muss repräsetativ sei. Eie Stichprobe ist da repräsetativ, we jede Utersuchugseiheit aus der Grudgesamtheit dieselbe Chace hat, ausgewählt zu werde. Vollerhebug Bei eier Vollerhebug wird die gaze Grudgesamtheit erhobe. Merkmalsträger / Utersuchugsobjekte / statistische Eiheit / Elemet Objekte, a dee die iteressierede Merkmale auftrete. Merkmal / Variable Iteressierede Eigeschafte der Merkmalsträger. Hierbei ist eie exakte Defiitio wichtig. 5

Merkmalsauspräguge Es sid die mögliche Meßwerte eies Merkmals gemeit. Quatitative ud qualitative Merkmale (Merkmalsauspräguge) quatitativ: Auspräguge sid echte Meßwerte (vo Natur aus Zahle), d.h. addier-, subtrahier- ud multiplizierbar. Ma uterscheidet folgede Skalieruge: stetige / metrische Variable - köe fast jede Wert ud Zwischewert aehme, d.h. sie sid beliebig fei meßbar diskrete Variable - es köe ur edlich viele, gaz kokrete Werte ageomme werde (i.d.r. gazzahlig, keie Brüche) qualitativ: Ei Merkmal bezeichet eie Eigeschaft, Qualität, der utersuchte Objekte. Die Auspräguge eies qualitative Merkmales sid keie echte Zahle. Ma ka mit ihe icht reche! Hier uterscheidet ma folgede Skalieruge: omiale Variable - sid ur ametlich uterscheidbar (keie Zahle, keie Ordug, ur Name) ordiale Variable - sid sortierbar, es gibt eie iere Ordug, es ka damit icht gerechet werde Diese 4 Skalierugstype sid weisugsgebed für die Art der Dateauswertug!! 6

Deskriptive Statistik Mittelwerte Arithmetisches Mittel (egl. arithmetic mea) auch: Stadard - Mittelwert Ma addiert die Werte aller Elemete ud dividiert de Gesamtwert durch die Azahl der Elemete. Eideutig zu bestimme ist das arithmetische Mittel, we die Origialwerte i icht klassifizierter Form vorliege. x = i= x i x : sprich x-quer = x = Azahl der Beobachtuge / Messuge Ausprägug (ka sehr leicht verzerrt / verfälscht werde durch Extremwerte) geeiget für stetige Merkmale. Wird i der Praxis auch beutzt bei ordiale ud diskrete Merkmale. Gewogees arithmetisches Mittel x k = xi k i fi = i= f i k = Azahl verschiedeer Werte des Merkmals X f i = die zugehörige Häufigkeite Geometrisches Mittel (egl. geometric mea) Ist geeiget zur Berechug vo Wachstumsrate. durchschittliches Wachstum w: Schreibweise i %: ( % + w ) ( 00% + w ) ( 00% + w )... ( 00% + w ) 00% w = 00 3 wobei w, w, w 3,...w Wachstumsrate i gleich lage Zeiträume i %-Agabe. alterativ: Komma-Schreibweise: w ( + w ) ( + w ) ( + w )... ( + w ) = 3 7

Schätzug des arithmetische Mittels für klassierte Date (Klassebildug S.4) x ist eie Näherug!! Klasse eies stetige Merkmals Absolute Häufigkeite f i... bis uter.......... bis uter.......... bis uter....... Klassemitte a i Mi + Klasse Max Klasse k ai f i i= x = k f i= i k i= ai f i k f i k i= f i = Azahl verschiedeer Klasse die zugehörige Häufigkeite Azahl vo Beobachtuge 8

Media (egl. media) auch: Zetralwert Ma sortiert die Urliste vom kleiste zum größte Wert ud der Media ist der Wert, der i der Mitte liegt. Er ist uempfidlich gege Extremwerte. Er ist isbesodere für ordialskalierte Merkmale geeiget ud we diskrete ud stetige Merkmale schief verteilt sid. 50 % der Werte größer oder gleich 50 % der Werte kleier oder gleich bei gerader Azahl der Werte Media = x + x + Der Media ist bei eier gerade Azahl vo Werte der Mittelwert, der beide Werte i der Mitte der sortierte Urliste. bei ugerader Azahl der Werte: Media = x + Bei ugerader Azahl der Werte ist der Media der Wert, der i der sortierte Urliste i der Mitte liegt. Modus auch: Modalwert besoders für omialskalierte Variabletype geeiget Der Modus ist derjeige Merkmalswert, der die größte Häufigkeit aufweist, vorrausgesetzt es existiert geau Häufigster. 9

Streuugsmaße ( was befidet sich rechts ud liks vom Mittelwert?) Zu jedem Mittelwert sollte immer mid. ei Streuugsmaß agegebe werde. Spaweite R (egl. rage) Die Spaweite ist die Differez aus dem maximale ud dem miimale Wert der sortierte Urliste, der aber sehr leicht durch Extremwerte verzerrt werde ka. x () x ()... x () R = x () x () Variaz (egl. variace) ud Stadardabweichug (egl. stadard deviatio) Ma uterscheidet zwische Stichprobe ud Grudgesamtheit. Variaz ud Stadardabweichug i der Stichprobe werde mit s bzw. s bezeichet. Variaz s i der Stichprobe Die Variaz ist die Summe der Quadrate der Abweichuge aller Werte vom arithmetische Mittel, geteilt durch die Azahl der Werte. s = i= (x i - x ) Stadardabweichug s i der Stichprobe (mittlere quadratische Abweichug) Stadardabweichug ist die Wurzel aus der Variaz. s = s Für die Berechug mit Tascherecher ist die Taste zu beutze. Da i der Regel icht die komplette Grudgesamtheit erfasst wird, werde die Variaz ud Stadardabweichug der Grudgesamtheit i der aalytische Statistik geschätzt. Diese wird, im Gegesatz zu deskriptiver Statistik, mit - statt mit berechet. Deswege existiere zwei Taste auf de Tascherecher, eie für aalytische ud eie für deskriptive Statistik. Schätzug der Variaz i der Grudgesamtheit (aalytische Statistik) ˆ = (x i - x ) i= Schätzug der Stadardabweichug i der Grudgesamtheit (aalytische Statistik) ˆ = ˆ Für die Berechug mit Tascherecher ist die Taste - zu beutze. 0

Quartile Sie sid isbesodere für ordialskalierte Merkmale geeiget ud we diskrete ud stetige Merkmale schief verteilt sid. Die geordete Reihe vo Merkmalswerte wird i vier gleiche Teile geteilt (also 4 5%): Uteres Quartil (.Quartil): 5% der Werte sid kleier oder gleich 75% der Werte sid größer oder gleich Zweites Quartil Media 50% der Werte sid kleier oder gleich 50% der Werte sid größer oder gleich Oberstes Quartil (3.Quartil): 75% der Werte sid kleier oder gleich 5% der Werte sid größer oder gleich Das vierte Quartil ist das Maximum: 00% der Werte sid kleier oder gleich Quartilabstad QA (egl. Iterquartilerage IQR) Quartilabstad ist die Differez zwische dem obere ud dem utere Quartil (Spaweite der mittlere 50%) QA = Q 3 Q Variatioskoeffiziet (egl. coefficiet of variatio) Variatioskoeffiziet diet dazu, mehrere Stadardabweichuge miteiader zu vergleiche. CV= x s bzw. CV= x s 00% (für Agabe i Prozet) CV= Verhältis der Stadardabweichug s zum Mittelwert x i %. Wie viel % des arithmetische Mittels ist s? Welches Streuugsmaß wird bei welchem Mittelwert agegebe? Mittelwert x Media Streuugsmaß s_ ud s Spaweite beim Vergleiche mehrerer Streuugsmaße CV IQR / QA Spaweite

Häufigkeite Häufigkeitsverteilug (egl. frequecy) Bei Häufigkeitsverteiluge wird ausgezählt, wie oft eizele Merkmalsauspräguge i der Stichprobe aufgetrete sid. Besoders geeiget für omiale, ordiale ud diskrete Auspräguge. Für stetige Merkmale müsse Klasse gebildet werde (siehe ute). Die Ergebisse der Auszählug werde i tabellarischer Form dargestellt. Beispiel: eie Häufigkeitstabelle i SPSS Fachrichtug Gültig Allgemeie Dokumetatio Wirtschaftsiformatik Bibliothekswese Psychologie Mathematik E-Techik Jura Sozialwisseschafte Lehramt für berufsbild.schule Geschichte & Politikwisses. Germaistik & Politikwisses. Architektur Gesamt Häufigkeit Prozet Kumulierte Prozete 3,8 3,8 0,5 6,3 7 8,8 35,0 9,3 46,3 3 3,8 50,0 6 7,5 57,5 8 0,0 67,5 3 3,8 7,3 6 7,5 78,8 4 5,0 83,8 6 7,5 9,3 7 8,8 00,0 80 00,0 absolute Häufigkeite relative Häufigkeit kumulierte Prozete (ausgezählt) (i Prozet) Azahl _ mit _ der _ spez. Ausprägug Relative Häufigkeite: 00 Gesamtzahl( ) Kumulierte Prozete: Aufaddierug der Prozete zeileweise.

Kreuztabelle Mehrere Merkmale werde gegeeiader ausgezählt. (Normalfall: Merkmale, ab 4 Merkmale ist die Tabelle schwer überschaubar). Softwarepakete gebe die Zellihalte der Kreuztabelle i.d.r. folgedermaße aus: Häufigkeit absolut (frequecy) Reiheprozete (Rowpercet) Spalteprozete (Colpercet) Gesamtprozete (Percet) Beispiel erstellt mit SPSS Geschlecht d.stud. * welche Hochschule? Kreuztabelle Geschlecht d.stud. Gesamt weiblich mälich Azahl % vo Geschlecht d.stud. % vo welche Hochschule? % der Gesamtzahl Azahl % vo Geschlecht d.stud. % vo welche Hochschule? % der Gesamtzahl Azahl % vo Geschlecht d.stud. % vo welche Hochschule? % der Gesamtzahl welche Hochschule? Fachhoch Uiversität schule Gesamt 4 8 33,3% 66,7% 00,0% 36,4% 88,9% 60,0% 0,0% 40,0% 60,0% 7 8 87,5%,5% 00,0% 63,6%,% 40,0% 35,0% 5,0% 40,0% 9 0 55,0% 45,0% 00,0% 00,0% 00,0% 00,0% 55,0% 45,0% 00,0% Ihaltliche Iterpretatio: 4 Persoe sid weiblich ud studiere a der Uiversität. 4/ 00 = 33,3% 33,3% der weibliche Befragte studiere a der Uiversität. 4/ 00 = 36,4 36,4% der Studierede a der Uiversität sid weiblich. 4/0 00 = 0% 0% der Befragte sid weiblich ud studiere a der Uiversität. 3

Klassebildug bei stetige Merkmale Da stetige Merkmale gaz uterschiedliche Merkmalswerte besitze köe, würde die direkte Auswertug der Date durch Häufigkeitstabelle weig Si mache. Deswege werde die Date ach uterschiedliche Aspekte gruppiert, d.h. es werde Klasse gebildet, die i Häufigkeits- oder Kreuztabelle ausgewertet werde köe. Festgelegt werde muss: Wie viele Klasse lege ich fest? Wo lege ich Klassegreze fest? Wie viele Klasse? Azahl der Klasse wird bestimmt durch die Größe der Stichprobe. Faustregel: Azahl der Klasse = (bei Dezimalstelle sivoll rude) Klassegreze Greze dürfe sich icht überscheide (klare Defiitio) Klassegreze solle aeiader greze.klasse fägt bei dem miimale Wert a letzte Klasse hört bei dem maximale Wert auf zur bessere Lesbarkeit sollte die Klassegreze glatte Zahle sei Gleich breite Klasse: Jede Klasse besteht aus gleich breite Abschitte. Klassebreite = Spaweite Azahl _ der _ Klasse Prozetual gleich starke Klasse Jede Klasse besitzt die gleiche Azahl vo. Klassehäufigkeit = Azahl _ der _ Klasse Ihaltliche Klassebildug Sivolle Kombiatio der Auswertugsmöglichkeite. Klasse sid ihaltlich vorgegebe, z.b. bei Blutwerte Grezwerte für ormal ud pathologisch. 4

Grafike der deskriptive Statistik Merkmalstyp Skalierug: omial, ordial, diskret Awedugstipp: max. 7 Auspräguge icht für feie Uterschiede geeiget Grafiktyp Kreisdiagramm 5-0x im Moat 0,0% -4x i der Woche 40,0% Fehled 5,0% täglich 45,0% Skalierug: ordial, omial, diskret auch: Gruppe- & Kompoetediagramm. stetiges Merkmal auf der y-achse Wie oft utze Sie das Iteret? Stabdiagramm 40 30 0 Absolute Werte 0 0 Fehled weiblich mälich Geschlecht der Studierede siehe Stabdiagramm! Balkediagramm Besoders geeiget für omiale Skalieruge. Beschriftug ist sehr gut lesbar ud wird machmal ach Häufigkeite sortiert. Auch als Gruppe- & Kompoetediagramm. Fachrichtug Allgemeie Dokumeta Wirtschaftsiformati E-Techik Jura Geschichte & Politik Geschlecht d.stud. mälich weiblich 0 4 6 8 0 4 Absolute Werte Skalierug: stetig Stem & Leaf Für die erste Zeile ALTERSANGABE: 40, 4, 4, 4, 43, 44 verwedet eie Teil der Datewerte als Stem / Stamm, um Gruppe / Klasse zu 4 034 bilde, ud de adere Teil als Leaf / 4 566677 Blatt, um die Azahl der Häufigkeite 5 33344 graphisch zu verdeutliche. 5 55566677899 Vorteil: Ma sieht die aktuelle Datewerte, 6 00333455 die gleichzeitig graphisch dargestellt sid. 6 5567788999999 5

Skalierug: stetig Box-Plot 60000 Grafik, i der mehrere Maßzahle dargestellt werde: uteres Quartil, Media, oberes Quartil, Maximum, Miimum. I mache Versioe werde Extremwerte extra gekezeichet. Umsatz des eizele Vertreters 50000 40000 30000 0000 0000 N = 8 7 7 7 Nord Süd Ost West Bezirk Ahad des Box-Plots lässt sich auf die Verteilugsart der Date schließe. Symmetrische Verteilug Liksschiefe Verteilug Rechtsschiefe Verteilug Skalierug: stetig Grafische Darstellug eier Häufigkeitsverteilug eies stetige klassierte Merkmals. Das Maß für die Häufigkeit ist i der Regel die Fläche. Histogramm 40 30 0 Awedugstipp: Mehrere Klasseeiteiluge ausprobiere! 0 Std.abw. = 3,68 Mittel = 4,0 0 N = 75,00 7,5 0,0,5 5,0 7,5 30,0 3,5 35,0 37,5 Alter d. Stud. Skalierug: y-achse: stetige oder diskrete mit viele Auspräguge. x-achse: i.d.r. fidet sich hier der zeitliche Aspekt wieder. Verlaufskurve Umsatz im Jahr i Mio 4 0 8 6 4 0 997 998 999 000 00 00 Jahr 6

Aalytische Statistik Wahrscheilichkeitsrechug Ereigisraum ( Mege aller mögliche Elemetar - Ereigisse) A,B,C P(A) A A B P( ) P( A B) Ereigisse Wahrscheilichkeit dafür, dass Ereigis A eitritt. komplemetäres Ereigis zu A (Gegeereigis) Wahrscheilichkeit dafür, dass Ereigis A oder Ereigis B oder beide eitrete (Vereiigug Additiossatz). Wahrscheilichkeit dafür, dass Ereigis A ud Ereigis B eitrete (Schittmege Multiplikatiossatz). Defiitioe der Wahrscheilichkeit Klassische Defiitioe (Laplac'sche Defiitio): We die Elemetarereigisse edlich ud gleichmöglich sid, gilt: Azahl _ aller _ güstige _ Elemetarereigisse P(A)= Azahl _ aller _ gleichmögliche _ Elemetarereigisse Statistische Defiitio: P(A) wird als diejeige Größe defiiert, der sich die relative Häufigkeit eies Ereigisses A bei ubeschräkter Versuchsserie ( ) ähert. Axiomatische Defiitio ach Kolmogoroff: Axiom : 0<=P(A)<= Axiom : P(S) = sicheres Ereigis S Axiom 3: P(E) = 0 umögliches Ereigis E Additiossatz Allgemeier Additiossatz (für beliebige Ereigisse): P( A B) =P(A) + P(B) - P( A B) P( A B C) =P(A) + P(B) + P(C) - P( B) C A B C P( ) A - P( A ) - P( C) B + Spezieller Additiossatz (für disjukte Ereigisse): Disjukte Ereigisse sid uvereibare Ereigisse, die icht gleichzeitig auftrete köe. P( A B) P( AU B U C) P( AU A) =P(A) + P(B) =P(S)= =P(A) + P(B) + P(C) P( A )=-P(A) Das zu eiem Ereigis A komplemetäres Ereigis A ist das Ereigis, das eitritt, we A icht eitritt. 7

Stochastische (U-)Abhägigkeit vo Ereigisse: Gegebe seie die Ereigisse A,B,C mit P(A)>0, P(B)>0 ud P(C)>0. Ereigis B ist stochastisch (u-)abhägig vo Ereigis A, we P( B A) =P( B A) =P(B) Die Ereigisse A, B, C sid voeiader stochastisch uabhägig, we P( A B) = P( A C) = P( B C) A = P(A) P( B A) = P( B C) = P( A C) P( C A) = P( C B) = P( A B) B =P(B) ud C =P(C) Bedigte Wahrscheilichkeit Sie ist die Wahrscheilichkeit dafür, dass B eitritt, uter der Bedigug dass A mit P(A) 0 bereits eigetrete ist. P B ( A B ) = P( A) P( B) P(A) P A ( A B ) = P(B) mit P(A)>0 mit P(B)>0 Multiplikatiossatz Allgemeier Multiplikatiossatz: B A A B P( ) A =P(A) P( B ) =P(B) P( ) P( A B C) =P(A) P( A) B P( C A B) Spezieller Multiplikatiossatz: Für stochastisch uabhägige Ereigisse A, B ud C gilt: A B =P(A) P(B) P( ) P( A B C) =P(A) P(B) P(C) für beliebig viele Ereigisse 8

Kombiatorik Fakultät!=... (-) 0!= Biomialkoeffiziet (sprich über k) k = 0 = ( )( )...( k + ) k!! = k!( k)! Für Berechug des Biomialkoeffiziete mit Tascherecher ist die Taste Cr zu beutze. Wahrscheilichkeitsverteiluge Verteilugsfuktio defiiert für alle reelle Zahle x i F(x i ) = P(X <= x i ) F(x i ) Verteilugsfuktio P Wahrscheilichkeit X Zufallsvariable (z.b. Zuweise der Augezahl beim Würfel) x i kokrete Auspräguge ~ verteilt wie Biomialverteilug (azuwede für kleie Stichprobe) Voraussetzuge für die Aweduge der Biomialverteilug Merkmal ist dichotom (besitzt geau Auspräguge: A ud A ) uabhägige Wiederholuge des Zufallsexperimets werde durchgeführt (z.b. Ziehe vo Kugel mit Zurücklege) p = P(A) ist bekat P(X = k) = p k (-p) -k k wobei: X Zufallsvariable k Azahl der Treffer p Wahrscheilichkeit eie Treffer zu ziehe Azahl der Versuche P: Wahrscheilichkeit, dass uter (uabhägige) Versuche geau k mal Ereigis A auftritt Kurzbezeichugsweise (sprich X verteilt wie/ach Biomialverteilug): X ~ B(,p) 9

Gauß- oder Normalverteilug N(µ, ) Wird eideutig festgelegt durch: µ Mittelwert i der GG Variaz i der GG - ierhalb der Etferug vo Stadardabweichug ach rechts ud liks vom Mittelwert µ befide sich 68,6% der Messwerte - ierhalb der Etferug vo Stadardabweichuge ach rechts ud liks vom Mittelwert µ befide sich 95,45% der Messwerte - ierhalb der Etferug vo 3 Stadardabweichuge ach rechts ud liks vom Mittelwert µ befide sich 99,73% der Messwerte Stadardisierte Normalverteilug N(0,) ist vertafelt µ=0 Stadardisierug eier beliebige Zufallsvariable X ~ N(µ, ) X µ = U wobei U ~ N(0,) Trasformatio der Stadardormalverteilug i eie beliebige Normalverteilug U ~ N(0,) U + µ ~ N(µ, ) Parameter i der Grudgesamtheit Zur Uterscheidug vo der Stichprobe werde die Parameter der Grudgesamtheit mit griechische Buchstabe bezeichet: µ Mittelwert i der Grudgesamtheit σ Streuug i der Grudgesamtheit π Prozetsatz i der Grudgesamtheit 0

Kofidezitervalle -α Sicherheits- oder Vertraueswahrscheilichkeit üblich: 99%, 95%, 90% α Irrtumswahrscheilichkeit üblich: %, 5%, 0% Werte aus der N(0,)-Tafel u α/ -α α/ α/ 0 -u α/ u α/ Kofidezitervall für eie ubekate Mittelwert µ eier Grudgesamtheit s P( x - u α/ µ x + u α/ s ) = -α Beispiel für 95%-ige Sicherheitswahrscheilichkeit: s s P( x -,96 µ x +,96 ) = 95% Soderregel: Umfasst die Stichprobe mehr als 5% der Grudgesamtheit (große Stichprobe), beutze s s N statt besser N Kofidezitervall für eie ubekate Proportio eier Grudgesamtheit P(p - u α/ p ( p) p ( p) π p + u α/ ) = -α Voraussetzug: p 5 we p 0,5 (-p) 5 we p > 0,5 Beispiel für 95%-ige Sicherheitswahrscheilichkeit: p ( p) p ( p) P(p,96 π p +,96 ) = 95% Soderregel: Umfasst die Stichprobe mehr als 5% der Grudgesamtheit ( große Stichprobe), beutze p ( p) p ( p) N statt besser N

Fallzahlbestimmug Bestimmug des erforderliche (Midest-) Stichprobeumfags bei Schätzug eies (prozetuale) Ateils u p (- p) e die erforderliche Midestfallzahl -α bzw. α Sicherheits- bzw. Irrtumswahrscheilichkeit u α/ p e aus Tabelle vo N(0,) Erfahrugswert für ugefähre Größeordug des %-Ateils existiert kei Wert, setze p=0,5 Exaktheit Abstad zwische Stichprobeschätzug p ud wahrem π der Grudgesamtheit e= p Bestimmug der erforderliche (Midest-)Fallzahl bei der Schätzug eies (ubekate) Mittelwertes µ u a ˆ e erforderliche Midestfallzahl -α bzw. α Sicherheits- bzw. Irrtumswahrscheilichkeit e Exaktheit e= x Uterschied zwische Stichprobemittelwert x ud wahrem µ der Grudgesamtheit ˆ Schätzug der Variaz des betrachtete stetige Merkmals falls keie Schätzug existiert, bereche s = ( x i x) i=

A Additiossatz 7 Allgemeier Additiossatz 7 Allgemeier Multiplikatiossatz 8 Aalytische Statistik Defiitio 4 Aalytische Statistik 7 Arithmetisches Mittel 7 B Balkediagramm 5 Bedigte Wahrscheilichkeit 8 Biomialkoeffiziet 9 Biomialverteilug 9 Box-Plot 6 D Deskriptive Statistik Defiitio 4 Deskriptive Statistik 7 Diagramme 5 Diskrete Variable 6 E Ereigisraum 7 F Fakultät 9 Fallzahlbestimmug G Gaußverteilug 8 Geometrisches Mittel 7 Grafike 5 Grudbegriffe der Statistik 5 Grudgesamtheit 5 H Häufigkeite Häufigkeitstabelle Histogramm 6 Ihaltsverzeichis I K Klassebildug 4 Kombiatorik 9 Kofidezitervalle Kreisdiagramm 5 Kreuztabelle 3 M Media 9 Merkmal 5 Merkmalsauspräguge 6 Merkmalsträger 5 Mittelwerte 7 f Modus 9 Multiplikatiossatz 8 N Nomiale Variable 6 Normalverteilug 0 O Ordiale Variable 6 P Parameter i der Grudgesamtheit 8 Q Quatitative Merkmale 6 Quatitative Merkmale 6 Quartile Quartilsabstad S Schätzug des arithmetische Mittels für klassierte Merkmale 8 Spaweite 0 Spezieller Additiossatz 7 Spezieller Multiplikatiossatz 8 Stabdiagramm 5 Stadardabeichug 0 Stadardisierte Normalverteilug 0 Stem & Leaf 5 Stetige / metrische Variable 6 Stichprobe 5 Stichprobeumfags Stochastische (U-)Abhägigkeit 8 Streuugsmaße 0 T Trasformatio der Stadardormalverteilug0 U Urliste 5 V Variaz 0 Variatioskoeffiziet Verlaufskurve 6 Verteilugsfuktio 9 Vollerhebug 5 W Wahrscheilichkeit 7 Wahrscheilichkeitsrechug 7 Wahrscheilichkeitsverteiluge 9 Z Zufallsvariable 0 3