Statistische Datenanalyse und Versuchsplanung



Ähnliche Dokumente
Wissenschaftliches Arbeiten Studiengang Energiewirtschaft

Statistik Einführung // Konfidenzintervalle für einen Parameter 7 p.2/39

15.4 Diskrete Zufallsvariablen

3. Einführung in die Statistik

h i Deskriptive Statistik 1-dimensionale Daten Daten und Häufigkeiten Seite 1 Nominal Ordinal Metrisch (Kardinal) Metrisch - klassiert

n 1,n 2,n 3,...,n k in der Stichprobe auftreten. Für die absolute Häufigkeit können wir auch die relative Häufigkeit einsetzen:

Statistik I/Empirie I

Auch im Risikofall ist das Entscheidungsproblem gelöst, wenn eine dominante Aktion in A existiert.

Statistische Maßzahlen. Statistik Vorlesung, 10. März, Beispiel. Der Median. Beispiel. Der Median für klassifizierte Werte.

2 Vollständige Induktion

Innerbetriebliche Leistungsverrechnung

Statistik mit Excel Themen-Special. Peter Wies. 1. Ausgabe, Februar 2014 W-EX2013S

BINOMIALKOEFFIZIENTEN. Stochastik und ihre Didaktik Referentin: Iris Winkler

Übungen zur Vorlesung Funktionentheorie Sommersemester Musterlösung zu Blatt 0

Lerneinheit 2: Grundlagen der Investition und Finanzierung

Formelsammlung. zur Klausur. Beschreibende Statistik

Korrekturrichtlinie zur Studienleistung Wirtschaftsmathematik am Betriebswirtschaft BB-WMT-S

Allgemeine Lösungen der n-dimensionalen Laplace-Gleichung und ihre komplexe Variable

Formelsammlung Mathematik

Aufgaben und Lösungen der Probeklausur zur Analysis I

2. Diophantische Gleichungen

Ausgangspunkt: Über einen endlichen Zeitraum wird aus einem Kapital (Rentenbarwert RBW v n,i

Evaluierung einer Schulungsmaßnahme: Punktezahl vor der Schulung Punktezahl nach der Schulung. Autoritarismusscore vor/nach Projekt

Versicherungstechnik

Arbeitsplätze in SAP R/3 Modul PP

Kapitel 6: Statistische Qualitätskontrolle

... a ik) i=1...m, k=1...n A = = ( a mn

Empirische Methoden I

KUNDENPROFIL FÜR GELDANLAGEN

6 Vergleich mehrerer unverbundener Stichproben

Stochastik für WiWi - Klausurvorbereitung

Kleines Matrix-ABC. Fachgebiet Regelungstechnik Leiter: Prof. Dr.-Ing. Johann Reger. 1 Elementares

Variiert man zusätzlich noch die Saatstärke (z.b. 3 Stärkearten), würde man von einer zweifaktoriellen Varianzanalyse sprechen.

Gliederung. Value-at-Risk

Testumfang für die Ermittlung und Angabe von Fehlerraten in biometrischen Systemen

Kapitel XI - Korrelationsrechnung

Statistik. Prof. Dr. K. Melzer.

Statistische Formelsammlung Begleitende Materialien zur Statistik - Vorlesung des Grundstudiums im Fachbereich IK

Stichproben im Rechnungswesen, Stichprobeninventur

Vl Statistische Prozess und Qualitätskontrolle und Versuchsplanung Übung 3

Die Gasgesetze. Die Beziehung zwischen Volumen und Temperatur (Gesetz von J.-L. und J. Charles): Gay-Lussac

Kryptologie: Kryptographie und Kryptoanalyse Kryptologie ist die Wissenschaft, die sich mit dem Ver- und Entschlüsseln von Informationen befasst.

Beschreibende Statistik Kenngrößen in der Übersicht (Ac)

Parameter von Häufigkeitsverteilungen

Finanzmathematische Formeln und Tabellen

Weitere Lagemaße: Quantile/Perzentile I

Lösungen der Aufgaben zur Vorbereitung auf die Klausur Mathematik für Informatiker I

Vl Statistische Prozess- und Qualitätskontrolle und Versuchsplanung Übung 5

Der natürliche Werkstoff Holz - Statistische Betrachtungen zum uniaxialen Zugversuch am Beispiel von Furnier

s xy x i x y i y s xy = 1 n i=1 y 2 i=1 x 2 s 1 n x n i Streudiagramme empirische Kovarianz x=5,5 y=7,5

Nachklausur - Analysis 1 - Lösungen

Es werden 120 Schüler befragt, ob sie ein Handy besitzen. Das Ergebnis der Umfrage lautet: Von 120 Schülern besitzen 99 ein Handy.

Behandlung von Messunsicherheiten (Fehlerrechnung)

1 Analysis T1 Übungsblatt 1

Kapitel 6: Quadratisches Wachstum

Statistik Einführung // Beschreibende Statistik 2 p.2/61

VAIO-Link Kundenservice Broschüre

Univariate Verteilungen

h i :=h a i f i = h a i n Absolute Häufigkeit: Relative Häufigkeit: h 2 h 4 h 6 :=h der Elemente mit der Ausprägung i=6 zu der Anzahl n aller Werte

2.2.1 Lagemaße. Exkurs: Quantile. und n. p n

SUCHPROBLEME UND ALPHABETISCHE CODES

Übungsblatt 1 zur Vorlesung Angewandte Stochastik

Wahrscheinlichkeit & Statistik

Qualitätskennzahlen für IT-Verfahren in der öffentlichen Verwaltung Lösungsansätze zur Beschreibung von Metriken nach V-Modell XT

AUFGABENSTELLUNG (ZUSAMMENFASSUNG) 2 SPEZIFIKATION 2. Datenfluß und Programmablauf 2. Vorbedingung 3. Nachbedingung 3. Schleifeninvariante 3

Prof. Dr.-Ing. Bernd Kochendörfer. Bauwirtschaft und Baubetrieb. Investitionsrechnung

Beurteilung des Businessplans zur Tragfähigkeitsbescheinigung

Wirksamkeit, Effizienz

3. Tilgungsrechnung Tilgungsarten

So lösen Sie die Gleichung für den Korrelationskoeffizienten

Prof. Dr. Roland Füss Statistik II SS 2008

Medienzentrum. Bibliothek. Handreichung zur Literatursuche

Inhaltsverzeichnis Office Excel Themen-Special: Statistik I

Vorlesung Informationssysteme

Empirische Verteilungsfunktion

Kapitel 4.1: Dr. Jörg Franke. Technische Universität Dortmund. Sommersemester 2011

Weitere Lagemaße: Quantile/Perzentile II. Weitere Lagemaße: Quantile/Perzentile I. Weitere Lagemaße: Quantile/Perzentile IV

Zur Definition. der wirksamen. Wärmespeicherkapazität

LOHN Betriebswirtschaftliche Planung & Controlling

( ), der genau auf der Geraden ( ) 2 ( ) #( ) 8. Lineare Regression. = f i. Nach der Summe der kleinsten. mx i

Institut für Stochastik Prof. Dr. N. Bäuerle Dipl.-Math. S. Urban

Ulrich Stein Fehlerrechnung

Zahlenfolgen, Grenzwerte und Zahlenreihen

7.2 Grundlagen der Wahrscheinlichkeitsrechnung

Umrechnung einer tatsächlichen Häufigkeitsverteilung in eine prozentuale Häufigkeitsverteilung

Kapitel 4: Stationäre Prozesse

e) ( 4a + 8b + 9a + 18b ) : a + 2b f) 2 log (x) + 3 log (2y) 0.5 log (z)

Kapitel 5: Schließende Statistik

Elementare Wahrscheinlichkeitsrechnung und Statistik

Sind Sie mit unserem Angebot zufrieden? ja nein weiß nicht

GIBS. Übungsaufgaben zur Vertiefung. V1. Beschriften Sie die Konstruktionen! n n n n ' ' ' ' Modul 1.5. Geometrische Optik 1 58.

Reader Teil 1: Beschreibende Statistik

Absolutskala: metrische Skala mit einem natürlichen Nullpunkt und einer natürlichen Einheit. (Z.B. Einwohnerzahl). Nicht alle Variablen lassen sich

SBP Mathe Aufbaukurs 1. Absolute und relative Häufigkeit. Das arithmetische Mittel und seine Eigenschaften. Das arithmetische Mittel und Häufigkeit

(a) Richtig, die Varianz ist eine Summe quadratischer Größen.

Statistik I Vorlesungsskript

h a 2 b 1 h a1 b 2 h a1 b 1 h a1. h a 2. h.b1 h ij h 11 h 12 h 21 a b h. j h 1. h 2. h.1 a b h i. =h i1 h i2... h i m h. j =h 1j h 2j... h k j h.

Gruppe 108: Janina Bär Christian Hörr Robert Rex

14 Statistische Beziehungen zwischen nomi nalen Merkmalen

Flexibilität beim Lagern und Kommissionieren: Schienengeführte Regalbediengeräte

Transkript:

Statistische Dateaalyse ud Versuchsplaug Wahlpflicht für Studete der Biotechologie SWS IV (VL/Ü/PR) Abschluss: Übugsote U. Römisch http:// www.lmtc.tu-berli.de/agewadte_statistik_ud_cosultig

LITERATUR zur Lehrverastaltug Statistische Dateaalyse ud Versuchsplaug // Autorekollektiv (004): Eiführug i die Biometrie. Richter, Ch.: - Grudbegriffe ud Dateaalyse Sumpf, D. ud E. Moll: - Schätze eies Parameters ud Vergleich vo bis zu zwei Parameter Schumacher, E.: 3- Vergleich vo mehr als zwei Parameter Rasch, D. ud R. Verdoore: 4- Grudlage der Korrelatios- ud Regressiosaalyse.. Aufl., Saphir- Verl. Ribbesbüttel // Bärlocher, F. (008): Biostatistik.. Aufl., Thieme Verl. Stuttgart /3/ Bortz, J., G. A. Lieert u. K. Boehke (990): Verteilugsfreie Methode i der Biostatistik. Spriger- Verl. Berli /4/ Fahrmeir, L., R. Küstler, I. Pigeot u. G. Tutz (004): Statistik- Der Weg zur Dateaalyse. 5. Aufl., Spriger- Verl. Berli

/5/ Hartug, J. u. a. (989): Statistik. Lehr- ud Hadbuch der agewadte Statistik. 7. Aufl., Oldebourg Verl. Müche /6/ Klei, Berd (007): Versuchsplaug- DoE. Eiführug i die Taguchi/Shaii- Methodik.. Aufl. Oldebourg Verl. Müche /7/ Kleppma, W. (006): Taschebuch Versuchsplaug 4. Auflage Haser Verl. Müche /8/ Rudolf, M. u. W. Kuhlisch (008) Biostatistik- Eie Eiführug für Biowisseschaftler. Pearso Studium, Müche /9/ Stahel, W. (999): Statistische Dateaalyse - Eie Eiführug für Naturwisseschaftler.. Aufl., Vieweg Verl. Brauschweig/ Wiesbade /0/ Timischl, W. (000) Biostatistik- Eie Eiführug für Biologe ud Medizier.. Aufl., Spriger Verl. Berli

Ihaltsverzeichis EINLEITUNG. Was versteht ma uter Statistik, Biometrie, Chemometrie, Ökoometrie ud Techometrie ud stat. Versuchsplaug?. Wie lügt ma mit Statistik? Umfrage Mittelwert- ud Streuugsmaße Grafike

Teil I: Statistische Dateaalyse. Beschreibede ud explorative Methode. Charakterisierug vo Merkmale. Grudgesamtheit ud Stichprobe.3 Die Häufigkeitsverteilug diskreter ud stetiger eidim. Merkmale - absolute u. relative Häufigkeite ud ihre grafische Darstellug, empirische Verteilugsfuktio.4 Lage- ud Streuugsmaße, Schiefe ud Exzeß - arithm. Mittel, Media, gestutztes Mittel, Modalwert, geometrisches Mittel, α- Quatil

- Spaweite, Mediaabstad, Quartilsabstad, Variaz, Stadardabweichug, Stadardfehler des arithm. Mittelwertes, Variatioskoeffiziet, Box- ud Whisker Plots - zufällige ud systematische Fehler - Schiefe ud Exzess.5. Zweidimesioale Merkmale - grafische Darstellug (XY-Scatterplot) - -dim. Häufigkeitsverteilug - Zusammehagsmaße (Maß- ud Ragkorrelatioskoeffiziet) - lieare Regressio (eif. ud multiple lieare Regressio)

. Wahrscheilichkeitsrechug. Zufälliges Ereigis, Wahrscheilichkeit, Zufallsgröße. Parameter vo Verteiluge (Erwartugswert u. Variaz).3 Normalverteilug.4 Prüfverteiluge (χ -, t- u. F- Verteilug) 3. Schließede Methode 3. Puktschätzuge, Kofidezitervalle 3. Statistische Tests 3. Variazaalyse

Teil : Statistische Versuchsplaug 4. Eiführug i die stat. Versuchsplaug 4. Arte statistischer Versuchspläe - Faktorielle Versuchspläe. Ordug k ud k- - Zetral zusammegesetzte Versuchspläe - Mischugspläe 4. Beispiele zu stat. Versuchspläe - Herstellug eies chemische Produktes - Etwicklug eies glutefreie ud ballaststoffagereicherte Gebäckes mit optimale Eigeschafte I eier Übug am PC werde mit eiem Statistikprogramm kokrete Datesätze ausgewertet.

EINLEITUNG. Was ist Statistik? (Biometrie, Techometrie, Ökoometrie) Statistik ist die Wisseschaft des Sammels, Aalysieres ud Iterpretieres vo Date. Sie beatwortet die Frage:. Wie gewit ma welche Date?. Wie ka ma Date beschreibe? ud 3. Welche Schlüsse ka ma aus Date ziehe? Teilgebiete: Beschreibede Statistik Wahrscheilichkeitstheorie Stat. DA Stochastik Schließede Statistik Stat. VP

. Wie lügt ma mit Statistik? Bsp. : Wir lebe im Zeitalter der Umfrage! Bsp. : Mittelwert- ud Streuugsmaße Bsp. 3: Vorsicht bei Grafike!

.Teil: Statistische Dateaalyse. Beschreibede Methode s. // Stahel

Die Beschreibede ud explorative Statistik diet der Beschreibug, Strukturierug ud Verdichtug umfagreiche Datematerials. Wie erhält ma u Date ud welcher Art sid die Date? Erhebuge ud Versuche Ziel: Ketisse über die Eigeschafte bestimmter Objekte (z.b. Alage, Messmethode, Weiprobe, Hefestämme) oder Idividue (z.b. Persoe, Tiere, Pflaze) zu erhalte Erhebuge Ist-Stadsaalyse Versuche - Vergleich vo Gruppe - Utersuchug vo Zusammehäge zwische Merkmale

.. Charakterisierug vo Merkmale Die Objekte/ Idividue, a dee Beobachtuge vorgeomme werde, heiße Beobachtugseiheite (Merkmalsträger). Dabei ist kei Objekt/ Idividuum mit eiem adere idetisch. Diese Uterschiedlichkeit et ma Variabilität. Die Variabilität biologischer Objekte/ Idividue ist häufig geetisch oder umweltbedigt. - Die Größe oder Eigeschafte, auf die sich die Beobachtuge beziehe, heiße Merkmale. - Jedes Objekt/ Idividuum ist durch eie spezielle Merkmalsausprägug gekezeichet. - Alle beobachtete Werte eies Merkmals heiße Merkmalswerte.

Klassifizierug vo Merkmale. Merkmale Qualitative Merkmale Quatitative Merkmale. (Uterscheidug durch Art) Bsp.: Geschlecht, Rasse, Sorte, Lad, Hefestamm, Aroma Merkmale (Uterscheidug durch Größe) Bsp.: Alter, Gewicht, Masse, Läge, Volume, Eikomme, Wasser- u. Lufttemperatur, Kozetratio, Zellzahl Diskrete Merkmale (edlich viele oder abzählbar uedlich viele Merkmalsauspräguge) Bsp.: Geschlecht, Rasse, Sorte, Lad, Hefestamm, Aroma, Zellzahl Stetige Merkmale (überabzählbar uedlich viele Auspräguge, d.h. Werte im reelle Zahleitervall) Bsp.: Alter, Gewicht, Masse,

3. Merkmale Nomialskalierte Merkmale (Skala mit iedrigstem Niveau, keie Vergleichbarkeit oder Ragfolge zwische de Werte) Bsp.: Geschlecht, Rasse, Sorte, Lad, Hefestamm, Aroma Ordialskalierte Merkmale (Skala mit höherem Niveau, Werte uterscheide sich i ihrer Itesität, ermögliche eie Ragfolgeordug, jedoch keie Iterpretatio der Abstäde zwische de Räge) Bsp.: Aroma, Härtegrad, sesor. Parameter, Zesure Metrisch skalierte Merkmale (Skala mit höchstem Niveau, Abstäde zwische de Werte sid iterpretierbar) Bsp.: Alter, Gewicht, Masse, Läge, Volume, Eikomme, Wasser- u. Lufttemperatur, Zellzahl, Kozetratio, Itervallskala Proportiosskala

.. Grudgesamtheit ud Stichprobe Date ka ma durch Befragug vo Persoe (Erhebuge) oder durch Experimete (Messuge) gewie. Experimete Passive Experimete Alle Beobachtugswerte ergebe sich zufällig währed des Versuches! Aktive Experimete Aktive Plaug der Experimete vor dere Durchführug, Plaug der Versuchsbediguge Kombiierte Experimete Awedug der Methode der statistische Versuchsplaug (SVP)!

Methode der statistische Versuchsplaug Ziel: Erziele vo Ergebisse mit ausreicheder Sicherheit ud Geauigkeit bei miimaler Azahl vo Versuche Problem Plaug 3 (4) Versuchsetappe: Durchführug Auswertug

Bsp.: Herstellug eier Chemikalie Mittelwerte der Ausbeute mit Kofidezitervall 68,0 (66,48,69,55) 55,387 (53,85,56,9) (+++) 6,387 (60,85,63,9) Katalysator 54,0 (5,48,55,55) 68,887 (67,35,70,4) 56, (54,58,57,65) 6,83 (60,8,63,35) Zeit 53,87 (5,75,54,8) (- - -) Temperatur

Def.: Die Mege aller mögliche Werte eies Merkmals et ma Grudgesamtheit. Eie edliche Teilmege der Grudgesamtheit et ma Stichprobe. Besteht die Teilmege aus Elemete, so heißt Stichprobeumfag. Def.: Der Gesamtheit der Merkmalswerte etspricht eideutig eie Gesamtheit vo Beobachtugseiheite (Merkmalsträger), die ma ebefalls als Grudgesamtheit oder Populatio bezeichet. Die Grudgesamtheit muss bei jeder Aufgabestellug festgelegt werde! Eie Grudgesamtheit ka auch uedlich viele Elemete ethalte, de theoretisch köe wir de Versuch uedlich oft wiederhole.

Mathematische Statistik Beschreibede Statistik Schließede Statistik Wahrscheilichkeitsrechug Iduktiosschluss Stichprobe Grudgesamtheit Deduktiosschluss

Was ist bei eier Stichprobeetahme zu beachte? Die Stichprobeauswahl muss so erfolge, dass die Stichprobe die Grudgesamtheit repräsetiert!. Zufälligkeit der Stichprobe. Vermeide systematischer Fehler 3. Umfag der Stichprobe Optimaler Stichprobeumfag ist abhägig vo : - zeitliche, arbeitstechische ud fiazielle Faktore - Wahl des statistische Modells - Geauigkeit der Ergebisse - Umfag der Grudgesamtheit 4. Homogeität ud gleiche Geauigkeit 5. Vergleichbarkeit

.3. Die Häufigkeitsverteilug diskreter ud stetiger eidim. Merkmale Bei eiem Versuch wird a Beobachtugseiheite ei Merkmal X beobachtet, d.h. a jeder Eiheit wird die Ausprägug dieses Merkmals festgestellt. Sid a,...,a m die mögliche Auspräguge des Merkmals X, so wird also der i-te Beobachtugseiheit (i=,...) seie Ausprägug a j als Merkmalswert x i zugeordet: x i = a j (i) Merkmalswert Beobachtugseiheit Ausprägug

Schritte der Dateerfassug ud -aufbereitug:. Schritt: Erfassug der Date eies oder mehrerer Merkmale Stichprobe (ugeordete Urliste): Merkmalswerte x,...,x Variatiosreihe (geordete Urliste): x (),...,x (), wobei x ()... x () Skalierug der Auspräguge: a,,a m

Bsp.: Weidate Nr. i Lad L Art A Rebsorte R Histamigehalt H [mg/l] Butadiolgehalt B [g/l] l a r h b 7 l 7 = 5 a 7 = r 7 = h 7 = 0,4 b 7 = 0,49 l a r h b Skalierug: Lad: l i = = Deutschlad = Bulgarie 3 = Österreich 4 = Frakreich 5 = Australie Art: a i = = Rotwei = Weißwei 3 = Roséwei Rebsorte: r i = = Caberet Sauvigo = Chardoay 3 = Merlot 4 = Rieslig

. Schritt: Ermittlug der abs. ud rel. Häufigkeite.. (Primäre) Häufigkeitsverteilug (HV) bei diskrete Merkmale Def.: Beobachtet ma a Beobachtugseiheite ei Merkmal X, das i m Auspräguge a,...,a m vorkommt, so heißt f (a j ) = "Azahl der Fälle, i dee a j auftritt" für j=,...,m absolute Häufigkeit der Ausprägug a j. Bem.: -Σf (a j ) = - Die abs. Häufigkeite häge vom Stichprobeumfag ab

Def.: Die relative Häufigkeit h (a j ) = (/) f (a j ) für j=,...,m gibt de Ateil der Beobachtugseiheite bezoge auf a, die die Ausprägug a j habe. Bem.: -Σh (a j ) = - 0 h (a j ) - Die Folge der relative Häufigkeite h (a ),...,h (a m ) heißt rel. Häufigkeitsverteilug des Merkmals X... (Sekudäre) Häufigkeitsverteilug (HV) bei stetige Merkmale (mit Klassebildug) - Da stetige Merkmale i sehr viele Auspräguge auftrete, fasst ma verschiedee Auspräguge i Klasse zusamme.

- Ma zerlegt das Itervall, i dem alle Beobachtugswerte liege i m Klasse: mit de Klassegreze: y j- ud y j ud de Klassemitte: x j = (y j- +y j ) / K,...,K m mit K j = (y j- ; y j ] ; j=,...,m - Die Azahl der Klasse wählt ma häufig m (oder 5 m 0), wobei der Stichprobeumfag ist. - Der Abstad d =y j - y j- für j=,...,m heißt Klassebreite. (äquidistate Klasse) Bem.: Durch die Agabe der utere Afagsklassegreze y 0 ud die Klassebreite d oder durch y 0, y m ud m wird eie Klasseeiteilug eideutig bestimmt.

Def.: Als absolute Klassehäufigkeit bezeichet ma f (x j ) = "Azahl der Beobachtugswerte i der j- te Klasse mit der Klassemitte x j " (j=,...,m) Def.: Als relative Klassehäufigkeit bezeichet ma h (x j ) = (/) f (x j ) Bem.: Die Folge der relative Häufigkeite h (x ),...,h (x m ) heißt rel. Häufigkeitsverteilug des stet. Merkmals X.

3. Schritt: Grafische Darstelluge - Stabdiagramm (Strecke- oder Liiediagramm) über jeder Ausprägug auf der Abszisse wird die zugehörige Häufigkeit als sekrechte Strecke abgetrage, besoders für diskrete Merkmale geeiget, z.b.: Azahl der Stillstäde eier Alage, Aromastufe, Hefestämme, Schrotarte - Häufigkeitspolygo erhält ma durch Verbidug der Edpukte der Strecke des Stabdiagramms, besoders zur Darstellug zeitlicher Verläufe geeiget, z.b.: moatliche Etwicklug der Arbeitslosezahle h (a j ) h (a j ) a... a... a j a j

- Histogramm Häufigkeite werde als aeiaderstoßede Rechtecke dargestellt, dere Fläche proportioal de Häufigkeite sid, besoders für stetige Merkmale geeiget h (x j ) x y y 0 x j - Flächediagramme, z.b.: Kreisdiagramme Häufigkeite werde durch Fläche repräsetiert, zur Strukturdarstellug geeiget, z.b.: Azahl der Beschäftigte i verschiedee Wirtschaftszweige, Wahlergebisse 57% 3% 3% 7%

4. Schritt: Ermittlug der empirische Verteilugsfuktio 4.. (Primäre) Häufigkeitsverteilug bei diskrete Merkmale (ohe Klassebildug) Def.: Die absolute Summehäufigkeit der j- te Ausprägug a j ist die Azahl der Beobachtugseiheite, bei dee eie Ausprägug a j beobachtet wurde, d.h. j f (a ) +... + f (a j ) = f (ak ) ; j=,...,m k= Def.: Die relative Summehäufigkeit der j- te Ausprägug gibt de Ateil der Beobachtugseiheite a, bei dee eie Ausprägug a j beobachtet wurde, d.h. j h (a ) +... + h (a j ) = h (ak ) ; j=,,m k=

Durch die Folge der relative Summehäufigkeite wird die empirische Verteilugsfuktio des Merkmals X bestimmt. Def.: Die empirische Verteilugsfuktio des Merkmals X ist eie Fuktio über dem Bereich der reelle Zahle R Fˆ (x) (x R) 0 ; x< a j = h(ak ) ; a j x< a j+ k= ; x a m j =,...,m

Bem.: Die empirische Verteilugsfuktio ist auf jedem Itervall [a j,a j+ ) kostat ud sprigt bei a j+ um de Wert h (a j+ ) ach obe. Die erste Sprugstelle liegt bei der kleiste, die letzte bei der größte beobachtete Merkmalsausprägug. Fˆ(x) h (a )+ h (a ) h (a ) a a Auspräguge x

4.. (Sekudäre) Häufigkeitsverteilug (HV) bei stetige Merkmale (mit Klassebildug) Def.: Die absolute Klassesummehäufigkeit der j- te Klasse ist die Azahl der Beobachtugswerte, die i eier Klasse mit eier Klassemitte x j liege, d.h. f (x ) +... + f (x j ) = j k= j f k= (xk ) Def.: Die relative Klassesummehäufigkeit der j- te Klasse gibt de Ateil der Beobachtugswerte a, die i eier Klasse mit der Klassemitte x j liege, d.h. h (x ) +... + h (x j ) = h (xk ) ; j=,...,m ; j=,...,m Durch die Folge der relative Klassesummehäufigkeite wird die empirische Verteilugsfuktio vo X bestimmt!

Def.: Die empirische Verteilugsfuktio des Merkmals X, dere Beobachtugswerte i Klasse vorliege, hat folgede Gestalt: Fˆ (x) 0 j = h(xk ) ; x j x< x j+ k= ; ; x x < x x m j =,...,m Bem.: Die empirische Verteilugsfuktio a der Stelle x ist die Summe der relative Häufigkeite aller Klasse, dere Mitte x j x sid. Als Sprugstelle werde jetzt die Klassemitte verwedet.

Bsp.: Weidate- stet. Merkmal Butadiolgehalt Sekudäre Verteilugstabelle (y 0 = 0 ; d = 0,5): Kl.Nr. Kl.greze Kl.mitte abs.häuf. rel.häuf. abs.k.s.h. rel.k.s.h. j (y j- ; y j ] x j f (x j ) h (x j ) ------------------------------------------------------------------------------------------------------ 0 (- ; 0] (0 ; 0,5] 0,5 f h f h (0,5 ; 0,50] 0,375 f h f +f h +h M M M M 7 (,50 ;,75],65 f 7 h 7 (,75 ; ) j=,.m

Bem.: Die empirische Verteilugsfuktio ist auf jedem Itervall [x j,x j+ ) kostat ud sprigt bei x j+ um de Wert h (x j+ ) ach obe. Die erste Sprugstelle liegt bei der kleiste, die letzte bei der größte Klassemitte. Fˆ(x) h (x )+ h (x ) h (x ) x x Klassemitte x

Bsp.: Koloie vo Mikroorgaisme (s. /9/) Aufgabe: Utersuchug der Eigeschafte vo Mikroorgaisme i der Luft Versuch: Nährbode auf Agarplatte wurde 30 mi. bei Zimmertemperatur offe im Raum stehe gelasse, ach Ikubatio über 3 Tage ware 40 Pilz- bzw. Bakteriekoloie gewachse, vo dee der Durchmesser, die Atibiotikaresistez, sowie die Farbe bestimmt wurde.. Frage: Wie ka ma die Verteilug der Merkmale beschreibe? Uterscheide sich die Verteiluge der Durchmesser zwische de Koloie uterschiedlicher Farbe?

. Schritt: Dateerfassug ud Merkmalsklassifizierug X: Durchmesser [mm] quatitativ, stetig, metrisch skaliert Y: Atibiotikaresistez [-] qualitativ, diskret, ordial skaliert Auspräguge: - sehr sesitiv, - sesitiv, 3- itermediär, 4- resistet, 5- sehr resistet Z: Farbe [-] qualitativ, diskret, omial skaliert Auspräguge: - gelb, - weißlich, 3- brau, 4- orage, 5- farblos, 6- rosa, 7- grü

. Schritt: Erfassug der Date (Stichprobe) Nr. i Durchmesser x i Resistez y i y i cod Farbe z i z i cod 0,5 sehr sesitiv gelb 4, sesitiv gelb 4, resistet 4 weißlich 8 0, sehr sesitiv orage 4 9,5 sesitiv orage 4 30,8 itermediär 3 farblos 5 34 4, resistet 4 rosa 6 38 0, sehr sesitiv brau 3 39 3,3 itermediär 3 grü 7 40 4, itermediär 3 grü 7

3. Schritt: Bestimmug der empir. Häufigkeitsverteilug Merkmal X: Durchmesser Frequecy Tabulatio for Durchmesser -------------------------------------------------------------------------------- Lower Upper Relative Cumulative Cum. Rel. Class Limit Limit Midpoit Frequecy Frequecy Frequecy Frequecy -------------------------------------------------------------------------------- at or below 0,0 0 0,0000 0 0,0000 0,0,0,0 3 0,0750 3 0,0750,0 4,0 3,0 7 0,750 0 0,500 3 4,0 6,0 5,0 0 0,500 0 0,5000 4 6,0 8,0 7,0 0 0,500 30 0,7500 5 8,0 0,0 9,0 7 0,750 37 0,950 6 0,0,0,0 3 0,0750 40,0000 above,0 0 0,0000 40,0000 -------------------------------------------------------------------------------- Histogram (abs. frequecies) Histogram (rel. cumulative frequecies) Box-ad-Whisker Plot 0 00 frequecy 8 6 4 percetage [%] 80 60 40 0 Durchmesser 0 8 6 4 0 0 4 6 8 0 Durchmesser 0 0 4 6 8 0 Durchmesser 0

Merkmal Y: Atibiotikaresistez Frequecy Table for Atibiotikaresistez (Auspräguge hier icht codiert!) ------------------------------------------------------------------------ Relative Cumulative Cum. Rel. Class Value Frequecy Frequecy Frequecy Frequecy ------------------------------------------------------------------------ itermediär 8 0,000 8 0,000 resistet 6 0,500 4 0,3500 3 sehr resistet 4 0,000 8 0,4500 4 sehr sesitiv 3 0,350 3 0,7750 5 sesitiv 9 0,50 40,0000 ------------------------------------------------------------------------ 5 Barchart for Atibiotikaresistez frequecy 9 6 3 Piechart for Atibiotikaresistez 0 itermediär resistet sehr resistet sehr sesitiv sesitiv,50% 0,00% Kategorie weise hier keie Ordug auf! 3,50% 5,00% Atibiotikaresistez itermediär resistet 0,00% sehr resistet sehr sesitiv sesitiv

Merkmal Y: Atibiotikaresistez Frequecy Tabulatio for Atibiotikaresistez_ (Auspräguge hier umerisch codiert!) Auspräguge -------------------------------------------------------------------------------- Lower Upper Relative Cumulative Cum. Rel. Class Limit Limit Midpoit Frequecy Frequecy Frequecy Frequecy -------------------------------------------------------------------------------- at or below 0,5 0 0,0000 0 0,0000 0,5,5,0 3 0,350 3 0,350,5,5,0 9 0,50 0,5500 3,5 3,5 3,0 8 0,000 30 0,7500 4 3,5 4,5 4,0 6 0,500 36 0,9000 5 4,5 5,5 5,0 4 0,000 40,0000 above 5,5 0 0,0000 40,0000 -------------------------------------------------------------------------------- 5 Histogram Ordug zwische de Kategorie frequecy 9 6 3 3 Dot Diagram 0 0 3 4 5 6 Atibiotikaresistez_ Frequecy 0 0 3 4 5 Atibiotikaresistez_

Merkmal Z: Farbe (Auspräguge hier icht codiert!) Frequecy Table for Farbe ------------------------------------------------------------------------ Relative Cumulative Cum. Rel. Class Value Frequecy Frequecy Frequecy Frequecy ------------------------------------------------------------------------ brau 0,050 0,050 farblos 4 0,000 5 0,50 3 gelb 3 0,350 8 0,4500 4 grü 0,0500 0 0,5000 5 orage 0,0500 0,5500 6 rosa 4 0,000 6 0,6500 7 weißlich 4 0,3500 40,0000 ------------------------------------------------------------------------ 5 Barchart for Farbe Kategorie weise keie Ordug auf! frequecy 9 6 3 35,00% Piechart for Farbe,50% 0,00% 0 brau farblos gelb grü orage rosa weißlich 0,00% 5,00% 5,00% 3,50% Farbe brau farblos gelb grü orage rosa weißlich

Vergleich der rel. Häufigkeitsverteiluge der Durchmesser zwische de Koloie uterschiedlicher Farbe percetage 40 30 0 0 Histogram 0 0 4 6 8 0 Durchmesser der gelbe Koloie percetage 30 5 0 5 0 Histogram 5 0 0 4 6 8 0 Durchmesser der weißliche Koloie Histogram 40 percetage 30 0 0 0-3 5 7 9 Durchmesser der sostige Koloie

. Frage: Wie ka ma mittels statistischer Maßzahle eie quatitative Vergleich der Häufigkeitsverteiluge vorehme? Wie uterscheide sich die mittlere Durchmesser zwische de Koloie uterschiedlicher Farbe, wie stark streue die Werte?.4 Lage- ud Streuugsmaße, Schiefe ud Exzeß.4. Lagemaße. Mittelwertmaße Mittelwertmaße gebe a, wo sich das Zetrum eier Häufigkeitsverteilug befidet.

Arithmetischer Mittelwert Seie x,...,x die Beobachtugswerte des Merkmals X x = i= x i Vorteile: - der arithm. Mittelwert eier Stichprobe ist ei uverzerrter Schätzwert für de Mittelwert eier ormalverteilte Grudgesamtheit ud gut geeiget bei eigipflige Häufigkeitsverteiluge - alle Iformatioe der Stichprobe werde ausgeschöpft Nachteile: - das arithm. Mittel ist ubrauchbar bei schiefe oder mehrgipflige Verteiluge - das arithm. Mittel ist icht robust gegeüber Ausreißer

Media (Zetralwert) - Der Media ist dadurch charakterisiert, dass jeweils 50 % der Beobachtugswerte eie Wert ud 50 % eie Wert dem Media habe. - Wir orde daher die Beobachtugswerte der Größe ach ud erhalte die Variatiosreihe x (),...,x () mit x ()... x () x~ 0,5 x (k+ ) = x + x (k) (k+ ) ; für ; für = k+ = k

Vorteile: - der Media ist auch bei asymmetrische ud mehrgipflige Verteiluge verwedbar - er ist zu bevorzuge bei ur weige Messwerte ud auch bei ordialskalierte Beobachtugsmerkmale - er ist robust gegeüber Ausreißer Nachteile: - es werde icht alle Iformatioe der Stichprobe ausgeschöpft (icht alle Messwerte gehe i die Berechug des Mediaes ei) - bei ormalverteilte Merkmale hat er schlechtere Schätzeigeschafte als das arithm. Mittel

Gestutztes Mittel - Wir orde wieder die Stichprobe der Größe ach ud streiche da die m uterste ud die m oberste Merkmalswerte. - Da erhält ma das (m/) 00 % - gestutzte Mittel, idem ma das arithmetische Mittel aus de verbleibede - m Merkmalswerte bildet. x m = (x(m+ ) +... + x( m) ) m Vorteil: - das gestutzte Mittel ist robust gegeüber Ausreißer ud basiert im Vergleich zum Media auf eier größere Azahl vo Werte Nachteil: - es besitzt bei Normalverteilug schlechtere Schätzeigeschafte als das arithm. Mittel ud schöpft icht alle Iformatioe der Stichprobe aus

Modalwert (Dichtemittel, Modus) Bei eigipflige Verteiluge gibt das Dichtemittel die Ausprägug mit der größte Häufigkeit i der Messreihe a. Bei klassierte Date (stet. Merkmale) gibt es die Klassemitte der Klasse mit der größte Klassehäufigkeit a. f (x mod ) f (a j ) a j j=,...,m Vorteile: - das Dichtemittel ist auch bei omial- ud ordialskalierte Merkmale awedbar - bei mehrgipflige Verteiluge gibt ma ebe dem Media auch die lokale Dichtemittel a - das Dichtemittel ist robust gegeüber Ausreißer Nachteile: - bei Normalverteilug hat das Dichtemittel schlechtere Eigeschafte als das arithm. Mittel - icht alle Beobachtugswerte gehe i die Berechug des Dichtemittels ei

Geometrisches Mittel - Sid die Merkmalswerte relative Äderuge (Zuwachsrate, Produktiossteigeruge), so wird das geometrische Mittel verwedet, da die Gesamtäderug icht durch eie Summe, soder durch ei Produkt beschriebe wird. - Die Bezeichug geom. Mittel ist ei Hiweis auf Zähl- oder Messdate, die statt der arithm. eie geometr. Zahlefolge bilde (z.b. bei Verdüugsreihe). - Es wird verwedet bei Zähldate, vo dee bekat ist, dass sie durch multiplikative Wirkuge etstade sid ud dere Werte sehr uterschiedliche Größeorduge aufweise, sowie fast immer eie stark asymmetrische Häufigkeitsverteilug aufweise (z.b. Keimzahle i flüssige Medie, wie Milch ud Gülle). - das geom. Mittel fidet auch Awedug bei logarithmische Date (z.b. Spektralaalyse)

Es gibt folgede Möglichkeite der Berechug des geom. Mittels ud der durchschittliche Zuwachsrate:. Seie x,...,x Beobachtugswerte (rel. Äderuge, bez. auf = 00%) mit x i 0 für i=,..., ud r die durchschittliche Zuwachsrate. x lg x g = x K x ud r = x g. Mache Aalysemethode liefer die Logarithme der gesuchte Gehalte (z.b. Spektralaalyse). = lg g x i i= = lg x x g = 0 3. We sich eie Afagsmege A i eier Zeiteiheit um eie kostate Zuwachsrate r erhöht, da erhält ma ach Zeiteiheite die Edmege E: E = A(+r) x g = E A ud r = x g lg x

Bsp.: I eier best. Kultur erhöhte sich i 3 Tage die Zahl der Bakterie pro Eiheit vo 00 auf 500. Wie groß ist die durchschittliche tägliche Zuahme i [%]? Lösug: Bsp.: Bei Milchprobe wurde folgede Keimzahle i [0 3 ] gemesse: 550 6900 85 65 4750 60900 40 3950 50 850 30500 95 Wie groß ist die mittlere Keimzahl? Lösug:

Bsp.: I eier best. Kultur erhöhte sich i 3 Tage die Zahl der Bakterie pro Eiheit vo 00 auf 500. Wie groß ist die durchschittliche tägliche Zuahme i [%]? Lösug: r = x = E A = 0,7 7% g = Bsp.: Bei Milchprobe wurde folgede Keimzahle i [0 3 ] gemesse: 550 6900 85 65 4750 60900 40 3950 50 850 30500 95 Wie groß ist die mittlere Keimzahl? Lösug: Da die Werte über mehrere Zeherpoteze schwake, wird das geom. Mittel bestimmt. lgx 6,5358 xg = 0 = 0 = 3.433.998 (Im Vergleich: x=.067.083 )

. Weitere Lagemaße: α- Quatil Wir betrachte die Variatiosreihe x (),...,x (). Da sidα% der Merkmalswerte ud (-α) % der Merkmalswerte dem α - Quatil. x~ α x x + x ( k+ ) = + ( k) ( k ) ; k ; k = = it( α ), falls α keie g.z. α, falls α g.z. (it = gazer Teil; g.z.= gaze Zahl) We α = 0,5 0,5 0,75 Media uteres oberes Quartil Quartil

.4.. Streuugsmaße - Maße, die die Abweichug der Beobachtugswerte vom Zetrum eier Häufigkeitsverteilug beschreibe, heiße Streuugs- oder Dispersiosmaße. - Ket ma Lage- ud Streuugsmaße, hat ma scho eie recht gute Vorstellug vo der Häufigkeitsverteilug, ohe diese explizit zu kee.

Spaweite (Rage, Variatiosbreite) Sie ist das eifachste Streuugsmaß ud gibt de Streubereich eier HV a, d.h. de Bereich, i dem alle Merkmalswerte liege. Sei x (),...,x () eie Variatiosreihe, da gilt: R = x () - x (). Vorteil: - Eifach zu bestimmedes Streuugsmaß, eifach iterpretierbar Nachteile: - R ist icht robust gegeüber Ausreißer - R besitzt keie gute stat. Schätzeigeschafte, da außer de extreme Merkmalswerte alle adere Werte uberücksichtigt bleibe.

Quartilsabstad (Iterquartile rage) - Der Quartilsabstad gibt de Bereich zwische oberem ud uterem Quartil eier Messreihe a. - Er ethält 50 % aller Merkmalswerte. I = x~ 0,75 ~ x 0, 5 Vorteile: - I ist robust gegeüber Ausreißer - I ist aschaulich ud besitzt bessere statistische Schätzeigeschafte als die Spaweite Nachteil: - icht alle Iformatioe der Stichprobe gehe i die Berechug ei

Mittlere absolute Abweichug vom Media Ma wählt hier als Bezugsgröße für die Abweichug der Merkmalswerte vom Zetrum der Häufigkeitsverteilug de Media. d = i= x i ~ x 0,5 Vorteile: - d ist robust gegeüber Ausreißer - d ist gut geeiget bei schiefe Häufigkeitsverteiluge Nachteil: - bei Normalverteilug ist die empir. Variaz das bessere Schätzmaß

Media der absolute Abweichuge vom Media MAD = med ( y~ 0, x ~ i x 0,5 ) = 5 y i = x ~ i x 0,5 Vor- ud Nachteile: aalog wie mittlere abs. Abweichug vom Media

Stichprobevariaz ud Stadardabweichug - Wir betrachte u als Bezugsgröße für das Zetrum der HV das arithmetische Mittel. - Da ist die Stichprobevariaz die durchschittliche quadratische Abweichug der Messwerte vom arithmetische Mittelwert. - Dabei wird jedoch durch de Faktor (-), d.h. die Azahl der voeiader uabhägige Abweichuge, geat Freiheitsgrad, dividiert. - Der Stichprobeumfag sollte midestes 6 betrage! s = (x = i x) x i= i= i x

- Als Stadardabweichug s bezeichet ma: s = (xi x) = (( i= i= x i ) x ) - Der Stadardfehler des arithm. Mittelwertes bezieht sich auf de Stichprobeumfag: s x = s Vorteile: - Die Variaz s hat die beste Schätzeigeschafte bei Normalverteilug - Die Stadardabweichug s hat die gleiche Dimesio wie die Messwerte ud der arithm. Mittelwert, ma ka daher Itervalle der Form x± s bzw. x ± 3 s agebe. Nachteil: - s ist icht robust gegeüber Ausreißer

- Variatioskoeffiziet Der Variatioskoeffiziet ist ei vo maß, das das Verhältis vo s ud v = s IxI [00%] x x bereiigtes Streuugs- misst. Vorteil: - v ist gut geeiget zum Vergleich vo Streuuge vo Beobachtugsreihe mit uterschiedlichem Mittelwert

Grafische Darstellug vo Lage- ud Streuugsmaße:. Box- ud Whisker Plot Ezymaktivitäte vo 8 Mutate Vaadiumgehalt vo Weie 75 Box & Whisker Plot (Ezymaktivitäte) Multipler Box- Whisker Plot für Vaadium 3,0,5 70,0 65,5 Ezymkozetratioe 60 55 50 45 40 35 30 5 0 3 4 5 6 7 8 Mutate Media 5%-75% Mi-Max Vaad ium,0 0,5 0,0-0,5 -,0 -,5 Czech Republic Hu gary Ro maia So uth Africa Weisswei Lad Czech Republic Hu gary Ro maia So uth Africa Rotwei Media 5%-75% No-Outlier Rage

Grafische Darstellug vo Lage- ud Streuugsmaße:. Mittelwertplots Ezymaktivitäte vo 8 Mutate 75 Mittelwertplot (Ezymaktivitäte vo Mutate) 70 Mittelwertplot (Ezymaktivitäte) 70 65 Ezymkozetratioe 65 60 55 50 45 40 35 30 Ezymkozetratioe 60 55 50 45 40 35 5 30 0 3 4 5 6 7 8 Mutate arithm. Mittelwert MW + - 95%-iges Kofidezitervall Extrem werte 5 3 4 5 6 7 8 Mutate arithm. MW Mea±0,95*SD

Bsp.: 40 Koloie vo Mikroorgaisme Mittelwertmaße: Merkmal X: Durchmesser (metrisch) Stichprobe Verteilugsform Arithm. MW Media Vergleich Alle Koloie (40) symmetrisch 5,9 6,0 Gelbe Koloie (3) rechtssteil 7, 7,7 < Weißliche Koloie (4) symmetrisch 6,0 6,0 SostigeKoloie (3) likssteil 4,5 4, > Merkmal Y: Atibiotikaresistez (ordial) x~ Media: (sesitiv) (3, 0, 8 3, 5 4, 4 5 ) 0,5 = Modalwert: D = (sehr sesitiv) Merkmal Z: Farbe (omial) Modalwert: D = (weißlich ist die am häufigste auftretede Farbe)

Streuugsmaße: Merkmal X: Durchmesser Stichprobe Quartilsabst. Spaweite Variaz Stad. abw. Var. koeff. Alle Koloie (40),7 8,7,95 4,3 0,50 Gelbe Koloie (3),4 8,77,96 3,6 0,4 Weißliche Koloie (4) 8,0 7,50,74 3,8 0,45 Sostige Koloie (3) 9,9 7,6,76 3,4 0,6 Box-ad-Whisker Plot Box-ad-Whisker Plot Durchmesser 0 8 6 4 Durchmesser 0 8 6 4 0 gelb sostige weißlich 0 braufarblosgelb grüoragerosaweißlich Farbgruppe Farbe

.4.3. Schiefe ud Exzess. Schiefe - We der Media ud der Modalwert vom arithmetische Mittel abweiche, bezeichet ma eie Verteilug als schief. - Ma charakterisiert schiefe Verteiluge außerdem durch die Schiefe g als Maß für die Schiefheit ud ihre Richtug. - Echt schiefe Verteiluge liege vor, we bei Vorliege eier große Azahl vo Beobachtugswerte ud der Awedug aller mögliche Trasformatio der Date die Schiefheit der Verteilug bestehe bleibt. - Keie echte Schiefe liegt vor, we ma schiefe Verteiluge durch Trasformatioe (z.b. Logarithmiere) i symmetrische überführe ka.

Bsp.: Auftrete log. Verteiluge bei: Aalyse sehr iedriger Gehalte (z.b. Spureaalyse) Merkmale mit sehr großer Spaweite (mehrere Zeherpoteze) sehr großem Zufallsfehler (z.b. halbquatitative Spektralaalyse) g = ( i= i= (x (x i i x) x) 3 ) 3 = i= xi s x 3 Eie HV ist symmetrisch, we x x~0 = x = ud g = 0,5 mod Eie HV ist liksschief oder rechtssteil, we ud g < 0 x < x~0 < x Eie HV ist rechtsschief oder likssteil, we x > x~0,5 > x ud g > 0,5 mod mod

. Exzeß ud Kurtosis - Mägel i de gewählte Versuchsbediguge köe zu eier Überhöhug (Streckug) oder Uterhöhug (Stauchug) der Häufigkeitsverteilug führe. Derartig verzerrte Verteiluge werde durch de Exzeß g charakterisiert. - Der Exzeß gibt a, ob das absolute Maximum der Häufigkeitsverteilug (bei aäherd gleicher Variaz) größer oder kleier dem Maximum der Normalverteilugsdichte ist. 4 (xi x) 4 i= xi x = 3 = 3 g ' 3 = i s = (xi x) i= g g heißt Kurtosis.

We g = 0 Häufigkeitsverteilug etspricht der NV We g < 0 abs. Häufigkeitsmaximum < Maximum der NV- Dichte (HV ist flachgipfliger), d.h. die Azahl größerer Abweichuge vo x ist geriger als bei der NV bei gleicher Variaz. We g > 0 abs. Häufigkeitsmaximum > Maximum der NV- Dichte (HV ist steilgipfliger), d.h. die Azahl größerer Abweichuge vo x ist größer als bei der NV bei gleicher Variaz.

Als k- tes Momet bezeichet ma: ud als k-tes zetriertes Momet: i= i= k x i (x i x) k Bem.: Damit stelle der arithm. Mittelwert das. Momet ud die empirische Variaz das. zetrierte Momet dar, währed Schiefe ud Exzeß auf dem 3. bzw. 4. zetrierte Momet basiere.

.5. Mehrdimesioale Merkmale - Bei viele praktische Probleme wirke Merkmale icht ur eizel, soder auch im Komplex. Es iteressiert da der Zusammehag zwische zwei oder mehrere Merkmale. - Wir bezeiche eie Komplex vo Merkmale auch als mehrdimesioales Merkmal (od. Merkmalsvektor) ud schreibe: (X,...,X ), bzw. (X,Y) bei eiem zweidimesioale Merkmal.

Beispiele:. X- Lagerzeit vo Zuckerrübe (X- determiistische d.h. Y- Saccharosegehalt vo Zuckerrübe eistellbare Eiflussgröße, Y- zufällige Zielgröße). X- Körpermasse vo Schweie (X ud Y - zufällige Größe, Y- Körpergröße vo Schweie jede ka als Eifluss- bzw. Zielgröße betrachtet werde) 3. Prozess des Nass-Salzes vo Hartkäse X - Natriumchloridgehalt im Salzbad X - Temperatur des Salzbades X 3 - Salzdauer Y - Masseausbeute des Käses ach dem Salze Y - Sesorischer Qualitätsparameter (X,X,X 3 - determ. Eiflussgröße, Y,Y - zufällige Zielgröße) WICHTIG: Erfassug aller für de zu utersuchede Sachverhalt (Produkt, Prozess) wesetliche Merkmale!

5 Fragestelluge sid vo Iteresse:. Welche Art vo Merkmale werde betrachtet? (Klassifizierug, Eiflussgröße eistellbar oder zufällig?). Wie lasse sich zweidimesioale Merkmale grafisch darstelle? (Puktwolke, Streudiagramm, XY- Scatterplot) 3. Wie sieht die Häufigkeitsverteilug (tabellarisch ud grafisch) eies zweidimesioale Merkmals aus? (-dim. Häufigk.tabelle, Kotigeztafel, 3-dim. Histogramm) 4. Wie stark ist der Zusammehag zwische Merkmale X ud Y ud welche Richtug hat er? (Assoziatios-, Kotigez-, Maßkorrelatios- oder Ragkorrelatioskoeffiziet) 5. I welcher Form lässt sich der Zusammehag darstelle? (Kotigeztafel-, Variaz- u. Regressiosaalyse)

zu.) Streudiagramm (XY- Scatterplot) y aäherd liearer Zusammehag x y y Hyperbel Rezipr. Trasf. x Bsp.: Fallhöhe ud Schwigugsfrequez vo Wasserfälle /x

zu 3.) Häufigkeitsverteilug Zur Darstellug vo Häufigkeitsverteiluge diee Häufigkeitstabelle (Vierfeldertafel, Kotigeztafel) ud grafische Darstelluge durch zweidimesioale Histogramme oder Polygoe.. Fall: - Sei (X,Y) ei omialskaliertes - dim. Merkmal mit je Auspräguge (a j,b k ) j,k=, (z.b.: ja/ ei, vorhade, icht vorhade) Vierfeldertafel ( x ): X vorhade icht vorh. Summe vorhade Y icht vorhade Summe f f f +f f f f +f f +f f +f

Bem.: - Die absolute Häufigkeite f jk (j,k=,) im Ier der Tafel stelle die - dim. absolute Häufigkeitsverteilug dar. (aalog: die relative Häufigkeite h jk = f jk / stelle die - dim. relative Häufigkeitsverteilug dar). - Die Radsummehäufigkeite (Zeile- ud Spaltesumme) stelle die etsprechede - dim. Häufigkeitsverteiluge vo X bzw. Y dar. - Aus der zweidimesioale Häufigkeitsverteilug ka ma auf die eidimesioale Häufigkeitsverteiluge schließe, es gilt aber icht die Umkehrug!

Bsp.: Utersuchug vo 7 Ratte auf Milbebefall der Spezies A ud B Vierfeldertafel (x): Spezies vorhade B icht vorhade Summe Spezies A vorhade icht vorhade 44 3 75 85 9 08 Summe 67 60 7 - Die Radsumme gebe Aufschluss darüber, wie viele der Ratte eie der beide Milbe beherberge bzw. icht beherberge, uabhägig davo, ob die adere Spezies vorhade ist oder icht, d.h. sie gebe die eidimesioale Häufigkeitsverteiluge a.

Ergebis: - Die Chace, eie A- Milbe azutreffe, ist bei de Ratte, bei dee scho B- Milbe festgestellt wurde, größer als bei alle Ratte zusammegeomme, de: ur auf etwa der Hälfte aller 7 Ratte kame A- Milbe vor (Radsumme 9), aber i der Teilmege der 67 Ratte, die B- Milbe beherberge, befide sich 44 Träger vo A- Milbe. Damit ist der Ateil der Träger vo A- Milbe uter de Träger vo B- Milbe größer als i der Gesamtprobe! Umgekehrt gilt dasselbe. - Zwische dem A- Milbebefall ud dem B- Milbebefall scheit also ei statistischer Zusammehag zu bestehe.

. Fall: - Sei (X,Y) ei ordialskaliertes - dim. Merkmal, bei dem jede Kompoete auf eier Ragskala gemesse wird, d.h. als Merkmalsausprägug eie Ragzahl hat. - Vorliege eier Tabelle der Ragzahle (keie Häufigkeitstabelle!) Tabelle der Ragzahle: i R(x i ) R(y i ) d i d i R(x ) R(y ) d d............... R(x ) R(y ) d d - dabei ist d i = R(x i ) - R(y i ) die Differez der Ragzahle der i- te Kompoete vo X ud Y

Bsp.: Weiverkostug Bei eier Weiverkostug solle 8 Weisorte hisichtlich ihres Aromas i eie Ragordug gebracht werde. Prüfer solle uabhägig voeiader die Sorte begutachte, wobei die Sorte mit dem schwächste Aroma die Ragzahl ud die Sorte mit dem stärkste Aroma die Ragzahl 8 erhalte soll. Tabelle der Ragzahle: i Sorte Prüfer R(x i ) Prüfer R(y i ) d i A 6 5 B 3 3 C 8 8 0 4 D 4-5 E 0 6 F 7 6 7 G 4 3 8 H 5 7 -

Ergebis: - Nur bei Sorte gab es Übereistimmug i der Bewertug, bei alle übrige Sorte gab es Differeze, die aber icht mehr als Ragzahle betrage. - Ma ka eie statistische Zusammehag vermute, de je höher im allgemeie die Ragzahl des. Prüfers ist, desto höher ist im allgemeie auch die Ragzahl des. Prüfers. - Die Weisorte scheie also Aromauterschiede aufzuweise ud beide Prüfer ware i der Lage, diese zu erkee.

3. Fall: - Sei (X,Y) ei omial- oder ordialskaliertes - dim. Merkmal, dere Auspräguge (a j,b k ) mit de absolute Häufigkeite f jk ud de relative Häufigkeite h jk für j=,...,l ud k=,...,m auftrete. Kotigeztafel (l x m): Y Summe b b... b m a f f... f m f. X a f f... f m f................ a l f l. f l f l Summe f. f.... f. m f lm

Bsp.: Utersuchug der Note vo 3 Studete i Mathematik ud Statistik ( ordialskalierte Merkmale) Kotigeztafel (5 x 5): Note i Mathematik 3 4 5 Summe Note 0 0 0 i Statistik 3 4 0 0 0 0 3 0 0 4 4 0 0 0 5 6 6 5 0 0 3 Summe 5 6 9 3

Ergebis: - Je besser im allgemeie die Note i Mathematik ist, desto besser ist im allgemeie auch die Note i Statistik ud umgekehrt. - Ma ka also eie statistische Zusammehag zwische de Note vermute, de ma dara erket, dass die i der Nähe der Diagoale gelegee Felder der Kotigeztafel die höchste absolute Häufigkeite aufweise.

4. Fall: - Sei (X,Y) ei metrisch skaliertes - dim. Merkmal, für dere Kompoete X ud Y eie Klasseeiteilug vorliegt Häufigkeitstabelle (aalog Kotigeztafel!) (l x m): Klassegreze (y 0 ;y ] Y (y ;y ]... (y m- ;y m ] Summe (x 0 ;x ] f f... f m f. X (x ;x ] f f... f m f................ (x l- ;x l ] f l f l f lm f l Summe f. f.... f. m Bsp.: Utersuchug des Asche- ud Kaliumgehaltes vo Weie

Bsp.: Weidate (3- dim.histogramm) - dim. Histogramm (Weie aus Ugar ud Tschechie) - dim. Histogramm (Weie aus Ugar ud Tschechie)

zu 4.) Zusammehagsmaße Art der Merkmale omialskaliert omial- oder (ud) ordialskaliert ordialskaliert metrisch skaliert Häufigkeitsvert. Vierfeldertafel Kotigeztafel (Tab. vo Ragzahle) - dim. Häufigkeitstabelle (Kotigeztafel) Zusammehagsmaß Assoziatioskoeff. vo Cramér, Kotigezkoeff. vo Pearso Assoziatioskoeff. vo Cramér ud Kotigezkoeff. vo Pearso Ragkorrelatioskoeff. vo Spearma Vor.: X,Y zufällige Merkmale Li. Abhägigkeit Maßkorrelatioskoeff. vo Bravais/ Pearso Mo. Abhägigkeit Ragkorrelatioskoeff. vo Spearma

. Kotigezkoeffiziet C vo Pearso: - Sei (X,Y) ei - dim., omial- oder ordialskaliertes diskretes Merkmal, das i de Auspräguge (a j, b k ) für j =, l ud k =,,m mit de abs. Häufigkeite f jk auftritt. - Der Kotigezkoeffiziet ist ei Maß für die Stärke des stochastische Zusammehages zwische diskrete Merkmale. C= wobei χ χ + χ = l m f jk j j= k= j k f f f f k

Bem.: - Der Kotigezkoeffiziet C immt Werte im Itervall kei Zusammehag 0 C mi mi vollst. Zusammehag ( l,m) ( l,m) a. - Der maximale Wert vo C (d.h. vollstädige Kotigez) ist vo der Tafelgröße (Zeile- bzw. Spaltezahl l ud m) abhägig ud ähert sich für große l bzw. m gege. besser: korrigierter Kotigezkoeffiziet vo Pearso C corr - Für die Vierfeldertafel gilt: 0 C 0,707

Bem.: - Der korrigierte Kotigezkoeffiziet C corr wird berechet ach: = C corr χ χ + mi mi ( l,m) ( l,m) ud es gilt u: 0 C corr, d.h. bei vollstädiger Kotigez wird immer der Wert ageomme, uabhägig vo der Größe der Kotigeztafel.

. Assoziatioskoeffiziet vo Cramér (Cramér s V): - Sei (X,Y) ei - dim., omial- oder ordialskaliertes diskretes Merkmal, das i de Auspräguge (a j, b k ) für j =, l ud k =,,m mit de abs. Häufigkeite f jk auftritt. - Der Assoziatioskoeffiziet ist ebefalls ei Maß für die Stärke des stochastische Zusammehages zwische diskrete Merkmale. V = wobei χ ( mi( l,m) ) χ = l m f jk j j= k= j k vollst. Zusammehag kei Zusammehag f f f f mit 0 V k

3. Ragkorrelatioskoeffiziet r s vo SPEARMAN: - Sei (X,Y) ei - dim., ordial oder metrisch skaliertes Merkmal, bei dem jede Kompoete Merkmalswerte mit eier eideutige Ragfolge hat (ragskaliert). - Wir beobachte a de Beobachtugseiheite die Merkmalswerte (x i,y i ) für i=,..., - Wir orde u jedem Beobachtugswert x i bzw. y i für i=,..., eie Ragzahl R(x i ) bzw. R(y i ) zu, wobei gilt: R(x (i) ) = i für i=,..., ud x () x ()... x () - Tritt eie Ausprägug mehrfach auf ( Biduge ), so ordet ma diese gleiche Werte als Rag das arithmetische Mittel der Räge zu, die sie eiehme. - Bsp.: x () =; x () =4; x (3) =4; x (4) =6; x (5) =9 R(x () )=; R(x () )=,5; R(x (3) )=,5; R(x(4))=4; R(x (5) )=5

Formel für de Ragkorrelatioskoeffiziete r s : ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) = = i i i i i s y R y R x R x R y R y R x R x R r ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) i i i i i s y R y R x R x R R(y) R(x) y R x R r = = - Der Ragkorrelatioskoeffiziet ist ei Maß für die Stärke ud Richtug eies mootoe stochastische Zusammehages zwische ragskalierte Merkmale.

We keie Biduge vorliege, d.h. we x i x j für i j ud y i y j für i j gilt: 6 i= r s = d i ( ), wobei d = R( x ) R( y ) Bem.: Für de Ragkorrelatioskoeffiziete gilt: We r s < 0 eg. Ragkorrelatio We r s > 0 pos. Ragkorrelatio - r s + i i i=,, r s =, we X ud Y mooto zusammehäge r s =, we die x- Räge mit de y- Räge übereistimme r s = -, we die x- ud y- Räge geau etgegegesetzte Ragfolge ergebe. i

Bsp.: Aromaprüfug vo 8 Weisorte durch Prüfer Der Ragkorrelatioskoeffiziet vo r s = 0,86 deutet auf eie recht starke, mooto wachsede stochastische Zusammehag hi. 4. Maßkorrelatioskoeffiziet r XY vo BRAVAIS- PEARSON: - Sei (X,Y) ei metrisch skaliertes - dim. Merkmal, dere Merkmalswerte (x i,y i ), i=,...,, eie äherugsweise lieare Zusammehag zwische X ud Y vermute lasse. - Wir beobachte a de Beobachtugseiheite die Merkmalswerte (x i,y i ) für i=,..., - Der Maßkorrelatioskoeffiziet ist ei Maß für die Stärke ud Richtug eies lieare stochast. Zusammehages zwische metrisch skalierte Merkmale.

Formel für de Maßkorrelatioskoeffiziete r XY : ( ) ( ) ( ) ( ) ( ) ( ) = = i i i i i XY y y x x ) ( y y x x ) ( r ( ) ( ) ( ) ( ) i i i i i XY y y x x y x y x r = =

Bem.: Für de Maßkorrelatioskoeffiziete r XY gilt: We r XY < 0 egative Korrelatio We r XY > 0 positive Korrelatio - r XY + r XY =, we X ud Y liear zusammehäge We r XY = 0 Ukorreliertheit zwische X ud Y We r XY = 0 ud (X,Y) - dim. ormalverteilt Uabhägigkeit zwische X ud Y Der Korrelatioskoeffiziet ist icht imstade, ichtlieare Zusammehäge zwische Merkmale zu erkee. Ma beachte Schei- ud Usikorrelatioe!

Bem.: Merkmale mit sehr schiefe Häufigkeitsverteiluge köe mituter auch eie Korrelatioskoeffiziete ahe 0 habe, obwohl ei statistischer Zusammehag zwische ihe besteht. B = r XY heißt Bestimmtheitsmaß. Es gibt de Ateil der Variatio der y- Werte a, der durch de lieare Zusammehag zwische X ud Y bestimmt wird. Bei der Utersuchug vo lieare Abhägigkeite zwische mehr als Merkmale gibt es: - partielle Korrelatioskoeffiziete, - multiple Korrelatioskoeffiziete ud - kaoische Korrelatioskoeffiziete.

Zu 5.) Form der statistische Abhägigkeit - Sei (X,Y) ei metrisch skaliertes - dim. Merkmal mit de Merkmalswerte (x i,y i ) für i=,...,. - Es iteressiert die Form der Abhägigkeit eies Merkmals Y (abhägiges Merkmal, Zielgröße, Regressad) vo eiem Merkmal X (uabh. Merkmal, Eiflussgröße, Regressor). - Alle kotrollierbare Eiflussgröße werde kostat gehalte. - Wir beschräke us auf de Fall des Modells I der eifache lieare Regressio (Eiflussgröße, lieare Abhägigkeit). Vor.: Y zuf. Merkmal, eistellbares Merkmal X zuf. Merkmal, mit kleiem Fehler messbar RM I zuf. Merkmal RM II

Streudiagramm (XY- Scatterplot) Aahme eies lieare Modells für die Abhägigkeit zwische X ud Y i der Grudgesamtheit: y = β 0 + β x, geat lieare Regressiosgleichug. Da gilt für die zuf. Beobachtuge der Zielgröße: Y i = β 0 + β x i + ε i i=,, Zufallsfehler, wobeiε i uabhägig ud idetisch verteilt mit Eε i =0 ud D ε i = σ ud σ uabhägig vo de Messpukte x i Bem.: We ε i ~ N(0, σ ) bei RM I : Y i ~ N(β 0 + β x i, σ ) bzw. Y~ N(β 0 + β x, σ )

Regressiosaalyse:. Schätzug der empirische lieare Regressiosgleichug (Ausgleichsgerade) ach der Methode der kleiste Quadrate (MkQ, LS): Q Zuf. Beobachtugswerte Modellwerte 0 εi mi i 0 i = i= i= ( β, β ) = ( Y ( β +β x )) Residue Die Werte vo β 0 ud β, für die Q(β 0, β ) ihr Miimum aimmt, et ma Kleiste-Quadrate-Schätzer βˆ ud βˆ. 0 Durch Nullsetze der partielle Ableituge vo Q ach β 0 ud β erhält ma ei Normalgleichugssystem, das zu löse ist.

Die auf der Basis der kokrete Stichprobe ermittelte Schätzwerte für β 0 ud β bezeichet ma mit b 0 ud b. Bem.: ( x x) ( y y) i i i= b = = ud i= XY X ( x x) b = y b i 0 x SP SQ geschätzte lieare Regressiosgleichug: ŷ(b,b) = b0 + b s XY 0 = i= x ( x ) ( ) i x y i y = SPXY heißt Kovariaz zwische X ud Y ud s X = i= ( xi x) = SQ X oder: b = r XY s s Y X Variaz vo X.

. Zeiche der Regressiosgerade is Streudiagramm: y ŷ= b + b 0 x ŷ i y i ˆε i b 0 0 x i x

( ) ( ) ( ) = = = ε = + = = i i i i 0 i i i i R ˆ x b b y ŷ y s R R SQ s = Restquadratsumme 3. Güte des Regressiosmodells - Beurteilug der Güte der Modellvorhersage für jede Messwert mit Hilfe der geschätzte Residue, i=,, - Maß für die Variatio der Stichprobewerte um die geschätzte Regressiosgerade: Restvariaz geschätzte Residue i i i ŷ y ˆ = ε - Streuugszerlegug (Zerlegug der Quadratsumme!): ( ) ( ) ( ) = = = + = i i i i i i i y ŷ ŷ y y y M R T SQ SQ SQ + = durch de Modellzusammehag erklärte Streuug Gesamtstreuug Reststreuug FG

Erklärte Streuug: Darstellug der Variatio der y- Werte, die auf de lieare Zusammehag SQ M zwische X ud Y zurückzuführe ist, d.h. sie ethält die Variatio der Werte auf der Gerade um de Mittelwert y. Reststreuug: Verbleibeder Rest der Variatio der y- SQ R Werte Bem.: Liege alle beobachtete Werte exakt auf eier Gerade, so sid die Residue 0 ud ebeso die Reststreuug. Da ließe sich die gesamte Variatio vo Y durch de lieare Modellzusammehag mit X erkläre (fuktioaler liearer Zusammehag). Je größer die Reststreuug ist, desto schlechter beschreibt das Modell die Date.

- Als Maßzahl für die Güte der Modellapassug verwedet ma häufig das Bestimmtheitsmaß B. Es gibt de Ateil a der Gesamtstreuug der y- Werte a, der durch die Regressio vo Y auf X erklärt wird ud ist der Quotiet aus erklärter ud Gesamtstreuug. B ( ) ŷ i y SQM i= i= = = = SQT ( ) yi y i= i= 0 B ( y ŷ ) i ( y ) i y i kei liearer Zusammehag fuktioaler liearer Zusammehag B = r XY Für Vorhersage sollte das Bestimmtheitsmaß möglichst 0,8 sei! Aber: B ist bei RM I vom Versuchspla abhägig!

- Tests zur Prüfug der Modelladäquatheit (F- Test der Variazaalyse) ud zur Prüfug der Modellparameter (t- Tests, Kofidezitervalle) im Rahme der schließede Statistik 4. Residualaalyse - Prüfe der Modellvoraussetzuge über de Zufallsfehler (ε ~ N(0, σ ) ud σ uabhägig vo de Messpukte x i ) - Residualplots εˆ i = y i ŷ d d i ormierte Residue d i d = εˆ s i εˆ Ausreißer +3 0 0 ŷ ŷ 0 ŷ idealer Verlauf ugleiche Variaze -3 d i > 3 Ausreißer

Bsp.: Weidate, Abhägigkeit zwische de seltee Erde- Parameter Lathaum ud Gadolium XY- Scatterplot (Lathaum, Gadolium) y = -0,78 +,9690 * x Korrelatioskoeffiziet: r = 0,9836 0 Gadolium - - -3-4 -5-4 -3 - - 0 Lathaum 95% Kofige zgreze

, Normierte Residue,0 0,8 0,6 Normierte Residue 0,4 0, 0,0-0, -0,4-0,6-0,8 -,0 -, -,4-5 -4-3 - - 0 Geschätzte Werte für Gadolium

Geschätzte gege beobachtete Werte (Gadolium) 0 Beobachtete Werte - - -3-4 -5-5 -4-3 - - 0 Geschätzte Werte 95% Kofidezgreze

Bsp.: Weidate (Matrix Plot) Matrix Plot (Histogramm ud Scatterplot) für Alkaliität, Asche ud Kalium (trasformiert) Alkaliität Asche Kalium

. Wahrscheilichkeitsrechug Die Wahrscheilichkeitsrechug liefert mathematische Modelle für Zufallserscheiuge. // Stahel, W. (995)

Es werde Experimete betrachtet, dere Ergebisse eie zufällige Ausgag habe, so geate zufällige Versuche... Zufälliges Ereigis, Wahrscheilichkeit, Zufallsgröße Begriffe ud Defiitioe: Def.: Ei zufälliges Ereigis ist ei Ereigis, das bei eiem Versuch, bei dem bestimmte Bediguge eigehalte werde, eitrete ka, aber icht otwedig eitrete muss. Es ist das Ergebis eies zufällige Versuches. Bez.: A,B,C,...,A,B,...

Bsp. : Würfel mit eiem ideale Würfel ud Beobachtug der geworfee Augezahl (zuf. Versuch) zufällige Ereigisse sid: A i := "Augezahl i wird gewürfelt, i=,...,6 ", aber auch: A 7 := "Eie gerade Augezahl wird gewürfelt" Begriffe: - Elemetarereigis: Elemetarereigisse lasse sich icht weiter i zufällige Ereigisse zerlege. Bez.: e i ; i=,..., Bsp.: e i := "Würfel der Augezahl i, i=,...,6 "

- Zusammegesetzte Ereigisse: lasse sich weiter i zufällige Ereigisse zerlege. Bez.: A i, B i,... ; i=,..., Bsp.: A 7 := "Würfel eier gerade Zahl" = {e,e 4,e 6 } Def.: Die Mege E (oder: Ω) heißt Mege der zu eiem zufällige Versuch gehörede Elemetarereigisse, we jedem Versuchsausgag geau ei Elemet dieser Mege E etspricht. Bsp.: E = {e,...,e 6 } Schlussfolgerug: Methode der Megelehre (Vereiigug, Durchschitt, Differez) sid awedbar!

Def.: Ei zufälliges Ereigis A ist eie Teilmege der Mege E der Elemetarereigisse, d.h. A E. Grezfälle vo zufällige Ereigisse: Def.: Sichere Ereigisse sid dadurch gekezeichet, dass sie immer eitrete. Sie bilde die Teilmege vo E, die alle Elemetarereigisse ethält. Bsp.: E: = "Es wird eie Zahl zwische ud 6 gewürfelt" = {e,...,e 6 } Def.: Umögliche Ereigisse sid dadurch charakterisiert, dass sie icht eitrete köe. Sie sid die Teilmege, die kei Elemetarereigis ethält. Bsp.: Ø := "Es wird eie '0' gewürfelt!"

Relatioe ud Operatioe zwische zufällige Ereigisse: Def.: Ei zufälliges Ereigis A ist geau da i dem zufällige Ereigis B ethalte, we alle Elemetarereigisse, die zu A gehöre, auch zu B gehöre. Bez.: A B Bsp.: Würfel mit Würfel: A A 7 Bem.: Für ei beliebiges zufälliges Ereigis A gilt immer: Ø A E Def.: Zwei zuf. Ereigisse A ud B heiße äquivalet (gleich), we sowohl das Ereigis A i B ethalte ist ( A B ), als auch das Ereigis B i A ethalte ist ( B A). Bez.: A = B

Def.: Sid A ud B zuf. Ereigisse, so verstehe wir uter der Summe vo A ud B (Vereiigug) das Ereigis, das geau die Elemetarereigisse ethält, die zu A oder zu B gehöre. Bez.: A B Bsp.: Würfel A = { e,e,e, } A 7 4 e 6 E A B Def.: Sid A ud B zuf. Ereigisse, so verstehe wir uter dem Produkt vo A ud B (Durchschitt) das Ereigis, das geau die Elemetarereigisse ethält, die zu A ud zu B gehöre. Bez.: A B Bsp.: Würfel A A 7 = E A B

Def.: Zwei zufällige Ereigisse A ud B heiße miteiader uvereibar (uverträglich), we sie keie gemeisame Elemetarereigisse besitze. Bez.: A B = Bsp.: A A 7 = Def.: Ist A ei zufälliges Ereigis, so ee wir das Ereigis, das geau die Elemetarereigisse ethält, die icht zu A gehöre, das zu A komplemetäre Ereigis. Bez.: A Bsp.: A 7 = {,3,5}

Def.: Sid A, B zufällige Ereigisse, so verstehe wir uter der Differez vo A ud B das Ereigis, das geau die Elemetarereigisse ethält, die zu A, aber icht zu B gehöre. (d.h. we A, aber icht B eitritt!) Bez.: A \ B Bsp.: Würfel E A B A 7 \ A = {4, 6} Es gelte folgede Aussage: A = E \ A A B = A \ B