Übersicht Teil 1 - deskriptive Statistik

Ähnliche Dokumente
Lösungsvorschläge zur Klausur Beschreibende Statistik und Wirtschaftsstatistik (Sommersemester 2013)

Eine zweidimensionale Stichprobe

Statistik eindimensionaler Größen

Kapitel XI - Korrelationsrechnung

Grundlagen der Wahrscheinlichkeitstheorie und Statistik für Studierende der Informatik

Deskriptive Statistik

5 Exkurs: Deskriptive Statistik

Statistik und Wahrscheinlichkeitsrechnung

Statistik für Betriebswirte I 1. Klausur Wintersemester 2014/

Statistik K urs SS 2004

Übungsblatt 3 zur Vorlesung Wahrscheinlichkeitsrechnung und mathematische Statistik für Informatiker

Das arithmetische Mittel. x i = = 8. x = 1 4. und. y i = = 8

Deskriptive Statistik. (basierend auf Slides von Lukas Meier)

Brückenkurs Statistik für Wirtschaftswissenschaften

Statistik und Wahrscheinlichkeitsrechnung

Beispiel 2 (Einige Aufgaben zu Lageparametern) Aufgabe 1 (Lageparameter)

Ausführliche Lösungen zu ausgewählten Aufgaben von ÜB 5 und 6. Streudiagramm

Lage- und Streuungsparameter

3. Lektion: Deskriptive Statistik

Von insgesamt 50 Statistikern nehmen an allen 3 Tagen einer Tagung 30, an 2 Tagen 10 und an einem Tag ebenfalls 10 teil.

Hochschule Darmstadt FB Mathematik und Naturwissenschaften. Statistik. für Wirtschaftsingenieure (B.Sc.) Sommersemester 2017

Deskriptive Statistik Erläuterungen

Klausur zur Vorlesung

Didaktisches Seminar über Stochastik. Themen: ffl Korrelation von zwei Zufallsvariablen

Lösungen zur Klausur GRUNDLAGEN DER WAHRSCHEINLICHKEITSTHEORIE UND STATISTIK

Weitere Lagemaße: Quantile/Perzentile I

Demo-Text für STOCHASTIK. Tschebyscheff-Ungleichung. Einführung mit Anwendungsbeispielen. Datei Nr Friedrich W.

3) Lagemaße: Mittelwert, Median, Modus

Statistik I für Humanund Sozialwissenschaften

Beispiel 4 (Einige weitere Aufgaben)

Bitte bearbeite zunächst alle Aufgaben bevor du einen Blick in die Lösungen wirfst.

Vorlesung Gesamtbanksteuerung Mathematische Grundlagen II Dr. Klaus Lukas Carsten Neundorf. Vorlesung 04 Mathematische Grundlagen II,

(a) Richtig, die Varianz ist eine Summe quadratischer Größen.

Inhaltsverzeichnis: Aufgaben zur Vorlesung Statistik Seite 1 von 10 Prof. Dr. Karin Melzer, Prof. Dr. Gabriele Gühring, Fakultät Grundlagen

Konfidenzintervalle Grundlegendes Prinzip Erwartungswert Bekannte Varianz Unbekannte Varianz Anteilswert Differenzen von Erwartungswert Anteilswert

W-Seminar: Versuche mit und am Menschen 2017/2019 Skript

Inhaltsverzeichnis. Inhalt Teil I: Beschreibende (Deskriptive) Statistik Seite. 1.0 Erste Begriffsbildungen Merkmale und Skalen 5

Wahrscheinlichkeitsverteilungen

(f(xi ) y i ) 2. minimal ist: man will also die Summe der quadratischen Abweichungen minimieren ... f(x i ) y i, i=1 (t x i) 2

i =1 i =2 i =3 x i y i 4 0 1

Prüfung im Anschluss an das Sommersemester 2002 am 11. Oktober 2002 von bis Uhr

Übungsaufgaben zur Klausur Statistik

Wahrscheinlichkeitstheorie und Statistik vom

Tutorium Statistik Berufsbegleitende Studiengänge Bodensee Campus Konstanz Dozent Dipl. Mathematiker (FH) Roland Geiger

Stichproben Parameterschätzung Konfidenzintervalle:

1. Aufgabe. Bei einer Lehrveranstaltungsbewertung werden folgende Merkmale untersucht: Ordnen Sie diese entsprechenden Skalentypen zu.

Hinweis: Es sind 4 aus 6 Aufgaben zu bearbeiten. Werden mehr als 4 Aufgaben bearbeitet, werden nur die ersten vier Aufgaben gewertet.

Prof. Dr. Walter F. Tichy Dr. Matthias Müller Sommersemester 2006

Ganzrationale Funktionen

Statistik II. Lineare Regressionsrechnung. Wiederholung Skript 2.8 und Ergänzungen (Schira: Kapitel 4) Statistik II

Karl Entacher. FH-Salzburg

Die folgende Tabelle 1 wurde im Rahmen einer Umfrage unter den Studenten eines Statistikseminars erstellt.

Dr. W. Kuhlisch Dresden, Institut für Mathematische Stochastik

Lösungen zur deskriptiven Statistik

Lineare Gleichungssysteme mit 2 Variablen

Dr. I. Fahrner WiSe 2016/17 Fakultät Grundlagen Hochschule Esslingen Übungsblatt 2. Statistik

Theorie-Teil: Aufgaben 1-3: 30 Punkte Programmier-Teil: Aufgaben 4-9: 60 Punkte

Eine Firma will den Zusammenhang zwischen Werbungskosten und Absatz untersuchen. Dazu nimmt sie zunächst eine Stichprobe dieser beiden Merkmale

Mathematik: LehrerInnenteam Arbeitsblatt Semester ARBEITSBLATT 12. Erwartungswert, Varianz und Standardabweichung

Math. II, Statistik, Uebung2, Termin (AI), (BI) 1-Logistischer Trend, 2-Faktoren, 3-Expon. Glätten, 4-Häufigkeit

Viel Erfolg! Prof. Große, Dr. Jüngel BA WS 15/16 Mathe+Statistik Klausur Jena, den Matrikelnummer. Name (lesbar!

13 Mehrdimensionale Zufallsvariablen Zufallsvektoren

Übungen mit dem Applet Rangwerte

Goethe-Universität Frankfurt

Geg.: Eine Menge von Elementen, z.b.

2 Regressionsgerade und Korrelation

Gemeinsame Wahrscheinlichkeitsverteilungen

Biomathematik für Mediziner, Klausur SS 2000 Seite 1

Erwartungswert, Varianz und Standardabweichung einer Zufallsgröße. Was ist eine Zufallsgröße und was genau deren Verteilung?

1 x 1 y 1 2 x 2 y 2 3 x 3 y 3... n x n y n

Herzlich willkommen zur Vorlesung Statistik. Streuungsmaße oder die Unterschiedlichkeit der Daten nebst kurzen Ausführungen zu Schiefe und Wölbung

absolute Häufigkeit h: Anzahl einer bestimmten Note relative Häufigkeit r: Anzahl einer bestimmten Note, gemessen an der Gesamtzahl der Noten

Skriptteufel Klausurworkshop

Musterlösung zur Übungsklausur Statistik

Mathematik für Biologen

Deskription, Statistische Testverfahren und Regression. Seminar: Planung und Auswertung klinischer und experimenteller Studien

Philipp Sibbertsen Hartmut Lehne. Statistik. Einführung für Wirtschafts- und. Sozialwissenschaftler. 2., überarbeitete Auflage. 4^ Springer Gabler

Klausur zur Vorlesung

Statistik Klausur Wintersemester 2013/2014 Hamburg, BITTE LESERLICH IN DRUCKBUCHSTABEN AUSFÜLLEN!

Klausur zu Methoden der Statistik I (mit Kurzlösung) Sommersemester Aufgabe 1

Welche der folgenden Aussagen sind richtig? (x aus 5) A Ein metrisches Merkmal, das überabzählbar viele Ausprägungen besitzt heißt diskret.

Prüfung zu Modul 26 (BA Bw) bzw. 10 (BA IB) (Wirtschaftsstatistik)

Lösungen. w58r4p Lösungen. w58r4p. Name: Klasse: Datum:

Prüfung im Anschluss an das Sommersemester 2002 am 11. Oktober 2002 von bis Uhr

Übungsblatt 4. Berechnen Sie für die statistischen Reihen die Varianzen, Kovarianzen und Korrelationskoeffizienten

Einführung in die computergestützte Datenanalyse

Analytische Lösung algebraischer Gleichungen dritten und vierten Grades

Einführung in die Statistik für Wirtschaftswissenschaftler für Betriebswirtschaft und Internationales Management

Bitte am PC mit Windows anmelden!

6 Korrelations- und Regressionsanalyse: Zusammenhangsanalyse stetiger Merkmale

Wahrscheinlichkeit und Statistik: Zusammenfassung

Statistik. Datenanalyse mit EXCEL und SPSS. R.01denbourg Verlag München Wien. Von Prof. Dr. Karlheinz Zwerenz. 3., überarbeitete Auflage

Deskriptive Statistik Aufgaben und Lösungen

Statistik I. 1. Klausur Wintersemester 2010/2011 Hamburg, Art der Anmeldung: STiNE FlexNow Zulassung unter Vorbehalt

Statistik. Einführung in die com putergestützte Daten an alyse. Oldenbourg Verlag München B , überarbeitete Auflage

Ziel: Breite der Verteilung auf der Achse beschreiben nur bei quantitativen Merkmalen mo glich hier:

Übungsblatt 9. f(x) = e x, für 0 x

Musterlösung zur Übungsklausur Statistik

Transkript:

1 Übersicht Teil 1 - deskriptive Statistik x = (x 1, x,, x n ) Stichprobe vom Umfang n Die x i heißen Stichprobenwerte Alle unterschiedlichen Werte, die unter den x i vorkommen, nennt man Merkmalswerte und bezeichnet sie mit x 1, x,, x k Wenn alle Werte, die man betrachtet, Zahlen sind, ist es sinnvoll, die x k aufsteigend anzuordnen, etwa Klausurnoten von x 1 = 1 bis x 5 = 5 Beispiel 01: Man sieht sich die Farben von fünf vorbeifahrenden Autos an: Der Reihe nach rot, blau, rot, rot, blau Das ist dann eine Stichprobe vom Umfang 5 mit x 1 = x 3 = x 4 = rot und x = x 5 = blau Es gibt zwei verschiedene (Merkmals-)Werte, x 1 = rot und x = blau Die Anzahl, wie oft ein bestimmtes Merkmal x k (Note, Farbe, Zahl oä) in der Stichprobe vorkommt, nennt man absolute Häufigkeit von x k und schreibt dafür kurz h k ( h für Häufigkeit) Der Anteil des Merkmals x k am Ganzen heißt relative Häufigkeit von x k, wird mit f k bezeichnet und durch f k = h k n berechnet Beispiel 0: Bei dem Autobeispiel von oben gab es drei rote und zwei blaue Wagen Rot war x 1, blau war x ; damit ist dann h 1 = 3 und h = Wenn drei von fünf Autos rot sind - wieviel Prozent sind das dann? rel Häufigkeit f 1 = 3 = 0, 6 = 60% rote und f 5 = = 0, 4 = 40% blaue Autos 5 Kurz: Absolute Häufigkeiten sind immer ganze Zahlen; relative Häufigkeiten sind Prozent- oder Kommazahlen mit Werten zwischen 0% und 100% bzw zwischen 0 und 1 Hinter den relativen Häufigkeiten stecken genau -Aussagen in Prozent (wieviel Prozent haben (genau) eine 3 geschrieben?) Wenn man nach höchstens fragt (etwa wieviel Prozent haben bestanden? = wieviel Prozent haben höchstens eine 4 geschrieben? ), braucht man die sogenannte relative Summenhäufigkeit F i

Das ist, wenn man die Merkmale x k aufsteigend sortiert hat, einfach die Summe der ersten i relativen Häufigkeiten, also F 1 =f 1, F =f 1 + f = F 1 + f, F 3 =f 1 + f + f 3 = F + f 3, F 4 =f 1 + f + f 3 + f 4 = F 3 + f 4 etc Merke: Die Einzelwerte werden mit einem kleinen f, die Summe wird mit einem großen F bezeichnet Die empirische Verteilungsfunktion braucht man im Prinzip nur, um F i grafisch darstellen zu können Der Graph dieser Verteilungsfunktion war eine Treppenfunktion (sah wie Treppenstufen aus); auf der x-achse wurden die x k und auf der y-achse die entsprechenden Wahrscheinlichkeiten (alle zwischen 0 und 1) eingetragen Links von x 1 war der y-wert 0 (und blieb es auch, Strich nach links), rechts vom größten x -Wert war der y-wert 1 (und blieb es auch, Strich nach rechts) Dazwischen sprang man an jeder x -Stelle immer eine Stufe hoch: Bei x 1 auf den Wert F 1, bei x auf den Wert F usw Am besten sieht man sich dazu mal die Seiten mit den Kindergrößen in der Materialiensammlung dazu an Lageparameter einer Stichprobe: Mittelwert x und Median x Den Mittelwert (umgangssprachlich: Durchschnitt) berechnet man am besten mit der einfachen Faustformel: Summe durch Anzahl (also Summe der x i -Werte durch n) Wenn ich nicht die Stichprobe selber kenne, aber die absoluten Häufigkeiten der verschiedenen Merkmale (etwa Einsen, 8 Zweien, 0 Dreien, 15 Vieren in der Klausur), dann brauche ich nicht mehr jeden Wert einzeln zu addieren, sondern kann einfach absolute Häufigkeit mal Merkmal rechnen (*viel* weniger Arbeit); nicht vergessen: Anschließend durch n teilen! Beispiel 03: Die Notensumme kann auch berechnet werden als h 1 x 1 + h x + h 3 x 3 + h 4 x 4 = 1 + 8 + 0 3 + 15 4 = 78, insgesamt + 8 + 0 + 15 = 5 Klausuren, also ist der Mittelwert der Noten (oder auch Notendurchschnitt) 78 = 3, 1 5

Der Median ist der mittlere oder auch Zentralwert der Stichprobe Bei einer ungeraden Anzahl von Meßwerten x i (dh n ungerade) ist der Median der Wert, der in der Mitte steht, nachdem ich die x i aufsteigend sortiert habe; also etwa der 3 Wert bei 5, oder der 5 bei 9 - das müssen aber wegen der Sortierung NICHT ZWINGEND x 3 und x 5 sein! (Könnte natürlich zufällig so sein, muß aber nicht) Bei einer geraden Anzahl von Meßwerten x i (dh n gerade) ist der Median der Mittelwert der beiden mittleren Werte (die vorher wieder aufsteigend sortiert wurden), also etwa x = 1 (dritter Wert + vierter Wert) bei n = 6 Werten Beispiel 04: Den Median praktisch bestimmen (vgl Ende erste Vorlesung) Möglichkeit 1: Grafisch Geht gut, wenn man den Graph der Verteilungsfunktion hat; dann sucht man sich auf der y-achse den Wert 0, 5, geht nach rechts, bis man auf den Graph trifft, und da dann senkrecht nach unten; der x-wert ist dann der Median Kommt man auf ein gerades Stück, wenn man nach rechts geht, nimmt man den Mittelwert zwischen den beiden x- Werten, die zu diesem geraden Stück gehören (der, wo das Stück anfängt, und der, wo es aufhört) Möglichkeit : Durch Ablesen in einer Tabelle, in der F k, die rel Summenhäufigkeit, drinsteht Der Wert x k, zu dem der erste Wert F k gehört, der größer ist als 0, 5, ist dann der Median; wenn F k genau den Wert 0, 5 annimmt, muß man wieder das arithmetische Mittel zwischen diesem x k und dem nächsten x -Wert bilden Man sieht sich besser mal MatSam I3 an 3 Streuungsmaße einer Stichprobe: Maße für die Spannbreite einer Stichprobe, namentlich Varianz s und Standardabweichung s Empirische Varianz einer Stichprobe: Ist die mittlere quadratische Abweichung der einzelnen Meßwerte vom Mittelwert, in Formeln: s n(x) = 1 n (x i x), wenn man nur die Varianz der Stichprobe wissen will (theoretischer, sprich: unbrauchbarer Wert) bzw s n 1(x) = 1 n 1 (x i x),

wenn man die Varianz des Ganzen (sog Grundgesamtheit) sucht (praktische Anwendungen brauchen s n 1 ) Zu der jeweiligen Varianz gehört die empirische Standardabweichung s, was einfach die Wurzel aus der Varianz ist Der Unterschied: Stichprobe von meinetwegen 1000 Autos hinsichtlich des Spritverbrauchs Bestimme die durchschnittliche Abweichung der Stichprobe s n - im Gegensatz zu: Schätze die durchschnittliche Abweichung der Menge aller Autos s n 1 Der Unterschied wird im dritten Teil der Vorlesung nochmal deutlich gemacht Beispiel 05: Varianz s n und damit auch die Standardabweichung s n praktisch bestimmen (vgl Anfang zweite Vorlesung) s n(x) = 1 (x n i x) : Umständlich, weil n mal Differenz bilden, dann quadrieren, dann aufaddieren Einfacher: s n(x) = 1 x n i x Statt jedesmal die Differenz zu bilden, muß man nur einen einzigen Wert abziehen Dazu sollte man folgende Arbeitstabelle benutzen: 4 x i x i Entscheidend sind die Werte in der letzten Zeile xi = n x x i Damit gilt: s n(x) = 1 n und s n = s n x i ( ) n x linker Wert: erst durch n, dann quadrieren n }{{} rechter Wert WICHTIG: Diese Arbeitstabelle kann man nur für s n, nicht für s n 1 benutzen!

5 Datentransformation: Macht man, um krumme und/oder große Werte x k glatt und/oder klein zu kriegen Aus den alten Werten x macht man transformierte, neue Werte y durch folgende Formel: y = x (kleinster x Wert) größter gemeinsamer Teiler der Abstände zwischen den x Werten Allerdings hat die mathematisch korrekte Transformation die Form y = ax + b, also muß man (vgl Beispiel in der Vorlesung ) etwa y = x 800 noch umformen zu y = x 800 = 1 x + ( 8) 100 100 }{{} 100 =a }{{} =b Wenn der alte Mittelwert x bekannt ist, dann kann man den transformierten Mittelwert mit y = a x + b berechnen Ist umgekehrt y bekannt (=aus den neuen, einfacheren y-werten berechnet worden), kann man den Mittelwert der ursprünglichen Daten mit x = y b a berechnen Wenn die alte Varianz s n(x) bekannt ist, dann kann man die transformierte Varianz mit s n(y) = a s n(x) berechnen Ist umgekehrt s n(y) bekannt (=aus den neuen, einfacheren y-werten berechnet worden), kann man die Varianz der ursprünglichen Daten mit s n(x) = 1 a s n(y) berechnen Datenzusammensetzung: Braucht man, wenn man zu alten Daten schon Mittelwert und Varianz kennt und jetzt neue Daten mit berücksichtigen will (also gesucht: Mittelwert und Varianz des ganzen Datensatzes, alte und neue Daten) Superhäßliche Formeln; stehen in der Formelsammlung Ich empfehle DRIN- GEND, sich dazu das gemachte Beispiel nochmal anzusehen, dann versteht man hoffentlich, wie man die Formeln anwendet Zweidimensionale Stichproben: Stichproben von Wertepaaren (x i, y k ) Wenn es etwa drei verschiedene x - und fünf verschiedene y -Werte gibt, dann gibt es 3 5 = 15 verschiedene Paare Die absoluten Häufigkeiten dieser Paare schreibt man in eine 3 5-Tabelle In die Spalte rechts davon schreibt man die Summe aller Zeileneinträge der jeweiligen Zeile und in die Zeile darunter die jeweilige Spaltensumme Alle

diese Einträge heißen Randverteilungen der Stichprobe Ganz unten rechts schreibt man die Summe der Einträge der allerletzten (Summen-)Zeile, was auch die Summe der Einträge der allerletzten (Summen-)Spalte sein soll - beides muß n ergeben! Die ganze Tabelle mit allen Summeneinträgen heißt Kontingenztafel der Stichprobe Wichtige Frage: Stehen die beiden Werte in einem Zusammenhang zueinander? (etwa Größe und Gewicht, Preis und Leistung, Lebenserwartung und Raucher/Nichtraucher) 6 Maß für den Zusammenhang der Merkmale x und y: s xy = 1 (x n 1 i x)(y i y) heißt empirische Kovarianz; kennt man die, kann man den empirischen Korrelationskoeffizienten r(x, y) berechnen durch r(x, y) = sxy s xs y = x i y i nxy ( )( ) = x i nx yi ny x i y i 1 n (nx)(ny) ( )( ) x i 1 n (nx) yi 1 n (ny) Man berechnet diesen Koeffizienten mit folgender Arbeitstabelle: x i y i x i yi x i y i = n x = n y x i y i xi y i Für dieses r gilt: 1 r 1; je näher r bei 1 oder 1 liegt, desto besser ist ein linearer Zusammenhang erkennbar; je näher r bei 0 liegt, desto weniger Zusammenhang besteht zwischen den beiden Merkmalen Beispiel 06: ( ) Sei (x, y) = (1, 6), (, 7), (3, 8), (4, 9), (5, 10) gegeben; wie gut hängen x und y zusammen? x i y i x i yi x i y i 1 6 1 36 6 7 4 49 14 3 8 9 64 4 4 9 16 81 36 5 10 5 100 50 5 x = 15 5 y = 40 x i = 55 y i = 330 xi y i = 130

x = 3, y = 8, r(x, y) = ( x i y i nxy )( x i nx y i ny ) = 130 5 3 8 (55 5 3 = 10 )(330 5 8 ) 10 10 = 1 perfekter linearer Zusammenhang, die Punkte liegen alle auf einer Geraden (nämlich auf y = x + 5) WICHTIG: Kombination aus Datentransformation und Korrelationskoeffizient, vgl Beispiel mit Ottomotor aus der Vorlesung! (Kurz: Der Korrkoeff der transformierten Daten unterscheidet sich höchstens im Vorzeichen von dem der nicht transformierten, ursprünglichen Daten) Beispiel 07: Werte aus Beispiel 6 mit transformiertem y: x i y i ŷ i = y i 6 x i ŷi x i ŷ i 1 6 0 1 0 0 7 1 4 1 3 8 9 4 6 4 9 3 16 9 1 5 10 4 5 16 0 5 x = 15 5 ŷ = 10 x i = 55 ŷ i = 30 xi y i = 40 x = 3, ŷ =, r(x, ŷ) = x i ŷ i nxŷ ( )( ) = x i nx ŷi nŷ 7 40 5 3 (55 5 3 )(30 5 ) = 10 10 10 = 1 =+r(x, y)

Regressionsrechnung: Gutes Schätzen von Zwischenwerten Beispiel 06: Wir verpacken Reiseproviant für Wanderer in Plastiktüten Für eine Person reicht eine Tüte, für 10 Personen brauche ich 4 Tüten, für 0 sogar 6 Tüten ( x : Anzahl Personen, y : Anzahl Tüten, Wertepaare (1; 1), (10; 4), (0; 6)) Ich hab eine Gruppe von 18 Leuten, wieviele Tüten brauche ich? (Und wer muß sie tragen?) Ich hab nur noch 3 Tüten; wer nix zu essen kriegt, will nicht mit Wieviele Leute können loswandern? Trick: Wir basteln uns eine Gerade (oder eine Parabel), die möglichst gut durch die gegebenen Punkte (= Werte) durch und/oder möglichst nahe an ihnen vorbeigeht; dann können wir fehlende Punkte schätzen, indem wir einfach behaupten, sie würden genau auf der Gerade (oder der Parabel) draufliegen Erst die Gerade: ŷ = a + bx Man berechnet zunächst b, den sogenannten empirischen Regressionskoeffizienten, durch b = sxy s x = x i y i 1 n (n x)(nȳ) x i 1 n (n x) 8 mit einer Arbeitstabelle wie beim emp Korrelationskoeffizienten (man braucht die y i -Spalte aber nicht) Dann berechnet man a durch a = ȳ b x Ergebnis: Regressionsgerade fertig Im Beispiel 6 gilt: x i y i = 161, n x = 31, nȳ = 11, b = 161 1 3 31 11 501 1 3 (31) = 47,333 180,667 = 0, 6, x i = 501 n x = 31, n = 3 x = 31 3 = 10, 333, nȳ = 11, n = 3 ȳ = 11 3 = 3, 667 a = ȳ b x = 3, 667 0, 6 10, 333 = 0, 960 ẙ = 0, 96 + 0, 6x Die Antworten lauten also: x = 18 y = 0, 96 + 0, 6 18 = 5, 676, ich brauche also mindestens 5,676, also 6 Tüten für 18 Leute y = 3 3 = 0, 96 + 0, 6x x = 3 0,96 = 7, 786, ich kann also höchstens 0,6 7,786 Leute ernähren, also kommen nur 7 Leute mit

9 Jetzt die Parabel: ŷ = a + bx + cx Um a, b, c zu berechnen, muß man folgendes 3 3 - Gleichungssystem lösen, am besten per Gauß: a n x 0 i + b n x 1 i + c n x i = n y i x 0 i a n x 1 i + b n x i + c n x 3 i = n y i x 1 i a n x i + b n x 3 i + c n x 4 i = n y i x i Wenn man es etwas umformt, sieht es dann so aus: an + b n x i + c n x i = y i a n x i + b n x i + c n x 3 i = n y i x i a n x i + b n x 3 i + c n x 4 i = n y i x i Und die zugehörige Arbeitstabelle ist: x i x i x 3 i x 4 i y i y i x i y i x i xi x i x 3 i x 4 i yi yi x i yi x i Im Beispiel 6 gilt: n = 3, x i = 31, x i = 501, x 4 i = 170001, y i = 11, x 3 i = 9001, y i x i = 801, n y i x i = 161, 3a + 31b + 501c = 11 31a + 501b + 9001c = 161 501a + 9001b + 170001c = 801 a = 34 57 = 0, 596, b = 39 95 = 0, 411, c = 85 ẙ = a + bx + cx = 0, 596 + 0, 411x 0, 007x = 0, 007 Nochmal die Antworten zu Bsp 6, jetzt bei einer Regressionsparabel: x = 18 y = 0, 596 + 0, 411 18 0, 007 18 = 5, 76, also bräuchte ich hier mindestens 5,76, also 6 Tüten für 18 Leute; y = 3 3 = 0, 596 + 0, 411x 0, 007x x + 0,411 0,007 x + 0,596 3 0,007 = 0 x 58, 714x + 343, 49 = 0; (p, q-formel) x 1, = 9, 357 ± 9, 357 343, 49 = 9, 357 ±, 768

10 x 1 = 5, 15 x = 6, 589; unsinnigerweise lautet hier das Ergebnis: Entweder kann ich nur 6 oder mindestens 5 Leute mitnehmen, wenn ich drei Tüten habe Die zweite Lösung ist natürlich Blödsinn und kommt dadurch zustande, daß man versucht hat, eine Parabel aus nur drei Werten zu erzeugen - generell: Versucht immer, erstmal ne Gerade draus zu machen; das macht viel Sinn, wenn man nur wenige Werte hat oder der Korrelationskoeffizient nahe ±1 liegt Hat man viele Werte und ist der Korrkoeff zusätzlich beinahe 0, muß man wohl oder übel die Parabel aufstellen