Anwendung von Statistik in Excel Deskriptive Statistik und Wirtschaftsstatistik Wintersemester 08/09 Kai Schaal Universität zu Köln
Organisatorisches und Einleitung (1) Was, wann, wo? Anwendung von Statistik 1 in Excel Mittwoch 19.30 Uhr 21.00 Uhr Hörsaal XIa Statistik 1, Tutorium 1 2 2/ 34
Organisatorisches und Einleitung (2) Wo findet man Infos und Materialien? Lehrstuhl für Wirtschafts- & Sozialstatistik http://www.uni-koeln.de/wisofak/wisostatsem/studium/grundstudium.htm Aufgaben und Kurzlösungen Tutoriums-Unterlagen www.schaal-din.de kai@schaal-din.de Statistik 1, Tutorium 1 3 3/ 34
Organisatorisches und Einleitung (3) Literatur Bomsdorf, E., E. Gröhn, K. Mosler u. F. Schmid: Definitionen, Formeln und Tabellen zur Statistik. 6. Auflage Köln 2008 Bomsdorf, E.: Deskriptive Statistik. 12. Auflage Lohmar Köln 2007 Excel-Kurs Unterlagen von Michael Kaluza (www.schaal-din.de) Rechenzentrum Universität zu Köln Statistik 1, Tutorium 1 4 4/ 34
Organisatorisches und Einleitung (4) Software Microsoft Excel Microsoft Office, http://www.wiso.unikoeln.de/aspsamp/dv/inhalt.asp?a=sw&b=msdnaa Alternativ auch OpenOffice, kostenloser Download unter http://download.openoffice.org/common/instructions.html Statistik 1, Tutorium 1 5 5/ 34
Organisatorisches und Einleitung (5) Termine und Aufgaben Aufgaben für das Tutorium auf den Seiten des Lehrstuhls Aufgaben werden teilweise am Projektor und teilweise in Excel bearbeitet Statistik 1, Tutorium 1 6 6/ 34
Das Summenzeichen (1) Formel: f(x) = Bsp.: SUMME (erste Zelle : letzte Zelle) f(x) = SUMME(C6:C14) f(x) = Bsp.: SUMME (erste Zelle ; zweite Zelle ; dritte Zelle ; ) f(x) = SUMME (C6;C3;Z3) Bereiche können durch Festhalten und Ziehen der Maus markiert werden Einzelne Zellen können durch Festhalten von STRG und gleichzeitiges Anklicken der gewünschten Zellen markiert werden Statistik 1, Tutorium 1 7 7/ 34
Das Summenzeichen (2) Statistik 1, Tutorium 1 8 8/ 34
Das Produktzeichen (1) Formel: f(x) = Bsp.: PRODUKT (erste Zelle : letzte Zelle) f(x) = PRODUKT(C6:C14) f(x) = Bsp.: PRODUKT (erste Zelle ; zweite Zelle ; dritte Zelle ; ) f(x) = PRODUKT (C6;C3;Z3) Bereiche können durch Festhalten und Ziehen der Maus markiert werden Einzelne Zellen können durch Festhalten von STRG und gleichzeitiges Anklicken der gewünschten Zellen markiert werden Statistik 1, Tutorium 1 9 9/ 34
Das Produktzeichen (2) Statistik 1, Tutorium 1 10 10/ 34
Aufgabe 0.9 (1) siehe Excel-Beispiel Bezüge absolut relativ durch F4-Taste festlegen, Bsp.: C4, $C$4, C$4, $C4 $-Zeichen setzt Zeile, Spalte oder beides fest Benennung von Zellen zur Übersicht Zelle anklicken und oben links im Namenfeld gewünschten Namen eingeben, dann Enter drücken Zellennamen können in Formeln verwendet werden Statistik 1, Tutorium 1 11 11/ 34
Aufgabe 0.9 (2) Zelle heißt nicht G5, sondern Zinssatz Zelle heißt nicht F5, sondern Einzahlung Bei Änderungen der Werte in den Feldern Einzahlung bzw. Zinssatz verändern sich aufgrund der Einbindung in die Formeln automatisch die Jahresbeträge Relative Bezüge zur jeweils darüber liegenden Zelle Verwendung der Namen Einzahlung und Zinssatz in Formeln 12 Statistik 1, Tutorium 1 12/ 34
Aufgabe 0.9 (3) Benennung von Zellen im Namenfeld (Einzahlung, Jahre, Zinsfaktor) Formel: Anzahl [Bsp. f(x)=anzahl(b:b)] zählt Anzahl der Zahleneinträge in Spalte B Einbindung der Formel zur Berechnung für geometrische Reihen Einzahlung*(Zinsfaktor^Jahre-1)/(Zinsfaktor-1) siehe Formelsammlung Seite 67 13 Statistik 1, Tutorium 1 13/ 34
Merkmale und Daten (1) Grundgesamtheit Merkmalsträger Merkmalsträger Merkmal Merkmal Merkmalsausprägung Merkmalsausprägung Statistik 1, Tutorium 2 14/34
Merkmale und Daten (2) Beispiel zu Folie 1 2 Personen (Martha und Fritz) Martha Fritz Geschlecht Geschlecht weiblich männlich Statistik 1, Tutorium 2 15/34
Aufgabe 1.2 (1) Bestandsmassen: abgegrenzt durch Zeitpunkt, Einwohner der Stadt Köln (am 01.01.08) Bewegungsmassen: abgegrenzt durch Zeitraum, Eheschließungen (im Jahre 2008) häufbar: Merkmalsträger kann mehrere Ausprägungen haben, Studienfach, Staatsangehörigkeit, Freizeitbeschäftigung nicht häufbar: nur eine Ausprägung pro Merkmalsträger; Alter, Geschlecht Statistik 1, Tutorium 2 16/34
Aufgabe 1.2 (2) a) Geschlecht Freitzeitbeschäftigung Familienstand Beruf Religionszugehörigkeit Staatsangehörigkeit Wertungsnote beim Eiskunstlauf Steuerklasse Studienfach Hotelkategorie Nicht häufbar Häufbar Nicht häufbar Häufbar Nicht häufbar Häufbar Nicht häufbar Häufbar Häufbar Nicht häufbar Statistik 1, Tutorium 2 17/34
Aufgabe 1.2 (3) b) Bevölkerung Umsatz Anzahl Arbeitslose Autoproduktion Investitionen Anlagevermögen Zinsen aus Vermögen Geburten und Sterbefälle Zugelassene Kraftfahrzeuge Einkommen Bestandsmasse Bewegungsmasse Bestandsmasse Bewegungsmasse Bewegungsmasse Bestandsmasse Bewegungsmasse Bewegungsmasse Bestandsmasse Bewegungsmasse Zu- & Fortzüge, Geburten & Sterbefälle Entlassungen & Einstellungen Zu- & Abgänge, Investitionen & Abschreibungen Zulassungen & Abmeldungen Statistik 1, Tutorium 2 18/34
Aufgabe 2.3 Tabellen: Nutzung von f(x)=summe(etc.) Nutzung eines absoluten Bezugs in Spalte D ($C$11) Nutzung relativer Bezüge in Spalte E ( immer die obere Zelle plus die linke Zelle ) Zeichnung der empirischen Verteilungsfunktion durch Einfügen eines Diagramms und Anzeigen des Fehlerindikators (x) Funktioniert hier nur, weil Abstände auf der x-achse immer gleichgroß sind, ansonsten Trick : Linien manuell nachzeichnen, siehe Aufgabe 2.5 vgl. A 2.7 und entsprechende Excel-Datei sowie Anhang Kapitel 2 Statistik 1, Tutorium 2 19/34
Aufgabe 2.5 Tabellen: Nutzung von f(x)=summe(etc.) Nutzung eines absoluten Bezugs in Spalte C ($B$11) Nutzung relativer Bezüge in Spalte D ( immer die obere Zelle plus die linke Zelle Grafik nur über Trick möglich Markieren des Quellbereichs, Diagramm einfügen, Liniendiagramm nachträgliches Zeichnen der Linien per Hand, vorher automatisch erstellte Linie löschen Ansicht Symbolleisten Zeichen Alternative zum Säulendiagramm Stabdiagramm, ohne Trick möglich vgl. cdplayer.xls und Anhang Kapitel 2 Statistik 1, Tutorium 2 20/34
Aufgabe 2.8 Funktion Wenn f(x)=wenn(...;...;...) prüft einen bestimmten Sachverhalt und zeigt einen dem jeweiligen Ergebnis entsprechend definierten Text an Bsp: Wenn in Zelle XY der Wert Z steht, dann soll Text 1 erscheinen, sonst (wenn in Zelle XY also nicht der Wert Z steht) soll Text2 erscheinen, hier benutzt zur Bestimmung der Quantile (Hilfsspalte) Funktion Sverweis f(x)=sverweis(...;...;...;...) durchsucht die linke Spalte einer zuvor definierten Matrix nach einem bestimmten Wert und gibt den entsprechenden (also in der gleichen Zeile stehenden) Wert einer ebenfalls zuvor festgelegten Spalte der Matrix wieder hier benutzt, um die Zelle zu finden, in der zum ersten Mal ja erscheint (Hilfsspalte zur Bestimmung der Quantile), um dann den Wert aus der zweiten Hilfsspalte weiter rechts wiederzugeben, der in der gleichen Zeile steht wie die gefundene Zelle Statistik 1, Tutorium 3 21/34
Aufgabe 2.11 Funktion Zählenwenn f(x)=zählenwenn(...;...) zählt die Anzahl der Zellen eines definierten Bereichs, in denen ein bestimmter Wert steht Bsp: verwendet, um aus der Urliste die Anzahl der Zellen herauszufinden, in denen jeweils der gleiche Benzinverbrauch steht Funktion UND Beispiel f(x)=wenn(und(zelle1=x;zelle2=y);dann;sonst) fügt Bedingungen hinzu hier verwendet, um bei der Wenn-Funktion das Ergebnis nicht nur von einer Bedingung, sondern auch von einer zweiten Bedingung abhängig zu machen Statistik 1, Tutorium 3 22/34
Aufgabe 3.1 3 verschiedene Methoden zur Mittelwertberechnung 1. per Hand, Produkt aus Merkmalsausprägung und absoluter Häufigkeit für jedes Merkmal und dann Aufsummierung 2. und 3. Funktion Summenprodukt, f(x)=summenprodukt(matrix1,matrix2) Bsp: Hier benutzt, um die Merkmalsausprägung aus der Merkmalsspalte (Matrix 1) mit der jeweils zugehörigen, absoluten Häufigkeit (Matrix 2) zu multiplizieren und anschließend die Summe dieser Produkte zu bilden Quantile wieder per Funktion Sverweis, siehe Unterlagen der letzten Tutorien Statistik 1, Tutorium 4 23/34
Aufgabe 3.3 Funktion Mittelwert f(x)=mittelwert(bereich) gibt das arithmetische Mittel einer Urliste (Bereich) wieder Funktionen MIN und MAX) f(x)=min(bereich) bzw. f(x)=max(bereich) bestimmt den kleinsten bzw. größten Wert einer Urliste hier verwendet, um die Boxplots zeichnen zu können Boxplots Punktdiagramm ohne Verbindungslinien einfügen, Datenbereich Y immer die gleiche Zahl (pro Boxplot eine), Bsp: zwei Boxplots Datenbereich Y von Boxplot 1 nur Einsen, Datenbereich Y von Boxplot 2 nur Zweien Datenbereich X die jeweiligen Minima, Maxima und Quartile Einzeichnen der Verbindungslinien über Ansicht, Symbolleisten, Zeichnen Statistik 1, Tutorium 4 24/34
Aufgabe 2.13 Histogramm Punktdiagramm mit Verbindungslinien ohne Punkte Y-Werte = empirische Dichten X-Werte jeder X-Wert nimmt unterschiedliche Y Werte an, der erste und der letzte jeweils 2, dazwischen liegende jeweils 3, dementsprechend Tabelle anlegen empirische Verteilungsfunktion bei stetigen Daten Punktdiagramm mit Verbindungslinien ohne Punkte Y-Werte = F(x) aus Tabelle, wie sonst auch X-Werte = Obergrenzen Achtung: Ergänzung der untersten Grenze der ersten Klasse und Zuordnung von F(x)=0 Statistik 1, Tutorium 4 25/34
Aufgabe 3.7 3 verschiedene Möglichkeiten der Varianzberechnung 1. per Hand 2. über die Funktion f(x)=summenprodukt (siehe Unterlagen der letzten Tutorien) 3. über die Funktion Varianzen, f(x)=varianzen(bereich) berechnet die Varianz von Zahlen innerhalb eines Bereichs ACHTUNG: Unterscheide von varianz, varianza und varianzena, hiermit werden andere Varianzen berechnet! Statistik 1, Tutorium 5 26/34
Aufgabe 3.6 Funktion Wurzel f(x)=wurzel(zahl oder weitere Funktion) hier verwendet, um die Wurzel aus dem Summenprodukt zu ziehen f(x)=wurzel(summenprodukt(matrix1;matrix2)) Statistik 1, Tutorium 6 27/34
Aufgabe 3.10 Empirische Verteilungsfunktion siehe Unterlagen der vorherigen Tutorien (Ergänzung der zwei Werte) (Punktdiagramm mit Verbindungslinien) Histogramm siehe Unterlagen der vorherigen Tutorien (jeder x-wert nimmt 3 y-werte an, Ausnahme: erster und letzter Hilfstabelle für Histogramme anlegen) (Punktdiagramm mit Verbindungslinien, x- und y-datenbereich festlegen) Statistik 1, Tutorium 6 28/34
Aufgabe 4.2 Konzentrationsberechnung Anlegen von Hilfstabellen analog zum Anlegen von Häufigkeitstabellen gleiche Operationen in Excel Beachte die absteigende Ordnung! Statistik 1, Tutorium 6 29/34
Aufgabe 4.6 Konzentrationskurve Punktdiagramm mit Verbindungslinien Ergänzung des Punktes (0;0) Einzeichnen der Winkelhalbierenden durch Hinzufügen einer zweiten Reihe mit zwei Punkten (0;0) und (n;1) Einzeichnen eines dicken Rahmens Skalierung der Achsen, x-achse von 0 bis n, y-achse von 0 bis 1 Lorenzkurve Punktdiagramm mit Verbindungslinien Ergänzung des Punktes (0;0) Einzeichnen der Winkelhalbierenden durch Hinzufügen einer zweiten Reihe mit zwei Punkten (0;0) und (1;1) Einzeichnen eines dicken Rahmens Skalierung der Achsen, x-achse und y-achse von 0 bis 1 x-achsen-beschriftungen als Brüche darstellen lassen Statistik 1, Tutorium 7 30/34
Aufgabe 5.5 n-te Wurzel in Excel für die Darstellung der n-ten Wurzel in Excel gibt es keine extra Funktion Nutzung von (x) = x 0,5 oder allgemein t (x) = x (1/t) Z.B. =Zelle^(1/(2006-1998) = 5 (Zelle) hier verwendet, um Zuwachsraten zu berechnen Statistik 1, Tutorium 8 31/34
Aufgabe 6.4 absolute und relative Bezüge setzen von $-Zeichen zur Fixierung einer bestimmten Zelle bisher wurden einzelne Zellen komplett fixiert Beispiel: $C$4, Dollar vor der Spalte C fixiert Spalte C, Dollar vor der Zeile 4 fixiert Zeile 4, oft bei Häufigkeitstabellen benutzt nun soll entweder nur die Spalte oder nur die Zeile fixiert werden entweder Dollarzeichen per Hand eintragen oder F4-Taste mehrmals drücken bis entweder nur die Zeile oder nur die Spalte fixiert ist Beispiele: $C4 bedeutet, dass Spalte C fixiert ist, Zeile 4 aber nicht C$4 bedeutet, dass Spalte C nicht fixiert ist, aber Zeile 4 Statistik 1, Tutorium 10 32/34
Aufgabe 6.9 Berechnung der Kovarianz zweier Merkmale in Excel die Berechnung muss nicht per Hand erfolgen, Excel verwendet eine Formel f(x)=kovar Beispiel f(x)=kovar(matrix1;matrix2) hier verwendet, um den Korrelationskoeffizienten von Spearman per Hand zu berechnen Berechnung des Korrelationskoeffizienten von Spearman in Excel auch hier muss die Berechnung nicht per Hand erfolgen Formel: f(x) = korrel Beispiel f(x)=korrel(matrix1;matrix2) Statistik 1, Tutorium 10 33/34
Ende Viel Erfolg bei der Klausur! Statistik 1, Tutorium 12 34/34