Quantitative Methoden

Größe: px
Ab Seite anzeigen:

Download "Quantitative Methoden"

Transkript

1 Prof. Dr. Peter Schmidt SoSe 010 Volkswirtschaftslehre und Statistik : (041) Fax: (041) Peter.Schmidt@hs-bremen.de QM Quantitative Methoden Master of Business Administration Modul, Unit Wissenschaftliche Fragestellungen und Methoden Vermittlung statistisch-methodischen Wissens Gewinnung praktischer Erfahrung in der EDV-Umsetzung Dokumentation der verwendeten Methoden Hilfe bei der täglichen Arbeit

2 Forschungsmethoden Seite i Prof. Dr. Peter Schmidt SoSe 010 Volkswirtschaftslehre und Statistik : (041) Fax: (041) Peter.Schmidt@hs-bremen.de QM Quantitative Methoden Master of Business Administration Modul, Unit A Zielsetzungen Wissenschaftliche Fragestellungen und Methoden Vermittlung statistisch-methodischen Wissens Gewinnung praktischer Erfahrung in der EDV-Umsetzung Außendarstellung durch Dokumentation der verwendeten Methoden Hilfe bei der täglichen Arbeit B Lehr- und Lernmethoden Durch Übungen und Gruppenarbeiten und -präsentationen wird der im seminaristischen Unterricht vorgestellte Stoff durch die Studierenden selbstständig vertieft und anwendungsorientiert erlernt. Seminaristischer Unterricht Vermittlung theoretischen Wissens Übung am PC Vertiefung der Inhalte und PC-Praxis Präsentationen Eigenständiges Erarbeiten und Darstellung durch Studierende Peter Schmidt, Hochschule Bremen 010

3 Forschungsmethoden Seite ii C Inhalt der Lehreinheit 1 Quantitative Methoden im täglichen Einsatz 1.1 Definitionen Empirische Forschung / Statistik / Research Methods 1. Häufigkeiten und grafische Darstellungen 1..1 Eindimensionale und mehrdimensionale Häufigkeitsdarstellungen 1.. Besondere Häufigkeitskonzepte 1.3 Lagemaße (Mittelwerte) und Streuungsmaße 1.4 Zusammenhänge zwischen mehreren Merkmalen Zusammenhangmaße 1.4. Regressionsanalyse 1.5 Zeitreihen und Indexzahlen Weitere Themen.1 Schließenden Statistik und Statistische Tests. Durchführung und Darstellung räumlicher Analysen (Business Mapping).3 Multivariate Analysemethoden.4 Übersicht und Demonstration von Software.4.1 Auswertungen und Darstellungen in Excel.4. Statistikprogramme (z.b. SPSS, GrafStat, Stata, Eviews,...) Grundlagen und Möglichkeiten der Datenhaltung und -organisation in Statistikprogrammen statistische Auswertungen - interaktiv und im Programm-Modus Grafische Darstellungsmöglichkeiten.4.3 Ausblick auf weitere Programme und Anwendungsmöglichkeiten 3 Übungen am PC und Fallbeispiele Peter Schmidt, Hochschule Bremen 010

4 Forschungsmethoden Seite iii D Literaturhinweise Black, Thomas: Understanding Social Science Research, 00 Bourier, Günther: Beschreibende Statistik und Wahrscheinlichkeitsrechung und Schließende Statistik, Wiesbaden 008 Backhaus, Erichson, Plinke, Weiber, Multivariate Analysemethoden: Eine anwendungsorientierte Einführung, Heidelberg, 005 Bamberg, Günter und Baur, Franz: Statistik, München 007 (mit Arbeitsbuch) Bleymüller, Josef; Gehlert, Günther und Gülicher, Herbert: Statistik für Wirtschaftswissenschaftler, München 008 Hippmann, Hans-Dieter: Statistik für Wirtschafts- und Sozialwissenschaftler, 007 Kirk, Roger: Statistics - An Introduction, 1998 Krämer, Walter: Statistik verstehen und: So lügt man mit Statistik, München, 001, 000 Puhani, Josef: Statistik - Einführung mit praktischen Beispielen, Würzburg 005 Scharnbacher, Kurt: "Statistik im Betrieb", Wiesbaden 004 Schwarze, Jochen: Grundlagen der Statistik, Bände I und II, Herne/Berlin 005/06 Praktisches am PC: Bühl, Achim und Zöfel Peter, SPSS Vers. 1 Einführung in die moderne Datenanalyse unter Windows, 004 Brosius, Felix: SPSS 14 - Professionelle Statistik unter Windows, 006 Erben, Wilhelm: Statistik mit Excel 5 oder 7, München 004 Monka, Michael Schöneck, Nadine und Voß, Werner: Statistik am PC - Lösungen mit Excel, 008 (005 / frühere Auflage für Excel bis Version 003) auch einige der oben genannten Bücher beschreiben die Anwendung der Methoden in Softwaremethoden, z.b. Black, Backhaus u.a. Diese Hinweise sollen Ihnen erleichtern, sich einen eigenen Eindruck von der Fülle statistischer Literatur zu machen. Es gibt nicht das Statistik-Buch, weder allgemein noch auf diese Veranstaltung bezogen. Es wird stark empfohlen, sich verschiedene Bücher anhand konkreter Themen anzuschauen und dann persönlich zu entscheiden, welches dem eigenen Stil entspricht! E Leistungsnachweis: Teil der Klausur am Ende des Moduls F Unterrichtssprache: Deutsch, teilweise englische Ergänzungen Peter Schmidt, Hochschule Bremen 010

5 Quantitative Methoden Seite iv G Inhalt der Unterlagen 1. Quantitative Methoden der deskriptiven Statistik Seite 1 Praxisbezogene Darstellung statistischer Methoden anhand von Beispielen, die in Zusammenhang mit den begleitenden Excel-Tabellen erarbeitet werden können.. Ablauf einer statistischen Untersuchung + Fallbeispiel Seite 1 Studierendenbefragung an der Fakultät Wirtschaftswissenschaften 3. Material zur Schließenden Statistik Seite 3 4. Business Mapping durch Geoinformationssysteme Seite 56 Darstellung räumlicher Analysemethoden und deren Anwendung in der volks- und betriebswirtschaftlichen Anwendung 5. Forschungsprojekt als Fallstudie: Seite 65 Regional Economic Impacts of Large Cultural Events Does public funding of large cultural events make sense from a regional economic point of view? 6. Formelsammlung: Seite 87 Die Unterlagen werden im Verlauf der Lehrveranstaltung erweitert um Materialien zu Übungen und Fallbeispielen, die jeweils auch über die Veranstaltungs-Webseite verfügbar sind. Peter Schmidt, Hochschule Bremen 010

6 Quantitative Methoden Deskriptive Statistik - Seite 1 - MBA Quantitative Methoden Deskriptive Statistik Peter Schmidt, Hochschule Bremen Inhalt 1 Quantitative Methoden; Statistik Definitionen Was ist Statistik? Häufigkeiten und grafische Darstellungen Eindimensionale und mehrdimensionale Häufigkeitsdarstellungen Besondere Häufigkeitskonzepte Lagemaße (Mittelwerte) und Streuungsmaße Zusammenhänge zwischen mehreren Merkmalen Zusammenhangmaße Regressionsanalyse Zeitreihen und Indexzahlen...17 Literaturhinweise und Weitere Informationen Schlagwortindex... 0 Hinweis: Dieser Beitrag ist erschienen in: Schmidt, Peter: Betriebsstatistik ; in: Dey und Grauvogel (Hrsg.): "Praxishandbuch Wirtschaftswissen von A-Z für die erfolgreiche Betriebsratspraxis", Kissing, Peter Schmidt, Hochschule Bremen MBA

7 Quantitative Methoden Deskriptive Statistik - Seite - Abbildungen: Abbildung 1 Verdichtung von Information... 4 Abbildung Skalierung von Merkmalen... 5 Abbildung 3 Absolute Häufigkeiten und zweidimensionales Säulendiagramm... 7 Abbildung 4 Kreisdiagramme zur Darstellung von relativen Häufigkeiten... 7 Abbildung 5 Einfache Häufigkeiten und Summenhäufigkeiten... 8 Abbildung 6 Verteilungen mit unterschiedlicher Streuung Abbildung 7 Abweichungen der Einzelbeobachtungen vom Mittelwert Abbildung 8 xy-diagramm für Zusammenhang Überstunden / Energieverbrauch... 1 Abbildung 9 Stärke von Zusammenhängen und Werte des Korrelationskoeffizienten.. 1 Abbildung 10 Regressionsgrade Überstunden / Energieverbrauch Abbildung 11 Regressionsanalyse Abbildung 1 Regressionsanalyse mit multiplen Einflussfaktoren Abbildung 13 Umsatzentwicklung im Zeitablauf Abbildung 14 Einkommensentwicklung absolut und als Indexzahlen Verzeichnis der Tabellen: Tabelle 1 Personaldaten (Beispiel für Ursprungsdaten)... 6 Tabelle Eindimensionale Häufigkeitstabelle Anzahl Befragte nach Berufsstatus... 6 Tabelle 3 Zweidimensionale Häufigkeitstabelle Befragte nach Alter und Geschlecht.. 6 Tabelle 4 Prozentuale Häufigkeiten Befragte nach Alter und Geschlecht... 7 Tabelle 5 Mittelwerte... 9 Tabelle 6 Beispiel für Lage- und Streuungsmaße Tabelle 7 Wertetabelle für Zusammenhang Überstunden / Energieverbrauch Tabelle 8 Zusammenhangmaße für unterschiedliche Skalenniveaus Tabelle 9 Zeitreihe einer Umsatzentwicklung Tabelle 10 Entwicklung von Unternehmer- und Arbeitnehmereinkommen Peter Schmidt, Hochschule Bremen MBA

8 Quantitative Methoden Deskriptive Statistik - Seite 3-1 QUANTITATIVE METHODEN; STATISTIK Statistik ist ein Gebiet, das mit vielen Vorbehalten und Vorurteilen behaftet ist. Sie dies die Sorge vor zu viel Mathematik, Formeln und anderem schwer verständlichem. Oder seien es Redensarten, die ein unbedarftes Herangehen an dieses Gebiet erschweren, wie der berühmte Ausspruch (Winston Churchill zugeschrieben) Ich traue keiner Statistik, die ich nicht selbst gefälscht habe oder der beliebten Steigerung Lüge gemeine Lüge Statistik. Trotzdem begegnet uns Statistik an vielen Stellen des täglichen (betrieblichen) Lebens und es ist wichtig, damit umgehen zu können. Es ist nicht nötig, anhand kompliziert klingender Begriffe davon auszugehen, dass das Gegenüber schon Recht haben wird, wenn man in der Lage ist, fachkundig nachzufragen und Aussagen kritisch zu hinterfragen. Nicht alle statistischen Modelle und Kennzahlen sind in allen Zusammenhängen und für alle Arten von Daten anwendbar. Aber nicht nur die Situation, vorgelegte statistische Auswertungen verstehen und (kritisch) interpretieren zu müssen, kann in der täglichen Praxis auftauchen, sondern auch der Wunsch, vorhandene Daten selbst auszuwerten und anschaulich darzustellen. Dies kann die (grafische) Aufbereitung zur Präsentation der Daten sein, aber auch die Analyse von statistischen Zusammenhängen bzw. Unterschieden von Daten oder Sachverhalten. Begleitende Excel-Datei Daher werden in diesem Skript wichtige betriebsstatistische Methoden nicht nur vorgestellt, sondern können mit dem PC selbst nachvollzogen werden, da sich auf der Webseite unter QM / mkm eine Excel-Datei befindet, mit der die Beispiele aus dem Text nachvollzogen werden können. Es wird hier beispielhaft das Tabellenkalkulationsprogramm Excel (aus dem Office Paket der Firma Microsoft) verwendet, da dieses eine sehr große Verbreitung hat. In anderen Tabellenkalkulationen können die dargestellten Methoden ebenso verwendet werden. Darüber hinaus gibt es spezielle Statistik-Programme, die die Verarbeitung von Daten zwar erleichtern, für den täglichen Gebrauch jedoch i.d.r. nicht notwendig sind, z.b. SPSS, SAS, Statgraphics, u.v.m. Auf diese wird hier nicht eingegangen. Das vorliegende Material will mehr bieten als nur die Aufzählung verschiedener Methoden und deren kurze verbale Beschreibung. Ziel ist eine lesbare und alltagstaugliche Übersicht über gängige Methoden und nicht eine mathematisch umfassende Darstellung der Statistik. Auf Formeln wird weitgehend verzichtet; zur Vergleichbarkeit mit bzw. Orientierung in Nachschlagewerken werden die üblichen Symbole (Buchstaben, Abkürzungen) verwendet. Am Ende des Artikels findet sich ein Schlagwortindex, der das Auffinden einzelner Begriffe erleichtern soll. Für tiefergehende Fragen sind am Schluss einige Literaturhinweise zusammengestellt. Ziel dieses Skriptes ist es, zu zeigen, dass quantitative Methoden in der täglichen Arbeit v.a. durch den Einsatz von EDV-Programmen einfach zu erstellen und dadurch praktisch und nutzbringend einsetzbar sind. Peter Schmidt, Hochschule Bremen MBA

9 Quantitative Methoden Deskriptive Statistik - Seite 4 - beschreibende Statistik schließende Statistik Verdichtung von Datenmaterial 1.1 Definitionen Was ist Statistik? Statistik ist ein Hilfsmittel, ein Werkzeug zur systematischen Darstellung und Auswertung von Zahlenmaterial, meist kurz als Daten bezeichnet. Mit statistischen Methoden werden Kennzahlen gebildet, die dabei helfen, vorliegendes Datenmaterial - vor allem aber die entsprechenden Sachverhalte - möglichst objektiv zu bewerten. Es gibt zwei grundlegende Ziele statistischer Analysen: Beschreibung vorhandener Daten: Beschreibende oder Deskriptive Statistik Es liegen Daten (Zahlen) vor, die ausgewertet werden sollen: z.b. Alter und Einkommen von 0 Mitarbeitern oder 100 Gewichtsangaben von Werkstücken oder Umsatzzahlen in 16 Quartalen,... usw. Ableiten allgemeiner Aussagen Schließende oder aus einer kleinen Auswahl von Daten Induktive Statistik Es liegt nur eine (kleine) Stichprobe von Daten vor, aus diesen sollen allgemeingültige Schlüsse über die Grundgesamtheit aller Daten gezogen werden: z.b.: Aus den Angaben über Alter, Geschlecht und Provision von 50 Angestellten soll auf die entsprechenden Werte aller 800 Mitarbeiter geschlossen werden oder aus den Umsatzentwicklungen von 0 Betrieben soll die Branchenentwicklung abgeschätzt werden. Dieser Artikel behandelt die beschreibende Statistik. Verdichtung von Informationen abhängig von der Skalierung der Daten Eine Hauptaufgabe statistischer Methoden ist es, die oft sehr große Fülle von Informationen auf wenige (Kenn-) Zahlen zu verdichten. Beispiel: Von 500 Beschäftigten mögen z.b. die Dauer der Betriebszugehörigkeit und die Ausbildung vorliegen, dies sind Zahlen. Statistisch sprechen wir von Merkmalen (z.b. Alter, Geschlecht) und deren Ausprägungen (z.b. 0 Jahre, 44 Jahre bzw. männl., weibl.). Durch Auszählung von Häufigkeiten oder Angabe eines Mittelwertes können diese z.b. auf drei Häufigkeitsangaben (z.b. 100 angelernte Arbeiter (Ar), 50 Facharbeiter (F) und 150 Angestellte (An)) oder im Fall der Betriebszugehörigkeit sogar auf einen Mittelwert (z.b. Durchschnitt von 8,5 Jahren (J)). Abbildung 1 Verdichtung von Information ( Ar,4 J) ( F,1J ) ( An,6 J ) ( Ar,5 J)... Ursprungsdaten: ( An,6 J ) ( Ar,10 J ) ( F,6 J) ( An,1 J )... ( An, J ) ( Ar,9 J) ( Ar, J ) ( Ar,1J )... ( F,3J ) ( An,3J ) ( Ar,6J ) ( Ar,9J ) Verdichtungen, z.b.: Mittelwert : 8,5 Jahre Betriebszugehörigkeit Häufigkeiten: 100 Angelernte 50 Facharbeiter 150 Angestellte Während in den Ursprungsdaten also alle Personen mit allen Eigenschaften enthalten sind, enthalten Verdichtungen nur einzelne ausgewertete Kennzahlen. Peter Schmidt, Hochschule Bremen MBA

10 Quantitative Methoden Deskriptive Statistik - Seite 5 - Es zeigt sich jedoch, dass nicht alle Maßzahlen für alle Merkmale möglich sind, so würde ein Mittelwert beim Mitarbeiterstatus keinen Sinn machen. Genauer gesagt ist die Auswahl der statistischen Maßzahlen von der Skalierung des Merkmals abhängig. Abbildung zeigt die vier Skalen, die üblicherweise unterschieden werden. Abbildung Skalierung von Merkmalen Skalierung von Daten als Basis für die Anwendbarkeit statistischer Methoden Verhältnisskala Verhältnisse können angegeben werden Metrische Skalen Intervallskala Nur Abstände (Intervalle) können angegeben werden Skalen Rang- / Ordinalskala Nur Rangfolgen können angegeben werden Nominalskala Ausprägungen stehen gleichberechtigt nebeneinander Währungsbeträge, Gewichte, Alter, Maße Temperatur, Lärmmessung, Meinungsskala Noten: sehr gut,..., ungenügend; Handelsklassen, Tabellenplätze Geschlecht, Farben, Berufe, Nationalität Verhältnisskalierte Daten beinhalten die meiste Information, nominal skalierte die wenigste. Entsprechend stehen mehr oder weniger statistische Methoden zur Auswertung der Daten zur Verfügung Merkmale können in diskreter oder stetiger Form vorliegen. Diskrete Merkmale können nur abzählbar viele Ausprägungen annehmen, wie z.b. oben der Berufsstatus, das Geschlecht oder Farben. Stetige Merkmale hingegen können beliebig viele Ausprägungen annehmen, oft werden sie in Dezimalzahlen gemessen, z.b. Geldbeträge, Gewichte oder Mengen. Die Unterscheidungen von Typen und Skalen werden im folgenden wichtig sein, wenn die Methoden zur Auswertung beschrieben werden. 1. Häufigkeiten und grafische Darstellungen Wie oben gesehen, ist auch die Auszählung von Häufigkeiten ein Mittel zur Verdichtung von Daten, gerne wird diese grafisch dargestellt Eindimensionale und mehrdimensionale Häufigkeitsdarstellungen Die Ursprungsdaten (oder Rohdaten - vgl. Abbildung 1) werden oft in Tabellen dargestellt, die aus Zeilen und Spalten bestehen. Dabei stellt jede Zeile eine statistische Einheit (Person, Werkstück, Summe,...) und jede Spalte ein bestimmtes Merkmal dar. Diese Darstellung wird auch in Tabellenkalkulationsprogrammen verwendet. Hier kann dann jede Zelle (z.b. Zeile 3, Spalte 4) einzeln angesteuert bzw. berechnet werden. Beispiele hierzu finden sich in den Excel-Dateien. Die laufende Nummer wird auch als (Lauf-) Peter Schmidt, Hochschule Bremen MBA

11 Quantitative Methoden Deskriptive Statistik - Seite 6 - Index bezeichnet, daher die übliche Abkürzung i. Es können dann alle Angaben anhand dieses Index angegeben werden. Z.B. ist die 3. Person seit Jahren im Betrieb: B 3 =. Tabelle 1 Personaldaten (Beispiel für Ursprungsdaten) Spalte lfd. Nummer Geschlecht Betriebszugehörigkeit Berufs- Status Note im Eignungstest i G i B i S i N i 1 w 10 Ar w 5 An 1 Zeile 3 m Ar 3 4 w 18 F 8 5 m Ar 1 Zelle 6 m 9 An 9 7 m 14 F Die einfachste Verdichtung von Daten ist die Angabe von Häufigkeiten, oft ebenfalls in tabellarischer Form, wie Tabelle für den Fall einer einfachen Häufigkeitstabelle für das Merkmal Berufsstatus zeigt. Tabelle Eindimensionale Häufigkeitstabelle Anzahl Befragte nach Berufsstatus Kürzel Status Anzahl (Häufigkeit n i ) (Bezeichnung) Status: Ar angelernte Arbeiter 100 = n 1 F Facharbeiter 50 = n An Angestellte 50 = n 3 Summe: 400 = n Beschäftigte Der Buchstabe n als Symbol für Anzahl der Beobachtungen wird in der Statistik sehr häufig verwendet. Wenn es sich auf die Grundgesamtheit aller statistischen Einheiten bezieht, wird auch ein großes N verwendet. Interessanter ist die Aufbereitung mehrerer Dimensionen, etwa die Auszählung der Anzahl der Beschäftigten, diesmal nach Alter und Geschlecht, wie sie in Tabelle 3 vorgenommen wird. Ursprungsdaten Häufigkeitstabelle zweidimensionale Häufigkeiten Tabelle 3 Zweidimensionale Häufigkeitstabelle Befragte nach Alter und Geschlecht Geschlecht Betriebsweiblich männlich alle zugehörigkeit Personen Randunter 10 Jahre summen 10-0 Jahre über 0 Jahre alle Personen Gesamt- Randsummen summe Peter Schmidt, Hochschule Bremen MBA

12 Quantitative Methoden Deskriptive Statistik - Seite 7 - Grafiken wie die hier beispielhaft vorgestellten lassen sich mit Hilfe von Computerprogrammen relativ einfach erzeugen. Es gibt eine sehr große Anzahl von Darstellungsmögrelative Häufigkeiten In dieser Tabelle 3 sind zum einen die Einzelhäufigkeiten für die Kombinationen bestimmter Eigenschaften angegeben (z.b. haben 40 Männer eine Betriebszugehörigkeit unter 10 Jahren), aber auch - in den Randsummen - die Häufigkeitsauszählungen für die einzelnen Merkmale (z.b. insgesamt gibt es 180 Personen mit einer Betriebszugehörigkeit zwischen 10 und 0 Jahren). Für das Merkmal Betriebszugehörigkeit wurden Klassen (von... bis...) gebildet. Dies ist sinnvoll, wenn viele Ausprägungen vorhanden sind, so dass diese nicht mehr übersichtlich in einer Tabelle oder Grafik dargestellt werden können. Üblich ist auch die Darstellung von relativen oder prozentualen Häufigkeiten. Tabelle 4 Prozentuale Häufigkeiten Befragte nach Alter und Geschlecht Zeilenprozente Spaltenprozente Betriebszugehörigkeit weiblich männlich alle Personen weiblich männlich alle Personen unter 10 Jahre 66,7% 33,3% 100% 6,7% 0,0% 4,0% 10-0 Jahre 55,6% 44,4% 100% 33,3% 40,0% 36,0% über 0 Jahre 60,0% 40,0% 100% 40,0% 40,0% 40,0% alle Personen 60,0% 40,0% 100% 100% 100% 100% Diese Häufigkeitsdarstellungen, ob in absoluten Zahlen oder relativen Anteilen gemessen, werden oft grafisch dargestellt. So lassen sich die Zahlen aus Tabelle z.b. in einem Balken- oder Säulendiagramm darstellen, wie in Abbildung 3 links dargestellt ist. Abbildung 3 Absolute Häufigkeiten und zweidimensionales Säulendiagramm 300 Säulendiagramm Anzahl 0 angelernte Arbeiter Facharbeiter Angestellte Angestellte Balkendiagramm Facharbeiter Angelernte Betriebszugehörigkeit nach Geschlecht unter 10 Jahre 10-0 Jahre Auch die zweidimensionalen Häufigkeiten aus Tabelle 3 lassen sich grafisch veranschaulichen (z.b. wie in Abbildung 3 recht oder Abbildung 4). Abbildung 4 Kreisdiagramme zur Darstellung von relativen Häufigkeiten weiblich männlich Betriebszugehörigkeit unter 10 Jahre 4% über 0 Jahre 40% 10-0 Jahre 36% 40% 40% 0% 7% Frauen 33% 40% Männer Betriebs- Zugehörigkeit: Anteile nach Geschecht unter 10 Jahre 10-0 Jahre über 0 Jahre Peter Schmidt, Hochschule Bremen MBA

13 Quantitative Methoden Deskriptive Statistik - Seite 8 - lichkeiten und es sollte jeweils aus dem konkreten Zusammenhang entschieden werden, welche Darstellung hilfreich für den Transport der Botschaft ist. Die Daten und die hier dargestellten Beispiele finden sich in der begleitenden Excel-Datei. 1.. Besondere Häufigkeitskonzepte Für die Darstellung von Häufigkeiten werden oft Säulendiagramme verwendet. Summenhäufigkeitsfunktionen zeigen, wie viel (Prozent der) Ausprägungen höchstens einem bestimmten Wert annehmen (bis zu...). Abbildung 5 zeigt dieses Häufigkeitskonzept neben einem einfachen Säulendiagramm. Histogramme und Summenhäufigkeiten Abbildung 5 Einfache Häufigkeiten und Summenhäufigkeiten Klasse Häufigkeiten: Werte: Obergrenze 0 n i f i % 0 F 0i Körpergröße: ,4 9,4 F i : Summen-Häufigkeit: ,6 5,0... Prozent der Personen ,1 53,1 sind höchstens... groß ,4 87, ,5 100,0 3 befragte Personen Summe: Relative Häufigkeiten (%) Summenhäufigkeiten , , , , , , , ,0 0, f i : relative Häufigkeit Histogramme werden verwendet, wenn die Ausprägungen wie oben in Klassen eingeteilt werden und diese unterschiedlich breit sind. Säulendiagramme würden in diesem Fall falsche Häufigkeiten vermuten lassen, so dass die Häufigkeiten als Fläche dargestellt werden. Klasse Häufigkeiten: KlBreite Anzahl Obergrenze D x i n i f i % F i D = fi / D xi ,6 15,6 0, ,1 43,8 1, ,3 75,0 3, ,6 90,6 1, ,4 100,0 1,88 Summe: ,00 3,50 3,00,50,00 1,50 1,00 0,50 0,00 D (xi) Histogramm Lagemaße (Mittelwerte) und Streuungsmaße Die bisherige Beschreibung zeigte Möglichkeiten der Darstellung, die deutlich anschaulicher sind als die Betrachtung von Ursprungsdaten, aber die Tabellen und Abbildungen in Punkt 1. müssen jeweils ihrerseits interpretiert werden: Wie unterscheiden sich zwei Peter Schmidt, Hochschule Bremen MBA

14 Quantitative Methoden Deskriptive Statistik - Seite 9 - Streuungsmaße Neben der Lage einer Verteilung ist diese durch ihr Aussehen, etwa ihre Breite bezeichnet: Wie verteilen sich die Ausprägungen des Merkmals um den Mittelwert?. Statistisch wird hier von Schwankung oder Streuung der Werte gesprochen, so dass die entsprechen- Mittelwerte: auf die Skala achten Grafiken? ; Was ist das wichtige an dieser Tabelle?... mögen die Fragen lauten. Daraus ergibt sich der Wunsch, nach noch knapperen statistischen (bzw. betrieblichen) Kennzahlen. Die sicherlich bekanntesten statistischen Maße sind Mittelwerte, unter Ihnen der prominenteste das arithmetische Mittel, oft einfach als Mittelwert bezeichnet. Aber nicht für alle Daten (jeder Skalierung) kann ein arithmetische Mittel errechnet werden. In der betrieblichen Praxis sind die in Tabelle 5 angegebenen Mittelwerte relevant. Wichtig ist hier, dass falsche Verwendung der Mittelwerte eben auch zu falschen (oder verfälschten) Ergebnissen führt. So ist das arithmetische Mittel i.d.r. größer als das geometrische Mittel. Würde man im letzten Beispiel (fälschlicherweise) ein arithmetisches Mittel errechnen, so hätte dies einen Wert von 9 Prozent ( =36 / 4). Die tatsächliche Lohnsteigerung der letzten vier Jahre würde also höher angegeben als sie tatsächlich war. Mittelwerte werden auch als Lagemaße bezeichnet, da sie die Lage einer Verteilung (auf der waagrechten Achse) angeben. So haben die Verteilungen von Abbildung 3 oder Abbildung 5 ihren jeweiligen Schwerpunkt in ihren Mittelwerten. Tabelle 5 Mittelwerte Mittelwert für Skalen Definition Beispiel Modus (Modalwert) Median oder Zentralwert arithmetisches Mittel ( Mittelwert ) geometrisches Mittel alle Skalen Ordinalskalen und metrische Skalen metrische Skalen Steigerungsraten von Wachstumsdaten (nur Verhältnisskalen) häufigster Wert Mitte aller geordneten Ausprägungen Summe aller Werte geteilt durch die Anzahl der Beobachtungen (n) n-te Wurzel aus dem Produkt aller Werte Die einzelnen Berechnung können in der Excel-Datei nachvollzogen werden. In Tabelle ist F der Modalwert, da Facharbeiter (mit 50 Personen) die größte Einzelhäufigkeit aufweisen Alter: 44, 19, 4, 60, 1, 4, 11 geordnet: 11,19,1,4,4,44,60 Median = 4, da mittlerer Wert, es stehen rechts und links davon je drei Zahlen Alter: 44, 19, 4, 60, 1, 4, = 7 Durchschnittsalter x = 31, 6 Jahre Lohnsteigerung in 4 Jahren: 10 %, 0 %, 5 %, 1 % 4 1,10 1,0 1,05 1,01 GM = 1, 0877 rund 8,77 Prozent oder Streuungsmaße Peter Schmidt, Hochschule Bremen MBA

15 Quantitative Methoden Deskriptive Statistik - Seite 10 - den Kennzahlen als Streuungsmaße bezeichnet werden. Abbildung 6 zeigt ein Beispiel für 3 verschiedene Verteilungen (Häufigkeitsauszählungen als Säulendiagramm). In allen drei Fällen wurden 50 Personen (aus drei Abteilungen) befragt: Bewerten Sie die Arbeitszeitregelung im Betrieb. Die Antworten in allen drei Abteilungen ergaben denselben arithmetischen Mittelwert von 4,0 aufweisen, die Verteilungen sehen aber unterschiedlich aus. Abbildung 6 Verteilungen mit unterschiedlicher Streuung Abt Abt Abt Mit Streuungsmaßen kann das unterschiedliche Aussehen dieser drei Verteilungen, statistisch gesagt die unterschiedliche Schwankung gemessen werden: Das einfachste Streuungsmaß ist die Spannweite. Sie wird ermittelt, indem die kleinste Ausprägung von der größten abgezogen wird (Abt.1: 6 = 4; Abt.: 7 1= 6; Abt.3: 6 1= 5) und spiegelt damit die Breite der Verteilung wider. Üblichere Streuungsmaße messen die Abweichung der einzelnen Werte vom Mittelwert, was in Abbildung 7 veranschaulicht wird (am Beispiel von drei Personen aus Abt. 1). Als statistische Kennzahl dient wiederum ein Mittelwert dieser Abweichungen. Die Durchschnittliche Absolute Abweichung (DAA) ist ein mögliches Maß, weitaus bekannter jedoch ist die Standardabweichung. Sie wird ermittelt aus der Hilfsgröße Varianz (dem Durchschnitt aller quadrierten Abweichungen). Abbildung 7 Abweichungen der Einzelbeobachtungen vom Mittelwert 5 4 Mittelwert +3 Person Nummer Antwort auf Frage Antworten auf einer Ratingskala (Werte von 1 bis 7 konnten angegeben werden) In Tabelle 6 sind die vorgestellten Maßzahlen für das obige Beispiel (Befragung von je 50 Personen in drei Abteilungen) zusammengefasst. Tabelle 6 Beispiel für Lage- und Streuungsmaße Abteilung Median arithm. Mittel Spannweite Standardabweichung 1 4 4,0 4 (von bis 6) 1,6 3 4,0 6 (von 1 bis 7), ,0 5 (von 1 bis 6),18 Peter Schmidt, Hochschule Bremen MBA

16 Quantitative Methoden Deskriptive Statistik - Seite 11 - Es mag sich angesichts dieses einfachen Beispiels die Frage stellen, welchen Sinn solche recht aufwendigen Maßzahlen haben. Dieser liegt vor allem in der Verarbeitung großer Datenmengen. Sind nicht nur drei Abteilungen, sondern z.b. 16 Bereiche und nicht nur eine Frage sondern z.b. 35 zu bewerten und so zu verdichten, dass eine Orientierung auf einen Blick (oder zumindest wenige Blicke) möglich ist, so geht dies nur mit Hilfe von Kennzahlen. Nicht alle sind an jeder Stelle geeignet. So zeigt hier das arithmetische Mittel eine Übereinstimmung der drei Abteilungen an, was aber angesichts Abbildung 6 nicht zu überzeugen vermag. Schon der Median, vor allem aber die Streuungsmaße zeigen - auch ohne den Blick auf die Grafiken - dass die Antworten in Abteilung 1 recht einheitlich verteilt sind, wogegen diejenigen in Abteilung und 3 größere Schwankungen aufweisen. Dort gehen also die Meinungen weiter auseinander, in unserem Beispiel könnte hiermit ein Anhaltspunkt dafür gegeben sein, dass der Betriebsrat dort - etwa in Einzelgesprächen - klären sollte, ob größere Unzufriedenheit unter den Angestellten herrscht, als in anderen Abteilungen. Messen der Stärke eines Zusammenhangs 1.4 Zusammenhänge zwischen mehreren Merkmalen Oft ist das Ziel statistischer Analysen nicht nur, ein einzelnes Merkmal zu beschreiben, sondern es interessiert die Wirkung verschiedener Merkmale aufeinander. so wurde bereits in Tabelle 4 und Abbildung 3 eine zweidimensionale Betrachtung angestellt. Wiederum können zwei unterschiedliche Fragestellungen unterschieden werden: Wird ein (zufälliger) Zusammenhang zwischen zwei Merkmalen untersucht, in dem Sinne, dass die Merkmale sich gegenseitig beeinflussen; oder wird ein ursächlicher Zusammenhang vermutet, in dem Sinne, dass bestimmte Merkmale ein anderes beeinflussen bzw. steuern (Kausalität)? Für die erste Frage eignen sich Zusammenhangmaße, die zweite kann mit Regressionsmodellen untersucht werden Zusammenhangmaße Zusammenhangmaße beschreiben die Stärke eines Zusammenhangs. Die Geschäftsleitung macht auf den steigenden Energieverbrauch einer Abteilung aufmerksam. Der Betriebsrat vermutet, dass dies durch die wachsende Anzahl von Überstunden verursacht wird und vergleicht die beiden Zahlenreihen X: Anzahl der Überstunden pro Woche und Y: Energieverbrauch miteinander. Es werden sechs Wochen (i = 1,..., 6), entsprechend sechs Wertepaare (x i, y i ) miteinander verglichen. Diese sind in Tabelle 7 angegeben. Tabelle 7 Wertetabelle für Zusammenhang Überstunden / Energieverbrauch Woche Überstunden Energieverbrauch Woche Überstunden Energieverbrauch i X i Y i i X i Y i Da es sich um zwei metrisch skalierte Merkmale handelt, können sie - in Abbildung 8 - als xy-diagramm (Streu- oder Punktdiagramm) dargestellt werden. Peter Schmidt, Hochschule Bremen MBA

17 Quantitative Methoden Deskriptive Statistik - Seite 1 - In der folgenden Grafik ist ein Zusammenhang zu erkennen: Je höher die Anzahl der Überstunden, desto höher ist auch der Energieverbrauch. Das statistische Maß, welches die Stärke eines solchen Zusammenhanges metrischer Merkmale misst, heißt Korrelationskoeffizient (nach Bravais-Pearson), üblicherweise mit dem Buchstaben r (oder dem griechischen ρ) bezeichnet. r gibt sowohl die Richtung des Zusammenhanges als auch dessen Stärke an, denn er kann Werte zwischen -1 und 1 annehmen. Im vorliegenden Falle ergibt sich ein Wert von r=0,97 und damit ein starker statistischer Zusammenhang zwischen Überstunden (X) und Energieverbrauch (Y). Abbildung 8 xy-diagramm für Zusammenhang Überstunden / Energieverbrauch Y-Achse: Energieverbrauch X-Achse: Überstunden Ein positiver Zusammenhang (r größer als 0) heißt, dass je größer die Ausprägung des einen Merkmals (X), desto größer auch die des anderen Merkmals (Y); Ein negativer Zusammenhang (r kleiner als 0) heißt, dass je größer die Ausprägung des einen Merkmals (X), desto kleiner die des anderen Merkmals (Y), wobei der Zusammenhang desto stärker ist, je näher r an 1 bzw. -1. Ein Korrelationskoeffizient nahe oder gleich Null bedeutet, dass es keinen Zusammenhang zwischen X und Y gibt. Der Korrelationskoeffizient r ist also eine Kennzahl, die eine große Menge an Informationen verdichten kann, indem das Verhältnis beliebig vieler Wertepaare in einer Maßzahl r zusammengefasst wird. Abbildung 9 Stärke von Zusammenhängen und Werte des Korrelationskoeffizienten 8 6 vollk. positiver Zh (schwach) positiver Zh kein Zh (schwach) negativer Zh vollk. negativer Zh r = < r < r = > r > r = Auch hier gilt wieder, dass ein solches Maß besonders dann nützlich ist, wenn große Mengen von Daten betrachtet werden und nicht für jedes Merkmalspaar ein solches xy- Diagramm erstellt werden kann. Es können dann mittels des Korrelationskoeffizienten schnell diejenigen Merkmale herausgefunden werden, die einen starken Zusammenhang aufweisen und diese näher untersucht werden. Korrelationskoeffizienten sind ein in der betrieblichen Praxis sehr gebräuchliches Maß. Allerdings kann der Korrelationskoeffizient r nach Bravais-Pearson nur für metrische Merkmale ermittelt werden. Bei ordinal skalierten Merkmalen muss auf den Rangkorrelationskoeffizienten r s zurückgegriffen werden; bei nominal skalierten Daten steht nur der Peter Schmidt, Hochschule Bremen MBA

18 Quantitative Methoden Deskriptive Statistik - Seite 13 - Kontingenzkoeffizient zur Verfügung. Tabelle 8 zeigt die Zusammenhangmaße für die verschiedenen Skalenniveaus. Je größer der Informationsgehalt der Skala (vgl. Abbildung ), desto höher ist auch die Aussagekraft des Zusammenhangmaßes. Der Koeffizient r s kann nur Sortierungen vergleichen, aber keine Zahlenwerte, der Kontingenzkoeffizient C beinhaltet keine Richtung des Zusammenhanges, bezüglich der Größe von C gilt ebenfalls, dass ein Wert von 0 keinen Zusammenhang bedeutet und je näher C sich dem Wert 1 nähert, desto stärker ist der untersuchte Zusammenhang zwischen den Merkmalen X und Y. Tabelle 8 Zusammenhangmaße für unterschiedliche Skalenniveaus Zusammenhangmaß für Skalen Wertebereich Beispiele r Korrelationskoeffizient nach Bravais-Pearson r s Korrelationskoeffizient nach Spearman metrische Skalen, linearer Zus.hang -1 r 1 Ordinalskalen -1 r s 1 - Produktionsmenge und Kosten - Alter und Einkommen - Schulnote und Altersklasse - Schulabschluss Leistungsklasse C Kontingenzkoeffizient Nominalskalen 0 C 1 - Geschlecht und Beruf 1.4. Regressionsanalyse Bei metrisch skalierten Merkmalen wurden in Abbildung 8 und Abbildung 9 Punktewolken betrachtet, also die Verteilung der xy-wertepaare in einem Koordinatensystem. Als Referenz für die Messung von Stärke eines Zusammenhanges dient dabei eine gedachte Linie durch die Punktewolke und die Betrachtung, wie die Bebachtungspunkte zu dieser Linie liegen. Bei Korrelationskoeffizienten r = 1 und r = -1 liegen die Punkte auf dieser gedachten Grade bzw. bilden diese Grade. Regressionsanalyse misst die Art eines Zusammenhanges Im Beispiel der Tabelle 7 wurde ein statistischer Zusammenhang zwischen der Anzahl der Überstunden und dem Energieverbrauch ermittelt. Es stellt sich im nächsten Schritt die Frage, wie die beiden Merkmale zusammenhängen, welcher Art ihre Beziehung ist. Um dies statistisch zu untersuchen, muss zunächst eine Annahme aufgestellt werden, diese sei: inhaltlich: Der Energieverbrauch hängt von der Zahl der Überstunden ab mathematisch: Der Energieverbrauch Y ist eine Funktion der Zahl der Überstunden X Funktional: Y = f (X) und im linearen Fall: Y = a + b * X In Worten bedeutet dies, dass eine Gerade gesucht wird, die durch das Zentrum der Punktewolke geht, wie Abbildung 10 zeigt. Peter Schmidt, Hochschule Bremen MBA

19 Quantitative Methoden Deskriptive Statistik - Seite 14 - Abbildung 10 Regressionsgrade Überstunden / Energieverbrauch Y-Achse: Energieverbrauch Y = 10,4 + 0,55 * X R = 0, X-Achse: Überstunden Die Regressionsgrade in Abbildung 10 wird bestimmt durch ihren Schnittpunkt mit der Y-Achse (hier a = 10,4) und ihre Steigung (hier b = 0,55). Mit dieser Grade bzw. der Formel Y = a + b * X; hier Y = 10,4 + 0,55 * X kann für jede denkbare Anzahl von Überstunden ein erwarteter Wert für den Energieverbrauch errechnet werden. Daher hat das Modell seinen Namen, denn re-gressere kommt aus dem Lateinischen und bedeutet zurückführen ; hier wird also der Energieverbrauch auf die Anzahl der Überstunden zurückgeführt. Dies kann zum einen geschehen durch einsetzen von X-Werten in die Formel, so ergibt sich für 10 Überstunden ein erwarteter Energieverbrauch von Y =10,4 + 0,55 * 10 (Stunden) = 15,9 (kwh). X wird auch als das erklärende (unabhängige) und Y als das erklärte (abhängige) Merkmal bezeichnet. Dies ist in Abbildung 11 verdeutlicht. Abbildung 11 Regressionsanalyse Y-Achse: Energieverbrauch Y = 10,4 + 0,55 * X Achsenabschnitt a (hier 10,4) Steigung der Gerade b = 0,55 Ablesebeispiel: X = 10; zugehöriger Y-Wert: 15,9 X-Achse: Überstunden Eine solche Regressionsanalyse kann in Computerprogrammen sehr einfach erzeugt werden. In der Excel- Datei in der beiliegenden Datei finden Sie diese Grafiken, die zugrunde liegenden Zahlen und Hinweise zur Erstellung der Analysen. Eine Regressionsanalyse bietet somit zwei praktische Möglichkeiten: Ein Zusammenhang kann formal beschrieben werden (wie hängen X und Y zusammen?) Es kann für gegebene X-Werte ausgerechnet werden, welche Y-Werte zu erwarten sind. Anwendung finden Regressionsanalysen in verschiedensten Bereichen der betrieblichen Praxis und sind sehr verbreitet. Peter Schmidt, Hochschule Bremen MBA

20 Quantitative Methoden Deskriptive Statistik - Seite 15 - Gütemaß Die Güte einer Regressionsanalyse bemisst sich daran, wie gut die Regressionsgrade den tatsächlichen Zusammenhang beschreibt bzw. vorhersagt. Dies wird darin gemessen, wie stark die einzelnen Beobachtungspunkte um die Gerade schwanken. Liegen alle Punkte auf der Gerade, so ist die Regressionsschätzung perfekt. Liegen sie nahe neben der Grade, so ist die Vorhersage, wie im obigen Beispiel, gut je weiter die Werte von der Grade entfernt liegen, desto schlechter ist die Regression. Diese Darstellung erinnert an die des Korrelationskoeffizienten und tatsächlich ist im bisher besprochen Fall der linearen Einfachregression R = r (also das Quadrat des Korrelationskoeffizienten) ein Gütemaß für die Regressionsanalyse. (Es wird allgemein als R-Quadrat ausgesprochen, wobei dies als Eigenname zu verstehen ist. Es gibt keine Zahl R, die dann quadriert wird, sondern das Gütemaß heißt R, bei machen Autoren aber auch B für Bestimmtheitsmaß). In Worten sagt R aus, wie viel Prozent der Schwankungen der Y-Werte durch die X-Werte vorhergesagt werden. R liegt also zwischen 0 und 1 (0 < R < 1). Im obigen Beispiel ist in Abbildung 10 das Gütemaß mit 93,9 Prozent angegeben, diese Beispielregression beschreibt die Daten also gut, was ja auch grafisch erkennbar ist. In der Praxis sind allerdings die wenigsten zu untersuchenden Zusammenhänge so einfacher Natur wie das obige Beispiel: Der Zusammenhang kann nicht-linear sein, d.h. die Punktwolke kann nicht durch eine Grade, sondern müsste durch eine Kurve beschrieben werden Y hängt nicht genau von einer Erklärungsgröße X ab, sondern von mehreren. Beide Erweiterungen des Regressionsmodells sind in der Praxis sehr gebräuchlich. Abbildung 1 zeigt ein Beispiel für einen Zusammenhang zwischen einem abhängigen Merkmal, der Absatzmenge eines Produktes und drei Einflussfaktoren, der Verkaufsfläche, der Werbeausgaben und des Preises. Peter Schmidt, Hochschule Bremen MBA

21 Quantitative Methoden Deskriptive Statistik - Seite 16 - Abbildung 1 Regressionsanalyse mit multiplen Einflussfaktoren Multivariate Zusammenhänge Beispiel: Absatzzahlen eines Kosmetikartikels Absatz- Menge Verkaufs- Fläche Werbe- Ausgaben Preis pro Einheit Stück qm TEuro Euro i y i x1 i x i x3 i Nr Absatz Fläche Werbung Preis , , , , , , , , , ,95 Menge y = -19,16x + 391,7 R = 0, ,00 Preis,00 4,00 6,00 8,00 10,00 1,00 14,00 16,00 18,00 Menge y = 0,848x + 901,1 R = 0, Verkaufs-Fläche Menge 500 y = 17,043x + 38,85 R = 0, Werbeausgaben In Abbildung 1 sind zunächst die Ursprungsdaten und die drei einzelnen Regressionen dargestellt. Anhand der Gütemaße ist zu erkennen, dass der Preis (mit einem R von 86,4 %) den höchsten Erklärungsgrad aufweist, die Verkaufsfläche (R = 78,8 %) den zweithöchsten und auch die Werbeausgaben (R = 73,3 %) einen messbaren Einfluss auf die Absatzmenge haben. Die inhaltliche Aussage kann der Steigung der Regressionsgraden bzw. dem Vorzeichen von b entnommen werden: Während die Verkaufsfläche, ebenso wie die Werbeausgaben, positiv auf die Absatzmenge wirken, hat der Preis einen negativen Einfluss. Das heißt: je größer die Verkaufsfläche einer Filiale und je höher die dortigen Werbeausgaben, desto höher der Absatz. Je höher jedoch der Preis des Produktes, desto weniger Einheiten werden abgesetzt. Lineare Mehrfachregression Dies kann auch in einer einzigen, multiplen Regression errechnet werden. Die Bestimmungsgleichung für den Absatz Y lautet dann: Y = a + b 1 * X 1 + b * X + b 3 * X 3 oder hier: Absatz = a + b 1 * Fläche + b * Werbung + b 3 * Preis Die Durchführung der multiplen Regression in Excel ergibt das folgende Ergebnis: Absatz = ,4 * Fläche + 1,7 * Werbung 13,8 * Preis Damit wird in einer Gleichung das oben dargestellte Ergebnis beschrieben. Eine Erhöhung der Verkaufsfläche erhöht den Absatz um das 0,4-fache, also z.b. 100 qm mehr Verkaufsfläche bringen im Durchschnitt 40 Stück mehr Umsatz. Die Erhöhung der Werbeausgaben Peter Schmidt, Hochschule Bremen MBA

22 Quantitative Methoden Deskriptive Statistik - Seite 17 - um 10 TEuro erhöht den Absatz um 17 Stück und eine Senkung des Preises um 1 Euro würde zu einer Erhöhung des Absatzes um knapp 14 Stück führen. Damit ist auch eine Rangfolge geeigneter Maßnahmen zur Absatzerhöhung erkennbar, die Preissenkung hat in diesem Beispiel die stärkste Wirkung. Regressionsanalysen finden in verschiedenen Varianten Anwendung. Die hier besprochene lineare Regression wird oft auch als KQ-Regression als Abkürzung für Kleinste- Quadrate-Regression (weil mathematisch die Abstände zwischen den Beobachtungspunkten und der Regressionsgrade quadriert werden und die Gerade dann so gewählt, dass die Summe dieser quadrierten Abstände möglichst klein wird) oder OLS-Regression von der englischen Bezeichnung Ordinary Least Squares -Regression. Hinweise zur Durchführung von Regressionsrechnungen finden sich in der Excel-Datei. 1.5 Zeitreihenanalyse und Indexzahlen Ein weiteres Anwendungsgebiet von Zusammenhangmaßen ergibt sich, wenn die Entwicklung eines Merkmals im Zeitablauf betrachtet werden soll, also quasi der Zusammenhang zwischen diesem Merkmal und der Zeit. Eine Zeitreihe wird dabei (künstlich) in mehrere Komponenten zerlegt: Y = Trend-Komponente (+ Konjunktur-Komponente) + Saison-Komponente + Rest-Komponente Beispielsweise seien Umsatzzahlen für die Quartale von 005 bis 008 (Tabelle 9) betrachtet, die in Abbildung 13 als Zeitreihe darstellt sind. Tabelle 9 Zeitreihe einer Umsatzentwicklung (in Mio. Euro) Jahr Quartal 05-I 05-II 05-III 05-IV 06-I 06-II 06-III 06-IV 07-I 07-II 07-III 07-IV Zeitpunkt t y t 0,8 3,1,9 1,7 4,0 6,3 6,1 4,9 7, 9,5 9,3 8,1 Abbildung 13 Umsatzentwicklung im Zeitablauf 3,0 30,0 Umsatzentwicklung als Zeitreihe 3,0 30,0 Zeitreihe mit Trendgerade 8,0 6,0 4,0, ,0 05-I 05-II 05-III 05-IV 06-I 06-II 06-III 06-IV 07-I 07-II 07-III 07-IV 8,0 6,0 4,0,0 0,0 y = 0,6993x + 0,871 R = 0, I 05-II 05-III 05- IV 06-I 06-II 06-III 06- IV 07-I 07-II 07-III 07- IV Umsatz TEuro Prognose Regression Die linke Grafik in Abbildung 13 zeigt die Entwicklung des Umsatzes in den drei Jahren, wobei erkennbar ist, dass sich in jedem Jahr eine recht regelmäßige Entwicklung wiederholt. Die saisonale Komponente zeigt ein Ansteigen des Umsatzes im 1. und. Quartal sowie Rückgänge im 3. und 4. Quartal. Um diese Saisoneinflüsse zu bereinigen und den Entwicklungstrend betrachten zu können, wird auch hier eine lineare Regression durchgeführt, deren Ergebnis auf der rechten Seite von Abbildung 13 zu erkennen ist. Die Steigung Peter Schmidt, Hochschule Bremen MBA

23 Quantitative Methoden Deskriptive Statistik - Seite 18 - Glättung von Zeitreihenwerten Indexzahlen der Regressionsgerade ist positiv, d.h. der Umsatztrend geht über die drei Jahre nach oben, die Rückgänge in der zweiten Jahreshälfte sind nur saisonbedingt. Es ist erkennbar, dass die Trendkomponente eine Glättung der schwankenden Zeitreihe darstellt und damit eine Referenzgröße für die Ermittlung der Saisoneinflüsse darstellen kann. Als weitere Methode zur Glättung von Zeitreihen sind Gleitende Durchschnitte (Moving Average) üblich, bei der aus jeweils vier Quartalswerten ein Mittelwert gebildet wird. Die hier verwendete Methode der linearen Trendfunktion hat dabei den Vorteil, dass der Trend für alle Beobachtungszeitpunkte gebildet werden kann und auch Prognosen über diesen Zeitraum hinaus vorgenommen werden können. Diese Möglichkeit sowie die Saisonbereinigung sind in der Excel-Datei dargestellt. Indexzahlen Indexzahlen (oder Indizes) sind gewichtete arithmetische Mittelwerte aus Messzahlen. Bekannt ist etwa der Preisindex der Lebenshaltung, der durch das Statistische Bundesamt veröffentlicht wird, aber auch Aktienindizes, wie z.b. der Dow-Jones oder der DAX. Hier werden die Preisentwicklungen aller Güter und Dienstleistungen, die Haushalte im Durchschnitt verbrauchen, zu einer mittleren Preissteigerung zusammengefasst. Dabei werden die (relativen) Mengen und daraus folgend die Ausgabenanteile für diese Produkte berücksichtigt. Bei Zeitreihenanalysen werden anstelle der absoluten Werte oft Reihen von Indexzahlen verwendet. Diese werden dadurch gebildet, dass ein Basiszeitraum = 100 (Prozent) gesetzt wird und alle anderen Werte im Bezug auf dieses Basisjahr umgerechnet werden. Entwicklungen von Preisen, Umsätzen, Marktanteilen können damit für verschiedene Merkmale verglichen werden, die eine unterschiedliche absolute Höhe haben und deshalb (z.b. in einer Grafik) nicht zusammen passen. Tabelle 10 zeigt hierfür ein Beispiel. Tabelle 10 Entwicklung von Unternehmer- und Arbeitnehmereinkommen in Mrd. Euro Steigerungsrate Index 1991 = 100 Jahr Unternehmer Arbeitnehmer Unternehmer Arbeitnehmer Unternehmer Arbeitnehmer ,6 847, ,0 100, , 997,0 15,8% 17,7% 115,8 117, , ,6,7% 1,0% 119,0 118, , ,7 4,1% 0,4% 13,8 119, ,8 1.03,3 1,4%,1% 15,5 11, , ,5-1,4%,6% 13,8 15, , ,1-0,8% 3,8% 1,8 19, , 1.10,6 3,7% 1,9% 17,4 13, ,8 1.18,3 1,7% 0,7% 19,6 133, , ,7 3,9% 0,3% 134,6 133, , ,8 10,4% 0,5% 148,7 134, ,9 1.19,3 6,% -0,7% 158,0 133, , ,9 7,3% 1,4% 169,4 135, Absolute Steigerung Durchschnittliche Steigerungsrate* : 39,9 97,9 1,0414 1,035 Mrd. Euro Mrd. Euro entspricht 4,14%,35% Spaltenbezeichnungen: Unternehmer = Einkommen aus Unternehmertätigkeit und Vermögen Arbeitnehmer = Arbeitnehmer-Einkommen * Geometrisches Mittel (da Durchschnitt aus Steigerungsraten; vgl. Punkt 1.3) Quelle: eigene Berechnung aus: "Zahlen zur wirtschaftlichen Entwicklung der Bundesrepublik Deutschland" des IW Köln und Statistisches Jahrbuch 007, Tab. 6.1 Peter Schmidt, Hochschule Bremen MBA

24 Quantitative Methoden Deskriptive Statistik - Seite 19 - Das Beispiel in Tabelle 10 zeigt den Unterschied zwischen absoluter und relativer Entwicklung. Könnte auf Basis der ersten beiden Spalten formuliert werden, dass das Arbeitnehmereinkommen um mehr als den doppelten Betrag gestiegen ist, so zeigt sowohl die Betrachtung der Steigerungsraten als auch der Indexzahlen, die so umgerechnet wurden (Dreisatz), dass das Jahr 1991 den Wert 100,0 annimmt, das gegenteilige Ergebnis. Beide Maßzahlen ergeben, dass die Einkommen aus Unternehmertätigkeit und Vermögen mit,9 Prozent stärker gestiegen sind als die Arbeitnehmer-Einkommen mit,4 Prozent. Das Errechnen von Steigerungsraten oder Indexzahlen hat somit den Vorteil der besseren Vergleichbarkeit. Auch lassen sich indizierte Werte besser in einer gemeinsamen Grafik darstellen, wie die folgende Abbildung illustriert. Abbildung 14 Einkommensentwicklung absolut und als Indexzahlen Unternehmer Arbeitnehmer Unternehmer Arbeitnehmer LITERATURHINWEISE UND WEITERE INFORMATIONEN Aus der großen Menge guter Statistik-Bücher seien drei herausgegriffen, die jeweils praktische Einführungen in die betriebliche Anwendung darstellen: Bourier, Günther: Beschreibende Statistik und Wahrscheinlichkeitsrechung und Schließende Statistik, Wiesbaden 008 Backhaus, Erichson, Plinke, Weiber, Multivariate Analysemethoden: Eine anwendungsorientierte Einführung, Heidelberg, 005 Krämer, Walter: Statistik verstehen und: So lügt man mit Statistik, München, 001, 000 Puhani, Josef: Statistik - Einführung mit praktischen Beispielen, Würzburg 005 Scharnbacher, Kurt: "Statistik im Betrieb", Wiesbaden 004 Schwarze, Jochen: Grundlagen der Statistik, Bände I und II, Herne/Berlin 005/06 Spaß an der Statistik und trotzdem - oder eben deshalb - viele interessante Informationen rund um das Thema und seine Anwendungen finden sich in: Krämer, Walter: So lügt man mit Statistik und: Statistik verstehen, München 001 Peter Schmidt, Hochschule Bremen MBA

25 Quantitative Methoden Deskriptive Statistik - Seite 0 - Praktische Arbeit am PC wird mit folgendem sehr empfehlenswerten Buch erleichtert, da es neben dem theoretischen Hintergrund auch die praktische Umsetzung in Excel zeigt, Text und Hinweise auf CD-ROM mitliefert und vor allem durch den erfrischenden Schreibstil die statistische Arbeit zur Freude macht: Monka, Michael, Schöneck, Nadine und Voß, Werner: Statistik am PC - Lösungen mit Excel, München 008 Weitere Information zur (amtlichen) Statistik sowie interessante Datengrundlagen können im Internet gefunden werden. Wichtige Web-Adressen mit (betriebs-) wirtschaftlich relevanten Informationen finden sich z.b. auf meiner Webseite: - unter links. 3 SCHLAGWORTINDEX Deskriptive Statistik...4 Diskrete Merkmale...5 Glättung...18 Gütemaß...15 Häufigkeiten Histogramm...8 prozentuale Häufigkeiten..7 relative Häufigkeiten...7 Summenhäufigkeit...8 Indexzahlen...18 Induktive Statistik...4 Klassenbildung...7 Kontingenzkoeffizient...13 Korrelationskoeffizient...1 Merkmale...4 Mittelwerte...9, 13 arithmetisches Mittel...9 geometrisches Mittel...9 Median...9 Modus...9 Regression multiple Regression...16 Regressionsanalyse...14 Regressionsgrade...14 Schwankung...9 Skalierung...5 Stetige Merkmale...5 Stichprobe...4 Streuung...9 Streuungsmaße DAA...10 Spannweite...10 Standardabweichung...10 Varianz...10 Zeitreihe...17 Trend(gerade)...17 Zusammenhangmaße...13 Peter Schmidt, Hochschule Bremen MBA

26 Prof. Dr. Peter Schmidt SoSe 008 Volkswirtschaftslehre und Statistik : (041) Fax: (041) Peter.Schmidt@hs-bremen.de Quantitative Methoden Master of Business Administration Modul, Unit Teil : Ablauf einer statistischen Untersuchung Fallbeispiel Studierendenbefragung

27 Quantitative Methoden Seite 1 Ablauf einer statistischen Untersuchung Worum geht s? Arbeiten mit statistischen Methoden bedeutet nicht nur dressieren von Zahlen, sondern vor allem die präzise Planung und Durchführung realitätsbezogener Analysen 1. Planung 1 Aufgabenstellung Wer Will Was? Zielsetzung Eigenes Ziel: gestellte Aufgabe mit geringstmöglichem Aufwand lösen Kosten- und Zeitrahmen Welche Mittel und Welche Zeit stehen maximal zur Verfügung?. Datenerhebung.1. Erhebungstechnik: Primärerhebung = Durchführen einer eigenen Befragung Sekundärstatistik = Nutzung vorhandener Daten Primärstatistik Kosten hoch niedrig Zeitaufwand hoch niedrig Sekundärstatistik Zielbezug stark teilweise eingeschränkt Aktualität aktuell i.d.r. weniger aktuell.. Erhebungsumfang: Festlegung der Befragten (bzw. zu Befragenden): Vollerhebung gesamte Gruppe befragen Teilerhebung Stichprobe aus der Grundgesamtheit notwendig! Die Stichprobentheorie wird in Abschnitt 8.1 der Vorlesung behandelt Vollerhebung Kosten hoch niedrig Zeitaufwand hoch niedrig Teilerhebung Aktualität aktuell i.d.r. weniger aktuell Messgenauigkeit hoch teilweise geringer Durchführbarkeit oft nicht möglich immer möglich 1 Die Darstellungen und Tabellen dieses Abschnitts basieren teilweise auf Bourier Beschreibende Statistik (000, S. 5 ff). Peter Schmidt, Hochschule Bremen 008

28 Quantitative Methoden Seite.3. Art der (Primär-) Erhebung: Beobachtung Messung, Zählungen, Sachverständige, usw. Schriftliche Befragung Fragebogen Mündliche Befragung Interview (telefonisch oder persönlich) Beobachtung schriftliche Befragung mündliche Befragung Kosten eher niedrig eher niedrig eher hoch Zeitaufwand eher niedrig eher niedrig eher hoch Aktualität aktuell teilweise lange Rücklaufzeiten recht aktuell Befragungstiefe eher oberflächlich detaillierter detailliert durch Nachfragen 3. Datenaufbereitung Aufbereitung von Fragebogen / Interviewnotizen Eingabe in EDV (Statistikprogramm) Kontrolle (Vollständigkeit, Glaubwürdigkeit) 4. Auswertung und Darstellung der Daten Datenanalyse Hauptaufgabe ist die Verdichtung der Information d.h. reduzieren der großen Menge der Rohdaten (Urliste) auf wenige, aussagekräftige Kennzahlen. Die dazu relevanten Methoden werden v.a. im ersten Teil der Vorlesung, der Beschreibenden Statistik behandelt. Analyse: Wie aus dem Datenmaterial über die reine Beschreibung der Daten hinaus durch statistische Schlussfolgerungen gezogen werden, behandelt vor allem der zweite Teil der Vorlesung, der Schließende Statistik. 5. Interpretation Die Erläuterung und Interpretation der Analyse des Datenmaterials und der daraus gezogenen Schlüsse ist der Kern der empirischen Arbeit. Wenn Sie für einen Auftraggeber oder einen Vorgesetzten eine Statistik aufbereiten sollen, reicht diesem nicht die Sammlung und Darstellung der Daten, sondern die Kernfragen: Was bringt die Analyse?, Was haben wir gelernt? stehen im Zentrum des Interesses. Peter Schmidt, Hochschule Bremen 008

29 Quantitative Methoden Seite 3 Fallbeispiel: Durchführung einer empirischen Untersuchung Aufgabenstellung Fallbeispiel: Planung und Durchführung einer empirischen Untersuchung Sie sind nach erfolgreich abgeschlossenem Studium MitarbeiterIn der R&H Marktforschung. Ihrem Unternehmen liegen drei Anfragen von verschiedenen Auftraggebern vor. Sie haben die Aufgabe, eine empirische Untersuchung durchzuführen, mit der alle 3 Anfragen beantwortet werden können. Die Anfragen: 1. Verkehrsträgergesellschaft VBX: Für die Planung unserer Streckenführung und Produktpolitik benötigen wir Informationen, a) welche Studierenden welche Verkehrsmittel benutzen, um zur Hochschule zu kommen b) welches ggf. die Hinderungsgründe für Nicht-Nutzung des ÖPNV sind.. HSC - Hochschule einer norddeutschen Hansestadt: Für die Planung von Wohnheimen benötigen wir Informationen darüber, in welchen Wohnformen Studierende wohnen.... Für ihr Hochschulmarketing möchte die HSC möglichst genau wissen, welche Studierenden eingeschrieben sind ( Soziodemographika : Geschlecht, Bildung, Beruf, praktische Erfahrung, berufliche Tätigkeiten neben dem Studium, Gesundheit,... usw.), was diese sich von ihrem Studium erwarten und auch, wie sie auf die Hochschule aufmerksam geworden sind. 3. Gleichzeitig möchte der Dozent S. in seiner Statistikveranstaltung den Studierenden gerne Beispieldaten zur eigenen Bearbeitung zur Verfügung stellen. Dazu benötigt er Informationen darüber, ob den Studierenden privat PC s zur Verfügung stehen, ob sie ein Tabellenkalkulationsprogramm (z.b. Excel) oder ein Statistik- Programm zur Verfügung haben und über Kenntnisse im Umgang damit verfügen. Wie könnte eine statistische Untersuchung dieser Fragestellungen durch die R&H aussehen (Art der Erhebung)? An welchen Stellen greifen die Fragestellungen ineinander? Welche Probleme sehen Sie bei der Auswertung der Daten bzw. welche Besonderheiten müssen Sie beachten? Diskutieren Sie diese Fragen in Arbeitsgruppen, die sich mit einer der Fragestellungen befassen und stellen Sie Ihre Ergebnisse anschließend im Plenum vor. Peter Schmidt, Hochschule Bremen 008

30 Quantitative Methoden Seite 4 Fragebogen an die Studierenden des 1. Semesters (nur zum vorlesungsinternen Gebrauch bitte keinen Namen angeben) 1. Studiengang:. Fachsemester: 3.Geschlecht w (1) m(0) 4.Alter: 5.Wohnheimwunsch? 6. Gewicht: 7. Körpergröße: 8. Familienstand: 9. Anzahl Kinder: 10. höchster Bildungsabschluss: Abitur (1) Fachabitur () Sonstig. (3) 1. Wie lange waren Sie vor Ihrem Studium bereits berufstätig? (Jahre; 0 = Nein) 14. Geburtsort: Bremen (1) Ausland (0) sonst. D bitte Bundesland:... (-15) 17. Wichtigstes Verkehrsmittel: für Weg zur Hochschule 19. Wohnort (Stadt/Gemeinde): + Bremen - City / Wall /Bhf. / ¼ (1) - rechts der Weser West (Gröpell.-Findorff) () NO (Schwachh-Horn-Lehe) (3) Ost (4) - links der Weser (5) - Bremen Nord (6) + 50 km umzu (7) + sonstig (8). Wohnung: eigenständig (allein / mit PartnerIn / Familie) (1) WG () Untermiete (3) Eltern (4) sonstiges (5) 11. abgeschlossene Berufsausbildung? Ja (1) Nein (0) 13. Wenn Sie berufstätig waren: angestellt (1) selbständig () freiberuflich (3) 15. Entfernung (km) Wohnung HSB 16. Wegzeit (Min) Wohnung HSB 18. Weiteres Verkehrsmittel: (bitte je nur ein wichtigstes und ein zweites) 0. Nicht-ÖPNV-Nutzer (d.h. 17. Ist nicht Bus / Bahn): Gründe für Nicht-Nutzung: Zu teuer (1) Zu langsam (Fahrt) () Wartezeiten (3) Erreichbarkeit (4) Umbequemlichkeit (5) sonstiges (6) 3. Computer privat verfügbar: keinen (0) PC (1) wenn bis 486er (1 a) bekannt: Pentium unter 400 Mhz (1 b) Pentium mit mehr als 400 Mhz (1 c) andere (3) 1. Aufmerksam geworden auf HS: über Schule (1) Studienführer () Veranstaltungen der HS (3) Werbung der HS (4) Zeitung / Medien (5)... (6) sonstiges (7): und zwar: Programme verfügbar: Textverarbeitung (4-1) Tabellenkalkulation (4-) Grafikprogramm (4-3) Statistikprogramm (4-4) priv. Internet-Zugang (4-5) 5. Nebenjob J (1) N (0) 6. Einkommen (in 100 Euro) 7. BaFöG J (1) N (0) Kenntnisse in den folgenden Programmen bitte in einem der Felder ankreuzen (nicht dazwischen) keine wenig sehr viel 8. Textverarbeitung 9. Tabellenkalkulation 30. Präsentationsprogramm 31. Statistikprogramm 3. Internet-Anwendung 33. Internet-Programmierung (HTML, Java) Genaueres zur Tabellenkalkulation Excel: -- Können Sie die folgenden Operationen durchführen: und wie sicher wären Sie sich dabei? Nein unsicher sehr sicher 34. Addieren von Zahlen 35. Formeln verwenden 36. Tabelle (für Druck) formatieren 37. Erstellen eines Diagrammes 38. Anlegen einer Pivot-Tabelle 39. (Auto-) Filter benutzen 40. Statistische Auswertungen 41. Erwartungen an das Studium ( Rückseite) Peter Schmidt, Hochschule Bremen 008

31 Quantitative Methoden Seite 5 Datenaufbereitung Auswertung: Erster Schritt: Codierung der verbalen Antworten. Zur Eingabe in ein Statisik- Programm (oder wie hier die Tabellenkalkulation Excel) müssen verbale Angaben in Zahlenwerte umgewandelt werden. Dieser Schritt heißt Codierung. Eingabe der Daten. Codierung für Fragebogen Statistik I 1. Aufmerksam 14. Bundesländer 1.Studiengänge geworden über 1 Bremen 1 BW 1 Schule Bayern EFA Studienführer 3 Berlin 3 ISVW 3 Veranst. HS 4 Brandenburg sonstige bitte direkt eintragen 4 Werbung HS 5 Baden-Württemberg 5 Zeitung/Medien 6 Hamburg 17/18. Verkehrsmittel 6 Internet 7 Hessen 1 Bus / Straßenbahn 7 8 Mecklenburg-Vorpommern Bahn (DB) 8 9 Niedersachsen 3 Fahrrad 9 sonstiges 10 Nordrhein-Westfalen 4 zu Fuß (bei Mehrfachnennung alle Zahlen (z.b. 14)) 11 Rheinland-Pfalz 5 Auto sonstiges bitte in 1 Saarland 6 sonstiges Textfelder eintragen 13 Sachsen 41. Erwartungen an Studium 14 Sachsen-Anhalt Mehrfachnennungen: 41.1 praxisorientierter Stoff 15 Schleswig-Holstein 41. Möglichst guten Job 16 Thüringen 41.3 Interessante Inhalte 41.4 Allgemeinwissen 0 Ausland sonstiges Frage Übung Stud-Gang Semester Geschlecht Alter Raucher Gewicht Groesse FamStandKinder Bildung , In jeder Zeile befindet sich ein Datensatz, d.h. eine befragte Person. In jeder Spalte finden sich die Angaben zu einer bestimmten Frage. Deshalb beinhalten die Spaltenköpfe die Fragennummern und die Bezeichnung der Merkmale. Peter Schmidt, Hochschule Bremen 008

32 Quantitative Methoden Seite 6 Analyse der Daten durch statistische Maße - Möglichkeiten in Excel (003) Einfache Statistische Maße In der Excel-Datei ( ist diese Tabelle noch ausführlicher: in den obersten Zeilen werden einfache beschreibende Statistiken dargestellt (Anm: Anmerkung zu diesem Merkmal ; MW: (arithmetischer) Mittelwert; Antworten: Anzahl der gültigen Antworten auf diese Frage; Min: Kleinster Wert; Max: Größter Wert; StAbw: Standardabweichung) Es wurden Spalten mit verbalen Erläuterungen und Indikatormerkmalen eingefügt. Ein Indikatormerkmal nimmt den Wert 1 an, wenn ein Merkmal gegeben ist, sonst ist es 0. Beispiel Geschlecht: eine 1 in der dritten Spalte bedeutet, dass diese Zeile die Angaben einer Studentin beinhalten. Frage a 3 3-T 4 4-Text Stud-Gang StudGangSg_BW Sg_Efa Sg_VW Semester ErstSemester Geschlecht GeschlechtTAlter Altersgruppe A_bis A_3-5 A_6+ Anm (1-3) 1. Sem 1=weiblich (3 Klassen) MW 0,74 0,19 0,07 1,07 0,97 0,47 3,16 0,41 0,43 0,16 Antworten Min Max StAbW 0,44 0,39 0,6 0,46 0,16 0,50,65 0,49 0,50 0,36 Nr Stud-Gang StudGangSg_BW Sg_Efa Sg_VW Semester ErstSemester Geschlecht GeschlechtTAlter Altersgruppe A_bis A_3-5 A_ BW weiblich 19 -jünger BW weiblich 0 -jünger BW weiblich -jünger BW weiblich BW weiblich 0 -jünger BW männlich ISVW männlich 0 -jünger ISVW männlich ISVW weiblich 19 -jünger ISVW männlich 1 -jünger ISVW männlich -jünger ISVW männlich 1 -jünger ISVW männlich 1 -jünger ISVW männlich 1 -jünger ISVW männlich Pivot-Tabellen Ein wesentliches Mittel zur Analyse von Daten in Excel sind Pivot-Tabellen. In Excel finden Sie diese im Menü Daten - PivotTable. Es sind Zeilen, Spalten und Inhalt der Tabellen anzugeben. Interessieren wir uns beispielsweise für die Anzahl der Befragten nach Alter und Geschlecht, bietet sich ein solches Tabellenlayout an: Peter Schmidt, Hochschule Bremen 008

33 Quantitative Methoden Seite 7 Die Pivot-Tabelle zeigt dann folgende Auszählung: Anzahl - Nr Altersgruppe GeschlechtT -jünger Gesamtergebnis weiblich männlich Gesamtergebnis Also 160 Befragte (eigentlich 164, aber nur 160 haben Alter und Geschlecht angegeben), von denen 85 Männer waren, 9 Frauen über 5 Jahre, usw.) Diese Darstellung von Anzahlen wird in der Statistik als absolute Häufigkeit bezeichnet. Wir könnten den Inhalt der Tabelle auch an (Prozent-) Anteile darstellen lassen. Anzahl - Nr Altersgruppe GeschlechtT -jünger Gesamtergebnis weiblich 6% 36% 36% 47% männlich 38% 64% 64% 53% Gesamtergebnis 100% 100% 100% 100% Diese Darstellung von Anzahlen wird in der Statistik als relative Häufigkeit (hier dargestellt als Zeilenprozente ) bezeichnet. In Pivot-Tabellen können aber auch Anteile, Mittelwerte, Schwankungsmaße u.a. angegeben werden. Dies sind zwar Maße, die erst im weiteren Verlauf der Vorlesung behandelt werden, aber nehmen wir den allgemein bekannten Mittelwert (das arithmetische Mittel ), zum Beispiel den des Merkmals Berufsausbildung : Mittelwert - Berufsausb. Altersgruppe GeschlechtT -jünger Gesamtergebnis weiblich 44% 84% 78% 61% männlich 1% 88% 88% 65% Gesamtergebnis 3% 87% 84% 64% Zur Interpretation dieser Anteilswerte ist zu beachten, dass das Merkmal Berufsausbildung ein Indikatormerkmal ist, ein Merkmal, das nur die Werte 0 oder 1 annehmen kann. Der Wert 1 steht für die Ausprägung Ja, der Wert 0 entsprechend für die Ausprägung Nein. Der Mittelwert eines Indikatormerkmals gibt direkt den Anteil der Personen mit Berufsausbildung an. Solche Mittelwerte von Indikatormerkmalen (oder auch Indikatorvariablen ) werden wir im folgenden sehr oft anschauen, einfach weil es so praktisch ist, gleich mit dem Mittelwert den Anteil der Befragten zu erhalten, die ein bestimmtes Merkmal haben. Wenn Sie sich die große Tabelle der folgenden Seiten anschauen, sehen Sie, dass dort sogar eine ganze Menge von Merkmalen so umcodiert wurden, dass sie wieder Indikatormerkmale sind. Beispielsweise das Alter, das in die drei Indikatorvariablen A_bis, A_3bis5 und A_6plus umgewandelt wurde. Die Prozentanteile 0,41; 0,49 und 0,16 addieren sich naturgemäß zu 100. Analog wurde mit dem Bildungsabschluss B_..., dem Berufsstatuts St_..., dem Geburtsort G_... verfahren. Viel Spaß beim Daten-stöbern. Wir dürfen gespannt sein, ob die Ergebnisse der diesjährigen Befragung anders sind... Peter Schmidt, Hochschule Bremen 008

34 Quantitative Methoden Seite 8 Mittelwerte der abgefragten Merkmale nach Gruppen von Befragten MW: (arithmetischer) Mittelwert; Antworten: Anzahl der gültigen Antworten auf diese Frage; Min: Kleinster Wert; Max: Größter Wert; StAbw: Standardabweichung. Danach folgen die Mittelwerte nach Studienrichtung, Geschlecht, Alter, usw. In der Zweiten Zeile finden Sie die Anzahl der Personen, die dieses Merkmal erfüllten, Bsp: 10 BW- Studierende, Personen haben ein Arbeitseinkommen. Mittelwerte nach Gruppen Alle Befragten BW Efa VW Frauen Männer bis J. 3-5 J. ab 6 J. Berufs- Ausb. BAFöG- Empf. FrNr. Frage Anm MW Antworten Min Max StAbW Sg_BW 0, ,44 1,00 0,00 0,00 0,76 0,71 0,6 0,80 0,84 0,80 0,75 0,79 1. Sg_Efa 0, ,39 0,00 1,00 0,00 0,0 0,19 0,4 0,19 0,08 0,19 0,0 0, Sg_VW 0, ,6 0,00 0,00 1,00 0,04 0,10 0,14 0,01 0,08 0,01 0,05 0,10 Semester 1, ,46 1,10 1,00 1,00 1,13 1,0 1,00 1,00 1,48 1,09 1,00 1,11.a ErstSemester 1. Sem 0, ,16 0,96 1,00 1,00 0,96 0,99 1,00 1,00 0,83 0,97 1,00 0,97 3 Geschlecht 1=weiblich 0, ,50 0,49 0,48 0,5 1,00 0,00 0,6 0,36 0,36 0,46 0,35 0,43 4 Alter 3, ,65 3,6,1,0,56 3,69 0,76 3,88 7,5 4, 3,50 3,1 4.1 A_bis 0, ,49 0,35 0,5 0,75 0,55 0,9 1,00 0,00 0,00 0,1 0,8 0,45 4. A_3-5 0, ,50 0,47 0,4 0,08 0,33 0,5 0,00 1,00 0,00 0,58 0,50 0, A_6+ 0, ,36 0,18 0,06 0,17 0,1 0,19 0,00 0,00 1,00 0,1 0,3 0,18 5 Raucher 1=Ja 0, ,47 0,36 0,0 0,33 0,34 0,33 0,9 0,43 0,0 0,37 0,50 0,40 6 Gewicht 69, ,88 70,1 66,3 71,8 60,80 76,83 65,0 73,9 70,39 70,7 73,93 70,8 7 Groesse 176, ,10 176,4 174,4 177,8 170, 181,5 173,9 178,1 177,0 176,9 177,8 176,3 8 FamStand ledig=1 0, ,5 0,91 1,00 0,9 0,93 0,94 1,00 0,94 0,76 0,93 0,95 0,94 9 Kinder 0, ,6 0,07 0,00 0,08 0,05 0,06 0,00 0,03 0,5 0,07 0,03 0, Bild_Abi 0, ,50 0,5 0,77 0,75 0,67 0,51 0,68 0,56 0,36 0,50 0,38 0, Bild_Fach 0, ,49 0,44 0,3 0,08 0,6 0,47 0,3 0,38 0,5 0,45 0,58 0, Bild_Son 0, ,0 0,04 0,00 0,17 0,07 0,0 0,00 0,06 0,1 0,05 0,05 0,04 11 Berufsausb. 1=Ja 0, ,48 0,69 0,65 0,08 0,6 0,65 0,3 0,87 0,84 1,00 0,78 0,64 1 BerufsDauer Jahre 1, ,50,05 0,97 1,3 1,71 1,89 0,68 1,96 4,44,53,50 1, St_ang 0, ,1 0,99 0,84 1,00 0,93 0,98 0,90 0,96 1,00 0,98 1,00 0, St_selb 0, ,10 0,01 0,00 0,00 0,0 0,00 0,00 0,0 0,00 0,01 0,00 0, St_freiber 0, ,18 0,00 0,16 0,00 0,05 0,0 0,10 0,0 0,00 0,01 0,00 0, G_HB 0, ,49 0,45 0,3 0,08 0,36 0,43 0,35 0,5 0,0 0,48 0,30 0, G_NS 0, ,4 0,4 0,16 0,17 0,4 0, 0,18 0, 0,40 0,8 0,43 0, G_sonstD 0, ,41 0,13 0,48 0,33 0,5 0,17 0,3 0,10 0,4 0,15 0,13 0, G_Ausl 0, ,38 0,18 0,03 0,4 0,16 0,17 0,15 0,16 0,16 0,10 0,15 0,10 15 EntfWohn 16, ,77 15,8 17,3 11,1 16,58 15,09 14,45 16,80 15,96 17,0 17,36 13,71 16 WegZeit 30, ,38 30,3 8,5 6,5 30,0 9,19 30,17 9,18 30,04 30,75 33,0 7, V_Bus 0, ,50 0,44 0,48 0,67 0,49 0,44 0,49 0,41 0,48 0,4 0,51 0, V_Bahn 0, ,4 0,3 0,9 0,00 0,4 0,1 0,18 0,8 0,0 0,8 0,8 0, V_Fahrrad 0, ,9 0,09 0,10 0,08 0,1 0,07 0,11 0,09 0,08 0,11 0,08 0, V_Fuß 0, ,11 0,01 0,03 0,00 0,00 0,0 0,0 0,01 0,00 0,01 0,00 0, V_Auto 0, ,40 0, 0,10 0,5 0,15 0,4 0,18 0,1 0,4 0,19 0,13 0, V_sonst 0, ,08 0,01 0,00 0,00 0,00 0,01 0,0 0,00 0,00 0,00 0,00 0, V_Bus 0, ,49 0,36 0,5 0,50 0,49 0,33 0,4 0,38 0,41 0,40 0,40 0, V_Bahn 0, ,3 0,11 0,16 0,00 0,11 0,1 0,10 0,1 0,14 0,1 0,13 0, V_Fahrrad 0, ,39 0,19 0,0 0,10 0,14 0, 0,13 0,6 0,14 0,18 0,17 0, V_Fuß 0, ,1 0,06 0,04 0,00 0,07 0,03 0,06 0,04 0,05 0,04 0,00 0, V_Auto 0, ,4 0,6 0,08 0,30 0,18 0,7 0,3 0,0 0,7 0,3 0,30 0, V_sonst 0, ,09 0,00 0,00 0,10 0,00 0,01 0,0 0,00 0,00 0,00 0,00 0, W_City 0, ,40 0, 0,1 0,08 0,3 0,19 0,0 0, 0,0 0,0 0,3 0,5 19. W_West 0, ,8 0,08 0,07 0,08 0,09 0,08 0,08 0,09 0,08 0,07 0,13 0, W_NO 0, ,39 0,18 0,4 0,17 0,0 0,18 0,0 0,13 0,8 0,17 0,15 0, W_Ost 0, ,31 0,10 0,07 0,5 0,08 0,13 0,14 0,10 0,04 0,07 0,08 0, W_links 0, ,31 0,10 0,03 0,33 0,08 0,1 0,13 0,09 0,08 0,10 0,08 0, W_Nord 0, ,19 0,05 0,00 0,00 0,04 0,04 0,03 0,04 0,04 0,04 0,10 0, W_umzu 0, ,43 0,3 0,34 0,08 0,3 0,5 0,17 0,9 0,8 0,3 0,0 0, W_sonst 0, ,19 0,04 0,03 0,00 0,05 0,0 0,05 0,04 0,00 0,04 0,05 0,01 Arb. Eink. Peter Schmidt, Hochschule Bremen 008

35 Quantitative Methoden Seite 9 Mittelwerte nach Gruppen Alle Befragten BW Efa VW Frauen Männer bis J. 3-5 J. ab 6 J. Berufs- Ausb. BAFöG- Empf. FrNr. Frage Anm MW Antworten Min Max StAbW NoÖV_teuer 0, ,30 0,10 0,00 0,5 0,00 0,17 0,05 0,05 0,38 0,09 0,09 0,10 0. NoÖV_langsam 0, ,50 0,46 0,33 0,75 0,43 0,48 0,55 0,36 0,50 0,38 0,7 0,5 0.3 NoÖV_WarteZeit 0, ,50 0,41 0,33 0,75 0, 0,59 0,36 0,45 0,50 0,9 0,45 0, NoÖV_Erreichb. 0, ,3 0,1 0,00 0,00 0,17 0,07 0,09 0,14 0,13 0,09 0,18 0, NoÖV_unbequem 0, ,50 0,41 0,17 0,75 0, 0,55 0,3 0,50 0,38 0,3 0,7 0, NoÖV_sonst 0, ,38 0,17 0,33 0,00 0, 0,14 0,18 0,18 0,13 0,1 0,18 0, Auf_Schule Ja 0, ,37 0,0 0,00 0,17 0,11 0,1 0,14 0,18 0,0 0,14 0,15 0,18 1. Auf_StFührer Ja 0, ,45 0,6 0,3 0,5 0,30 0,3 0,33 0,5 0,08 0,3 0,6 0,4 1.3 Auf_HSB Ja 0, ,7 0,09 0,06 0,08 0,11 0,06 0,03 0,13 0,08 0,1 0,13 0, Auf_Werb Ja 0, ,3 0,06 0,03 0,08 0,07 0,05 0,08 0,01 0,1 0,07 0,03 0, Auf_Medien Ja 0, ,4 0,04 0,16 0,00 0,07 0,06 0,11 0,04 0,00 0,04 0,03 0, Auf_WWW Ja 0, ,5 0,03 0,16 0,5 0,09 0,05 0,11 0,04 0,04 0,04 0,05 0,05.1 WO_Eigen 0, ,49 0,46 0,7 0,17 0,3 0,48 0,3 0,4 0,80 0,48 0,40 0,43. WO_WG 0, ,37 0,10 0,33 0,33 0,19 0,14 0, 0,13 0,1 0,13 0,0 0,19.3 WO_Unt 0, ,0 0,0 0,10 0,17 0,07 0,0 0,06 0,01 0,04 0,01 0,05 0,01.4 WO_Eltern 0, ,49 0,41 0,3 0,33 0,40 0,35 0,46 0,4 0,04 0,37 0,35 0,34.5 WO_sonst 0, ,13 0,01 0,07 0,00 0,03 0,01 0,03 0,01 0,00 0,0 0,00 0, Kein_PC keinen 0, ,33 0,11 0,10 0,18 0,18 0,06 0,13 0,15 0,00 0,09 0,11 0,11 3. PC_allg(486 oder unbekannt) Ja 0, ,34 0,14 0,10 0,17 0,19 0,08 0,14 0,11 0,16 0,14 0,11 0, P-400 Ja 0, ,48 0,38 0,31 0,33 0,30 0,4 0,33 0,35 0,5 0,40 0,38 0, P400++ Ja 0, ,45 0,4 0,34 0,33 0,15 0,39 0,7 0,3 0,0 0,7 0,30 0,7 3.4 PC_Mac Ja 0, ,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0, PC_anders Ja 0, ,3 0,1 0,14 0,00 0,19 0,05 0,14 0,08 0,1 0,10 0,11 0, Pg_Text Ja 0, ,3 0,89 0,84 1,00 0,88 0,91 0,88 0,87 1,00 0,91 0,83 0,90 4. Pg_Tabk Ja 0, ,4 0,79 0,77 0,67 0,71 0,86 0,74 0,78 0,96 0,84 0,75 0,8 4.4 Pg_Grafik Ja 0, ,50 0,56 0,45 0,5 0,49 0,53 0,45 0,50 0,7 0,53 0,50 0, Pg_Stat Ja 0, ,7 0,10 0,03 0,00 0,11 0,06 0,06 0,07 0,16 0,10 0,08 0,1 4.6 Pg_InterNet Ja 0, ,48 0,6 0,65 0,9 0,60 0,71 0,59 0,6 0,96 0,69 0,55 0,73 5 Arbeit Ja 0, ,50 0,5 0,8 0,58 0,45 0,51 0,5 0,4 0,63 0,49 0,50 1,00 6 Einkommenin 100 DM-Kl. 3, ,9 4,51 0,87 0,85 1,48 4,71,03 5,47 1,87 4,66 1,9 4,55 7 BAFöG Ja 0, ,46 0,30 0,36 0,17 0,3 0,37 0,19 0,36 0,50 0,37 1,00 0,3 8 Kn_Text (1-5), ,01,61 3,03 1,83,63,6,48,80,68,88,75,68 9 Kn_Tabk Ja 1, ,0 1,84,7 0,58 1,6,00 1,55,01,08,1 1,90 1,95 30 Kn_Präs Ja 0, ,06 0,85 1,60 0,5 0,74 1,13 0,88 0,93 1,4 1,11 0,80 0,89 31 Kn_Stat Ja 0, ,60 0,31 0,41 0,7 0,1 0,43 0,33 0,7 0,50 0,31 0,41 0,40 3 Kn_InterNet Ja, ,08,05,37,00,00,19,0,16,4,5,05,8 33 Kn_HTML Ja 0, ,66 0,5 0,30 0,58 0,1 0,43 0,3 0,5 0,5 0,31 0,3 0,40 34 X-Addition Ja, ,53,81 3,33 1,00,6,9,45 3,04 3,04 3,17,98,66 35 X-Formeln Ja, ,43,05,57 0,50 1,89,14 1,80,16,36,40,0 1,9 36 X-formatieren Ja, ,74,17,63 0,33 1,93,7 1,97,19,40,55,18,17 37 X-Diagramm Ja 1, ,16 1,99,48 0,5 1,5,3,16 1,70,0,14 1,90 1,78 38 X-Pivot Ja 0, ,89 0,53 0,80 0,08 0,49 0,60 0,56 0,46 0,7 0,69 0,60 0,6 39 X-Filter Ja 0, ,34 0,85 1,57 0,08 0,80 1,05 0,84 0,88 1,3 1,7 1,03 1,08 40 X-Statistik Ja 0, ,86 0,49 1,00 0,08 0,47 0,63 0,67 0,46 0,5 0,64 0,48 0, Erw_Praxis Ja 0, ,49 0,37 0,47 0,5 0,50 0,9 0,51 0,8 0,0 0,3 0,34 0, 41. Erw_Job Ja 0, ,49 0,38 0,67 0,18 0,48 0,36 0,41 0,37 0,47 0,47 0,38 0, Erw_Inhalte Ja 0, ,43 0,6 0,33 0,00 0,1 0,5 0,18 0,3 0,40 0,35 0,4 0, Erw_Allgem Ja 0, ,35 0,17 0,07 0,08 0,09 0,17 0,05 0,15 0,33 0,1 0,10 0,06 Arb. Eink. Peter Schmidt, Hochschule Bremen 008

36 Quantitative Methoden Seite 30 Hinweise zur Erstellung von Fragebogen Es sollen hier einige (technische) Hinweise zur Erstellung von Fragebogen (in Word) gegeben werden, die zum einen die Erstellung / Layout betreffen, zum zweiten aber auch bereits die Erfassung vorbereitend erleichtern. Allgemeines Ein Fragebogen sollte ansprechend aussehen und nicht durch seine bloße äußere Form abschrecken. Zu Beginn bietet sich (als Blickfang) an, das Logo oder die Logos der beteiligten Institutionen auf den Kopf des Fragebogens zu platzieren. Nach einer kurzen Anrede sollte der Bogen mit Fragen beginnen, die in das Thema einführen und das Interesse der Befragten wecken. Zu vermeiden sind hier allgemeine Angaben über Alter, Geschlecht, Situation,..., diese gehören an den Schluss des Bogens. Fragen Die Fragen sollten fortlaufend nummeriert werden, diese Nummerierung dient später auch als Variablennummer in der Auswertungsdatei. (siehe jeweils Beispiel unten) Es ist zu unterscheiden zwischen offenen Fragen (Raum für Einträge - V1) und geschlossenen Fragen (Items zum Ankreuzen vorgegeben). Bei letzteren ist schon im Vorfeld zu klären, ob nur eine Alternative gewählt werden kann, oder Mehrfachnennungen möglich sind. Im ersten Fall sind die Items Ausprägungen der Variable (V), im zweiten Fall ist jede der möglichen Nennungen eine Variable (V - V5). Beispiel: 1. Wie oft waren Sie im letzten Jahr in der Kunsthalle Bremen? (V1) Mal. Sie Sind hergekommen, um sich anzusehen: (V) (1) nur die Sonderausstellung () nur die ständige Sammlung (3) beides 3. Was hat Sie dazu bewegt, die Sonderausstellung Der Blaue Reiter zu besuchen? Werbemaßnahmen (V3) Mund Propaganda (V4) Sonstiges (V5) Technische Hinweise zum Nummerieren: Die Nummerierung wurde mittels Feldern (in WinWord - siehe ggf. Hilfe-Funktion) erzeugt und es wird nachdrücklich empfohlen, dies zu tun, da sonst jede Verschiebung der Fragenreihenfolge mit erheblichem Aufwand ver- Peter Schmidt, Hochschule Bremen 008

37 Quantitative Methoden Seite 31 bunden ist. Sie können erkennen, wie die Nummerierung erzeugt sind, indem Sie in diesem (WinWord-) Dokument die Feldfunktionen sichtbar machen. Dies geht entweder über das Menu Extras-Optionen-Ansicht-Feldfunktionen oder mittels der Tastenkombination Alt-F9. Sie erkennen dann, dass in diesem Beispiel die Funktion Seq (sequentielles Nummerieren) in zwei Varianten benutzt wird. Die Fragen werden nummeriert mittels {Seq f}, der einfachsten Anwendung dieses Feldes - f ist dabei eine beliebige Bezeichnung, diese kann frei gewählt werden, Word nummeriert alle Seq-Felder mit der gleichen Bezeichnung aufsteigend. Die Fragen sind nummeriert, indem eine andere Bezeichnung verwendet wird; (V{Seq Frage}) erzeugt die Variablennummern, bei denen der Buchstabe V unmittelbar von der Zahl gefolgt wird. Bei der Nummerierung der Alternativen ist es erforderlich, dass diese in jeder Frage wieder von vorne beginnt. Daher muss bei der ersten Alternative der Schalter \r 1 gesetzt werden (renumber): ({Seq Alt \r 1}), danach wird laufend nummeriert: ({Seq Alt}). Pretest Wenn machbar, ist es sehr sinnvoll, einen Pretest durchzuführen, d.h. den Fragebogen mit einigen Test-Personen auszuprobieren und die Daten einzugeben. Die Testpersonen sollten nach Anregungen gefragt, der Fragebogen - nach Feedback und Dateneingabe - auf mögliche Inkonsistenzen untersucht und diese vor der Hauptbefragung beseitigt werden. Diesen Text und auch ein Anwendungsbeispiel (Fragebogen als Word-Datei sowie Daten und Auswertung als Excel-Dateien) finden Sie auf der Webseite für den MBA-Kurs. Peter Schmidt, Hochschule Bremen 008

38 Material zur Schließenden Statistik Inhalt 1. Kombinatorik & Wahrscheinlichkeitsrechnung...34 Definition von Wahrscheinlichkeiten Rechnen mit Wahrscheinlichkeiten Theoretische Verteilungen...38 Wahrscheinlichkeits-Dichte und Verteilungsfunktion Stetige Verteilungen Zentraler Grenzwertsatz Schluss von der Stichprobe auf die Grundgesamtheit Schätztheorie Konfidenzintervalle (für den Mittelwert) Hypothesentests Parametrische Tests Testen von Mittelwerten Zweistichprobentests Testen der Aussagekraft der Regressionskoeffizienten bei Multipler Regression Fallbeispiel College Town... 55

39 Schließende Statistik 1 Kombinatorik & Wahrscheinlichkeitsrechnung = Ausgangspunkt: Man will allgemeine Aussagen über die Grundgesamtheit treffen, diese ist jedoch gar nicht näher bekannt ( z.b. Mittelwert, Standardabweichung etc.) Bekannt sind dagegen Aussagen über eine Stichprobe Ziel: Schluss von der Stichprobe auf die Grundgesamtheit Stichprobe Grundgesamtheit ermittelt werden z.b. Statistiken Parameter Mittelwert µ Standardabweichung s σ Anzahl der Beobachtungen n Ν Beispiel: Als Leiter der Qualitätsabteilung einer Glühbirnenfirma, muss ich wissen, wie lange die produzierten Glühbirnen im Durchschnitt brennen. Problem: Ich kann nicht alle ausprobieren... Deshalb entnehme ich aus der laufenden Produktion 0 Glühbirnen und messe, wie lange diese brennen. Es ergibt sich eine durchschnittliche Brenndauer von 90 Stunden Grundgesamtheit Stichprobe x = 90 Stunden s= 30 Stunden Auf dieser Basis schätze ich ab (statistischer Schluss), dass auch die Grundgesamtheit der Glühbirnen eine Brenndauer von 90 Stunden hat, stimmt das? P. Schmidt, Hochschule Bremen Seite 33

40 Schließende Statistik 1 Kombinatorik & Wahrscheinlichkeitsrechnung 1. Kombinatorik & Wahrscheinlichkeitsrechnung Schon in der Antike tritt der Gedanke auf, dass die Naturgesetze durch eine sehr große Anzahl von zufälligen Ereignissen zur Geltung kommen. Die Aufdeckung der Gesetzmäßigkeiten, auf deren Auftreten zahlreiche individuelle Einflüsse einwirken, die nicht oder fast nicht miteinander verbunden sind, war auch Ziel der Gelehrten, die die Wahrscheinlichkeitsrechnung wesentlich beeinflussten. Vor allem die mit Glücksspielen zusammenhängenden Probleme bildeten den Anlass dafür, dass sich bedeutende Gelehrte mit Fragen der Zufälligkeit von Ereignissen u.a. beschäftigten. Problem: Wie groß ist die Wahrscheinlichkeit, eine 6 zu würfeln? Anzahl der günstigen Ausgänge Anzahl der möglichen Ausgänge W = = = = Problem: Wie groß ist die Wahrscheinlichkeit, 6 Richtige im Lotto zu haben? Anzahl der günstigen Ausgänge Anzahl der möglichen Ausgänge W = = = = P. Schmidt, Hochschule Bremen Seite 34

41 Schließende Statistik 1 Kombinatorik & Wahrscheinlichkeitsrechnung Definition von Wahrscheinlichkeiten Was ist eine Wahrscheinlichkeit? Watt is en Wahrscheinlichkeit? Da stelle mer uns ens janz dumm: Et kütt drupp ahn: a) subjektive Wahrscheinlichkeit auf welches Ereignis würde ich einen bestimmten Geldbetrag setzen? b) Klassische Definition nach Laplace c) Statistische (empirische) Definition nach Mises W(A) = f(a) d) Axiomatische Definition nach ΚΟΛΜΟΓΟΡΟΒ (=Kolmogoroff) (vgl. Formel (6-9)) 1. immer 0. W (Ω) = 1 3. additiv 0 W 1 P. Schmidt, Hochschule Bremen Seite 35

42 Schließende Statistik 1 Kombinatorik & Wahrscheinlichkeitsrechnung Rechnen mit Wahrscheinlichkeiten Additionssätze 1. Allgemeiner Additionssatz: Gegeben sei ein gemischter Kasten Bier Definition: Wie wahrscheinlich ist es, aus einer Kiste Bier mit mehreren Sorten blind zwei Flaschen meines Lieblingsbieres Bocksbier zu ziehen? Was muss ich dazu vorher wissen? W(A B) = W(A) + W(B) W(A B) A Hefebier Die Wahrscheinlichkeit, dass ich eine Flasche Bocksbier oder eine Flasche Hefebier aus dem Kasten ziehe. B Bocksbier. Spezieller Additionssatz A Bocksbier Gold Definition: Wie wahrscheinlich ist es, aus einer Kiste Bier mit mehreren Sorten blind zwei Flaschen meines Lieblingsbieres Bocksbier zu ziehen? Was muss ich dazu vorher wissen? W(A B) = W(A) + W(B) B Bocksbier classic Die Wahrscheinlichkeit, dass ich eine Flasche Bocksbier classic oder eine Flasche Bocksbier Gold aus dem Kasten ziehe. P. Schmidt, Hochschule Bremen Seite 36

43 Schließende Statistik 1 Kombinatorik & Wahrscheinlichkeitsrechnung Allgemeiner Multiplikationssatz Definition: Wie wahrscheinlich ist es, aus einer Kiste Bier mit mehreren Sorten blind meine Lieblingsbiere Bocksbier zu ziehen? Was muss ich dazu vorher wissen? A: Bocksbier classic B: Bocksbier Gold C: Bocksbier bleifrei Nach der Übung kaufe ich mir an der Tankstelle einen gemischten 6Pack mit je Flaschen Bocksbier classic, Bocksbier Gold und Bocksbier bleifrei. Ich nehme 3 Flaschen heraus. Wie groß ist die Wahrscheinlichkeit, dass ich zuerst ein A, dann ein B und dann ein C erwische? 1. Griff. Griff 3. Griff A B Bo ck s C Formel: W(A B C) = W(A) W(B A) W(C A B) (6-16) Beim Multiplikationssatz ist also die Wahrscheinlichkeit gesucht, dass ich eine Flasche classic und eine Flasche Gold und eine Flasche bleifrei aus dem Kasten ziehe. P. Schmidt, Hochschule Bremen Seite 37

44 Schließende Statistik Theoretische Verteilungen. Theoretische Verteilungen Wahrscheinlichkeits-Dichte und Verteilungsfunktion Zu einem der beliebtesten Experimente in der Statistik gehört das Werfen von Münzen, vielleicht auch, weil die möglichen Ausgänge dabei sehr begrenzt sind: Kopf/Wappen (W) oder Zahl (Z). Eine abzählbare Anzahl möglicher Ergebnisse deutet auf diskrete Merkmale hin: In diesem Fall soll eine Münze dreimal geworfen werden. Die ZV X entspricht dabei der Anzahl der geworfenen Wappen: Ω Wahrscheinlichkeit X ZZZ 0,15 ZZW 0,15 ZWZ 0,15 WZZ 0,15 WWZ 0,15 WZW 0,15 ZWW 0,15 WWW 0,15 1 W (X=x) f(x) F(x) Wahrscheinlichkeits- Funktion Wie groß ist die Wahrscheinlichkeit, dass die Zufallsvariable X den Wert x annimmt. f(x) = W(X = x) Verteilungs-Funktion Wie groß ist die Wahrscheinlichkeit, dass die Zufallsvariable X höchstens den Wert x annimmt. F(x) = W(X x) = f ( x i ) x i x P. Schmidt, Hochschule Bremen Seite 38

45 Schließende Statistik Theoretische Verteilungen Stetige Verteilungen 1) Normalverteilung (nach ihrem Erfinder, dem Mathematiker, Physiker und Astronomen auch Gauß sche Glockenkurve genannt, der bei der Suche nach einem Verteilungsgesetz für zufällige Beobachtungsfehler im Zusammenhang mit astronomischen Untersuchungen darauf stieß) Charakteristika: Dichtefunktion: Formel: 1 x µ σ 1 f ( x µ, σ ) = e (7-4) Π σ Beispiel: Der Durchmesser von Handelsklasse A Melonen sei normalverteilt mit dem Mittelwert 4,5 cm und einer Standardabweichung von 1 cm. oder kürzer: X N (4,5 ; 1) 1 Fläche unter dem Intervall Intervall Fläche P. Schmidt, Hochschule Bremen Seite 39

46 Schließende Statistik Theoretische Verteilungen Lageparameter Streuungsparameter Verteilungsfunktion P. Schmidt, Hochschule Bremen Seite 40

47 Schließende Statistik Theoretische Verteilungen ) Standardnormalverteilung Schreibweise: Folgt eine Zufallsvariable X einer Normalverteilung mit dem Mittelwert µ=0 und der Standardabweichung σ =1, ist sie standardnormalverteilt. Man macht in diesem Fall nichts anderes, als dass eine Transformation der x-werte in z- Werte erfolgt. Tragen Sie dies bitte in den obigen Graphen ein! Durch diese Transformation lassen sich Wahrscheinlichkeiten aus Tabellen leicht ablesen und müssen nicht mittels komplizierter Formel errechnet werden (Formelsammlung, Tafel 4) Die Tabellen geben dabei die Fläche unter der Kurve an, dabei wird immer von links angefangen zu messen, also die Wahrscheinlichkeit, dass die ZV höchstens den (abgelesenen Wert) z annimmt Formelsammlung S. 5. P. Schmidt, Hochschule Bremen Seite 41

48 Schließende Statistik Theoretische Verteilungen Zentraler Grenzwertsatz Verteilung der Grundgesamtheit Wichtig(st)e Basis für Schätzen und Testen!! µ Verteilung möglicher Stichproben Verteilung der Stichprobenmittelwerte P. Schmidt, Hochschule Bremen Seite 4

49 Schließende Statistik Theoretische Verteilungen Beispiel: Eine Grundgesamtheit bestehe aus 5 Angestellten mit den Jahreseinkommen (TEuro): Angestellte/r Einkommen X i ( Xi X ) 1. Anne Ben Cäsar Doris Eva 40 0 Mittelwert: Standardabweichung: ΣX i =00 45 Stichproben und Stichprobenmittelwerte: Stichprobe 1. ABC ABD ABE ACD ACE ADE BCD BCE BDE CDE Σ X i = Mittelwert: Standardabweichung: P. Schmidt, Hochschule Bremen Seite 43

50 Z c Z c critical Schließende Statistik 3 Schluss von der Stichprobe auf die Grundgesamtheit 3. Schluss von der Stichprobe auf die Grundgesamtheit 3.1 Schätztheorie Damit ist das Abschätzen der Parameter der Grundgesamtheit (σ und µ) auf Basis derer einer Stichprobe gemeint. Bei einer Punktschätzung werden die konkreten Parameter direkt durch die der Stichprobe geschätzt. Beispiel für eine Punktschätzung : µ = x σ = s Dies ist unter Umständen sehr ungenau! Daher behandeln wir im Folgenden Intervallschätzungen: 3. Konfidenzintervalle (für den Mittelwert) Hier wird davon ausgegangen, dass ein Parameter nur mit einer bestimmten Wahrscheinlichkeit (Signifikanz) vorausgesagt werden kann, also nur ungefähr. Daraus ergibt sich ein symmetrisches Intervall um den Mittelwert der Stichprobe x herum. Wir sprechen von einer Ober- (g o ) und einer Untergrenze (g u ) des Intervalls. W ( c X c X x z σ µ x + z σ ) = 1 α Untergrenze Obergrenze f(x) 95 % g u g o x Wiederholung Symbole Parameter der Grundgesamtheit Statistiken der Stichprobe Mittelwert Standardabweichung Anzahl Beobachtungen Die Stichproben-Standardabweichung σ X ist dabei abhängig von der Größe der Grundgesamtheit und der Stichprobe. In der Formelsammlung auf S. 16 sind diese Fallunterscheidungen genau aufgeführt. σ Im einfachsten Fall gilt: σ = X n P. Schmidt, Hochschule Bremen Seite 44

51 Schließende Statistik 3 Schluss von der Stichprobe auf die Grundgesamtheit Problem: In einem Geschäft entdecke ich Chipstüten, auf denen die genaue Inhaltsangabe vergessen wurde. Bevor ich beim Hersteller anrufe, nicht nur weil diese fehlende Angabe rechtswidrig ist, sondern weil ich mir eine Belohnung ausrechne, starte ich Testkäufe, weil ich nun wirklich wissen will, was drin ist. Meine Stichprobenwerte (errechnet aus 60 Stichproben) ergeben ein x von 50 g und ein s von 5 g. Frage: Welches Konfidenzintervall ergibt sich für die Grundgesamtheit? W ( c X c X x z σ µ x + z σ ) = 1 α W( < µ < ) = 0,95 Frage: Welche Unter- und Obergrenzen kann ich damit definieren, in dessen Intervall 95 % aller weiteren Chipstüten liegen wird (also in dem der unbekannte Mittelwert µ der Grundgesamtheit liegt? Frage: Wie groß ist die Wahrscheinlichkeit, dass ich mich irre? P. Schmidt, Hochschule Bremen Seite 45

52 Schließende Statistik 3 Schluss von der Stichprobe auf die Grundgesamtheit 3.3 Hypothesentests Vorbemerkung zum Statistischen Testen Mit Statistik kann man nichts beweisen! (weil doch irgendwie alles Zufall ist)! Man kann nur zeigen, dass Aussagen falsch sind (mittels Gegenbeispiel) - widerlegen - ablehnen - falsifizieren Daher wird oft nicht die gewünschte Aussage selbst untersucht, sondern das Gegenteil in der Hoffnung, dieses Gegenteil zu widerlegen. Diese Gegenteilige Aussage wird dabei zu einem Strohmann (der verbrannt werden soll). Statistisch sprechen wir bei diesen Aussagen von Hypothesen. Diese nummerieren wir: H 0 ist die Ausgangshypothese des Tests, die untersucht wird. Diese kann als eventuell widerlegt werden. H 1 ist die Gegenhypothese oder Alternativhypothese. Sie kann eventuelle unterstützt (belegt) werden, indem H 0 widerlegt wird P. Schmidt, Hochschule Bremen Seite 46

53 Schließende Statistik 3 Schluss von der Stichprobe auf die Grundgesamtheit Hypothesentests: Beispiel und Vorgehen Bei statistischen Tests geht es um die Überprüfung einer Hypothese/einer Behauptung. Problem: Die Firma Studentenfit hat sich auf Müsliriegel spezialisiert, die den Lernerfolg bei Studenten massiv erhöhen. Der Kohlenhydratgehalt von 100 g dieses Müsliriegels liegt bei 70 g. Der Riegel darf nicht zu wenig Kohlenhydrate aufweisen, soll die lernfördernde Wirkung des Müsliriegels aufrechterhalten werden (σ = 7g). Bei zu vielen Kohlenhdraten streiken jedoch die Studenten, da sie dem Lernerfolg nicht ihre gute Figur opfern wollen. Eine zufällige Stichprobe 100 ergibt ein x von 68,9 g. Frage: Stimmen die Angaben auf der Packung aus statistischer Sich oder nicht? Die Schritte im Einzelnen 0. Schritt: Informationen über die Stichprobe und Grundgesamtheit (je nach Typ des Tests andere oder gar keine Parameter): Umfang Mittelwert Standardabw. Grundgesamtheit N =? µ =? σ =? Stichprobe n =? x =? s =? 1. Schritt: Aufstellen der Hypothesen H 0 = zu widerlegende Ausgangsbehauptung ( Händler ) H 1 = zu untersuchende Gegenbehauptung, anhand derer widerlegt wird ( S. 79). Schritt: Festlegen des Signifikanzniveaus α (ist in der Regel angegeben oder aus der Aufgabe abzuleiten) P. Schmidt, Hochschule Bremen Seite 47

54 Schließende Statistik 3 Schluss von der Stichprobe auf die Grundgesamtheit 3. Schritt: Gegebenenfalles Fallunterscheidung bei der Berechnung von σ X σ bekannt oder unbekannt? Größe der Stichprobe beachten!!! S. 16 Formelsammlung 4. Schritt: Ablesen in der Tabelle (z.b. der Standardnormalverteilung F SN) ein- und zweiseitige Hypothesen beachten! 5. Schritt: Ablesen bzw. Berechnen des kritischen Wertes ein- und zweiseitige Hypothesen beachten! 6. Schritt: Anwenden der Entscheidungsregeln H 0 verwerfen oder nicht verwerfen ( annehmen ) 7. Schritt: Interpretation der Ergebnisse Wozu das Ganze? Beispielzeichnung für einen parametrischen Test: P. Schmidt, Hochschule Bremen Seite 48

55 Schließende Statistik 3 Schluss von der Stichprobe auf die Grundgesamtheit 3.4 Parametrische Tests Testen von Mittelwerten Bei diesem Test ist der Mittelwert der Grundgesamtheit unbekannt. Es gibt aber eine Vermutung (Behauptung), er betrage µ 0. Es soll nun überprüft werden, ob es sich bei µ 0 um den wahren Mittelwert µ handeln kann. Dies wird auf Basis der Stichprobe ermittelt. Ist nur die Überschreitung in eine Richtung nicht möglich, handelt es sich um einen einseitigen Test Für das Ablesen des z c ergibt sich: (einseitiger Test, linksseitig kritischer Bereich kann auch abgelesen werden mittels: F SN ( z c ) = 1 α F SN ( z c ) = α f ( x ) α 1 - α µ c u µ 0 x Annahmebereich Sind zu beiden Seiten des Mittelwertes Grenzen gesetzt, handelt es sich um einen zweiseitigen Test Für das Ablesen des z c ergibt sich: D ( z c ) = 1 α dies entspricht: F SN ( z c ) = 1 α/ f ( x ) 1 - α α x µ c u µ 0 µ c o Annahmebereich Tabellierung der Standardnormalverteilung, Tafel 4. P. Schmidt, Hochschule Bremen Seite 49

56 Schließende Statistik 3 Schluss von der Stichprobe auf die Grundgesamtheit Ermittlung des Annahmebereiches: Um den Annahmebereich zu ermitteln, gibt es Varianten Formelsammlung Kapitel 8.3 Variante A: Testentscheidung auf Basis absoluter Werte: kritischen Grenzen µ c (bzw. p c ), indem vom angenommenen Mittelwert µ 0 z c Standardabweichungen in die entsprechenden Richtungen abgetragen werden: 5. u u µ c = µ 0 zc σ bzw. p X c = p0 zc σ pˆ (8-35) o u µ c = µ 0 + zc σ bzw. pc = p + zc pˆ (8-36) X 0 σ 6. Entscheidungsregel: Ablehnung von H 0, wenn: (analog für Testwerte t und χ ) o x > µ bzw. p ˆ > bei rechts- oder zweiseitigem Test oder (8-37) o c u x < µ c bzw. p c p ˆ < bei links- oder zweiseitigem Test (8-38) u p c 7. Interpretation des Ergebnisses Variante B: (einfacher aber fehleranfälliger) Z-Test Testentscheidung auf Basis der standardisierten Z-Werte Als Prüfgröße ergibt sich z.b.: z X x µ 0 σ =, X x µ = oder s t X 0 womit im Grunde x bzw. pˆ auf die Z-Achse (oder t-achse) übertragen werden. Für die Ermittlung von σ ist auch hier eine Fallunterscheidung nötig. X n z pˆ = pˆ σ pˆ p 0 5. Berechnung der Prüfgröße z X (bzw. t x, z p ˆ, χ oder t siehe Kapitel bis 8.4.4) 6. Anwendung der Entscheidungsregel (analog für die anderen Prüfgrößen) wenn z > z X c Ablehnung von H 0 (8-39) 7. Interpretation des Ergebnisses Am besten betrachten wir dies anhand der folgenden Beispiele... P. Schmidt, Hochschule Bremen Seite 50

57 Schließende Statistik 3 Schluss von der Stichprobe auf die Grundgesamtheit Beispiel für einen zweiseitigen Test über den Mittelwert µ Der Durchmesser von in Großserie hergestellten Eisenstäben ist nach Angaben des Herstellers normalverteilt mit Mittelwert µ = 10 mm und einer Standardabweichung von 0,7 mm. Ein Kunde, der die Eisenstäbe nur verwenden kann, wenn sie die angegebenen Toleranzen einhalten, entnimmt der laufenden Produktion 144 Eisenstäbe. Deren Untersuchung ergibt einen Mittelwert von 10,15 mm. Wird der Kunde die Eisenstäbe von diesem Hersteller beziehen, wenn ein Test mit einem Signifikanzniveau von α = 0,05 durchgeführt wird? Vorab: Zusammenstellung der vorhandenen Informationen: Grundgesamtheit: µ = µ 0 = 10 ; σ = 0,7 Stichprobe: x = 10,15 ; n=144 Schritte eines statistischen Hypothesentests 7. Aufstellen von H 0 und H 1 H 0 : µ = µ 0 = 10 H 1 : µ µ 0 8. Festlegen des Signifikanzniveaus zweiseitig kritischer Bereich α = 0,05 in der Aufgabe vorgegeben 9. Bestimmen der geeigneten Prüfverteilung Fallunterscheidung σ ist bekannt, n > Fall keine Endlichkeitskorrektur, da N sehr groß (Großserie) σ 0,7 σ = = = 0, X n Ermittlung der Testgröße durch Ablesen in der Tabelle der Standardnormalverteilung Variante 1: zweiseitiger Test F SN (z c ) = 1-a/ = 0,975 kritisches z c = 1,960 Testentscheidung auf Basis absoluter Werte kritischer µ-wert 5. Berechnung der kritischen Wertes µ = 0 = 10 1,96 0,05833 = 9,886 u c µ zc σ X o c µ + zc σ X µ = 0 = ,96 0,05833 = 10, Anwendung der Entscheidungsregel Wenn x > o µ c oder x < u µ c soll H 0 abgelehnt werden. Da 10,15 > 10,114 Ablehnung von H 0 7. Interpretation des Ergebnisses Der Kunde wird die Eisenstäbe nicht von diesem Hersteller beziehen! P. Schmidt, Hochschule Bremen Seite 51

58 Schließende Statistik 3 Schluss von der Stichprobe auf die Grundgesamtheit Variante : Testentscheidung auf Basis der (standardisierten) Z-Werte Z-Test Zweiseitiger Test über den Mittelwert µ Schritte 1 bis 4 bleiben gleich. 11. Berechnung der Prüfgröße z X x µ 0 = σ X 10,15 10 = 0,05833 =, Anwendung der Entscheidungsregel Wenn z > z X c soll H 0 abgelehnt werden. Da,5715 > 1,96 Ablehnung von H Interpretation des Ergebnisses Der Kunde wird die Eisenstäbe nicht von diesem Hersteller beziehen! P. Schmidt, Hochschule Bremen Seite 5

59 Schließende Statistik 3 Schluss von der Stichprobe auf die Grundgesamtheit 3.4. Zweistichprobentests Test auf Mittelwertdifferenz Problem: Klausuraufgabe: Im Unterricht Zaubertränke bei Prof. Snape gibt es zwei Gruppen von Schülern: Schüler aus Gryffindor (Gruppe G) und 6 Schüler aus Hufflepuff (Gruppe H). Der durchschnittliche Punktabzug für Schwatzen während des Unterrichts beträgt bei G 10,1 Punkte und bei H 9,6 Punkte jeweils mit einer Standardabweichung von Punkten. [Gesamt: 18 Punkte] Snape geht davon aus, dass er beide Gruppen gleich behandelt. Testen Sie diese Aussage mit einem Konfidenzniveau von 95 %. [7 Punkte] 1. Schritt: Zusammenstellen der Informationen: Informationen n i Mittelwerte Standardabweichungen Stichprobe 1 (G) n 1 = x 1 = s 1 = Stichprobe (M) n = x = s = 1) Hypothese: H o : x 1 - x = 0 x 1 = x ) α = 0,05 lt. Aufgabenstellung 3) bei Mittelwertdifferenz keine Fallunterscheidung (auch keine Ermittlung von σ x oder σ pˆ ) 4) t c =... 5) t x 1 = =... s1 s n 1 x + n 6) t x > t c? H 0 verwerfen?? 7) Interpretation: P. Schmidt, Hochschule Bremen Seite 53

60 Schließende Statistik 3 Schluss von der Stichprobe auf die Grundgesamtheit Testen der Aussagekraft der Regressionskoeffizienten bei Multipler Regression Beispielaufgabe von Seite 37 / 38 (Absatzzahlen Kosmetikartikel) AUSGABE der Excel-Funktion "Analysefunktionen - Regression" Regressions-Statistik Multipler Korrelationskoeffizient 0,9780 Bestimmtheitsmaß 0,94635 Adjustiertes Bestimmtheitsmaß 0,9195 Standardfehler 117,91933 Beobachtungen 10 ANOVA Freiheitsgrade Quadratsummen (df) Mittlere Quadratsumme (SS) Prüfgröße (MS) (F) F krit Regression , 49053,4 35,7684 0,00033 Residue , ,969 Gesamt Koeffizienten Standardfehler t-statistik P-Wert Untere 95% Obere 95% Untere 95,0%Obere 95,0% Schnittpunkt 398, ,3009,440 0,0503-4, ,3963-4, ,3963 Fläche 0,4151 0,1373 3,05 0,033 0,0791 0,751 0,0791 0,751 Werbung 1,6903 4,4560 0,3793 0,7175-9,131 1,5937-9,131 1,5937 Preis -13,87 58,8809 -,109 0,080-67,8991 0,537-67,8991 0,537 Zusammenfassung und Formatierung der Ergebnisse einer multiplen Regression: Gütemaß R : 0,90 entspricht 9,0 % Signifikanz: p-wert 95% 90% Die Schätzergebnisse (Koeffizienten) lauten: Schnittpunkt mit y-achse a 398,8 0,05 nein * ja* Erklärende Größen: X 1 Fläche b 1 0,4 0,0 * ja* * ja* X Werbung b 1,7 0,7 nein nein X3 Preis b3-13,8 0,08 nein * ja* Was wollen uns diese Worte sagen? P. Schmidt, Hochschule Bremen Seite 54

61 Schließende Statistik 3 Schluss von der Stichprobe auf die Grundgesamtheit Fallbeispiel College Town (folgt als Kopie) P. Schmidt, Hochschule Bremen Seite 55

62 Quantitative Methoden 3. Business Mapping / GIS - Seite 56 - Business Mapping durch GeoInformationsSysteme GIS Jutta Schmidt, Gis.direkt 1 Peter Schmidt, Hochschule Bremen Inhalt 1 Was ist Business Mapping? Geodaten Basis des Business Mapping Software Datenquellen und Geodatenanbieter Anwendungsfelder Standortmanagement Zielgruppenanalyse Penetrationsanalyse (Marktdurchdringung) Tourenplanung Literaturhinweise Hinweis: Teile dieser Darstellung sind erschienen in: Schmidt, Jutta und Schmidt, Peter: Business Mapping ; in: Dey und Grauvogel (Hrsg.): "Praxishandbuch Wirtschaftswissen von A-Z für die erfolgreiche Betriebsratspraxis", Kissing, Kontakt: Schmidt@GIS-direkt.de Kontakt: Peter.Schmidt@hs-bremen.de Peter Schmidt, Hochschule Bremen MBA

63 Quantitative Methoden 3. Business Mapping / GIS - Seite 57-1 WAS IST BUSINESS MAPPING? Business Mapping steht für die Betrachtung von Daten im Raum: Adressen, Standorte, Gebiete, Verbindungen,... und deren Darstellung als Karte (engl. map ). Eine Karte sagt mehr als tausend Worte der Raumbezug von Daten in den Entscheidungen von Unternehmen schon immer eine wichtige Rolle gespielt, konnte aber bis vor kurzem nur unzureichend dargestellt und genutzt werden. Raumbezug von Daten Ob es sich um Vertriebsgebiete von Außendienstmitarbeitern, die Standortplanung eines Filialisten oder Ermittlung neuer Kundenpotenziale handelt 80% der unternehmerischen Fragestellungen haben einen konkreten Raumbezug. Mit der Landkarte an der Wand, Stecknadeln, Fähnchen und Bindfäden wurde diese Tatsache auch schon länger genutzt. In den letzten 10 Jahren hat sich, bedingt durch die rasche Entwicklung der Computerkartografie und der Verfügbarkeit des PC praktisch auf jedem Schreibtisch, eine weitaus mächtigere Visualisierungs- und Analysemethode verbreitet, die allgemein als Business Mapping bezeichnet wird. Begriffe wie Business Geographics, Geomarketing, Desktop Mapping werden analog verwandt. Allen gemeinsam dienen als Grundlage Geoinformationssysteme, kurz GIS genannt. Geoinformationssysteme Geoinformationssysteme sind computergestützte Systeme zur Erstellung, Verwaltung, Analyse und Ausgabe raumbezogener und themenbezogener Daten. Digitale Landkarten lassen sich mit Daten anreichern, auswerten und darstellen. Hierdurch können räumliche Strukturen und Entwicklungen aufgezeigt werden. Abbildung 1: Bevölkerungsdichte Bremer Ortsteile, Beispiel für den Zusammenhang von tabellarischen Daten und kartografischer Darstellung. (Quelle: Daten des statistischen Landesamtes Bremen) Ein Geoinformationssystem besteht grundsätzlich aus einem Kartografie-Modul, einem Datenbank-Modul sowie Analysemethoden verschiedenen Funktionsumfanges. Die Realisierungsmöglichkeiten sind vielfältig, vom einfachen Auskunftsarbeitsplatz bis hin zum Forschungsarbeitsplatz sind diverse Stufen möglich. Während erstere leicht von geschultem Personal bedient werden können, sind für letztere ausgebildete GIS-Fachleute notwendig. Peter Schmidt, Hochschule Bremen MBA

64 Quantitative Methoden 3. Business Mapping / GIS - Seite 58 - Benutzeroberfläche Digitale Landkarten Raster- und Vektordaten Es wird grundsätzlich zwischen Raster- und Vektordaten unterschieden. Rasterkarten sind Bilder, die aus einzelnen Punkten bestehen. Sie enthalten keine weiteren Informationen außer dem Farbwert und wirken rein als Bild auf den Betrachter. Beliebt sind sie aufgrund ihres vertrauten Aussehens, z.b. in Form von Stadtplänen. Vektordaten entstehen durch Digitalisierung. Diese punkt-, linien- oder flächenhaften Elemente lassen sich beliebig mit weiteren Informationen anreichern, z.b. kann ein Punkt einen Standort darstellen und mit einem dazugehörigen Datensatz verknüpft werden. Ein solcher Datensatz kann z.b. die Adresse, Ansprechpartner, Absatzmengen, Datum der Lieferung, o.ä. enthalten. Aus die- Analysemethoden Sachdaten GIS-Software Hardwarekomponenten Abbildung : Bausteine eines Geoinformationssystems Geoinformationssysteme werden seit Jahrzehnten in vielen Bereichen eingesetzt, (z.b. Natur- und Umweltschutz, Raumplanung, Verkehrsplanung, Energieversorgung). Mit Beginn der neunziger Jahre verzeichnet das Business Mapping hohe Wachstumsraten. Business Mapping Zunehmende Marktsättigung, verstärkte Nachfrage nach mehr Service und Individualität sowie wachsende Konkurrenz sind Ursachen dafür, dass Geoinformationssysteme verstärkt in der Wirtschaft, insbesondere bei Dienstleistern wie z.b. Banken und Versicherungen, bei Handel oder Industrie genutzt werden. Business Mapping kann als Oberbegriff für alle Einsatzbereiche von Geoinformationssystemen in der Wirtschaft verstanden werden. Beispielhafte Anwendungsfelder sind: Geomarketing Vertriebsplanung Standortmanagement Mediaplanung Routenplanung Facility Management GEODATEN BASIS DES BUSINESS MAPPING Grundsätzlich benötigt Business Mapping Geodaten, d.h. Daten, die durch Angabe von Koordinaten einen eindeutigen Bezug zum Raum haben. Peter Schmidt, Hochschule Bremen MBA

65 Quantitative Methoden 3. Business Mapping / GIS - Seite 59 - sem Grunde werden gerade im Business Mapping Vektordaten bevorzugt eingesetzt, während Rasterkarten lediglich der Orientierung dienen. Ein Business Mapping System setzt sich je nach Fragestellung aus verschiedenen Datenbeständen zusammen: Geografische Daten (beispielhaft) Administrative Daten, z.b. Landes- und Kreisgrenzen Ortspunkte Straßennetze, Straßenverzeichnisse Flächennutzungen, topographische Angaben Thematische Sachdaten Externe Sachdaten, z.b. demografische Daten (Bevölkerungsdichte, Altersstruktur...) und Marktdaten, (Kaufkraftkennziffern...) Unternehmensinterne Daten, z.b. Umsatzkennziffern, Kundenadressen, Fahrtrouten Informationen in Schichten Die Daten werden im Geoinformationssystem in Schichten gehalten. Dies ist ähnlich vorzustellen, wie durchsichtige Folien, die übereinander gelegt werden, wobei das GIS die inhaltlichen Informationen der Schichten (anhand ihrer räumlichen Lage) verknüpfen kann. Der Anwender kann die Daten, die er für seine jeweilige Fragestellung benötigt übereinanderschichten, um dann spezielle Analysen vorzunehmen. Abbildung 3: Entwicklung einer thematischen Karten aus verschiedenen überlagerten Informationsschichten Entscheidend für die Datenqualität sind verschiedene Faktoren wie Aktualität, Flächenabdeckung und geometrische Konsistenz (d.h. die verschiedenen Datenschichten müssen in ihrem räumlichen Bezug zusammenpassen ). Nicht zu unterschätzen ist die Bedeutung der sogenannten Metadaten ( Informationen über Informationen ), ohne die die Datenbestände kaum nutzbar sind, wie z.b. Zeitpunkt der Erhebung und notwendige inhaltliche Erläuterungen. Eine weitere Schwierigkeit liegt in der Schnittstelle, d.h. den verschiedenen Datenformaten, insbesondere bei der Verwendung verschiedener Datenquellen. Peter Schmidt, Hochschule Bremen MBA

66 Quantitative Methoden 3. Business Mapping / GIS - Seite 60 - Software für verschiedene Ansprüche 3 SOFTWARE Die Datenbestände werden in einer leistungsfähigen GIS-Software zusammengeführt, die mindestens über folgenden Funktionsumfang verfügen sollte: Datenverwaltung, d.h. Verwaltung von Daten unterschiedlicher Herkunft (Rasterkarten, Datenbanken, Grafiken) Dateneingabe zum Aufbau eigener Datenbestände durch Digitalisieren und tabellarische Datenpflege Datenvisualisierung bzw. Präsentation (Erstellung von thematischen Karten) Datenanalyse (Abfragen, statistische Auswertungen, raumbezogene Analysen) Abbildung 4: Beispiel für eine GIS-Benutzeroberfläche (ArcView 3. der Firma ESRI)(Datenquelle: Statistisches Landesamt Bremen) 4 DATENQUELLEN UND GEODATENANBIETER Die meisten Geodaten müssen vom Unternehmen dazugekauft werden. Nur ein Teil wird selbst erstellt werden, da dies größeren Aufwand erfordert und höchstens für unternehmensinterne Daten sinnvoll ist. Der Geodatenmarkt ist inzwischen fast unüberschaubar groß geworden. Sowohl amtliche als auch kommerzielle Anbieter bieten Geobasisdaten sowie Sachdaten an. Daneben gibt es zunehmend branchenspezifisches Komplettlösungen, d.h. Softwarepakete mit integrierten Datenpaketen. Peter Schmidt, Hochschule Bremen MBA

67 Quantitative Methoden 3. Business Mapping / GIS - Seite 61 - Die Betrachtungsebene ist entscheidend Amtliche Geobasisdaten Die Vermessungs- und Katasterverwaltungen der einzelnen Bundesländer bieten topografische Daten als Vektor- und Rasterkarten an. Topografische Vektorkarten umfassen verschiedene Objekte, z.b. Straßen, bebaute Flächen, Gebäude, Gemeindegrenzen. Außerdem werden Höhenmodelle und Luftbilddaten angeboten. Luftbilder und Rasterkarten dienen vor allem der Orientierung, da mit ihnen keine weiteren Analysen durchgeführt werden können. Bezugsquellen sind die jeweiligen Landesvermessungsämter. Kommerzielle Geobasisdaten Da das Vermessungswesen Ländersache ist, sind die o.a. Angebote auf das jeweilige Bundesland beschränkt. Diese Einschränkung haben die kommerziellen Datenanbieter nicht. Ihr Angebot geht inzwischen weit über das Angebot amtlicher Anbieter hinaus. Neben Rasterkarten werden Gebietsgrenzen wie administrative Gebietseinteilungen, Postleitzahlbereiche, Telefonvorwahlbereiche angeboten. Interessant sind vor allem Straßendaten, die z.t. hausnummerngenau digitalisiert sind und sowohl für Routing als auch Geokodierung genutzt werden können. Für Marktforschung und Marketing relevant sind die Marktzellen, bestehend aus Straßenabschnitten. Anbieteradressen werden im Anhang genannt. Amtliche Sachdaten Die statistischen Landesämter geben gemeinsam das Datenpaket Statistik Regional heraus mit Informationen für die Landkreise und kreisfreien Städte heraus. Es umfasst Angaben zu 16 Fachgebieten. Auf Gemeindeebene sind z.t. noch feiner gegliederte Angaben beim jeweiligen Statistischen Amt erhältlich. Auch andere Ämter und Behörden bieten raumbezogene (Spezial-) Daten an. Auf Bundesebene ist hier v.a. die Bundesamt für Bauwesen und Raumordnung zu nennen, aber auch Regionalverbände, Städtetage u.v.m. liefern Geodaten. Daneben bieten Industrie- und Handelskammern Daten ihrer Kammerbezirke an. Kleinräumige Marktdaten Kommerzielle Sachdaten Auf verschiedenen räumlichen Ebenen, bis hin zu Marktzellen, bestehend aus 7 bis 15 Haushalten, sind Daten zu Bevölkerung, Bebauung, Branchen, Kaufkraftkennziffern und PKW-Besitz erhältlich. Fachspezifische Branchenpotenzialdaten, Angaben zu Wahlverhalten und Konsumverhalten u.v.m. wird von einer Vielzahl kommerzieller Datenanbieter erhoben und gepflegt. Außerdem bieten die meisten von ihnen Geokodierdienste an, d.h. unternehmensinterne Adressdatenbestände erhalten über die Zuordnung von Koordinaten räumlichen Bezug, sodass z.b. die räumliche Verteilung von Kundenadressen dargestellt werden kann. 5 ANWENDUNGSFELDER Die Verknüpfung unternehmensbezogener Daten mit geografischen und marktbezogenen Daten verdeutlicht Zusammenhänge zwischen Geschäfts- und Marktdaten. Unternehmerische Fragestellungen gewinnen unter Berücksichtigung der räumlichen Aspekte erweiterte Peter Schmidt, Hochschule Bremen MBA

68 Quantitative Methoden 3. Business Mapping / GIS - Seite 6 - Erkenntnisse, sorgen für höhere Kundenpotenzialausschöpfung, höhere Umsätze, geringere Streuverluste: Standortmanagement: welche Einzugsgebiete deckt das bestehende Filialnetz ab? Zielgruppenanalyse, Marktdurchdringung: wie gut werden Kundenpotenziale ausgeschöpft? Konkurrenzanalyse: wo sind Mitbewerber? Tourenplanung: wie wird Fahrtzeit, Wegstrecke, Ladevorgänge, Kundenbesuche... optimiert? Beispielhaft werden die Möglichkeiten des Business Mapping für vier Bereiche skizziert. Szenarien in der Standortplanung 5.1 Standortmanagement Die Standortanalyse und -planung eines Unternehmens, beispielsweise eines Einzelhandelsfilialisten, kann unter Nutzung des Business Mapping effektiver und umfassender werden: Durch die EDV-Unterstützung wird es vereinfacht, verschiedene Szenarien zu entwickeln. Beispiel Standortanalyse: In einem ersten Schritt werden die eigenen Standorte visualisiert, sowie verschiedene Faktoren, z.b. Verkaufsfläche, Umsatz, Sortiment der Filialen. Ebenso kann die Wettbewerbssituation dargestellt werden. Hierfür werden die Adressen der Mitbewerber und anderer points of interest geokodiert. Dies kann - je nach gewünschter Genauigkeit - straßen(abschnitts)- oder sogar hausnummerngenau erfolgen. Nun wird der Einzugsbereich der Filialen festgelegt: auf Grundlage eines Straßennetzes werden hierfür Entfernung oder Fahrzeit zum Standort berücksichtigt. Im nächsten Schritt können sie mit der Schicht der Sachdaten verschnitten werden. Es kann z.b. ermittelt werden: wie viele Haushalte im Einzugsbereich leben (Kundenpotenzial); wie die Haushaltsstruktur im Einzugsbereich ist (Alter, Familiengröße Zielgruppenanalyse); wie groß das Umsatzpotential (Kaufkraft) ist. Peter Schmidt, Hochschule Bremen MBA

69 Quantitative Methoden 3. Business Mapping / GIS - Seite 63 - Abbildung 5: Einzugsbereich eines Standortes nach Fahrtzeit 5. Zielgruppenanalyse Visualisierung der Mitbewerber und Kunden In ähnlicher Weise können die potentiellen Zielgruppen verortet werden: Ist eine solche Zielgruppe vom Unternehmen einmal definiert, kann sie mit statistischen Daten für das Untersuchungsgebiet abgeglichen werden. So wird die räumliche Verteilung einer Zielgruppe dargestellt und dient als wesentliche Grundlage für weitere Analysen, z.b. Marktpotenziale oder Marketingmaßnahmen. 5.3 Penetrationsanalyse (Marktdurchdringung) Welchen Anteil am Markt schöpft das jeweilige Unternehmen aus? Die Visualisierung der Marktdurchdringung kann durch verschiedene Verfahren erfolgen, z.b mittels Darstellung des gesamten Marktvolumens und der Gegenüberstellung des Unternehmensumsatzes. Die weitere Differenzierung, z.b. nach Marktsegmenten werden Stärken und Schwächen des Vertriebs sichtbar und räumlich zugeordnet. Abbildung 6: Visualisierung der Marktausschöpfung Peter Schmidt, Hochschule Bremen MBA

Betriebsstatistik - Seite 1 - beschreibende Statistik

Betriebsstatistik - Seite 1 - beschreibende Statistik Betriebsstatistik - Seite 1 - Betriebsstatistik Inhalt beschreibende Statistik 1 Quantitative Methoden; Statistik...2 1.1 Definitionen Was ist Statistik?...3 1.2 Häufigkeiten und grafische Darstellungen...4

Mehr

Betriebsstatistik. beschreibende Statistik. Inhalt

Betriebsstatistik. beschreibende Statistik. Inhalt in: Wirtschaftswissen für Betriebsräte - Seite 1 - Inhalt Betriebsstatistik beschreibende Statistik 1 Begriff... 1 1.1 Definitionen Was ist (Betriebs-) Statistik?... 3 1.2 Häufigkeiten und grafische Darstellungen...

Mehr

MBA Quantitative Methoden

MBA Quantitative Methoden Quantitative Methoden Deskriptive Statistik - Seite 1 - Quantitative Methoden Deskriptive Statistik Peter Schmidt, Hochschule Bremen Inhalt 1 Quantitative Methoden; Statistik... 3 1.1 Definitionen Was

Mehr

Einführung in die computergestützte Datenanalyse

Einführung in die computergestützte Datenanalyse Karlheinz Zwerenz Statistik Einführung in die computergestützte Datenanalyse 6., überarbeitete Auflage DE GRUYTER OLDENBOURG Vorwort Hinweise zu EXCEL und SPSS Hinweise zum Master-Projekt XI XII XII TEIL

Mehr

Statistik. Datenanalyse mit EXCEL und SPSS. R.01denbourg Verlag München Wien. Von Prof. Dr. Karlheinz Zwerenz. 3., überarbeitete Auflage

Statistik. Datenanalyse mit EXCEL und SPSS. R.01denbourg Verlag München Wien. Von Prof. Dr. Karlheinz Zwerenz. 3., überarbeitete Auflage Statistik Datenanalyse mit EXCEL und SPSS Von Prof. Dr. Karlheinz Zwerenz 3., überarbeitete Auflage R.01denbourg Verlag München Wien Inhalt Vorwort Hinweise zu EXCEL und SPSS Hinweise zum Master-Projekt

Mehr

Statistik. Einführung in die com putergestützte Daten an alyse. Oldenbourg Verlag München B , überarbeitete Auflage

Statistik. Einführung in die com putergestützte Daten an alyse. Oldenbourg Verlag München B , überarbeitete Auflage Statistik Einführung in die com putergestützte Daten an alyse von Prof. Dr. Karlheinz Zwerenz 4., überarbeitete Auflage B 366740 Oldenbourg Verlag München Inhalt Vorwort XI Hinweise zu EXCEL und SPSS XII

Mehr

Inhaltsverzeichnis. Teil 1 Basiswissen und Werkzeuge, um Statistik anzuwenden

Inhaltsverzeichnis. Teil 1 Basiswissen und Werkzeuge, um Statistik anzuwenden Inhaltsverzeichnis Teil 1 Basiswissen und Werkzeuge, um Statistik anzuwenden 1 Statistik ist Spaß 3 Warum Statistik? 3 Checkpoints 4 Daten 4 Checkpoints 7 Skalen - lebenslang wichtig bei der Datenanalyse

Mehr

Grundlagen der Statistik I

Grundlagen der Statistik I NWB-Studienbücher Wirtschaftswissenschaften Grundlagen der Statistik I Beschreibende Verfahren Von Professor Dr. Jochen Schwarze 10. Auflage Verlag Neue Wirtschafts-Briefe Herne/Berlin Inhaltsverzeichnis

Mehr

Statistik. Datenanalyse mit EXCEL und SPSS. Prof. Dr. Karlheinz Zwerenz. R.Oldenbourg Verlag München Wien. Von

Statistik. Datenanalyse mit EXCEL und SPSS. Prof. Dr. Karlheinz Zwerenz. R.Oldenbourg Verlag München Wien. Von Statistik Datenanalyse mit EXCEL und SPSS Von Prof. Dr. Karlheinz Zwerenz R.Oldenbourg Verlag München Wien Inhalt Vorwort Hinweise zu EXCEL und SPSS Hinweise zum Master-Projekt XI XII XII TEIL I GRUNDLAGEN

Mehr

Grundlagen der Statistik

Grundlagen der Statistik www.nwb.de NWB Studium Betriebswirtschaft Grundlagen der Statistik Band 1: Beschreibende Verfahren Von Professor Dr. Jochen Schwarze 12., vollständig überarbeitete Auflage nwb STUDIUM Inhaltsverzeichnis

Mehr

1. Einführung und statistische Grundbegriffe. Grundsätzlich unterscheidet man zwei Bedeutungen des Begriffs Statistik:

1. Einführung und statistische Grundbegriffe. Grundsätzlich unterscheidet man zwei Bedeutungen des Begriffs Statistik: . Einführung und statistische Grundbegriffe Beispiele aus dem täglichen Leben Grundsätzlich unterscheidet man zwei Bedeutungen des Begriffs Statistik: Quantitative Information Graphische oder tabellarische

Mehr

Statistische Grundlagen I

Statistische Grundlagen I Statistische Grundlagen I Arten der Statistik Zusammenfassung und Darstellung von Daten Beschäftigt sich mit der Untersuchung u. Beschreibung von Gesamtheiten oder Teilmengen von Gesamtheiten durch z.b.

Mehr

Günther Bourier. Beschreibende Statistik. Praxisorientierte Einführung - Mit. Aufgaben und Lösungen. 12., überarbeitete und aktualisierte Auflage

Günther Bourier. Beschreibende Statistik. Praxisorientierte Einführung - Mit. Aufgaben und Lösungen. 12., überarbeitete und aktualisierte Auflage i Günther Bourier Beschreibende Statistik Praxisorientierte Einführung - Mit Aufgaben und Lösungen 12., überarbeitete und aktualisierte Auflage 4^ Springer Gabler Inhaltsverzeichnis Vorwort V 1 Einführung

Mehr

TEIL 12: BIVARIATE ANALYSE FÜR METRISCH SKALIERTE VARIABLEN

TEIL 12: BIVARIATE ANALYSE FÜR METRISCH SKALIERTE VARIABLEN TEIL 12: BIVARIATE ANALYSE FÜR METRISCH SKALIERTE VARIABLEN GLIEDERUNG Bivariate Analyse für metrisch skalierte Variablen Grundlagen Streudiagramme und Visualisierungen von Zusammenhängen Positive lineare

Mehr

Inhaltsverzeichnis Grundlagen aufigkeitsverteilungen Maßzahlen und Grafiken f ur eindimensionale Merkmale

Inhaltsverzeichnis Grundlagen aufigkeitsverteilungen Maßzahlen und Grafiken f ur eindimensionale Merkmale 1. Grundlagen... 1 1.1 Grundgesamtheit und Untersuchungseinheit................ 1 1.2 Merkmal oder statistische Variable........................ 2 1.3 Datenerhebung.........................................

Mehr

Deskriptive Statistik

Deskriptive Statistik Helge Toutenburg Christian Heumann Deskriptive Statistik Eine Einführung in Methoden und Anwendungen mit R und SPSS Siebte, aktualisierte und erweiterte Auflage Mit Beiträgen von Michael Schomaker 4ü Springer

Mehr

W-Seminar: Versuche mit und am Menschen 2017/2019 Skript

W-Seminar: Versuche mit und am Menschen 2017/2019 Skript 3. Deskriptive Statistik Die deskriptive (auch: beschreibende) Statistik hat zum Ziel, [ ] Daten durch Tabellen, Kennzahlen [ ] und Grafiken übersichtlich darzustellen und zu ordnen. Dies ist vor allem

Mehr

Deskriptive Statistik

Deskriptive Statistik Deskriptive Statistik 1 Ziele In der deskriptiven (=beschreibenden) Statistik werden Untersuchungsergebnisse übersichtlich dargestellt, durch Kennzahlen charakterisiert und grafisch veranschaulicht. 2

Mehr

Deskription, Statistische Testverfahren und Regression. Seminar: Planung und Auswertung klinischer und experimenteller Studien

Deskription, Statistische Testverfahren und Regression. Seminar: Planung und Auswertung klinischer und experimenteller Studien Deskription, Statistische Testverfahren und Regression Seminar: Planung und Auswertung klinischer und experimenteller Studien Deskriptive Statistik Deskriptive Statistik: beschreibende Statistik, empirische

Mehr

Beschreibende Statistik

Beschreibende Statistik Gunther Bourier Beschreibende Statistik Praxisorientierte Einfuhrung Mit Aufgaben und Losungen 7., uberarbeitete Auflage GABIER Inhaltsverzeichnis Vorwort Inhaltsverzeichnis V VII 1 Einfuhrung 1 1.1 Begriff

Mehr

Wolf-Gert Matthäus, Jörg Schulze. Statistik mit Excel. Beschreibende Statistik für jedermann. 3./ überarbeitete und erweiterte Auflage.

Wolf-Gert Matthäus, Jörg Schulze. Statistik mit Excel. Beschreibende Statistik für jedermann. 3./ überarbeitete und erweiterte Auflage. Wolf-Gert Matthäus, Jörg Schulze Statistik mit Excel Beschreibende Statistik für jedermann 3./ überarbeitete und erweiterte Auflage Teubner Inhaltsverzeichnis Einleitung 11 1 Grundlagen 17 1.1 Statistische

Mehr

Kai Schaal. Universität zu Köln

Kai Schaal. Universität zu Köln Deskriptive Statistik und Wirtschaftsstatistik Tutorium zur Anwendung von Statistik 1 in Excel Kai Schaal Universität zu Köln Organisatorisches und Einleitung (1) Was, wann, wo? Anwendung von Statistik

Mehr

Franz Kronthaler. Statistik angewandt. Datenanalyse ist (k)eine Kunst. mit dem R Commander. A Springer Spektrum

Franz Kronthaler. Statistik angewandt. Datenanalyse ist (k)eine Kunst. mit dem R Commander. A Springer Spektrum Franz Kronthaler Statistik angewandt Datenanalyse ist (k)eine Kunst mit dem R Commander A Springer Spektrum Inhaltsverzeichnis Teil I Basiswissen und Werkzeuge, um Statistik anzuwenden 1 Statistik ist

Mehr

Vorlesungsskript. Deskriptive Statistik. Prof. Dr. Günter Hellmig

Vorlesungsskript. Deskriptive Statistik. Prof. Dr. Günter Hellmig Vorlesungsskript Deskriptive Statistik Prof. Dr. Günter Hellmig Prof. Dr. Günter Hellmig Vorlesungsskript Deskriptive Statistik Erstes Kapitel Die Feingliederung des ersten Kapitels, welches sich mit einigen

Mehr

Statistik II. Lineare Regressionsrechnung. Wiederholung Skript 2.8 und Ergänzungen (Schira: Kapitel 4) Statistik II

Statistik II. Lineare Regressionsrechnung. Wiederholung Skript 2.8 und Ergänzungen (Schira: Kapitel 4) Statistik II Statistik II Lineare Regressionsrechnung Wiederholung Skript 2.8 und Ergänzungen (Schira: Kapitel 4) Statistik II - 09.06.2006 1 Mit der Kovarianz und dem Korrelationskoeffizienten können wir den statistischen

Mehr

TEIL 12: BIVARIATE ANALYSE FÜR METRISCH SKALIERTE VARIABLEN

TEIL 12: BIVARIATE ANALYSE FÜR METRISCH SKALIERTE VARIABLEN TEIL 12: BIVARIATE ANALYSE FÜR METRISCH SKALIERTE VARIABLEN Bivariate Analyse für metrisch skalierte Variablen Grundlagen Verfahren für metrische Daten nutzen den vollen mathematischen Informationsgehalt

Mehr

Die folgende Tabelle 1 wurde im Rahmen einer Umfrage unter den Studenten eines Statistikseminars erstellt.

Die folgende Tabelle 1 wurde im Rahmen einer Umfrage unter den Studenten eines Statistikseminars erstellt. Nr. Die folgende Tabelle wurde im Rahmen einer Umfrage unter den Studenten eines Statistikseminars erstellt. Gewicht (x i ) Raucher Geschlecht Lieblingssportart Ausübung des Sports Geld pro Monat Klassenmitte

Mehr

1 GRUNDLAGEN Grundbegriffe Skalen...15

1 GRUNDLAGEN Grundbegriffe Skalen...15 Inhaltsverzeichnis 1 GRUNDLAGEN...13 1.1 Grundbegriffe...13 1.2 Skalen...15 DESKRIPTIVE STATISTIK 2 EINDIMENSIONALE HÄUFIGKEITSVERTEILUNGEN...16 2.1 Häufigkeiten...16 2.1.1 Grundbegriffe...16 2.1.2 Klassieren

Mehr

Inhaltsverzeichnis DESKRIPTIVE STATISTIK. 1 Grundlagen Grundbegriffe Skalen... 15

Inhaltsverzeichnis DESKRIPTIVE STATISTIK. 1 Grundlagen Grundbegriffe Skalen... 15 Inhaltsverzeichnis 1 Grundlagen... 13 1.1 Grundbegriffe...13 1.2 Skalen... 15 DESKRIPTIVE STATISTIK 2 Eindimensionale Häufigkeitsverteilungen...16 2.1 Häufigkeiten... 16 2.1.1 Grundbegriffe... 16 2.1.2

Mehr

Ausführliche Lösungen zu ausgewählten Aufgaben von ÜB 5 und 6. Streudiagramm

Ausführliche Lösungen zu ausgewählten Aufgaben von ÜB 5 und 6. Streudiagramm y Aufgabe 3 Ausführliche Lösungen zu ausgewählten Aufgaben von ÜB 5 und 6 a) Zur Erstellung des Streudiagramms zeichnet man jeweils einen Punkt für jedes Datenpaar (x i, y i ) aus der zweidimensionalen

Mehr

Statistik I (Deskriptive Statistik)

Statistik I (Deskriptive Statistik) Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2011/2012 Donnerstag, 10.15-11.45 Uhr Hörsaal: Aula am Aasee Dr. Andrea Beccarini Westfälische Wilhelms-Universität Münster Inhalt

Mehr

Statistik. Ronald Balestra CH St. Peter

Statistik. Ronald Balestra CH St. Peter Statistik Ronald Balestra CH - 7028 St. Peter www.ronaldbalestra.ch 17. Januar 2010 Inhaltsverzeichnis 1 Statistik 1 1.1 Beschreibende Statistik....................... 1 1.2 Charakterisierung von Häufigkeitsverteilungen...........

Mehr

Ermitteln Sie auf 2 Dezimalstellen genau die folgenden Kenngrößen der bivariaten Verteilung der Merkmale Weite und Zeit:

Ermitteln Sie auf 2 Dezimalstellen genau die folgenden Kenngrößen der bivariaten Verteilung der Merkmale Weite und Zeit: 1. Welche der folgenden Kenngrößen, Statistiken bzw. Grafiken sind zur Beschreibung der Werteverteilung des Merkmals Konfessionszugehörigkeit sinnvoll einsetzbar? A. Der Modalwert. B. Der Median. C. Das

Mehr

Statistik K urs SS 2004

Statistik K urs SS 2004 Statistik K urs SS 2004 3.Tag Grundlegende statistische Maße Mittelwert (mean) Durchschnitt aller Werte Varianz (variance) s 2 Durchschnittliche quadrierte Abweichung aller Werte vom Mittelwert >> Die

Mehr

Statistik und Wahrscheinlichkeitsrechnung

Statistik und Wahrscheinlichkeitsrechnung Statistik und Wahrscheinlichkeitsrechnung 3. Vorlesung Dr. Jochen Köhler 1 Inhalte der heutigen Vorlesung Ziel: Daten Modellbildung Probabilistisches Modell Wahrscheinlichkeit von Ereignissen Im ersten

Mehr

Kapitel 5 Kenngrößen empirischer Verteilungen 5.1. Lagemaße. x mod (lies: x-mod) Wofür? Lageparameter. Modus/ Modalwert Zentrum. Median Zentralwert

Kapitel 5 Kenngrößen empirischer Verteilungen 5.1. Lagemaße. x mod (lies: x-mod) Wofür? Lageparameter. Modus/ Modalwert Zentrum. Median Zentralwert Kapitel 5 Kenngrößen empirischer Verteilungen 5.1. Lagemaße Wofür? Lageparameter Modus/ Modalwert Zentrum Median Zentralwert Im Datensatz stehende Informationen auf wenige Kenngrößen verdichten ermöglicht

Mehr

Christoph Schöffel, Deskriptive Statistik. 1. Kapitel: Eindimensionale Häufigkeitsverteilungen 1. Thema 1: Darstellungsweise von Merkmalen 1

Christoph Schöffel, Deskriptive Statistik. 1. Kapitel: Eindimensionale Häufigkeitsverteilungen 1. Thema 1: Darstellungsweise von Merkmalen 1 Inhaltsübersicht 1. Kapitel: Eindimensionale Häufigkeitsverteilungen 1 Thema 1: Darstellungsweise von Merkmalen 1 1. Diskrete und (quasi-)kontinuierliche Merkmale 1 1.1 Was sind Merkmale 1 1.2 Darstellungsweise

Mehr

Lösungsvorschläge zur Klausur Beschreibende Statistik und Wirtschaftsstatistik (Sommersemester 2013)

Lösungsvorschläge zur Klausur Beschreibende Statistik und Wirtschaftsstatistik (Sommersemester 2013) Lösungsvorschläge zur Klausur Beschreibende Statistik und Wirtschaftsstatistik (Sommersemester 203) Aufgabe (9 Punkte) Ein metrisches Merkmal X sei in einer Grundgesamtheit vom Umfang n = 200 diskret klassiert.

Mehr

Klausur zu Methoden der Statistik I (mit Kurzlösung) Sommersemester Aufgabe 1

Klausur zu Methoden der Statistik I (mit Kurzlösung) Sommersemester Aufgabe 1 Lehrstuhl für Statistik und Ökonometrie der Otto-Friedrich-Universität Bamberg Prof. Dr. Susanne Rässler Klausur zu Methoden der Statistik I (mit Kurzlösung) Sommersemester 2015 Aufgabe 1 In der aktuellen

Mehr

1 EINLEITUNG Allgemeines Kapitelübersicht Gebrauch dieses Buches Verwenden zusätzlicher Literatur...

1 EINLEITUNG Allgemeines Kapitelübersicht Gebrauch dieses Buches Verwenden zusätzlicher Literatur... Inhaltsverzeichnis 1 EINLEITUNG... 1 1.1 Allgemeines... 1 1.2 Kapitelübersicht... 2 1.3 Gebrauch dieses Buches... 3 1.4 Verwenden zusätzlicher Literatur... 4 DESKRIPTIVE STATISTIK 2 GRUNDLAGEN... 5 2.1

Mehr

0 Einführung: Was ist Statistik

0 Einführung: Was ist Statistik 0 Einführung: Was ist Statistik 1 Datenerhebung und Messung 2 Univariate deskriptive Statistik Häufigkeitsverteilungen Statistische Kennwerte 3 Multivariate Statistik 4 Regression 5 Ergänzungen Deskriptive

Mehr

Karl Entacher. FH-Salzburg

Karl Entacher. FH-Salzburg Ahorn Versteinert Bernhard.Zimmer@fh-salzburg.ac.at Statistik @ HTK Karl Entacher FH-Salzburg karl.entacher@fh-salzburg.ac.at Beispiel 3 Gegeben sind 241 NIR Spektren (Vektoren der Länge 223) zu Holzproben

Mehr

Anteile Häufigkeiten Verteilungen Lagemaße Streuungsmaße Merkmale von Verteilungen. Anteile Häufigkeiten Verteilungen

Anteile Häufigkeiten Verteilungen Lagemaße Streuungsmaße Merkmale von Verteilungen. Anteile Häufigkeiten Verteilungen DAS THEMA: VERTEILUNGEN LAGEMAßE - STREUUUNGSMAßE Anteile Häufigkeiten Verteilungen Lagemaße Streuungsmaße Merkmale von Verteilungen Anteile Häufigkeiten Verteilungen Anteile und Häufigkeiten Darstellung

Mehr

Eine zweidimensionale Stichprobe

Eine zweidimensionale Stichprobe Eine zweidimensionale Stichprobe liegt vor, wenn zwei qualitative Merkmale gleichzeitig betrachtet werden. Eine Urliste besteht dann aus Wertepaaren (x i, y i ) R 2 und hat die Form (x 1, y 1 ), (x 2,

Mehr

Das arithmetische Mittel. x i = = 8. x = 1 4. und. y i = = 8

Das arithmetische Mittel. x i = = 8. x = 1 4. und. y i = = 8 .2 Einige statistische Maßzahlen.2. Die Schusser in zwei Familien Die vier Kinder der Familie Huber haben x = 5, x 2 = 7, x 3 = 9, x 4 = Schusser. Die vier Kinder der Familie Maier haben y = 7, y 2 = 7,

Mehr

Forschungsmethoden in der Sozialen Arbeit

Forschungsmethoden in der Sozialen Arbeit Forschungsmethoden in der Sozialen Arbeit Fachhochschule für Sozialarbeit und Sozialpädagogik Alice- Salomon Hochschule für Soziale arbeit, Gesundheit, Erziehung und Bildung University of Applied Sciences

Mehr

Bitte am PC mit Windows anmelden!

Bitte am PC mit Windows anmelden! Einführung in SPSS Plan für heute: Grundlagen/ Vorwissen für SPSS Vergleich der Übungsaufgaben Einführung in SPSS http://weknowmemes.com/generator/uploads/generated/g1374774654830726655.jpg Standardnormalverteilung

Mehr

swiss marketing academy GmbH Seite 1 von 11

swiss marketing academy GmbH Seite 1 von 11 AUFGABE 1a Nennen Sie 3 fallbezogene Gliederungszahlen und beschreiben Sie pro Gliederungszahl die Aussagekraft. 6 Punkte Gliederungszahl = Verhältnis eines Teiles zum gleichartigen Ganzen. Nennung Beschreibung

Mehr

1) Warum ist die Lage einer Verteilung für das Ergebnis einer statistischen Analyse von Bedeutung?

1) Warum ist die Lage einer Verteilung für das Ergebnis einer statistischen Analyse von Bedeutung? 86 8. Lageparameter Leitfragen 1) Warum ist die Lage einer Verteilung für das Ergebnis einer statistischen Analyse von Bedeutung? 2) Was ist der Unterschied zwischen Parametern der Lage und der Streuung?

Mehr

htw saar 1 EINFÜHRUNG IN DIE STATISTIK: BESCHREIBENDE STATISTIK

htw saar 1 EINFÜHRUNG IN DIE STATISTIK: BESCHREIBENDE STATISTIK htw saar 1 EINFÜHRUNG IN DIE STATISTIK: BESCHREIBENDE STATISTIK htw saar 2 Grundbegriffe htw saar 3 Grundgesamtheit und Stichprobe Ziel: Über eine Grundgesamtheit (Population) soll eine Aussage über ein

Mehr

Quantitative Methoden der Agrarmarktanalyse und des Agribusiness

Quantitative Methoden der Agrarmarktanalyse und des Agribusiness Quantitative Methoden der Agrarmarktanalyse und des Agribusiness Teil Quantitative Methoden der Agrarmarktanalyse Vorlesung: Montag und Mittwoch 8:30-10:00 Dr. Bernhard Brümmer Tel.: 0431-880-4449, Fax:

Mehr

Statistik eindimensionaler Größen

Statistik eindimensionaler Größen Statistik eindimensionaler Größen Michael Spielmann Inhaltsverzeichnis 1 Aufgabe der eindimensionalen Statistik 2 2 Grundbegriffe 2 3 Aufbereiten der Stichprobe 3 4 Die Kennzahlen Mittelwert und Streuung,

Mehr

Beispiel 2 (Einige Aufgaben zu Lageparametern) Aufgabe 1 (Lageparameter)

Beispiel 2 (Einige Aufgaben zu Lageparametern) Aufgabe 1 (Lageparameter) Beispiel (Einige Aufgaben zu Lageparametern) Aufgabe 1 (Lageparameter) 1 Ein Statistiker ist zu früh zu einer Verabredung gekommen und vertreibt sich nun die Zeit damit, daß er die Anzahl X der Stockwerke

Mehr

3. Merkmale und Daten

3. Merkmale und Daten 3. Merkmale und Daten Ziel dieses Kapitels: Vermittlung des statistischen Grundvokabulars Zu klärende Begriffe: Grundgesamtheit Merkmale (Skalenniveau etc.) Stichprobe 46 3.1 Grundgesamtheiten Definition

Mehr

Beschreibende Statistik

Beschreibende Statistik Beschreibende Statistik von Dr. Peter M. Schulze Professor für Statistik und Ökonometrie an der Johannes Gutenberg-Universität Mainz 6., korrigierte und aktualisierte Auflage R.Oldenbourg Verlag München

Mehr

Trim Size: 176mm x 240mm Lipow ftoc.tex V1 - March 9, :34 P.M. Page 11. Über die Übersetzerin 9. Einleitung 19

Trim Size: 176mm x 240mm Lipow ftoc.tex V1 - March 9, :34 P.M. Page 11. Über die Übersetzerin 9. Einleitung 19 Trim Size: 176mm x 240mm Lipow ftoc.tex V1 - March 9, 2016 6:34 P.M. Page 11 Inhaltsverzeichnis Über die Übersetzerin 9 Einleitung 19 Was Sie hier finden werden 19 Wie dieses Arbeitsbuch aufgebaut ist

Mehr

Brückenkurs Statistik für Wirtschaftswissenschaften

Brückenkurs Statistik für Wirtschaftswissenschaften Peter von der Lippe Brückenkurs Statistik für Wirtschaftswissenschaften Weitere Übungsfragen UVK Verlagsgesellschaft mbh Konstanz Mit UVK/Lucius München UVK Verlagsgesellschaft mbh Konstanz und München

Mehr

I. Deskriptive Statistik 1

I. Deskriptive Statistik 1 I. Deskriptive Statistik 1 1. Einführung 3 1.1. Grundgesamtheit und Stichprobe.................. 5 1.2. Merkmale und Verteilungen..................... 6 1.3. Tabellen und Grafiken........................

Mehr

Dr. Maike M. Burda. Welchen Einfluss hat die Körperhöhe auf das Körpergewicht? Eine Regressionsanalyse. HU Berlin, Econ Bootcamp 7.-9.

Dr. Maike M. Burda. Welchen Einfluss hat die Körperhöhe auf das Körpergewicht? Eine Regressionsanalyse. HU Berlin, Econ Bootcamp 7.-9. Dr. Maike M. Burda Welchen Einfluss hat die Körperhöhe auf das Körpergewicht? Eine Regressionsanalyse. HU Berlin, Econ Bootcamp 7.-9. Januar 2011 BOOTDATA11.GDT: 250 Beobachtungen für die Variablen...

Mehr

Musterlösung zur Übungsklausur Statistik

Musterlösung zur Übungsklausur Statistik Musterlösung zur Übungsklausur Statistik WMS15B Oettinger 9/216 Aufgabe 1 (a) Falsch: der Modus ist die am häufigsten auftretende Merkmalsausprägung in einer Stichprobe. (b) Falsch: die beiden Größen sind

Mehr

8. Statistik Beispiel Noten. Informationsbestände analysieren Statistik

8. Statistik Beispiel Noten. Informationsbestände analysieren Statistik Informationsbestände analysieren Statistik 8. Statistik Nebst der Darstellung von Datenreihen bildet die Statistik eine weitere Domäne für die Auswertung von Datenbestände. Sie ist ein Fachgebiet der Mathematik

Mehr

Statistik EFA I Deskriptive Statistik Montag, 10. Februar 2014

Statistik EFA I Deskriptive Statistik Montag, 10. Februar 2014 Prof. Dr. Peter Schmidt Wintersemester 2013/14 www.schmidt-bremen.de Statistik EFA I Deskriptive Statistik Montag, 10. Februar 2014 Dieser Klausurteil ist der erste Teil der Gesamtklausur Statistik (Halbmann

Mehr

Es können keine oder mehrere Antworten richtig sein. Eine Frage ist NUR dann richtig beantwortet, wenn ALLE richtigen Antworten angekreuzt wurden.

Es können keine oder mehrere Antworten richtig sein. Eine Frage ist NUR dann richtig beantwortet, wenn ALLE richtigen Antworten angekreuzt wurden. Teil III: Statistik Alle Fragen sind zu beantworten. Es können keine oder mehrere Antworten richtig sein. Eine Frage ist NUR dann richtig beantwortet, wenn ALLE richtigen Antworten angekreuzt wurden. Wird

Mehr

Inhalt. I. Deskriptive Statistik Einführung Die Grundgesamtheit Merkmale und Verteilungen Tabellen und Grafiken...

Inhalt. I. Deskriptive Statistik Einführung Die Grundgesamtheit Merkmale und Verteilungen Tabellen und Grafiken... I. Deskriptive Statistik 1 1. Einführung 3 1.1. Die Grundgesamtheit......................... 5 1.2. Merkmale und Verteilungen..................... 6 1.3. Tabellen und Grafiken........................ 10

Mehr

Sommersemester Marktforschung

Sommersemester Marktforschung Dipl.-Kfm. Sascha Steinmann Universität Siegen Lehrstuhl für Marketing steinmann@marketing.uni-siegen.de Sommersemester 2010 Marktforschung Übungsaufgaben zu den Themen 3-6 mit Lösungsskizzen Aufgabe 1:

Mehr

Veranstaltung Wirtschaftsstatistik (BWL) an der FH Frankfurt/Main im Sommersemester 2007 (Dr. Faik) Klausur 03. Juli 2007

Veranstaltung Wirtschaftsstatistik (BWL) an der FH Frankfurt/Main im Sommersemester 2007 (Dr. Faik) Klausur 03. Juli 2007 Veranstaltung Wirtschaftsstatistik (BWL) an der FH Frankfurt/Main im Sommersemester 2007 (Dr. Faik) Klausur 03. Juli 2007 BEARBEITER/IN (NAME, VORNAME): MATRIKELNUMMER: Hinweise: Sie haben zur Bearbeitung

Mehr

Datenstrukturen. Querschnitt. Grösche: Empirische Wirtschaftsforschung

Datenstrukturen. Querschnitt. Grösche: Empirische Wirtschaftsforschung Datenstrukturen Datenstrukturen Querschnitt Panel Zeitreihe 2 Querschnittsdaten Stichprobe von enthält mehreren Individuen (Personen, Haushalte, Firmen, Länder, etc.) einmalig beobachtet zu einem Zeitpunkt

Mehr

Tutorium Mathematik in der gymnasialen Oberstufe 1. Veranstaltung: Beschreibende Statistik 19. Oktober 2016

Tutorium Mathematik in der gymnasialen Oberstufe 1. Veranstaltung: Beschreibende Statistik 19. Oktober 2016 Tutorium Mathematik in der gymnasialen Oberstufe 1. Veranstaltung: Beschreibende Statistik 19. Oktober 2016 1. Daten erfassen 1. Aufgabe: Würfeln Sie 30-mal mit einem regelmäßigen Oktaeder und dokumentieren

Mehr

y = y = 2'500 Darstellung in Grafik: P 2 (800 2'500) x (Stk) 1'000

y = y = 2'500 Darstellung in Grafik: P 2 (800 2'500) x (Stk) 1'000 . Kostenfunktion a) Vorgaben und Fragestellung Über die Herstellungskosten eines Produkts ist folgendes bekannt: Die variablen Material- und Lohnkosten betragen CHF. pro Stück. Die Fikosten belaufen sich

Mehr

Statistik II: Grundlagen und Definitionen der Statistik

Statistik II: Grundlagen und Definitionen der Statistik Medien Institut : Grundlagen und Definitionen der Statistik Dr. Andreas Vlašić Medien Institut (0621) 52 67 44 vlasic@medien-institut.de Gliederung 1. Hintergrund: Entstehung der Statistik 2. Grundlagen

Mehr

Musterlösung zur Übungsklausur Statistik

Musterlösung zur Übungsklausur Statistik Musterlösung zur Übungsklausur Statistik WMS4A Oettinger 6/205 Aufgabe (a) Falsch: der Modus ist die am häufigsten auftretende Merkmalsausprägung in einer Stichprobe. (b) Richtig: ein ordinales Merkmal

Mehr

Kapitel XI - Korrelationsrechnung

Kapitel XI - Korrelationsrechnung Universität Karlsruhe (TH) Institut für Statistik und Mathematische Wirtschaftstheorie Kapitel XI - Korrelationsrechnung Markus Höchstötter Uni Karlsruhe Karlsruhe, SS 2008 Kapitel XI - Korrelationsrechnung

Mehr

WS 1.1 Aufgabenstellung: Lösung:

WS 1.1 Aufgabenstellung: Lösung: WS 1.1 Werte aus tabellarischen und elementaren grafischen Darstellungen ablesen (bzw. zusammengesetzte Werte ermitteln) und im jeweiligen Kontext angemessen interpretieren können Anmerkung: (un-)geordnete

Mehr

Lage- und Streuungsparameter

Lage- und Streuungsparameter Lage- und Streuungsparameter Beziehen sich auf die Verteilung der Ausprägungen von intervall- und ratio-skalierten Variablen Versuchen, diese Verteilung durch Zahlen zu beschreiben, statt sie graphisch

Mehr

Gliederung der Veranstaltung. Teil I Beschreibende Statistik (empirische Verteilungen)

Gliederung der Veranstaltung. Teil I Beschreibende Statistik (empirische Verteilungen) Prof. Dr. Peter Schmidt, HSB, Wirtschaftswissenschaften Wirtschaftsstatistik, WS 2017/18 Gliederung der Veranstaltung Teil I Beschreibende Statistik (empirische Verteilungen) Einleitung: die StudierBar,

Mehr

Statistische Methoden in den Umweltwissenschaften

Statistische Methoden in den Umweltwissenschaften Statistische Methoden in den Umweltwissenschaften Korrelationsanalysen Kreuztabellen und χ²-test Themen Korrelation oder Lineare Regression? Korrelationsanalysen - Pearson, Spearman-Rang, Kendall s Tau

Mehr

Arbeitsbuch zur deskriptiven und induktiven Statistik

Arbeitsbuch zur deskriptiven und induktiven Statistik Helge Toutenburg Michael Schomaker Malte Wißmann Christian Heumann Arbeitsbuch zur deskriptiven und induktiven Statistik Zweite, aktualisierte und erweiterte Auflage 4ü Springer Inhaltsverzeichnis 1. Grundlagen

Mehr

1 x 1 y 1 2 x 2 y 2 3 x 3 y 3... n x n y n

1 x 1 y 1 2 x 2 y 2 3 x 3 y 3... n x n y n 3.2. Bivariate Verteilungen zwei Variablen X, Y werden gemeinsam betrachtet (an jedem Objekt werden gleichzeitig zwei Merkmale beobachtet) Beobachtungswerte sind Paare von Merkmalsausprägungen (x, y) Beispiele:

Mehr

TEIL 7: EINFÜHRUNG UNIVARIATE ANALYSE TABELLARISCHE DARSTELLUNG / AUSWERTUNG

TEIL 7: EINFÜHRUNG UNIVARIATE ANALYSE TABELLARISCHE DARSTELLUNG / AUSWERTUNG TEIL 7: EINFÜHRUNG UNIVARIATE ANALYSE TABELLARISCHE DARSTELLUNG / AUSWERTUNG Statistik eine Umschreibung Mathematische Hilfswissenschaft mit der Aufgabe, Methoden für die Sammlung, Aufbereitung, Analyse

Mehr

Statistik für. von. Prof. Dr. Josef Bleymüller. und. Prof. Dr. Rafael Weißbach. sowie. Dr. Günther Gehlert. und. Prof. Dr.

Statistik für. von. Prof. Dr. Josef Bleymüller. und. Prof. Dr. Rafael Weißbach. sowie. Dr. Günther Gehlert. und. Prof. Dr. Statistik für Wirtschaftswissenschaftler von Prof. Dr. Josef Bleymüller und Prof. Dr. Rafael Weißbach sowie Dr. Günther Gehlert und Prof. Dr. Herbert Gülicher bei früheren Auflagen 17., überarbeitete Auflage

Mehr

Statistik Grundbegriffe

Statistik Grundbegriffe Kapitel 2 Statistik Grundbegriffe 2.1 Überblick Im Abschnitt Statistik Grundbegriffe werden Sie die Bedeutung von statistischen Grundbegriffen wie Stichprobe oder Merkmal kennenlernen und verschiedene

Mehr

1 Grundlagen der Wahrscheinlichkeitsrechnung Wahrscheinlichkeitsräume. Ein erster mathematischer Blick auf Zufallsexperimente...

1 Grundlagen der Wahrscheinlichkeitsrechnung Wahrscheinlichkeitsräume. Ein erster mathematischer Blick auf Zufallsexperimente... Inhaltsverzeichnis 1 Grundlagen der Wahrscheinlichkeitsrechnung 1 1.1 Wahrscheinlichkeitsräume Ein erster mathematischer Blick auf Zufallsexperimente.......... 1 1.1.1 Wahrscheinlichkeit, Ergebnisraum,

Mehr

Univ.-Prof. Dr. Georg Wydra

Univ.-Prof. Dr. Georg Wydra Univ.-Prof. Dr. Georg Wydra Methoden zur Auswertung von Untersuchungen 1 SKALENTYPEN UND VARIABLEN 2 ZUR BEDEUTUNG DER STATISTIK IN DER FORSCHUNG 3 STATISTIK ALS VERFAHREN ZUR PRÜFUNG VON HYPOTHESEN 4

Mehr

JosefPuhani. Kleine Formelsammlung zur Statistik. 10. Auflage. averiag i

JosefPuhani. Kleine Formelsammlung zur Statistik. 10. Auflage. averiag i JosefPuhani Kleine Formelsammlung zur Statistik 10. Auflage averiag i Inhalt- Vorwort 7 Beschreibende Statistik 1. Grundlagen 9 2. Mittelwerte 10 Arithmetisches Mittel 10 Zentral wert (Mediän) 10 Häufigster

Mehr

Kapitel 2. Mittelwerte

Kapitel 2. Mittelwerte Kapitel 2. Mittelwerte Im Zusammenhang mit dem Begriff der Verteilung, der im ersten Kapitel eingeführt wurde, taucht häufig die Frage auf, wie man die vorliegenden Daten durch eine geeignete Größe repräsentieren

Mehr

3) Lagemaße: Mittelwert, Median, Modus

3) Lagemaße: Mittelwert, Median, Modus Thema: Beschreibende Statistik LE.1: 40 min Seite 9 3) Lagemaße: Mittelwert, Median, Modus Lagemaße In der beschreibenden Statistik werden Daten erhoben. Diese Daten weisen eine bestimmte Verteilung auf.

Mehr

Deskriptive Statistik Auswertung durch Informationsreduktion

Deskriptive Statistik Auswertung durch Informationsreduktion Deskriptive Statistik Auswertung durch Informationsreduktion Gliederung Ø Grundbegriffe der Datenerhebung Total-/Stichprobenerhebung, qualitatives/quantitatives Merkmal Einteilung der Daten (Skalierung,

Mehr

1. Einführung und statistische Grundbegriffe. Grundsätzlich unterscheidet man zwei Bedeutungen des Begriffs Statistik:

1. Einführung und statistische Grundbegriffe. Grundsätzlich unterscheidet man zwei Bedeutungen des Begriffs Statistik: . Einführung und statistische Grundbegriffe Grundsätzlich unterscheidet man zwei Bedeutungen des Begriffs Statistik: Quantitative Information Graphische oder tabellarische Darstellung von Datenmaterial

Mehr

Diese Lücken sollten nicht auch bei Ihnen vorhanden sein: Aufgrund einer statistischen Untersuchung entsteht eine geordnete bzw. ungeordnete, die durc

Diese Lücken sollten nicht auch bei Ihnen vorhanden sein: Aufgrund einer statistischen Untersuchung entsteht eine geordnete bzw. ungeordnete, die durc SS 2017 Torsten Schreiber 222 Diese Lücken sollten nicht auch bei Ihnen vorhanden sein: Aufgrund einer statistischen Untersuchung entsteht eine geordnete bzw. ungeordnete, die durch Summierung je Ausprägung

Mehr

fh management, communication & it Constantin von Craushaar fh-management, communication & it Statistik Angewandte Statistik

fh management, communication & it Constantin von Craushaar fh-management, communication & it Statistik Angewandte Statistik fh management, communication & it Folie 1 Überblick Grundlagen (Testvoraussetzungen) Mittelwertvergleiche (t-test,..) Nichtparametrische Tests Korrelationen Regressionsanalyse... Folie 2 Überblick... Varianzanalyse

Mehr

Teil: lineare Regression

Teil: lineare Regression Teil: lineare Regression 1 Einführung 2 Prüfung der Regressionsfunktion 3 Die Modellannahmen zur Durchführung einer linearen Regression 4 Dummyvariablen 1 Einführung o Eine statistische Methode um Zusammenhänge

Mehr

Skalenniveaus =,!=, >, <, +, -

Skalenniveaus =,!=, >, <, +, - ZUSAMMENHANGSMAßE Skalenniveaus Nominalskala Ordinalskala Intervallskala Verhältnisskala =,!= =,!=, >, < =,!=, >, ,

Mehr

'+4 Elisabeth Raab-Steiner / Michael Benesch. Der Fragebogen. Von der Forschungsidee zur SPSS-Auswertung. 4., aktualisierte und überarbeitete Auflage

'+4 Elisabeth Raab-Steiner / Michael Benesch. Der Fragebogen. Von der Forschungsidee zur SPSS-Auswertung. 4., aktualisierte und überarbeitete Auflage '+4 Elisabeth Raab-Steiner / Michael Benesch Der Fragebogen Von der Forschungsidee zur SPSS-Auswertung 4., aktualisierte und überarbeitete Auflage facultas «4 Inhaltsverzeichnis 1 Elementare Definitionen

Mehr

Klausurlösungen Statistik

Klausurlösungen Statistik Klausurlösungen Statistik Kurs 4060 Grundlagen der Statistik - Version vom 0.0.07 Wichtige Hinweise Liebe Studierende, Vielen Dank für den Erwerb dieser Klausurlösungen zum Kurs 4060 Grundlagen der Statistik

Mehr

Standardisierte Vorgehensweisen und Regeln zur Gewährleistung von: Eindeutigkeit Schlussfolgerungen aus empirischen Befunden sind nur dann zwingend

Standardisierte Vorgehensweisen und Regeln zur Gewährleistung von: Eindeutigkeit Schlussfolgerungen aus empirischen Befunden sind nur dann zwingend Standardisierte Vorgehensweisen und Regeln zur Gewährleistung von: Eindeutigkeit Schlussfolgerungen aus empirischen Befunden sind nur dann zwingend oder eindeutig, wenn keine alternativen Interpretationsmöglichkeiten

Mehr

Mathematik. Schuljahr 1

Mathematik. Schuljahr 1 Mathematik 1 Duales Berufskolleg Mathematik Schuljahr 1 Fachrichtung Soziales 2 Mathematik Vorbemerkungen Die Schülerinnen und Schüler lernen im Fach Mathematik einfache naturwissenschaftliche Sachverhalte

Mehr