Datenanalyse aus einer unklassierten Häufigkeitstabelle

Größe: px
Ab Seite anzeigen:

Download "Datenanalyse aus einer unklassierten Häufigkeitstabelle"

Transkript

1 Datenanalyse aus einer unklassierten Häufigkeitstabelle Worum geht es in diesem Modul? Häufigkeitstabelle Stabdiagramm Die empirische Verteilungsfunktion Quantile Worum geht es in diesem Modul? Nachdem gezeigt wurde, wie Daten in Form einer Urliste statistisch analysiert werden, soll in diesem Modul die Datenanalyse aus einer Häufigkeitstabelle ohne Klassierung gezeigt werden. Zunächst wird die Idee und der Aufbau der Häufigkeitstabelle erklärt. Es folgen die entsprechenden grafischen Darstellungen einer Häufigkeitstabelle. Anschließend wird erklärt, wie Quantile aus einer Häufigkeitstabelle bestimmt werden. Ein statistischer Report demonstriert die erlernten Methoden. Häufigkeitstabelle Die Daten einer Erhebung liegen zunächst ungeordnet in Form einer Urliste vor. Im Allgemeinen treten einige Werte mehrfach auf. Hieraus folgt, dass bei größer werdenden Datenumfängen eine mögliche Struktur der Daten aufgrund der wachsenden Unübersichtlichkeit immer schwerer zu erkennen ist. So erhebt das Statistische Bundesamt eine Vielzahl von Daten zu unterschiedlichen Fragestellungen, wie etwa zu der Aufteilung aller Studierenden Deutschlands auf die unterschiedlichen Studienfächer. Ein derartig umfangreicher Datensatz, bestehend aus Beobachtungen, kann nicht übersichtlich in einer Urliste oder einem geordneten Datensatz dargestellt werden. Aus diesem Grund werden die erhobenen Daten in Form einer Häufigkeitstabelle übersichtlicher dargestellt. Die Vorgehensweise bei der Erstellung einer derartigen Tabelle ist dabei die Folgende: Die innerhalb eines Datensatzes auftretenden Beobachtungswerte werden geordnet Page 1

2 zusammengefasst, indem ausgezählt wird, wie oft welche Merkmalsausprägung in dem betrachteten Datensatz auftritt. Diese Information wird dann tabellarisch zusammengefasst. Auf diese Art entsteht ein erster Überblick über die Häufigkeit des Auftretens der einzelnen Werte und deren Verteilung im Datensatz. Der Aufbau einer Häufigkeitstabelle erfolgt nach dem folgenden Muster. Welche Werte in den einzelnen Spalten eingetragen werden, wird im weiteren Verlauf näher erläutert. 1 Die erste Spalte der Häufigkeitstabelle wird als Indexspalte, mit, zur Kennzeichnung der einzelnen Merkmalswerte vorangestellt. In der zweiten Spalte der Häufigkeitstabelle werden die einzelnen Merkmalswerte der Größe nach geordnet eingetragen. Eine derartige Ordnung ist nur bei ordinal und kardinal skalierten Merkmalen möglich. Im Falle nominalskalierter Merkmale ist die Reihenfolge, in der die Ausprägungen in der Spalte eingetragen werden, frei wählbar. In der dritten Spalte der Tabelle ist ablesbar, wie oft die jeweiligen Ausprägungen im Datensatz aufgetreten sind; es werden die absoluten Häufigkeiten eingetragen. Diese sind stark von dem Umfang des Datensatzes abhängig, so dass zum einen die Interpretation der Daten erschwert wird und zum anderen ein Vergleich von Datensätzen unterschiedlichen Umfangs nicht möglich ist. Um eine Vergleichbarkeit unterschiedlicher Tabellen zu gewährleisten, werden in der vierten Spalte der Häufigkeitstabelle die Anteile der jeweiligen Merkmalswerte, die so genannten relativen Häufigkeiten, bestimmt. Diese werden berechnet, indem die absoluten Häufigkeiten durch den Umfang des Datensatzes dividiert werden: Betrachten wir den Datensatz bezüglich der Aufteilung aller Studierenden Deutschlands im Wintersemester 2001/02 auf die unterschiedlichen Studienfächer. Die dazugehörige Häufigkeitstabelle sieht wie folgt aus: 1 Sprach- u. Kulturwissens , Sport ,0144 Page 2

3 3 Rechts-, Wirtschafts- u. Sozialwissens , Mathe, Naturwissens , Humanmedizin , Veterinärmedizin , Agrar-, Forst- u. Ernährungswissens , Ingenieurwissens , Kunst, Kunstwissens , Sonstiges 657 0,0004 Die Häufigkeitsverteilung wird hier sehr schön ersichtlich: Im Wintersemester 2001/02 waren die meisten Studierenden in der Fächergruppe "Rechts-, Wirtschafts- und Sozialwissenschaften" eingeschrieben. Die wenigsten studierten "Veterinärmedizin" oder "Sonstiges". Schauen Sie sich auch die : Flashanimation ' Animation Erstellung unklassierter Häufigkeitstabellen ' siehe Online-Version an, hier wird der Sachverhalt noch einmal aus einer anderen Perspektive dargestellt. Zur praktischen Umsetzung der hier vorgestellten und verwendeten statistischen Methoden im Statistiklabor sei auf den folgenden Exkurs verwiesen. Beispiel: Kryptologie Problemstellung Ein Schatzsucher hat eine Wegbeschreibung zu einer Schatzinsel gefunden. Da diese allerdings verschlüsselt wurde, kann er den Schatz nicht so ohne weiteres finden. Der verschlüsselte Text lautet: Page 3

4 Yq hmi Mrwip fixvixir dy osirrir, fveyglwx hy jspkirhi Kikirwxeirhi: Imri Ebx yrh hew Wimp eyw hiq Wglyttir yrh hmi Vyhiv eyw hiq Zivwxigo zsr Kisvki. Eywwivhiq qeglx iwivwx Wmrr, hmi Mrwip dy ivjsvwglir, airr hy hir Wglexdtper irxhigox lewx. Lösungsweg Der Schatzsucher bittet einen Freund, der sich gut mit Statistik auskennt, um Hilfe. Glücklicherweise hat dieser letzte Woche in einem Buch über Kryptologie interessante Informationen über die Caesar-Verschlüsselung gefunden. Bei dieser Verschlüsselungsmethode wird jeder Buchstabe durch den Buchstaben verschlüsselt, der eine bestimmte Anzahl von Buchstaben hinter ihm steht. Des Weiteren hat er herausgefunden, dass sich deutschsprachige Texte durch eine bestimmte Häufigkeitsstruktur bezüglich des Auftretens der Buchstaben in diesen auszeichnen. So tritt der Buchstabe e sehr häufig auf, während der Buchstabe x eher selten zu finden ist. Der verschlüsselte Text liegt als Urliste im Labor auf der Seite Krypto.spf vor; ebenso ist dort die Häufigkeitstabelle der Buchstaben in deutschsprachigen Texten zu finden. Mit diesen beiden Hilfsmitteln und dem in diesem Kapitel erlernten Wissen sollte eine Entschlüsselung leicht fallen. Labordatei öffnen ( baa.spf ) Antwort Die Lösung ergibt sich durch einen Vergleich der relativen Häufigkeiten der Buchstaben des verschlüsselten Textes mit den relativen Häufigkeiten der Buchstaben in deutschsprachigen Texten. Bei der Betrachtung des verschlüsselten Textes fällt auf, dass hier der Buchstabe i der am häufigsten vorkommende Buchstabe ist; in deutschsprachigen Texten ist dies der Buchstabe e. Damit liegt die Vermutung nahe, dass der Buchstabe e durch ein i verschlüsselt wurde. Um nun die Wegbeschreibung zu entschlüsseln, müssen alle Buchstaben im kodierten Text um 4 Stellen im Alphabet nach hinten verschoben werden. Betrachten wir exemplarisch das kodierte Wort mrwip. Nach der oben festgestellten Methode zur Entschlüsselung wird aus dem Buchstaben m ein i, aus r ein n usw. Das gesuchte Wort lautet Insel. Labordatei öffnen ( bb5.spf ) Beispiel: Generalbeispiel "Studentendaten" - Erstellung einer Häufigkeitstabelle Problemstellung Wir betrachten zwei Merkmale des Generalbeispiels. Hierzu wählen wir zum einen das nominalskalierte Merkmal "Geschlecht" und zum anderen das kardinalskalierte Merkmal "Anzahl der Brüder". Zu diesen beiden Datensätzen wird jeweils die Häufigkeitstabelle erstellt und in einem nächsten Schritt interpretiert. Lösungsweg Wir erstellen zunächst die Häufigkeitstabelle des Merkmals "Geschlecht". Der Merkmalsausprägung "weiblich" wird dabei eine 1, der Merkmalsausprägung "männlich" eine 2 zugeordnet. Page 4

5 Die zu dem kardinalskalierten Merkmal "Anzahl der Brüder" erstellte Häufigkeitstabelle und die dazugehörige Interpretation kann im Labor betrachtet werden: Labordatei öffnen ( c0f.spf ) Antwort Es fällt auf, dass der Anteil der männlichen Studierenden überwiegt - die relative Häufigkeit ist gleich 0.6. Interpretieren wir dieses Ergebnis vor dem Hintergrund, dass es sich bei den befragten Studierenden um angehende Wirtschaftswissenschaftler handelt, so ist dieses nicht weiter überraschend, da an diesen Fakultäten der Anteil der männlichen Studierenden im Allgemeinen überwiegt. Betrachten wir dieses Ergebnis jedoch unter dem Blickwinkel, dass heutzutage die Absolventen an Gymnasien überwiegend Frauen sind, stellt sich die weiterführende Frage, warum der Frauenanteil an der Fakultät für Wirtschaftswissenschaften nicht auch größer ist. Haben sich diese eher an anderen Fakultäten eingeschrieben oder entscheiden sich Frauen eher für eine Lehre nach dem Abitur? Deutlich wird, dass je nach Fragestellung die Interpretation der Häufigkeitstabelle unterschiedlich ausfallen kann. In zwei Städten wurden je 60 Personen nach der Anzahl ihrer Kinobesuche in den letzten 6 Monaten befragt. Die beiden Urlisten liegen im Labor bereit. Labordatei öffnen ( c1c.zmpf ) a) Erstellen Sie aus den beiden vorliegenden Urlisten jeweils eine Häufigkeitstabelle. b) Bestimmen Sie für beide Städte die am häufigsten genannte Merkmalsausprägung. c) Die Bewohner welcher Stadt scheinen lieber ins Kino zu gehen? d) Formulieren Sie ihre Ergebnisse aus. Betrachten Sie die Merkmale "Haarfarbe" und "Anzahl der Schwestern" des Generalbeispiels. Bestimmen Sie die Skalenniveaus und diskutieren Sie, warum eine diskrete Darstellung der Daten angebracht ist. Bestimmen Sie mit Hilfe der jeweiligen Häufigkeitstabellen die häufigsten und seltensten Merkmalsausprägungen. Für das Merkmal "Haarfarbe" gilt folgende Zuordnung: 1= schwarz, 2= braun, 3= blond, 4= rot, 5=sonstiges. Die Ausprägung "NA" (not available) in den Datensätzen bedeutet, dass von dem Befragten keine Angabe gemacht wurde. Diese Ausprägungen sollten aus den Datensätzen eliminiert werden. Page 5

6 Labordatei öffnen ( c31.zmpf ) Die Funktion DiskHaeuf setzt das Konzept der Häufigkeitstabelle für nichtklassierte Daten im Labor um. - Aufruf im Statistiklabor: DiskHaeuf(x) - Demonstrationsseite im Statistiklabor: Häufigkeitstabelle (nichtklassierte Daten) ( c40.spf ) Hinweise: - Sie ist nur auf Daten x in der Form einer Urliste oder Rangwertreihe ansetzbar. - NA`s sind in Urlisten zugelassen, sie werden bei der jeweiligen Verarbeitung nicht berücksichtigt. - Das Objekt Häufigkeitstabelle hat Matrixform mit den 3 Spalten Ausprägungen, absolute Häufigkeiten und relative Häufigkeiten. - Als Funktion aus der Bibliothek danalyse.r arbeitet sie defaultmäßig im Silent-Modus. Durch Setzen des Parameters SIL=F im Aufruf, gibt die Funktion Informationen über ihr Arbeiten. - Mit xh <- DiskHaeuf(x) wird die Häufigkeitstabelle auf der Variablen xh zur weiteren Verarbeitung in Funktionen wie beispielsweise Mittelwert, Stabdiagramm etc. abgelegt. - Im Labor findet sich im Objekt "Häufigkeitstabelle" eine eingeschränkte Umsetzung des Konzepts "Häufigkeitstabelle für diskrete Daten". Steckbrief/Kurzbeschreibung Ein Steckbrief der Funktion: Häufigkeitstabelle (nichtklassierte Daten) ( ) Weitere Quellen Im Anhang sind die für das Labor benötigte Bibliothek "danalyse.r" und eine Beschreibung der Bibliothek abgelegt. Stabdiagramm : c56.pdf Die Häufigkeitstabelle enthält die Verteilung der beobachteten Merkmalswerte in tabellarischer Form. Sie ist damit der erste Schritt einer Datenanalyse und schafft einen ersten Einblick in die Struktur des Datenmaterials. Die grafische Darstellung des Inhalts einer Häufigkeitstabelle ist das Stabdiagramm. Mit seiner Hilfe wird ein umfassender Überblick über die einzelnen Merkmalsausprägungen und der Häufigkeit ihres Auftretens in der zu betrachtenden und zu analysierenden Stichprobe ermöglicht. Auf der x-achse (Abszisse) des Stabdiagramms werden die beobachteten Merkmalsausprägungen abgetragen. Auf der y-achse (Ordinate) werden die absoluten oder relativen Häufigkeiten der jeweiligen Ausprägung in Form eines Stabes abgetragen. Die Länge des Stabes gibt die Häufigkeit der zugehörigen Ausprägung wider. Im Allgemeinen werden die relativen Häufigkeiten ein Vergleich von Datensätzen mit unterschiedlichen Stichprobenumfängen gewählt, da so Page 6

7 gewährleistet wird. Das Stabdiagramm ermöglicht es, auf einen Blick alle beobachteten Ausprägungen eines Merkmales und deren Häufigkeit zu erfassen und zu interpretieren. Stellen wir an dieser Stelle ein exemplarisches Stabdiagramm zur Verdeutlichung auf. Das Statistische Bundesamt hat eine Häufigkeitstabelle bezüglich der Aufteilung aller Studierenden Deutschlands im Wintersemester 2001/02 auf die unterschiedlichen Studienfächer veröffentlicht (vgl. Abschnitt Häufigkeitstabelle ). 1 Sprach- u. Kulturwissens ,22 2 Sport ,014 3 Rechts-, Wirtschafts- u. Sozialwissens ,32 4 Mathe, Naturwissens ,17 5 Humanmedizin ,05 6 Veterinärmedizin ,004 7 Agrar-, Forst- u. Ernährungswissens ,02 8 Ingenieurwissen ,16 9 Kunst, Kunstwissens ,04 10 Sonstiges 657 0,0004 Betrachten wir im Folgenden die grafischen Umsetzung: Page 7

8 Stabdiagramm des Merkmals "Fächergruppen" Quelle: Statistisches Bundesamt Schauen Sie sich dazu auch die folgende : Flashanimation ' Animation Erstellung Stabdiagramm ' siehe Online-Version an. Zur praktischen Umsetzung der hier vorgestellten und verwendeten statistischen Methoden im Statistiklabor sei auf den folgenden Exkurs verwiesen. Beispiel: Fortsetzung des Kryptologie - Beispiels Problemstellung In Rahmen der Beispielkomponente "Kryptologie" wurde das Problem des Schatzsuchers bereits mit Hilfe einer Häufigkeitstabelle gelöst (vgl. Abschnitt Kryptologie ). Die dort angewandte Lösungsstrategie bestand in einer Gegenüberstellung der Häufigkeiten der einzelnen Buchstaben im verschlüsselten Text und der Häufigkeiten der Buchstaben in deutschsprachigen Texten. Lösungsweg Page 8

9 Die Lösung dieses Problems erfolgt erneut über einen Vergleich. Aus den in dem vorhergegangenen Beispiel erstellten Häufigkeitstabellen werden die dazugehörigen Stabdiagramme erstellt. Die Erstellung dieser Diagramme und auch die Ergebnisse der Analyse können auf dieser Laborseite nachgelesen werden. Labordatei öffnen ( d8c.spf ) Stabdiagramm der Häufigkeiten der Buchstaben im verschlüsselten Text Quelle: Statistik Labor Stabdiagramm der Häufigkeiten der Buchstaben in deutschsprachigen Texten Quelle Statistik Labor Antwort Ein Vergleich der Stabdiagramme verdeutlicht den Sachverhalt auf einen Blick: Im Stabdiagramm, welches die Häufigkeiten der Buchstaben in deutschsprachigen Page 9

10 Texten veranschaulicht, zeigt sich ein Anstieg der Häufigkeiten bei den Buchstaben b bis e. Die selbe Struktur ist in dem Stabdiagramm des verschlüsselten Textes in dem Bereich von f bis i zu beobachten. Der Anstieg der Häufigkeiten ist folglich um vier Stellen im Alphabet nach vorn verschoben. Wir kommen bei einem Vergleich der beiden Stabdiagramm somit zu dem selben Ergebnis wie bereits bei den dazugehörigen Häufigkeitstabellen. Weitere Ähnlichkeiten lassen sich auch in der Nähe des Buchstaben r im Diagramm des verschlüsselten Textes und in der Nähe des Buchstaben n im Diagramm der deutschsprachigen Texte feststellen. Wir können festhalten, dass eine Entschlüsselung der Wegbeschreibung nach der Caesar-Verschlüsselung durch eine Verschiebung der Buchstaben des kodierten Textes um 4 Stellen im Alphabet nach hinten erfolgen kann. Das Ergebnis, welches über einen Vergleich der Häufigkeitstabelle erzielt wurde, konnte somit bestätigt werden. Insgesamt kommen wir zu dem Ergebnis, dass Stabdiagramme Strukturen innerhalb der Häufigkeiten besser und anschaulicher darstellen als einfache Häufigkeitstabellen, die einen ersten Eindruck in das bestehende Datenmaterial gewähren. Beispiel: Generalbeispiel "Studentendaten" - Erstellung eines Stabdiagramms Problemstellung Im Rahmen der Beispielkomponente "Generalbeispiel "Studentendaten - Erstellung einer Häufigkeitstabelle" wurden die Häufigkeitstabellen der Merkmale "Geschlecht" und "Anzahl der Brüder" betrachtet und interpretiert (vgl. Teil 1 des Generalbeispiels ). Die Ergebnisse dieser Analyse sollen anhand einer grafischen Darstellung bestätigt werden. Lösungsweg Aus den Häufigkeitstabellen zu den interessierenden Merkmalen werden die dazugehörigen Stabdiagramme erstellt. Die Erstellung der beiden Stabdiagramme und die daraus folgenden Ergebnisse der Interpretation können im Labor unter dem Dateinamen bspstabdia.spf nachvollzogen werden. Labordatei öffnen ( db4.spf ) Page 10

11 Stabdiagramm des Merkmals "Geschlecht" Quelle: Statistik Labor Stabdiagramm des Merkmals "Anzahl der Brüder" Quelle: Statistik Labor Antwort Im ersten Stabdiagramm werden die Häufigkeiten des Merkmals "Geschlecht" dargestellt. Dabei steht die Ausprägung 1 für "weiblich" und die Ausprägung 2 für "männlich". Es zeigt sich, dass der Anteil der männlichen Wirtschaftswissenschaftsstudenten größer ist als der Anteil weiblicher Studierenden. Dieses Ergebnis bestätigt unsere bereits getroffene Einschätzung der Situation an der Fakultät, die wir aufgrund der dazugehörigen Häufigkeitstabelle getroffen haben. Das zweite Stabdiagramm veranschaulicht die Häufigkeiten des Merkmals "Anzahl der Brüder". Deutlich wird, dass der Anteil der Befragten mit höchstens einem Bruder deutlich höher ist als der Anteil derjenigen, die mehr als einen Bruder haben. Labordatei öffnen ( dc9.spf ) In zwei Städten wurden je 60 Personen nach der Anzahl ihrer Kinobesuche in den letzten 6 Monaten befragt. Zeichnen Sie die Stabdiagramme der jeweiligen Städte. Diskutieren Sie die Diagramme bezüglich ihrer Symmetrieeigenschaft ( Teil 1 der Aufgabe ). Reflektieren Sie die Fragen und Antworten zu b) und c) aus der Aufgabe Kinobesuche Häufigkeitstabelle mit Hilfe der erstellten Grafiken. Formulieren Sie ihre Ergebnisse aus. Labordatei öffnen ( dd7.spf ) Erstellen Sie die Stabdiagramme zu den Merkmalen "Haarfarbe" und "Anzahl der Schwestern" ( Teil 1 der Übung ). Interpretieren Sie die Diagramme und reflektieren Sie die Aussagen, die Sie über die Merkmale im Rahmen der Aufgabe im Abschnitt "Häufigkeitstabelle" getroffen haben. Welches Instrument halten Sie für geeigneter, um Aussagen über die Häufigkeitsstruktur eines Datensatzes zu treffen? Page 11

12 Labordatei öffnen ( de3.zmpf ) Die Funktion Stabdiagramm setzt das Konzept des Stabdiagramms im Labor um. Sie ist nur auf Daten x in der Form einer diskreten Häufigkeitstabelle ansetzbar. - Aufruf im R-Kalkulator des Labors: Stabdiagramm(x) - Demonstrationsseite im Labor: Stabdiagramm ( df4.spf ) Hinweise - Damit die Graphik angezeigt wird, müssen Sie das Laborobjekt R-Graphik mit dem R-Kalkulator verbinden. - Als Funktion aus der Bibliothek danalyse.r arbeitet sie defaultmäßig im Silent-Modus. Durch Setzen des Parameters SIL=F im Aufruf, gibt die Funktion Informationen über ihr Arbeiten. - Im Labor findet sich im Objekt R-Graphik-Wizard mit dem Angebot Stabdiagramm" eine einfache Umsetzung des Konzepts "Stabdiagramm". Hiermit können Sie aus verbundenen Datenquellen stammende Daten einfach in einem Stabdiagramm darstellen. Steckbrief/Kurzbeschreibung Steckbrief der Funktion Stabdiagramm: Stabdiagramm ( : e04.pdf ) Weitere Quellen Im Anhang sind die für das Labor benötigte Bibliothek "danalyse.r" und eine Beschreibung der Bibliothek abgelegt. Die empirische Verteilungsfunktion Wir haben bislang die relativen Häufigkeiten einzelner Merkmalsausprägungen betrachtet und Aussagen über deren Verteilung getroffen. In vielen Fällen sind allerdings nicht einzelne Ausprägungen von Interesse; statt dessen möchten wir die relative Häufigkeit ganzer Intervalle von Ausprägungen betrachten. Es stellen sich Fragen der folgenden Art: "Welcher Anteil der Daten ist kleiner oder gleich einem interessierenden Wert?" oder bezogen auf ein Beispiel: "Welcher Anteil der befragten Studierenden ist höchstens 23 Jahre alt?" Dazu könnten die einzelnen relativen Häufigkeiten in dem betrachteten Intervall aufaddiert werden. Das Problem dieser Lösungsform liegt aber darin, dass bei jeder neuen Fragestellung die einzelnen relativen Häufigkeiten neu aufaddiert werden müssen. Um dieses zu umgehen, wird die empirische Verteilungsfunktion gebildet. Hierzu wird die Häufigkeitstabelle um eine Spalte der kumulierten relativen Häufigkeiten erweitert. Hierbei handelt es sich um die in der Häufigkeitstabelle schrittweise aufaddierten relativen Häufigkeiten. Damit eine sinnvolle Kumulation der Häufigkeiten überhaupt möglich ist, muss das betrachtete Merkmal mindestens ordinalskaliert sein, die Merkmalsausprägungen somit der Größe nach geordnet in der Häufigkeitstabelle stehen. Da nominalskalierte Merkmale keine natürliche Ordnung besitzen, würde ein Aufaddieren der Häufigkeiten Page 12

13 der Merkmalsausprägungen keine sinnvolle Interpretation ermöglichen. Formal wird die empirische Verteilungsfunktion wie Folgt definiert: also als der Anteil der Beobachtungen, die kleiner oder gleich einem interessierenden Wert ist. Dieser Anteil ist nicht nur für die Ausprägungen des Merkmals im Datensatz sinnvoll, sondern für alle reellen Zahlen. Zur praktischen Umsetzung der hier vorgestellten und verwendeten statistischen Methoden im Statistiklabor sei auf den folgenden Exkurs verwiesen. Bei einer grafischen Darstellung der Funktion werden auf der Abszisse die Merkmalsausprägungen und auf der Ordinate die kumulierten relativen Häufigkeiten abgetragen. Es entsteht eine monoton wachsende Treppenfunktion, die an den Ausprägungen um die entsprechende relative Häufigkeit nach oben springt. Die Funktion ist rechtsseitig stetig, d.h. an den Sprungstellen ist jeweils der Wert der Treppenoberkante der zu der Ausprägung gehörige Funktionswert. Verdeutlichen wir diese Vorgehensweise anhand eines Beispiels: Ein Dozent befragt die 55 Studierenden seiner Veranstaltung nach ihrem Alter. Er möchte wissen, welcher Anteil der befragten Studierenden höchstens 23 Jahre alt ist. Die zur Beantwortung dieser Frage benötigte empirische Verteilungsfunktion ist die Folgende: Empirische Verteilungsfunktion des Merkmals "Alter" Quelle: Eigene Befragung Page 13

14 Mit Hilfe dieser grafischen Darstellung kann die Frage einfach beantwortet werden: 60% der Studierenden sind höchstens 23 Jahre alt. Schauen Sie dazu auch die : Flashanimation ' Animation Verteilungsfunktion ' siehe Online-Version an, in der das Konzept aus einer etwas anderen Perspektive erörtert wird. Zur praktischen Umsetzung der hier vorgestellten und verwendeten statistischen Methoden im Statistiklabor sei auf den folgenden Exkurs verwiesen. Beispiel: Tore bei der EM 2000 Problemstellung Ein Statistiker hat für jedes der 31 Spiele der Fußball-EM 2000 die Anzahl der Tore der ersten und der zweiten Halbzeit notiert. Er möchte wissen, in welcher Halbzeit die meisten Tore erzielt wurden. Labordatei öffnen ( e5f.spf ) Lösungsweg Um die Fragestellung beantworten zu können, werden in einem ersten Schritt die Differenzen von den Toren der 2. Halbzeit und den Toren der 1.Halbzeit gebildet. In weiteren Schritten werden die Differenzen tabellarisch und grafisch dargestellt, um zu plausiblen Aussagen kommen zu können. Im Rahmen dieses Beispieles werden das ermittelte Stabdiagramm und die dazugehörige empirische Verteilungsfunktion abgebildet. Die diesen beiden grafischen Darstellungen zugrunde liegende Häufigkeitstabelle kann im Labor eingesehen werden. Stabdiagramm der Tordifferenzen Quelle: Statistik Labor Page 14

15 Empirische Verteilungsfunktion der Tordifferenzen Quelle: Statistik Labor Antwort Betrachten wir zunächst das Stabdiagramm der Tordifferenzen. Es fällt auf, dass die meisten Differenzen rechts von der beobachteten Ausprägung 0 liegen, also positiv sind. Eine positive Differenz bedeutet, dass in der zweiten Halbzeit mehr Tore erzielt wurden als in der ersten Halbzeit. Der häufigste beobachtete Wert der Tordifferenzen ist die 1; während der betrachteten Fußball-EM wurde in der 2. Halbzeit häufig ein Tor mehr erzielt als in der 1. Halbzeit. Wir können daher die Vermutung anstellen, dass die Spieler in der 2. Halbzeit motivierter sind, sich nach der Halbzeit mehr Mühe geben und daher auch mehr Tore schießen als vor der Pause. Bestätigt wird diese Annahme durch die empirische Verteilungsfunktion: Es zeigt sich, dass der Anteil der Tordifferenzen, die größer sind als 0, 52% beträgt. Der Anteil der Tordifferenzen, die kleiner als 0 sind, beträgt hingegen lediglich 26%. Kein Unterschied zwischen den beiden Halbzeiten wurde in 23% der Fußballspiele beobachtet. Damit konnte die obige Vermutung bestätigt werden, dass in der 2. Halbzeit mehr Tore erzielt wurden, die Spieler sich somit während der zweiten Spielphase mehr Mühe gaben. Die Funktion pemp setzt das Konzept einer empirischen Verteilungsfunktion im Labor um. - Aufruf im Statistiklabor: pemp(x) - Demonstrationsseite im Labor: Empirische Verteilungsfunktion ( e8a.spf ) Hinweise - Die Daten seien auf der Variablen x abgelegt. Sie können in Form einer Urliste, Rangwertreihe, diskreten oder kontinuierlichen Häufigkeitstabelle vorliegen. - NA`s sind in Urlisten zugelassen, sie werden bei der jeweiligen Verarbeitung nicht berücksichtigt. - Soll der Wert der empirischen Verteilungsfunktion an der Stelle xp berechnet werden, dann erreicht man dies im R-Kalkulator des Labors durch den Aufruf: pemp(xp,x) - Als Funktion aus der Bibliothek danalyse.r arbeitet sie defaultmäßig im Silent-Modus. Page 15

16 Durch Setzen des Parameters SIL=F im Aufruf, gibt die Funktion Informationen über ihr Arbeiten. Steckbrief/Kurzbeschreibung Steckbrief der Funktion: Empirische Verteilungsfunktion ( : e9c.pdf ) Weitere Quellen Im Anhang sind die für das Labor benötigte Bibliothek "danalyse.r" und eine Beschreibung der Bibliothek abgelegt. Die Funktion EmpVert setzt das Konzept Graph einer empirischen Verteilungsfunktion im Labor um. - Aufruf im R-Kalkulator des Labors: EmpVert(x) - Demonstrationsseite 1 im Labor: Grafik(1) der empirischen Verteilung ( ec1.spf ) - Demonstrationsseite 2 im Labor: Grafik(2) der empirischen Verteilung ( ec4.spf ) Hinweise - Die Daten seien auf der Variablen x abgelegt. Sie können in Form einer Urliste, Rangwertreihe, diskreten oder kontinuierlichen Häufigkeitstabelle vorliegen. - NA`s sind in Urlisten zugelassen, sie werden bei der jeweiligen Verarbeitung nicht berücksichtigt. - Die Graphik erscheint in dem mit dem R-Kalkulator verbundenen Laborobjekt R-Graphik. - Als Funktion aus der Bibliothek danalyse.r arbeitet sie defaultmäßig im Silent-Modus. Durch Setzen des Parameters SIL=F im Aufruf, gibt die Funktion Informationen über ihr Arbeiten. - Im Labor findet sich im Objekt R-Graphik-Wizard mit dem Angebot "Empirische Verteilungsfunktion" eine einfache Umsetzung des Konzepts "Empirische Verteilungsfunktion". Steckbrief/Kurzbeschreibung Steckbrief der Funktion EmpVert: EmpVert() ( : ed8.pdf ) Weitere Quellen Im Anhang sind die für das Labor benötigte Bibliothek "danalyse.r" und eine Beschreibung der Bibliothek abgelegt. Quantile Bislang haben wir Fragen nach Anteilen, die von einer bestimmten Ausprägung nicht überschritten werden, mit Hilfe der empirischen Verteilungsfunktion beantworten können. Diese Fragestellung kann auch umgekehrt werden: Wir suchen nun nach einer Merkmalsausprägung, die von einem bestimmten Anteil der Merkmalsträger in der Stichprobe nicht überschritten wird. Dabei kann es sich um Fragen der folgenden Art handeln: "Welches Alter wird von 90% der Studierenden nicht überschritten?" (vgl. ) Page 16

17 Die Bestimmung der Quantile aus einer Häufigkeitstabelle ohne Klassierung unterscheidet sich im Wesentlichen nicht von der Berechnung der Quantile aus einem geordneten Datensatz. Schließlich ist eine nicht-klassierte Häufigkeitstabelle nichts anderes als ein komprimierter geordneter Datensatz: Eine Häufigkeitstabelle fasst die innerhalb eines Datensatzes auftretenden Ausprägungen der Größe nach geordnet zusammen, indem ausgezählt wird, wie oft welche Merkmalsausprägung in dem betrachteten Datensatz auftritt. Der geordnete Datensatz wird demnach komprimiert in einer Tabelle zusammengefasst. Definition: p-quantil Für jeden Anteil mit ist das p-quantil des Datensatzes der kleinste x-wert, für den gilt, formal:, falls und. Wir sprechen auch vom p-quantil der empirischen Verteilungsfunktion. Zur Veranschaulichung beantworten wir die Frage nach dem Alter der Studierenden anhand der dazugehörigen Häufigkeitstabelle: Page 17

18 Der Wert an Stelle des erwarteten ist auf Rundungsfehler zurückzuführen. Für p = 0.9 ergibt sich, denn aber. Zur praktischen Umsetzung der hier vorgestellten und verwendeten statistischen Methoden im Statistiklabor sei auf den folgenden Exkurs verwiesen. Schauen Sie sich dazu die : Flashanimation ' Animation Quantile ' siehe Online-Version an, in der der Sachverhalt von einer etwas anderen Perspektive beleuchtet wird. Beispiel: Generalbeispiel "Studentendaten" - Erstellung einer empirischen Verteilungsfunktion Problemstellung Wir betrachten erneut die beiden Merkmale "Geschlecht" und "Anzahl der Brüder" des Generalbeispiels ( Teil 1 des Beispiels ). Da es sich bei dem Merkmal "Geschlecht" um ein nominalskaliertes Merkmal handelt, ist eine Erstellung und Betrachtung der empirischen Verteilungsfunktion nicht sinnvoll. Die beiden möglichen Merkmalsausprägungen besitzen keine Ordnungsstruktur, so dass ein Aufaddieren dieser keine sinnvolle Interpretation ermöglichen würde. Auch lassen sich inhaltlich mit Hilfe der Verteilungsfunktion keine neuen Erkenntnisse ableiten; diese würde zeigen, dass 100% der Studierenden ein Geschlecht haben. Aus diesem Grund wird nur die Verteilungsfunktion für das Merkmal "Anzahl der Brüder" betrachtet. Lösungsweg Die bereits bekannte Häufigkeitstabelle des Merkmals "Anzahl der Brüder" wird zunächst um die Spalte der kumulierten relativen Häufigkeiten erweitert: ,37 0, ,42 0, ,11 0, ,02 0, ,07 0, , Page 18

19 In einem nächsten Schritt wird die dazugehörige empirische Verteilungsfunktion grafisch dargestellt: Empirische Verteilungsfunktion des Merkmals "Anzahl der Brüder" Quelle: Statistik Labor Antwort Aus der um die empirische Verteilungsfunktion ergänzten Häufigkeitstabelle kann abgelesen werden, dass 79% der befragten Studierenden höchstens einen Bruder haben. Damit gilt im Umkehrschluss, dass der Anteil der Studierenden, die mehr als einen Bruder, bzw. mindestens zwei Brüder haben, 21% beträgt. Mindestens 3 und höchstens 5 Brüder haben lediglich 8% der befragten Studierenden. Dieser Wert ergibt sich aus 0.98, d.h. 98% der Befragten haben höchstens 5 Brüder, abzüglich der 90%, die höchstens 2 Brüder haben. Die Geschwisteranzahl der befragten Studierenden scheint eher klein zu sein. Hierbei kann es sich lediglich um eine Vermutung handeln, da sich aus dem vorliegenden Datensatz keine Aussagen über die Anzahl der Schwestern ergeben. Würden wir die Anzahl der Schwestern in die Analyse einfließen lassen, könnten gesicherte Aussagen über die Geschwisterzahl der Befragten abgeleitet werden. Gegeben ist die Anzahl der Kinobesuche der letzten 6 Monaten in zwei Städten. Beantworten Sie die folgenden Fragen für beide Städte ( Teil 1 der Aufgabe ). a) Ergänzen Sie die Häufigkeitstabelle um die kumulierten relativen Häufigkeiten des betrachteten Merkmals. b) Zeichnen Sie die empirische Verteilungsfunktion. c) Bestimmen Sie den Anteil der Leute, die mindestens einmal im Kino waren. d) Bestimmen Sie den Anteil der Leute, die mindestens 3-mal und höchstens 5-mal im Kino waren. e) Bestimmen Sie den Anteil der Leute, die mehr als einmal und weniger als 5-mal im Kino waren. Page 19

1,11 1,12 1,13 1,14 1,15 1,16 1,17 1,17 1,17 1,18

1,11 1,12 1,13 1,14 1,15 1,16 1,17 1,17 1,17 1,18 3. Deskriptive Statistik Ziel der deskriptiven (beschreibenden) Statistik (explorativen Datenanalyse) ist die übersichtliche Darstellung der wesentlichen in den erhobenen Daten enthaltene Informationen

Mehr

5 Zusammenhangsmaße, Korrelation und Regression

5 Zusammenhangsmaße, Korrelation und Regression 5 Zusammenhangsmaße, Korrelation und Regression 5.1 Zusammenhangsmaße und Korrelation Aufgabe 5.1 In einem Hauptstudiumsseminar des Lehrstuhls für Wirtschafts- und Sozialstatistik machten die Teilnehmer

Mehr

Kontingenzkoeffizient (nach Pearson)

Kontingenzkoeffizient (nach Pearson) Assoziationsmaß für zwei nominale Merkmale misst die Unabhängigkeit zweier Merkmale gibt keine Richtung eines Zusammenhanges an 46 o jl beobachtete Häufigkeiten der Kombination von Merkmalsausprägungen

Mehr

3.2 Bivariate Verteilungen

3.2 Bivariate Verteilungen 3.2 Bivariate Verteilungen zwei Variablen X, Y werden gemeinsam betrachtet (an jedem Objekt i, i = 1,..., n, werden gleichzeitig zwei Merkmale beobachtet) Beobachtungswerte sind Paare/Kombinationen von

Mehr

2. Deskriptive Statistik 2.1. Häufigkeitstabellen, Histogramme, empirische Verteilungsfunktionen

2. Deskriptive Statistik 2.1. Häufigkeitstabellen, Histogramme, empirische Verteilungsfunktionen 4. Datenanalyse und Modellbildung Deskriptive Statistik 2-1 2. Deskriptive Statistik 2.1. Häufigkeitstabellen, Histogramme, empirische Verteilungsfunktionen Für die Auswertung einer Messreihe, die in Form

Mehr

90-minütige Klausur Statistik für Studierende der Kommunikationswissenschaft

90-minütige Klausur Statistik für Studierende der Kommunikationswissenschaft Prof. Dr. Helmut Küchenhoff SS08 90-minütige Klausur Statistik für Studierende der Kommunikationswissenschaft am 22.7.2008 Anmerkungen Überprüfen Sie bitte sofort, ob Ihre Angabe vollständig ist. Sie sollte

Mehr

2. Eindimensionale (univariate) Datenanalyse

2. Eindimensionale (univariate) Datenanalyse 2. Eindimensionale (univariate) Datenanalyse Dr. Antje Kiesel Institut für Angewandte Mathematik WS 2011/2012 Kennzahlen, Statistiken In der Regel interessieren uns nicht so sehr die beobachteten Einzeldaten

Mehr

Befragung und empirische Einschätzung der Praxisrelevanz

Befragung und empirische Einschätzung der Praxisrelevanz Befragung und empirische Einschätzung der Praxisrelevanz eines Vorgehensmodells zur Auswahl von CRM-Systemen D I P L O M A R B E I T zur Erlangung des Grades eines Diplom-Ökonomen der Wirtschaftswissenschaftlichen

Mehr

Analog zu Aufgabe 16.1 werden die Daten durch folgenden Befehl eingelesen: > kredit<-read.table("c:\\compaufg\\kredit.

Analog zu Aufgabe 16.1 werden die Daten durch folgenden Befehl eingelesen: > kredit<-read.table(c:\\compaufg\\kredit. Lösung 16.3 Analog zu Aufgabe 16.1 werden die Daten durch folgenden Befehl eingelesen: > kredit

Mehr

Anwendung von Statistik in Excel Deskriptive Statistik und Wirtschaftsstatistik

Anwendung von Statistik in Excel Deskriptive Statistik und Wirtschaftsstatistik Anwendung von Statistik in Excel Deskriptive Statistik und Wirtschaftsstatistik Wintersemester 08/09 Kai Schaal Universität zu Köln Organisatorisches und Einleitung (1) Was, wann, wo? Anwendung von Statistik

Mehr

Statistik und Wahrscheinlichkeitsrechnung

Statistik und Wahrscheinlichkeitsrechnung Statistik und Wahrscheinlichkeitsrechnung Übung 2 28.02.2008 1 Inhalt der heutigen Übung Beschreibende Statistik Gemeinsames Lösen der Übungsaufgaben 2.1: Häufigkeitsverteilung 2.2: Tukey Boxplot 25:Korrelation

Mehr

Grundlagen der Inferenzstatistik: Was Ihnen nicht erspart bleibt!

Grundlagen der Inferenzstatistik: Was Ihnen nicht erspart bleibt! Grundlagen der Inferenzstatistik: Was Ihnen nicht erspart bleibt! 1 Einführung 2 Wahrscheinlichkeiten kurz gefasst 3 Zufallsvariablen und Verteilungen 4 Theoretische Verteilungen (Wahrscheinlichkeitsfunktion)

Mehr

Abhängigkeit zweier Merkmale

Abhängigkeit zweier Merkmale Abhängigkeit zweier Merkmale Johannes Hain Lehrstuhl für Mathematik VIII Statistik 1/33 Allgemeine Situation Neben der Untersuchung auf Unterschiede zwischen zwei oder mehreren Untersuchungsgruppen hinsichtlich

Mehr

Beschreibende Statistik

Beschreibende Statistik Beschreibende Statistik Daten graphisch darstellen 21. April 2009 Dr. Katja Krüger Universität Paderborn Grundlagen der Schulmathematik SoSe 2009 1 Daten graphisch darstellen warum? Die rasche und sichere

Mehr

Skript zur Übung: Grundlagen der empirischen Sozialforschung - Datenanalyse

Skript zur Übung: Grundlagen der empirischen Sozialforschung - Datenanalyse Skript zur Übung: Grundlagen der empirischen Sozialforschung - Datenanalyse Phasen des Forschungsprozesses Auswahl des Forschungsproblems Theoriebildung Theoretische Phase Konzeptspezifikation / Operationalisierung

Mehr

Statistik mit Excel 2010. Themen-Special. Peter Wies. 1. Ausgabe, September 2011 W-EX2010S

Statistik mit Excel 2010. Themen-Special. Peter Wies. 1. Ausgabe, September 2011 W-EX2010S Statistik mit Excel 2010 Peter Wies 1. Ausgabe, September 2011 Themen-Special W-EX2010S 3 Statistik mit Excel 2010 - Themen-Special 3 Statistische Maßzahlen In diesem Kapitel erfahren Sie wie Sie Daten

Mehr

Deskriptive Statistik

Deskriptive Statistik Deskriptive Statistik In der beschreibenden Statistik werden Methoden behandelt, mit deren Hilfe man Daten übersichtlich darstellen und kennzeichnen kann. Die Urliste (=Daten in der Reihenfolge ihrer Erhebung)

Mehr

Medizinische Biometrie (L5)

Medizinische Biometrie (L5) Medizinische Biometrie (L5) Vorlesung II Daten Deskription Prof. Dr. Ulrich Mansmann Institut für Medizinische Informationsverarbeitung, Biometrie und Epidemiologie mansmann@ibe.med.uni-muenchen.de IBE,

Mehr

Multinomiale logistische Regression

Multinomiale logistische Regression Multinomiale logistische Regression Die multinomiale logistische Regression dient zur Schätzung von Gruppenzugehörigkeiten bzw. einer entsprechenden Wahrscheinlichkeit hierfür, wobei als abhänginge Variable

Mehr

Grundbegriffe (1) Grundbegriffe (2)

Grundbegriffe (1) Grundbegriffe (2) Grundbegriffe (1) S.1 Äquivalenzklasse Unter einer Äquivalenzklasse versteht man eine Klasse von Objekten, die man hinsichtlich bestimmter Merkmalsausprägungen als gleich (äquivalent) betrachtet. (z.b.

Mehr

Messsystemanalyse (MSA)

Messsystemanalyse (MSA) Messsystemanalyse (MSA) Inhaltsverzeichnis Ursachen & Auswirkungen von Messabweichungen Qualifikations- und Fähigkeitsnachweise Vorteile einer Fähigkeitsuntersuchung Anforderungen an das Messsystem Genauigkeit

Mehr

Formulierungshilfen für das wissenschaftliche Schreiben

Formulierungshilfen für das wissenschaftliche Schreiben Formulierungshilfen für das wissenschaftliche Schreiben 1. Einleitendes Kapitel 1.1.1 Einen Text einleiten und zum Thema hinführen In der vorliegenden Arbeit geht es um... Schwerpunkt dieser Arbeit ist...

Mehr

Auswertung und Darstellung wissenschaftlicher Daten (1)

Auswertung und Darstellung wissenschaftlicher Daten (1) Auswertung und Darstellung wissenschaftlicher Daten () Mag. Dr. Andrea Payrhuber Zwei Schritte der Auswertung. Deskriptive Darstellung aller Daten 2. analytische Darstellung (Gruppenvergleiche) SPSS-Andrea

Mehr

Entscheidungsbaumverfahren

Entscheidungsbaumverfahren Entscheidungsbaumverfahren Allgemeine Beschreibung Der Entscheidungsbaum ist die Darstellung einer Entscheidungsregel, anhand derer Objekte in Klassen eingeteilt werden. Die Klassifizierung erfolgt durch

Mehr

Verteilungsmodelle. Verteilungsfunktion und Dichte von T

Verteilungsmodelle. Verteilungsfunktion und Dichte von T Verteilungsmodelle Verteilungsfunktion und Dichte von T Survivalfunktion von T Hazardrate von T Beziehungen zwischen F(t), S(t), f(t) und h(t) Vorüberlegung zu Lebensdauerverteilungen Die Exponentialverteilung

Mehr

Linearer Zusammenhang von Datenreihen

Linearer Zusammenhang von Datenreihen Linearer Zusammenhang von Datenreihen Vielen Problemen liegen (möglicherweise) lineare Zusammenhänge zugrunde: Mein Internetanbieter verlangt eine Grundgebühr und rechnet minutenweise ab Ich bestelle ein

Mehr

Ermittlung von Assoziationsregeln aus großen Datenmengen. Zielsetzung

Ermittlung von Assoziationsregeln aus großen Datenmengen. Zielsetzung Ermittlung von Assoziationsregeln aus großen Datenmengen Zielsetzung Entscheidungsträger verwenden heutzutage immer häufiger moderne Technologien zur Lösung betriebswirtschaftlicher Problemstellungen.

Mehr

1. Biometrische Planung

1. Biometrische Planung 1. Biometrische Planung Die biometrische Planung ist Teil der Studienplanung für wissenschaftliche Studien, in denen eine statistische Bewertung von Daten erfolgen soll. Sie stellt alle erforderlichen

Mehr

Grundlagen quantitativer Sozialforschung Interferenzstatistische Datenanalyse in MS Excel

Grundlagen quantitativer Sozialforschung Interferenzstatistische Datenanalyse in MS Excel Grundlagen quantitativer Sozialforschung Interferenzstatistische Datenanalyse in MS Excel 16.11.01 MP1 - Grundlagen quantitativer Sozialforschung - (4) Datenanalyse 1 Gliederung Datenanalyse (inferenzstatistisch)

Mehr

Prüfung zu Modul 26 (BA Bw) bzw. 10 (BA IB) (Wirtschaftsstatistik)

Prüfung zu Modul 26 (BA Bw) bzw. 10 (BA IB) (Wirtschaftsstatistik) 2 3 Klausur-Nr = Sitzplatz-Nr Prüfung zu Modul 26 (BA Bw) bzw. 10 (BA IB) (Wirtschaftsstatistik) Klausurteil 1: Beschreibende Statistik BeStat-1 (7 ) n = 400 Personen wurden gefragt, wie viele Stück eines

Mehr

29. Mai 2006. 5. Bei Unterschleif gilt die Klausur als nicht bestanden und es erfolgt eine Meldung an das Prüfungsamt.

29. Mai 2006. 5. Bei Unterschleif gilt die Klausur als nicht bestanden und es erfolgt eine Meldung an das Prüfungsamt. L. Fahrmeir, C. Belitz Department für Statistik Bitte für die Korrektur freilassen! Aufgabe 1 2 3 4 Punkte Klausur zur Vorlesung Statistik III für Studenten mit Wahlfach Statistik 29. Mai 2006 Hinweise:

Mehr

ETWR TEIL B ÜBUNGSBLATT 4 WS14/15

ETWR TEIL B ÜBUNGSBLATT 4 WS14/15 ETWR TEIL B ÜBUNGSBLATT 4 WS14/15 OTTO-VON-GUERICKE-UNIVERSITÄT MAGDEBURG F A K U L T Ä T F Ü R W I R T S C H A F T S W I S S E N S C H A FT LEHRSTUHL FÜR EMPIRISCHE WIRTSCHAFTSFORSCHUNG & GESUNDHEITSÖKONOMIE,

Mehr

Prof. Dr. P. von der Lippe Statistik I NK SS 2002 Seite 1

Prof. Dr. P. von der Lippe Statistik I NK SS 2002 Seite 1 Prof. Dr. P. von der Lippe Statistik I NK SS 2002 Seite 1 Aufgabe 1 a) BWL-Student S hat von seinem Lieblingsonkel 10.000 geschenkt bekommen mit der Auflage damit etwas Vernünftiges zu machen. Nachdem

Mehr

Kapitel 3. Zufallsvariable. Wahrscheinlichkeitsfunktion, Dichte und Verteilungsfunktion. Erwartungswert, Varianz und Standardabweichung

Kapitel 3. Zufallsvariable. Wahrscheinlichkeitsfunktion, Dichte und Verteilungsfunktion. Erwartungswert, Varianz und Standardabweichung Kapitel 3 Zufallsvariable Josef Leydold c 2006 Mathematische Methoden III Zufallsvariable 1 / 43 Lernziele Diskrete und stetige Zufallsvariable Wahrscheinlichkeitsfunktion, Dichte und Verteilungsfunktion

Mehr

Übungen zur Veranstaltung Statistik 2 mit SPSS

Übungen zur Veranstaltung Statistik 2 mit SPSS Raum 22, Tel. 39 4 Aufgabe 5. Wird der neue Film MatchPoint von Woody Allen von weiblichen und männlichen Zuschauern gleich bewertet? Eine Umfrage unter 00 Kinobesuchern ergab folgende Daten: Altersgruppe

Mehr

Lehrerhandbuch Unterrichtsstunde zum Mathematiklabor Thema Proportionalität. Universität Würzburg Lena Moser

Lehrerhandbuch Unterrichtsstunde zum Mathematiklabor Thema Proportionalität. Universität Würzburg Lena Moser Lehrerhandbuch Unterrichtsstunde zum Mathematiklabor Thema Proportionalität Universität Würzburg Lena Moser Tafelbild Proportionalität Raupe auf Uhr r(ϕ)= ϕ Eigenschaft: Zellteilung exponentielles Wachstum

Mehr

Willkommen zur Vorlesung Statistik

Willkommen zur Vorlesung Statistik Willkommen zur Vorlesung Statistik Thema dieser Vorlesung: Varianzanalyse Prof. Dr. Wolfgang Ludwig-Mayerhofer Universität Siegen Philosophische Fakultät, Seminar für Sozialwissenschaften Prof. Dr. Wolfgang

Mehr

IT-basierte Erstellung von Nachhaltigkeitsberichten. Diplomarbeit

IT-basierte Erstellung von Nachhaltigkeitsberichten. Diplomarbeit IT-basierte Erstellung von Nachhaltigkeitsberichten Diplomarbeit zur Erlangung des Grades eines Diplom-Ökonomen der Wirtschaftswissenschaftlichen Fakultät der Leibniz Universität Hannover vorgelegt von

Mehr

Ausbau des Unternehmergeistes an badenwürttembergischen. Ziel A 3.1.2 des badenwürttembergischen

Ausbau des Unternehmergeistes an badenwürttembergischen. Ziel A 3.1.2 des badenwürttembergischen Ausbau des Unternehmergeistes an badenwürttembergischen Hochschulen im spezifischen Ziel A 3.1.2 des badenwürttembergischen ESF-OP Aktualisierte Ergebnisse aus der Programmevaluation Fassung vom 28.10.2013

Mehr

i x k k=1 i u i x i v i 1 0,2 24 24 0,08 2 0,4 30 54 0,18 3 0,6 54 108 0,36 4 0,8 72 180 0,60 5 1,0 120 300 1,00 2,22 G = 1 + 1 n 2 n i=1

i x k k=1 i u i x i v i 1 0,2 24 24 0,08 2 0,4 30 54 0,18 3 0,6 54 108 0,36 4 0,8 72 180 0,60 5 1,0 120 300 1,00 2,22 G = 1 + 1 n 2 n i=1 1. Aufgabe: Der E-Commerce-Umsatz (in Millionen Euro) der fünf größten Online- Shopping-Clubs liegt wie folgt vor: Club Nr. Umsatz 1 120 2 72 3 54 4 30 5 24 a) Bestimmen Sie den Ginikoeffizienten. b) Zeichnen

Mehr

9. Schätzen und Testen bei unbekannter Varianz

9. Schätzen und Testen bei unbekannter Varianz 9. Schätzen und Testen bei unbekannter Varianz Dr. Antje Kiesel Institut für Angewandte Mathematik WS 2011/2012 Schätzen und Testen bei unbekannter Varianz Wenn wir die Standardabweichung σ nicht kennen,

Mehr

Statistik im Bachelor-Studium der BWL und VWL

Statistik im Bachelor-Studium der BWL und VWL Max C. Wewel Statistik im Bachelor-Studium der BWL und VWL Methoden, Anwendung, Interpretation Mit herausnehmbarer Formelsammlung ein Imprint von Pearson Education München Boston San Francisco Harlow,

Mehr

Datenanalyse und Statistik

Datenanalyse und Statistik Datenanalyse und Statistik p. 1/44 Datenanalyse und Statistik Vorlesung 2 (Graphik I) K.Gerald van den Boogaart http://www.stat.boogaart.de Datenanalyse und Statistik p. 2/44 Daten Schätzung Test Mathe

Mehr

Einseitig gerichtete Relation: Mit zunehmender Höhe über dem Meeresspiegel sinkt im allgemeinen die Lufttemperatur.

Einseitig gerichtete Relation: Mit zunehmender Höhe über dem Meeresspiegel sinkt im allgemeinen die Lufttemperatur. Statistik Grundlagen Charakterisierung von Verteilungen Einführung Wahrscheinlichkeitsrechnung Wahrscheinlichkeitsverteilungen Schätzen und Testen Korrelation Regression Einführung Die Analyse und modellhafte

Mehr

Versuchsauswertung mit Polynom-Regression in Excel

Versuchsauswertung mit Polynom-Regression in Excel Versuchsauswertung mit Polynom-Regression in Excel Aufgabenstellung: Gegeben sei die in Bild 1 gezeigte Excel-Tabelle mit Messwertepaaren y i und x i. Aufgrund bekannter physikalischer Zusammenhänge wird

Mehr

Data Mining (ehem. Entscheidungsunterstützungssysteme)

Data Mining (ehem. Entscheidungsunterstützungssysteme) Data Mining (ehem. Entscheidungsunterstützungssysteme) Melanie Pfoh Anja Tetzner Christian Schieder Übung WS 2014/15 AGENDA TEIL 1 Aufgabe 1 (Wiederholung OPAL / Vorlesungsinhalte) ENTSCHEIDUNG UND ENTSCHEIDUNGSTHEORIE

Mehr

Abschlussklausur (60 Minuten), 15. Juli 2014

Abschlussklausur (60 Minuten), 15. Juli 2014 Prof. Dr. Amelie Wuppermann Volkswirtschaftliche Fakultät Universität München Sommersemester 2014 Empirische Ökonomie 1 Abschlussklausur (60 Minuten), 15. Juli 2014 Bearbeitungshinweise Die Bearbeitungszeit

Mehr

Drucksache 17 / 15 031. 17. Wahlperiode. der Abgeordneten Anja Schillhaneck (GRÜNE) Studierende im Wintersemester 2013/2014 in Berlin

Drucksache 17 / 15 031. 17. Wahlperiode. der Abgeordneten Anja Schillhaneck (GRÜNE) Studierende im Wintersemester 2013/2014 in Berlin Drucksache 17 / 15 031 Schriftliche Anfrage 17. Wahlperiode Schriftliche Anfrage der Abgeordneten Anja Schillhaneck (GRÜNE) vom 24. November 2014 (Eingang beim Abgeordnetenhaus am 27. November 2014) und

Mehr

Norm- vs. Kriteriumsorientiertes Testen

Norm- vs. Kriteriumsorientiertes Testen Norm- vs. Kriteriumsorientiertes Testen Aus psychologischen Test ergibt sich in der Regel ein numerisches Testergebnis, das Auskunft über die Merkmalsausprägung der Testperson geben soll. Die aus der Testauswertung

Mehr

Analyse bivariater Kontingenztafeln

Analyse bivariater Kontingenztafeln Analyse bivariater Kontingenztafeln Werden zwei kategoriale Merkmale mit nicht zu vielen möglichen Ausprägungen gemeinsam analysiert, so kommen zur Beschreibung der gemeinsamen Verteilung im allgemeinen

Mehr

1 Einleitung. 1.1 Unser Ziel

1 Einleitung. 1.1 Unser Ziel 1 Dieses Buch wendet sich an alle, die sich für agile Softwareentwicklung interessieren. Einleitend möchten wir unser mit diesem Buch verbundenes Ziel, unseren Erfahrungshintergrund, das dem Buch zugrunde

Mehr

Einführung in SPSS. 1. Die Datei Seegräser

Einführung in SPSS. 1. Die Datei Seegräser Einführung in SPSS 1. Die Datei Seegräser An 25 verschiedenen Probestellen wurde jeweils die Anzahl der Seegräser pro m 2 gezählt und das Vorhandensein von Seeigeln vermerkt. 2. Programmaufbau Die wichtigsten

Mehr

TECHNISCHE UNIVERSITÄT DRESDEN Fakultät Wirtschaftswissenschaften Prof. Dr. W. Esswein Lehrstuhl Wirtschaftsinformatik, insbesondere Systementwicklung

TECHNISCHE UNIVERSITÄT DRESDEN Fakultät Wirtschaftswissenschaften Prof. Dr. W. Esswein Lehrstuhl Wirtschaftsinformatik, insbesondere Systementwicklung TECHNISCHE UNIVERSITÄT DRESDEN Fakultät Wirtschaftswissenschaften Prof. Dr. W. Esswein Lehrstuhl Wirtschaftsinformatik, insbesondere Systementwicklung Diplomprüfung Wintersemester 2010-2011 im Fach Wirtschaftsinformatik,

Mehr

Statistik I für Wirtschaftswissenschaftler Klausur am 06.07.2007, 14.00 16.00.

Statistik I für Wirtschaftswissenschaftler Klausur am 06.07.2007, 14.00 16.00. 1 Statistik I für Wirtschaftswissenschaftler Klausur am 06.07.2007, 14.00 16.00. Bitte unbedingt beachten: a) Gewertet werden alle 9 gestellten Aufgaben. b) Lösungswege sind anzugeben. Die Angabe des Endergebnisses

Mehr

Die Quantitative und Qualitative Sozialforschung unterscheiden sich bei signifikanten Punkten wie das Forschungsverständnis, der Ausgangspunkt oder

Die Quantitative und Qualitative Sozialforschung unterscheiden sich bei signifikanten Punkten wie das Forschungsverständnis, der Ausgangspunkt oder 1 2 3 Die Quantitative und Qualitative Sozialforschung unterscheiden sich bei signifikanten Punkten wie das Forschungsverständnis, der Ausgangspunkt oder die Forschungsziele. Ein erstes Unterscheidungsmerkmal

Mehr

Anleitung zum Applet Schiefer Wurf

Anleitung zum Applet Schiefer Wurf Anleitung zum Applet: Schiefer Wurf 1 Anleitung zum Applet Schiefer Wurf Bearbeitung von: Mathias Hartner SS 2009 Studiengang: Elektronik und Informationstechnik Betreuung durch: Prof. Dr. Wilhelm Kleppmann

Mehr

Erfahrungen und Erwartungen zum Einsatz von E-Learning in der universitären Lehre

Erfahrungen und Erwartungen zum Einsatz von E-Learning in der universitären Lehre Erfahrungen und Erwartungen zum Einsatz von E-Learning in der universitären Lehre Ergebnisse einer Kurzumfrage unter Studierenden im Fach Politikwissenschaft Bericht: Ingo Henneberg März 2015 Albert-Ludwigs-Universität

Mehr

Modul G.1 WS 07/08: Statistik 17.01.2008 1. Die Korrelation ist ein standardisiertes Maß für den linearen Zusammenhangzwischen zwei Variablen.

Modul G.1 WS 07/08: Statistik 17.01.2008 1. Die Korrelation ist ein standardisiertes Maß für den linearen Zusammenhangzwischen zwei Variablen. Modul G.1 WS 07/08: Statistik 17.01.2008 1 Wiederholung Kovarianz und Korrelation Kovarianz = Maß für den linearen Zusammenhang zwischen zwei Variablen x und y Korrelation Die Korrelation ist ein standardisiertes

Mehr

Service & Support. Wie kann der Rücktransfer von Projekten eines Bediengerätes durchgeführt werden und was ist dabei zu beachten? SIMATIC Bediengeräte

Service & Support. Wie kann der Rücktransfer von Projekten eines Bediengerätes durchgeführt werden und was ist dabei zu beachten? SIMATIC Bediengeräte Wie kann der Rücktransfer von Projekten eines Bediengerätes durchgeführt werden und was ist dabei zu beachten? SIMATIC Bediengeräte FAQ August 2008 Service & Support Answers for industry. Fragestellung

Mehr

Monte Carlo Simulation (Grundlagen)

Monte Carlo Simulation (Grundlagen) Der Titel des vorliegenden Beitrages wird bei den meisten Lesern vermutlich Assoziationen mit Roulette oder Black Jack hervorrufen. Allerdings haben das heutige Thema und die Spieltische nur den Namen

Mehr

Stichprobenauslegung. für stetige und binäre Datentypen

Stichprobenauslegung. für stetige und binäre Datentypen Stichprobenauslegung für stetige und binäre Datentypen Roadmap zu Stichproben Hypothese über das interessierende Merkmal aufstellen Stichprobe entnehmen Beobachtete Messwerte abbilden Schluss von der Beobachtung

Mehr

Schätzung des Lifetime Values von Spendern mit Hilfe der Überlebensanalyse

Schätzung des Lifetime Values von Spendern mit Hilfe der Überlebensanalyse Schätzung Lifetime Values von Spenn mit Hilfe Überlebensanalyse Einführung in das Verfahren am Beispiel Einzugsgenehmigung Überlebensanalysen o Ereignisdatenanalysen behandeln das Problem, mit welcher

Mehr

Standardisierte kompetenzorientierte schriftliche Reifeprüfung. Mathematik. Probeklausur März 2014. Teil-1-Aufgaben

Standardisierte kompetenzorientierte schriftliche Reifeprüfung. Mathematik. Probeklausur März 2014. Teil-1-Aufgaben Standardisierte kompetenzorientierte schriftliche Reifeprüfung Mathematik Probeklausur März 2014 Teil-1-Aufgaben Beurteilung Jede Aufgabe in Teil 1 wird mit 0 oder 1 Punkt bewertet, jede Teilaufgabe in

Mehr

1.4 Portfolio-Analyse (Marktwachstums-Marktanteils-Portfolio)

1.4 Portfolio-Analyse (Marktwachstums-Marktanteils-Portfolio) FACHHOCHSCHULE LAUSITZ Prof. Dr.-Ing. M. Strunz Lehrgebiet Projektmanagement Übungsskript l 1.4 Portfolio-Analyse (Marktwachstums-Marktanteils-Portfolio) Zu den bekanntesten Instrumenten des strategischen

Mehr

Natur und Technik. Lernstandserhebung zu den Schwerpunkten Biologie, Naturwissenschaftliches Arbeiten, Informatik. Datum:

Natur und Technik. Lernstandserhebung zu den Schwerpunkten Biologie, Naturwissenschaftliches Arbeiten, Informatik. Datum: Name: Natur und Technik Lernstandserhebung zu den Schwerpunkten Biologie, Naturwissenschaftliches Arbeiten, Informatik Datum: Klasse: 1 Das entscheidende Kennzeichen aller Lebewesen ist ihr Aufbau aus

Mehr

Eine computergestützte Einführung mit

Eine computergestützte Einführung mit Thomas Cleff Deskriptive Statistik und Explorative Datenanalyse Eine computergestützte Einführung mit Excel, SPSS und STATA 3., überarbeitete und erweiterte Auflage ^ Springer Inhaltsverzeichnis 1 Statistik

Mehr

Lineare Modelle in R: Einweg-Varianzanalyse

Lineare Modelle in R: Einweg-Varianzanalyse Lineare Modelle in R: Einweg-Varianzanalyse Achim Zeileis 2009-02-20 1 Datenaufbereitung Wie schon in der Vorlesung wollen wir hier zur Illustration der Einweg-Analyse die logarithmierten Ausgaben der

Mehr

Webergänzung zu Kapitel 10

Webergänzung zu Kapitel 10 Webergänzung zu Kapitel 10 10.1.4 Varianzanalyse (ANOVA: analysis of variance) Im Kapitel 10 haben wir uns hauptsächlich mit Forschungsbeispielen beschäftigt, die nur zwei Ergebnissätze hatten (entweder

Mehr

Statistische Software P. Fink. Statistische Software (R) Wiederholungshausübung SoSe 2015

Statistische Software P. Fink. Statistische Software (R) Wiederholungshausübung SoSe 2015 Allgmeine Hinweise Die Hausübung umfasst 7 Aufgaben mit insgesamt 120 Punkten. Erstellen Sie eine R Skript-Datei mit Ihrer Matrikelnummer als Dateinamen. Diese Datei enthält Ihren vollständigen und mit

Mehr

Alltagskompetenz im Test Umfrage an Berliner Schüler

Alltagskompetenz im Test Umfrage an Berliner Schüler Berlin, 14. März 2006 Weltverbrauchertag 2006: Fragebogen zur Verbraucherbildung Alltagskompetenz im Test Umfrage an Berliner Schüler Der Hintergrund Anlass für die Erhebung ist der Weltverbrauchertag

Mehr

ICF und Förderdiagnostik Worum geht es da? Chris Piller & Markus Born Hochschule für Heilpädagogik Zürich in Zusammenarbeit mit der AHS Eupen

ICF und Förderdiagnostik Worum geht es da? Chris Piller & Markus Born Hochschule für Heilpädagogik Zürich in Zusammenarbeit mit der AHS Eupen ICF und Förderdiagnostik Worum geht es da? Chris Piller & Markus Born Hochschule für Heilpädagogik Zürich in Zusammenarbeit mit der AHS Eupen wir starten mit einem kurzen Film Aufgabe: Betrachten Sie den

Mehr

Methoden der empirischen Sozialforschung (Grundlagen) Reinecke, Jost, Prof. Dr.

Methoden der empirischen Sozialforschung (Grundlagen) Reinecke, Jost, Prof. Dr. Universität Bielefeld Modul: Fakultät für Soziologie Methoden der empirischen Sozialforschung (Grundlagen) Modulschlüssel: 30-M2 Modulbeauftragte/r: Bergmann, Jörg R., Prof. Dr. Reinecke, Jost, Prof. Dr.

Mehr

Seite 1 von 2. Teil Theorie Praxis S Punkte 80+25 120+73 200+98 erreicht

Seite 1 von 2. Teil Theorie Praxis S Punkte 80+25 120+73 200+98 erreicht Seite 1 von 2 Ostfalia Hochschule Fakultät Elektrotechnik Wolfenbüttel Prof. Dr.-Ing. T. Harriehausen Bearbeitungszeit: Theoretischer Teil: 60 Minuten Praktischer Teil: 60 Minuten Klausur FEM für elektromagnetische

Mehr

Wolfgang Trutschnig. Salzburg, 2014-05-08. FB Mathematik Universität Salzburg www.trutschnig.net

Wolfgang Trutschnig. Salzburg, 2014-05-08. FB Mathematik Universität Salzburg www.trutschnig.net Auffrischungskurs Angewandte Statistik/Datenanalyse (Interne Weiterbildung FOR SS14-08) Block 1: Deskriptive Statistik, Wiederholung grundlegender Konzepte, R FB Mathematik Universität Salzburg www.trutschnig.net

Mehr

Methoden der empirischen Sozialforschung I

Methoden der empirischen Sozialforschung I Methoden der empirischen Sozialforschung I Annelies Blom, PhD TU Kaiserslautern Wintersemester 2011/12 Übersicht Quantitative Datenauswertung: deskriptive und induktive Statistik Wiederholung: Die wichtigsten

Mehr

Ergebnisse der Evaluation: Wintersemester 2012/13. Dipl.Psych. Elisabeth Oberhauser und Evaluationsteam

Ergebnisse der Evaluation: Wintersemester 2012/13. Dipl.Psych. Elisabeth Oberhauser und Evaluationsteam Ergebnisse der Evaluation: Wintersemester 2012/13 Dipl.Psych. Elisabeth Oberhauser und Evaluationsteam Ziele: Befragung der Humboldt reloaded- TeilnehmerInnen im Wintersemester 2012/13 Abklären der Erwartungen

Mehr

Management Soft Diligence MSD

Management Soft Diligence MSD Management Soft Diligence MSD März 2011 MSD l März 2011 ChangeCorporation 2011 1 Ein Großteil des Unternehmenserfolgs ist abhängig von den Personen im Management Sie planen ein Unternehmen zu kaufen, zu

Mehr

Risiko und Symmetrie. Prof. Dr. Andrea Wirth

Risiko und Symmetrie. Prof. Dr. Andrea Wirth Risiko und Symmetrie Prof. Dr. Andrea Wirth Gliederung 1. Einleitung Was ist eigentlich Risiko? 2. Risiko Mathematische Grundlagen 3. Anwendungsbeispiele Wo genau liegt der Schmerz des Risikos? 4. Sie

Mehr

Kapiteltests zum Leitprogramm Binäre Suchbäume

Kapiteltests zum Leitprogramm Binäre Suchbäume Kapiteltests zum Leitprogramm Binäre Suchbäume Björn Steffen Timur Erdag überarbeitet von Christina Class Binäre Suchbäume Kapiteltests für das ETH-Leitprogramm Adressaten und Institutionen Das Leitprogramm

Mehr

Netmapping. Vernetztes Denken und Handeln: Zusammenfassung der elearning-software. auf www.netmap.ch

Netmapping. Vernetztes Denken und Handeln: Zusammenfassung der elearning-software. auf www.netmap.ch Netmapping Vernetztes Denken und Handeln: Zusammenfassung der elearning-software auf Inhaltsverzeichnis 1 Ziele der Software und dieser Dokumentation... 3 1.1 Idee der Software... 3 1.2 Inhalt dieser Dokumentation...

Mehr

ERGEBNISBERICHT DER LEHRVERANSTALTUNGS- EVALUATION. Software aus Komponenten. Wintersemester 2005/2006 Dozent/Dozentin: Gräbe

ERGEBNISBERICHT DER LEHRVERANSTALTUNGS- EVALUATION. Software aus Komponenten. Wintersemester 2005/2006 Dozent/Dozentin: Gräbe ERGEBNISBERICHT DER LEHRVERANSTALTUNGS- EVALUATION Software aus Komponenten Wintersemester 2005/2006 Dozent/Dozentin: Gräbe 1. Allgemeine Veranstaltungsinformationen Veranstaltungskennung: Studienfach:

Mehr

BMV Visionen 2020. Ergebnisbericht der Mitglieder Befragung

BMV Visionen 2020. Ergebnisbericht der Mitglieder Befragung BMV Visionen 22 Ergebnisbericht der Mitglieder Befragung Die Mitglieder Befragung wurde im Rahmen des Projekts Visionen 22 des Steirischen Blasmusikverbandes (BMV) mithilfe eines Fragebogens durchgeführt.

Mehr

Gibt es verschiedene Arten unendlich? Dieter Wolke

Gibt es verschiedene Arten unendlich? Dieter Wolke Gibt es verschiedene Arten unendlich? Dieter Wolke 1 Zuerst zum Gebrauch des Wortes unendlich Es wird in der Mathematik in zwei unterschiedlichen Bedeutungen benutzt Erstens im Zusammenhang mit Funktionen

Mehr

Situation im Masterbereich im Wintersemester 2013/2014. (Beschluss der Kultusministerkonferenz vom 08.05.2014)

Situation im Masterbereich im Wintersemester 2013/2014. (Beschluss der Kultusministerkonferenz vom 08.05.2014) STÄNDIGE KONFERENZ DER KULTUSMINISTER DER LÄNDER IN DER BUNDESREPUBLIK DEUTSCHLAND Situation im Masterbereich im Wintersemester 2013/2014 (Beschluss der Kultusministerkonferenz vom 08.05.2014) Seite 2

Mehr

Schriftliche Abiturprüfung Leistungskursfach Mathematik

Schriftliche Abiturprüfung Leistungskursfach Mathematik Sächsisches Staatsministerium für Kultus Schuljahr 2000/01 Geltungsbereich: - Allgemein bildendes Gymnasium - Abendgymnasium und Kolleg - Schulfremde Prüfungsteilnehmer Schriftliche Abiturprüfung Leistungskursfach

Mehr

Prüfung einer mehrstufigen Datenmigration ein Fall aus der Praxis

Prüfung einer mehrstufigen Datenmigration ein Fall aus der Praxis Prüfung einer mehrstufigen Datenmigration ein Fall aus der Praxis Peter Steuri Partner / Leiter IT-Prüfung und -Beratung BDO AG, Solothurn Ausgangslage / Zielsetzungen Ausgangslage Sehr grosses, global

Mehr

Kapitel 7: Varianzanalyse mit Messwiederholung

Kapitel 7: Varianzanalyse mit Messwiederholung Kapitel 7: Varianzanalyse mit Messwiederholung Durchführung einer einfaktoriellen Varianzanalyse mit Messwiederholung 1 Durchführung einer zweifaktoriellen Varianzanalyse mit Messwiederholung auf einem

Mehr

0 Einführung: Was ist Statistik

0 Einführung: Was ist Statistik 0 Einführung: Was ist Statistik 1 Datenerhebung und Messung Die Messung Skalenniveaus 2 Univariate deskriptive Statistik 3 Multivariate Statistik 4 Regression 5 Ergänzungen Grundbegriffe Statistische Einheit,

Mehr

Vorlesung. Funktionen/Abbildungen 1

Vorlesung. Funktionen/Abbildungen 1 Vorlesung Funktionen/Abbildungen 1 1 Grundlagen Hinweis: In dieser Vorlesung werden Funktionen und Abbildungen synonym verwendet. In der Schule wird eine Funktion häufig als eindeutige Zuordnung definiert.

Mehr

Welch-Test. Welch-Test

Welch-Test. Welch-Test Welch-Test Welch-Test Test auf Lageunterschied zweier normalverteilter Grundgesamtheiten mit unbekannten Varianzen durch Vergleich der Mittelwerte zweier unabhängiger Zufallsstichproben. Beispiel Im Labor

Mehr

Tabelle 6a: Deskriptive Statistiken der metrischen Variablen

Tabelle 6a: Deskriptive Statistiken der metrischen Variablen Ergebnisse 77 5 Ergebnisse Das folgende Kapitel widmet sich der statistischen Auswertung der Daten zur Ü- berprüfung der Hypothesen. Die hier verwendeten Daten wurden mit den in 4.3 beschriebenen Instrumenten

Mehr

12. Vergleich mehrerer Stichproben

12. Vergleich mehrerer Stichproben 12. Vergleich mehrerer Stichproben Dr. Antje Kiesel Institut für Angewandte Mathematik WS 2011/2012 Häufig wollen wir verschiedene Populationen, Verfahren, usw. miteinander vergleichen. Beipiel: Vergleich

Mehr

Seminar: Angewandte Methoden der empirischen Bildungsforschung. Sommersemester 2012, Dozenten: Patrick Schaar, Tom Schröter

Seminar: Angewandte Methoden der empirischen Bildungsforschung. Sommersemester 2012, Dozenten: Patrick Schaar, Tom Schröter Seminar: Angewandte Methoden der empirischen Bildungsforschung Sommersemester 2012, Dozenten: Patrick Schaar, Tom Schröter Fahrplan für Heute: - Termine - Ablauf - Themen und Inhalte - Aufgaben im Seminar

Mehr

Operatorenkatalog für die schriftliche Abiturprüfung im Fach Deutsch in Baden-Württemberg

Operatorenkatalog für die schriftliche Abiturprüfung im Fach Deutsch in Baden-Württemberg Operatorenkatalog für die schriftliche Abiturprüfung im Fach Deutsch in Baden-Württemberg I. Allgemeine Hinweise Die schriftliche Abiturprüfung im Fach Deutsch soll die erworbenen Kompetenzen der Schülerinnen

Mehr

Institut für Soziologie. Methoden 2. Regressionsanalyse I: Einfache lineare Regression

Institut für Soziologie. Methoden 2. Regressionsanalyse I: Einfache lineare Regression Institut für Soziologie Methoden 2 Regressionsanalyse I: Einfache lineare Regression Programm Anwendungsbereich Vorgehensweise Interpretation Annahmen Zusammenfassung Übungsaufgabe Literatur # 2 Anwendungsbereich

Mehr

Umsetzung von DEA in Excel

Umsetzung von DEA in Excel Umsetzung von DEA in Excel Thorsten Poddig Armin Varmaz 30. November 2005 1 Vorbemerkungen In diesem Dokument, das als Begleitmaterial zum in der Zeitschrift,,Controlling, Heft 10, 2005 veröffentlichten

Mehr

Datenanalyse mit SPSS spezifische Analysen

Datenanalyse mit SPSS spezifische Analysen Datenanalyse mit SPSS spezifische Analysen Arnd Florack Tel.: 0251 / 83-34788 E-Mail: florack@psy.uni-muenster.de Raum 2.015 Sprechstunde: Dienstags 15-16 Uhr 25. Mai 2001 2 Auswertung von Häufigkeitsdaten

Mehr

9 Resümee. Resümee 216

9 Resümee. Resümee 216 Resümee 216 9 Resümee In der vorliegenden Arbeit werden verschiedene Methoden der Datenreduktion auf ihre Leistungsfähigkeit im sozialwissenschaftlichstatistischen Umfeld anhand eines konkreten Anwendungsfalls

Mehr

14.03.08. Name: Ternes Vorname: Daniel Adresse: Am Spitzberg 42 56075 Koblenz- Karthause

14.03.08. Name: Ternes Vorname: Daniel Adresse: Am Spitzberg 42 56075 Koblenz- Karthause .. Name: Ternes Vorname: Daniel Adresse: Am Spitzberg Koblenz- Karthause Ist es nicht schön mit seinen Freunden im Internet zu chatten, Spiele am PC zu spielen oder sich Videos im Internet anzuschauen?

Mehr

AUSLANDSERFAHRUNGEN UND MOBILITÄTSBEREITSCHAFT VON SCHULABSOLVENT/INNEN DER SEKUNDARSTUFE II

AUSLANDSERFAHRUNGEN UND MOBILITÄTSBEREITSCHAFT VON SCHULABSOLVENT/INNEN DER SEKUNDARSTUFE II KURT SCHMID AUSLANDSERFAHRUNGEN UND MOBILITÄTSBEREITSCHAFT VON SCHULABSOLVENT/INNEN DER SEKUNDARSTUFE II Aufgrund zunehmender internationaler wirtschaftlicher Verflechtungen und Aktivitäten (Stichwort

Mehr