Streudiagramme und Korrelation

Größe: px
Ab Seite anzeigen:

Download "Streudiagramme und Korrelation"

Transkript

1 Streudiagramme und Korrelation Worum geht es in diesem Modul? Streudiagramme Vier-Quadranten-Schema Kovarianz Korrelationskoeffizient Scheinkorrelation Rangkorrelation Worum geht es in diesem Modul? Bisher haben wir den Zusammenhang von bivariaten, nominal skalierten Daten über Kontingenztafeln betrachtet und anhand des Phi-Koeffizienten beurteilt. Wenn uns kardinal skalierte Werte vorliegen, können wir bivariate Daten grafisch im sogenannten Streudiagramm darstellen. Das Streudiagramm vermittelt uns einen ersten Eindruck über den Zusammenhang der dargestellten Merkmale. Ferner lernen wir für kardinal skalierte Merkmale zwei weitere Zusammenhangsmaße kennen: den Korrelationskoeffizienten und den Rangkorrelationskoeffizienten. Die Basis für beide ist die Kovarianz, die zuerst vorgestellt wird. Streudiagramme Streudiagramm für bivariate Daten In verschiedenen US-Magazinen wurden Werbeanzeigen hinsichtlich ihrer Lesbarkeit ausgewertet. Unter anderem wurden die Anzahlen von Sätzen und Wörtern ausgezählt. Lange Sätze sind schwerer zu lesen als kurze; viele Wörter bedeuten einen langen und eher anspruchsvollen Anzeigetext. Es liegt auf der Hand, dass beide Variablen zusammenhängen. Allerdings ist nicht von vornherein klar, in welcher Weise sie das tun. Sind bei einem bivariaten Datensatz die beobachteten Variablen und wie in der eben angesprochenen Situation kardinal skaliert und sind ihre Werte größtenteils verschieden, so erfolgt die grafische Darstellung am geeignetsten in einem Streudiagramm. Ein Streudiagramm für bivariate Daten besteht aus einem zweidimensionalen Page 1

2 Koordinatensystem, in das die Ausprägungspaare als Punkte eingezeichnet werden. Die Wertepaare im Koordinatenkreuz bilden eine Punktwolke, aus der erste Hinweise auf Zusammenhänge zwischen den beiden Merkmalen ablesbar sind. Link zur Erstellung eines Streudiagramms im Labor ( a24.spf )! Im Streudiagramm zu den Sätzen und Wörtern in Werbeanzeigen zeigt sich ein plausibler Zusammenhang: Mit der Anzahl der Sätze steigt die Anzahl der Wörter. Die genauere Betrachtung zeigt aber, dass diese Tendenz nur für einen Teil der Daten gilt. Wenn die Anzahl der Sätze eine gewisse Grenze erreicht haben, steigt die Anzahl der Wörter nicht weiter an. Die Sätze sind dann offensichtlich kürzer gehalten, um die Lesbarkeit nicht zu gefährden. Streudiagramme für dreidimensionale Datensätze Liegen mehr als zwei kardinal skalierte Variablen vor, so ist eine einfache grafische Darstellung nicht mehr ohne weiteres möglich. Haben zwei der Variablen viele verschiedene Werte und spielt die dritte eher die Rolle einer Gruppierungsvariablen, so lässt sich eine Berücksichtigung der dritten Variablen etwa über eine Einfärbung erreichen. Bei den Werbeanzeigen der US-amerikanischen Magazine wurde eine Klassifikation in drei Gruppen vorgenommen, entsprechend dem Bildungsanspruch der Magazine. Werden die Punkte entsprechend unterschiedlich eingefärbt, so erhalten wir das folgende Streudiagramm. Hier sind die Magazine mit dem höchsten Anspruchsniveau rot, die mit mittlerem blau und die restlichen schwarz markiert. Wie zu sehen ist, überlappen sich die drei Magazin-Gruppen bzgl. der untersuchten Merkmale von Werbeanzeigen stark. Lesbarkeit von Werbeanzeigen Quelle: eigene Berechnungen Bei drei Variablen, bei denen alle im wesentlichen unterschiedliche Werte aufweisen, kann noch ein dreidimensionales Streudiagramm erstellt werden. Hier ist aber die Möglichkeit wesentlich, dieses zu drehen, damit verschiedene Perspektiven ermöglicht werden. Sonst wäre der Eindruck ungenügend. Dies kann mit dem Applet Dreidimensionales Streudiagramm (a35.jar) ausprobiert werden. Streudiagramme für höherdimensionale Datensätze Bei mehr als drei Dimensionen ist eine direkte Darstellung nicht mehr möglich. Als Ersatz können wir auf die grafische Darstellung von je zwei Merkmalen zurückgreifen. Für jede Kombination von zwei Variablen werden somit Streudiagramme gezeichnet. Die bivariaten Streudiagramme werden dazu in einem rechteckigen Schema angeordnet, so dass jedes Merkmal einmal in der Zeile und einmal in der Spalte vorkommt. Die Merkmale der Zeilen werden auf der Abszisse (x-achse) und die der Spalten auf der Ordinate (y-achse) abgetragen. Sie unterscheiden sich in der Zuordnung der beiden Achsen. Diese Form der Darstellung ist unter dem Namen Streudiagramm-Matrix bekannt. Im Beispiel "Ausgaben für den täglichen Bedarf" ist eine solche Streudiagramm-Matrix abgebildet. Allerdings können wir hier Zusammenhänge, die aus dem Zusammenspiel von mehr als zwei Merkmalen resultieren, nicht mehr erkennen. Page 2

3 Beispiel: Ausgaben für den täglichen Bedarf Bei 20 Haushalten wurden die monatlichen Ausgaben ermittelt für V1= Wohnung, einschl. Heizung und Elektrizität V2=Lebensmittel, einschl. Alkohol und Tabak, V3=Anderes, einschl. Kleidung und langlebige Verbrauchsgüter V4=Dienstleistungen, einschl. Verkehrsmittel und Unterhalt eines Fahrzeuges Dieser vierdimensionale Datensatz führt zur folgenden Streudiagramm-Matrix: Streudiagrammmatrix Quelle: Eigene Berechnungen An den Streudiagrammen ist beispielsweise zu erkennen, dass die Ausgaben für "Anderes, einschl. Kleidung und langlebige Verbrauchsgüter" und " Dienstleistungen" eine gemeinsame Tendenz zeigen. Ist also Geld übrig, so wird es nicht nur für eine Ausgabenart verwendet. Andererseits zeigen die Ausgaben für "Lebensmittel" und "Anderes" keinen offensichtlichen Zusammenhang: Bei geringen Ausgaben für "Anderes" gibt es niedrige und hohe Ausgaben für Lebensmittel. Für die amerikanischen Präsidenten und ihre wichtigsten Mitbewerber wurden die Körpergrößen ermittelt. Wie hängen Körpergröße und Gewinn der Wahlen zusammen? Einen ersten Ansatz zur Beantwortung dieser Frage bietet die Darstellung der Daten in einem Streudiagramm. Labordatei öffnen ( a6f.zmpf ) Vier-Quadranten-Schema Werbeanzeigen Bei den Werbeanzeigen ist im Streudiagramm zu sehen, dass die Anzahlen von Wörtern und Sätzen eine gleichgerichtete Tendenz aufweisen. Wir wollen diesen bildlichen Eindruck präzisieren. Dazu werden in das Streudiagramm zusätzlich Parallelen zu den Achsen durch die arithmetischen Mittel der betrachteten Merkmale eingezeichnet. Der Schnittpunkt dieser beiden Geraden mit den Koordinaten ist der Schwerpunkt der bivariaten Verteilung. Dies ist die Verallgemeinerung der für bivariate Daten. Die so entstandenen vier Teilbereiche werden gegen den Uhrzeigersinn - rechts oben beginnend - als I. bis IV. Quadrant bezeichnet. Satz/Wort/ mit Hilfslinien Quelle: Eigene Berechnungen Wir können anhand der Hilfslinien feststellen, dass der überwiegende Teil der Punkte im ersten und dritten Quadranten liegt. Dies ist offensichtlich Ausdruck der "gleichgerichteten Tendenz". Allgemeine Beurteilung Allgemein gilt: Liegen die Punkte des Streudiagramms hauptsächlich im - I. + III. Quadranten, so deutet dies auf einen positiven Zusammenhang zwischen den Merkmalen hin; mit steigenden Werten von steigen auch die Werte von. Page 3

4 - II. + IV. Quadranten, so deutet dies auf einen negativen Zusammenhang zwischen den Merkmalen hin; mit steigenden Werten von fallen die Werte von. - Verteilen sich die Punkte mehr oder weniger gleichmäßig auf alle vier Quadranten, deutet das daraufhin, dass kein Zusammenhang zwischen den Merkmalen besteht. Die Punktewolke hat eine diffuse Gestalt. Strukturen im Vier-Quadranten Schema Quelle: Statistik interaktiv! Kovarianz Bestimmung der Kovarianz Das Vier-Quadranten-Schema führt auf die Kovarianz als Zusammenhangsmaß zweier Merkmale. Dies wird in der : Flashanimation ' Animation Kovarianz ' siehe Online-Version dargestellt. Die Kovarianz basiert auf demselben Prinzip wie die. Diese baut auf den quadrierten Abweichungen einzelner Daten vom Schwerpunkt des Datensatzes, dem arithmetischen Mittel, auf. Bei der Kovarianz werden die Abstände der Beobachtungspaare von den zugehörigen arithmetischen Mitteln genommen. Weiter treten die Produkte der Abweichungen an die Stelle der Abweichungsquadrate. Anschließend werden die Ergebnisse aller Ausprägungspaare addiert und durch geteilt: Bedingung für die Berechnung ist, dass beide Merkmale ein kardinales Skalenniveau haben. Interpretation der Kovarianz Die Kovarianz wird durch das Vier-Quadranten-Schema verdeutlicht: Es besteht: - ein positiver Zusammenhang, wenn die Punkte hauptsächlich im I. und III. Quadranten liegen; dann ist. - ein negativer Zusammenhang, wenn die Punkte hauptsächlich im II. und IV. Quadranten liegen; dann ist. - kein Zusammenhang, wenn die Punkte etwa gleichmäßig in allen vier Quadranten liegen; dann gilt. Umgekehrt kann man aus nicht schließen, dass zwischen den Merkmalen kein Zusammenhang besteht. Einmal hängt der Betrag der Kovarianz stark von der jeweiligen Skalierung der Merkmale ab; zum anderen gibt es Zusammenhänge zwischen zwei Merkmalen, die sich nicht unbedingt durch die Kovarianz erfassen lassen. Eigenschaften der Kovarianz Die Kovarianz hängt wesentlich von der Maßeinheit der Variablen ab. Der Wert der Kovarianz für den Zusammenhang zwischen Gewicht und Körpergröße wird um das 100fache größer, wenn die Körpergröße statt in Metern in Zentimetern angegeben wird! Denn der Wechsel der Maßeinheit von Meter zu Zentimeter bedeutet, dass die Werte mit 100 multipliziert werden. Dies führt auch zu der entsprechenden Vergrößerung der Kovarianz: Page 4

5 Entsprechend gilt auch Verschiebungen wirken sich dagegen nicht auf die Kovarianz aus:. Beispiel: Besuch des Acadia National Park, Maine Ein Wanderer möchte in der Zeit zwischen April und September den schönen Acadia-Nationalpark in Maine, USA, besuchen. Zur Vorbereitung sucht er sich eine Klimatabelle, damit er die richtige Ausstattung einpacken kann. Monat Temperatur durchschnittl. Höchstwert ( F) Temperatur durchschnittl. Durchschnittl. Tiefstwert ( F) Niederschlag (inch) APRIL MAI JUNI JULI AUGUST SEPTEMBER Der Zusammenhang zwischen der Temperatur und der Niederschlagshöhe wird durch die Kovarianz bestimmt. Bezeichnen wir die Variablen mit = Durchschnittl. Höchstwert, = Durchschnittl. Tiefstwert und = Durchschnittl. Niederschlag, so stellt sich der Zusammenhang folgendermaßen dar: Die Temperaturangaben sind in Fahrenheit. Sie sind in unsere gewohnten Grad Celsius zu konvertieren. 32 F entspricht dem Gefrierpunkt des Wassers, 212 F dem Siedepunkt. Die benötigte Transformation lautet daher: Die Niederschlagshöhe ist in Inch angegeben. Die Umrechnung hat in Millimeter zu erfolgen. Da 1 Inch 25.4 mm entsprechen, sind die Angaben mit 25.4 zu multiplizieren. Die Umrechnungen ergeben also: Monat Temperatur durchschnittl. Höchstwert ( C) Temperatur durchschnittl. Durchschnittl. Tiefstwert ( C) Niederschlag (mm) APRIL MAI JUNI Page 5

6 JULI AUGUST SEPTEMBER Für den Zusammenhang erhalten wir: In der Tendenz werden den Wanderer entweder eine höhere Temperatur mit weniger Regen oder eine niedrigere Temperatur mit mehr Regen erwarten. Zur Berechnung der Kovarianz im Labor: Labordatei öffnen ( c3c.spf ) Beispiel: Quadratischer Zusammenhang In der angegebenen Tabelle gilt. Damit herrscht zwischen den beiden Variablen und eine perfekte Beziehung. Dennoch ist die Kovarianz null: Die Beziehung ist nichtlinear. Korrelationskoeffizient Definition des Korrelationskoeffizienten Die dargestellte Abhängigkeit von der Maßeinheit der Merkmale ist der wesentliche Grund, dass die Kovarianz nur begrenzte Aussagekraft über die Stärke eines Zusammenhangs zwischen den Merkmalen hat. Dies wird bei dem Korrelationskoeffizienten vermieden. Das wird erreicht, indem die Kovarianz der standardisierten Beobachtungen bestimmt wird. Äquivalent dazu ist es, durch das Produkt der Standardabweichungen und zu dividieren: Der Korrelationskoeffizient hat keine Einheit wie "Kilogramm oder "Meter ; er ist dimensionslos. Sein Wert liegt immer zwischen -1 und 1, weil die Kovarianz (Zähler) betragsmäßig nie größer sein kann als das Produkt der Standardabweichungen (Nenner). Da die Standardabweichungen immer größer Null sind, wird das Vorzeichen des Korrelationskoeffizienten stets durch das Vorzeichen der Kovarianz bestimmt. Interpretation des Korrelationskoeffizienten Page 6

7 Der Korrelationskoeffizient ist ein Maß für die Stärke eines linearen Zusammenhangs zwischen zwei Merkmalen. Denn genau dann gilt, wenn alle Punkte im Streudiagramm exakt auf einer Geraden liegen. Das Vorzeichen des Korrelationskoeffizienten bestimmt die Richtung, sein Betrag die Stärke des linearen Zusammenhangs: Ist das Vorzeichen positiv, ist auch der Zusammenhang positiv; ist es negativ, ist der Zusammenhang negativ. Für den Betrag des Koeffizienten gilt folgende Interpretationsrichtlinie: Interpretation 0 kein linearer Zusammenhang schwach linearer Zusammenhang mittlerer linearer Zusammenhang stark linearer Zusammenhang 1 perfekt linearer Zusammenhang Der Phi-Koeffizient Der ist ein Zusammenhangsmaß für nominal skalierte Merkmale. Er ist natürlich auch sinnvoll für ordinal skalierte oder metrisch skalierte Merkmale, sofern sie nur wenige unterschiedliche Realisationen aufweisen. Wenn die Merkmale lediglich zwei Ausprägungen aufweisen, ist er mit dem quadrierten Korrelationskoeffizienten identisch. Beispiel: Besuch des Acadia National Park, Maine (Fortsetzung) Der Wanderer, der in der Zeit April bis September den Park besuchen möchte, hat eine gegenläufige Tendenz von Temperatur und Niederschlag zu erwarten. Die Stärke dieser "Gegenläufigkeit" beträgt: Das ist ein schwacher bis mittlerer linearer Zusammenhang; dabei ist es egal, ob die Korrelationen aus den ursprünglichen oder den transformierten Daten berechnet werden. Labordatei öffnen ( cd9.spf ) Erzeugen Sie in dem Applet Korrelationsmessung (ce0.jar) einige Streudiagramme mit mindestens 10 Punkten, so dass die Korrelationen jeweils Page 7

8 ungefähr-1, -0.5, 0, 0.5 und 1 betragen. Trainieren Sie mit dem Applet Raten von Korrelationen (cf5.jar) Ihre Fähigkeit, anhand von Streudiagrammen die Stärke der Korrelation zweier Variablen einzuschätzen! Scheinkorrelation Bei der Interpretation des Korrelationskoeffizienten ist immer zu berücksichtigen, dass es sich um eine formal berechnete Größe handelt. So lässt sich aus einem großen Wert des Korrelationskoeffizienten, d.h. einem Wert in der Nähe von -1 oder von +1, nicht folgern, dass zwischen den Merkmalen ein kausaler Zusammenhang besteht; es kann sich auch um ein eher zufälliges Ergebnis oder eine durch weitere Merkmale vermittelte Abhängigkeit handeln. Dies wäre dann eine Scheinkorrelation. Ob es überhaupt sinnvoll ist, bei den untersuchten Merkmalen von einem kausalen Zusammenhang auszugehen, muss mit anderen Methoden untersucht werden. Der Korrelationskoeffizient kann also nur das Ergebnis einer inhaltlichen Fragestellung bestärken, nicht aber beweisen. Beispiel: Wortschatz und Körpergröße Bei Schulkindern wurde in einer Reihenuntersuchung u.a. der Wortschatz und die Körpergröße erhoben. Für den Korrelationskoeffizienten erhielt man einen Wert von Keines der beiden Merkmale ist kausal für das andere. Vielmehr ist bei Schulkindern das Wachstum und der Spracherwerb an das Alter gekoppelt. Das Alter wirkt hier als Hintergrundvariable, die beides beeinflusst, sowohl die Körpergröße als auch den Fortschritt beim Spracherwerb. Im Rahmen eines Projektes in der Region Bielefeld wurden Daten zur Migration und Industrialisierung erhoben. Die Daten stammen aus dem Stadtarchiv Bielefeld und geben die Verhältnisse von 1879 bis 1914 wieder. Im einzelnen stehen folgende Variablen zur Verfügung: Labordatei öffnen ( d11.zmpf ) Jahresangabe, und für das entsprechende Jahr jeweils die Bevölkerungsanzahl, die Anzahl der Geburten, die Sterbefälle und die Anzahl der Arbeiter. Errechnen und interpretieren Sie alle möglichen Korrelationskoeffizienten! Sind diese kausal zu erklären? Rangkorrelation Der Rangkorrelationskoeffizient nach Spearman kann für bivariate Datensätze berechnet werden, bei denen beide Merkmale mindestens ordinal skaliert sind. Er ist der übliche Korrelationskoeffizient, jedoch berechnet für Rangzahlen bzw. der und. Rangzahlen sind einfach Platznummern in den jeweiligen geordneten Datensätzen. In einer Folge von Beobachtungen wird also der kleinste Wert durch 1, der zweitkleinste durch 2 ersetzt, bis schließlich der größte durch ersetzt wird. Bei gleichen Werten vergibt man mittlere Ränge. Seien etwa die Werte 3.2, 4.5, 1.4, 6.3, 0.8, 1.4 beobachtet worden. Dann lautet die Page 8

9 zugehörige Rangwertreihe: 4, 5, 2.5, 6, 1, 2.5. Der Rangkorrelationskoeffizient ist: Da der Rangkorrelationskoeffizient nicht die konkreten Ausprägungen berücksichtigt, sondern lediglich deren Ränge in einem sortierten Datensatz, ist er ein Maß für den monotonen Zusammenhang zwischen den Merkmalen; wenn also bei steigenden -Werten die -Werte tendenziell fallen oder steigen. Wie der Korrelationskoeffizient liegt der Rangkorrelationskoeffizient immer zwischen -1 und 1. Aufgrund der Konstruktion reagiert der Rangkorrelationskoeffizient bei kardinalen Merkmalen und unempfindlicher (robuster) auf einzelne extreme Ausprägungen als der Korrelationskoeffizient. Beispiel: Weinbaugebiet Europa Je größer die Weinanbaufläche, desto größer die Produktion, wird man denken. Dieser Zusammenhang stimmt aber nur in der Tendenz. Für Europa sieht es im Detail etwas anders aus: Das Streudiagramm zeigt, dass es zwei "Ausreißer" gibt. Daher macht es Sinn, den Rangkorrelationskoeffizienten zu bestimmen statt des üblichen Korrelationskoeffizienten von Bravais-Pearson. Er ist mit recht hoch. Die Berechnung des Rangkorrelationskoeffizienten im Labor können Sie hier einsehen! Labordatei öffnen ( d6b.spf ) Weinanbau in Europa Quelle: Eigene Berechnungen In der Datenmatrix ( d77.zmpf ) sind für verschiedene Typen von Flugzeugen der Firma Boeing die Reichweite (in km) und die Anzahl der Sitze angegeben. Bestimmen Sie den Rangkorrelationskoeffizienten. Wie ist er zu interpretieren? Ausprägungspaar ErklärungPunktwolke ErklärungStreudiagramm ErklärungStreudiagrammmatrix Erklärung (c) Projekt Neue Statistik 2003, Freie Universität Berlin, Center für Digitale Systeme Kontakt: Page 9

TEIL 12: BIVARIATE ANALYSE FÜR METRISCH SKALIERTE VARIABLEN

TEIL 12: BIVARIATE ANALYSE FÜR METRISCH SKALIERTE VARIABLEN TEIL 12: BIVARIATE ANALYSE FÜR METRISCH SKALIERTE VARIABLEN GLIEDERUNG Bivariate Analyse für metrisch skalierte Variablen Grundlagen Streudiagramme und Visualisierungen von Zusammenhängen Positive lineare

Mehr

TEIL 12: BIVARIATE ANALYSE FÜR METRISCH SKALIERTE VARIABLEN

TEIL 12: BIVARIATE ANALYSE FÜR METRISCH SKALIERTE VARIABLEN TEIL 12: BIVARIATE ANALYSE FÜR METRISCH SKALIERTE VARIABLEN Bivariate Analyse für metrisch skalierte Variablen Grundlagen Verfahren für metrische Daten nutzen den vollen mathematischen Informationsgehalt

Mehr

Ausführliche Lösungen zu ausgewählten Aufgaben von ÜB 5 und 6. Streudiagramm

Ausführliche Lösungen zu ausgewählten Aufgaben von ÜB 5 und 6. Streudiagramm y Aufgabe 3 Ausführliche Lösungen zu ausgewählten Aufgaben von ÜB 5 und 6 a) Zur Erstellung des Streudiagramms zeichnet man jeweils einen Punkt für jedes Datenpaar (x i, y i ) aus der zweidimensionalen

Mehr

1 x 1 y 1 2 x 2 y 2 3 x 3 y 3... n x n y n

1 x 1 y 1 2 x 2 y 2 3 x 3 y 3... n x n y n 3.2. Bivariate Verteilungen zwei Variablen X, Y werden gemeinsam betrachtet (an jedem Objekt werden gleichzeitig zwei Merkmale beobachtet) Beobachtungswerte sind Paare von Merkmalsausprägungen (x, y) Beispiele:

Mehr

Didaktisches Seminar über Stochastik. Themen: ffl Korrelation von zwei Zufallsvariablen

Didaktisches Seminar über Stochastik. Themen: ffl Korrelation von zwei Zufallsvariablen Didaktisches Seminar über Stochastik Themen: ffl Gemeinsame Verteilung von zwei Zufallsvariablen ffl Lineare Regression ffl Korrelation von zwei Zufallsvariablen Michael Ralph Pape Mai 1998 1 1 GEMEINSAME

Mehr

6 Korrelations- und Regressionsanalyse: Zusammenhangsanalyse stetiger Merkmale

6 Korrelations- und Regressionsanalyse: Zusammenhangsanalyse stetiger Merkmale 6 Korrelations- und Regressionsanalyse: Zusammenhangsanalyse stetiger Merkmale 397 6.1 Korrelationsanalyse Jetzt betrachten wir bivariate Merkmale (X, Y ), wobei sowohl X als auch Y stetig bzw. quasi-stetig

Mehr

Kontingenztabellen. Worum geht es in diesem Modul?

Kontingenztabellen. Worum geht es in diesem Modul? Kontingenztabellen Worum geht es in diesem Modul? Die Ausgangssituation Die 2x2 Felder Tafel Randverteilungen in 2x2-Tafeln Bedingte Häufigkeiten in 2x2-Tafeln Die IxJ-Felder Tafel Kontingenztabelle und

Mehr

Sommersemester Marktforschung

Sommersemester Marktforschung Dipl.-Kfm. Sascha Steinmann Universität Siegen Lehrstuhl für Marketing steinmann@marketing.uni-siegen.de Sommersemester 2010 Marktforschung Übungsaufgaben zu den Themen 3-6 mit Lösungsskizzen Aufgabe 1:

Mehr

Statistische Methoden in den Umweltwissenschaften

Statistische Methoden in den Umweltwissenschaften Statistische Methoden in den Umweltwissenschaften Korrelationsanalysen Kreuztabellen und χ²-test Themen Korrelation oder Lineare Regression? Korrelationsanalysen - Pearson, Spearman-Rang, Kendall s Tau

Mehr

Statistik II. Lineare Regressionsrechnung. Wiederholung Skript 2.8 und Ergänzungen (Schira: Kapitel 4) Statistik II

Statistik II. Lineare Regressionsrechnung. Wiederholung Skript 2.8 und Ergänzungen (Schira: Kapitel 4) Statistik II Statistik II Lineare Regressionsrechnung Wiederholung Skript 2.8 und Ergänzungen (Schira: Kapitel 4) Statistik II - 09.06.2006 1 Mit der Kovarianz und dem Korrelationskoeffizienten können wir den statistischen

Mehr

Medizinisches Beispiel

Medizinisches Beispiel Problemstellung Stimmen zwei oder mehrere Beobachter in ihrer Einschätzung überein? (im engl.: rater agreement oder interrater agreement) Beispiel: Zwei Professoren beurteilen die Referate oder Seminararbeiten

Mehr

3. Lektion: Deskriptive Statistik

3. Lektion: Deskriptive Statistik Seite 1 von 5 3. Lektion: Deskriptive Statistik Ziel dieser Lektion: Du kennst die verschiedenen Methoden der deskriptiven Statistik und weißt, welche davon für Deine Daten passen. Inhalt: 3.1 Deskriptive

Mehr

Assoziation & Korrelation

Assoziation & Korrelation Statistik 1 für SoziologInnen Assoziation & Korrelation Univ.Prof. Dr. Marcus Hudec Einleitung Bei Beobachtung von Merkmalen stellt sich die Frage, ob es Zusammenhänge oder Abhängigkeiten zwischen den

Mehr

Assoziation & Korrelation

Assoziation & Korrelation Statistik 1 für SoziologInnen Assoziation & Korrelation Univ.Prof. Dr. Marcus Hudec Einleitung Bei Beobachtung von 2 Merkmalen stellt sich die Frage, ob es Zusammenhänge oder Abhängigkeiten zwischen den

Mehr

6 Korrelationsanalyse: Zusammenhangsanalyse stetiger. Merkmale

6 Korrelationsanalyse: Zusammenhangsanalyse stetiger. Merkmale 6 Korrelationsanalyse: Zusammenhangsanalyse stetiger Merkmale 6.1 Korrelationsanalyse Jetzt betrachten wir bivariate Merkmale (X, Y ), wobei sowohl X als auch Y stetig bzw. quasi-stetig und mindestens

Mehr

Leseprobe. Michael Sachs. Wahrscheinlichkeitsrechnung und Statistik. für Ingenieurstudenten an Fachhochschulen. ISBN (Buch):

Leseprobe. Michael Sachs. Wahrscheinlichkeitsrechnung und Statistik. für Ingenieurstudenten an Fachhochschulen. ISBN (Buch): Leseprobe Michael Sachs Wahrscheinlichkeitsrechnung und Statistik für Ingenieurstudenten an Fachhochschulen ISBN (Buch): 978-3-446-43797-5 ISBN (E-Book): 978-3-446-43732-6 Weitere Informationen oder Bestellungen

Mehr

6Korrelationsanalyse:Zusammengangsanalysestetiger Merkmale

6Korrelationsanalyse:Zusammengangsanalysestetiger Merkmale 6Korrelationsanalyse:Zusammengangsanalysestetiger Merkmale Jetzt betrachten wir bivariate Merkmale (X, Y ), wobei sowohl X als auch Y stetig bzw. quasi-stetig und mindestens ordinalskaliert, typischerweise

Mehr

Gemeinsame Wahrscheinlichkeitsverteilungen

Gemeinsame Wahrscheinlichkeitsverteilungen Gemeinsame Wahrscheinlichkeitsverteilungen Worum geht es in diesem Modul? Gemeinsame Wahrscheinlichkeits-Funktion zweier Zufallsvariablen Randverteilungen Bedingte Verteilungen Unabhängigkeit von Zufallsvariablen

Mehr

Ermitteln Sie auf 2 Dezimalstellen genau die folgenden Kenngrößen der bivariaten Verteilung der Merkmale Weite und Zeit:

Ermitteln Sie auf 2 Dezimalstellen genau die folgenden Kenngrößen der bivariaten Verteilung der Merkmale Weite und Zeit: 1. Welche der folgenden Kenngrößen, Statistiken bzw. Grafiken sind zur Beschreibung der Werteverteilung des Merkmals Konfessionszugehörigkeit sinnvoll einsetzbar? A. Der Modalwert. B. Der Median. C. Das

Mehr

5 Beschreibung und Analyse empirischer Zusammenhänge

5 Beschreibung und Analyse empirischer Zusammenhänge 5 Beschreibung und Analyse empirischer Zusammenhänge 132 5 Beschreibung und Analyse empirischer Zusammenhänge 5.1 Zusammenhänge zwischen kategorialen Merkmalen 137 5.1.1 Kontingenztabellen 137 Verteilungen

Mehr

WISTA WIRTSCHAFTSSTATISTIK

WISTA WIRTSCHAFTSSTATISTIK WISTA WIRTSCHAFTSSTATISTIK PROF. DR. ROLF HÜPEN FAKULTÄT FÜR WIRTSCHAFTSWISSENSCHAFT Seminar für Theoretische Wirtschaftslehre Vorlesungsprogramm 04.06.2013 Zweidimensionale Datensätze 1. Kontingenztabelle

Mehr

Eine zweidimensionale Stichprobe

Eine zweidimensionale Stichprobe Eine zweidimensionale Stichprobe liegt vor, wenn zwei qualitative Merkmale gleichzeitig betrachtet werden. Eine Urliste besteht dann aus Wertepaaren (x i, y i ) R 2 und hat die Form (x 1, y 1 ), (x 2,

Mehr

Musterlösung zur Aufgabensammlung Statistik I Teil 3

Musterlösung zur Aufgabensammlung Statistik I Teil 3 Musterlösung zur Aufgabensammlung Statistik I Teil 3 2008, Malte Wissmann 1 Zusammenhang zwischen zwei Merkmalen Nominale, Ordinale Merkmale und Mischungen Aufgabe 12 a) x\ y 1.Klasse 2.Klasse 3.Klasse

Mehr

Eigene MC-Fragen (Teil II) "Kap. 9 Zusammenhangsmaße

Eigene MC-Fragen (Teil II) Kap. 9 Zusammenhangsmaße Eigene MC-Fragen (Teil II) "Kap. 9 Zusammenhangsmaße 1. Kreuze die richtige Aussage an! positiv sind, ist r stets identisch mit s xy. negativ sind, ist r stets identisch mit s xy. positiv sind, ist das

Mehr

Kapitel 1 Beschreibende Statistik

Kapitel 1 Beschreibende Statistik Beispiel 1.25: fiktive Aktienkurse Zeitpunkt i 0 1 2 Aktienkurs x i 100 160 100 Frage: Wie hoch ist die durchschnittliche Wachstumsrate? Dr. Karsten Webel 53 Beispiel 1.25: fiktive Aktienkurse (Fortsetzung)

Mehr

Lage- und Streuungsparameter

Lage- und Streuungsparameter Lage- und Streuungsparameter Beziehen sich auf die Verteilung der Ausprägungen von intervall- und ratio-skalierten Variablen Versuchen, diese Verteilung durch Zahlen zu beschreiben, statt sie graphisch

Mehr

Bivariate Verteilungen

Bivariate Verteilungen Bivariate Verteilungen Tabellarische Darstellung: Bivariate Tabellen entstehen durch Kreuztabulation zweier Variablen. Beispiel: X Y Student(in) Herkunft Fakultät 0001 Europa Jura 000 Nicht-Europa Medizin

Mehr

Cox-Regression. Ausgangspunkt Ansätze zur Modellierung von Einflussgrößen Das Cox-Modell Eigenschaften des Cox-Modells

Cox-Regression. Ausgangspunkt Ansätze zur Modellierung von Einflussgrößen Das Cox-Modell Eigenschaften des Cox-Modells Cox-Regression Ausgangspunkt Ansätze zur Modellierung von Einflussgrößen Das Cox-Modell Eigenschaften des Cox-Modells In vielen Fällen interessiert, wie die Survivalfunktion durch Einflussgrößen beeinflusst

Mehr

Skalenniveaus =,!=, >, <, +, -

Skalenniveaus =,!=, >, <, +, - ZUSAMMENHANGSMAßE Skalenniveaus Nominalskala Ordinalskala Intervallskala Verhältnisskala =,!= =,!=, >, < =,!=, >, ,

Mehr

Inhaltsverzeichnis. 1 Über dieses Buch Zum Inhalt dieses Buches Danksagung Zur Relevanz der Statistik...

Inhaltsverzeichnis. 1 Über dieses Buch Zum Inhalt dieses Buches Danksagung Zur Relevanz der Statistik... Inhaltsverzeichnis 1 Über dieses Buch... 11 1.1 Zum Inhalt dieses Buches... 13 1.2 Danksagung... 15 2 Zur Relevanz der Statistik... 17 2.1 Beispiel 1: Die Wahrscheinlichkeit, krank zu sein, bei einer positiven

Mehr

3.1 Zusammenhang zwischen einem qualitativen und einem quantitativen Merkmal

3.1 Zusammenhang zwischen einem qualitativen und einem quantitativen Merkmal Kapitel 3 Bivariate Analyse In Kapitel 2 haben wir gesehen, wie man ein Merkmal auswertet. Mit Hilfe statistischer Verfahren kann man aber auch untersuchen, ob zwischen mehreren Merkmalen Abhängigkeiten

Mehr

Mathematik für Biologen

Mathematik für Biologen Mathematik für Biologen Prof. Dr. Rüdiger W. Braun Heinrich-Heine-Universität Düsseldorf 05. Dezember 2012 1 Datenpaare Korrelation 2 Lineare Regression Problemstellung Beispiel Bleibelastung 3 Regression

Mehr

Es können keine oder mehrere Antworten richtig sein. Eine Frage ist NUR dann richtig beantwortet, wenn ALLE richtigen Antworten angekreuzt wurden.

Es können keine oder mehrere Antworten richtig sein. Eine Frage ist NUR dann richtig beantwortet, wenn ALLE richtigen Antworten angekreuzt wurden. Teil III: Statistik Alle Fragen sind zu beantworten. Es können keine oder mehrere Antworten richtig sein. Eine Frage ist NUR dann richtig beantwortet, wenn ALLE richtigen Antworten angekreuzt wurden. Wird

Mehr

Mathematik für Biologen

Mathematik für Biologen Mathematik für Biologen Prof. Dr. Rüdiger W. Braun http://blog.ruediger-braun.net Heinrich-Heine-Universität Düsseldorf 10. Dezember 2014 1 Datenpaare Korrelation 2 Lineare Regression Problemstellung Beispiel

Mehr

Gibt es einen Zusammenhang zwischen Merkmalen? Korrelationen

Gibt es einen Zusammenhang zwischen Merkmalen? Korrelationen Arbeitsblatt SPSS Kapitel 8 Seite Gibt es einen Zusammenhang zwischen Merkmalen? Korrelationen Wie in allen Kapiteln gehen wir im Folgenden davon aus, dass Sie die Datei elporiginal.sav geöffnet haben.

Mehr

Statistik II. II. Univariates lineares Regressionsmodell. Martin Huber 1 / 20

Statistik II. II. Univariates lineares Regressionsmodell. Martin Huber 1 / 20 Statistik II II. Univariates lineares Regressionsmodell Martin Huber 1 / 20 Übersicht Definitionen (Wooldridge 2.1) Schätzmethode - Kleinste Quadrate Schätzer / Ordinary Least Squares (Wooldridge 2.2)

Mehr

Dr. Maike M. Burda. Welchen Einfluss hat die Körperhöhe auf das Körpergewicht? Eine Regressionsanalyse. HU Berlin, Econ Bootcamp 7.-9.

Dr. Maike M. Burda. Welchen Einfluss hat die Körperhöhe auf das Körpergewicht? Eine Regressionsanalyse. HU Berlin, Econ Bootcamp 7.-9. Dr. Maike M. Burda Welchen Einfluss hat die Körperhöhe auf das Körpergewicht? Eine Regressionsanalyse. HU Berlin, Econ Bootcamp 7.-9. Januar 2011 BOOTDATA11.GDT: 250 Beobachtungen für die Variablen...

Mehr

Kapitel 1 Beschreibende Statistik

Kapitel 1 Beschreibende Statistik Beispiel 1.5: Histogramm (klassierte erreichte Punkte, Fortsetzung Bsp. 1.1) 0.25 0.2 Höhe 0.15 0.1 0.05 0 0 6 7 8,5 10 11 erreichte Punkte Dr. Karsten Webel 24 Beispiel 1.5: Histogramm (Fortsetzung) Klasse

Mehr

Statistik I. Zusammenfassung und wichtiges zur Prüfungsvorbereitung. Malte Wissmann. 9. Dezember Universität Basel.

Statistik I. Zusammenfassung und wichtiges zur Prüfungsvorbereitung. Malte Wissmann. 9. Dezember Universität Basel. Zusammenfassung und wichtiges zur Prüfungsvorbereitung 9. Dezember 2008 Begriffe Kenntnis der wichtigen Begriffe und Unterscheidung dieser. Beispiele: Merkmal, Merkmalsraum, etc. Skalierung: Nominal etc

Mehr

Bivariate Zusammenhänge

Bivariate Zusammenhänge Bivariate Zusammenhänge 40 60 80 Bivariater Zusammenhang: Zusammenhang zwischen zwei Variablen weight (kg) Gibt es einen Zusammenhang zwischen Größe & Gewicht? (am Beispieldatensatz) Offensichtlich positiver

Mehr

Modul G.1 WS 07/08: Statistik

Modul G.1 WS 07/08: Statistik Modul G.1 WS 07/08: Statistik 10.01.2008 1 2 Test Anwendungen Der 2 Test ist eine Klasse von Verfahren für Nominaldaten, wobei die Verteilung der beobachteten Häufigkeiten auf zwei mehrfach gestufte Variablen

Mehr

Wahrscheinlichkeitsrechnung und Statistik

Wahrscheinlichkeitsrechnung und Statistik Wahrscheinlichkeitsrechnung und Statistik Für Ingenieurstudenten an Fachhochschulen von Michael Sachs erweitert Wahrscheinlichkeitsrechnung und Statistik Sachs schnell und portofrei erhältlich bei beck-shopde

Mehr

Zusammenhangsmaße II

Zusammenhangsmaße II Sommersemester 2009 Eine nominale und eine intervallskalierte Variable χ 2 =?!? Übung von Simone Reutzel Heute im HS1, altes ReWi-Haus Zum Nachlesen Agresti/Finlay: Kapitel 8.5, 9.4 Gehring/Weins: Kapitel

Mehr

Einführung in die Korrelationsrechnung

Einführung in die Korrelationsrechnung Einführung in die Korrelationsrechnung Sven Garbade Fakultät für Angewandte Psychologie SRH Hochschule Heidelberg sven.garbade@hochschule-heidelberg.de Statistik 1 S. Garbade (SRH Heidelberg) Korrelationsrechnung

Mehr

Beschreibende Statistik Zweidimensionale (bivariate) Daten

Beschreibende Statistik Zweidimensionale (bivariate) Daten Mathematik II für Biologen Beschreibende Statistik Zweidimensionale (bivariate) Daten 8. Mai 2009 Lineare Regression Transformationen Produktmomenten-Korrelation Rangkorrelation Warnung Stichprobe ( 1,y

Mehr

Statistik I für Betriebswirte Vorlesung 10

Statistik I für Betriebswirte Vorlesung 10 Statistik I für Betriebswirte Vorlesung 10 Dr. Andreas Wünsche TU Bergakademie Freiberg Institut für Stochastik 15. Juni 2017 Dr. Andreas Wünsche Statistik I für Betriebswirte Vorlesung 10 Version: 13.

Mehr

Institut für Soziologie Dipl. Soz. Maximilian Sonnauer. Methoden II. Zusammenhangsmaße für kategoriale und metrische Variablen

Institut für Soziologie Dipl. Soz. Maximilian Sonnauer. Methoden II. Zusammenhangsmaße für kategoriale und metrische Variablen Institut für Soziologie Dipl. Soz. Methoden II Zusammenhangsmaße für kategoriale und metrische Variablen Organisatorisches Prüfungsanmeldung Methoden II Die Anmeldung zur Prüfung läuft über die Tafelübung.

Mehr

unabhängigen Variablen Eine Funktion dient der Beschreibung von Zusammenhängen zwischen mehreren verschiedenen Faktoren.

unabhängigen Variablen Eine Funktion dient der Beschreibung von Zusammenhängen zwischen mehreren verschiedenen Faktoren. Funktionsbegriff 2.1 2 Funktionen mit einer unabhängigen Variablen 2.1 Funktionsbegriff Eine Funktion dient der Beschreibung von Zusammenhängen zwischen mehreren verschiedenen Faktoren. In den Wirtschaftswissenschaften

Mehr

Bivariate Analyse: Gemeinsame (bivariate) Häufigkeitstabelle. Sie wird auch Kontingenz-, Assoziations- oder Korrelationstabelle (f b )genannt.

Bivariate Analyse: Gemeinsame (bivariate) Häufigkeitstabelle. Sie wird auch Kontingenz-, Assoziations- oder Korrelationstabelle (f b )genannt. Bivariate Analyse: Tabellarische Darstellung: Gemeinsame (bivariate) Häufigkeitstabelle. Sie wird auch Kontingenz-, Assoziations- oder Korrelationstabelle (f b )genannt. Beispiel: Häufigkeitsverteilung

Mehr

Bivariate Regressionsanalyse

Bivariate Regressionsanalyse Universität Bielefeld 15. März 2005 Kovarianz, Korrelation und Regression Kovarianz, Korrelation und Regression Ausgangspunkt ist folgende Datenmatrix: Variablen 1 2... NI 1 x 11 x 12... x 1k 2 x 21 x

Mehr

Lösungen zur deskriptiven Statistik

Lösungen zur deskriptiven Statistik Lösungen zur deskriptiven Statistik Aufgabe 1. Bei einer Stichprobe von n = Studenten wurden folgende jährliche Ausgaben (in e) für Urlaubszwecke ermittelt. 1 58 5 35 6 8 1 6 55 4 47 56 48 1 6 115 8 5

Mehr

Zusammenhangsmaße II

Zusammenhangsmaße II Sommersemester 2009 Wiederholung/ Eine nominale und eine intervallskalierte Variable χ 2 =?!? Übung von Simone Reutzel Heute im HS1, altes ReWi-Haus Zum Nachlesen Agresti/Finlay: Kapitel 8.5, 9.4 Gehring/Weins:

Mehr

W-Rechnung und Statistik für Ingenieure Übung 5

W-Rechnung und Statistik für Ingenieure Übung 5 W-Rechnung und Statistik für Ingenieure Übung 5 Grafische/ tabellarische Darstellung für bivariate Daten diskrete Merkmale (qualitativ+ quantitativ diskret) stetige Merkmale (quantitativ stetig) Zusammenhangsmaße

Mehr

Verfahren zur Überprüfung von Zusammenhangshypothesen

Verfahren zur Überprüfung von Zusammenhangshypothesen Verfahren zur Überprüfung von Zusammenhangshypothesen 0. Allgemeines Wir haben uns bisher mit Unterschiedshypothesen beschäftigt (Unterschiede von Stichproben in Bezug auf abhängige Variablen). Im Folgenden

Mehr

Lösungen zur Klausur zur Statistik Übung am

Lösungen zur Klausur zur Statistik Übung am Lösungen zur Klausur zur Statistik Übung am 28.06.2013 Fabian Kleine Staatswissenschaftliche Fakultät Aufgabe 1 Gegeben sei die folgende geordneten Urliste des Merkmals Y. 30 Punkte Y : 5 5 5 5 10 10 10

Mehr

Beispiel 2 (Einige Aufgaben zu Lageparametern) Aufgabe 1 (Lageparameter)

Beispiel 2 (Einige Aufgaben zu Lageparametern) Aufgabe 1 (Lageparameter) Beispiel (Einige Aufgaben zu Lageparametern) Aufgabe 1 (Lageparameter) 1 Ein Statistiker ist zu früh zu einer Verabredung gekommen und vertreibt sich nun die Zeit damit, daß er die Anzahl X der Stockwerke

Mehr

Inhaltsverzeichnis (Ausschnitt)

Inhaltsverzeichnis (Ausschnitt) 4 Zweidimensionale Daten Inhaltsverzeichnis (Ausschnitt) 4 Zweidimensionale Daten Häufigkeitsverteilungen unklassierter Daten Häufigkeitsverteilungen klassierter Daten Bedingte Häufigkeitsverteilungen

Mehr

Kapitel XI - Korrelationsrechnung

Kapitel XI - Korrelationsrechnung Universität Karlsruhe (TH) Institut für Statistik und Mathematische Wirtschaftstheorie Kapitel XI - Korrelationsrechnung Markus Höchstötter Uni Karlsruhe Karlsruhe, SS 2008 Kapitel XI - Korrelationsrechnung

Mehr

Datenanalyse mit Excel. Wintersemester 2013/14

Datenanalyse mit Excel. Wintersemester 2013/14 Datenanalyse mit Excel 1 KORRELATIONRECHNUNG 2 Korrelationsrechnung Ziel der Korrelationsrechnung besteht im bivariaten Fall darin, die Stärke des Zusammenhangs zwischen zwei interessierenden statistischen

Mehr

Parametrische vs. Non-Parametrische Testverfahren

Parametrische vs. Non-Parametrische Testverfahren Parametrische vs. Non-Parametrische Testverfahren Parametrische Verfahren haben die Besonderheit, dass sie auf Annahmen zur Verteilung der Messwerte in der Population beruhen: die Messwerte sollten einer

Mehr

Statistik II. Regressionsrechnung+ Regressionsanalyse. Statistik II

Statistik II. Regressionsrechnung+ Regressionsanalyse. Statistik II Statistik II Regressionsrechnung+ Regressionsanalyse Statistik II - 16.06.2006 1 Regressionsrechnung Nichtlineare Ansätze In einigen Situation könnte man einen nichtlinearen Zusammenhang vermuten. Bekannte

Mehr

Vl Zweidimensionale Verteilungen Zusammenhangsmaße 3.1. Zwei dimensionale Häufigkeitstabellen. Absolute Häufigkeitstabelle

Vl Zweidimensionale Verteilungen Zusammenhangsmaße 3.1. Zwei dimensionale Häufigkeitstabellen. Absolute Häufigkeitstabelle Vl. 5.12.11 3. Zweidimensionale Verteilungen Zusammenhangsmaße 3.1. Zwei dimensionale Häufigkeitstabellen schnell mittel langsam 3 Arten von Häufigkeitstabellen: Absolute Häufigkeitstabelle relative Häufigkeitstabelle

Mehr

Einführung in die Statistik

Einführung in die Statistik Elmar Klemm Einführung in die Statistik Für die Sozialwissenschaften Westdeutscher Verlag INHALTSVERZEICHNIS 1. Einleitung und Begrifflichkeiten 11 1.1 Grundgesamtheit, Stichprobe 12 1.2 Untersuchungseinheit,

Mehr

5.5 PRE-Maße (Fehlerreduktionsmaße) 6

5.5 PRE-Maße (Fehlerreduktionsmaße) 6 359 5.5 PRE-Maße (Fehlerreduktionsmaße) 6 5.5.1 Die grundlegende Konstruktion Völlig andere, sehr allgemeine Grundidee zur Beschreibung von Zusammenhängen. Grundlegendes Prinzip vieler statistischer Konzepte.

Mehr

Mathematik für Biologen

Mathematik für Biologen Mathematik für Biologen Prof. Dr. Rüdiger W. Braun Heinrich-Heine-Universität Düsseldorf 21. Oktober 2010 1 Datenpaare Korrelation Lineare Regression Regression im exponentiellen Modell Datenpaare Häufig

Mehr

htw saar 1 EINFÜHRUNG IN DIE STATISTIK: BESCHREIBENDE STATISTIK

htw saar 1 EINFÜHRUNG IN DIE STATISTIK: BESCHREIBENDE STATISTIK htw saar 1 EINFÜHRUNG IN DIE STATISTIK: BESCHREIBENDE STATISTIK htw saar 2 Grundbegriffe htw saar 3 Grundgesamtheit und Stichprobe Ziel: Über eine Grundgesamtheit (Population) soll eine Aussage über ein

Mehr

Teil: lineare Regression

Teil: lineare Regression Teil: lineare Regression 1 Einführung 2 Prüfung der Regressionsfunktion 3 Die Modellannahmen zur Durchführung einer linearen Regression 4 Dummyvariablen 1 Einführung o Eine statistische Methode um Zusammenhänge

Mehr

Grundlegende Eigenschaften von Punktschätzern

Grundlegende Eigenschaften von Punktschätzern Grundlegende Eigenschaften von Punktschätzern Worum geht es in diesem Modul? Schätzer als Zufallsvariablen Vorbereitung einer Simulation Verteilung von P-Dach Empirische Lage- und Streuungsparameter zur

Mehr

Logarithmische Skalen

Logarithmische Skalen Logarithmische Skalen Arbeitsblatt Logarithmische Skalen ermöglichen dir eine übersichtlichere Darstellung von Kurvenverläufen vor allem dann, wenn sie sich über sehr große Zahlenbereiche erstrecken. 1

Mehr

Funktionen in der Mathematik

Funktionen in der Mathematik R. Brinkmann http://brinkmann-du.de Seite 05.0.008 Funktionen in der Mathematik Bei der mathematischen Betrachtung natürlicher, technischer oder auch alltäglicher Vorgänge hängt der Wert einer Größe oft

Mehr

Zusammenhänge zwischen metrischen Merkmalen

Zusammenhänge zwischen metrischen Merkmalen Zusammenhänge zwischen metrischen Merkmalen Darstellung des Zusammenhangs, Korrelation und Regression Daten liegen zu zwei metrischen Merkmalen vor: Datenpaare (x i, y i ), i = 1,..., n Beispiel: x: Anzahl

Mehr

Kapitel VII - Konzentration von Merkmalswerten

Kapitel VII - Konzentration von Merkmalswerten Institut für Volkswirtschaftslehre (ECON) Lehrstuhl für Ökonometrie und Statistik Kapitel VII - Konzentration von Merkmalswerten Deskriptive Statistik Prof. Dr. W.-D. Heller Hartwig Senska Carlo Siebenschuh

Mehr

Was sind Zusammenhangsmaße?

Was sind Zusammenhangsmaße? Was sind Zusammenhangsmaße? Zusammenhangsmaße beschreiben einen Zusammenhang zwischen zwei Variablen Beispiele für Zusammenhänge: Arbeiter wählen häufiger die SPD als andere Gruppen Hochgebildete vertreten

Mehr

Die Funktion f wird als Regressionsfunktion bezeichnet.

Die Funktion f wird als Regressionsfunktion bezeichnet. Regressionsanalyse Mit Hilfe der Techniken der klassischen Regressionsanalyse kann die Abhängigkeit metrischer (intervallskalierter) Zielgrößen von metrischen (intervallskalierten) Einflussgrößen untersucht

Mehr

Einführung. Ablesen von einander zugeordneten Werten

Einführung. Ablesen von einander zugeordneten Werten Einführung Zusammenhänge zwischen Größen wie Temperatur, Geschwindigkeit, Lautstärke, Fahrstrecke, Preis, Einkommen, Steuer etc. werden mit beschrieben. Eine Zuordnung f, die jedem x A genau ein y B zuweist,

Mehr

Statistik I für Betriebswirte Vorlesung 10

Statistik I für Betriebswirte Vorlesung 10 Statistik I für Betriebswirte Vorlesung 10 Prof. Dr. Hans-Jörg Starkloff TU Bergakademie Freiberg Institut für Stochastik 13. Juni 2016 Prof. Dr. Hans-Jörg Starkloff Statistik I für Betriebswirte Vorlesung

Mehr

Statistik I. 1. Klausur Wintersemester 2010/2011 Hamburg, Art der Anmeldung: STiNE FlexNow Zulassung unter Vorbehalt

Statistik I. 1. Klausur Wintersemester 2010/2011 Hamburg, Art der Anmeldung: STiNE FlexNow Zulassung unter Vorbehalt Statistik I 1. Klausur Wintersemester 2010/2011 Hamburg, 11.02.2011 BITTE LESERLICH IN DRUCKBUCHSTABEN AUSFÜLLEN! Nachname:............................................................................ Vorname:.............................................................................

Mehr

Einiges zu den Potenzfunktionen. Exponentialfunktionen

Einiges zu den Potenzfunktionen. Exponentialfunktionen Einiges zu den Potenzfunktionen Es sind zunächst zwei Arten der Potenzfunktionen zu unterscheiden. Erstens die eigentlichen Potenzfunktionen, bei denen die Variable x als Basis von Potenzen vorkommt. Diese

Mehr

W-Seminar: Versuche mit und am Menschen 2017/2019 Skript

W-Seminar: Versuche mit und am Menschen 2017/2019 Skript 3. Deskriptive Statistik Die deskriptive (auch: beschreibende) Statistik hat zum Ziel, [ ] Daten durch Tabellen, Kennzahlen [ ] und Grafiken übersichtlich darzustellen und zu ordnen. Dies ist vor allem

Mehr

Graphische Darstellung einer univariaten Verteilung:

Graphische Darstellung einer univariaten Verteilung: Graphische Darstellung einer univariaten Verteilung: Die graphische Darstellung einer univariaten Verteilung hängt von dem Messniveau der Variablen ab. Bei einer graphischen Darstellung wird die Häufigkeit

Mehr

5. Spezielle stetige Verteilungen

5. Spezielle stetige Verteilungen 5. Spezielle stetige Verteilungen 5.1 Stetige Gleichverteilung Eine Zufallsvariable X folgt einer stetigen Gleichverteilung mit den Parametern a und b, wenn für die Dichtefunktion von X gilt: f x = 1 für

Mehr

Assoziation & Korrelation

Assoziation & Korrelation Statistik 1 für SoziologInnen Assoziation & Korrelation Univ.Prof. Dr. Marcus Hudec Einleitung Bei Beobachtung von 2 Merkmalen stellt sich die Frage, ob es systematische Zusammenhänge oder Abhängigkeiten

Mehr

Grundlagen der Statistik

Grundlagen der Statistik Grundlagen der Statistik Übung 2 2010 FernUniversität in Hagen Alle Rechte vorbehalten Fakultät für Wirtschaftswissenschaft Übersicht über die mit den Übungsaufgaben geprüften Lehrzielgruppen Lehrzielgruppe

Mehr

Kapitel 2. Mittelwerte

Kapitel 2. Mittelwerte Kapitel 2. Mittelwerte Im Zusammenhang mit dem Begriff der Verteilung, der im ersten Kapitel eingeführt wurde, taucht häufig die Frage auf, wie man die vorliegenden Daten durch eine geeignete Größe repräsentieren

Mehr

Deskription, Statistische Testverfahren und Regression. Seminar: Planung und Auswertung klinischer und experimenteller Studien

Deskription, Statistische Testverfahren und Regression. Seminar: Planung und Auswertung klinischer und experimenteller Studien Deskription, Statistische Testverfahren und Regression Seminar: Planung und Auswertung klinischer und experimenteller Studien Deskriptive Statistik Deskriptive Statistik: beschreibende Statistik, empirische

Mehr

Anwendungsaufgaben. a. Anhand des Streudiagramms (. Abb. 1) lässt sich ein linearer Zusammenhang vermuten. Aufgabe 1. Anhang 1: Lösungen der Aufgaben

Anwendungsaufgaben. a. Anhand des Streudiagramms (. Abb. 1) lässt sich ein linearer Zusammenhang vermuten. Aufgabe 1. Anhang 1: Lösungen der Aufgaben Anhang 1: Lösungen der Aufgaben 15 +1). Korrelationskoeffizienten unterschiedlicher Stichproben oder verschiedener Variablen können so miteinander verglichen werden, was mit der Kovarianz nicht möglich

Mehr

Streuungsmaße Worum geht es in diesem Modul? Allgemeines zu Streuungsmaßzahlen Spannweite und Interquartilsabstand

Streuungsmaße Worum geht es in diesem Modul? Allgemeines zu Streuungsmaßzahlen Spannweite und Interquartilsabstand Streuungsmaße Worum geht es in diesem Modul? Allgemeines zu Streuungsmaßzahlen Spannweite und Interquartilsabstand Berechnung der mittleren quadratischen Abweichung und der Varianz aus einer Urliste Standardabweichung

Mehr

Über die Bedeutung der zwei Zahlen m und x 1 für das Aussehen des Graphen wird an anderer Stelle informiert.

Über die Bedeutung der zwei Zahlen m und x 1 für das Aussehen des Graphen wird an anderer Stelle informiert. Lineare Funktionen - Term - Grundwissen Woran erkennt man, ob ein Funktionsterm zu einer Linearen Funktion gehört? oder Wie kann der Funktionsterm einer Linearen Funktion aussehen? Der Funktionsterm einer

Mehr

Mathematik. Oktober 2017 AHS. Kompensationsprüfung 1 Angabe für Kandidatinnen/Kandidaten

Mathematik. Oktober 2017 AHS. Kompensationsprüfung 1 Angabe für Kandidatinnen/Kandidaten Name: Datum: Klasse: Kompensationsprüfung zur standardisierten kompetenzorientierten schriftlichen Reifeprüfung AHS Oktober 2017 Mathematik Kompensationsprüfung 1 Angabe für Kandidatinnen/Kandidaten Hinweise

Mehr

Statistik und Wahrscheinlichkeitsrechnung

Statistik und Wahrscheinlichkeitsrechnung Statistik und Wahrscheinlichkeitsrechnung 3. Vorlesung Dr. Jochen Köhler 1 Inhalte der heutigen Vorlesung Ziel: Daten Modellbildung Probabilistisches Modell Wahrscheinlichkeit von Ereignissen Im ersten

Mehr

Grundlagen der empirischen Sozialforschung

Grundlagen der empirischen Sozialforschung Grundlagen der empirischen Sozialforschung Sitzung 11 - Datenanalyseverfahren Jan Finsel Lehrstuhl für empirische Sozialforschung Prof. Dr. Petra Stein 5. Januar 2009 1 / 22 Online-Materialien Die Materialien

Mehr

Der Korrelationskoezient nach Pearson

Der Korrelationskoezient nach Pearson Der Korrelationskoezient nach Pearson 1 Motivation In der Statistik werden wir uns häug mit empirisch erfassten Daten beschäftigen. Um diese auszuwerten, ist es oftmals notwendig einen Zusammenhang zwischen

Mehr

Das multiple lineare Regressionsmodell

Das multiple lineare Regressionsmodell Das multiple lineare Regressionsmodell Worum geht es in diesem Lernmodul? Das Modell Schätzen der Koeffizienten Interpretation der Koeffizienten Testen der Koeffizienten Worum geht es in diesem Lernmodul?

Mehr

Lagemaße Worum geht es in diesem Modul? Allgemeines zu Lagemaßzahlen Arithmetisches Mittel aus einer Urliste

Lagemaße Worum geht es in diesem Modul? Allgemeines zu Lagemaßzahlen Arithmetisches Mittel aus einer Urliste Lagemaße Worum geht es in diesem Modul? Allgemeines zu Lagemaßzahlen Arithmetisches Mittel aus einer Urliste Berechnung des arithmetischen Mittels aus Häufigkeitstabellen Weitere Lagemaße Worum geht es

Mehr

Zusammenhangsanalyse mit SPSS. Messung der Intensität und/oder der Richtung des Zusammenhangs zwischen 2 oder mehr Variablen

Zusammenhangsanalyse mit SPSS. Messung der Intensität und/oder der Richtung des Zusammenhangs zwischen 2 oder mehr Variablen - nominal, ordinal, metrisch In SPSS: - Einfache -> Mittelwerte vergleichen -> Einfaktorielle - Mehrfaktorielle -> Allgemeines lineares Modell -> Univariat In SPSS: -> Nichtparametrische Tests -> K unabhängige

Mehr

fh management, communication & it Constantin von Craushaar fh-management, communication & it Statistik Angewandte Statistik

fh management, communication & it Constantin von Craushaar fh-management, communication & it Statistik Angewandte Statistik fh management, communication & it Folie 1 Überblick Grundlagen (Testvoraussetzungen) Mittelwertvergleiche (t-test,..) Nichtparametrische Tests Korrelationen Regressionsanalyse... Folie 2 Überblick... Varianzanalyse

Mehr

3. Deskriptive Statistik

3. Deskriptive Statistik 3. Deskriptive Statistik Eindimensionale (univariate) Daten: Pro Objekt wird ein Merkmal durch Messung / Befragung/ Beobachtung erhoben. Resultat ist jeweils ein Wert (Merkmalsausprägung) x i : - Gewicht

Mehr

5 Assoziationsmessung in Kontingenztafeln

5 Assoziationsmessung in Kontingenztafeln 5 Assoziationsmessung in Kontingenztafeln 51 Multivariate Merkmale 51 Multivariate Merkmale Gerade in der Soziologie ist die Analyse eindimensionaler Merkmale nur der allererste Schritt zur Beschreibung

Mehr