Diskriminanzanalyse Beispiel

Größe: px
Ab Seite anzeigen:

Download "Diskriminanzanalyse Beispiel"

Transkript

1 Diskriminanzanalyse Ziel bei der Diskriminanzanalyse ist die Analyse von Gruppenunterschieden, d. h. der Untersuchung von zwei oder mehr Gruppen hinsichtlich einer Vielzahl von Variablen. Diese Methode hat demzufolge das gleiche Ziel wie die binäre logistische Regression, nämlich Objekte zu klassifizieren. Beispiel Ein Kreditinstitut möchte wissen, wie es Neukunden hinsichtlich ihrer Kreditwürdigkeit einschätzen soll. Hierfür verwendet es Daten seines bestehenden Kundenstamms: das Alter und das Nettoeinkommen. Es werden folglich nur zwei Gruppen betrachtet: die Kreditwürdigen und die Nichtkreditwürdigen. Um einen ersten Eindruck zu erhalten, wird ein Streudiagramm erstellt: Wie kann man nun auf Basis dieser Daten einen Neukunden klassifizieren? Ersichtlich ist, dass ein Neukunde mit hohem Einkommen eher kreditwürdig ist als ein Neukunde, der ein relativ geringes Einkommen hat. Hinsichtlich des Alters kann eine ähnliche Schlussfolgerung nicht gezogen werden. Man vermutet, dass die Schätzung einer Geradengleichung unter gleichzeitiger Verwen- 68

2 dung beider Variablen - Alter und Nettoeinkommen - eindeutigere Ergebnisse liefern könnte: Auf Basis der Grafik lassen sich eher Neukunden einordnen, dies insbesondere vor dem Hintergrund der Informationen beider Variablen. Grudsätzlich können mehr als zwei Gruppen betrachtet werden, in die es Objekte einzuordnen gilt. Ist dies der Fall, so können Parallelen zur multinomialen logistischen Regression gezogen werden. Um einen Zugang zu der Methode zu erhalten, wird nachfolgend der Zwei-Gruppen-Fall betrachtet. Um zwischen zwei Gruppen unterscheiden zu können, muss eine Diskriminanzfunktion bzw. eine Trennfunktion geschätzt werden. Diese ist im Zwei- Gruppen-Fall Y = b 0 + b 1 x 1 + b 2 x b j x j b J x J,mit (56) Y als Diskriminanzvariable, x j als Variable j (j =1,...,J), b j als Diskriminanzkoeffizient der Variable j und b 0 als konstantes Absolutglied. Y kann also nur zwei Werte annehmen, nämlich die Gruppenzugehörigkeit oder die Nichtgruppenzugehörigkeit. Die Variablen x j müssen für alle j metrisch 69

3 sein. Es gilt, die Koeffizienten b j zu schätzen. Nach der Schätzung der obigen Diskriminanzfunktion können für Objekte Diskriminanzwerte berechnet werden. Kleines Beispiel Es werden zwei Gruppen betrachtet. Zwischen diesen wird durch zwei Variablen diskriminatorisch unterschieden. Die entsprechende Diskriminanzfunktion sei Y = b 0 + b 1 x 1 + b 2 x 2. (57) Um zwischen zwei Gruppen unterscheiden zu können, bedarf es der Betrachtung der Centroiden der jeweiligen Gruppe. Diese Centroiden sind definiert als Ȳ g = 1 I g Σ Ig i=1y ig,mit (58) Y g als Gruppencentroid der Gruppe g (hier: g =1, 2), I g als Anzahl der Objekte in Gruppe g und Y ig als Wert der Diskriminanzfunktion für Objekt i, das der Gruppe g angehört. Die Unterschiedlichkeit zweier Gruppen ist definiert als Betrag der Differenz der beiden Gruppencentroiden: Ȳ1 Ȳ2. (59) Dieser Zusammenhang kann wie folgt dargestellt werden: Ȳ 1 ist hier der Centroid der Gruppe 1 und Ȳ2 ist der Centroid der Gruppe 2. Y ist der kritische Diskriminanzwert bzw. das Trennkriterium zur Diskriminierung der beiden Gruppen. Angenommen 70

4 Y = x 1 0, 5x 2,mitb 0 =0und Y =0. (60) Das Objekt i habe nun die Werte x 1i = 4 und x 2i = 6. Dann ergibt sich ein Diskriminanzwert für Objekt i gleich 1. Da 1 > 0=Y,wirddasObjekt i in Gruppe 2 klassifiziert. Es gilt also, die Koeffizienten der Diskriminanzfunktion zu schätzen. Diese Schätzung soll optimal zwischen den betrachteten Gruppen trennen. Hierfür wird das Diskriminanzkriterium als zu maximierendes Zielkriterium gewählt. Ein Maß als Diskriminanzkriterium für die Unterschiedlichkeit von Gruppen sei Ȳ1 Ȳ2 (61) als Distanz zwischen den Gruppencentroiden, die es zu maximieren gilt. Problematisch in diesem Zusammenhang ist eine gegebenenfalls vorhandene starke Streuung innerhalb der beiden Gruppen. Diese kann zu Fehlschlüssen bei der Klassifizierung von Objekten führen: Ein besseres Maß als zu maximierendes Diskriminanzkriterium für die Unterschiedlichkeit von Gruppen ist die standardisierte Distanz: 71

5 Ȳ1 Ȳ2,mit (62) s s als Standardabweichung der Diskriminanzwerte Y. Zur Verwendung dieses Diskriminanzkriteriums müssen allerdings zwei Voraussetzungen erfüllt sein: i. Es werden lediglich zwei Gruppen betrachtet und ii. die beiden Gruppen sollten eine möglichst gleiche Streuung bezüglich der Diskriminanzwerte haben, d. h. wenn s s Y s Y1 s Y2. (63) Es kann gezeigt werden, dass i. und ii. nicht berücksichtigt werden müssen, als Streuung zwischen den Gruppen Γ= (64) Streuung in den Gruppen als Diskriminanzkriterium gewählt wird. Γ kann auch geschrieben werden Γ= ΣG g=1 I g (Ȳg Ȳ )2 Σ G g=1σ Ig i=1(y gi Ȳg) = ss b, (65) 2 ss w mit I g als Anzahl der Objekte in Gruppe g, ss b als Streuung zwischen den Gruppen bzw. als durch die Diskriminanzfunktion erklärte Streuung und ss w als Streuung in den Gruppen bzw. als durch die Diskriminanzfunktion nicht erklärte Streuung. Die Gesamtstreuung wird dann auch geschrieben als ss w. ss =Σ G g=1σ Ig i=1(y gi Ȳ )2, (66) wobei diese Gesamtstreuung ss wie folgt zerlegt werden kann: ss = ss b + 72

6 Das Absolutglied b 0 in der Diskriminanzfunktion Y = b 0 + b 1 x 1 + b 2 x b j x j b J x J verändert zwar die Lage der Y,abernichtderen Streuung: D. h. das b 0 kann so gewählt werden, dass der kritische Diskriminanzwert Y gleich null ist. Zusammenfassend kann also festgehalten werden, dass bei der Schätzung der Diskriminanzfunktion folgendes Optimierungsproblem gelöst werden muss: max b1,b 2,...,b j,...,b J Γ. (67) Beispiel (fortgesetzt) Im Kreditinstitut entscheidet man sich für die Schätzung der Diskriminanzfunktion Y = b 0 + b 1 x 1 + b 2 x 2, (68) mit x 1 als Alter von Kreditkunden des alten Kundenbestandes und x 2 als Höhe des monatlichen Nettoeinkommens der Kunden. Güte der Diskriminanzfunktion Die Überprüfung der Güte bzw. Trennkraft einer Diskriminanzfunktion kann auf zwei Wegen vorgenommen werden: Zum einen kann eine Klassifizierungstabelle betrachtet werden, die die ursprüngliche Klassifizierung mit der Klassifizierung durch die Diskriminanzfunktion vergleicht. Eine weitere Beurteilung der Güte einer Diskriminazfunktion basiert auf dem Diskrimi- 73

7 nanzkriterium Γselbst. Die Klassifizierungstabelle spiegelt - wie in der binären logistischen Regression - die Quote der richtig klassifizierten Objekte wider: Gruppe 1 Gruppe 2 Gruppe 1 Gruppe 2 In der Vorspalte stehen die Angaben zur ursprünglichen Klassifizierung der Objekte und in der Kopfzeile stehen die Angaben zur Klassifizierung, die durch die Diskriminanzanalyse gewonnen wurde. Die Angaben können als absolute und relative Häufigkeiten angegeben werden. Zudem ist ersichtlich, dass die Struktur der Tabelle eine Erweiterung auf den Mehr-Gruppen-Fall möglich macht (ähnlich zu der Klassifizierungstabelle in der multinomialen logistischen Regression). Die Betrachtung der Klassifizierungstabelle sollte - wie in der logistischen Regression - allerdings erst dann erfolgen, wenn auf Basis von Trainingsdaten die Diskriminanzfunktion geschätzt worden ist und die Klassifizierungsgüte dann mit Testdaten vorgenommen wurde. Man betrachtet dann also eine bereinigte Quote der richtig klassifizierten Objekte. Zur Beurteilung der Güte kann das Diskriminanzkriterium Γbzw.die Ausprägung γ selbst betrachtet werden. Dieser Wert ist der maximale Wert des Diskriminanzkriteriums selbst: γ = ss b ss w = erklärte Streuung nicht erklärte Streuung. (69) Problematisch in diesem Zusammenhang ist, dass dieser Wert nicht normiert ist. Um einen normierten Wert zu erhalten, bedient man sich folgender Quotienten: 74

8 γ 1+γ = ss b ss b + ss w = erklärte Streuung Gesamtstreuung oder (70) 1 1+γ = ss w ss b + ss w = nicht erklärte Streuung. (71) Gesamtstreuung Üblicherweise wird der kanonische Korrelationskoeffizient betrachtet: γ erklärte Streuung c = 1+γ = Gesamtstreuung. (72) Ein ebenfalls gebräuchliches Gütekriterium ist Wilks-Lambda Λ: Λ= 1 1+γ nicht erklärte Streuung =. (73) Gesamtstreuung Es ist ersichtlich, dass kleine Werte Λ auf eine bessere Güte bzw. Trennkraft der geschätzten Diskriminanzfunktion hinweisen und umgekehrt. Der kanonische Korrelationskoeffizient c und Wilks-Lambda können in Beziehung zueinander gebracht werden: c 2 +Λ=1. (74) Wilks-Lambda kann so transformiert werden, dass eine Teststatistik berechnet werden kann und auf dieser Basis die Nullhypothese überprüft werden kann, dass sich beide Gruppen nicht unterscheiden. Es wird also angenommen, dass der Zwei-Gruppen-Fall betrachtet wird. Die Teststatistik wird hier berechnet über χ 2 = [n J + G 1] ln Λ. (75) 2 n ist in obiger Formel gleich der Anzahl der Beobachtungen, J ist die Anzahl der in der Diskriminanzfunktion berücksichtigten Variablen und G ist die Anzahl der betrachteten Gruppen. Diese Teststatistik ist χ 2 -verteilt 75

9 mit J (G 1) Freiheitsgraden. Die Nulhypothese wird abgelehnt, wenn die Teststatistik größer ist als χ 2 J (G 1),1 α. Beispiel (fortgesetzt) Die im Kreditinstitut geschätzte Diskriminanzfunktion soll auf ihre Güte überprüft werden Hierfür werden der kanonische Korrelationskoeffizient c und Wilks-Lambda Λ berechnet. Zudem wird auf Basis des letzteren Werts die Nullhypothese überprüft, ob sich beide Gruppen nicht unterscheiden. Der Wert des kanonischen Korrelationskoeffizienten c beträgt 0, 317 und ist für das Kreditinstitut kaum ausreichend, da die Wurzel des Anteils der erklärten Streuung an der Gesamtstreuung relativ klein ist. Für den vorliegenden Fall wird c berechnet über γ = 0,112 =0, 317 = c. Wilks- 1+γ 1+0,112 Lambda beträgt im vorliegenden Fall 0, 9 und deutet auf eine Güte hin, die für das Kreditinstitut ebenfalls kaum ausreichend ist. Schließlich sollte diese Kennzahl möglichst nahe null sein. Wilks-Lambda wird hier berechnet über 1 = 1 1+γ 1+0,112 =0, 9: 76

10 Die Nullhypothese, dass beide Gruppen - die Kreditwürdigen und die Nichtkreditwürdigen - sich nicht unterscheiden, wird zu jedem Signifikanzniveau abgelehnt. Die Teststatistik beträgt 126, 599 und wird berechnet über χ 2 = [ ] ln 0, 9 = 126, Klassifizierung von neuen Objekten Bei der Diskriminanzanalyse gibt es drei verschiedene Wege, neue Objekte zu klassifizieren: das Distanzkonzept, die Klassifizierungsfunktion und das Wahrscheinlichkeitskonzept. Distanzkonzept Dieser Ansatz zur Klassifizierung eines neuen Objekts erfolgt im einfachsten Fall auf Basis der Distanz des Diskriminanzwerts des neuen Objekts und der Gruppencentroiden. Als Distanzmaß wird üblicherweise die quadrierte euklidische Distanz verwendet 10 : 10 Distanzmaße werden ausführlich im Zusammenhang mit der Clusteranalyse betrachtet. D 2 ig =(Y i Ȳg) 2. (76) 77

11 Diese Distanz spiegelt die Ähnlichkeit des neuen Objektes mit den betrachteten Gruppen(-centroiden) wider: Je kleiner der Distanzwert Dig 2,desto ähnlicher sind sich Objekt und Gruppe. Betrachtet man den Zwei-Gruppen- Fall (g = 1, 2), dann wird ein neues Objekt derjenigen Gruppe zugeordnet, die die geringste Distanz zum neuen Objekt hat. Dieser Ansatz kann folgendermaßen veranschaulicht werden: Klassifizierungsfunktion Bei Verwendung einer Klassifizierungsfunktion - hier der Klassifizierungsfunktion nach Fischer - wird für jede betrachtete Gruppe eine Funktion generiert, auf deren Basis dann eine Klassifizierung von neuen Objekten vorgenommen wird. Im einfachsten Fall zweier Gruppen müssen also zwei Klassifizierungsfunktionen generiert werden. Die allgemeine Darstellungsweise dieser Funktionen im Zwei-Gruppen-Fall ist dann: F 1 = b 01 + b 11 x 1 + b 21 x b j1 x j b J1 x J und F 2 = b 02 + b 12 x 1 + b 22 x b j2 x j b J2 x J. (77) Soll nun ein neues Objekt klassifiziert werden, so wird für jege der zwei Gruppen jeweils ein F-Wert berechnet. Das Objekt wird dann derjenigen Gruppe zugeordnet, die den höheren F-Wert hat. Wahrscheinlichkeitskonzept Ein neues Objekt wird unter Verwendung des Wahrscheinlichkeitskonzepts dann einer Gruppe zugeordnet, wenn die berechnete Wahrscheinlichkeit für eine Gruppe am größten ist. Die relevante Wahrscheinlichkeit ist die be- 78

12 dingte Wahrscheinlichkeit, einer Gruppe g anzugehören unter der Bedingung, dass sich ein Diskriminanzwert in Höhe von Y i ergeben hat: P (g Y i )= P (Y i g) P i (g) Σ G g=1p (Y i g) P i (g). (78) Es kann gezeigt werden, dass obige bedingte Wahrscheinlichkeit berechnet werden kann über: P (g Y i )= e D 2 ig 2 P i (g) Σ G g=1e D2 ig 2 P i (g), (79) mit Dig 2 als quadrierter euklidischer Distanz zwischen dem Objekt i und dem Gruppencentroiden und P i (g) als Wahrscheinlichkeit (A-priori-Wahrscheinlichkeit) des Objektes i der Gruppe g anzugehören. Anzumerken zu allen drei Ansätzen zur Klassifizierung neuer Objekte ist noch, dass sie allesamt verschiedene Bedingungen erfüllen können und somit zu abweichenden Ergebnissen führen können. Ein Beispiel hierfür ist beispielsweise die Möglichkeit der Berücksichtigung von A-priori-Wahrscheinlichkeiten bei Klassifizierungsfunktionen und beim Wahrscheinlichkeitskonzept, was bei dem Distanzkonzept nicht möglich ist. Die Berücksichtigung von A-priori-Wahrscheinlichkeiten impliziert die Berücksichtigung von ungleicher Verteilung von Objekten auf verschiedene Gruppen vor Durchführung der Diskriminanzanalyse. Beispiel (fortgesetzt) Welche Werte nehmen die Werte der Diskriminanzfunktion an, wenn es gilt, neue Objekte in kreditwürdige Kunden einzuordnen? Das Ergebnis sieht wie folgt aus: 79

13 Auf Bais dieser Ergebnisse kann die geschätzte Diskriminanzfunktion also geschrieben werden als Y = 0, 965 0, 022 Alter+0, 317 Nettoeinkommen. Würde das Kreditinstitut nun einen Neukunden mit dem Alter 31 und einem monatlichen Nettoeinkommen in Höhe von 14 klassifizieren wollen, so ergäbe sich ein Diskriminanzwert in Höhe von 2, 791. Würde das Institut einen kritischen Diskriminanzwert von Y = 0 festlegen, so müsste es diesem Neukunden einen Kredit bewilligen. Wie sehen die Ergebnisse aus, wenn man eine Klassifizierung von Neukunden auf Basis der Klassifizierungsfunktionen nach Fischer vornehmen würde? Die Ergebnisse sind die folgenden: 80

14 Es ergibt sich somit eine Klassifizierungsfunktion F 0 = 4, , 135 Alter+0, 322 Nettoeinkommen für die erste Gruppe der Nichtkreditwürdigen und eine Klassifizierungsfunktion F 1 = 5, , 116 Alter +0, 594 Nettoeinkommen für die zweite Gruppe der Kreditwürdigen. Im Kreditinstitut will man wiederum den gleichen Kunden wie oben klassifizieren, dieses Mal allerdings mit dem hier gewählten Ansatz. Für die erste Klassifizierungsfunktion ergibt sich ein Wert in Höhe von 3, 885 und für die zweite Klassifizierungsfunktion ein Wert in Höhe von 6, 508. Somit würde der Neukunde auf dieser Basis ebenfalls einen Kredit bewilligt bekommen. Wie erfolgt die Klassifizierung nach dem Wahrscheinlichkeitskonzept? Hierzu dienen folgende Ergebnisse: 81

15 Die Wahrscheinlichkeit, der Gruppe 1 anzugehören unter der Bedingung D = d beträgt hier 0, 933 für den oben betrachteten Neukunden, so dass dieser auf Basis dieses Entscheidunskriteriums wiederum der Gruppe 1 zugeordnet wird. Die gespeicherten Daten im Dateneditor sehen wie folgt aus: Schließlich interessiert man sich im Kreditinstitut auch noch für das Gütekriterium Klassifizierungstabelle. Diese hat folgendes Aussehen: 82

16 Es wird ersichtlich, dass insgesamt 66, 5% aller berücksichtigten Fälle durch die Diskriminanzanalyse richtig klassifiziert wurden. Man stellt sich die Frage, ob man vorab eine Kreuzvalidierung hätte durchführen sollen, um verläßlichere Ergebnisse zu erzielen. Schließlich dienen die folgenden beiden Grafiken noch zur Aufhellung der Zusammenhänge: 83

17 Die Werte der beiden Gruppencentroiden sind hierbei diese beiden Werte: 84

Proseminar Verarbeitung geographischer Daten (Quant II) Sommersemester 2001 Daniel Braunschweiger Achim Schmidt Tobias Spaltenberger

Proseminar Verarbeitung geographischer Daten (Quant II) Sommersemester 2001 Daniel Braunschweiger Achim Schmidt Tobias Spaltenberger Proseminar Verarbeitung geographischer Daten (Quant II) Sommersemester 2001 Daniel Braunschweiger Achim Schmidt Tobias Spaltenberger Diskriminanzanalyse am Fallbeispiel von 23 Klimastationen in Tunesien

Mehr

Multinomiale logistische Regression

Multinomiale logistische Regression Multinomiale logistische Regression Die multinomiale logistische Regression dient zur Schätzung von Gruppenzugehörigkeiten bzw. einer entsprechenden Wahrscheinlichkeit hierfür, wobei als abhänginge Variable

Mehr

Multivariate Verfahren

Multivariate Verfahren Multivariate Verfahren Lineare Reression Zweck: Vorhersae Dimensionsreduktion Klassifizierun Hauptkomponentenanalyse Korrespondenzanalyse Clusteranalyse Diskriminanzanalyse Eienschaften: nicht-linear verteilunsfrei

Mehr

Hans-Friedrich Eckey SS 2004. Skript zur Lehrveranstaltung Multivariate Statistik

Hans-Friedrich Eckey SS 2004. Skript zur Lehrveranstaltung Multivariate Statistik Hans-Friedrich Eckey SS 2004 Skript zur Lehrveranstaltung Multivariate Statistik Vormerkungen I Vorbemerkungen Das Manuskript beinhaltet den gesamten Stoff, der Bestandteil der Lehrveranstaltung "Multivariate

Mehr

Marketing Analytics. Diskriminanzanalyse

Marketing Analytics. Diskriminanzanalyse Institut für Angewandtes Markt-Management Prof. Dr. Wolfgang Müller Reihe Studienmanuskript Band 11 Marketing Analytics Diskriminanzanalyse Dortmund, WS 2015/2016 Fachhochschule Dortmund University of

Mehr

Willkommen zur Vorlesung Statistik

Willkommen zur Vorlesung Statistik Willkommen zur Vorlesung Statistik Thema dieser Vorlesung: Varianzanalyse Prof. Dr. Wolfgang Ludwig-Mayerhofer Universität Siegen Philosophische Fakultät, Seminar für Sozialwissenschaften Prof. Dr. Wolfgang

Mehr

Weitere Fragestellungen im Zusammenhang mit einer linearen Einfachregression

Weitere Fragestellungen im Zusammenhang mit einer linearen Einfachregression Weitere Fragestellungen im Zusammenhang mit einer linearen Einfachregression Speziell im Zusammenhang mit der Ablehnung der Globalhypothese werden bei einer linearen Einfachregression weitere Fragestellungen

Mehr

Inhaltsverzeichnis. Regressionsanalyse. http://mesosworld.ch - Stand vom: 20.1.2010 1

Inhaltsverzeichnis. Regressionsanalyse. http://mesosworld.ch - Stand vom: 20.1.2010 1 Inhaltsverzeichnis Regressionsanalyse... 2 Lernhinweise... 2 Einführung... 2 Theorie (1-8)... 2 1. Allgemeine Beziehungen... 3 2. 'Best Fit'... 3 3. 'Ordinary Least Squares'... 4 4. Formel der Regressionskoeffizienten...

Mehr

Franz Kronthaler. Statistik angewandt. Datenanalyse ist (k)eine Kunst. Excel Edition. ^ Springer Spektrum

Franz Kronthaler. Statistik angewandt. Datenanalyse ist (k)eine Kunst. Excel Edition. ^ Springer Spektrum Franz Kronthaler Statistik angewandt Datenanalyse ist (k)eine Kunst Excel Edition ^ Springer Spektrum Inhaltsverzeichnis Teil I Basiswissen und Werkzeuge, um Statistik anzuwenden 1 Statistik ist Spaß 3

Mehr

Fortgeschrittene Statistik Logistische Regression

Fortgeschrittene Statistik Logistische Regression Fortgeschrittene Statistik Logistische Regression O D D S, O D D S - R A T I O, L O G I T T R A N S F O R M A T I O N, I N T E R P R E T A T I O N V O N K O E F F I Z I E N T E N, L O G I S T I S C H E

Mehr

Kommentierte Formelsammlung multivariater statistischer Verfahren. Prof. Dr. Irene Rößler Prof. Dr. Albrecht Ungerer

Kommentierte Formelsammlung multivariater statistischer Verfahren. Prof. Dr. Irene Rößler Prof. Dr. Albrecht Ungerer Kommentierte Formelsammlung multivariater statistischer Verfahren Prof Dr Irene Rößler Prof Dr Albrecht Ungerer Inhaltsverzeichnis i Inhaltsverzeichnis Verfahren im Überblick Beispieldatensatz 1 1 Multiple

Mehr

Lösungen zu Janssen/Laatz, Statistische Datenanalyse mit SPSS 1

Lösungen zu Janssen/Laatz, Statistische Datenanalyse mit SPSS 1 LÖSUNG 9B a) Lösungen zu Janssen/Laatz, Statistische Datenanalyse mit SPSS 1 Man kann erwarten, dass der Absatz mit steigendem Preis abnimmt, mit höherer Anzahl der Außendienstmitarbeiter sowie mit erhöhten

Mehr

Kommentierter SPSS-Ausdruck zur logistischen Regression

Kommentierter SPSS-Ausdruck zur logistischen Regression Daten: POK V AG 3 (POKV_AG3_V07.SAV) Kommentierter SPSS-Ausdruck zur logistischen Regression Fragestellung: Welchen Einfluss hat die Fachnähe und das Geschlecht auf die interpersonale Attraktion einer

Mehr

Commercial Banking Übung 1 Kreditscoring

Commercial Banking Übung 1 Kreditscoring Commercial Banking Übung Kreditscoring Dr. Peter Raupach raupach@wiwi.uni-frankfurt.de Sprechzeit Dienstag 6-7:00 Uhr Raum 603 B Kreditscoring Gliederung Grundanliegen Das Sample Modellspezifikation Diskriminanzanalyse

Mehr

Tutorial: Homogenitätstest

Tutorial: Homogenitätstest Tutorial: Homogenitätstest Eine Bank möchte die Kreditwürdigkeit potenzieller Kreditnehmer abschätzen. Einerseits lebt die Bank ja von der Vergabe von Krediten, andererseits verursachen Problemkredite

Mehr

Willkommen zur Vorlesung Statistik (Master)

Willkommen zur Vorlesung Statistik (Master) Willkommen zur Vorlesung Statistik (Master) Thema dieser Vorlesung: Verteilungsfreie Verfahren Prof. Dr. Wolfgang Ludwig-Mayerhofer Universität Siegen Philosophische Fakultät, Seminar für Sozialwissenschaften

Mehr

Beurteilung der biometrischen Verhältnisse in einem Bestand. Dr. Richard Herrmann, Köln

Beurteilung der biometrischen Verhältnisse in einem Bestand. Dr. Richard Herrmann, Köln Beurteilung der biometrischen Verhältnisse in einem Bestand Dr. Richard Herrmann, Köln Beurteilung der biometrischen Verhältnisse in einem Bestand 1 Fragestellung Methoden.1 Vergleich der Anzahlen. Vergleich

Mehr

Begriffsbestimmung CRISP-DM-Modell Betriebswirtschaftliche Einsatzgebiete des Data Mining Web Mining und Text Mining

Begriffsbestimmung CRISP-DM-Modell Betriebswirtschaftliche Einsatzgebiete des Data Mining Web Mining und Text Mining Gliederung 1. Einführung 2. Grundlagen Data Mining Begriffsbestimmung CRISP-DM-Modell Betriebswirtschaftliche Einsatzgebiete des Data Mining Web Mining und Text Mining 3. Ausgewählte Methoden des Data

Mehr

Lösungen zu den Übungsaufgaben aus Kapitel 3

Lösungen zu den Übungsaufgaben aus Kapitel 3 Lösungen zu den Übungsaufgaben aus Kapitel 3 Ü3.1: a) Die Start-Buchungslimits betragen b 1 = 25, b 2 = 20 und b 3 = 10. In der folgenden Tabelle sind jeweils die Annahmen ( ) und Ablehnungen ( ) der Anfragen

Mehr

Das Dialogfeld für die Regressionsanalyse ("Lineare Regression") findet sich im Statistik- Menu unter "Regression"-"Linear":

Das Dialogfeld für die Regressionsanalyse (Lineare Regression) findet sich im Statistik- Menu unter Regression-Linear: Lineare Regression Das Dialogfeld für die Regressionsanalyse ("Lineare Regression") findet sich im Statistik- Menu unter "Regression"-"Linear": Im einfachsten Fall werden mehrere Prädiktoren (oder nur

Mehr

a) Zeichnen Sie in das nebenstehende Streudiagramm mit Lineal eine Regressionsgerade ein, die Sie für passend halten.

a) Zeichnen Sie in das nebenstehende Streudiagramm mit Lineal eine Regressionsgerade ein, die Sie für passend halten. Statistik für Kommunikationswissenschaftler Wintersemester 2009/200 Vorlesung Prof. Dr. Helmut Küchenhoff Übung Cornelia Oberhauser, Monia Mahling, Juliane Manitz Thema 4 Homepage zur Veranstaltung: http://www.statistik.lmu.de/~helmut/kw09.html

Mehr

Aufgabenstellung Aufgabe 1: Betrachten Sie das folgende ökonometrische Modell: y t = α + βx t + u t (1)

Aufgabenstellung Aufgabe 1: Betrachten Sie das folgende ökonometrische Modell: y t = α + βx t + u t (1) Klausur: Einführung in die Ökonometrie Prüfer: Prof. Dr. Karl-Heinz Paqué Dr.Ludwigv.Auer Semester: WS 1999/00 Als Hilfsmittel sind zugelassen: nicht-programmierbarer Taschenrechner Diese Klausur besteht

Mehr

Klausur zur Vorlesung Multivariate Verfahren, SS 2006 6 Kreditpunkte, 90 min

Klausur zur Vorlesung Multivariate Verfahren, SS 2006 6 Kreditpunkte, 90 min Klausur, Multivariate Verfahren, SS 2006, 6 Kreditpunkte, 90 min 1 Prof. Dr. Fred Böker 08.08.2006 Klausur zur Vorlesung Multivariate Verfahren, SS 2006 6 Kreditpunkte, 90 min Gesamtpunkte: 39 Aufgabe

Mehr

Eine Einführung in R: Statistische Tests

Eine Einführung in R: Statistische Tests Eine Einführung in R: Statistische Tests Bernd Klaus, Verena Zuber Institut für Medizinische Informatik, Statistik und Epidemiologie (IMISE), Universität Leipzig http://www.uni-leipzig.de/ zuber/teaching/ws12/r-kurs/

Mehr

Herzlich Willkommen zur Vorlesung Statistik

Herzlich Willkommen zur Vorlesung Statistik Herzlich Willkommen zur Vorlesung Statistik Thema dieser Vorlesung: Kovarianz und Korrelation Prof. Dr. Wolfgang Ludwig-Mayerhofer Universität Siegen Philosophische Fakultät, Seminar für Sozialwissenschaften

Mehr

Datamining Cup Lab 2005

Datamining Cup Lab 2005 Datamining Cup Lab 2005 Arnd Issler und Helga Velroyen 18. Juli 2005 Einleitung Jährlich wird der Datamining Cup 1 von der Firma Prudsys und der TU Chemnitz veranstaltet. Im Rahmen des Datamining-Cup-Praktikums

Mehr

Multivariate Statistik

Multivariate Statistik Hermann Singer Multivariate Statistik 1 Auflage 15 Oktober 2012 Seite: 12 KAPITEL 1 FALLSTUDIEN Abbildung 12: Logistische Regression: Geschätzte Wahrscheinlichkeit für schlechte und gute Kredite (rot/blau)

Mehr

OPERATIONS-RESEARCH (OR)

OPERATIONS-RESEARCH (OR) OPERATIONS-RESEARCH (OR) Man versteht darunter die Anwendung mathematischer Methoden und Modelle zur Vorbereitung optimaler Entscheidungen bei einem Unternehmen. Andere deutsche und englische Bezeichnungen:

Mehr

Codierungstheorie Rudolf Scharlau, SoSe 2006 9

Codierungstheorie Rudolf Scharlau, SoSe 2006 9 Codierungstheorie Rudolf Scharlau, SoSe 2006 9 2 Optimale Codes Optimalität bezieht sich auf eine gegebene Quelle, d.h. eine Wahrscheinlichkeitsverteilung auf den Symbolen s 1,..., s q des Quellalphabets

Mehr

Regressionsanalysen. Zusammenhänge von Variablen. Ziel der Regression. ( Idealfall )

Regressionsanalysen. Zusammenhänge von Variablen. Ziel der Regression. ( Idealfall ) Zusammenhänge von Variablen Regressionsanalysen linearer Zusammenhang ( Idealfall ) kein Zusammenhang nichtlinearer monotoner Zusammenhang (i.d.regel berechenbar über Variablentransformationen mittels

Mehr

Clusteranalyse. Multivariate Datenanalyse. Prof. Dr. Dietmar Maringer. Abteilung für Quantitative Methoden, WWZ der Universität Basel

Clusteranalyse. Multivariate Datenanalyse. Prof. Dr. Dietmar Maringer. Abteilung für Quantitative Methoden, WWZ der Universität Basel Clusteranalyse Multivariate Datenanalyse Prof. Dr. Dietmar Maringer Abteilung für Quantitative Methoden, WWZ der Universität Basel Herbstsemester 2013 D Maringer: Datenanalyse Clusteranalyse (1) Ausgangssituation

Mehr

Multivariate Analysemethoden

Multivariate Analysemethoden Multivariate Analysemethoden 30.04.2014 Günter Meinhardt Johannes Gutenberg Universität Mainz Einführung Was sind multivariate Analysemethoden? Vorlesung Übung/Tut Prüfung Verfahrensdarstellung in Überblick

Mehr

Sozialwissenschaftliche Fakultät der Universität Göttingen. Sommersemester 2009. Statistik mit SPSS

Sozialwissenschaftliche Fakultät der Universität Göttingen. Sommersemester 2009. Statistik mit SPSS Sommersemester 2009 Statistik mit SPSS 15. Mai 2009 15. Mai 2009 Statistik Dozentin: mit Esther SPSSOchoa Fernández 1 Überblick 1. Korrelationsanalysen Kovariation und Kovarianz Korrelation: - Interpretation

Mehr

Die Clusteranalyse 24.06.2009. Clusteranalyse. Grundidee Mögliche Anwendungsgebiete gg Vorgehensweise Beispiele. methodenlehre ll Clusteranalyse

Die Clusteranalyse 24.06.2009. Clusteranalyse. Grundidee Mögliche Anwendungsgebiete gg Vorgehensweise Beispiele. methodenlehre ll Clusteranalyse Clusteranalyse Thomas Schäfer SS 2009 1 Die Clusteranalyse Grundidee Mögliche Anwendungsgebiete gg Vorgehensweise Beispiele Thomas Schäfer SS 2009 2 1 Die Clusteranalyse Grundidee: Eine heterogene Gesamtheit

Mehr

Tabelle 6a: Deskriptive Statistiken der metrischen Variablen

Tabelle 6a: Deskriptive Statistiken der metrischen Variablen Ergebnisse 77 5 Ergebnisse Das folgende Kapitel widmet sich der statistischen Auswertung der Daten zur Ü- berprüfung der Hypothesen. Die hier verwendeten Daten wurden mit den in 4.3 beschriebenen Instrumenten

Mehr

Klausur Wirtschaftsmathematik Lösungshinweise

Klausur Wirtschaftsmathematik Lösungshinweise Klausur Wirtschaftsmathematik Lösungshinweise Prüfungsdatum: 27. Juni 2015 Prüfer: Etschberger Studiengang: Wirtschaftsingenieurwesen Aufgabe 1 16 Punkte Anton Arglos hat von seiner Großmutter 30 000 geschenkt

Mehr

Business Value Launch 2006

Business Value Launch 2006 Quantitative Methoden Inferenzstatistik alea iacta est 11.04.2008 Prof. Dr. Walter Hussy und David Tobinski UDE.EDUcation College im Rahmen des dokforums Universität Duisburg-Essen Inferenzstatistik Erläuterung

Mehr

Nachholklausur STATISTIK II

Nachholklausur STATISTIK II Nachholklausur STATISTIK II Name, Vorname: Matrikel-Nr.: Die Klausur enthält zwei Typen von Aufgaben: T e i l A besteht aus Fragen mit mehreren vorgegebenen Antwortvorschlägen, von denen mindestens eine

Mehr

9. Schätzen und Testen bei unbekannter Varianz

9. Schätzen und Testen bei unbekannter Varianz 9. Schätzen und Testen bei unbekannter Varianz Dr. Antje Kiesel Institut für Angewandte Mathematik WS 2011/2012 Schätzen und Testen bei unbekannter Varianz Wenn wir die Standardabweichung σ nicht kennen,

Mehr

Kapitel 27 Distanz- und Ähnlichkeitsmaße

Kapitel 27 Distanz- und Ähnlichkeitsmaße Kapitel 7 Distanz- und Ähnlichkeitsmaße 7.1 Einführung Sowohl Distanz- als auch Ähnlichkeitsmaße dienen dazu, die Ähnlichkeit verschiedener Fälle oder Variablen zu quantifizieren. Beide Maße untersuchen,

Mehr

Korrelation - Regression. Berghold, IMI

Korrelation - Regression. Berghold, IMI Korrelation - Regression Zusammenhang zwischen Variablen Bivariate Datenanalyse - Zusammenhang zwischen 2 stetigen Variablen Korrelation Einfaches lineares Regressionsmodell 1. Schritt: Erstellung eines

Mehr

Logistische Regression

Logistische Regression TU Chemnitz SoSe 2012 Seminar: Multivariate Analysemethoden 26.06.2012 Dozent: Dr. Thomas Schäfer Logistische Regression Ein Verfahren zum Schätzen von Wahrscheinlichkeiten Referentinnen: B. Sc. Psych.

Mehr

Name (in Druckbuchstaben): Matrikelnummer: Unterschrift:

Name (in Druckbuchstaben): Matrikelnummer: Unterschrift: 20-minütige Klausur zur Vorlesung Lineare Modelle im Sommersemester 20 PD Dr. Christian Heumann Ludwig-Maximilians-Universität München, Institut für Statistik 2. Oktober 20, 4:5 6:5 Uhr Überprüfen Sie

Mehr

Klausur zu Methoden der Statistik I (mit Kurzlösung) Sommersemester 2008. Aufgabe 1

Klausur zu Methoden der Statistik I (mit Kurzlösung) Sommersemester 2008. Aufgabe 1 Lehrstuhl für Statistik und Ökonometrie der Otto-Friedrich-Universität Bamberg Prof. Dr. Susanne Rässler Klausur zu Methoden der Statistik I (mit Kurzlösung) Sommersemester 2008 Aufgabe 1 I) Einige Mitarbeiter

Mehr

Entscheidungsbaumverfahren

Entscheidungsbaumverfahren Entscheidungsbaumverfahren Allgemeine Beschreibung Der Entscheidungsbaum ist die Darstellung einer Entscheidungsregel, anhand derer Objekte in Klassen eingeteilt werden. Die Klassifizierung erfolgt durch

Mehr

Einführung in die statistische Datenanalyse I

Einführung in die statistische Datenanalyse I Einführung in die statistische Datenanalyse I Inhaltsverzeichnis 1. EINFÜHRUNG IN THEORIEGELEITETES WISSENSCHAFTLICHES ARBEITEN 2 2. KRITIERIEN ZUR AUSWAHL STATISTISCH METHODISCHER VERFAHREN 2 3. UNIVARIATE

Mehr

Multiple Regression. Ziel: Vorhersage der Werte einer Variable (Kriterium) bei Kenntnis der Werte von zwei oder mehr anderen Variablen (Prädiktoren)

Multiple Regression. Ziel: Vorhersage der Werte einer Variable (Kriterium) bei Kenntnis der Werte von zwei oder mehr anderen Variablen (Prädiktoren) Multiple Regression 1 Was ist multiple lineare Regression? Ziel: Vorhersage der Werte einer Variable (Kriterium) bei Kenntnis der Werte von zwei oder mehr anderen Variablen (Prädiktoren) Annahme: Der Zusammenhang

Mehr

Linearer Zusammenhang von Datenreihen

Linearer Zusammenhang von Datenreihen Linearer Zusammenhang von Datenreihen Vielen Problemen liegen (möglicherweise) lineare Zusammenhänge zugrunde: Mein Internetanbieter verlangt eine Grundgebühr und rechnet minutenweise ab Ich bestelle ein

Mehr

Varianzanalyse ANOVA

Varianzanalyse ANOVA Varianzanalyse ANOVA Johannes Hain Lehrstuhl für Mathematik VIII Statistik 1/23 Einfaktorielle Varianzanalyse (ANOVA) Bisher war man lediglich in der Lage, mit dem t-test einen Mittelwertsvergleich für

Mehr

5 Zusammenhangsmaße, Korrelation und Regression

5 Zusammenhangsmaße, Korrelation und Regression 5 Zusammenhangsmaße, Korrelation und Regression 5.1 Zusammenhangsmaße und Korrelation Aufgabe 5.1 In einem Hauptstudiumsseminar des Lehrstuhls für Wirtschafts- und Sozialstatistik machten die Teilnehmer

Mehr

Analog zu Aufgabe 16.1 werden die Daten durch folgenden Befehl eingelesen: > kredit<-read.table("c:\\compaufg\\kredit.

Analog zu Aufgabe 16.1 werden die Daten durch folgenden Befehl eingelesen: > kredit<-read.table(c:\\compaufg\\kredit. Lösung 16.3 Analog zu Aufgabe 16.1 werden die Daten durch folgenden Befehl eingelesen: > kredit

Mehr

90-minütige Klausur Statistik für Studierende der Kommunikationswissenschaft

90-minütige Klausur Statistik für Studierende der Kommunikationswissenschaft Prof. Dr. Helmut Küchenhoff SS08 90-minütige Klausur Statistik für Studierende der Kommunikationswissenschaft am 22.7.2008 Anmerkungen Überprüfen Sie bitte sofort, ob Ihre Angabe vollständig ist. Sie sollte

Mehr

Analytische Statistik I. Statistische Methoden in der Korpuslinguistik Heike Zinsmeister WS 2009/10

Analytische Statistik I. Statistische Methoden in der Korpuslinguistik Heike Zinsmeister WS 2009/10 Analytische Statistik I Statistische Methoden in der Korpuslinguistik Heike Zinsmeister WS 2009/10 Testen Anpassungstests (goodness of fit) Weicht eine gegebene Verteilung signifikant von einer bekannten

Mehr

- Eine typische Ausfallrate, wie sie bei vielen technischen Anwendungen zu sehen ist hat die Form einer Badewanne, deshalb nennt man diese Kurve auch

- Eine typische Ausfallrate, wie sie bei vielen technischen Anwendungen zu sehen ist hat die Form einer Badewanne, deshalb nennt man diese Kurve auch 1 2 - Eine typische Ausfallrate, wie sie bei vielen technischen Anwendungen zu sehen ist hat die Form einer Badewanne, deshalb nennt man diese Kurve auch Badewannenkurve. -mit der Badewannenkurve lässt

Mehr

Allgemeine Beschreibung von Blockcodes

Allgemeine Beschreibung von Blockcodes Allgemeine Beschreibung von Blockcodes Bei Blockcodierung wird jeweils eine Sequenz von m q binären Quellensymbolen (M q = 2) durch einen Block von m c Codesymbolen mit dem Symbolumfang M c dargestellt.

Mehr

Rekursionen. Georg Anegg 25. November 2009. Methoden und Techniken an Beispielen erklärt

Rekursionen. Georg Anegg 25. November 2009. Methoden und Techniken an Beispielen erklärt Methoden und Techniken an Beispielen erklärt Georg Anegg 5. November 009 Beispiel. Die Folge {a n } sei wie folgt definiert (a, d, q R, q ): a 0 a, a n+ a n q + d (n 0) Man bestimme eine explizite Darstellung

Mehr

Kurzbeschreibung. Eingaben zur Berechnung. Das Optionspreismodell. Mit dem Eurex-OptionMaster können Sie

Kurzbeschreibung. Eingaben zur Berechnung. Das Optionspreismodell. Mit dem Eurex-OptionMaster können Sie Kurzbeschreibung Mit dem Eurex-OptionMaster können Sie - theoretische Optionspreise - Optionskennzahlen ( Griechen ) und - implizite Volatilitäten von Optionen berechnen und die errechneten Preise bei

Mehr

Bachelorabschlussseminar Dipl.-Kfm. Daniel Cracau

Bachelorabschlussseminar Dipl.-Kfm. Daniel Cracau 1 Einführung in die statistische Datenanalyse Bachelorabschlussseminar Dipl.-Kfm. Daniel Cracau 2 Gliederung 1.Grundlagen 2.Nicht-parametrische Tests a. Mann-Whitney-Wilcoxon-U Test b. Wilcoxon-Signed-Rank

Mehr

Regression mit Gretl Eine erste Einführung 1

Regression mit Gretl Eine erste Einführung 1 Kurzeinführung in Gretl S. 1 Regression mit Gretl Eine erste Einführung 1 Installation: Gretl für das entsprechende Betriebssystem herunterladen und die Setup-Datei ausführen. Hinweis: Für die Benutzung

Mehr

Statistik II für Betriebswirte Vorlesung 3

Statistik II für Betriebswirte Vorlesung 3 PD Dr. Frank Heyde TU Bergakademie Freiberg Institut für Stochastik Statistik II für Betriebswirte Vorlesung 3 5. November 2013 Beispiel: Aktiensplit (Aczel & Sounderpandan, Aufg. 14-28) Ein Börsenanalyst

Mehr

riskkv Scorenalyse riskkv Scoring Seite 1 von 9

riskkv Scorenalyse riskkv Scoring Seite 1 von 9 riskkv Scorenalyse riskkv Scoring Seite 1 von 9 Das Modul dient der flexiblen Erstellung, Auswertung und Verwendung von Scores. Durch vordefinierte Templates können in einer Einklicklösung bspw. versichertenbezogene

Mehr

Mit KI gegen SPAM. Proseminar Künstliche Intelligenz

Mit KI gegen SPAM. Proseminar Künstliche Intelligenz Mit KI gegen SPAM Proseminar Künstliche Intelligenz SS 2006 Florian Laib Ausblick Was ist SPAM? Warum SPAM-Filter? Naive Bayes-Verfahren Fallbasiertes Schließen Fallbasierte Filter TiMBL Vergleich der

Mehr

Probeklausur Zeitreihenökonometrie (Sommersemester 2014) 1

Probeklausur Zeitreihenökonometrie (Sommersemester 2014) 1 Probeklausur Zeitreihenökonometrie (Sommersemester 2014) 1 Aufgabe 1: Betrachtet wird folgendes Modell zur Erklärung des Managergehalts salary durch den Umsatz sales, die Eigenkapitalrendite roe und die

Mehr

Einseitig gerichtete Relation: Mit zunehmender Höhe über dem Meeresspiegel sinkt im allgemeinen die Lufttemperatur.

Einseitig gerichtete Relation: Mit zunehmender Höhe über dem Meeresspiegel sinkt im allgemeinen die Lufttemperatur. Statistik Grundlagen Charakterisierung von Verteilungen Einführung Wahrscheinlichkeitsrechnung Wahrscheinlichkeitsverteilungen Schätzen und Testen Korrelation Regression Einführung Die Analyse und modellhafte

Mehr

Institut für Soziologie. Methoden 2. Regressionsanalyse I: Einfache lineare Regression

Institut für Soziologie. Methoden 2. Regressionsanalyse I: Einfache lineare Regression Institut für Soziologie Methoden 2 Regressionsanalyse I: Einfache lineare Regression Programm Anwendungsbereich Vorgehensweise Interpretation Annahmen Zusammenfassung Übungsaufgabe Literatur # 2 Anwendungsbereich

Mehr

Kontingenzkoeffizient (nach Pearson)

Kontingenzkoeffizient (nach Pearson) Assoziationsmaß für zwei nominale Merkmale misst die Unabhängigkeit zweier Merkmale gibt keine Richtung eines Zusammenhanges an 46 o jl beobachtete Häufigkeiten der Kombination von Merkmalsausprägungen

Mehr

Abhängigkeit zweier Merkmale

Abhängigkeit zweier Merkmale Abhängigkeit zweier Merkmale Johannes Hain Lehrstuhl für Mathematik VIII Statistik 1/33 Allgemeine Situation Neben der Untersuchung auf Unterschiede zwischen zwei oder mehreren Untersuchungsgruppen hinsichtlich

Mehr

Erfolg und Vermögensrückgänge angefertigt im Rahmen der Lehrveranstaltung Nachrichtentechnik von: Eric Hansen, eric-hansen@gmx.de am: 07.09.

Erfolg und Vermögensrückgänge angefertigt im Rahmen der Lehrveranstaltung Nachrichtentechnik von: Eric Hansen, eric-hansen@gmx.de am: 07.09. Abstract zum Thema Handelssysteme Erfolg und Vermögensrückgänge angefertigt im Rahmen der Lehrveranstaltung Nachrichtentechnik von: Eric Hansen, eric-hansen@gmx.de am: 07.09.01 Einleitung: Handelssysteme

Mehr

Datenanalyse mit Excel. Wintersemester 2013/14

Datenanalyse mit Excel. Wintersemester 2013/14 Datenanalyse mit Excel 1 KORRELATIONRECHNUNG 2 Korrelationsrechnung Ziel der Korrelationsrechnung besteht im bivariaten Fall darin, die Stärke des Zusammenhangs zwischen zwei interessierenden statistischen

Mehr

Fakultät für Wirtschaftswissenschaft. Aufgabenheft zu. Klausur: Modul 32711 Business Intelligence. Termin: 23.09.2014, 11:30 13:30 Uhr

Fakultät für Wirtschaftswissenschaft. Aufgabenheft zu. Klausur: Modul 32711 Business Intelligence. Termin: 23.09.2014, 11:30 13:30 Uhr Fakultät für Wirtschaftswissenschaft Aufgabenheft zu : Modul 32711 Business Intelligence Termin: 23.09.2014, 11:30 13:30 Uhr Prüfer: Univ.-Prof. Dr. U. Baumöl Aufbau und Bewertung der Aufgabe 1 2 3 4 Summe

Mehr

6.2 Regressionsanalyse

6.2 Regressionsanalyse c-kennzahlensystem (ROCI) 6. Regressionsanalyse Die Regressionsanalyse zählt zu den wichtigsten Analysemethoden des Kommunikationscontrollings und hat ihre tiefen Wurzeln in der Statistik. Im Rahmen des

Mehr

Teil II: Einführung in die Statistik

Teil II: Einführung in die Statistik Teil II: Einführung in die Statistik (50 Punkte) Bitte beantworten Sie ALLE Fragen. Es handelt sich um multiple choice Fragen. Sie müssen die exakte Antwortmöglichkeit angeben, um die volle Punktzahl zu

Mehr

Klausur Sommersemester 2010

Klausur Sommersemester 2010 Klausur Sommersemester 2010 Lehrstuhl: Wirtschaftspolitik Prüfungsfach: Empirische Wirtschaftsforschung Prüfer: Prof. Dr. K. Kraft Datum: 04.08.2010 Hilfsmittel: Nicht-programmierbarer Taschenrechner Klausurdauer:

Mehr

DIPLOMVORPRÜFUNG GRUNDZÜGE DER STATISTIK, TEIL B WINTERSEMESTER 2006/07 28.02.2007

DIPLOMVORPRÜFUNG GRUNDZÜGE DER STATISTIK, TEIL B WINTERSEMESTER 2006/07 28.02.2007 Wirtschaftswissenschaftliches Prüfungsamt DIPLOMVORPRÜFUNG GRUNDZÜGE DER STATISTIK, TEIL B WINTERSEMESTER 006/07 8.0.007 Lösung Prof. Dr. R Friedmann / Dr. R. Hauser Hinweise für die Klausurteilnehmer

Mehr

Dokumentation. estat Version 2.0

Dokumentation. estat Version 2.0 Dokumentation estat Version 2.0 Installation Die Datei estat.xla in beliebiges Verzeichnis speichern. Im Menü Extras AddIns... Durchsuchen die Datei estat.xla auswählen. Danach das Auswahlhäkchen beim

Mehr

Güte von Tests. die Wahrscheinlichkeit für den Fehler 2. Art bei der Testentscheidung, nämlich. falsch ist. Darauf haben wir bereits im Kapitel über

Güte von Tests. die Wahrscheinlichkeit für den Fehler 2. Art bei der Testentscheidung, nämlich. falsch ist. Darauf haben wir bereits im Kapitel über Güte von s Grundlegendes zum Konzept der Güte Ableitung der Gütefunktion des Gauss im Einstichprobenproblem Grafische Darstellung der Gütefunktionen des Gauss im Einstichprobenproblem Ableitung der Gütefunktion

Mehr

Profil A 49,3 48,2 50,7 50,9 49,8 48,7 49,6 50,1 Profil B 51,8 49,6 53,2 51,1 51,1 53,4 50,7 50 51,5 51,7 48,8

Profil A 49,3 48,2 50,7 50,9 49,8 48,7 49,6 50,1 Profil B 51,8 49,6 53,2 51,1 51,1 53,4 50,7 50 51,5 51,7 48,8 1. Aufgabe: Eine Reifenfirma hat für Winterreifen unterschiedliche Profile entwickelt. Bei jeweils gleicher Geschwindigkeit und auch sonst gleichen Bedingungen wurden die Bremswirkungen gemessen. Die gemessenen

Mehr

Arbeiten mit Excel. 1. Allgemeine Hinweise

Arbeiten mit Excel. 1. Allgemeine Hinweise 1. Allgemeine Hinweise Man sollte eine Excel Tabelle immer so übersichtlich wie möglich halten. Dazu empfiehlt es sich, alle benötigten Daten, Konstanten und Messwerte inklusive aller dazugehörigen Einheiten

Mehr

Kaufhaus-Aufgabe. aus Abiturprüfung Bayern LK (abgeändert)

Kaufhaus-Aufgabe. aus Abiturprüfung Bayern LK (abgeändert) Kaufhaus-Aufgabe aus Abiturprüfung Bayern LK (abgeändert) 5. a) Ein Kunde eines Kaufhauses benutzt mit einer Wahrscheinlichkeit von 75% die hauseigene Tiefgarage. Mit einer Wahrscheinlichkeit von 40% bleibt

Mehr

Die Renteninformation Alles klar! Oder doch nicht?

Die Renteninformation Alles klar! Oder doch nicht? Die Renteninformation Alles klar! Oder doch nicht? Veröffentlichung von Ulrich Watermann Schmitzbüchel 32a D 51491 Overath Tel: 02204 / 768733 Fax: 02204 / 768845 Mail: uw@watermann vorsorgekonzepte.de

Mehr

Webergänzung zu Kapitel 10

Webergänzung zu Kapitel 10 Webergänzung zu Kapitel 10 10.1.4 Varianzanalyse (ANOVA: analysis of variance) Im Kapitel 10 haben wir uns hauptsächlich mit Forschungsbeispielen beschäftigt, die nur zwei Ergebnissätze hatten (entweder

Mehr

1. Allgemeine Hinweise Alexander.Martin.Koenig@TU-Clausthal.de

1. Allgemeine Hinweise Alexander.Martin.Koenig@TU-Clausthal.de 1. Allgemeine Hinweise Alexander.Martin.Koenig@TU-Clausthal.de Man sollte eine Excel-Tabelle immer so übersichtlich wie möglich halten. Dazu empfiehlt es sich, alle benötigten Daten, Konstanten und Messwerte

Mehr

Kurs 00091: Finanzierungs- und entscheidungstheoretische Grundlagen der Betriebswirtschaftslehre

Kurs 00091: Finanzierungs- und entscheidungstheoretische Grundlagen der Betriebswirtschaftslehre Grundlagen der Betriebswirtschaftslehre, Kurs 00091, KE 4, 5 und 6, SS 2008 1 Kurs 00091: Finanzierungs- und entscheidungstheoretische Grundlagen der Betriebswirtschaftslehre Lösungshinweise zur Einsendearbeit

Mehr

Skriptum zur Veranstaltung. Quantitative Methoden (Mathematik/Statistik) Teil Induktive Statistik. 1. Version (mehr Draft als Skriptum)

Skriptum zur Veranstaltung. Quantitative Methoden (Mathematik/Statistik) Teil Induktive Statistik. 1. Version (mehr Draft als Skriptum) Skriptum zur Veranstaltung Quantitative Methoden (Mathematik/Statistik) Teil Induktive Statistik 1. Version (mehr Draft als Skriptum) Anmerkungen, Aufzeigen von Tippfehlern und konstruktive Kritik erwünscht!!!

Mehr

Bachelorprüfung. Praxis der empirischen Wirtschaftsforschung Prof. Regina T. Riphahn, Ph.D. Name, Vorname. Matrikelnr. E-Mail. Studiengang.

Bachelorprüfung. Praxis der empirischen Wirtschaftsforschung Prof. Regina T. Riphahn, Ph.D. Name, Vorname. Matrikelnr. E-Mail. Studiengang. Lehrstuhl für Statistik und empirische Wirtschaftsforschung Fach: Prüfer: Bachelorprüfung Praxis der empirischen Wirtschaftsforschung Prof. Regina T. Riphahn, Ph.D. Name, Vorname Matrikelnr. E-Mail Studiengang

Mehr

12. Vergleich mehrerer Stichproben

12. Vergleich mehrerer Stichproben 12. Vergleich mehrerer Stichproben Dr. Antje Kiesel Institut für Angewandte Mathematik WS 2011/2012 Häufig wollen wir verschiedene Populationen, Verfahren, usw. miteinander vergleichen. Beipiel: Vergleich

Mehr

Statistik I für Wirtschaftswissenschaftler Klausur am 06.07.2007, 14.00 16.00.

Statistik I für Wirtschaftswissenschaftler Klausur am 06.07.2007, 14.00 16.00. 1 Statistik I für Wirtschaftswissenschaftler Klausur am 06.07.2007, 14.00 16.00. Bitte unbedingt beachten: a) Gewertet werden alle 9 gestellten Aufgaben. b) Lösungswege sind anzugeben. Die Angabe des Endergebnisses

Mehr

Korrelation (II) Korrelation und Kausalität

Korrelation (II) Korrelation und Kausalität Korrelation (II) Korrelation und Kausalität Situation: Seien X, Y zwei metrisch skalierte Merkmale mit Ausprägungen (x 1, x 2,..., x n ) bzw. (y 1, y 2,..., y n ). D.h. für jede i = 1, 2,..., n bezeichnen

Mehr

geben. Die Wahrscheinlichkeit von 100% ist hier demnach nur der Gehen wir einmal davon aus, dass die von uns angenommenen

geben. Die Wahrscheinlichkeit von 100% ist hier demnach nur der Gehen wir einmal davon aus, dass die von uns angenommenen geben. Die Wahrscheinlichkeit von 100% ist hier demnach nur der Vollständigkeit halber aufgeführt. Gehen wir einmal davon aus, dass die von uns angenommenen 70% im Beispiel exakt berechnet sind. Was würde

Mehr

Doing Economics with the Computer Sommersemester 2002. Excel Solver 1

Doing Economics with the Computer Sommersemester 2002. Excel Solver 1 Universität Bern Kurt Schmidheiny / Manuel Wälti Doing Economics with the Computer Sommersemester 2002 Excel Solver 1 Mit dem Solver unterstützt Excel eine Funktion, mit der u.a. komplex verschachtelte

Mehr

Statische Versuchsplanung (DoE - Design of Experiments)

Statische Versuchsplanung (DoE - Design of Experiments) Statische Versuchsplanung (DoE - Design of Experiments) Übersicht Bei der statistischen Versuchsplanung wird die Wirkung von Steuerparametern unter dem Einfluss von Störparametern untersucht. Mit Hilfe

Mehr

Klausur zu Methoden der Statistik I (mit Kurzlösung) Wintersemester 2007/2008. Aufgabe 1

Klausur zu Methoden der Statistik I (mit Kurzlösung) Wintersemester 2007/2008. Aufgabe 1 Lehrstuhl für Statistik und Ökonometrie der Otto-Friedrich-Universität Bamberg Prof. Dr. Susanne Rässler Klausur zu Methoden der Statistik I (mit Kurzlösung) Wintersemester 2007/2008 Aufgabe 1 Ihnen liegt

Mehr

Kapitel 23 Lineare Regression

Kapitel 23 Lineare Regression Kapitel 23 Lineare Regression Sowohl einfache als auch multiple Regressionsanalysen können Sie mit dem Befehl STATISTIK REGRESSION LINEAR... durchführen. Dabei lassen sich mit Hilfe diverser Optionen zahlreiche

Mehr

1 Interaktion von zwei Dummyvariablen. 2 Interaktion einer Dummyvariablen mit einer kardinalskalierten Variablen

1 Interaktion von zwei Dummyvariablen. 2 Interaktion einer Dummyvariablen mit einer kardinalskalierten Variablen Modelle mit Interationsvariablen I Modelle mit Interationsvariablen II In der beim White-Test verwendeten Regressionsfuntion y = β 0 + β 1 x 1 + β 2 x 2 + β 3 x 2 1 + β 4 x 2 2 + β 5 x 1 x 2, ist anders

Mehr

Korrelation. Übungsbeispiel 1. Übungsbeispiel 4. Übungsbeispiel 2. Übungsbeispiel 3. Korrel.dtp Seite 1

Korrelation. Übungsbeispiel 1. Übungsbeispiel 4. Übungsbeispiel 2. Übungsbeispiel 3. Korrel.dtp Seite 1 Korrelation Die Korrelationsanalyse zeigt Zusammenhänge auf und macht Vorhersagen möglich Was ist Korrelation? Was sagt die Korrelationszahl aus? Wie geht man vor? Korrelation ist eine eindeutige Beziehung

Mehr

Ein möglicher Unterrichtsgang

Ein möglicher Unterrichtsgang Ein möglicher Unterrichtsgang. Wiederholung: Bernoulli Experiment und Binomialverteilung Da der sichere Umgang mit der Binomialverteilung, auch der Umgang mit dem GTR und den Diagrammen, eine notwendige

Mehr

25. Januar 2010. Ruhr-Universität Bochum. Methodenlehre III, WS 2009/2010. Prof. Dr. Holger Dette. 4. Multivariate Mittelwertvergleiche

25. Januar 2010. Ruhr-Universität Bochum. Methodenlehre III, WS 2009/2010. Prof. Dr. Holger Dette. 4. Multivariate Mittelwertvergleiche Ruhr-Universität Bochum 25. Januar 2010 1 / 75 2 / 75 4.1 Beispiel: Vergleich von verschiedenen Unterrichtsmethoden Zwei Zufallsstichproben (A und B) mit je 10 Schülern und 8 Schülern Gruppe A wird nach

Mehr

Auswertung von kritischen Daten Vorgehensweise anhand eines Beispiels Visual-XSel 10.0

Auswertung von kritischen Daten Vorgehensweise anhand eines Beispiels Visual-XSel 10.0 Auswertung von kritischen Daten Vorgehensweise anhand eines Beispiels Visual-XSel 10.0??? Curt Ronniger 2007 Bei Neueinstieg in das Programm, sollte zunächst die Dokumentation XSelDoE10.pdf gelesen werden.

Mehr

Grundlagen der Inferenzstatistik

Grundlagen der Inferenzstatistik Grundlagen der Inferenzstatistik (Induktive Statistik oder schließende Statistik) Dr. Winfried Zinn 1 Deskriptive Statistik versus Inferenzstatistik Die Deskriptive Statistik stellt Kenngrößen zur Verfügung,

Mehr

Einleitung 19. Teil I Datenanalyse und Modellbildung Grundlagen 25

Einleitung 19. Teil I Datenanalyse und Modellbildung Grundlagen 25 Inhaltsverzeichnis Einleitung 19 Zu diesem Buch 19 Konventionen in diesem Buch 20 Was Sie nicht lesen müssen 21 Falsche Voraussetzungen 21 Wie dieses Buch aufgebaut ist 21 Teil I: Datenanalyse und Grundlagen

Mehr