BM-Datenanalyse eine Exploration

Größe: px
Ab Seite anzeigen:

Download "BM-Datenanalyse eine Exploration"

Transkript

1 BM-Datenanalyse eine Exploration Marcello Robbiani ZHAW und EBMK Ein Web-basierter Bildervortrag Allgemeingut, Eigengewächs: Keine Quellenangabe Web-Material: Quellenangabe im jeweiligen Folienkopf

2 Inspiriert durch einen Kurzvortrag von Beate Sick Institut für Datenanalyse und Prozessdesign Zürcher Hochschule für Angewandte Wissenschaften Eckdaten zu meiner Person: Fachkonferenz Mathematik 9 Die künftige Berufsmaturität - offene Probleme

3 Wovon handelt das Folgende? Technik & IT, Chemie & Life Sciences, Architektur, Bau- & Planungswesen % Datenanalyse im Grundlagenfach ( von Lektionen) Im Folgenden: TDA (Technik - Daten Analyse) Wovon handelt das Folgende nicht? Ausrichtungen: Gesundheit, Soziale Arbeit, Land- & Forstwirtschaft et al. Deskriptive Statistik & Wahrscheinlichkeitsrechnung

4 Inhalt. Statement zur TDA. Was sollte TDA nicht sein?. Was sollte TDA sein?. TDA Pros und Cons Was sollte TDA sein? Explorativ! Qualitativ Deskriptiv Graphisch Datengetrieben

5 Im Gegensatz zu... Klassisch! Quantitativ Normativ Mathematisch Modellgetrieben htw.activemath.org/activemath/search/show.cmd?id=mbase://mathebrhtw/binom/fak_intro Was TDA nicht ist: Kombinatorik... 5

6 Was TDA nicht ist: Wahrscheinlichkeitsrechnung... Statistik/grundlagen/grund-binomialverteilung-e.htm Was TDA nicht ist: Zufallsexperimente... 6

7 cheind.wordpress.com/9///on-coin-tossing-games-part-/ Was TDA nicht ist: Wahrscheinlichkeitsverteilungen... Was TDA nicht ist: Schliessende Statistik... 7

8 it.wikipedia.org/wiki/file:monty_hall_solution_expanded.png Was TDA nicht ist: Entscheidungstheorie... Was ist dann TDA? Explorativ! Was heisst "explorativ"? Wer steckt hinter "explorativ"? Woher kommt "explorativ"? Weshalb "explorativ"? Nicht zu verwechseln mit "explorative Didaktik"! 8

9 John W. Tukey 95 - Exploratory Data Analysis "Far better an approximate answer to the right question, which is often vague, than the exact answer to the wrong question, which can always be made precise." American Statistician (986) John W. Tukey über Explorative Datenanalyse: "..., I would suggest that it is an attitude and a flexibility and some graph paper..." wikipedia.org/wiki/john_tukey 9

10 Explorative Datenanalyse ist nicht alternativ! Confirmatory Data Analysis (CDA) sollte in Lehre und Praxis auf Exploratory Data Analysis (EDA) aufbauen cll.stanford.edu/~langley/cogsys/behrens97pm.pdf John W. Tukey über Explorative Datenanalyse: "... substantive concerns must take precedence over statistical convenience." Gesundheit, Soziale Arbeit, Land- & Forstwirtschaft et al.

11 M.Sc.E Mittelwert.67 Median.5 Modus 6 Eine mögliche Lösung: Noten EXCEL Eine mögliche Lösung: Noten Quantil ~.5.5-Quantil ~.5.75-Quantil ~

12 Eine mögliche Lösung: Noten M.Sc.E Ausreisser Mittelwert: 5. Mittelwert: 5. Standardabweichung:.97 Standardabweichung: Ausreisser Ausreisser Mittelwert:.98 Standardabweichung:.56 Mittelwert:.85 Standardabweichung:.77 psycnet.apa.org/index.cfm?fa=buy.optiontobuy&id=-97- John W. Tukey: Stem-and-Leaf-Plot

13 processtrends.com/pg_temp_trends.htm John W. Tukey: Box-and-Whisker-Plot Stockholm ryouready.wordpress.com John W. Tukey: Coded Maps 9

14 seattlebubble.com/blog/6/9/6/correction-income-decline-map/ Fallen... Fallen... Kubische Wurzel:

15 en.wikipedia.org/wiki/air_safety Fallen... Das sicherste Verkehrsmittel... Tote pro Reise Tote pro Reisezeit Tote pro Reisestrecke Bus:. Zug: Auto: Laufen: Flug: 7 Velo: 7 Bus:. Zug: Flug:.8 Auto: Laufen: Velo: 55 Flug:.5 Bus:. Zug:.6 Auto:. Velo:.6 Laufen: 5. Bett: Weltweit / 998 Sollte TDA bivariat sein? Simpson-Paradoxon Karl Pearson The Grammar of Science 5

16 en.wikipedia.org/wiki/simpson's_paradox#cite_note-bickel- Berkeley gender bias case 97 Bewerbungen Männer Frauen Angenommen 7 5 Abgelehnt Kreuztabelle / Kontingenztafel Erfolgschancen (Odds) Männer :.7 Frauen :.86 Relative Erfolgschancen (Odds ratio) Frauen :.6 Männer Frauen Bewerbungen Erfolgreich Bewerbungen Erfolgreich A 85 6% 8 8% B 56 6% 5 68% C 5 7% 59 % D 7 % 75 5% E 9 8% 9 % F 7 6% 7% Die 6 grössten Departemente von Berkeley Fazit: Frauen wurden in keiner Weise diskriminiert! 6

17 Grund: Das Denken in Odds ist schwierig... Männer Frauen Bewerbungen Erfolgreich Bewerbungen Erfolgreich A % % B % % C % % D % % E % % F 95 % 5 % Annals of Eugenics. 7, 96 Sollte TDA bivariat sein? Grenzen der Diskriminanzanalyse Ronald A. Fisher The Use of Multiple Measurements in Taxonomic Problems 7

18 de.wikipedia.org/wiki/portal:statistik/datensaetze#cite_note-fisher6- Anderson's Iris data set 5 Schwertlilien der Arten Iris Setosa, Iris Virginica, Iris Versicolor Merkmale: Länge & Breite von Kelchblatt - Sepalum Kronblatt - Petalum. Virginica und Versicolor sind graphisch nicht diskriminierbar! Streudiagramm 8

19 Streudiagramm-Matrix Sollte TDA bivariat sein? Zusammenhangsanalyse... John W. Tukey war Mitglied der Charlie Winsor's Society for the Suppression of Correlation Coefficients...!!! 9

20 Koordinatentransformationen Logarithmisch Doppeltlogarithmisch Scheinzusammenhänge Korrelation vs. Kausalität

21 bweiss.fornax.uberspace.de/blog/wordpress/?tag=okologischer-fehlschluss Der Ökologische Fehlschluss Statistik der Kennzahlen... Wie betrüge ich mit Statistik... Cyril L. Burt John W. Tukey: "The greatest value of a picture is when it forces us to notice what we never expected to see." flowingdata.com/7/9//wise-words-from-john-tukey/

22 John W. Tukey zur Linearen Ausgleichsrechnung... Daten in Abhängigkeit von x in drei Klassen einteilen. x, x, x Mediane der x-werte in jeder Klasse y, y, y Mediane der y-werte in jeder Klasse Die Ausgleichsgerade ist y = a x + b mit. a = (y - y) / (x - x) b = (y + y + y - a (x + x + x)) / y Ideeskizze: (x,y) (x,y) median-median-line (x,y) x

23 Die Erste wurde von Auge bestimmt; die Zweite durch Gausssche lineare Regression; die Dritte durch das Verfahren von Tukey; Welche ist welche? TDA - Pros & Cons (ohne Anspruch auf Vollständigkeit oder Wissenschaftlichkeit) Was spricht dagegen: Lektionen zu viel... Lektionen zu wenig... Zu ambitioniert für BM-Lernende... Zu anspruchvoll für BM-Didaktik... Replik: All dies gilt nur für das klassische Modell!

24 Was spricht dafür: Gesellschaftliche Relevanz... Berufliche Relevanz... Zubringerdienst FH... Viele Chancen attraktiver Didaktik... Erfolgserlebnis auch für Mathe-Muffels... Ideal für projektbasierten Unterricht... Ideal für interdisziplinäres Arbeiten... Replik: Falls TDA nicht zu Betty Bossi entartet! Mein liebstes Argument: Elisabeth Noelle-Neumann 96 - "Statistik ist für mich das Informationsmittel der Mündigen. Wer mit ihr umgehen kann, kann weniger leicht manipuliert werden."

Stochastik und Statistik für Ingenieure Vorlesung 8

Stochastik und Statistik für Ingenieure Vorlesung 8 PD. Dr. Frank Heyde TU Bergakademie Freiberg Institut für Stochastik Stochastik und Statistik für Ingenieure Vorlesung 8 6. Dezember 2013 4. Deskriptive Statistik 4.1. Grundbegriffe der Statistik Der Begriff

Mehr

Eine computergestützte Einführung mit

Eine computergestützte Einführung mit Thomas Cleff Deskriptive Statistik und Explorative Datenanalyse Eine computergestützte Einführung mit Excel, SPSS und STATA 3., überarbeitete und erweiterte Auflage ^ Springer Inhaltsverzeichnis 1 Statistik

Mehr

Statistik und Wahrscheinlichkeitsrechnung

Statistik und Wahrscheinlichkeitsrechnung Statistik und Wahrscheinlichkeitsrechnung Übung 2 28.02.2008 1 Inhalt der heutigen Übung Beschreibende Statistik Gemeinsames Lösen der Übungsaufgaben 2.1: Häufigkeitsverteilung 2.2: Tukey Boxplot 25:Korrelation

Mehr

2. Deskriptive Statistik 2.1. Häufigkeitstabellen, Histogramme, empirische Verteilungsfunktionen

2. Deskriptive Statistik 2.1. Häufigkeitstabellen, Histogramme, empirische Verteilungsfunktionen 4. Datenanalyse und Modellbildung Deskriptive Statistik 2-1 2. Deskriptive Statistik 2.1. Häufigkeitstabellen, Histogramme, empirische Verteilungsfunktionen Für die Auswertung einer Messreihe, die in Form

Mehr

Einführung in die Statistik mir R

Einführung in die Statistik mir R Einführung in die Statistik mir R ww w. syn t egris.de Überblick GESCHÄFTSFÜHRUNG Andreas Baumgart, Business Processes and Service Gunar Hofmann, IT Solutions Sven-Uwe Weller, Design und Development Jens

Mehr

Zusammenhänge zwischen metrischen Merkmalen

Zusammenhänge zwischen metrischen Merkmalen Zusammenhänge zwischen metrischen Merkmalen Darstellung des Zusammenhangs, Korrelation und Regression Daten liegen zu zwei metrischen Merkmalen vor: Datenpaare (x i, y i ), i = 1,..., n Beispiel: x: Anzahl

Mehr

3.2 Bivariate Verteilungen

3.2 Bivariate Verteilungen 3.2 Bivariate Verteilungen zwei Variablen X, Y werden gemeinsam betrachtet (an jedem Objekt i, i = 1,..., n, werden gleichzeitig zwei Merkmale beobachtet) Beobachtungswerte sind Paare/Kombinationen von

Mehr

Einfache Statistiken in Excel

Einfache Statistiken in Excel Einfache Statistiken in Excel Dipl.-Volkswirtin Anna Miller Bergische Universität Wuppertal Schumpeter School of Business and Economics Lehrstuhl für Internationale Wirtschaft und Regionalökonomik Raum

Mehr

Elisabeth Raab-Steiner/Michael Benesch. Der Fragebogen. Von der Forschungsidee zur SPSS/PASW-Auswertung. 2., aktualisierte Auflage. facultas.

Elisabeth Raab-Steiner/Michael Benesch. Der Fragebogen. Von der Forschungsidee zur SPSS/PASW-Auswertung. 2., aktualisierte Auflage. facultas. Elisabeth Raab-Steiner/Michael Benesch Der Fragebogen Von der Forschungsidee zur SPSS/PASW-Auswertung 2., aktualisierte Auflage facultas.wuv Inhaltsverzeichnis 1 Elementare Definitionen 11 1.1 Deskriptive

Mehr

Bachelorabschlussseminar Dipl.-Kfm. Daniel Cracau

Bachelorabschlussseminar Dipl.-Kfm. Daniel Cracau 1 Einführung in die statistische Datenanalyse Bachelorabschlussseminar Dipl.-Kfm. Daniel Cracau 2 Gliederung 1.Grundlagen 2.Nicht-parametrische Tests a. Mann-Whitney-Wilcoxon-U Test b. Wilcoxon-Signed-Rank

Mehr

Multivariate Statistik

Multivariate Statistik Hermann Singer Multivariate Statistik 1 Auflage 15 Oktober 2012 Seite: 12 KAPITEL 1 FALLSTUDIEN Abbildung 12: Logistische Regression: Geschätzte Wahrscheinlichkeit für schlechte und gute Kredite (rot/blau)

Mehr

2. Eindimensionale (univariate) Datenanalyse

2. Eindimensionale (univariate) Datenanalyse 2. Eindimensionale (univariate) Datenanalyse Dr. Antje Kiesel Institut für Angewandte Mathematik WS 2011/2012 Kennzahlen, Statistiken In der Regel interessieren uns nicht so sehr die beobachteten Einzeldaten

Mehr

1,11 1,12 1,13 1,14 1,15 1,16 1,17 1,17 1,17 1,18

1,11 1,12 1,13 1,14 1,15 1,16 1,17 1,17 1,17 1,18 3. Deskriptive Statistik Ziel der deskriptiven (beschreibenden) Statistik (explorativen Datenanalyse) ist die übersichtliche Darstellung der wesentlichen in den erhobenen Daten enthaltene Informationen

Mehr

Methoden der empirischen Sozialforschung I

Methoden der empirischen Sozialforschung I Methoden der empirischen Sozialforschung I Annelies Blom, PhD TU Kaiserslautern Wintersemester 2011/12 Übersicht Quantitative Datenauswertung: deskriptive und induktive Statistik Wiederholung: Die wichtigsten

Mehr

-Which word (lines 47-52) does tell us that Renia s host brother is a pleasant person?

-Which word (lines 47-52) does tell us that Renia s host brother is a pleasant person? Reading tasks passend zu: Open World 1 Unit 4 (student s book) Through a telescope (p. 26/27): -Renia s exchange trip: richtig falsch unkar? richtig falsch unklar: Renia hat sprachliche Verständnisprobleme.

Mehr

Univariate Lineare Regression. (eine unabhängige Variable)

Univariate Lineare Regression. (eine unabhängige Variable) Univariate Lineare Regression (eine unabhängige Variable) Lineare Regression y=a+bx Präzise lineare Beziehung a.. Intercept b..anstieg y..abhängige Variable x..unabhängige Variable Lineare Regression y=a+bx+e

Mehr

Assessment of disgn-flows in water management, Classical methods, nonstationary and multidimensional extensions of Extreme Value Modeling (EVM)

Assessment of disgn-flows in water management, Classical methods, nonstationary and multidimensional extensions of Extreme Value Modeling (EVM) Assessment of disgn-flows in water management, Classical methods, nonstationary and multidimensional extensions of Extreme Value Modeling (EVM) Dr. Winfried Willems, IAWG Outline Classical Approach, short

Mehr

Auswertung und Darstellung wissenschaftlicher Daten (1)

Auswertung und Darstellung wissenschaftlicher Daten (1) Auswertung und Darstellung wissenschaftlicher Daten () Mag. Dr. Andrea Payrhuber Zwei Schritte der Auswertung. Deskriptive Darstellung aller Daten 2. analytische Darstellung (Gruppenvergleiche) SPSS-Andrea

Mehr

Statistik und Wahrscheinlichkeitsrechnung 401-0612-00

Statistik und Wahrscheinlichkeitsrechnung 401-0612-00 Statistik und Wahrscheinlichkeitsrechnung 401-0612-00 Lukas Meier Wieso Statistik und Wahrscheinlichkeitsrechnung? Zufällige Prozesse und Anwendungen von W keitsrechnung und Statistik sind in unserem Alltag

Mehr

Statistik und Datenanalyse. eine praktische Einführung

Statistik und Datenanalyse. eine praktische Einführung Statistik und Datenanalyse eine praktische Einführung Antony Unwin Lehrstuhl für Rechnerorientierte Statistik und Datenanalyse Institut für Mathematik Universität Augsburg unwin@math.uni-augsburg.de Augsburger

Mehr

School of Engineering Institut für Datenanalyse und Prozessdesign (IDP)

School of Engineering Institut für Datenanalyse und Prozessdesign (IDP) School of Engineering Institut für Datenanalyse und Prozessdesign (IDP) Zürcher Fachhochschule www.zhaw.ch/idp Forschung & Entwicklung Das Institut für Datenanalyse und Prozessdesign (IDP) Das Institut

Mehr

Schätzung des Lifetime Values von Spendern mit Hilfe der Überlebensanalyse

Schätzung des Lifetime Values von Spendern mit Hilfe der Überlebensanalyse Schätzung Lifetime Values von Spenn mit Hilfe Überlebensanalyse Einführung in das Verfahren am Beispiel Einzugsgenehmigung Überlebensanalysen o Ereignisdatenanalysen behandeln das Problem, mit welcher

Mehr

Grundlagen der Datenanalyse am Beispiel von SPSS

Grundlagen der Datenanalyse am Beispiel von SPSS Grundlagen der Datenanalyse am Beispiel von SPSS Einführung Dipl. - Psych. Fabian Hölzenbein hoelzenbein@psychologie.uni-freiburg.de Einführung Organisatorisches Was ist Empirie? Was ist Statistik? Dateneingabe

Mehr

Linearer Zusammenhang von Datenreihen

Linearer Zusammenhang von Datenreihen Linearer Zusammenhang von Datenreihen Vielen Problemen liegen (möglicherweise) lineare Zusammenhänge zugrunde: Mein Internetanbieter verlangt eine Grundgebühr und rechnet minutenweise ab Ich bestelle ein

Mehr

Einsatz einer Dokumentenverwaltungslösung zur Optimierung der unternehmensübergreifenden Kommunikation

Einsatz einer Dokumentenverwaltungslösung zur Optimierung der unternehmensübergreifenden Kommunikation Einsatz einer Dokumentenverwaltungslösung zur Optimierung der unternehmensübergreifenden Kommunikation Eine Betrachtung im Kontext der Ausgliederung von Chrysler Daniel Rheinbay Abstract Betriebliche Informationssysteme

Mehr

Kreuztabellenanalyse -Zusammenhangsmaße

Kreuztabellenanalyse -Zusammenhangsmaße Lehrveranstaltung Empirische Forschung und Politikberatung der Universität Bonn, WS 2007/2008 Kreuztabellenanalyse -Zusammenhangsmaße 14. Dezember 2007 Anja Hall, Bundesinstitut für Berufsbildung, AB 2.2:

Mehr

LOG AND SECURITY INTELLIGENCE PLATFORM

LOG AND SECURITY INTELLIGENCE PLATFORM TIBCO LOGLOGIC LOG AND SECURITY INTELLIGENCE PLATFORM Security Information Management Logmanagement Data-Analytics Matthias Maier Solution Architect Central Europe, Eastern Europe, BeNeLux MMaier@Tibco.com

Mehr

26. GIL Jahrestagung

26. GIL Jahrestagung GeorgAugustUniversität Göttingen 26. GIL Jahrestagung Einsatz von künstlichen Neuronalen Netzen im Informationsmanagement der Land und Ernährungswirtschaft: Ein empirischer Methodenvergleich Holger Schulze,

Mehr

Teil 4,9 Ich habe mein Handy, aber wo sind meine Schlüssel?

Teil 4,9 Ich habe mein Handy, aber wo sind meine Schlüssel? Teil 4,9 Ich habe mein Handy, aber wo sind meine Schlüssel? Üben wir! Vokabular (I) Fill in each blank with an appropriate word from the new vocabulary: 1. Ich lese jetzt Post von zu Hause. Ich schreibe

Mehr

Data Science (k)eine Teenagerliebe? Thilo Stadelmann, Swiss ICT Symposium, 05. November 2011. Zürcher Fachhochschule

Data Science (k)eine Teenagerliebe? Thilo Stadelmann, Swiss ICT Symposium, 05. November 2011. Zürcher Fachhochschule Data Science (k)eine Teenagerliebe? Thilo Stadelmann, Swiss ICT Symposium, 05. November 2011 Teenagerliebe? Data Science Big Data! Aber: Hohe Korrelation in der aktuellen öffentlichen Wahrnehmung. Keiner

Mehr

Statistik trifft Big Data. Univ. Prof. Dr. Andreas Futschik IFAS, JKU

Statistik trifft Big Data. Univ. Prof. Dr. Andreas Futschik IFAS, JKU Statistik trifft Big Data Univ. Prof. Dr. Andreas Futschik IFAS, JKU It is a breathtaking time in science as masses of data pour in, promising new insights. But how can we find meaning in these terabytes?

Mehr

Auswertung mit dem Statistikprogramm SPSS: 30.11.05

Auswertung mit dem Statistikprogramm SPSS: 30.11.05 Auswertung mit dem Statistikprogramm SPSS: 30.11.05 Seite 1 Einführung SPSS Was ist eine Fragestellung? Beispiel Welche statistische Prozedur gehört zu welcher Hypothese? Statistische Berechnungen mit

Mehr

Untersuchungen zum Thema Tracking Error

Untersuchungen zum Thema Tracking Error Untersuchungen zum Thema Tracking Error J. Fulmek 24. August 2003 1 Einleitung Im Folgenden werden folgende Punkte untersucht: 1. verschiedene in der Literatur übliche Definitionen des Tracking Errors

Mehr

Vorhersagetechniken für zukünftiges Verhalten von Kunden

Vorhersagetechniken für zukünftiges Verhalten von Kunden IBM 360 Grad-Sicht auf den Kunden: Vorhersagetechniken für zukünftiges Verhalten von Kunden Sven Fessler, sven.fessler@de.ibm.com Solution Architect, IBM Germany Business Analytics & Optimization Das Spektrum

Mehr

Abhängigkeit zweier Merkmale

Abhängigkeit zweier Merkmale Abhängigkeit zweier Merkmale Johannes Hain Lehrstuhl für Mathematik VIII Statistik 1/33 Allgemeine Situation Neben der Untersuchung auf Unterschiede zwischen zwei oder mehreren Untersuchungsgruppen hinsichtlich

Mehr

Analog zu Aufgabe 16.1 werden die Daten durch folgenden Befehl eingelesen: > kredit<-read.table("c:\\compaufg\\kredit.

Analog zu Aufgabe 16.1 werden die Daten durch folgenden Befehl eingelesen: > kredit<-read.table(c:\\compaufg\\kredit. Lösung 16.3 Analog zu Aufgabe 16.1 werden die Daten durch folgenden Befehl eingelesen: > kredit

Mehr

Veranstaltungsort Bildungsherberge der Studierendenschaft der FernUniversität Hagen

Veranstaltungsort Bildungsherberge der Studierendenschaft der FernUniversität Hagen Bildungsurlaub-Seminare: Lerninhalte und Programm Seminartitel SPSS für Psychologen/innen (BH15113) Termin Mo, den 18.05.bis Fr, den 22.05.2015 (40 UStd.) Veranstaltungsort Bildungsherberge der Studierendenschaft

Mehr

Algorithms for graph visualization

Algorithms for graph visualization Algorithms for graph visualization Project - Orthogonal Grid Layout with Small Area W INTER SEMESTER 2013/2014 Martin No llenburg KIT Universita t des Landes Baden-Wu rttemberg und nationales Forschungszentrum

Mehr

Korrelation - Regression. Berghold, IMI

Korrelation - Regression. Berghold, IMI Korrelation - Regression Zusammenhang zwischen Variablen Bivariate Datenanalyse - Zusammenhang zwischen 2 stetigen Variablen Korrelation Einfaches lineares Regressionsmodell 1. Schritt: Erstellung eines

Mehr

9 Resümee. Resümee 216

9 Resümee. Resümee 216 Resümee 216 9 Resümee In der vorliegenden Arbeit werden verschiedene Methoden der Datenreduktion auf ihre Leistungsfähigkeit im sozialwissenschaftlichstatistischen Umfeld anhand eines konkreten Anwendungsfalls

Mehr

Modellierung von Korrelationen zwischen Kreditausfallraten für Kreditportfolios. Bernd Rosenow, 3. Kölner Workshop Quantitative Finanzmarktforschung

Modellierung von Korrelationen zwischen Kreditausfallraten für Kreditportfolios. Bernd Rosenow, 3. Kölner Workshop Quantitative Finanzmarktforschung Modellierung von Korrelationen zwischen Kreditausfallraten für Kreditportfolios Bernd Rosenow Rafael Weißhaupt Frank Altrock Universität zu Köln West LB AG, Düsseldorf Gliederung Beschreibung des Datensatzes

Mehr

Chair of Information Management Wissenschaftsdisskussion

Chair of Information Management Wissenschaftsdisskussion Chair of Information Management Wissenschaftsdisskussion 3. Wirtschaftsinformatik Doktorandenkolloquium Südost-Niedersachsen 2008 10. - 11. März 2008, St.Andreasberg Institute of Information Systems Chair

Mehr

Statistik im Bachelor-Studium der BWL und VWL

Statistik im Bachelor-Studium der BWL und VWL Max C. Wewel Statistik im Bachelor-Studium der BWL und VWL Methoden, Anwendung, Interpretation Mit herausnehmbarer Formelsammlung ein Imprint von Pearson Education München Boston San Francisco Harlow,

Mehr

Inhaltsverzeichnis. I Einführung in STATISTICA 1. 1 Erste Schritte in STATISTICA 3

Inhaltsverzeichnis. I Einführung in STATISTICA 1. 1 Erste Schritte in STATISTICA 3 I Einführung in STATISTICA 1 1 Erste Schritte in STATISTICA 3 2 Datenhaltung in STATISTICA 11 2.1 Die unterschiedlichen Dateitypen in STATISTICA....... 11 2.2 Import von Daten......... 12 2.3 Export von

Mehr

Log-lineare Analyse I

Log-lineare Analyse I 1 Log-lineare Analyse I Einleitung Die log-lineare Analysemethode wurde von L.A. Goodman in den 60er und 70er Jahren entwickelt. Sie dient zur Analyse von Zusammenhängen in mehrdimensionalen Kontingenztafeln

Mehr

Why you should care. by Thomas Krimmer. Thomas Krimmer @ACS Slide 1

Why you should care. by Thomas Krimmer. Thomas Krimmer @ACS Slide 1 Why you should care. by Thomas Krimmer Thomas Krimmer @ACS Slide 1 CAS Publication Record Abstracts (Millions) 1.5 papers per minute Source: CAS helpdesk, Statistical Summary 1907-2007, 02/10/2009 Thomas

Mehr

Asset Management für Instandhalter: Alter Wein in neuen Schläuchen?

Asset Management für Instandhalter: Alter Wein in neuen Schläuchen? Asset Management für Instandhalter: Alter Wein in neuen Schläuchen? Prof. Dr. Christoph Heitz Institut für Datenanalyse und Prozessdesign Zürcher Hochschule für Angewandte Wissenschaften Winterthur, Switzerland

Mehr

5.2 Optionen Auswahl der Statistiken, die bei der jeweiligen Prozedur zur Verfügung stehen.

5.2 Optionen Auswahl der Statistiken, die bei der jeweiligen Prozedur zur Verfügung stehen. 5 Statistik mit SPSS Die Durchführung statistischer Auswertungen erfolgt bei SPSS in 2 Schritten, der Auswahl der geeigneten Methode, bestehend aus Prozedur Variable Optionen und der Ausführung. 5.1 Variablen

Mehr

SAP Predictive Challenge - Lösung. DI Walter Müllner, Dr. Ingo Peter, Markus Tempel 22. April 2015

SAP Predictive Challenge - Lösung. DI Walter Müllner, Dr. Ingo Peter, Markus Tempel 22. April 2015 SAP Predictive Challenge - Lösung DI Walter Müllner, Dr. Ingo Peter, Markus Tempel 22. April 2015 Teil II - Lösung Teil II-1: Fachbereich (automated mode) Teil II-2: Experte (PAL HANA) Teil II-3: Vergleich

Mehr

Daten haben wir reichlich! 25.04.14 The unbelievable Machine Company 1

Daten haben wir reichlich! 25.04.14 The unbelievable Machine Company 1 Daten haben wir reichlich! 25.04.14 The unbelievable Machine Company 1 2.800.000.000.000.000.000.000 Bytes Daten im Jahr 2012* * Wenn jedes Byte einem Buchstaben entspricht und wir 1000 Buchstaben auf

Mehr

Fachgruppe Statistik, Risikoanalyse & Computing. STAT672 Data Mining. Sommersemester 2007. Prof. Dr. R. D. Reiß

Fachgruppe Statistik, Risikoanalyse & Computing. STAT672 Data Mining. Sommersemester 2007. Prof. Dr. R. D. Reiß Fachgruppe Statistik, Risikoanalyse & Computing STAT672 Data Mining Sommersemester 2007 Prof. Dr. R. D. Reiß Überblick Data Mining Begrifflichkeit Unter Data Mining versteht man die Computergestützte Suche

Mehr

Einseitig gerichtete Relation: Mit zunehmender Höhe über dem Meeresspiegel sinkt im allgemeinen die Lufttemperatur.

Einseitig gerichtete Relation: Mit zunehmender Höhe über dem Meeresspiegel sinkt im allgemeinen die Lufttemperatur. Statistik Grundlagen Charakterisierung von Verteilungen Einführung Wahrscheinlichkeitsrechnung Wahrscheinlichkeitsverteilungen Schätzen und Testen Korrelation Regression Einführung Die Analyse und modellhafte

Mehr

Algorithmische Modelle als neues Paradigma

Algorithmische Modelle als neues Paradigma Algorithmische Modelle als neues Paradigma Axel Schwer Seminar über Philosophische Grundlagen der Statistik, WS 2010/11 Betreuer: Prof. Dr. Thomas Augustin München, den 28. Januar 2011 1 / 29 LEO BREIMAN

Mehr

Einführung in SPSS. 1. Die Datei Seegräser

Einführung in SPSS. 1. Die Datei Seegräser Einführung in SPSS 1. Die Datei Seegräser An 25 verschiedenen Probestellen wurde jeweils die Anzahl der Seegräser pro m 2 gezählt und das Vorhandensein von Seeigeln vermerkt. 2. Programmaufbau Die wichtigsten

Mehr

Next Generation SEO Author Markups und Schema Integrationen Marcus Tober Köln 16.10.2013

Next Generation SEO Author Markups und Schema Integrationen Marcus Tober Köln 16.10.2013 Next Generation SEO Author Markups und Schema Integrationen Marcus Tober Köln 16.10.2013 10/21/2013 Searchmetrics Inc. 2013 Page 1 Gründer von Searchmetrics Ich liebe SEO und Search seit 2001 Informatik-Studium

Mehr

Anhang A: Fragebögen und sonstige Unterlagen

Anhang A: Fragebögen und sonstige Unterlagen Anhang Anhang A: Fragebögen und sonstige Unterlagen A.: Flyer zur Probandenrekrutierung 46 A.: Fragebogen zur Meditationserfahrung 47 48 A.3: Fragebogen Angaben zur Person 49 5 5 A.4: Termin- und Einladungsschreiben

Mehr

90-minütige Klausur Statistik für Studierende der Kommunikationswissenschaft

90-minütige Klausur Statistik für Studierende der Kommunikationswissenschaft Prof. Dr. Helmut Küchenhoff SS08 90-minütige Klausur Statistik für Studierende der Kommunikationswissenschaft am 22.7.2008 Anmerkungen Überprüfen Sie bitte sofort, ob Ihre Angabe vollständig ist. Sie sollte

Mehr

Analyse bivariater Kontingenztafeln

Analyse bivariater Kontingenztafeln Analyse bivariater Kontingenztafeln Werden zwei kategoriale Merkmale mit nicht zu vielen möglichen Ausprägungen gemeinsam analysiert, so kommen zur Beschreibung der gemeinsamen Verteilung im allgemeinen

Mehr

Datenanalyse und Statistik

Datenanalyse und Statistik Datenanalyse und Statistik p. 1/44 Datenanalyse und Statistik Vorlesung 2 (Graphik I) K.Gerald van den Boogaart http://www.stat.boogaart.de Datenanalyse und Statistik p. 2/44 Daten Schätzung Test Mathe

Mehr

Seminarangebote zu Methodenkompetenzen

Seminarangebote zu Methodenkompetenzen Seminarangebote zu Methodenkompetenzen Contrastwerkstatt Fotolia.com Inhalt Inhalt... 2 Einführung in Diversity Management... Fehler! Textmarke nicht definiert. Evaluation und Qualitätssicherung in der

Mehr

Market Basket Analysis oder: isst man Salat zum Schnitzel?

Market Basket Analysis oder: isst man Salat zum Schnitzel? Market Basket Analysis oder: isst man Salat zum Schnitzel? SAS Forum Switzerland, 07. Mai 2013 Ralph Wenzl Migros-Genossenschafts-Bund Customer & Web Intelligence Agenda 1 2 3 4 Muster in Warenkörben 3

Mehr

Prediction Market, 28th July 2012 Information and Instructions. Prognosemärkte Lehrstuhl für Betriebswirtschaftslehre insbes.

Prediction Market, 28th July 2012 Information and Instructions. Prognosemärkte Lehrstuhl für Betriebswirtschaftslehre insbes. Prediction Market, 28th July 2012 Information and Instructions S. 1 Welcome, and thanks for your participation Sensational prices are waiting for you 1000 Euro in amazon vouchers: The winner has the chance

Mehr

Institut für angewandte Informationstechnologie (InIT)

Institut für angewandte Informationstechnologie (InIT) School of Engineering Institut für angewandte Informationstechnologie (InIT) We ride the information wave Zürcher Fachhochschule www.init.zhaw.ch Forschung & Entwicklung Institut für angewandte Informationstechnologie

Mehr

A match made in heaven? Prof. Dr. Christian Krekeler

A match made in heaven? Prof. Dr. Christian Krekeler Language Assessment and Languages for Specific Purposes A match made in heaven? Prof. Dr. Christian Krekeler Hochschule Konstanz HTWG Lost in translation Video clip Lost in translation, CNN news report

Mehr

Häufigkeitstabellen. Balken- oder Kreisdiagramme. kritischer Wert für χ2-test. Kontingenztafeln

Häufigkeitstabellen. Balken- oder Kreisdiagramme. kritischer Wert für χ2-test. Kontingenztafeln Häufigkeitstabellen Menüpunkt Data PivotTable Report (bzw. entsprechendes Icon): wähle Data Range (Zellen, die die Daten enthalten + Zelle mit Variablenname) wähle kategoriale Variable für Spalten- oder

Mehr

Scrum @FH Biel. Scrum Einführung mit «Electronical Newsletter» FH Biel, 12. Januar 2012. Folie 1 12. Januar 2012. Frank Buchli

Scrum @FH Biel. Scrum Einführung mit «Electronical Newsletter» FH Biel, 12. Januar 2012. Folie 1 12. Januar 2012. Frank Buchli Scrum @FH Biel Scrum Einführung mit «Electronical Newsletter» FH Biel, 12. Januar 2012 Folie 1 12. Januar 2012 Frank Buchli Zu meiner Person Frank Buchli MS in Computer Science, Uni Bern 2003 3 Jahre IT

Mehr

Visual Analytics. Seminar. [Guo, 2006] [Wong, 2006] [Keim, 2006] [Proulx, 2006] [Chang, 2007] [Kosara, 2006]

Visual Analytics. Seminar. [Guo, 2006] [Wong, 2006] [Keim, 2006] [Proulx, 2006] [Chang, 2007] [Kosara, 2006] Seminar Visual Analytics [Guo, 2006] [Keim, 2006] [Wong, 2006] [Proulx, 2006] [Chang, 2007] [Kosara, 2006] Visual Analytics - Definitions Visual analytics is the science of analytical reasoning facilitated

Mehr

a lot of, much und many

a lot of, much und many Aufgabe 1, und In bejahten Sätzen verwendest du für die deutschen Wörter viel und viele im Englischen Bsp.: I have got CDs. We have got milk. There are cars on the street. Bei verneinten Sätzen und Fragen

Mehr

Sicherheit dank Durchblick. Thomas Fleischmann Sales Engineer, Central Europe

Sicherheit dank Durchblick. Thomas Fleischmann Sales Engineer, Central Europe Sicherheit dank Durchblick Thomas Fleischmann Sales Engineer, Central Europe Threat Landscape Immer wieder neue Schlagzeilen Cybercrime ist profitabel Wachsende Branche 2013: 9 Zero Day Vulnerabilities

Mehr

Eignung von Tag Clouds zur Exploration und Navigation nutzergenerierter Inhalte

Eignung von Tag Clouds zur Exploration und Navigation nutzergenerierter Inhalte Eignung von Tag Clouds zur Exploration und Navigation nutzergenerierter Inhalte Bachelorarbeit Institut für Informatik der Technischen Universität München 4. Juli 2011 Agenda 1 Einführung: Tag Cloud 2

Mehr

Critical Chain and Scrum

Critical Chain and Scrum Critical Chain and Scrum classic meets avant-garde (but who is who?) TOC4U 24.03.2012 Darmstadt Photo: Dan Nernay @ YachtPals.com TOC4U 24.03.2012 Darmstadt Wolfram Müller 20 Jahre Erfahrung aus 530 Projekten

Mehr

Regressionsanalysen. Zusammenhänge von Variablen. Ziel der Regression. ( Idealfall )

Regressionsanalysen. Zusammenhänge von Variablen. Ziel der Regression. ( Idealfall ) Zusammenhänge von Variablen Regressionsanalysen linearer Zusammenhang ( Idealfall ) kein Zusammenhang nichtlinearer monotoner Zusammenhang (i.d.regel berechenbar über Variablentransformationen mittels

Mehr

3 Deskriptive Statistik in R (univariat)

3 Deskriptive Statistik in R (univariat) (univariat) Markus Burkhardt (markus.burkhardt@psychologie.tu-chemnitz.de) Inhalt 3.1 Ziel... 1 3.2 Häufigkeiten... 1 3.3 Deskriptive Kennziffern I Lagemaße... 2 3.4 Streuungsmaße... 5 3.5 Standardisierung:

Mehr

Disclaimer & Legal Notice. Haftungsausschluss & Impressum

Disclaimer & Legal Notice. Haftungsausschluss & Impressum Disclaimer & Legal Notice Haftungsausschluss & Impressum 1. Disclaimer Limitation of liability for internal content The content of our website has been compiled with meticulous care and to the best of

Mehr

Maschinelles Lernen und Data Mining: Methoden und Anwendungen

Maschinelles Lernen und Data Mining: Methoden und Anwendungen Maschinelles Lernen und Data Mining: Methoden und Anwendungen Eyke Hüllermeier Knowledge Engineering & Bioinformatics Fachbereich Mathematik und Informatik GFFT-Jahrestagung, Wesel, 17. Januar 2008 Knowledge

Mehr

2. Korrelation, lineare Regression und multiple Regression

2. Korrelation, lineare Regression und multiple Regression multiple 2.2 Lineare 2.2 Lineare 1 / 130 2.2 Lineare 2 / 130 2.1 Beispiel: Arbeitsmotivation Untersuchung zur Motivation am Arbeitsplatz in einem Chemie-Konzern 25 Personen werden durch Arbeitsplatz zufällig

Mehr

Versorgungsforschung: ein MUSS für Interdisziplinarität?

Versorgungsforschung: ein MUSS für Interdisziplinarität? Versorgungsforschung: ein MUSS für Interdisziplinarität? Tanja Stamm Medizinische Universität Wien, Abt. f. Rheumatologie FH Campus Wien, Department Gesundheit, Ergotherapie & Health Assisting Engineering

Mehr

Deskriptive Statistik

Deskriptive Statistik Deskriptive Statistik In der beschreibenden Statistik werden Methoden behandelt, mit deren Hilfe man Daten übersichtlich darstellen und kennzeichnen kann. Die Urliste (=Daten in der Reihenfolge ihrer Erhebung)

Mehr

Was können Schüler anhand von Primzahltests über Mathematik lernen?

Was können Schüler anhand von Primzahltests über Mathematik lernen? Was können Schüler anhand von Primzahltests über Mathematik lernen? Innermathematisches Vernetzen von Zahlentheorie und Wahrscheinlichkeitsrechnung Katharina Klembalski Humboldt-Universität Berlin 20.

Mehr

Berufsmaturitätsschule BMS Kaufmännische Richtung. Berufsbegleitende Ausbildung

Berufsmaturitätsschule BMS Kaufmännische Richtung. Berufsbegleitende Ausbildung Berufsmaturitätsschule BMS Kaufmännische Richtung Berufsbegleitende Ausbildung 2 Ziele Die kaufmännische Berufsmaturitätsschule nach abgeschlossener Lehre vermittelt in einem zweijährigen berufsbegleitenden

Mehr

Microsoft Excel Schnellkurs Physik Übungen für Mediziner. Maurizio Musso, Günter Moser, Kristjan Plätzer

Microsoft Excel Schnellkurs Physik Übungen für Mediziner. Maurizio Musso, Günter Moser, Kristjan Plätzer Microsoft Excel Schnellkurs Physik Übungen für Mediziner Maurizio Musso, Günter Moser, Kristjan Plätzer Vorwort Die folgenden Folien enthalten eine Kurzanleitung zu Microsoft Excel. Zur Erstellung wurde

Mehr

Statistische Verfahren für das Data Mining in einem Industrieprojekt

Statistische Verfahren für das Data Mining in einem Industrieprojekt Statistische Verfahren für das Data Mining in einem Industrieprojekt Thorsten Dickhaus Forschungszentrum Jülich GmbH Zentralinstitut für Angewandte Mathematik Telefon: 02461/61-4193 E-Mail: th.dickhaus@fz-juelich.de

Mehr

Antje Damm Ist 7 viel? 44 Fragen für viele Antworten Moritz Verlag, Frankfurt am Main

Antje Damm Ist 7 viel? 44 Fragen für viele Antworten Moritz Verlag, Frankfurt am Main Deutsch Ist 7 viel? 44 Fragen für viele Antworten Moritz Verlag, Frankfurt am Main Was ist Glück? Lieben alle Mütter ihre Kinder? Wird es die Erde immer geben? Tut alt werden weh? Was denken Babys? Plant

Mehr

Risiken bei der Analyse sehr großer Datenmengen. Dr. Thomas Hoppe

Risiken bei der Analyse sehr großer Datenmengen. Dr. Thomas Hoppe Risiken bei der Analyse sehr großer Datenmengen Dr. Thomas Hoppe Datenaufbereitung Datenanalyse Data Mining Data Science Big Data Risiken der Analyse Sammlung Integration Transformation Fehlerbereinigung

Mehr

Künstliche Neuronale Netze und Data Mining

Künstliche Neuronale Netze und Data Mining Künstliche Neuronale Netze und Data Mining Catherine Janson, icasus GmbH Heidelberg Abstract Der Begriff "künstliche Neuronale Netze" fasst Methoden der Informationstechnik zusammen, deren Entwicklung

Mehr

Angewandte Linguistik IUED Institut für Übersetzen und Dolmetschen Fachübersetzen

Angewandte Linguistik IUED Institut für Übersetzen und Dolmetschen Fachübersetzen Zürcher Hochschule für Angewandte Wissenschaften Angewandte Linguistik IUED Institut für Übersetzen und Dolmetschen Fachübersetzen Certificate of Advanced Studies (CAS) Zürcher Fachhochschule Der Kurs

Mehr

Statistische Methoden der Datenanalyse

Statistische Methoden der Datenanalyse Aktuelle Probleme der experimentellen Teilchenphysik (Modul P23.1.2b) Statistische Methoden der Datenanalyse Ulrich Husemann Humboldt-Universität zu Berlin Wintersemester 2010/2011 Vorstellung Vorlesung:

Mehr

9 Diskriminanzanalyse

9 Diskriminanzanalyse 9 Diskriminanzanalyse 9.1 Problemstellung Ziel einer Diskriminanzanalyse: Bereits bekannte Objektgruppen (Klassen/Cluster) anhand ihrer Merkmale charakterisieren und unterscheiden sowie neue Objekte in

Mehr

Modul G.1 WS 07/08: Statistik 17.01.2008 1. Die Korrelation ist ein standardisiertes Maß für den linearen Zusammenhangzwischen zwei Variablen.

Modul G.1 WS 07/08: Statistik 17.01.2008 1. Die Korrelation ist ein standardisiertes Maß für den linearen Zusammenhangzwischen zwei Variablen. Modul G.1 WS 07/08: Statistik 17.01.2008 1 Wiederholung Kovarianz und Korrelation Kovarianz = Maß für den linearen Zusammenhang zwischen zwei Variablen x und y Korrelation Die Korrelation ist ein standardisiertes

Mehr

Inhaltsverzeichnis. Regressionsanalyse. http://mesosworld.ch - Stand vom: 20.1.2010 1

Inhaltsverzeichnis. Regressionsanalyse. http://mesosworld.ch - Stand vom: 20.1.2010 1 Inhaltsverzeichnis Regressionsanalyse... 2 Lernhinweise... 2 Einführung... 2 Theorie (1-8)... 2 1. Allgemeine Beziehungen... 3 2. 'Best Fit'... 3 3. 'Ordinary Least Squares'... 4 4. Formel der Regressionskoeffizienten...

Mehr

Vorlesung Energiewirtschaft II: Risk Management and Electricity Trade

Vorlesung Energiewirtschaft II: Risk Management and Electricity Trade Vorlesung Energiewirtschaft II: Risk Management and Electricity Trade Georg Zachmann V 1.0-1- Agenda of Today's Lecture 1) Self Introduction 2) Organizational Issues 3) Aims of the Course 4) Risk Management

Mehr

Übungen zur Vorlesung. Statistik 2. a) Welche Grundannahmen der linearen Regression sind in Modell (1) verletzt?

Übungen zur Vorlesung. Statistik 2. a) Welche Grundannahmen der linearen Regression sind in Modell (1) verletzt? Institut für Stochastik WS 2007/2008 Universität Karlsruhe JProf. Dr. H. Holzmann Blatt 7 Dipl.-Math. oec. D. Engel Übungen zur Vorlesung Statistik 2 Aufgabe 25 (keine Abgabe) Angenommen die Zielvariable

Mehr

Übungsserie Nr. 10 mit Lösungen

Übungsserie Nr. 10 mit Lösungen Übungsserie Nr. 10 mit Lösungen 1 Ein Untersuchungsdesign sieht einen multivariaten Vergleich einer Stichprobe von Frauen mit einer Stichprobe von Männern hinsichtlich der Merkmale X1, X2 und X3 vor (Codierung:

Mehr

Versicherungsmathematik in 50 Minuten. Schnellbleiche für Unwissende. Vortrag vom 10. Dezember 2008 an der Universität Basel Prof. Dr.

Versicherungsmathematik in 50 Minuten. Schnellbleiche für Unwissende. Vortrag vom 10. Dezember 2008 an der Universität Basel Prof. Dr. Versicherungsmathematik in 50 Minuten Schnellbleiche für Unwissende Vortrag vom 10. Dezember 2008 an der Universität Basel Prof. Dr. Herbert Lüthy 1 Inhalt 1. Was ist Versicherungsmathematik? 2. Bedeutung

Mehr

Versuchsauswertung mit Polynom-Regression in Excel

Versuchsauswertung mit Polynom-Regression in Excel Versuchsauswertung mit Polynom-Regression in Excel Aufgabenstellung: Gegeben sei die in Bild 1 gezeigte Excel-Tabelle mit Messwertepaaren y i und x i. Aufgrund bekannter physikalischer Zusammenhänge wird

Mehr

Was ist Data Mining... in der Fundraising Praxis?

Was ist Data Mining... in der Fundraising Praxis? Was ist Data Mining...... in der Fundraising Praxis? Erkennen von unbekannten Mustern in sehr grossen Datenbanken (> 1000 GB) wenige und leistungsfähige Verfahren Automatisierung Erkennen von unbekannten

Mehr

Commercial Banking Übung 1 Kreditscoring

Commercial Banking Übung 1 Kreditscoring Commercial Banking Übung Kreditscoring Dr. Peter Raupach raupach@wiwi.uni-frankfurt.de Sprechzeit Dienstag 6-7:00 Uhr Raum 603 B Kreditscoring Gliederung Grundanliegen Das Sample Modellspezifikation Diskriminanzanalyse

Mehr

DATA-FORECASTER. Erich Steiner steiner@softopt.de SoftOpt www.softopt.de. 7. April 2003

DATA-FORECASTER. Erich Steiner steiner@softopt.de SoftOpt www.softopt.de. 7. April 2003 DATA-FORECASTER Erich Steiner steiner@softopt.de SoftOpt www.softopt.de 7. April 2003 Was ist DATA-FORECASTER? 1 Was ist DATA-FORECASTER? 1 eine Software für Datamining Was ist DATA-FORECASTER? 1 eine

Mehr