26. GIL Jahrestagung



Ähnliche Dokumente
Tiefgreifende Prozessverbesserung und Wissensmanagement durch Data Mining

Eine computergestützte Einführung mit

Managementprozesse und Performance

Übersicht: Modul 2. Methoden der empirischen Sozialforschung, Statistik und computergestützte Datenanalyse. Dr. H.-G. Sonnenberg

Veranstaltungsort Bildungsherberge der Studierendenschaft der FernUniversität Hagen

Quality Assurance Review der IT-Revision (QAR-IT) -Ein Leitfaden -

ZUSAMMENFASSUNG...I VORWORT...II INHALTSÜBERSICHT... IV INHALTSVERZEICHNIS... VI ABBILDUNGSVERZEICHNIS... IX TABELLENVERZEICHNIS...

Data/Information Quality Management

STABILE UND ROBUSTE HANDELSSYSTEMENTWICKLUNG MIT METATRADER

Prozessbewertung und -verbesserung nach ITIL im Kontext des betrieblichen Informationsmanagements. von Stephanie Wilke am

Bachelorabschlussseminar Dipl.-Kfm. Daniel Cracau

Adoptionsfaktoren. Thorsten^Litfin^ Empirische Analyse am Beispiel eines innovativen Telekommunikationsdienstes. Deutscher Universitäts-Verlag

Einflussfaktoren auf die Teamkompetenz in Projekten. Empirische Studie zur Master Thesis Mai 2010

Prototypenentwicklung zur Identifikation gleichartiger Nachrichtenticker am Beispiel des Gashandels

Begriffsbestimmung CRISP-DM-Modell Betriebswirtschaftliche Einsatzgebiete des Data Mining Web Mining und Text Mining

Regressionsanalyse zur Optimierung von künstlichen neuronalen Netzen bei der DAX-Prognose

1 Personalisierte Internetauftritte zum Aufbau und zur Stärkung von Marken... 1

Fragebogen zur Nutzung des Angebots der Hochschulbibliothek an elektronischen Medien:

Vergleich von künstlichen Neuronalen Netzen und multivariaten statistischen Verfahren in der Primärforschung: Ein empirischer Vergleich

Objektivität und Validität der Critical Incident Technique

Qualitätsmanagement mit Continuous Integration Untersuchung anhand einer Machbarkeitsstudie in der Praxis. Abschlußpräsentation zur Studienarbeit

9 Resümee. Resümee 216

TÜV Service tested Prüfgrundlagen

Hauptseminar am Fachgebiet für Quantitative Methoden der Wirtschaftswissenschaften

Dieses Material ist zur Veröffentlichung nicht freigegeben.

Pfadanalyse. 1. Grundlegende Verfahren. Bacher, SoSe2007

InnoFaktor Innovationsstrategien mittelständischer Weltmarktführer im demografischen Wandel

Industrie 4.0 in Deutschland

Datenanalyse - Schnittstellendesign

DISKUSSIONSBEITRÄGE DER FAKULTÄT FÜR BETRIEBSWIRTSCHAFTSLEHRE MERCATOR SCHOOL OF MANAGEMENT UNIVERSITÄT DUISBURG-ESSEN. Nr. 374

Eine empirische Analyse für den deutschen Markt. von. Dr. Alexander Hick

Project roles and responsibilities

Erfolgsfaktor Work-Life Balance? Ein Vergleich verschiedener Personengruppen

Mitarbeiterbefragung als PE- und OE-Instrument

User Experience vs. Retrievaltests Wie lässt sich die Relevanz von Suchergebnissen bewerten?

1 Einleitung. 1.1 Motivation und Zielsetzung der Untersuchung

Gliederung der Vorlesung Wirtschaftsstatistik Seite im Buch

Aufnahmeprüfung Psychologie. Studienjahr 2014 / 2015

Qualifizierung studentischer TrainerInnen. Dr. Andrea Cnyrim qualiko Kolloquium Hildesheim 16. Juli Interkulturelle Kompetenz Was ist das?

UNIVERSITÄT LEIPZIG WIRTSCHAFTSWISSENSCHAFTLICHE FAKULTÄT DIPLOM-PRÜFUNG

Kurzbeschreibung GVB-Marktstudie. Top-Anbieter von Telematiksystemen in der Transportlogistik

3D Visualisierung von UML Umgebungsmodellen

Die Quantitative und Qualitative Sozialforschung unterscheiden sich bei signifikanten Punkten wie das Forschungsverständnis, der Ausgangspunkt oder

Agile Vorgehensmodelle in der Softwareentwicklung: Scrum

Grundlagen der Datenanalyse am Beispiel von SPSS

IT OUTSOURCING. Wie die IT durch Transparenz zum internen Dienstleister wird. Herford, , Steffen Müter

Einführung des ESVG 2010 in die deutsche FinR 8. Berliner VGR-Kolloquium, 18. Juni 2015

UX SportScheck. Fallstudie eresult UX Monitor. eresult GmbH Results for Your E-Business (

Die Interferenz von flexiblen Arbeitszeiten mit der Nutzbarkeit arbeitsfreier Zeit Ein Prädiktor für soziale Beeinträchtigungen

Fallbeispiel. Auswahl und Evaluierung eines Software- Lokalisierungstools. Tekom Herbsttagung 2004 Angelika Zerfaß

Methodische Fragen zur frühen Nutzenbewertung nach 35a SGB V

Claus Ebster, Lieselotte Stalzer, Wissenschaftliches Arbeiten für Wirtschafts- und Sozialwissenschaftler

Comparison of Software Products using Software Engineering Metrics

Meffert Marktforschung

Grundlagen für den erfolgreichen Einstieg in das Business Process Management SHD Professional Service

extensible Business Reporting Language Status des Promotionsvorhabens und Ausblick

SDD System Design Document

Data Mining für die industrielle Praxis

Klausur zur Vorlesung Multivariate Verfahren, SS Kreditpunkte, 90 min

Linked Open Data (LOD) in der Landwirtschaft. Workshop Anwendungsbeispiele nach Themen I

Kundenwertorientierte strategische Segmentierung in der gesetzlichen Krankenversicherung

Franz Kronthaler. Statistik angewandt. Datenanalyse ist (k)eine Kunst. Excel Edition. ^ Springer Spektrum

Stadtwerke im Spiegelbild der öffentlichen Meinung. Energie 2009

Auswertung qualitativer Interviews

Entwicklung von Führungskompetenzen

Leseauszug DGQ-Band 14-26

Fallstricke des Kostencontrolling zwischen operativen Notwendigkeiten und strategischen Steuerungsbedarfen

Service erfolgreich gestalten im Gesundheitswesen

Die Orgadata AG ist ein stark expandierendes Software-Unternehmen aus Leer. Mit unserem System LogiKal

Die Nutzer im Mittelpunkt des Software-Entwicklungprozesses

How to do? Projekte - Zeiterfassung

Statistische Datenanalyse mit SPSS

Implementierung eines steuerlichen Risikomanagementsystems

Evaluation nach Maß. Die Evaluation des BMBF-Foresight-Prozesses

Ergebnisse einer Umfrage zur aktuellen

Architekturplanung und IS-Portfolio-

Web Market Research.360

Auswirkungen telemedizinischer Versorgung auf das Arzt-Patient-Verhältnis

Das Würfel-Modell kurz erklärt Ergänzung zum Foliensatz

The Shopper Rules Einfluss von Internet, Handy & Co. auf das Informationsverhalten von Konsumenten

down-vorgehen bei Anforderungsanalysen als notwendige Ergänzung zum Bottom-up

Ihr Logo. Willkommen zur Schulung. Kundenorientierung WEKA MEDIA GmbH & Co. KG. Folie 0/01

How-to: Webserver NAT. Securepoint Security System Version 2007nx

kkk Begleitete Elternschaft in NRW: Zahlen und Befragungsergebnisse

Versuch 6 Agilent VEE Transistorkennlinie mittels VXI Systems mittels VXI-Plug&Play Driver über IEEE488-Bus

Modellvorhaben Lizenz- und Kostenfragen Fragen an die Dienstenutzer (Arbeitsversion Fragebogen)

Mitarbeiterbefragung zur Führungsqualität und Mitarbeitermotivation in Ihrem Betrieb

Fachdidaktik der Informatik Jörg Depner, Kathrin Gaißer

HMS. Statistiken mit SAS ins Internet. HMS Analytical Software GmbH - Johannes Lang

Numerische Modellierung von Wasserstand und Seegang an Halligwarften als Grundlage für die Ermittlung von Sicherheitskriterien

IC Power-Pricing-Tool

Monitoring und Sozialberichterstattung.

Evaluation und Optimierung Ihrer Inter-/Intranet-Präsenz.

Customer Relationship Management im Agribusiness

APIS Benutzertreffen Tipps und Tricks vom APIS Support

Qualitative und Quantitative Forschungsmethoden

Auswertung der empirischen Erhebung mobiles Internet Januar

fh management, communication & it Constantin von Craushaar fh-management, communication & it Statistik Angewandte Statistik

Modul 02: Zum Ablauf einer statistischen (empirischen) Untersuchung. Prof. Dr. W. Laufner. Beschreibende Statistik. Wozu statistische Methoden

Transkript:

GeorgAugustUniversität Göttingen 26. GIL Jahrestagung Einsatz von künstlichen Neuronalen Netzen im Informationsmanagement der Land und Ernährungswirtschaft: Ein empirischer Methodenvergleich Holger Schulze, Achim Spiller 6. März 2006 Schulze, Spiller Einsatz von KNN im Informationsmanagement 1

Gliederung 1 Einleitung: Verwendung von statistischen in der Primärforschung 2 Methodische Vorgehensweise 3 Ergebnisse des empirischen svergleich 4 Fazit 6. März 2006 Schulze, Spiller Einsatz von KNN im Informationsmanagement 2

Gliederung 1 Verwendung von statistischen in der Primärforschung 2 Methodische Vorgehensweise 3 Ergebnisse des empirischen svergleich 4 Fazit 6. März 2006 Schulze, Spiller Einsatz von KNN im Informationsmanagement 3

Die Ablaufschritte des Marktforschungsprozesses Schritt 1 Problemdefinition Beobachtungen Befragungen Schritt 2 Marktforschungsdesign Primärdaten Schritt 3 Schritt 4 Schritt 5 Datengewinnung Datenanalyse Kommunikation der Ergebnisse Erhebungsart, Aktualität, Detailliertheit, Objektivität, Relevanz, Fallzahl, Variablenanzahl, Skalenniveau interne Quellen Sekundärdaten externe Quellen Quelle: Eigene Darstellung in Anlehnung an HÜTTNER 1999: 23; BEREKOVEN et al. 1999: 49 6. März 2006 Schulze, Spiller Einsatz von KNN im Informationsmanagement 4

Die Ablaufschritte des Marktforschungsprozesses Schritt 1 Problemdefinition univariate bivariate multivariate Schritt 2 Marktforschungsdesign Primärdaten Schritt 3 Datengewinnung künstliche Neuronale Netze Data Mining Schritt 4 Datenanalyse Sekundärdaten Schritt 5 Kommunikation der Ergebnisse univariate bivariate multivariate Quelle: Eigene Darstellung in Anlehnung an HÜTTNER 1999: 23; BEREKOVEN et al. 1999: 49 6. März 2006 Schulze, Spiller Einsatz von KNN im Informationsmanagement 5

Ziel der Studie Ziel der folgenden Studie ist es, zu untersuchen, ob durch den Einsatz von künstlichen Neuronalen Netzen in der Primärforschung eine Verbesserung der analytischen Informationsgewinnung im Vergleich zu den bisher eingesetzten multivariaten möglich ist. 6. März 2006 Schulze, Spiller Einsatz von KNN im Informationsmanagement 6

Gliederung 1 Verwendung von statistischen in der Primärforschung 2 Methodische Vorgehensweise 3 Ergebnisse des empirischen svergleich 4 Fazit 6. März 2006 Schulze, Spiller Einsatz von KNN im Informationsmanagement 7

Vergleich von KNN und multivariaten multivariate Neuronale Netze Dependenzanalyse Regressionsanalyse Interdependenzanalyse Clusteranalyse MultiLayer Perceptrons SelfOrganizing Maps Quelle: Eigene Darstellung Software: Clementine 8.5 und SPSS 12 6. März 2006 Schulze, Spiller Einsatz von KNN im Informationsmanagement 8

Kriterien zur Beurteilung der Kriterien zur Beurteilung der Leistungsfähigkeit direkte Kriterien indirekte Kriterien datenorientierte Kriterien Datendeformation Datenqualität Datenmenge methodenorientierte Kriterien Ergebnissicherheit Generalisierbarkeit Modellprämissen anwenderorientierte Kriterien Interessantheit Verständlichkeit Interpretierbarkeit Bedienbarkeit Flexibilität Verfügbarkeit Quelle: Eigene Darstellung in Anlehnung an BERRY et al. 1997: 422f.; KÜPPERS 1999: 87f. 6. März 2006 Schulze, Spiller Einsatz von KNN im Informationsmanagement 9

Übersicht über die Fallstudien und die Modelle Fallstudie/ Anwendungsschwerpunkt svergleich Stichprobengröße Modelle Fallstudie 1: Meinungsforschung zum Stallbau in Diemarden/ Ursachenanalyse (Strukturabbildung) 164 Anwohner MLP vs. MRA Modell 1: explorative Faktorenanalyse mit anschließender Ursachenanalyse Modell 2: Aufnahme aller unabhängigen Variablen in das Modell mit anschließendem sequentiellen Ausschluss nichtsignifikanter Variablen Fallstudie 2: Markenpräferenz bei Chinesischen Konsumenten/ Typlogisierung (Strukturentdeckung) 800 Konsumenten SOM vs. CLU (Ward, KMeans) Modell 1: explorative Faktorenanalyse mit anschließender Clusterung auf Basis von 3 clusterbildenden Variablen Modell 2: Clusterung auf Basis von 11 clusterbildenden Variablen Quelle: Eigene Darstellung 6. März 2006 Schulze, Spiller Einsatz von KNN im Informationsmanagement 10

Gliederung 1 Verwendung von statistischen in der Primärforschung 2 Methodische Vorgehensweise 3 Ergebnisse des empirischen svergleich 4 Fazit 6. März 2006 Schulze, Spiller Einsatz von KNN im Informationsmanagement 11

Prognosequalität im svergleich (Fallstudie 1) Modelle InSample Qualität OutofSample Qualität MSE RMSE MSE RMSE Multiple Regressionsanalyse Modell 1 Modell 2 0,039 0,024 0,196 0,154 0,070 0,046 0,266 0,216 MultiLayer Perceptrons Modell 1 0,044 0,210 0,073 0,270 Regressionsanalyse (Modell 1, InSample Menge) nach dem MSE um 12,81 % besser als MLP Regressionsanalyse (Modell 1, OutofSample Menge) nach dem MSE um 2,72 % besser als MLP Quelle: Eigene Berechnungen 6. März 2006 Schulze, Spiller Einsatz von KNN im Informationsmanagement 12

SOM, KMeans und Ward im Vergleich (Fallstudie 2) Fehlerquadratsumme 2000 1800 1600 1400 1200 1000 800 600 400 200 0 2 3 4 5 6 7 8 9 10 11 12 13 14 15 Ward KMeans SOM Quelle: Eigene Berechnungen Anzahl der Cluster 6. März 2006 Schulze, Spiller Einsatz von KNN im Informationsmanagement 13

Validität der Clusterlösungen im svergleich Fallstudie 2, Modell 1 Cluster Validierung interne Validität relative Validität eta² eta DA = Diskriminanzanalyse Quelle: Eigene Berechnungen Wilks` Lambda Gütekriterium Übereinstimmungsquote der DA Übereinstimmungsquote der RCLU KappaWert der RCLU KMeans 0,55 0,74 96,30 0,084 78,20 0,726 SOM 0,46 0,60 88,00 0,097 52,82 0,401 RCLU = replizierte Clusteranalyse Nur 58 % der Objekte wurden durch die SOM und KMeans gleich klassifiziert! 6. März 2006 Schulze, Spiller Einsatz von KNN im Informationsmanagement 14

Bewertung von multivariaten und KNN (Teil 1) Kriterium datenorientierte Kriterien Datendeformation Datenqualität Datenmengen methodenorientierte Kriterien Ergebnissicherheit Generalisierung Modellprämissen Quelle: Eigene Darstellung Strukturentdeckung Clusteranalyse SOM Strukturabbildung Regressionsanalyse MLP 6. März 2006 Schulze, Spiller Einsatz von KNN im Informationsmanagement 15

Bewertung von multivariaten und KNN (Teil 2) Kriterium anwenderorientierte Kriterien Interessantheit Verständlichkeit Interpretierbarkeit Bedienbarkeit Flexibilität Verfügbarkeit Strukturentdeckung Clusteranalyse SOM Strukturabbildung Regressionsanalyse MLP Quelle: Eigene Darstellung 6. März 2006 Schulze, Spiller Einsatz von KNN im Informationsmanagement 16

Einordnung der Analyseverfahren anwenderorientierte Anforderungen Neuronale Netze multivariate bivariate univariate methoden und datenorientierte Anforderungen Quelle: Eigene Darstellung 6. März 2006 Schulze, Spiller Einsatz von KNN im Informationsmanagement 17

Gliederung 1 Verwendung von statistischen in der Primärforschung 2 Methodische Vorgehensweise 3 Ergebnisse des empirischen svergleich 4 Fazit 6. März 2006 Schulze, Spiller Einsatz von KNN im Informationsmanagement 18

Fazit Der Einsatz von KNN zur Datenanalyse in der Primärforschung ist prinzipiell möglich Erweiterung des Methodenvorrates Keine besseren Güteergebnisse und Informationsgewinne durch die KNN Was ist bei komplexeren, nichtlinearen Zusammenhängen in den Datenstrukturen? KNN weisen Schwächen in der Anwendbarkeit auf BlackBox Charakter und TrialandError Entwicklungsprozess 6. März 2006 Schulze, Spiller Einsatz von KNN im Informationsmanagement 19

Fazit Handlungsempfehlung: Einsatz von KNN in der Wissenschaften und in Marktforschungsunternehmen Einsatz von multivariaten in der betrieblichen Praxis zukünftige Entwicklungen: weitere Studien zum Einsatz von KNN in der Primärforschung Software mit anwenderorientierte Benutzeroberfläche Potenziale KNN: Eigenschaften (Nichtlinearität, Lernfähigkeit usw.) hohes Verbesserungs und Weiterentwicklungspotenziale 6. März 2006 Schulze, Spiller Einsatz von KNN im Informationsmanagement 20

GeorgAugustUniversität Göttingen Vielen Dank für Ihre Aufmerksamkeit! 6. März 2006 Schulze, Spiller Einsatz von KNN im Informationsmanagement 21