Opinion Mining in der Marktforschung von andreas.boehnke@stud.uni-bamberg.de S. 1
Überblick I. Motivation Opinion Mining II. Grundlagen des Text Mining III. Grundlagen des Opinion Mining IV. Opinion Mining in der Marktforschung V. Fallbeispiel VI. Diskussion S. 2
I. Motivation Opinion Mining Damit Sie heute schon wissen mit welchen Trends Sie morgen Ihr Geld verdienen Jessica Staats S. 3
I. Motivation Opinion Mining Ergebnisse von aktuellen Studien des Jahres 2011: ARD/ZDF: 73% der Deutschen nutzen das Internet für gezielte Informationssuche und Kommunikation via Email Google: 56% der deutschen Internetnutzer informieren sich gezielt im Internet vor einem Kauf S. 4
I. Motivation Opinion Mining Ergebnisse von aktuellen Studien des Jahres 2011: Ralf Schengber: Für 81% spielen Produktbewertungen eine eher wichtige Rolle 70% der Befragten nutzen Social Media im Laufe des Kaufprozess Bewertungen sind besonders für Elektronische Produkte (94%), Reisen/Hotels (84%) und Autos (67%) besonders wichtig Bedeutung von Opinion Mining steigt S. 5
II. Grundlagen des Text Mining Definitionen: Feldman/Dagan definieren Text Mining als Knowledge Discovery from Text (KDT) Gao, Chang und Han definieren Textmining dagegen als art and technology of extraction information and knowledge from text collections stored in the structured repository, document warehouse, for conducting text mining and related business intelligence operations." Text Mining ist nicht trivial S. 6
II. Grundlagen des Text Mining Abgrenzung gegenüber artverwandter Forschungsgebiete: Data Mining Entdeckung von nützlichen Mustern in Daten Information Retrieval Wiederfinden von Dokumenten, welche Antworten auf die Fragen besitzen und nicht neue Antworten finden Information Extraction Extrahieren von spezifischen Informationen aus Texten S. 7
II. Grundlagen des Text Mining Abgrenzung gegenüber artverwandter Forschungsgebiete: Maschinelles Lernen Lernen aus Erfahrung anhand von Beispielen Computer-Linguistik Verarbeitung linguistischer Daten mittels linguistik-relevanter Programme S. 8
II. Grundlagen des Text Mining Prozess des Text Mining: Dokumentenselektion Aufgabendefinition Dokumentaufbereitung (Text) Mining Methoden Interpretation / Evalution Anwendung S. 9
II. Grundlagen des Text Mining Prozess des Text Mining: Dokumentenselektion Aufgabendefinition Dokumentaufbereitung (Text) Mining Methoden Interpretation / Evalution Anwendung 1. Aufgabendefinition Anhand des betriebswirtschaftlichen Problems werden die Ziele des Text Mining beschrieben S. 10
II. Grundlagen des Text Mining Prozess des Text Mining: Dokumentenselektion Aufgabendefinition Dokumentaufbereitung (Text) Mining Methoden Interpretation / Evalution Anwendung 2. Dokumentenselektion Anschließend findet an Hand der formulierten Text Mining Ziele eine Selektion von potentiellen Dokumenten statt S. 11
II. Grundlagen des Text Mining Prozess des Text Mining: Dokumentenselektion Aufgabendefinition Dokumentaufbereitung (Text) Mining Methoden Interpretation / Evalution Anwendung 3. Dokumentaufbereitung Morphologische Analyse (Reduktion der Komplexität) Syntaktische Analyse (Annotation einzelner Satzbausteine und Textteile Semantische Analyse (Ergänzung der syntaktischen Informationen mit kontextuellem Wissen) S. 12
II. Grundlagen des Text Mining Prozess des Text Mining: Dokumentenselektion Aufgabendefinition Dokumentaufbereitung (Text) Mining Methoden Interpretation / Evalution Anwendung 4. (Text) Mining Methoden Klassifikation (automatische Zuordnung von Texten zu Kategorien) Segmentierung (ähnliche Texte werden gruppiert (Clusteranalyse)) S. 13
III. Grundlagen des Opinion Mining Definition: Liu definiert Opinion Mining als Given a set of evaluative text documents D that contain opinions (or sentiments) about an object, opinion mining aims to extract attributes and components of the object that have been commented on in each document d D and to determine whether the comments are positive, negative or neutral. S. 14
III. Grundlagen des Opinion Mining Vorgehensweisen: Sentiment Classification Ganze Dokumente werden als Basiseinheit betrachtet Meinungswörter z.b. Verben (mögen, hassen), Adjektive (schön, schrecklich), Nomen (Schrott, Müll) Sentiment Analysis of Comparative Sentences Meinungsanalyse von vergleichenden Sätzen z.b. Produkt A ist besser als Produkt B Identifizierung der Relativsätze durch Schlüsselwörter (z.b. ebenfalls, favorisieren) und komparative und superlative Adjektive/Adverbien S. 15
III. Grundlagen des Opinion Mining Vorgehensweisen: Feature-Based Opinion Mining Identifizierung häufiger Objekteigenschaften Entscheiden ob die Objekteigenschaften positiv, negativ oder neutral sind Gruppierung von Synonymen und Redewendungen der Objekteigenschaften S. 16
IV. Opinion Mining in der Marktforschung Definition: Böhler definiert Marktforschung als systematische Sammlung, Aufbereitung, Analyse und Interpretation von Daten über Märkte und Marktbeeinflussungsmöglichkeiten zum Zweck der Informationsgewinnung für Marketing-Entscheidungen definiert. Ziel: Situation des eigenen Unternehmens zu ermitteln Stärken auszubauen bzw. Schwächen zu minimieren Methoden der Informationsgewinnung sind die Sekundär- und Primärforschung S. 17
IV. Opinion Mining in der Marktforschung Methoden der Informationsgewinnung: Sekundärforschung greift auf bereits erhobene Daten zu: Vorteile: Nachteile: + Schnell und günstig - Oft kein konkreter Problembezug - Keinen Einfluss auf die Methodik und Qualität der Daten Primärforschung erhebt neue bisher noch nicht erfasst Daten: Vorteile Nachteile: + Konkreter Problembezug, Daten meist nicht anders zu erfassen + Informationen stehen nur dem eigenen Unternehmen zur Verfügung - Teuer und langwierig - Methodisch benötigtes Fachwissen S. 18
IV. Opinion Mining in der Marktforschung Potential Opinion Mining in der Informationsgewinnung: Opinion Mining greift auf bereits bestehende bewertete Daten zu: Vorteile: + Schnell und günstig + Ehrliche und unzensierte Meinungen der Rezessenten Nachteile: - Generalisierbarkeit und Repräsentativität der Stichprobe - Fingierte Bewertungen von verärgerten Kunden oder Konkurrenten S. 19
V. Fallbeispiel Produkt: Galaxy S II Premiumprodukt des Konzerns Samsung Über 10 Millionen Exemplare wurden seit Juli 2011 verkauft Viele Bewertungen im Internet vorhanden S. 20
V. Fallbeispiel 1. Aufgabendefinition: Der Leiter der Forschungsabteilung will wissen, welche Produkteigenschaften die Kunden am Galaxy S II am meisten schätzen um somit Schlüsse für den Nachfolger Galaxy S III abzuleiten. Die Toolauswahl fällt aus betriebswirtschaftlichen Gründen und des guten Rufes auf das Produkt RapidMiner. 2. Dokumentenselektion: Es werden die 100 neusten Bewertungen auf der Amazon.de Plattform analysiert. S. 21
V. Fallbeispiel 3. Dokumentenaufbereitung: Hauptprozess Einlesen der Bewertungen aus der Textdatei Operator Process Documents zur Generierung eines Termvektors aus der Textdatei S. 22
V. Fallbeispiel 3. Dokumentenaufbereitung: Subprozess Tokenize: Merkmalsextraktion Transform (low) Cases Filter Stopwordlist Filter Stopwordlist (manuelle Ergänzungen) Stem (Dictionary) Kein Part of Speech Tagging S. 23
V. Fallbeispiel 4. (Opinion) Mining Methoden: Manuelle Auswertung manuelle Klassifizierung im Stem Operator (positiv, negativ) Einfügen eines zusätzlichen Filter im Hauptprozess der alle Kombinationen aus den Produkteigenschaften (rot markiert) und Meinungswörtern bildet S. 24
V. Fallbeispiel 5. Interpretation/Evaluation und 6. Anwendung 25 Evaluation der Produkteigenschaften 20 15 10 negativ positiv 5 0 Display Kamera Apps Akku Priorität der Entwicklung stärker auf den Akku konzentrieren S. 25
VI. Diskussion Vielen Dank für die Aufmerksamkeit!!! S. 26