WAZ Zeitungsgruppe optimiert Direkt-Marketing durch die Bestimmung von Adresspotenzialen. Dr. Ana Moya Senior Analyst

Ähnliche Dokumente
Potenziale der Region Bonn/Rhein-Sieg. R. Andreas Domschke Creditreform Bonn Domschke KG

Kundenstrukturanalyse. Am Beispiel der Abonnenten eines Verlags

Profile microgeographischer Daten in dem PLZ-Gebiet PRO POTSDAM GmbH

Volkshochschule Salzburg Strategie-Entwicklung

Erwartungen der Konsumenten

Standortbewertung und Filialnetzoptimierung

Teil: lineare Regression

Einführung in die Statistik für Politikwissenschaftler Sommersemester 2011

Chi Quadrat-Unabhängigkeitstest

Anmietung von Consumer-Adressen.

Allgemeines Titelprofil Rheinische Post (GA) Verbreitung, Auflagen und Leserschaft

Geomail Wie erreiche ich mit meinem Werbeversand die richtige Zielgruppe?

Personicx Typologie in der best for planning 2016

Prof. Dr. Walter F. Tichy Dr. Matthias Müller Sommersemester 2006

ZAHLEN UND FAKTEN, DIE UNSEREN ERFOLG SICHTBAR MACHEN. NATÜRLICH LESEN.

Übersicht microm MARKET. Alle Variablenpakete im Überblick

Delmenhorst - Migranten und Wohnungsmarktstrategie

Angewandte Statistik 3. Semester

Standardisierte Vorgehensweisen und Regeln zur Gewährleistung von: Eindeutigkeit Schlussfolgerungen aus empirischen Befunden sind nur dann zwingend

Erste Ergebnisse einer Delmenhorster Wohnungsmarktstrategie, hier für Migranten

THEMA: ZUSAMMENHANGSANALYSEN FÜR KATEGORIALE VARIABLEN " TORSTEN SCHOLZ

Empirische Analysen mit dem SOEP

Test auf den Erwartungswert

Grundlagen der Statistik

Titelprofil Rheinische Post (WIRA Niederrhein Süd) Verbreitung, Auflagen und Leserschaft

Senozon Locations Report

Statistik II: Signifikanztests /1

Bestandskundenmanagement Wo drückt bei Ihnen der Schuh?

Lebenswelten in Deutschland

TNS EX A MINE GeoCheck Evaluation und Selektion mikrogeographischer Daten für Marketing und Vertrieb. TNS Infratest Applied Marketing Science

VS PLUS

Institut für Biometrie und klinische Forschung. WiSe 2012/2013

WBG-Unternehmensgruppe Augsburg. Edgar Mathe Geschäftsführer WBG-Unternehmensgruppe Augsburg Dipl.-oec. (Univ.) Steuerberater Syndikus

Rheinische Post (WR Niederrhein Nord) (Factsheet Wirtschaftsraumausgabe/Bezirksausgaben/Teilausgaben)

microm Geo Milieus Das psychografische Zielgruppen- Modell für Sie lokalisiert

Statistik, Geostatistik

microm Limbic Types Ihren Kunden in den Kopf geschaut!

Zwei kategoriale Merkmale. Homogenität Unabhängigkeit

Mundt Direkt. ib Scoring

1 Inhaltsverzeichnis. 1 Einführung...1

Probeklausur zur Vorlesung Statistik II für Studierende der Soziologie und Nebenfachstudierende

Mundt Direkt. Scoring-Nutzen in Zahlen

Aktuelle Entwicklung der geringfügigen Beschäftigungen

Chi-Quadrat Verfahren

microm Geo Milieus Lokalisierung psychographischer Zielgruppen

Bei näherer Betrachtung des Diagramms Nr. 3 fällt folgendes auf:

Klausur zur Mathematik für Biologen

Amt der Oö. Landesregierung Direktion Präsidium Information der Abt. Statistik. Vorausschätzung der oö. Privathaushalte nach Größe bis 2060

Kapitel 2.1: Die stochastische Sicht auf Signale Georg Dorffner 67

Bayes Klassifikatoren M E T H O D E N D E S D A T A M I N I N G F A B I A N G R E U E L

BIOL, HST HS 2014 Dr. M. Kalisch. MC-Quiz 1. Einsendeschluss: Dienstag, der :59 Uhr

Verteilung der neuen Sinus-Milieus

Dialogmarketing dem Spender und Sponsor auf der Spur. Ulrich Hölscher, bedirect GmbH & Co. KG R. Andreas Domschke, Creditreform Bonn

Ablaufschema beim Testen

STAR: Kostenstrukturen in Anwaltskanzleien 1994 und 1998

Aufgabenblock 3. Durch zählen erhält man P(A) = 10 / 36 P(B) = 3 / 36 P(C) = 18 / 36 und P(A B) = 3 /

Grundlagen der Statistik

Mögliche Fehler beim Testen

Warum ist die Erwerbsneigung ostdeutscher Frauen höher als die westdeutscher Frauen?

Statistik. Jan Müller

» S C H R I T T - F Ü R - S C H R I T T - A N L E I T U N G «M U L T I P L E L I N E A R E R E G R E S S I O N M I T S P S S / I B M Daniela Keller

Zielgruppen-Steckbrief

Einführung in die Statistik für Politikwissenschaftler Sommersemester 2013

Visionen zur Bannerwerbung mit eigenen Kundendaten

Was sind Zusammenhangsmaße?

Statistik II Übung 2: Multivariate lineare Regression

Es können keine oder mehrere Antworten richtig sein. Eine Frage ist NUR dann richtig beantwortet, wenn ALLE richtigen Antworten angekreuzt wurden.

Bivariate Zusammenhänge

Überblick über multivariate Verfahren in der Statistik/Datenanalyse

Wo leben Familien in der Stadt? Kommunalstatistiken im Vergleich

Bachelorabschlussseminar Dipl.-Kfm. Daniel Cracau

Regionalisierte Bevölkerungsentwicklung der Schweiz bis 2040

Scoring: Kaufwahrscheinlichkeiten ermitteln und gezielt Umsätze steigern

Liegenschaftsexposé für Objekt Paul-Klee-Weg Bochum

Metropolregionen in Deutschland

Versorgung mit Briefkästen und Paketshops in Deutschland

Immowelt-Marktbericht Frankfurt

Echt erfolgreich verkaufen!

Selbstständig und doch abhängig? Zur Einkommenssituation selbstständig erwerbstätiger Frauen

(Neu-)Kunden vor und nach der Buchung im Visier: Wie Data Driven Targeting die Konversionen steigen lässt

Best for planning goes Geo! DDS Data Days 2013

1 3 1є7 1є7 1є7 1є7 1є7 1є7 1є7 1є7 1є7 1є7 1є7

Regression ein kleiner Rückblick. Methodenseminar Dozent: Uwe Altmann Alexandra Kuhn, Melanie Spate

Der Einfluss der Vertragsarztdichte auf die Inanspruchnahme sekundärer präventiver Leistungen in Deutschland Eine räumliche Analyse

Berliner Gespräche zur Digitalen Integration

Grundlegende Eigenschaften von Punktschätzern

Auflagenstatistik der Zeitungen in Deutschland

ERFAHRUNG GIBT SICHERHEIT CREDITREFORM KUNDENREPORT 2010/2011

Aufgaben zu Kapitel 9

THEMA: "STATISTIK IN DER PRAXIS TESTEN IST BESSER ALS VERMUTEN" TORSTEN SCHOLZ

Entwicklung und Struktur der Niedriglohnbeschäftigung in Deutschland sowie Aufstiegschancen von Niedrigverdienern. Hermann Gartner, Thomas Rhein (IAB)

microm Geo Milieus Lokalisierung psychographischer Zielgruppen zur operativen Nutzbarkeit

Metrische und kategoriale Merkmale

Glossar Biometrie / Statistik. Auszug für Fragebogen Fallzahlberechnung/-begründung

Transkript:

WAZ Zeitungsgruppe optimiert Direkt-Marketing durch die Bestimmung von Adresspotenzialen Dr. Ana Moya Senior Analyst

Who we are Titel und Kennzahlen NRW Vier (Haupt-) Tageszeitungen - Westdeutsche Allgemeine Zeitung (WAZ) - Neue Rhein Zeitung (NRZ) - Westfälische Rundschau (WR) - Westfallen Post (WP) Reichweite: 35,1 %, dies sind insgesamt 2,04 Mio. Leser* Gesamtauflage Q4/2012: 718.998** * Medienanalyse 2012 ** IVW-Gemeldet 2013 International Business Machines Corporation 2

Where we are Das Verbreitungsgebiet erstreckt sich von der niederländischen Grenze im Nordwesten bis Rheinland-Pfalz im Süden von Raum Moers im Westen bis nach Marsberg im Osten 2013 International Business Machines Corporation 3

Überblick Hauptziel Welche Zielgruppen mit welchen Merkmalen haben eine überdurchschnittliche Responsewahrscheinlichkeit? Ansatz & Daten Ergebnisse Daten: Die soziodemographischen Variablen liegen auf PLZ8-Ebene vor. Für ehemalige Abonnenten ist auch Abo-Information vorhanden. Ansatz: Reagierer-Profilierung (Deskriptive Analyse) Responseanalyse (Bayes'sches Netze, Entscheidungsbäume sowie logistische Regression) Identifizierung der Merkmale, die den größten Einfluss auf die Responsewahrscheinlichkeit auswirken. Ableitung von Regeln, die die Klassenzugehörigkeit eines noch nicht zugeordneten Adressaten bestimmen bzw. vorhersagen. Festlegung des Responseverhaltens im Bezug auf unsere Titel, so dass dem Adressaten der passendste Titel angeboten werden kann. 2013 International Business Machines Corporation 4

Übersicht der Analyseschritte Plausibilitätsprüfung Reagierer-Profilierung Verfügbare Adressen Geocodierung (Zuordnung einer PLZ8) Anreicherung mit Geodaten (auf PLZ8-Ebene) Modellierung Unabhängige Abhängige Variablen Variablen (lineare) Funktion (f) X 1, X 2, Y. Klassenzugehörigkeit Vorhersagen Responseverhalten Einflussreichste Variablen 2013 International Business Machines Corporation 5

Übersicht der Modellierungsansatz Datenbestand 1 GEWINNSPIEL Reine Adresse Datenbestand 2 MAILINGCUBE Datenbestand 3 ALTBESTAND Adresse sowie Abo-Infos, u.a. der letzte bestellte Titel, Monate seit dem letzten Vollabo Ausländerquote Kaufkraft Lebensphase Straßentyp Haushaltsstatus PLZ 8 Ø 500 HH Limbic Type Haustyp Familienstruktur Sinus Milieus Arbeitslosenquote Gegeben: Response (R) als dichotomische Variable 0: NEIN 1: JA Gesucht: (R=1) Є [0,1] Datenbestände microgeographische Daten Response Unabhängige Variablen (lineare) Funktion (f) Abhängige Variablen X 1, X 2,. P(R=1) 2013 International Business Machines Corporation 6

Übersicht der geographischen Hierarchien 2013 International Business Machines Corporation 7

PLZ8 Ein Beispiel Abonnentendichte nach PLZ8 Gebieten Zoom Abonnentendichte=Anzahl Abonnenten/Anzahl Haushalte im Gebiet Kundendichte stark unterdurchschnittlich (bis 15%) unterdurchschnittlich (>15-20%) durchschnittlich (>20-25%) überdurchschnittlich (>25-35%) stark überdurchschnittlich (>35%) 2013 International Business Machines Corporation 8

Ansatz - Erste Validierung Drei Datenbestände wurden untersucht: 1) Gewinnspieladressen 2) Mailingcubeadressen (zwischen 3 und 36 Monaten ohne Abo) und 3) Altadressen (mehr als 36 Monate ohne Abo) Hypothesen: H 0 : Die Herkunft der Daten und die Responsequote sind stochastisch unabhängig. Der Chi-Quadrat-Unabhängigkeitstest lieferte letztendlich das Ergebnis, dass bei einem Konfidenzniveau von 99% die Nullhypothese verworfen werden kann, so dass zwischen den getesteten Variablen eine stochastische Abhängigkeit vorliegt. 2013 International Business Machines Corporation 9

Ansatz Reagierer-Profilierung Reagierer aus dem Altbestand weisen eine besonders überdurchschnittliche Kaufkraft auf. Eine unterdurchschnittliche Ausländerquote weist keiner von den hier betrachteten Datenbeständen auf. Reagierer aus dem Mailingcube wohnen eher in 6-9 Familienhäusern, während der Reagierer aus dem Altbestandcube eher in 1-2 Familienhäusern lebt. In allen Datenbeständen dominiert ein unterdurchschnittlicher Status. 2013 International Business Machines Corporation 10

Reagierer und Nicht-Reagierer im direkten Vergleich Deskriptive Statistik (Zusammenfassung) Variable Kaufkraft Ausländerquote Überdurchschnittlich Überdurchschnittlich Arbeitslosenquote Überdurchschnittlich Ausprägung im Vergleich der Reagierer zu Nicht-Reagieren für Mailing Geschlecht Männlich Weiblich Altersgruppen Einwohner unter 14 Einwohner zw. 15-29 Einwohner zw. 30-44 Einwohner zw. 45-59 Einwohner zw. 60-74 Einwohner über 75 Sinus Milieus Konservativ-Etablierte Hedonisten Performer Bürgerliche Mitte Sozialökologische Traditionelle Prekäre Andere Limbic Type Traditionalisten Disziplinierte Performer Abenteurer Hedonisten Harmoniser Offene Lebensphase Junge Paare Junge Familie mit Kind Singles Paare Familie mit Kind Alleinstehende Senioren Ältere Paare Straßentyp Reine Wohnstraße Läden und Dienstleistungen Mischform Gewerbestraße Extrem gewerblich Familienstruktur Alleinstehend/ Singlehaushalte Überdurchschnittlicher Anteil Singlehaushalte Haushaltsstatus: Niedrigster Status Sehr niedriger Status Haustyp: 1-2 Familienhäuser in homogen bebautem Straßenabschnitt Gemischte Familienstruktur Überdurchschnittlicher Anteil Familie mit Kindern Unterdurchschnittlicher Status Durchschnittlicher Status 1-2 Familienhäuser in nicht homogen bebautem Straßenabschnitt 3-5 Familienhäuser 6-9 Familienhäuser Nahezu ausschließlich Familien mit Kind Überdurchschnittlicher Status Wohnblocks mit 10-19 Haushalten Höchster Status Hochhäuser mit 20 und mehr Haushalten überwiegend gewerblich genutzte Häuser Die Merkmale Kaufkraft, Ausländerquote und Arbeitslosenquote unterscheiden sich von den übrigen. Für diese Merkmale wird jeweils ein Wert im Verhältnis zum Durchschnittswert der BRD dargestellt. Für die übrigen Felder bzw. Merkmalsausprägungen wird jeweils die Tendenz zwischen Reagieren und Nicht-Reagierern dargestellt. Schwächer Ausgeprägt* Gleich Ausgeprägt* Stärker Ausgeprägt* *im Vergleich zu den Nicht-Reagierern 2013 International Business Machines Corporation 11

Scoremodelle und Potenzial Anhängige Variablen: Responsewahrscheinlichkeit 2013 International Business Machines Corporation 12

Scoremodell - Vergleichskriterien Scoring-Methoden sind Punktbewertungsmethoden. Responsewahrscheinlichkeit - nicht nur eine ordinale Ratingnote ist das Ziel, sondern auch eine genaue Responsewahrscheinlichkeit. Vollständigkeit - Multikollinearität und einen Anstieg der Prognoseunsicherheit zu verhindern. Prognose Genauigkeit es werden unterschiedliche Modelle untersucht und nach ihrer Prognosefähigkeit (Prozentsatz für richtige und falsche Vorhersagen auf der Testmenge) geprüft. Ein Modell für jeden Datenbestand: GEWINNSPIEL MAILINGCUBE (Vertiefung) ALTBESTAND 2013 International Business Machines Corporation 13

Scoremodell Beste Prognosefähigkeit Ein Bayes'sches Netz dient dazu, die gemeinsame Wahrscheinlichkeitsverteilung aller beteiligten Variablen unter Ausnutzung bekannter bedingter Unabhängigkeiten möglichst kompakt zu repräsentieren. Dabei wird die bedingte (Un)abhängigkeit von Untermengen der Variablen mit dem A-priori-Wissen kombiniert. GEWINNSPIEL MAILINGCUBE (Vertiefung) ALTBESTAND 2013 International Business Machines Corporation 14

Scoremodelle und Potenzial Scorewert (Dezile*) Kum_Ant_Potenzial Kum_Ant_Responses 1 10% 21,40% 2 20% 35,80% 3 30% 47,50% 5 40% 57,60% 4 50% 67,60% 6 60% 76,50% 7 70% 84,20% 9 80% 91,50% 8 90% 97,30% 10 100% 100,00% Bei zufälliger Auswahl von 20% der Adressen aus dem Referenzbestand (Potenzial) befinden sich auch nur 20% der Zielgruppe Reagierer (siehe rote Linie) in diesem Segment, während es bei einer Selektion nach Score ca. 35,80% (siehe blaue Linie) sind. *) Durch Dezile (lat. Zehntelwerte ) wird die Menge der verteilten Werte in 10 umfangsgleiche Teile zerlegt 2013 International Business Machines Corporation 15

Verteilung der Aussandmengen und der Scorewerte über die Zielgruppe 2013 International Business Machines Corporation 16

Aussandmengen und Scorewerte Sehr niedrige Niedrige Mittlere Hohe Sehr hohe Gebiete mit wenig Potenzial (schlechtem Scorewert) und trotzdem viele Adressen vorhanden (hohe Ansprache). Gebiete mit viel Potenzial (gutem Scorewert) und trotzdem nicht genügend Adressen vorhanden (niedrige Ansprache). 2013 International Business Machines Corporation 17

Scorewerte und Titel Unterschiedliche Responseverhalten können auch im Bezug auf den Titel festgestellt werden, so dass dem Adressaten der passendste Titel angeboten werden kann. Scorewert Scorewert < 2013 International Business Machines Corporation 18

Zusammenfassung Voruntersuchung Daten- Quelle Die Herkunft der Daten (Datenbestand) ist (stochastisch) abhängig von der Responsequote. Unterschiedliche Modelle pro Datenquelle sinnvoll. Titel Unterschiedliche Responseverhalten konnten auch nach Titel festgestellt werden. Je nach Gebiet kann Angebot optimiert werden 2013 International Business Machines Corporation 19

Zusammenfassung Analyseprozess Identifikation der einflussreichten Merkmale, die es ermöglichen die Reagierer zu profilieren. Ableitung von Regeln, die die Klassenzugehörigkeit eines noch nicht zugeordneten Adressaten bestimmen bzw. sein Verhalten vorhersagen. Kennzeichnung der vielversprechenden Potenziale im inaktiven Bestand (Scorewerte) 2013 International Business Machines Corporation 20

Zusammenfassung Ergebnisse Analyse vorherige Mailings Analyse ergibt, dass bislang Gebiete gab mit hohem Potenzial und trotzdem relativ geringen Aussandmengen auswiesen und umgekehrt. => Optimierung Aussandmengen nach Gebiet Maßnahme für neue Mailings Neues Mailing unter Verwendung optimierter Adressdaten und optimierter Angebotswahl (Titel) nach Gebiet => Zweifache Optimierung Business Benefit Signifikante Steigerung des Response bei gleicher Marktausschöpfung Einsparung Kosten durch verbesserte räumliche und produktspezifische Ansprache 2013 International Business Machines Corporation 21