Blog

Předpokládejme, že provozujete přímou marketingovou kampaň, kde se snažíte zacílit na členy své zákaznické základny nabídkou v naději, že budou reagovat a zakoupit nový produkt nebo se přihlásit k odběru další služby. Pomocí historických dat z předchozí kampaně nám prediktivní model umožňuje předpovědět pravděpodobnost reakce každého zákazníka na základě jeho charakteristik a chování. (Viz například náš předchozí blogový příspěvek o tom, jak může být logistický regresní model užitečným nástrojem pro předpovídání pravděpodobnosti binárního výsledku.)

jaké výnosy dostanu z vedení marketingové kampaně?

v této souvislosti chceme pochopit, jaký přínos může prediktivní model nabídnout při předpovídání, kteří zákazníci budou respondenty oproti neodpovídajícím v nové kampani(ve srovnání s jejich náhodným cílením). Toho lze dosáhnout zkoumáním kumulativních zisků a zvedání spojených s modelem, porovnáním jeho výkonu při cílení respondentů s tím, jak úspěšní bychom byli bez přidané hodnoty, kterou model nabízí. Můžeme také použít stejné informace, které pomohou rozhodnout, kolik kusů direct mail poslat, vyvážení marketingové náklady s očekávaným výnosem z výsledného prodeje. S každým zákazníkem, kterého posíláte, jsou spojeny náklady, a proto chcete maximalizovat počet respondentů, které získáte, pro počet Odeslaných zásilek.

v tomto blogu popisujeme kroky potřebné k výpočtu kumulativních zisků a zvedání spojených s prediktivním klasifikačním modelem.

Decilní skupiny

pokračujeme v příkladu přímého marketingu, pomocí vybaveného modelu můžeme porovnat pozorované výsledky z historické marketingové kampaně, tj. kdo odpověděl a kdo ne, s předpokládanou pravděpodobností odpovědi pro každého zákazníka kontaktovaného v této kampani. (Všimněte si, že v praxi bychom model zařadili do podmnožiny našich dat a pomocí tohoto modelu předpovídáme pravděpodobnost reakce pro každého zákazníka ve vzorku “hold-out”, abychom získali přesnější posouzení toho, jak by model fungoval pro nové zákazníky.)

nejprve třídíme zákazníky podle jejich předpokládaných pravděpodobností v sestupném pořadí od nejvyšší (nejblíže k jedné) k nejnižší (nejblíže k nule). Rozdělením zákazníků do stejně velkých segmentů vytváříme skupiny obsahující stejný počet zákazníků, například 10 decilových skupin, z nichž každá obsahuje 10% zákaznické základny. Tak, ti zákazníci, kteří předpovídáme, s největší pravděpodobností odpoví, jsou v decilní skupině 1, další s největší pravděpodobností v decilní skupině 2, a tak dále. Při zkoumání každé ze skupin decilu můžeme vytvořit shrnutí decilu, jak je uvedeno v tabulce 1, shrnující počty a proporce zákazníků a respondentů v každém decilu.

historické údaje mohou ukázat, že celkově, a tedy při náhodném zasílání zákaznické základny, odpovídá přibližně 5% zákazníků (506 z 10 000 zákazníků). Pokud tedy pošlete 1 000 zákazníků, očekáváte, že uvidíte kolem 50 respondentů. Pokud se však podíváme na míru odpovědí dosaženou v každé z decilních skupin v tabulce 1, vidíme, že nejvyšší skupiny mají vyšší míru odezvy než tato, jsou to naše nejlepší vyhlídky.

Decilní skupina rozsah predikované pravděpodobnosti počet vlastních ers kumulativní číslo. zákazníků kumulativní % zákazníků respondenti míra odpovědí kumulativní číslo. % respondentů kumulativní % respondentů
1 0.129-1.000 1,000 1,000 10.0% 143 14.3% 143 28.3% 2.83
2 0.105-0.129 1,000 2,000 20.0% 118 11.8% 261 51.6% 2.58
3 0.073-0.105 1,000 3,000 30.0% 96 9.6% 357 70.6% 2.35
4 0.040-0.073 1,000 4,000 40.0% 51 5.1% 408 80.6% 2.02
5 0.025-0.040 1,000 5,000 50.0% 32 3.2% 440 87.0% 1.74
6 0.018-0.025 1,000 6,000 60.0% 19 1.9% 459 90.7% 1.51
7 0.015-0.018 1,000 7,000 70.0% 17 1.7% 476 94.1% 1.34
8 0.012-0.015 1,000 8,000 80.0% 14 1.4% 490 96.8% 1.21
9 0.006-0.012 1,000 9,000 90.0% 11 1.1% 501 99.0% 1.10
10 0.000-0.006 1,000 10,000 100.0% 5 0.5% 506 100.0% 1.00

Tabulka 1: Shrnutí Decilu

například jsme zjistili, že ve skupině decilu 1 byla míra odpovědi 14,3% (z 1 000 zákazníků bylo 143 respondentů), ve srovnání s celkovou mírou odpovědi 5,1%. Můžeme také vizualizovat výsledky ze shrnutí decilu v grafu vodopádu, jak je znázorněno na obrázku 1. To ukazuje, že všichni zákazníci v decilních skupinách 1, 2 a 3 mají vyšší míru odezvy pomocí prediktivního modelu.

Obrázek 1: Vodopád graf vizualizaci míry odezvy spojené s každou skupinou decile, ve srovnání s celkovou mírou odezvy v celé zákaznické základny.

kumulativní zisky

ze shrnutí decilu můžeme také vypočítat kumulativní zisky poskytované modelem. Porovnáváme kumulativní procento zákazníků, kteří odpovídají, s kumulativním procentem zákazníků kontaktovaných v marketingové kampani napříč skupinami. To popisuje “zisk” v cílení na dané procento z celkového počtu zákazníků s použitím nejvyšší modelované pravděpodobnosti odpovědi, spíše než na ně náhodně.

například prvních 10% zákazníků s nejvyšší předpokládanou pravděpodobností (decil 1) obsahuje přibližně 28,3% respondentů (143/506). Takže místo zachycení 10% respondentů jsme našli 28.3% respondentů zaslalo pouze 10% zákaznické základny. Včetně dalších 10% zákazníků (deciles 1 a 2) zjistíme, že prvních 20% zákazníků obsahuje přibližně 51,6% respondentů. Tyto údaje mohou být zobrazeny v kumulativní zisky grafu, jak je znázorněno na obrázku 2.

Obrázek 2: Graf kumulativních zisků porovnávající kumulativní procento dosažených respondentů versus kumulativní procento kontaktovaných zákazníků.

přerušovaná čára na obrázku 2 odpovídá “no gain”, tj., čeho bychom očekávali, že dosáhneme náhodným kontaktováním zákazníků. Čím blíže je linie kumulativních zisků k levému hornímu rohu grafu, tím větší je zisk; čím vyšší je podíl respondentů, které jsou dosaženy pro nižší podíl kontaktovaných zákazníků.

v závislosti na nákladech spojených s odesláním každého kusu přímé pošty a očekávaných příjmech od každého respondenta lze kumulativní graf zisků použít k rozhodnutí o optimálním počtu zákazníků, kteří mají kontaktovat. Pravděpodobně dojde k bodu zvratu, kdy jsme dosáhli dostatečně vysokého podílu respondentů, a kde náklady na kontaktování větší části zákazníků jsou vzhledem k klesajícím výnosům příliš velké. To bude obecně odpovídat zploštění křivky kumulativních zisků, kde se neočekává, že další kontakty (odpovídající dalším decilům) poskytnou mnoho dalších respondentů. V praxi by spíše než seskupování zákazníků do decil bylo možné zkoumat větší počet skupin, což by umožnilo větší flexibilitu v podílu zákazníků, o kterých bychom mohli uvažovat.

výtah

můžeme se také podívat na výtah dosažený zacílením na rostoucí procenta zákaznické základny, seřazené podle klesající pravděpodobnosti. Výtah je jednoduše poměr procenta respondentů dosaženého k procentu kontaktovaných zákazníků.

takže zdvih 1 je ekvivalentní žádnému zisku ve srovnání s náhodným kontaktováním zákazníků. Zatímco výtah 2, například, odpovídá tomu, že je dosažen dvojnásobný počet respondentů ve srovnání s číslem, které byste očekávali náhodným kontaktováním stejného počtu zákazníků. Takže jsme možná kontaktovali pouze 40% zákazníků, ale možná jsme dosáhli 80% respondentů v zákaznické základně. Proto jsme zdvojnásobili počet respondentů dosažených zacílením na tuto skupinu ve srovnání s zasláním náhodného vzorku zákazníků.

tyto hodnoty mohou být zobrazeny v křivce zdvihu, jak je znázorněno na obrázku 3. V ideálním případě chceme, aby se křivka výtahu rozšířila co nejvíce do levého horního rohu obrázku, což naznačuje, že máme velký výtah spojený s kontaktováním malé části zákazníků.

obrázek 3: křivka zdvihu ukazující “výtah” spojený s posíláním pošty zvyšující se procenta z celkové zákaznické základny, pokud jde o poměr procenta respondentů dosaženého ve vztahu k procentu kontaktovaných zákazníků.

v předchozím blogu jsme diskutovali o tom, jak lze Roc křivky použít při hodnocení toho, jak dobrý je model při klasifikaci (tj., předpovídání výsledku). Stejně jako pochopení prediktivní přesnosti modelu použitého pro klasifikaci, může být také užitečné pochopit, jaký přínos nabízí model ve srovnání se snahou identifikovat výsledek bez něj.

kumulativní zisky a křivky zdvihu jsou jednoduchým a užitečným přístupem k pochopení toho, jaké výnosy pravděpodobně získáte při spuštění marketingové kampaně a kolik zákazníků byste měli kontaktovat, na základě cílení na nejslibnější zákazníky pomocí prediktivního modelu. Tyto přístupy by mohly být podobně aplikovány v souvislosti s předpovědí, kteří jednotlivci budou splácet osobní půjčku, aby mohli rozhodnout, komu by mohla být nabídnuta kreditní karta, například. V tomto případě je cílem minimalizovat počet lidí, kteří pravděpodobně nesplácí úvěr, a zároveň maximalizovat počet nabízených kreditních karet těm, kteří nesplácí. Prediktivním modelem v každém případě může být jakýkoli vhodný statistický přístup pro generování pravděpodobnosti binárního výsledku, ať už je to například logistický regresní model, náhodný les nebo neuronová síť.

Napsat komentář

Vaše e-mailová adresa nebude zveřejněna.