Blog

să presupunem că desfășurați o campanie de marketing direct, în care încercați să vizați membrii bazei dvs. de clienți cu o ofertă în speranța că vor răspunde și vor achiziționa un produs nou sau se vor abona la un serviciu suplimentar. Folosind Date istorice dintr-o campanie anterioară, un model predictiv ne permite să prezicem probabilitatea ca fiecare client să răspundă pe baza caracteristicilor și comportamentelor sale. (A se vedea, de exemplu, postarea noastră anterioară pe blog despre modul în care un model de regresie logistică poate fi un instrument util pentru prezicerea probabilității unui rezultat binar.)

ce returnări voi obține de la rularea campaniei mele de marketing?

în acest context, dorim să înțelegem ce beneficii poate oferi modelul predictiv în prezicerea clienților care vor răspunde față de cei care nu răspund într-o nouă campanie (comparativ cu direcționarea lor la întâmplare). Acest lucru poate fi realizat prin examinarea câștigurilor cumulative și a ascensiunii asociate modelului, comparând performanța acestuia în direcționarea respondenților cu cât de succes am fi fără valoarea adăugată oferită de model. De asemenea, putem folosi aceleași informații pentru a vă ajuta să decideți câte bucăți de poștă directă să trimiteți, echilibrând costurile de marketing cu randamentele așteptate din vânzările rezultate. Există un cost asociat cu fiecare client pe care îl trimiteți prin poștă și, prin urmare, doriți să maximizați numărul de respondenți pe care îi achiziționați pentru numărul de e-mailuri pe care le trimiteți.

în acest blog, descriem pașii necesari pentru a calcula câștigurile cumulative și ridicarea asociate cu un model de clasificare predictivă.

grupuri Decile

continuând cu exemplul de marketing direct, folosind modelul adaptat, putem compara rezultatele observate din campania de marketing istorică, adică cine a răspuns și cine nu, cu probabilitățile prezise de a răspunde pentru fiecare client contactat în campania respectivă. (Rețineți că, în practică, am încadra modelul într-un subset al datelor noastre și am folosi acest model pentru a prezice probabilitatea de a răspunde pentru fiecare client într-un eșantion de “reținere” pentru a obține o evaluare mai exactă a modului în care modelul ar funcționa pentru clienții noi.)

mai întâi sortăm clienții după probabilitățile prezise, în ordine descrescătoare de la cea mai mare (cea mai apropiată de una) la cea mai mică (cea mai apropiată de zero). Împărțind clienții în segmente de dimensiuni egale, creăm grupuri care conțin același număr de clienți, de exemplu, 10 grupuri decile fiecare conținând 10% din Baza de clienți. Deci, acei clienți pe care îi prezicem că vor răspunde cel mai probabil sunt în decile group 1, următorul cel mai probabil în decile group 2 și așa mai departe. Examinând fiecare dintre grupurile decile, putem produce un rezumat decile, așa cum se arată în tabelul 1, rezumând numărul și proporțiile clienților și respondenților din fiecare decile.

datele istorice pot arăta că, în general, și, prin urmare, atunci când trimiteți prin poștă baza de clienți la întâmplare, aproximativ 5% dintre clienți răspund (506 din 10.000 de clienți). Deci, dacă e-mail 1.000 de clienți vă așteptați să vedeți în jur de 50 de răspuns. Dar, dacă ne uităm la ratele de răspuns obținute în fiecare dintre grupurile decile din tabelul 1, vedem că grupurile de top au o rată de răspuns mai mare decât aceasta, ele sunt cele mai bune perspective ale noastre.

grup Decile interval de probabilitate prezis număr de Custom-ers cumulativ nr. de clienți % cumulativ de clienți răspuns-ers rata de răspuns cumulativ nr. de respondenți % cumulat de respondenți ridică
1 0.129-1.000 1,000 1,000 10.0% 143 14.3% 143 28.3% 2.83
2 0.105-0.129 1,000 2,000 20.0% 118 11.8% 261 51.6% 2.58
3 0.073-0.105 1,000 3,000 30.0% 96 9.6% 357 70.6% 2.35
4 0.040-0.073 1,000 4,000 40.0% 51 5.1% 408 80.6% 2.02
5 0.025-0.040 1,000 5,000 50.0% 32 3.2% 440 87.0% 1.74
6 0.018-0.025 1,000 6,000 60.0% 19 1.9% 459 90.7% 1.51
7 0.015-0.018 1,000 7,000 70.0% 17 1.7% 476 94.1% 1.34
8 0.012-0.015 1,000 8,000 80.0% 14 1.4% 490 96.8% 1.21
9 0.006-0.012 1,000 9,000 90.0% 11 1.1% 501 99.0% 1.10
10 0.000-0.006 1,000 10,000 100.0% 5 0.5% 506 100.0% 1.00

Tabelul 1: Rezumat Decile

de exemplu, constatăm că în grupul decile 1 Rata de răspuns a fost de 14,3% (au existat 143 de respondenți din cei 1000 de clienți), comparativ cu rata generală de răspuns de 5,1%. Putem vizualiza, de asemenea, rezultatele din rezumatul decile într-un complot cascadă, așa cum se arată în Figura 1. Acest lucru ilustrează faptul că toți clienții din grupurile decile 1, 2 și 3 au o rată de răspuns mai mare folosind modelul predictiv.

Figura 1: parcelă cascadă vizualizarea ratelor de răspuns asociate fiecărui grup decile, comparativ cu rata generală de răspuns pe întreaga bază de clienți.

câștiguri Cumulative

din rezumatul decile, putem calcula și câștigurile cumulative furnizate de model. Comparăm procentul cumulat de clienți care răspund cu procentul cumulat de clienți contactați în campania de marketing din cadrul grupurilor. Aceasta descrie ‘câștigul’ în direcționarea unui anumit procent din numărul total de clienți care utilizează cele mai mari probabilități modelate de răspuns, mai degrabă decât direcționarea lor la întâmplare.

de exemplu, primii 10% dintre clienții cu cele mai mari probabilități prezise (decile 1), conțin aproximativ 28,3% dintre respondenți (143/506). Deci, în loc să capturăm 10% din respondenți, am găsit 28.3% dintre respondenți au trimis prin poștă doar 10% din Baza de clienți. Incluzând încă 10% dintre clienți (decilele 1 și 2), constatăm că primii 20% dintre clienți conțin aproximativ 51,6% dintre respondenți. Aceste cifre pot fi afișate într-o diagramă câștiguri cumulative, așa cum se arată în Figura 2.

Figura 2: graficul câștigurilor Cumulative comparând procentul cumulat de respondenți atins față de procentul cumulat de clienți contactați.

linia punctată din Figura 2 corespunde cu “fără câștig”, adică., ceea ce ne-am aștepta să realizăm contactând clienții la întâmplare. Cu cât linia câștigurilor cumulate este mai aproape de colțul din stânga sus al graficului, cu atât câștigul este mai mare; cu atât este mai mare proporția respondenților care sunt atinși pentru proporția mai mică de clienți contactați.

în funcție de costurile asociate cu trimiterea fiecare bucată de direct mail și veniturile așteptate de la fiecare responder, graficul câștigurile cumulate pot fi folosite pentru a decide cu privire la numărul optim de clienți pentru a contacta. Probabil că va exista un punct critic la care am ajuns la o proporție suficient de mare de respondenți și în care costurile contactării unei proporții mai mari de clienți sunt prea mari, având în vedere randamentele în scădere. Acest lucru va corespunde, în general, cu o aplatizare a curbei câștigurilor cumulative, unde nu se așteaptă ca alte contacte (corespunzătoare cu decile suplimentare) să ofere mulți respondenți suplimentari. În practică, mai degrabă decât gruparea clienților în decile, ar putea fi examinat un număr mai mare de grupuri, permițând o mai mare flexibilitate în proporția clienților pe care am putea lua în considerare să îi contactăm.

Lift

ne putem uita, de asemenea, la ascensorul realizat prin direcționarea procentelor crescânde ale bazei de clienți, ordonate prin scăderea probabilității. Liftul este pur și simplu raportul dintre procentul de respondenți atins și procentul de clienți contactați.

deci, un lift de 1 este echivalent cu nici un câștig în comparație cu contactarea clienților la întâmplare. Întrucât un lift de 2, de exemplu, corespunde cu faptul că există de două ori numărul de respondenți atins în comparație cu numărul pe care l-ați aștepta contactând același număr de clienți la întâmplare. Deci, este posibil să fi contactat doar 40% dintre clienți, dar este posibil să fi ajuns la 80% dintre respondenții din Baza de clienți. Prin urmare, am dublat numărul de respondenți la care s-a ajuns vizând acest grup în comparație cu trimiterea prin poștă a unui eșantion aleatoriu de clienți.

aceste cifre pot fi afișate într-o curbă de ridicare, așa cum se arată în Figura 3. În mod ideal, dorim ca curba de ridicare să se extindă cât mai sus posibil în colțul din stânga sus al figurii, indicând faptul că avem un lift mare asociat cu contactarea unei mici proporții de clienți.

Figura 3: curba de ridicare care arată” ascensorul ” asociat cu trimiterea prin poștă creșterea procentelor din Baza totală de clienți, în ceea ce privește raportul dintre procentul de respondenți atins în raport cu procentul de clienți contactați.

într-o postare anterioară pe blog am discutat despre modul în care curbele ROC pot fi utilizate în evaluarea cât de bun este un model la clasificare (adică., prezicerea unui rezultat). Pe lângă înțelegerea preciziei predictive a unui model utilizat pentru clasificare, poate fi de asemenea util să înțelegem ce beneficiu este oferit de model în comparație cu încercarea de a identifica un rezultat fără el.

câștigurile Cumulative și curbele de ridicare sunt o abordare simplă și utilă pentru a înțelege ce randamente veți obține probabil din derularea unei campanii de marketing și câți clienți ar trebui să contactați, pe baza direcționării celor mai promițători clienți folosind un model predictiv. Aceste abordări ar putea fi aplicate în mod similar în contextul prezicerii persoanelor care vor intra în incapacitate de plată pentru un împrumut personal pentru a decide cine ar putea primi un card de credit, de exemplu. În acest caz, scopul este de a reduce la minimum numărul de persoane susceptibile de a intra în incapacitate de plată a împrumutului, maximizând în același timp numărul de carduri de credit oferite celor care nu vor intra în incapacitate de plată. Modelul predictiv în fiecare caz ar putea fi orice abordare statistică adecvată pentru generarea unei probabilități pentru un rezultat binar, fie că este un model de regresie logistică, o pădure aleatorie sau o rețea neuronală, de exemplu.

Lasă un răspuns

Adresa ta de email nu va fi publicată.