Blog

Supponiamo che tu stia eseguendo una campagna di marketing diretto, in cui stai cercando di indirizzare i membri della tua base di clienti con un’offerta nella speranza che rispondano e acquistino un nuovo prodotto o sottoscrivano un servizio aggiuntivo. Utilizzando i dati storici di una campagna precedente, un modello predittivo ci consente di prevedere la probabilità di risposta di ciascun cliente in base alle sue caratteristiche e comportamenti. (Vedi ad esempio il nostro precedente post sul blog su come un modello di regressione logistica può essere uno strumento utile per predire la probabilità di un risultato binario.)

Quali ritorni otterrò dall’esecuzione della mia campagna di marketing?

In questo contesto, vogliamo capire quali benefici può offrire il modello predittivo nel prevedere quali clienti saranno responder rispetto a non responder in una nuova campagna (rispetto al targeting casuale). Ciò può essere ottenuto esaminando i guadagni cumulativi e il sollevamento associati al modello, confrontando le sue prestazioni nel targeting dei rispondenti con il successo che avremmo senza il valore aggiunto offerto dal modello. Possiamo anche utilizzare le stesse informazioni per aiutare a decidere quanti pezzi di direct mail inviare, bilanciando i costi di marketing con i rendimenti attesi dalle vendite risultanti. C’è un costo associato a ciascun cliente che invii e quindi vuoi massimizzare il numero di rispondenti che acquisisci per il numero di invii che invii.

In questo blog, descriviamo i passaggi necessari per calcolare i guadagni cumulativi e il sollevamento associati a un modello di classificazione predittiva.

Decile Groups

Continuando con l’esempio di direct marketing, utilizzando il modello montato possiamo confrontare i risultati osservati dalla campagna di marketing storica, cioè, chi ha risposto e chi no, con le probabilità previste di rispondere per ogni cliente contattato in quella campagna. (Si noti che, in pratica, inseriremmo il modello in un sottoinsieme dei nostri dati e utilizzeremo questo modello per prevedere la probabilità di risposta per ciascun cliente in un campione di “hold-out” per ottenere una valutazione più accurata di come il modello avrebbe funzionato per i nuovi clienti.)

Per prima cosa ordiniamo i clienti in base alle loro probabilità previste, in ordine decrescente dal più alto (più vicino a uno) al più basso (più vicino a zero). Suddividendo i clienti in segmenti di dimensioni uguali, creiamo gruppi contenenti lo stesso numero di clienti, ad esempio 10 gruppi di decile contenenti ciascuno il 10% della base clienti. Quindi, i clienti che prevediamo sono più propensi a rispondere sono nel gruppo decile 1, il prossimo più probabile nel gruppo decile 2 e così via. Esaminando ciascuno dei gruppi decile, possiamo produrre un riepilogo decile, come mostrato nella Tabella 1, che riassume i numeri e le proporzioni dei clienti e dei rispondenti in ciascun decile.

I dati storici possono mostrare che nel complesso, e quindi quando si spedisce la base clienti a caso, circa il 5% dei clienti risponde (506 su 10.000 clienti). Quindi, se invii 1.000 clienti, ti aspetti di vedere circa 50 risponditori. Ma, se guardiamo ai tassi di risposta raggiunti in ciascuno dei gruppi decili nella Tabella 1, vediamo che i gruppi superiori hanno un tasso di risposta più alto di questo, sono le nostre migliori prospettive.

Gruppo decile Intervallo di probabilità previsto Numero di Custom-ers Numero cumulativo. di Clienti % cumulativo di Clienti Rispondere-ers Tasso di risposta Numero cumulativo. di Rispondere – % cumulativo di Rispondere-ers Sollevare
1 0.129-1.000 1,000 1,000 10.0% 143 14.3% 143 28.3% 2.83
2 0.105-0.129 1,000 2,000 20.0% 118 11.8% 261 51.6% 2.58
3 0.073-0.105 1,000 3,000 30.0% 96 9.6% 357 70.6% 2.35
4 0.040-0.073 1,000 4,000 40.0% 51 5.1% 408 80.6% 2.02
5 0.025-0.040 1,000 5,000 50.0% 32 3.2% 440 87.0% 1.74
6 0.018-0.025 1,000 6,000 60.0% 19 1.9% 459 90.7% 1.51
7 0.015-0.018 1,000 7,000 70.0% 17 1.7% 476 94.1% 1.34
8 0.012-0.015 1,000 8,000 80.0% 14 1.4% 490 96.8% 1.21
9 0.006-0.012 1,000 9,000 90.0% 11 1.1% 501 99.0% 1.10
10 0.000-0.006 1,000 10,000 100.0% 5 0.5% 506 100.0% 1.00

Tabella 1: Decile di riepilogo

Per esempio, troviamo che nel decile gruppo 1 il tasso di risposta è stato del 14,3% (ci sono 143 responder dei 1.000 clienti), confrontato con il tasso di risposta complessivo del 5,1%. Possiamo anche visualizzare i risultati del riepilogo decile in un grafico a cascata, come mostrato in Figura 1. Ciò dimostra che tutti i clienti dei gruppi decile 1, 2 e 3 hanno un tasso di risposta più elevato utilizzando il modello predittivo.

Figura 1: Grafico a cascata che visualizza i tassi di risposta associati a ciascun gruppo decile, rispetto al tasso di risposta complessivo nell’intera base clienti.

Guadagni cumulativi

Dal riepilogo decile, possiamo anche calcolare i guadagni cumulativi forniti dal modello. Confrontiamo la percentuale cumulativa di clienti che rispondono con la percentuale cumulativa di clienti contattati nella campagna di marketing tra i gruppi. Questo descrive il “guadagno” nel targeting di una data percentuale del numero totale di clienti che utilizzano le più alte probabilità di risposta modellate, piuttosto che prenderle di mira a caso.

Ad esempio, il 10% dei clienti con le probabilità previste più alte (decile 1), contiene circa il 28,3% dei rispondenti (143/506). Quindi, invece di catturare il 10% dei responder, ne abbiamo trovati 28.3% dei rispondenti che hanno inviato solo il 10% della base clienti. Includendo un ulteriore 10% di clienti (decili 1 e 2), troviamo che il 20% superiore dei clienti contiene circa il 51,6% dei rispondenti. Queste cifre possono essere visualizzate in un grafico guadagni cumulativi, come mostrato in Figura 2.

Figura 2: Grafico dei guadagni cumulativi che confronta la percentuale cumulativa di responder raggiunti rispetto alla percentuale cumulativa di clienti contattati.

La linea tratteggiata in Figura 2 corrisponde con “nessun guadagno”, cioè, quello che ci aspetteremmo di raggiungere contattando clienti a caso. Più la linea dei guadagni cumulativi è vicina all’angolo in alto a sinistra del grafico, maggiore è il guadagno; maggiore è la percentuale dei rispondenti raggiunti per la percentuale inferiore di clienti contattati.

A seconda dei costi associati con l’invio di ogni pezzo di direct mail e le entrate previste da ogni risponditore, il grafico guadagni cumulativi può essere utilizzato per decidere il numero ottimale di clienti da contattare. Ci sarà probabilmente un punto di svolta in cui abbiamo raggiunto una percentuale sufficientemente elevata di soccorritori, e dove i costi di contattare una percentuale maggiore di clienti sono troppo grandi dati i rendimenti decrescenti. Ciò corrisponderà generalmente ad un appiattimento della curva dei guadagni cumulativi, in cui ulteriori contatti (corrispondenti a decili aggiuntivi) non dovrebbero fornire molti responder aggiuntivi. In pratica, invece di raggruppare i clienti in decili, potrebbe essere esaminato un numero maggiore di gruppi, consentendo una maggiore flessibilità nella proporzione di clienti che potremmo considerare di contattare.

Ascensore

Possiamo anche guardare l’ascensore raggiunto mirando a percentuali crescenti della base clienti, ordinate per probabilità decrescente. L’ascensore è semplicemente il rapporto tra la percentuale di responder raggiunto alla percentuale di clienti contattati.

Quindi, un aumento di 1 equivale a nessun guadagno rispetto al contatto casuale dei clienti. Mentre un aumento di 2, ad esempio, corrisponde al doppio del numero di responder raggiunti rispetto al numero che ci si aspetterebbe contattando lo stesso numero di clienti a caso. Quindi, potremmo aver contattato solo il 40% dei clienti, ma potremmo aver raggiunto l ‘ 80% dei rispondenti nella base clienti. Pertanto, abbiamo raddoppiato il numero di responder raggiunti prendendo di mira questo gruppo rispetto all’invio di un campione casuale di clienti.

Queste cifre possono essere visualizzate in una curva di sollevamento, come mostrato nella Figura 3. Idealmente, vogliamo che la curva di sollevamento si estenda il più in alto possibile nell’angolo in alto a sinistra della figura, indicando che abbiamo un grande sollevamento associato al contatto con una piccola percentuale di clienti.

Figura 3: Curva di sollevamento che mostra il “sollevamento” associato al mailing percentuali crescenti della base clienti totale, in termini di rapporto tra la percentuale di rispondenti raggiunti rispetto alla percentuale di clienti contattati.

In un precedente post sul blog abbiamo discusso di come le curve ROC possono essere utilizzate per valutare quanto un modello sia bravo a classificare (cioè, prevedendo un risultato). Oltre a comprendere l’accuratezza predittiva di un modello utilizzato per la classificazione, può anche essere utile capire quali benefici offre il modello rispetto al tentativo di identificare un risultato senza di esso.

I guadagni cumulativi e le curve di sollevamento sono un approccio semplice e utile per capire quali ritorni potresti ottenere dall’esecuzione di una campagna di marketing e quanti clienti dovresti contattare, in base al targeting dei clienti più promettenti utilizzando un modello predittivo. Questi approcci potrebbero essere applicati allo stesso modo nel contesto di prevedere quali individui saranno di default su un prestito personale al fine di decidere chi potrebbe essere offerto una carta di credito, per esempio. In questo caso, l’obiettivo è quello di ridurre al minimo il numero di persone che rischiano di default sul prestito, massimizzando il numero di carte di credito offerte a coloro che non default. Il modello predittivo in ogni caso potrebbe essere qualsiasi approccio statistico appropriato per generare una probabilità per un risultato binario, sia che un modello di regressione logistica, una foresta casuale o una rete neurale, per esempio.

Lascia un commento

Il tuo indirizzo email non sarà pubblicato.