Blog

Suponha que você está executando uma campanha de marketing direto, onde você está tentando alvo membros de sua base de clientes, com uma oferta na esperança de que eles irão responder e comprar um novo produto ou subscrever um serviço adicional. Usando dados históricos de uma campanha anterior, um modelo preditivo nos permite prever a probabilidade de cada cliente responder com base em suas características e comportamentos. (Veja, por exemplo, nosso post anterior sobre como um modelo de regressão logística pode ser uma ferramenta útil para prever a probabilidade de um resultado binário.)

quais retornos obterei com a execução da minha campanha de marketing?

neste contexto, queremos entender que benefício o modelo preditivo pode oferecer na previsão de quais clientes serão respondentes versus não respondentes em uma nova campanha (em comparação com direcioná-los aleatoriamente). Isso pode ser alcançado examinando os ganhos cumulativos e o aumento associado ao modelo, comparando seu desempenho em respondentes de segmentação com o sucesso que teríamos sem o valor agregado oferecido pelo modelo. Também podemos usar as mesmas informações para ajudar a decidir quantas peças de mala direta enviar, equilibrando os custos de marketing com os retornos esperados das vendas resultantes. Há um custo associado a cada cliente que você envia e, portanto, deseja maximizar o número de respondentes que você adquire para o número de correspondências enviadas.

neste blog, descrevemos as etapas necessárias para calcular os ganhos cumulativos e o aumento associado a um modelo de classificação preditiva.

grupos Decile

continuando com o exemplo de marketing direto, usando o modelo ajustado, podemos comparar os resultados observados da campanha de marketing histórica, ou seja, quem respondeu e quem não respondeu, com as probabilidades previstas de responder para cada cliente contatado nessa campanha. (Note-se que, na prática, teríamos de ajustar o modelo para um subconjunto de dados e utilizar este modelo para prever a probabilidade de responder para cada cliente em um “hold-out” amostra para obter uma avaliação mais precisa de como o modelo poderia realizar para novos clientes.)

primeiro classificamos os clientes por suas probabilidades previstas, em ordem decrescente do mais alto (mais próximo de um) para o mais baixo (mais próximo de zero). Dividindo os clientes em segmentos de tamanho igual, criamos grupos contendo o mesmo número de clientes, por exemplo, 10 grupos decile cada um contendo 10% da base de clientes. Portanto, os clientes que prevemos têm maior probabilidade de responder estão no decile group 1, o próximo mais provável no decile group 2 e assim por diante. Examinando cada um dos grupos decile, podemos produzir um resumo decile, como mostrado na Tabela 1, resumindo os números e proporções de clientes e respondentes em cada decile.

os dados históricos podem mostrar que, no geral e, portanto, ao enviar a base de clientes aleatoriamente, aproximadamente 5% dos clientes respondem (506 de 10.000 clientes). Portanto, se você enviar 1.000 clientes, espera ver cerca de 50 respondentes. Mas, se olharmos para as taxas de resposta alcançadas em cada um dos grupos decile na Tabela 1, vemos que os principais grupos têm uma taxa de resposta mais alta do que isso, eles são nossas melhores perspectivas.

Grupo Decile intervalo de probabilidade previsto número de Custom-ers número cumulativo. de Clientes Cumulativa % dos Clientes Responder-ers Taxa de Resposta Cumulativa Não. de Responder-ers Cumulativa % de Responder-ers Elevador
1 0.129-1.000 1,000 1,000 10.0% 143 14.3% 143 28.3% 2.83
2 0.105-0.129 1,000 2,000 20.0% 118 11.8% 261 51.6% 2.58
3 0.073-0.105 1,000 3,000 30.0% 96 9.6% 357 70.6% 2.35
4 0.040-0.073 1,000 4,000 40.0% 51 5.1% 408 80.6% 2.02
5 0.025-0.040 1,000 5,000 50.0% 32 3.2% 440 87.0% 1.74
6 0.018-0.025 1,000 6,000 60.0% 19 1.9% 459 90.7% 1.51
7 0.015-0.018 1,000 7,000 70.0% 17 1.7% 476 94.1% 1.34
8 0.012-0.015 1,000 8,000 80.0% 14 1.4% 490 96.8% 1.21
9 0.006-0.012 1,000 9,000 90.0% 11 1.1% 501 99.0% 1.10
10 0.000-0.006 1,000 10,000 100.0% 5 0.5% 506 100.0% 1.00

Tabela 1: Decil resumo

Por exemplo, encontramos que no decil do grupo 1, a taxa de resposta foi de 14,3% (houve 143 respondentes de 1.000 clientes), em comparação com a taxa geral de resposta de 5,1%. Também podemos visualizar os resultados do resumo decil em um gráfico em cascata, conforme mostrado na Figura 1. Isso ilustra que todos os clientes nos grupos decile 1, 2 e 3 têm uma taxa de resposta mais alta usando o modelo preditivo.

Figura 1: Gráfico em cascata visualizando as taxas de resposta associadas a cada grupo decile, em comparação com a taxa de resposta geral em toda a base de clientes.

ganhos cumulativos

a partir do resumo decile, também podemos calcular os ganhos cumulativos fornecidos pelo modelo. Comparamos a porcentagem acumulada de clientes que respondem com a porcentagem acumulada de clientes contatados na campanha de marketing entre os grupos. Isso descreve o “ganho” em direcionar uma determinada porcentagem do número total de clientes usando as probabilidades modeladas mais altas de responder, em vez de direcioná-los aleatoriamente.

por exemplo, os 10% principais dos clientes com as maiores probabilidades previstas (decile 1), contêm aproximadamente 28,3% dos respondentes (143/506). Então, em vez de capturar 10% dos respondentes, encontramos 28.3% dos respondentes enviaram apenas 10% da base de clientes. Incluindo mais 10% dos clientes (deciles 1 e 2), descobrimos que os 20% principais dos clientes contêm aproximadamente 51,6% dos respondentes. Esses números podem ser exibidos em um gráfico de ganhos cumulativos, conforme mostrado na Figura 2.

Figura 2: Gráfico de ganhos cumulativos comparando a porcentagem cumulativa de respondentes alcançados versus a porcentagem cumulativa de clientes contatados.

a linha tracejada na Figura 2 corresponde a “nenhum ganho”, ou seja,, o que esperaríamos alcançar entrando em contato com os clientes aleatoriamente. Quanto mais próxima a linha de ganhos cumulativos estiver do canto superior esquerdo do gráfico, maior será o ganho; quanto maior a proporção dos respondentes que são alcançados para a menor proporção de clientes contatados.

dependendo dos custos associados ao envio de cada mala direta e da receita esperada de cada respondente, o gráfico de ganhos cumulativos pode ser usado para decidir sobre o número ideal de clientes para entrar em contato. Provavelmente haverá um ponto de inflexão no qual atingimos uma proporção suficientemente alta de respondentes, e onde os custos de entrar em contato com uma proporção maior de clientes são muito grandes, dados Os retornos decrescentes. Isso geralmente corresponderá a um achatamento da curva de ganhos cumulativos, onde não se espera que outros contatos (correspondentes a decis adicionais) forneçam muitos respondentes adicionais. Na prática, em vez de agrupar clientes em decis, um número maior de grupos poderia ser examinado, permitindo maior flexibilidade na proporção de clientes que podemos considerar entrar em contato.

Elevador

também podemos olhar para o elevador alcançado visando porcentagens crescentes da base de clientes, ordenadas pela diminuição da probabilidade. O elevador é simplesmente a proporção da porcentagem de respondentes atingida para a porcentagem de clientes contatados.

portanto, um aumento de 1 é equivalente a nenhum ganho em comparação com o contato com os clientes aleatoriamente. Considerando que um aumento de 2, por exemplo, corresponde a haver o dobro do número de respondentes alcançados em comparação com o número que você esperaria entrando em contato com o mesmo número de clientes aleatoriamente. Portanto, podemos ter contatado apenas 40% dos clientes, mas podemos ter atingido 80% dos respondentes na base de clientes. Portanto, dobramos o número de respondentes alcançados direcionando esse grupo em comparação com o envio de uma amostra aleatória de clientes.

esses números podem ser exibidos em uma curva de elevação, conforme mostrado na Figura 3. Idealmente, queremos que a curva de elevação se estenda o mais alto possível no canto superior esquerdo da figura, indicando que temos um grande elevador associado ao contato com uma pequena proporção de clientes.

Figura 3: curva de Elevação mostrando o “lift” associado ao aumento das porcentagens de correspondência da base total de clientes, em termos da proporção da porcentagem de entrevistados atingida em relação à porcentagem de clientes contatados.

em um post anterior, discutimos como as curvas ROC podem ser usadas na avaliação de quão bom é um modelo na classificação (ou seja,, prevendo um resultado). Além de entender a precisão preditiva de um modelo usado para classificação, também pode ser útil entender qual benefício é oferecido pelo modelo em comparação com a tentativa de identificar um resultado sem ele.Ganhos cumulativos e curvas de elevação são uma abordagem simples e útil para entender quais retornos você provavelmente obterá ao executar uma campanha de marketing e quantos clientes você deve entrar em contato, com base na segmentação dos clientes mais promissores usando um modelo preditivo. Essas abordagens também podem ser aplicadas no contexto de prever quais indivíduos serão inadimplentes em um empréstimo pessoal, a fim de decidir quem poderia receber um cartão de crédito, por exemplo. Nesse caso, o objetivo é minimizar o número de pessoas com probabilidade de inadimplência do empréstimo, maximizando o número de cartões de crédito oferecidos àqueles que não o inadimplerão. O modelo preditivo em cada caso pode ser qualquer abordagem estatística apropriada para gerar uma probabilidade para um resultado binário, seja um modelo de regressão logística, uma floresta aleatória ou uma rede neural, por exemplo.

Deixe uma resposta

O seu endereço de email não será publicado.