Blog

Supposons que vous menez une campagne de marketing direct, où vous essayez de cibler les membres de votre clientèle avec une offre dans l’espoir qu’ils répondront et achèteront un nouveau produit ou souscriront à un service supplémentaire. En utilisant les données historiques d’une campagne précédente, un modèle prédictif nous permet de prédire la probabilité que chaque client réagisse en fonction de ses caractéristiques et de ses comportements. (Voir par exemple notre article de blog précédent sur la façon dont un modèle de régression logistique peut être un outil utile pour prédire la probabilité d’un résultat binaire.)

Quels retours vais-je obtenir de l’exécution de ma campagne de marketing?

Dans ce contexte, nous voulons comprendre quel avantage le modèle prédictif peut offrir en prédisant quels clients seront répondeurs par rapport aux non-répondeurs dans une nouvelle campagne (par rapport à les cibler au hasard). Cela peut être réalisé en examinant les gains cumulatifs et la portance associés au modèle, en comparant ses performances en ciblant les intervenants avec le succès que nous aurions sans la valeur ajoutée offerte par le modèle. Nous pouvons également utiliser les mêmes informations pour décider du nombre de publipostages à envoyer, en équilibrant les coûts de marketing avec les retours attendus des ventes résultantes. Il y a un coût associé à chaque client que vous envoyez et vous souhaitez donc maximiser le nombre de répondants que vous acquérez pour le nombre d’envois que vous envoyez.

Dans ce blog, nous décrivons les étapes nécessaires pour calculer les gains cumulés et la portance associés à un modèle de classification prédictive.

Groupes de déciles

En poursuivant l’exemple de marketing direct, en utilisant le modèle ajusté, nous pouvons comparer les résultats observés de la campagne de marketing historique, c’est-à-dire qui a répondu et qui n’a pas répondu, avec les probabilités prédites de répondre pour chaque client contacté dans cette campagne. (Notez que, dans la pratique, nous ajusterions le modèle à un sous-ensemble de nos données et utiliserions ce modèle pour prédire la probabilité de réponse pour chaque client dans un échantillon de “attente” afin d’obtenir une évaluation plus précise de la performance du modèle pour les nouveaux clients.)

Nous trions d’abord les clients par leurs probabilités prédites, dans l’ordre décroissant du plus élevé (le plus proche de un) au plus bas (le plus proche de zéro). En divisant les clients en segments de taille égale, nous créons des groupes contenant le même nombre de clients, par exemple, des groupes de 10 déciles contenant chacun 10% de la base de clients. Ainsi, les clients que nous prévoyons les plus susceptibles de répondre se trouvent dans le groupe de déciles 1, le suivant le plus probable dans le groupe de déciles 2, etc. En examinant chacun des groupes de déciles, nous pouvons produire un résumé des déciles, comme le montre le tableau 1, résumant le nombre et la proportion de clients et d’intervenants dans chaque décile.

Les données historiques peuvent montrer que dans l’ensemble, et donc lors de l’envoi aléatoire de la clientèle, environ 5% des clients répondent (506 sur 10 000 clients). Donc, si vous envoyez un courrier à 1 000 clients, vous vous attendez à voir environ 50 intervenants. Mais, si nous regardons les taux de réponse obtenus dans chacun des groupes de déciles du tableau 1, nous voyons que les groupes supérieurs ont un taux de réponse plus élevé que celui-ci, ce sont nos meilleures perspectives.

Groupe de déciles Plage de probabilité prédite Nombre de Custom personnalisés Non cumulatif. des clients % cumulatif des clients Répondre – Rate Taux de réponse Nombre cumulatif. de Répondre -ers % cumulatif de Répondre -Lift Ascenseur
1 0.129-1.000 1,000 1,000 10.0% 143 14.3% 143 28.3% 2.83
2 0.105-0.129 1,000 2,000 20.0% 118 11.8% 261 51.6% 2.58
3 0.073-0.105 1,000 3,000 30.0% 96 9.6% 357 70.6% 2.35
4 0.040-0.073 1,000 4,000 40.0% 51 5.1% 408 80.6% 2.02
5 0.025-0.040 1,000 5,000 50.0% 32 3.2% 440 87.0% 1.74
6 0.018-0.025 1,000 6,000 60.0% 19 1.9% 459 90.7% 1.51
7 0.015-0.018 1,000 7,000 70.0% 17 1.7% 476 94.1% 1.34
8 0.012-0.015 1,000 8,000 80.0% 14 1.4% 490 96.8% 1.21
9 0.006-0.012 1,000 9,000 90.0% 11 1.1% 501 99.0% 1.10
10 0.000-0.006 1,000 10,000 100.0% 5 0.5% 506 100.0% 1.00

Tableau 1 : Sommaire du décile

Par exemple, nous constatons que dans le groupe des déciles 1, le taux de réponse était de 14,3 % (il y avait 143 répondants sur les 1 000 clients), comparativement au taux de réponse global de 5,1 %. Nous pouvons également visualiser les résultats du résumé du décile dans un graphique en cascade, comme le montre la figure 1. Cela montre que tous les clients des groupes de déciles 1, 2 et 3 ont un taux de réponse plus élevé en utilisant le modèle prédictif.

Figure 1: Graphique en cascade visualisant les taux de réponse associés à chaque groupe de déciles, par rapport au taux de réponse global sur l’ensemble de la base de clients.

Gains cumulatifs

À partir du résumé du décile, nous pouvons également calculer les gains cumulatifs fournis par le modèle. Nous comparons le pourcentage cumulé de clients qui répondent avec le pourcentage cumulé de clients contactés dans la campagne marketing à travers les groupes. Cela décrit le “gain” en ciblant un pourcentage donné du nombre total de clients en utilisant les probabilités modélisées les plus élevées de réponse, plutôt que de les cibler au hasard.

Par exemple, les 10 % de clients ayant les probabilités prédites les plus élevées (décile 1) contiennent environ 28,3 % des répondants (143/506). Donc, plutôt que de capturer 10% des intervenants, nous en avons trouvé 28.3% des intervenants n’ayant envoyé par la poste que 10% de la clientèle. En incluant 10% de clients supplémentaires (déciles 1 et 2), nous constatons que les 20% de clients les plus importants contiennent environ 51,6% des répondants. Ces chiffres peuvent être affichés dans un graphique des gains cumulatifs, comme le montre la figure 2.

Figure 2 : Graphique des gains cumulatifs comparant le pourcentage cumulatif de répondants atteints par rapport au pourcentage cumulatif de clients contactés.

La ligne pointillée de la figure 2 correspond à “aucun gain”, c’est-à-dire, ce que nous nous attendrions à réaliser en contactant les clients au hasard. Plus la ligne des gains cumulatifs est proche du coin supérieur gauche du graphique, plus le gain est élevé; plus la proportion des répondants qui sont atteints pour la proportion inférieure de clients contactés est élevée.

Selon les coûts associés à l’envoi de chaque publipostage et les revenus attendus de chaque répondeur, le graphique des gains cumulatifs peut être utilisé pour décider du nombre optimal de clients à contacter. Il y aura probablement un point de basculement où nous aurons atteint une proportion suffisamment élevée d’intervenants et où les coûts de contact avec une plus grande proportion de clients seront trop élevés compte tenu des rendements décroissants. Cela correspondra généralement à un aplatissement de la courbe des gains cumulés, où d’autres contacts (correspondant à des déciles supplémentaires) ne devraient pas fournir de nombreux répondeurs supplémentaires. En pratique, plutôt que de regrouper les clients en déciles, un plus grand nombre de groupes pourrait être examiné, ce qui permettrait une plus grande flexibilité dans la proportion de clients que nous pourrions envisager de contacter.

Ascenseur

Nous pouvons également examiner l’ascenseur obtenu en ciblant des pourcentages croissants de la clientèle, classés par probabilité décroissante. L’ascenseur est simplement le rapport entre le pourcentage d’intervenants atteints et le pourcentage de clients contactés.

Ainsi, une levée de 1 équivaut à aucun gain par rapport au contact aléatoire des clients. Alors qu’un ascenseur de 2, par exemple, correspond au double du nombre de répondeurs atteints par rapport au nombre auquel vous vous attendez en contactant le même nombre de clients au hasard. Ainsi, nous n’avons peut-être contacté que 40% des clients, mais nous avons peut-être atteint 80% des intervenants de la clientèle. Par conséquent, nous avons doublé le nombre de répondants atteints en ciblant ce groupe par rapport à l’envoi d’un échantillon aléatoire de clients.

Ces chiffres peuvent être affichés dans une courbe de portance, comme le montre la figure 3. Idéalement, nous voulons que la courbe de portance s’étende le plus haut possible dans le coin supérieur gauche de la figure, ce qui indique que nous avons une grande portance associée au contact d’une petite proportion de clients.

Figure 3: Courbe de remontée montrant la “remontée” associée à l’envoi par la poste en pourcentage croissant de la clientèle totale, en termes de ratio du pourcentage de répondants atteints par rapport au pourcentage de clients contactés.

Dans un article de blog précédent, nous avons discuté de la façon dont les courbes ROC peuvent être utilisées pour évaluer la qualité d’un modèle en matière de classification (c.-à-d., prédire un résultat). En plus de comprendre la précision prédictive d’un modèle utilisé pour la classification, il peut également être utile de comprendre les avantages offerts par le modèle par rapport à la tentative d’identifier un résultat sans celui-ci.

Les gains cumulés et les courbes de lift sont une approche simple et utile pour comprendre les rendements que vous êtes susceptible d’obtenir de l’exécution d’une campagne marketing et le nombre de clients que vous devez contacter, en ciblant les clients les plus prometteurs à l’aide d’un modèle prédictif. Ces approches pourraient également être appliquées dans le contexte de la prédiction des personnes qui manqueront à un prêt personnel afin de décider à qui pourrait se voir offrir une carte de crédit, par exemple. Dans ce cas, l’objectif est de minimiser le nombre de personnes susceptibles de faire défaut sur le prêt, tout en maximisant le nombre de cartes de crédit offertes à ceux qui ne feront pas défaut. Le modèle prédictif dans chaque cas pourrait être toute approche statistique appropriée pour générer une probabilité de résultat binaire, qu’il s’agisse d’un modèle de régression logistique, d’une forêt aléatoire ou d’un réseau de neurones, par exemple.

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée.