Blog

ダイレクトマーケティングキャンペーンを実行しているとします。 以前のキャンペーンの履歴データを使用して、予測モデルを使用すると、各顧客の特性と行動に基づいて応答する確率を予測することができます。 (例えば、ロジスティック回帰モデルがバイナリ結果の確率を予測するための有用なツールになる方法についての以前のブログ記事を参照してくださ)

私は私の販売運動を動かすことからどんなリターンを得るか。

この文脈では、新しいキャンペーンでどの顧客がレスポンダーになるかを予測する際に、予測モデルがどのような利点を提供できるかを理解したいと思 これは、モデルに関連する累積的な利益と揚力を調べ、レスポンダーをターゲットにする際のパフォーマンスと、モデルが提供する付加価値なしでどれだけ成功したかを比較することによって達成することができます。 また、同じ情報を使用して、送信するダイレクトメールの数を決定するのに役立ち、マーケティングコストと結果の売上からの期待されるリターンのバラン そこにあなたが郵送し、したがって、あなたが送信する郵送の数のために取得した回答者の数を最大化したい各顧客に関連付けられたコストがあ

このブログでは、予測分類モデルに関連する累積利得と揚力を計算するために必要な手順について説明します。

Decile Groups

ダイレクトマーケティングの例を続けて、適合モデルを使用して、過去のマーケティングキャンペーンから観測された結果、つまり誰が回答したのか、誰が回答しなかったのかを、そのキャンペーンで連絡を受けた各顧客の応答確率と比較することができます。 (実際には、モデルをデータのサブセットに適合させ、このモデルを使用して、”保留”サンプルで各顧客に応答する確率を予測し、モデルが新規顧客に対してどのように実行されるかをより正確に評価することに注意してください。)

まず、顧客を予測確率で、最高(最も近い)から最低(ゼロに最も近い)の順に並べ替えます。 顧客を同じサイズのセグメントに分割すると、同じ数の顧客を含むグループが作成されます。 したがって、応答する可能性が最も高いと予測される顧客は、decileグループ1にあり、decileグループ2にある可能性が最も高いというようになります。 各decileグループを調べると、表1に示すように、各decileの顧客と応答者の数と比率を要約したdecile要約を作成できます。

過去のデータは、全体的に、したがって、顧客ベースを無作為に郵送すると、約5%の顧客が応答することを示す可能性があります(506人の顧客のうち10,000人)。 従って、1,000人の顧客を郵送すればおよそ50人の応答者を見ると期待する。 しかし、表1のdecileグループのそれぞれで達成された応答率を見ると、トップグループはこれよりも高い応答率を持っていることがわかります。

デシルグループ 予測確率範囲 カスタム数-ers 累積番号。 顧客の 累積%顧客の 応答-ers 応答率 累積いいえ。 Cumulative Cumulative Lift Cumulative Cumulative Lift
1 0.129-1.000 1,000 1,000 10.0% 143 14.3% 143 28.3% 2.83
2 0.105-0.129 1,000 2,000 20.0% 118 11.8% 261 51.6% 2.58
3 0.073-0.105 1,000 3,000 30.0% 96 9.6% 357 70.6% 2.35
4 0.040-0.073 1,000 4,000 40.0% 51 5.1% 408 80.6% 2.02
5 0.025-0.040 1,000 5,000 50.0% 32 3.2% 440 87.0% 1.74
6 0.018-0.025 1,000 6,000 60.0% 19 1.9% 459 90.7% 1.51
7 0.015-0.018 1,000 7,000 70.0% 17 1.7% 476 94.1% 1.34
8 0.012-0.015 1,000 8,000 80.0% 14 1.4% 490 96.8% 1.21
9 0.006-0.012 1,000 9,000 90.0% 11 1.1% 501 99.0% 1.10
10 0.000-0.006 1,000 10,000 100.0% 5 0.5% 506 100.0% 1.00

表1:Decileの概要

たとえば、decileグループ1では、全体の回答率5.1%と比較して、回答率は14.3%(1,000人の顧客のうち143人の回答者がいました)でした。 また、図1に示すように、ウォーターフォールプロットのdecile要約からの結果を視覚化することもできます。 これは、予測モデルを使用して、decileグループ1、2、および3のすべての顧客がより高い応答率を持つことを示しています。

図1:ウォーターフォールプロット顧客ベース全体の全体的な回答率と比較して、各decileグループに関連付けられた回答率を視覚化します。

累積利益

decileの要約から、モデルによって提供される累積利益を計算することもできます。 レスポンダーである顧客の累積割合と、グループ全体のマーケティングキャンペーンで連絡を受けた顧客の累積割合を比較します。 これは、無作為にターゲットを設定するのではなく、モデル化された応答確率が最も高い顧客の総数の特定の割合をターゲットに設定する際の”ゲイン”を

たとえば、予測確率が最も高い顧客の上位10%(decile1)には、応答者の約28.3%(143/506)が含まれています。 だから、むしろレスポンダーの10%をキャプチャするよりも、我々は28を発見しました。顧客基盤の3%だけ郵送した応答者の10%。 顧客のさらなる10%(1と2をdeciles)を含むと、顧客の上位20%には応答者の約51.6%が含まれていることがわかります。 これらの数値は、図2に示すように、累積ゲインチャートに表示できます。

図2:累積利益は、接触した顧客の累積割合対到達したレスポンダーの累積割合を比較したグラフ.

図2の破線は”ゲインなし”に対応しています。、私達が顧客に無作為に連絡することによって達成すると期待する何を。 累積ゲイン線がチャートの左上隅に近いほど、ゲインは大きくなり、連絡を受けた顧客の割合が低いほど、応答者の割合が高くなります。

ダイレクトメールの各部分を送信することに関連するコストと各レスポンダーからの予想収益に応じて、累積利益チャートを使用して、連絡する顧客の最 おそらく、我々はレスポンダーの十分に高い割合に達している転換点があり、顧客のより多くの割合に連絡するコストが減少し、リターンを与えられた大き これは一般に、累積利得曲線の平坦化オフに対応し、さらなる接触(追加のデカイルに対応する)は、多くの追加の応答者を提供することは期待されない。 実際には、顧客をデシルにグループ化するのではなく、より多くのグループを検討することができ、連絡を検討する顧客の割合の柔軟性が向上します。

リフト

我々はまた、確率を減少させることによって、顧客ベースの増加割合をターゲットにすることによって達成されたリフトを見ることができます。 リフトは、単に接触した顧客の割合に到達したレスポンダーの割合の比率です。

だから、1のリフトは無作為に顧客に連絡することと比較してゲインなしに相当します。 たとえば、2のリフトは、同じ数の顧客に無作為に連絡することによって期待される数と比較して、レスポンダーの数が2倍になることに対応します。 だから、我々は顧客の40%に連絡している可能性がありますが、我々は顧客ベースでレスポンダーの80%に達している可能性があります。 従って、私達は顧客の無作為サンプルを郵送することと比較されるこのグループを目標とすることによって達される応答者の数を倍増した。

これらの数値は、図3に示すようにリフト曲線で表示することができます。 理想的には、リフト曲線を図の左上隅までできるだけ高く伸ばし、小さな割合の顧客に連絡することに関連して大きなリフトがあることを示します。

図3:連絡された顧客の割合に対する回答者の割合の比率の観点から、総顧客ベースの増加割合を郵送に関連付けられた”リフト”を示すリフト曲線。

以前のブログ記事では、モデルが分類する際にどのように良いかを評価するためにROC曲線をどのように使用できるかについて説明しました(つまり、ROC曲線は、モデルが分類する際にどのように良いかを評価するために使用できるかについて説明しました)。、結果を予測する)。 分類に使用されるモデルの予測精度を理解するだけでなく、それなしで結果を特定しようとするのと比較して、モデルによってどのような利点が提

累積利益とリフト曲線は、予測モデルを使用して最も有望な顧客をターゲットに基づいて、マーケティングキャンペーンを実行することから得られる可能性のあるリターンと、連絡すべき顧客の数を理解するためのシンプルで便利なアプローチです。 これらのアプローチは、同様に、例えば、クレジットカードを提供することができる人を決定するために、個人が個人ローンのデフォルトになります予測の文脈で適用することができます。 この場合、目的は、デフォルトではない人に提供されるクレジットカードの数を最大化しながら、ローンのデフォルトに可能性が高い人の数を最小限に それぞれの場合の予測モデルは、ロジスティック回帰モデル、ランダムフォレスト、ニューラルネットワークなど、バイナリ結果の確率を生成するための適切な統計的アプローチである可能性があります。

コメントを残す

メールアドレスが公開されることはありません。