블로그

직접 마케팅 캠페인을 운영하고 있다고 가정해 보겠습니다. 이전 캠페인의 과거 데이터를 사용하여 예측 모델을 사용하면 각 고객이 특성 및 행동에 따라 응답 할 확률을 예측할 수 있습니다. 로지스틱 회귀 모델이 이진 결과의 확률을 예측하는 데 유용한 도구가 될 수있는 방법에 대한 이전 블로그 게시물을 참조하십시오.)

내 마케팅 캠페인을 실행에서 얻을 것 이다 어떤 반환?

이러한 맥락에서 우리는 예측 모델이 새로운 캠페인에서 응답자 대 비 응답자가 될 고객을 예측하는 데 어떤 이점을 제공 할 수 있는지 이해하려고합니다(무작위로 타겟팅하는 것과 비교). 이는 모델과 관련된 누적 이득 및 리프트를 조사하고 응답자를 대상으로 한 성과를 모델에서 제공하는 부가 가치없이 얼마나 성공적 이었는지와 비교함으로써 달성 할 수 있습니다. 우리는 또한 보낼 다이렉트 메일의 얼마나 많은 조각을 결정하는 것을 돕도록 동일한 정보를 이용할 수 있어,유래 판매에서 예상한 반환을 가진 매매 비용을 균형을 잡. 너가 우송하는 각 고객에 회합되는 비용 있고 그런 까닭에 너가 보내는 우편물의 수를 위해 너가 취득하는 응답자의 수를 확대하고 싶는다.

이 블로그에서는 예측 분류 모델과 관련된 누적 이득 및 리프트를 계산하는 데 필요한 단계를 설명합니다.

십분 그룹

다이렉트 마케팅 예제를 계속하면서,적합 모델을 사용하여 과거 마케팅 캠페인에서 관찰된 결과,즉 응답한 사람과 그렇지 않은 사람을 해당 캠페인에서 접촉한 각 고객에 대한 응답의 예측된 확률과 비교할 수 있습니다. 실제로 모델을 데이터의 하위 집합에 맞추고 이 모델을 사용하여”보류”샘플의 각 고객에 대한 응답 확률을 예측하여 모델이 신규 고객에 대해 수행하는 방식을 보다 정확하게 평가할 수 있습니다.)

먼저 고객을 예측 된 확률로 가장 높은(1 에 가장 가까운)에서 가장 낮은(0 에 가장 가까운)순서로 정렬합니다. 고객을 동일한 크기의 세그먼트로 분할하여 동일한 수의 고객을 포함하는 그룹(예:각각 고객 기반의 10%를 포함하는 10 십분 그룹)을 만듭니다. 따라서 우리가 예측 한 고객이 응답 할 가능성이 가장 높은 고객은 1 십분 그룹 1 에 있고 그 다음 고객은 2 십분 그룹 2 에 있습니다. 각 십분 그룹을 검토하여 표 1 과 같이 십분 요약을 작성하여 각 십분 단위의 고객 및 응답자의 수와 비율을 요약 할 수 있습니다.

히스토리 데이터는 전체적으로 고객 기반을 무작위로 우송 할 때 약 5%의 고객이 응답한다는 것을 보여줄 수 있습니다(10,000 명의 고객 중 506 명). 따라서 1,000 명의 고객에게 메일을 보내면 약 50 명의 응답자를 볼 것으로 예상됩니다. 그러나 표 1 의 각 십분 그룹에서 달성 된 응답률을 살펴보면 상위 그룹이 이보다 더 높은 응답률을 가지고 있음을 알 수 있습니다.

10 십분 그룹 예측 확률 범위 사용자 정의 사용자 수 누적 번호. 고객 누적 고객 응답자 응답률 누적 번호 응답자의 누적 응답자의 리프트
1 0.129-1.000 1,000 1,000 10.0% 143 14.3% 143 28.3% 2.83
2 0.105-0.129 1,000 2,000 20.0% 118 11.8% 261 51.6% 2.58
3 0.073-0.105 1,000 3,000 30.0% 96 9.6% 357 70.6% 2.35
4 0.040-0.073 1,000 4,000 40.0% 51 5.1% 408 80.6% 2.02
5 0.025-0.040 1,000 5,000 50.0% 32 3.2% 440 87.0% 1.74
6 0.018-0.025 1,000 6,000 60.0% 19 1.9% 459 90.7% 1.51
7 0.015-0.018 1,000 7,000 70.0% 17 1.7% 476 94.1% 1.34
8 0.012-0.015 1,000 8,000 80.0% 14 1.4% 490 96.8% 1.21
9 0.006-0.012 1,000 9,000 90.0% 11 1.1% 501 99.0% 1.10
10 0.000-0.006 1,000 10,000 100.0% 5 0.5% 506 100.0% 1.00

표 1:십분 요약

예를 들어,십분 그룹 1 의 응답률은 5.1%의 전체 응답률과 비교하여 14.3%(1,000 명의 고객 중 143 명의 응답자)였습니다. 그림 1 과 같이 폭포 플롯의 십분 요약 결과를 시각화 할 수도 있습니다. 이는 1 십분 그룹 1,2 및 3 의 모든 고객이 예측 모델을 사용하여 더 높은 응답 속도를 갖는다는 것을 보여줍니다.

그림 1:전체 고객 기반의 전체 응답률과 비교하여 각 십분위기 그룹과 관련된 응답률을 시각화하는 폭포 그림.

누적 이익

십분법 요약에서 모델이 제공하는 누적 이익을 계산할 수도 있습니다. 응답자인고객의 누적 비율과 그룹 전체의 마케팅 캠페인에서 연락된고객의 누적 비율을 비교합니다. 이 응답의 가장 높은 모델링 확률을 사용하여 고객의 총 수의 주어진 비율을 대상으로’이득’을 설명,오히려 무작위로 그들을 대상으로.

예를 들어,가장 높은 예측 확률(1 십분법)을 가진 고객의 상위 10%는 응답자의 약 28.3%(143/506)를 포함합니다. 따라서 응답자의 10%를 캡처하는 대신 28 을 발견했습니다.응답자의 3%는 고객 기반의 10%만 발송했습니다. 10%의 고객(1 십분 및 2 십분)을 포함하여 상위 20%의 고객이 응답자의 약 51.6%를 포함한다는 것을 알 수 있습니다. 이 수치는 누적 이익 차트에 표시 할 수 있습니다,도면에 도시 된 바와 같이 2.

그림 2:도달한 응답자의 누적 비율과 접촉한 고객의 누적 비율을 비교하는 누적 이익 차트.

그림 2 의 점선은”이득 없음”과 일치합니다.,우리는 무작위로 고객에게 연락하여 달성 할 것으로 예상 무엇. 누적 수익 라인이 차트의 왼쪽 위 모서리에 가까울수록 이득이 커집니다.

다이렉트 메일의 각 부분을 보내는 것과 관련된 비용과 각 응답자의 예상 수익에 따라 누적 이익 차트를 사용하여 연락 할 최적의 고객 수를 결정할 수 있습니다. 우리가 응답자의 충분히 높은 비율에 도달 한 티핑 포인트가있을 것이며,감소하는 수익을 감안할 때 더 많은 비율의 고객에게 연락하는 비용이 너무 큽니다. 이는 일반적으로 누적 이익 곡선의 평탄화와 일치하며,추가 접촉(추가 십진수에 해당)은 많은 추가 응답자를 제공 할 것으로 예상되지 않습니다. 실제로 고객을 십진수로 그룹화하는 대신 더 많은 수의 그룹을 검사하여 연락을 고려할 수 있는 고객의 비율을 더 유연하게 할 수 있습니다.

리프트

우리는 또한 고객 기반의 증가 비율을 대상으로 달성 리프트 볼 수 있습니다,감소 확률에 의해 주문. 리프트는 단순히 연락 고객의 비율에 도달 응답자의 비율의 비율이다.

따라서 1 의 리프트는 무작위로 고객에게 연락하는 것에 비해 이득이없는 것과 같습니다. 예를 들어,2 의 리프트는 동일한 수의 고객에게 무작위로 연락하여 기대하는 수에 비해 도달 한 응답자 수의 두 배에 해당합니다. 이렇게,우리는 단 고객의 40%을 접촉할지도 모른다,그러나 우리는 고객 기초안에 응답자의 80%을 도달할지도 모른다. 따라서 이 그룹을 타겟팅하여 도달한 응답자 수를 무작위 고객 샘플을 발송하는 것과 비교하여 두 배로 늘렸습니다.

이 수치는 그림 3 과 같이 리프트 곡선으로 표시 할 수 있습니다. 이상적으로,우리는 리프트 커브가 그림의 왼쪽 상단 모서리로 최대한 높게 확장되기를 원하며,이는 작은 비율의 고객과 접촉하는 것과 관련된 큰 리프트가 있음을 나타냅니다.

그림 3:전체 고객 기반의 메일 링 증가 백분율과 관련된”리프트”를 보여주는 리프트 곡선,응답자의 비율이 접촉 한 고객의 비율을 기준으로 도달 비율 측면에서.

이전 블로그 게시물에서 우리는 모델이 분류에 얼마나 좋은 평가(즉.,결과 예측). 분류에 사용되는 모델의 예측 정확도를 이해하는 것뿐만 아니라 모델이 제공하지 않는 결과를 식별하는 것과 비교하여 모델이 제공하는 이점을 이해하는 것도 도움이 될 수 있습니다.

누적 수익 및 리프트 곡선은 예측 모델을 사용하여 가장 유망한 고객을 대상으로 마케팅 캠페인을 실행하여 얻을 수 있는 수익률과 연락해야 하는 고객 수를 이해하는 간단하고 유용한 방법입니다. 이러한 접근 방식은 예를 들어 신용 카드를 제공 할 수있는 사람을 결정하기 위해 어떤 개인이 개인 대출로 채무 불이행 할 것인지 예측하는 맥락에서 유사하게 적용될 수 있습니다. 이 경우,목표는 대출에 기본 가능성이 사람들의 수를 최소화하는 것입니다,기본되지 않습니다 사람들에게 제공하는 신용 카드의 수를 극대화하는 동안. 각각의 경우에 예측 모델은 이진 결과에 대한 확률을 생성하기위한 적절한 통계적 접근법 일 수 있으며,예를 들어 로지스틱 회귀 모델,랜덤 포리스트 또는 신경망 일 수 있습니다.

답글 남기기

이메일 주소는 공개되지 않습니다.