blogi

Oletetaan, että käytät suoramarkkinointikampanjaa, jossa yrität kohdentaa asiakaskuntasi jäseniä tarjouksella siinä toivossa, että he vastaisivat ja ostaisivat uuden tuotteen tai tilaisivat lisäpalvelun. Aikaisemman kampanjan historiatietojen avulla ennakoiva malli mahdollistaa sen, että pystymme ennustamaan jokaisen asiakkaan vastaustodennäköisyyden heidän ominaisuuksiensa ja käyttäytymisensä perusteella. (Katso esimerkiksi edellinen blogikirjoitus siitä, miten logistinen regressiomalli voi olla hyödyllinen työkalu binäärituloksen todennäköisyyden ennustamisessa.)

mitä tuottoa saan markkinointikampanjani pyörittämisestä?

tässä yhteydessä haluamme ymmärtää, mitä hyötyä ennakoiva malli voi tarjota ennustettaessa, ketkä asiakkaat ovat vastaajia verrattuna ei-vastaajia uudessa kampanjassa (verrattuna kohdentamiseen sattumanvaraisesti). Tämä voidaan saavuttaa tarkastelemalla malliin liittyviä kumulatiivisia hyötyjä ja nostetta, vertaamalla sen suorituskykyä vastaajien kohdentamisessa siihen, kuinka onnistuisimme ilman mallin tarjoamaa lisäarvoa. Voimme myös käyttää samoja tietoja päättääksemme, kuinka monta kappaletta suoramainontaa lähetetään, tasapainottaen markkinointikuluja odotetun tuoton kanssa. Jokaiseen postittamaasi asiakkaaseen liittyy kustannuksia, ja siksi haluat maksimoida hankkimasi vastaajien määrän lähettämiesi postitusten määrästä.

tässä blogissa kuvataan ennakoivaan luokittelumalliin liittyvien kumulatiivisten hyötyjen ja nostojen laskemiseen tarvittavia vaiheita.

Desiiliryhmät

jatkaen suoramarkkinointiesimerkin käyttöä sovitetulla mallilla voimme verrata historiallisen markkinointikampanjan havaittuja tuloksia eli sitä, kuka vastasi ja kuka ei, kunkin kampanjassa tavoitetun asiakkaan ennustettuihin vastaustodennäköisyyksiin. (Huomaa, että käytännössä sovittaisimme mallin tietomme osajoukkoon ja käyttäisimme tätä mallia ennustaaksemme kullekin asiakkaalle vastaamisen todennäköisyyden “hold-out” – otoksessa saadaksemme tarkemman arvion siitä, miten malli toimisi uusille asiakkaille.)

lajittelemme asiakkaat ensin niiden ennustettujen todennäköisyyksien mukaan, alenevassa järjestyksessä korkeimmasta (lähimpänä yhtä) alimpaan (lähimpänä Nollaa). Jakamalla asiakkaat samankokoisiin segmentteihin luomme ryhmiä, joissa on sama asiakasmäärä, esimerkiksi 10 desiiliryhmää, joista jokainen sisältää 10% asiakaskunnasta. Eli ne asiakkaat, jotka ennustamme todennäköisimmin vastaavat, ovat desiiliryhmässä 1, seuraavaksi todennäköisimmin desiiliryhmässä 2 ja niin edelleen. Tarkastelemalla jokaista desiiliryhmää voimme laatia taulukon 1 mukaisen tiivistelmän, jossa on yhteenveto asiakkaiden ja vastaajien lukumääristä ja osuuksista kussakin desiilissä.

Historiatiedot saattavat osoittaa, että kaiken kaikkiaan ja siten satunnaisesti postitettaessa asiakaskunta vastaa noin 5% asiakkaista (506 10 000 asiakkaasta). Niin, Jos lähetät 1,000 asiakkaita odotat näkeväsi noin 50 vastaajat. Mutta jos tarkastelemme taulukon 1 kunkin desiiliryhmän aikaansaamia vastausprosentteja, huomaamme, että ylimmillä ryhmillä on tätä korkeampi vastausprosentti, ne ovat parhaat tulevaisuudennäkymämme.

Tulokymmenysryhmä ennustettu Todennäköisyysalue asiakkaiden lukumäärä kumulatiivinen No. asiakkaista kumulatiivinen % asiakkaista vastaajat vastausprosentti kumulatiivinen No. vastanneista kumulatiivinen % vastanneista Hissi
1 0.129-1.000 1,000 1,000 10.0% 143 14.3% 143 28.3% 2.83
2 0.105-0.129 1,000 2,000 20.0% 118 11.8% 261 51.6% 2.58
3 0.073-0.105 1,000 3,000 30.0% 96 9.6% 357 70.6% 2.35
4 0.040-0.073 1,000 4,000 40.0% 51 5.1% 408 80.6% 2.02
5 0.025-0.040 1,000 5,000 50.0% 32 3.2% 440 87.0% 1.74
6 0.018-0.025 1,000 6,000 60.0% 19 1.9% 459 90.7% 1.51
7 0.015-0.018 1,000 7,000 70.0% 17 1.7% 476 94.1% 1.34
8 0.012-0.015 1,000 8,000 80.0% 14 1.4% 490 96.8% 1.21
9 0.006-0.012 1,000 9,000 90.0% 11 1.1% 501 99.0% 1.10
10 0.000-0.006 1,000 10,000 100.0% 5 0.5% 506 100.0% 1.00

Taulukko 1: tulokymmenyksen Yhteenveto

esimerkiksi tulokymmenyksen ryhmässä 1 vastausprosentti oli 14,3% (1 000 asiakkaasta vastaajia oli 143), kun kokonaisvasteprosentti oli 5,1%. Voimme myös visualisoida tulokset desiilin yhteenvedosta vesiputouksen juonessa, kuten kuvassa 1 esitetään. Tämä havainnollistaa sitä, että kaikilla desiiliryhmiin 1, 2 ja 3 kuuluvilla asiakkailla on suurempi vastausprosentti ennustemallia käyttäen.

Kuva 1: vesiputous juoni visualisoimalla kuhunkin desiiliryhmään liittyvät vastausprosentit verrattuna koko asiakaskunnan kokonaisvastausprosenttiin.

kumulatiiviset voitot

kymmenesosan summasta voidaan laskea myös mallin tuottamat kumulatiiviset voitot. Vertaamme vastaajina olevien asiakkaiden kumulatiivista prosenttiosuutta markkinointikampanjassa yhteyttä ottaneiden asiakkaiden kumulatiiviseen prosenttiosuuteen eri ryhmissä. Tämä kuvaa “voittoa” kohdentamalla tietty prosenttiosuus kaikista asiakkaista käyttäen korkeimpia mallinnettuja vastaamisen todennäköisyyksiä sen sijaan, että ne kohdistettaisiin sattumanvaraisesti.

esimerkiksi 10% asiakkaista, joilla on korkein ennustettu todennäköisyys (desiili 1), sisältää noin 28,3% vastanneista (143/506). Sen sijaan, että olisimme napanneet 10% vastanneista, olemme löytäneet 28.3 prosenttia vastanneista oli postittanut vain 10 prosenttia asiakaskunnasta. Kun mukaan lasketaan vielä 10% asiakkaista (desiilit 1 ja 2), huomaamme, että top 20% asiakkaista sisältää noin 51,6% vastaajista. Nämä luvut voidaan näyttää kumulatiivinen voitot kaavio, kuten kuvassa 2.

kuva 2: kumulatiivinen voitot kaavio vertaamalla kumulatiivinen prosenttiosuus vastaajien saavutettu verrattuna kumulatiivinen prosenttiosuus asiakkaiden yhteyttä.

kuvan 2 katkoviivaa vastaa “no gain”, ts., mitä odottaisimme saavuttavamme ottamalla yhteyttä asiakkaisiin satunnaisesti. Mitä lähempänä kumulatiivinen voitot linja on vasemmassa yläkulmassa kaavion, sitä suurempi voitto; sitä suurempi osuus vastaajat, jotka on saavutettu pienempi osuus asiakkaita yhteyttä.

riippuen kunkin suoramainonnan lähettämiseen liittyvistä kustannuksista ja odotetuista tuloista jokaiselta vastaajalta, kumulatiivista voittokaaviota voidaan käyttää päätettäessä optimaalisesta asiakasmäärästä, johon voidaan ottaa yhteyttä. On todennäköisesti käännekohta, jossa olemme saavuttaneet riittävän korkean vastaajien osuuden ja jossa yhteydenotot suuremmalle osalle asiakkaista ovat liian suuret, kun otetaan huomioon tuottojen väheneminen. Tämä vastaa yleensä kumulatiivisten voittojen käyrän madaltumista, jolloin lisäkontaktien (jotka vastaavat ylimääräisiä desiilejä) ei odoteta tuottavan monia lisävasteita. Käytännössä asiakkaiden ryhmittelyn sijaan voitaisiin tarkastella suurempaa joukkoa ryhmiä, jolloin voitaisiin joustavoittaa yhteydenottoja harkitsevien asiakkaiden osuutta.

Hissi

voidaan tarkastella myös nostetta, joka saavutetaan kohdentamalla kasvavia prosentteja asiakaskunnasta, tilattuna laskevalla todennäköisyydellä. Hissi on yksinkertaisesti saavutetun vastaajien prosenttiosuuden suhde otettujen asiakkaiden prosenttiosuuteen.

niin, 1: n hissi on yhtä kuin ei voittoa verrattuna asiakkaiden satunnaiseen yhteydenottoon. Kun taas esimerkiksi 2: n hissi vastaa sitä, että vastaajien määrä on kaksinkertainen verrattuna odotettuun määrään ottamalla yhteyttä samaan määrään asiakkaita satunnaisesti. Olemme siis ehkä ottaneet yhteyttä vain 40 prosenttiin asiakkaista,mutta asiakaskunnassa olemme saattaneet tavoittaa 80 prosenttia vastanneista. Siksi olemme kaksinkertaistaneet tämän ryhmän tavoittamien vastaajien määrän verrattuna satunnaiseen otokseen asiakkaista.

nämä luvut voidaan esittää nostokäyrällä, kuten kuvassa 3 esitetään. Ihannetapauksessa haluamme hissikäyrän ulottuvan mahdollisimman korkealle kuvan vasempaan yläkulmaan, mikä osoittaa, että meillä on suuri hissi, joka liittyy yhteydenottoon pieneen osaan asiakkaista.

kuva 3: Hissikäyrä, joka osoittaa postitukseen liittyvän” hissin ” lisääntyvän prosentuaalisen osuuden koko asiakaskunnasta, suhteessa tavoitettujen vastaajien prosenttiosuuteen suhteessa otettujen asiakkaiden prosenttiosuuteen.

aiemmassa blogikirjoituksessa pohdimme, miten ROC-käyriä voidaan käyttää arvioitaessa, kuinka hyvä malli on luokittelussa (ts., tuloksen ennustaminen). Luokittelussa käytetyn mallin ennustavan tarkkuuden ymmärtämisen lisäksi voi olla hyödyllistä ymmärtää, mitä hyötyä mallista on verrattuna siihen, että yritetään tunnistaa tulos ilman sitä.

kumulatiiviset voitot ja nostokäyrät ovat yksinkertainen ja hyödyllinen tapa ymmärtää, mitä tuottoja saat todennäköisesti markkinointikampanjan toteuttamisesta ja kuinka moneen asiakkaaseen sinun tulisi ottaa yhteyttä. Näitä lähestymistapoja voitaisiin soveltaa myös ennustettaessa, ketkä henkilöt jättävät henkilökohtaisen lainan maksamatta, jotta voitaisiin päättää, kenelle voitaisiin tarjota esimerkiksi luottokorttia. Tässä tapauksessa tavoitteena on minimoida niiden ihmisten määrä, jotka todennäköisesti laiminlyövät lainan, ja maksimoida luottokorttien määrä, joita tarjotaan niille, jotka eivät laiminlyö. Ennustemalli voisi kussakin tapauksessa olla mikä tahansa sopiva tilastollinen lähestymistapa todennäköisyyden tuottamiseksi binääriselle tulokselle, oli se sitten logistinen regressiomalli, satunnainen metsä tai esimerkiksi neuroverkko.

Vastaa

Sähköpostiosoitettasi ei julkaista.