tegyük fel, hogy direkt marketing kampányt folytat, ahol az ügyfélkör tagjait egy ajánlattal próbálja megcélozni abban a reményben, hogy válaszolnak és új terméket vásárolnak, vagy feliratkoznak egy kiegészítő szolgáltatásra. Egy korábbi kampányból származó korábbi adatok felhasználásával a prediktív modell lehetővé teszi számunkra, hogy megjósoljuk az egyes ügyfelek válaszadási valószínűségét jellemzőik és viselkedésük alapján. (Lásd például előző blogbejegyzésünket arról, hogy a logisztikai regressziós modell hasznos eszköz lehet A bináris kimenetel valószínűségének előrejelzésére.)
milyen hozamot kapok a marketingkampányom futtatásából?
ebben az összefüggésben meg akarjuk érteni, hogy a prediktív modell milyen előnyökkel járhat annak előrejelzésében, hogy mely ügyfelek lesznek válaszadók vagy nem válaszolók egy új kampányban (összehasonlítva a véletlenszerű célzással). Ezt úgy érhetjük el, ha megvizsgáljuk a modellhez kapcsolódó kumulatív nyereséget és emelkedést, összehasonlítjuk annak teljesítményét a válaszadók célzásában azzal, hogy mennyire lennénk sikeresek a modell által kínált hozzáadott érték nélkül. Ugyanezeket az információkat felhasználhatjuk annak eldöntésére is, hogy hány darab közvetlen levelet kell küldeni, egyensúlyban tartva a marketing költségeket az ebből eredő értékesítésekből származó várható hozamokkal. Az Ön által elküldött minden ügyféllel kapcsolatban költség áll fenn, ezért maximalizálni szeretné a megszerzett válaszadók számát az elküldött levelek számára.
ebben a blogban leírjuk a prediktív osztályozási modellhez kapcsolódó kumulatív nyereség és emelés kiszámításához szükséges lépéseket.
decilis csoportok
folytatva a direkt marketing példát, az illesztett modell segítségével összehasonlíthatjuk a korábbi marketingkampány megfigyelt eredményeit, azaz azt, hogy ki válaszolt és ki nem, a válaszadás várható valószínűségével az adott kampányban megkeresett minden ügyfél esetében. (Vegye figyelembe, hogy a gyakorlatban a modellt az adataink egy részhalmazához illesztjük, és ezt a modellt arra használjuk, hogy megjósoljuk az egyes ügyfelek válaszadásának valószínűségét egy “visszatartási” mintában, hogy pontosabb értékelést kapjunk arról, hogy a modell hogyan teljesítene az új ügyfelek számára.)
először az előre jelzett valószínűségek szerint rendezzük az ügyfeleket, csökkenő sorrendben a legmagasabbtól (az egyikhez legközelebb) a legalacsonyabbig (a nullához legközelebb). Az ügyfeleket azonos méretű szegmensekre osztva azonos számú ügyfelet tartalmazó csoportokat hozunk létre, például 10 decilis csoportot, amelyek mindegyike az ügyfélkör 10% – át tartalmazza. Tehát azok az ügyfelek, akikre előrejelzésünk szerint a legnagyobb valószínűséggel válaszolnak, az 1. decilis csoportban vannak, a következő valószínűleg a 2.decilis csoportban stb. Az egyes decilis csoportokat megvizsgálva elkészíthetünk egy decilis összefoglalót, amint az az 1.táblázatban látható, összegezve az egyes decilisek számát és arányát.
a korábbi adatok azt mutathatják, hogy összességében, és ezért az ügyfélkör véletlenszerű postázásakor az ügyfelek körülbelül 5% – a válaszol (506 a 10 000 ügyfélből). Tehát, ha 1000 ügyfelet küldesz, akkor körülbelül 50 válaszadót fogsz látni. De, ha megnézzük az 1. táblázat minden decilis csoportjában elért válaszarányt, azt látjuk, hogy a felső csoportok magasabb válaszaránnyal rendelkeznek, mint ez, ők a legjobb kilátásaink.
decilis csoport | becsült valószínűségi tartomány | ügyfelek száma | kumulatív szám. ügyfelek | kumulatív % az ügyfelek | válasz-ers | válaszadási arány | kumulatív szám. válaszolók | összesített % – a válaszolók | Lift |
1 | 0.129-1.000 | 1,000 | 1,000 | 10.0% | 143 | 14.3% | 143 | 28.3% | 2.83 |
2 | 0.105-0.129 | 1,000 | 2,000 | 20.0% | 118 | 11.8% | 261 | 51.6% | 2.58 |
3 | 0.073-0.105 | 1,000 | 3,000 | 30.0% | 96 | 9.6% | 357 | 70.6% | 2.35 |
4 | 0.040-0.073 | 1,000 | 4,000 | 40.0% | 51 | 5.1% | 408 | 80.6% | 2.02 |
5 | 0.025-0.040 | 1,000 | 5,000 | 50.0% | 32 | 3.2% | 440 | 87.0% | 1.74 |
6 | 0.018-0.025 | 1,000 | 6,000 | 60.0% | 19 | 1.9% | 459 | 90.7% | 1.51 |
7 | 0.015-0.018 | 1,000 | 7,000 | 70.0% | 17 | 1.7% | 476 | 94.1% | 1.34 |
8 | 0.012-0.015 | 1,000 | 8,000 | 80.0% | 14 | 1.4% | 490 | 96.8% | 1.21 |
9 | 0.006-0.012 | 1,000 | 9,000 | 90.0% | 11 | 1.1% | 501 | 99.0% | 1.10 |
10 | 0.000-0.006 | 1,000 | 10,000 | 100.0% | 5 | 0.5% | 506 | 100.0% | 1.00 |
1. táblázat: decilis összegzés
például azt tapasztaltuk, hogy az 1.decilis csoportban a válaszarány 14,3% volt (143 válaszadó volt az 1000 ügyfélből), szemben az 5,1% – os általános válaszaránnyal. A decilis összefoglaló eredményeit egy vízesés-diagramban is megjeleníthetjük, amint az az ábrán látható 1. Ez azt mutatja, hogy az 1., 2. és 3. decilis csoportba tartozó összes ügyfélnél magasabb a válaszadási arány a prediktív modell használatával.
1. ábra: vízesés telek az egyes decilis csoportokhoz tartozó válaszadási arányok megjelenítése, összehasonlítva a teljes ügyfélkör teljes válaszadási arányával.
kumulatív nyereség
a decilis összefoglalóból kiszámíthatjuk a modell által biztosított kumulatív nyereséget is. Összehasonlítjuk a válaszadók összesített százalékos arányát a csoportokon belüli marketingkampányban megkeresett ügyfelek összesített százalékos arányával. Ez azt a nyereséget írja le, amikor az ügyfelek teljes számának egy adott százalékát célozzák meg a válaszadás legmagasabb modellezett valószínűségével, ahelyett, hogy véletlenszerűen céloznák meg őket.
például a legmagasabb előrejelzett valószínűségű ügyfelek 10% – a (decilis 1) A válaszadók körülbelül 28,3% – át tartalmazza (143/506). Tehát a válaszadók 10% – ának befogása helyett 28-at találtunk.A válaszadók 3% – a csak az ügyfélkör 10% – át küldte el. Az ügyfelek további 10% – át (1.és 2. decilis) beleszámítva azt tapasztaltuk, hogy az ügyfelek felső 20% – a A válaszadók körülbelül 51,6% – át tartalmazza. Ezek a számok is megjelenik egy kumulatív nyereség diagram, ábrán látható 2.
2. ábra: kumulatív nyereség diagram, amely összehasonlítja az elért válaszadók kumulatív százalékát a megkeresett ügyfelek kumulatív százalékával.
a 2. ábrán látható szaggatott vonal a “nincs nyereség” – nek felel meg, azaz., mit várnánk el, ha véletlenszerűen kapcsolatba lépnénk az ügyfelekkel. Minél közelebb van a kumulatív nyereség vonal a diagram bal felső sarkához, annál nagyobb a nyereség; minél nagyobb a válaszadók aránya, amelyet a megkeresett ügyfelek alacsonyabb arányához érnek el.
az egyes közvetlen levelek küldésével kapcsolatos költségektől és az egyes válaszadóktól várható bevételektől függően a kumulatív nyereség diagram felhasználható az optimális ügyfelek számának eldöntésére. Valószínűleg lesz egy fordulópont, amikor elértük a válaszadók kellően magas arányát, és ahol az ügyfelek nagyobb részének kapcsolatfelvételének költségei túl nagyok a csökkenő hozamok miatt. Ez általában megfelel a kumulatív nyereséggörbe ellapításának, ahol a további kapcsolatok (további decilekkel összhangban) várhatóan nem nyújtanak sok további választ. A gyakorlatban, ahelyett, hogy az ügyfeleket decilisekre csoportosítanák, nagyobb számú csoportot lehetne megvizsgálni, nagyobb rugalmasságot engedve az ügyfelek arányában, akikkel érdemes kapcsolatba lépni.
Lift
megnézhetjük azt a felvonót is, amelyet az ügyfélkör növekvő százalékának megcélzásával érünk el, csökkenő valószínűség szerint rendezve. A felvonó egyszerűen a válaszadók százalékos aránya a megkeresett ügyfelek százalékához viszonyítva.
tehát az 1-es emelés egyenértékű a nem nyereséggel, mint a véletlenszerű kapcsolatfelvétel. Mivel a 2, Például, megfelel annak, hogy kétszer annyi válaszadó érkezett, mint az elvárt szám, ha véletlenszerűen felveszi a kapcsolatot azonos számú ügyféllel. Tehát lehet, hogy csak az ügyfelek 40% – ával léptünk kapcsolatba, de az ügyfélkörben a válaszadók 80% – át elérhetjük. Ezért megdupláztuk a válaszadók számát, akiket e csoport megcélzásával értünk el, összehasonlítva az ügyfelek véletlenszerű mintájának elküldésével.
ezek az ábrák emelési görbén jeleníthetők meg, amint azt a 3.ábra mutatja. Ideális esetben azt akarjuk, hogy az emelési görbe a lehető legmagasabbra nyúljon az ábra bal felső sarkába, jelezve, hogy van egy nagy emelésünk, amely az ügyfelek kis hányadával való kapcsolatfelvételhez kapcsolódik.
3. ábra: emelési görbe, amely a levelezéshez kapcsolódó “emelést” mutatja a teljes ügyfélkör növekvő százalékában, az elért válaszadók százalékos arányának arányában a megkeresett ügyfelek százalékához viszonyítva.
egy korábbi blogbejegyzésben megvitattuk, hogy a ROC görbék hogyan használhatók annak felmérésére, hogy egy modell mennyire jó osztályozásban (azaz., eredmény előrejelzése). Az osztályozáshoz használt modell prediktív pontosságának megértése mellett hasznos lehet megérteni, hogy a modell milyen előnyöket kínál, összehasonlítva azzal, hogy megpróbálja azonosítani az eredményt anélkül.
a kumulatív nyereség és az emelési görbék egyszerű és hasznos megközelítés annak megértéséhez, hogy milyen megtérülést érhet el egy marketingkampány futtatása, és hány ügyféllel kell kapcsolatba lépnie, a legígéretesebb ügyfelek megcélzása alapján egy prediktív modell segítségével. Ezeket a megközelítéseket hasonlóan lehet alkalmazni annak előrejelzésével összefüggésben, hogy mely egyének nem teljesítik a személyi kölcsönt annak eldöntése érdekében, hogy kinek lehet hitelkártyát kínálni, például. Ebben az esetben a cél az, hogy minimálisra csökkentsék azoknak a személyeknek a számát, akik valószínűleg nem teljesítik a kölcsönt, miközben maximalizálják a nem fizetésképteleneknek kínált hitelkártyák számát. A prediktív modell minden esetben bármilyen megfelelő statisztikai megközelítés lehet A bináris kimenetel valószínűségének előállításához, legyen az logisztikai regressziós modell, véletlenszerű erdő vagy neurális hálózat.