Regisztráció és bejelentkezés

Ügyfélvesztés előrejelzésének vizsgálata szoftverhasználati adatok alapján, mesterséges intelligencia segítségével

Minden vállalat számára, amely ügyfeleknek kínál egy szolgáltatást, létfontosságú a már megszerzett ügyfelek megtartása. Már pusztán az ügyfél elvesztési arány kis változása is nagy ingadozásokat okozhat a cég profitjában, különösen, ha egy ügyfél megszerzésének költsége jelentős. Emiatt a vállalatok számára kiemelten fontos, hogy beazonosítsák azokat az ügyfeleiket, akik várhatóan abba szeretnék hagyni a termékük használatát, és proaktívan orvosolják a helyzetet, például egy kedvezmény ajánlásával.

A felmondás előrejelzés régóta kutatott témakör a bank és telekommunikációs szektorban: életkor, lakhely, szolgáltatáscsomag, hívásmennyiség stb. adatok alapján már a kezdetektől kezdve próbálják a cégek kategorizálni az ügyfeleiket.

A világ digitalizálódásával a témakör még inkább előtérbe került, és újabb területeken van igény a használatára. Egyrészt a digitális szolgáltatások esetében könnyebben tud a felhasználó konkurens termékeket választani, mert online könnyen elérhetőek számára. Másrészt a vállalatok számára is nagyobb tér nyílik a felmondás megelőzésére, hiszen több információt tudnak gyűjteni arról, hogy hogyan használják a termékeiket.

Dolgozatom fókusza a szoftvertermékek esetén történő felmondás előrejelzés, mivel ez egy kevésbé kutatott terület jelenleg, ugyanakkor feltehetően egyre nagyobb figyelmet kap majd a jövőben, különösen az előfizetés alapú üzleti modellek terjedésének köszönhetően.

A munkámban 2 adathalmazon vizsgálom meg a témakört. Az első publikus adathalmaz Ázsia egyik vezető zene streamelő szolgáltatásának (KKBox) használati adatait tartalmazza, valamint, hogy az ügyfél lemondta-e az előfizetését a vizsgált periódus után. A második adathalmaz egy valós ipari környezetben gyűjtött adathalmaz, amely egy professzionális felhasználók által használt szoftver használati adatait tartalmazza.

Munkám során gépi tanulási modelleket (Logisztikus regresszió, Döntési fa, Véletlen erdő) tanítok be a predikcióra, és összehasonlítom a teljesítményüket. Különös hangsúlyt fektetek az adatok előkészítésére, és a feature engineeringre, tekintettel arra, hogy a problémakörben nem is feltétlen újfajta modellekkel, hanem megfelelő adatfeldolgozással lehet jobb és jobb eredményeket elérni. Végezetül összehasonlítom milyen feature-ök kapnak szerepeket a két eltérő adatszetten betanított modellekben.

Dolgozatom eredményeként javaslatokat teszek a hasonló, szoftveres környezetben történő prediktáláshoz: egyrészt értékelem a különböző gépi tanulási modelleket, másrészt a feature-ök kiválasztásának terén teszek ajánlásokat.

szerző

  • Kapus Ádám
    Mérnök informatikus szak, mesterképzés
    mesterképzés (MA/MSc)

konzulens

  • Dr. Ekler Péter
    Docens, Automatizálási és Alkalmazott Informatikai Tanszék