Une propension à l'espérance et à la joie est une vraie richesse ; quelqu'un qui craint et s'afflige de la vraie pauvreté. —David Hume
Résumé
Les spécialistes du marketing passent beaucoup de temps à parler de l'importance de transmettre les bons messages aux personnes idéales au moment idéal. La notification ou l'envoi d'un e-mail lorsque l'utilisateur n'est pas intéressé peut amener de nombreux utilisateurs à désactiver les notifications d'application ou à signaler des e-mails indésirables qui bloquent toutes les communications futures.
Le marketing a un coût à la fois financier et d'expérience utilisateur. S'il y a 100 000 utilisateurs sur la plate-forme, il est sage de ne s'efforcer que pour un sous-ensemble d'utilisateurs susceptibles d'être intéressés par l'achat/la conversion.
Le meilleur moyen d'identifier qui, parmi votre public, est le plus susceptible d'effectuer un achat, d'accepter une offre ou de s'inscrire à un service est un modèle de propension . Comprenons mieux le modèle de propension en travaillant sur un énoncé de problème : créez un modèle de propension pour déterminer si un utilisateur achètera lors de sa prochaine visite.
Objectif
Objectif
- Modèle de propension pour déterminer la probabilité qu'une personne achète un produit lors de sa prochaine visite.
- Nous devons identifier la probabilité de conversion pour chaque utilisateur.
Résultat commercial
- Un score de propension aiderait à segmenter les utilisateurs et à lancer différentes campagnes marketing afin d'augmenter le taux de conversion.
- Nous pouvons partager des notifications mobiles ou des e-mails avec des offres exclusives aux utilisateurs à forte propension à aider les entreprises avec des taux de conversation.
Approcher
Qu'est-ce qu'un score de propension ?
- Une propension est une tendance naturelle à se comporter d'une certaine manière. Nous avons tous des propensions - des choses que nous avons tendance à faire.
- La modélisation de la propension tente de prédire la probabilité que les visiteurs, les prospects et les clients effectuent certaines actions.
- Le score de propension peut être défini comme P( Target = 1 | Z ) où Z est les caractéristiques du comportement de l'utilisateur sur le site Web.
Fonctionnalité requise
L'analyse des données
Analysez vos données en comprenant combien de % de la classe positive (l'utilisateur achète lors d'une visite de retour) et de la classe négative (l'utilisateur n'achète pas lors d'une visite de retour).
- Classe positive (1), c'est-à-dire que l'utilisateur achète lors d'une nouvelle visite : 1,53 % [Client à forte propension]
- Classe négative (0), c'est-à-dire que l'utilisateur n'achète pas lors d'une nouvelle visite : 98,47 % [client à faible propension]
Sélection métrique
Pour notre cas d'utilisation marketing visant à améliorer le taux de conversion :
Cost of False Negative (marking High Propensity as Low) > Cost of False Positive (marking a Low Propensity Customer as High)
Par conséquent, notre métrique devrait être telle que : Le rappel est plus important que la précision
Une valeur bêta de 2 pèsera plus sur le rappel que sur la précision et est appelée mesure F2.
F2-Measure = ((1 + 2²) * Precision * Recall) / (2² * Precision + Recall)
Formation de modèle
Le modèle de propension est un problème de classification binaire, nous utiliserions une régression logistique pour notre modèle.
Modèle de schéma de formation
Sortie du modèle
prob: est la probabilité de régression logistique qu'un événement se produise, dans notre cas, l'événement est l'achat par l'utilisateur lors d'une visite de retour ou non.
Expérimentation
Nous avons effectué 3 expériences d'ensembles de fonctionnalités différentes avec régression logistique et avons trouvé que la 2e était la plus performante sur nos métriques.
VISUEL de l'évaluation du modèle (Meilleur modèle : 2e dans le tableau d'expériences ci-dessus | Seuil de classe positif : 0,0217)
Le meilleur seuil pour la classe positive = 0,0217 signifie que la probabilité de régression logistique ≥ le seuil est la classe positive (l'utilisateur achètera lors d'une prochaine visite), sinon la classe négative.
Résultats sur l'ensemble de données de test pour le modèle de propension
Lors du test du modèle d'expérience 2 avec les fonctionnalités Bounce, OS, TimeOnSite, Pageviews et Country. Nous avons obtenu un rappel de 91,7 % et une précision de 3,9 %. Un rappel élevé concerne les cas de faux négatifs faibles et une faible précision concerne les cas de faux positifs élevés.
Matrice de confusion sur le jeu de données Test
REMARQUE : Pour construire ce modèle, notre objectif était de maximiser le taux de conversion. Nous avons donné plus d'importance au rappel, c'est-à-dire Coût (faux négatif)> Coût (faux positif)
Si le coût de la communication marketing est élevé et les exigences commerciales (égales à la précision et au rappel), nous aurions besoin de modifier le seuil de classe positif et la métrique de sorte que Rappel = Précision (prenez le score F1 comme métrique).
Portée de l'amélioration du modèle
- Si l'utilisateur est connecté sur le site Web ou non.
- Ajouter une source de trafic ; organiques ou des publicités les ont amenés sur le site Web
- Utiliser les fonctionnalités horaires : certains utilisateurs adorent faire du shopping la nuit ( lien vers l'étude de cas )
- Utilisez les fonctionnalités technologiques : marque et modèle de l'appareil pour mieux cibler les utilisateurs. Il y a eu plusieurs études de cas qui montrent que les utilisateurs ayant des appareils coûteux/haut de gamme convertissent davantage. ( lien étude de cas )
- Envisagez d'expérimenter le modèle en ajoutant plus de données géographiques de l'utilisateur, c'est-à-dire la ville/l'état. Les utilisateurs visitant le site Web à partir de villes ou d'états de niveau 1 ayant un taux par habitant plus élevé ont une propension plus élevée à convertir.
Conclusion
Désormais, en utilisant ce modèle de propension, le marketing et le ciblage d'audience peuvent être effectués de manière plus intelligente lorsque les chances de conversion d'un utilisateur (achat) à partir de la plate-forme sont plus élevées. En outre, cela aide l'équipe marketing en termes de coût car elle n'a plus à exécuter de campagnes/notifications/emailers sur tous les visiteurs, mais se concentre plutôt uniquement sur un sous-ensemble d'utilisateurs dont le score de propension est élevé.
J'espère que vous avez appris quelque chose de nouveau sur ce blog. Si vous l'avez aimé, appuyez sur 👏 et partagez cet article. Restez à l'écoute pour le prochain!
AUTEUR : https://www.linkedin.com/in/shaurya-uppal/
Bulletin : https://www.linkedin.com/newsletters/problem-resolution-data-science-6874965456701198336/
Également publié ici .