Una propensión a la esperanza ya la alegría es riqueza real; uno para temer y afligir la pobreza real. —David Hume
Resumen
Los profesionales del marketing invierten mucho tiempo hablando de la importancia de hacer llegar los mensajes correctos a las personas perfectas en el momento perfecto. Notificar o enviar correos electrónicos cuando el usuario no está interesado puede hacer que muchos usuarios desactiven las notificaciones de la aplicación o informen correos electrónicos no deseados que bloquean todas las comunicaciones futuras.
El marketing tiene un costo tanto financiero como de experiencia del usuario. Si hay 100 000 usuarios en la plataforma, es aconsejable esforzarse solo por un subconjunto de usuarios que podrían estar interesados en comprar/convertir.
La mejor manera de identificar quién de su audiencia tiene más probabilidades de realizar una compra, aceptar una oferta o suscribirse a un servicio es un modelo de propensión . Entendamos mejor el modelo de propensión trabajando en una declaración del problema: construya un modelo de propensión para determinar si un usuario comprará en su visita de regreso.
Meta
Objetivo
- Modelo de propensión para calcular la probabilidad de que una persona compre un producto en su visita de regreso.
- Necesitamos identificar la probabilidad de conversión para cada usuario.
resultado comercial
- Un puntaje de propensión ayudaría a segmentar a los usuarios y ejecutar diferentes campañas de marketing para que la tasa de conversión aumente.
- Podemos compartir notificaciones móviles o correos electrónicos con ofertas exclusivas para usuarios de alta propensión que ayuden a las empresas con las tasas de conversación.
Acercarse
¿Qué es un puntaje de propensión?
- Una propensión es una tendencia natural a comportarse de cierta manera. Todos tenemos propensiones, cosas que tendemos a hacer.
- El modelado de propensión intenta predecir la probabilidad de que los visitantes, clientes potenciales y clientes realicen ciertas acciones.
- El puntaje de propensión se puede definir como P (objetivo = 1 | Z), donde Z son las características características del comportamiento del usuario en el sitio web.
Característica requerida
Análisis de los datos
Analice sus datos comprendiendo cuántos % de la clase positiva (el usuario compra en una visita de regreso) y la clase negativa (el usuario no compra en una visita de regreso).
- Clase positiva (1), es decir, compra del usuario en la visita de regreso: 1.53% [Cliente de alta propensión]
- Clase negativa (0), es decir, el usuario no compra en una visita de regreso: 98,47% [Cliente de baja propensión]
Selección métrica
Para nuestro caso de uso de marketing para mejorar la tasa de conversión:
Cost of False Negative (marking High Propensity as Low) > Cost of False Positive (marking a Low Propensity Customer as High)
Por lo tanto, nuestra métrica debe ser tal que: La recuperación es más importante que la precisión.
Un valor beta de 2 prestará más atención a la recuperación que a la precisión y se denomina medida F2.
F2-Measure = ((1 + 2²) * Precision * Recall) / (2² * Precision + Recall)
Entrenamiento modelo
El modelo de propensión es un problema de clasificación binaria, estaríamos usando una regresión logística para nuestro modelo.
Esquema de entrenamiento modelo
Salida del modelo
prob: es la probabilidad de regresión logística de que ocurra un evento, en nuestro caso, el evento es si el usuario compra en una visita de regreso o no.
Experimentación
Ejecutamos 3 experimentos de conjuntos de características diferentes con regresión logística y encontramos que el segundo tenía el mejor desempeño en nuestras métricas.
VISUAL de evaluación del modelo (Mejor modelo: 2º en la tabla de experimentos anterior | Umbral de clase positivo: 0,0217)
El mejor umbral para la clase positiva = 0,0217 significa que la probabilidad de regresión logística ≥ el umbral es una clase positiva (el usuario comprará en la visita de regreso) de lo contrario, una clase negativa.
Resultados en el conjunto de datos de prueba para el modelo de propensión
Al probar el modelo de experimento 2 con características Bounce, OS, TimeOnSite, Pageviews y Country. Obtuvimos un Recall de 91.7% y una Precisión de 3.9%. Un alto recuerdo se relaciona con casos bajos de falsos negativos y una baja precisión se relaciona con casos altos de falsos positivos.
Matriz de confusión en el conjunto de datos de prueba
NOTA: Para construir este modelo, nuestro objetivo era maximizar la tasa de conversión. Le dimos más importancia a recordar, es decir, Costo (Falso Negativo)> Costo (Falso Positivo)
Si el costo de la comunicación de marketing es alto y las demandas comerciales (precisión y recuperación iguales), entonces tendríamos que cambiar el umbral de clase positivo y la métrica de modo que Recall = Precision (tome F1 Score como métrica).
Alcance de la mejora del modelo
- Si el usuario está registrado en el sitio web o no.
- Agregar fuente de tráfico; orgánicos o anuncios los trajeron al sitio web
- Usar funciones de tiempo: a algunos usuarios les encanta ir de compras por la noche ( enlace de estudio de caso )
- Use características tecnológicas: marca y modelo del dispositivo para orientar mejor a los usuarios. Ha habido múltiples estudios de casos que respaldan que los usuarios que tienen dispositivos costosos/de alta gama convierten más. ( enlace de estudio de caso )
- Considere experimentar con el modelo agregando más datos geográficos del usuario, es decir, Ciudad/Estado. Los usuarios que visitan el sitio web desde ciudades o estados de nivel 1 que tienen un per cápita más alto tienen una mayor propensión a convertir.
Conclusión
Ahora, el uso de este modelo de propensión, el marketing y la orientación de la audiencia se pueden hacer de manera más inteligente cuando las posibilidades de conversión (compra) de un usuario desde la plataforma son mayores. Además, ayuda al equipo de marketing en términos de costos, ya que ya no tienen que ejecutar campañas/notificaciones/mensajes de correo electrónico para todos los visitantes, sino centrarse solo en un subconjunto de usuarios cuyo puntaje de propensión es alto.
Espero que hayas aprendido algo nuevo de este blog. Si te gustó, dale 👏 y comparte este artículo. ¡Estad atentos para la próxima!
AUTOR: https://www.linkedin.com/in/shaurya-uppal/
Boletín: https://www.linkedin.com/newsletters/problem-resolving-data-science-6874965456701198336/
También publicado aquí .