Uma propensão à esperança e à alegria é uma riqueza real; alguém para temer e lamentar a pobreza real. —David Hume
Abstrato
Os profissionais de marketing investem muito tempo falando sobre a importância de enviar as mensagens corretas para as pessoas certas no momento certo. Notificar ou enviar e-mails quando o usuário não está interessado pode fazer com que muitos usuários desativem as notificações do aplicativo ou denunciem e-mails de spam que bloqueiam todas as comunicações futuras.
O marketing tem um custo financeiro e de experiência do usuário. Se houver 100 mil usuários na plataforma, é aconselhável se esforçar apenas para um subconjunto de usuários que possam estar interessados em comprar/converter.
A melhor maneira de identificar quem do seu público tem maior probabilidade de realmente fazer uma compra, aceitar uma oferta ou se inscrever em um serviço é um modelo de propensão . Vamos entender melhor o modelo de propensão trabalhando em uma declaração de problema: Construir um modelo de propensão para determinar se um usuário comprará em sua visita de retorno.
Meta
Objetivo
- Modelo de propensão para descobrir a probabilidade de uma pessoa comprar um produto em sua visita de retorno.
- Precisamos identificar a probabilidade de conversão para cada usuário.
Resultado de negócios
- Uma pontuação de propensão ajudaria a segmentar os usuários e executar diferentes campanhas de marketing para que a taxa de conversão aumentasse.
- Podemos compartilhar notificações móveis ou e-mails com ofertas exclusivas para usuários de alta propensão, ajudando empresas com taxas de conversação.
Abordagem
O que é uma pontuação de propensão?
- Uma propensão é uma tendência natural para se comportar de uma determinada maneira. Todos nós temos propensões - coisas que tendemos a fazer.
- A modelagem de propensão tenta prever a probabilidade de visitantes, leads e clientes realizarem determinadas ações.
- O escore de propensão pode ser definido como P( Alvo = 1 | Z ) onde Z são os recursos característicos do comportamento do usuário no site.
Recurso Necessário
Análise de dados
Analise seus dados entendendo quantos % da classe positiva (o usuário compra na visita de retorno) e na classe negativa (o usuário não compra na visita de retorno).
- Classe positiva (1), ou seja, o usuário compra na visita de retorno: 1,53% [Cliente de alta propensão]
- Classe negativa (0), ou seja, o usuário não compra em uma visita de retorno: 98,47% [Cliente de baixa propensão]
Seleção de Métrica
Para nosso caso de uso de Marketing para melhorar a taxa de conversão:
Cost of False Negative (marking High Propensity as Low) > Cost of False Positive (marking a Low Propensity Customer as High)
Portanto, nossa métrica deve ser tal que: Recall é mais importante que precisão
Um valor beta de 2 pesará mais atenção na recordação do que na precisão e é referido como a medida F2.
F2-Measure = ((1 + 2²) * Precision * Recall) / (2² * Precision + Recall)
Modelo de Treinamento
O modelo de propensão é um problema de classificação binária, estaríamos usando uma regressão logística para o nosso modelo.
Esquema de treinamento de modelo
Saída do modelo
prob: é a probabilidade de regressão logística de um evento ocorrer, no nosso caso o evento é o usuário comprando em uma visita de retorno ou não.
Experimentação
Executamos 3 experimentos de conjunto de recursos diferentes com regressão logística e descobrimos que o segundo tem o melhor desempenho em nossas métricas.
VISUAL de Avaliação do Modelo (Melhor Modelo: 2º na Tabela Experimental acima | Limite de Classe Positivo: 0,0217)
O melhor limite para classe positiva = 0,0217 significa probabilidade de regressão logística ≥ o limite é classe positiva (o usuário comprará na visita de retorno), caso contrário, classe negativa.
Resultados no conjunto de dados de teste para modelo de propensão
Ao testar o modelo de experimento 2 com os recursos Bounce, OS, TimeOnSite, Pageviews e Country. Obtivemos um Recall de 91,7% e uma Precisão de 3,9%. Uma alta rechamada está relacionada a casos falsos negativos baixos e uma precisão baixa está relacionada a casos altos de falsos positivos.
Matriz de confusão no conjunto de dados de teste
NOTA: Para construir este modelo nosso objetivo era maximizar a taxa de conversão. Demos mais importância ao recall, ou seja, Custo(Falso Negativo) > Custo(Falso Positivo)
Se o custo da comunicação de marketing for alto e as demandas de negócios (Precisão e Recall iguais), precisaríamos alterar o limite de classe positiva e a métrica de forma que Recall = Precisão (considere F1 Score como métrica).
Escopo de Melhoria do Modelo
- Se o usuário está logado no site ou não.
- Adicionar fonte de tráfego; orgânicos ou anúncios os trouxeram para o site
- Use recursos de tempo: alguns usuários adoram fazer compras à noite ( link do estudo de caso )
- Use recursos tecnológicos: marca e modelo do dispositivo para segmentar melhor os usuários. Houve vários estudos de caso que sustentam que os usuários com dispositivos caros/de última geração convertem mais. ( link do estudo de caso )
- Considere experimentar o modelo adicionando mais dados geográficos do usuário, ou seja, cidade/estado. Os usuários que visitam o site de cidades ou estados de nível 1 com per capita mais alto têm maior propensão a converter.
Conclusão
Agora, usando esse modelo de propensão, o marketing e a segmentação de público podem ser feitos de maneira mais inteligente onde as chances de conversão (compra) do usuário na plataforma são maiores. Além disso, ajuda a equipe de marketing em termos de custo, pois não precisa mais executar campanhas/notificações/enviadores de e-mail para todos os visitantes, mas sim se concentrar apenas em um subconjunto de usuários cuja pontuação de propensão é alta.
Espero que você tenha aprendido algo novo com este blog. Se você gostou, clique em 👏 e compartilhe este artigo. Fique ligado no próximo!
AUTOR: https://www.linkedin.com/in/shaurya-uppal/
Boletim informativo: https://www.linkedin.com/newsletters/problem-resolution-data-science-6874965456701198336/
Publicado também aqui .