希望と喜びへの傾向は真の富です。本当の貧困を恐れ、悲しむ人。 — デビッド・ヒューム
概要
マーケティング担当者は、適切なタイミングで適切なメッセージを適切な個人に届けることの重要性について、多くの時間を費やしています。ユーザーが興味を持っていないときに通知または電子メールを送信すると、多くのユーザーがアプリの通知をオフにしたり、電子メールのスパムを報告したりして、今後のすべての通信がブロックされる可能性があります。
マーケティングには、金銭面とユーザー エクスペリエンスの両方が犠牲になります。プラットフォームに 10 万人のユーザーがいる場合は、購入/コンバージョンに関心がある可能性のあるユーザーのサブセットのみに努力することが賢明です。
オーディエンスの中で、実際に購入する、オファーを受け入れる、またはサービスにサインアップする可能性が最も高いのは誰かを特定する最善の方法は、傾向モデルです。問題文に取り組み、傾向モデルをよりよく理解しましょう:傾向モデルを構築して、ユーザーが再訪問時に購入するかどうかを判断します。
ゴール
目的
- 人が再訪問時に製品を購入する可能性を把握するための傾向モデル。
- ユーザーごとにコンバージョンの確率を特定する必要があります。
ビジネス成果
- 傾向スコアは、ユーザーをセグメント化し、さまざまなマーケティング キャンペーンを実行して、コンバージョン率を高めるのに役立ちます。
- 会話率でビジネスを支援する傾向の高いユーザーに限定オファーを含むモバイル通知または電子メールを共有する場合があります。
アプローチ
傾向スコアとは何ですか?
- 傾向とは、特定の方法で行動する自然な傾向です。私たちは皆、傾向があります—私たちがする傾向があること。
- 傾向モデリングは、訪問者、リード、および顧客が特定のアクションを実行する可能性を予測しようとします。
- 傾向スコアは P( ターゲット = 1 | Z ) として定義できます。ここで、Z は Web サイトでのユーザーの行動特性です。
必要な機能
データ分析
データを分析して、ポジティブ クラス (ユーザーが再訪問時に購入) とネガティブ クラス (ユーザーが再訪問時に購入しない) の何%を把握します。
- 正のクラス (1) つまり、ユーザーが再訪問時に購入する: 1.53% [傾向の高い顧客]
- ネガティブ クラス (0) つまり、ユーザーが再訪問時に購入しない: 98.47% [傾向の低い顧客]
指標の選択
コンバージョン率を改善するためのマーケティングの使用例:
Cost of False Negative (marking High Propensity as Low) > Cost of False Positive (marking a Low Propensity Customer as High)
したがって、メトリクスは次のようになる必要があります。再現率は精度よりも重要です
ベータ値 2 は、精度よりもリコールに重点を置き、F2 尺度と呼ばれます。
F2-Measure = ((1 + 2²) * Precision * Recall) / (2² * Precision + Recall)
モデルトレーニング
傾向モデルはバイナリ分類問題であり、モデルにはロジスティック回帰を使用します。
モデル トレーニング スキーマ
モデル出力
prob:発生するイベントのロジスティック回帰確率です。この場合、イベントは、再訪問時にユーザーが購入するかどうかです。
実験
ロジスティック回帰を使用して 3 つの異なる機能セットの実験を実行したところ、2 番目がメトリクスで最高のパフォーマンスを発揮することがわかりました。
モデル評価のビジュアル (ベストモデル: 上記の実験表の 2 番目 | 正のクラスのしきい値: 0.0217)
ポジティブ クラスの最適なしきい値 = 0.0217 は、ロジスティック回帰確率 ≥ しきい値がポジティブ クラス (ユーザーは再訪問時に購入する)、それ以外の場合はネガティブ クラスであることを意味します。
傾向モデルのテスト データセットの結果
機能 Bounce、OS、TimeOnSite、Pageviews、および Country を使用した実験モデル 2 のテストについて。再現率は 91.7%、適合率は 3.9% でした。高い再現率は低い偽陰性ケースに関連し、低い精度は高い偽陽性ケースに関連します。
テスト データセットの混同行列
注: このモデルを構築する目的は、コンバージョン率を最大化することでした。コスト(偽陰性) > コスト(偽陽性)を思い出すことをより重要視しました。
マーケティング コミュニケーション コストが高く、ビジネス ニーズ (Precision と Recall が等しい) の場合は、Recall = Precision (指標として F1 スコアを取る) のように正のクラスのしきい値と指標を変更する必要があります。
モデルの改良範囲
- ユーザーが Web サイトにサインインしているかどうか。
- トラフィック ソースを追加します。オーガニックまたは広告によってウェブサイトに誘導された
- 時間機能の使用: 夜のショッピングが好きなユーザーもいます (ケース スタディ リンク)
- 技術的特徴: デバイスのブランドとモデルを使用して、ユーザーをより適切にターゲティングします。高価な/ハイエンドのデバイスを持っているユーザーがより多く変換することを裏付ける複数のケーススタディがあります. (ケーススタディリンク)
- ユーザーの地理情報、つまり都市/州を追加して、モデルを試してみることを検討してください。 1 人当たりの人口が多い Tier 1 の都市または州から Web サイトにアクセスするユーザーは、コンバージョンする傾向が高くなります。
結論
現在、この傾向モデルを使用すると、プラットフォームからのユーザー コンバージョン (購入) の可能性が高い場合に、マーケティングとオーディエンス ターゲティングをよりインテリジェントに行うことができます。また、マーケティング チームは、すべての訪問者に対してキャンペーン/通知/メールを実行する必要がなくなり、傾向スコアが高いユーザーのサブセットのみに集中できるため、コストの面でも役立ちます。
このブログから何か新しいことを学んでいただければ幸いです。気に入ったら、👏 を押して、この記事を共有してください。次回もお楽しみに!
著者: https://www.linkedin.com/in/shaurya-uppal/
ニュースレター: https://www.linkedin.com/newsletters/problem-solving-data-science-6874965456701198336/
ここにも掲載されています。