用户流失及转换预测的前期工作

刚刚接手一个小型的某旅游O2O网站酒店订单数据分析项目,目的是分析用户流失关键影响因素,并对访问转化进行预测。

在预测前对该网站访问下单路径、用户生命周期以及本次的分析思路进行梳理。

1.业务流程(用户访问下单路径)

  • 用户登陆(读取到用户画像指标、行为偏好、记录登陆时长)
  • 访问酒店详情页(访问日期和时点、访问会话id、当前酒店画像)
  • 访问订单填写页(入住日期、当前酒店所在城市同一入住日期的昨日订单)
  • 下达订单(label)

2.用户生命周期

  • 用户注册、首次登陆
  • 用户首次访问酒店详情页
  • 用户首次访问订单填写页
  • 用户首次下单
  • 用户非首次下单
  • 用户取消订单
  • 用户长期未下单
  • 用户长期未访问

3.分析思路

  • 从业务上对数据分类
    • 当前访问下单数据
    • 当前用户画像及行为偏好
    • 当前用户长期历史访问下单数据
    • 当前用户短期历史访问数据
    • 当前酒店的历史数据
    • 当前城市的昨日热度
  • 用户流失分析
    • 探索流失指标和阈值,定义用户流失,构建流失label
    • 假设流失只与用户画像及行为偏好、长期历史访问下单数据有关,从中探索影响显著的变量
    • 由于是分类问题,以logistic回归、决策树、神经网络、SVM等分别建模,评估模型效果
    • 选用效果好的模型,解释关键影响因素
  • 用户酒店匹配度分析
    • 用户短期历史访问指标均值、最值分别与酒店指标归一化
    • 归一化后的用户短期历史访问指标均值、最值分别与酒店对应指标差分
    • 差分指标求平方和,作为用户酒店匹配度指标
  • 访问转化预测
    • 构建变量提前期(=入住日期-访问日期)
    • 从提前期、访问时点、是否新访问会话、用户画像、用户酒店匹配度、当前城市昨日热度中筛选自变量
    • 由于是分类问题,以随机森林、XGboost、LSTM模型等分别建模,评估模型效果
    • 选用效果好的模型作为访问转化预测模型

你可能感兴趣的:(数据分析)