数据简介
对于某企业新用户,会利用大数据来分析该用户的信息来确定是否为付费用户,弄清楚用户属性,从而针对性的进行营销,提高运营人员的办事效率。
对于付费用户预测,主要是思考收入由哪些因素推动,再对每个因素做预测,最后得出付费预测。这其实不是一个财务问题,是一个业务问题。
流失预测。这方面会偏向于大额付费用户,提取特征向量运用到应用场景的用户流失和预测里面去。(查看文末了解数据获取方式)。
数据详情
数据格式
data
字段
年龄
工作阶层
权重
教育
教育年份
婚姻状况
职业
家庭关系
种族
性别
资本收益
资本损失
每周小时数
原籍国
付费
大小
3800kb
样本量
32561
数据浏览
以前9行数据为例,我们来预览一下:
变量探索:
数据获取
在下面公众号后台回复“付费用户数据”,可获取完整数据。
点击标题查阅往期内容
R语言逻辑回归预测分析付费用户
左右滑动查看更多
01
02
03
04
点击标题查阅往期内容
R语言贝叶斯广义线性混合(多层次/水平/嵌套)模型GLMM、逻辑回归分析教育留级影响因素数据
R语言用逻辑回归、决策树和随机森林对信贷数据集进行分类预测
R语言用贝叶斯线性回归、贝叶斯模型平均 (BMA)来预测工人工资
R语言用加性多元线性回归、随机森林、弹性网络模型预测鲍鱼年龄和可视化
R语言高维数据惩罚回归方法:主成分回归PCR、岭回归、lasso、弹性网络elastic net分析基因数据(含练习题)
R语言用加性多元线性回归、随机森林、弹性网络模型预测鲍鱼年龄和可视化
R语言线性回归和时间序列分析北京房价影响因素可视化案例
python用支持向量机回归(SVR)模型分析用电量预测电力消费
R语言非参数模型厘定保险费率:局部回归、广义相加模型GAM、样条回归
R语言计量经济学:工具变量法(两阶段最小二乘法2SLS)线性模型分析人均食品消费时间序列数据和回归诊断
r语言逻辑回归(对数几率回归,Logistic)分析研究生录取数据实例
R语言广义加性模型GAMs分析温度、臭氧环境数据绘制偏回归图与偏残差图
Matlab中的偏最小二乘法(PLS)回归模型,离群点检测和变量选择
R语言JAGS贝叶斯回归模型分析博士生延期毕业完成论文时间
R语言多元逐步回归模型分析房价和葡萄酒价格:选择最合适的预测变量
R语言分位数回归Quantile Regression分析租房价格
重庆住房租赁市场现状分析:解读出租房市场的数据密码
R语言惩罚logistic逻辑回归(LASSO,岭回归)高维变量选择的分类模型案例
R语言用标准最小二乘OLS,广义相加模型GAM ,样条函数进行逻辑回归LOGISTIC分类
R语言实现CNN(卷积神经网络)模型进行回归数据分析
R语言中使用非凸惩罚函数回归(SCAD、MCP)分析前列腺数据
R语言中实现广义相加模型GAM和普通最小二乘(OLS)回归
【视频】R语言实现CNN(卷积神经网络)模型进行回归数据分析
R语言ISLR工资数据进行多项式回归和样条回归分析
R语言中的多项式回归、局部回归、核平滑和平滑样条回归模型
R语言随机搜索变量选择SSVS估计贝叶斯向量自回归(BVAR)模型
R语言如何和何时使用glmnet岭回归
欲获取全文文件,请点击左下角“阅读原文”。