你好,我是不二翔叔。
一、数据分析的目的
1.验证产品模式是否可行
2.验证用户对产品功能的满意度
3.挖掘新的需求,帮助产品、运营进行迭代
二、数据分析流程
1.数据采集
友盟+事件埋点
2.数据清洗
Excel清洗
3.数据分析
Excel + SPSS
4.数据可视化
Excel图表
5.数据迭代
三、数据分析工具
四、数据分析指标
1.定性指标vs量化指标
2.探索性指标vs报告性指标
3.先见性指标vs后见性指标
4.相关性指标vs因果性指标
5.虚荣性指标vs可付诸行动指标
①整体
北极星指标:核心指标
一级指标:衡量公司战略和目标
二级指标:一级指标的路径
三级指标:二级指标的路径
AARRR模型:
A:用户获取
渠道相关:
渠道规模、访问量、访问用户量、拉新能力、新访问用户量、新访问用户量/访问用户总量、渠道质量、访问时长、每次会话浏览页面数、跳出率、用户注册转化率、用户其他转化率、渠道留存率
激活相关:
下载量:已下载应用的用户数量,以及应用商店排名和评分
安装激活量:安装并打开应用的设备数
激活率:激活设备数/安装设备数
新增用户数:新增设备的数量(激活数量,唯一)
注册用户数:所有激活用户中注册成功的用户占比
用户获取成本:每获取一个用户所需要的费用
抛出一个疑问:何为真正的激活?
安装之后打开就算激活吗?注册成功就算激活吗?还是必须得首次体验到产品核心功能才算激活?
A:用户活跃
产品使用规模:
日活、周活、月活跃用户量:一段时间内启动过应用的设备数,表示用户规模
访问量,启动次数:启动应用的次数
活跃系数:日活跃用户数/月活跃用户数(大于0.2比较合适)
平均使用时长:平均每个用户一天使用应用的时间
功能使用率:使用某功能的用户数占活跃用户的比例
新手引导效率:
新手任务完成率
新手任务完成耗时
用户活跃度:
活跃访次/全部访次
各模块用户活跃度
产品转化率:
核心流程转化率
核心转化步骤流失率
R:用户留存
N日留存计算:统计日期新增的用户或活跃用户,在第N天又来使用的比例。
次日留存率
7日留存率
30日留存率
产品留存率:
核心产品功能留存率
抛出一个疑问:当留存率非常低时,如何利用指标发现问题?
次日留存比较低时,说明用户对我们的产品不感兴趣,或者说我们的产品做得太差
7日留存比较低时,说明用户觉得我们的内容不耐玩,不好玩
30日留存比较低时,说明我们的版本迭代规划做得不够好,没有及时给用户更新内容
R:获取收入
销售额、转化率
R:用户传播
推荐用户数量
推荐用户/全部线索用户
NPS
K因子
口碑指数(百度,谷歌)
②局部
1.产品每一个具体功能的用户体验评估
heart模型:
2.产品每一个具体业务的指标
电商类:
UGC内容类:
游戏类:
平均同时在线人数(ACU: Average concurrent users):即在一定时间段抓取一次数据,以一定周期为期限;周期内的ACU可取时间段的平均数据。[例如:系统每一小时抓取一次数据,全天24小时共24个不同时刻的在线数据,则每天的ACU是这24个数据的平均值(每个公司有每个公司的定义,一般ACU取平均值,若针对某一时刻,则直接在某时刻内直接统计用户数)
最高同时在线人数(PCU:Peak concurrent users)即在一定时间内,抓取最高在线数据。(例如:单天最高在线:系统每小时统计一次数据,全天24小时共24个不同时刻的在线数据,则24个时间段内最高的用户在线数据为PCU)
充值金额(RMB):即在一定周期内充值总金额。
元宝消费金额(RMB):即在一定周期内,玩家在游戏商城中的消费总金额(仔细看,充值金额与元宝消费金额有着明显区别,上者受活动影响,下者受商城道具需求影响。)
每付费用户平均收益(ARPPU: Average Revenue Per Paying User):相似于下载游戏的消费比率,(国内很多人以“ARPU”称呼,个人定义不同),此类数据主要衡量付费用户收益(公式:月总收入/月付费用户数)
平均每活跃用户收益(ARPU: Average Revenue Per User):主要衡量游戏整体贡献收益;毕竟除了付费收益,活跃用户也能产生收益,(一般国内以此数据为核心,各家算法不同)(公式:月总收入/月活跃用户)
平均生命周期:有新增账户在首次进入游戏到最后一次参与游戏的时间天数。比如记录某一个月,这个月里,每个新增用户的生命周期之和/MAU=平均生命周期。
LTV生命周期价值(LTV: Life Time Value):约定一个计算的生命周期值(比如上个月的平均生命周期,或者约定为15日,即这个月有15日登陆记录的账户数),符合这个生命周期条件的账户数中,充值金额的和/条件账户数。
每日注册并登陆的用户数(DNU: Daily New Users):这个言简意赅,就不详谈了,直接从后台抓取即可。
新登用户中只有一次会话的用户(DOSU: Daily One Session Users):这个也很简单,此类数据主要衡量新用户的质量,买量的可以参考一下。
每日登陆过游戏的用户数(DAU: Daily Active Users):直接从字面就能了解了,一般从后台抓取。
七天内登陆过游戏的用户数(WAU: Weekly Active Users):这个还是很好理解,就不废话了,此类数据主要衡量周变化。
30天内登陆过游戏的用户数(MAU: Monthly Active Users):浅显易懂,主要衡量产量的粘性以及用户的稳定性。
四、数据分析中的误区
1.忽略沉默用户
2.过度依赖数据
3.错判因果关系
4.通过数据表达方式欺骗
5.妄谈大数据
五、数据分析方法
从统计学的角度看:
按照难易程度分为:基础统计分析、高级统计分析、数据挖掘方法。
常见的分析方法有如下:
①画像分群:聚合符合某种特定行为/画像的用户,聚类分析
②趋势分析:实时快速了解多维度趋势,便于进行产品、市场迅速迭代
③对比分析:与竞争对手比,与过去的自己/版本比
④交叉分析:多维度交叉分析
⑤漏斗分析:按照已知转化路径,分析每一步骤转化情况
⑥回归分析:预测性的建模技术,研究因变量和自变量之间的关系
⑦聚类分析:物以类聚,人以群分,将相似或距离相近的对象/数据归为一类
⑧相关性分析:对两个或多个具备相关性的变量元素进行分析,从而衡量两个变量因素的相关密切程度
⑨行为事件分析/用户路径分析:探索性了解某组用户的行为轨迹
⑩留存分析:了解行为/行为组与回访之间的关联
⑩①A/B测试:对比不同产品设计/算法对结果的影响
⑩②优化建模:建立预测模型优化商业结果
六、数据分析框架/思维
①AARRR模型
不解释了。
②逻辑分层拆解
七、数据应用的场景
产品设计前:通过数据分析发现问题
产品设计中:辅助决策,判断思路(A/B测试)
产品设计后:数据验证方案
所谓的数据驱动,其实就是一套量化的发现问题和解决问题的流程,在产品设计的重要环节,数据都在发挥着主观臆断无法替代的作用。
八、回归实际,解决重要的三个问题
①数据如何科学的采集?(关于埋点方式的探讨)
目前市面上有的埋点方式主要是三种:
a.可视化/全埋点
所谓全埋点,就是在产品中嵌入一段SDK,做一个统一的埋点,也叫“无埋点”。
优势:
可视化展示宏观指标,满足基本的数据分析需求;技术门槛较低,使用与部署较简单;用户友好性强
缺陷:
只能采集到用户交互数据,自定义的某些属性无法采集;无埋点兼容性有限,同一按钮可能出现不同名称,造成混乱;属于前端采集的方式,有天然的缺陷,如数据采集不全面、传输时效性差、数据可靠性无法保障等。
b.代码埋点
又分为前端代码埋点和后端代码埋点。前端类似全埋点,所不同的是,对于每一个关键行为,都需要调用SDK,将必要的事件名、属性字段写入代码;后端代码埋点则将相关的事件、属性等通过后端模块调用SDK的方式,发送到后台服务器,这种方式更适合安全性要求高、精细化分析的场景,如金融服务。
c.导入辅助工具
还可以采用日志、数据库的方式生成数据,然后对数据进行转换,通过实时或批量工具完成数据的导入。
那么,如何选择合适的采集方式呢?因企而异。
一般三种都是结合起来用的,只不过看全埋点是用第三方现成的,如友盟、神策数据、growthingio等,还是用官方自己搭建数据分析平台,这要根据公司具体业务来定。
②一款产品在什么时期就要开始做埋点工作了?(尤其是早期冷启动产品)
建议在早期就要有数据分析体系搭建的意识,可能暂时还用不上,如果产品验证还不错,公司资源又跟的上,那建议尽早去做。
③数据深度挖掘算法
现在大家都在谈大数据,大数据该怎么做?怎么智能化?有以下几个方向:
a.决策树模型
b.神经网络
c.机器学习
因为涉及的领域太深、太难,此处不做过多分析。
九、扩展:如何培养数据分析能力
①心法层面
1.好奇心
2.求知欲
宽广的胸怀,敢于打破常规和局限。
②基础层面
基础指标:pv、uv、跳出率、转化率、点击数等
学习网站:
http://bluewhale.cc/
书籍:
《统计数据会撒谎》
《深入浅出数据分析》
《谁说菜鸟不会数据分析》
《赤裸裸的统计学》
《深入浅出统计学》
《MySQL必知必会》
《流量的秘密》
《数据之美》
《精益数据分析》
《利用Python进行数据分析》
③对业务足够了解
④重视数据,保持敏感
时刻关注数据,时刻反思优化
我是不二翔叔,欢迎关注我~