数据分析入门(1)

互联网公司数据分析的应用场景

运营:用户运营(用户分类,用户生命周期),活动运营,内容运营,商品运营

产品:产品功能,产品体验,产品调研,用户需求调研

市场:商务合作效果,渠道推广效果,投入产出比

流程

需求分析——数据收集——数据清洗——数据分析——报告撰写——报告分享——投入应用,收集反馈

数据类型

定性数据(一般通过问卷调查获取)

· 分类数据:男生/女生 天气好/坏……

分类数据不能区分大小,也不可以进行算术计算

· 顺序数据:满意度评分,教育水平等级,年龄层……

顺序数据可以区分大小

定量数据(一般通过日志获取)

· 离散型:用户数,消费次数……

可加减,进行频数分析

·连续型:成绩,消费金额……

可算术运算,进行频数分析,集中趋势分析(均值,众数,中位数)&离散程度分析(标准差,方差,最大值,最小值,全距/范围)

数据收集

(1)数据埋点  

UV,PV,用户数,用户停留时间,浏览页面等用户行为数据

(2)第三方数据平台

Growing IO,SimilarWeb, Google Analytics, 国家统计局网站……

(3)问卷调查

线上问卷调查,线下问卷调查 & 电话回访

数据清洗

(1)数据异常表现:空值,波动太大,不同数据源获取的数据相互矛盾

(2)数据异常原因:系统故障 & 人为因素

(3)清洗方法:删除异常值,平均值填充,通过统计计算值填充 & 不同数据源交叉验证

数据分析体系

常用数据分析指标(Key Performance Indicator)

网站分析指标:

UV(unique visitor)  独立访客数

PV  (page view)  网页浏览量

VV (visit view)  访客网站的访问次数,该网站所有页面visit=page1+page2+……

IP( Internet Protocol)   独立IP数

DAU (daily active user)日活跃用户

点击率,转化率,网页停留时间,网站停留时间,跳出率,退出率等

eg:小皮用ADSL拨号上网,今天9am访问了www.universityofwarwick.co.uk下的两个网页,5pm访问了同一个网站下的五个网页,则:

PV=7,UV=1,VV=2,IP=2(ADSL拨号上网每次IP不同)

渠道分析指标:

新增用户数,用户转化率,渠道ROI(return on investment),渠道流量,渠道流量占比

活动效果指标:

活动点击率,活动参与人数,活动转化率,活动ROI

收入指标:

付费人数,转化率,订单数,客单价,GMV,复购频次,毛利率,毛利额

用户类指标:

新增用户,活跃用户,留存用户,回流用户,流失用户

用户价值指标:

用户最近一次下单时间,用户下单频次,用户消费总金额

#####通过需求分析,找到目标,把目标拆解成不同指标(一级指标,二级指标等)####

横向拆解数据体系原则:遵循MECE原则,即互相独立,完全穷尽;同一类型的数据在同一层级

纵向拆解数据体系原则:拆解的时候只能选一条主流程;主流程应该选择大多数用户的操作流程

不同类产品关注常见指标「例子」:

电商类

{GMV=流量*转化率*客单价;毛利额=流量*转化率*客单价*毛利率}

工具/社群类产品

 {活跃用户数=新增活跃用户数+已有活跃用户数

二级:活跃用户数=新访客流量*新用户激活率+已有用户数*已有用户留存率}

游戏类产品

{付费收入=活跃用户数*付费率*ARPU

二级:付费收入=(新活跃用户数+留存用户数)*付费率*ARPU

三级:付费收入=(渠道流量*转化率+老用户*留存率)*付费率*ARPU}

O2O类产品

{订单完成率=已完成订单数/需求订单数

二级:(新用户订单数+老用户订单数)/(新用户需求数+老用户订单数)

常用数据分析框架(数据分析方法论)

1. QQ模型

数量(绝对数):用户数,浏览量,点击量

质量(相对数):留存率,转化率,参与率

eg:某banner活动点击量很高,但参与率低,说明可能活动能吸引用户,但是参与门槛高

2. 用户行为理论

3. 5W2H分析法

4. AARRR模型(“海盗模型”)

5. RFM模型(用户价值模型)

6. 人货场模型

常用数据分析方法

对比分析法,分组分析法,矩阵关联分析,逻辑树分析方法,漏斗分析法




你可能感兴趣的:(数据分析入门(1))