知识来源:接地气学堂1
根据分析目的,用统计学的从数据中寻找信息形成结论。
工作对象
驱动业务:利用数据落地运营方法.具体的运营岗位提供相应的服务。包含,但不限于:提供报告报表、数据赋能、专题分析、数据产品。
数据分析与挖掘的大致关系
数据挖掘是分析的一种方式,统计学/机器学习的方法只是解决分析问题的工具
一般数据分析 | 数据挖掘 | |
---|---|---|
定义 | 分析方法业务模型,评估现状和修正不足 | 分析侧重于数学模型,发现未知的模式 和规律 |
侧重 | 实际的业务知识 | 挖掘技术的落地,完成“采矿”过程 |
技能 | 统计学、数据库、Excel、可视化等 | 过硬的数学功底和编程技术 |
结果 | 需结合业务知识解读统计结果 | 模型或规则 |
工作流程
需求层——数据层——分析层——输出层
基础能力 | 作用 | 说明 | 其他 |
---|---|---|---|
统计学 | |||
概率论 | |||
沟通表达 | |||
思维框架 | |||
业务能力: | 各方业务知识 | ||
电子商务 | |||
用户运营 | |||
商品运营 | |||
工程能力 | |||
数据搜集 | SQL | ||
数据清洗与探索 : | Excel | ||
Python | |||
KETTLE | |||
数据建模 : | Python | ||
数据呈现 : | PPT | ||
BI | |||
Excel |
关于数据工作的概念层出不穷,但万变不离其宗,数据分析思维是解决一切的核心
所谓数据分析赋能业务,可以做的是:
一量化现状,为赋能打下基础
二梳理问题,为赋能方向指路
三展开分析,为赋能优化效率
四监控进度,为赋能保驾护航
五总结经验,为赋能积累成果
真实的产品,是一个广泛的概念,并非是死板的BI+仪表盘。因为,业务使用频率和认可度,是第一位的。很多做数据的同学一提数据产品,就想着搞花里胡哨的仪表盘,很容易让数据产品变成“为做而做”,最后打开率不高,更不指望别人说自己好了。换句话说,只要业务能用起来,数字输出到哪里,炫酷不炫酷,根本没那么重要。
复杂问题是简单问题的叠加
工作:要用数据描述状况。
单指标思路
只用1个指标就能描述清楚状况,比如身高、年龄这种,是没有什么分析方法的,注意描述的维度:时间、角度。
多指标思路
描述很多指标,涉及:重点指标选择,指标展示方式。描述性方法:
要注意
以上都是描述问题的方法,并没有解答问题,比如看到用户流失率75%所以呢?所以75%是好还是坏呢?描述+标准才能对问题做判断。所以才有了下边“是什么”的方法。
工作:“是什么”主指树立数据标准的方法,也包括定位对象(是谁、在哪里)
解决思路:可以纯粹基于数学寻找标准,但实际中更多是基于业务经验,但业务经验也需要数据进行验证才知道是对的错的。因此,产生了“是什么”的两个步骤:探索标准的方法,验证标准的方法:
注意: 有没有用数据找标准,有没有验证过业务部门的标准,是从取数到分析的分水岭。 很多同学觉得自己没有做分析,不知道分析的是什么,核心原因就是手上只有数据没有标准。
比如跑出来一个:本月底销售额3000万,可3000万又怎样呢?不知道。然而渠道部一看到月底销售额3000万,就大喊一声:肯定是华东大区藏了业绩,下个月头他们至少还要吐500万出来!这就是有没有评价标准的差距。所以平时工作中就得养成强烈的标准意识,这样才能进行真正的分析。
工作: “为什么”指探索问题原因。
方法:很难仅通过数据锁定原因,是一个系统的过程,需要做齐量化-探索-假设-检验-总结全套流程,往往要内部数据+外部调研+业务判断+测试,共同努力锁定原因。严格来说,这里不是靠某个分析方法得出的结论,想仅通过数据分析找原因,是相当困难的,这一点切记切记。但是考虑到面试官还是很想听几个方法的名字的,我们可以这么说,找原因的方法可以分作经验推断与算法推断两种:
注意:统计上的相关系数与业务中的相关关系是两码事
定性方法是基于业务经验和业务假设,来推测未来走势,并不全是拍脑袋,因为定性假设选取的场景和参数可以通过分析来获得,并不是完全没有依据。同时,对业务部门而言,定性预测时责权划分非常清晰,每个部门要做到多少业绩一清二楚,反而容易推动执行有两种推测法。
定量的方法又分为基于时间的时间序列法,与基于因果关系的算法两类。比如比如预测店铺销量,如果用时间序列法,则根据过往1-3年销量数据来预测未来的销售数据。如果基于因果关系,则要引入与销售结果相关的变量(多元回归),比如店铺位置、店铺产品线、产品价格、顾客评价、顾客人数等等。
类型 | 问题层次 | 问题描述 | 备注 |
---|---|---|---|
直接解决 | 1.是多少 | 今天直播观看10分钟以上的人数是多少 | 不只是一个数,搭建数据指标体系也算“是多少” |
直接解决 | 2.是什么 | 今天观看10n+人数70万一一不满意啊! | “是什么”的关键是评价标准!找标准也是工作之 |
直接解决 | 3.为什么 | 为啥90%的人都看不到10分钟? | 找原因的方法很复杂,需要配合测试和长期观察 |
直接解决 | 4.会怎样 | 果我做了X工作,观看人数会增加吗? | 做预测的方法也多,很复杂,经常用到算法 |
直接解决 | 5.怎么做 | 上个抽奖,人数增加了,可其他指标降了呀! | 高大上的叫法叫:综合评价问题,常涉及复杂评估 |
间接解决 | 6. 想不想 | 我要不要去签约几个美女主播回来? | 转化为4:列出支持想法的理由,用数据验证/否定 |
间接解决 | 7. 能不能 | 我让美女主播露臼花花的大腿,会被查封不? | 转化为5:(黑箱)数据测试(白箱)收集过往结果 |
间接解决 | 8.会不会 | 我到底该怎么做,才能合理合法的让 | 转化为4:从问题出发找原因/从手段出发找可行性 |
间接解决 | 9.该不该 | 我还是决定签美女,该不该现在干! | 转化为5:(事后)评估效果(算)除证浮绿 |
1 类是用数据描述问题,把问题量化。2345类都需要探索-假设-检验-总结的循环性的过程对常用方法的简单总结。解决后面的问题,通常要先解决前面的。
理想情况:
设定数据指标→数据监控过程→数据预警问题→分析问题→探索对策→进行测试→验证假设→总结经验→更新指标体系循环监控。“大厂经验”,其实只是这套流程运转的比较顺利而已。
注意:
思维方法:临床诊断疾病
基本流程:
理解业务是需求分析的前提。
不理解业务不但无法赋能别人,而是自己需要别人赋能。看不到业务,看不懂业务,不知道业务进展、无法沟通,自然没法把分析逻辑和业务结果联系起来。需要深入一线了解:服务对象、业务流、管理流、数据流、业务现状等。业务的理解程度决定了后续:对需求的理解,分析方法的准确性、能采取的措施建议。
服务对象:谁是我的赋能对象。
刚入行的菜鸟们喜欢笼统的说:业务。满脑子都是“copy模板、模型、公式”。业务并不是一个孤零零的、独立的个人。业务两个字背后,是非常具体的、复杂的维度:
各维度影响
企业 | 行业地位 | 增长速度 | 发展方向 |
---|---|---|---|
行业 | toC | toB | toVC |
部门 | 销售 | 运营 | 产品 |
等级 | 部门总监 | 部门经理 | 小兵 |
动机 | 寻求求助 | 证明自己 | 甩锅 |
要素 | 决定事项 | 事项决定分析 |
---|---|---|
行业+企业 | 数据基础 | 战场 :数据的基础建设、对数据的认知程度、发展方向 |
企业+部门 | 工作职 | 战略:工作定位、流程、人员、相关措施、制度、活动,有哪些历史遗留问题,过往经验 |
部门+等级 | 关注重点 | 战术: 职责KPI/OKR、当前指标表现是什么,哪些分析指标反映了他的问题,有多严重 |
等级+动机 | 具体要求 | 战斗:他希望从数据分析里得到什么结论,数据分析实际上可以帮他解决什么问题,ˇ还有哪些是可以帮上整约 |
问题层次 | 说明 | 举例 |
---|---|---|
战略层 | 做哪个方向 | 我们要抓DAU指标?观看人数?观看次数?这个指标目标多少,要提高多少? |
战术层 | 已经选择了方向,县体做什么事情 | 我们决定了要抓观看时长,尽量让用户观看10分钟以上。那么问题是:我要找更优质的用户呢?还是改进直播体验呢?还是找一些大牛主播呢? |
战斗层 | 已经决定了做什么事,事情做的大小、多少 | 我们决定了签约主播,那么市面上有哪些主播可以签,签哪些游戏的主播?签来要播多少次,要不要搞个对抗赛让主播LoW一把,啥时搞气学 |
等级影响
部门影响
部门 | 部门职责 | 行动方式 | 核心关注点 |
---|---|---|---|
销售部 | 直接对业绩负责,出业绩! | 快速找到方法,然后各个业务线,各个团队复制、复制、复制,执行力最重要 | 这个月业绩有多少,我能不能借力活动作出业绩,如果能,还有没有人没借上东风,我怎么帮没借上东风的人借 |
市场部 | 打辅助,提供活动作为工具 | 需要较长时间筹备(方案、系统、物料、宣传)策略性很重要,策略不对,努力白费 | 活动有没有效?活动有没有效,如果有效,下个月还做不做,如果没效,加码还来得及不? |
供应链 | 做支撑,保障产品供应,维持库存平衡 | 筹备周期非常长(备货、周转、生产排版)且开弓没有回头箭,(生产线一旦启动就不能停需要打提前量 | 预计销量如何,现有库存能维持多久,是否要增加供应 |
动机影响
类型 | 对应部门 | 职责 | 关键 | 创新要求 | 数据要求 | 执行要求 |
---|---|---|---|---|---|---|
策略类 | 战略发展、产品管理、用户运营 | 梦想转为计划 | 部署和节奏 | 2 | 3 | 1 |
创类 | 研发、设计、产品经理、品牌创意 | 创造价值 | 创造力 | 3 | 2 | 2 |
执行类 | 销售、市场推广、媒体、社群、运营 | 只谈干货、钱 | 干!干!干! | 1 | 1 | 3 |
支类性 | 客服、售后、生产、供应、物流 | 支撑前线 | 干 | 1 | 2 | 3 |
业务流程:
数据基本情况:拥有哪些数据,来自哪里,
对象在做什么?分为几步做?得什么结果?数据流是什么?可以采取流程法思考,落实到数据。流程法:业务层上各业务是并行的,流程层上是有先后顺序的
第一步,先梳理流程,
第二步,确定每个步骤当中涉及到的一些业务点,
第三步,根据每一个业务点去梳理量化其中的一些数据。
案例:如何控制商品库存积压成本?
商品生命周期 | 业务流程 | 需求 | 数据需求 |
---|---|---|---|
上架准备 | 商品定位、评级 | 商品定位是否科学,品级是否合理 | 成本、库存 |
预热 | 宣传预售 | 通过预售反馈,预测第一批销里,验证品级合理性 | 预算、库存、广告费用 |
上市 | 走量、补货 | 根据销售变化,预测未来销量判断LTV | 销量、利润 |
热销 | 促销、变现 | 根据销售变化,预测未来销量,预警库存 | 断货率、流失率、转化率 |
稳定 | 控制库存 | 库存管理,活动预测 | 销量、周转率 |
清仓下架 | 尾货处理 | 需要多久清完库存 | 周转、毛利 |
业务痛点:
哪些地方是不满意的,想改善哪些问题。
**决定发力时机的选择。**数据分析项目,最大的敌人是:日常工作。所以,并不是所有事情都适合立项目来做。时机非常重要。往往我们要挑业务部门的以下时机入手:想做创新、想改良现状、新工作两眼一抹黑、遭遇问题不知所措、三板斧砍完不见效
套路经验
想找方案,就要先研究套路。大量数据分析一听“如何做”就怕了,因为我们不做具体业务,站在数据分析角度,关注的不是某个具体idea,而是哪个套路更管用结合数据,找到更好的套路,才是数据分析的作用。这里需要数据分析师对常用的业务套路所有了解。
业务需求
有业务需求时,先不要着急跑数,牢记灵魂三问:
适用层次 | 适用场合 | 投入成本 | 效果 | |
---|---|---|---|---|
临时取数 | 战斗层 | “这个数据老板要,下班以前要搞定 | 看似投入少,需求一多,非常时耗力 | 几乎没有,不会有人注意你 |
报表 | 战略层、战斗层 | 跟踪固定指标,发现问题 | 建指标体系耗时,后续维护简单 | 长期内大家都会看,但几乎没有人说你好 |
专题分析 | 战略层、战术层 | 针对专项问题,寻找办法 | 无论啥时候都費时费力 | 短期内有效 |
数据模型 | 战术层、战斗层 | 适合模型解决的特定问题 | 非常吃数据质量,想实现效果需要业务的配合 | 不是露脸,就是露屁股 |
ABtest | 战斗层 | 有具体业务方案情况下做测试 | 需要大量前期准备,有可能需准备很多个版本,开发压力大 | 工作量大,短期内有效,同意产生依赖 |
数据产品 | 战略层、战术层 | 有经费/人力/时间的话尽量都做成产品,直观,好用 | 非常多经费/人力时间投入 | 需要培养用户习惯 |
病人一般的小病是不需要医生的,同理,当需要分析辅助时一定是业务遇到无法理清的大问题。数据分析师要像医生对待真实的病人3一样。菜鸟确认需求完全依赖于:问业务、套模板;老鸟确认需求:具体情况具体分析带着经验、方案、逻辑……一步步引导业务到数据分析可以解决的问题上。
项目意识
需要复杂的问题该立项做尽量立项做,不能立项做的也要有项目思维:项目目标、工作范围、输出产物、交付时间。有多大锅下多少米,如果数据质量差、人手不足、缺乏基础,缺乏经验、就沉住气一步步做,不指望一次解决所有问题。
投入/时间 | 长 | 短 |
---|---|---|
多 | 精致工程:合理规划+按部就班+细致工作+及时回馈 | 突击工程:金钱换时间、人多力量大、实用第一 |
| 少 | 鸡肋工程:有空就搞搞 | 应急工程:抓冬瓜丢芝麻
问题题眼
题眼是指对解决最重要的影响因素,只有一个,由实际情况决定。一般来说,用户出现问题时:直接面向用户的商品是关键因素,为什么是这个商品不是别的,为什么观察这个角度的数据?
需要进行复杂分析的往往是要解决5个问题中的后两问,需要先解决前面的问题,是多少,是什么,为什么
构建分析框架
业务冋题不直接等于数据问题,要做把业务问题转化为数据逻辑:明确分析思路,数据需求。判断问题的真伪、大小,问题的背后可能有,商品、产品、用户群、竞争对手等各反面的问题,要从根据业务逻辑/分析逻辑建立一个问题逻辑树,用于系统诊断:出问题的位置。
构建分析假设,
问题逻辑树展示的问题较为琐碎,一个个研究不现实,要根据问题的主语进行归纳设计假设
案例:用户是否喜欢平台、用户是否喜欢直播、用户是否喜欢游戏,可以合并为用户质量问题,同理归纳为产品质量、服务质量等有限的几大核心。针对几大核心提出假设:1. 用户问题:用户本身质量不高,投放不准 2. 推广流程问题:推广环节多(比如先拉群,听直播再推付费课),效率低 ……
寻找数据,验证假设推导出核心问题
这是数据分析师最能发挥作用的地方,因为能客观看待问题,避免本位主义,需要:
解决问题的层级
业务部门解决问题有一个从无到有的过程,数据分析辅助要根据业务部门的基础有层级顺序的分层级输出。因此得先看业务部门到哪一步卡住了,不做跳跃层级的事,沉住气一步步来,最后结果才容易得到认可才好发力:
控制好业务方期望
除了期待之外,一切都有边界。现实中每个人都受岗位、部门、等级的限制,资源有限,因此可用的手段往往是有限的。这样是个利好:我们筛选方法的范围不是无限广,而是在有限的选项内做选择。业务们的痛点,很多不是数据能解决的。问题分析完之后,要及时与业务方沟通预期结果,要注意留有边界,以防项目死于期待太高
不要依赖业务
确认需求,不是让你直接问业务:“你们想分析点啥”。这种问法太被动,又回到叼飞盘老路上。而且往往业务会回答的你摸不着脑袋:
不死硬套模板
实际问题是复杂场景,不是大喊一句“我是互联网AARRR思维”就能搞掂的。指望套模板结局就是死翘翘。况且经过这几年的历练,很多运营、产品经理、策划都学会了基础数据分析概念,这时候还抱着充满“SOWT、PEST、5w2h”一类空洞口号ppt模板,数据分析师就等着下岗吧。具体问题、具体分析,怎么强调都不为过。
例如:曾是toC互联网企业,现在要发力toB,完全不知道怎么和客户打交道;名为互联网产品,可服务对象是实体老板,销售还在用最原始的电话外呼;
基本思路理清楚、定好交付时间、排工作优先级、安排项目组成员。然后就可以按计划下地干活。具体内容和分析议题有关,这里无法展开讲的。当有工作方式需要注意:
对实际价值而言,只有分析思路和方法是没有用的,更重要的环节是:落地。落地方法这一步,得看具体的方法是什么,再具体执行,这里大部分是具体的业务操作,和数据关系不大。但在具体落地的时候会遇到:上同下反4的现象。问题的本质是没有对数据的作用沟通到位:数据不是祖传的救命仙丹,它不能一吃就灵。
循序渐进,威逼利诱。
数据分析的结果不一定就正确,类似于临床的初诊,治疗性诊断、需要迭代才能确保有效。而且对销售业绩而言,促销才是救命仙丹,一降价肯定有销量,但救命仙丹其实都是汞、硝、硫磺这种剧毒玩意,嗑多了人就挂了。这也是数据产品真正难题,避免问题拖到了需要嗑仙丹的地步。
落地目标结合业务动作
方法要能落地,这是首要。数据分析驱动业务是正确的废话,太空、太虚。想要让数据分析成果在一个部门里落地生根,要从’太理论‘到实用:
监控进度,接受反馈
方案实施 作为数据分析,能做的是:监控进度,保障按计划执行,个冋题有一个具体针对性意见。每个意见,先看有多少人使用,再看接受后指标改善。
在执行掉链子的时候提示问题。比如:
数据产出必须固定成产品/服务,坚决不能让它躺在ppt或者excel里
区分对待服务对象
找到好队友。数据产品知识只是一个开始,就像医生开的药,效果往往是缓慢的提升,甚至需要治疗式诊断而且没有人的配合很难独立产生价值,大部分企业的数据分析部门,没有独立经费和工作团队,需要通过服务业务部门实现分析成功的落地。这就要求我们,有良好的沟通能力及敏锐的识人眼:
态度/业绩 | 好 | 差 |
---|---|---|
好 | 新兵锐将 | 虾兵蟹将 |
差 | 骄兵悍将 | 疲兵倦将 |
小成绩,再争取更大的机会
注意影响落地的因素:
数据赋能、数据产品……说的好听,最后赋成了没有,赋成啥样,要拿数据说话做检验。不用说,这又是数据分析老本行工作。
汇报工作
汇报的时候,除了项目流程也要考虑目标听众的身份、目的、结合项目目标做个性化汇报。这样才能取得好效果。基于听众的思考,使得即使同样的数据,同样的结论,也能有不同的表达形式,最后抓住听众眼球,
菜鸟数据分析师眼中 | 老鸟数据分析师眼中 |
---|---|
分析背景 | 谁在听? |
分析目的 | 他关心什么? |
指标含义 | 数据怎么能帮助他? |
数据来源 | 什么表达他能听明白 |
数据清洗 | |
建模过程 | |
分析结论 | |
业务建议 |
问题:某短视频平台,游戏直播业务的日活用户1000万左右,但90%观看时间不足10分钟,运营希望尽可能多的让用户观看10分钟以上,请分析下该干哪些事情。
定义:
指标体系 = 指标 +结构化
数据指标体系三大件
主指标、框架、标准
设计思维
自顶向下设计,再自下而上回归。指标体系要服务于业务但,在具体的业务人员脑子里装的是不是数据库里的表结构,而是一个个具体的问题。他们眼中的是问题结构,这就是为什么要建立问题逻辑树的原因。业务的每个核心的问题,可根据问题逻辑树,分解为背后的小问题,而小问题有对应的标签和数据,这就是指标体系。
流程
指标体系的建立需要对每一个业务单元进行:1.打标签:用户、主播、产品的标签;2.标签分类;3.基于分类的分层与数据监控4.评估迭代
意义
基于指标体系的诊断,只解决战术问题:是什么、是多少。不解决战斗层面:为什么,会怎样,怎么做,未来怎么干得有更针对性的专题分析才行。
为什么需要数据指标?
分析为什么需要数据指标体系?
指标体系是分析思路一部分
数据分析开工前,只有建立指标体系,后面再进行数据获取、处理、分析、可视化的时候,才能有的放矢,才能按图索骥.
一个问题,往往有很多方面。理清楚问题,就像吊车吊起一块楼板,需要一组提手。只用一个指标不能充分说明问题,需要有一组逻辑的数据指标来细化。好的数据指标体系,能让业务人员看一眼就知道该在哪里干,该往什么方向干,非常好用
可以对现象之间的相互联系,做出有序且深入的分析。
一个指标往往可以分成好多维度,增加维度,能够避免平均数陷阱。核心指标的波动往往是因为某一种维度的影响而产生的波动,所以我们要监控核心指标,本质上还是说要去监控这个影响维度上的核心指标。
工具性强
指标体系是针对核心对象建立的,有了指标体系但对象出现时能快速定位问题,展开分析而不是每次都重头再来。
OLAP系统
Online analytical processing ,联机分析处理,核心是一个OLAP多维数据集
定义:
用来评价业务的最核心的指标。主指标是由问题级别决定的一个相对值,小问题的主指标是大问题的子指标。
运营分工 | 工作职责 | 主要指标 | 感性、理性 | 数据作用 | 备注 |
---|---|---|---|---|---|
渠道运营 | 选择渠道投放资源,拉新搞流量 | 投放数量、用户转化、销售转化、投放RoI | 理性 | 中 | 讲究策略性,需要观察数据合理分配费用,改善转化。具体则需要分渠道 |
用户运营 | 通过奖励、积分、会员等维护用户新增、活跃、留存。 | AARRR(新增、活跃、留存、转化、转介绍) | 理性 | 高 | 特别讲究策略性,AARRR各指标很难平衡 |
内容运营 | 内容创作用于内外部媒体投放:设计视频、文案、广告、供宣传使用,通过微信、微博、公众号、抖音、站内信等平台影响用户 | 内容全网点击数、转化数、涨粉数 | 感性 | 低 | 做内容特别依赖创作者的灵感和创意,数字只是结果 |
商品运营 | 销售商品的进销存管理 | 上架、进货、销量、库存、利润、周转 | 理性 | 高 | 前期有感性的部分,后期都有周转和销量来定位 |
活动运营 | 组织活动,提升用户、产品、商品指标 | 活动目标、参与人数、达标人数、活动ROI | 高 | 高 | 数据为策略提供依据,但具体到每个活动力,影响因素很多:宣传语、宣传视频、活动创意、代言明星等。 |
新媒体运营 | 两微一抖等平台日常运作 | 平台粉丝数、内容点击、转发、转化 | 中 | 中 | |
产品运营 | 品体验优化、升级、改版需求 | 产品路径、用户使用率、跳出停留的 | 中 | 中 |
建立
主指标要素:
注意:
子指标是由分析框架决定,而构建分析框架的核心是:思考维度。自指标是对大方向进一步问题,使问题更加准确和具有可操作性。分层拆解要有强烈的逻辑关联,,必须清楚了解他们是如何影响核心指标的,每一层的指标只能代表一个方向,不能有相关性,
好的思考维度:
分类维度本身无对错,但有好用/不好用之分。不好用的分类雏度,数据切得很细,看完也没啥想法;好用的分类维度,可以让人一眼看到自己可以控制的地方有没有问题。
例如:
核心是按照业务管理方式来拆解:
有很多维度都能当分类维度,选用哪些,完全看业务上能从什么角度管理问题。并非所有的分类的维度都有意义!每个部门能做的事情很有限,优先按他们可以做事情的维度进行拆分,这样看完更容易指向:我该干x事情。
比如:销售金额,既能以分公司为单位进行指标拆解,也能以用户为单位进行。具体怎么看,要看业务能怎么管这件事。比如销售一般按区域管理,那就按分公司拆。市场一般按用户管,就按用户拆。总之,基于业务最重要。
常见的业务管理逻辑:
案例
像B2B业务,大里过程要线下销售跟进,很难记录,但即使如此,只要有有线索入库时间,那至少可以算四个指标:
1.线索数(所有销售起点,直接反应营销推广质量)
2.成单率(签约/线索,直接反应销售质量)
3.成单时间(从线索入库到签约时间,反应跟进效率,传说中魔法数字)
4.成单数(就是常说的:业绩数据,只是签约已经是最后一步了)
找到了主指标,就得为它建立配套的判断标准,这样才能解读数据含义。参照物的选择,本身是个复杂的分析过程,需要做深入的分析。常见的有四类:
指标体系诊断方法:
汇报动机分为类:
你问我答:有明确的问题要解答
弄回答是一个数字,还是一件事。这时候不是写的报告没人看,而是被人各种挑刺。
即席查询:回答即时的问题:是多少,是什么
多维分析:在多维度中钻取,发现问题所在**,回答是什么**
预报:回答会怎样,是最热门的分析应用之一,预测型建模预测未来是多少
优化:回答怎么做,
我说你听:汇报情况,需要从常规数据中解读
做出来没人看,就是那些最消耗体力,却最不受待见的
标准报表:报告是多少。销售/产品/运营日报、周报、月报、季报、半年报.它们一般是定期生成,用来回答在某个特定的领域发生了什么。从某种程度上来说它们是有用的,但无法用于制定长期决策。
警报:报告是什么。警报可以业务知道什么时候出了问题,并当问题再次出现时及时告知。警报可以通过电子邮件、RSS订阅、评分卡或仪表盘上的红色信号灯来展示。
统计分析:报告:为什么。在历史数据中进行统计并总结规律。
报告分类
专题:单一性,深入性针对某一问题
采用:Word
综合:全面,联系性
采用:PPT
日常:进度性,规范性,日常性,时效性
采用:Excel
例如:日报
报告几乎是数据分析的最后一步,更多功夫是在报告之前要做好:
初级报告
常常是领导或业务部门随口要个数。这时候没有分类维度,只是单一指标,因此只要区分清楚时间状态,就能解答好。案例:
请大家看上图,作答:
昨天的销售业绩是多少
是多少-单维度:一问一答,正面回答,简单清晰。
答1:昨天的销售业绩是1000万
明天的销售业绩是多少
会怎样:就得讲清楚:预测方法、预测依据、预测结果。
明天,是还没有发生的,因此是个预测值。涉及预测,
答:根据上周规律来看,明天预计1200万,比今天多20%。
今天的销售业绩是多少
3点前的是实际值,3点后的是预测值。所以回答的时候要区分状态,答:截止下午3点,实际值是700万,按趋势推算,预计1400万。
高级报告
在数据分析领域,没有高级的方法,只有高难度的问题。问题本身含糊不清,就一下把报告的难度从初级提到高级了。和中级报告的最大区别是:中级报告是基于数据谈问题,而以高级报连基础的事实、数据都没有。这种情况下要牢记:先问是不是,再问为什么。
我们的产品体验有什么问题?
先回答:1. 用户体验的考核指标是XXX. 判断好和差的标准是(上月、去年同月、KPI指标……)3. 和标准对比,差的程度是(不存在,轻,中,重)4.如果问题不存在,干脆就不答了5.最后回答:这个(轻,中,重)级别的差,是因为……
为什么我的领导会听到顾客不满意的抱怨
套路也是一样的。只不过问题3更不靠谱要先落实情况,要先明确对象、问题、事实、数据指标,再树标准,再分析再后续分析:
1.我的领导是谁2. 我的领导在什么时间、地点、以什么方式3. 听到了哪一个用户,关于什么问题的抱怨
说大家关心的话,减少毫无意义的BB
分析工作中残酷的真相是:数据是很重要,很多人是需要每天看数据,但数据只是他们工作的一小部分。因此大部分时候,看就看了,也不会特别当成一回事。主动汇报,想让人听进去,得抓
四个场景。
对症下药的报告方式
To销售部
首先要清晰:销售部关心的是业绩,活动什么的只是业绩一小部分。
To市场部
首先要清晰:市场部关心的是活动,业绩什么的只是活动带来的结果。所以汇报给市场部,
To供应链
首先,供应链关心的不是业绩本身,而是业绩对库存/生产的影响,所以同样的业绩数据,给供应链看,可能就是完全不同的样子
案例:没用的报告
1. 男女比例4:6
2. 30岁以上占比40%
3. 平均年消费500元
4. 活跃1个月以上用户55%
一份数据分析报告由以下几个部分组成,总结过去得失,原因得失是什么,建议怎么改进。
总:标题、目录、前言
分:对比和细分贯穿报告,还有过程与结果。
各个行业都有自己成熟的分析方法和思路体系,首先我们需要懂运营和行业。按照行业的运营要素去写。
总:结论,建议,附录
标题是一份报告的文眼,是全篇报告最浓缩的精华。好的标题让读者能毫无偏差地理解这篇分析报告的主要目的,有时可以直接在标题中加入部分或者关键性结论达到直达文意的效果。
在标题的命名过程中,现在有一份关于数据分析师招聘和薪酬方面的一份报告,你可以:
直接在标题中放上报告的结论,例如《数据分析师在人工智能大环境下需求直线上升》
提出分析报告的研究问题,例如《数据分析师的职业规划在哪里》
中规中矩地写上研究的主题,例如《数据分析师的招聘研究》
结构清晰,可按照运营分析的思路。论提现数据分析报告的整体架构
前言部分就和写论文时候的Abstract类似:
看你报告的人,不一定知道你为什么要做分析。比如你们部门的报告,公司老板要一份。
略微阐述现状或者存在的问题
通过这次分析需要解决什么问题
运用了什么分析思路,分析方法和模型(可以在目录中展示)
给出总结性的结论或者效果
给出数据来源,和时效性
如果是引用外部数据,引用多个数据源,需要标注数据来源统计口径:统计的时间段,所遵循的统计标注
原则:
谨慎性
逻辑性强,架构清晰
建议和论证一定要严谨合理,分析思路的框架,一定要显而易。
证实可靠:反复核实数据、计算、分析方法;用实际情况交叉验证。一次出错就会失去信任。对于数据不能用可能两个字回答。
结论明确
最好一个分析模块只给出一个和主题关联最强的分析结论,避免干扰
共识优先
图表>表格>文字
图像:PPT中的图形一般只能来自EXCEL,来自python\spss等。通过专业软件 做的图表,不适合给非专业认识看‘例如方差。
文字和陈述:需要把统计学语言,翻译为一般人可以看懂的语言,在写报告的时候,把分析过程略去
术语:使用的的名词需要根据各业务通用术语,避免口水话:
活儿多分枝细
运营是个大工作,里边的分支非常多。产品辅助:出产品设计、观察产品效果;开发辅助:把产品需求做出来,维护产品运行;而运营是:除了以上两个事以外所有事都得干。小公司的运营人少,就几个兄弟上天入地,下海捉憋,把所有事都干了。大公司运营会有略清晰的分工和晋升线路。
本质是辅助
从本质上看,运营是个辅助性工作。理论上,如果产品力足够强大,商品天下无敌,那根本没运营啥事。可大部分产品\商品,同质化竞争严重,只能靠差异化的运营手段。因此需要运营打辅助,通过用户激励、促销活动、内容传播、商品运作等等手段,来保持用户的新鲜感,促进用户持续活跃和付费。俗话说:“产品不够,运营凑”就是这个意思。
自带具体指标
通过指标体系可以看到,运营会特别在意数据,几乎所有工作都是围绕数据工作,都是在“自然增长率”之上做叠加。单独看每一类运营,都有一套自己的指标体系。此外非理性的运营种类工作中还有很多感性、情绪、创意,例如内容运营,对数据的依赖程度较低。如果数据运营把重点放在数据上,那最终就是沦为跑数机器的命。
运营分工 | 工作职责 | 主要指标 | 感性、理性 | 数据作用 | 备注 |
---|---|---|---|---|---|
渠道运营 | 选择渠道投放资源,拉新搞流量 | 投放数量、用户转化、销售转化、投放RoI | 理性 | 中 | 讲究策略性,需要观察数据合理分配费用,改善转化。具体则需要分渠道 |
用户运营 | 通过奖励、积分、会员等维护用户新增、活跃、留存。 | AARRR(新增、活跃、留存、转化、转介绍) | 理性 | 高 | 特别讲究策略性,AARRR各指标很难平衡 |
内容运营 | 内容创作用于内外部媒体投放:设计视频、文案、广告、供宣传使用,通过微信、微博、公众号、抖音、站内信等平台影响用户 | 内容全网点击数、转化数、涨粉数 | 感性 | 低 | 做内容特别依赖创作者的灵感和创意,数字只是结果 |
商品运营 | 销售商品的进销存管理 | 上架、进货、销量、库存、利润、周转 | 理性 | 高 | 前期有感性的部分,后期都有周转和销量来定位 |
活动运营 | 组织活动,提升用户、产品、商品指标 | 活动目标、参与人数、达标人数、活动ROI | 高 | 高 | 数据为策略提供依据,但具体到每个活动力,影响因素很多:宣传语、宣传视频、活动创意、代言明星等。 |
新媒体运营 | 两微一抖等平台日常运作 | 平台粉丝数、内容点击、转发、转化 | 中 | 中 | |
产品运营 | 品体验优化、升级、改版需求 | 产品路径、用户使用率、跳出停留的 | 中 | 中 |
对费用的依赖不同
运营分类 | 缺钱程度 | 用钱说明 |
---|---|---|
内容运营 | 低 | 一个天才写手胜过千万刷阅读量的钱 |
商品运营 | 中 | 需要大量钱采购商品,维持库存,但一般企业直接将商品成本计入日常销售成本,不会单独拨钱,都是走流程 |
活动运营 | 中 | 看活动规模、投入力度,往往是大有大的做法,小有小的做法 |
渠道运营 | 高 | 非常缺钱。流量为王的年代,推广渠道都是大爷,拿一分钱干一分钱活 |
用户运营 | 高 | 无数的补贴大战、红包大战、优惠券大战告诉我们:用户运营都是钱烧出来的。 |
部门间天然冲突
运营各自看数据,看似科学,实则带着原罪:公司流程越长运营工作越需要相互配合,可各个部门的小团伙利益是天然冲突的,各自考核数据互相甩锅的可能性越大。例如:
不需要太多创新
运营之所以喜欢说迭代,首先是因为运营几乎都有方法库:有大量的基础套路、模板、案例可以参照,完全不需要从头做起。所以不需要用“创新、设计、创造”这种词。例如:运营最喜欢说的AARRR,其实每个方面,都有大堆套路.
其次是随着环境变化、企业规模扩大,即使套路总不能一杆子捅到底,总会随着时间变化有些变化,但其实大部分的骨架和逻辑不咋变,100%创新才是异类。这种变化可以分为五个等级(如下图已优惠券设置为例):
运营工作是一个循环往复的过程。
五个等级的创新变化 ,会按照流程循环:了解现状 →发现问题 →寻找方法 →落实措施 →观察结果 →新现状 。通过监控数据发现问题,之后在方法库里寻找方法,看看是直接叠加几条规则,还是改个参数,还是改个形式。
天然痛点
增长需要投入和创新,而投入需要平衡,创新也会过时,成本永远比效果跑得快,复杂的市场造就了纠结的运营。以用户运营为案例:
菜鸟眼中运营数据分析无非(是滴,外行很喜欢用无非这俩字)就是AARRR与漏斗模型,还喜欢提用户画像,而实际这上都是描述性统计,告诉的是一个结果。这些数据需求只要做了报表就能固定。但运营真正痛点,并不是:不知道结果是啥样,而是:结果就这样了,我搞来搞去领导都不满意,咋办呀!
本质是运营。真正价值不是拿来当跑数机,而是建立一套从整体目标出发的数据考核机制统一协调各部门的:钱、时间、责任,既能让各部门跳出小圈子,达成共识目标,又能让各部门落实方法、跟踪进度,反馈问题,共同为“增长”服务的办法。
第一步:共识整体目标,制定整体战略。
各个运营小组,共识年度大部门整体目标(比如DAU、转化率、销售金额等),并且选择落地大目标的战术,把大目标分解到各个月。
注意分解方法可以有:阶梯增长型:不指望爆款,毎个月稳步推进;新品引导型:指望新版本推岀/爆款引入,围绕一个重点俽;重点突破型:指望关键节点(68、双十一)引爆销量,平时做辅助。选择策略关键看业务上有没有做好相关准备,比如是否有足够的持续投入资源,比如爆款是否真的指望的,真的够爆。以及万一没有爆,第二手准备是什么。
第二步:设定阶段性重点,各小组分配任务。
从上自下,在凊晰整体目标的情况下进行分解,越落地,越有任务主次之分,执行起来各自任务很凊晰,也便于选执行
比如上图,大方向是求转化,实现盈利,具体策略是活动拉动,因道、商品、活动运营要抗大旗。也有可能是追求增长方向,渠道、用户运营扛大旗。
第三步:分解阶段性指标,各部门执行、监测、反馈。
这一步就是常规运营数据指标的监控过程,不再赘述了。有了前两步,每阶段的运营工作就有了清晰的主任务,就不用纠结在“为啥短期类活跃率降了”“到底自然增长该写多少合适”“又有几个客户投诉很激烈”——整体目标达成就好。细节问题,可以在各小组自己复盘的时候,再找改进点
第四步:监控执行进度,从下向上检讨效果。
为了避免甩锅,效果没达到使用检讨三原则:在执行到位前,不质疑策略;在投入可调时,不修订策略;在策略失效前,不质疑方向。所有人尽全力完成,
活动目标是KPI指标, KPI分解法
KPI分解法往往用于销售额、利润、新增用户数等可累加的,直接结果类指标(不太适用于比例、比率类指标)。常见的做法是:先定全年整体目标,提升观之后按过往规律,按月份区域等比例分解下去,落实到每个月。(注意下图中,因为春节原因,1、2月份手动调整,这种方法适合季节性规律强的业务入援地气字)
活动目标是KPI的过程指标,KPI倒推法
KPI反推法往往用于活跃人数、注册人数等过程类指标或者转化率、ⅥP占比等比例类指标。常见的做法是:假设一个固定转化率,比如活跃用户付费转化是10%,人均付费200,那为了拿到1亿销量额,饉推,需要至少活跃用户超过500,且转化率不低于10%这种假设看和复杂,但实际上,运营指标是有波动范围、季节规律的,有历史值可参考。
活动目标是KPI关联指标,KPI场景法
KPI场景法适用于与KP直接关联小,但业务逻辑上很重要的指标。比如满意度、市场知名度、铺货率等等。这些指标通常不直接和KPI关联,但是满意度太低,知名度不够,铺货速度太慢,就是会让用户觉得你的产品不行,不想买。在数据上,往往呈现拐点效应如左图,低于某个值后迅速下跌)或前后效应(如右图,得一前一后才有快速增长趋势)在设目标的时候,常常设成:不低于x数值,或者在X日达到X数值
先回答和钱有关的
与钱有关的通常是战略方向性的问题,因此数据化运营中,从一开始制定共识目标,到后面各运营部门都应该厘清与钱有关的问题。每一类业务在各个阶段,规模、收益需要量化,才能精细化运营。例如:1. 公司发现目标是(行业第一?营收破100亿?)2. 基于此目标,需要新用户XX万,老活跃用户维持在XX水平3. 基于新用户数,按目前市场价,渠道成本为XXX亿4. 基于目前措施,老用户维护成本为XXX亿 5. 以上目标,通过阶段性大促完成x%,日常渠道/用户投入X%
发现问题是重点
在运营的五步循环中发现冋题环节是最混乱的,也是最需要数据分析支持的。明确除了责任的划分,最终落实的问题点会直接影响决策!例如:用户活跃率低了,到底是因为新人进来就出了问题,还是后续运营没做好,还是对手发力了。
了解现在和观察效果是数据分析的日常工作。报表类工具能够搞定
找到运营的痛点,进行辅助分析
如果事前没有定目标,一定要事后补救的话, 牢记:核心不是什么自然增长率,而是“业务到底需要把指标做成什么样子”。特别是整体目标已经扑街的情况下,事后再纠结自然增长率,往往会沦为甩锅大战。这时候可以分三步做
做数据分析的,要对业务常存敬畏之心,不然光空口白话,会被人笑话的。提建议很难,总觉得提的不够细,其实主要是思考的不够细导致的。如果一上来只有一根曲线,没有走势分析,没有结构分析,没有标杆,肯定建议也细不下去。甚至连“要不要搞高”这么简单地建议都会提的毫无依据,很容易被挑战。
下图是某个电商一周销售金额走势(具体数据都差不多,总之曲线长这样),问:数据反映什么问题,怎么提运营建议?
“要搞高”三个字说起来轻松,可做起来一堆问题:为什么非要搞高?要搞到多高才算高?市场搞高还是销售搞高?用什么型号的产品搞高?啥时候开始搞到啥时候?
用剥洋葱的方法,层层深入,每一步都基于之前获得共识的判断,每一层都是数据分析可以解释的。这样能非常有效的助力业务思考,也不容易被推翻。
从最简单的:“是什么”这个问题
判断问题是否存在。为什么要搞高是最初的判断,也是最重要的判断。判断错误会把整个方向带歪,搞得大家兴师动众劳而无功,所以一定要慎重。
前提是有标准:判定这个数是低。我们得综合趋势、品类周期性、任务目标,综合下结论。至于数值代表的好坏需要深入分析
再问‘是多少’的问题?
问题存在则需要,就要确定有问题的严重性,基于此才能制定目标要搞多高。
此时数据分析可以:事后KPI考核。
很多人会说:不是越高越好吗?显然不是!应该是:在投入一定的情况下,越高越好。你的商品主管、用户运营、产品经理、网站开发在短期内的投入能力都是有限的,因此得定个合理的小目标:
再问是哪里搞出来的问题
如何解决问题,想提有用的建议,得先明确是提给谁的。这就需要确定出问题的位置,确定出问题的地方,也就能找到干活的人。要分析为什么低?是哪里出了问题?利用分析思路拆解问题,具体到可执行单位。
例如:产品部交易平台出现了bug、市场部竞争对手有动作、商品部产品断货、
再问能怎么整这个问题
“怎么做”是不能直接从数据层面推导,而且不同部门可以干的事是有区别的,要业务的专业判断。数据可以做的是, 1.上次出现类似情况,是如何处理的;2.常规措施,促销、新品、用户活动,大概投入产出多少。
再问这次可以选哪个手段
到底用什么手段,用多少投入。之后才是细节:具体哪天上什么产品,优惠力度是多少,发券面向多少人……在更细节层面,比如券面额,活动形式上,可能还得配合一些ABtest才能得到最后结果。
只会喊:疼疼疼的病人还不是最讨厌的,起码他有治病的意愿,还能沟通。不配的病人5才是最棘手的:
1. 经验主义:老夫从业20年,不符合我的感觉的都是错的!
2. 拒绝面对:谁说我做的不好!我不做业绩更差/全行业都不好!
3. 拒绝投入:项目上线要快,所以埋点就省了吧/数据治理太麻烦,业务要快!不搞了!
4. 篡改数据:人为刷流量、刷阅读/活动规则留薅羊毛的空间/改目标、参照组
注意:
这已经不是分析思路的问题了。现在的问题是,这些人胡搅蛮缠,试图甩锅。用理性、正常的逻辑和他们无法沟通。这时候需要的是对付敌人的手段。具体来说,是如何推进项目的战术。所以真遇到这些人,请不要怀疑自己的思路出问题,而是看怎么趋利避害,争取一个好结果,至少不白白背锅。
堵住借口:找借口并不能解决问题,因此先把各种逃跑路线堵上,集中精力想能干点啥。
往往借口产生于:宏观因素、外部因素、队友因素。所以在这里,关键是证伪。只要能推翻他们的逃跑借口就行。证伪最好用的办法就是举例法,同样是下雨,为什么别人就抗的住。同样是流量难搞,为啥别的业务线能持续增长?
找到症结:在一堆影响因素里,从大到小,从粗到细,先搞大问题
数据分析喜欢的复杂问题往往是,数据完美,含义清晰,静静躺在excel表里等着被建模,然而这也是企业真实的经营场景,负责问题同时存在以下多种问题:
案例中:有了成套配套,整个流程才跑的顺:会员到店以后出示微信卡包,亮明身份;店员点击使用果盘权益,扫条码果盘出库,端给会员吃。各个流程都有数据记录,这个权益才能真正落到会员身上。不然少了环节,就会产生灰色账目。
基于画像我们可以进行精细化的运营,通过数据层的“事实标签”,在算法层进行计算,打上“模型标签”的分类结果,最后指导业务层,得出“预测标签”
没有经过加工的事实标签,比如用户性别、年龄、消费金额这些,是很少具备指导意义的。真正有指导意义的是经过数据检验的:二级、三级综合标签,比如“兴趣”“爱好”标签,很难直接获得,需要通过复杂的分析过程。
接地
设计唯一标识
用户唯一标识是整个用户画像的基础,串联用户的所有行为。
例如:用户名、注册手机号、联系人手机号、邮箱、设备号、CookieID 等
给用户打标签:
数据层,建立事实标签:指的是用户消费行为里的标签,作为数据客观的记录
基础属性标签 | 性别、年龄、地域、收入、学历、职业、渠道、兴趣爱好、设备和网络 |
---|---|
消费习惯标签 | 付费程度、消费品类、购买意向、是否对促销敏感、投诉次数购买次数、优惠券使用频率、 |
行为习惯标签 | 时间段、频次、时长、访问路径、支付渠道 |
内容分析 | 停留时间长、浏览次数,类别,比如,金融、娱乐、教育、体育、时尚、科技等。 |
数学建模
算法层,模型标签:透过这些行为算出的用户建模,作为用户画像的分类标识。挖掘海量数据进行标签化,来得到精准的用户画像。挖掘时,需要根据场景进行用户分类,并对比各类用户与总体间的差异,这样才能保证分析结果的可信性和适用性,而TGI指数就是很好的对比指标。
基础属性标签 | 用户关联关系、渠道偏好、用户类型:电子商务类、交友、游戏 |
---|---|
消费习惯标签 | 购买偏好、满意度、支付偏好、优惠券偏好、RFM标签 |
行为习惯标签 | 活跃度、、 |
内容分析 | 用户兴趣、 |
划分业务价值
业务层,预测标签:指的是业务层指的是获客、粘客、留客的手段,作为业务关联的结果。从用户生命周期的三个阶段来划分业务价值
获客 | 获客预测:如何进行拉新,通过更精准的营销获取客户。 |
---|---|
粘客 | GMV预测、个性化推荐,搜索排序,场景运营等 |
留客 | 流失率预测,分析关键节点降低流失率。 |
B2B业务本身特点:
一线!!
基本画像
B2C业务 | B2B业务 | |
---|---|---|
用户名称 | ID | 企业名 |
基本特征自 | 自然属性为主:性别、年齡、地区 | 经营属性为主:行业,行业排名,企业规模,发展速度 |
用户角色 | 自然人 | 审批者(各部门大佬)、采购者(采购部经理、主管、职员)、需求者(需求部门经理、主管、职员)、使用者(各种角色) |
用户消费行为 | AAARR | 售前动作为主:需求发起,沟通,演示,评标,中标结果 |
用户互动行为 | 在线点击、线下到店 | 采购行为(多少次进度,每次进度到哪一步),沟通内容(咨询人,咨询问题,应对案,后续反馈)使用行为(使用人次,使用建议) |
数据的质量最终决定了数据分析的准确性 现实生活中,数据并非完美的, 需要进行清洗才能进行后面 的数据分析 。常规数据分析、数据挖掘开始工作前都要:明确数据情况、统一数据格式、
错误数据的来源:人为失误、历史局限、刻意隐瞒、特定业务操作,数据采集问题,数据同步问题。
内容:
对于数据的探索,是基于业务规则和分析需求。是否符合业务规范,是否能满足数据分析的要求。除下表之外还需要注意表外的要求:数据来源、记录时间、内容准确性(交叉验证)。
探索内容 | 字段 | 记录 | 提示 |
---|---|---|---|
含义 | 具体定义 | ||
数量 | 合理的记录数 | ||
缺失 | 缺失哪些字段 | ||
范围 | 数值范围、文本内容 | 离群值、异常值的数量、大小 | |
唯一性 | 是否具有唯一性 | 是否符合字段要求:完全重复行/部分重复 | |
非空性 | 是否为可以为空 | 是否符合字段要求 | |
默认值 | 是否存在默认值填充 | ||
数据类别 | 数值/文本 | 是否符合字段要求 | |
数值格式要求 | 保留位数、单位要求 | ||
数值分布 | 离散/连续分布 | 箱线图法(分位差法)或者分布图(标准差法 | |
文本分布 | 各文本数据项分布情况 | 是否符合规定的文本要求 |
操作:查数据
主要是处理异常值:缺失、重复、错误值,处理思路:
分析情况
异常值在字段中的分布,以及是否有显著的规律分布特征。
判断:
取决于后期数据分析和模型的容忍度和灵活度。
常用处理方式
丢弃意味着削减数据特征。不宜采用这种方式。当存在大量异常值,缺失值,比如超过10%、50%;或者缺失的数据很大程度影响数据分布特征。
补全/替换较为常用,补全方式有 :
统计法
数值型数据:使用平均值,加权均值中位数。
分类型数据:众数最多的值
模型法
基于已有的字段,将缺失值作为目标进行预测。
数值型:回归模型;分类变量:分类模型。
替换法
有均值替换、前向、后向替换和常数替换、上下限替换异常值
专家补全
其他
例如随机数,特征值,多重填补
删除记录
完全重复记录、数量相对较少删除后不影响数据分析
主要是针对格式错误的数据
数据操作:增、删、改
注意:
伪异常
当遗产是由特定的业务动作产生,能够真实反映业务的状态,并且需要分析异常情况时,这些数据不进行处理:业务峰值、信用卡欺诈分析
数据操作:增、改
数据类型的转换
数据归约
数据归一化处理,
数据聚合
数据合并
横向堆叠:将两张表或多张表在X轴方向,即横向拼接在一起,行数相同 ,
纵向堆叠将两张表或多张表在Y轴方向,即纵向拼接在一起
工具
高级方法是简单方法的叠加,新模型是旧模型的进化,关键是如何实现
对比思想是所有的的基础,分为:自我对比、其他对比
横向对比:同一时间点上的两个并存事物的比较。
定比:kpi、预警分析
环比:
本周期 和上周期整体比较:例如2005年7月份与2005年6月份相比较称其为环比
环比增长速度=(本期数-上期数)/上期数×100%
环比发展速度=本期数 / 上期数×100%
纵向对比:单个事物在周期内不同时间点上的状态进行的比较
同比:本周期 和 上周期的同一点比较:避免周期性波动
趋势图
单维度分许:分析整体的趋势、周期性、异常值
描述:上涨、快速上涨、上涨趋势减缓、急跌、反弹、下趺、快速下跌、荡下跌
ABtest
应用场景:体验优化、转化率优化、广告优化、算法优化
环节设置:现状分析、假设构建、人群分流、目标设置、A/B/n版本制作、数据收集、结果分析:通过用户行为分析用户心理,从而优化产品用户体验
象限分析法、
实现:多维度分析,对数据在不同维度进行交叉展现细分数据,一般是两个维度。根据不同的业务场景和业务需求,将任意两个指标作为坐标轴
例如:BCG模型/类BCG模型。分析渠道——通过用户的质量和数量分为四个部分;品牌的状况——品牌GMV增长率和占有率;商品引流能力和转化率:流量份额-转化率;商品对毛利/GMV的贡献:毛利率-销售额
指数体系分析
(数学基础中有详细解)确定不同因素对结果的影响大小
漏斗分析
结构分析
场景:app功能分析;菜单级别
路径分析
热力图分析
基于链接的热力图
基于像素的热力图
聚类分析
回归分析
关联分析
宏观背景决定行业风口,风口决定公司的发展。基本的研究框架:
产品
这个行业的主要产品是什么?
产品的主要形态是什么?
满足了用户哪一方面的需求?
产品的替代品包括什么?
产品的关键技术是哪一项?
产品的成本结构如何?
产品生命周期PLC
product life cycle,产品的生命都是有限的、不同阶段的目标、措施不同
阶段 | 价值 | 战略 | 指标 | 用户 |
---|---|---|---|---|
开发 | 时间 | |||
引入期 | 反馈 | |||
成长期 | 增长 | |||
成熟期 | 利润 | |||
衰退期 |
品牌
AIPL+FAST:AIPL:品牌在品牌体系里的人群资产定量化运营,FAST模型:从数量和质量上衡量消费者运营健康度模型
市场
公司的市场定位?
公司的主要用户?
市场空间有多大?
近几年的市场增长率有多高?
预计未来几年的市场增速如何?
市场的主要玩家是谁?
战略钟
市场价格
STP市场定位理论
市场定位
SWOT
竞争
行业概括
基本的行业术语
行业的发展历程和变迁
行业的监管情况和主要政策是什么?
行业发展的有利因素和不利因素
行业发展的瓶颈
行业目前所处的周期
行业的供应链情况?
PESTEL
用PESTEL模型分析,这个行业大环境如何?
P:政治因素,是否是公有设施行业?是否受到政策和监控的严控?如房地产
E:经济因素,哪些经济因素影响了这个行业的发展?如奢侈品
S:社会因素,社会风俗和思想开放程度对这个行业有多大的影响?如医美
T:技术因素,技术是如何影响这个行业的?如手机
E:环境因素,环保政策和环保理念如何影响行业发展?如新能源汽车
L:法律因素,某些法律法规的出台对行业的影响,如广告法影响自媒体等。
生态谱图
供应链情况分析
竞争
行业的竞争情况如何,是完全竞争?寡头垄断?还是寡头竞争?
业内几个主要玩家的盈利模式分别是怎样的?
在竞争胜出的关键行业因素是什么?
该行业是否受到海外竞争的压力?
近期的特殊事件。
譬如中概股最近遭遇做空,包括爱奇艺、好未来等,如果你正在看教育行业,那这件事情是你应该关注的。对于这些特殊事情,你在知乎上搜索也能找到很多的数据和各方说法,看个3-5篇的深度分析,对这件事情至少能够在与一般人交谈时比别人多出大概5%的谈资。
如果是为了看行业总体数据,可以上国家统计局和对应的行业协会官网,对于行业研究报告,推荐以下几个地方:
1、证监会官网
在证监会官网上可以找到各个上市公司的上市时候的招股说明书,这是券商针对公司情况出具的一份翔实的报告,里面的行业部分通常是券商经过仔细的调研得出的情况,当然如果是太小的券商出具的报告,有可能深度不够。可以找一下中金、招商、中信证券等大投行出的IPO对应行业的某家公司的招股说明书。
2、巨潮资讯
证监会指定的上市公司公开披露信息的网站,在上面可以找到各个上市公司的定期报告和招股说明书等。
3、东方财富网
对于未付费用户,每天可以免费下三份报告,找报告的时候同样挑选一下出具报告的券商,还是建议看几个大投行的。
4、万得
這個是要收费的,而且很贵,一般人都不会买,大部分情况下是公司买了給员工用。如果你有朋友在金融机构,可能他手里有公司发的账号,你可以麻烦他下几份。如果嫌麻烦,某宝上或者某鱼上搜一搜,便宜得很。
5、网站:发现报告
这个网站上有“行业研究”、“宏观策略”、“公司研究”、“招股说明书”和“其他报告”四个板块,每天会新增几百到上千份报告,报告来源于其他各个网站,包括消费、互联网等,常见的行业一般能在这上面搜到。
6、网站:并购家
这个网站关注的是行业内的并购事件,也能在上面找到各个行业的报告。
7、网站:行行查
上面有行业数据、法规、技术变革、竞争格局等,是我最近用得比较多的一个网站,上面还会根据关键字提取报告中的内容,譬如“商业模式”“产业链”等。
无论何种形式的电子商务,GMV( Gross Merchandise Volume 成交总额)是电子商务的核心指标,从计算角度来分析:采用杜邦分析法即GMV= 用户数*客单价;从管理角度分析最具有代表性的框架为:人、货、场。
提示:对应指标在指标篇中,此处不展开
用户定义:?包括:用户行为、用户价值、用户构成
用户心理:(现在无法落地到数据暂时不展开)马斯洛需求:生理需求、安全需求、社交需求、尊重需求、自我实现
用户行为分析
AARRR是一个思考的框架,不是五个指标。
每个方面下边都有一堆指标可以看;因为每一步的达成都需要众多部门合作。
不是一个用户必须走完五个流程,运营时也不是分布进行
用户具体行为并不一定,而且运营中存在同步进行,基本是作为一个整体,关注的五个方面
不是说每个方面都得做到极致
不同的业务, AARRR形态不同。有的业务就是靠大量转发裂变,有的就是靠大量不付费用户撑起台面,有的就是流失很严重,但是沙里淘金服务几个大客户。所以得具体问题具体分析
Acquisition 获客
战略:获取新用户
战术:拉新,运营主要的目标是引导用户下载应用,完成注册
战斗:精准定位,发掘渠道,
通过SEM、SEO、CPS、ASO、换量、积分墙以及一些线下渠道,找到并发现目标用户,将用户引入体系中来并诱发使用,完成这个阶段的目标。最终引入用户的渠道质量和匹配度,将决定用户的有效转化率和留存率。还有就是落地业等产品端的价值传达。
指标:用户增量、获客成本
Activation 激活
Retention 留存
战略:留存率衡量着一个产品是否健康成长。
战术:减低流失
战斗:
当新用户在某个时间段内、按照某种频率使用某个功能,则该用户在本平台的留存概率将最大化,进而成为忠诚用户。
指标:次日、3、7日、30日、90日留存率、生命周期长度、流失预警+重定位
Revenue 收益
战略:传播
战术:精准营销
战斗:交叉营销
基于平台现有的产品类别,流量、爆款、利润款,以各种运营手段配合,促成用户完成多次复购
指标:ARPU、LTV、消费金额、频次、消费商品
Referral 传播
战略:复购
指标:传播用户数、传播质量、K因子
战术:诱导用户对于平台产品和服务进行传播。
通过用户推荐再次获取新用户,应用运营形成了一个螺旋式上升的轨道。而优秀的应用就很好地利用了这个轨道,不断扩大自己的用户群体。
介绍:用户相对价值的划分的经典模型,
Recency最近一次消费时间间隔 | 理论上,上一次消费时间越近的顾客应该是比较好的顾客,对提供即时的商品或是服务也最有可能会有反应 | 与顾客建立长期的关系: 如果显示上一次购买很近的客户,(消费为1个月)人数如增加,则表示该公司是个稳健成长的公司;反之,如上一次消费为一个月的客户越来越少,则是该公司迈向不健全之路的征兆。 |
---|---|---|
Frequency,消费频率,一段时间(比如1年)内的消费次数 | 消费频率是顾客在限定的期间内所购买的次数。我们可以说最常购买的顾客,也是满意度最高的顾客。 | 最常购买的消费者,忠诚度也就最高。增加顾客购买的次数意味着从竞争对手处偷取市场占有率,由别人的手中赚取营业额。 |
Monetary,消费金额,一段时间(比如1年)内的消费金额 | 消费、消费频率、消费金额是测算消费者价值最重要也是最容易的方法,而其中,消费是最有力的预测指标,消费金额决定客户重要性 | 也所有数据库报告的支柱,也可以验证“帕雷托法则”(Pareto’s Law)——公司80%的收入来自20%的顾客。 |
分类
“忠诚度的阶梯”(loyalty ladder),其诀窍在于让消费者一直顺着阶梯往上爬,实际运用上,我们只需要把每个维度做两分即可,这样在3个维度上我们依然得到了8组用户。
用户分类采取不同的运营决策识别有价值的用户
用户分类 | 距今间隔 | 消费频率(F | 消费金额(M) | |
---|---|---|---|---|
重要价值用户 | 1 | 1 | 1 | 对这部分优质客户要特殊保护 |
重要发展用户 | 1 | 0 | 1 | 忠诚度不高,很有潜力的用户,需要对其识别后进行个性化推荐,增加用户付费次数,提高粘性 |
重要保持用户 | 0 | 1 | 1 | 说明这是个一段时间没来的忠诚客户,需要运营/业务人员对其进行唤回(可用红包、奖励、优惠券等方式) |
重要挽留用户 | 0 | 0 | 1 | 可能是我们的潜在客户或易流失客户,可以找到该部分用户让其给出反馈建议等 |
一般价值用户 | 1 | 1 | 0 | 可能是对价格较敏感或付费能力不足,可对该部分用户进行商品关联推荐 |
一般发展用户 | 1 | 0 | 0 | 新客户,可对该部分用户增加关怀,推送优惠信息,增加粘性 |
一般保持用户 | 0 | 1 | 0 | 该部分客户可能快要流失,可低成本营销 |
一般挽留用户 | 0 | 0 | 0 | 有可能不是目标客户,若经费有限可忽略此类用户 |
计算
定义
每一种用户形态组合,对应一个结果。TGI指数反映目标群体在特定研究范围(如地理区域、人口统计领域、媒体受众、产品消费者]内的强势或弱势的指数。
计算
TGI指数=用户分类中具有某一特征的群体所占比例/总体中具有相同特征的群体所占比例*100
用法
将目标用户进行分类,
对比各类用户与总体之间的差异性
要论证一种形态组合比另一种更好,要么做标杆对比:每个组合的收入;要么看时间线上,每个组合对应的利润、成本等指标变化。比如在分析用户的年龄段时,可以通过TGI指数对比各用户分类与总体在各年龄段的差异,设用户分类1中16-25岁的用户占比为4%,而总体中16-25岁的用户占比为8.3%,那么用户分类1在16-25岁用户中的TGI指数为4%/8.3%=48。依照这一方法,我们可以对各类用户在各年龄段的TGI指数进行对比。如上图所示,各类目标用户在16-25岁这个年龄段的占比都比总体小(TGI指数<100),其中分类1的用户年龄偏大,因为该类用户在36岁以上各个年龄段的TGI指数都明显高于100,且同时高于其他三类用户。
TGI指数等于100表示平均水平,高于100,代表该类用户对某类问题的关注程度高于整体水平
(LTV):客户终生价值
用户体验模型:HEART
定义:
产品,解决一系列问题的工具。商品,具体的交易物。商品分析主要指:商品,负责商品规划,涉及:需求预测、供应链管理。量、收、利、进、销、存:零售行业,无论线上线下都是这六个关键指标:总量、收入、利润、采购(进)、存货。和AARRR一样,有一堆二级三级小指标。
起源于财务领域,扩展很多。通过数学公式和维度选择,层层拆解,能够用于初步定位问题所在。
ABC 分类法 (Activity Based Classification) ,全称应为 ABC 分类库存控制法。又称帕累托分析法,28法则。
产品介绍
核心目标
解决目标用户市场一个什么问题,这个问题分析的越透彻,产品核心目标越准确。如:360安全卫士解决用户使用电脑的安全问题。
产品定位
目标用户群是谁?目标用户群分析的越透彻,越清晰,对于后期产品推广起关键性助推作用。一句话,比如,陌陌一款基于地理位置的移动社交工具。鸟哥笔记:分享互联网产品,运营推广干货。
产品设计
功能、技术、可用性
重心
1.使用广度:总用户数,月活;
2.使用深度:每人每天平均浏览次数,平均访问时长;
3.使用粘性:人均使用天数;
4.综合指标:月访问时长=月活人均使用天数每人每天平均浏览次数*平均访问时长
在产品初期,核心的工作是拉新,应该更加关注产品的使用广度,而产品的中后期,应该更加注重使用深度和使用粘性的提升。
对于不同的产品也需根据产品的性质来确定核心指标,比如,对于社交类产品,使用广度和使用粘性至关重要,而对于一些中台分析类产品,提升使用深度和使用粘性更有意义。
工具类:启动次数很重要
社区类:活跃用户和UGC(User Generated Content)用户原创内容”很重要
游戏:在线人数和ARPU值是关键
移动电商:主要关注成交销售额。包括订单转化率和金额转化率
漏斗模型,常用来改善内容投放、新用户注册、产品流程。这些工作往往是若干环节组合,用户在操作过程中会因为环节太多而流失,类似漏斗的效果,所以有漏斗模型的说法。
根据流程,分析析每个环节的:转化量,转化率、停留时长,访问深度。通过标杆/同比、环比的比较判断好坏。考虑到设计产品的用户行为路径,其中详情页的转化率是最为重要的指标。
购买转换率:访客中购买商品的比例,购买客户数/访客数
详情页到达率:详情页UV/曝光率
详情页的主要来源:入站UV——直接落地详情页、入站UV——聚合页(从首页进入、从频道进入、从分类页进入、从品牌页进入)、入站UV——商品详情页(关联销售)——详情页,分析聚合页进入
详情页下单转化率:
详情页缺少吸引力
支付成功率
支付引导差/支付工具问题
可以粗略的理解为:用户的消费场景的搭建。重在提高用户的体验,对各场景进行优化,增强客户粘性。没有创造牛x的运营策略,只是因为发现了用户在xx场景下的xx需求,通过我们设定的路径和工具,帮助用户实现了而已。
渠道来源:
referral-引荐网站:指向本网站的其他网站
direct-直接进入:直接输入网站或者通过收藏夹进入,一般是老客户
organic sercch-自然搜索、other-一般付费流量
paid search 付费搜索
场景:
用户转化率—导入用户数 平面坐标
优质渠道 、潜力渠道、垃圾渠道、混杂渠道
转化率分析:漏斗模型
辨别渠道作弊
渠道效果评估:留存率
用户终端
1、方法:关注低价设备排名
2、方法:关注新版本的操作系统的占比
3、关注wifi网络的使用情况
4、定向投放也很重要
用户行为
1、比较用户行为数据
2、了解新增用户、活跃用户小时时间点数据曲线
3、查看用户访问的页面明细细
转化率分析
反作弊模块
(1)设备号异常:频繁重置idfa
(2)ip异常:频繁更换地理位置
(3)行为异常:大量购买特价商品等
(4)数据包不完整:只有启动信息,不具备页面、事件等其他用户行为信息
类别
静态图表
动态交互图形
制作方式
自动图表化
手动图表化
流程
确定主题
汇总数据
分析数据格式
探索表达方式
根据数据类型和业务目的选择
创意草图
编辑
设计
检验
复杂图是简单图形的组合,最基础:条形图、饼图、柱状图
比较:对比
条形图
显示Y轴各个项目之间的比较情况
柱形图
通常描述的是分类数据,用于显示一段时间内的数据变化或显示各项之间的比较情况。
雷达图
当系列值多于两个的时候,再用柱形图会使柱形图显得拥挤,这个时候我们可以选择雷达图
目标完成率图
联系:查看两个变量之间关系
气泡图
双坐标轴图
旋风图
用于两个项目不同指标或者不同系列的对比,另外一个作用就是表示两个数据之间的相关关系
步骤:
选中数据 → 插入簇状条形图 → 右击数据条选中设置数据系列格式 → 把主次坐标轴数字大小调成一样 → 选中一个标签然后逆序 → 最后设置坐标轴格式去掉负数
构成:组成要素,每个部分所占整体的百分比
饼图:
饼图以二维或三维格式显示每一数值相对于总数值的大小
树形图、排列图 、
漏斗图:
漏斗图主要是在条形图的基础上绘制,主要使用的是堆积条形图。
适用于业务流程比较规范、周期长、环节多的单流程单向分析,通过漏斗各环节业务数据的比较,能够直观地发现和说明问题所在,为决策者提供一定的参考。
分布:关心各数值范围包含多少项目,如
柱形图
盒式图:数据基础中有
散点图
显示变量之间的相互影响程度,点的位置由变量的数值决定。
帕累托图
排列图,主次图、主要用于质量分析原因定位等.原则就是二八原则
直方图
高代表数据密集 ,低代表数据较少
直方图画法: X——max-min均匀区间;Y——频数
地图,甘特图
看趋势
面积图:又叫区域图,面积图强调数量随时间而变化的程度, 它是在折线图的基础之上形成的, 它将折线图中折线与自变量坐标轴之间的区域使用颜色或者纹理填充,颜色的填充可以更好的突出趋势信息
迷你图
最大化数据墨水比原则:保留有效元素,去除无效元素,淡化非主要元素
注意时间维度
规模数量
流量
访问量/启动次数:会话session次数,用户打开第一个网页之后启动一次会话,编号为sessionID=X,用户30min内无操作或者关闭网页,会话结束,计为一次会话;
UV:(unique visitor)一定时间独立访客数:在网站系统中会依据用户的浏览器、设备编号等为用户分配一个编号,这个编号被称为Cookie,访客数就是COOKie数,更换浏览器或者设备cookie会变;
PV:(Page View) 页面浏览次数
用户数
用户数、
新客用户数:表示网站客户规模的增长速度;
产品每天新增的用户数
老客用户数、
新/老用户数量比
召回
召回 召回数 召回率
质量
用户活跃
AU()活跃用户数:一段时间内启动过应用的设备数,表示用户的规模
DAU(Daily Active User)日活跃用户数量:日活跃用户数波动较大一般用作当天的引流效果。通过DAU可以很直观的了解产品的所处在的生命周期。
MAU(即monthly active users):月活跃用户数量相对稳定,用来表示活跃用户数
活跃系数:?
流失用户:是指连续n周没有启动过应用的应用
忠诚用户:连续活跃n周以上的用户
意向
询单量
询单转化率
平均接待时长
店铺评分
转化率
转化:最重要的。根据具体情况定义,任何有意义的动作都可以是转化。达成某种目标的访客数(访问量)/总的访客数(访问量),采用访问量量意味着每次访问都是下单或者购买的机会,访客数意味着购买之前多次访问是正常的。
订单转化率
来源转化率
注册转化率
行为完成率
留存
n日留存计算:使用粘性。 统计日期内新增的用户或活跃用户,在第N天又来使用的比例,可以参考行业值对标自己的应用留存是否健康;不同维度下用户流失的情况 阅读资讯、社交沟通、系统工具是留存率最高的三类应用,在4个月以后的留存率稳定在10%左右。
次日留存率:新手引导设计和新用户转化路径
7日留存率:在这个时间段里,用户通常会经历一个完整的使用和体验周期,如果在这个阶段用户能够留下来,就有可能成为忠诚用户
30日留存率:APP版本更新是否对用户有影响 通常移动APP的迭代周期为2-4周一个版本,
渠道留存:渠道不同用户质量也会有差别,而且排除用户渠道差别的因素以后,再去比较次日,周留存,可以更准确的判断产品上的问题
消费
APA(Active Payment Account)活跃付费账户
ARPU (Average Revenue Per User)即客单价=总收入/总用户数 =销量*单价/总用户数=人均购买的件数*件单价**。付费能力
ARRPU:(付费用户人均付费) 总收入/付费用户数
UP付费率:付费用户/总用户数 ,区别对待付费用户和免费用户,两者行为差别很大,单独跟踪和对待付费用户的行为流失,服务好付费用户提升金额就可以提升交易额
购买次数
复购率:消费N次以上的人数/付费用户,代表电商的用户粘性
首次付费时间:用户激活多久后才会开始付费,有助于把握转化用户的时间节点适合的时间尝试引导付费
客单价
新用户客单价:和新用户的留存有很大关系;
连带率 :人均购买件数,是指每个客户购买了几件商品,这个指标常用来衡量关联销售的效果——(组合装/单价装、推荐效果——推荐带来的销售额)
LTV::用户生命周期总价值
传播
转发率
邀请率
UGC
发表文章、点赞、评论、阅读、订阅、
热度:热度=分享次数+推荐次数+点赞次数。
量、收、利、进、销、存:总量、收入、利润、采购(进)、存货。
品类
品类结构:男、女、童装
销量结构:爆旺平滞
尺码结构:XS、S、M、XL,XXL,
季节款:
风格款:
时间:上架天数/可售天数
商品层次:备货款、新款、淘汰款、
量
总量
sku数
销量:历史销量、预测销量;总体、品类;
订单量:订单数(关系到支付压力和仓库发货的任务量)
售罄率
断码率:**重点商品的缺货率(爆款缺货的比例)**造成客户流失的重要指标
加货次数
增长率(历史增长/平台增长)
收入
GMV( Gross Merchandise Volume,网站成交金额):GMV=实际成交额+取消订单金额+拒收订单金额+退货订单金额。体现电商平台的交易规模
实际成交额/GMV:购买意向
净销售额(不含退货):净销售额是统计期间内的销售业绩减去期间退货的业绩
销售结构(品类/价格带/折扣带)
业绩增长率
利润
件单价:热销商品的价格波动
毛利:总体、单体;品类
价格带
折扣
采购(供应链)
供应商:响应周期
库存
总量
周转率
库存金额(成本/ 吊牌)
有效库存比(适销)
库存结构 (年份/品类/价格带)
存销比
断码率
断货率
品类占比
货龄(存货天数)
各商品层次SKU数
备货SKU数
制造商
货期
时效
产能
超期率
仓储配送
送货时间
妥投及时率:(妥投到客户的订单中,安装约定时间妥投的比例),重要的客户体验指标,影响客户的回购率;
评价
退货率(整体/单款)
使用广度
总用户数,月活;
用户活跃
AU()活跃用户数:一段时间内启动过应用的设备数,表示用户的规模
DAU(Daily Active User)日活跃用户数量:日活跃用户数波动较大一般用作当天的引流效果,
MAU(即monthly active users):月活跃用户数量相对稳定,用来表示活跃用户数
活跃系数:?
功能使用率:使用某功能的用户占活跃用户数的比例,用来表示某个功能的受欢迎的程度
使用深度
人每天平均浏览次数,平均访问时长;
浏览深度
Tp(Time on Page)停留时长
PV(page view )浏览的页面数量:页面停留时长和网站停留时长,平均值,在此页面(站)的总停留时长/此页面(站)总的访问量;
PV/UV:
日平均使用时长: 用户使用APP或网站/页面的总时长=总时长/总用户数
轨迹:访问的页面明细
跳出率:非常重要,指的是来到网站后没有任何操作就离开的比例,落地页的访问量/总的访问量
页面点击:页面热点图**
退出率:衡量某个网站推出的概率,无论从哪里进入最终从这里退出的比例,从一个页面退出的次数/访问次数
使用粘性:
人均使用天数;
每次启动活跃时长
访问间隔
时间点数据曲线
用户终端
设备价格
操作系统
wifi使用情况
ip分布
综合指标:月访问时长=月活人均使用天数每人每天平均浏览次数*平均访问时长。
导出率:点击该页面上链接的次数除以进入该页面的次数
商品导出率:在该页面上点击商品详情页的次数除以进入该页面的次数,
推荐商品点击率:点击推荐商品的比例/在商品详情页看到推荐的访客。
需要时刻保持对于ROI的关注,保证运营活动的必要性和有效性。
运营完成后,需及时复盘,查看最终结果与预期目标的差距、投入产出的最终比例,以及运营前后数据的变化等。通过复盘,提升运营活动质量的持续性
流量来源
获客成本:
CAC(用户获取成本)
CPC(每次点击付费)
CPT(按时长付费)
CPM(千人成本) 、
CPS(按提成收费)
同 用户留存指标
同 产品转化指标
百度统计
GoogleAnalytics:
对比
百度统计 | GoogleAnalytics: | |
---|---|---|
如果做二次开发(埋点):可以统计订单交易数据、用户点击、注册、下载等动作(事件) 百度:国内用的最多的免费网站流量统计工具,速度快 | GA:GoogleAnalytics,国外用的最多的免费网站流量统计工具,功能丰富 http://www.google.com/analytics/ | |
适合: | 流量统计辅助工具 | 贸类型的网站,服务器架设在国外,用户主要是国外用户 |
费用: | 免费,数据准确, | 基础版本免费(据说数据量太大千万以上就不正确) |
用处: | 学习其分析方法和原理,面试的时候要求会。工作中用的比较多,因为百度的市场份额大通过百度SEO访问来源的用户精准 | 学习其分析方法和原理,面试的时候要求会,不过基本不用 国内访问不了,需要挂VPN。国外的数据经常有差错,会丢包!准确率70%左右。 |
部署人员: | 分析师+(WEB开发工程师) | 分析师+WEB开发工程师 |
缺点: | 提供的数据不够全面,不过基本够用 | 国内用户少,不能和推广工具直接对接。 |
优点: | 免费,可以很好地和百度推广账号打通。 | 功能强大 |
类型工具: | CNZZ、腾讯统计 | |
原理 | 通过一段js代码,获取访客行为和页面的信息, | |
分析方法 | 统计渠道推广ROI 估计百度推广渠道的转化效果 统计订单数据 统计网站流量和用户行为细节数据 统计关键的事件(咨询、下载、点击) 案例http://coric.top/zh/h2h 数据https://tongji.baidu.com/web/demo/visit/district?siteId=5503017 |
国外——flurry、Google Analytics;国外——友盟、TalkingData;Crash分析工具——crashlytics
自上而下设计,自下而上回归,这种层层递进的逻辑方法,也是数据分析的短板。从经验上看,数据分析师做的方案往往倾向于保守,往往缺少创意,这些都是太过理性的后遗症。而实际上商业成功往往不是理性的结果。天才的创意、勇猛的胆识、无敌的运气、过人的机智、诱人的魅力、不可挑战的权力,可能都是成功的因素。
然而,数据分析的独特吸引力也在这里。你会发现创意、机智、魅力是天生的,权力、运气可遇不可求的,胆识加在蠢人身上就是灾难。唯独数据分析能力是可以通过学习、训练、实验、记录来不断提升的。所以基于数据提可行性建议,可能不会被采纳,但只会越来越被重视。经济大潮来了,怎么都能成功,现在水势不明的时候,就是数据方法大放异彩了
需求如患者,分析如医者。需要理论扎实,也需要观察到位,沟通到位,要对症下药,实事求是,还需要循序渐进,认识任何数据产品都不是灵丹妙药。
如同医生通过体温、仪器测试推断病情,除了多维度获取信息外还需要知道正常值的范围。
1. 取数和分析的基本区别:是否使用了数据指标来描述问题。
2. 判断标准一定要事先立!太多项目死于“提高销量”“增加活跃度”这种含糊的标准到底提高多少!增加多少,事前要有判断。
3. 数据指标需要得到需求方的验证
数据作为一个产品,和所有的产品一样,想助力业务,要有用户,场景,痛点。场景拆分的越细,越能够击中用户痛点,所以得从基础一线业务认真研究起,分析要结合业务动作。
与直觉思维不同,工程思维是数学、工程工具、逻辑去寻找答案,解决问题的一种思维方式。做数据分析,感性是用于沟通流的,核心是理性。用逻辑性对抗情绪化,我们些感觉、情绪、冲动都是我们的大敌,要坚决消灭!
脱离概率谈个案、脱离整体谈细节、脱离数据谈现状、脱离标准谈判断,统统都是耍流氓!
医学教科书上的描述代表大多数患者的共性,而医生要解决的是眼前这个病人的问题,而病人的病情资料永远都不会完整,病症表现的存在多样性,病情存在的个体差异性。在企业里数据分析也是同样的处境,从来就没有
实际需求都是一个模板,一个数据集,一个范例解决不了的。优秀的数据分析师,脑子里装的是一个个具体的业务问题,然后拿数据解释问题,从问题中发现新数据。流水线上工人,才是对着模板拧螺丝,每一个操作都一模一样。引以为戒。
我家门前的大树年年都在长,中国GDP也年年在涨,两列数据算个相关系数哇塞0.99,P值小于0.05,所以我家门前的树是我中华龙脉,我要发财啦! ↩︎
理想的病人:现实中能一见到医生,能清晰的说出:“自己从27号开始发烧,已经持续到今天,期间体温没下过38度,27号淋了雨,没有其他症状,没有喉咙痛”——这样理性、清晰的病人少之又少。真实的病人:总是一进门只会哼哼:诶呦,诶呦,诶呦,医生啊,我浑身难受啊,快救救我啊!医生问:到底哪难受?病人:全身难受……这时候咋办?医生只能从0开始沟
问家属:“到底他哪里不舒服?”
查病历:“之前有什么病史?”
做检测:“测个体温/验个血/拍个片看看?”
问行为:“吃了什么?去了哪里?”
做测试:“我按你这里,会不会更疼?
专业的医生,不但只谈病情,连医保政策、家庭收入、亲子关系都会很耐心的和病人沟通。这些因素跟病情没有关系,但跟病人看病花的钱、时间、精力有直接关系。最后都会影响看病效果。 ↩︎
高层管理往往很希望推动数字化转型、信息化建设等,我们大搞BI系统,数据建模,数仓建设,下边的人也会吐槽无用。 ↩︎
不配合的病人。