1.数据分析师最重要的能力是什么?能够给企业带来什么?
2.项目怎么写?(项目是一个星期都解决不了的业务难题)
项目背景
项目的逻辑
项目的主要策略/目标
项目的主要工作是做了什么?什么工作是在这个项目中起决定性作用的
项目的业绩
3.面试要表达什么内容?
4.未来规划问题怎么答?
5.业务细节没做过怕露馅怎么办?
6.如何准备面试?
7.如何找招股说明书?
招股说明书会介绍公司的业务,业务规模,行业的模式,市场规模等关键数据,对理解公司的业务很有帮助(没有上市的公司只能通过公司所在行业,搜索行业研报来侧面了解以上信息)
8.怎么谈高薪?
9.怎么打开一个市场?
10.工作经验
对日常工作的理解
对工作难题的理解
对行业的理解
11.自我介绍应该怎么做?
12.类比问题
你的业务有A场景,我的业务也有类似的场景,我把我的场景举例出来,你说说你对这个场景的解决方案
考察的是你对于技术场景的知识积累,也考察你对于问题的拆解(思考能力)和解决能力
如何回答?
13.面试如何保持节奏/状态?
14.随机抽取好还是全局抽取好
考虑点:
15.什么决定实验的样本量大小?
16.你最喜欢用的产品?
规模怎么知道有多大?
17.如果让你改进这个产品,你会如何改进?
18.现在要你写一个品牌的前三季度报告,怎么写,有框架吗?从哪些方向写?
19.针对不同的行业要写不同版本的简历吗?
20.给你两周时间,写一份陌生行业的分析报告,你会怎么做
21.面试流程
电话面:判断合格(HR,主管)工作经验和项目
技术面:口试SQL,估算问题
业务面:项目,面试作品(主管,导师,leader)(很多人在这一面挂)
交叉面:逻辑
HR第一次面:常规面
HR第二次面:谈薪
22.数据分析流程是什么样的?
提出问题→理解数据→数据清洗→构建模型→数据可视化
第一步:数据准备(70%时间)
第二步:数据观察(发现规律和隐藏的关联)
第三步:数据建模
第四步:数据挖掘
循环第二步到第四步,进行数据分析,根据图表得出结论完成文章
23.业务分析怎么进行?
①数据为王,业务是核心
了解整个产业链的结构
制定好业务的发展规划
衡量的核心指标有哪些
有了数据必须和业务结合才有效果。首先你需要摸清楚所在产业链的整个结构,对行业的上游和下游的经营情况有大致的了解。然后根据业务当前的需要,制定发展计划,从而归类出需要整理的数据。最后一步详细地列出数据核心指标(KPI),并且对几个核心指标进行更细致的拆解,当然具体结合你的业务属性来处理,找出那些对指标影响幅度较大的影响因子。前期资料的收集以及业务现况的全面掌握非常重要
②思考指标现状,发现多维规律
熟悉产品框架,全面定义每个指标的运营现状
对比同行业指标,挖掘隐藏的提升空间
拆解关键指标,合理设置运营方法来观察效果
针对核心用户,单独进行产品用研与需求挖掘
发现规律不一定需要很高深的编程方法,或者复杂的统计公式,更重要的是培养一种感觉和意识。不能用你的感觉去揣测用户的感觉,因为每个人的教育背景,生活环境都不一样。很多数据元素之间的关系没有明显的显示,需要使用直觉与观察(数据可视化技术来呈现)
③规律验证,经验总结
发现了规律之后不能立刻上线,需要在测试机上对模型进行验证
24.数据分析框架是什么样的?
①从互联网实体角度分析
我们可以从以下7个角度构建互联网数据分析体系
这个实体分析方法,可以称得上是万能的数据分析框架,适用于所有互联网企业。
②从用户的关键路径进行分析
关键路径分析方法是一个行之有效的常用分析方法,也是做数据化运营的常用工具。关键路径分析让我们聚焦于核心环节,排除杂音,定位出业务的核心问题,快速的加以解决。在应用关键路径分析时候,我们往往先把可能的结果,以及最关心的结果梳理出来,以结果为导向追溯行为的根本,当然,也可以从行为的初始出发,梳理出所有可能的行为路径,找出关键行为,导向我们最终设计好的结果中去,下面我们举例子说明下:
在电商网站中,我们假设我们运营目标是让用户购买网站上的商品(在这里,我要插说几句,我们的目标有时候不只是购买,在精细化运营中,往往会根据用户的生命周期,确定关键路径的目标,比如对于一个进入期的新买家,我们通常会发一些购物攻略加以指导,针对流失期的买家,关键路径的结果我们可能导向申领我们的优惠券之类等等。)刚才谈到,我们假设我们运营目标是让用户购买网站上的商品,那么我们可以把关键路径,也即,用户的购买路径梳理出来:
通过这种关键路径,我们还常常进行漏斗分析,从而进行流量的转化分析,找出影响到达最终结果的关键环节
③从KPI拆解角度分析
KPI拆解分析方法也是比较常见的互联网分析方法。核心思想是先定一个总体目标,比如今年营收12亿,那么可以把这个指标拆解到各个业务线去,业务线再进行拆分,比如分解为12个月,每个月需要达成营收额,接着,就是达成该营收额,根据流量的转化情况,估算出需要多少的流量,目前平台已有多少流量,需要外拓引流多少流量才能达成目标,这就可以层层拆解指标,最终或落地到产品团队或部分导运营团队去承担KPI任务
25.面试官看重的要素
①数据分析技能
②分析报告:为业务(产品,市场,运营)提供有洞察力的数据分析报告及策略建议,为业务决策,市场方向提供有价值的数据支持
③项目经历:做过XXX分析模型(详细解释,附带作品),XXX分析报告(详细解释,附带作品)(推荐找一个感兴趣的产品(竞品),写一个完整的产品分析报告,作为作品附在简历中,报告观点自洽,并且具有结构化体系)
④掌握数据分析体系方法
⑤演说,演讲技能
26.对细节的敏感度
①统计口径
②数据
对数据异常波动,离群值,平均数没有代表意义等情况的迅速识别能力
27.去互联网,金融,零售行业做数据分析师都要掌握哪些工具?
①商业问题的理解
方法论:swot,pest,5w2h,mece原则,二八原则等
PPT:给领导或者小组内做一些简单的交流
WORD:把自己分析目标的内容说清楚
Xmind:传达自己的分析思维
②数据的采集
内部采集:SQL
外部数据采集:爬虫(python),第三方工具(八爪鱼)
③数据的处理与分析
Excel:数据量小
python:数据量大
④数据的呈现
Excel
tableau
⑤汇报与复盘
PPT
28.流量分析的核心思维
常见的流量波动分析就是两个:日活和留存
①日活
日活波动=外部影响 & 内部影响
外部影响 = 行业变化 & 竞品变化 = 常识 + 外部事件 + 竞品策略
内部影响 = 数据统计 + 用户基础属性 + 用户行为属性
数据统计:数据没有搞错 —— 数据采集和统计口径
用户基础属性:用户从哪里来,通过什么方式进入 —— 渠道(新增用户变化)入口,画像
用户行为属性:用户进来干了什么 —— 具体功能的变化,跟版本可能有关
②留存
留存波动=新用户留存&老用户留存
新用户留存=渠道+渠道过程有关
老用户留存=所有功能用户去重留存+大盘非功能用户留存
实际中,会出现以下几种情况(假设留存下跌):
A,B,C中有1个留存下跌 —— 最好解释
A,B,C中有两个以上留存下跌 —— 看谁是主要下跌因子,找到它,如果下跌幅度都差不多:
1)进一步观察,如果还是持续阴跌,必然是产品某核心部分出现问题,围绕指标体系做一次产品全盘分析,找到它
2)跌了几天之后回去了,可能跟外部影响因素有关,暂时不管
在留存这件事上,由于是比例,排查起来会比较费神,保持耐心,跟业务多聊,一定能够找到主要影响因子
29.以京东APP为例,讲解电商数据分析
①如何去看京东APP
1)用户视角
搜索:流量最大的一个入口
广告banner:各种活动宣传
导航:十宫格,相对比较稳定,10大主要产品
feeds流:电商 + 内容
个性化推荐:千人千面
底部button:5大主模块,方便快速查看
2)数据分析师视角(应该更加深入有层次地去看这个APP的数据)
有三个问题需要大家思考
引流(场):首页作为最大的带量位,分发效率怎么评估
漏斗(货):北极星指标交易额只是一个数字,更加重要的是理解这个数字转化的过程
用户(人):作为一款非常成熟的APP,老用户相对比较稳定,但新用户获取应该怎么优化
其中引流是对整个APP整体的分析,漏斗是对核心路径的分析,用户是对产品的当前痛点进行分析
②首页的分发效率
除了要关注日活,留存,渗透率这些常规指标外,更加重要的是找到一些能够反映产品问题的指标
CTR:点击UV/曝光UV,反映用户点击欲望的指标,非常重要,只有点击才能产生交易,如果较小,首页问题较大
人均访问(点击)页面数:总访问页面数(PV)/总访问UV,只有多访问页面,才可能产生交易
而围绕这两个指标,按照维度拆解方法,可以发现更多问题
比如CTR突然低了,那么是所有坑位的CTR均低还是个别引起
基于日活,留存,渗透,分发效率,基本上就能够对APP的整体数据有个大概了解
作为一名优秀的分析师,除了要把自己负责的产品做好外,更加重要的是不要设定边界,主动去了解整体数据,在这个过程中,你需要找到负责的产品跟大盘的数据关系
A.该产品确实很好的带来了大盘的提升
B.该产品只是在抢大盘的流量
C.该产品部分抢大盘流量,部分提升,那么提升度到底多少
找到:业务功能与产品核心指标的关联性,量化
③漏斗分析
了解每层漏斗的影响因素:请教老同事,买电商书籍查看,多机型体验产品
引流渠道:桌面图标打开进入搜索还是其它搜索框搜索,热点搜索,语音搜索
客服,评论,店铺设计,商品属性
尺寸,颜色,数量
物流,是否只是7天无理由退货,发票,运费支付方式多样性
密码错误,冲动消费,界面异常,其它打断
应该说电商的大部分数据分析都会跟漏斗有关,除了经验之外,更加重要的是对产品本身的多体验,以及对竞品的学习,保持好奇心和敬畏心,也只有这样,才能慢慢关注到其他同学关注不到的点,而这些是培养良好微观体感的重要一步
④新用户分析
1)背景
作为一款非常成熟,在一线城市有很多忠实用户的APP,当前在用户体量上与手淘相差仍然很大,因此我们会看到京东与各方APP战略性合作,共同拉新
拉新必然就要衡量拉新效果和拉新优化,拉新效果内部数据不太清楚,但是作为一名分析师,可以去看整个APP在拉新上可以优化的点。实际上拉新如果做得好,比老用户分析更容易出成绩
2)建议
新用户和老用户相比,由于对APP不熟悉,因此在漏斗环节,可能会有几个特征:
A.用户行为较为离散化,数据上可能有几个主要漏斗
B.在某个环节转化率远比老用户低
C.新用户当天以逛为主,不下单,过一定时间段后再下单
数据分析师能做的就是:把自己当做一个新用户去体验各种路径,并对异常漏斗进行维度拆解(比如,是不是某个渠道的新用户转化率低引起整体低)
3)总结
对于一款电商APP,分发效率是非常重要的一个产品指标
漏斗模型套路很重要
新用户的分析会更加有挑战性和有趣感
30.以斗地主为例,看看如何做游戏行业的数据分析?
①背景
电商:非常互联网
互联网金融:直接跟钱打交道
游戏:互联网思维+钱都要具备
游戏行业用户两极分化比较严重:要么快速流失,要么就玩得时间很长
目标:尽量让用户晚点流失(流失分析),让花时间的用户多变现(商业分析)
②指标口径
日活:每天打开APP的用户数
次留率:第一天打开欢乐斗地主并且第二天也打开欢乐斗地主的人数/第一天打开欢乐斗地主的人数
渗透率:进入商城的用户数/DAU
转化率:针对某个连贯路径,使用下一个结点的用户数/使用上一个节点的用户数(打开APP - 进入房间 - 参加比赛)
③用户流失分析
行业内一般对流失用户的定义:一个月内不使用产品即定义为流失
实际上,不同的产品形态用户行为差异非常大,像住宿类APP那就是低频高价值用户,欢乐斗地主7天不上线可能就已经流失,所以要合理定义流失用户,对于流失用户,发现的越早越好
不能很好地定义流失就是因为用户有可能回流,比如拍脑袋30天,结果30天的时候,大量用户回流
所以实际上流失周期确定=回流率稳定,一旦这个指标稳定,就定义这个时间段天数为用户流失周期
回流率=回流用户数/流失用户数=某个周期内的流失用户数在周期结束后又回来了/某个周期内的流失用户数
所以,只要按照枚举法,周期=1,2,...30,然后分别计算回流率,一旦回流率趋于收敛,该周期就是流失周期
对于游戏行业的用户流失分析,即有其他行业的类似套路但又有一些差异化很大的点
类似套路:看流失前最后一步在干啥
差异化很大的点:作为一款非常复杂,需要花用户大量时间的APP,分析师要想好好研究用户为何流失,也必须要去很深入的玩游戏,找到游戏中的快感和痛点,跟其他玩家多交流,否则就是脱离业务
对于游戏分析(特别是网游),要结合游戏深入体验和初步数据一起分析,才能有明显效果
④付费分析
游戏这个行业前期投入大,本身迭代快,所以对付费变现有非常高的要求
在付费分析上,整体思路是:
A.以付费金额分布和付费模块为切入点
B.根据1确定未来重点是在高,中,低哪个群体
C.进行AB测试,并每天看收入情况
游戏行业非常注重收入,分析师要每天看收入数据,所做的各种分析都要和收入挂钩,除了互联网那些分析方法,游戏行业更加注重分析师的深度体验,单纯的数据只能解决交互式的失误,而不能让游戏变得更加好玩,所以分析师最大的价值就是让用户玩的更爽,只有到这一步,才能实现真正的增长
31.什么叫懂业务?
①原因:要知道业务流程是如何产生数据,要知道在每个业务的流程环节是如何使用数据的,每一个业务流程的变化对数据产生的影响有哪些
②方法:要懂行业,要懂企业,要懂得这个企业的组织架构,要懂得每个人在企业里面扮演的角色
懂行业:来龙去脉,盈利模式,服务的对象
理解公司:产品,服务的对象,对象和产品之间通过什么样的方式,管理者
业务的落地执行:企业级的部门有多少,部门职责,每个部门有多少人,每个人负责什么事情,这些事情都有哪些重要的环节
32.什么是一名合格的数据分析师?
①描述性分析:表格,图表,仪表盘
数据的准确性
掌握数据清洗可视化的能力
有构建业务指标体系的能力
②诊断性分析:对数据做出预判
数据的敏感度
逻辑思维能力:分析问题的框架
数据分析的方法
③预测性分析
掌握一些核心的算法能力:统计学,机器学习,深度学习
强大的编程能力
强大的算法掌握能力
业务抽象建模能力
④指导性分析:价值最高,难度最大
分析问题解决问题的能力
业务认知/构建的能力
执行和复盘的能力