正题前有个分享给你:京东秋招管培生题型分享+技术类题型各两篇。到我的个人微信号Bersheka回复JD即可。本周内有效。
VIT精品群中的每日一问(9月5日)
背景知识:
1.检索量是什么?
一般情况下每发起一次检索请求记为一次检索,当同一用户发起多次检索时记为多个检索量,而同一用户在短时间内检索同一搜索词时,不重复累计。
2.下降5%是什么概念
针对于百度这么大体量的公司来看,下降5%意味着损失了过亿的检索量,天然的单一突发事件几乎不可能造成这么大的检索量流失。
首先贴一张百度内网的解决办法:
讲真:很羞愧,我看不懂。
接下来根据我的理解简单说说我的思路(结合了在地铁上和SK君的讨论):
一、流量入口方面:百度的手机端或PC端等流量入口是否出现了异常
二、反作弊风控是否出现了问题
三、百度自身的服务器等是否出现异常
四、热点事件的降低以及百度自身的品牌形象受损等都可以归结为社会环境对检索量的影响。
五、竞品的营销动作会对百度的检索量有一定影响。
外部因素对于检索量的影响应该会更大一点。
以下是群里其他同学的回答:
最后做总结:群里的几个回答都是从自身和外部两个因素进行考虑。而考虑最多的方向还是环境因素(是否有恶意事件的出现,竞争对手是否有恶意营销等);从内部角度来讲会更多的考虑到自身某个板块、某个流量入口等出现的问题,以对症下药;另外一种小型(小概率发生)影响因素则从用户本身出发,如是否断网。而辩证思想(冷静思维)则体现在:这个数据是否本来就是正常的呢,只是前段时间因特殊情况而太高了而已。
补充群内VIT小咖的总结答案:
第一步:数据异常分析的基础数据层面要点有哪些?
1)全局指标分析。
全局指标包含但不限于一段合理的时间段内的检索量、独立用户数、总CTR、首次点击时间、翻页率等。以上全局指标可用于排查全局性问题,比如节日、重大事件效应,另外可以发现用户行为异常以进一步缩小问题范围。
2)分渠道数据分析。
主要统计多个维度不同渠道的指标,渠道可以按引流方式、地域、浏览器、操作系统、运营商等分类。此步骤主要用于观察渠道数据是否有异常,常常可以定位到如浏览器切换默认搜索引擎、地方运营商劫持之类的问题。
3)用户行为数据分析。
在1)和2)的基础上,分析用户不同时间段、不同群体、不同需求类型下的数据情况,另外在1)的基础上,更细致地分析则需要抽取随机(检索词),通过用户session(用户为了得到某个信息而在一段时间内连续搜索的行为)人工排查是否出现行为异常。此步骤主要为排查是否有事件导致用户行为异常,例如开学了,学生们都乖乖回去上课了,可能导致娱乐类搜索量下降。
4)搜索结果数据分析。
针对搜索各类型结果做数据分析,分结果类型统计影响面、点击率、结尾点击率等数据。此步骤主要为排查是否出现结果异常,尤其是排查是否线上出现事故。
以上数据需要在定位到原因后严格计算原因造成的检索量损失是否真的吻合实际数据,比如假设认为是某节日引起的,则必须拉取同比数据对比同样该节日的情况下下降数据是否接近,如果仍有较大偏差则不能掉以轻心,需要继续排查直到数据最终符合预期为止。
第二步:除了数据之外,还有哪些手段配合定位原因?
1)舆情监控。
舆情监控包括但不限于从内部反馈渠道、微博、论坛、朋友圈等方式收集用户对百度搜索的反馈,一般来说,过亿的检索量影响是极有可能在舆情层面发现问题的。
2)其他产品线监控。
除了第一步4)中提到的基本数据之外,实际上其他产品线监控数据也是可以协助排查问题的,例如行为异常,其他类似贴吧、视频之类的产品线可以提供佐证数据。
3.详细解答
为了分析百度检索量下降5%的原因,可以按照以下步骤进行分析。
(1)排查全局指标,排查以下因素
1)同比数据是否有同级别下降?排查是否周期性影响,如节日、重大赛事影响等。
2)环比数据特征?平稳下降还是骤跌?排查突发性事件还是累积性事件。
3)排查CTR、首点时间、翻页率等,确认是否有全局性影响因素导致用户数据异常。
(2)排查分渠道数据,排查以下因素
1)是否出现个别地区大幅下跌?
2)是否出现个别运营商大幅下跌?
3)是否出现个别UA大幅下跌?
……(其他可能性不赘述)
(3)排查用户行为变化,排查以下因素
1)是否某群体使用百度的量减小?
2)是否某类需求在百度搜索减少?
3)是否某些场景下使用百度的量减小?
……(其他可能性不赘述)
(4)排查搜索结果变化,挨个儿追查产品线上线、下线情况,主要排查是否出现事故
(5)同时结合舆情、同类/相关产品线,进行协助分析
排查完成后,定位到某个具体原因,然后根据具体原因来考虑止损方案。