007数据分析能力:业务题

评价游戏中英雄的平衡情况,怎么做

分析的前提是,我们对于每个位置、具备不同特点的英雄类别分开进行判断。
由两个方面入手,一是通过数值策划方面的数据,二是通过玩家对于英雄的使用偏好,判断哪些英雄受热捧,哪些受冷落。

首先绘制出各个位置的英雄的总体平均的各方面数值平均水平。攻击力、防御力、攻击的距离长短、回血能力、移动速度,各方面要素总结为若干类别,得到技能雷达图。另外,基于每一个能力,绘制出箱线图,判断是否有英雄明显是离群点,则单独分析。

另外是玩家数据方面,我们应该先剔除部分营销因素,比如避开英雄和道具有折扣、赠送活动的时间段,数据样本都是由用户自己根据实战经验而进行的选择。可以绘制柱状图首先观察,各个英雄在一段时间内被使用的次数。类似于留存,我们可以构造一个新指标,该英雄被使用后,第二次、第三次、乃至第n次被使用的次数,体现了该英雄受欢迎程度。

网易大神

游戏划分:明日之后,荒野行动,星际争霸,我的世界

  1. 福利中心:领取绑定的礼包
  2. 交易市场:买卖账号
  3. 在线问答:游戏方法交流
  4. 直播:对接到CC直播
  5. 游戏其他材料和物件合成的图鉴教程

刚上线2周的新游戏可以有哪些指标效果

问题的关键词:刚上线(新)、2周

我们可以从渠道分析、用户分析、留存分析、收入分析等指标入手。
首先是我们从各个渠道获得用户。
渠道分析:通过对渠道的分析,我们能够更加精准地展开拉新获客等营销活动;找到较好的渠道后,能够构建忠诚度,并且营造相应的品牌,这是渠道分析的意义。

  1. 相应的指标包括了媒体推广、社交推广、广告、第三方市场等渠道数据。
  2. 在拉新获客时,如果产品推广营销人员仅仅把下载量当做唯一KPI,可能会导致用户后续的质量、行为被忽略。我们需要关注后续的用户下载量、留存、活跃度等指标,来判断推广营销策略是否是符合该渠道的。
  3. 数量方面: 下载量、注册量、注册的渠道比例、注册转化率。如果可以获得数据,应该也关注用户的网络质量、加载游戏的时间
  4. 质量方面:
    日活跃度(每天登录游戏的用户数量)
    一日玩家比例(只在新增日登录后再也没有登录比例)——这部分的用户是刚性流失,是难以通过后续的营销活动进行挽回的;所以该指标分析之后,需要进一步看留存率的水分到底有多高
    次日留存率(新增玩家在第二天还会登录)
    每日新增/每日活跃=每日新增/(每日新增 + 每日登录老用户):如果比例越接近于1,说明大多数的活跃数都是由新增用户支撑的,老用户较少,忠诚度较低
    首周付费率(在新增日的7天内进行付费的比率)——用户在第一周进行付费后,培养起付费的习惯;首周没有付费习惯的后续也难以培养
  5. 收入方面:
    游戏收入、付费人数、各类付费方式、付费用户对应的等级、付费的频率和时间间隔、付费和游戏道具之间潜在的关系
    收入 = 每日活跃用户数 * 每个活跃用户平均收入 = (每日新增 + 每日登陆老用户) * 付费率 * 每个付费用户平均收入

在渠道中进入游戏后,我们可以进行用户分析。

用户分析:

  1. 用户使用的平台、时间段分析——手机机型、登录集中的时间段
  2. 研究游戏产品、哪些因素能够留下或者损失新的用户规模、活跃规模、付费比例
    比如游戏存在着黑色一分钟,用户在进行游戏的下载、安装、进程等过程中,可能遭遇启动时间长、卡顿、闪退、耗电、发热等影响体验的不良因素。比如收集手机型号、响应时间和新增用户的关系,能够帮助我们更好地改进产品。
  3. 在比如“黑色一分钟”过滤了大部分非目标用户,以及部分的目标用户后,我们需要引入参与游戏了的用户的核心指标
    每个活跃用户平均收入 ARPU、付费转化率、留存率、游戏时长
    游戏内——关卡、用户的等级,便于研究之后的付费转化
  4. 活跃用户的解读:DAU指标
    主要思路
    (1)核心用户规模:利用DNU / DAU:看出游戏的稳定性
    (2)产品黏性:DAU是由不同时期的新增用户的留存构成的。初期留存看的是用户对产品的兴趣,长期留存看的是游戏产品的质量与水平高低。
    (3)用户流失DAU:流失有多少程度是可预估的,多少是意料之外的

如何衡量一个游戏付费环境是否健康

你的数据分析应用到哪些行业?职业规划

我的职业规划,确定的目标是数据分析相关岗位,行业圈定于我较为熟悉的互联网金融行业,以及较为喜爱的游戏行业。两个行业其实也有相似的地方,比如都具备较高的用户粘性,然后用户对理财APP或者游戏的细微变动都会极大的关注,也就是我们可以获得较多的页面点击信息,埋点数据。

具体的工作内容是,日常我希望做到与运营方面对接,归纳出能够提高运营方面的拉新获客、提高用户的留存、降低流失等方面的能力,提供用户画像、人群细分、用户流失等原因、AB-TEST效果的归纳。

而在经过一段时间的业务能力积累后,我希望能够自己引导一些数据分析项目。比如利用机器学习算法,以及各类付费用户、以及绝不付费的用户潜在具体特征,对游戏用户进行分类。从而在运营方面,能够更好地瞄准未来新客户的潜在付费行为,进行方向较为确定的营销,给游戏运营降低成本。

直播的数据分析

参考1

参考2

玩过什么游戏,

介绍数据分析项目,以及最大的难点——要突出自己怎么解决的(能力点)

天池数据分析项目
最大的难点在于模型性能的泛化能力提高
所以需要在至少两个方面进行提高,一是特征工程,包括了数据的预处理、归一化,特征的挑选,高维度特征向低维度特征合并。使用了数值特征的分布来看是否和标记相同。另外也应该使用K-best、卡方等函数方法,来选择具备最多信息的字段作为训练集的数据。
为了在有限的数据里,提高模型的泛化能力。我使用随机森林和boosting模型做了尝试。随机森林由于在决策树的结点进行了特征的随机选择,所以对于每一个弱分类器都有一定的扰动,提高了泛化能力。
除开模型的选择,我运用了pipeline这个包组合了模型训练的流程,运用CV方法,使用测试集来不断更新不同参数下,模型的训练集外的表现能力。

超参数选择:另外是超参数的改进。使用grid-search的确可以不断地在密集的超参数中进行挑选,而重要方法在于能够理解模型本身参数的含义,再来进行挑选。比如随机森林的参数选择,一般使用 k = l o g 2 d k=log_2{d} k=log2d 。也可以通过训练决策树的深浅、结点个数的安排,来有逻辑地、有目的地改进这个模型。

拉新活动,怎么分析效果

AB-test:从一个多种特征都类似的客户群体里,随机抽取为两个样本,接受实验和不接受实验。实验的时间尽量长,达30天左右。
针对某个指标,进行t检验
首先刻画出两个样本的用户画像、调研新用户以前使用软件、玩游戏的经历和付费等情况。
由于是新用户,所以我们关心能不能活动能不能提高转化率,以及3天、7天、30天留存率。

怎么从游戏用户的角度去进行英雄的迭代优化?指导产品优化?

如果让你评价游戏中英雄的平衡情况,怎么去做,如何去看游戏中的英雄强不强?假设产品下一周需要优化英雄的各个指标,需求是你这边给到他们目前游戏中设置的强势英雄数据,怎么做?

作者:~微澜…
链接:https://www.nowcoder.com/discuss/277032?type=post&order=time&pos=&page=1
来源:牛客网

我的思路是:对于英雄强弱,我说的是从数据库中取出使用某一个英雄的所有玩家用户数据,分析其各个指标发育情况及胜率情况,与其他的英雄对照指标。对于各种英雄,指标有一个平衡值,比如攻击力、防御力、速度什么的,不同类型的英雄权重不同,但是要保证这些指标最后的加权平均值相等,每个英雄总和相等。若总和不相等则英雄不平衡

如何评价游戏中社交活动属性?需要看哪些指标来了解社交状况?

你常玩的游戏有哪些?挑一个谈一谈你认为这个游戏还有哪些优化迭代空间?

举一个证明你的学习能力很强的例子

深挖简历产品数据分析项目,分析竞品不同特点,数据是怎么分析的?指标是如何拆解的?最后怎么落地的?

京东数科

分析付费额度的下降

  1. 先找出付费下降的用户的各类特征
    (1)用户的地区、年龄等各类特征
    (2)付费下降的日期范围、具体时间段
    (3)用户的使用历史,付费历史;新老客户的判断
    (4)付费下降发生在哪个版块,具体来说是什么类型的产品/道具
  2. 确定好了某个范围的样本后,进行指标的拆解
    (1)销售额 = 进入的流量 * 下单率(购买率) * 客单价
    (2)进入流量 = sum(各个渠道流量 * 转化率)
    (3)下单率 = 购买页面的访问率 * 转化率
    (4)客单价 = 商品数量 * 商品价格
  3. 定性地分析潜在的原因
    (1)内部:运营方面的营销活动造成的波动,产品某个界面出现问题,某些游戏道具在一段时间后用户失去兴趣(比如对战游戏的皮肤需要频繁更新)
    (2)外部:节日因素、竞品因素、媒体新闻、用户的热点需求

如何分析次日留存率下降的问题

业务问题关键是问对问题,然后才是拆解问题去解决。
(1)两层模型:从用户画像、渠道、产品、行为环节等角度细分,明确到底是什么样的用户的次日留存率下降了
(2)指标拆解:次日留存率 = Σ 次日留存数 / 今日获客人数
(3)原因分析:
内部因素:
获客 — 新用户(拉新渠道出现问题、拉新运营活动不合理、活动获取了非目标用户)
满足需求方面(软件推出的新功能使得用户不适应)
激活过程(签到等提活手段没有达成目标,没有通过活动提高用户的粘性)
外部因素

1)内部:
     a. 运营活动
     b. 产品变动
     c. 技术故障
     d. 设计漏洞(如产生可以撸羊毛的设计)
     
2)外部:   
  a. 竞品
  b. 用户偏好
  c. 节假日
  d. 社会事件(如产生舆论)

如何分析商家刷单?

刷单:如果有若干标记的样本,则用监督的分类算法;相反,如果标记样本太少,或者无法确定是否是刷单,则用聚类算法。首先需要找到特征。
对于某个商家的某个产品:

  1. 商家特征(通过商家本身的特征,判断商家是否存在好评率异常过高):商家的信用程度,过往的销量,历史的好评出现时间聚集度,被投诉次数
  2. 用户行为特征(我们要判断这个人是否真的是正常的用户,是否和普通人一样有较为固定的下单路径、支付路径):用户过往的购买行为,评论的字符长度,评论的图片数目,购买记录和评论的时间差,用户信用,下单路径,浏览页面的行为,下单转化率
  3. 机器环境特征(可能机器刷单的是集中刷单):登录的IP地址,登录的终端类型,地区
  4. 异常变动(是否有经常转变登录的地址)
  5. 评论的文本近似度检测
  6. 评论的图片近似度检测

检测游戏作弊、挂机

检测直播的恶意言论或者是违规的直播

用户流失分析;新老用户的流失有何区别

  1. 用户流失分析
    (1)第一是,细分整个过程中,产品端、渠道的获新、用户生命周期,哪个环节出现了用户的流失。
    (2)第二是,拆解用户流失量的指标, = sum(各个类别的用户数量 * 流失率)。进行用户画像、或者是新老的区分,来看是因为用户数量增加导致的流失量增加,还是某个特定的用户类别出现了流失率的提高。
  2. 新用户
    在AARRR模型中,新用户处于刚获取、激活的阶段,流失可能是因为非目标用户产品没有满足需求,游戏最开始上手受挫、无法接受游戏的画风竞品吸引了新客户。新用户的数据较少,所以需要在有限的数据里进行分析。
  3. 老用户
    相反,老用户的数据较为齐全。用户粘性较高,所以需要尽量留住老用户。
    (1)用户的生命周期衰退期(2)过度提高游戏内道具价格,导致低端用户的流失(3)游戏的功能难以满足用户需求

来源渠道如何进行异常值检测

异常值检测

如何分析、评估、预测(整理后)

如何处理(整理后)

原材料(整理前)

(1) 日活跃用户数

(2) 如何分析营业额下降——游戏的登录等下降
如果现在有个情景,我们有一款游戏收入下降了,你怎么分析
1)两层模型:细分用户、渠道、产品,看到底是哪里的收入下降了
2)指标拆解:收入=玩家数量活跃占比付费转化率付费次数客单价
进一步细分,如玩家数量=老玩家数量活跃度+新玩家数量留存率等。然后对各个指标与以往的数据进行对比,发现哪些环节导致收入下降
3)原因分析:
a.内部:产品变化、促活活动、拉新活动、定价策略、运营策略、服务器故障等
b.外部:用户偏好变化、市场环境变化、舆论环境变化、竞争对手行为、外部渠道变化等
4)如何提高:基于乘法模型,可以采用上限分析,从前往后依次将指标提升到投入足够精力(假设优先分配人力、经费与渠道)后的上限,然后分析“收入”指标的数值提升。找到数值提升最快的那个阶段,就是我们提高收入的关键任务

(3) 流失用户如何处理
召回活动分有目的召回和无目的召回。有目的的召回很好理解,就是为了召回流失玩家做些活动,如送奖励、道具、金币等。无目的召回就是没有做任何活动的情况下,流失的玩家又回到游戏中,我们称为自然回流用户

营销渠道用户流失分析
  哪个营销渠道带来的客户最容易流失?
  上季度的新获客策略是否成功吸引了更多客户的加入?
  要说明的是,按营销渠道做客户流失分析是公司在获客初期就可以对其营销策略进行改革的绝佳倚靠,这样我们就不用只在客户购买了产品和有了产品体验之后才考虑流失的问题。如果能做到两方面兼顾——既能有效应对不满意的客户,又能从源头上提升渠道客户的质量以提高留存率,那当然是最好的了。
  当然,如果你还想用一些常用的客户调查手段来作为以上提到的客户流失分析方式的补充的话,还可以试试这个永不过时最直接的方法:客户退出行为调查。去采访最近停止使用产品的客户(也可以给他们提供适当奖励),简单询问他们对产品,对服务以及对退出使用的看法。当然回复率可能很低,但是得到的反馈和洞察却是别处很难得到的。

用户流失分析,主要根据用户的生命周期和价值两方面去考虑。从生命周期的角度来说,比较关注老用户(核心用户)的流失;从价值的角度来说,比较偏向付费用户的流失。用户在哪些场景下会产生流失,可以通过什么方法来预防这些流失。

用户主动型流失分析
  用户主动选择不再接受服务。这么做的原因可能有很多,从客户公司业务方向的改变,到喜欢上其他公司的同类产品,或者到客户一直用不明白产品等等这些都有可能。这些客户是需要花费最多的精力去挽回的那一部分人群。

用户满意型流失分析
  客户对产品的服务体验很满意但还是不再续费。一般来讲这些用户之所以使用某个产品,都是因为他们有些专门需求。他们有可能只是为了举办一场活动,完成一项事件,或者单纯为了做好一个短期项目。

用户被动型流失分析
  客户未及时更新他们的信用卡信息导致续费失败。挽回这些客户就很简单了,只要用点心给他们做一个付费提醒就可以了,可以按客户的选择来给他们发邮件或短信提醒,或者请客户直接提供更便捷保险的付款方式即可。

用户集群型流失分析
  客户流失最多的月份是哪个?
  上季度的价格调整对客户流失有何影响?
  这可以看出,集群分析是完整分析客户流失的重要环节。它的价值在于既能够显示出公司在业务上的一般表现,也能显示出公司在具体活动或决定之后的业务表现。

(4) (同上)如果京东某个月的营业额下降了,怎么分析。
(5) 预测一个客户下一个下单的时间和下单的商品

(6) 估算每天微信群聊中未命名的群聊数目?
未命名群聊数 = 总群聊数 - 命名群聊数
= 日活 * 人均群聊数 - 人均群聊数 * 命名按钮转换率
人均群聊数涉及到去重问题。

(7) 如何评估社团整体情况和影响力。

(8) 样本不平衡对什么评价指标不影响?为什么

(9) 业务题,假如你是淘宝店主,有一个月的利润率下降了,问你怎么分析原因

(10) 海量日志数据,提取出某日访问百度次数最多的那个IP

(11) 如果一个APP某一天的日活量异常,你怎么分析?

(12) 如何建立预测一个APP的用户流失模型?可以创建哪些特征?

(13) 选择网易的一款产品,说说你怎么运用数据分析提高产品的热度?——比如分析客户流失挽回流失客户

(14) 如何评价模型(分成回归和分类进行指标评价,与BASELINE模型比较等等)

(15) 数据分析和数据挖掘区别在哪里

(16) 如何挽回一个可能要离开游戏的用户
用户的被动流失,比如扣费超过了游戏账户余额,可以通过允许欠费,或者发短消息提示充值等来挽回客户。
用户的主动流失,比如对其他公司的游戏感兴趣,甚至对于本公司的游戏失去兴趣,需要从游戏本身出发考虑。

如果细致到一些操作上,那么可以有若干方法:
 标题党:利用夸张的标题——比如游戏最近的充值优惠,或者免费道具来吸引用户
 关注信息:利用机器学习LR回归,SVM,决策树,朴素贝叶斯等方法进行分类,获取他们最感兴趣的信息,进行短消息的发送。
 通过其与其他用户聊天的ID账号,给他发短信息说明该关注好友正在游戏中等信息
 内容相关:比如给用户说,您的分享或者帖子已经引起多少人关注等信息。

(17) 现在有一个游戏测试的环节,游戏测试结束后需要根据数据提交一份PPT,这个PPT你会如何安排?包括什么内容?
这里可以套AARRR模型:
1)获取:我们的用户是谁?用户规模多大?
a.用户分层
2)日活:游戏是否吸引玩家?哪个渠道获取的用户有质量(如次日留存高、首日停留时间长等)?用户的会话次数(比如在某个板块停留的时间和频率),获取的成本
3)留存:用户能否持续留存?哪些用户可以留存?
4)转化:用户的游戏行为如何?能否进行转化?能否持续转化?
5)传播:用户是否会向他人推荐该游戏?哪种方式能有效鼓励用户推荐该游戏?传播k因子是否大于1?

(18) 比如你对楼市不熟悉,现在要你去做一个像58同城之类的,卖房的中介,电商,你会如何进行分析
1)商业模式分析:中介做的是双边市场生意,通过解决市场信息不对称下的信息流动问题,降低买方和卖方的交易成本,从而创造盈利空间
2)需求分析:
a.买方需求分析:低价买好房,对时间的需求有快的和慢的
b.卖方需求分析:房子卖高价,对时间的需求有快的和慢的
3)进入条件分析(套swot也行):
a.自身条件
b.竞争对手
c.市场增长规模
4)进入策略分析:
a.自身目标
b.目标拆解
c.分析目标达成的可能性,预估将来一段时间,好/正常/坏条件下的目标达成情况
d.得出结论:是否进入该市场
(19) 如果有一家网吧,最近收入下降,对面开了一家新网吧,收益却比你高,你怎么分析(他们的重点是要求放在某一指标上比如客流量,要求能从主要到次要,分析几个重要指标。我没答到点上,又被教育一通)
1)两层模型,找到具体是哪个部分收入下降:用户维度(新用户老用户、年龄等画像)、产品(网吧、水饮)
2)指标拆分:
a.收入=客流客单
b.客流=老客数量
活跃度+活动曝光度转化人数
c.客单=平均上网时长
上网时价+平均饮料食品消费单次价格+平均预充金额(当次充值金额-当次消费金额)
3)原因分析:
a.内部:停止拉新活动、停止拉活活动、定价策略变化、室内环境变化(如烟味重、空调不够等)
b.外部:用户偏好变化、街道交通可达性降低、周边人流下降、竞争对手影响、新游戏需要更好的设备、天气
(20)

【业务问题:用户画像】

(1) 如何区分恶意用户
(2) 对推荐算法和用户画像的理解是什么
(3) 关联挖掘算法?
(4) 如何排除有的客户乱填问卷的情况?

【统计】

(1) 独立和不相关的区别
(2) T分布
(3) 几种距离度量公

【综合】

(1) 对数据分析的理解
(2) 玩过什么游戏?尽量往网游上靠近
(3) 经历什么困难?
(4) 大数据都是怎么处理的?
(5) 有没有把什么工作流程自动化过
(6) 一根不均匀绳子燃烧完需要1个小时,如何判断是30分钟和45分钟
30分钟:一根绳子两头同时点燃,全部烧完就是半个小时
45分钟:两根绳子,同时点燃一根的两头和另一根的一头,等到点燃两头的绳子全部烧完后,点燃另一绳子的一头,这根绳子烧完就是45分钟。
(7) 给你一个比较急的项目,如何安排,如何规划直至如期完成?(考验抗压能力)
(8) 公司本身有哪些游戏?什么类别?其中一个游戏有什么特点?
(9) 网易雷火旗下的产品有哪些?????
主要的游戏举例:

  1. 网易实况足球:集中于分析阵型、玩家活跃度、是否具有多种阵型还是主要是坚持某种攻防风格。缺陷是场景太少,能够分析的礼包、角色类别有限制。
  2. 英雄联盟:角色较多,地图较为固定,打怪、攻击角色挑选或者路线习惯都能够体现玩家特征,单局购买道具数量、习惯。
  3. (雷火)逆水寒:

含有趋势,寻找原因(归因)

  1. 某款游戏10月份收入比同年9月份下降了20%,作为数据分析师,你会从哪些方面分析收入下降原因?
    作答要求:1)列举至少2种以上拆分思路 2)写清楚每种思路下对应的数据指标

作答(1):
首先审核数据下降的真实性,确认数据无误后:
思路一:按用户划分入手,锁定下降原因。根据二八定律,80%的收入由20%人贡献,所以按游戏用户等级(vip等级,消费等级)划分,按等级查看各消费等级用户下降金额,比例。如果某个高等级用户金额有明显下降导致,分析用户的行为指标(月活跃人数,最近登陆时间,游戏时长),逐个分析。
思路二:按游戏消费产品类目划分,锁定下降原因。分析每种消费项目的当月金额,同比下降值。看同比,确认每个消费下降程度。然后再锁定下降产品项目,查看付费用户数,付费金额指标,具体分析。
这两种思路是分析游戏十月的下降事实原因,此外还应该查看去年(或往前查看几年)的9月,10月的收入规律,是否存在某些因素,导致周期性的常规下降。
最后还要查看外部因素,主要考虑竞争对手的相关动作(如出某个相似度高的游戏,吸引了我们的用户,导致用户流失)。如国家出台的某些措施政策,反游戏沉迷,导致下降。

作答(2)
内部因素
游戏玩家减少(kpi=每日活跃人数)
游戏玩家永久性减少,游戏自身可持续度如一个月就可以玩通所有游戏关卡 (kpi=每个玩家在每个剧本的平均停留时长,每个玩家游戏生命周期平均总时长)
游戏质量下降,比如出了新的剧本,质量不好 (kpi=玩家差评率)
付费减少(kpi=平均付费额)
可购买道具有限(kpi=用户购买道具比率变化)
外部因素
政府管制
如年龄18岁以下禁止(kpi=根据政府政策调整之后,前后对比,对比年龄比率的变化,对比总收入变化)
季节性 如暑假结束 (kpi 同上)
竞争对手
出现类似游戏,抢走了用户(kpi=花钱买一些行业报告,比如网页或手机应用商店的下载次数对比)

  1. 每款游戏里都会有各式各样的付费礼包,但对于这个大众礼包,付费效果并不理想,如何能有效拉动用户付费是每款游戏都会思考的问题。那么请选取你比较熟悉的一款游戏,基于玩家的游戏行为数据,对用户进行分类, 设计几类个性化付费礼包,以期提升游戏付费。
    作答要求:1)写明人群分类方法2)列出选取的指标项 3)写明每类人群特征及对应礼包内包含的道具类型4)(选答)如果有推送场景限制的,可写明推送场景。

含模型类

  1. 如何识别外挂?使用什么(机器学习)模型?
    当没有标记时,如何识别?——可能是要面试者结合游戏体验,寻找特征。
    业务(寻找特征):
    鼠标、键盘超过多少时间不动——如何定义多少时间(通过离群点)
    模型(机器学习):
    如何在未知Y的时候进行分类?——无监督学习方法(聚类)

AB-test

  1. 经一番研究后,我们开发出了一个新的商品详情页中’相关商品’模块的算法,并且打算通过AB Test(50%用户保留原先的算法逻辑为控制组,50%用户使用新的算法逻辑为实验组)来进行评估。假如你是此次实验的数据分析师,请问你会怎么评估控制组和实验组的表现?请按重要性列出最重要的三个指标并给出你的分析过程。

说明:思考进入商品详情页顾客的行为流程。首先是滑动,聚焦于某个区间,逗留于某界面,进入详细商品,是否会点击评论,相关产品的点击,循环以上流程,购买行为发生。

1.相关商品的点击率=相关商品链接点击次数/当前页面浏览次数
2.相关商品的购买率=购买行为发生次数/相关商品浏览行为次数
3.当前商品与相关商品一同购买的概率=共同购买/当前商品购买

1、访问量
2、点击率:即点击进入接口的数量/访问量
3、购买率:即成功下单的数量/点击量
首先观察实验组访问量随时间的变化趋势图,刚开始几天可能会出现逐渐下降或逐渐上升的情况,等到趋于一个稳定趋势时,检测与对照组是否有显著差别。在一段时间内的访问量应该服从泊松分布,设这段时间为一天,那么要检验ab两组无差别,即H0:X1=X2。由于泊松分布可以近似为正态分布,故可以用t检验。
点击率为每个顾客的点击率,假设顾客点击的概率就为点击率,假设AB无显著差异,即P1=P2。根据中心极限定理,样本量足够大时,均值服从正态分布,故可用t检验。
购买率的检验方式与点击率相同。

你可能感兴趣的:(笔试面试-数据分析)