分析的前提是,我们对于每个位置、具备不同特点的英雄类别分开进行判断。
由两个方面入手,一是通过数值策划方面的数据,二是通过玩家对于英雄的使用偏好,判断哪些英雄受热捧,哪些受冷落。
首先绘制出各个位置的英雄的总体平均的各方面数值平均水平。攻击力、防御力、攻击的距离长短、回血能力、移动速度,各方面要素总结为若干类别,得到技能雷达图。另外,基于每一个能力,绘制出箱线图,判断是否有英雄明显是离群点,则单独分析。
另外是玩家数据方面,我们应该先剔除部分营销因素,比如避开英雄和道具有折扣、赠送活动的时间段,数据样本都是由用户自己根据实战经验而进行的选择。可以绘制柱状图首先观察,各个英雄在一段时间内被使用的次数。类似于留存,我们可以构造一个新指标,该英雄被使用后,第二次、第三次、乃至第n次被使用的次数,体现了该英雄受欢迎程度。
游戏划分:明日之后,荒野行动,星际争霸,我的世界
问题的关键词:刚上线(新)、2周
我们可以从渠道分析、用户分析、留存分析、收入分析等指标入手。
首先是我们从各个渠道获得用户。
渠道分析:通过对渠道的分析,我们能够更加精准地展开拉新获客等营销活动;找到较好的渠道后,能够构建忠诚度,并且营造相应的品牌,这是渠道分析的意义。
在渠道中进入游戏后,我们可以进行用户分析。
我的职业规划,确定的目标是数据分析相关岗位,行业圈定于我较为熟悉的互联网金融行业,以及较为喜爱的游戏行业。两个行业其实也有相似的地方,比如都具备较高的用户粘性,然后用户对理财APP或者游戏的细微变动都会极大的关注,也就是我们可以获得较多的页面点击信息,埋点数据。
具体的工作内容是,日常我希望做到与运营方面对接,归纳出能够提高运营方面的拉新获客、提高用户的留存、降低流失等方面的能力,提供用户画像、人群细分、用户流失等原因、AB-TEST效果的归纳。
而在经过一段时间的业务能力积累后,我希望能够自己引导一些数据分析项目。比如利用机器学习算法,以及各类付费用户、以及绝不付费的用户潜在具体特征,对游戏用户进行分类。从而在运营方面,能够更好地瞄准未来新客户的潜在付费行为,进行方向较为确定的营销,给游戏运营降低成本。
参考1
参考2
天池数据分析项目
最大的难点在于模型性能的泛化能力提高
所以需要在至少两个方面进行提高,一是特征工程,包括了数据的预处理、归一化,特征的挑选,高维度特征向低维度特征合并。使用了数值特征的分布来看是否和标记相同。另外也应该使用K-best、卡方等函数方法,来选择具备最多信息的字段作为训练集的数据。
为了在有限的数据里,提高模型的泛化能力。我使用随机森林和boosting模型做了尝试。随机森林由于在决策树的结点进行了特征的随机选择,所以对于每一个弱分类器都有一定的扰动,提高了泛化能力。
除开模型的选择,我运用了pipeline这个包组合了模型训练的流程,运用CV方法,使用测试集来不断更新不同参数下,模型的训练集外的表现能力。
超参数选择:另外是超参数的改进。使用grid-search的确可以不断地在密集的超参数中进行挑选,而重要方法在于能够理解模型本身参数的含义,再来进行挑选。比如随机森林的参数选择,一般使用 k = l o g 2 d k=log_2{d} k=log2d 。也可以通过训练决策树的深浅、结点个数的安排,来有逻辑地、有目的地改进这个模型。
AB-test:从一个多种特征都类似的客户群体里,随机抽取为两个样本,接受实验和不接受实验。实验的时间尽量长,达30天左右。
针对某个指标,进行t检验
首先刻画出两个样本的用户画像、调研新用户以前使用软件、玩游戏的经历和付费等情况。
由于是新用户,所以我们关心能不能活动能不能提高转化率,以及3天、7天、30天留存率。
作者:~微澜…
链接:https://www.nowcoder.com/discuss/277032?type=post&order=time&pos=&page=1
来源:牛客网
我的思路是:对于英雄强弱,我说的是从数据库中取出使用某一个英雄的所有玩家用户数据,分析其各个指标发育情况及胜率情况,与其他的英雄对照指标。对于各种英雄,指标有一个平衡值,比如攻击力、防御力、速度什么的,不同类型的英雄权重不同,但是要保证这些指标最后的加权平均值相等,每个英雄总和相等。若总和不相等则英雄不平衡
京东数科
业务问题关键是问对问题,然后才是拆解问题去解决。
(1)两层模型:从用户画像、渠道、产品、行为环节等角度细分,明确到底是什么样的用户的次日留存率下降了
(2)指标拆解:次日留存率 = Σ 次日留存数 / 今日获客人数
(3)原因分析:
内部因素:
获客 — 新用户(拉新渠道出现问题、拉新运营活动不合理、活动获取了非目标用户)
满足需求方面(软件推出的新功能使得用户不适应)
激活过程(签到等提活手段没有达成目标,没有通过活动提高用户的粘性)
外部因素
1)内部:
a. 运营活动
b. 产品变动
c. 技术故障
d. 设计漏洞(如产生可以撸羊毛的设计)
2)外部:
a. 竞品
b. 用户偏好
c. 节假日
d. 社会事件(如产生舆论)
刷单:如果有若干标记的样本,则用监督的分类算法;相反,如果标记样本太少,或者无法确定是否是刷单,则用聚类算法。首先需要找到特征。
对于某个商家的某个产品:
异常值检测
(1) 日活跃用户数
(2) 如何分析营业额下降——游戏的登录等下降
如果现在有个情景,我们有一款游戏收入下降了,你怎么分析
1)两层模型:细分用户、渠道、产品,看到底是哪里的收入下降了
2)指标拆解:收入=玩家数量活跃占比付费转化率付费次数客单价
进一步细分,如玩家数量=老玩家数量活跃度+新玩家数量留存率等。然后对各个指标与以往的数据进行对比,发现哪些环节导致收入下降
3)原因分析:
a.内部:产品变化、促活活动、拉新活动、定价策略、运营策略、服务器故障等
b.外部:用户偏好变化、市场环境变化、舆论环境变化、竞争对手行为、外部渠道变化等
4)如何提高:基于乘法模型,可以采用上限分析,从前往后依次将指标提升到投入足够精力(假设优先分配人力、经费与渠道)后的上限,然后分析“收入”指标的数值提升。找到数值提升最快的那个阶段,就是我们提高收入的关键任务
(3) 流失用户如何处理
召回活动分有目的召回和无目的召回。有目的的召回很好理解,就是为了召回流失玩家做些活动,如送奖励、道具、金币等。无目的召回就是没有做任何活动的情况下,流失的玩家又回到游戏中,我们称为自然回流用户
营销渠道用户流失分析
哪个营销渠道带来的客户最容易流失?
上季度的新获客策略是否成功吸引了更多客户的加入?
要说明的是,按营销渠道做客户流失分析是公司在获客初期就可以对其营销策略进行改革的绝佳倚靠,这样我们就不用只在客户购买了产品和有了产品体验之后才考虑流失的问题。如果能做到两方面兼顾——既能有效应对不满意的客户,又能从源头上提升渠道客户的质量以提高留存率,那当然是最好的了。
当然,如果你还想用一些常用的客户调查手段来作为以上提到的客户流失分析方式的补充的话,还可以试试这个永不过时最直接的方法:客户退出行为调查。去采访最近停止使用产品的客户(也可以给他们提供适当奖励),简单询问他们对产品,对服务以及对退出使用的看法。当然回复率可能很低,但是得到的反馈和洞察却是别处很难得到的。
用户流失分析,主要根据用户的生命周期和价值两方面去考虑。从生命周期的角度来说,比较关注老用户(核心用户)的流失;从价值的角度来说,比较偏向付费用户的流失。用户在哪些场景下会产生流失,可以通过什么方法来预防这些流失。
用户主动型流失分析
用户主动选择不再接受服务。这么做的原因可能有很多,从客户公司业务方向的改变,到喜欢上其他公司的同类产品,或者到客户一直用不明白产品等等这些都有可能。这些客户是需要花费最多的精力去挽回的那一部分人群。
用户满意型流失分析
客户对产品的服务体验很满意但还是不再续费。一般来讲这些用户之所以使用某个产品,都是因为他们有些专门需求。他们有可能只是为了举办一场活动,完成一项事件,或者单纯为了做好一个短期项目。
用户被动型流失分析
客户未及时更新他们的信用卡信息导致续费失败。挽回这些客户就很简单了,只要用点心给他们做一个付费提醒就可以了,可以按客户的选择来给他们发邮件或短信提醒,或者请客户直接提供更便捷保险的付款方式即可。
用户集群型流失分析
客户流失最多的月份是哪个?
上季度的价格调整对客户流失有何影响?
这可以看出,集群分析是完整分析客户流失的重要环节。它的价值在于既能够显示出公司在业务上的一般表现,也能显示出公司在具体活动或决定之后的业务表现。
(4) (同上)如果京东某个月的营业额下降了,怎么分析。
(5) 预测一个客户下一个下单的时间和下单的商品
(6) 估算每天微信群聊中未命名的群聊数目?
未命名群聊数 = 总群聊数 - 命名群聊数
= 日活 * 人均群聊数 - 人均群聊数 * 命名按钮转换率
人均群聊数涉及到去重问题。
(7) 如何评估社团整体情况和影响力。
(8) 样本不平衡对什么评价指标不影响?为什么
(9) 业务题,假如你是淘宝店主,有一个月的利润率下降了,问你怎么分析原因
(10) 海量日志数据,提取出某日访问百度次数最多的那个IP
(11) 如果一个APP某一天的日活量异常,你怎么分析?
(12) 如何建立预测一个APP的用户流失模型?可以创建哪些特征?
(13) 选择网易的一款产品,说说你怎么运用数据分析提高产品的热度?——比如分析客户流失挽回流失客户
(14) 如何评价模型(分成回归和分类进行指标评价,与BASELINE模型比较等等)
(15) 数据分析和数据挖掘区别在哪里
(16) 如何挽回一个可能要离开游戏的用户
用户的被动流失,比如扣费超过了游戏账户余额,可以通过允许欠费,或者发短消息提示充值等来挽回客户。
用户的主动流失,比如对其他公司的游戏感兴趣,甚至对于本公司的游戏失去兴趣,需要从游戏本身出发考虑。
如果细致到一些操作上,那么可以有若干方法:
标题党:利用夸张的标题——比如游戏最近的充值优惠,或者免费道具来吸引用户
关注信息:利用机器学习LR回归,SVM,决策树,朴素贝叶斯等方法进行分类,获取他们最感兴趣的信息,进行短消息的发送。
通过其与其他用户聊天的ID账号,给他发短信息说明该关注好友正在游戏中等信息
内容相关:比如给用户说,您的分享或者帖子已经引起多少人关注等信息。
(17) 现在有一个游戏测试的环节,游戏测试结束后需要根据数据提交一份PPT,这个PPT你会如何安排?包括什么内容?
这里可以套AARRR模型:
1)获取:我们的用户是谁?用户规模多大?
a.用户分层
2)日活:游戏是否吸引玩家?哪个渠道获取的用户有质量(如次日留存高、首日停留时间长等)?用户的会话次数(比如在某个板块停留的时间和频率),获取的成本
3)留存:用户能否持续留存?哪些用户可以留存?
4)转化:用户的游戏行为如何?能否进行转化?能否持续转化?
5)传播:用户是否会向他人推荐该游戏?哪种方式能有效鼓励用户推荐该游戏?传播k因子是否大于1?
(18) 比如你对楼市不熟悉,现在要你去做一个像58同城之类的,卖房的中介,电商,你会如何进行分析
1)商业模式分析:中介做的是双边市场生意,通过解决市场信息不对称下的信息流动问题,降低买方和卖方的交易成本,从而创造盈利空间
2)需求分析:
a.买方需求分析:低价买好房,对时间的需求有快的和慢的
b.卖方需求分析:房子卖高价,对时间的需求有快的和慢的
3)进入条件分析(套swot也行):
a.自身条件
b.竞争对手
c.市场增长规模
4)进入策略分析:
a.自身目标
b.目标拆解
c.分析目标达成的可能性,预估将来一段时间,好/正常/坏条件下的目标达成情况
d.得出结论:是否进入该市场
(19) 如果有一家网吧,最近收入下降,对面开了一家新网吧,收益却比你高,你怎么分析(他们的重点是要求放在某一指标上比如客流量,要求能从主要到次要,分析几个重要指标。我没答到点上,又被教育一通)
1)两层模型,找到具体是哪个部分收入下降:用户维度(新用户老用户、年龄等画像)、产品(网吧、水饮)
2)指标拆分:
a.收入=客流客单
b.客流=老客数量活跃度+活动曝光度转化人数
c.客单=平均上网时长上网时价+平均饮料食品消费单次价格+平均预充金额(当次充值金额-当次消费金额)
3)原因分析:
a.内部:停止拉新活动、停止拉活活动、定价策略变化、室内环境变化(如烟味重、空调不够等)
b.外部:用户偏好变化、街道交通可达性降低、周边人流下降、竞争对手影响、新游戏需要更好的设备、天气
(20)
(1) 如何区分恶意用户
(2) 对推荐算法和用户画像的理解是什么
(3) 关联挖掘算法?
(4) 如何排除有的客户乱填问卷的情况?
(1) 独立和不相关的区别
(2) T分布
(3) 几种距离度量公
(1) 对数据分析的理解
(2) 玩过什么游戏?尽量往网游上靠近
(3) 经历什么困难?
(4) 大数据都是怎么处理的?
(5) 有没有把什么工作流程自动化过
(6) 一根不均匀绳子燃烧完需要1个小时,如何判断是30分钟和45分钟
30分钟:一根绳子两头同时点燃,全部烧完就是半个小时
45分钟:两根绳子,同时点燃一根的两头和另一根的一头,等到点燃两头的绳子全部烧完后,点燃另一绳子的一头,这根绳子烧完就是45分钟。
(7) 给你一个比较急的项目,如何安排,如何规划直至如期完成?(考验抗压能力)
(8) 公司本身有哪些游戏?什么类别?其中一个游戏有什么特点?
(9) 网易雷火旗下的产品有哪些?????
主要的游戏举例:
作答(1):
首先审核数据下降的真实性,确认数据无误后:
思路一:按用户划分入手,锁定下降原因。根据二八定律,80%的收入由20%人贡献,所以按游戏用户等级(vip等级,消费等级)划分,按等级查看各消费等级用户下降金额,比例。如果某个高等级用户金额有明显下降导致,分析用户的行为指标(月活跃人数,最近登陆时间,游戏时长),逐个分析。
思路二:按游戏消费产品类目划分,锁定下降原因。分析每种消费项目的当月金额,同比下降值。看同比,确认每个消费下降程度。然后再锁定下降产品项目,查看付费用户数,付费金额指标,具体分析。
这两种思路是分析游戏十月的下降事实原因,此外还应该查看去年(或往前查看几年)的9月,10月的收入规律,是否存在某些因素,导致周期性的常规下降。
最后还要查看外部因素,主要考虑竞争对手的相关动作(如出某个相似度高的游戏,吸引了我们的用户,导致用户流失)。如国家出台的某些措施政策,反游戏沉迷,导致下降。
作答(2)
内部因素
游戏玩家减少(kpi=每日活跃人数)
游戏玩家永久性减少,游戏自身可持续度如一个月就可以玩通所有游戏关卡 (kpi=每个玩家在每个剧本的平均停留时长,每个玩家游戏生命周期平均总时长)
游戏质量下降,比如出了新的剧本,质量不好 (kpi=玩家差评率)
付费减少(kpi=平均付费额)
可购买道具有限(kpi=用户购买道具比率变化)
外部因素
政府管制
如年龄18岁以下禁止(kpi=根据政府政策调整之后,前后对比,对比年龄比率的变化,对比总收入变化)
季节性 如暑假结束 (kpi 同上)
竞争对手
出现类似游戏,抢走了用户(kpi=花钱买一些行业报告,比如网页或手机应用商店的下载次数对比)
说明:思考进入商品详情页顾客的行为流程。首先是滑动,聚焦于某个区间,逗留于某界面,进入详细商品,是否会点击评论,相关产品的点击,循环以上流程,购买行为发生。
1.相关商品的点击率=相关商品链接点击次数/当前页面浏览次数
2.相关商品的购买率=购买行为发生次数/相关商品浏览行为次数
3.当前商品与相关商品一同购买的概率=共同购买/当前商品购买
1、访问量
2、点击率:即点击进入接口的数量/访问量
3、购买率:即成功下单的数量/点击量
首先观察实验组访问量随时间的变化趋势图,刚开始几天可能会出现逐渐下降或逐渐上升的情况,等到趋于一个稳定趋势时,检测与对照组是否有显著差别。在一段时间内的访问量应该服从泊松分布,设这段时间为一天,那么要检验ab两组无差别,即H0:X1=X2。由于泊松分布可以近似为正态分布,故可以用t检验。
点击率为每个顾客的点击率,假设顾客点击的概率就为点击率,假设AB无显著差异,即P1=P2。根据中心极限定理,样本量足够大时,均值服从正态分布,故可用t检验。
购买率的检验方式与点击率相同。