最近在准备数据分析岗位的笔试,整理了牛客网上的一些试题与答案方便查看(只摘部分)。
ps:在牛客网搜索框搜索"数据分析",点击搜索分类版块“试卷”即可看到笔试套题。
1. 一般通过下面哪个指标来衡量用户的活跃值?
正确答案:DAU
参考解析:
DAU-Daily Active User 日活跃用户数量
ARPU-Average Revenue Per User 每用户平均收益
ARPPU-Average Revenue per Paying User 每付费用户平均收益
LTV-Life Time Value生命周期总价值,意为客户终生价值
2、请根据下列数字的规律,推测括号中的数字应该是多少?0,6,24,60,120,( )
正确答案:210
参考解析:
x=n*(n*n-1)
3、请根据下列数字的规律,推测括号中的数字应该是多少?20/9,4/3,7/9,4/9,1/4,( )
正确答案:5/36
参考解析:
相邻两数相除就会发现规律:
20/9 除以 4/3 =5/3= 10/6
4/3 除以7/9 = 12/7
7/9 除以4/9 =7/4= 14/8
4/9 除以 1/4 = 16/9
1/4 除以?= 18/10
规律是分子为:10,12,14,16,18分母为:6,7,8,9,10
因此下一个要填的数是5/36
4、某游戏,收入4月份比3月下降了20%,请列出收入下降的分析思路及参考指标。
【参考民间回答1】角度--指标--原因
首先审核数据下降的真实性,确认数据无误后:
【参考民间回答2】
【博主回答参考】本质--对比指标--细因
分析:收入下降的本质原因可能有这些,用户数减少、平均用户付费额减少
思路一:从用户数入手:(可细分用户再进行分析,对比不同类用户的变化)
内部:
外部:
思路二:从平均用户付费额入手:(可细分用户再进行分析,对比不同类用户的变化)
5、请简述K-means算法原理、过程及其在游戏数据分析中的应用。
【参考民间回答】
K-Means算法原理:
K-means算法的基本思想是:对于给定样本数据集,将样本数据集分成K类,使类间样本点的距离尽可能地大,类内样本点的距离尽可能地小;
实现过程:
1.确定分类数K,随机初始化K个质心;
2.计算所有样本点到K个质心的距离,并将其分配到离他最近的质心所在的类中;
3.计算类的均值,将类均值作为新的质心;
4.重复2、3步,直到质心不再发生变化或达到迭代终止条件。
在数据分析中的作用:
可以对用户进行K-means聚类:将用户按活跃状态划分为活跃用户、高危用户和流失用户;或者按照用户等级等将用户划分为高级用户、中级用户和低级用户。聚类之后可以按照用户的不同类别给用户推送不同的内容。
6、根据以下表格,请填写求各地区充值总金额(美元)的excel函数。
答案:=SUMPRODUCT(D6:D14,E6:E14)
7.根据以下已知表格,求各物品的购买数量,请书写excel步骤,及其相关函数:
参考答案:
1、在表1后新加一列,取名物品名称,=VLOOKUP(B22,$G$21:$H$29,2,0),然后往下拉
2、在表1物品名称后再新加一列,取名性别,=IF(C22="female","女","男"),然后往下拉
3、在求购买数量-购买数量下,添加函数,=SUMIFS($D$22:$D$34,$E$22:$E$34,B39,$F$22:$F$34,C39),然后往下拉
8、
【参考民间回答】
A、
select
count(distinct B.userid),
sum(B.money)
from B
left join A on A.userid=B.userid
where A.date>=2017
B、
SELECT A.DATE,
COUNT(DISTINCT B.USERID)
FROM B LEFT JOIN A ON B.USERID=A.USERID
WHERE DATE_FORMAT(B.DATE,'%Y-%C')='2016-12'
GROUP BY 1