数据集共有82934条数据,109个字段,记录了一个游戏,玩家注册后一周的行为跟踪数据,主要针对以下10个字段进行相关分析。
注:数据来源于 DataFrog数据分析 https://space.bilibili.com/359939497
主要从以下四个方面进行:
-- 此数据中,distinct 加不加都是一样的
select count(distinct user_id)as 新增玩家数量
from game_analyst;
#查看数据中user_id是否唯一性,即查询user_id>1是否存在
select user_id,count(1)
from game_analyst
group by user_id
having count(1)>1;
-- 新增付费玩家数量
select count(distinct user_id) as 新增付费玩家数量
from game_analyst
where pay_price>0;
-- 付费玩家占比
select a/b as 付费玩家占比
from
(select count(distinct user_id) as a
from game_analyst
where pay_price>0) as t1,
(select count(distinct user_id)as b
from game_analyst) as t2;
通过上述查询可知,新增付费玩家数量是828934人,其中付费玩家有19549人,付费玩家人数占总注册人数的2.36%,付费人数占比略低。
select date(register_time) as 日期,
count(distinct user_id) as 当日新增玩家数量
from game_analyst
group by 日期;
select date(register_time) as 日期,
count(distinct user_id) as 当日新增付费玩家
from game_analyst
where pay_price>0
group by 日期;
观察可知:
每日新增玩家在3月10日有一次高峰增长,在3月13日有一次小高峰增长,这是因为这两次时间点举办了游戏相关活动,但是活动过后,后续新玩家增长量并没有明显提升,因此这两次活动并没有给这款游戏带来实质性的帮助。所以活动还需要一定的推广力度以及保持一定的时间维度,时间段的话,玩家对于游戏还不够了解,应该给玩家充分了解游戏的时间,才有可能持续提高游戏的热度。
select avg(avg_online_minutes) as 玩家平均在线时长
from game_analyst;
select avg(avg_online_minutes) as 付费玩家平均在线时长
from game_analyst
where pay_price>0;
观察可发现,付费玩家平均在线时长远大于全部玩家平均在线时长,活跃度要高很多。
使用箱线图分析总体特征,求最大值、最小值、中位数和上下四分位数
-- 全部玩家人数的下四分位数、中位数、上四分位数
select round (count(distinct user_id)/4) as 下四分位数,
round (count(distinct user_id)/2) as 中位数,
round (count(distinct user_id)/4*3) as 上四分位数
from game_analyst;
-- 全部玩家在线时长箱线图关键值
select min(avg_online_minutes) as 最小值,
( select avg_online_minutes
from game_analyst
order by avg_online_minutes
limit 207233,1) as 下四分位数,
( select avg_online_minutes
from game_analyst
order by avg_online_minutes
limit 414466,1)as 中位数,
( select avg_online_minutes
from game_analyst
order by avg_online_minutes
limit 621700,1)as 上四分位数,
max(avg_online_minutes)as 最大值
from game_analyst;
-- 付费玩家人数的四分位数,中位数,上四分位数
select round(count(distinct user_id)/4) as 下四分位数,
round(count(distinct user_id)/2)as 中位数,
round(count(distinct user_id)/4*3)as 上四分位数
from game_analyst
where pay_price>0;
-- 付费玩家在线时长箱线图
select min(avg_online_minutes) as 最小值,
( select avg_online_minutes
from game_analyst
where pay_price>0
order by avg_online_minutes
limit 4886,1) as 下四分位数,
( select avg_online_minutes
from game_analyst
where pay_price>0
order by avg_online_minutes
limit 9774,1)as 中位数,
( select avg_online_minutes
from game_analyst
where pay_price>0
order by avg_online_minutes
limit 14661,1)as 上四分位数,
max(avg_online_minutes)as 最大值
from game_analyst
where pay_price >0;
全部玩家与付费玩家在线时长箱线图:
根据以上数据和图标可得出以下结论:
全部玩家的在线时长箱线图向下压缩的很厉害,全部玩家在线时长上四分位数为1,75%的玩家平均在线时长只有大约1分钟,可见玩家流失的情况还是比较严重的。
付费用户的在线时长箱线图中,下四分位数为3,中位数为85,上四分位数191,也就是说,付费用户中,75%以上的用户在线时长都超过了30分钟。
AU:(Active Users):活跃用户,这里定为游戏时间长达15分钟的为活跃用户
PU(Paying User):付费用户
APA(Active Payment Account):活跃付费用户数
ARPU(Average Revenue Per User):平均每个活跃用户的收入,即可通过总收入/APA计算得出
ARPPU(Average Revenue Per Paying User):平均每个活跃付费用户收入,可通过总收入/APA计算得出
PUR(Pay User Rate):付费比率,可通过APA/AU计算得出
-- ARPU=总收入/AU
select count(distinct user_id)as AU,
(select sum(pay_price) from game_analyst)as 总收入,
(select sum(pay_price) from game_analyst)/count(distinct user_id)as ARPU
from game_analyst
where avg_online_minutes>=15;
-- ARPPU=总收入/APA
select count(distinct user_id)as APA,
(select sum(pay_price) from game_analyst)as 总收入,
(select sum(pay_price) from game_analyst)/count(distinct user_id)as ARPPU
from game_analyst
where avg_online_minutes>=15
and pay_price>0;
-- PUR = APA/AU
select count(distinct user_id) as APA,
(select count(distinct user_id)
from game_analyst
where avg_online_minutes>=15)as AU,
count(distinct user_id)/(select count(distinct user_id)
from game_analyst
where avg_online_minutes>0)as PUR
from game_analyst
where avg_online_minutes>=15
and pay_price>0;
对数据进行可视化:
该游戏人均付费率ARPU很低,说明游戏的收入较差,但对比ARPU,平均每个付费用户收入ARPPU很高,是ARPU的6倍多,那就说明收费玩家的付费能力很强,针对这一点,我们可以做一些付费功能调整和优化,甚至专属大R玩家,让大R玩的更开心。
付费率只有可怜的2.7%,其实只要简单的开展一个首充活动,比如:充1元可获得价值60元的大礼包,就能够很好地提高游戏的付费率了。付费率高,一样可以得到渠道青睐,获得更多推荐展示机会(行业俗称为“吸量”),间接提高游戏的热度。
注:大R,可理解为家里有矿的人,游戏的充值金额很大。每个游戏都有等级划分的制度,共有以下五种:废户、普通用户、VIP用户、SVIP用户、大R用户
PVP(Player VS Player):玩家之间的游戏对决,就是玩家与对立阵营,派别之间的玩家发生的战斗。通过完成击杀其他玩家获得荣誉,装备道具等。
PVE(Player VS Environment):玩家与电脑之间的对决,即打怪、打副本等。
select avg(pvp_battle_count) as 平均PVP次数,
sum(pvp_lanch_count)/sum(pvp_battle_count) as 主动发起PVP的概率,
sum(pvp_win_count)/sum(pvp_battle_count) as PVP胜利的概率
from game_analyst
where avg_online_minutes>=15;
select avg(pvp_battle_count) as 平均PVP次数,
sum(pvp_lanch_count)/sum(pvp_battle_count) as 主动发起PVP的概率,
sum(pvp_win_count)/sum(pvp_battle_count) as PVP胜利的概率
from game_analyst
where avg_online_minutes>=15
and pay_price>0;
select avg(pve_battle_count) as 平均PVe次数,
sum(pve_lanch_count)/sum(pve_battle_count) as 主动发起PVE的概率,
sum(pve_win_count)/sum(pve_battle_count) as PVE胜利的概率
from game_analyst
where avg_online_minutes>=15;
select avg(pve_battle_count) as 平均PVe次数,
sum(pve_lanch_count)/sum(pve_battle_count) as 主动发起PVE的概率,
sum(pve_win_count)/sum(pve_battle_count) as PVE胜利的概率
from game_analyst
where avg_online_minutes>=15
and pay_price>0;
将数据可视化:
从上图可以看出,APA玩家的平均PVE和PVP次数都要高于AU玩家两倍左右,显然APA玩家更愿意花费更多的时间在这个游戏上。
在PVE活动中,APA玩家主动发起进攻的概率和胜利的概率与AU玩家基本持平,其中主动发起PVE的概率非常高,可见游戏玩家还是比较熟悉游戏规则,基本上能主动刷副本打怪获取资源或者等级的提升。另外游戏的PVE难度也不高,玩家的PVE胜率高达90%,可见游戏体验较为友好。