游戏数据分析用到的模型(二)留存率预估

本文主要参考了黎湘艳、叶洋的经典著作《游戏数据分析实战》。这本书堪称游戏数据分析的开山之作,这里向两位作者表示感谢。

关于留存率的模型,参考4.4.2节。

我们要先计算出1日留存率,2日留存率,……,N日留存率。

游戏数据分析用到的模型(二)留存率预估_第1张图片

 作者建议,用幂函数来拟合留存率模型:y=a*x^{b}

两边取对数,可以得到一个线性模型。

liucun <- c(0.39,0.27,0.22,0.19,0.16,0.15,0.15)
d <- 1:7
df <- data.frame(cbind(d,liucun))
df %>% ggplot(aes(x=d,y=liucun)) + 
  geom_point() +
  geom_line()+xlab('天数')+ylab('留存率')

df$logd <- log(df$d)
df$log_liucun <- log(df$liucun)

log_model <- lm(log_liucun~logd,data=df)

summary(log_model)

游戏数据分析用到的模型(二)留存率预估_第2张图片

b就是斜率,也就是-0.51628

loga是截距,-0.95018,所以a=exp(-0.95018)=0.3867 

得到结果y=0.3867*x^{-0.51628}

游戏数据分析用到的模型(二)留存率预估_第3张图片 

红点是拟合的结果,模型估计的留存率比实际数据下降的略快,如果有更多数据拟合效果会更好。

有了留存率模型,就可以计算日活跃人数。

你可能感兴趣的:(游戏)