2020英语流利说数据分析笔试(第二批)

单选 + 多选 + 2道解答题

选择题涉及机器学习、概率论与数理统计、业务等
部分题目:

选择题:

1.若投掷硬币,正面概率= 3 4 \frac{3}{4} 43,反面概率= 1 4 \frac{1}{4} 41,求连续投掷2次正面所需次数的期望。

详解见 知乎链接
E ( N k ) = 1 p + 1 p 2 + 1 p 3 + . . . + 1 p k E(N_{k})=\frac{1}{p}+\frac{1}{p^2}+\frac{1}{p^3}+...+\frac{1}{p^k} E(Nk)=p1+p21+p31+...+pk1,其中k为连续投掷正面次数。
计算得期望: 28 9 \frac{28}{9} 928

2.500张多米诺骨牌,每轮取出奇数位牌,求最后剩下的牌是原第几张牌?

第一轮:2,4,6,8,10,…,500
第二轮:4,8,12,16,…,500
第三轮:8,16,24,…,496
最终第 2 8 = 256 < 500 2^8=256<500 28=256<500留下。

3.MAU与DAU的换算

DAU = MAU * 当月活跃天数/当月自然天数
MAU = 上月留存 + 本月新增 + 本月回流
月留存 = 上月MAU * 月留存率

2 道解答题:

1.计算每个页面首次被各个用户访问的平均次序。举例说明:小王依次访问了A,C,A,A,C,B页面,则首次访问排序为:A,C,B;各页面的首次访问次序为:A=1,B=3,C=2.表结构:data_date(string) user_id(int) page_name(string) ts(datetime) 输出page_name(string) avg_rank(float)

select page_name,avg(rank1) avg_rank from(
select user_id,page_name,ts,row_number() over(partition by user_id order by ts) rank1 from(
select user_id,page_name,ts,row_number() over(partition by user_id,page_name order by ts)rn  from events) A where rn = 1) B
group by page_name;

2.产品经理发现日活跃用户较上一周均值下降5%,怎么分析?

从内、外部来看:

内:分为时空两个维度分析

  1. 时间段

  2. 用户、渠道、活动、产品四方面

外:竞对、社会舆论

你可能感兴趣的:(2020秋招真题)