拼多多2020学霸批数据分析师笔试题 (2019.7.28)

真真正正20届秋招,第一场笔试献给了「拼多多」。

  • 套题
    20届学霸批数据分析师笔试题
  • 题型简单粗暴
    5道问答题:3 * SQL + 1 * 概率计算 + 1 * 业务分析题
  • 完成时间
    90分钟

会写的不会写的,大概1个小时我就做完了。剩下半个钟,把题目记了下来~ (数据记不起来的,就自己生成的~)

❤️ 「更多数据分析真题」

《数据分析真题日刷 | 目录索引》

❤️ 「更多我的秋招经验贴」
2020我的秋招总结帖 [数据分析岗] | 目录索引


第1题 —— 数据库操作

表ord(用户订单表)

user_id ord_id ord_amt create_time(预定时间)
1 001 888 2019-05-01
1 002 367 2019-05-03
1 003 500 2019-05-04
1 004 987 2019-05-11
1 005 769 2019-05-12
205 009 209 2019-05-07
205 010 780 2019-05-08
205 020 998 2019-05-12

表act_usr(活动参与用户表)

act_id user_id create_time(报名时间)
Act_1 1 2019-05-03
Act_2 80 2019-05-06
Act_3 205 2019-05-07

(1)创建表act_output,保存以下信息:

区分不同活动,统计每个活动对应所有用户在报名参与活动之后产生的总订单金额、总订单数(一个用户只能参加一个活动)。

(2)加入活动开始后每天都会产生订单,计算每个活动截止当前(测评当天)平均每天产生的订单数,活动开始时间假设为用户最早报名时间。


第2题 —— 数据库操作

某网络用户访问操作流水表 tracking_log,

user_id opr_type(操作类型) log_time(操作时间)
1 A 2019-05-01
1 B 2019-05-01
1 C 2019-05-01
1 B 2019-05-07
1 E 2019-05-08
2 A 2019-05-06
2 B 2019-05-06

(1)计算网站每天的访客数以及他们的平均操作次数;

(2)统计每天符合A操作后B操作的操作模式的用户数,即要求AB相邻。


第3题 —— 数据库操作

根据第2题的用户访问操作流水表 tracking_log,

(1)计算网络每日新增访客表(在这次访问之前没有访问过该网站);

(2)新增访客的第2日、第30日回访比例。


第4题 —— 概率计算(全概率公式 + 贝叶斯公式)

简化题目:

已知P(A次品)=0.6,P(B次品)=0.4,P(次品|A)=0.01,P(次品|B)=0.02;

求 P(B|次品)

「我的答案」

P(B|次品) = P(次品|B) * P(B) / P(次品)

= 0.02 * 0.4 / (0.02 * 0.4 + 0.01 * 0.6) = 0.5714


第5题 —— 业务分析题

网站对商品详情页改版,正在灰度中(新页面cover10%的用户,老页面cover90%的页面)。希望提升用户从商详页进入支付页的比例。

(1)需要为决策提供哪些信息?

(2)需要采集哪些数据指标,选择什么统计方法以及统计过程?


暂且只分享了 第4题 的个人解析,因为统计是我最擅长的了?

SQL待我实操验证后,再补充代码~ 但是第3题,考试的时候觉得特别有难度。

欢迎「智慧的你」在评论区分享你的答案~?我们一起互帮互助 ?


「2019-08-13补充」

《拼多多2020学霸批数据分析师笔试 —— SQL整理(2019.7.28)》

你可能感兴趣的:(#,数据分析真题,#,2020我的秋招总结,数据分析岗,数据分析岗秋招,面经,总结,学习资料汇总)