【笔试题目整理】小红书2019年校园招聘数据分析岗位在线笔试第二批

最近在准备数据分析岗位的笔试,整理了牛客网上的一些试题与答案方便查看(只摘部分)。

  • 今日真题
    小红书2019年校园招聘数据分析岗位在线笔试第二批(来源:牛客网)
  • 题型
    客观题:单选6道,不定项选择3道,填空3道;
    主观题:问答2道
  • 完成时间
    120分钟
  • 牛客网评估难度系数
    3颗星

1、从含有N个元素的总体中抽取n个元素作为样本,使得总体中的每一个元素都有相同的机会(概率)被抽中,这样的抽样方式称为

答案:简单随机抽样

参考解析:

简单随机抽样:对总体不做任何划分,随机抽取
分层抽样:挑选对总体影响较大的特征作为分层依据,在每层中抽取一定比例的样本,比如:抽取某小学学生的身高,可按照年纪划分成6层,在每层中抽取一定比例的学生组成样本。
系统抽样:比如100个学生,给每个学生编号,平均分成5等分,每一份都选编号为1,5,9的学生
整群抽样:100个学生分成4个群,随机选择其中的2个群,群里所有学生都要参与抽样。

 

2、一组数据,均值>中位数>众数,则这组数据

答案:右偏

参考解析:

左偏分布(负偏态)mean(平均数)

右偏分布(正偏态)mode(众数)

所以,偏态数据中,中位数更适合用来反应数据的集中趋势。几何平均数:降低因数据本身的尺度不同对结果的影响

 

3、对一个特定情形的估计来说,置信水平越低,所对应的置信区间

答案:越小

 

4、关于logistic回归算法,以下说法不正确的是 

【笔试题目整理】小红书2019年校园招聘数据分析岗位在线笔试第二批_第1张图片

答案:B

参考解析:

logistics回归,实际上是二分类算法;目标变量要求是离散值;
logistic回归的输入特征:工业界中我们通常将连续变量离散化再带入logistic回归。

 

5、下列关于正态分布,不正确的是

【笔试题目整理】小红书2019年校园招聘数据分析岗位在线笔试第二批_第2张图片

答案:C

参考解析:

期望为0,标准差为1的是标准正态分布

 

6、样本中各观察值均加5后

【笔试题目整理】小红书2019年校园招聘数据分析岗位在线笔试第二批_第3张图片

答案:C D

参考解析:

方差表示数据围绕均值的波动大小,每个样本都加5,波动情况并没有改变,所以方差不变。

标准差是方差的平方根,也不变。

 

7、请写sql语句:

想要了解班级内同学的考试情况,现有一张成绩表表名为A,每行都包含以下内容(已知表中没有重复内容,但所有的考试结果都录入在了同一张表中,一个同学会有多条考试结果):

student_id,course_name,score

现在需要知道:

1. 每门课程得到成绩的同学人数

2. 每门课程的平均成绩

3. 如果对于每门课程来说,60分以下为不及格,高于60为及格,统计每门课程及格和不及格的人数

 

参考答案:

1、SELECT course_name,COUNT(distinct student_id) FROM A

WHERE score is not null      

GROUP BY course_name

2、SELECT course_name,AVG(score) FROM A

GROUP BY course_name

3、SELECT

                     course_name,

                     SUM(CASE WHEN score>=60 THEN 1 ELSE 0 END) AS '及格人数',

                     SUM(CASE WHEN score<60 THEN 1 ELSE 0 END) AS '不及格人数 

FROM A

GROUP BY course_name

 

8、经一番研究后,我们开发出了一个新的商品详情页中'相关商品'模块的算法,并且打算通过AB Test(50%用户保留原先的算法逻辑为控制组,50%用户使用新的算法逻辑为实验组)来进行评估。假如你是此次实验的数据分析师,请问你会怎么评估控制组和实验组的表现?请按重要性列出最重要的三个指标并给出你的分析过程。

民间答案:

1.相关商品的点击率=相关商品链接点击次数/当前页面浏览次数

2.相关商品的购买率=购买行为发生次数/相关商品浏览行为次数

3.当前商品与相关商品一同购买的概率=共同购买/当前商品购买

 

 

你可能感兴趣的:(笔试题目整理)