阿里巴巴2011数据分析师实习生笔试题

职位名称:数据分析师
招聘人数:若干
【职位描述】
1.负责业务数据收集整理,对多种数据源进行深度诊断性组合分析、挖掘、深度分析和建

2.提供效能报告,对市场活动终端体现给予评估,为公司运营决策、产品方向、销售策略
提供数据支持
3.参与、组织客户调研,定期提供行业报告;并与业务部门沟通并推进以上结果
【职位要求】
1.计算机、统计、数学、信息技术硕士学历,本科生有突出能力
2.熟悉Oracle数据库,熟练运用SQL;熟练操作Excel,SAS/SPSS,PPT
3.具备良好的沟通能力、团队精神和领导力

试题:

1.什么是异常值,列举一种找出连续型变量异常值的方法。

2.什么是聚类分析,有哪些聚类分析方法,写出原理和算法。

3.SQL题,给出一个表,写SQL语句,创建表名为B(结构和原表一样),按列出最早访问的url

id:用户名

time:用户访问时间

url:用户访问网页

4.一个B2C网站,用户群是办公室女性,一个表是一周的销售额:工作日的销售额都是5000-5100,周六大概是3400,周日大概是3000

(1)从表中数据看出什么,分析其原因

(2)写一个运营计划

5.有ABC三类客户,现有一个改进计划,设计数据分析调研支持该决策

(1)调查需要提供什么数据

(2)如何制定用户群、数据指标,采用什么调查分析方法

 

 

解答:

1.异常值是指一组测定值中与平均值的偏差超过两倍标准差的测定值。查找异常值的方法有:Nair检验法、Grubbs检验法、狄克逊检验法、偏度检测法、峰度检测法等。

2.聚类分析是一种将研究对象分为相对同质的群组的统计分析技术。聚类方法有:层次聚类、合并法、分解法等。算法原理:第一步逐个扫描样本,每个样本依据其已扫描过的样本的距离,被归为以前的类,或生成一个新类;第二步对第一步中各类依据类间距离进行合并,按一定的标准,停止合并。

你可能感兴趣的:(数据分析,计算机,阿里巴巴)