数据分析/大数据研发面经笔经(阿里/腾讯/网易/招行信用卡中心/小红书/vivo等)

**个人简介:**本硕985,本科专业应用数学,硕士专业cs。有一段滴滴数据运营实习,硕士期间做过两个工业类的项目(异常检测/关联分析),发了两篇水论文(二作)。
**为什么投数据分析:**本来第一意向是算法。无奈今年算法岗实在太热门,美团笔试受挫后觉得选数据分析或许会有更多的机会。


阿里

#####阿里巴巴数据研发工程师(内推,被转岗数据分析)
**一面:**收到的第一个面试是阿里的内推,8.12网申,做完在线测评差不多一天就接到电话问什么时间方便面试。因为投的是研发,我本人的方向又是机器学习相关的,于是用一天时间复习了ML算法、mapreduce、还看了一些面经。然而没想到面试官问的问题的是这种画风:
(1)自我介绍
(2)未来的职业规划(在这里我说首选的方向是算法,其次是数据类的,大概率踩雷了orz)
(3)介绍一下以前的工作经历
(4)介绍一下学校的项目,你觉得你的这些方法在商业领域可以有什么具体的应用?
(5)你认为一个公司的经济指标有哪些?(???)
(6)你认为一个判断一个公司有潜力的核心指标有哪些?(听到这题简直感觉自己在面商业分析= =)
(7)想在哪个城市工作,为什么?
(8)想在什么行业工作,为什么?
(9)期望什么样的工作环境?
(10)你有什么问题问我吗?
由于全过程都觉得很迷在这里没忍住问了面试官这个岗是数据开发吗…为什么都没有问开发相关的东西…然后他才告知我我被内部转岗到了数据分析(…),他是天猫BI做数据分析的。后来我又问了数据分析是不是要求熟悉SQL(当时还不会),以及他们的工作里会不会用到ML相关技术,他的回答都比较官方,说不会的可以学,ML也还是会用到。╮( ̄▽ ̄")╭
面完就感觉凉凉,果然第二天收到了rejected。

**总结:**第一次面试太没有经验了…建议大家一开始就要问清自己面的是什么岗什么部门(存在转岗、转部门可能),回答的时候也一定要围绕这个职位去说(比如我当时说prefer算法什么的就很emmm…)


腾讯

#####软件开发-数据分析
内推的时候选了因为事业群选了微信所以一直被泡在池子里…直到转正式秋招才收到模拟笔试通知(p.s.腾讯的模拟笔试和笔试是投了简历都会收到的,而且秋招的时候之前投的事业群会没有参考价值)
**模拟笔试:**题目基本上是春招的原题。具体可参考:
https://blog.csdn.net/Ego_Bai/article/details/79866112
考点包括概率统计、数据结构、排序、ML等等。
**笔试:**待9.16补


网易

#####数据分析师(考拉)
笔试:23道单选+2道简答,单选各3分,简答各10分。
部分单选
(1)从(0,1)不经对角线走到(m,n)(m小于n)的方法数?
(2)关系数据模型的三要素?
(3)E-R模型的说法正确的是?
(4)两个袋子,4种颜色的球,一边40个一边36个(各色个数相等),拿出后不放回,什么时候拿出的球里至少有12个同色?
(5)神经网络中什么方式无法避免过拟合?
(6)SVM、logistic回归、决策树、随机森林里对中小型数据集分类精度最高的是?
(7)sql查询语句的正确性?
(8)sql查询什么情况下可以正确使用组合索引?
(9)本福特定律的别名?
(10)10人投票,其中7人赞成,3人反对,全程赞成数一直比反对数多的概率是?
(11)ABCD4个人,甲乙丙丁4件工作,A不做甲乙,B不做乙丙,C不做丙丁,问安排的方法数?
(12)X和Y均服从[0,1]上的均匀分布,X2+Y2<=1的概率?
(13)一个去开会。遇到另外6人每人各12次,其中每2各6次,每3人各4次,每4人各3次,每5人各2次,每6人各1次,1人也没遇见的有5次,问他共参加几次会议?
(14)RGB三种颜色铺地砖(每个可铺1x1)。R只能在R的总数目是偶数的情况使用,问1x6地砖的铺法?
(15)真人脸图片检测到人脸的概率是0.9,非人脸图片检测到的概率是0.01,已知真人脸与非真人脸图片比例为2:8,则一张真人脸图片检测到人脸的概率是?
(16)pearson相关系数的判断?
(17)e100在使用泰勒展开计算的时候可以采用哪种拆分?99+1?Kln2+100?1010?0.1+99.9?
(18)一个班48人,上学坐公交的40人,放学坐公交的34人,上学放学都坐的人有30人,则上学放学都不坐的人数是?
简答
(1)什么是关联分析?代表算法有哪些?请写出其中一种的中心思想与具体步骤
(2)你会从哪些方面对已结束的黑五活动进行复盘?
**总结:**个人觉得网易的笔试题出得挺好的,涵盖了概率、统计、sql、ML、业务等等,比起腾讯算法技术层面的难度低一些。


招行信用卡中心

#####数据分析类(APP运营方向,内推)
招行的笔试基本全是行测题…还有7 800字选一个结论的推断,真的无聊死了(捂脸)


迅雷

#####大数据分析工程师
笔试:26道单选+16道多选,单选各2分,多选各3分。
部分单选
(1)hive里sql执行计划怎么看?show?explain?list?describe?
(2)sql里limit语句有map吗?有reduce吗?
(3)三张表,问其中一个的关键码?
(4)linux怎么切换到用户主目录?
(5)linux删除命令?
(6)man 5 passwd 的含义?
(7)gzip bizp2 compress的压缩效率排序?
(8)secondnamenode的作用?
(9)n=5的汉诺塔的移动次数?
(10)升级和不升级的概率的概率都是1/2,5级以上时若不升级则会降级,则一个人从1级升到8级的次数的期望是?
(11)sql中alter通常不能修改?
(12)sql给定表中各列的类型,选择可以插入的内容为?
(13)HDFS中block size默认的大小是?
(14)上述的默认大小可以修改吗?
(15)-rwxrw-r-,则其他用户对文件的权限是?
(16)INSTR(‘TUTORIALS POINT’,‘P’)的结果是?
(17)一个样本需要在多个变量上进行描述,用什么图表示最好?
(18)描述数据波动的统计量是?
(19)分区、并行查询、视图、索引哪个不能提高查询效率?
(20)两条命令同时执行,1条需要1min执行,另一条需要3min,则从开始到第二条执行完过去了多久?
(21)一个二叉树,给定前序中序,后序为?
部分多选
(1)缺失值的处理办法?
(2)RDBMS的判定?
(3)A1A2A3A4A5不可能的出栈顺序?
(4)sql运算倾斜的解决方法?
(5)对数据库的描述不正确的是?
(6)对hive分区描述不正确的是?
(7)算法的结构包括哪些:递归、条件、顺序?循环?
(8)删除表中所有数据的错误语句(truncate、drop、delete)?
(9)hadoop的模式?
(10)对某一商品取名的业务参考指标?
(11)视图的说法正确的是?
(12)shell中$2的含义?
(13)shell中a+b的方法?
(14)假设检验的步骤?
(15)parse_url可以获取的参数?
(16)hadoop中client上传过程的描述?
**总结:**迅雷主要涉及三部分:linux、数据库、mapreduce,还有少量的统计、算法。(linux和mapreduce我全靠蒙呵呵哒)

你可能感兴趣的:(笔经面经)