记录一下9月秋招情况,八月初开始一直进行笔试面试,几乎每天都有,从七月面试凉了后就开始海投(投了70家左右了),大致的进展如下,感觉今年池子尤其的深。
岗位:大数据开发,数据开发
顺丰科技: 1-2-HR,已OC
贝壳找房:1-2-HR,已接到HR电话
阿里菜鸟:1-2-3-HR,等结果
快手科技: 1-2-3-HR,等结果
京东:1-2-HR,等结果
网易云:1-2-HR,开奖没开到
一点资讯: 1-2-3-HR,等结果
有赞:1-2-HR,等结果
VIPKID: 1-2-HR(今天HR)
本文分享给需要面试刷题的朋友,也祝愿大家顺利拿到自己想要的offer,这份资料主要包含了Java基础,数据结构,jvm,多线程等等,由于篇幅有限,以下只展示小部分面试题,有需要完整版的朋友可以点一点链接跳转领取:链接:点击即可!!!暗号:CSDN
腾讯pcg后端:一面凉,没看到大数据岗,投的后端,一直问后端凉, 手撕代码也写不出来
跟谁学:一面凉,也问好多后端,手撕代码也写不出来
其他的就是:笔试后没结果的,拼多多,老虎证券,哔哩哔哩,科大讯飞,滴滴,爱奇艺,携程,4399,等等好多笔试都挂掉
还有简历挂掉的:猿辅导,百度,作业帮,好未来等
个人情况:
本科黑龙江末流二本,研究生末流985,实习主要写SQL
技术相关:JAVA,MySQL,Linux,Hadoop,Hive,HBase,Flume,Kafka,Kylin,对离线数仓熟悉,Spark和Flink了解一点点,简历上几乎没怎么写
有10多天没整理面经了,上午整理了一些。可能有好多问题,大概整理一下,还有的没整理出来
项目介绍
技术选型
维度,指标,讲了二期三期主题
Kylin和Presto和Druid区别看一看
报表可视化
数据小为啥不用关系型数据库
Kylin的雪崩
遇到过得比较大的挑战?业务对接,Kylin的Bug
对大数据的理解
数据仓库,Hive的执行引擎mr,Tez,Spark
mr和Tez会出现啥问题,适合什么样的场景,Tez底层
数据倾斜
Hbase的rowkey设计
排序算法
Java基础,线程上下问切换,资源消耗问题
垃圾回收算法
介绍项目
Kylin的优势,构建Cube非常复杂
Presto和Druid
Kylin的Cube存在Hbase上
Shuffle的过程
数据倾斜问题,
Group by 和 Reduce by?
Group by 和 Order by 执行过程
Group by 和 Distinct的区别
Flume和Kafka用在项目中
数仓介绍一下,数仓分层,每层做什么事
数据的实效性,
Hadoop集群的规模
数据量大小
数据的版本,发版策略
未来三年的规划,三年能达到什么的高度?
反问环节
大数据的几个方向
你想做啥?
数据量几十个T左右
工作地点考虑
个人介绍
接触大数据技术?平常自主学习?
数学建模和挑战杯的内容?
读研究生给你带来的最大收获?
为什么选择顺丰科技?发展?
城市选择问题?
家人对工作地点有什么意见吗?
行业的选择?
顺丰科技的了解?为什么选择?
手中有别的offer吗?
家人给你带来的帮助?收获?
职业规划?
反问?
1.数据仓库相关,主要是问项目中的
2.数据仓库横向(是指分层),他问我纵向怎么划分(是主题吗?我就把实习项目中做的主题和他说了说)
3.写SQL(rank 函数) 公司人员成本表a,有三个字段 月份date( 格式:2020-05) 、成员name、成本amt.2019年各成员成本排名
4.写SQL(连表,然后group by) 公司部门表 b 有两个字段 人名name、部门department ;部门每月的成本。
5.问项目中表的情况
6.实习中用的kylin,构建,还有优化(使用维度聚合之类,我只知道简单的)
7.问clickhouse,我不知道,presto我实习中用的是kylin也不知道。
8.遇到的问题,社区版kylin有很多bug(在7070的web界面写SQL,遇到过的一些异常,零除和连表的一些问题)
9.做的系统给谁用,给集团和各个事业部的
10.项目中数据的校对,怎么做的。
11.反问环节
1.问实习项目中做的工作,我主要写建数据模型,写kylin SQL
2.围绕项目展开的,实习项目中数仓相关,为什么分层,维度建模,什么是维度(让我解释,懵逼)
3.写下面的执行顺序
select
from
where
group by
having
order by
limit
执行顺序
我当时写的有些问题,然后我就按照自己想法解释了一通,大致没问题
4.让我把上面的SQL对应到MR里面
就是MR的输入输出对应啥,
我把MR中的分组,排序大概说了说对应上,要对MR中map(),reduce()和shuffle熟悉,之前18年写MR程序写的多,写过的话就会知道了
5.Hive的优化,常用的说,我大概说了6-7条,有说了2条Hadoop
6.数据倾斜解决,我大概说了3条
HR面(8.15. 18分钟)
1.为什么做大数据,想做那个方向?
2.项目中做了啥,收获
3.项目担任角
4.问本科期间做的比赛,数学建模和挑战杯
5.工作地点
6.选择公司考虑什么
7.面了哪些公司
8.对贝壳的了解
9.反问环节
10.对薪资的期望
11.能不能实习
1.说一下shuffle过程
2.分区是根据啥分区的,自定义分区
3.数据倾斜产生
4.做join的倾斜问题
5.map join 的原理
6. 调整map数和reduce数,怎么调?
7.数仓建模的问题,自己说
8.HashMap的实现
9.快速排序 实现,时间复杂度,稳定性。
10,区间合并的题,LeetCode
自我介绍
1.比较有挑战的事情?
2.项目问题
3.核心指标,从每一期指标说了说
4.指标对不上问题,数据对不上
5.数仓整个过程
6.数据量大小
7.数仓,写SQL
工作地点
反问工作
都是自己说
1.java基础封装继承多态
2.集合相关,list和map那些
3.线程相关,自己说
4.数据库
5.HDFS
6.MR
7.Hive
8.项目介绍
9.大数据学习过程
10.
现在有大学考试成绩如下表A:
id,subject,score
找出每一科都是这一科前30%的学生的id
一开始约的牛客面,后来公司网络问题,那边改成电话,正常问题,忘记录音
不自我介绍直接开始
Hadoop
存储
MR和shuffle
reduce分三个阶段,你怎么分
资源调度
Hive执行流程(SQL转MR过程)
ZK的原理 paxos一致性算法
进程和线程区别
内存模型
锁的机制,什么时候用到锁,
写代码:
1.删除无序链表中值重复出现的节点 选择换题
2.单链表的选择排序 选择换题
3.翻转字符串(2) AC
4.括号字符串的有效性 AC
不自我介绍直接开始
1.直接问项目,做了啥,问一下数据建设情况
2.对Kylin的了解
3.做的系统给谁用,可视化用的啥
4.实习中开发工作的流程
5.Cube的优化,减少膨胀率
6.项目中主要做的工作写SQL
7.写SQL,我记得一个是用rank求排名的,一个是用explode函数,把数组炸裂开,让一行变多行的,然后连表
8.hive优化相关,SQL书写优化,连表优化等,hive的调参数优化等
9.每天跑数的时候,任务挂掉了,怎么搞?(实习中没搞过,一顿瞎扯)
10.HBase,写数据流程
11.大数据啥时候学的,为什么往这个发展
12.另一个项目的数据来源,我爬虫得到的
13.职业规划,反问
1.实习项目参与情况
2.有成就感的事情,顺着吧项目说了说
3.项目组开发人员情况
4.遇到困哪
5.平常的学习过程
6.项目中那些需要改进和提升
7.为什么往大数据发展
8.职业规划
9.兴趣爱好
10.听音乐的类型
11.用网易云听
12.最大的挫折
13.有什么优点,缺点
14.面试了那些
15.工作地点,有没有女朋友
16.反问
就10分钟面试
1.自我介绍
2.项目
3.岗位要做什么
4.数据库的原理,关系型数据库理论知识
5.转到数仓,分仓
6.学生干部经历
7.实习情况?
8.反问环节?
没录音,记不太清了
1.最有成就感事情
2.数仓建模
3. 累计快照事实表
把我鸽了,第二天又面得,也没录音,8分钟结束,正常问题
邮箱收到通知说审批,审批过了就有,没过就感谢信
8月份也面了不少,感觉现在手里没面得大厂剩美团,百度这些了,还有别的欢迎补充。
祝大家能收获心仪的offer。
觉得有用的点赞,收藏支持一下,面经后续整理继续更新。