经历了水深火热的大数据学习,终于拨开云雾见天明了,但你离成功总是还差了一步,那就是拿到大数据工程师的Offer。
在电脑旁奋斗了无数个日夜,代码敲了无数遍,项目整改了无数遍,只为了得到一份自己满意的高薪资高待遇的Offer。但这个收获不仅仅需要你学到娴熟的大数据技术,还需要在面试之前精心准备,了解自己要应聘的企业发展状况、 自己应聘岗位的技术要求等等,除此之外,多看一些大数据面试题也是很有必要的,给自己涨涨经验。
小编虽然不能帮你调查你理想企业的发展状况,但大数据常见面试题早已经为你准备好了,需要的尽快收入囊中吧!
1.scala 语言有什么特点,什么是函数式编程?有什么优点
2.scala 伴生对象有什么作用
3.scala 并发编程是怎么弄得,你对 actor 模型怎么理解有何优点
4.Spark如何处理结构化数据,Spark如何处理非结构话数据?
5.Spark性能优化主要有哪些手段?
6.对于Spark你觉得他对于现有大数据的现状的优势和劣势在哪里?
7.对于算法是否进行过自主的研究设计?
8.简要描述你了解的一些数据挖掘算法与内容
9.怎么用spark做数据清洗
10.跟我聊聊spark的应用,商场里广告投放,以及黄牛检测
11.spark读取 数据,是几个Partition呢? hdfs几个block 就有几个 Partition?
12.Mogodb和hbase的区别
13.开发中遇到的问题
14.HIVE的优化
15.linux的启动顺序
16.编译好的scala程序,运行时还需要scala环境吗
17.Write a java program to implement Stack in java.
18.Linkedlist和ArrayList的区别
19.hadoop中combiner的作用
20.用mr设计一个分组排重计数算法
21.用MapReduce找出存在公共好友的两个人
22.hdfs存储机制
23.MapReduce原理
24.hadoop运行原理
25.hadoop 的 namenode 宕机,怎么解决
26.Hbase 的特性,以及你怎么去设计 rowkey 和 columnFamily ,怎么去建一个table
27.Redis,传统数据库,hbase,hive 每个之间的区别(问的非常细)
28.说下对hadoop 的一些理解,包括哪些组件
29.详细讲解下你流式实时计算的项目部署以及收集的结果情况
30.实时流式计算框架,几个人,多长时间,细节问题,包括讲flume ,kafka ,storm 的各个的组件组成,你负责那一块,如果需要你搭建你可以完成么?