大数据面试题、经验分享及新手问答整理

原文地址:http://www.aboutyun.com/thread-9581-1-1.html

**笔试类型:

**
1、 java基础类:
2、 linux基础:

**面试问答:

**1、讲项目经验:
问的很细,给纸,笔,让画公司hadoop的项目架构,说几条业务数据,然后经过平台后,出来成什么样子;
2、java方面:
io输入输出流里有哪些常用的类,还有webService,线程相关的知识;
3、linux:
问到jps命令,kill命令,问awk,sed是干什么用的、还有hadoop的一些常用命令;
4、hadoop:
讲hadoop1中map,shuffle,reduce的过程,其中问到了map端和reduce端溢写的细节;
也问了一些,外部表,还有就是hive的物理模型跟传统数据库的不同。

**面试成功


****公司主要业务
**
1、公司主要业务:
现在工作于一家互联网公司,主要做广告投放(dsp),数据平台(dmp)
2、技术:
由于现在公司即将上线的项目是广告投放系统,需要实时处理一些数据,目前主要用到flume,kafka,storm这一系列流处理工具,mongodb,redis这一系列数据库;


大数据面试题、经验分享及新手问答整理_第1张图片
公司业务.png

**新手问答:
****1、工资多少,工作几年了,有java基础吗,大学学什么
** 13k,做javaweb将近三年,2014年4月开始学习hadoop,现在已经工作一个多月了,有java基础,大学是计算机系
**2、flume,kafka,storm是怎么学的,有没有做优化
** 看官方文档,先搭环境, 然后用java写代码调用它们的接口,熟悉api不过,如果有视频资源的话,还是建议尽量看一下
**3、现在用hadoop1还是2
**hadoop2
**4、面试时说做hadoop多久了
** 我说的将近两年,面试时一定要说有hadoop经验
**5、storm,python之前都会吗,还是进公司后自学的
**这些都是到公司后,自学的

**6、你用的hadoop是收费 的还是免费的
**目前 是用的是免费的

**7、自己搭过集群吗,一开始压力大吗
**集群是自己搭的,压力很大,不过车到山前必有路

**8、广告作弊用mapreduce计算吗
** 用的storm,实时处理

**9、普通局域网的机子可以搭建么
** 可以,当时我先在自己机器上测试,用的自己电脑上的虚拟机,后来公司买的去服务器

**10、flume的知识有什么高深的东西
**我觉得没有什么东西是高深,只是我们没有涉入,只要用的多,多测试,它只是一个软件而已

**11、你看源码吗, 现在?
**会看源码,但是我觉得不要死扣在源码,我们主要是应用,如果自己有精力,也可以分块研究一下

**12、公司现在有多少台服务器?
**有10台,我用其中四台做了storm,kafka,flume,另外四台做hadoop ,hive,还有两台用做机器学习用

**13、没有java能做hadoop么
**不能吧,必须要会java

**14、面试时会不会让默写代码
**没有遇到过(不同的公司不一样)

**15、自己学,遇到问题都自己解决吗?
**目前遇到的问题,自己都能解决,如果不能的话,会救助同事吧

**16、你们数据库用hbase?
**目前还没用,现在主要用mongdb,mysql,redis(hive、hbase的公司不少)

17、大专不好找工作吗?
也没有,我有个同事,也是大专,但是她找工作时说自己是本科(因为那职位要求本科),后来面试通过后,又给人事打电话说,我其实是大专,但是为了得到这次面试机会,我说自己是本科。。。后来人事说这个没关系。。。那个公司就是×××,她现在已经在那里上班了(这个属于特殊情况,如果比较严的公司,拒绝的可能性是非常大的,除非实力强劲,大专找到工作是很正常的事情,

**这里只是公供大家参考,希望去其糟粕,取其精华
**)

**18、现在hadoop什么水平了,基本的框架 都会用的程度 吗?
** 是的,我现在基本框架都会用,都搭集群环境,包括调用的api也都很熟悉

**19、hadoop方向不错我现在15k,考虑要不要转
**我觉得这个要看你现在的行业以后的发展,如果有瓶颈,我觉得可以考虑转

**20、英文杂样,能看懂官方文档吗?
**看文档的问题不大,写和说还不行,我正在做计划,看怎么学

**21、你对自己在it行业啥想法呢,会一直在大数据这方面吗?
**目前 我的想法是以后准备做数据挖掘,机器学习工程师

**22、python要掌握到什么程度?
**在互联网方面,python,shell都是少不了的工具,我觉得我们主要精通一门,python的话,能看懂,能修改别人代码就行。现在的话,我还是比较推崇python,比shell强大,比java简洁。

**23、3周是自己单独学,还是工作之外学?
** 学习的过程,我一般都是晚上学,很痴迷,也可能是因为想赶紧转,脱离当前公司的苦海,哈哈

**24、人家说集群什么的都没有搭建,这样的工作你当时没犹豫就接了吗,这么有自信?
**当时我也很担心,不过进去的时候,也有说,让我别压力太大,如果有问题,他们会想办法找人帮我解决,所以我就豁出去了

**25、shell掌握到什么程度是,工作用到的难不难
**我觉得shell 的话,主要把awk,sed学好,当然基础也要学好,比如网络配置、基本操作

你可能感兴趣的:(大数据面试题、经验分享及新手问答整理)