hadoop面试题整理(十一)

1.hbase怎么预分区?


2.hbase怎么给web前台提供接口来访问?


3.htable API有没有线程安全问题,在程序中是单例还是多例?


4.hbase有没有并发问题?


5.metaq消息队列,zookeeper集群,storm集群,就可以完成对商城推荐系统功能吗?还有没有其他的中间件?


6.storm 怎么完成对单词的计数?


7.hdfs的client端,复制到第三个副本时宕机, hdfs怎么恢复保证下次写第三副本?


8.block块信息是先写dataNode还是先写nameNode?


9.Hadoop生态圈中各种框架的运用场景?


10.hive中的压缩格式RCFile、TextFile、SequenceFile各有什么区别? 


11.说明 Hadoop 2.0 的基本构成。


12.相比于 HDFS1.0, HDFS 2.0最主要的改进在哪几方面?


13.试使用"步骤 1,步骤 2,步骤 3…" 说明YARN中运行应用程序的基本流程。


14.MapReduce2.0中,MRAppMaster主要作用是什么?MRAppMaster如何实现任务容错的?


15.为什么会产生yarn, 它解决了什么问题,有什么优势?

你可能感兴趣的:(hadoop面试题整理(十一))