大数据技术Hadoop面试题

在互联网高速发展的今天,很多人还没有搞清楚什么是PC互联网,移动互联网来了,我们还没搞清楚移动互联网的时候,大数据时代又来了。大数据已经无处不在,随之而来的就是大数据技术人才的急需,以下是关于大数据技术的面试问题,大家可以再面试前参考。

单项选择题

1. 下面哪个程序负责 HDFS 数据存储。

a)NameNode   b)Jobtracker   c)Datanode   d)secondaryNameNode   e)tasktracker

2. HDfS 中的 block 默认保存几份?

a)3 份 b)2 份 c)1 份 d)不确定

3. 下列哪个程序通常与 NameNode 在一个节点启动?

a)SecondaryNameNode   b)DataNode   c)TaskTracker   d)Jobtracker

4. Hadoop 作者

a)Martin Fowler   b)Kent Beck   c)Doug cutting

5. HDFS 默认 Block Size

a)32MB   b)64MB   c)128MB

6. 下列哪项通常是集群的最主要瓶颈

a)CPU b)网络 c)磁盘 d)内存

7. 关于 SecondaryNameNode 哪项是正确的?

a)它是 NameNode 的热备

b)它对内存没有要求

c)它的目的是帮助 NameNode 合并编辑日志,减少 NameNode 启动时间

d)SecondaryNameNode 应与 NameNode 部署到一个节点

多选题:

8. 下列哪项可以作为集群的管理工具

a)Puppet   b)Pdsh   c)Cloudera Manager   d)Zookeeper

9. 配置机架感知的下面哪项正确

a)如果一个机架出问题,不会影响数据读写

b)写入数据的时候会写到不同机架的 DataNode 中

c)MapReduce 会根据机架获取离自己比较近的网络数据

10. Client 端上传文件的时候下列哪项正确

a)数据经过 NameNode 传递给 DataNode

b)Client 端将文件切分为 Block,依次上传

c)Client 只上传数据到一台 DataNode,然后由 NameNode 负责 Block 复制工作

11. 下列哪个是 Hadoop 运行的模式

a)单机版 b)伪分布式 c)分布式

12. Cloudera 提供哪几种安装 CDH 的方法

a)Cloudera manager b)Tar ball c)Yum d)Rpm

判断题:

13. Ganglia 不仅可以进行监控,也可以进行告警。( )

14. Block Size 是不可以修改的。( )

15. Nagios 不可以监控 Hadoop 集群,因为它不提供 Hadoop 支持。( )

16. 如果 NameNode

你可能感兴趣的:(2019年5月,2019年3月,2018年11月,2017年3月,2016年5月,2015年10月,2012年10月,2008年8月,2006年7月,2010年4月,2014年9月,2016年4月,2017年2月,2018年6月,2018年12月,2019年4月,大数据,人工智能,编程语言,程序员)