【大数据分布并行处理】单元测试(二)

文章目录

  • 第二单元
    • 单选题
    • 多选题
    • 填空题

第二单元

单选题

  1. 每种大数据产品都有特定的应用场景,以下哪个产品是用于图计算的:
    A. MapReduce
    B. GraphX
    C. Hive
    D. Streams
    正确答案: B

  2. 每种大数据产品都有特定的应用场景,以下哪个产品是用于查询分析计算的:
    A. MapReduce
    B. Storm
    C. GraphX
    D. Dremel
    正确答案: D

  3. 以下对Hadoop的说法错误的是:
    A. Hadoop2.0增加了NameNode HA和Wire-compatibility两个重大特性
    B. Hadoop的核心是HDFS和MapReduce
    C. Hadoop MapReduce是针对谷歌MapReduce的开源实现,通常用于大规模数据集的并行计算
    D. Hadoop是基于Java语言开发的,只支持Java语言编程
    正确答案: D

  4. 以下哪个不是Hadoop的特性:
    A. 高可靠性
    B. 支持多种编程语言
    C. 高容错性
    D. 成本高
    正确答案: D

  5. 以下名词解释不正确的是:
    A. HDFS:分布式文件系统,是Hadoop项目的两大核心之一,是谷歌GFS的开源实现
    B. HBase:提供高可靠性、高性能、分布式的行式数据库,是谷歌BigTable的开源实现
    C. Zookeeper:针对谷歌Chubby的一个开源实现,是高效可靠的协同工作系统
    D. Hive:一个基于Hadoop的数据仓库工具,用于对Hadoop文件中的数据集进行数据整理、特殊查询和分析存储
    正确答案: B

  6. Hadoop的创建者是下面哪一位:
    A. Mike Cafarella
    B. Tom White
    C. Kent Beck
    D. Doug Cutting
    正确答案: D

  7. 下面关于Hadoop叙述不正确的是:
    A. Hadoop是Apache开源软件基金会所开发的分布式系统基础架构
    B. Hadoop必须运行于大规模的高性能服务器上
    C. Hadoop是基于Java语言开发的,具有很好的跨平台特性
    D. Hadoop是大数据存储、计算、分析的分布式存储系统和分布式运算框架
    正确答案: B

  8. 关于Hadoop的发展史叙述不正确的是:
    A. Hadoop是Apache Lucene的子项目之一
    B. 2008年1月,Hadoop成为Apache顶级项目
    C. 2006年3月,Yahoo!建设了第一个Hadoop集群用于开发
    D. Google发表的Bigtable论文,激起了HDFS的创建
    正确答案: D

  9. 与HDFS类似的框架是:
    A. FAT32
    B. NTFS
    C. FAT32
    D. GFS
    正确答案: D

  10. 不属于Hadoop生态系统的是:
    A. HDFS
    B. HBase
    C. GFS
    D. Hive
    正确答案: C

多选题

  1. ‌每种大数据产品都有特定的应用场景,以下哪个产品是用于批处理的:
    A. Storm
    B. Graphx
    C. MapReduce
    D. Spark
    正确答案: CD

  2. 每种大数据产品都有特定的应用场景,以下哪个产品可用于流计算:
    A. Spark
    B. Cassandra
    C. pregel
    D. Flume
    正确答案: AD

  3. 下列属于NoSQL数据库的是:
    A. neo4j
    B. Redis
    C. SQL Server
    D. MongoDB
    正确答案: ABD

  4. 以下关于Hadoop的说法正确的是
    A. 可以运行在大量廉价商用机器上
    B. 提供容错机制
    C. 硬件错误较少发生
    D. 成本低
    正确答案: ABD

  5. 关于hadoop配置文件描述正确的是?
    A. NameNode的主机名和端口号需要在core-site.xml 文件中配置
    B. hdfs元数据文件存放路径在hdfs-site.xml 文件中配置
    C. hdfs文件的副本数在core-site.xml 文件配置
    D. 格式化HDFS系统命令:hdfs namenode -format
    正确答案: ABD

  6. 下列Hadoop叙述正确是:
    A. 2008年4月,Hadoop打破世界纪录,成为最快排序1TB数据的系统
    B. 在2009年5月,Hadoop更是把1TB数据排序时间缩短到62秒
    C. HDFS是BigTable的开源实现
    D. 第二代Hadoop包含两个版本,分别是0.23.x和2.x,这是一套全新的架构,包含HDFS Federation和YARN两个系统
    正确答案: ABD

  7. 选择 Hadoop版本,一般需要考虑哪些因素:
    A. 是否开源
    B. 是否有强大社区支持
    C. 是否有稳定版本
    D. 是否是最新版本
    正确答案: ABC

  8. 下列关于Hadoop特性叙述正确的是:
    A. 仅支持Java编程语言,具有跨平台特性
    B. 高可扩展性
    C. 高容错性
    D. 高可靠性
    正确答案: BCD

  9. Hadoop集群配置文件主要包括:
    A. core-site.xml
    B. hdfs-site.xml
    C. yarn-site.xml
    D. mapred-site.xml
    正确答案: ABCD

  10. Hadoop的安装部署的模式包括哪几种:
    A. 独立模式(本地模式)
    B. 伪分布模式
    C. 集中模式
    D. 完全分布模式
    正确答案: ABD

填空题

  1. Linux下_____命令用于拷贝文件,若拷贝的对象为目录,则需要使用-r参数。
    正确答案:cp

  2. Linux下_____命令用于查看文件与目录。
    正确答案:ls

  3. Linux下_____命令用于查看文本文件内容。
    正确答案:cat

  4. _____命令用于查看服务器IP配置。
    正确答案:ifconfig

  5. Linux下_____命令用于删除文件,若删除的对象为目录,则需要使用-r。
    正确答案:rm

你可能感兴趣的:(#,《,大数据技术,》,大数据,hadoop)