1.hdfs是属于什么架构

高可用的分布式架构

2.hdfs部署后进程哪些?按启动顺序说

NameNode,DataNode,SecondaryNameNode

3.一个文件180M,请问实际存储多少,多少块?多少map task?(副本为3)

540M, 6块, 假如文件支持分割,那么就2个map task。假如文件是压缩的,那么正好压缩不支持分割,那么就一个map task

4.副本放置策略,来说说看

就近分配

5.snn职责是什么

是合并NameNode的edit logs到fsimage文件中

6.hadoop fs命令和什么命令一样

hdfs dfs

7.shuffle,说说你们的理解

在map和repuced中间 进行重组 洗牌操作

8.yarn的进程哪些?

NodeManager,ResourceManager

9.jps命令,谈谈你们的理解

查看java进程及其对应信息

10.hdfs yarn界面的默认端口分别多少?假如让你们修改这个端口号,会不会?

50070,8088

11.查看进程哪个占系统资源较多的命令是什么

top

12.查看系统负载,1分钟 5分钟 15分钟 的命令是什么

top右上角 load average: 0.09, 0.05, 0.01
三个数分别代表不同时间段的系统平均负载(一分钟、五 分钟、以及十五分钟)

13.说说你们对top,还能够看啥?

查看系统的CPU、内存、运行时间、交换分区、执行的线程等信息