HDFS面试问题整理

1、hdfs读取流程,小文件处理
2、hdfs的数据压缩算法
3、datanode什么情况下不会进行备份
4、hdfs的体系结构
5、hdfs的存储机制
6、hdfs的基本原理
7、hdfs上传文件的流程
8、HADOOP1.0和2.0HDFS的BLOCK各为多少?
9、HDFS为什么不太适合小文件的存储
这里面提到了文档块的概念,同本地文件系统一样,HDFS也是按块存储的,只不过块的大小设置的相对大一些,默认为64M。如果一个文件不足64M,那么它只存储在一个块中,而且并不会占用64M的磁盘空间,

这一点需要注意,HDFS不适用于小文件存储的原因并不是因为小文件消耗磁盘空间,而是因为小文件占用了太多的块信息,每个文档块的元数据是会存储在namenode的内存里的,因此当文档块较多的时候会十分消耗namenode的内存

HDFS的命令整理

常见命令的使用

你可能感兴趣的:(大数据)