什么是HDFS?

什么是HDFS?

一个节点集群存储文件
节点间复制模块
主从架构 
• 没有文件更新
• 一次写,多次读
• 大数据块 顺序读模式
• 为批处理设计

HDFS主服务器特点:

NameNode
- 运行在单个节点服务器上作为主处理器
? 存有文件的元数据(哪个数据块在哪里)
? 直接访问文件的客户端
• SecondaryNameNode
- 不是一个热点容错
- 维持NameNode的元数据拷贝

HDFS从服务器特点:

DataNode
- 一般运行在集群中所有节点
? 堵塞 creation/replication/deletion/reads
? 从NameNode获取等级次序

HDFS的文件存储原理

假设一个文件如图由红绿蓝三个数据块组成,现在将演示如何写入到HDFS系统中:

什么是HDFS?_第1张图片

你可能感兴趣的:(大数据)