Hadoop学习日记之hdfs读写流程

转载自:http://blog.chinaunix.net/uid-27105712-id-3274395.html 

分布式文件系统比较出名的有HDFS 和 GFS,其中HDFS比较简单一点。本文是一篇描述非常简洁易懂的漫画形式讲解HDFS的原理。比一般PPT要通俗易懂很多。不难得的学习资料。

1、三个部分: 客户端、nameserver(可理解为主控和文件索引类似linux的inode)、datanode(存放实际数据的存server)

Hadoop学习日记之hdfs读写流程_第1张图片

 

2、如何写数据过程

Hadoop学习日记之hdfs读写流程_第2张图片

 

Hadoop学习日记之hdfs读写流程_第3张图片

 

Hadoop学习日记之hdfs读写流程_第4张图片

3、读取数据过程

Hadoop学习日记之hdfs读写流程_第5张图片

4、容错:第一部分:故障类型及其检测方法(nodeserver 故障,和网络故障,和脏数据问题)

Hadoop学习日记之hdfs读写流程_第6张图片

 

Hadoop学习日记之hdfs读写流程_第7张图片

5、容错第二部分:读写容错

Hadoop学习日记之hdfs读写流程_第8张图片

6、容错第三部分:dataNode 失效

Hadoop学习日记之hdfs读写流程_第9张图片

7、备份规则

Hadoop学习日记之hdfs读写流程_第10张图片

8、结束语

Hadoop学习日记之hdfs读写流程_第11张图片




你可能感兴趣的:(hadoop)