复习记录一:hdfs的文件写入读取过程

文件写入过程

1.Client会向namenode发出上传请求。
2.namenode检测上传的权限。
3.namenode通知Client可以上传。
4.Client请求上传整个文件的其中一个数据块。
5.namenode会根据集群中DN上的block信息和机架感知,选出可以上传的3个主机
6.namenode返回datanode列表给Client。
7.client和DN之间建立pipeline(管道:以便于传输数据)。
8.Client向DN传递数据,传递的单位为:packet(64k)。
9.将packet信息进行缓存。
10.发送应答。
以上仅仅是其中一个数据块的写入过程,如果还有数据块会从第四步开始进程重复。
复习记录一:hdfs的文件写入读取过程_第1张图片

文件读取过程

1.Client向namenode请求下载文件。
2.namenode进行权限检查和文件block列表检查。选出每一个block对应的主机列表。
3.返回block主机列表给Client。
4.和每一个block所在的主机建立pipeline。
5.开始数据的读取。读取单位:packet(64K)。
6.将block进行合并,合并成一个完整的文件。
复习记录一:hdfs的文件写入读取过程_第2张图片

你可能感兴趣的:(复习)