hadoop基础学习1

1.    NameNode和dataNode的区别

       Namenode是分布式文件系统的管理者,管理文件系统命名空间。集群配置信息和存储快的复制等,同时会将Meta-data存储在内存中。

       DataNode是文件存储的基本单元,将block存储在本地文件系统中,存储了Meta-data,会周期性的将所有Block信息发送给NameNode。

2. 文件写入

     client向NameNode发起文件写入请求

      NameNode根据文件大小和文件快配置情况,返回给client所管理的DataNode信息

      client根据这些DataNode进行写入

3 文件读取

     client向NameNode发起文件读取的请求

     NameNode返回DataNode信息

     client读取文件信息。


      

你可能感兴趣的:(hadoop)