NameNode是如何存储元数据的?

1.NN的作用

  • 保存HDFS上所有文件的元数据!
  • 接受客户端的请求!
  • 接受DN上报的信息,给DN分配任务(维护副本数)!

2.元数据的存储

元数据存储在fsiamge文件+edits文件中!

  • fsimage(元数据的快照文件)
  • edits(记录所有写操作的日志文件)

NN负责处理集群中所有客户端的请求和所有DN的请求!在一个集群中,通常NN需要一个高配置,保证NN可以及时处理客户端或DN的请求,一旦NN无法及时处理请求,HDFS就已经瘫痪!

edits文件的产生:
NN在启动之后,每次接受的写操作请求,都会将写命令记录到edits文件中,edits文件每间隔一定的时间和大小滚动!

fsimage文件的产生:
①第一次格式化NN时,此时会创建NN工作的目录,其次在目录中生成一个fsimage_000000000000文件

当NN在满足某些条件时,NN会将所有的edits文件和fsiamge文件加载到内存合并得到最新的元数据,将元数据持久化到磁盘生成新的fsimage文件

  • 合并时机
    需要满足checkpoint的条件:
    ①默认1h
    ②两次checkpoint期间已经额外产生了100w txid的数据

③如果启用了2nn,2nn也会辅助NN合并元数据,会将合并后的元数据发送到NN
NameNode是如何存储元数据的?_第1张图片

3.查看edits文件

如果直接使用cat命令打开edits文件你会看见一堆火星文……
正确方法:使用hdfs命令

hdfs oev -i edits_xxx -o /打开后的存放路径/xxx.xml
  • 参数oevoffline edits viewer ,提供离线的edits编辑器打开edits文件
  • 参数i:input_file,输入文件,即edits文件
  • 参数o:output_file,输出文件,即打开后保存在哪个文件里

以xml格式打开edits文件,会发现里面有七对record(记录)标签,即对写操作分为成了七步
标签里又有txid :每次写操作命令,分解为若干步,每一步都会有一个id,这个id称为txid

NN的元数据分两部分

inodes : 记录在fsimage文件中或edits文件中
blocklist: 块的位置信息(每次DN在启动后,自动上报的)

你可能感兴趣的:(NameNode是如何存储元数据的?)