【PNFS学习】NFS和pNFS

一、NFS结构

传统的nfs结构包括:一个共享文件系统的服务器端、一个挂载文件系统的客户端。存储器位于服务器端。当客户端想访问存储器上的文件时,要经过网络连接到服务器端,进而访问到文件,即带内访问。这样会受到带宽等因素的干扰,使性能收到影响。NFS 的最新许可版本是 NFS version 4。

二、pNFS结构

NFS的下一个修改版本是version 4.1,包括一个扩展 Parallel NFS(pNFS)。它将普通 NFS 的优势和并行输入输出(I/O)的高传输率结合起来。它与NFS的区别在于,客户端、服务器均与存储器直接相连,客户端不必再通过服务器间接访问存储器了,即带外访问,再也不用收到带宽等因素的干扰,性能大大提高。

三、pNFS具体实现细节

【PNFS学习】NFS和pNFS_第1张图片
上图显示一个 pNFS 配置。左边是pNFS服务器。顶部是客户机节点。底部是数据仓库,也就是存储器。

下面介绍图中三个协议:

  1. pNFS protocol:在服务器和客户端之间传递元数据(更正式的叫法为“布局”)。包括:文件写入位置、文件属性等。
  2. storage access protocol:指定客户机访问数据仓库的方式。
  3. control protocol:同步元数据服务器和数据服务器之间的状态。同步是对客户机隐藏的,比如重新组织介质上的文件。此外,NFSv4.1 并没有规定控制协议;因此它有多种形式,这在性能、成本和特性方面的竞争为供应商提供了灵活性。

四、pNFS的read操作

我们通过read操作来看pNFS具体是怎么实现数据传输的。

  1. 客户机向服务器发送LOOKUP+OPEN请求,服务器返回文件句柄和状态信息。
  2. 客户机发送LAYOUTGET命令,服务器返回所需的文件元数据(布局)。
  3. 客户机拿到元数据后,向存储器发送READ请求。
  4. 客户机完成读操作后以LAYOUTRETURN表示操作结束。
  5. 如果客户机拿到的元数据已经过时,服务器将发出CB_LAYOUTRECALL命令,表明该布局过时,必须清除或重新获取。

布局可以缓存到客户机上,从而提高性能。为了避免布局过期,服务器将回收不准确的布局,当回收发生时,每个与之相关的客户机必须停止I/O,重新从服务器获取布局或从普通的NFS访问文件。当服务器进行数据迁移等操作之前,必须执行回收。

你可能感兴趣的:(pnfs学习)