并行虚拟文件系统(PVFS) _曹强

并行虚拟文件系统(PVFS)

PVFS [2](Parallel Virtual File System)项目是Clemson大学为了运行Linux集群而创建的一个开源项目,因此,PVFS也无需特别的硬件设备。普通的能运行Linux系统的PC机即可。PVFS现已被广泛地使用,很多分布式文件系统都是以PVFS为基础架构而设计实现的[3],比如国内的浪潮并行文件系统。目前的版本是第二版[4]。

正如一般的分布式文件系统一样,PVFS将数据存储到多个集群节点中,数据保存在这些节点的本地文件系统之中,然后多个客户端可以并行同时访问这些数据。PVFS有以下4个重要功能:

1)命名空间的一致性:为了易于安装和使用,PVFS提供了统一的文件命名空间。

2)文件的数据分散分布到不同的集群节点的本地磁盘之上:为高速访问集群系统中的文件数据,PVFS将文件数据进行条块化划分,分散存储到不同集群节点(称作I/O节点,如图5.4所示)的多个磁盘上,从而消除了单个I/O路径带来的瓶颈问题,且增加了客户端的并发带宽。

3)兼容现有系统上的文件访问方式:对已安装PVFS文件和目录能够继续使用现有Linux系统上的命令和工具,比如ls、cat、dd和rm等等,方便用户的使用。该功能由Linux核心的一个模块提供支持。

4)为应用程序提供高性能的数据访问方式:PVFS还提供了libpvfs库,以专有接口来访问PVFS文件系统。而libpvfs库直接和PVFS服务器相连接,不需要把消息传递给内核,这样提高了访问效率。

并行虚拟文件系统(PVFS) _曹强_第1张图片 
(点击查看大图)图 5.4  PVFS系统结构图

PVFS系统是一个3方架构:计算节点、管理节点和I/O节点,如图 5.4所示。其中,计算节点的功能运行应用程序,发起PVFS的I/O请求;管理节点的功能是管理元数据,接受并调度计算节点的I/O请求;I/O节点的功能是存放PVFS文件系统中的文件数据,所有文件数据的读写都要与I/O节点打交道。

PVFS系统中有且只有一个管理节点,一个或者多个计算节点和I/O节点。PVFS集群中任意一个集群节点既可以只提供3方架构中的其中一种功能,也可以提供同时提供2种或者3种功能。计算节点也同时用来做管理节点,也可以充当I/O节点的角色,反之亦然。对于小规模的集群系统,这种功能重叠的方法可以节省开支,充分利用资源;对于大规模集群系统,则一般不推荐使用这种功能重叠的方法,因为功能重叠会使机器过于繁忙,从而导致性能下降,一般是一个节点只充当一个角色。

PVFS还存在以下不足:

1)单一管理节点。上面说到过PVFS中只有一个管理节点来管理元数据,当集群系统达到一定的规模之后,管理节点将可能出现过度繁忙的情况,这时管理节点将成为系统瓶颈。

2)对数据的存储缺乏容错机制。当某一I/O节点无法工作时,上面的数据将出现不可用的情况。

3)静态配置。对PVFS的配置只能在启动前进行,一旦系统运行则不可再更改原先的配置。

你可能感兴趣的:(linux,集群,System,存储,parallel,磁盘)