茉璃珞

GFS分布式文件系统(GlusterFS)

引言

一、文件系统

1、组件

2、作用

3、文件系统的挂载使用

二、GlusterFS概述

1、GFS简介

组件

2、GFS特点

2.1扩展性和高性能

2.2高可用性

2.3全局统一命名空间

2.4弹性卷管理

2.5基于标准协议

3、GFS 专业术语

3.1 Brick（存储块）

3.2 Volume（逻辑卷）

3.3 FUSE

3.4 VFS（虚拟端口）

3.5 Glusterd（后台管理进程）

4、模块化堆栈式架构

GFS-client 端

网络通讯

5、GFS工作流程

6、不同服务器详解

7、后端存储如何定位

三、GFS卷类型

1、分布式卷（Distribute volume）

特点

2、条带卷（Stripe volume）

特点

3、复制卷（Replica volume）

特点

4、分布式条带卷（Distribute Stripe volume）

5、分布式复制卷（Distribute Replica volume）

6、条带复制卷（Stripe Replica volume）

7、分布式条带复制卷（Distribute Stripe Replicavolume）

四、GFS部署

1、环境说明

2、硬盘分区挂载

3、配置/etc/hosts文件（所有节点都需要操作）

4、安装、启动GFS

配置yum本地源

5、添加节点并创建集群

6、根据规则规划建卷

6.1 规则

6.2创建分布式卷

6.3创建条带卷

6.4创建复制卷

6.5创建分布式条带卷

6.6创建分布式复制卷

7、Client部署

7.1 环境部署

8、破坏性测试

五、GFS 文件系统的维护命令

总结

引言

当数据集的大小超过一台独立物理计算机的存储能力时，就有必要对它进行分区，并存储到若干台单独的计算机上。GFS 是用来管理网络中跨多台计算机存储的文件系统。这种系统构架于网络之上，肯定会引入网络编程的复杂性，因此它比普通的磁盘文件系统更为复杂。

一、文件系统

1、组件

接口：文件系统接口
功能模块(管理、存储的工具)：对对像管理的软件集合
对象及属性：(使用此文件系统的消费者)

2、作用

从系统角度来看，文件系统是对文件存储设备的空间进行组织和分配，负责文件存储并对存入的文件进行保护和检索的系统
主要负责为用户建立文件，存入、读出、修改、转储文件，控制文件的存取

3、文件系统的挂载使用

除跟文件系统以外的文件系统创建后要使用需要先挂载至挂载点后才可以被访问
挂载点即分区设备文件关联的某个目录文件
类比 NFS（外部的文件系统），使用挂载的方式才可以让本地系统来使用外部的文件系统的功能
例如：配置永久挂载时，我们会写入挂载点与挂载目录，还有文件系统的名称（xfs），文件类型格式等。我们在远程跨服务器使用 GFS 分布式文件系统，挂载时也需要指定其文件格式（GlusterFS）

二、GlusterFS概述

1、GFS简介

GFS（Gluster File System）是一个可扩展、开源的分布式文件系统（可以很好的体现出弹性伸缩的特点），用于大型的、分布式的、对大量数据进行访问的应用，在传统的解决方案中，GFS 能够灵活的结合物理的，虚拟的和云资源去体现高可用和企业级的性能存储

组件

存储服务器（Brick Server）
客户端（不在本地）（且，有客户端，也会有服务端，这点类似于 NFS，但是更为复杂）
存储网关（NFS/Samaba）

例如：

无元数据服务器
元数据是核心，描述对象的信息，影响其属性；
例如NFS，存放数据本身，是一个典型的元数据服务器可能存在单点故障，故要求服务器性能较高，服务器一旦出现故障就会导致数据丢失；
反过来看，所以无元数据服务不会有单点故障。
那么数据存放在哪里呢？会借用分布式的原则，分散存储，不会有一个统一的数据服务器

2、GFS特点

2.1扩展性和高性能

可扩展性，扩展节点，通过多节点提高性能。

GlusterFS利用双重特性来提供高容量存储解决方案。
（1）Scale-Out架构允许通过简单地增加存储节点的方式来提高存储容量和性能（磁盘、计算和I/O资源都可以独立增加），支持10GbE和 InfiniBand等高速网络互联。
（2）Gluster弹性哈希（ElasticHash）解决了GlusterFS对元数据服务器的依赖，改善了单点故障和性能瓶颈，真正实现了并行化数据访问。GlusterFS采用弹性哈希算法在存储池中可以智能地定位任意数据分片（将数据分片存储在不同节点上），不需要查看索引或者向元数据服务器查询。

2.2高可用性

不存在单点故障，有备份机制，类似 Raid 的容灾机制。GlusterFS可以对文件进行自动复制，如镜像或多次复制，从而确保数据总是可以访问，甚至是在硬件故障的情况下也能正常访问。
当数据出现不一致时，自我修复功能能够把数据恢复到正确的状态，数据的修复是以增量的方式在后台执行，几乎不会产生性能负载。
GlusterFS可以支持所有的存储，因为它没有设计自己的私有数据文件格式，而是采用操作系统中主流标准的磁盘文件系统（如EXT3、XFS等）来存储文件，因此数据可以使用传统访问磁盘的方式被访问。

2.3全局统一命名空间

集中化管理，类比 API 的性质/概念，系统里根据他命名所定义的隔离区域，是一个独立空间；统一的名称空间，与客户端交互，把请求存放至后端的块数据服务器。

分布式存储中，将所有节点的命名空间整合为统一命名空间，将整个系统的所有节点的存储容量组成一个大的虚拟存储池，供前端主机访问这些节点完成数据读写操作。

2.4弹性卷管理

方便扩容及对后端存储集群的管理与维护，较为复杂。GlusterFS通过将数据储存在逻辑卷中，逻辑卷从逻辑存储池进行独立逻辑划分而得到。
逻辑存储池可以在线进行增加和移除，不会导致业务中断。逻辑卷可以根据需求在线增长和缩减，并可以在多个节点中实现负载均衡。
文件系统配置也可以实时在线进行更改并应用，从而可以适应工作负载条件变化或在线性能调优。

2.5基于标准协议

基于标准化的文件使用协议，让 CentOS 兼容 GFS。

Gluster 存储服务支持 NFS、CIFS、HTTP、FTP、SMB 及 Gluster原生协议，完全与 POSIX 标准（可移植操作系统接口）兼容。
现有应用程序不需要做任何修改就可以对Gluster 中的数据进行访问，也可以使用专用 API 进行访问。

3、GFS 专业术语

3.1 Brick（存储块）

实际存储用户数据的服务器

3.2 Volume（逻辑卷）

本地文件系统的"分区”

3.3 FUSE

用户空间的文件系统(类比EXT4)，“这是一个伪文件系统”;以本地文件系统为例，用户想要读写一个文件，会借助于EXT4文件系统，然后把数据写在磁盘上；而如果是远端的GFS，客户端的请求则应该交给FUSE(为文件系统)，就可以实现跨界点存储在GFS上

3.4 VFS（虚拟端口）

内核态的虚拟文件系统，用户是先提交请求交给VFS然后VFS交给FUSE，再交给GFS客户端，最后由客户端交给远端的存储

3.5 Glusterd（后台管理进程）

行再存储节点的进程（客户端运行的是gluster client）GFS使用过程中整个GFS之间的交换由Gluster client 和glusterd完成

4、模块化堆栈式架构

模块化：类似linux 编译安装，很多功能都可以做定制的，通常都是通过软件开发的方式封装为模块，按需使用/不适用
GlusterFS也是这个思想：把功能封装为一个个模块，通过加载/调用/启用的方式就可以对应的功能堆栈式架构设计通过对模块不同功能的组合来实现复杂功能

模块化的设计，即把功能封装在一起，最后一起调用
同时启用多个模块，多个功能的组合，这种提供功能的方式叫做堆栈式的结构
通过对模块的组合，可以实现复杂的功能

GFS-server 端功能模块的划分

卷的类型（使用分布式、复制、条带)
存储管理 (卷的创建、启用、关闭)
I/O调用 (存储后，读取数据，如何读取)
与GFS-client 端对接

GFS-client 端

用户通过用户态模式下，存储数据(写入数据)
写入的数据，使用GFS挂载的形式完成（网络挂载samba/NFS)
数据的写入会由GFS-client转存到GFS-server端(对应的卷中)

网络通讯

Infinlband ：网络协议，与TCP/IP相比，TCP/IP具有转发丢失数据包的特性，基于此通信协议可能导致通信变慢，而IB使用基于信任的、流控制的机制来保证连接完整性
TCP/IP：网络协议
RDMA：面向连接传输协议，数据完整性(丢包率低)，网络协议，与TCP/IP相比，TCP/IP具有转发丢失数据包的特性，基于此通信协议可能导致通信变慢，而IB使用基于信任的、流控制的机制来保证连接完整性，以后的服务中可以做为跨节点共享内存资源的协议

5、GFS工作流程

客户端或应用程序通过 GlusterFS 的挂载点访问数据
Linux系统内核通过 VFS API 收到请求并处理
VFS 将数据递交给 FUSE 内核文件系统，并向系统注册一个实际的文件系统 FUSE，而 FUSE 文件系统则是将数据通过 /dev/fuse 设备文件递交给了 GlusterFS client 端。可以将 FUSE 文件系统理解为一个代理
GlusterFS client 收到数据后，client 根据配置文件的配置对数据进行处理
经过 GlusterFS client 处理后，通过网络将数据传递至远端的 GlusterFS Server，并且将数据写入到服务器存储设备上

总结：应用程序访问本地挂载的目录进行查看修改等操作，服务器会通过内核交给文件系统进行处理，并且处理后的数据会通过网络传递给该挂载目录实际所在的源服务器中，源服务器会对数据进行存储

6、不同服务器详解

Application：客户端或应用程序通过GlusterFSync的挂载点访问数据
VFS：linux系统内核通过VFS的API 收到请求并处理
FUSE：VFS将数据递交给FUSE内核文件系统，fuse文件系统则是将数据通过/dev/fuse设备文件递交给了GlusterFS
GlusterFS Client ：通过网络将数据传递至远端的GlusterFS Server，并且写入到服务器存储设备上

7、后端存储如何定位

弹性HASH算法是Davies-Meyer算法的具体实现，通过HASH算法可以得到一个32位的整数范围的hash值, 假设逻辑卷中有N个存储单位Brick，则32位的整数范围将被划分为N个连续的子空间，每个空间对应一个Brick。

当用户或应用程序访问某一个命名空间时，通过对该命名空间计算HASH值，根据该HASH值所对应的32位整数空间定位数据所在的Brick。