GFS分布式文件系统

目录

一、GlusterFS简介

1、GlusterFS是什么?

2、GlusterFS特点

二、GlusterFS专业术语

三、GlusterFS构成

1、GlusterFS总流程

2、GFS的工作原理

3、分布式gfs服务器存储

四、GlusterFS的卷类型

1、分布式卷

2、条带卷

3、复制卷

4、分布式条带卷

5、分布式复制卷

五、部署GlusterFS集群实验

1、集群环境

2、更改节点名称和关闭防火墙

3、节点进行磁盘挂载,安装本地源

添加节点创建集群

创建分布式卷

创建条带卷

创建复制卷

创建分布式条带卷

创建分布式复制卷

部署gluster客户端

测试文件系统

破坏性测试/冗余测试

其他维护命令


一、GlusterFS简介

1、GlusterFS是什么?

  • Gluster是一个 开源的分布式文件系统。
  • 是一个C/S架构。
    • 存储服务器客户端以及NFS/Samba存储网关组成。
  • 没有元数据服务器组件,这有助于提升整个系统的性能,可靠性和稳定性。

文件系统定义

  • 负责实现数据存储方式,以什么格式保存在磁盘中的一个技术。

2、GlusterFS特点

扩展性和高性能

  • 分布式的特性

高可用性

  • 冗余、容灾的能力

全局统一命令空间

  • 将所有节点的命名空间整个统一命令空间。将整个系统的所有节点的存储容量组成一个大的虚拟存储池,供客户端访问。

弹性卷管理

  • 逻辑存储池可以在线进行增加和移除,不会导致业务中断。逻辑卷可以根据需求在线增长和缩减,并可以在多个节点中实现负载均衡。

基于标准协议

  • 按照什么协议进行传输(TCP/UDP),Gluster 存储服务支持 NFS、CIFS、HTTP、FTP、SMB 及 Gluster原生协议,完全与 POSIX 标准(可移植操作系统接口)兼容。

二、GlusterFS专业术语

1、Brick(块存储服务器)

  • 实际存储用户数据的服务器(相当于逻辑卷中的PE)

2、Volume(逻辑卷)

  • 一个逻辑卷是一组Brick的集合,卷是数据存储的逻辑设备。

  • 本地文件系统的“分区”

3、FUSE(用户空间的文件系统)

  • 用户的空间的文件系统(类别EXT4),这是一个”伪文件系统(就是虚拟的文件系统)“,用户端的交换模块。

4、VFS(虚拟端口)

  • 用户是提交请求给VFS,然后VFS交给FUSH,再交给GFS客户端,最后由客户端交给远程服务端进行存储。

5、Glusterd(服务)

  • 是运行再存储节点的进程(客户端运行的是gluster client),GFS使用过程中整个GFS之间的交换由Gluster client 和 glusterd 完成。

4.模块化堆栈式架构

  • GlusterFS 采用模块化、堆栈式的架构。
  • 通过对模块进行各种组合,即可实现复杂的功能。例如 Replicate 模块可实现 RAID1,Stripe 模块可实现 RAID0, 通过两者的组合可实现 RAID10 和 RAID01,同时获得更高的性能及可靠性。

总结:以上虚拟文件系统

三、GlusterFS构成

模块化推栈式架构

  • 模块化、推栈式的架构
  • 通过对模块的组合,实现复杂的功能

1、API: 应用程序编程接口

2、模块化: 每个模块可以提供不同的功能

3、推栈式: 同时启用多个模块,多个功能功能可以组合,实现复杂的功能

1、GlusterFS总流程

GFS分布式文件系统_第1张图片

  • I/O cache : I/O缓存
  • read ahead : 内核文件预读
  • distribute/stripe: 分布式、条带化
  • Gige: 千兆网/千兆接口
  • TCP/IP: 网络协议
  • InfiniBand: 网络协议,与TCP/IP具有转发丢失数据包的特性,基于此通信协议可能导致通信变慢,而IB使用基于信任的,流程制的机制来保证连接的完整性。
  • RDMA: 负责数据传输,有一种数据传输协议,功能:为了解决传输过程中客户端与服务器端数据处理的延迟。

上半部分为客户端,中间为网络层,下班部分为服务端

  • 封装多核功能模块,组成推栈式的结构,来实现复杂的功能。
  • 然后以请求的方式与客户端进行交互,客户端与服务端进行交互,由于可能会存在系统兼容问题,需要通过posix来解决系统兼容性问题,让客户端的命令通过posix过滤后可以在服务端执行。

2、GFS的工作原理

GFS分布式文件系统_第2张图片

上图说明

①外来一个请求,例:用户端申请创建一个文件,客户端或应用程序通过GFS的挂载点访问数据。

②linux系统内核通过VFS的API收到请求并处理。

③VFS将数据递交给FUSE内核文件系统,fuse文件系统则是将数据通过/dev/fuse设备文件递交给GluseterFS client端。

④GlusterFS client端收到数据后,会根据配置文件的配置对数据进行处理。

⑤再通过网络,将数据发送给远程端的Gluster server,并将数据写入到服务器储存设备上。

⑥server再将数据转交给VFS虚拟文件系统转换,再由VFS进行CFS转存处理,最后交给EXT3文件系统,最后存储到磁盘中。

3、分布式gfs服务器存储

分布式GFS存储是依靠于弹性hash算法,通过对存储内容进行hash算法的运算,可以得到32位的整数,将32位整数平均划分到 分布式服务器中,也就是每一个brick对应一段整数范围。用户根据计算得出数字找到对应的brick块。

弹性HASH算法

  • 弹性 HASH 算法是 Davies-Meyer 算法的具体实现,通过 HASH 算法可以得到一个 32 位的整数范围的 hash 值,
  • 假设逻辑卷中有 N 个存储单位 Brick,则 32 位的整数范围将被划分为 N 个连续的子空间,每个空间对应一个 Brick。
  • 当用户或应用程序访问某一个命名空间时,通过对该命名空间计算 HASH 值,根据该 HASH 值所对应的 32 位整数空间定位数据所在的 Brick。

弹性HASH算法的优点

  • 保证数据平均分布在每一个Brick中
  • 解决了对元数据服务器的依赖,进而解决了单点故障

四、GlusterFS的卷类型

1、分布式卷

  • 没有对文件进行分块处理
  • 通过扩展文件属性保存HASH值
  • 支持底层文件系统有EXT3、EXT4、ZFS、XFS等

GFS分布式文件系统_第3张图片

特点:

  • 文件分布在不同的服务器,不具备冗余性
  • 更容易和廉价的扩展卷的大小。
  • 单点故障会造成数据丢失
  • 依赖底层的数据保护

2、条带卷

  • 根据偏移量将文件分成N块(N个条带节点),轮询的存储在每个Brick Server节点
  • 存储大文件时,性能尤为突出
  • 不具备冗余性,类似Raid0

GFS分布式文件系统_第4张图片

特点

  • 数据被分割成更小块分布到块服务器群集中的不同条带区。
  • 分布减少了负载且更小的文件加速了存取的速度。
  • 没有数据冗余

3、复制卷

  • 同一文件保存一份或多份副本
  • 因为要保存副本,所以磁盘利用率较低
  • 若多个节点上的存储空间不一致,将按照木桶效应取最低点的容量作为该卷的总容量。

GFS分布式文件系统_第5张图片

特点

  • 卷中所有的服务器均保存一个完整的副本
  • 卷的副本数量可由创建的时候决定,但是复制必须等于卷中Brick所包含的存储服务器数。
  • 至少由两块服务器或更多服务器
  • 具备冗余性

4、分布式条带卷

  • 兼顾分布式卷和条带卷的功能
  • 主要用于大文件访问处理
  • 至少最少需要4台服务器

5、分布式复制卷

  • 兼顾分布式卷和复制卷的功能
  • 用于需要冗余的情况

五、部署GlusterFS集群实验

1、集群环境

Node1节点:node1/192.168.100.3      磁盘: /dev/sdb1            挂载点: /data/sdb1
                                  /dev/sdc1                    /data/sdc1
                                  /dev/sdd1                    /data/sdd1
                                  /dev/sde1                    /data/sde1

Node2节点:node2/192.168.100.20      磁盘: /dev/sdb1            挂载点: /data/sdb1
                                  /dev/sdc1                    /data/sdc1
                                  /dev/sdd1                    /data/sdd1
                                  /dev/sde1                    /data/sde1

Node3节点:node3/192.168.100.50      磁盘: /dev/sdb1            挂载点: /data/sdb1
                                  /dev/sdc1                    /data/sdc1
                                  /dev/sdd1                    /data/sdd1
                                  /dev/sde1                    /data/sde1

Node4节点:node4/192.168.100.90    磁盘: /dev/sdb1        挂载点: /data/sdb1
                                   /dev/sdc1                /data/sdc1
                                   /dev/sdd1                /data/sdd1
                                   /dev/sde1                /data/sde1

=====客户端节点:192.068.100.2=====
 

2、更改节点名称和关闭防火墙

四台机子都姚更改

GFS分布式文件系统_第6张图片

3、节点进行磁盘挂载,安装本地源

所有节点都需要做,这边以node1为例

GFS分布式文件系统_第7张图片

 进行时间同步

添加节点创建集群

添加节点到存储信任池中(仅需在一个节点上操作,我这里依旧在node1节点上操作)
gluster peer probe node1
gluster peer probe node2
gluster peer probe node3
gluster peer probe node4
gluster peer status

GFS分布式文件系统_第8张图片

 根据规划创建卷

卷名 卷类型 Brick
dis-volume 分布式卷 node1(/data/sdb1)、node2(/data/sdb1)
stripe-volume 条带卷 node1(/data/sdc1)、node2(/data/sdc1)
rep-volume 复制卷 node3(/data/sdb1)、node4(/data/sdb1)
dis-stripe 分布式条带卷 node1(/data/sdd1)、node2(/data/sdd1)、node3(/data/sdd1)、node4(/data/sdd1)
dis-rep 分布式复制卷 node1(/data/sde1)、node2(/data/sde1)、node3(/data/sde1)、node4(/data/sde1)

创建分布式卷

gluster volume create dis-volume node1:/data/sdb1 node2:/data/sdb1 force


创建分布式卷,没有指定类型,默认创建的是分布式卷
gluster volume list
#查看类型
gluster volume start dis-volume
#开启
gluster volume info dis-volume
#查看卷信息 

GFS分布式文件系统_第9张图片

创建条带卷

指定类型为 stripe,数值为 2,且后面跟了 2 个 Brick Server,所以创建的是条带卷
gluster volume create stripe-volume stripe 2 node1:/data/sdc1 node2:/data/sdc1 force
gluster volume start stripe-volume
gluster volume info stripe-volume

GFS分布式文件系统_第10张图片

创建复制卷

指定类型为 replica,数值为 2,且后面跟了 2 个 Brick Server,所以创建的是复制卷

gluster volume create rep-volume replica 2 node3:/data/sdb1 node4:/data/sdb1 force
gluster volume start rep-volume
gluster volume info rep-volume

GFS分布式文件系统_第11张图片

创建分布式条带卷

gluster volume create dis-stripe stripe 2 node1:/data/sdd1 node2:/data/sdd1 node3:/data/sdd1 node4:/data/sdd1 force
gluster volume start dis-stripe
gluster volume info dis-stripe

GFS分布式文件系统_第12张图片

创建分布式复制卷

指定类型为 replica,数值为 2,而且后面跟了 4 个 Brick Server,是 2 的两倍,所以创建的是分布式复制卷
gluster volume create dis-rep replica 2 node1:/data/sde1 node2:/data/sde1 node3:/data/sde1 node4:/data/sde1 force
gluster volume start dis-rep
gluster volume info dis-rep

GFS分布式文件系统_第13张图片gluster volume list

GFS分布式文件系统_第14张图片

部署gluster客户端

部署Gluster客户端(192.168.32.11)
systemctl stop firewalld
setenforce 0
cd /opt
unzip gfsrepo.zip

GFS分布式文件系统_第15张图片

cd /etc/yum.repos.d/
mv .repo repos.bak
vim glfs.repo
[glfs]
name=glfs
baseurl=file:///opt/gfsrepo
gpgcheck=0
enabled=1

GFS分布式文件系统_第16张图片

GFS分布式文件系统_第17张图片

 yum -y install glusterfs glusterfs-fuse
mkdir -p /test/{dis,stripe,rep,dis_stripe,dis_rep}
cd /test/

GFS分布式文件系统_第18张图片

echo "192.168.100.20 node1" >> /etc/hosts
echo "192.168.100.50 node2" >> /etc/hosts
echo "192.168.100.60 node3" >> /etc/hosts
echo "192.168.100.3 node4" >> /etc/hosts GFS分布式文件系统_第19张图片

mount.glusterfs node1:dis-volume /test/dis
mount.glusterfs node1:stripe-volume /test/stripe
mount.glusterfs node1:rep-volume /test/rep
mount.glusterfs node1:dis-stripe /test/dis_stripe
mount.glusterfs node1:dis-rep /test/dis_rep

GFS分布式文件系统_第20张图片GFS分布式文件系统_第21张图片

测试文件系统

写入文件

dd if=/dev/zero of=/opt/demo1.log bs=1M count=20
dd if=/dev/zero of=/opt/demo2.log bs=1M count=20
dd if=/dev/zero of=/opt/demo3.log bs=1M count=20
dd if=/dev/zero of=/opt/demo4.log bs=1M count=20
dd if=/dev/zero of=/opt/demo5.log bs=1M count=20

GFS分布式文件系统_第22张图片

 ls -lh /opt

 GFS分布式文件系统_第23张图片

 cp demo* /test/dis
cp demo* /test/stripe/
cp demo* /test/rep/
cp demo* /test/dis_stripe/
cp demo* /test/dis_rep/

GFS分布式文件系统_第24张图片

GFS分布式文件系统_第25张图片

查看文件分布

查看分布式文件分布(node1:/dev/sdb1、node2:/dev/sdb1)

[root@node1 ~]# ls -lh /data/sdb1
[root@node2 ~]# ls -lh /data/sdb1

GFS分布式文件系统_第26张图片

GFS分布式文件系统_第27张图片

 查看条带卷文件分布(node1:/dev/sdc1、node2:/dev/sdc1)

[root@node1 ~]#ls -lh /data/sdc1
[root@node2 ~]#ls -lh /data/sdc1

GFS分布式文件系统_第28张图片

 

 查看复制卷文件分布(node3:/dev/sdb1、node4:/dev/sdb1)

[root@node3 ~]#ll -h /data/sdb1
[root@node4 ~]#ll -h /data/sdb1

GFS分布式文件系统_第29张图片

 

 查看分布式条带卷分布(node1:/dev/sdd1、node2:/dev/sdd1、node3:/dev/sdd1、node4:/dev/sdd1)

[root@node1 ~]#ll -h /data/sdd1
[root@node2 ~]#ll -h /data/sdd1
[root@node3 ~]#ll -h /data/sdd1
[root@node4 ~]#ll -h /data/sdd1

GFS分布式文件系统_第30张图片

 

GFS分布式文件系统_第31张图片

 

查看分布式复制卷分布(node1:/dev/sde1、node2:/dev/sde1、node3:/dev/sde1、node4:/dev/sde1)

[root@node1 ~]#ll -h /data/sde1
[root@node2 ~]#ll -h /data/sde1
[root@node3 ~]#ll -h /data/sde1
[root@node4 ~]#ll -h /data/sde1

GFS分布式文件系统_第32张图片

GFS分布式文件系统_第33张图片GFS分布式文件系统_第34张图片 

 

破坏性测试/冗余测试

挂起node2节点模拟故障

GFS分布式文件系统_第35张图片

在客户端

分布式数据查看,缺少demo5这是在node2上的,不具备冗余

ll /test/dis

条带卷,无法访问,不具备冗余

ll /test/stripe/

复制卷,在node3和node4上的,关闭node4进行测试,具有冗余

ll /test/rep/                #会卡一段时间,耐心等待

GFS分布式文件系统_第36张图片

分布式条带卷,不具备冗余

ll /test/dis_stripe/

分布式复制卷,具有冗余

ll /test/dis_rep/

GFS分布式文件系统_第37张图片

其他维护命令

1.查看GlusterFS卷
gluster volume list 
 
2.查看所有卷的信息
gluster volume info
 
3.查看所有卷的状态
gluster volume status
 
4.停止一个卷
gluster volume stop dis-stripe
 
5.删除一个卷,注意:删除卷时,需要先停止卷,且信任池中不能有主机处于宕机状态,否则删除不成功
gluster volume delete dis-stripe
 
6.设置卷的访问控制
#仅拒绝
gluster volume set dis-rep auth.allow 192.168.32.11
 
#仅允许
gluster volume set dis-rep auth.allow 192.168.32.*      #设置192.168.184.0网段的所有IP地址都能访问dis-rep卷(分布式复制卷)

你可能感兴趣的:(数据库数据存储,运维,服务器,网络,运维)