一、简介
MooseFS(Moose File System,mfs)是一种分布式文件系统,它将数据分布在网络中的不同服务器上,支持FUSE(用户空间文件系统Filesystem in Userspace,简称FUSE),客户端挂载后可以作为一个 普通的Unix 文件系统使用MooseFS。
MooseFS中共有四种角色: 主控服务器 master server、 主控备份服务器 metalogger server、 存储块服务器 chunkserver、 客户端主机 client。
主控服务器 负责各个存储服务器的管理、文件读写调度、文件空间回收以及恢复、多节点拷贝。
主控备份服务器 负责备份主控服务器的元数据、变化日志文件,文件类型为changelog_ml.*.mfs,以便在主控服务器出问题的时候可以恢复。
存储块服务器 负责提供存储空间,并为客户提供数据传输。
客户端则通过fuse挂接主控服务器上所管理的存储块服务器,可以像操作本地文件一样操作MooseFS文件系统中的文件。
NFS虽然使用简单,但当NFS客户端访问量大时,通过NFS方式共享一个服务器的存储空间,使得NFS服务器不堪重负,并且执行读写都比较频繁的操作会出现意外的错误,对于高可靠的集群部署是有挑战的。
分布式文件系统服务器之间的数据访问不再是一对多的关系(1个NFS服务器,多个NFS客户端),而是多对多的关系,这样一来,性能大幅提升毫无问题。moosefs分布式文件系统,实施起来简单、不停止服务扩容、恢复服务容易,因为作为共享存储服务器是个不错的选择。
MooseFS 读写流程图:
MFS的官方网站: http://www.moosefs.org/download.html 。
上面有详细的MFS简介和MooseFS分布式文件系统安装向导以及MFS。
先将 mfs-1.6.25-1.tar.gz 重命名为 mfs-1.6.25.tar.gz
#yum install fuse-devel pkgconfig zlib-devel //build源码包需要的依赖
#rpmbuild -ta mfs-1.6.25.tar.gz
会生成6个rpm二进制安装包(其中debuginfo调试时使用):
也可以通过tar zxvf mfs-1.6.25-1.tar.gz 解压,使用./configure、make、make install安装(具体参考 安装向导 )。
(1) 安装
#rpm -ivh mfs-master-1.6.25-1.x86_64.rpm //安装
#rpm -ql mfs-master //查询安装的文件路径,可以查看所有的安装文件,便于修改
/etc/mfsexports.cfg.dist /etc/mfsmaster.cfg.dist /etc/mfstopology.cfg.dist /usr/sbin/mfsmaster /usr/sbin/mfsmetadump /usr/sbin/mfsmetarestore /usr/share/doc/mfs-master-1.6.25/usr/share/doc/mfs-master-1.6.25/NEWS /usr/share/doc/mfs-master-1.6.25/README /usr/share/doc/mfs-master-1.6.25/UPGRADE /usr/share/man/man5/mfsexports.cfg.5.gz /usr/share/man/man5/mfsmaster.cfg.5.gz /usr/share/man/man5/mfstopology.cfg.5.gz /usr/share/man/man7/mfs.7.gz /usr/share/man/man7/moosefs.7.gz /usr/share/man/man8/mfsmaster.8.gz /usr/share/man/man8/mfsmetarestore.8.gz /var/lib/mfs /var/lib/mfs/metadata.mfs.empty
(2) 复制样例文件,以得到 master 所需的配置文件
#cp mfsmaster.cfg.dist mfsmaster.cfg
#cp mfstopology.cfg.dist mfstopology.cfg
#cp mfsexports.cfg.dist mfsexports.cfg
如果我们打算更改这些配置文件中的某些项目的值,则需要打开特定配置文件相关文本行前的 注释 , 然后修改跟随其后的值。因为被注释掉的行,即是 MooseFS 内置的缺省值。
Mfsmaster.cfg 配置文件包含主控服务器 master 相关的设置,想查看 该配置文件 更多信息使用 命令 man mfsmaster.cfg。
mfsexports.cfg 指定那些客户端主机可以远程挂接 MooseFS 文件系统, 以及授予 挂接客户端什么样的访问权限。 例如 指定只有 192.168.40.x 网段的主机可以以读写模式访问 MooseFS 的整个共享结构资源(/),在 配置文件 mfsexports.cfg 文件的第二行改为或添加:
(注:可以挂在根/目录下的子目录,配置文件加上192.168.40.0/24 /test rw,alldirs,maproot=0,password=test,注意test目录是在根目录已经创建好的子目录,并且挂载时使用 mfsmount /mnt/client -H mfsmaster -o mfssubfolder=/test -p,否则会出现mfsmaster register error: Permission denied的错误。)
# Allow everything but "meta".#* / rw,alldirs,maproot=0192.168.40.0/24 / rw,alldirs,maproot=0 192.168.40.0/24 . rw
二进制文件 metadata 和文本文件 changelog 将被保存在目录/var/lib/mfs, 安装 master 时,会自动生成一个名为 metadata.mfs.empty 的元数据文件 metadata,该文件是空的。MooseFS master 运必须有文件 metadata.mfs,这个文件是从 metadata.mfs.empty 改名而来。
# cd /var/lib/mfs
#cp metadata.mfs.empty metadata.mfs // MooseFS master 运行以后,metadata.mfs 文件大小将发生变,不会为空文件。
(3) 绑定主机名 mfsmaster 与 ip (每个节点都需 绑定 ) 修改/etc/hosts 文件,以绑定主机名 mfsmaster 与 ip 地址:
192.168.40.125 mfsmaster
(4)安装 CGI
为了监控 MooseFS 当前运行状态,可以安装运行 CGI 监控服务 用浏览器查看整个MooseFS 的运行情况。
#rpm -ivh mfs-cgi-1.6.25-1.x86_64.rpm
#rpm -ql mfs-cgi
(5)启动
# /usr/sbin/mfsmaster start
会出现问题:
working directory: /var/lib/mfs can't create lockfile in working directory: EACCES (Permission denied)
主要是没有设置 运行用户
和运行组,添加用户(安装完成后配置文件没有改动),也可以使用
nobody:nobody。
# groupadd mfs // 添加 mfs 组
#useradd -g mfs mfs // 新增系统用户mfs
#chown -R mfs.mfs /var/lib/mfs //设置文件所属用户和组(也可以直接指定用户和组,不需要重新创建)
#vim /etc/mfsmaster.cfg
WORKING_USER = mfs WORKING_GROUP = mfs# SYSLOG_IDENT = mfsmaster# LOCK_MEMORY = 0
然后正常启动!
# /usr/sbin/mfscgiserv start
会打不开网页,这是因为cgi文件没有可执行权限
#chmod +x /usr/share/mfscgi/*.cgi
然后启动 ,在浏览器地址栏输入 http://192.168.40.125:9425 即可查看 master 的运行情况(这时不能看见 chunk server 的数据 )。
(1) 安装
安装 备份服务器metalogger的主机在性能上应该比 master 强大(至少有更多的内存),一旦主控服务器 master 失效,只要导入 changelogs 到元数据文件,备份服务器 metalogger 将能接替发生故障的 master,行使管理服务器的职能。
若 备份服务器 单独安装,需要安装fuse-devel和修改vim /etc/hosts添加192.168.40.125 mfsmaster。 添加mfs用户和组,也可指定到其他用户,或使用nobody:nobody。
#rpm -ivh mfs-metalogger-1.6.25-1.x86_64.rpm
#rpm -ql mfs-metalogger
#cp mfsmetalogger.cfg.dist mfsmetalogger.cfg
#vim mfsmetalogger.cfg(不修改会出现Permission denied)
WORKING_USER = mfs WORKING_GROUP = mfs
接着运行备份服务 mfsmetaloger:
#usr/sbin/mfsmetalogger start
在生产环境里应当设置自动启动脚本,以便操作系统重新启动时MooseFSmfsmetalogger 服务也能自动运行。
(1) 安装
若在其他主机上单独安装chunkserver需要安装 fuse-devel,并添加mfs用户和组(可指定到其他用户)
#rpm -ivh mfs-chunkserver-1.6.25-1.x86_64.rpm //安装
#rpm -ql mfs-chunkserver //查询安装的文件路径,可以查看所有的安装文件,便于修改
(2) 准备 chunk server 服务所需的配置文件
#cp mfschunkserver.cfg.dist mfschunkserver.cfg
#cp mfshdd.cfg.dist mfshdd.cfg
#vim /etc/ mfschunkserver.cfg (想了解配置文件mfschunkserver.cfg更详细的信息,请查看手册页man mfschunkserver.cfg )
WORKING_USER = mfs WORKING_GROUP = mfs
(3)建立共享点
在配置文件 mfshdd.cfg 中 , 给出了用于客户端挂接 MooseFS 分布式文件系统根分区所 使用的共享空间位置。 建议在 chunk server 上划分单独的空间新建一个设备挂载点作为储存点专门给 MooseFS 使用 , 这样做的好处是便于管理剩余空间 。
此处 假定要使用两个共享点/mnt/mfschunks1 和/mnt/mfschunks2 ,在 mfshdd.cfg 加入下面的文本行 :
# mount points of HDD drives##/mnt/hd1#/mnt/hd2#etc./mnt/mfschunks1 /mnt/mfschunks2
在启动 chunk server 前,需确保用户 mfs 有权限读写将要被挂接的分区(因为 chunk server 运行时要在此创建一个.lock 的文件)。否则出现以下错误:
hdd space manager: can't create lock file '/mnt/mfschunks1/.lock': EACCES (Permission denied) init: hdd space manager failed !!!
#chown -R mfs:mfs /mnt/mfschunks1
#chown -R mfs:mfs /mnt/mfschunks2
(注:若是单独与 master 的机器,还需执行 chown -R mfs:mfs /var/lib/mfs和修改 /etc/hosts 添加 192.168.40.125 mfsmaster。 )
(4) 开始启动 chunk server
#/usr/sbin/mfschunkserver start
再通过浏览器访问 http://192.168.40.125:9425就可以看到 MooseFS 系统的全部信息,包括主控 master 和存储服务 chunkserver 。
(5)MooseFS chunk 以独占方式使用专门磁盘分区
在上述操作过程中不需要这部分的内容,此部分是在实际应用环境下,将chunk server用专门磁盘分区作为 设备挂载点,这样做是不要的,便于管理剩余空间,因为MooseFS 并不考虑其剩余空间能被另作他用。
如果没有单独创建文件系统的条件,可以在文件中创建一个文件系统,在此准备两个 2GB 的文件(文件位于目录/var/lib/mfs/下,也可以放在其他目录下),并在其上创建文件系统,把他们格式化为 ext3,分别挂接在/mnt/mfschunks1 和/mnt/mfschunks2。
操作步骤: 挂接第一个文件系统
1、创建镜像文件mfschunks1
#dd if=/dev/zero of= /var/lib/mfs/ mfschunks1 bs=1024 count=1 seek=$((2*1024*1024-1))
2、创建文件系统
##mkfs -t ext3 /var/lib/mfs/ mfschunks1
3、创建挂接点
#mkdir -p /mnt/mfschunks1
4、挂接文件系统
#mount -t ext3 -o loop /var/lib/mfs/ mfschunks1 /mnt/mfschunks1
挂接第二个文件系统的步骤与上面相同,# mount -t ext3 -o loop /var/lib/mfs/ mfschunks2 /mnt/mfschunks2
在启动 chunk server 前,需确保用户 mfs 有权限读写将要被挂接的分区(因为 chunk server 运行时要在此创建一个.lock 的文件):
#chown -R mfs:mfs /mnt/mfschunks1
#chown -R mfs:mfs /mnt/mfschunks2
为了挂接基于 MooseFS 分布式文件,客户端主机必须安装 FUSE 软件包( fuse 版本号至少
2.6,推荐使用版本号大于 2.7.2 的 fuse),#yum install fuse。
安装客户端软件 mfsmount:
#rpm -ivh mfs-client-1.6.25-1.x86_64.rpm
(客户端若单独安装,需要安装fuse-devel和修改vim /etc/hosts添加192.168.40.125 mfsmaster。)
#cp /etc/mfsmount.cfg.dist /etc/mfsmount.cfg
假定客户端的挂接点是/mnt/mfs,将以下面的指令来使用 MooseFS 分布式共享文件系统:
1、 创建挂接点
#mkdir -p /mnt/ mfs
2、开始挂接操作
#/usr/bin/mfsmount /mnt/ mfs -H mfsmaster
有时会出现mfsmaster register error: Permission denied:
是因为 mfsmaster的配置文件和挂载目录 不一致的原因, vim /etc/mfsexports.cfg
# Allow everything but "meta".#* / rw,alldirs,maproot=0192.168.40.0/24 /test rw,alldirs,maproot=0
master的挂载配置文件中 允许挂载的目录是 /test ,若用户# mfsmount /mnt -H mfsmaster (不加 -o mfssubfolder 默认是挂载/)挂载 根/目录会挂载不上,可以修改 mfsexports.cfg配置文件为/,再进行挂在就没问题了。
192.168.40.0/24 / rw,alldirs,maproot=0
# /usr/sbin/mfsmaster restart
有时挂载目录有内容,提示error in fuse_mount,可以使用 -o nonempty 选项挂载。
# mfsmount /mnt/mfs -H mfsmaster -o nonempty
3、挂载meta文件系统
首先保证 mfsexports.cfg 文件中加入:
# Allow "meta".* . rw
然后执行:
#mfsmount -m / mnt/mfs -H mfsmaster
可以不挂载MFS META文件系统,挂载该系统主要是为了恢复被误删除的文件。
4、查看分区
执行命令 df -h | grep mfs 检查分区情况:
mfsmaster:9421 102G 256K 102G 1% /mnt/mfs
(1)备份
#cd /mnt/mfs
#mkdir dir1
#mkdir dir2
默认mfs将储存的文件只储存在一个节点上(master选取的)。
设置储存在储存块dir2上的文件储存在两个节点上,做一个备份,系统会自动将数据同步到选定的节点上,这样达到里备份的效果 。
因master和trunk服务器在同一台机器上, 即便设定了 goal=2 来到达保存两个副本但 看到的只是一个副本而已, 尽管有两个trunk挂在点,但 它只是一个 chunk server。
设置文件副本数量,一般以3份为佳。
#mfssetgoal -r 3 /mnt/mfs
#mfsgetgoal /mnt/mfs/
#/mnt/mfs : 3
(2)设置删除文件的空间回收时间
#mfsgettrashtime dir2/passwd
dir2/passwd: 86400
#mfssettrashtime 300 /mnt/mfs
获取删除 dir2/passwd后在回收站中保存的时间,防止用户误删,这个数字不能设置的太高也不能太低,一般设置为300(5分钟)。
(3)查看目录信息
# mfsdirinfo -H /mnt/mfs
(4)数据恢复
二进制文件 metadata 和文本文件 changelog 将被保存在目录/var/lib/mfs
执行数据恢复操作,其命令为:mfsmetarestore -m metadata.mfs.back -o metadata.mfs changelog_ml.*.mfs 恢复成功后再执行启动新的 master 服务操作。
(5) 停止 MooseFS
为了安全停止 MooseFS 集群, 建议执行如下的步骤:
在所有客户端用 unmount 命令先卸载文件系统(本例将是: umount /mnt/mfs)
停止 chunk server 进程: /usr/sbin/mfschunkserver stop
停止 metalogger 进程: /usr/sbin/mfsmetalogger stop
停止主控 master server 进程: /usr/sbin/mfsmaster stop
(1)使用configre、make、make install的方式可以参考官方文档,具体参数和配置都给的很详细, 官方网站 http://www.moosefs.org/download.html 。
(2) 集群部署还需要进一步强化,数据恢复及其他关于MooseFS的内容以后会更新。
(3)MooseFS 命令的使用方法: http://www.moosefs.org/reference-guide.html#using-moosefs 。
(4)上述的安装包和参考文档已上传到csdn上,需要下载的可以点击 http://download.csdn.net/detail/taiyang1987912/8229595 。