本文介绍在Oracle Linux上创建配置ceph集群。Ceph软件代号为jewel。

一、操作系统设置

以下操作在每个ceph集群节点都要操作。
1、OS内核设置

[root@hdp01 ~]# cat /proc/sys/kernel/pid_max
32768
[root@hdp01 ~]# vi /etc/sysctl.conf
kernel.pid_max = 4194303
[root@hdp01 ~]# sysctl -p

2、软件仓库

[root@hdp01 ~]# yum -y install yum-utils
[root@hdp01 ~]# yum-config-manager --enable ol7_ceph ol7_latest ol7_optional_latest ol7_addons

3、禁用防火墙和Selinux

[root@hdp01 ~]# systemctl disable firewalld
[root@hdp01 ~]# systemctl stop firewalld
[root@hdp01 ~]# sed -i -e 's,enforcing,disabled,' /etc/sysconfig/selinux 

4、设置免密码SSH互访(略)
5、各个节点配置NTP服务

[root@hdp01 ~]# echo "server ntp1.aliyun.com" >>/etc/ntp.conf
[root@hdp01 ~]# echo "server ntp2.aliyun.com" >>/etc/ntp.conf
[root@hdp01 ~]# echo "server ntp3.aliyun.com" >>/etc/ntp.conf
[root@hdp01 ~]# systemctl enable ntpd
[root@hdp01 ~]# systemctl start ntpd
[root@hdp01 ~]# ntpdate -u ntp1.aliyun.com

二、安装配置Ceph

2.1 管理节点安装配置ceph

[root@hdp01 ~]# yum -y install ceph-deploy
[root@hdp01 ~]# mkdir fc;cd fc
--创建集群
[root@hdp01 fc]# ceph-deploy new fc

2.2 编辑ceph配置文件

[root@hdp01 fc]# vi ceph.conf
osd pool default size = 3
public network = 192.168.120.0/24
rbd_default_features = 3

2.3 安装配置集群存储节点

[root@hdp01 fc]# ceph-deploy install hdp0{2..4}

此步骤就是调用yum安装软件包,如果之前配置了ceph的yum仓库,在安装过程中它会重新初始化yum仓库,如果网络差的情况下,此步骤会非常慢。最直接的就是在各个节点手工安装以下软件包:

[root@hdp02 ~]# yum -y install ceph-osd ceph-mds ceph-mon ceph-radosgw
[root@hdp03 ~]# yum -y install ceph-osd ceph-mds ceph-mon ceph-radosgw
[root@hdp04 ~]# yum -y install ceph-osd ceph-mds ceph-mon ceph-radosgw

2.4 创建ceph监控节点

[root@hdp01 fc]# ceph-deploy mon create-initial
[root@hdp01 fc]# ceph-deploy mon create hdp0{2,3,4}

在ceph集群中的监控节点都是奇数个,这里使用了4个监控节点。创建完成后,收集下各个节点的密钥信息:

[root@hdp01 fc]# ceph-deploy gatherkeys hdp0{2,3,4}

2.5 创建OSDs

[root@hdp01 fc]# ceph-deploy disk zap hdp01:sdb
[root@hdp01 fc]# ceph-deploy osd create hdp01:sdb
--检查ceph集群状态
[root@hdp01 fc]# ceph -s
    cluster ef4bfc8f-6e8b-497e-a5e5-336213a7f4f7
     health HEALTH_ERR
            64 pgs are stuck inactive for more than 300 seconds
            64 pgs degraded
            64 pgs stuck inactive
            64 pgs undersized
     monmap e1: 1 mons at {hdp01=192.168.120.96:6789/0}
            election epoch 3, quorum 0 hdp01
     osdmap e5: 1 osds: 1 up, 1 in
            flags sortbitwise
      pgmap v8: 64 pgs, 1 pools, 0 bytes data, 0 objects
            34004 kB used, 46023 MB / 46056 MB avail
                  64 undersized+degraded+peered

创建其他几个OSD:

[root@hdp01 fc]# ceph-deploy disk zap hdp02:sdb
[root@hdp01 fc]# ceph-deploy osd create hdp02:sdb
[root@hdp01 fc]# ceph-deploy disk zap hdp03:sdb
[root@hdp01 fc]# ceph-deploy osd create hdp03:sdb
[root@hdp01 ~]# ceph health
HEALTH_OK
[root@hdp01 ~]# ceph status
    cluster 87d6656b-1ba9-4345-904e-37c9f860ebc3
     health HEALTH_OK
     monmap e4: 4 mons at {hdp01=192.168.120.96:6789/0,hdp02=192.168.120.97:6789/0,hdp03=192.168.120.98:6789/0,hdp04=192.168.120.99:6789/0}
            election epoch 8, quorum 0,1,2,3 hdp01,hdp02,hdp03,hdp04
     osdmap e23: 3 osds: 3 up, 3 in
            flags sortbitwise
      pgmap v189: 214 pgs, 2 pools, 14624 kB data, 16 objects
            153 MB used, 134 GB / 134 GB avail
                 214 active+clean

三、安装配置ceph客户端

3.1 设置客户端和ceph集群之间的SSH互访(略)
3.2 安装ceph-common软件包

[root@hdp05 ~]# yum -y install ceph-common

3.3 同步ceph配置文件到客户端

[root@hdp01 fc]# ceph-deploy admin hdp05

四、创建RBD块设备

4.1 客户端创建存储池

[root@hdp05 ~]# ceph osd pool create datastore 150 150

4.2 创建块设备镜像

[root@hdp05 ~]# rbd create --size 4096 --pool datastore vol01

如果没有指定pool参数,则rbd使用默认的rbd pool。
4.3 将image映射为块设备

[root@hdp05 ~]# rbd map vol01 --pool datastore
[root@hdp05 ~]# ll /dev/rbd0
brw-rw---- 1 root disk 248, 0 Apr 11 10:27 /dev/rbd0
[root@hdp05 ~]# ll /dev/rbd/datastore/
total 0
lrwxrwxrwx 1 root root 10 Apr 11 10:27 vol01 -> ../../rbd0
[root@hdp05 ~]# lsmod|grep rbd
rbd                    77824  1 
libceph               249856  1 rbd
[root@hdp05 ~]# rbd ls -p datastore
vol01

4.4 创建文件系统
可以直接对映射的设备创建文件系统,也可以对映射后的设备进行分区操作,然后创建文件系统。

[root@hdp05 ~]# mkfs.xfs /dev/rbd0 
[root@hdp05 ~]# mount /dev/rbd0 /mnt

4.5 RBD设备自动映射
如果安装了ceph-common软件包,默认会在/etc/ceph下面产生一个rbdmap文件。此文件主要作用是在系统启动的时候自动映射块设备。

# RbdDevice             Parameters
datastore/vol01         id=admin,keyring=/etc/ceph/ceph.client.admin.keyring

其中,rbdevice为poolname/blockname,parameters的id,这里用的是admin,也就是ceph服务端的admin。
4.6 RBD设备扩容

[root@hdp05 ~]# rbd resize -p datastore --image vol01 -s 5120
Resizing image: 100% complete...done.
[root@hdp05 ~]# rbd info -p datastore --image vol01
rbd image 'vol01':
        size 5120 MB in 1280 objects
        order 22 (4096 kB objects)
        block_name_prefix: rbd_data.11342ae8944a
        format: 2
        features: layering
        flags: 
[root@hdp05 ~]# mount /dev/rbd0 /mnt
[root@hdp05 ~]# df /mnt
Filesystem                 Size  Used Avail Use% Mounted on
......
/dev/rbd0                  4.0G   33M  4.0G   1% /mnt
[root@hdp05 ~]# xfs_growfs /mnt
[root@hdp05 ~]# df /mnt
Filesystem                 Size  Used Avail Use% Mounted on
/dev/rbd0                  5.0G   33M  5.0G   1% /mnt

4.7 查看image状态

[root@hdp05 ~]# rbd status -p datastore --image vol01
Watchers:
        watcher=192.168.120.103:0/3157940806 client.4408 cookie=1
[root@hdp05 ~]# rbd status datastore/vol01
Watchers:
        watcher=192.168.120.103:0/3157940806 client.4408 cookie=1

4.8 查看image信息

[root@hdp05 ~]# rbd info --pool datastore --image vol01
rbd image 'vol01':
        size 4096 MB in 1024 objects
        order 22 (4096 kB objects)
        block_name_prefix: rbd_data.11342ae8944a
        format: 2
        features: layering
        flags: 

五、删除RBD设备

-- 卸载挂载点

[root@hdp05 ~]# umount /mnt

--删除映射

[root@hdp05 ~]# rbd unmap /dev/rbd/datastore/vol01

--删除块设备

[root@hdp05 ~]# rbd rm vol01 -p datastore

--删除存储池
在删除存储池之前,必须在ceph.conf文件中加入下面内容,然后同步到其他ceph集群节点:

[root@hdp01 ~]# vi /etc/ceph/ceph.conf
mon allow pool delete = true
[root@hdp01 ~]# for i in {2..4};do scp /etc/ceph/ceph.conf hdp0$i:/etc/ceph/;done

然后在各个节点重启mon服务:

[root@hdp01 ~]# systemctl restart ceph-mon.target
[root@hdp02 ~]# systemctl restart ceph-mon.target
[root@hdp03 ~]# systemctl restart ceph-mon.target
[root@hdp04 ~]# systemctl restart ceph-mon.target
[root@hdp05 ~]# ceph osd pool delete datastore datastore --yes-i-really-really-mean-it

六、CephFS配置

Ceph 文件系统( Ceph FS )是个 POSIX 兼容的文件系统,它使用 Ceph 存储集群来存储数据。Ceph 文件系统要求 Ceph 存储集群内至少有一个 Ceph 元数据服务器。这里将hdp04作为cephfs的元数据服务节点(MDS)。
6.1 创建MDS服务

[root@hdp01 fc]# ceph-deploy --overwrite-conf mds create hdp04
[root@hdp01 ~]# echo $(sed -n 's/.*key *= *\([^ ]*.*\)/\1/p' < /etc/ceph/ceph.client.admin.keyring) > /etc/ceph/admin.secret
[root@hdp01 ~]# chmod 600 /etc/ceph/admin.secret 
[root@hdp01 ~]# cat /etc/ceph/ceph.client.admin.keyring 
[client.admin]
        key = AQBfZM1aAhtVIhAAToLlVABZs/nH107Dt6z/jg==
[root@hdp01 ~]# cat /etc/ceph/admin.secret 
AQBfZM1aAhtVIhAAToLlVABZs/nH107Dt6z/jg==
[root@hdp01 ~]# scp /etc/ceph/admin.secret hdp07:/etc/ceph/   
[root@hdp01 ~]# scp /etc/ceph/admin.secret hdp05:/etc/ceph/

6.2 创建CephFS
MDS需要使用两个pool,一个pool用来存储数据,一个pool用来存储元数据。

[root@hdp07 ~]# ceph osd pool create cephfs_data 1
pool 'cephfs_data' created
[root@hdp07 ~]# ceph osd pool create cephfs_metadata 2
pool 'cephfs_metadata' created
[root@hdp07 ~]# ceph fs new cephfs cephfs_metadata cephfs_data
new fs with metadata pool 5 and data pool 4
[root@hdp07 ~]# ceph mds stat
e5: 1/1/1 up {0=hdp04=up:active}
[root@hdp07 ~]# mount -t ceph hdp04:6789:/ /mnt -o name=admin,secretfile=/etc/ceph/admin.secret 
[root@hdp07 ~]# df
Filesystem                 Size  Used Avail Use% Mounted on
......
192.168.120.99:6789:/      135G  156M  135G   1% /mnt

还有一种方法就是通过fuse挂载,如下:

[root@hdp07 ~]# yum -y install ceph-fuse
[root@hdp07 ~]# ceph-fuse -c /etc/ceph/ceph.conf /mnt
2018-04-11 16:44:47.705919 7ff65fab5e80 -1 init, newargv = 0x559559a5a510 newargc=11
ceph-fuse[3325]: starting ceph client
ceph-fuse[3325]: starting fuse
[root@hdp07 ~]# df /mnt
Filesystem                 Size  Used Avail Use% Mounted on
ceph-fuse                  135G  156M  135G   1% /mnt

如果客户端没有安装ceph-common软件,则使用下面的方法:

[root@hdp08 ~]# mkdir -p /etc/ceph
[root@hdp01 ~]# scp /etc/ceph/ceph.conf root@hdp08:/etc/ceph
[root@hdp01 ~]# scp /etc/ceph/ceph.client.admin.keyring root@hdp08:/etc/ceph
[root@hdp08 ~]# chmod -R 644 /etc/ceph/
[root@hdp08 ~]# ceph-fuse -c /etc/ceph/ceph.conf /mnt
[root@hdp08 ~]# df /mnt
Filesystem                 Size  Used Avail Use% Mounted on
ceph-fuse                  135G  156M  135G   1% /mnt
[root@hdp08 ~]# umount /mnt