ceph集群创建:
创建虚拟机器必须是单数例如:3,6,9等
主机名对相应的/etc/hosts,ip地址,yum源可以上网查询
修改所有主机的主机名,ssh免密连接,ntp时间同步,创建物理磁盘
步骤一:
挂在相关的ceph资源包,ceph-mon,ceph-Tools,ceph-osd,ceph-ardosgw,ceph-mds
添加到/etc/yum.repos.d/local.repo
注意!这里我是用自己本地的ceph源
[ceph-mon]
name=CentOS 7
baseurl=ftp://192.168.4.254/ceph/MON
enabled=1
gpgcheck=0
[ceph-osd]
name=CentOS 7
baseurl=ftp://192.168.4.254/ceph/OSD
enabled=1
gpgcheck=0
[ceph-mds]
name=CentOS 7
baseurl=ftp://192.168.4.254/ceph/mds
enabled=1
gpgcheck=0
[ceph-Tools]
name=CentOS 7
baseurl=ftp://192.168.4.254/ceph/Tools
enabled=1
gpgcheck=0
第二步:vim /etc/hosts //编辑/etc/hosts主机名
vim /etc/hosts
192.168.1.10 ceph1
步骤三:ssh免密登陆
ssh-keygen -f ~/.ssh/id_rsa -N ''
for i in ceph{1..3}
do
ssh-copy-id -i $i
done
步骤四:时间同步
编辑/etc/chrony.conf
[student@root ~]$ cat /etc/chrony.conf
# Use public servers from the pool.ntp.org project.
# Please consider joining the pool (http://www.pool.ntp.org/join.html).
server ntp.aliyun.com iburst
server ntp1.aliyun.com iburst
#server 1.centos.pool.ntp.org iburst
#server 2.centos.pool.ntp.org iburst
server 192.168.1.254 iburst #自己主机的网关
[student@root ~]$ for i in ceph{1..3}
do
scp /etc/chrony.cong $i:/etc
ssh $i "systemctl restart chronyd;systemctl enable chronyd"
scp /etc/yum.repos.d/local.repo $i:/etc/yum.repos.d/
ssh $i "yum clean all ;yum repolist"
done
步骤五添加物理磁盘:
物理机上为每个虚拟机准备3块20G磁盘(可以使用命令,也可以使用图形直接添加)
案例2:部署ceph集群
- 安装部署工具ceph-deploy
- 创建ceph集群
- 准备日志磁盘分区
- 创建OSD存储空间
查看ceph状态,验证
2.2 步骤
实现此案例需要按照如下步骤进行。
步骤一:安装部署软件ceph-deploy
1)在node1安装部署工具,学习工具的语法格式。
- [root@node1 ~]# yum -y install ceph-deploy
- [root@node1 ~]# ceph-deploy --help
- [root@node1 ~]# ceph-deploy mon --help
2)创建目录
- [root@node1 ~]# mkdir ceph-cluster
- [root@node1 ~]# cd ceph-cluster/
步骤二:部署Ceph集群
1)给所有节点安装ceph相关软件包。
- [root@node1 ceph-cluster]# for i in node1 node2 node3
- do
- ssh $i "yum -y install ceph-mon ceph-osd ceph-mds ceph-radosgw"
- done
2)创建Ceph集群配置,在ceph-cluster目录下生成Ceph配置文件。
在ceph.conf配置文件中定义monitor主机是谁。
- [root@node1 ceph-cluster]# ceph-deploy new node1 node2 node3
3)初始化所有节点的mon服务,也就是启动mon服务(主机名解析必须对)。
- [root@node1 ceph-cluster]# ceph-deploy mon create-initial
常见错误及解决方法(非必要操作,有错误可以参考):
如果提示如下错误信息:
- [node1][ERROR ] admin_socket: exception getting command descriptions: [Error 2] No such file or directory
解决方案如下(在node1操作):
先检查自己的命令是否是在ceph-cluster目录下执行的!!!!如果确认是在该目录下执行的create-initial命令,依然报错,可以使用如下方式修复。
- [root@node1 ceph-cluster]# vim ceph.conf #文件最后追加以下内容
- public_network = 192.168.4.0/24
修改后重新推送配置文件:
- [root@node1 ceph-cluster]# ceph-deploy --overwrite-conf config push node1 node2 node3
步骤三:创建OSD
备注:vdb1和vdb2这两个分区用来做存储服务器的journal缓存盘。
- [root@node1 ceph-cluster]# for i in node1 node2 node3
- do
- ssh $i "parted /dev/vdb mklabel gpt"
- ssh $i "parted /dev/vdb mkpart primary 1 50%"
- ssh $i "parted /dev/vdb mkpart primary 50% 100%"
- done
2)磁盘分区后的默认权限无法让ceph软件对其进行读写操作,需要修改权限。
node1、node2、node3都需要操作,这里以node1为例。
- [root@node1 ceph-cluster]# chown ceph.ceph /dev/vdb1
- [root@node1 ceph-cluster]# chown ceph.ceph /dev/vdb2
- #上面的权限修改为临时操作,重启计算机后,权限会再次被重置。
- #我们还需要将规则写到配置文件实现永久有效。
- #规则:如果设备名称为/dev/vdb1则设备文件的所有者和所属组都设置为ceph。
- #规则:如果设备名称为/dev/vdb2则设备文件的所有者和所属组都设置为ceph。
- [root@node1 ceph-cluster]# vim /etc/udev/rules.d/70-vdb.rules
- ENV{DEVNAME}=="/dev/vdb1",OWNER="ceph",GROUP="ceph"
- ENV{DEVNAME}=="/dev/vdb2",OWNER="ceph",GROUP="ceph"
3)初始化清空磁盘数据(仅node1操作即可)。
- [root@node1 ceph-cluster]# ceph-deploy disk zap node1:vdc node1:vdd
- [root@node1 ceph-cluster]# ceph-deploy disk zap node2:vdc node2:vdd
- [root@node1 ceph-cluster]# ceph-deploy disk zap node3:vdc node3:vdd
4)创建OSD存储空间(仅node1操作即可)
重要:很多同学在这里会出错!将主机名、设备名称输入错误!!!
- [root@node1 ceph-cluster]# ceph-deploy osd create \
- node1:vdc:/dev/vdb1 node1:vdd:/dev/vdb2
- //创建osd存储设备,vdc为集群提供存储空间,vdb1提供JOURNAL缓存,
- //每个存储设备对应一个缓存设备,缓存需要SSD,不需要很大
- [root@node1 ceph-cluster]# ceph-deploy osd create \
- node2:vdc:/dev/vdb1 node2:vdd:/dev/vdb2
- [root@node1 ceph-cluster]# ceph-deploy osd create \
- node3:vdc:/dev/vdb1 node3:vdd:/dev/vdb2
常见错误及解决方法(非必须操作)。
使用osd create创建OSD存储空间时,如提示下面的错误提示:
[ceph_deploy][ERROR ] RuntimeError: bootstrap-osd keyring not found; run 'gatherkeys'
可以使用如下命令修复文件,重新配置ceph的密钥文件:
- [root@node1 ceph-cluster]# ceph-deploy gatherkeys node1 node2 node3
步骤四:验证测试
1) 查看集群状态。
- [root@node1 ~]# ceph -s
2)常见错误(非必须操作)。
如果查看状态包含如下信息:
- health: HEALTH_WARN
- clock skew detected on node2, node3…
clock skew表示时间不同步,解决办法:请先将所有主机的时间都使用NTP时间同步!!!
Ceph要求所有主机时差不能超过0.05s,否则就会提示WARN。
如果状态还是失败,可以尝试执行如下命令,重启ceph服务:
- [root@node1 ~]# systemctl restart ceph\*.service ceph\*.target
3 案例3:创建Ceph块存储
3.1 问题
沿用练习一,使用Ceph集群的块存储功能,实现以下目标:
- 创建块存储镜像
- 客户端映射镜像
- 创建镜像快照
- 使用快照还原数据
- 使用快照克隆镜像
- 删除快照与镜像
3.2 步骤
实现此案例需要按照如下步骤进行。
步骤一:创建镜像
1)查看存储池。
- [root@node1 ~]# ceph osd lspools
- 0 rbd,
2)创建镜像、查看镜像
- [root@node1 ~]# rbd create demo-image --image-feature layering --size 10G
- [root@node1 ~]# rbd create rbd/jacob --image-feature layering --size 10G
#这里的demo-image和jacob为创建的镜像名称,可以为任意字符。
#--image-feature参数指定我们创建的镜像有哪些功能,layering是开启COW功能。
#提示:ceph镜像支持很多功能,但很多是操作系统不支持的,我们只开启layering。
- [root@node1 ~]# rbd list
- [root@node1 ~]# rbd info demo-image
- rbd image 'demo-image':
- size 10240 MB in 2560 objects
- order 22 (4096 kB objects)
- block_name_prefix: rbd_data.d3aa2ae8944a
- format: 2
- features: layering
步骤二:动态调整
1)扩容容量
- [root@node1 ~]# rbd resize --size 15G jacob
- [root@node1 ~]# rbd info jacob
2)缩小容量
- [root@node1 ~]# rbd resize --size 7G jacob --allow-shrink
- [root@node1 ~]# rbd info image
步骤三:通过KRBD访问
1)客户端通过KRBD访问
- #客户端需要安装ceph-common软件包
- #拷贝配置文件(否则不知道集群在哪)
- #拷贝连接密钥(否则无连接权限)
- [root@client ~]# yum -y install ceph-common
- [root@client ~]# scp 192.168.4.11:/etc/ceph/ceph.conf /etc/ceph/
- [root@client ~]# scp 192.168.4.11:/etc/ceph/ceph.client.admin.keyring \
- /etc/ceph/
- [root@client ~]# rbd map jacob
- [root@client ~]# lsblk
- [root@client ~]# rbd showmapped
- id pool image snap device
- 0 rbd jacob - /dev/rbd0
2) 客户端格式化、挂载分区
- [root@client ~]# mkfs.xfs /dev/rbd0
- [root@client ~]# mount /dev/rbd0 /mnt/
- [root@client ~]# echo "test" > /mnt/test.txt
步骤四:创建镜像快照
1) 查看镜像快照(默认所有镜像都没有快照)。
- [root@node1 ~]# rbd snap ls jacob
2) 给镜像创建快照。
- [root@node1 ~]# rbd snap create jacob --snap jacob-snap1
- #为jacob镜像创建快照,快照名称为jacob-snap1
- [root@node1 ~]# rbd snap ls jacob
- SNAPID NAME SIZE
- 4 jacob-snap1 15360 MB
3) 删除客户端写入的测试文件
- [root@client ~]# rm -rf /mnt/test.txt
- [root@client ~]# umount /mnt
4) 还原快照
- [root@node1 ~]# rbd snap rollback jacob --snap jacob-snap1
- #客户端重新挂载分区
- [root@client ~]# mount /dev/rbd0 /mnt/
- [root@client ~]# ls /mnt
步骤五:创建快照克隆
1)克隆快照
- [root@node1 ~]# rbd snap protect jacob --snap jacob-snap1
- [root@node1 ~]# rbd snap rm jacob --snap jacob-snap1 //会失败
- [root@node1 ~]# rbd clone \
- jacob --snap jacob-snap1 jacob-clone --image-feature layering
- //使用jacob镜像的快照jacob-snap1克隆一个新的名称为jacob-clone的镜像
2)查看克隆镜像与父镜像快照的关系
- [root@node1 ~]# rbd info jacob-clone
- rbd image 'jacob-clone':
- size 15360 MB in 3840 objects
- order 22 (4096 kB objects)
- block_name_prefix: rbd_data.d3f53d1b58ba
- format: 2
- features: layering
- flags:
- parent: rbd/jacob@jacob-snap1
- #克隆镜像很多数据都来自于快照链
- #如果希望克隆镜像可以独立工作,就需要将父快照中的数据,全部拷贝一份,但比较耗时!!!
- [root@node1 ~]# rbd flatten jacob-clone
- [root@node1 ~]# rbd info jacob-clone
- rbd image 'jadob-clone':
- size 15360 MB in 3840 objects
- order 22 (4096 kB objects)
- block_name_prefix: rbd_data.d3f53d1b58ba
- format: 2
- features: layering
- flags:
- #注意,父快照信息没了!
- [root@node1 ~]# rbd snap unprotect jacob --snap jacob-snap1 #取消快照保护
- [root@node1 ~]# rbd snap rm jacob --snap jacob-snap1 #可以删除快照
步骤六:其他操作
1) 客户端撤销磁盘映射
- [root@client ~]# umount /mnt
- [root@client ~]# rbd showmapped
- id pool image snap device
- 0 rbd jacob - /dev/rbd0
- //语法格式:
- [root@client ~]# rbd unmap /dev/rbd0