ceph安装部署

ceph集群创建:

创建虚拟机器必须是单数例如:3,6,9等

主机名对相应的/etc/hosts,ip地址,yum源可以上网查询

修改所有主机的主机名,ssh免密连接,ntp时间同步,创建物理磁盘

hostnamectl set-hostname ceph1
reboot


1.关闭防火墙
systemctl stop firewalld
systemctl disable firewalld

2.关闭selinux
setenforce 0

步骤一:

挂在相关的ceph资源包,ceph-mon,ceph-Tools,ceph-osd,ceph-ardosgw,ceph-mds

vim /etc/yum.repos.d/ceph.repo

[root@ceph16 yum.repos.d]# less ceph.repo

[Ceph-SRPMS]
name=Ceph SRPMS packages
baseurl=https://mirrors.aliyun.com/ceph/rpm-jewel/el7/SRPMS/
enabled=1
gpgcheck=0
type=rpm-md
 
[Ceph-aarch64]
name=Ceph aarch64 packages
baseurl=https://mirrors.aliyun.com/ceph/rpm-jewel/el7/aarch64/
enabled=1
gpgcheck=0
type=rpm-md
 
[Ceph-noarch]
name=Ceph noarch packages
baseurl=https://mirrors.aliyun.com/ceph/rpm-jewel/el7/noarch/
enabled=1
gpgcheck=0
type=rpm-md
 
[Ceph-x86_64]
name=Ceph x86_64 packages
baseurl=https://mirrors.aliyun.com/ceph/rpm-jewel/el7/x86_64/
enabled=1
gpgcheck=0
type=rpm-md


ceph-deploy 安装的时候只需要在后面加上参数就可以避免自定义ceph.repo yum源 被覆盖掉

 

第二步:vim /etc/hosts   //编辑/etc/hosts主机名

vim /etc/hosts

192.168.1.10  ceph1

 

步骤三:ssh免密登陆

ssh-keygen -f ~/.ssh/id_rsa -N ''

for i in ceph{1..3}

do

ssh-copy-id -i  $i

done

 

步骤四:时间同步

编辑/etc/chrony.conf

[student@root ~]$ cat /etc/chrony.conf 
# Use public servers from the pool.ntp.org project.
# Please consider joining the pool (http://www.pool.ntp.org/join.html).
server ntp.aliyun.com iburst
server ntp1.aliyun.com iburst
#server 1.centos.pool.ntp.org iburst
#server 2.centos.pool.ntp.org iburst
server  10.0.3.1  iburst   #自己主机的网关

[student@root ~]$ for i in ceph{1..3}

do

scp /etc/chrony.conf    $i:/etc

ssh $i "systemctl restart chronyd;systemctl enable chronyd"

scp /etc/yum.repos.d/ceph.repo   $i:/etc/yum.repos.d/

ssh $i "yum clean all ;yum repolist"

done

 

步骤五添加物理磁盘:

物理机上为每个虚拟机准备3块20G磁盘(可以使用命令,也可以使用图形直接添加)

 

案例2:部署ceph集群

安装部署工具ceph-deploy 
创建ceph集群 
准备日志磁盘分区 
创建OSD存储空间 
查看ceph状态,验证

2.2 步骤
实现此案例需要按照如下步骤进行。

步骤一:安装部署软件ceph-deploy

1)在node1安装部署工具,学习工具的语法格式。

[root@node1 ~]#  yum -y install ceph-deploy
[root@node1 ~]#  ceph-deploy  --help
[root@node1 ~]#  ceph-deploy mon --help
2)创建目录

[root@node1 ~]#  mkdir ceph-cluster
[root@node1 ~]#  cd ceph-cluster/
步骤二:部署Ceph集群

1)给所有节点安装ceph相关软件包。

[root@node1 ceph-cluster]# for i in ceph1 ceph2 ceph3
do
	ssh  $i "yum install epel-release -y"
    ssh  $i "yum -y install ceph-mon ceph-osd ceph-mds ceph-radosgw"
done 
2)创建Ceph集群配置,在ceph-cluster目录下生成Ceph配置文件。

在ceph.conf配置文件中定义monitor主机是谁。

[root@node1 ceph-cluster]# ceph-deploy new ceph1 ceph2 ceph3
3)初始化所有节点的mon服务,也就是启动mon服务(主机名解析必须对)。

[root@node1 ceph-cluster]# ceph-deploy mon create-initial
常见错误及解决方法(非必要操作,有错误可以参考):

如果提示如下错误信息:

[node1][ERROR ] admin_socket: exception getting command descriptions: [Error 2] No such file or directory
解决方案如下(在node1操作):

先检查自己的命令是否是在ceph-cluster目录下执行的!!!!如果确认是在该目录下执行的create-initial命令,依然报错,可以使用如下方式修复。

[root@node1 ceph-cluster]# vim ceph.conf      #文件最后追加以下内容
public_network = 192.168.4.0/24
修改后重新推送配置文件:

[root@node1 ceph-cluster]# ceph-deploy --overwrite-conf config push node1 node2 node3
步骤三:创建OSD

备注:vdb1和vdb2这两个分区用来做存储服务器的journal缓存盘。

[root@node1 ceph-cluster]# for i in node1 node2 node3
do
     ssh $i "parted /dev/vdb mklabel gpt"
     ssh $i "parted /dev/vdb mkpart primary 1 50%"
     ssh $i "parted /dev/vdb mkpart primary 50% 100%"
 done
2)磁盘分区后的默认权限无法让ceph软件对其进行读写操作,需要修改权限。

node1、node2、node3都需要操作,这里以node1为例。

[root@node1 ceph-cluster]# chown  ceph.ceph  /dev/vdb1
[root@node1 ceph-cluster]# chown  ceph.ceph  /dev/vdb2
#上面的权限修改为临时操作,重启计算机后,权限会再次被重置。
#我们还需要将规则写到配置文件实现永久有效。
#规则:如果设备名称为/dev/vdb1则设备文件的所有者和所属组都设置为ceph。
#规则:如果设备名称为/dev/vdb2则设备文件的所有者和所属组都设置为ceph。
[root@node1 ceph-cluster]# vim /etc/udev/rules.d/70-vdb.rules
ENV{DEVNAME}=="/dev/vdb1",OWNER="ceph",GROUP="ceph"
ENV{DEVNAME}=="/dev/vdb2",OWNER="ceph",GROUP="ceph"
3)初始化清空磁盘数据(仅node1操作即可)。

[root@node1 ceph-cluster]# ceph-deploy disk  zap  node1:sdc   node1:sdd    
[root@node1 ceph-cluster]# ceph-deploy disk  zap  node2:vdc   node2:vdd
[root@node1 ceph-cluster]# ceph-deploy disk  zap  node3:vdc   node3:vdd   

ceph-deploy disk  zap  ceph1:sdb   ceph1:sdc
ceph-deploy disk  zap  ceph2:sdb   ceph2:sdc
ceph-deploy disk  zap  ceph3:sdb   ceph3:sdc

4)创建OSD存储空间(仅node1操作即可)

重要:很多同学在这里会出错!将主机名、设备名称输入错误!!!

[root@node1 ceph-cluster]# ceph-deploy osd create \
 node1:vdc:/dev/vdb1 node1:vdd:/dev/vdb2  
//创建osd存储设备,vdc为集群提供存储空间,vdb1提供JOURNAL缓存,
//每个存储设备对应一个缓存设备,缓存需要SSD,不需要很大
[root@node1 ceph-cluster]# ceph-deploy osd create \
 node2:vdc:/dev/vdb1 node2:vdd:/dev/vdb2
[root@node1 ceph-cluster]# ceph-deploy osd create \
 node3:vdc:/dev/vdb1 node3:vdd:/dev/vdb2 
常见错误及解决方法(非必须操作)。

ceph-deploy osd create ceph1:sdb:/dev/sdb ceph1:sdc:/dev/sdc
ceph-deploy osd create ceph2:sdb:/dev/sdb ceph1:sdc:/dev/sdc
ceph-deploy osd create ceph3:sdb:/dev/sdb ceph1:sdc:/dev/sdc

使用osd create创建OSD存储空间时,如提示下面的错误提示:

[ceph_deploy][ERROR ] RuntimeError: bootstrap-osd keyring not found; run 'gatherkeys'

可以使用如下命令修复文件,重新配置ceph的密钥文件:

[root@node1 ceph-cluster]#  ceph-deploy gatherkeys node1 node2 node3 
步骤四:验证测试

1) 查看集群状态。

[root@node1 ~]#  ceph  -s
2)常见错误(非必须操作)。

如果查看状态包含如下信息:

health: HEALTH_WARN
        clock skew detected on  node2, node3…  
clock skew表示时间不同步,解决办法:请先将所有主机的时间都使用NTP时间同步!!!

Ceph要求所有主机时差不能超过0.05s,否则就会提示WARN。

如果状态还是失败,可以尝试执行如下命令,重启ceph服务:

[root@node1 ~]#  systemctl restart ceph\*.service ceph\*.target
3 案例3:创建Ceph块存储
3.1 问题
沿用练习一,使用Ceph集群的块存储功能,实现以下目标:

创建块存储镜像 
客户端映射镜像 
创建镜像快照 
使用快照还原数据 
使用快照克隆镜像 
删除快照与镜像 
3.2 步骤
实现此案例需要按照如下步骤进行。

步骤一:创建镜像

1)查看存储池。

[root@node1 ~]# ceph osd lspools
0 rbd,
2)创建镜像、查看镜像

[root@node1 ~]# rbd create demo-image --image-feature  layering --size 10G
[root@node1 ~]# rbd create rbd/jacob  --image-feature  layering --size 10G
#这里的demo-image和jacob为创建的镜像名称,可以为任意字符。

#--image-feature参数指定我们创建的镜像有哪些功能,layering是开启COW功能。

#提示:ceph镜像支持很多功能,但很多是操作系统不支持的,我们只开启layering。

[root@node1 ~]# rbd list
[root@node1 ~]# rbd info demo-image
rbd image 'demo-image':
    size 10240 MB in 2560 objects
    order 22 (4096 kB objects)
    block_name_prefix: rbd_data.d3aa2ae8944a
    format: 2
    features: layering
步骤二:动态调整

1)扩容容量

[root@node1 ~]# rbd resize --size 15G jacob
[root@node1 ~]# rbd info jacob
2)缩小容量

[root@node1 ~]# rbd resize --size 7G jacob --allow-shrink
[root@node1 ~]# rbd info image
步骤三:通过KRBD访问

1)客户端通过KRBD访问

#客户端需要安装ceph-common软件包
#拷贝配置文件(否则不知道集群在哪)
#拷贝连接密钥(否则无连接权限)
[root@client ~]# yum -y  install ceph-common
[root@client ~]# scp 192.168.4.11:/etc/ceph/ceph.conf  /etc/ceph/
[root@client ~]# scp 192.168.4.11:/etc/ceph/ceph.client.admin.keyring \
/etc/ceph/
[root@client ~]# rbd map  jacob
[root@client ~]#  lsblk
[root@client ~]# rbd showmapped
id pool image snap device    
0  rbd  jacob -    /dev/rbd0
2) 客户端格式化、挂载分区

[root@client ~]# mkfs.xfs /dev/rbd0
[root@client ~]# mount /dev/rbd0 /mnt/
[root@client ~]# echo "test" > /mnt/test.txt
步骤四:创建镜像快照

1) 查看镜像快照(默认所有镜像都没有快照)。

 [root@node1 ~]# rbd snap ls jacob
2) 给镜像创建快照。

[root@node1 ~]# rbd snap create jacob --snap jacob-snap1
#为jacob镜像创建快照,快照名称为jacob-snap1
[root@node1 ~]# rbd snap ls jacob
SNAPID NAME            SIZE 
     4 jacob-snap1 15360 MB
3) 删除客户端写入的测试文件

[root@client ~]# rm  -rf   /mnt/test.txt
[root@client ~]# umount  /mnt
4) 还原快照

[root@node1 ~]# rbd snap rollback jacob --snap jacob-snap1
#客户端重新挂载分区
[root@client ~]# mount /dev/rbd0 /mnt/
[root@client ~]# ls  /mnt
步骤五:创建快照克隆

1)克隆快照

[root@node1 ~]#  rbd snap protect jacob --snap jacob-snap1
[root@node1 ~]#  rbd snap rm jacob --snap jacob-snap1    //会失败
[root@node1 ~]#  rbd clone \
jacob --snap jacob-snap1 jacob-clone --image-feature layering
//使用jacob镜像的快照jacob-snap1克隆一个新的名称为jacob-clone的镜像
2)查看克隆镜像与父镜像快照的关系

[root@node1 ~]#  rbd info jacob-clone
rbd image 'jacob-clone':
    size 15360 MB in 3840 objects
    order 22 (4096 kB objects)
    block_name_prefix: rbd_data.d3f53d1b58ba
    format: 2
    features: layering
    flags: 
    parent: rbd/jacob@jacob-snap1
#克隆镜像很多数据都来自于快照链
#如果希望克隆镜像可以独立工作,就需要将父快照中的数据,全部拷贝一份,但比较耗时!!!
[root@node1 ~]#  rbd flatten jacob-clone
[root@node1 ~]#  rbd info jacob-clone
rbd image 'jadob-clone':
    size 15360 MB in 3840 objects
    order 22 (4096 kB objects)
    block_name_prefix: rbd_data.d3f53d1b58ba
    format: 2
    features: layering
    flags: 
#注意,父快照信息没了!
[root@node1 ~]#  rbd snap unprotect jacob --snap jacob-snap1     #取消快照保护
[root@node1 ~]#  rbd snap rm jacob --snap jacob-snap1            #可以删除快照
步骤六:其他操作

1) 客户端撤销磁盘映射

[root@client ~]# umount /mnt
[root@client ~]# rbd showmapped
id pool image        snap device    
0  rbd  jacob        -    /dev/rbd0
//语法格式:
[root@client ~]# rbd unmap /dev/rbd0























ceph-deploy --version
ceph-deploy new ceph1 ceph2 ceph3
ceph-deploy mon create-initial
systemctl status [email protected] 
ceph -s
lsblk
ceph-deploy disk  zap  ceph1:sdb   ceph1:sdc
ceph-deploy disk  zap  ceph2:sdb   ceph2:sdc
ceph-deploy disk  zap  ceph3:sdb   ceph3:sdc
ceph-deploy osd create ceph1:/dev/sdb ceph1:/dev/sdc
ceph-deploy osd create ceph2:/dev/sdb ceph2:/dev/sdc
ceph-deploy osd create ceph3:/dev/sdb ceph3:/dev/sdc

但是当前一套集群只能有一个文件系统存在
*少于 5 个 OSD 时可把 pg_num 设置为 128

*OSD 数量在 5 到 10 个时,可把 pg_num 设置为 512

*OSD 数量在 10 到 50 个时,可把 pg_num 设置为 4096

cephFS
ceph osd pool create cephfs_tdata 128
ceph osd pool create cephfs_tmetadata 128
ceph fs new mytcephfs cephfs_tmetadata cephfs_tdata
ceph fs ls




磁盘挂载
scp 192.168.48.132:/etc/ceph/ceph.conf  /etc/ceph/
scp 192.168.48.132:/etc/ceph/ceph.client.admin.keyring /etc/ceph/
ceph-authtool -p ceph.client.admin.keyring
vim ~/admin.keyring

mount -t ceph 192.168.48.132:6789,192.168.48.133:6789:/ /mnt/tgm -o name=admin,secret=AQDmWPNiJRVfLBAAwJyUxZS7OKJ1vRsI3DcjSw==,fs=tgm

mount -t ceph 192.168.48.132:6789,192.168.48.133:6789:/ /mnt/tgm -o name=admin,secretfile=/root/admin.keyring
mount -t ceph 192.168.48.132:6789:/ /mnt/tang -o name=admin,secretfile=/root/admin.keyring




1.在需要的主机上创建块存储

1)查看存储池。

[root@node1 ~]# ceph osd lspools
0 rbd,
2)创建镜像、查看镜像

[root@node1 ~]# rbd create demo-image --image-feature  layering --size 10G
[root@node1 ~]# rbd create rbd/jacob  --image-feature  layering --size 10G
#这里的demo-image和jacob为创建的镜像名称,可以为任意字符。

#--image-feature参数指定我们创建的镜像有哪些功能,layering是开启COW功能。

#提示:ceph镜像支持很多功能,但很多是操作系统不支持的,我们只开启layering。

[root@node1 ~]# rbd list
[root@node1 ~]# rbd info demo-image
rbd image 'demo-image':
    size 10240 MB in 2560 objects
    order 22 (4096 kB objects)
    block_name_prefix: rbd_data.d3aa2ae8944a
    format: 2
    features: layering
步骤二:动态调整

1)扩容容量

[root@node1 ~]# rbd resize --size 15G jacob
[root@node1 ~]# rbd info jacob
2)缩小容量

[root@node1 ~]# rbd resize --size 7G jacob --allow-shrink
[root@node1 ~]# rbd info image
步骤三:通过KRBD访问

1)客户端通过KRBD访问

#客户端需要安装ceph-common软件包
#拷贝配置文件(否则不知道集群在哪)
#拷贝连接密钥(否则无连接权限)
[root@client ~]# yum -y  install ceph-common
[root@client ~]# scp 192.168.4.11:/etc/ceph/ceph.conf  /etc/ceph/
[root@client ~]# scp 192.168.4.11:/etc/ceph/ceph.client.admin.keyring \
/etc/ceph/
[root@client ~]# rbd map  jacob
[root@client ~]#  lsblk
[root@client ~]# rbd showmapped
id pool image snap device    
0  rbd  jacob -    /dev/rbd0
2) 客户端格式化、挂载分区

[root@client ~]# mkfs.xfs /dev/rbd0
[root@client ~]# mount /dev/rbd0 /mnt/
[root@client ~]# echo "test" > /mnt/test.txt
步骤四:创建镜像快照

1) 查看镜像快照(默认所有镜像都没有快照)。

 [root@node1 ~]# rbd snap ls jacob
2) 给镜像创建快照。

[root@node1 ~]# rbd snap create jacob --snap jacob-snap1
#为jacob镜像创建快照,快照名称为jacob-snap1
[root@node1 ~]# rbd snap ls jacob
SNAPID NAME            SIZE 
     4 jacob-snap1 15360 MB
3) 删除客户端写入的测试文件

[root@client ~]# rm  -rf   /mnt/test.txt
[root@client ~]# umount  /mnt
4) 还原快照

[root@node1 ~]# rbd snap rollback jacob --snap jacob-snap1
#客户端重新挂载分区
[root@client ~]# mount /dev/rbd0 /mnt/
[root@client ~]# ls  /mnt
步骤五:创建快照克隆

1)克隆快照

[root@node1 ~]#  rbd snap protect jacob --snap jacob-snap1
[root@node1 ~]#  rbd snap rm jacob --snap jacob-snap1    //会失败
[root@node1 ~]#  rbd clone \
jacob --snap jacob-snap1 jacob-clone --image-feature layering
//使用jacob镜像的快照jacob-snap1克隆一个新的名称为jacob-clone的镜像
2)查看克隆镜像与父镜像快照的关系

[root@node1 ~]#  rbd info jacob-clone
rbd image 'jacob-clone':
    size 15360 MB in 3840 objects
    order 22 (4096 kB objects)
    block_name_prefix: rbd_data.d3f53d1b58ba
    format: 2
    features: layering
    flags: 
    parent: rbd/jacob@jacob-snap1
#克隆镜像很多数据都来自于快照链
#如果希望克隆镜像可以独立工作,就需要将父快照中的数据,全部拷贝一份,但比较耗时!!!
[root@node1 ~]#  rbd flatten jacob-clone
[root@node1 ~]#  rbd info jacob-clone
rbd image 'jadob-clone':
    size 15360 MB in 3840 objects
    order 22 (4096 kB objects)
    block_name_prefix: rbd_data.d3f53d1b58ba
    format: 2
    features: layering
    flags: 
#注意,父快照信息没了!
[root@node1 ~]#  rbd snap unprotect jacob --snap jacob-snap1     #取消快照保护
[root@node1 ~]#  rbd snap rm jacob --snap jacob-snap1            #可以删除快照
步骤六:其他操作

1) 客户端撤销磁盘映射

[root@client ~]# umount /mnt
[root@client ~]# rbd showmapped
id pool image        snap device    
0  rbd  jacob        -    /dev/rbd0
//语法格式:
[root@client ~]# rbd unmap /dev/rbd0


6、开机自动挂载cephfs

如需要开机时自动挂载cephfs,将下面的信息添加到客户端的/etc/fstab中

id=admin /mnt/fuse_cephfs fuse.ceph defaults 0 0

挂载集群
mount -t ceph 192.168.48.132:6789,192.168.48.133:6789:/ /mnt/tcc -o name=admin,secretfile=/root/admin.keyring

挂载单个节点
mount -t ceph 192.168.48.132:6789:/ /mnt/tang -o name=admin,secretfile=/root/admin.keyring


https://blog.csdn.net/weixin_39859055/article/details/119636499 ceph

所有ceph的服务开启、关闭等
systemctl start ceph.target

按照服务分类开启、关闭等
systemctl start ceph-mon.target

systemctl start ceph-mgr.target

systemctl start ceph.osd.target

更加细粒度的服务开启、关闭




你可能感兴趣的:(存储,linux,运维,docker)