csw354

Ceph学习笔记二

五、RGW 对象存储

通过对象存储，将数据存储为对象，每个对象除了包含数据，还包含数据自身的元数据。
对象通过 Object ID 来检索，无法通过普通文件系统操作来直接访问对象，只能通过API来访问，或者第三方客户端（实际上也是对API的封装）。
对象存储中的对象不整理到目录树中，而是存储在扁平的命名空间中，Amazon S3将这个扁平命名空间称为 bucket。

5.1 部署rados gw

在node-1上部署rgw

[root@node-1 ceph-deploy]# ceph-deploy rgw create node-1

[node-1][INFO  ] Running command: systemctl start ceph-radosgw@rgw.node-1
[node-1][INFO  ] Running command: systemctl enable ceph.target
[ceph_deploy.rgw][INFO  ] The Ceph Object Gateway (RGW) is now running on host node-1 and default port 7480
[root@node-1 ceph-deploy]#

验证rgw的状态

[root@node-1 ceph-deploy]# netstat -tunpl | grep 7480
tcp        0      0 0.0.0.0:7480            0.0.0.0:*               LISTEN      12377/radosgw       
tcp6       0      0 :::7480                 :::*                    LISTEN      12377/radosgw       
[root@node-1 ceph-deploy]# curl http://node-1:7480
<?xml version="1.0" encoding="UTF-8"?><ListAllMyBucketsResult xmlns="http://s3.amazonaws.com/doc/2006-03-01/"><Owner><ID>anonymous</ID><DisplayName></DisplayName></Owner><Buckets></Buckets></ListAllMyBucketsResult>[root@node-1 ceph-deploy]#

5.2 修改RGW默认端口

修改ceph.conf配置文件，在末尾增加两行配置

[root@node-1 ceph-deploy]# pwd
/root/ceph-deploy
[root@node-1 ceph-deploy]# 
[root@node-1 ceph-deploy]# cat  ceph.conf 
[global]
fsid = ff22ec29-da80-4790-97b5-c6699433f0b0
public_network = 10.0.0.0/24
cluster_network = 10.211.56.0/24
mon_initial_members = node-1
mon_host = 10.0.0.201
auth_cluster_required = cephx
auth_service_required = cephx
auth_client_required = cephx

[client.rgw.node-1]
rgw_frontends = "civetweb port=80"

把修改后的配置文件推送至node-1,node-2 ,node-3

[root@node-1 ceph-deploy]# ceph-deploy   --overwrite-conf  config push node-1 node-2 node-3

重启RGW服务

[root@node-1 ceph-deploy]# systemctl restart ceph-radosgw.target

访问验证

[root@node-1 ceph-deploy]# curl http://node-1

5.3 RGW 的S3接口使用

官方文档参考：https://docs.ceph.com/en/octopus/radosgw/admin/

创建用户

[root@node-1 ceph-deploy]# radosgw-admin user create --uid ceph-s3-user --display-name "Ceph S3 User Demo"

保存该用户的密钥信息，方便之后查看

[root@node-1 ceph-deploy]# cat > key.txt <
>           "user": "ceph-s3-user",
>             "access_key": "ZHTTSYSKPY6IMB4YLBWI",
>             "secret_key": "DmAYwx1A9nR9q271F0lPS1QKgIGYRB5U4XTVOmRk"
> EOF

如果碰巧忘记了该密钥信息，可通过以下方法查看

[root@node-1 ceph-deploy]# radosgw-admin user list
[
    "ceph-s3-user"
]
[root@node-1 ceph-deploy]# radosgw-admin user info --uid ceph-s3-user
{
    "user_id": "ceph-s3-user",
    "display_name": "Ceph S3 User Demo",
    "email": "",
    "suspended": 0,
    "max_buckets": 1000,
    "subusers": [],
    "keys": [
        {
            "user": "ceph-s3-user",
            "access_key": "ZHTTSYSKPY6IMB4YLBWI",
            "secret_key": "DmAYwx1A9nR9q271F0lPS1QKgIGYRB5U4XTVOmRk"
        }

通过编写S3风格的SDK 接口来访问Rdosgw

[root@node-1 ceph-deploy]# yum install python-boto

#编写python接口脚本生成bucket
[root@node-1 ceph-deploy]# cat s3client.py 
import boto
import boto.s3.connection
access_key = 'ZHTTSYSKPY6IMB4YLBWI'
secret_key = 'DmAYwx1A9nR9q271F0lPS1QKgIGYRB5U4XTVOmRk'
conn = boto.connect_s3(
    aws_access_key_id = access_key,
    aws_secret_access_key = secret_key,
    host = '10.0.0.201', port=80,
    is_secure=False,
    calling_format = boto.s3.connection.OrdinaryCallingFormat(),
)
bucket = conn.create_bucket('my-first-s3-bucket')
for bucket in conn.get_all_buckets():
        print "{name}\t{created}".format(
                name = bucket.name,
                created = bucket.creation_date,
)


# 未创建bucket前
[root@node-1 ceph-deploy]# ceph osd lspools
1 ceph-demo
2 .rgw.root
3 default.rgw.control
4 default.rgw.meta
5 default.rgw.log
[root@node-1 ceph-deploy]# 


# 创建bucket后
[root@node-1 ceph-deploy]# python s3client.py 
my-first-s3-bucket	2021-01-18T15:00:01.572Z
[root@node-1 ceph-deploy]# ceph osd lspools
1 ceph-demo
2 .rgw.root
3 default.rgw.control
4 default.rgw.meta
5 default.rgw.log
6 default.rgw.buckets.index
[root@node-1 ceph-deploy]#

5.4 RGW 的S3cmd接口使用

安装s3cmd命令行工具

[root@node-1 ceph-deploy]# yum install s3cmd.noarch -y

初始化s3cmd工具，填入以下信息，并把生成的 /root/.s3cfg 中的signature_v2 = False
改为True

Access Key: ZHTTSYSKPY6IMB4YLBWI
Secret Key: DmAYwx1A9nR9q271F0lPS1QKgIGYRB5U4XTVOmRk
Default Region [US]:
S3 Endpoint [s3.amazonaws.com]: 10.0.0.201:80
DNS-style bucket+hostname:port template for accessing a bucket [%(bucket)s.s3.amazonaws.com]: 10.0.0.201:80/%(bucket)s
Encryption password: 
Path to GPG program [/usr/bin/gpg]:
Use HTTPS protocol [Yes]: no
HTTP Proxy server name:
Test access with supplied credentials? [Y/n] y
Save settings? [y/N] y


[root@node-1 ~]# vim /root/.s3cfg
signature_v2 = True

查看之前创建的bucket

[root@node-1 ~]# s3cmd ls
2021-01-18 15:00  s3://my-first-s3-bucket
[root@node-1 ~]#

使用s3cmd创建一个新的bucket

[root@node-1 ~]# s3cmd mb s3://s3cmd-demo
Bucket 's3://s3cmd-demo/' created
[root@node-1 ~]#

使用s3cmd的put方法上传本地文件至 radosgw，发现报错

[root@node-1 ~]# s3cmd put /etc/fstab s3://my-first-s3-bucket/s3c-demo
upload: '/etc/fstab' -> 's3://my-first-s3-bucket/s3c-demo'  [1 of 1]
 510 of 510   100% in    0s   633.53 B/s  done
ERROR: S3 error: 416 (InvalidRange)

编辑 10.0.0.201服务器的 ceph.conf，添加如下两行配置

[root@node-1 ceph-deploy]# vim  ceph.conf 
[mon]
mon allow pool delete = true
mon_max_pg_per_osd = 300

把修改过后的ceph.conf文件推送到node-1,node-2, node-3

[root@node-1 ceph-deploy]# ceph-deploy --overwrite-conf config push node-1 node-2 node-3

在node-1 node-2 node-3 三台服务器上重启mon服务

[root@node-1 ceph-deploy]# systemctl restart ceph-mon.target

重新尝试上传文件

[root@node-1 ceph-deploy]# s3cmd put /etc/hosts s3://s3cmd-demo/s3cmd-demo
upload: '/etc/hosts' -> 's3://s3cmd-demo/s3cmd-demo'  [1 of 1]
 250 of 250   100% in    1s   171.75 B/s  done

查看上传的文件

[root@node-1 ceph-deploy]# s3cmd ls s3://s3cmd-demo
2021-01-19 14:27          250  s3://s3cmd-demo/s3cmd-demo
[root@node-1 ceph-deploy]#

上传目录，把整个目录放在s3://s3cmd-demo/s3-etc/下

[root@node-1 ceph-deploy]# s3cmd put /etc  s3://s3cmd-demo/s3-etc/ --recursive

此时会看到有7个pool，其中“default.rgw.buckets.data”是上传文件后生成的

[root@node-1 ~]# ceph osd lspools
1 ceph-demo
2 .rgw.root
3 default.rgw.control
4 default.rgw.meta
5 default.rgw.log
6 default.rgw.buckets.index
7 default.rgw.buckets.data
[root@node-1 ~]#

查看pool里的内容，有很多

[root@node-1 ~]# rados -p default.rgw.buckets.data ls
deea903a-1500-4c1b-a6ca-e7f1f4a94b81.54141.1_s3-etc/etc/selinux/targeted/active/modules/100/cloudform/cil
deea903a-1500-4c1b-a6ca-e7f1f4a94b81.54141.1_s3-etc/etc/selinux/targeted/active/modules/100/open/hll
deea903a-1500-4c1b-a6ca-e7f1f4a94b81.54141.1_s3-etc/etc/selinux/targeted/active/modules/100/secadm/hll
deea903a-1500-4c1b-a6ca-e7f1f4a94b81.54141.1_s3-etc/etc/selinux/targeted/active/modules/100/kmscon/lang_ext
deea903a-1500-4c1b-a6ca-e7f1f4a94b81.54141.1_s3-etc/etc/selinux/targeted/active/modules/100/minissdpd/hll

他们都有统一的前缀，而这个前缀（index）是通过下面的方式核查的

[root@node-1 ~]# rados -p default.rgw.buckets.index ls
.dir.deea903a-1500-4c1b-a6ca-e7f1f4a94b81.54141.1
.dir.deea903a-1500-4c1b-a6ca-e7f1f4a94b81.44133.1

5.5 Swift 风格的api接口

在原有账号的基础上建立swift的子账号

[root@node-1 ~]# radosgw-admin user list
[
    "ceph-s3-user"
]
[root@node-1 ~]# radosgw-admin subuser create --uid=ceph-s3-user --subuser=ceph-s3-user:swift --access=full
{
    "user_id": "ceph-s3-user",
    "display_name": "Ceph S3 User Demo",
    "email": "",

2.生成secret-key

[root@node-1 ~]# sudo radosgw-admin key create --subuser=ceph-s3-user:swift  --key-type=swift --gen-secret
{
    "user_id": "ceph-s3-user",
    "display_name": "Ceph S3 User Demo",
    "email": "",
    "suspended": 0,
    "max_buckets": 1000,
    "subusers": [
        {
            "id": "ceph-s3-user:swift",
            "permissions": "full-control"
        }
    ],
    "keys": [
        {
            "user": "ceph-s3-user",
            "access_key": "ZHTTSYSKPY6IMB4YLBWI",
            "secret_key": "DmAYwx1A9nR9q271F0lPS1QKgIGYRB5U4XTVOmRk"
        }
    ],
    "swift_keys": [
        {
            "user": "ceph-s3-user:swift",
            "secret_key": "87y9HoU5o5YYSyPqenKev6cZwnzJz5YSO25wltUR"
        }
    ]

安装对应工具包

[root@node-1 ~]# yum install python-setuptools  -y
[root@node-1 ~]# yum install python-pip   -y  

# yum 安装的pip版本比较低，升级成最新版本，期间可能会因为网络原因多次失败，请多试几次

[root@node-1 ~]# pip install --upgrade pip
Collecting pip
  Downloading https://files.pythonhosted.org/packages/54/eb/4a3642e971f404d69d4f6fa3885559d67562801b99d7592487f1ecc4e017/pip-20.3.3-py2.py3-none-any.whl (1.5MB)
    100% |████████████████████████████████| 1.5MB 9.8kB/s 
Installing collected packages: pip
  Found existing installation: pip 8.1.2
    Uninstalling pip-8.1.2:
      Successfully uninstalled pip-8.1.2
Successfully installed pip-20.3.3
[root@node-1 ~]# 

# 安装swift客户端
[root@node-1 ~]# pip install python-swiftclient
DEPRECATION: Python 2.7 reached the end of its life on January 1st, 2020. Please upgrade your Python as Python 2.7 is no longer maintained. pip 21.0 will drop support for Python 2.7 in January 2021. More details about Python 2 support in pip can be found at https://pip.pypa.io/en/latest/development/release-process/#python-2-support pip 21.0 will remove support for this functionality.
Collecting python-swiftclient
  Downloading python_swiftclient-3.11.0-py2.py3-none-any.whl (86 kB)
     |████████████████████████████████| 86 kB 233 kB/s 
Requirement already satisfied: futures>=3.0.0; python_version == "2.7" in /usr/lib/python2.7/site-packages (from python-swiftclient) (3.1.1)
Requirement already satisfied: requests>=1.1.0 in /usr/lib/python2.7/site-packages (from python-swiftclient) (2.11.1)
Requirement already satisfied: six>=1.9.0 in /usr/lib/python2.7/site-packages (from python-swiftclient) (1.9.0)
Requirement already satisfied: urllib3==1.16 in /usr/lib/python2.7/site-packages (from requests>=1.1.0->python-swiftclient) (1.16)
Installing collected packages: python-swiftclient
Successfully installed python-swiftclient-3.11.0
[root@node-1 ~]#

用swiftclient来查看 bucket

[root@node-1 ~]# swift -A http://10.0.0.201:80/auth -U ceph-s3-user:swift -K 87y9HoU5o5YYSyPqenKev6cZwnzJz5YSO25wltUR list
my-first-s3-bucket
s3cmd-demo
[root@node-1 ~]#

创建环境变量，简化指令

[root@node-1 ~]# cat  swift_openrc.sh
export ST_AUTH=http://10.0.0.201:80/auth
export ST_USER=ceph-s3-user:swift
export ST_KEY=87y9HoU5o5YYSyPqenKev6cZwnzJz5YSO25wltUR
[root@node-1 ~]# 
[root@node-1 ~]# source swift_openrc.sh
# 简化后的指令
[root@node-1 ~]# swift list
my-first-s3-bucket
s3cmd-demo
[root@node-1 ~]#

swift创建bucket

[root@node-1 ~]# swift post swift-demo
[root@node-1 ~]# swift list
my-first-s3-bucket
s3cmd-demo
swift-demo
[root@node-1 ~]#

swift 上传本地文件至指定的bucket上，如果bucket不存在，则会自动创建bucket

[root@node-1 ~]# swift upload swift_demo /etc/fstab 
etc/fstab
[root@node-1 ~]#

swift 下载文件到本地

root@node-1 ~]# swift download swift_demo  etc/fstab 
etc/fstab [auth 0.010s, headers 0.013s, total 0.013s, 0.157 MB/s]

[root@node-1 ~]# ls
anaconda-ks.cfg  ceph-deploy-ceph.log  Documents  etc                   Music  Pictures  python-demo      Templates
ceph-deploy      Desktop               Downloads  initial-setup-ks.cfg  mysql  Public    swift_openrc.sh  Videos
[root@node-1 ~]# cat /etc/fstab 
# /etc/fstab
# Created by anaconda on Fri Jul 10 23:25:02 2020
#

六、CephFS 文件系统

Ceph File System (CephFS) 是与 POSIX 标准兼容的文件系统, 能够提供对 Ceph 存储集群上的文件访问。 CephFS 需要至少一个元数据服务器 (Metadata Server - MDS) daemon (ceph-mds) 运行, MDS daemon 管理着与存储在 CephFS 上的文件相关的元数据, 并且协调着对 Ceph 存储系统的访问

6.1 安装部署MDS集群

将node-1 node-2 node-3 部署成 MDS集群服务

[root@node-1 ceph-deploy]# ceph-deploy  --overwrite-conf  mds    create node-1
[root@node-1 ceph-deploy]# ceph-deploy  --overwrite-conf  mds    create node-2
[root@node-1 ceph-deploy]# ceph-deploy  --overwrite-conf  mds    create node-3

6.2 创建CephFS文件系统

创建ceph_metadata 和 ceph_data 的OSD pool

[root@node-1 ceph-deploy]# ceph osd pool create cephfs_data 16 16
[root@node-1 ceph-deploy]# ceph osd pool create cephfs_metadata 16 16

新建一个文件系统，并关联上面创建的两个pool

[root@node-1 ceph-deploy]# ceph fs new cephfs-demo cephfs_metadata cephfs_data 
new fs with metadata pool 8 and data pool 9
[root@node-1 ceph-deploy]# 
[root@node-1 ceph-deploy]# ceph fs ls
name: cephfs-demo, metadata pool: cephfs_metadata, data pools: [cephfs_data ]
[root@node-1 ceph-deploy]#

此时可看到mds集群已变成一个active ，两个standby的状态了

[root@node-1 ceph-deploy]# ceph -s
  cluster:
    id:     ff22ec29-da80-4790-97b5-c6699433f0b0
    health: HEALTH_WARN
            too many PGs per OSD (288 > max 250)
 
  services:
    mon: 3 daemons, quorum node-1,node-2,node-3 (age 63m)
    mgr: node-2(active, since 71m), standbys: node-1, node-3
    mds: cephfs-demo:1 {0=node-1=up:active} 2 up:standby

6.3 内核挂载CephFS

创建挂载点

[root@node-1 ~]# mkdir /mnt/ceph-fs

挂载

[root@node-1 ~]# mount -t ceph 10.0.0.202:6789:/ /mnt/ceph-fs -o name=admin  
[root@node-1 ~]# df -h
Filesystem               Size  Used Avail Use% Mounted on
devtmpfs                 894M     0  894M   0% /dev
tmpfs                    910M     0  910M   0% /dev/shm
tmpfs                    910M   11M  900M   2% /run
tmpfs                    910M     0  910M   0% /sys/fs/cgroup
/dev/mapper/centos-root   50G  7.7G   43G  16% /
/dev/sr0                 4.5G  4.5G     0 100% /media/cdrom
/dev/sda1                197M  163M   35M  83% /boot
tmpfs                    910M   24K  910M   1% /var/lib/ceph/osd/ceph-0
tmpfs                    182M   12K  182M   1% /run/user/42
tmpfs                    182M     0  182M   0% /run/user/0
10.0.0.202:6789:/         42G     0   42G   0% /mnt/ceph-fs

6.4 通过ceph-fuse 对cephfs进行内核态的挂载

yum 安装ceph-fuse 软件

[root@node-1 ~]# yum install ceph-fuse  -y

新建挂载点并挂载

[root@node-1 ~]# mkdir /mnt/ceph-fuse
[root@node-1 ~]# ceph-fuse  -n client.admin -m 10.0.0.201:6789,10.0.0.201:6789 /mnt/ceph-fuse/
ceph-fuse[4106]: starting ceph client
2021-01-25 22:55:57.730 7ff1898c2f80 -1 init, newargv = 0x55a1b538ae20 newargc=9
ceph-fuse[4106]: starting fuse
[root@node-1 ~]#

查看挂载情况和挂载的文件格式

[root@node-1 ~]# df -h
Filesystem               Size  Used Avail Use% Mounted on
devtmpfs                 894M     0  894M   0% /dev
tmpfs                    910M     0  910M   0% /dev/shm
tmpfs                    910M   11M  900M   2% /run
tmpfs                    910M     0  910M   0% /sys/fs/cgroup
/dev/mapper/centos-root   50G  7.8G   43G  16% /
/dev/sr0                 4.5G  4.5G     0 100% /media/cdrom
/dev/sda1                197M  163M   35M  83% /boot
tmpfs                    910M   24K  910M   1% /var/lib/ceph/osd/ceph-0
tmpfs                    182M   12K  182M   1% /run/user/42
tmpfs                    182M     0  182M   0% /run/user/0
ceph-fuse                 42G     0   42G   0% /mnt/ceph-fuse
10.0.0.202:6789:/         42G     0   42G   0% /mnt/ceph-fs




[root@node-1 ceph-fuse]# df -T
Filesystem              Type           1K-blocks    Used Available Use% Mounted on
devtmpfs                devtmpfs          914500       0    914500   0% /dev
tmpfs                   tmpfs             931520       0    931520   0% /dev/shm
tmpfs                   tmpfs             931520   10444    921076   2% /run
tmpfs                   tmpfs             931520       0    931520   0% /sys/fs/cgroup
/dev/mapper/centos-root xfs             52403200 8124256  44278944  16% /
/dev/sr0                iso9660          4669162 4669162         0 100% /media/cdrom
/dev/sda1               xfs               201380  166056     35324  83% /boot
tmpfs                   tmpfs             931520      24    931496   1% /var/lib/ceph/osd/ceph-0
tmpfs                   tmpfs             186304      12    186292   1% /run/user/42
tmpfs                   tmpfs             186304       0    186304   0% /run/user/0
ceph-fuse               fuse.ceph-fuse  43589632       0  43589632   0% /mnt/ceph-fuse
10.0.0.202:6789:/       ceph            43589632       0  43589632   0% /mnt/ceph-fs
[root@node-1 ceph-fuse]#

七、OSD扩容与换盘

7.1 osd纵向扩容

横向扩容(scale out)：简单的理解，就是增加节点，通过增加节点来达到增加容量的目的

纵向扩容(scale up)：通过增加现有节点的硬盘(OSD)来达到增加容量的目的

纵向扩容增加node-1节点的OSD

[root@node-1 ceph-deploy]# ceph-deploy  osd create  node-1 --data /dev/sdc

[node-1][INFO  ] Running command: /bin/ceph --cluster=ceph osd stat --format=json
[ceph_deploy.osd][DEBUG ] Host node-1 is now ready for osd use.


[root@node-1 ceph-deploy]# ceph osd tree
ID CLASS WEIGHT  TYPE NAME       STATUS REWEIGHT PRI-AFF 
-1       0.17569 root default                            
-3       0.07809     host node-1                         
 0   hdd 0.04880         osd.0       up  1.00000 1.00000 
 3   hdd 0.02930         osd.3       up  1.00000 1.00000 
-5       0.04880     host node-2                         
 1   hdd 0.04880         osd.1       up  1.00000 1.00000 
-7       0.04880     host node-3                         
 2   hdd 0.04880         osd.2       up  1.00000 1.00000 
[root@node-1 ceph-deploy]#

7.2 数据 rebalancing 重分步

随着集群资源的不断增长，Ceph集群的空间可能会存在不够用的情况，因此需要对集群进行扩容，扩容通常包含两种：横向扩容和纵向扩容。横向扩容即增加台机器，纵向扩容即在单个节点上添加更多的OSD存储，以满足数据增长的需求，添加OSD的时候由于集群的状态（cluster map）已发生了改变，因此会涉及到数据的重分布（rebalancing），即 pool 的PGs数量是固定的，需要将PGs数平均的分摊到多个OSD节点上。

7.3 临时关闭rebalance

当在做rebalance的时候，每个osd都会按照osd_max_backfills指定数量的线程来同步,如果该数值比较大，同步会比较快，但是会影响部分性能；另外数据同步时，是走的cluster_network,而客户端连接是用的public_network,生产环境建议这两个网络用万兆网络，较少网络传输的影响；
同样，为了避免业务繁忙时候rebalance带来的性能影响，可以对rebalance进行关闭；当业务比较小的时候，再打开。

#关闭 rebalance 
[root@node-1 ~]# ceph osd set norebalance
# 关闭 backfill
[root@node-1 ~]# ceph osd set nobackfill

[root@node-1 ~]# ceph osd set nobackfill
nobackfill is set
[root@node-1 ~]# ceph -s
  cluster:
    id:     ff22ec29-da80-4790-97b5-c6699433f0b0
    health: HEALTH_WARN
            nobackfill,norebalance flag(s) set
 
  services:
    mon: 3 daemons, quorum node-1,node-2,node-3 (age 5m)
    mgr: node-2(active, since 40m), standbys: node-3, node-1
    mds: cephfs-demo:1 {0=node-3=up:active} 2 up:standby
    osd: 4 osds: 4 up (since 40m), 4 in (since 57m)
         flags nobackfill,norebalance
    rgw: 1 daemon active (node-1)
 
  task status:
 
  data:
    pools:   9 pools, 288 pgs
    objects: 5.25k objects, 9.2 GiB
    usage:   32 GiB used, 148 GiB / 180 GiB avail
    pgs:     288 active+clean
 
[root@node-1 ~]#

八、 OSD坏盘更换

Ceph的osd是不建议做成raid10或者raid5的，一般建议单盘跑。在我们的环境中，为了充分利用raid卡的缓存，即使是单盘，我们还是将其挂在raid卡下做成raid0。
这样不可避免的问题就是磁盘的损坏，需要在ceph当中做一些摘除动作，同时还需要重建raid。
在更换完磁盘重建raid之后，需要重新添加osd。新的osd加入到集群后，ceph还会自动进行数据恢复和回填的过程。我们还需要通过调整一些数据恢复和回填的参数来控制其恢复速度

日常检查OSD磁盘有无坏道，一般有坏道，处于将坏未坏的时候，那块osd写入和读取数据延时会比较大

[root@node-1 ~]# ceph osd perf
osd commit_latency(ms) apply_latency(ms) 
  3                  0                 0 
  2                  0                 0 
  1                  0                 0 
  0                  0                 0 
[root@node-1 ~]#

模拟osd损坏，更换osd的过程

#在node-2上停止 osd-4的服务，查看osd.4状态为down
[root@node-2 ~]# systemctl stop ceph-osd@4

[root@node-1 ceph-deploy]# ceph osd tree
ID CLASS WEIGHT  TYPE NAME       STATUS REWEIGHT PRI-AFF 
-1       0.20499 root default                            
-3       0.07809     host node-1                         
 0   hdd 0.04880         osd.0       up  1.00000 1.00000 
 3   hdd 0.02930         osd.3       up  1.00000 1.00000 
-5       0.07809     host node-2                         
 1   hdd 0.04880         osd.1       up  1.00000 1.00000 
 4   hdd 0.02930         osd.4     down  1.00000 1.00000 
-7       0.04880     host node-3                         
 2   hdd 0.04880         osd.2       up  1.00000 1.00000 
[root@node-1 ceph-deploy]#

在ceph osd集群中把 osd.4移除

[root@node-1 ceph-deploy]# ceph osd out osd.4
marked out osd.4. 
[root@node-1 ceph-deploy]#

等数据rebalancing完成后，开始一系列的移除工作（crush map ）

[root@node-1 ceph-deploy]# ceph osd crush rm osd.4
removed item id 4 name 'osd.4' from crush map
[root@node-1 ceph-deploy]# 

[root@node-1 ceph-deploy]# ceph osd rm osd.4
removed osd.4
[root@node-1 ceph-deploy]#

把对应的认证信息也删掉

[root@node-1 ceph-deploy]# ceph auth rm osd.4
updated
[root@node-1 ceph-deploy]#

九、Ceph集群运维

现在，所有支持 systemd 的发行版（ CentOS 7 、 Fedora 、Debian Jessie 以及更高版、 SUSE ）都用原生的 systemd 文件来管理 ceph 守护进程，不再使用原来的 sysvinit 脚本了。

9.1 Ceph 守护服务管理

查看与ceph相关的所有systemd进程

[root@node-1 ceph-deploy]# cd /usr/lib/systemd/system
[root@node-1 system]# ls | grep ceph
ceph-crash.service
ceph-fuse@.service
ceph-fuse.target
ceph-mds@.service
ceph-mds.target
ceph-mgr@.service
ceph-mgr.target
ceph-mon@.service
ceph-mon.target
ceph-osd@.service
ceph-osd.target
ceph-radosgw@.service
ceph-radosgw.target
ceph.target
ceph-volume@.service
[root@node-1 system]#

以查看mon 服务的状态为例，有以下两种方式

方式一

[root@node-1 system]# systemctl status ceph-mon.target 
● ceph-mon.target - ceph target allowing to start/stop all ceph-mon@.service instances at once
   Loaded: loaded (/usr/lib/systemd/system/ceph-mon.target; enabled; vendor preset: enabled)
   Active: active since Sun 2021-01-31 15:28:18 CST; 5h 34min ago

Jan 31 15:28:18 node-1 systemd[1]: Reached target ceph target allowing to start/stop all ceph-mon@.service instances at once.
[root@node-1 system]#

方式二

[root@node-1 system]# systemctl status ceph-mon@node-1
● ceph-mon@node-1.service - Ceph cluster monitor daemon
   Loaded: loaded (/usr/lib/systemd/system/ceph-mon@.service; enabled; vendor preset: disabled)
   Active: active (running) since Sun 2021-01-31 15:28:18 CST; 5h 35min ago
 Main PID: 1216 (ceph-mon)
   CGroup: /system.slice/system-ceph\x2dmon.slice/ceph-mon@node-1.service
           └─1216 /usr/bin/ceph-mon -f --cluster ceph --id node-1 --setuser ceph --setgroup ceph

Jan 31 16:21:25 node-1 ceph-mon[1216]: 2021-01-31 16:21:25.589 7fee31553700 -1 mon.node-1@0(leader) e3 get_health_metrics reporting 27 slow op... 483 v28)
Jan 31 16:21:31 node-1 ceph-mon[1216]: 2021-01-31 16:21:31.027 7fee31553700 -1 mon.node-1@0(leader) e3 get_health_metrics reporting 2 slow ops...9.048923)
Jan 31 16:21:36 node-1 ceph-mon[1216]: 2021-01-31 16:21:36.029 7fee31553700 -1 mon.node-1@0(leader) e3 get_health_metrics reporting 2 slow ops...9.048923)
Jan 31 16:46:02 node-1 ceph-mon[1216]: 2021-01-31 16:46:02.719 7fee3555b700 -1 Fail to open '/proc/5160/cmdline' error = (2) No such file or directory
Jan 31 16:46:02 node-1 ceph-mon[1216]: 2021-01-31 16:46:02.720 7fee3555b700 -1 received  signal: Hangup from <unknown> (PID: 5160) UID: 0
Jan 31 16:46:02 node-1 ceph-mon[1216]: 2021-01-31 16:46:02.854 7fee3555b700 -1 Fail to open '/proc/5160/cmdline' error = (2) No such file or directory
Jan 31 16:46:02 node-1 ceph-mon[1216]: 2021-01-31 16:46:02.854 7fee3555b700 -1 received  signal: Hangup from <unknown> (PID: 5160) UID: 0
Jan 31 17:36:33 node-1 ceph-mon[1216]: 2021-01-31 17:36:33.908 7fee31553700 -1 mon.node-1@0(electing) e3 get_health_metrics reporting 8 slow o...130, , 0)
Jan 31 17:37:08 node-1 ceph-mon[1216]: 2021-01-31 17:37:08.916 7fee31553700 -1 mon.node-1@0(electing) e3 get_health_metrics reporting 1 slow o...7.948367)
Jan 31 17:37:13 node-1 ceph-mon[1216]: 2021-01-31 17:37:13.923 7fee31553700 -1 mon.node-1@0(leader) e3 get_health_metrics reporting 4 slow ops...7.948367)
Hint: Some lines were ellipsized, use -l to show in full.
[root@node-1 system]#

3、同样，查看OSD的也有两种方式

[root@node-1 system]# systemctl status ceph-osd@0
● ceph-osd@0.service - Ceph object storage daemon osd.0
   Loaded: loaded (/usr/lib/systemd/system/ceph-osd@.service; enabled-runtime; vendor preset: disabled)
   Active: active (running) since Sun 2021-01-31 15:28:18 CST; 5h 39min ago
 Main PID: 1233 (ceph-osd)
   CGroup: /system.slice/system-ceph\x2dosd.slice/ceph-osd@0.service
           └─1233 /usr/bin/ceph-osd -f --cluster ceph --id 0 --setuser ceph --setgroup ceph



[root@node-1 system]# systemctl status ceph-osd.target 
● ceph-osd.target - ceph target allowing to start/stop all ceph-osd@.service instances at once
   Loaded: loaded (/usr/lib/systemd/system/ceph-osd.target; enabled; vendor preset: enabled)
   Active: active since Sun 2021-01-31 15:28:18 CST; 5h 40min ago

Jan 31 15:28:18 node-1 systemd[1]: Reached target ceph target allowing to start/stop all ceph-osd@.service instances at once.
[root@node-1 system]#

9.2 Ceph 服务日志分析

与Ceph相关的日志存储位置

[root@node-1 system]# cd /var/log/ceph/
[root@node-1 ceph]# ls
ceph.audit.log              ceph-client.rgw.node-1.log  ceph-mds.node-1.log  ceph-mon.node-1.log-20210131.gz  ceph-volume.log
ceph.audit.log-20210131.gz  ceph.log                    ceph-mgr.node-1.log  ceph-osd.0.log                   ceph-volume-systemd.log
ceph-client.admin.log       ceph.log-20210131.gz        ceph-mon.node-1.log  ceph-osd.3.log
[root@node-1 ceph]#

9.3 Ceph 集群状态监控

查看集群状态

[root@node-1 ceph]# ceph -s
  cluster:
    id:     ff22ec29-da80-4790-97b5-c6699433f0b0
    health: HEALTH_OK
 
  services:
    mon: 3 daemons, quorum node-1,node-2,node-3 (age 3h)
    mgr: node-2(active, since 5h), standbys: node-3, node-1
    mds: cephfs-demo:1 {0=node-3=up:active} 2 up:standby
    osd: 4 osds: 4 up (since 4h), 4 in (since 4h)
    rgw: 1 daemon active (node-1)
 
  task status:
 
  data:
    pools:   9 pools, 288 pgs
    objects: 4.12k objects, 4.8 GiB
    usage:   19 GiB used, 161 GiB / 180 GiB avail
    pgs:     288 active+clean
 
[root@node-1 ceph]#

动态观察集群状态

[root@node-1 ceph]# ceph -w

资源池空间使用情况

[root@node-1 ceph]# ceph df 
RAW STORAGE:
    CLASS     SIZE        AVAIL       USED       RAW USED     %RAW USED 
    hdd       180 GiB     161 GiB     15 GiB       19 GiB         10.50 
    TOTAL     180 GiB     161 GiB     15 GiB       19 GiB         10.50 
 
POOLS:
    POOL                          ID     PGS     STORED      OBJECTS     USED        %USED     MAX AVAIL 
    ceph-demo                      1      64     4.7 GiB       1.24k      14 GiB      8.66        50 GiB 
    .rgw.root                      2      32     1.2 KiB           4     768 KiB         0        50 GiB 
    default.rgw.control            3      32         0 B           8         0 B         0        50 GiB 
    default.rgw.meta               4      32     2.4 KiB          12     2.1 MiB         0        50 GiB 
    default.rgw.log                5      32         0 B         207         0 B         0        50 GiB 
    default.rgw.buckets.index      6      32         0 B           4         0 B         0        50 GiB 
    default.rgw.buckets.data       7      32      35 MiB       2.62k     562 MiB      0.37        50 GiB 
    cephfs_metadata                8      16     551 KiB          23     3.2 MiB         0        50 GiB 
    cephfs_data                    9      16     2.5 KiB           1     192 KiB         0        50 GiB 
[root@node-1 ceph]#

查看每块OSD的具体的存储使用情况

[root@node-1 ceph]#  ceph osd df 
ID CLASS WEIGHT  REWEIGHT SIZE    RAW USE DATA    OMAP    META     AVAIL   %USE  VAR  PGS STATUS 
 0   hdd 0.04880  1.00000  50 GiB 4.3 GiB 3.3 GiB 817 KiB 1023 MiB  46 GiB  8.50 0.81 171     up 
 3   hdd 0.02930  1.00000  30 GiB 2.7 GiB 1.7 GiB     0 B    1 GiB  27 GiB  9.14 0.87 117     up 
 1   hdd 0.04880  1.00000  50 GiB 6.0 GiB 5.0 GiB 833 KiB 1023 MiB  44 GiB 11.91 1.13 288     up 
 2   hdd 0.04880  1.00000  50 GiB 6.0 GiB 5.0 GiB 813 KiB 1023 MiB  44 GiB 11.91 1.13 288     up 
                    TOTAL 180 GiB  19 GiB  15 GiB 2.4 MiB  4.0 GiB 161 GiB 10.50                 
MIN/MAX VAR: 0.81/1.13  STDDEV: 1.56
[root@node-1 ceph]#

9.4 Ceph 资源池管理

资源池pool的创建

[root@node-1 ceph]# ceph osd pool create pool-demo 16 16
pool 'pool-demo' created
[root@node-1 ceph]#

查看所有的资源池

[root@node-1 ceph]# ceph osd lspools
1 ceph-demo
2 .rgw.root
3 default.rgw.control
4 default.rgw.meta
5 default.rgw.log
6 default.rgw.buckets.index
7 default.rgw.buckets.data
8 cephfs_metadata
9 cephfs_data
10 pool-demo
[root@node-1 ceph]#

调整对应的资源池pool的副本数为2

[root@node-1 ceph]# ceph osd pool set pool-demo size 2
set pool 10 size to 2
[root@node-1 ceph]#

查看对应的资源池的pg和pgp数

[root@node-1 ceph]# ceph osd pool get pool-demo pg_num
pg_num: 16
[root@node-1 ceph]# ceph osd pool get pool-demo pgp_num
pgp_num: 16
[root@node-1 ceph]#

给对应的资源池pool划分用户类别（rbd\cephfs\rgw）

[root@node-1 ceph]# ceph osd pool application enable pool-demo rbd
enabled application 'rbd' on pool 'pool-demo'
[root@node-1 ceph]#

9.5 Ceph PG数据分布

9.6 Ceph 参数配置调整

ceph集群默认不允许手动删除pool，如果要删，需要调整下面的参数（该方法只是临时有效，服务重启后会恢复原有参数）

ceph --admin-daemon  /var/run/ceph/ceph-mon.node-1.asok config show | grep mon_allow_pool_delete
    "mon_allow_pool_delete": "false",
[root@node-1 ceph]# 

[root@node-1 ceph]# ceph --admin-daemon  /var/run/ceph/ceph-mon.node-1.asok config set mon_allow_pool_delete true
{
    "success": "mon_allow_pool_delete = 'true' "
}
[root@node-1 ceph]#

调整后可成功删除

[root@node-2 ~]# ceph osd pool rm pool-demo pool-demo  --yes-i-really-really-mean-it
pool 'pool-demo' removed
[root@node-2 ~]#

永久生效模式–把“mon allow pool delete = true”写到配置文件里

[root@node-1 ceph-deploy]# cat ceph.conf 
[global]
fsid = ff22ec29-da80-4790-97b5-c6699433f0b0
public_network = 10.0.0.0/24
cluster_network = 10.211.56.0/24
mon_initial_members = node-1
mon_host = 10.0.0.201
auth_cluster_required = cephx
auth_service_required = cephx
auth_client_required = cephx

[client.rgw.node-1]
rgw_frontends = "civetweb port=80"


[mon]
mon allow pool delete = true
mon_max_pg_per_osd = 300

[root@node-1 ceph-deploy]#

把修改后的配置推送给node-1 node-2 node-3

[root@node-1 ceph-deploy]# ceph-deploy  push config node-1 node-2 node-3

十、调整Crush Map

10.1 Crush Map 功能简介

CRUSH 算法通过计算数据存储位置来确定如何存储和检索。 CRUSH 授权 Ceph 客户端直接连接 OSD ，而非通过一个中央服务器或代理。数据存储、检索算法的使用，使 Ceph 避免了单点故障、性能瓶颈、和伸缩的物理限制。

CRUSH 需要一张集群的 Map，且使用 CRUSH Map 把数据伪随机地、尽量平均地分布到整个集群的 OSD 里。CRUSH Map 包含 OSD 列表、把设备汇聚为物理位置的“桶”列表、和指示 CRUSH 如何复制存储池里的数据的规则列表。

10.2 CRUSH Map 规则剖析

要激活 CRUSH Map 里某存储池的规则，找到通用规则集编号，然后把它指定到那个规则集。

1 查看crush map的整体规则

[root@node-1 ceph-deploy]# ceph osd crush dump

2.查看crush map 的规则rule

[root@node-1 ceph-deploy]# ceph osd crush rule ls
replicated_rule
[root@node-1 ceph-deploy]#

3.查看对应资源池pool的rule

[root@node-1 ceph-deploy]# ceph osd pool get ceph-demo crush_rule
crush_rule: replicated_rule
[root@node-1 ceph-deploy]#

10.3 定制Crush 拓扑架构

CRUSH Map 主要有 4 个段落。
设备：由任意对象存储设备组成，即对应一个 ceph-osd进程的存储器。 Ceph 配置文件里的每个 OSD 都应该有一个设备。
桶类型：定义了 CRUSH 分级结构里要用的桶类型（ types ），桶由逐级汇聚的存储位置（如行、机柜、机箱、主机等等）及其权重组成。
桶实例：定义了桶类型后，还必须声明主机的桶类型、以及规划的其它故障域。
规则：由选择桶的方法组成。

10.4 手动编辑crush map

CRUSH Map 支持“ CRUSH 规则”的概念，用以确定一个存储池里数据的分布。CRUSH 规则定义了归置和复制策略、或分布策略，用它可以规定 CRUSH 如何放置对象副本。对大型集群来说，你可能创建很多存储池，且每个存储池都有它自己的 CRUSH 规则集和规则。默认的 CRUSH Map 里，每个存储池有一条规则、一个规则集被分配到每个默认存储池。

下载crush map的二进制文件到本地

[root@node-1 ceph-deploy]# ceph osd getcrushmap -o crushmap.bin
[root@node-1 ceph-deploy]# file crushmap.bin 
crushmap.bin: MS Windows icon resource - 8 icons, 1-colors
[root@node-1 ceph-deploy]#

把二进制文件编译成txt文本方便修改

[root@node-1 ceph-deploy]# crushtool -d crushmap.bin -o crushmap.txt

编辑crushmap.txt，修改成如下所示

# begin crush map
tunable choose_local_tries 0
tunable choose_local_fallback_tries 0
tunable choose_total_tries 50
tunable chooseleaf_descend_once 1
tunable chooseleaf_vary_r 1
tunable chooseleaf_stable 1
tunable straw_calc_version 1
tunable allowed_bucket_algs 54

# devices
device 0 osd.0 class hdd
device 1 osd.1 class hdd
device 2 osd.2 class hdd
device 3 osd.3 class ssd
device 4 osd.4 class ssd
device 5 osd.5 class ssd

# types
type 0 osd
type 1 host
type 2 chassis
type 3 rack
type 4 row
type 5 pdu
type 6 pod
type 7 room
type 8 datacenter
type 9 zone
type 10 region
type 11 root

# buckets
host node-1 {
	id -3		# do not change unnecessarily
	id -4 class hdd		# do not change unnecessarily
	# weight 0.078
	alg straw2
	hash 0	# rjenkins1
	item osd.0 weight 0.049
}
host node-2 {
	id -5		# do not change unnecessarily
	id -6 class hdd		# do not change unnecessarily
	# weight 0.068
	alg straw2
	hash 0	# rjenkins1
	item osd.1 weight 0.049
}
host node-3 {
	id -7		# do not change unnecessarily
	id -8 class hdd		# do not change unnecessarily
	# weight 0.078
	alg straw2
	hash 0	# rjenkins1
	item osd.2 weight 0.049
}

host node-1-ssd {
        # weight 0.078
        alg straw2
        hash 0  # rjenkins1
        item osd.3 weight 0.029
 }

host node-2-ssd {
        # weight 0.068
        alg straw2
        hash 0  # rjenkins1
        item osd.5 weight 0.019
}

host node-3-ssd {
        # weight 0.078
        alg straw2
        hash 0  # rjenkins1
        item osd.4 weight 0.029
}




root default {
	id -1		# do not change unnecessarily
	id -2 class hdd		# do not change unnecessarily
	# weight 0.224
	alg straw2
	hash 0	# rjenkins1
	item node-1 weight 0.039
	item node-2 weight 0.034
	item node-3 weight 0.039
}

root ssd {
        # weight 0.224
        alg straw2
        hash 0  # rjenkins1
        item node-1-ssd weight 0.039
        item node-2-ssd weight 0.034
        item node-3-ssd weight 0.039
}



# rules
rule replicated_rule {
	id 0
	type replicated
	min_size 1
	max_size 10
	step take default
	step chooseleaf firstn 0 type host
	step emit
}

rule demo_rule {
        id 10
        type replicated
        min_size 1
        max_size 10
        step take ssd
        step chooseleaf firstn 0 type host
        step emit
}


# end crush map

具体可拆分为：

修改device区域
修改bucket区域，新增如下部分
新增root顶部配置
修改rule区域，新增demo-rule

4.将crushmap.txt重新编译成二进制文件

[root@node-1 ceph-deploy]# crushtool -c crushmap.txt -o crushmap-new.bin

应用新的crushmap

[root@node-1 ceph-deploy]# ceph osd setcrushmap -i crushmap-new.bin 
20
[root@node-1 ceph-deploy]# ceph osd tree
ID  CLASS WEIGHT  TYPE NAME           STATUS REWEIGHT PRI-AFF 
-12       0.11197 root ssd                                    
 -9       0.03899     host node-1-ssd                         
  3   ssd 0.02899         osd.3           up  1.00000 1.00000 
-10       0.03400     host node-2-ssd                         
  5   ssd 0.01900         osd.5           up  1.00000 1.00000 
-11       0.03899     host node-3-ssd                         
  4   ssd 0.02899         osd.4           up  1.00000 1.00000 
 -1       0.11197 root default                                
 -3       0.03899     host node-1                             
  0   hdd 0.04900         osd.0           up  1.00000 1.00000 
 -5       0.03400     host node-2                             
  1   hdd 0.04900         osd.1           up  1.00000 1.00000 
 -7       0.03899     host node-3                             
  2   hdd 0.04900         osd.2           up  1.00000 1.00000 
[root@node-1 ceph-deploy]#

查看已新生成demo-rule规则

[root@node-1 ~]# ceph osd crush rule ls
replicated_rule
demo_rule
[root@node-1 ~]#

将原有的ceph-demo 资源池设置成新的demo_rule

[root@node-1 ~]# ceph osd pool set ceph-demo crush_rule demo_rule
set pool 1 crush_rule to demo_rule
[root@node-1 ~]#

往ceph-demo资源池新建文件，查看该文件的存储设备

[root@node-1 ~]# rbd create ceph-demo/crush-demo.img --size 5G
[root@node-1 ~]# ceph osd map ceph-demo crush-demo.img
osdmap e565 pool 'ceph-demo' (1) object 'crush-demo.img' -> pg 1.d267742c (1.2c) -> up ([5,4,3], p5) acting ([1,4], p1)
[root@node-1 ~]#

还原crushmap

[root@node-1 ~]# ceph osd crush rule ls
replicated_rule
demo_rule
[root@node-1 ~]# ceph osd pool set ceph-demo crush_rule replicated_rule
set pool 1 crush_rule to replicated_rule

[root@node-1 ceph-deploy]# ceph osd setcrushmap -i crushmap.bin 
21
[root@node-1 ceph-deploy]# ceph osd tree
ID CLASS WEIGHT  TYPE NAME       STATUS REWEIGHT PRI-AFF 
-1       0.22447 root default                            
-3       0.07809     host node-1                         
 0   hdd 0.04880         osd.0       up  1.00000 1.00000 
 3   hdd 0.02930         osd.3       up  1.00000 1.00000 
-5       0.06828     host node-2                         
 1   hdd 0.04880         osd.1       up  1.00000 1.00000 
 5   hdd 0.01949         osd.5       up  1.00000 1.00000 
-7       0.07809     host node-3                         
 2   hdd 0.04880         osd.2       up  1.00000 1.00000 
 4   hdd 0.02930         osd.4       up  1.00000 1.00000 
[root@node-1 ceph-deploy]#  ceph osd map ceph-demo crush-demo.img
osdmap e658 pool 'ceph-demo' (1) object 'crush-demo.img' -> pg 1.d267742c (1.2c) -> up ([1,0,4], p1) acting ([1,0,4], p1)

你可能感兴趣的:(ceph)

Ceph实战（一）-分布式存储介绍与原理架构概述深度视觉机器 Centos7 Ceph 分布式存储介绍与原理架构概述
最近工作中有涉及到CEPH相关的内容，所以打算开一个CEPH专栏来进行总结，学习CEPH还有一个重要原因就是我同时要补充kubernetes、rancher专栏必定会涉及到有状态的存储资源抽象（StatefulSet、PV、PVC、StorageClass等），首先绕不开的就是高可用的分布式存储系统，虽然有很多人反对将持久化数据以容器的方式来部署，说容器化部署不是银弹，但未来发展方向就是容器化，并
云原生存储架构：构建数据永续的新一代存储基础设施桂月二二云原生架构
引言：重新定义数据基础设施边界蚂蚁集团基于Ceph构建的全闪存存储集群达到EB级规模，单集群IOPS突破1亿，延迟稳定在200μs内。Snowflake的存储计算分离架构使其数据湖查询速度提升14倍，存储成本降低82%。Gartner预测到2025年70%企业将采用云原生存储方案，数据自动分层技术可将冷数据存储成本压缩至0.001美元/GB/月。一、存储架构演进路线1.1数据存储范式对比技术维度D
Ceph Cookbook: 掌握分布式存储技术的实践指南云山雾村
本文还有配套的精品资源，点击获取简介：《CephCookbook》是一本面向希望深入学习Ceph分布式存储系统的读者的实用指南。本书通过实际案例和操作指导，全面介绍Ceph的核心概念和关键技术。介绍了Ceph的三个主要组件：RADOS、RBD和RGW，以及它们如何协同工作以提供高可用性和数据冗余。读者将学习Ceph的安装、配置、管理和优化，以及如何利用其高级特性，如CRUSH算法和多租户管理。本书
深入探讨Ceph：分布式存储架构的未来深度Linux ceph 分布式架构 C/C++
在数字化浪潮汹涌澎湃的当下，数据量呈爆发式增长，传统存储系统在应对海量数据存储、高并发访问以及灵活扩展等方面，逐渐显得力不从心。分布式存储技术应运而生，成为解决现代数据存储难题的关键方案，而Ceph作为分布式存储领域的佼佼者，正日益受到广泛关注和应用。Ceph以其卓越的性能、高可靠性、强大的扩展性以及开源的特性，在众多分布式存储系统中脱颖而出，被广泛应用于云计算、大数据、人工智能等前沿领域。无论是
分布式NAS集群+ceph+CTDB Comedy_宁分布式 ceph linux NAS CTDB
分布式存储系统中，分布式NAS、CTDB和Ceph常常被结合使用以提供高性能、高可用性和灵活扩展的存储解决方案。以下是这三者的关系及其在分布式存储系统中的角色：一、分布式NAS（NetworkAttachedStorage）分布式NAS是一种通过网络提供分布式文件存储服务的系统。它的核心功能是将存储资源分布在多个节点上，提供一个统一的文件系统视图，并通过网络文件系统协议（如NFS和SMB）供客户端
4.Ceph监控 yongbang_yan ceph集群运维
Ceph监控演示如何监控一个Ceph集群。我们将学习如何用ceph的命令行工具进行监控。监控集群的整体状态健康状态ceph命令的health选项查看集群的健康状态。#cephhealthdetailHEALTH_WARNclockskewdetectedonmon.ceph-node2;Monitorclockskewdetectedmon.ceph-node2addr192.168.1.121:
ceph fs status 输出详解时空无限 ceph ceph
cephfsstatus命令用于显示Ceph文件系统的状态信息，其中各列的含义如下：RANK：元数据服务器（MDS）的等级或标识符。STATE：MDS的当前状态，例如active（活跃）、standby（待机）等。MDS：MDS的名称或标识符。ACTIVITY：MDS当前的活动状态或正在执行的操作。DNS：MDS管理的目录名称（DirectoryNames）的数量。INOS：MDS管理的inode
ceph中报错“ clock skew detected on mon.ceph2, mon.ceph3” 下一页盛夏花开 ceph ceph 运维
自己搭建的ceph集群，显示时间不同步:clockskewdetectedonmon.ceph2,mon.ceph3但是查看chrony进程已经启动，ceph配置文件中,如下参数也已经配置，
ceph-deploy osd activate xxx bluestore ERROR only火车头 Ceph ceph bluestore ceph-deploy aio-max-nr
cephluminous12.2.0bluestore添加osd出错:[ceph_deploy.conf][DEBUG]foundconfigurationfileat:/root/.cephdeploy.conf[ceph_deploy.cli][INFO]Invoked(1.5.38):/usr/bin/ceph-deploy--overwrite-conf--ceph-conf/etc/ce
ceph bluestore Blob 分析 only火车头 Ceph
cephversion:11.0.0bluestore包含一个非常重要的结构，Blob,本节主要分析Blob，注意ceph版本是基于11.0.0的。1.BlobstructBlob:publicboost::intrusive::set_base_hookextents;///unused_t;unused_tunused;///>buffer_map;Cache*cache;state_list
ceph HEALTH_WARN clock skew detected on mon.f, mon.o, mon.p, mon.q 时空无限 ceph ceph
问题cephhealthdetail[WRN]MON_CLOCK_SKEW:clockskewdetectedonmon.f,mon.o,mon.p,mon.qmon.fclockskew0.243128s>max0.05s(latency0.000836159s)mon.oclockskew16.249s>max0.05s(latency0<
一次交换机故障导致的云平台（opensatck+ceph）不可用的记录大新新大浩浩 openstack ceph 服务器网络
前言发现几年前记录的一次由于交换机故障导致的云平台使用异常的问题，因为比较少见所以也整理记录一下一、细节过程用户联系说好多运行在云主机上的网页访问不了了，需要处理一下。甲方现场还挺远，我就先登陆在虚拟机上部署的堡垒机，发现堡垒机也不好使。机房运维联系说有台业务交换机坏了，有备件，正在更换。换上之后，过了一会，堡垒机就好使了。赶紧登陆上去检查服务。存储集群已经开始自动恢复，虚拟机也逐渐恢复了业务能力
k8s rook-ceph MountDevice failed for volume pvc An operation with the given Volume ID already exists 时空无限 Kubernetes kubernetes ceph
https://github.com/rook/rook/issues/4896环境kubeadm搭建的k8s集群，rook-ceph部署的ceph存储，monpod所在宿主机和挂载客户端机器pod所在机器不在一个二层网络里。故障pod挂载不上pvc，describepod信息如下MountDevicefailedforvolumepvcAnoperationwiththegivenVolumeI
rook-ceph无法登录dashboard 时空无限 Kubernetes ceph ceph kubernetes
环境ubuntu22.04tlsk8s1.20.2现象搭建好ceph集群环境后，执行如下命令获取admin登录账号的密码kubectl-nrook-cephgetsecretrook-ceph-dashboard-password-ojsonpath="{['data']['password'
Rook-ceph(1.92最新版) 野猪佩挤 k8s 存储 ceph
安装前准备#确认安装lvm2yuminstalllvm2-y#启用rbd模块modproberbdcat>/etc/rc.sysinit/etc/sysconfig/modules/rbd.modulesfilesystem.yaml<
ceph nautilus(14.2.22) 通过ansible部署grafana无法启动 Ethan@YL 运维 ceph 分布式存储
cephnautilus(14.2.22)通过ansible部署grafana无法启动一、ceph环境ceph版本：nautilus(14.2.22)二、cephansible部署1、在cephansible自动化部署的时候，到最后启动grafanadocker的时候，总是启动不了提示：“Timeoutwhenwaitingforxxx.xxx.xxx.xxx:3000”2、通过查看/var/lo
ansible部署ceph 时空无限 ceph ansible ceph linux
前言：ceph的官网有坑。按照官网部署，不会一蹴而就。会遇到各种各样的问题，ceph文档有待改进。环境操作系统cat/etc/redhat-releaseCentOSLinuxrelease8.5.2111uname-r4.18.0-80.el8.x86_64主机名三台主机，其中node-01为部署机器和ceph的其中一个节点。node-01node-02node-03网卡和ip每台主机双网卡en
ansible进行ceph-rgw部署睿江云计算程序人生开发工具开发 ansible
用户管理用户创建执行下面的命令新建一个用户(S3接口):radosgw-adminusercreate—uid={username}—display-name=”{display-name}”[—email={email}]实例如下:radosgw-adminusercreate—uid=johndoe—display-name=”JohnDoe”—[email protected]获取
Ceph 网络模块(1) - 网络模块基本结构 hequan_hust Ceph Ceph 网络模块分布式存储
Ceph网络模块基本结构本文基于Jewel版本对Ceph的网络模块进行分析，主要针对AsyncMessenger的方式。Ceph依据节点功能可以将节点划分为4种类型，分别是Client、OSD、Monitor和MDS。每个节点由Dispatcher（消息调度器）集合和Messenger（消息管理器）集合两部分组成。Dispatcher是消息的订阅者，对接收的消息进行处理或者将需要发送的消息移交给本
Ceph 架构以及部署完颜振江 ceph 架构
Ceph是一个开源的分布式存储系统，它提供了对象存储、块存储和文件系统存储。Ceph的设计目标是高度可扩展性和高性能，同时提供无单点故障的高可用性。Ceph架构Ceph的架构主要包括以下组件：Monitor(MON)：CephMonitor负责维护集群的状态，包括存储节点的成员信息和数据分布图。它们是Ceph集群的中枢，保证了集群的一致性和健康状态。ObjectStorageDaemon(OSD)
CentOS7部署ceph 假面生存储 linux
CEPH简介不管你是想为云平台提供Ceph对象存储和/或Ceph块设备，还是想部署一个Ceph文件系统或者把Ceph作为他用，所有Ceph存储集群的部署都始于部署一个个Ceph节点、网络和Ceph存储集群。Ceph存储集群至少需要一个CephMonitor和两个OSD守护进程。而运行Ceph文件系统客户端时，则必须要有元数据服务器（MetadataServer）。CephOSDs:CephOSD守
Centos 7下 ceph的安装村口树下《技术人生》系列 ceph
文章目录ceph安装环境准备工作1、安装ceph-deploy2、配置时间同步3、配置节点间ssh无密码登录4、防火墙配置5、安装包管理器部署ceph集群1、创建ceph操作目录（node-1）2、创建集群3、安装ceph4、安装monitor5、安装ceph-mgr6、创建osd7、创建元数据服务器mds8、扩展集群8.1、增加monitor8.2、增加manager8.3、创建RGW实例8.4
Ceph：关于Ceph 中使用 RADOS 块设备提供块存储的一些笔记整理(12) 山河已无恙零基础入门Ceph ceph 笔记
写在前面准备考试，整理ceph相关笔记博文内容涉及使用RADOS块设备提供块存储理解不足小伙伴帮忙指正对每个人而言，真正的职责只有一个：找到自我。然后在心中坚守其一生，全心全意，永不停息。所有其它的路都是不完整的，是人的逃避方式，是对大众理想的懦弱回归，是随波逐流，是对内心的恐惧——赫尔曼·黑塞《德米安》使用RADOS块设备提供块存储管理RADOS块设备基于RBD的块存储块设备是服务器、笔记本电脑
Ceph的原理与架构 stybxiao Ceph ceph
Ceph的原理与架构Ceph的原理与架构Ceph的起源与哲学Ceph的技术Ceph的架构及组件
理解Ceph的三种存储方式(块设备、文件系统、对象存储) 118路司机大数据
前言Ceph是一个开源的、统一的、分布式的存储系统这是我们宣传Ceph时常说的一句话，其中“统一”是说Ceph可以一套存储系统同时提供块设备存储、文件系统存储和对象存储三种存储功能。一听这句话，具有一定存储基础的用户应该已经大致了解了Ceph的存储接口，而没有存储基础的小白用户则一脸懵逼。本文旨在让小白用户理解Ceph的块存储、文件系统存储和对象存储接口。一.Ceph的块设备存储接口什么是块设备？
Ceph存储架构详解 wespten 虚拟化技术 SDN NFV 云计算技术 OpenStack 数据库存储块存储文件存储对象存储分布式网络存储 ceph 架构
1、Ceph三大存储接口Ceph能够提供企业中三种常见的存储需求：块存储、文件存储和对象存储。正如Ceph官方所定义的一样“Cephuniquelydeliversobject,block,andfilestorageinoneunifiedsystem.”，Ceph在一个统一的存储系统中同时提供了对象存储、块存储和文件存储，即Ceph是一个统一存储，能够将企业企业中的三种存储需求统一汇总到一个存
【日常运维】mongoDB学习-入门介绍-其强大之处以及用武之地向往风的男子运维日常 DBA mongodb
本站以分享各种运维经验和运维所需要的技能为主《python零基础入门》：python零基础入门学习《python运维脚本》：python运维脚本实践《shell》：shell学习《terraform》持续更新中：terraform_Aws学习零基础入门到最佳实战《k8》暂未更新《docker学习》暂未更新《ceph学习》ceph日常问题解决分享《日志收集》ELK+各种中间件《运维日常》运维日常《l
ceph新增节点，OSD设备，标签管理（二）淡黄的Cherry 存储篇 ceph
一、访问客户端集群方式方式一:使用cephadmshell交互式配置[root@ceph141~]#cephadmshell#注意，此命令会启动一个新的容器，运行玩后会退出！Inferringfsidc153209c-d8a0-11ef-a0ed-bdb84668ed01Inferringconfig/var/lib/ceph/c153209c-d8a0-11ef-a0ed-bdb84668ed0
分布式存储的技术选型之HDFS、Ceph、MinIO对比 Linux运维老纪勇敢向前迎接运维开发之挑战分布式 hdfs ceph 云原生运维开发大数据云计算
分布式存储的技术选型比：HDFS、Ceph、MinIO对比一文读懂分布式存储在当今数字化时代，数据呈爆炸式增长，分布式存储技术应运而生，成为大数据存储与管理的得力助手。它将数据分散存于多台独立设备，构建起一个庞大而可靠的虚拟存储体系，有效突破了传统集中式存储的性能瓶颈，大幅提升了可靠性、可用性及存取效率，轻松应对海量数据的存储挑战。分布式存储的应用场景极为广泛。在大数据处理领域，如互联网公司应对海
nfs-ganesha(用户态NFS)编译、安装和使用沙拉OK Ceph分布式存储运维 ceph nfs 经验分享
前面的文章介绍了基于社区或自己项目编译rpm包搭建Ceph分布式存储集群的方法。本篇介绍使用nfs-ganesha源码编译、安装，客户端使用用户态nfs协议挂载使用Ceph文件存储和对象存储的方法。编译与安装nfs-ganesha一、获取源码源码可直接从github上gitclone，也可以使用自己库维护的代码：github：[email protected]:nfs-ganesha/n
ASM系列六利用TreeApi 添加和移除类成员 lijingyao8206 jvm 动态代理 ASM 字节码技术 TreeAPI
同生成的做法一样，添加和移除类成员只要去修改fields和methods中的元素即可。这里我们拿一个简单的类做例子，下面这个Task类，我们来移除isNeedRemove方法，并且添加一个int 类型的addedField属性。 package asm.core; /** * Created by yunshen.ljy on 2015/6/
Springmvc-权限设计 bee1314 spring Web jsp
万丈高楼平地起。权限管理对于管理系统而言已经是标配中的标配了吧，对于我等俗人更是不能免俗。同时就目前的项目状况而言，我们还不需要那么高大上的开源的解决方案，如Spring Security，Shiro。小伙伴一致决定我们还是从基本的功能迭代起来吧。目标： 1.实现权限的管理（CRUD） 2.实现部门管理（CRUD) 3.实现人员的管理（CRUD） 4.实现部门和权限
算法竞赛入门经典（第二版）第2章习题 CrazyMizzz c 算法
2.4.1 输出技巧 #include <stdio.h> int main() { int i, n; scanf("%d", &n); for (i = 1; i <= n; i++) printf("%d\n", i); return 0; } 习题2-2 水仙花数(daffodil
struts2中jsp自动跳转到Action 麦田的设计者 jsp webxml struts2 自动跳转
1、在struts2的开发中，经常需要用户点击网页后就直接跳转到一个Action，执行Action里面的方法，利用mvc分层思想执行相应操作在界面上得到动态数据。毕竟用户不可能在地址栏里输入一个Action（不是专业人士） 2、＜jsp:forward page="xxx.action" /＞，这个标签可以实现跳转，page的路径是相对地址,不同与jsp和j
php 操作webservice实例 IT独行者 PHP webservice
首先大家要简单了解了何谓webservice，接下来就做两个非常简单的例子，webservice还是逃不开server端与client端。我测试的环境为：apache2.2.11 php5.2.10做这个测试之前，要确认你的php配置文件中已经将soap扩展打开，即extension=php_soap.dll; OK 现在我们来体验webservice //server端 serve
Windows下使用Vagrant安装linux系统 _wy_ windows vagrant
准备工作：下载安装 VirtualBox ：https://www.virtualbox.org/ 下载安装 Vagrant ：http://www.vagrantup.com/ 下载需要使用的 box ：官方提供的范例：http://files.vagrantup.com/precise32.box 还可以在 http://www.vagrantbox.es/
更改linux的文件拥有者及用户组(chown和chgrp) 无量 c linux chgrp chown
本文（转） http://blog.163.com/yanenshun@126/blog/static/128388169201203011157308/ http://ydlmlh.iteye.com/blog/1435157 一、基本使用：使用chown命令可以修改文件或目录所属的用户：命令
linux下抓包工具矮蛋蛋 linux
原文地址： http://blog.chinaunix.net/uid-23670869-id-2610683.html tcpdump -nn -vv -X udp port 8888 上面命令是抓取udp包、端口为8888 netstat -tln 命令是用来查看linux的端口使用情况 13 . 列出所有的网络连接 lsof -i 14. 列出所有tcp 网络连接信息 l
我觉得mybatis是垃圾！：“每一个用mybatis的男纸，你伤不起” alafqq mybatis
最近看了每一个用mybatis的男纸，你伤不起原文地址：http://www.iteye.com/topic/1073938 发表一下个人看法。欢迎大神拍砖；个人一直使用的是Ibatis框架，公司对其进行过小小的改良；最近换了公司，要使用新的框架。听说mybatis不错；就对其进行了部分的研究；发现多了一个mapper层；个人感觉就是个dao；
解决java数据交换之谜百合不是茶数据交换
交换两个数字的方法有以下三种，其中第一种最常用 /* 输出最小的一个数 */ public class jiaohuan1 { public static void main(String[] args) { int a =4; int b = 3; if(a<b){ // 第一种交换方式 int tmep =
渐变显示 bijian1013 JavaScript
<style type="text/css"> #wxf { FILTER: progid:DXImageTransform.Microsoft.Gradient(GradientType=0, StartColorStr=#ffffff, EndColorStr=#97FF98); height: 25px; } </style>
探索JUnit4扩展：断言语法assertThat bijian1013 java 单元测试 assertThat
一.概述 JUnit 设计的目的就是有效地抓住编程人员写代码的意图，然后快速检查他们的代码是否与他们的意图相匹配。 JUnit 发展至今，版本不停的翻新，但是所有版本都一致致力于解决一个问题，那就是如何发现编程人员的代码意图，并且如何使得编程人员更加容易地表达他们的代码意图。JUnit 4.4 也是为了如何能够
【Gson三】Gson解析{"data":{"IM":["MSN","QQ","Gtalk"]}} bit1129 gson
如何把如下简单的JSON字符串反序列化为Java的POJO对象? {"data":{"IM":["MSN","QQ","Gtalk"]}} 下面的POJO类Model无法完成正确的解析： import com.google.gson.Gson;
【Kafka九】Kafka High Level API vs. Low Level API bit1129 kafka
1. Kafka提供了两种Consumer API High Level Consumer API Low Level Consumer API(Kafka诡异的称之为Simple Consumer API，实际上非常复杂) 在选用哪种Consumer API时，首先要弄清楚这两种API的工作原理，能做什么不能做什么，能做的话怎么做的以及用的时候，有哪些可能的问题
在nginx中集成lua脚本：添加自定义Http头，封IP等 ronin47 nginx lua
Lua是一个可以嵌入到Nginx配置文件中的动态脚本语言，从而可以在Nginx请求处理的任何阶段执行各种Lua代码。刚开始我们只是用Lua 把请求路由到后端服务器，但是它对我们架构的作用超出了我们的预期。下面就讲讲我们所做的工作。强制搜索引擎只索引mixlr.com Google把子域名当作完全独立的网站，我们不希望爬虫抓取子域名的页面，降低我们的Page rank。 location /{
java-归并排序 bylijinnan java
import java.util.Arrays; public class MergeSort { public static void main(String[] args) { int[] a={20,1,3,8,5,9,4,25}; mergeSort(a,0,a.length-1); System.out.println(Arrays.to
Netty源码学习-CompositeChannelBuffer bylijinnan java netty
CompositeChannelBuffer体现了Netty的“Transparent Zero Copy” 查看API（ http://docs.jboss.org/netty/3.2/api/org/jboss/netty/buffer/package-summary.html#package_description）可以看到，所谓“Transparent Zero Copy”是通
Android中给Activity添加返回键 hotsunshine Activity
// this need android:minSdkVersion="11" getActionBar().setDisplayHomeAsUpEnabled(true); @Override public boolean onOptionsItemSelected(MenuItem item) {
静态页面传参 ctrain 静态
$(document).ready(function () { var request = { QueryString : function (val) { var uri = window.location.search; var re = new RegExp("" + val + "=([^&?]*)", &
Windows中查找某个目录下的所有文件中包含某个字符串的命令 daizj windows 查找某个目录下的所有文件包含某个字符串
findstr可以完成这个工作。 [html] view plain copy >findstr /s /i "string" *.* 上面的命令表示，当前目录以及当前目录的所有子目录下的所有文件中查找"string&qu
改善程序代码质量的一些技巧 dcj3sjt126com 编程 PHP 重构
有很多理由都能说明为什么我们应该写出清晰、可读性好的程序。最重要的一点，程序你只写一次，但以后会无数次的阅读。当你第二天回头来看你的代码时，你就要开始阅读它了。当你把代码拿给其他人看时，他必须阅读你的代码。因此，在编写时多花一点时间，你会在阅读它时节省大量的时间。让我们看一些基本的编程技巧：尽量保持方法简短尽管很多人都遵
SharedPreferences对数据的存储 dcj3sjt126com
SharedPreferences简介： &nbs
linux复习笔记之bash shell (2) bash基础 eksliang bash bash shell
转载请出自出处： http://eksliang.iteye.com/blog/2104329 1.影响显示结果的语系变量（locale） 1.1locale这个命令就是查看当前系统支持多少种语系，命令使用如下： [root@localhost shell]# locale LANG=en_US.UTF-8 LC_CTYPE="en_US.UTF-8"
Android零碎知识总结 gqdy365 android
1、CopyOnWriteArrayList add(E) 和remove(int index)都是对新的数组进行修改和新增。所以在多线程操作时不会出现java.util.ConcurrentModificationException错误。所以最后得出结论：CopyOnWriteArrayList适合使用在读操作远远大于写操作的场景里，比如缓存。发生修改时候做copy，新老版本分离，保证读的高
HoverTree.Model.ArticleSelect类的作用 hvt Web .net C#hovertree asp.net
ArticleSelect类在命名空间HoverTree.Model中可以认为是文章查询条件类，用于存放查询文章时的条件，例如HvtId就是文章的id。HvtIsShow就是文章的显示属性，当为-1是，该条件不产生作用，当为0时，查询不公开显示的文章，当为1时查询公开显示的文章。HvtIsHome则为是否在首页显示。HoverTree系统源码完全开放，开发环境为Visual Studio 2013
PHP 判断是否使用代理 PHP Proxy Detector 天梯梦 proxy
1. php 类 I found this class looking for something else actually but I remembered I needed some while ago something similar and I never found one. I'm sure it will help a lot of developers who try to
apache的math库中的回归——regression（翻译） lvdccyb Math apache
这个Math库，虽然不向weka那样专业的ML库，但是用户友好，易用。多元线性回归，协方差和相关性（皮尔逊和斯皮尔曼），分布测试（假设检验，t，卡方，G），统计。数学库中还包含，Cholesky，LU，SVD，QR，特征根分解，真不错。基本覆盖了：线代，统计，矩阵，最优化理论曲线拟合常微分方程遗传算法（GA），还有3维的运算。。。
基础数据结构和算法十三：Undirected Graphs (2) sunwinner Algorithm
Design pattern for graph processing. Since we consider a large number of graph-processing algorithms, our initial design goal is to decouple our implementations from the graph representation
云计算平台最重要的五项技术 sumapp 云计算云平台智城云
云计算平台最重要的五项技术 1、云服务器云服务器提供简单高效，处理能力可弹性伸缩的计算服务，支持国内领先的云计算技术和大规模分布存储技术，使您的系统更稳定、数据更安全、传输更快速、部署更灵活。特性机型丰富通过高性能服务器虚拟化为云服务器，提供丰富配置类型虚拟机，极大简化数据存储、数据库搭建、web服务器搭建等工作；仅需要几分钟，根据CP
《京东技术解密》有奖试读获奖名单公布 ITeye管理员活动
ITeye携手博文视点举办的12月技术图书有奖试读活动已圆满结束，非常感谢广大用户对本次活动的关注与参与。 12月试读活动回顾： http://webmaster.iteye.com/blog/2164754 本次技术图书试读活动获奖名单及相应作品如下：一等奖（两名） Microhardest：http://microhardest.ite