林凡修

ceph集群维护常用操作

文章目录

- - - 通过套接字进行单机管理
    - 集群启停
    - 移除节点
    - ceph配置文件
    - 存储池分类
    - - 副本池IO
      - 纠删码池IO
    - PG与PGP
    - PG数量计算
    - PG常见状态
    - 存储池管理
    - - 创建存储池
      - 查看存储池
      - 删除存储池
      - 存储池配额
    - 存储池可用参数
    - 存储池快照

通过套接字进行单机管理

可以在mon或者osd节点通过ceph命令进行单机管理本机的mon或osd服务

节点上需要存在keyring认证文件

#通过socket文件连接osd服务，执行操作
ceph --admin-socket /var/run/ceph/ceph-osd.11.asok help	#帮查看助

--admin-daemon	#在mon节点通过socket文件获取daemon服务帮助
ceph --admin-daemon /var/run/ceph/ceph-mon.ceph-mon-01.asok help	#查看帮助
ceph --admin-daemon /var/run/ceph/ceph-mon.ceph-mon-01.asok config show	#查看配置信息

集群启停

关闭集群之前，要提前设置ceph集群不要将osd标记为out，避免节点关闭之后osd状态转变为out产生数据迁移

ceph osd set noout	#关闭集群前设置noout
ceph osd unset noout	#集群启动后取消noout

集群关闭顺序：

关闭集群前设置noout标记
关闭存储客户端，停止读写数据
如果使用了RGW，关闭RGW
关闭cephfs元数据服务
关闭osd
关闭mgr
关闭mon

集群启动顺序：

启动mon
启动mgr
启动osd
启动mds
启动rgw服务
启动存储客户端
取消noout标记

移除节点

移除节点之前，要逐个把节点上的osd停止并从ceph集群删除。具体步骤可以参考如下：

设置osd为out，然后等待数据迁移完成
节点上停止osd进程
从集群中删除所有待移除节点上的osd，ceph osd purge
待移除主机上的其它osd重复以上操作
全部操作完成后下线主机
从集群中删除该节点，ceph osd crush remove

ceph配置文件

ceph的主要配置文件是/etc/ceph/ceph.conf，ceph服务在启动时会检查ceph.conf，分号；和#在配置文件中都表示注释。ceph.conf主要由以下配置段组成：

[global]	#全局配置
[osd]	#osd专用配置，可以使用osd.N来表示某一个osd专用配置，N为osd编号，如0、1、2等
[mon]	#mon专用配置，可以使用mon.A来为某一个monitor节点做专用配置，其中A表示节点名称，例如ceph-mon-01，可以使用ceph mon dump获取到节点名称
[client]	#客户端专用配置

ceph配置文件加载顺序：

$CEPH_CONF环境变量指定的文件
-c选项指定的文件
/etc/ceph/ceph.conf
~/.ceph/ceph.conf 当前用户家目录下.ceph目录下的ceph.conf
./ceph.conf 当前目录下的ceph.conf

存储池分类

在ceph中，存储池有两种类型：副本池和纠删码池

副本池：replicated，定义每个对象在集群中保存为多个副本，默认为3个副本，副本池是默认的存储池类型
纠删码池：erasure code，把各对象分为N=K+M个块（chunk），其中K为数据块数量，M为编码块数量，因此存储池的总大小N=K+M。简单来说就是数据保存在K个数据块上，并提供M个冗余块提供数据高可用，那么最多能故障的块就是M个，实际的磁盘占用就是K+M块，因此相比副本池比较节省存储资源。一般采用8+4机制（默认2+2），即8个数据块+4个编码块，那么就是1/3的存储空间用于数据冗余，比副本池默认的3副本节省空间，但不能出现大于一定数据块的故障。需要注意，不是所有的应用都支持纠删码池，例如rbd只支持副本池，而rgw可以支持纠删码池

副本池IO

副本池将一个数据对象存储为多个副本

在客户端写入数据时，ceph使用CRUSH算法计算出对象所属的PG ID和PG对应的osd，然后向主osd写入数据，再由主osd将数据同步给辅助osd。

读取数据：

客户端向主osd发起读请求
主osd从本地磁盘读取数据并返回，最终完成读请求

写入数据：

客户端向主osd请求写入数据
主osd写入后，将数据发送至各辅助osd
辅助osd写入数据完成后，发送完成信号给主osd
主osd返回确认信息给客户端，完成写请求

纠删码池IO

ceph从F版本起开始支持纠删码，但不推荐在生产环境使用纠删码池。

纠删码池虽然降低了数据保存所需要占用的存储空间，但是读写数据占用的计算资源要比副本池高。

纠删码池写入数据：数据在主osd进行编码然后分发到相应的osd上

计算合适的数据块并进行编码
对每个数据块进行编码并写入osd

纠删码池读取数据：

1.从相应的osd中获取数据后进行解码

创建纠删码池

ceph osd pool create erasure-test-pool 32 32 erasure

查看默认的纠删码保存策略

ceph osd erasure-code-profile get default

如上图，其中：

k=2表示数据块的数量
m=2表示编码块的数量
plugin=jerasure 默认的纠删码池插件

验证数据的存储方式

rados put testfile /var/log/syslog -p erasure-test-pool	#上传测试对象
ceph osd map erasure-test-pool test-file	#查看测试对象保存位置
rados get test-file ./a.log -p erasure-test-pool	#下载测试对象

如上图所示，可以看到每个object所属的pg对应4个osd，其中两个保存数据块，另外两个保存编码块，正好是K+M

PG与PGP

PG表示归置组，PGP表示归置组的组合，pgp相当于pg对应osd的逻辑排列组合关系（不同的pg使用不同组合关系的osd）

例如创建存储池时设置PG=32 PGP=32，那么：存储池中有32个pg，pg会写入到有32中组合关系（pgp）的osd上。如下图：

PG是用于跨osd将数据存储在每个存储池中的内部数据结构。它在osd和客户端之前生成了一个逻辑中间层，CRUSH算法负责将每个对象动态映射至一个PG，然后再将每个PG映射至一组osd，从而能够支持在新的osd设备上线时进行数据重新均衡。

可以自定义存储池中PG的数量。

ceph处于规模性伸缩及性能方面的考虑，将存储池分为多个PG，把对象映射到PG上，并为PG分配一个主osd。

存储池由一系列PG组成，而CRUSH算法则根据集群运行图和集群状态，将PG均匀的、伪随机（基于hash映射，每次的计算结果都一样）的分布到集群的osd之上。

如果单个OSD失败或需要对集群进行重新平衡，ceph只需要移动或复制PG即可，而不需要单独对每个对象进行操作。

为什么不直接将对象映射到osd，而是添加一个中间层PG？假设将object直接映射到osd，那么在osd出现故障后，需要对osd上的每个对象都重新计算存储位置，这会大量占用计算资源

PG数量计算

PG的数量是由管理员在创建存储池时指定的，然后由CRUSH负责创建和使用，PGd的梳理为2的N次方，每个osd上的PG不要超过250个，官方建议是每个osd上50-100个PG左右：https://docs.ceph.com/en/quincy/rados/operations/placement-groups/#choosing-the-number-of-placement-groups

通常，PG的数量应该是数据的合理粒度的子集。例如一个包含256个PG的存储池，每个PG包含大约1/256的存储池数据

当需要将PG从一个OSD移动到另一个OSD的时候，PG的数量会对性能产生影响。如果PG过少，每个PG承载的数据就会变多，那么ceph同步数据的时候产生的网络负载就会对集群性能输出产生一定影响。如果PG过多，ceph将会占用较多的计算资源来记录PG的状态信息。

在所有OSD之间进行数据持久存储以及完成数据分布会需要较多的归置组，但是它们的数量应该减少到实现ceph最大性能所需的最小PG数量值，以节省cpu和内存资源。

一般来说，对于有着超过50个OSD的集群，建议每个osd大约有50-100个PG以平衡资源使用及取得更好的数据持久性和数据分布，而在更大的集群上，每个OSD可以有100-200个PG。

集群中总的PG数量可以通过下面的公式进行计算，将得到的值四舍五入取最近的2的N次幂。

osd总数 ✖ 每个osd的PG数 ➗ 副本数量 => PG总数
例如：
集群有100个osd，每个osd计划承载100个PG，使用3副本，那么总的PG数量就等于
100 * 100 / 3 = 3333 ->向上取2的整次幂 = 4096

至于每个pool应该使用多少PG，应该根据pool所存储的数据占集群存储空间的比例来设置。

另外目前ceph支持根据存储池数据量自动调整存储池PG数量，可以参考官方文档进行设置：https://docs.ceph.com/en/quincy/rados/operations/placement-groups/#pg-autoscaler

PG常见状态

PG的常见状态如下：

Peering

正在同步状态，同一个PG中的osd需要将数据同步一致，而Peering就是osd同步过程中的状态
Activating

Peering已经完成，PG正在等待所有PG实例Peering的结果
Clean

干净态，PG当前不存在修复的对象，并且大小等于存储池的副本数，即PG的活动集（Acting Set）和上行集（Up Set）为同一组OSD且内容一致

什么是上行集和活动集？在某一个osd故障后，需要将故障的osd更换为可用的osd，并将PG所对应的主osd上的数据同步到新的osd上，例如刚开始pg对应osd1、osd2和osd3，当osd3故障后需要用osd4替换osd3，那么osd1、osd2、osd3就是上行集，替换后osd1、osd2、osd4就是活动集，osd替换完成后活动集最终要替换上行集，即活动集和上行集要保持一致
Active

就绪状态，Active表示主osd和备osd均处于正常状态，此时PG可以处理来自客户端的读写请求，正常的PG默认就是Active+Clean状态
Degraded

降级状态，一般出现于osd被标记为down之后，映射到此osd的PG都会转到降级状态。

如果此osd还能重新启动完成并完成Peering操作后，那么此osd上的PG会恢复为clean状态。

如果此osd被标记为down的时间超过5分钟还没恢复，那么此osd会被ceph标记为out，然后ceph会对被降级的PG启动恢复操作，直到因此osd故障而被降级的PG重新恢复为clean状态。

恢复数据会从PG所属的主osd恢复，如果是主osd故障，那么会在备用的osd中选择一个作为主osd。
Stable

过期状态，正常情况下每个主osd都要周期性的向mon报告其所持有PG的最新统计数据，因任何原因导致某个OSD无法正常向mon发送汇报信息的、或者由其它osd报告某个osd已经down的时候，则所有以此osd为主osd的PG会被标记为stable状态，即它们的主osd持有的已经不是最新数据了
undersized

PG当前副本数小于其存储池定义的值时，PG会转换为undersized状态
Scrubing

scrub是ceph对数据的清洗状态，用来保证数据完整性的机制，ceph的osd定期启动scrub线程来扫描部分PG，通过与其它副本比对来发现是否一致，如果存在不一致，抛出异常提示用户手动解决，scrub以PG为单位，对于每一个PG，ceph分析该PG中的所有object，产生一个类似于元数据信息摘要的数据结构，如对象大小、属性等，叫scrubmap，通过比较不同副本的scrubmap，来保证是不是有object丢失或不匹配，扫描分为轻量级扫描（light scrubs）和深度扫描（deep scrubs）。

轻量级扫描比较object-size和属性，深度扫描读取数据部分，并通过checksum算法对比数据的一致性，深度扫描过程中的PG会处于scrubing+deep状态
Recovering

正在恢复状态，集群正在执行迁移或同步PG它们的副本，这可能是由于添加了一个新的OSD到集群中或者某个osd故障后，PG可能被CRUSH算法重新分配到不同的osd上，而由于osd更换导致PG发生内部数据同步的过程中的PG会标记为Recovering
Backfilling

正在后台填充态，backfill是recovery的一种特殊场景，指peering完成后，如果基于当前权威日志无法对Up Set当中的某些PG实施增量同步（例如承载这些PG实例的osd离线太久，或者是新的osd加入集群导致的PG实例整体迁移）则通过完全拷贝当前主osd上PG对象的方式进行全量同步，此过程中的PG会处于backfilling
Backfill-toofull

某个需要被Backfill的PG实例，其所在的OSD可用空间不足，Backfill流程被挂起时的PG状态

存储池管理

创建存储池

ceph osd pool create  pg-num pgp-num {replicated|erasure}
例如：
ceph osd pool create test-pool2 16 16 	#默认是副本池

查看存储池

ceph osd pool ls	#列出所有pool
ceph osd lspools	#列出所有pool，返回信息带pool ID
ceph osd pool stats 	#查看指定pool的信息

删除存储池

删除存储池会把存储池内的数据全部删除，为了防止误删除操作，ceph设置了两个机制来防止误删除：

第一个是存储池的NODELETE标志
第二个是集群范围配置参数mon allow pool delete，即mon不允许删除存储池

首先设置pool的nodelete标志为false，false表示可以删除，true表示不能删除，不过默认就是false

ceph osd pool set test-pool2 nodelete false
ceph osd pool get test-pool2 nodelete

然后，通过ceph tell命令临时设置mon allow pool delete的参数为true，在删除指定的pool后再改为false

ceph tell mon.* injectargs --mon-allow-pool-delete=true

删除存储池

ceph osd pool rm <pool-name> <pool-name> --yes-i-really-really-mean-it	#pool名字要重复两次
例如：
ceph osd pool rm test-pool2 test-pool2 --yes-i-really-really-mean-it

最后将mon allow pool delete重置为false

ceph tell mon.* injectargs --mon-allow-pool-delete=false

存储池配额

存储池可以从两个方面设置配额，一个是配置最大可用空间（max_bytes），另一个是配置最大可写入对象数量（max_objects）

ceph osd pool get-quota mypool	#查看mypool的配额
ceph osd pool set-quota mypool max_bytes 53529804800	#设置mypool最多可用50G空间
ceph osd pool set-quota mypool max_objects 1000	#设置mypool最多可以存储1000个object

存储池可用参数

一般都是通过ceph osd pool get 获取存储池某个参数的值，通过ceph osd pool set 修改参数的值

常用的存储池参数如下：

size，存储池中pg的副本数量，默认是3

min_size，最小可用副本数，例如size为3，min_size为2，表示最少要有两个副本存在，PG才能对外提供读写

pg_num/pgp_num，pg数量和pgp数量

crush_rule，设置crush算法规则，默认为副本池

nodelete，控制是否可以删除，默认fasle，表示可以删除

nopgchange，控制是否可以更改存储池的pg_num和pgp_num

nosizechange，控制是否可以修改存储池的副本数，默认允许修改

noscrube，控制是否开启轻量级扫描，默认开启轻量级扫描

nodeep-scrub，控制是否开启深度扫描，默认开启深度扫描

scrub_min_interval，设置执行轻度扫描的最小时间间隔，默认未设置，可以通过配置文件中osd_min_scrub_interval参数指定

scrub_max_interval，设置执行轻度扫描的最大时间间隔，默认未设置，可以通过配置文件中osd_max_scrub_interval参数指定

dee_scrub_interval，设置执行深度扫描的时间间隔，默认未设置，可以通过配置文件中osd_deep_scrub_interval参数指定

其它参数可以通过help信息获取：

存储池快照

快照用于对存储池中的数据进行备份和还原，创建快照需要的时间和占用的存储空间取决于存储池中数据的大小。

创建快照

ceph osd pool mksnap  mypool mypool-snap1
或者
rados -p mypool mksnap mypool-snap2

查看快照

rados lssnap -p mypool

恢复快照

#先上传一个测试对象到mypool
rados put testfile /var/log/syslog -p mypool
#创建快照
rados mksnap mypool-snap3 -p mypool
#删除上传的测试对象，然后get测试对象验证是否已被删除
rados rm testfile -p mypool
rados get testfile ./a.log -p mypool
#通过快照恢复测试对象
rados rollback -p mypool testfile mypool-snap3
#再次get测试对象验证是否恢复
rados get testfile ./a.log -p mypool

删除快照

ceph osd pool rmsnap mypool mypool-snap3
或者
rados rmsnap mypool-snap2 -p mypool

你可能感兴趣的:(ceph,ceph)

Ceph存储阈值调整：优化nearfull_ratio参数 mixboot Ceph ceph
Ceph存储阈值调整：优化nearfull_ratio参数前言在Ceph存储系统的管理中，合理设置存储阈值参数对于确保系统稳定运行至关重要。如何调整nearfull_ratio参数，以及这一参数对Ceph集群的影响。Ceph存储阈值概述Ceph存储系统主要有三个与容量相关的重要阈值参数：近满阈值(nearfull_ratio)：默认为0.85或85%，当集群使用空间达到此比例时，Ceph会发出警告
Ceph OSD.419 故障分析
CephOSD.419故障分析1.问题描述在Ceph存储集群中，OSD.419无法正常启动，系统日志显示服务反复重启失败。2.初始状态分析观察到OSD.419服务启动失败的系统状态：systemctlstatusceph-osd@419●[email protected]:loaded(/usr/lib/systemd
【ceph】坏盘更换，osd的具体操作向往风的男子 ceph ceph
本站以分享各种运维经验和运维所需要的技能为主《python零基础入门》：python零基础入门学习《python运维脚本》：python运维脚本实践《shell》：shell学习《terraform》持续更新中：terraform_Aws学习零基础入门到最佳实战《k8》暂未更新《docker学习》暂未更新《ceph学习》ceph日常问题解决分享《日志收集》ELK+各种中间件《运维日常》运维日常《l
ceph报错整理时空无限 Kubernetes ceph linux 运维 kubernetes
xxdaemonshaverecentlycrashedceph-scluster:id:d82dfc33-6a35-4fa4-b5f0-c32979b714cdhealth:HEALTH_WARN74daemonshaverecentlycrashedcephcrashlsIDENTITYNEW2024-07-26T06:17:34.480675Z_bd4c30b7-2347-4307-a9e6
使用ceph-ansible部署分布式存储Ceph-octopus版本降世神童云计算技术专栏分布式 ceph ansible
使用ceph-ansible部署分布式存储Ceph-octopus版本1.Ceph基础概念及部署方式1.1.Ceph基本概念1.2.Ceph部署方式2.系统初始化配置3.Ceph集群部署3.1.Ansible安装与配置3.2.ceph-ansible安装与配置3.2.1.下载ceph-ansible3.2.2.安装ceph-ansible依赖3.2.3.修改ceph配置文件3.3.开始部署ceph
2024年运维最新分布式存储ceph osd 常用操作_ceph查看osd对应硬盘(1)，2024年最新Linux运维编程基础教程 2401_83944328 程序员运维分布式 ceph
最全的Linux教程，Linux从入门到精通======================linux从入门到精通(第2版)Linux系统移植Linux驱动开发入门与实战LINUX系统移植第2版Linux开源网络全栈详解从DPDK到OpenFlow第一份《Linux从入门到精通》466页====================内容简介====本书是获得了很多读者好评的Linux经典畅销书**《Linu
【ceph】ceph集群更换osd时，找不到坏盘位置，怎么查找坏盘对应的序列号---业内称“点灯”
本站以分享各种运维经验和运维所需要的技能为主《python零基础入门》：python零基础入门学习《python运维脚本》：python运维脚本实践《shell》：shell学习《terraform》持续更新中：terraform_Aws学习零基础入门到最佳实战《k8》从问题中去学习k8s《docker学习》暂未更新《ceph学习》ceph日常问题解决分享《日志收集》ELK+各种中间件《运维日常》
Ceph集群管理实战 wespten OpenStack vSphere 虚拟化云平台 SDN 数据库存储块存储文件存储对象存储分布式网络存储 linux 运维服务器
配置完Ceph集群后，我们即可对Ceph集群进行数据存储。在后续使用过程中，Ceph提供了常用的命令对Ceph集群进行必要的运维。常见的集群状态查看、磁盘使用率查看、添加磁盘、删除坏盘等操作。详情可参考：WelcometoCeph—CephDocumentation1、Ceph的常用命令本节给出的Ceph常用命令可以作为最基本的集群运维命令。1）查看集群状态命令。[root@installer~]
深度剖析：Ceph分布式存储系统架构 TechVision大咖圈 ceph 分布式架构分布式存储
一文带你彻底搞懂Ceph的架构奥秘，从小白到架构师的进阶之路！文章目录1.Ceph简介：存储界的"多面手"什么是Ceph？为什么选择Ceph？2.核心组件架构：四大金刚的分工合作Monitor（MON）：集群的"大脑"ObjectStorageDevice（OSD）：数据的"家园"MetadataServer（MDS）：文件系统的"管家"Manager（MGR）：集群的"助手"3.三大存储接口：一
【无标题】 KellenKellenHao tomcat java
一、tomcat安装 #关闭防火墙与SELinux [root@proxy_host~]#rz rzwaitingtoreceive.**[root@proxy_host~]#ls anaconda-ks.cfg ceph-release-1-1.el7.noarch.rpm apache-tomcat-8.5.40.tar.gznginx-1.27.3.tar.gz #解压到指定路径
【mongodb】mongodb数据备份与恢复向往风的男子运维日常 DBA mongodb 数据库
本站以分享各种运维经验和运维所需要的技能为主《python零基础入门》：python零基础入门学习《python运维脚本》：python运维脚本实践《shell》：shell学习《terraform》持续更新中：terraform_Aws学习零基础入门到最佳实战《k8》暂未更新《docker学习》暂未更新《ceph学习》ceph日常问题解决分享《日志收集》ELK+各种中间件《运维日常》运维日常《l
rook-ceph配置dashboard代理无法访问
在ceph-tools的pod中看看dashboard是否开启kubectl-nrook-cephexec-itrook-ceph-tools-7b75b967db-jn68d–bashcephmgrservices查看集群内地址使用curl测试能否访问cephmgrmoduledisabledashboard关闭cephmgrmoduleenabledashboard开启rook中关于ceph部
速通Ceph分布式存储（含超详细图解）来自于狂人云计算
前言云计算存储架构图示例存储节点集群RAID控制层物理存储层分布式存储管理层存储接口层接入层OSD主机1OSD主机2OSD主机N磁盘1磁盘2磁盘3磁盘4磁盘5磁盘6RAID0/10/5RAID控制器1RAID0/10/5RAID控制器2RAID0/10/5RAID控制器NMonitor集群大脑OSD数据守护进程MDS元数据服务对象存储块存储文件存储对象网关RBDMDS客户端接入层存储接口层分布式存
使用kolla安装OPENSTACK qhqh310 openstack
安装centos7一、根据这个做一个模板1、编辑host文件10.103.129.146control-110.103.129.147node-110.103.129.148node-210.103.129.149network-110.103.129.150ceph-110.103.129.151ceph-210.103.129.152control-210.103.129.153network
ceph计算PG
计算公式：pg_num={(TargetPGsperOSD)x(OSD#)x(%Data)}/Size注释：TargetPGsperOSD：预估每个OSD的PG数，一般取100计算。当预估以后集群OSD数不会增加时，一般取100计算OSD#：集群OSD数量。%Data：预估该pool占该OSD集群总容量的近似百分比。Size：该pool的副本数。
分布式存储Ceph之PG状态详解 jiangxi_ ceph 运维 ceph pgp 分布式 linux
1.PG介绍一，PG的复杂如下：在架构层次上，PG位于RADOS层的中间。a.往上负责接收和处理来自客户端的请求。b.往下负责将这些数据请求翻译为能够被本地对象存储所能理解的事务。是组成存储池的基本单位，存储池中的很多特性，都是直接依托于PG实现的。面向容灾域的备份策略使得一般而言的PG需要执行跨节点的分布式写，因此数据在不同节点之间的同步、恢复时的数据修复也都是依赖PG完成。2.PG状态表正常的
ceph创建pool时pg_num的配置 lvbibir 数据库
pg_num用此命令创建存储池时：cephosdpoolcreate{pool-name}pg_num确定pg_num取值是强制性的，因为不能自动计算。常用的较为通用的取值：少于5个osd，pg_num设置为128osd数量在5到10个时，pg_num设置为512osd数量在10到50个时，pg_num=4096osd数量大于50是，需要理解ceph的权衡算法，自己计算pg_num取值自行计算pg
ceph 通过 crush rule 修改故障域时空无限 ceph ceph
创建故障域为osd的crushrulecephosdcrushrulecreate-replicatedreplicated_osd_leveldefaultosd设置pool使用新创建的crushrulecephosdpoolsetceph-filesystem-data0crush_rulereplicated_osd_level查看有哪些crushrulecephosdcrushruleli
Rsync实操 KellenKellenHao excel
Rsync实操一.rsync命令 #类似于cp [root@user2~]#[email protected]:/root [email protected]'spassword: [root@user1~]#ls anaconda-ks.cfgceph-release-1-1.el7.noarch.rpminfo.sh二、使用rsync备份push方式服务器：
离线部署openstack 2024.1需求说明、初始化及实例创建过程分析查士丁尼·绵 openstack openstack
背景在ubuntu22.04离线部署openstack2024.1集群，外置存储为cephreef，提供：1、计算虚拟化；2、网络虚拟化，支持协议flat、vlan、vxlan；3、存储对接ceph；4、webUI；5、management网络为bond0，对应vlan10；6、self-service网络为bond0，对应vlan15；7、external网络对应bond1，对应vlan20、2
安装ceph时,出现Some monitors have still not reached quorum
现象：安装ceph时，在获取节点的证书时，也即下面这条语句时遇到问题ceph-deployadminceph1ceph2ceph3报错如下：[ceph3][INFO]Runningcommand:sudoceph--cluster=ceph--admin-daemon/var/run/ceph/ceph-mon.ceph3.asokmon_status[ceph3][ERROR]admin_soc
OpenStack私有云实战答案：Heat编排+KVM优化+Ceph存储对接与排障全解行家说竞赛 #云计算应用赛项 openstack ceph
【题目1】1.2.1Heat编排-创建用户[1分]编写Heat模板create_user.yaml，创建名为heat-user的用户。使用自己搭建的OpenStack私有云平台，使用heat编写摸板(heat_template_version:2016-04-08)创建名为”chinaskills”的domain，在此domain下创建名为beijing_group的租户，在此租户下创建名为clo
【k8s安装redis】k8s环境无pvc的情况下安装redis哨兵集群汪碧康 kubernetes docker redis kubernetes redis docker 容器哨兵 pvc
文章目录简介一.条件及环境说明：二.需求说明：三.实现原理及说明四.详细步骤4.1.规划节点标签4.2.创建configmap配置4.3.创建三个statefulset和serviceheadless配置4.4.创建哨兵deployment配置和service配置五.安装说明简介k8s集群中搭建有状态的服务会相对较麻烦，像搭建redis目前比较主流的做法主要是采用共享存储ceph、nas来实现数据
springboot2.6+awssdk2访问ceph bucket
版本信息：SpringBoot2.6.6awssdk2.17.100Ceph：Quincyv17.2.01、添加cephmaven依赖：父pom文件：。。。。。。2.17.100。。。。。。software.amazon.awssdkbom${awssdk.version}pomimport子pom文件：
【SCI论文写作】机器学习与时间序列医疗健康预测——（EEG）的获取与预处理：Python 实现 LIUDAN'S WORLD 医学 AI python 人工智能前端
当前时间：2025-05-29脑电图（Electroencephalography,EEG）作为一种非侵入性的神经生理监测技术，在医疗健康领域，尤其是在神经科学研究、疾病诊断（如癫痫、睡眠障碍）、脑机接口（BCI）等方面扮演着至关重要的角色。原始EEG信号通常包含复杂的生理信息，但也极易受到各种噪声和伪迹的污染，这为后续的数据分析和解读带来了巨大挑战。因此，对EEG数据进行系统有效的预处理是确保分
ES将快照仓库创建到ceph Nobe_yt es6 elasticsearch
这是在ES6.8.7环境进行的，测试7.6.2也是可以的。注意：所有的ES节点都需要安装对应版本的repository-s3插件。步骤一：提前准备好对象存储，和bukect"access_key":"xxxxxx""secret_key":"xxxxxx""bucket"："xxxxxx"步骤二：设置访问s3账号密码,根据步骤一中准备好的bukect的access_key,secret_key。#
Ceph---ceph 12.2.12 full ratio(s) out of order yysalad ceph
实际使用ceph12.2.12的过程中遇到fullratio(s)outoforder原因：osd_failsafe_full_ratio小于full_ratio解决方法：设置full_ratio小于等于osd_failsafe_full_ratiocephosdset-full-ratio0.97
ceph recovery 相关参数时空无限 ceph ceph
RECOVERY恢复/回填选项修改mClock最大回填/恢复限制的步骤可以修改的最大回填/恢复选项列在“恢复/回填选项”部分。mClock的修改默认回填/恢复限制由osd_mclock_override_recovery_settings选项，设置为默认为false。尝试修改任何默认恢复/回填限制而不设置门控选项，会将该选项重置为mClock默认值，并在集群日志中记录一条警告消息。请注意，默认值可
ceph性能调优时空无限 ceph ceph
硬件方面CPUceph的进程对cpu的依赖强弱MDS>OSD>MON一个MDS进程给4核cpu一个OSD进程给2核cpu一个MON进程给1核cpu内存ceph的进程对cpu的依赖强弱MON>OSD一个MON进程给2G内存一个OSD进程给1G内存（osd使用一个物理磁盘）如果使用多个物理磁盘作为一个OSD，每个OSD进程就需要分配大于1G的内存，另外集群处于recovery状态时，内存消耗会明显增加
017 Ceph的集群管理_3 weixin_30614587 shell 开发工具运维
一、验证OSD1.1osd状态运行状态有：up，in，out，down正常状态的OSD为up且in当OSD故障时，守护进程offline，在5分钟内，集群仍会将其标记为up和in，这是为了防止网络抖动如果5分钟内仍未恢复，则会标记为down和out。此时该OSD上的PG开始迁移。这个5分钟的时间间隔可以通过mon_osd_down_out_interval配置项修改当故障的OSD重新上线以后，会触
web前段跨域nginx代理配置刘正强 nginx cms Web
nginx代理配置可参考server部分 server { listen 80; server_name localhost;
spring学习笔记 caoyong spring
一、概述 a>、核心技术 : IOC与AOP b>、开发为什么需要面向接口而不是实现接口降低一个组件与整个系统的藕合程度，当该组件不满足系统需求时，可以很容易的将该组件从系统中替换掉，而不会对整个系统产生大的影响 c>、面向接口编口编程的难点在于如何对接口进行初始化,(使用工厂设计模式)
Eclipse打开workspace提示工作空间不可用 0624chenhong eclipse
做项目的时候，难免会用到整个团队的代码，或者上一任同事创建的workspace， 1.电脑切换账号后，Eclipse打开时，会提示Eclipse对应的目录锁定，无法访问，根据提示，找到对应目录，G:\eclipse\configuration\org.eclipse.osgi\.manager，其中文件.fileTableLock提示被锁定。解决办法，删掉.fileTableLock文件，重
Javascript 面向对面写法的必要性？一炮送你回车库 JavaScript
现在Javascript面向对象的方式来写页面很流行，什么纯javascript的mvc框架都出来了：ember 这是javascript层的mvc框架哦,不是j2ee的mvc框架我想说的是，javascript本来就不是一门面向对象的语言，用它写出来的面向对象的程序，本身就有些别扭，很多人提到js的面向对象首先提的是：复用性。那么我请问你写的js里有多少是可以复用的，用fu
js array对象的迭代方法换个号韩国红果果 array
1.forEach 该方法接受一个函数作为参数，对数组中的每个元素使用该函数 return 语句失效 function square(num) { print(num, num * num); } var nums = [1,2,3,4,5,6,7,8,9,10]; nums.forEach(square); 2.every 该方法接受一个返回值为布尔类型
对Hibernate缓存机制的理解归来朝歌 session 一级缓存对象持久化
在hibernate中session一级缓存机制中，有这么一种情况：问题描述：我需要new一个对象，对它的几个字段赋值，但是有一些属性并没有进行赋值，然后调用 session.save()方法，在提交事务后，会出现这样的情况： 1：在数据库中有默认属性的字段的值为空 2：既然是持久化对象，为什么在最后对象拿不到默认属性的值？通过调试后解决方案如下：对于问题一，如你在数据库里设置了
WebService调用错误合集 darkranger webservice
Java.Lang.NoClassDefFoundError: Org/Apache/Commons/Discovery/Tools/DiscoverSingleton 调用接口出错，一个简单的WebService import org.apache.axis.client.Call;import org.apache.axis.client.Service; 首先必不可
JSP和Servlet的中文乱码处理 aijuans Java Web
JSP和Servlet的中文乱码处理前几天学习了JSP和Servlet中有关中文乱码的一些问题，写成了博客，今天进行更新一下。应该是可以解决日常的乱码问题了。现在作以下总结希望对需要的人有所帮助。我也是刚学，所以有不足之处希望谅解。一、表单提交时出现乱码：在进行表单提交的时候，经常提交一些中文，自然就避免不了出现中文乱码的情况，对于表单来说有两种提交方式：get和post提交方式。所以
面试经典六问 atongyeye 工作面试
题记：因为我不善沟通，所以在面试中经常碰壁，看了网上太多面试宝典，基本上不太靠谱。只好自己总结，并试着根据最近工作情况完成个人答案。以备不时之需。以下是人事了解应聘者情况的最典型的六个问题： 1 简单自我介绍关于这个问题，主要为了弄清两件事，一是了解应聘者的背景，二是应聘者将这些背景信息组织成合适语言的能力。我的回答：(针对技术面试回答，如果是人事面试，可以就掌
contentResolver.query()参数详解百合不是茶 android query()详解
收藏csdn的博客,介绍的比较详细,新手值得一看 1.获取联系人姓名一个简单的例子，这个函数获取设备上所有的联系人ID和联系人NAME。 [java] view plain copy public void fetchAllContacts() {
ora-00054:resource busy and acquire with nowait specified解决方法 bijian1013 oracle 数据库 kill nowait
当某个数据库用户在数据库中插入、更新、删除一个表的数据，或者增加一个表的主键时或者表的索引时，常常会出现ora-00054:resource busy and acquire with nowait specified这样的错误。主要是因为有事务正在执行（或者事务已经被锁），所有导致执行不成功。 1.下面的语句
web 开发乱码征客丶 spring Web
以下前端都是 utf-8 字符集编码一、后台接收 1.1、 get 请求乱码 get 请求中，请求参数在请求头中；乱码解决方法： a、通过在web 服务器中配置编码格式：tomcat 中，在 Connector 中添加URIEncoding="UTF-8"； 1.2、post 请求乱码 post 请求中，请求参数分两部份， 1.2.1、url？参数，
【Spark十六】： Spark SQL第二部分数据源和注册表的几种方式 bit1129 spark
Spark SQL数据源和表的Schema case class apply schema parquet json JSON数据源准备源数据 {"name":"Jack", "age": 12, "addr":{"city":"beijing&
JVM学习之:调优总结 -Xms -Xmx -Xmn -Xss BlueSkator -Xss -Xmn -Xms -Xmx
堆大小设置JVM 中最大堆大小有三方面限制：相关操作系统的数据模型（32-bt还是64-bit）限制；系统的可用虚拟内存限制；系统的可用物理内存限制。32位系统下，一般限制在1.5G~2G；64为操作系统对内存无限制。我在Windows Server 2003 系统，3.5G物理内存，JDK5.0下测试，最大可设置为1478m。典型设置： java -Xmx355
jqGrid 各种参数详解(转帖) BreakingBad jqGrid
jqGrid 各种参数详解分类：源代码分享个人随笔请勿参考解决开发问题 2012-05-09 20:29 84282人阅读评论(22) 收藏举报 jquery 服务器 parameters function ajax string
读《研磨设计模式》-代码笔记-代理模式-Proxy bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.lang.reflect.InvocationHandler; import java.lang.reflect.Method; import java.lang.reflect.Proxy; /* * 下面
应用升级iOS8中遇到的一些问题 chenhbc ios8 升级iOS8
1、很奇怪的问题，登录界面，有一个判断，如果不存在某个值，则跳转到设置界面，ios8之前的系统都可以正常跳转，iOS8中代码已经执行到下一个界面了，但界面并没有跳转过去，而且这个值如果设置过的话，也是可以正常跳转过去的，这个问题纠结了两天多，之前的判断我是在 -(void)viewWillAppear:(BOOL)animated 中写的，最终的解决办法是把判断写在 -(void
工作流与自组织的关系？ comsci 设计模式工作
目前的工作流系统中的节点及其相互之间的连接是事先根据管理的实际需要而绘制好的，这种固定的模式在实际的运用中会受到很多限制，特别是节点之间的依存关系是固定的，节点的处理不考虑到流程整体的运行情况，细节和整体间的关系是脱节的，那么我们提出一个新的观点，一个流程是否可以通过节点的自组织运动来自动生成呢？这种流程有什么实际意义呢？这里有篇论文，摘要是：“针对网格中的服务
Oracle11.2新特性之INSERT提示IGNORE_ROW_ON_DUPKEY_INDEX daizj oracle
insert提示IGNORE_ROW_ON_DUPKEY_INDEX 转自：http://space.itpub.net/18922393/viewspace-752123 在 insert into tablea ...select * from tableb中，如果存在唯一约束，会导致整个insert操作失败。使用IGNORE_ROW_ON_DUPKEY_INDEX提示，会忽略唯一
二叉树:堆 dieslrae 二叉树
这里说的堆其实是一个完全二叉树,每个节点都不小于自己的子节点,不要跟jvm的堆搞混了.由于是完全二叉树,可以用数组来构建.用数组构建树的规则很简单: 一个节点的父节点下标为: (当前下标 - 1)/2 一个节点的左节点下标为: 当前下标 * 2 + 1 &
C语言学习八结构体 dcj3sjt126com c
为什么需要结构体，看代码 # include <stdio.h> struct Student //定义一个学生类型，里面有age, score, sex, 然后可以定义这个类型的变量 { int age; float score; char sex; } int main(void) { struct Student st = {80, 66.6,
centos安装golang dcj3sjt126com centos
#在国内镜像下载二进制包 wget -c http://www.golangtc.com/static/go/go1.4.1.linux-amd64.tar.gz tar -C /usr/local -xzf go1.4.1.linux-amd64.tar.gz #把golang的bin目录加入全局环境变量 cat >>/etc/profile<
10.性能优化-监控-MySQL慢查询 frank1234 性能优化 MySQL慢查询
1.记录慢查询配置 show variables where variable_name like 'slow%' ; --查看默认日志路径查询结果：--不用的机器可能不同 slow_query_log_file=/var/lib/mysql/centos-slow.log 修改mysqld配置文件：/usr /my.cnf[一般在/etc/my.cnf，本机在/user/my.cn
Java父类取得子类类名 happyqing java this 父类子类类名
在继承关系中，不管父类还是子类，这些类里面的this都代表了最终new出来的那个类的实例对象，所以在父类中你可以用this获取到子类的信息！ package com.urthinker.module.test; import org.junit.Test; abstract class BaseDao<T> { public void
Spring3.2新注解@ControllerAdvice jinnianshilongnian @Controller
@ControllerAdvice，是spring3.2提供的新注解，从名字上可以看出大体意思是控制器增强。让我们先看看@ControllerAdvice的实现： @Target(ElementType.TYPE) @Retention(RetentionPolicy.RUNTIME) @Documented @Component public @interface Co
Java spring mvc多数据源配置 liuxihope spring
转自：http://www.itpub.net/thread-1906608-1-1.html 1、首先配置两个数据库 <bean id="dataSourceA" class="org.apache.commons.dbcp.BasicDataSource" destroy-method="close&quo
第12章 Ajax（下） onestopweb Ajax
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
BW / Universe Mappings blueoxygen BO
BW Element OLAP Universe Element Cube Dimension Class Charateristic A class with dimension and detail objects (Detail objects for key and desription) Hi
Java开发熟手该当心的11个错误 tomcat_oracle java 多线程工作单元测试
#1、不在属性文件或XML文件中外化配置属性。比如，没有把批处理使用的线程数设置成可在属性文件中配置。你的批处理程序无论在DEV环境中，还是UAT（用户验收测试）环境中，都可以顺畅无阻地运行，但是一旦部署在PROD 上，把它作为多线程程序处理更大的数据集时，就会抛出IOException，原因可能是JDBC驱动版本不同，也可能是#2中讨论的问题。如果线程数目可以在属性文件中配置，那么使它成为
推行国产操作系统的优劣 yananay windows linux 国产操作系统
最近刮起了一股风，就是去“国外货”。从应用程序开始，到基础的系统，数据库，现在已经刮到操作系统了。原因就是“棱镜计划”，使我们终于认识到了国外货的危害，开始重视起了信息安全。操作系统是计算机的灵魂。既然是灵魂，为了信息安全，那我们就自然要使用和推行国货。可是，一味地推行，是否就一定正确呢？先说说信息安全。其实从很早以来大家就在讨论信息安全。很多年以前，就据传某世界级的网络设备制造商生产的交