王哞哞哞哞

ceph的体系结构

文章目录

Ceph
- Ceph的体系结构
- - 对象存储
  - RADOS
  - OSD
  - - OSD的状态
    - osd状态检测
  - 数据寻址
  - - file--->Object映射
    - Object--->pg映射
    - pg--->osd
    - 思考：为什么要在Object和osd之间增加一层pg的映射呢？
  - 存储池
  - monitor
  - - monitor与客户端的通信
    - Monitor与osd的通信
  - 数据操作流程
  - 块存储
补图： Ceph集群中完整的数据写入流程
补图： Ceph集群中元数据服务器的作用
补图：Ceph中pool、pg和osd的关系

Ceph

Ceph的官方定义是：ceph是一种为优秀的性能、可靠性和可扩展性而设计的统一的、分布式的存储系统。

统一的：意味着ceph可以使用一套存储系统同时提供对象存储、块存储和文件系统存储3种功能，以便在满足不同应用需求的前提下简化部署和运维的步骤。
分布式：意味着无中心结构，系统规模的扩展可以没有理论上限。

Ceph的体系结构

作为一个存储系统，ceph在物理上必然包含一个存储集群，以及访问这个存储集群的应用或客户端。ceph客户端又需要根据一定的协议与ceph集群进行交互。

（1）Ceph存储集群
Ceph基于可靠的、自动化的、分布式的对象存储（Reliable,Autonomous,Distributed Object Storage,RADOS）提供了一个可无限拓展的存储集群。RADOS，这一层本身就是一个对象存储系统，所有存储在ceph系统中的用户数据事实上都是由这一层来存储的。而ceph的高可靠、高可扩展、高性能、高自动化等也都是这一层提供的。

物理上，RADOS是由大量的存储设备节点组成，每个节点拥有自己的硬件资源（CPU、内存、硬盘、网络），并运行着操作系统和文件系统。

（2）基础库librados
Ceph客户端用一定的协议和存储集群进行交互，Ceph把此功能封装进了librados库，这样基于librados库就能创建自己的定制客户端了。

librados库实际上是对RADOS进行抽象和封装，并向上层提供API，以便可以基于rados（而不是这个ceph）进行应用研发。需要注意的是，RADOS是一个对象存储系统，因此，librados库实现的API也只是针对对象存储功能的。

rados采用C++开发，所提供的原生librados API包含C和C++两种。在物理上，librados和基于其上开发的应用位于同一台机器，因而，也被成为本地API。应用调用本机上的librados API，再向后者通过socket与RADOS集群中的节点通信并完成各种操作。

（3）高层应用接口RADOS GW、 RBD 、Ceph FS
这一层的作用是在librados库的基础上提供抽象层次更高、更便于应用或者客户端使用的上层接口。

ceph对象网关RADOS GW（RADOS Gateway）是一个构建在librados库之上的对象存储接口，为应用访问ceph集群提供了一个与Amazon S3和Swift兼容的RESTful风格的网关。

RBD则提供了一个标准的块设备接口，常用于在虚拟化的场景下为虚拟机创建存储卷。Red Hat已经将RBD驱动集成在KVM/QEMU中，以提高虚拟机的访问性能。

CephFS是一个可移植操作系统接口兼容的分布式存储系统，使用ceph存储集群来存储数据。

（4）应用层
这一层包含的是在不同场景下对应ceph各个高层应用接口的各种应用方式。例如，基于librados库直接开发的对象存储应用，基于RADOS GW开发的对象存储应用，基于RBD实现的云硬盘，等。

对象存储

严格意义上讲，ceph只提供对象存储接口，所谓的块存储接口和文件存储接口都算是对象存储接口应用程序。不同于传统文件系统提供的open/read/write/close/lseek，对象存储只提供pu/get/delete，对象存储的逻辑单元就是对象而不是通常概念中的文件。

RADOS GW是一个基于librados库构建的对象存储接口，为应用程序提供Ceph存储集群的RESTful网关，这样ceph就作为Amazon S3和OpenStack Swift的后端对象存储，应用程序可以直接通过librados的C语言或C++语言API实现对象操作了。

RADOS

RADOS集群主要由两种节点组成：为数众多的OSD，负责完成数据存储和维护；若干个Monitor，负责完成系统状态检测和维护。OSD和monitor之间互相传递节点的状态信息，共同得出系统的总体运行状态，并保存在全局数据结构中，即集群运行图（Cluster Map）中。 集群运行图与RADOS提供的特定算法相配合，实现了Ceph的许多优秀特性。

在使用RADOS系统时，客户端程序向monitor索取最新的集群运行图，然后直接在本地计算，得出对象的存储位置后，便直接与对应的osd进行通信，完成数据的各种操作。

ceph客户端、Monitor和OSD可以直接交互，这意味着OSD可以利用本地节点的CPU和内存执行那些传统集群架构中有可能拖垮中央服务器的任务，充分发挥节点上的计算能力。

OSD

OSD是用于实现数据的存储和维护。根据定义OSD可以被抽象为系统和守护进程两个部分.

在实际应用中,通常将多个OSD集中部署到一台大规模的服务器上。在选择系统配置时，应当保证每个OSD占有一定的计算能力、一定数量的内存和一块硬盘（通常情况下一个OSD对应一块硬盘）。同时，应当保证该服务器具有足够的网络带宽。

每个OSD拥有自己的一个OSD Daemon。这个Daemon负责完成OSD的所有逻辑功能，包括与monitor和其他OSD（实际为其他OSD的Daemon）通信，以维护和更新系统状态，与其他OSD共同完成数据的存储和维护操作，与客户端通信完成各种数据操作，等等。

RADOS集群从ceph客户端接收数据（可能是ceph块设备、ceph对象存储、ceph文件系统或者基于librados的自定义客户端），然后存储为对象。每个对象是文件系统中的一个文件，它们存储在OSD的存储设备上，由OSD Daemon处理存储设备上的读写操作。

OSD的状态

OSD的状态直接影响数据的重新分配，所以检测osd的状态是monitor的主要工作之一。

osd的状态由两个维度来表示：up或down（表示osd daemon与monitor是否连接正常）；out或in（osd上是否有pg）

因此，osd共有4种状态：

up & out：osd daemon与monitor通信正常，但是没有pg分配到该osd上。这种状态一般是osd daemon刚刚启动时。
up & in ： osd daemon正常的工作状态，有pg分配到osd上
down & in： osd daemon不能与monitor或者其他osd正常通信。可能是网络中断或者daemon进程异常退出。
down & out ： osd无法恢复，monitor将osd上的pg进行重新分配。

osd状态检测

ceph采用心跳机制，检测节点故障和网络故障。

osd之间的心跳包。 如果集群内所有osd都互相发送心跳包，则会对集群性能产生影响。因此，ceph选择peer osd之间发送心跳包。peer osd是指该osd上所有pg的副本所在的osd。 同时，由于ceph提供公共网络（osd和客户端通信）和集群网络（osd之间的通信），所以peer osd之间的心跳包也分为前端和后端，这样就可最大限度地监测osd及公共网路和集群网络的状态，及时上报monitor。同时，考虑到网络抖动原因，可以设置monitor在决定osd下线之前需要收到多少次报告。
osd和monitor之间的心跳包。可以认为是peer osd之间心跳包的补充。如果osd不能与其他osd交换心跳包，则必须与monitor按照一定频率进行通信，比如osd状态是up & out时就需要这种心跳包。

数据寻址

File：用户需要存储或访问的文件。对于一个基于ceph开发的对象存储应用来说，这个file就对应应用中的“对象”，也就是用户直接操作的对象。
Object：这里所说的Object是RADOS所看到的“对象”。Object的大小由RADOS限定，通常为4MB。当上层应用向RADOS存入尺寸很大的file时，需要将file切分成统一大小的一系列Object（最后一个Object大小可以不同）。
pg：pg的用途是对Object的存储进行组织和位置映射。具体来说，一个pg负责组织若干个Object，但一个Object只能映射到一个pg中【一对多】。同时，一个pg会被映射到n个osd上，而每个osd上会承载大量的pg【多对多】。在实践中，n至少为2，如果用于生产环境，则n至少为3。一个osd上的pg可达数百个。事实上。pg数量的设置关系到数据分布的均匀性问题。
osd：osd的数量事实上也关系到系统的数据分布均匀性，因此不应该太少。在实践中，至少也应是数百个的量级才有助于ceph发挥其应用的优势。

file—>Object映射

此次映射就是将用户要操作的file映射为RADOS能够处理的Object。本质上就是按照Object的最大尺寸对file进行切分，相当于磁盘阵列中的条带化过程。这种切分的好处有两个：1、让大小不限的file变成具有一致尺寸、能被RADOS高效管理的Object；2、让对单一file实施的串行处理变为对多个Object的并行处理。

上图中：ino表示待操作file的元数据，可理解为file的唯一ID
ono表示该file切分产生的某个Object的序号
oid表示ino后连接ono

Object—>pg映射

在file被映射为1个或多个Object之后，就需要将每个Object独立地映射到1个pg中去。其映射的计算公式如下：
hash(oid) & mask —> pgid
其中：hash表示静态哈希算法。如果pg的总数为m（m应为2的整数幂），则mask值为 m-1。 & 表示按位与操作。
通过上式计算，能从所有m个pg中近似均匀地随机选择1个pg。

pg—>osd

第3次映射就是将作为Object的逻辑组织单元的pg映射到数据的实际存储单元osd上。如上图所示，RADOS采用一个名为crush的算法，将pgid带入其中，就能得到一组共n个osd。生产环境下，n一般为3。这n个osd共同负责存储和维护一个pg中的所有Object。具体到每个osd，则由其上运行的OSD Daemon负责执行映射到本地的Object在本地文件系统中的存储、访问、元数据维护等操作。

crush算法并不是绝对不变的，而会受到其他因素的影响。影响因素主要有2个：

当前系统状态，即集群运行图。当系统中的osd状态、数量发生变化时，集群运行图也可能发生变化，这种变化会影响到pg到osd之间的映射关系。
存储策略配置，这里的策略主要和安全相关。利用策略配置，系统管理员可以指定承载同一个pg的3个osd分别位于数据中心的不同服务器或机架上，从而进一步改善存储的可靠性。

因此，当前系统状态和存储策略都不变时，pg和osd之间的映射关系才是固定不变的。实际应用中，存储策略一经配置通常不会改变。而设备损坏、存储集群规模扩大等都会导致集群运行图发生变化。但是，ceph本身提供了对这种变化的支持。因此，即使pg和osd之间的映射关系发生了变化，也不会对应用产生影响。事实上，ceph正是利用了crush算法的动态特性，可以将一个pg根据需要动态迁移不同的osd组合上，从而自动化地实现高可靠性、数据分布再平衡性等。

至此为止，ceph通过3次映射，完成了从file到Object、Object到pg、pg到osd的整个映射过程。整个过程没有任何的全局性查表操作需求。至于唯一的全局性数据结构：集群运行图，它的维护和操作都是轻量级的，不会对系统的可扩展性、性能等造成影响。

思考：为什么要在Object和osd之间增加一层pg的映射呢？

存储池

存储池是一个逻辑概念，是对存储对象的逻辑分区。Ceph安装后，会有一个默认的存储池，用户也可以自己创建新的存储池。一个存储池包含若干个pg及其所存储的若干个对象。

Ceph客户端从监视器获取一张集群运行图，并把对象写入存储池。存储池的大小或副本数、crush存储规则、和pg数量决定Ceph如何放置数据。

ceph osd pool create {pool-name} {pg-num} [{pgp-num}] [replicated] [crush-ruleset-name]
ceph osd pool create {pool-name} {pg-num} {pgp-num} erasure [erasure-code-profile] [crush-ruleset-name]

上述命令用于创建存储池。
可以看出存储池支持的内容如下：

设置数据存储的方法属于多副本模式还是纠删码模式。若是多副本模式，则可以设置副本的数量；如果是纠删码模式，则可以设置数据块和非数据块的数量（纠删码存储池把各对象存储为K+M个数据块，其中有K个数据块和M个编码块）。默认为多副本模式。如果副本数为3，则每个pg映射到3个OSD节点上。即每个映射到该pg的对象，其数据存储在对应的3个OSD节点上。
设置pg的数量。合理设置pg的数目，可以使资源得到较优的均衡
设置pgp的数量。通常与pg的数量保持一致。当需要增加pg的数量时，用户数据不会发生迁移。只有进一步增加pgp的数量时，用户数据才会发生迁移。
针对不同的存储池设置不同的crush存储规则。比如可以创建规则，指定在选择osd时，选择拥有固态硬盘的osd节点。
提供针对存储池的功能，比如存储池快照等
设置对象的所有者或访问权限。

monitor

Ceph客户端读或写数据之前必须先连接到某个Ceph monitor上，获取最新的集群运行图副本。
一个Ceph集群只需要单个监视器monitor即可运行，但它就成了单一故障点，即如果该monitor宕机，Ceph客户端就不能读或写数据了。为增强其可靠性和容错性，Ceph支持monitor集群。在一个monitor集群内，延时及其他错误会导致一到多个monitor滞后于集群的当前状态。因此，Ceph的各监视器例程必须与集群的当前状态达成一致。

由若干个monitor组成的监视器集群共同负责整个Ceph集群中所有osd状态的发现和记录，并且形成集群运行图的主副本，包括集群成员、状态、变更，以及Ceph存储集群的整体健康状况。随后，这份集群运行图被扩散至全体osd及客户端。osd使用集群运行图进行数据维护，而客户端使用集群运行图进行数据寻址。

在集群中，各个monitor的功能总体上是一样的，其之间的关系可以被简单理解为主从备份关系。monitor并不主动轮询各个osd的当前状态。正相反，osd需要向monitor上报状态信息。常见的两种上报情况：一是新的osd被加入集群，二是某个osd发现自身或其他osd发现异常。在收到这些上报消息后，monitor将更新集群运行图的信息并加以扩散。

集群运行图实际上是多个map的统称，包括monitor map、osdmap、pgmap、Crushmap以及mdsmap等。各运行图维护着各自运行状态的变更。其中Crushmap用于定义如何选择osd，内容包含了存储设备列表、故障域树结构（设备的分组信息，如设备、主机、机架、房间等）和存储数据时如何利用此树状结构的规则。

monitor与客户端的通信

客户端包括RBD客户端、RADOS客户端、Ceph FS客户端/MDS。根据通信内容分为获取OSDMap和命令行操作。
（命令行操作）
主要包括集群操作命令：OSD、Monitor、MDS的添加和删除、存储池的创建和删除等
集群信息查询命令：集群状态、空间利用率、IOps和带宽等
这些命令都是由Monitor直接执行或者通过Monitor转发到osd上执行的。

（获取OSDMap）
客户端与RADOS的读或写操作不需要Monitor的干预。客户端通过哈希算法得到Object所在的pg信息，然后查询OSDMap就可以知道pg的分布信息，就可以与primary osd进行通信了。因此，客户端与Monitor仅仅是当获取最新OSDMap时才会进行通信。

Monitor与osd的通信

Monitor需要知道osd的状态，并根据最新的状态生成最新的OSDMap。所以osd需要将osd的down状态报告给Monitor。
osd与monitor之间存在心跳机制，通过这种方式来判断osd的状态。
osd定时将pg信息发送给monitor。pg信息包括pg的状态（active、degraded等），Object信息（数目、大小、scrub/repair信息、IOps和带宽等）。monitor通过将这些信息汇总就可以知道整个系统的空间使用率、各个存储池的空间大小、集群的IOps和带宽等实时信息。
osd的操作命令是客户端通过monitor传递给osd的。比如osd scrub/deep scrub、pg scrub/deep scrub等
osd 初始化或osd所包含的OSDMap版本高于当前的OSDMap。

数据操作流程

Ceph的读写操作采用primary-replica模型。客户端只向Object所对应的OSD set的primary发起读或写请求，这保证了数据的强一致性。当primary收到Object的写请求时，它负责把数据发送给其他副本。只有这个数据被保存在所有的osd上时，primary才应答Object的写请求，这保证了副本的一致性。

当客户端需要向Ceph集群写入一个file时，首先需要在本地完成上述的数据寻址。将file变成一个Object，然后找到存储该Object的一组共3个osd。这3个osd具有各自不同的序号，序号最靠前的osd就是primary osd，而后两个则依次是secondary osd和Tertiary osd。

找出3个osd之后，客户端将直接与primary osd进行通信，发起写入操作。primary osd收到请求之后，分别向secondary osd和Tertiary osd发起写入操作。当secondary osd和Tertiary osd各自完成写入操作之后，将分别向primary osd发起确认操作。当primary osd确认其他两个osd都写入完成之后，自己也完成数据写入，并向客户端确认Object写入操作完成。

之所以采用这样的数据写入流程，本质上是为了保证写入过程的可靠性，尽可能避免出现数据丢失的情况。同时由于客户端只向primary osd发送数据，因此，在互联网使用场景下的外网带宽和整体访问延迟又得到了一定程度的优化。

但是，这种可靠性机制必然导致较长的延迟。特别是，如果要等到所有的osd都将数据写入磁盘后再向客户端发送确认信号，则整体延迟将难以忍受。因此，Ceph可以分两次向客户端确认。当各个osd都将数据写入内存缓冲区后，就先向客户端发起一次确认，此时客户端就可以继续向下执行。等所有osd都将数据写入磁盘后，会向客户端发送一个最终确认信号，此时客户端可以根据需要删除本地数据。

在正常情况下，客户端可以独立完成osd寻址操作，不必依赖于其他系统模块。因此，大量的客户端可以同时与大量的osd并行操作。同时，如果一个文件被分为多个Object，这多个Object也可以被并行发送至多个osd上。

从osd的角度来看，同一个osd在不同的pg中角色不同，因此，工作压力也可以尽可能的均匀分担，从而避免单个osd成为性能瓶颈。

如果需要读取数据，客户端只需要完成同样的寻址操作，并直接与primary osd联系。在目前的Ceph设计中，被读取的数据默认由primary osd提供，但也可以设置允许从其他osd中获取，以分散读取压力从而提高性能。

块存储

Ceph可以使用一套存储系统同时提供对象存储、块存储、和文件系统存储3种功能。Ceph存储集群RADOS本身就是一个对象操作系统。基础库librados提供一系列的API允许用户操作对象和OSD、MON等进行通信。基于RADOS与librados库，Ceph通过RBD提供了一个标准的块设备接口，提供基于块设备的访问模式。

Ceph中的块设备称为image，是精简配置的，即按需分配，大小可调且将数据条带化存储到集群内的多个osd上。

条带化是指把连续的信息分片存储到多个设备中。当多个进程同时访问一个磁盘时，可能会出现磁盘冲突的问题。大多数磁盘对访问次数（每秒的io操作）和数据传输率（每秒传输的数据量）都有限制，当达到这些限制时，之后需要访问磁盘的进程就需要等待。这时就是所谓的磁盘冲突。避免磁盘冲突是优化io性能的一个重要目标，而优化io性能最有效的手段就是将io请求最大限度的进行平衡。

条带化是能够自动将io负载均衡到多个物理磁盘上的技术。通过将一块连续的数据分成多个相同大小的部分，并把它们分别存储到不同的磁盘上，条带化技术能使多个进程同时访问数据的不同部分而不会造成磁盘冲突，而且能获得最大限度上的io并行能力。

条带化技术能将多个磁盘合成一个卷，这个卷所能提供的速度比单个盘所能提供的速度要快很多。Ceph的块设备就对应于LVM的逻辑卷。块设备在创建时，可以使用如下参数实现条带化。

stripe-unit：条带的大小
stripe-count：在多少数量的对象之间进行条带化

当处理大尺寸图像、大Swift对象（如视频）的时候，能看到条带化到一个对象集合的多个对象能带来显著的读写性能提升。当客户端把条带单元并行地写入相应对象时，就会有明显的写性能提升。因为对象映射到了不同的pg，进一步映射到不同的osd上，可以并行地以最大速度写入。由于到单一磁盘的写入受制于磁盘移动和存储设备带宽，Ceph把写入分布到多个对象（它们映射到不同的pg和osd中），这样就减少了寻道次数，并利用多个驱动器的吞吐量，以达到更高的读写速度。

使用Ceph的块设备有两种途径：

通过kernel module：即创建了RBD设备后，把它映射到内核中，称为一个虚拟的块设备，这个块设备同其他通用的块设备一样。设备文件一般为/dev/rbd0。之后可以把/dev/rbd0格式化后挂载到某个目录，也可以直接作为裸设备使用。
通过librbd：即创建了RBD设备之后，使用librbd、 librados库访问和管理块设备。这种方式直接调用librbd提供的接口，实现对RBD设备的访问和管理，不会在客户端产生块设备文件。

第二种方式主要是为虚拟机提供块存储设备。在虚拟机场景下，一般会用QEMU/KVM中的RBD驱动部署Ceph块设备。宿主机通过librbd向客户机提供块存储服务。QEMU可以直接通过librbd，像访问虚拟设备一样访问Ceph块设备。

补图： Ceph集群中完整的数据写入流程

补图： Ceph集群中元数据服务器的作用

补图：Ceph中pool、pg和osd的关系

你可能感兴趣的:(ceph,ceph)

Ceph存储阈值调整：优化nearfull_ratio参数 mixboot Ceph ceph
Ceph存储阈值调整：优化nearfull_ratio参数前言在Ceph存储系统的管理中，合理设置存储阈值参数对于确保系统稳定运行至关重要。如何调整nearfull_ratio参数，以及这一参数对Ceph集群的影响。Ceph存储阈值概述Ceph存储系统主要有三个与容量相关的重要阈值参数：近满阈值(nearfull_ratio)：默认为0.85或85%，当集群使用空间达到此比例时，Ceph会发出警告
Ceph OSD.419 故障分析
CephOSD.419故障分析1.问题描述在Ceph存储集群中，OSD.419无法正常启动，系统日志显示服务反复重启失败。2.初始状态分析观察到OSD.419服务启动失败的系统状态：systemctlstatusceph-osd@419●[email protected]:loaded(/usr/lib/systemd
【ceph】坏盘更换，osd的具体操作向往风的男子 ceph ceph
本站以分享各种运维经验和运维所需要的技能为主《python零基础入门》：python零基础入门学习《python运维脚本》：python运维脚本实践《shell》：shell学习《terraform》持续更新中：terraform_Aws学习零基础入门到最佳实战《k8》暂未更新《docker学习》暂未更新《ceph学习》ceph日常问题解决分享《日志收集》ELK+各种中间件《运维日常》运维日常《l
ceph报错整理时空无限 Kubernetes ceph linux 运维 kubernetes
xxdaemonshaverecentlycrashedceph-scluster:id:d82dfc33-6a35-4fa4-b5f0-c32979b714cdhealth:HEALTH_WARN74daemonshaverecentlycrashedcephcrashlsIDENTITYNEW2024-07-26T06:17:34.480675Z_bd4c30b7-2347-4307-a9e6
使用ceph-ansible部署分布式存储Ceph-octopus版本降世神童云计算技术专栏分布式 ceph ansible
使用ceph-ansible部署分布式存储Ceph-octopus版本1.Ceph基础概念及部署方式1.1.Ceph基本概念1.2.Ceph部署方式2.系统初始化配置3.Ceph集群部署3.1.Ansible安装与配置3.2.ceph-ansible安装与配置3.2.1.下载ceph-ansible3.2.2.安装ceph-ansible依赖3.2.3.修改ceph配置文件3.3.开始部署ceph
2024年运维最新分布式存储ceph osd 常用操作_ceph查看osd对应硬盘(1)，2024年最新Linux运维编程基础教程 2401_83944328 程序员运维分布式 ceph
最全的Linux教程，Linux从入门到精通======================linux从入门到精通(第2版)Linux系统移植Linux驱动开发入门与实战LINUX系统移植第2版Linux开源网络全栈详解从DPDK到OpenFlow第一份《Linux从入门到精通》466页====================内容简介====本书是获得了很多读者好评的Linux经典畅销书**《Linu
【ceph】ceph集群更换osd时，找不到坏盘位置，怎么查找坏盘对应的序列号---业内称“点灯”
本站以分享各种运维经验和运维所需要的技能为主《python零基础入门》：python零基础入门学习《python运维脚本》：python运维脚本实践《shell》：shell学习《terraform》持续更新中：terraform_Aws学习零基础入门到最佳实战《k8》从问题中去学习k8s《docker学习》暂未更新《ceph学习》ceph日常问题解决分享《日志收集》ELK+各种中间件《运维日常》
Ceph集群管理实战 wespten OpenStack vSphere 虚拟化云平台 SDN 数据库存储块存储文件存储对象存储分布式网络存储 linux 运维服务器
配置完Ceph集群后，我们即可对Ceph集群进行数据存储。在后续使用过程中，Ceph提供了常用的命令对Ceph集群进行必要的运维。常见的集群状态查看、磁盘使用率查看、添加磁盘、删除坏盘等操作。详情可参考：WelcometoCeph—CephDocumentation1、Ceph的常用命令本节给出的Ceph常用命令可以作为最基本的集群运维命令。1）查看集群状态命令。[root@installer~]
深度剖析：Ceph分布式存储系统架构 TechVision大咖圈 ceph 分布式架构分布式存储
一文带你彻底搞懂Ceph的架构奥秘，从小白到架构师的进阶之路！文章目录1.Ceph简介：存储界的"多面手"什么是Ceph？为什么选择Ceph？2.核心组件架构：四大金刚的分工合作Monitor（MON）：集群的"大脑"ObjectStorageDevice（OSD）：数据的"家园"MetadataServer（MDS）：文件系统的"管家"Manager（MGR）：集群的"助手"3.三大存储接口：一
【无标题】 KellenKellenHao tomcat java
一、tomcat安装 #关闭防火墙与SELinux [root@proxy_host~]#rz rzwaitingtoreceive.**[root@proxy_host~]#ls anaconda-ks.cfg ceph-release-1-1.el7.noarch.rpm apache-tomcat-8.5.40.tar.gznginx-1.27.3.tar.gz #解压到指定路径
【mongodb】mongodb数据备份与恢复向往风的男子运维日常 DBA mongodb 数据库
本站以分享各种运维经验和运维所需要的技能为主《python零基础入门》：python零基础入门学习《python运维脚本》：python运维脚本实践《shell》：shell学习《terraform》持续更新中：terraform_Aws学习零基础入门到最佳实战《k8》暂未更新《docker学习》暂未更新《ceph学习》ceph日常问题解决分享《日志收集》ELK+各种中间件《运维日常》运维日常《l
rook-ceph配置dashboard代理无法访问
在ceph-tools的pod中看看dashboard是否开启kubectl-nrook-cephexec-itrook-ceph-tools-7b75b967db-jn68d–bashcephmgrservices查看集群内地址使用curl测试能否访问cephmgrmoduledisabledashboard关闭cephmgrmoduleenabledashboard开启rook中关于ceph部
速通Ceph分布式存储（含超详细图解）来自于狂人云计算
前言云计算存储架构图示例存储节点集群RAID控制层物理存储层分布式存储管理层存储接口层接入层OSD主机1OSD主机2OSD主机N磁盘1磁盘2磁盘3磁盘4磁盘5磁盘6RAID0/10/5RAID控制器1RAID0/10/5RAID控制器2RAID0/10/5RAID控制器NMonitor集群大脑OSD数据守护进程MDS元数据服务对象存储块存储文件存储对象网关RBDMDS客户端接入层存储接口层分布式存
使用kolla安装OPENSTACK qhqh310 openstack
安装centos7一、根据这个做一个模板1、编辑host文件10.103.129.146control-110.103.129.147node-110.103.129.148node-210.103.129.149network-110.103.129.150ceph-110.103.129.151ceph-210.103.129.152control-210.103.129.153network
ceph计算PG
计算公式：pg_num={(TargetPGsperOSD)x(OSD#)x(%Data)}/Size注释：TargetPGsperOSD：预估每个OSD的PG数，一般取100计算。当预估以后集群OSD数不会增加时，一般取100计算OSD#：集群OSD数量。%Data：预估该pool占该OSD集群总容量的近似百分比。Size：该pool的副本数。
分布式存储Ceph之PG状态详解 jiangxi_ ceph 运维 ceph pgp 分布式 linux
1.PG介绍一，PG的复杂如下：在架构层次上，PG位于RADOS层的中间。a.往上负责接收和处理来自客户端的请求。b.往下负责将这些数据请求翻译为能够被本地对象存储所能理解的事务。是组成存储池的基本单位，存储池中的很多特性，都是直接依托于PG实现的。面向容灾域的备份策略使得一般而言的PG需要执行跨节点的分布式写，因此数据在不同节点之间的同步、恢复时的数据修复也都是依赖PG完成。2.PG状态表正常的
ceph创建pool时pg_num的配置 lvbibir 数据库
pg_num用此命令创建存储池时：cephosdpoolcreate{pool-name}pg_num确定pg_num取值是强制性的，因为不能自动计算。常用的较为通用的取值：少于5个osd，pg_num设置为128osd数量在5到10个时，pg_num设置为512osd数量在10到50个时，pg_num=4096osd数量大于50是，需要理解ceph的权衡算法，自己计算pg_num取值自行计算pg
ceph 通过 crush rule 修改故障域时空无限 ceph ceph
创建故障域为osd的crushrulecephosdcrushrulecreate-replicatedreplicated_osd_leveldefaultosd设置pool使用新创建的crushrulecephosdpoolsetceph-filesystem-data0crush_rulereplicated_osd_level查看有哪些crushrulecephosdcrushruleli
Rsync实操 KellenKellenHao excel
Rsync实操一.rsync命令 #类似于cp [root@user2~]#[email protected]:/root [email protected]'spassword: [root@user1~]#ls anaconda-ks.cfgceph-release-1-1.el7.noarch.rpminfo.sh二、使用rsync备份push方式服务器：
离线部署openstack 2024.1需求说明、初始化及实例创建过程分析查士丁尼·绵 openstack openstack
背景在ubuntu22.04离线部署openstack2024.1集群，外置存储为cephreef，提供：1、计算虚拟化；2、网络虚拟化，支持协议flat、vlan、vxlan；3、存储对接ceph；4、webUI；5、management网络为bond0，对应vlan10；6、self-service网络为bond0，对应vlan15；7、external网络对应bond1，对应vlan20、2
安装ceph时,出现Some monitors have still not reached quorum
现象：安装ceph时，在获取节点的证书时，也即下面这条语句时遇到问题ceph-deployadminceph1ceph2ceph3报错如下：[ceph3][INFO]Runningcommand:sudoceph--cluster=ceph--admin-daemon/var/run/ceph/ceph-mon.ceph3.asokmon_status[ceph3][ERROR]admin_soc
OpenStack私有云实战答案：Heat编排+KVM优化+Ceph存储对接与排障全解行家说竞赛 #云计算应用赛项 openstack ceph
【题目1】1.2.1Heat编排-创建用户[1分]编写Heat模板create_user.yaml，创建名为heat-user的用户。使用自己搭建的OpenStack私有云平台，使用heat编写摸板(heat_template_version:2016-04-08)创建名为”chinaskills”的domain，在此domain下创建名为beijing_group的租户，在此租户下创建名为clo
【k8s安装redis】k8s环境无pvc的情况下安装redis哨兵集群汪碧康 kubernetes docker redis kubernetes redis docker 容器哨兵 pvc
文章目录简介一.条件及环境说明：二.需求说明：三.实现原理及说明四.详细步骤4.1.规划节点标签4.2.创建configmap配置4.3.创建三个statefulset和serviceheadless配置4.4.创建哨兵deployment配置和service配置五.安装说明简介k8s集群中搭建有状态的服务会相对较麻烦，像搭建redis目前比较主流的做法主要是采用共享存储ceph、nas来实现数据
springboot2.6+awssdk2访问ceph bucket
版本信息：SpringBoot2.6.6awssdk2.17.100Ceph：Quincyv17.2.01、添加cephmaven依赖：父pom文件：。。。。。。2.17.100。。。。。。software.amazon.awssdkbom${awssdk.version}pomimport子pom文件：
【SCI论文写作】机器学习与时间序列医疗健康预测——（EEG）的获取与预处理：Python 实现 LIUDAN'S WORLD 医学 AI python 人工智能前端
当前时间：2025-05-29脑电图（Electroencephalography,EEG）作为一种非侵入性的神经生理监测技术，在医疗健康领域，尤其是在神经科学研究、疾病诊断（如癫痫、睡眠障碍）、脑机接口（BCI）等方面扮演着至关重要的角色。原始EEG信号通常包含复杂的生理信息，但也极易受到各种噪声和伪迹的污染，这为后续的数据分析和解读带来了巨大挑战。因此，对EEG数据进行系统有效的预处理是确保分
ES将快照仓库创建到ceph Nobe_yt es6 elasticsearch
这是在ES6.8.7环境进行的，测试7.6.2也是可以的。注意：所有的ES节点都需要安装对应版本的repository-s3插件。步骤一：提前准备好对象存储，和bukect"access_key":"xxxxxx""secret_key":"xxxxxx""bucket"："xxxxxx"步骤二：设置访问s3账号密码,根据步骤一中准备好的bukect的access_key,secret_key。#
Ceph---ceph 12.2.12 full ratio(s) out of order yysalad ceph
实际使用ceph12.2.12的过程中遇到fullratio(s)outoforder原因：osd_failsafe_full_ratio小于full_ratio解决方法：设置full_ratio小于等于osd_failsafe_full_ratiocephosdset-full-ratio0.97
ceph recovery 相关参数时空无限 ceph ceph
RECOVERY恢复/回填选项修改mClock最大回填/恢复限制的步骤可以修改的最大回填/恢复选项列在“恢复/回填选项”部分。mClock的修改默认回填/恢复限制由osd_mclock_override_recovery_settings选项，设置为默认为false。尝试修改任何默认恢复/回填限制而不设置门控选项，会将该选项重置为mClock默认值，并在集群日志中记录一条警告消息。请注意，默认值可
ceph性能调优时空无限 ceph ceph
硬件方面CPUceph的进程对cpu的依赖强弱MDS>OSD>MON一个MDS进程给4核cpu一个OSD进程给2核cpu一个MON进程给1核cpu内存ceph的进程对cpu的依赖强弱MON>OSD一个MON进程给2G内存一个OSD进程给1G内存（osd使用一个物理磁盘）如果使用多个物理磁盘作为一个OSD，每个OSD进程就需要分配大于1G的内存，另外集群处于recovery状态时，内存消耗会明显增加
017 Ceph的集群管理_3 weixin_30614587 shell 开发工具运维
一、验证OSD1.1osd状态运行状态有：up，in，out，down正常状态的OSD为up且in当OSD故障时，守护进程offline，在5分钟内，集群仍会将其标记为up和in，这是为了防止网络抖动如果5分钟内仍未恢复，则会标记为down和out。此时该OSD上的PG开始迁移。这个5分钟的时间间隔可以通过mon_osd_down_out_interval配置项修改当故障的OSD重新上线以后，会触
HQL之投影查询归来朝歌 HQL Hibernate 查询语句投影查询
在HQL查询中，常常面临这样一个场景，对于多表查询，是要将一个表的对象查出来还是要只需要每个表中的几个字段，最后放在一起显示？针对上面的场景，如果需要将一个对象查出来： HQL语句写“from 对象”即可 Session session = HibernateUtil.openSession();
Spring整合redis bylijinnan redis
pom.xml <dependencies>  <dependency> <groupId>org.springframework.data</groupId> <artifactId>spring-data-redi
org.hibernate.NonUniqueResultException: query did not return a unique result: 2 0624chenhong Hibernate
参考：http://blog.csdn.net/qingfeilee/article/details/7052736 org.hibernate.NonUniqueResultException: query did not return a unique result: 2 在项目中出现了org.hiber
android动画效果不懂事的小屁孩 android动画
前几天弄alertdialog和popupwindow的时候，用到了android的动画效果，今天专门研究了一下关于android的动画效果，列出来，方便以后使用。 Android 平台提供了两类动画。一类是Tween动画，就是对场景里的对象不断的进行图像变化来产生动画效果（旋转、平移、放缩和渐变）。第二类就是 Frame动画，即顺序的播放事先做好的图像，与gif图片原理类似。
js delete 删除机理以及它的内存泄露问题的解决方案换个号韩国红果果 JavaScript
delete删除属性时只是解除了属性与对象的绑定，故当属性值为一个对象时，删除时会造成内存泄露（其实还未删除）举例： var person={name:{firstname:'bob'}} var p=person.name delete person.name p.firstname -->'bob' // 依然可以访问p.firstname，存在内存泄露
Oracle将零干预分析加入网络即服务计划蓝儿唯美 oracle
由Oracle通信技术部门主导的演示项目并没有在本月较早前法国南斯举行的行业集团TM论坛大会中获得嘉奖。但是，Oracle通信官员解雇致力于打造一个支持零干预分配和编制功能的网络即服务（NaaS）平台，帮助企业以更灵活和更适合云的方式实现通信服务提供商（CSP）的连接产品。这个Oracle主导的项目属于TM Forum Live!活动上展示的Catalyst计划的19个项目之一。Catalyst计
spring学习——springmvc（二） a-john springMVC
Spring MVC提供了非常方便的文件上传功能。 1，配置Spring支持文件上传： DispatcherServlet本身并不知道如何处理multipart的表单数据，需要一个multipart解析器把POST请求的multipart数据中抽取出来，这样DispatcherServlet就能将其传递给我们的控制器了。为了在Spring中注册multipart解析器，需要声明一个实现了Mul
POJ-2828-Buy Tickets aijuans ACM_POJ
POJ-2828-Buy Tickets http://poj.org/problem?id=2828 线段树，逆序插入 #include<iostream>#include<cstdio>#include<cstring>#include<cstdlib>using namespace std;#define N 200010struct
Java Ant build.xml详解 asia007 build.xml
1,什么是antant是构建工具2,什么是构建概念到处可查到，形象来说，你要把代码从某个地方拿来，编译，再拷贝到某个地方去等等操作，当然不仅与此，但是主要用来干这个3,ant的好处跨平台 --因为ant是使用java实现的，所以它跨平台使用简单--与ant的兄弟make比起来语法清晰--同样是和make相比功能强大--ant能做的事情很多，可能你用了很久，你仍然不知道它能有
android按钮监听器的四种技术百合不是茶 android xml配置监听器实现接口
android开发中经常会用到各种各样的监听器,android监听器的写法与java又有不同的地方; 1,activity中使用内部类实现接口 ,创建内部类实例使用add方法与java类似创建监听器的实例 myLis lis = new myLis(); 使用add方法给按钮添加监听器
软件架构师不等同于资深程序员 bijian1013 程序员架构师架构设计
本文的作者Armel Nene是ETAPIX Global公司的首席架构师，他居住在伦敦，他参与过的开源项目包括 Apache Lucene,，Apache Nutch， Liferay 和 Pentaho等。如今很多的公司
TeamForge Wiki Syntax & CollabNet User Information Center sunjing TeamForge How do Attachement Anchor Wiki Syntax
the CollabNet user information center http://help.collab.net/ How do I create a new Wiki page? A CollabNet TeamForge project can have any number of Wiki pages. All Wiki pages are linked, and
【Redis四】Redis数据类型 bit1129 redis
概述 Redis是一个高性能的数据结构服务器，称之为数据结构服务器的原因是，它提供了丰富的数据类型以满足不同的应用场景，本文对Redis的数据类型以及对这些类型可能的操作进行总结。 Redis常用的数据类型包括string、set、list、hash以及sorted set.Redis本身是K/V系统，这里的数据类型指的是value的类型，而不是key的类型，key的类型只有一种即string
SSH2整合-附源码白糖_ eclipse spring tomcat Hibernate Google
今天用eclipse终于整合出了struts2+hibernate+spring框架。我创建的是tomcat项目，需要有tomcat插件。导入项目以后，鼠标右键选择属性，然后再找到“tomcat”项，勾选一下“Is a tomcat project”即可。具体方法见源码里的jsp图片，sql也在源码里。补充1：项目中部分jar包不是最新版的，可能导
[转]开源项目代码的学习方法 braveCS 学习方法
转自： http://blog.sina.com.cn/s/blog_693458530100lk5m.html http://www.cnblogs.com/west-link/archive/2011/06/07/2074466.html 1）阅读features。以此来搞清楚该项目有哪些特性2）思考。想想如果自己来做有这些features的项目该如何构架3）下载并安装d
编程之美-子数组的最大和（二维） bylijinnan 编程之美
package beautyOfCoding; import java.util.Arrays; import java.util.Random; public class MaxSubArraySum2 { /** * 编程之美子数组之和的最大值（二维） */ private static final int ROW = 5; private stat
读书笔记-3 chengxuyuancsdn jquery笔记 resultMap配置 ibatis一对多配置
1、resultMap配置 2、ibatis一对多配置 3、jquery笔记 1、resultMap配置当<select resultMap="topic_data"> <resultMap id="topic_data">必须一一对应。 (1)<resultMap class="tblTopic&q
[物理与天文]物理学新进展 comsci
如果我们必须获得某种地球上没有的矿石,才能够进行某些能量输出装置的设计和建造,而要获得这种矿石,又必须首先进行深空探测,而要进行深空探测,又必须获得这种能量输出装置,这个矛盾的循环,会导致地球联盟在与宇宙文明建立关系的时候,陷入困境怎么办呢?
Oracle 11g新特性:Automatic Diagnostic Repository daizj oracle ADR
Oracle Database 11g的FDI（Fault Diagnosability Infrastructure）是自动化诊断方面的又一增强。 FDI的一个关键组件是自动诊断库（Automatic Diagnostic Repository-ADR）。在oracle 11g中，alert文件的信息是以xml的文件格式存在的，另外提供了普通文本格式的alert文件。这两份log文
简单排序:选择排序 dieslrae 选择排序
public void selectSort(int[] array){ int select; for(int i=0;i<array.length;i++){ select = i; for(int k=i+1;k<array.leng
C语言学习六指针的经典程序，互换两个数字 dcj3sjt126com c
示例程序，swap_1和swap_2都是错误的，推理从1开始推到2，2没完成，推到3就完成了 # include <stdio.h> void swap_1(int, int); void swap_2(int *, int *); void swap_3(int *, int *); int main(void) { int a = 3; int b =
php 5.4中php-fpm 的重启、终止操作命令 dcj3sjt126com PHP
php 5.4中php-fpm 的重启、终止操作命令: 查看php运行目录命令：which php/usr/bin/php 查看php-fpm进程数：ps aux | grep -c php-fpm 查看运行内存/usr/bin/php -i|grep mem 重启php-fpm/etc/init.d/php-fpm restart 在phpinfo()输出内容可以看到php
线程同步工具类 shuizhaosi888 同步工具类
同步工具类包括信号量（Semaphore）、栅栏（barrier）、闭锁（CountDownLatch）闭锁（CountDownLatch） public class RunMain { public long timeTasks(int nThreads, final Runnable task) throws InterruptedException { fin
bleeding edge是什么意思 haojinghua DI
不止一次，看到很多讲技术的文章里面出现过这个词语。今天终于弄懂了——通过朋友给的浏览软件，上了wiki。我再一次感到，没有辞典能像WiKi一样，给出这样体贴人心、一清二楚的解释了。为了表达我对WiKi的喜爱，只好在此一一中英对照，给大家上次课。 In computer science, bleeding edge is a term that
c中实现utf8和gbk的互转 jimmee c iconv utf8&gbk编码
#include <iconv.h> #include <stdlib.h> #include <stdio.h> #include <unistd.h> #include <fcntl.h> #include <string.h> #include <sys/stat.h> int code_c
大型分布式网站架构设计与实践 lilin530 应用服务器搜索引擎
1.大型网站软件系统的特点？ a.高并发，大流量。 b.高可用。 c.海量数据。 d.用户分布广泛，网络情况复杂。 e.安全环境恶劣。 f.需求快速变更，发布频繁。 g.渐进式发展。 2.大型网站架构演化发展历程？ a.初始阶段的网站架构。应用程序，数据库，文件等所有的资源都在一台服务器上。 b.应用服务器和数据服务器分离。 c.使用缓存改善网站性能。 d.使用应用
在代码中获取Android theme中的attr属性值 OliveExcel android theme
Android的Theme是由各种attr组合而成, 每个attr对应了这个属性的一个引用, 这个引用又可以是各种东西. 在某些情况下, 我们需要获取非自定义的主题下某个属性的内容 (比如拿到系统默认的配色colorAccent), 操作方式举例一则: int defaultColor = 0xFF000000; int[] attrsArray = { andorid.r.
基于Zookeeper的分布式共享锁 roadrunners zookeeper 分布式共享锁
首先，说说我们的场景，订单服务是做成集群的，当两个以上结点同时收到一个相同订单的创建指令，这时并发就产生了，系统就会重复创建订单。等等......场景。这时，分布式共享锁就闪亮登场了。共享锁在同一个进程中是很容易实现的，但在跨进程或者在不同Server之间就不好实现了。Zookeeper就很容易实现。具体的实现原理官网和其它网站也有翻译，这里就不在赘述了。官
两个容易被忽略的MySQL知识 tomcat_oracle mysql
1、varchar(5)可以存储多少个汉字，多少个字母数字？　　相信有好多人应该跟我一样，对这个已经很熟悉了，根据经验我们能很快的做出决定，比如说用varchar(200)去存储url等等，但是，即使你用了很多次也很熟悉了，也有可能对上面的问题做出错误的回答。　　这个问题我查了好多资料，有的人说是可以存储5个字符，2.5个汉字（每个汉字占用两个字节的话），有的人说这个要区分版本，5.0
zoj 3827 Information Entropy(水题) 阿尔萨斯 format
题目链接：zoj 3827 Information Entropy 题目大意：三种底，计算和。解题思路：调用库函数就可以直接算了，不过要注意Pi = 0的时候，不过它题目里居然也讲了。。。limp→0+plogb(p)=0，因为p是logp的高阶。 #include <cstdio> #include <cstring> #include <cmath&