墨尔本--晴

Ceph RGW 设计与实现

1.总体架构

rgw 作为对象存储网关系统，一方面扮演RADOS集群客户端角色，为对象存储应用提供数据存储；另一方面扮演HTTP 服务端角色，接受并解析互联网传送的数据。

通过 HTTP 协议与 Swift 和 S3 应用通讯，后端与 librados 结合，通过socket 与 RADOS 集群通讯。 RGW 支持目前主流的WEB服务器，包括 Civetweb、 APACHE、 Nginx等，其中Civetweb 是一个C++库，可以内嵌到RGW框架中，是RGW默认的WEB服务器； Apache 与 Nginx 需要以独立进程存在，收到请求后，通过RGW注册的监听端口将请求转发到RGW上处理。

2.相关概念及定义

2.1几个内部概念

zone：包含多个RGW实例的一个逻辑概念。zone不能跨集群。同一个zone的数据保存在同一组pool中。
zonegroup：一个zonegroup如果包含1个或多个zone。如果一个zonegroup包含多个zone，必须指定一个zone作为master zone，用来处理bucket和用户的创建。一个集群可以创建多个zonegroup，一个zonegroup也可以跨多个集群。
realm：一个realm包含1个或多个zonegroup。如果realm包含多个zonegroup，必须指定一个zonegroup为master zonegroup，用来处理系统操作。一个系统中可以包含多个realm，多个realm之间资源完全隔离。

2.2几个外部概念

用户：对象应用的使用者。一个用户拥有一个或多个存储通。
存储桶：存储桶是对象的容器。是为了方便管理和操作具有同一属性的一类对象引入的一层管理单元。
对象：对象是对象存储系统数据组织和存储的基本单位，一个对象包括数据和元数据。

尽管不同的对象存储系统在设计上有所不同，但是对外呈现的基础数据实体大同小异。比如Amazon S3的基础数据实体包含user,bucket,object与以上的用户，存储桶，对象一致。而openStack Swift将用户的概念细分为account和user.

2.2.1 用户

一个用户包含的信息包括用户认证信息、访问控制权限信息和配额信息。

用户认证

要了解用户认证信息有哪些，必须要先了解RGW的认证机制， RGW针对S3 API和Swift API采用不同的认证机制。

S3认证过程

应用在发送请求前， 使用用户私有密钥（secret_key）， 请求内容， 采用与RGW网关约定好的算法计算出数字签名后， 将数字签名以及用户访问密钥（access_key） 封装在请求中发送给RGW网关。

RGW网关收到请求后， 使用用户访问密钥作为索引从RADOS集群中读取用户信息， 并从用户信息中获取用户私有密钥。

使用用户私有密钥请求内容等， 采用与应用约定好的算法计算数字签名。

判断RGW生成的数字签名与请求的签名是否匹配， 如果匹配， 则认为请求是真实的， 用户认证通过。

可以看出，在S3认证机制中，用户信息中必须包含访问密钥和私有密钥信息

Swift认证过程

应用在发出真正的操作请求前，向RGW网关请求一个令牌（注：该令牌有有效期，过了有效期后，需要重新请求新的令牌）。
RGW收到令牌请求后，使用子用户ID作为索引从RADOS集群中读取出子用户信息，并从子用户信息中获取到Swift私有密钥（swift_key）生成一个令牌返回给应用。
应用后续操作中携带该令牌， RGW收到操作请求后，采用与步骤2相同的方式生成一个令牌，并判断与请求中的令牌是否一致，如果一致，身份验证通过。

可以看出，Swift认证机制中必须包含Swift私有密钥。

RGW将用户信息保存在Rados对象的数据部分，一个用户对应RADOS对象，由于大部分情况下，我们需要使用用户ID作为所以获取用户信息，因此该对象以用户ID命名（RADOS通过‘‘pool名+对象吗’’来查询一个对象）

RGW需要将访问密钥，字用户，email跟用户信息所在的RADOS对象建立索引关系，针对这种情况，RGW采用了二级索引的方式，及分别创建以用户访问密钥，子用户，email命名的三个对象（即索引对象），并将用户ID保存在对象的数据部分，当需要某个索引查询用户信息时，所有从所有对象中读出用户ID，然后使用用户ID作为所以读取用户信息。

2.2.2存储桶

一个存储桶对应要一个RADOS对象。一个存储桶包含的信息包括两类，一类是对RGW网关透明的信息，这类信息通常指用户自定义的元数据，RGW网关直接将这些信息保存在扩展属性中，一个KV键值对对应一个扩展属性条目，另一类是RGW网关关注的信息，这类信息包括存储桶中对象的存储策略、存储桶中索引对象的数目以及应用对象和索引对象的映射关系、存储桶的配额等，此类信息由数据结构RGWBucketInfo管理。

在创建存储桶时，RGW网关会同步创建一个或多个索引（index）对象，用于保存该存储桶下的对象列表，以支持查询存储桶对象列表（List Bucket）功能，因此在存储桶中有心的对象上传或者删除的时候必须更新索引对象。

2.2.3对象

应用上传的对象包括数据和元数据两部分，数据部分保存在一个火多个RADOS对象的数据部分，元数据保存在其中一个RADOS对象的拓展属性中。RGW对单个对象提供了两种上传接口：整体上传和分段上传。

2.2.4Pool

RGW中含有多种pool,通过以下命令可以获得：

 
   rados lspools 
  

rbd

 
   .rgw.root 
  

 
   default.rgw.control 
  

 
   default.rgw.data.root 
  

 
   default.rgw.gc 
  

 
   default.rgw.log 
  

 
   default.rgw. 
   users 
   .uid 
  

 
   default.rgw. 
   users 
   .keys 
  

 
   default.rgw. 
   users 
   .swift 
  

 
   default.rgw.buckets.index 
  

 
   default.rgw.buckets.data 
  

各种pool的作用

.rgw.root 包含realm，zonegroup和zone
default.rgw.control在RGW上电时，在control pool创建若干个对象用于watch-notify，主要作用为当一个zone对应多个RGW，且cache使能时，保证数据的一致性，其基本原理为利用librados提供的对象watch-notify功能，当有数据更新时，通知其他RGW刷新cache，后面会有文档专门描述RGW cache
default.rgw.data.root：包含bucket和bucket元数据，bucket创建了两个对象一个：一个是< bucket_name > 另一个是.bucket.meta.< bucket_name >.< marker > 这个marker是创建bucket中生成的。同时用户创建的buckets在.rgw.buckets.index都对应一个object对象，其命名是格式：.dir.< marker
default.rgw.gc：RGW中大文件数据一般在后台删除，该pool用于记录那些待删除的文件对象
default.rgw.log：各种log信息
default.rgw.users.uid：保存用户信息，和用户下的bucket信息
default.rgw.users.keys：包含注册用户的access_key
default.rgw.users.swift：包含注册的子用户(用于swift)
default.rgw.buckets.index：包含bucket信息，和default.rgw.data.root对应
default.rgw.buckets.data：包含每个bucket目录下的object

default.rgw.data.root，default.rgw.buckets.index和default.rgw.buckets.data 之间有直接的联系

3.功能实现

这里主要是介绍RGW对外提供的功能，I/O路径以及存储桶创建，对象上传下载等几个功能的实现。

3.1功能特性

对象存储最基本的功能呢包括用户，存储桶，对象的增删改查等，RGW网关最近几年在不断地跟进和对齐AmazonS3和OpenStack Swift功能。目前RGW网关兼容的S3和Swift的API见链接：

https://docs.aws.amazon.com/AmazonS3/latest/API/Welcome.html
https://docs.openstack.org/swift/latest/api/object_api_v1_overview.html

3.1.1I/O路径

RGW网关使用OP线程处理应用的I/O请求（OP线程在上电时创建，当前端WEB服务器为Civetweb时，通过修改配置项rgw_thread_pool_size指定OP线程数目）。OP线程内部逻辑可分为HTTP前端，REST API通用处理层、API操作执行层、RADOS接口适配层与librados接口层等几个关键流程。OP线程从HTTP前端收到I/O请求后，首先在REST API通用处理层，从HTTP语义中解析出S3或Swift数据并进行一系列的检查，检查通过后，根据不同API操作请求执行不同的处理流程，如需从RASDOS集群获取数据或这往RADOS集群写入数据，则通过RGW与RADOS接口适配层调用librados接口将请求发送到RADOS集群中获取或写入相应数据，完成整个I/O过程。

RGW实例内部I/O路径如下图：

REST API通过处理层的关键步骤如下图所示，大概分为用户认证，用户/存储桶/对象的访问控制和用户/存储桶配额检查等几项。

这里以Civetweb作为Web服务器的Request处理流程如下：

1.在main函数中若选择使用civetweb作为前端Web服务器，在设置相关配置后调用run函数启动civetweb.

run函数中在mg_start函数启动web server.该函数还会传入一个回调函数，用于处理每个request请求。

 
   int  
   RGWCivetWebFrontend::run()

{

...

 
   struct  
   mg_callbacks cb;

 
        
   memset 
   (( 
   void  
   *)&cb, 0,  
   sizeof 
   (cb)); 
  

 
   /* 回调函数设置 */

 
   cb.begin_request = civetweb_callback;

 
   cb.log_message = rgw_civetweb_log_callback;

 
   cb.log_access = rgw_civetweb_log_access_callback;

 
   /* 启动服务 */

 
   ctx = mg_start(&cb,  
   this 
   , options.data());

 
   return  
   ! ctx ? -EIO : 0;

}

2.经过上一步的设置，在civetweb_callback中每一个request请求都需要经过process_request()进行处理，注意每个request请求都会绑定一组RGWRados(负责底层Librados的数据读写)/RGWREST（对应request和Response的处理）/OpsLogSocket（日志消息记录）。

 
   static  
   int  
   civetweb_callback( 
   struct  
   mg_connection* conn) 
  

{

 
      
   const  
   struct  
   mg_request_info*  
   const  
   req_info = mg_get_request_info(conn); 
  

 
   return  
   static_cast 
   (req_info->user_data)->process(conn);

}

 
   int  
   RGWCivetWebFrontend::process( 
   struct  
   mg_connection*   
   const  
   conn) 
  

{

 
   /* Hold a read lock over access to env.store for reconfiguration. */

 
   RWLock::RLocker lock(env.mutex);

 
   RGWCivetWeb cw_client(conn);

 
   auto real_client_io = rgw::io::add_reordering(

 
   rgw::io::add_buffering(dout_context,

 
   rgw::io::add_chunking(

 
   rgw::io::add_conlen_controlling(

 
   &cw_client))));

 
   RGWRestfulIO client_io(dout_context, &real_client_io);

 
   RGWRequest req(env.store->get_new_req_id());

 
   int  
   ret = process_request(env.store, env.rest, &req, env.uri_prefix,

 
   *env.auth_registry, &client_io, env.olog);

 
   if  
   (ret < 0) {

 
   /* We don't really care about return code. */

 
   dout(20) <<  
   "process_request() returned "  
   << ret << dendl;

}

 
   /* Mark as processed. */

 
   return  
   1;

}

3.process_request会根据传入的RGWRados参数获取RGWOp,再去认证该Op

 
   int  
   process_request(RGWRados*  
   const  
   store, 
  

 
   RGWREST*  
   const  
   rest,

 
   RGWRequest*  
   const  
   req,

 
   const  
   std::string& frontend_prefix,

 
   const  
   rgw_auth_registry_t& auth_registry,

 
   RGWRestfulIO*  
   const  
   client_io,

 
   OpsLogSocket*  
   const  
   olog)

{

...

/*

 
   得到RGWHandler_REST类实例

*/

 
   RGWRESTMgr *mgr;

 
   RGWHandler_REST *handler = rest->get_handler(store, s,

 
   auth_registry,

 
   frontend_prefix,

 
   client_io, &mgr, &init_error);

/*

 
   根据request的op得到对应的操作处理类，如：GET/PUT/DELETE/POST等

*/

 
   op = handler->get_op(store);

 
   if  
   (!op) {

 
   abort_early(s, NULL, -ERR_METHOD_NOT_ALLOWED, handler);

 
   goto  
   done;

}

 
   req->op = op;

 
      
   dout(10) <<  
   "op="  
   <<  
   typeid 
   (*op).name() << dendl; 
  

 
   s->op_type = op->get_type();

 
      
   req-> 
   log 
   (s,  
   "verifying requester" 
   ); 
  

/*

 
   执行认证操作

*/

 
   ret = op->verify_requester(auth_registry);

 
   if  
   (ret < 0) {

 
   dout(10) <<  
   "failed to authorize request"  
   << dendl;

 
   abort_early(s, NULL, ret, handler);

 
   goto  
   done;

}

 
   /* FIXME: remove this after switching all handlers to the new authentication

 
   * infrastructure. */

 
   if  
   (nullptr == s->auth.identity) {

 
   s->auth.identity = rgw::auth::transform_old_authinfo(s);

}

 
      
   req-> 
   log 
   (s,  
   "normalizing buckets and tenants" 
   ); 
  

/*

 
   检查bucket以及object名字的有效性。

*/

 
   ret = handler->postauth_init();

 
   if  
   (ret < 0) {

 
   dout(10) <<  
   "failed to run post-auth init"  
   << dendl;

 
   abort_early(s, op, ret, handler);

 
   goto  
   done;

}

/*

 
   用户被禁

*/

 
   if  
   (s->user->suspended) {

 
   dout(10) <<  
   "user is suspended, uid="  
   << s->user->user_id << dendl;

 
   abort_early(s, op, -ERR_USER_SUSPENDED, handler);

 
   goto  
   done;

}

/*

 
   验证并执行操作

*/

 
   ret = rgw_process_authenticated(handler, op, req, s);

 
   if  
   (ret < 0) {

 
   abort_early(s, op, ret, handler);

 
   goto  
   done;

}

 
   done: 
  

 
   try  
   {

 
   client_io->complete_request();

 
   }  
   catch  
   (rgw::io::Exception& e) {

 
   dout(0) <<  
   "ERROR: client_io->complete_request() returned "

 
   << e.what() << dendl;

}

 
   if  
   (should_log) {

 
   rgw_log_op(store, rest, s, (op ? op->name() :  
   "unknown" 
   ), olog);

}

 
   int  
   http_ret = s->err.http_ret;

 
   int  
   op_ret = 0;

 
   if  
   (op) {

 
   op_ret = op->get_ret();

}

 
   req->log_format(s,  
   "op status=%d" 
   , op_ret);

 
   req->log_format(s,  
   "http status=%d" 
   , http_ret);

 
   if  
   (handler)

 
   handler->put_op(op);

 
   rest->put_handler(handler);

 
   dout(1) <<  
   "====== req done req="  
   << hex << req << dec

 
   <<  
   " op status="  
   << op_ret

 
   <<  
   " http_status="  
   << http_ret

 
   <<  
   " ======"

 
   << dendl;

 
   return  
   (ret < 0 ? ret : s->err.ret);

 
   }  
   /* process_request */

从之前RGW的启动流程中可以看到，根据不同的模块RGW会注册（实例化）出对应的RGWRESTMgr类，从request处理

流程（request_process）中可以看到根据不同的处理对象（如针对桶的操作、针对对象的操作）会从RGWRESTMgr类中实

例化出对应的RGWHandler_REST类，再根据不同的方法（如post、put、delet、update）从RGWHandler_REST类中实例化

出RGWOp类，从而关联到了具体的操作，不同的RGWOp类（即不同的操作）有自己对应的acl，从中验证用户是否具有相应

的访问权限。每个RGWOp子类有自己的verify_permission函数来做验证。

3.1.2用户认证

对于S3 API RGW 支持认证用户和匿名用户的访问，所有没有通过认证的访问则被认为是匿名用户的访问。RGW支持V2和V4两种方式认证，RGW V2认证支持本地认证，LDAP和keystone三张方式，RGW V4认证兼容AWS V4认证机制。

对于Swift API，支持临时URL认证、SignedToken认证，KeyStore认证，ExternalToken认证和匿名认证5种认证引擎。RGW对每个请求依次使用上述5个认证引擎进行认证没如果某个引擎认证通过，认证结束，用户操作通过认证。

3.1.3用户/存储桶/对象访问权限控制

通过身份验证后，并不意味着一定有访问资源（桶，对象等）的权限，用户必须具备相应的访问权限（ACL）才能访问对应的对象。

针对S3 API，访问控制列表分为存储桶访问控制列表和对象访问控制列表，分别作用域存储桶本身和对象本身。

对于Swift API在权限访问控制上与S3 API有所不同，Swift访问控制权限分为用户访问控制列表和存储桶访问控制列表。

3.1.3.1bucket/用户配额

通常限制单个应用或者用户可以使用的最大存储空间称为配额管理，配额管理是对最大存放的对象数目和对象的总大小进行限制的，支持对单个用户和单个用户下存储桶的配额限制，分别用user_quota和bucket_quota表示。当两种配额模式同时启用时，任何一种先打到了配额限制都会生效。

3.1.3.2用户操作权限判断

在实际操作前，需要对用户权限进行判断，如：只有具有删除权限的用户才能对对象进行删除操作，对应用户信息的op_mask

字段。

经过以上4步完成后，针对不同的操作请求执行具体的请求操作，下面以存储桶创建，对象上传，对象下载操作请求为例，具体介绍实现流程。

3.1.2存储桶创建

创建存储桶的流程大致分一下几步：

从HTTP请求中解析出相关参数：如桶的访问控制列表，存储策略
判断存储桶是否存在：由于同一租户下不同用户不能创建同名的存储桶，因此如果该存储桶已存在，且其拥有者不是当前
的用户，返回存储桶已存在。
创建存储桶：首先应用指定的对象存储策略，并将存储策略保存在存储桶的管理结构RGWBucketInfo中，然后将存储桶的
访问控制列表、跨资源访问信息、自定义元数据封装对应的KV条目，在索引存储池创建一个或多个索引对象成功后，在
domain_root存储池创建一个对象，同时将管理结构RGWBucketInfo保存在该对象的内容中，将KV条目保存到对象的扩展
属性中。
更新user_id.buckets对象：创建一个用户的同时，创建一个名为.buckets的对象，用于记录该用户下的所有存储
桶列表，保存在该对象的OMAP中。OMAP头部保存用户使用空间统计信息（cls_user_header），OMAP的KV条目保存
一个存储桶使用空间统计信息（cls_user_bucket_entry）。

3.1.3对象上传

RGW针对对象上传操作设计了两个接口：整体上传对象接口和分段上传对象接口，当单个对象大于5G时，必须调用分段

上传接口才能成功上传对象，当单个对象小于条带大小时，不能采用分段上传对象。

3.1.3.1整体上传

prepare：在prepare阶段的主要工作时初始化 manifest 数据结构。
handle_data：handle_data阶段，RGW每次从HTTP Server 缓冲区中取出rgw_max_chunk_size字节的数据，存放在bufferlist
中，然后分成一个或多个I/O异步下发到RADOS层，每个I/O的大小等于MIN（rgw_max_chunk_size, next_part_ofs - data_ofs），
其中next_part_ofs表示下一个RADOS对象保存的用户数据偏位置，data_ofs 表示当前数据的偏移位置。
complete：等所有数据上传成功后，对象上传进入complate阶段，该阶段的主要工作时将对象的元数据更新到head_obj中，同时
将对象条目更新到索引对象中，以便连续列举对象。

3.1.3.2分段上传

分段上传对象比单个操作对象流程复杂，设计三个接口的调用：

初始化：在分段上传数据之前，应用首先调用INITIATE MULTI-PART UPLOAD 接口进行初始化，应用在调用该接口的请求中携带对象的访问控制列表，用户对上传对象自定义的元数据等信息。RGW网关在此操作中生成一个Upload返回给应用，同时在data_extra_pool中生成一个临时对象，用于保存每个分段的信息，并经对象的访问控制列表信息，元数据信息等保存到该对象的xattar中。
分段上传：分段上传对象流程跟单个操作上传流程基本一致，不同之处在complete阶段，分段上传对象除了需要将每个分段对象更新到索引对象之处外，还需要将每个分段信息更新到初始化时在data_extar_pool中生成的临时对象中。
分段上传完成：所有的分段上传完成后，应用需要调用COMPLETE MULTIPART UPLOAD表示对象上传完成。在此操作中RGW会从初始化阶段生成的临时对象中读出各个分段信息，主要是分段的manifest,组成一个manifest，然后生成一个head_obj，将这些信息保存到head_obj后，将临时对象删除。

3.1.4对象下载

用户除了上传对象外，还可以指定对象的某一段（采用off，length的形式）下载对象的部分内容，RGW首先从head_obj中读出manifest管理结构，然后根据manufest中定义的规则计算出用户请求的数据段保存在哪些对象中，最终从这些对象中读出数据合并后发送给客户端。

3.2 RGW下实现多活的机制

RGW多活方式是在同一zonegroup的多个zone之间进行，即同一zonegroup中多个zone之间的数据是完全一致的，用户可以通过任意zone读写同一份数据。但是，对元数据的操作，比如创建桶、创建用户，仍然只能在master zone进行。对数据的操作，比如创建桶中的对象，访问对象等，可以在任意zone中处理。

下面通过一个例子说明双活配置下，对象存储业务如何访问集群和多个zone之间数据如何同步。该例子实现跨集群的一个zonegroup下两个zone之间的双活。

4总结和展望

RGW在很多领域得到广泛应用，虽然RGW基本功能已经比较完备，但是还是有些小毛病，比如与S3 Java语言SDK不兼容，AWS4认证机制不完善，对象多版本功能存在小问题，但是基础模块已经比较稳定，完全可以使用于生产环境。除此之外，RGW以下几个功能特性也值得期待：

多站点朱博士数据容灾备份
支持元数据搜索功能
支持NFS访问

你可能感兴趣的:(ceph)

【无标题】 KellenKellenHao tomcat java
一、tomcat安装 #关闭防火墙与SELinux [root@proxy_host~]#rz rzwaitingtoreceive.**[root@proxy_host~]#ls anaconda-ks.cfg ceph-release-1-1.el7.noarch.rpm apache-tomcat-8.5.40.tar.gznginx-1.27.3.tar.gz #解压到指定路径
【mongodb】mongodb数据备份与恢复向往风的男子运维日常 DBA mongodb 数据库
本站以分享各种运维经验和运维所需要的技能为主《python零基础入门》：python零基础入门学习《python运维脚本》：python运维脚本实践《shell》：shell学习《terraform》持续更新中：terraform_Aws学习零基础入门到最佳实战《k8》暂未更新《docker学习》暂未更新《ceph学习》ceph日常问题解决分享《日志收集》ELK+各种中间件《运维日常》运维日常《l
rook-ceph配置dashboard代理无法访问
在ceph-tools的pod中看看dashboard是否开启kubectl-nrook-cephexec-itrook-ceph-tools-7b75b967db-jn68d–bashcephmgrservices查看集群内地址使用curl测试能否访问cephmgrmoduledisabledashboard关闭cephmgrmoduleenabledashboard开启rook中关于ceph部
速通Ceph分布式存储（含超详细图解）来自于狂人云计算
前言云计算存储架构图示例存储节点集群RAID控制层物理存储层分布式存储管理层存储接口层接入层OSD主机1OSD主机2OSD主机N磁盘1磁盘2磁盘3磁盘4磁盘5磁盘6RAID0/10/5RAID控制器1RAID0/10/5RAID控制器2RAID0/10/5RAID控制器NMonitor集群大脑OSD数据守护进程MDS元数据服务对象存储块存储文件存储对象网关RBDMDS客户端接入层存储接口层分布式存
使用kolla安装OPENSTACK qhqh310 openstack
安装centos7一、根据这个做一个模板1、编辑host文件10.103.129.146control-110.103.129.147node-110.103.129.148node-210.103.129.149network-110.103.129.150ceph-110.103.129.151ceph-210.103.129.152control-210.103.129.153network
ceph计算PG
计算公式：pg_num={(TargetPGsperOSD)x(OSD#)x(%Data)}/Size注释：TargetPGsperOSD：预估每个OSD的PG数，一般取100计算。当预估以后集群OSD数不会增加时，一般取100计算OSD#：集群OSD数量。%Data：预估该pool占该OSD集群总容量的近似百分比。Size：该pool的副本数。
分布式存储Ceph之PG状态详解 jiangxi_ ceph 运维 ceph pgp 分布式 linux
1.PG介绍一，PG的复杂如下：在架构层次上，PG位于RADOS层的中间。a.往上负责接收和处理来自客户端的请求。b.往下负责将这些数据请求翻译为能够被本地对象存储所能理解的事务。是组成存储池的基本单位，存储池中的很多特性，都是直接依托于PG实现的。面向容灾域的备份策略使得一般而言的PG需要执行跨节点的分布式写，因此数据在不同节点之间的同步、恢复时的数据修复也都是依赖PG完成。2.PG状态表正常的
ceph创建pool时pg_num的配置 lvbibir 数据库
pg_num用此命令创建存储池时：cephosdpoolcreate{pool-name}pg_num确定pg_num取值是强制性的，因为不能自动计算。常用的较为通用的取值：少于5个osd，pg_num设置为128osd数量在5到10个时，pg_num设置为512osd数量在10到50个时，pg_num=4096osd数量大于50是，需要理解ceph的权衡算法，自己计算pg_num取值自行计算pg
ceph 通过 crush rule 修改故障域时空无限 ceph ceph
创建故障域为osd的crushrulecephosdcrushrulecreate-replicatedreplicated_osd_leveldefaultosd设置pool使用新创建的crushrulecephosdpoolsetceph-filesystem-data0crush_rulereplicated_osd_level查看有哪些crushrulecephosdcrushruleli
Rsync实操 KellenKellenHao excel
Rsync实操一.rsync命令 #类似于cp [root@user2~]#[email protected]:/root [email protected]'spassword: [root@user1~]#ls anaconda-ks.cfgceph-release-1-1.el7.noarch.rpminfo.sh二、使用rsync备份push方式服务器：
离线部署openstack 2024.1需求说明、初始化及实例创建过程分析查士丁尼·绵 openstack openstack
背景在ubuntu22.04离线部署openstack2024.1集群，外置存储为cephreef，提供：1、计算虚拟化；2、网络虚拟化，支持协议flat、vlan、vxlan；3、存储对接ceph；4、webUI；5、management网络为bond0，对应vlan10；6、self-service网络为bond0，对应vlan15；7、external网络对应bond1，对应vlan20、2
安装ceph时,出现Some monitors have still not reached quorum
现象：安装ceph时，在获取节点的证书时，也即下面这条语句时遇到问题ceph-deployadminceph1ceph2ceph3报错如下：[ceph3][INFO]Runningcommand:sudoceph--cluster=ceph--admin-daemon/var/run/ceph/ceph-mon.ceph3.asokmon_status[ceph3][ERROR]admin_soc
OpenStack私有云实战答案：Heat编排+KVM优化+Ceph存储对接与排障全解行家说竞赛 #云计算应用赛项 openstack ceph
【题目1】1.2.1Heat编排-创建用户[1分]编写Heat模板create_user.yaml，创建名为heat-user的用户。使用自己搭建的OpenStack私有云平台，使用heat编写摸板(heat_template_version:2016-04-08)创建名为”chinaskills”的domain，在此domain下创建名为beijing_group的租户，在此租户下创建名为clo
【k8s安装redis】k8s环境无pvc的情况下安装redis哨兵集群汪碧康 kubernetes docker redis kubernetes redis docker 容器哨兵 pvc
文章目录简介一.条件及环境说明：二.需求说明：三.实现原理及说明四.详细步骤4.1.规划节点标签4.2.创建configmap配置4.3.创建三个statefulset和serviceheadless配置4.4.创建哨兵deployment配置和service配置五.安装说明简介k8s集群中搭建有状态的服务会相对较麻烦，像搭建redis目前比较主流的做法主要是采用共享存储ceph、nas来实现数据
springboot2.6+awssdk2访问ceph bucket
版本信息：SpringBoot2.6.6awssdk2.17.100Ceph：Quincyv17.2.01、添加cephmaven依赖：父pom文件：。。。。。。2.17.100。。。。。。software.amazon.awssdkbom${awssdk.version}pomimport子pom文件：
【SCI论文写作】机器学习与时间序列医疗健康预测——（EEG）的获取与预处理：Python 实现 LIUDAN'S WORLD 医学 AI python 人工智能前端
当前时间：2025-05-29脑电图（Electroencephalography,EEG）作为一种非侵入性的神经生理监测技术，在医疗健康领域，尤其是在神经科学研究、疾病诊断（如癫痫、睡眠障碍）、脑机接口（BCI）等方面扮演着至关重要的角色。原始EEG信号通常包含复杂的生理信息，但也极易受到各种噪声和伪迹的污染，这为后续的数据分析和解读带来了巨大挑战。因此，对EEG数据进行系统有效的预处理是确保分
ES将快照仓库创建到ceph Nobe_yt es6 elasticsearch
这是在ES6.8.7环境进行的，测试7.6.2也是可以的。注意：所有的ES节点都需要安装对应版本的repository-s3插件。步骤一：提前准备好对象存储，和bukect"access_key":"xxxxxx""secret_key":"xxxxxx""bucket"："xxxxxx"步骤二：设置访问s3账号密码,根据步骤一中准备好的bukect的access_key,secret_key。#
Ceph---ceph 12.2.12 full ratio(s) out of order yysalad ceph
实际使用ceph12.2.12的过程中遇到fullratio(s)outoforder原因：osd_failsafe_full_ratio小于full_ratio解决方法：设置full_ratio小于等于osd_failsafe_full_ratiocephosdset-full-ratio0.97
ceph recovery 相关参数时空无限 ceph ceph
RECOVERY恢复/回填选项修改mClock最大回填/恢复限制的步骤可以修改的最大回填/恢复选项列在“恢复/回填选项”部分。mClock的修改默认回填/恢复限制由osd_mclock_override_recovery_settings选项，设置为默认为false。尝试修改任何默认恢复/回填限制而不设置门控选项，会将该选项重置为mClock默认值，并在集群日志中记录一条警告消息。请注意，默认值可
ceph性能调优时空无限 ceph ceph
硬件方面CPUceph的进程对cpu的依赖强弱MDS>OSD>MON一个MDS进程给4核cpu一个OSD进程给2核cpu一个MON进程给1核cpu内存ceph的进程对cpu的依赖强弱MON>OSD一个MON进程给2G内存一个OSD进程给1G内存（osd使用一个物理磁盘）如果使用多个物理磁盘作为一个OSD，每个OSD进程就需要分配大于1G的内存，另外集群处于recovery状态时，内存消耗会明显增加
017 Ceph的集群管理_3 weixin_30614587 shell 开发工具运维
一、验证OSD1.1osd状态运行状态有：up，in，out，down正常状态的OSD为up且in当OSD故障时，守护进程offline，在5分钟内，集群仍会将其标记为up和in，这是为了防止网络抖动如果5分钟内仍未恢复，则会标记为down和out。此时该OSD上的PG开始迁移。这个5分钟的时间间隔可以通过mon_osd_down_out_interval配置项修改当故障的OSD重新上线以后，会触
ceph 报错 full ratio(s) out of order 时空无限 ceph ceph
fullratio(s)outoforder你遇到的错误信息：fullratio(s)outoforder说明你设置的OSD空间使用阈值之间的数值顺序不正确，即：nearfull_ratio≤backfillfull_ratio≤full_ratio≤osd_failsafe_full_ratio如果它们的关系不满足这个顺序，Ceph就会报这个错误。✅正确的设置顺序示例：阈值名称示例值nearfu
【Ceph】Ceph介绍、原理、架构 bdview 架构 java 运维分布式大数据
目录理解Ceph的三种存储接口:块设备、文件系统、对象存储干货｜非常详细的Ceph介绍、原理、架构1.Ceph架构简介及使用场景介绍1.1Ceph简介1.2Ceph特点1.3Ceph架构1.4Ceph核心组件及概念介绍1.5三种存储类型-块存储1.6三种存储类型-文件存储1.7三种存储类型-对象存储2.CephIO流程及数据分布2.1正常IO流程图2.2新主IO流程图2.3CephIO算法流程2.
为什么现在有些云计算机房ceph和raid都在使用？- Ceph 与 RAID 在云计算和数据中心中的协同作用来自于狂人 Openstack ceph 云计算
引入两个存储技术的对比在当今的云计算和数据中心环境中，Ceph和RAID的共存并非偶然或冗余设计，而是出于对性能、可靠性和成本效益的综合考量。这种组合运作不仅体现了技术选型上的灵活性，也展示了如何根据实际情况灵活调整以实现最佳效果。本文将深入探讨两者各自发挥的不同作用及其相辅相成的关系。1.Ceph的定位：分布式存储系统Ceph是一种强大的分布式存储解决方案，它通过软件定义存储（SDS）的理念，用
ceph osd 磁盘分区对齐时空无限 ceph ceph
分区对齐可以提高读写速度的原理是什么分区对齐可以提高磁盘读写速度的原理主要在于磁盘的物理扇区大小与操作系统发起的读写请求之间是否对齐。如果不对齐，每次读写操作可能会跨越多个物理扇区，造成额外的I/O操作，从而降低性能。原理详解1.物理扇区（PhysicalSector）现代磁盘（尤其是SSD和高容量机械盘）一般使用4KB物理扇区（AdvancedFormat，4Ksector）来代替传统的512B
互联网大厂Java求职面试实战：Spring Boot与微服务场景深度解析码农飞哥 Java场景面试宝典 Java Spring Boot 微服务互联网医疗数据库安全消息队列
1.Python基础专栏，基础知识一网打尽，9.9元买不了吃亏，买不了上当。Python从入门到精通2.毕业设计专栏，毕业季咱们不慌忙，几百款毕业设计等你选。❤️3.Python爬虫专栏，系统性的学习爬虫的知识点。9.9元买不了吃亏，买不了上当。python爬虫入门进阶❤️4.Ceph实战，从原理到实战应有尽有。Ceph实战❤️5.Java高并发编程入门，打卡学习Java高并发。Java高并发编程
云计算-私有云-私有云服务搭建大G哥云计算
私有云一、私有云服务搭建(10)IP地址设置，主机名设置，磁盘分区，文件系统挂载，web、ftp、dns、ntp等常用linux服务器安装与配置。OpenStack云平台搭建基本变量进行配置，安装部署数据库、Keystone服务、Glance服务、Nova服务、Neutron服务、Dashboad服务、Cinder服务、Swift服务、Heat服务、Ceph服务、Ceilometer、manila
云计算-私有云-私有云服务搭建
私有云一、私有云服务搭建（10）IP地址设置，主机名设置，磁盘分区，文件系统挂载，web、ftp、dns、ntp等常用linux服务器安装与配置。OpenStack云平台搭建基本变量进行配置，安装部署数据库、Keystone服务、Glance服务、Nova服务、Neutron服务、Dashboad服务、Cinder服务、Swift服务、Heat服务、Ceph服务、Ceilometer、manila
Ceph IO读写流程详解(一)——RADOSGW ProgrammAffen Ceph ceph linux
1radosgw接收用户请求过程从今天起，我将开启一个专题，讲述一个对象是如何从上传rgw到最终落盘的整个过程，期间也会有一些扩展内容，包括一些c++、网络等基础知识，权当作为一个复习吧。本文是以luminous版本进行讲解，虽然经过了迭代，但大体的思路是不变的。废话不多说，现在开始。Ceph对外提供服务是通过radosgw（存储网关）进行的，那么我们就从rgw的main函数开始进行探讨。该函数位
【ceph】ceph发展历史、组织和前景、整体架构 bdview 架构大数据人工智能运维
Ceph国内用户生态Ceph作为全球最火热的开源分布式存储项目，同样在中国的发展也是非常火热，不断开始在不同领域不同行业及客户系统相融合。典型应用在国内一线互联网公司以及运营商、政府、金融、广电、能源、游戏、直播等行业。当前中国Ceph形势对比前几年已经发生了决定性的变化，随着国内越来越多的各行业用户的使用，足以见证它的稳定性可靠性。Ceph中国用户生态已然形成，可以看到国内如：中国移动、腾讯、阿
Spring的注解积累 yijiesuifeng spring 注解
用注解来向Spring容器注册Bean。需要在applicationContext.xml中注册： <context:component-scan base-package=”pagkage1[,pagkage2,…,pagkageN]”/>。如：在base-package指明一个包 <context:component-sc
传感器百合不是茶 android 传感器
android传感器的作用主要就是来获取数据,根据得到的数据来触发某种事件下面就以重力传感器为例; 1,在onCreate中获得传感器服务 private SensorManager sm;// 获得系统的服务 private Sensor sensor;// 创建传感器实例 @Override protected void
[光磁与探测]金吕玉衣的意义 comsci
这是一个古代人的秘密:现在告诉大家信不信由你们: 穿上金律玉衣的人,如果处于灵魂出窍的状态,可以飞到宇宙中去看星星这就是为什么古代
精简的反序打印某个数沐刃青蛟打印
以前看到一些让求反序打印某个数的程序。比如：输入123，输出321。记得以前是告诉你是几位数的，当时就抓耳挠腮，完全没有思路。似乎最后是用到%和/方法解决的。而今突然想到一个简短的方法，就可以实现任意位数的反序打印（但是如果是首位数或者尾位数为0时就没有打印出来了）代码如下： long num, num1=0;
PHP：6种方法获取文件的扩展名 IT独行者 PHP 扩展名
PHP：6种方法获取文件的扩展名 1、字符串查找和截取的方法 1 $extension = substr ( strrchr ( $file , '.' ), 1); 2、字符串查找和截取的方法二 1 $extension = substr
面试111 文强chu 面试
1事务隔离级别有那些，事务特性是什么（问到一次） 2 spring aop 如何管理事务的，如何实现的。动态代理如何实现，jdk怎么实现动态代理的，ioc是怎么实现的，spring是单例还是多例，有那些初始化bean的方式，各有什么区别（经常问） 3 struts默认提供了那些拦截器（一次） 4 过滤器和拦截器的区别（频率也挺高） 5 final，finally final
XML的四种解析方式小桔子 dom jdom dom4j sax
在平时工作中，难免会遇到把 XML 作为数据存储格式。面对目前种类繁多的解决方案，哪个最适合我们呢？在这篇文章中，我对这四种主流方案做一个不完全评测，仅仅针对遍历 XML 这块来测试，因为遍历 XML 是工作中使用最多的（至少我认为）。　　预备　　测试环境：　　AMD 毒龙1.4G OC 1.5G、256M DDR333、Windows2000 Server
wordpress中常见的操作 aichenglong 中文注册 wordpress 移除菜单
1 wordpress中使用中文名注册解决办法 1)使用插件 2)修改wp源代码进入到wp-include/formatting.php文件中找到 function sanitize_user( $username, $strict = false
小飞飞学管理-1 alafqq 管理
项目管理的下午题，其实就在提出问题（挑刺），分析问题，解决问题。今天我随意看下10年上半年的第一题。主要就是项目经理的提拨和培养。结合我自己经历写下心得对于公司选拔和培养项目经理的制度有什么毛病呢？ 1，公司考察，选拔项目经理，只关注技术能力，而很少或没有关注管理方面的经验，能力。 2，公司对项目经理缺乏必要的项目管理知识和技能方面的培训。 3，公司对项目经理的工作缺乏进行指
IO输入输出部分探讨百合不是茶 IO
//文件处理在处理文件输入输出时要引入java.IO这个包； /* 1，运用File类对文件目录和属性进行操作 2，理解流，理解输入输出流的概念 3，使用字节/符流对文件进行读/写操作 4，了解标准的I/O 5，了解对象序列化 */ //1，运用File类对文件目录和属性进行操作 //在工程中线创建一个text.txt
getElementById的用法 bijian1013 element
getElementById是通过Id来设置/返回HTML标签的属性及调用其事件与方法。用这个方法基本上可以控制页面所有标签，条件很简单，就是给每个标签分配一个ID号。返回具有指定ID属性值的第一个对象的一个引用。语法： &n
励志经典语录 bijian1013 励志人生
经典语录1: 哈佛有一个著名的理论：人的差别在于业余时间，而一个人的命运决定于晚上8点到10点之间。每晚抽出2个小时的时间用来阅读、进修、思考或参加有意的演讲、讨论，你会发现，你的人生正在发生改变，坚持数年之后，成功会向你招手。不要每天抱着QQ/MSN/游戏/电影/肥皂剧……奋斗到12点都舍不得休息，看就看一些励志的影视或者文章，不要当作消遣；学会思考人生，学会感悟人生
[MongoDB学习笔记三]MongoDB分片 bit1129 mongodb
MongoDB的副本集(Replica Set)一方面解决了数据的备份和数据的可靠性问题，另一方面也提升了数据的读写性能。MongoDB分片(Sharding)则解决了数据的扩容问题，MongoDB作为云计算时代的分布式数据库，大容量数据存储，高效并发的数据存取，自动容错等是MongoDB的关键指标。本篇介绍MongoDB的切片(Sharding) 1.何时需要分片 &nbs
【Spark八十三】BlockManager在Spark中的使用场景 bit1129 manager
1. Broadcast变量的存储，在HttpBroadcast类中可以知道 2. RDD通过CacheManager存储RDD中的数据，CacheManager也是通过BlockManager进行存储的 3. ShuffleMapTask得到的结果数据，是通过FileShuffleBlockManager进行管理的，而FileShuffleBlockManager最终也是使用BlockMan
yum方式部署zabbix ronin47 yum方式部署zabbix
安装网络yum库#rpm -ivh http://repo.zabbix.com/zabbix/2.4/rhel/6/x86_64/zabbix-release-2.4-1.el6.noarch.rpm 通过yum装mysql和zabbix调用的插件还有agent代理#yum install zabbix-server-mysql zabbix-web-mysql mysql-
Hibernate4和MySQL5.5自动创建表失败问题解决方法 byalias J2EE Hibernate4
今天初学Hibernate4，了解了使用Hibernate的过程。大体分为4个步骤： ①创建hibernate.cfg.xml文件 ②创建持久化对象 ③创建*.hbm.xml映射文件 ④编写hibernate相应代码在第四步中，进行了单元测试，测试预期结果是hibernate自动帮助在数据库中创建数据表，结果JUnit单元测试没有问题，在控制台打印了创建数据表的SQL语句，但在数据库中
Netty源码学习-FrameDecoder bylijinnan java netty
Netty 3.x的user guide里FrameDecoder的例子，有几个疑问： 1.文档说：FrameDecoder calls decode method with an internally maintained cumulative buffer whenever new data is received. 为什么每次有新数据到达时，都会调用decode方法？ 2.Dec
SQL行列转换方法 chicony 行列转换
create table tb(终端名称 varchar(10) , CEI分值 varchar(10) , 终端数量 int) insert into tb values('三星' , '0-5' , 74) insert into tb values('三星' , '10-15' , 83) insert into tb values('苹果' , '0-5' , 93)
中文编码测试 ctrain 编码
循环打印转换编码 String[] codes = { "iso-8859-1", "utf-8", "gbk", "unicode" }; for (int i = 0; i < codes.length; i++) { for (int j
hive 客户端查询报堆内存溢出解决方法 daizj hive 堆内存溢出
hive> select * from t_test where ds=20150323 limit 2; OK Exception in thread "main" java.lang.OutOfMemoryError: Java heap space 问题原因： hive堆内存默认为256M 这个问题的解决方法为：修改/us
人有多大懒，才有多大闲 (评论『卓有成效的程序员』) dcj3sjt126com 程序员
卓有成效的程序员给我的震撼很大，程序员作为特殊的群体，有的人可以这么懒，懒到事情都交给机器去做，而有的人又可以那么勤奋，每天都孜孜不倦得做着重复单调的工作。在看这本书之前，我属于勤奋的人，而看完这本书以后，我要努力变成懒惰的人。不要在去庞大的开始菜单里面一项一项搜索自己的应用程序，也不要在自己的桌面上放置眼花缭乱的快捷图标
Eclipse简单有用的配置 dcj3sjt126com eclipse
1、显示行号 Window -- Prefences -- General -- Editors -- Text Editors -- show line numbers 2、代码提示字符 Window ->Perferences，并依次展开 Java -> Editor -> Content Assist，最下面一栏 auto-Activation
在tomcat上面安装solr4.8.0全过程 eksliang Solr solr4.0后的版本安装 solr4.8.0安装
转载请出自出处： http://eksliang.iteye.com/blog/2096478 首先solr是一个基于java的web的应用，所以安装solr之前必须先安装JDK和tomcat，我这里就先省略安装tomcat和jdk了第一步：当然是下载去官网上下载最新的solr版本，下载地址
Android APP通用型拒绝服务、漏洞分析报告 gg163 漏洞 android APP 分析
点评：记得曾经有段时间很多SRC平台被刷了大量APP本地拒绝服务漏洞，移动安全团队爱内测（ineice.com）发现了一个安卓客户端的通用型拒绝服务漏洞，来看看他们的详细分析吧。 0xr0ot和Xbalien交流所有可能导致应用拒绝服务的异常类型时，发现了一处通用的本地拒绝服务漏洞。该通用型本地拒绝服务可以造成大面积的app拒绝服务。针对序列化对象而出现的拒绝服务主要
HoverTree项目已经实现分层 hvt 编程 .net Web C#ASP.ENT
HoverTree项目已经初步实现分层，源代码已经上传到 http://hovertree.codeplex.com请到SOURCE CODE查看。在本地用SQL Server 2008 数据库测试成功。数据库和表请参考：http://keleyi.com/a/bjae/ue6stb42.htmHoverTree是一个ASP.NET 开源项目，希望对你学习ASP.NET或者C#语言有帮助，如果你对
Google Maps API v3: Remove Markers 移除标记天梯梦 google maps api
Simply do the following: I. Declare a global variable: var markersArray = []; II. Define a function: function clearOverlays() { for (var i = 0; i < markersArray.length; i++ )
jQuery选择器总结 lq38366 jquery 选择器
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40
基础数据结构和算法六：Quick sort sunwinner Algorithm Quicksort
Quick sort is probably used more widely than any other. It is popular because it is not difficult to implement, works well for a variety of different kinds of input data, and is substantially faster t
如何让Flash不遮挡HTML div元素的技巧_HTML/Xhtml_网页制作刘星宇 html Web
今天在写一个flash广告代码的时候，因为flash自带的链接，容易被当成弹出广告，所以做了一个div层放到flash上面，这样链接都是a触发的不会被拦截，但发现flash一直处于div层上面，原来flash需要加个参数才可以。让flash置于DIV层之下的方法，让flash不挡住飘浮层或下拉菜单，让Flash不档住浮动对象或层的关键参数：wmode=opaque。方法如下：
Mybatis实用Mapper SQL汇总示例 wdmcygah sql mysql mybatis 实用
Mybatis作为一个非常好用的持久层框架，相关资料真的是少得可怜，所幸的是官方文档还算详细。本博文主要列举一些个人感觉比较常用的场景及相应的Mapper SQL写法，希望能够对大家有所帮助。不少持久层框架对动态SQL的支持不足，在SQL需要动态拼接时非常苦恼，而Mybatis很好地解决了这个问题，算是框架的一大亮点。对于常见的场景，例如：批量插入/更新/删除，模糊查询，多条件查询，联表查询，