墨尔本--晴

Ceph RGW 对象上传源码分析

RGW中OP请求处理函数的入口都是process_request，process_request会根据传入的RGWRados参数获取RGWOp，然后当请求合法性通过后去调用rgw_process_authenticated函数执行OP的具体动作。

请求的处理 Collapse source

 
            int  
            process_request(RGWRados*  
            const  
            store, 
           
            RGWREST*  
            const  
            rest, 
           
            RGWRequest*  
            const  
            req, 
           
            const  
            std::string& frontend_prefix, 
           
            const  
            rgw_auth_registry_t& auth_registry, 
           
            RGWRestfulIO*  
            const  
            client_io, 
           
            OpsLogSocket*  
            const  
            olog) 
           
            { 
           
            ... 
           
            RGWOp* op = NULL; 
           
            int  
            init_error = 0; 
           
            bool  
            should_log =  
            false 
            ; 
           
            RGWRESTMgr *mgr; 
           
            RGWHandler_REST *handler = rest->get_handler(store, s, 
           
            auth_registry, 
           
            frontend_prefix, 
           
            client_io, &mgr, &init_error); 
           
            ... 
           
            op = handler->get_op(store); 
            //解析出具体的OP 
           
            ... 
           
            ret = rgw_process_authenticated(handler, op, req, s); 
            //验证OP 
           
            if  
            (ret < 0) { 
           
            abort_early(s, op, ret, handler); 
           
            goto  
            done; 
           
            }

rgw_process_authenticated函数内部执行OP具体动作时候，分为三个阶段pre_exec，execute和complete

OP执行 Collapse source

 
            int  
            rgw_process_authenticated(RGWHandler_REST *  
            const  
            handler, 
           
            RGWOp *& op, 
           
            RGWRequest *  
            const  
            req, 
           
            req_state *  
            const  
            s, 
           
            const  
            bool  
            skip_retarget) 
           
            { 
           
            ... 
           
            req-> 
            log 
            (s,  
            "init op" 
            ); 
           
            ret = op->init_processing(); 
           
            if  
            (ret < 0) { 
           
            return  
            ret; 
           
            } 
           
            req-> 
            log 
            (s,  
            "verifying op mask" 
            ); 
           
            ret = op->verify_op_mask(); 
           
            if  
            (ret < 0) { 
           
            return  
            ret; 
           
            } 
           
            req-> 
            log 
            (s,  
            "verifying op permissions" 
            ); 
           
            ret = op->verify_permission(); 
           
            if  
            (ret < 0) { 
           
            if  
            (s->system_request) { 
           
            dout(2) <<  
            "overriding permissions due to system operation"  
            << dendl; 
           
            }  
            else  
            if  
            (s->auth.identity->is_admin_of(s->user->user_id)) { 
           
            dout(2) <<  
            "overriding permissions due to admin operation"  
            << dendl; 
           
            }  
            else  
            { 
           
            return  
            ret; 
           
            } 
           
            } 
           
            req-> 
            log 
            (s,  
            "verifying op params" 
            ); 
           
            ret = op->verify_params(); 
           
            if  
            (ret < 0) { 
           
            return  
            ret; 
           
            } 
           
            req-> 
            log 
            (s,  
            "pre-executing" 
            ); 
           
            op->pre_exec(); 
           
            req-> 
            log 
            (s,  
            "executing" 
            ); 
           
            op->execute(); 
           
            req-> 
            log 
            (s,  
            "completing" 
            ); 
           
            op->complete(); 
           
            ... 
           
            }

所有的RGW 操作都是继承于基类RGWOp，然后具体的OP重写自己的的execute方法。

对象上传分为整体上传和分段上传。对于选择整体上传和分段上传的选择在于用户单次操作上传文件大小，若大于5GB对象就需要使用分段上传API，否则使用整体上传的API。这个就是用来兼容S3标准（对象操作）

对于整体上传就会对应到RGWPutObjProcessor_Atomic处理类，分段上传会对应RGWPutObjProcessor_Multipart处理类。这两个类会对上传的对象做加密操作，压缩，数据处理等。是整个上传对象操作的核心处理类。关于对上传对象压缩处理见ceph 官方文档介绍。

对于对象文件上传OP的类为RGWPutObj，其定义的execute函数为整个文件上传的入口，整个函数调用及嵌套关系如下所示：

RGWPutObj::execute

RGWPutObj_Compress::prepare
- RGWPutObjProcessor_Atomic::prepare
put_data_and_throttle
- RGWPutObj_Compress::handle_data
  - RGWPutObjProcessor_Atomic::handle_data
    - RGWPutObjProcessor_Atomic::write_data
      - RGWPutObjProcessor_Aio::handle_obj_data
        
        RGWRados::aio_put_obj_data
        
        librados aio API
- RGWPutObjProcessor_Aio::throttle_data
RGWPutObjProcessor::complete
- RGWPutObjProcessor_Atomic::complete

RGWPutObj::execute Collapse source

 
            void  
            RGWPutObj::execute() 
           
            { 
           
            RGWPutObjProcessor *processor = NULL; 
           
            // filter用于对数据进行处理，比如加密和压缩 
           
            RGWPutObjDataProcessor *filter = nullptr; 
           
            std::unique_ptr encrypt; 
           
            // 用于存储用户提供的md5、计算的md5 相关的数组 
           
            char  
            supplied_md5_bin[CEPH_CRYPTO_MD5_DIGESTSIZE + 1]; 
           
            char  
            supplied_md5[CEPH_CRYPTO_MD5_DIGESTSIZE * 2 + 1]; 
           
            char  
            calc_md5[CEPH_CRYPTO_MD5_DIGESTSIZE * 2 + 1]; 
           
            unsigned  
            char  
            m[CEPH_CRYPTO_MD5_DIGESTSIZE]; 
           
            MD5 hash; 
           
            bufferlist bl, aclbl, bs; 
           
            int  
            len; 
           
            map::iterator iter; 
           
            bool  
            multipart; 
           
            // copy source range 相关 
           
            off_t fst; 
           
            off_t lst; 
           
            // 根据zone配置选择object的压缩类型，可为none或具体的压缩插件名字 
           
            // http://docs.ceph.com/docs/kraken/radosgw/compression/ 
           
            const  
            auto& compression_type = store->get_zone_params().get_compression_type( 
           
            s->bucket_info.placement_rule); 
           
            CompressorRef plugin; 
           
            boost::optional compressor; 
           
            bool  
            need_calc_md5 = (dlo_manifest == NULL) && (slo_info == NULL); 
           
            perfcounter->inc(l_rgw_put); 
           
            op_ret = -EINVAL; 
           
            //--------------------------------------------------------- 
           
            // 解析并检查请求参数是否完整、正确 
           
            //--------------------------------------------------------- 
           
            // 判断用户请求object name、bucket name等是否正确 
           
            if  
            (s->object.empty()) { 
           
            goto  
            done; 
           
            } 
           
            if  
            (!s->bucket_exists) { 
           
            op_ret = -ERR_NO_SUCH_BUCKET; 
           
            return 
            ; 
           
            } 
           
            // 解析并判断http请求的相关参数，包括copy obj的情况、包含tagging的情况、包含version的情况，以及基本的objname和bucketname解析 
           
            op_ret = get_params(); 
           
            if  
            (op_ret < 0) { 
           
            ldout(s->cct, 20) <<  
            "get_params() returned ret="  
            << op_ret << dendl; 
           
            goto  
            done; 
           
            } 
           
            op_ret = get_system_versioning_params(s, &olh_epoch, &version_id); 
            //版本号 
           
            if  
            (op_ret < 0) { 
           
            ldout(s->cct, 20) <<  
            "get_system_versioning_params() returned ret=" 
           
            << op_ret << dendl; 
           
            goto  
            done; 
           
            } 
           
            // 判断并处理请求是否提供了md5来校验请求完整 
           
            if  
            (supplied_md5_b64) { 
           
            need_calc_md5 =  
            true 
            ; 
           
            ldout(s->cct, 15) <<  
            "supplied_md5_b64="  
            << supplied_md5_b64 << dendl; 
           
            op_ret = ceph_unarmor(supplied_md5_bin, &supplied_md5_bin[CEPH_CRYPTO_MD5_DIGESTSIZE + 1], 
           
            supplied_md5_b64, supplied_md5_b64 +  
            strlen 
            (supplied_md5_b64)); 
           
            ldout(s->cct, 15) <<  
            "ceph_armor ret="  
            << op_ret << dendl; 
           
            if  
            (op_ret != CEPH_CRYPTO_MD5_DIGESTSIZE) { 
           
            op_ret = -ERR_INVALID_DIGEST; 
           
            goto  
            done; 
           
            } 
           
            buf_to_hex(( 
            const  
            unsigned  
            char  
            *)supplied_md5_bin, CEPH_CRYPTO_MD5_DIGESTSIZE, supplied_md5); 
           
            ldout(s->cct, 15) <<  
            "supplied_md5="  
            << supplied_md5 << dendl; 
           
            } 
           
            // 判断http传输是否使用了chunk传输的方式，如果没有，可以直接根据content length来判断quota，否则需要等到所有chunk接收完成 
           
            //https://www.cnblogs.com/ribavnu/p/5084458.html 
           
            if  
            (!chunked_upload) {  
            /* with chunked upload we don't know how big is the upload. 
           
            we also check sizes at the end anyway */ 
           
            // 判断是否满足user和bucket的quota约束 
           
            op_ret = store->check_quota(s->bucket_owner.get_id(), s->bucket, 
           
            user_quota, bucket_quota, s->content_length); 
           
            if  
            (op_ret < 0) { 
           
            ldout(s->cct, 20) <<  
            "check_quota() returned ret="  
            << op_ret << dendl; 
           
            goto  
            done; 
           
            } 
           
            // 判断是否满足bucket index的shard的约束 http://docs.ceph.com/docs/master/radosgw/dynamicresharding/ 
           
            op_ret = store->check_bucket_shards(s->bucket_info, s->bucket, bucket_quota); 
           
            if  
            (op_ret < 0) { 
           
            ldout(s->cct, 20) <<  
            "check_bucket_shards() returned ret="  
            << op_ret << dendl; 
           
            goto  
            done; 
           
            } 
           
            } 
           
            // 当启用Multipart上传时，用户每次上传新part需要带上之前上传response中返回的etag 
           
            // 判断用户是否提供了etag 
           
            // 关于etag介绍：https://baike.baidu.com/item/ETag/4419019?fr=aladdin 
           
            if  
            (supplied_etag) { 
           
            strncpy 
            (supplied_md5, supplied_etag,  
            sizeof 
            (supplied_md5) - 1); 
           
            supplied_md5[ 
            sizeof 
            (supplied_md5) - 1] =  
            '\0' 
            ; 
           
            } 
           
            // 判断用户是否使用multipart方式的obj，并返回对应的processor ： RGWPutObjProcessor_Atomic 或 RGWPutObjProcessor_Multipart 
           
            // 并用multipart (bool)标识是否是multipart 
           
            processor = select_processor(* 
            static_cast 
            (s->obj_ctx), &multipart); 
           
            // no filters by default 
           
            filter = processor; 
           
            /* Handle object versioning of Swift API. */ 
           
            if  
            (! multipart) { 
           
            rgw_obj obj(s->bucket, s->object); 
           
            op_ret = store->swift_versioning_copy(* 
            static_cast 
            (s->obj_ctx), 
           
            s->bucket_owner.get_id(), 
           
            s->bucket_info, 
           
            obj); 
           
            if  
            (op_ret < 0) { 
           
            goto  
            done; 
           
            } 
           
            } 
           
            // 调用RGWPutObjProcessor_Atomic或RGWPutObjProcessor_Multipart的prepare： 
           
            // RGWPutObjProcessor_Atomic： 
           
            //   写入前的准备工作：生成对象名称前缀、设置placement rules、 
           
            //   在内存中创建对应的对象、设置切分head和tail对象的尺寸等等工作 
           
            // RGWPutObjProcessor_Multipart: 
           
            //   比起Atomic，多了处理uploadId和partNumber的过程http://docs.ceph.com/docs/master/radosgw/s3/objectops/#initiate-multi-part-upload 
           
            // 完成对应的工作后，嵌套调用RGWPutObjProcessor_Aio的prepare： 
           
            //   根据用户配置，设置aio的window size 
           
            // 然后会嵌套调用RGWPutObjProcessor的prepare： 
           
            //   设置RGWPutObjProcessor的store指针 
           
            op_ret = processor->prepare(store, NULL); 
           
            if  
            (op_ret < 0) { 
           
            ldout(s->cct, 20) <<  
            "processor->prepare() returned ret="  
            << op_ret 
           
            << dendl; 
           
            goto  
            done; 
           
            } 
           
            // 如果是copy source range操作，获得source对象的起止偏移 
           
            fst = copy_source_range_fst; 
           
            lst = copy_source_range_lst; 
           
            // sse相关，如果用户设置了sse，则进行加密的准备 
           
            op_ret = get_encrypt_filter(&encrypt, filter); 
           
            if  
            (op_ret < 0) { 
           
            goto  
            done; 
           
            } 
           
            // 需要加密时，filter用于加密数据 
           
            if  
            (encrypt != nullptr) { 
           
            filter = encrypt.get(); 
           
            }  
            else  
            { 
           
            //no encryption, we can try compression 
           
            if  
            (compression_type !=  
            "none" 
            ) { 
           
            // 不需要加密时，并且compression_type被设置了，filter被用于压缩数据 
           
            plugin = get_compressor_plugin(s, compression_type); 
           
            if  
            (!plugin) { 
           
            ldout(s->cct, 1) <<  
            "Cannot load plugin for compression type " 
           
            << compression_type << dendl; 
           
            }  
            else  
            { 
           
            //  如果一切都没问题，构造compressor 
           
            compressor.emplace(s->cct, plugin, filter); 
           
            filter = &*compressor; 
           
            } 
           
            } 
           
            } 
           
            //------------------------------------------------------------------------- 
           
            // 前期参数解析、工具准备、head obj初始化、写入ctx初始化工作完成       
           
            // 下面从req中读取数据，经处理后存入rados 
           
            //------------------------------------------------------------------------- 
           
            do  
            { 
           
            bufferlist data; 
           
            if  
            (fst > lst) 
           
            break 
            ; 
           
            if  
            (!copy_source) { 
           
            // 如果不是copy，是正常的put 
           
            // 读取请求体rgw_max_chunk_size字节的数据到data 
           
            /* 有关rgw_max_chunk_size的解释： 
           
            "The chunk size is the size of RADOS I/O requests that RGW sends when accessing " 
           
            "data objects. RGW read and write operation will never request more than this amount " 
           
            "in a single request. This also defines the rgw object head size, as head operations " 
           
            "need to be atomic, and anything larger than this would require more than a single " 
           
            "operation."), 
           
            */ 
           
            len = get_data(data); 
           
            }  
            else  
            { 
           
            // 否则，从另一个对象读取 
           
            uint64_t cur_lst = min(fst + s->cct->_conf->rgw_max_chunk_size - 1, lst); 
           
            op_ret = get_data(fst, cur_lst, data); 
           
            if  
            (op_ret < 0) 
           
            goto  
            done; 
           
            len = data.length(); 
           
            s->content_length += len; 
           
            fst += len; 
           
            } 
           
            if  
            (len < 0) { 
           
            op_ret = len; 
           
            ldout(s->cct, 20) <<  
            "get_data() returned ret="  
            << op_ret << dendl; 
           
            goto  
            done; 
           
            } 
           
            // 计算data的md5 
           
            if  
            (need_calc_md5) { 
           
            hash.Update(( 
            const  
            byte *)data.c_str(), data.length()); 
           
            } 
           
            /* update torrrent */ 
           
            torrent.update(data); 
           
            /* do we need this operation to be synchronous? if we're dealing with an object with immutable 
           
            * head, e.g., multipart object we need to make sure we're the first one writing to this object 
           
            */ 
           
            bool  
            need_to_wait = (ofs == 0) && multipart; 
           
            bufferlist orig_data; 
           
            if  
            (need_to_wait) { 
           
            orig_data = data; 
           
            } 
           
            // 先将调用RGWPutObj_Compress::handle_data数据进行压缩 
           
            // (或加密 或者 什么都不做) 
           
            // 然后调用RGWPutObjProcessor_Atomic::handle_data 将处理后的数据切分成一个head和多个tail对象 
           
            // handle_data最终调用`store->aio_put_obj_data`函数，将对象写入rados 
           
            // 在使用librados异步写时，需要先调用aio_create_completion函数，该 
           
            // 函数会返回一个rados_completion_t类型的对象，来表示异步写的状态 
           
            // rados_completion_t: Represents the state of an asynchronous operation 
           
            //  - it contains the return value once the operation completes, 
           
            // and can be used to block until the operation is complete or safe. 
           
            // put_data_and_throttle调用throttle_data时会传入这个对象的指针(handle) 
           
            // 这里，如果是上传Multipart类型对象的第一块数据，need_to_wait为true 
           
            // need_to_wait为true表示函数会等到该块数据写入rados才返回（变为同步写） 
           
            op_ret = put_data_and_throttle(filter, data, ofs, need_to_wait); 
           
            if  
            (op_ret < 0) { 
           
            if  
            (!need_to_wait || op_ret != -EEXIST) { 
           
            ldout(s->cct, 20) <<  
            "processor->thottle_data() returned ret=" 
           
            << op_ret << dendl; 
           
            goto  
            done; 
           
            } 
           
            /* need_to_wait == true and op_ret == -EEXIST */ 
           
            ldout(s->cct, 5) <<  
            "NOTICE: processor->throttle_data() returned -EEXIST, need to restart write"  
            << dendl; 
           
            /* restore original data */ 
           
            data.swap(orig_data); 
           
            /* restart processing with different oid suffix */ 
           
            dispose_processor(processor); 
           
            processor = select_processor(* 
            static_cast 
            (s->obj_ctx), &multipart); 
           
            filter = processor; 
           
            string oid_rand; 
           
            char  
            buf[33]; 
           
            gen_rand_alphanumeric(store->ctx(), buf,  
            sizeof 
            (buf) - 1); 
           
            oid_rand.append(buf); 
           
            op_ret = processor->prepare(store, &oid_rand); 
           
            if  
            (op_ret < 0) { 
           
            ldout(s->cct, 0) <<  
            "ERROR: processor->prepare() returned " 
           
            << op_ret << dendl; 
           
            goto  
            done; 
           
            } 
           
            op_ret = get_encrypt_filter(&encrypt, filter); 
           
            if  
            (op_ret < 0) { 
           
            goto  
            done; 
           
            } 
           
            if  
            (encrypt != nullptr) { 
           
            filter = encrypt.get(); 
           
            }  
            else  
            { 
           
            if  
            (compressor) { 
           
            compressor.emplace(s->cct, plugin, filter); 
           
            filter = &*compressor; 
           
            } 
           
            } 
           
            op_ret = put_data_and_throttle(filter, data, ofs,  
            false 
            ); 
           
            if  
            (op_ret < 0) { 
           
            goto  
            done; 
           
            } 
           
            } 
           
            // ofs表示当前已经从请求体中读取的数据长度 
           
            ofs += len; 
           
            // len==0 表示对象数据读取完成 
           
            }  
            while  
            (len > 0); 
           
            { 
           
            // flush 缓冲区 
           
            bufferlist flush; 
           
            op_ret = put_data_and_throttle(filter, flush, ofs,  
            false 
            ); 
           
            if  
            (op_ret < 0) { 
           
            goto  
            done; 
           
            } 
           
            } 
           
            // 如果不是chunk uoload，并且接收到的数据和content length不同，表明传输出现错误 
           
            if  
            (!chunked_upload && ofs != s->content_length) { 
           
            op_ret = -ERR_REQUEST_TIMEOUT; 
           
            goto  
            done; 
           
            } 
           
            s->obj_size = ofs; 
           
            perfcounter->inc(l_rgw_put_b, s->obj_size); 
           
            // 如函数名…… 
           
            op_ret = do_aws4_auth_completion(); 
           
            if  
            (op_ret < 0) { 
           
            goto  
            done; 
           
            } 
           
            // 判断是否超出quota限制 
           
            op_ret = store->check_quota(s->bucket_owner.get_id(), s->bucket, 
           
            user_quota, bucket_quota, s->obj_size); 
           
            if  
            (op_ret < 0) { 
           
            ldout(s->cct, 20) <<  
            "second check_quota() returned op_ret="  
            << op_ret << dendl; 
           
            goto  
            done; 
           
            } 
           
            // 判断是否超出bucket index 某个shards的最大obj数目 
           
            op_ret = store->check_bucket_shards(s->bucket_info, s->bucket, bucket_quota); 
           
            if  
            (op_ret < 0) { 
           
            ldout(s->cct, 20) <<  
            "check_bucket_shards() returned ret="  
            << op_ret << dendl; 
           
            goto  
            done; 
           
            } 
           
            hash.Final(m); 
           
            // 将压缩信息加入attrs 
           
            if  
            (compressor && compressor->is_compressed()) { 
           
            bufferlist tmp; 
           
            RGWCompressionInfo cs_info; 
           
            cs_info.compression_type = plugin->get_type_name(); 
           
            cs_info.orig_size = s->obj_size; 
           
            cs_info.blocks = move(compressor->get_compression_blocks()); 
           
            ::encode(cs_info, tmp); 
           
            attrs[RGW_ATTR_COMPRESSION] = tmp; 
           
            ldout(s->cct, 20) <<  
            "storing "  
            << RGW_ATTR_COMPRESSION 
           
            <<  
            " with type="  
            << cs_info.compression_type 
           
            <<  
            ", orig_size="  
            << cs_info.orig_size 
           
            <<  
            ", blocks="  
            << cs_info.blocks.size() << dendl; 
           
            } 
           
            buf_to_hex(m, CEPH_CRYPTO_MD5_DIGESTSIZE, calc_md5); 
           
            etag = calc_md5; 
           
            // 判断数据的md5是否符合期望 
           
            if  
            (supplied_md5_b64 &&  
            strcmp 
            (calc_md5, supplied_md5)) { 
           
            op_ret = -ERR_BAD_DIGEST; 
           
            goto  
            done; 
           
            } 
           
            // 把acl信息存入xattr 
           
            policy.encode(aclbl); 
           
            emplace_attr(RGW_ATTR_ACL, std::move(aclbl)); 
           
            if  
            (dlo_manifest) { 
           
            op_ret = encode_dlo_manifest_attr(dlo_manifest, attrs); 
           
            if  
            (op_ret < 0) { 
           
            ldout(s->cct, 0) <<  
            "bad user manifest: "  
            << dlo_manifest << dendl; 
           
            goto  
            done; 
           
            } 
           
            complete_etag(hash, &etag); 
           
            ldout(s->cct, 10) << __func__ <<  
            ": calculated md5 for user manifest: "  
            << etag << dendl; 
           
            } 
           
            if  
            (slo_info) { 
           
            bufferlist manifest_bl; 
           
            ::encode(*slo_info, manifest_bl); 
           
            emplace_attr(RGW_ATTR_SLO_MANIFEST, std::move(manifest_bl)); 
           
            hash.Update((byte *)slo_info->raw_data, slo_info->raw_data_len); 
           
            complete_etag(hash, &etag); 
           
            ldout(s->cct, 10) << __func__ <<  
            ": calculated md5 for user manifest: "  
            << etag << dendl; 
           
            } 
           
            // etag相关 
           
            if  
            (supplied_etag && etag.compare(supplied_etag) != 0) { 
           
            op_ret = -ERR_UNPROCESSABLE_ENTITY; 
           
            goto  
            done; 
           
            } 
           
            bl.append(etag.c_str(), etag.size() + 1); 
           
            emplace_attr(RGW_ATTR_ETAG, std::move(bl)); 
           
            // 将其他 (其他从http请求中获得的、对象需要的attr)，存入xattr 
           
            populate_with_generic_attrs(s, attrs); 
           
            op_ret = rgw_get_request_metadata(s->cct, s->info, attrs); 
           
            if  
            (op_ret < 0) { 
           
            goto  
            done; 
           
            } 
           
            encode_delete_at_attr(delete_at, attrs); 
           
            encode_obj_tags_attr(obj_tags.get(), attrs); 
           
            /* Add a custom metadata to expose the information whether an object 
           
            * is an SLO or not. Appending the attribute must be performed AFTER 
           
            * processing any input from user in order to prohibit overwriting. */ 
           
            if  
            (slo_info) { 
           
            bufferlist slo_userindicator_bl; 
           
            slo_userindicator_bl.append( 
            "True" 
            , 4); 
           
            emplace_attr(RGW_ATTR_SLO_UINDICATOR, std::move(slo_userindicator_bl)); 
           
            } 
           
            // 完成之前未完成的head和tail的写入，为head设置xattr 
           
            op_ret = processor->complete(s->obj_size, etag, &mtime, real_time(), attrs, 
           
            (delete_at ? *delete_at : real_time()), if_match, if_nomatch, 
           
            (user_data.empty() ? nullptr : &user_data)); 
           
            // only atomic upload will upate version_id here 
           
            if  
            (!multipart) 
           
            version_id = ( 
            static_cast 
            (processor))->get_version_id(); 
           
            /* produce torrent */ 
           
            if  
            (s->cct->_conf->rgw_torrent_flag && (ofs == torrent.get_data_len())) 
           
            { 
           
            torrent.init(s, store); 
           
            torrent.set_create_date(mtime); 
           
            op_ret =  torrent.complete(); 
           
            if  
            (0 != op_ret) 
           
            { 
           
            ldout(s->cct, 0) <<  
            "ERROR: torrent.handle_data() returned "  
            << op_ret << dendl; 
           
            goto  
            done; 
           
            } 
           
            } 
           
            done: 
           
            // 释放processor 
           
            dispose_processor(processor); 
           
            perfcounter->tinc(l_rgw_put_lat, 
           
            (ceph_clock_now() - s-> 
            time 
            )); 
           
            }

下面主要是在execute中主要执行的一些方法的说明：

prepare阶段：该阶段主要是初始化manifest结构体：

prepare阶段 Collapse source

put_data_and_throttle

在execute中，这个函数被调用的过程如下：

put_data_and_throttle Collapse source

不断的从请求中获取最多rgw_max_chunk_size字节的数据放入到bufferlist中，然后交给Processor分片或者写入Rodos底层。

put_data_and_throttle Collapse source

 
            static  
            inline  
            int  
            put_data_and_throttle(RGWPutObjDataProcessor *processor, 
           
            bufferlist& data, off_t ofs, 
           
            bool  
            need_to_wait) 
           
            { 
           
            bool  
            again =  
            false 
            ; 
           
            do  
            { 
           
            void  
            *handle = nullptr; 
           
            rgw_raw_obj obj; 
           
            uint64_t size = data.length(); 
           
            // handle指针指向aio返回的对象，可以通过handle得知aio是否完成 
           
            int  
            ret = processor->handle_data(data, ofs, &handle, &obj, &again); 
           
            if  
            (ret < 0) 
           
            return  
            ret; 
           
            if  
            (handle != nullptr) 
           
            { 
           
            // 将obj和handle封装后放入 Aio类的pending队列 
           
            // 并根据window_size限制pending队列的大小 
           
            ret = processor->throttle_data(handle, obj, size, need_to_wait); 
           
            if  
            (ret < 0) 
           
            return  
            ret; 
           
            } 
           
            else 
           
            break 
            ; 
           
            need_to_wait =  
            false 
            ;  
            /* the need to wait only applies to the first 
           
            * iteration */ 
           
            }  
            while  
            (again); 
           
            return  
            0; 
           
            }  
            /* put_data_and_throttle */

RGWPutObjProcessor_Atomic::handle_data

这个函数主要完成的是将一个rgw对象切分成一个head对象和多个tail对象的操作，然后调用write_data函数异步写入rados。

RGWPutObjProcessor_Atomic::handle_data Collapse source

 
            int  
            RGWPutObjProcessor_Atomic::handle_data(bufferlist &bl, off_t ofs,  
            void  
            **phandle, rgw_raw_obj *pobj,  
            bool  
            *again) 
           
            { 
           
            *phandle = NULL; 
           
            // data_ofs表示当前已经执行写入操作的所有数据 
           
            // next_part_ofs表示下一rados对象的开头，也就是当前要写入的rados对象的结尾 
           
            // 也就是说，总数据从cur_part_ofs开始到next_part_ofs结束的部分写入cur_obj指向的rados对象 
           
            // 这么做是因为一个rgw对象会被切分成多个rados对象（一个head，多个tail），每个默认大小4M 
           
            uint64_t max_write_size = std::min(max_chunk_size, (uint64_t)next_part_ofs - data_ofs); 
           
            // 把bl中的数据move到pending_data_bl的尾部 
           
            pending_data_bl.claim_append(bl); 
           
            // 如果加上bl中的数据，数据总长度仍然达不到写入操作的阈值（max_chunk_size），返回，等待下一次handle_data的调用 
           
            if  
            (pending_data_bl.length() < max_write_size) 
           
            { 
           
            *again =  
            false 
            ; 
           
            return  
            0; 
           
            } 
           
            // 把pending_data_bl前max_write_size字节的数据移到bl中 
           
            pending_data_bl.splice(0, max_write_size, &bl); 
           
            // 如果pending_data_bl剩下的数据仍然大大于写入操作的阈值（max_chunk_size） 
           
            /* do we have enough data pending accumulated that needs to be written? */ 
           
            *again = (pending_data_bl.length() >= max_chunk_size); 
           
            // 如果是head对象 并且 immutable_head()为false 
           
            // data_ofs为0表示第一次写数据 
           
            // immutable_head()函数 
           
            //   在RGWPutObjProcessor_Atomic中默认返回false 
           
            //   但可能会被子类继承并重写 
           
            if  
            (!data_ofs && !immutable_head()) 
           
            { 
           
            // 将bl中数据move到first_chunk中 
           
            first_chunk.claim(bl); 
           
            obj_len = (uint64_t)first_chunk.length(); 
           
            // 更新next_part_ofs和cur_part_ofs，将cur_obj指针指向当前要写入的rados对象 
           
            int  
            r = prepare_next_part(obj_len); 
           
            if  
            (r < 0)  
            return  
            r; 
           
            // 更新总写入的数据偏移data_ofs 
           
            data_ofs = obj_len; 
           
            return  
            0; 
           
            } 
           
            off_t write_ofs = data_ofs; 
           
            data_ofs = write_ofs + bl.length(); 
           
            // 对于不可改变类型的对象，当上传其head对象时，做一下标志，让后面做特别处理 
           
            bool  
            exclusive = (!write_ofs && immutable_head());  
            /* immutable head object, need to verify nothing exists there 
           
            we could be racing with another upload, to the same 
           
            object and cleanup can be messy */ 
           
            // 该函数先判断write_ofs是否大于next_part_ofs 
           
            // 如果是，则调用prepare_next_part函数，更新cur_obj、cur_part_ofs、next_part_ofs 
           
            // 然后，将pobj设为cur_obj 
           
            // 最后调用 hanle_obj_data 函数，做进一步操作 
           
            // hanle_obj_data通过aio_put_obj_data，最终调用了librados aio相关的api，将数据异步写入rados 
           
            int  
            ret = write_data(bl, write_ofs, phandle, pobj, exclusive); 
           
            if  
            (ret >= 0) 
           
            {  
            /* we might return, need to clear bl as it was already sent */ 
           
            bl.clear(); 
           
            } 
           
            return  
            ret; 
           
            }

complete函数其实就是调用了do_complelte,这个函数主要是做收尾工作，之前在put_data_and_throttle函数中开始了异步写流程，在收尾时，首先等待所有异步写操作完成。然后将上传的rgw对象的attrs信息写入head对象的xattr中,完成对象上传操作。

RGWPutObjProcessor_Atomic::do_complete Collapse source

 
            int  
            RGWPutObjProcessor_Atomic::do_complete( 
            size_t  
            accounted_size,  
            const  
            string& etag, 
           
            real_time *mtime, real_time set_mtime, 
           
            map& attrs, 
           
            real_time delete_at, 
           
            const  
            char  
            *if_match, 
           
            const  
            char  
            *if_nomatch,  
            const  
            string *user_data, 
           
            rgw_zone_set *zones_trace) { 
           
            int  
            r = complete_writing_data(); 
            //等待该rgw对象的所有异步写完成 
           
            if  
            (r < 0) 
           
            return  
            r; 
           
            obj_ctx.obj.set_atomic(head_obj); 
            //标识该对象为Atomic类型的对象 
           
            RGWRados::Object op_target(store, bucket_info, obj_ctx, head_obj); 
           
            /* some object types shouldn't be versioned, e.g., multipart parts */ 
           
            op_target.set_versioning_disabled(!versioned_object); 
           
            RGWRados::Object::Write obj_op(&op_target); 
            //将该rgw对象的attrs写入head对象的xattr中 
           
            obj_op.meta.data = &first_chunk; 
           
            obj_op.meta.manifest = &manifest; 
           
            obj_op.meta.ptag = &unique_tag;  
            /* use req_id as operation tag */ 
           
            obj_op.meta.if_match = if_match; 
           
            obj_op.meta.if_nomatch = if_nomatch; 
           
            obj_op.meta.mtime = mtime; 
           
            obj_op.meta.set_mtime = set_mtime; 
           
            obj_op.meta.owner = bucket_info.owner; 
           
            obj_op.meta.flags = PUT_OBJ_CREATE; 
           
            obj_op.meta.olh_epoch = olh_epoch; 
           
            obj_op.meta.delete_at = delete_at; 
           
            obj_op.meta.user_data = user_data; 
           
            obj_op.meta.zones_trace = zones_trace; 
           
            r = obj_op.write_meta(obj_len, accounted_size, attrs); 
            //此处进行attribute参数的写入 
           
            if  
            (r < 0) { 
           
            return  
            r; 
           
            } 
           
            canceled = obj_op.meta.canceled; 
           
            return  
            0; 
           
            }

complete_writing_data函数的定义如下：

complete_writing_data Collapse source

 
            int  
            RGWPutObjProcessor_Atomic::complete_writing_data() 
           
            { 
           
            if  
            (!data_ofs && !immutable_head()) { 
           
            /* only claim if pending_data_bl() is not empty. This is needed because we might be called twice 
           
            * (e.g., when a retry due to race happens). So a second call to first_chunk.claim() would 
           
            * clobber first_chunk 
           
            */ 
           
            if  
            (pending_data_bl.length() > 0) { 
           
            first_chunk.claim(pending_data_bl); 
           
            } 
           
            obj_len = (uint64_t)first_chunk.length(); 
           
            } 
           
            while  
            (pending_data_bl.length()) { 
            //分多次IO写入rados对象 
           
            void  
            *handle = nullptr; 
           
            rgw_raw_obj obj; 
           
            uint64_t max_write_size = MIN(max_chunk_size, (uint64_t)next_part_ofs - data_ofs); 
            //每个I/O大小 
           
            if  
            (max_write_size > pending_data_bl.length()) { 
           
            max_write_size = pending_data_bl.length(); 
           
            } 
           
            bufferlist bl; 
           
            pending_data_bl.splice(0, max_write_size, &bl); 
           
            uint64_t write_len = bl.length(); 
           
            int  
            r = write_data(bl, data_ofs, &handle, &obj,  
            false 
            ); 
           
            if  
            (r < 0) { 
           
            ldout(store->ctx(), 0) <<  
            "ERROR: write_data() returned "  
            << r << dendl; 
           
            return  
            r; 
           
            } 
           
            data_ofs += write_len; 
           
            r = throttle_data(handle, obj, write_len,  
            false 
            ); 
           
            if  
            (r < 0) { 
           
            ldout(store->ctx(), 0) <<  
            "ERROR: throttle_data() returned "  
            << r << dendl; 
           
            return  
            r; 
           
            } 
           
            if  
            (data_ofs >= next_part_ofs) { 
            //下一个Rados对象保存的用户数据便宜位置 
           
            r = prepare_next_part(data_ofs); 
           
            if  
            (r < 0) { 
           
            ldout(store->ctx(), 0) <<  
            "ERROR: prepare_next_part() returned "  
            << r << dendl; 
           
            return  
            r; 
           
            } 
           
            } 
           
            } 
           
            int  
            r = complete_parts(); 
           
            if  
            (r < 0) { 
           
            return  
            r; 
           
            } 
           
            r = drain_pending(); 
           
            if  
            (r < 0) 
           
            return  
            r; 
           
            return  
            0; 
           
            }

总结：

整个过程就如下图所示：

prepare：在prepare阶段的主要工作时初始化 manifest 数据结构。
handle_data：handle_data阶段，RGW每次从HTTP Server 缓冲区中取出rgw_max_chunk_size字节的数据，存放在bufferlist中，然后分成一个或多个I/O异步下发到RADOS层，每个I/O的大小等于MIN（rgw_max_chunk_size, next_part_ofs - data_ofs），其中next_part_ofs表示下一个RADOS对象保存的用户数据偏位置，data_ofs 表示当前数据的偏移位置。
complete：等所有数据上传成功后，对象上传进入complate阶段，该阶段的主要工作时将对象的元数据更新到head_obj中，同时将对象条目更新到索引对象中，以便连续列举对象。

nfs-ganesha(用户态NFS)编译、安装和使用沙拉OK Ceph分布式存储运维 ceph nfs 经验分享
前面的文章介绍了基于社区或自己项目编译rpm包搭建Ceph分布式存储集群的方法。本篇介绍使用nfs-ganesha源码编译、安装，客户端使用用户态nfs协议挂载使用Ceph文件存储和对象存储的方法。编译与安装nfs-ganesha一、获取源码源码可直接从github上gitclone，也可以使用自己库维护的代码：github：[email protected]:nfs-ganesha/n
【从问题中去学习k8s】k8s中的常见面试题（夯实理论基础）（二十八）向往风的男子 k8s 学习 kubernetes 容器
本站以分享各种运维经验和运维所需要的技能为主《python零基础入门》：python零基础入门学习《python运维脚本》：python运维脚本实践《shell》：shell学习《terraform》持续更新中：terraform_Aws学习零基础入门到最佳实战《k8》从问题中去学习k8s《docker学习》暂未更新《ceph学习》ceph日常问题解决分享《日志收集》ELK+各种中间件《运维日常》
ceph KVM使用rbd做存储 SkTj
博客：https://blog.csdn.net/bobpen/article/details/40112939博客：http://www.aboutyun.com/thread-13195-1-1.html导言很多cepher都会使用RBD块存储功能，下面介绍qemu-kvm访问RBD的方法。操作目前Ubuntu14.04.x和CentOS7.1(如使用CentOS7建议升级到7.1，CentO
【从问题中去学习k8s】k8s中的常见面试题（夯实理论基础）（十一）向往风的男子 k8s 学习 kubernetes 容器
本站以分享各种运维经验和运维所需要的技能为主《python零基础入门》：python零基础入门学习《python运维脚本》：python运维脚本实践《shell》：shell学习《terraform》持续更新中：terraform_Aws学习零基础入门到最佳实战《k8》从问题中去学习k8s《docker学习》暂未更新《ceph学习》ceph日常问题解决分享《日志收集》ELK+各种中间件《运维日常》
【mysql】mysql之优化向往风的男子 DBA mysql 数据库
本站以分享各种运维经验和运维所需要的技能为主《python零基础入门》：python零基础入门学习《python运维脚本》：python运维脚本实践《shell》：shell学习《terraform》持续更新中：terraform_Aws学习零基础入门到最佳实战《k8》从问题中去学习k8s《docker学习》暂未更新《ceph学习》ceph日常问题解决分享《日志收集》ELK+各种中间件《运维日常》
python 物理引擎摩擦力_Python物理引擎简单的艾伦 python 物理引擎摩擦力
Python的强大源自众多领域大牛的支持，例如物理引擎方面，就有N多模块支持PyODEPyODEisasetofopen-sourcePythonbindingsforTheOpenDynamicsEngine,anopen-sourcephysicsengine.PyMunkpymunkisaeasy-to-usepythonic2dphysicslibrarythatcanbeusedwhen
k8s 存储(PV、PVC、SC、本地存储、NFS) 大江东去了吗 kubernetes java linux
存储持久化相关三个概念:PersistentVolume(PV)是对具体存储资源的描述，比如NFS、Ceph、GlusterFS等，通过PV可以访问到具体的存储资源;PersistentVolumeClaim(PVC)Pod想要使用具体的存储资源需要对接到PVC，PVC里会定义好Pod希望使用存储的属性，通过PVC再去申请合适的存储资源(PV)，匹配到合适的资源后PVC和PV会进行绑定，它们两者是
cephadm搭建ceph文件集群存储 L__liurs 服务器
一、基础配置1、配置主机名[root@ecs-cd34~]hostnamectlset-hostnamenode1[root@ecs-cd34~]execbash#主机名生效2、配置hosts解析（根据自己的服务器id修改）cat>>/etc/hosts/etc/docker/daemon.json<
存储集群消除pg数量过多的告警大大金 ceph
[root@xxxxxxxxxxxxxx~]#ceph-scluster334cfe7e-9ccc-483d-8d2c-218fde3a5fdehealthHEALTH_WARNtoomanyPGsperOSD(307>max300)nodeep-scrubflag(s)setmonmape1:3monsat{node1=100.88.28.11:6789/0,node2=100.88.28.12
linux搭建ceph集群浓黑的daidai linux ceph 服务器
linux三节点搭建ceph集群主机IP主机名称172.26.50.75node1172.26.50.112node2172.26.50.228node3ceph-mon，ceph-mgr，ceph-mds都搭建在node1上，node2和node3上搭建ceph-osd，每个机器1个osdCeph是一个分布式的存储系统，可以在统一的系统中提供唯一的对象、块和文件存储，Ceph的大致组件如下：1.
3. ceph-mimic版本部署 Martin_wjc 7 存储 ceph chrome 前端
ceph-mimic版本部署一、ceph-mimic版本部署1、环境规划2、系统基础环境准备2.1关闭防火墙、SELinux2.2确保所有主机时间同步2.3所有主机ssh免密2.4添加所有主机解析3、配置ceph软件仓库4、安装ceph-deploy工具5、ceph集群初始化6、所有ceph集群节点安装相关软件7、客户端安装ceph-common软件8、在ceph集群中创建cephmonitor组
upmap的存储池osd坏盘处理问题奋斗的松鼠 ceph
写在前面喜欢ceph的话欢迎关注奋斗的cepher微信公众号阅读更多好文！在《坏盘处理时osd为什么不要rm》文章中，松鼠哥对比了多组各种osd处理与数据的情况，有一个细节，那就是如果osd在重建前后要保持pg映射的一致性，那么存储池做均衡使用的是crush-compat模式，同时有读者老铁留言，说当存储池使用了upmap模式做存储池均衡的话，osd重建前后将不能保持相同的pg映射。因为松鼠哥对存
【从问题中去学习k8s】k8s中的常见面试题（夯实理论基础）（二十四）向往风的男子 k8s 学习 kubernetes 容器
本站以分享各种运维经验和运维所需要的技能为主《python零基础入门》：python零基础入门学习《python运维脚本》：python运维脚本实践《shell》：shell学习《terraform》持续更新中：terraform_Aws学习零基础入门到最佳实战《k8》从问题中去学习k8s《docker学习》暂未更新《ceph学习》ceph日常问题解决分享《日志收集》ELK+各种中间件《运维日常》
【从问题中去学习k8s】k8s中的常见面试题（夯实理论基础）（十九）向往风的男子 k8s 学习 kubernetes 容器
本站以分享各种运维经验和运维所需要的技能为主《python零基础入门》：python零基础入门学习《python运维脚本》：python运维脚本实践《shell》：shell学习《terraform》持续更新中：terraform_Aws学习零基础入门到最佳实战《k8》从问题中去学习k8s《docker学习》暂未更新《ceph学习》ceph日常问题解决分享《日志收集》ELK+各种中间件《运维日常》
【从问题中去学习k8s】k8s中的常见面试题（夯实理论基础）（二）向往风的男子 k8s 学习 kubernetes 容器
本站以分享各种运维经验和运维所需要的技能为主《python零基础入门》：python零基础入门学习《python运维脚本》：python运维脚本实践《shell》：shell学习《terraform》持续更新中：terraform_Aws学习零基础入门到最佳实战《k8》从问题中去学习k8s《docker学习》暂未更新《ceph学习》ceph日常问题解决分享《日志收集》ELK+各种中间件《运维日常》
【从问题中去学习k8s】k8s中的常见面试题（夯实理论基础）（二十三）向往风的男子 k8s 学习 kubernetes 容器
本站以分享各种运维经验和运维所需要的技能为主《python零基础入门》：python零基础入门学习《python运维脚本》：python运维脚本实践《shell》：shell学习《terraform》持续更新中：terraform_Aws学习零基础入门到最佳实战《k8》从问题中去学习k8s《docker学习》暂未更新《ceph学习》ceph日常问题解决分享《日志收集》ELK+各种中间件《运维日常》
ceph rgw：bucket policy实现牛牛Blog Ceph ceph rgw bucket policy实现
cephrgw：bucketpolicy实现相比于aws，rgw的bucketpolicy实现的还不是很完善，有很多细节都不支持，并且已支持的特性也在很多细节方面与s3不同，尤其是因为rgw不支持类似s3的accountuser结构，而使用tenant作为替代而导致的一些不同。并且在文档中还提及，为了修正这种不同，以及支持更多特性，在不久后会重写rgw的Authentication/Authori
ceph rgw java_ceph rgw multisite基本用法 weixin_39587113 ceph rgw java
Realm：Zonegroup：理解为数据中心，由一个或多个Zone组成，每个Realm有且仅有一个MasterZonegroup，用于处理系统变更，其他的称为SlaveZonegroup，元数据与MasterZonegroup保持一致；Zone:Zone是一个逻辑概念，包含一个或者多个RGW实例。每个Zonegroup有且仅有一个MasterZone，用于处理bucket和user等元数据变更。
一文读懂CEPH RGW基本原理 shichungang ceph 分布式大数据云计算
一文读懂CEPHRGW基本原理一、RGW简介二、RGW的组成结构三、Rgw用户信息四、BUCKET与对象索引信息五、RGW对象与RADOS对象的关系六、上传对象的处理流程七、RGW的双活机制八、RGW版本管理机制与CLS机制九、结语本文从RGW的基本原理出发，从整体上描述RGW的框架结构，突出关键结构之间的关联关系，从基础代码分析关键环节的实现细节，以达到清晰说明RGW模块“骨架”的效果。一、RG
【mysql】mysql之存储引擎学习向往风的男子 DBA mysql 学习数据库
本站以分享各种运维经验和运维所需要的技能为主《python零基础入门》：python零基础入门学习《python运维脚本》：python运维脚本实践《shell》：shell学习《terraform》持续更新中：terraform_Aws学习零基础入门到最佳实战《k8》从问题中去学习k8s《docker学习》暂未更新《ceph学习》ceph日常问题解决分享《日志收集》ELK+各种中间件《运维日常》
【ceph学习】ceph如何进行数据的读写（2）陶二先生 ceph osd
本章摘要上文说到，librados/IoctxImpl.cc中调用objecter_op和objecter的op_submit函数，进行op请求的封装、加参和提交。本文详细介绍相关函数的调用。osdc中的操作初始化Op对象，提交请求设置Op对象的时间，oid，操作类型等信息。//osdc/Objector.h//mid-levelhelpersOp*prepare_mutate_op(consto
【ceph学习】ceph如何进行数据的读写（3）陶二先生 ceph osd messenger
本章摘要上文说到，osdc中封装请求，使用message中的相关机制将请求发送出去。本文详细介绍osd服务端如何进行请求的接收。osd初始化osd启动时，定义了message变量ms_public，该变量绑定public网络，负责接收客户端的请求。ms_public会启动对应的线程进行接收，并指定接收函数。//ceph_osd.ccMessenger*ms_public=Messenger::cr
云原生应用(7)之Docker容器数据持久化存储机制技术路上的苦行僧云原生应用与架构设计云原生 docker 容器 docker容器数据持久化
一、Docker容器数据持久化存储介绍物理机或虚拟机数据持久化存储由于物理机或虚拟机本身就拥有大容量的磁盘，所以可以直接把数据存储在物理机或虚拟机本地文件系统中，亦或者也可以通过使用额外的存储系统（NFS、GlusterFS、Ceph等）来完成数据持久化存储。Docker容器数据持久化存储由于Docker容器是由容器镜像生成的，所以一般容器镜像中包含什么文件或目录，在容器启动后，我们依旧可以看到相
Openstack 与 Ceph集群搭建(下)： Openstack部署范枝洲系统运维 openstack ceph
文章目录文章参考部署节点准备1.修改Host文件与hostname名称2.安装NTP软件3.网卡配置信息4.开启Docker共享挂载5.安装python虚拟环境6.安装kolla-ansible7.加载AnsiblegalaxyrequirementsOpenstack安装前预配置1.配置密码2.配置multinode文件3.修改全局配置文件Openstack正式安装1.启动bootstrap-s
学习笔记六：ceph介绍以及初始化配置风车带走过往 K8S相关应用学习笔记 ceph
k8s对接cephceph是一种开源的分布式的存储系统，包含以下几种存储类型：块存储（rbd）文件系统cephfs对象存储分布式存储的优点：Ceph核心组件介绍安装Ceph集群初始化配置Ceph安装源安装基础软件包安装ceph集群安装ceph-deploy创建monitor节点修改ceph配置文件配置初始monitor、收集所有的密钥部署osd服务创建ceph文件系统ceph是一种开源的分布式的存
云原生存储解决方案爱技术的小伙子云原生
云原生存储解决方案使用Rook、Ceph等工具进行云原生存储管理云原生存储简介什么是云原生存储云原生存储是指设计用于云原生环境中的存储解决方案，通常在容器化平台如Kubernetes上运行。它提供了高可用性、弹性、可扩展性和自动化管理等特性，满足现代应用的存储需求。云原生存储的重要性动态环境支持：云原生存储能够适应容器化应用的动态变化，提供灵活的存储资源管理。高可用性和持久性：确保数据在容器重启或
【从问题中去学习k8s】k8s中的常见面试题（夯实理论基础）（十二）向往风的男子 k8s 学习 kubernetes 容器
本站以分享各种运维经验和运维所需要的技能为主《python零基础入门》：python零基础入门学习《python运维脚本》：python运维脚本实践《shell》：shell学习《terraform》持续更新中：terraform_Aws学习零基础入门到最佳实战《k8》从问题中去学习k8s《docker学习》暂未更新《ceph学习》ceph日常问题解决分享《日志收集》ELK+各种中间件《运维日常》
【mysql】mysql之数据操作语言（insert、delete、update）向往风的男子 DBA mysql 数据库
本站以分享各种运维经验和运维所需要的技能为主《python零基础入门》：python零基础入门学习《python运维脚本》：python运维脚本实践《shell》：shell学习《terraform》持续更新中：terraform_Aws学习零基础入门到最佳实战《k8》从问题中去学习k8s《docker学习》暂未更新《ceph学习》ceph日常问题解决分享《日志收集》ELK+各种中间件《运维日常》
【从问题中去学习k8s】k8s中的常见面试题（夯实理论基础）（十五）向往风的男子 k8s 学习 kubernetes 容器
本站以分享各种运维经验和运维所需要的技能为主《python零基础入门》：python零基础入门学习《python运维脚本》：python运维脚本实践《shell》：shell学习《terraform》持续更新中：terraform_Aws学习零基础入门到最佳实战《k8》从问题中去学习k8s《docker学习》暂未更新《ceph学习》ceph日常问题解决分享《日志收集》ELK+各种中间件《运维日常》
【从问题中去学习k8s】k8s中的常见面试题（夯实理论基础）（十）向往风的男子 k8s 学习 kubernetes 容器
本站以分享各种运维经验和运维所需要的技能为主《python零基础入门》：python零基础入门学习《python运维脚本》：python运维脚本实践《shell》：shell学习《terraform》持续更新中：terraform_Aws学习零基础入门到最佳实战《k8》从问题中去学习k8s《docker学习》暂未更新《ceph学习》ceph日常问题解决分享《日志收集》ELK+各种中间件《运维日常》
Enum 枚举 120153216 enum 枚举
原文地址：http://www.cnblogs.com/Kavlez/p/4268601.html Enumeration 于Java 1.5增加的enum type...enum type是由一组固定的常量组成的类型，比如四个季节、扑克花色。在出现enum type之前，通常用一组int常量表示枚举类型。比如这样： public static final int APPLE_FUJI = 0
Java8简明教程 bijian1013 java jdk1.8
Java 8已于2014年3月18日正式发布了，新版本带来了诸多改进，包括Lambda表达式、Streams、日期时间API等等。本文就带你领略Java 8的全新特性。一.允许在接口中有默认方法实现 Java 8 允许我们使用default关键字，为接口声明添
Oracle表维护快速备份删除数据 cuisuqiang oracle 索引快速备份删除
我知道oracle表分区，不过那是数据库设计阶段的事情，目前是远水解不了近渴。当前的数据库表，要求保留一个月数据，且表存在大量录入更新，不存在程序删除。为了解决频繁查询和更新的瓶颈，我在oracle内根据需要创建了索引。但是随着数据量的增加，一个半月数据就要超千万，此时就算有索引，对高并发的查询和更新来说，让然有所拖累。为了解决这个问题，我一般一个月会进行一次数据库维护，主要工作就是备
java多态内存分析麦田的设计者 java 内存分析多态原理接口和抽象类
“ 时针如果可以回头，熟悉那张脸，重温嬉戏这乐园，墙壁的松脱涂鸦已经褪色才明白存在的价值归于记忆。街角小店尚存在吗？这大时代会不会牵挂，过去现在花开怎么会等待。但有种意外不管痛不痛都有伤害，光阴远远离开，那笑声徘徊与脑海。但这一秒可笑不再可爱，当天心
Xshell实现Windows上传文件到Linux主机被触发 windows
经常有这样的需求，我们在Windows下载的软件包，如何上传到远程Linux主机上？还有如何从Linux主机下载软件包到Windows下；之前我的做法现在看来好笨好繁琐，不过也达到了目的，笨人有本方法嘛；我是怎么操作的： 1、打开一台本地Linux虚拟机，使用mount 挂载Windows的共享文件夹到Linux上，然后拷贝数据到Linux虚拟机里面；（经常第一步都不顺利，无法挂载Windo
类的加载ClassLoader 肆无忌惮_ ClassLoader
类加载器ClassLoader是用来将java的类加载到虚拟机中，类加载器负责读取class字节文件到内存中，并将它转为Class的对象（类对象），通过此实例的 newInstance()方法就可以创建出该类的一个对象。其中重要的方法为findClass(String name)。如何写一个自己的类加载器呢？首先写一个便于测试的类Student
html5写的玫瑰花知了ing html5
<html> <head> <title>I Love You!</title> <meta charset="utf-8" /> </head> <body> <canvas id="c"></canvas>
google的ConcurrentLinkedHashmap源代码解析矮蛋蛋 LRU
原文地址： http://janeky.iteye.com/blog/1534352 简述 ConcurrentLinkedHashMap 是google团队提供的一个容器。它有什么用呢？其实它本身是对 ConcurrentHashMap的封装，可以用来实现一个基于LRU策略的缓存。详细介绍可以参见 http://code.google.com/p/concurrentlinke
webservice获取访问服务的ip地址 alleni123 webservice
1. 首先注入javax.xml.ws.WebServiceContext, @Resource private WebServiceContext context; 2. 在方法中获取交换请求的对象。 javax.xml.ws.handler.MessageContext mc=context.getMessageContext(); com.sun.net.http
菜鸟的java基础提升之道——————>是否值得拥有百合不是茶
1，c++，java是面向对象编程的语言，将万事万物都看成是对象；java做一件事情关注的是人物，java是c++继承过来的，java没有直接更改地址的权限但是可以通过引用来传值操作地址，java也没有c++中繁琐的操作，java以其优越的可移植型，平台的安全型，高效性赢得了广泛的认同，全世界越来越多的人去学习java，我也是其中的一员 java组成：
通过修改Linux服务自动启动指定应用程序 bijian1013 linux
Linux中修改系统服务的命令是chkconfig (check config)，命令的详细解释如下: chkconfig 功能说明：检查，设置系统的各种服务。语　　法：chkconfig [ -- add][ -- del][ -- list][系统服务] 或 chkconfig [ -- level <</SPAN>
spring拦截器的一个简单实例 bijian1013 java spring 拦截器 Interceptor
Purview接口 package aop; public interface Purview { void checkLogin(); } Purview接口的实现类PurviesImpl.java package aop; public class PurviewImpl implements Purview { public void check
[Velocity二]自定义Velocity指令 bit1129 velocity
什么是Velocity指令在Velocity中，#set,#if, #foreach, #elseif, #parse等，以#开头的称之为指令，Velocity内置的这些指令可以用来做赋值，条件判断，循环控制等脚本语言必备的逻辑控制等语句，Velocity的指令是可扩展的，即用户可以根据实际的需要自定义Velocity指令自定义指令(Directive)的一般步骤 &nbs
【Hive十】Programming Hive学习笔记 bit1129 programming
第二章 Getting Started 1.Hive最大的局限性是什么？一是不支持行级别的增删改(insert, delete, update)二是查询性能非常差(基于Hadoop MapReduce）,不适合延迟小的交互式任务三是不支持事务2. Hive MetaStore是干什么的？Hive persists table schemas and other system metadata.
nginx有选择性进行限制 ronin47 nginx 动静　限制
http { limit_conn_zone $binary_remote_addr zone=addr:10m; limit_req_zone $binary_remote_addr zone=one:10m rate=5r/s;... server {... location ~.*\.(gif|png|css|js|icon)$ {
java-4.-在二元树中找出和为某一值的所有路径 . bylijinnan java
/* * 0.use a TwoWayLinkedList to store the path.when the node can't be path,you should/can delete it. * 1.curSum==exceptedSum:if the lastNode is TreeNode,printPath();delete the node otherwise
Netty学习笔记 bylijinnan java netty
本文是阅读以下两篇文章时： http://seeallhearall.blogspot.com/2012/05/netty-tutorial-part-1-introduction-to.html http://seeallhearall.blogspot.com/2012/06/netty-tutorial-part-15-on-channel.html 我的一些笔记 ===
js获取项目路径 cngolon js
//js获取项目根路径，如： http://localhost:8083/uimcardprj function getRootPath(){ //获取当前网址，如： http://localhost:8083/uimcardprj/share/meun.jsp var curWwwPath=window.document.locati
oracle 的性能优化 cuishikuan oracle SQL Server
在网上搜索了一些Oracle性能优化的文章，为了更加深层次的巩固[边写边记]，也为了可以随时查看，所以发表这篇文章。 1.ORACLE采用自下而上的顺序解析WHERE子句，根据这个原理，表之间的连接必须写在其他WHERE条件之前，那些可以过滤掉最大数量记录的条件必须写在WHERE子句的末尾。（这点本人曾经做过实例验证过，的确如此哦！
Shell变量和数组使用详解 daizj linux shell 变量数组
Shell 变量定义变量时，变量名不加美元符号（$，PHP语言中变量需要），如： your_name="w3cschool.cc" 注意，变量名和等号之间不能有空格，这可能和你熟悉的所有编程语言都不一样。同时，变量名的命名须遵循如下规则：首个字符必须为字母（a-z，A-Z）。中间不能有空格，可以使用下划线（_）。不能使用标点符号。不能使用ba
编程中的一些概念，KISS、DRY、MVC、OOP、REST dcj3sjt126com REST
KISS、DRY、MVC、OOP、REST （1）KISS是指Keep It Simple,Stupid（摘自wikipedia），指设计时要坚持简约原则，避免不必要的复杂化。（2）DRY是指Don't Repeat Yourself（摘自wikipedia），特指在程序设计以及计算中避免重复代码，因为这样会降低灵活性、简洁性，并且可能导致代码之间的矛盾。（3）OOP 即Object-Orie
[Android]设置Activity为全屏显示的两种方法 dcj3sjt126com Activity
1. 方法1：AndroidManifest.xml 里，Activity的 android:theme 指定为" @android:style/Theme.NoTitleBar.Fullscreen" 示例: <application
solrcloud 部署方式比较 eksliang solrCloud
solrcloud 的部署其实有两种方式可选，那么我们在实践开发中应该怎样选择呢？第一种：当启动solr服务器时，内嵌的启动一个Zookeeper服务器，然后将这些内嵌的Zookeeper服务器组成一个集群。第二种：将Zookeeper服务器独立的配置一个集群，然后将solr交给Zookeeper进行管理谈谈第一种：每启动一个solr服务器就内嵌的启动一个Zoo
Java synchronized关键字详解 gqdy365 synchronized
转载自：http://www.cnblogs.com/mengdd/archive/2013/02/16/2913806.html 多线程的同步机制对资源进行加锁，使得在同一个时间，只有一个线程可以进行操作，同步用以解决多个线程同时访问时可能出现的问题。同步机制可以使用synchronized关键字实现。当synchronized关键字修饰一个方法的时候，该方法叫做同步方法。当s
js实现登录时记住用户名 hw1287789687 记住我记住密码 cookie 记住用户名记住账号
在页面中如何获取cookie值呢? 如果是JSP的话,可以通过servlet的对象request 获取cookie,可以参考:http://hw1287789687.iteye.com/blog/2050040 如果要求登录页面是html呢?html页面中如何获取cookie呢? 直接上代码了页面:loginInput.html 代码: <!DOCTYPE html PUB
开发者必备的 Chrome 扩展 justjavac chrome
Firebug：不用多介绍了吧https://chrome.google.com/webstore/detail/bmagokdooijbeehmkpknfglimnifench ChromeSnifferPlus：Chrome 探测器，可以探测正在使用的开源软件或者 js 类库https://chrome.google.com/webstore/detail/chrome-sniffer-pl
算法机试题李亚飞 java 算法机试题
在面试机试时，遇到一个算法题，当时没能写出来，最后是同学帮忙解决的。这道题大致意思是：输入一个数，比如4,。这时会输出： &n
正确配置Linux系统ulimit值字符串 ulimit
在Linux下面部署应用的时候，有时候会遇上Socket/File: Can’t open so many files的问题；这个值也会影响服务器的最大并发数，其实Linux是有文件句柄限制的，而且Linux默认不是很高，一般都是1024，生产服务器用其实很容易就达到这个数量。下面说的是，如何通过正解配置来改正这个系统默认值。因为这个问题是我配置Nginx+php5时遇到了，所以我将这篇归纳进
hibernate调用返回游标的存储过程 Supanccy2013 java DAO oracle Hibernate jdbc
注：原创作品，转载请注明出处。上篇博文介绍的是hibernate调用返回单值的存储过程，本片博文说的是hibernate调用返回游标的存储过程。此此扁博文的存储过程的功能相当于是jdbc调用select 的作用。 1，创建oracle中的包，并在该包中创建的游标类型。 ---创建oracle的程
Spring 4.2新特性-更简单的Application Event wiselyman application
1.1 Application Event Spring 4.1的写法请参考10点睛Spring4.1-Application Event 请对比10点睛Spring4.1-Application Event 使用一个@EventListener取代了实现ApplicationListener接口,使耦合度降低; 1.2 示例包依赖 <p

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他

Ceph RGW 对象上传源码分析

put_data_and_throttle

RGWPutObjProcessor_Atomic::handle_data

你可能感兴趣的:(ceph)