oba没有马

理解 QEMU/KVM 和 Ceph（2）：QEMU 的 RBD 块驱动（block driver）

1. QEMU 的 RBD 块驱动

1.1 QEMU 存储设备

1.2 QEMU 存储栈

1.3 QEMU 的 Ceph RBD 块设备驱动概述

1.4 QEMU 的 qemu_rbd_open 函数

2. 各种情况下的测试结果

2.1 打开 librbd log 和 admin socket

2.2 各种 QEMU 和 ceph 缓存配置的测试结果

2.2.1 测试结果

2.2.2 不使用 ceph 配置文件时的行为

3 qemu配置和rbd参数相互覆盖问题

理解 QEMU/KVM 和 Ceph（2）：QEMU 的 RBD 块驱动（block driver）

本系列文章会总结 QEMU/KVM 和 Ceph 之间的整合：

（1）QEMU-KVM 和 Ceph RBD 的缓存机制总结

（2）QEMU 的 RBD 块驱动（block driver）

（3）存储卷挂接和设备名称

1. QEMU 的 RBD 块驱动

QEMU/KVM 虚机中的磁盘（disk drive），可能虚拟自 Hypervisor 上的 qcow2，raw 等格式的镜像文件，也可能来自网络块设备存储系统比如 Ceph 的一个卷等。QEMU 使用一套统一的插件式的块设备驱动架构，它定义了若干需要每种块设备驱动实现的接口。Ceph RBD 作为其中的一种，与其它种类的块设备驱动没有本质区别。

1.1 QEMU 存储设备

客户机可以拥有的设备和介质：Floppy, CD-ROM, USB stick, SD card, harddisk

主机上的存储设备和介质：

文件，包括 img，iso，NFS 等
CD-ROM (/dev/cdrom)块设备，包括 /dev/sda3, LVM volumes, iSCSI LUNs 等
分布式存储，比如 Sheepdog, Ceph 等

其中，file 指定主机上的镜像文件或者块设备的路径，if 指定存储接口，cache 指定缓存模式。

比如：

（1）使用镜像文件虚拟的 diskdrive

-drive file=/var/lib/nova/instances/cc388037-18dc-4159-896c-2b7180e7dd20/disk,if=none,id=drive-virtio-disk0,format=qcow2,cache=none -device virtio-blk-pci,scsi=off,bus=pci.0,addr=0x4,drive=drive-virtio-disk0,id=virtio-disk0,bootindex=1

（2）使用 Ceph 卷虚拟的 diskdrive

-drive file=rbd:volumes/volume-512c91d8-a4da-4dcf-b5aa-ef43cf25cb3a:id=cinder:key=AQBc4vtV+JywHhAAqX8N+M69PhIJuUzf1mqNAg==:auth_supported=cephx\;none:mon_host=9.115.251.194\:6789\;9.115.251.195\:6789\;9.115.251.218\:6789,if=none,id=drive-virtio-disk1,format=raw,serial=512c91d8-a4da-4dcf-b5aa-ef43cf25cb3a,cache=writeback -device virtio-blk-pci,scsi=off,bus=pci.0,addr=0x6,drive=drive-virtio-disk1,id=virtio-disk1

1.2 QEMU 存储栈

Virtio 是准虚拟化存储接口，提供较好的性能，其中，virtio_blk 是准虚拟化块设备接口。IDE 是 QEMU 全虚拟化接口，提供最好的兼容性，但是性能最差。SCSI 是新的给特定设备的接口。本文以 virtio 为阐述对象。

Virtio 的工作流程（更详细的流程，请访问 KVM 介绍（3）：I/O 全虚拟化和准虚拟化）：

客户机中的应用通过 vfs （linux 虚拟文件系统）访问其由 Ceph image 映射而来的磁盘，该访问通过 virtio 传到 QEMU，它调用响应的块设备驱动来访问该磁盘对应的块存储。

QEMU 需要支持多种块设备，因此，在其代码中，它定义了一个块设备数据结构（BlockDriver），其中包括各种属性，以及各种块设备驱动需要实现的函数。

1.3 QEMU 的 Ceph RBD 块设备驱动概述

(以 QEMU 2.2 代码为分析目标)

对 RBD 驱动来说，QEMU 对于通过 virtio 传过来的虚拟磁盘读写请求，会将其转化为通过 librbd 对 Ceph MON 和 OSD 服务的访问。主要操作包括：

static BlockDriver bdrv_rbd = {
    .format_name        = "rbd",
    .instance_size      = sizeof(BDRVRBDState),
    .bdrv_needs_filename = true,
    .bdrv_file_open     = qemu_rbd_open,
    .bdrv_close         = qemu_rbd_close,
    .bdrv_create        = qemu_rbd_create,
    .bdrv_has_zero_init = bdrv_has_zero_init_1,
    .bdrv_get_info      = qemu_rbd_getinfo,
    .create_opts        = &qemu_rbd_create_opts,
    .bdrv_getlength     = qemu_rbd_getlength,
    .bdrv_truncate      = qemu_rbd_truncate,
    .protocol_name      = "rbd",
    .bdrv_aio_readv         = qemu_rbd_aio_readv,
    .bdrv_aio_writev        = qemu_rbd_aio_writev,
#ifdef LIBRBD_SUPPORTS_AIO_FLUSH
    .bdrv_aio_flush         = qemu_rbd_aio_flush,
#else
    .bdrv_co_flush_to_disk  = qemu_rbd_co_flush,
#endif
#ifdef LIBRBD_SUPPORTS_DISCARD
    .bdrv_aio_discard       = qemu_rbd_aio_discard,
#endif
    .bdrv_snapshot_create   = qemu_rbd_snap_create,
    .bdrv_snapshot_delete   = qemu_rbd_snap_remove,
    .bdrv_snapshot_list     = qemu_rbd_snap_list,
    .bdrv_snapshot_goto     = qemu_rbd_snap_rollback,
#ifdef LIBRBD_SUPPORTS_INVALIDATE
    .bdrv_invalidate_cache  = qemu_rbd_invalidate_cache,
#endif
};

其中，在一个 Ceph 卷第一次被连接到虚机，以及虚机启动时，QEMU 都会为它调用 qemu_rbd_open 函数。注意，qemu 是通过动态链接库的方式来使用 librbd 库的。

1.4 QEMU 的 qemu_rbd_open 函数

在虚机中使用一个从 Ceph volume 中虚拟而来的 disk drive 的第一步，是打开这个设备。

static int qemu_rbd_open(BlockDriverState *bs, QDict *options, int flags, Error **errp) # options 参数见下文描述
{
    BDRVRBDState *s = bs->opaque;
    ...
    opts = qemu_opts_create(&runtime_opts, NULL, 0, &error_abort);
    qemu_opts_absorb_qdict(opts, options, &local_err);
    ...

    filename = qemu_opt_get(opts, "filename");

    if (qemu_rbd_parsename(filename, pool, sizeof(pool),
                           snap_buf, sizeof(snap_buf),
                           s->name, sizeof(s->name),
                           conf, sizeof(conf), errp) < 0) {
        r = -EINVAL;
        goto failed_opts;
    }

    clientname = qemu_rbd_parse_clientname(conf, clientname_buf);
    r = rados_create(&s->cluster, clientname); #创建一个handle，其中，cluster 是保存 handle 的数据结构，clientname 是访问 ceph 的username
    ...

    s->snap = NULL;
    if (snap_buf[0] != '\0') {
        s->snap = g_strdup(snap_buf);
    }

    /*
     * Fallback to more conservative semantics if setting cache
     * options fails. Ignore errors from setting rbd_cache because the
     * only possible error is that the option does not exist, and
     * librbd defaults to no caching. If write through caching cannot
     * be set up, fall back to no caching.
     */
    if (flags & BDRV_O_NOCACHE) { #当缓存模式为 nocache 时，设置 cluster 中的配置为 '关闭 rbd cache'
        rados_conf_set(s->cluster, "rbd_cache", "false");
    } else { #其它 cache 模式下，设置 cluster handle 中的配置为 '打开 rbd cache'
        rados_conf_set(s->cluster, "rbd_cache", "true");
    }
    if (strstr(conf, "conf=") == NULL) { #当没有制定 ceph 配置文件时，调用 rados_conf_read_file 函数去读取默认的文件来配置 cluster handle。
        /* try default location, but ignore failure */
        rados_conf_read_file(s->cluster, NULL); #默认文件主要为 /etc/ceph/ceph.conf
    }
    if (conf[0] != '\0') { 
        r = qemu_rbd_set_conf(s->cluster, conf, errp); #继续将配置保存到 handle cluster，如果包含 'conf=‘，则调用 rados_conf_read_file 函数读取该文件并将其内容保存到 cluster handle
        if (r < 0) {
            goto failed_shutdown;
        }
    }
    r = rados_connect(s->cluster); #使用 cluster handle 连接到 ceph 集群，cluster handle 中的配置只有到此时才得到应用，之前一直在准备它。
    ...
    r = rados_ioctx_create(s->cluster, pool, &s->io_ctx); #创建 ioctx
    ...
    r = rbd_open(s->io_ctx, s->name, &s->image, s->snap); #打开客户机磁盘对应的 Ceph image
    ...
    bs->read_only = (s->snap != NULL); #如果是 snapshot 的，则只读
    qemu_opts_del(opts);
    return 0;
...
}

static int qemu_rbd_set_conf(rados_t cluster, const char *conf, Error **errp)
{
    ...
    buf = g_strdup(conf);
    p = buf;

    while (p) {
        ret = qemu_rbd_next_tok(name, sizeof(name), p,'=', "conf option name", &p, errp);
        ...if (strcmp(name, "conf") == 0) {
            ret = rados_conf_read_file(cluster, value); #如果配置中包括 "conf"，则将其内容读取到 cluster handle。可见，如果配置文件中有 rbd cache 的话，则会覆盖qemu之前所做的设置
            ...
        } else if (strcmp(name, "id") == 0) {
            /* ignore, this is parsed by qemu_rbd_parse_clientname() */
        } else {
            ret = rados_conf_set(cluster, name, value); #将 conf 中的配置保存到 cluster handle
           ...
        }
    }
    g_free(buf);
    return ret;
}

说明，

（1）options 是在 libvirt xml 中该 driver 的各种参数，比如 file、id、mon_hosts 等。比如

file=rbd:volumes/volume-512c91d8-a4da-4dcf-b5aa-ef43cf25cb3a:id=cinder:key=AQBc4vtV+JywHhAAqX8N+M69PhIJuUzf1mqNAg==:auth_supported=cephx\;none:mon_host=9.115.251.194\:6789\;9.115.251.195\:6789\;9.115.251.218\:6789,if=none,id=drive-virtio-disk1,format=raw,serial=512c91d8-a4da-4dcf-b5aa-ef43cf25cb3a,cache=writeback

（2）注意，目前 nova 启动的虚机的 options 中，没有使用 ”conf=“ 来指定 Ceph 配置文件。因此，qemu 能否读到，取决于所调用的  rados_conf_read_file(s->cluster, NULL) 函数能否在默认位置读取到用户放置的文件，包括：

$CEPH_CONF (environment variable)
/etc/ceph/ceph.conf
~/.ceph/config
ceph.conf (in the current working directory)

（3）如果在默认位置有ceph.conf 文件，并且设置了 rbd cache，那么根据上面代码的执行顺序，ceph.conf 中的配置将覆盖 QEMU 设置的 rbd cache 的值。

（4）如果在默认位置没有 ceph.conf 文件，那么 rados_conf_read_file(s->cluster, NULL) 将会失败，那么 rbd cache 是否开启将完全由 QEMU 根据 disk drive 的 cache mode 决定。

（5）从配置文件读 RBDCache 配置也是有道理的，因为一个 hypervisor 上的 RBDCache，不管各个客户机上的 disk drive 设置如何，其配置应该是唯一的。

（6）如果只需要支持将 ceph volume 连接到 Nova 虚机，完全只需要在 Hypervisor 节点上的 ceph.conf 中方式 RBDCache 配置参数，而不需其它比如 MON 地址这样的参数。因为，如果 Ceph 支持多个Ceph 集群的话，如果在 Ceph.conf 中放置 MON 地址等参数的话，由于 ceph.conf 会覆盖 QEMU 中 cinder 带来的配置，反而会带来问题。

（7）如果更改了 ceph 配置文件，需要重新挂接磁盘或者重启虚机。

（8）上面的分析是基于 qemu 2.2。但是，qemu 的代码变化很快，似乎在 qemu 2.4 里面行为发生了变化，可以参考 http://my.oschina.net/u/1047616/blog/525156?p=1。看起来，cache mode 只要不是 none，qemu 都会打开 rbd cache，不管 rbd cache 在配置文件中是 false 还是 true。因此，调试 qemu + rbd 问题，一定要注意代码版本之间逻辑的差异。

/*设置cache的参数*/ 
    if (flags & BDRV_O_NOCACHE) {
        rados_conf_set(s->cluster, "rbd_cache", "false");
    } else {
        rados_conf_set(s->cluster, "rbd_cache", "true");
    }
    r = rados_connect(s->cluster);     //连接cluster

2. 各种情况下的测试结果

2.1 打开 librbd log 和 admin socket

librdb 的日志和 admin socket 是调试 librbd 的重要工具。

1: 修改 /etc/ceph/ceph.conf，添加 log file 和 admin socket 
    [global]
    log file = /var/log/ceph/$name.log
    max open files = 131072
    auth cluster required = none
    auth service required = none
    auth client required = none
    rbd cache = true
    debug perfcounter = 20
    admin socket=/var/run/ceph/rbd-$pid.asok

2: 修改 /etc/apparmor.d/abstractions/libvirt-qemu，添加下列行，使得运行 qemu 的用户有权限读写 log 和 admin socket 文件

# for rbd
capability mknod,

# for rbd
/etc/ceph/ceph.conf r,
/var/log/ceph/* rw,
/var/run/ceph/** rw,

3. 重启 libvirt-bin 和 nova-compute 服务
4. boot 一个新的虚机，或者重启一个已经存在的虚机
5. 使用 admin socket: ceph --admin-daemon /var/run/ceph/rbd-12856.asok perf dump

2.2 各种 QEMU 和 ceph 缓存配置的测试结果

2.2.1 测试结果

#	host ceph.conf	rbd_cache 配置项	guest cache 配置项	实际 RBDCache 模式	实际客户机 drive cache 模式	结论
1	有	true	writeback	打开	writeback	ceph.conf 中有 rbd cache 配置项时，RDBCache 打开还是关闭受该配置项控制；客户机的磁盘的cache 模式受它自己的配置项控制。其它 RBDCache 参数会从 ceph.conf 中读取。
2	有	true	none	打开	none
3	有	false	none	关闭	none
4	有	false	writeback	关闭	writeback
5	有	不配置	none	关闭	none	ceph.conf 中没有 rbd cache 配置项时，RDBCache 打开还是关闭受磁盘驱动的cache 模式控制：'none' 则关闭RBDCache，‘writeback' 则打开RBDCache。其它 RBDCache 参数会从 ceph.conf 中读取。
6	有	不配置	writeback	打开	writeback
7	没有					同 #5 情况，RDBCache 打开还是关闭受磁盘驱动的cache 模式控制：'none' 则关闭RBDCache，‘writeback' 则打开RBDCache。其它 RBDCache 参数完全使用默认值。

以 #1 为例，

root@compute1:/var/log/ceph# cat /etc/ceph/ceph.conf  | grep 'rbd cache'
rbd cache = true
rbd cache writethrough until flush = true

root@compute1:/var/log/ceph# virsh dumpxml instance-00000068 | grep cache
      
      

root@compute1:/var/log/ceph# ceph --admin-daemon rbd-10588.asok config show | grep rbd_cache
    "rbd_cache": "true",
    "rbd_cache_writethrough_until_flush": "true",
    "rbd_cache_size": "33554432",
    "rbd_cache_max_dirty": "25165824",
    "rbd_cache_target_dirty": "16777216",
    "rbd_cache_max_dirty_age": "1",
    "rbd_cache_max_dirty_object": "0", （这是因为 rbd cache writethrough until flush = true 而此时 librbd 还没有收到 flush 操作过）
    "rbd_cache_block_writes_upfront": "false",

2.2.2 不使用 ceph 配置文件时的行为

关于 RBDCache 的默认参数，需要注意不同 librbd 版本中使用的不同值。

librbd 版本

librbd 使用的默认值

不使用 ceph 配置文件，而且 qemu drive 的 cache 模式

为 ’writeback‘ 时的实际 cache 模式

影响

0.87 之前，比如 0.80

rbd cache = false

rbd cache writethrough until flush = false

qemu 设置 rbd cache = true，使用 witeback 模式。

当客户机操作系统不支持 barrier 时，writeback 是不安全的。

0.87

rbd cache = true

rbd cache writethrough until flush = true

qemu 设置 rbd cache = true，使用 rbd cache writethrough until flush 默认值 true。再收到第一个 flush 指令前，使用 writethrough，之后使用 writeback。

安全性得到增强

3 qemu配置和rbd参数相互覆盖问题

（1）QEMU 和 ceph 配置项的相互覆盖问题

http://ceph.com/docs/master/rbd/qemu-rbd/#qemu-cache-options

在没有在 Ceph 配置文件中显式配置 RBD Cache 的参数（尽管Ceph 支持配置项的默认值，但是，看起来，是否在Ceph配置文件中写还是不写，会有不同的效果。。真绕啊。。）时，QEMU 的 cache 配置会覆盖 Ceph 的默认配置。
- qemu driver 'writeback' 相当于 rbd_cache = true
- qemu driver ‘writethrough’ 相当于 ‘rbd_cache = true,rbd_cache_max_dirty = 0’
- qemu driver ‘none’ 相当于 rbd_cache = false
- 一个典型场景是，在 nova.conf 中配置了 ”cache=writeback”，而没有在客户端节点上配置 Ceph 配置文件，这时候将直接打开 RBDCache 并使用 writeback 模式，而不是先 writethrough 后 writeback。
在在 Ceph 配置文件中显式配置了缓存模式的时候，Ceph 的 cache 配置会覆盖 QEMU 的 cache 配置。
如果在 QEMU 的命令行中使用了 cache 配置，则它会覆盖 Ceph 配置文件中的配置。

优先级：QEMU 命令行中的配置 > Ceph 文件中的显式配置 > QEMU 配置 > Ceph 默认配置

（2）在启用 RBDCache 时，必须在 QEMU 中配置 ”cache=writeback”，否则可能会导致数据丢失。在使用文件系统的情况下，这可能会导致文件系统损坏。

Important

If you set rbd_cache=true, you must set cache=writeback or risk data loss. Without cache=writeback, QEMU will not send flush requests to librbd. If QEMU exits uncleanly in this configuration, filesystems on top of rbd can be corrupted.

http://ceph.com/docs/master/rbd/qemu-rbd/#running-qemu-with-rbd

（3）使用 raw 格式的 Ceph 卷设备 “ “

http://ceph.com/docs/master/rbd/qemu-rbd/#creating-images-with-qemu

理论上，你可以使用其他 QEMU 支持的格式比如 qcow2 或者 vmdk，但是它们会带来 overhead
The raw data format is really the only sensible format option to use with RBD. Technically, you could use other QEMU-supported formats (such as qcow2 or vmdk), but doing so would add additional overhead, and would also render the volume unsafe for virtual machine live migration when caching (see below) is enabled.

（4）在新版本的 Ceph 中（将来的版本，尚不知版本号），Ceph 配置项 rbd cache 将会被删除，RBDCache 是否开启将由 QEMU 配置项决定。

也就是说，如果 QEMU 中设置 cache 为 ‘none’ 的话， RBDCache 将不会被使用；设置为 ‘writeback’ 的话，RBDCache 将会被启用。参考链接：ceph : [client] rbd cache = true override qemu cache=none|writeback。

（5）对 Nova 来说，不设置 disk_cachemode 值的话，默认的 driver 的 cache 模式是 ‘none’。但是，在不支持 ‘none’ 模式的存储系统上，会改为使用 ‘writethrough’ 模式。（来源）

转载出处：理解 QEMU/KVM 和 Ceph（2）：QEMU 的 RBD 块驱动（block driver）

Ceph数据恢复方案–分布式文件系统删除数据的恢复 San结构数据恢复数据恢复相关 ceph
提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录前言一、Ceph的三种存储结构二、Ceph中删除数据的恢复提取1.本次案例情况简介：2.数据分析：2.1：BlueStore架构2.2分布式存储中元数据概述2.3提取元数据2.3.2：获取meta_data2.3.4.元数据整理2.3.5.计算数据地址3.数据恢复提取总结前言什么是分布式文件系统分布式文件系统（Distribu
【mysql】mysql之主从部署以及介绍向往风的男子 DBA mysql 数据库
本站以分享各种运维经验和运维所需要的技能为主《python零基础入门》：python零基础入门学习《python运维脚本》：python运维脚本实践《shell》：shell学习《terraform》持续更新中：terraform_Aws学习零基础入门到最佳实战《k8》从问题中去学习k8s《docker学习》暂未更新《ceph学习》ceph日常问题解决分享《日志收集》ELK+各种中间件《运维日常》
基于BClinux8部署Ceph 19.2(squid)集群磐基Stack专业服务团队 ceph
#作者：闫乾苓文章目录1.版本选择Ceph版本发布历史目前官方在维护的版本2.部署方法3.服务器规划4.前置配置4.1系统更新4.2配置hostscat>>/etc/hosts>/etc/hosts/etc/chrony.conf/etc/chrony.conf/etc/os-release<
FastD：高性能PHP API框架钟冶妙Tilda
FastD：高性能PHPAPI框架fastD:rocket:AhighperformancePHPAPIframework.项目地址:https://gitcode.com/gh_mirrors/fa/fastD项目介绍FastD是一个专为高性能API场景设计的PHP框架，它充分利用了Swoole的高性能特性，为开发者提供了一个轻量级且易于扩展的开发环境。FastD不仅支持快速构建API服务，还提
debian-pve-ceph weixin_34278190
从头开始安装debian9.8debian-9.8.0-amd64-netinst.isovi/etc/vim/vimrc.tinysetnocompatiblesetbackspace=2一、让debian终端文件显示不同颜色vim/etc/vim/vimrc取消“syntaxon”的注释二、让debian终端文件夹显示不同颜色修改.bashrc文件，vim/root/.bashrc修改如下：#
Ceph实战（一）-分布式存储介绍与原理架构概述深度视觉机器 Centos7 Ceph 分布式存储介绍与原理架构概述
最近工作中有涉及到CEPH相关的内容，所以打算开一个CEPH专栏来进行总结，学习CEPH还有一个重要原因就是我同时要补充kubernetes、rancher专栏必定会涉及到有状态的存储资源抽象（StatefulSet、PV、PVC、StorageClass等），首先绕不开的就是高可用的分布式存储系统，虽然有很多人反对将持久化数据以容器的方式来部署，说容器化部署不是银弹，但未来发展方向就是容器化，并
云原生存储架构：构建数据永续的新一代存储基础设施桂月二二云原生架构
引言：重新定义数据基础设施边界蚂蚁集团基于Ceph构建的全闪存存储集群达到EB级规模，单集群IOPS突破1亿，延迟稳定在200μs内。Snowflake的存储计算分离架构使其数据湖查询速度提升14倍，存储成本降低82%。Gartner预测到2025年70%企业将采用云原生存储方案，数据自动分层技术可将冷数据存储成本压缩至0.001美元/GB/月。一、存储架构演进路线1.1数据存储范式对比技术维度D
Ceph Cookbook: 掌握分布式存储技术的实践指南云山雾村
本文还有配套的精品资源，点击获取简介：《CephCookbook》是一本面向希望深入学习Ceph分布式存储系统的读者的实用指南。本书通过实际案例和操作指导，全面介绍Ceph的核心概念和关键技术。介绍了Ceph的三个主要组件：RADOS、RBD和RGW，以及它们如何协同工作以提供高可用性和数据冗余。读者将学习Ceph的安装、配置、管理和优化，以及如何利用其高级特性，如CRUSH算法和多租户管理。本书
深入探讨Ceph：分布式存储架构的未来深度Linux ceph 分布式架构 C/C++
在数字化浪潮汹涌澎湃的当下，数据量呈爆发式增长，传统存储系统在应对海量数据存储、高并发访问以及灵活扩展等方面，逐渐显得力不从心。分布式存储技术应运而生，成为解决现代数据存储难题的关键方案，而Ceph作为分布式存储领域的佼佼者，正日益受到广泛关注和应用。Ceph以其卓越的性能、高可靠性、强大的扩展性以及开源的特性，在众多分布式存储系统中脱颖而出，被广泛应用于云计算、大数据、人工智能等前沿领域。无论是
分布式NAS集群+ceph+CTDB Comedy_宁分布式 ceph linux NAS CTDB
分布式存储系统中，分布式NAS、CTDB和Ceph常常被结合使用以提供高性能、高可用性和灵活扩展的存储解决方案。以下是这三者的关系及其在分布式存储系统中的角色：一、分布式NAS（NetworkAttachedStorage）分布式NAS是一种通过网络提供分布式文件存储服务的系统。它的核心功能是将存储资源分布在多个节点上，提供一个统一的文件系统视图，并通过网络文件系统协议（如NFS和SMB）供客户端
4.Ceph监控 yongbang_yan ceph集群运维
Ceph监控演示如何监控一个Ceph集群。我们将学习如何用ceph的命令行工具进行监控。监控集群的整体状态健康状态ceph命令的health选项查看集群的健康状态。#cephhealthdetailHEALTH_WARNclockskewdetectedonmon.ceph-node2;Monitorclockskewdetectedmon.ceph-node2addr192.168.1.121:
ceph fs status 输出详解时空无限 ceph ceph
cephfsstatus命令用于显示Ceph文件系统的状态信息，其中各列的含义如下：RANK：元数据服务器（MDS）的等级或标识符。STATE：MDS的当前状态，例如active（活跃）、standby（待机）等。MDS：MDS的名称或标识符。ACTIVITY：MDS当前的活动状态或正在执行的操作。DNS：MDS管理的目录名称（DirectoryNames）的数量。INOS：MDS管理的inode
ceph中报错“ clock skew detected on mon.ceph2, mon.ceph3” 下一页盛夏花开 ceph ceph 运维
自己搭建的ceph集群，显示时间不同步:clockskewdetectedonmon.ceph2,mon.ceph3但是查看chrony进程已经启动，ceph配置文件中,如下参数也已经配置，
ceph-deploy osd activate xxx bluestore ERROR only火车头 Ceph ceph bluestore ceph-deploy aio-max-nr
cephluminous12.2.0bluestore添加osd出错:[ceph_deploy.conf][DEBUG]foundconfigurationfileat:/root/.cephdeploy.conf[ceph_deploy.cli][INFO]Invoked(1.5.38):/usr/bin/ceph-deploy--overwrite-conf--ceph-conf/etc/ce
ceph bluestore Blob 分析 only火车头 Ceph
cephversion:11.0.0bluestore包含一个非常重要的结构，Blob,本节主要分析Blob，注意ceph版本是基于11.0.0的。1.BlobstructBlob:publicboost::intrusive::set_base_hookextents;///unused_t;unused_tunused;///>buffer_map;Cache*cache;state_list
ceph HEALTH_WARN clock skew detected on mon.f, mon.o, mon.p, mon.q 时空无限 ceph ceph
问题cephhealthdetail[WRN]MON_CLOCK_SKEW:clockskewdetectedonmon.f,mon.o,mon.p,mon.qmon.fclockskew0.243128s>max0.05s(latency0.000836159s)mon.oclockskew16.249s>max0.05s(latency0<
一次交换机故障导致的云平台（opensatck+ceph）不可用的记录大新新大浩浩 openstack ceph 服务器网络
前言发现几年前记录的一次由于交换机故障导致的云平台使用异常的问题，因为比较少见所以也整理记录一下一、细节过程用户联系说好多运行在云主机上的网页访问不了了，需要处理一下。甲方现场还挺远，我就先登陆在虚拟机上部署的堡垒机，发现堡垒机也不好使。机房运维联系说有台业务交换机坏了，有备件，正在更换。换上之后，过了一会，堡垒机就好使了。赶紧登陆上去检查服务。存储集群已经开始自动恢复，虚拟机也逐渐恢复了业务能力
k8s rook-ceph MountDevice failed for volume pvc An operation with the given Volume ID already exists 时空无限 Kubernetes kubernetes ceph
https://github.com/rook/rook/issues/4896环境kubeadm搭建的k8s集群，rook-ceph部署的ceph存储，monpod所在宿主机和挂载客户端机器pod所在机器不在一个二层网络里。故障pod挂载不上pvc，describepod信息如下MountDevicefailedforvolumepvcAnoperationwiththegivenVolumeI
rook-ceph无法登录dashboard 时空无限 Kubernetes ceph ceph kubernetes
环境ubuntu22.04tlsk8s1.20.2现象搭建好ceph集群环境后，执行如下命令获取admin登录账号的密码kubectl-nrook-cephgetsecretrook-ceph-dashboard-password-ojsonpath="{['data']['password'
Rook-ceph(1.92最新版) 野猪佩挤 k8s 存储 ceph
安装前准备#确认安装lvm2yuminstalllvm2-y#启用rbd模块modproberbdcat>/etc/rc.sysinit/etc/sysconfig/modules/rbd.modulesfilesystem.yaml<
ceph nautilus(14.2.22) 通过ansible部署grafana无法启动 Ethan@YL 运维 ceph 分布式存储
cephnautilus(14.2.22)通过ansible部署grafana无法启动一、ceph环境ceph版本：nautilus(14.2.22)二、cephansible部署1、在cephansible自动化部署的时候，到最后启动grafanadocker的时候，总是启动不了提示：“Timeoutwhenwaitingforxxx.xxx.xxx.xxx:3000”2、通过查看/var/lo
ansible部署ceph 时空无限 ceph ansible ceph linux
前言：ceph的官网有坑。按照官网部署，不会一蹴而就。会遇到各种各样的问题，ceph文档有待改进。环境操作系统cat/etc/redhat-releaseCentOSLinuxrelease8.5.2111uname-r4.18.0-80.el8.x86_64主机名三台主机，其中node-01为部署机器和ceph的其中一个节点。node-01node-02node-03网卡和ip每台主机双网卡en
ansible进行ceph-rgw部署睿江云计算程序人生开发工具开发 ansible
用户管理用户创建执行下面的命令新建一个用户(S3接口):radosgw-adminusercreate—uid={username}—display-name=”{display-name}”[—email={email}]实例如下:radosgw-adminusercreate—uid=johndoe—display-name=”JohnDoe”—[email protected]获取
Ceph 网络模块(1) - 网络模块基本结构 hequan_hust Ceph Ceph 网络模块分布式存储
Ceph网络模块基本结构本文基于Jewel版本对Ceph的网络模块进行分析，主要针对AsyncMessenger的方式。Ceph依据节点功能可以将节点划分为4种类型，分别是Client、OSD、Monitor和MDS。每个节点由Dispatcher（消息调度器）集合和Messenger（消息管理器）集合两部分组成。Dispatcher是消息的订阅者，对接收的消息进行处理或者将需要发送的消息移交给本
Ceph 架构以及部署完颜振江 ceph 架构
Ceph是一个开源的分布式存储系统，它提供了对象存储、块存储和文件系统存储。Ceph的设计目标是高度可扩展性和高性能，同时提供无单点故障的高可用性。Ceph架构Ceph的架构主要包括以下组件：Monitor(MON)：CephMonitor负责维护集群的状态，包括存储节点的成员信息和数据分布图。它们是Ceph集群的中枢，保证了集群的一致性和健康状态。ObjectStorageDaemon(OSD)
CentOS7部署ceph 假面生存储 linux
CEPH简介不管你是想为云平台提供Ceph对象存储和/或Ceph块设备，还是想部署一个Ceph文件系统或者把Ceph作为他用，所有Ceph存储集群的部署都始于部署一个个Ceph节点、网络和Ceph存储集群。Ceph存储集群至少需要一个CephMonitor和两个OSD守护进程。而运行Ceph文件系统客户端时，则必须要有元数据服务器（MetadataServer）。CephOSDs:CephOSD守
Centos 7下 ceph的安装村口树下《技术人生》系列 ceph
文章目录ceph安装环境准备工作1、安装ceph-deploy2、配置时间同步3、配置节点间ssh无密码登录4、防火墙配置5、安装包管理器部署ceph集群1、创建ceph操作目录（node-1）2、创建集群3、安装ceph4、安装monitor5、安装ceph-mgr6、创建osd7、创建元数据服务器mds8、扩展集群8.1、增加monitor8.2、增加manager8.3、创建RGW实例8.4
Ceph：关于Ceph 中使用 RADOS 块设备提供块存储的一些笔记整理(12) 山河已无恙零基础入门Ceph ceph 笔记
写在前面准备考试，整理ceph相关笔记博文内容涉及使用RADOS块设备提供块存储理解不足小伙伴帮忙指正对每个人而言，真正的职责只有一个：找到自我。然后在心中坚守其一生，全心全意，永不停息。所有其它的路都是不完整的，是人的逃避方式，是对大众理想的懦弱回归，是随波逐流，是对内心的恐惧——赫尔曼·黑塞《德米安》使用RADOS块设备提供块存储管理RADOS块设备基于RBD的块存储块设备是服务器、笔记本电脑
Ceph的原理与架构 stybxiao Ceph ceph
Ceph的原理与架构Ceph的原理与架构Ceph的起源与哲学Ceph的技术Ceph的架构及组件
理解Ceph的三种存储方式(块设备、文件系统、对象存储) 118路司机大数据
前言Ceph是一个开源的、统一的、分布式的存储系统这是我们宣传Ceph时常说的一句话，其中“统一”是说Ceph可以一套存储系统同时提供块设备存储、文件系统存储和对象存储三种存储功能。一听这句话，具有一定存储基础的用户应该已经大致了解了Ceph的存储接口，而没有存储基础的小白用户则一脸懵逼。本文旨在让小白用户理解Ceph的块存储、文件系统存储和对象存储接口。一.Ceph的块设备存储接口什么是块设备？
redis学习笔记——不仅仅是存取数据 Everyday都不同 returnSource expire/del incr/lpush 数据库分区 redis
最近项目中用到比较多redis，感觉之前对它一直局限于get/set数据的层面。其实作为一个强大的NoSql数据库产品，如果好好利用它，会带来很多意想不到的效果。（因为我搞java，所以就从jedis的角度来补充一点东西吧。PS：不一定全，只是个人理解，不喜勿喷） 1、关于JedisPool.returnSource(Jedis jeids) 这个方法是从red
SQL性能优化-持续更新中。。。。。。 atongyeye oracle sql
1 通过ROWID访问表--索引你可以采用基于ROWID的访问方式情况,提高访问表的效率, , ROWID包含了表中记录的物理位置信息..ORACLE采用索引(INDEX)实现了数据和存放数据的物理位置(ROWID)之间的联系. 通常索引提供了快速访问ROWID的方法,因此那些基于索引列的查询就可以得到性能上的提高. 2 共享SQL语句--相同的sql放入缓存 3 选择最有效率的表
[JAVA语言]JAVA虚拟机对底层硬件的操控还不完善 comsci JAVA虚拟机
如果我们用汇编语言编写一个直接读写CPU寄存器的代码段，然后利用这个代码段去控制被操作系统屏蔽的硬件资源，这对于JVM虚拟机显然是不合法的，对操作系统来讲，这样也是不合法的，但是如果是一个工程项目的确需要这样做，合同已经签了，我们又不能够这样做，怎么办呢？那么一个精通汇编语言的那种X客，是否在这个时候就会发生某种至关重要的作用呢？ &n
lvs- real 男人50 LVS
#!/bin/bash # # Script to start LVS DR real server. # description: LVS DR real server # #. /etc/rc.d/init.d/functions VIP=10.10.6.252 host='/bin/hostname' case "$1" in sta
生成公钥和私钥 oloz DSA 安全加密
package com.msserver.core.util; import java.security.KeyPair; import java.security.PrivateKey; import java.security.PublicKey; import java.security.SecureRandom; public class SecurityUtil {
UIView 中加入的cocos2d，背景透明 374016526 cocos2d glClearColor
要点是首先pixelFormat:kEAGLColorFormatRGBA8，必须有alpha层才能透明。然后view设置为透明glView.opaque = NO;[director setOpenGLView:glView];[self.viewController.view setBackgroundColor:[UIColor clearColor]];[self.viewControll
mysql常用命令香水浓 mysql
连接数据库 mysql -u troy -ptroy 备份表 mysqldump -u troy -ptroy mm_database mm_user_tbl > user.sql 恢复表（与恢复数据库命令相同） mysql -u troy -ptroy mm_database < user.sql 备份数据库 mysqldump -u troy -ptroy
我的架构经验系列文章 - 后端架构 - 系统层面 agevs JavaScript jquery css html5
系统层面：高可用性所谓高可用性也就是通过避免单独故障加上快速故障转移实现一旦某台物理服务器出现故障能实现故障快速恢复。一般来说，可以采用两种方式，如果可以做业务可以做负载均衡则通过负载均衡实现集群，然后针对每一台服务器进行监控，一旦发生故障则从集群中移除；如果业务只能有单点入口那么可以通过实现Standby机加上虚拟IP机制，实现Active机在出现故障之后虚拟IP转移到Standby的快速
利用ant进行远程tomcat部署 aijuans tomcat
在javaEE项目中，需要将工程部署到远程服务器上，如果部署的频率比较高，手动部署的方式就比较麻烦，可以利用Ant工具实现快捷的部署。这篇博文详细介绍了ant配置的步骤（http://www.cnblogs.com/GloriousOnion/archive/2012/12/18/2822817.html），但是在tomcat7以上不适用，需要修改配置，具体如下： 1.配置tomcat的用户角色
获取复利总收入 baalwolf 获取
public static void main(String args[]){ int money=200; int year=1; double rate=0.1; &
eclipse.ini解释 BigBird2012 eclipse
大多数java开发者使用的都是eclipse，今天感兴趣去eclipse官网搜了一下eclipse.ini的配置，供大家参考，我会把关键的部分给大家用中文解释一下。还是推荐有问题不会直接搜谷歌，看官方文档，这样我们会知道问题的真面目是什么，对问题也有一个全面清晰的认识。 Overview 1、Eclipse.ini的作用 Eclipse startup is controlled by th
AngularJS实现分页功能 bijian1013 JavaScript AngularJS 分页
对于大多数web应用来说显示项目列表是一种很常见的任务。通常情况下，我们的数据会比较多，无法很好地显示在单个页面中。在这种情况下，我们需要把数据以页的方式来展示，同时带有转到上一页和下一页的功能。既然在整个应用中这是一种很常见的需求，那么把这一功能抽象成一个通用的、可复用的分页（Paginator）服务是很有意义的。 &nbs
[Maven学习笔记三]Maven archetype bit1129 ArcheType
archetype的英文意思是原型，Maven archetype表示创建Maven模块的模版，比如创建web项目，创建Spring项目等等. mvn archetype提供了一种命令行交互式创建Maven项目或者模块的方式， mvn archetype 1.在LearnMaven-ch03目录下，执行命令mvn archetype:gener
【Java命令三】jps bit1129 Java命令
jps很简单，用于显示当前运行的Java进程，也可以连接到远程服务器去查看 [hadoop@hadoop bin]$ jps -help usage: jps [-help] jps [-q] [-mlvV] [<hostid>] Definitions: <hostid>: <hostname>[:
ZABBIX2.2 2.4 等各版本之间的兼容性 ronin47
zabbix更新很快，从2009年到现在已经更新多个版本，为了使用更多zabbix的新特性，随之而来的便是升级版本，zabbix版本兼容性是必须优先考虑的一点客户端AGENT兼容 zabbix1.x到zabbix2.x的所有agent都兼容zabbix server2.4：如果你升级zabbix server，客户端是可以不做任何改变，除非你想使用agent的一些新特性。 Zabbix代理（p
unity 3d还是cocos2dx哪个适合游戏？ brotherlamp unity自学 unity教程 unity视频 unity资料 unity
unity 3d还是cocos2dx哪个适合游戏？问：unity 3d还是cocos2dx哪个适合游戏？答：首先目前来看unity视频教程因为是3d引擎，目前对2d支持并不完善，unity 3d 目前做2d普遍两种思路，一种是正交相机，3d画面2d视角，另一种是通过一些插件，动态创建mesh来绘制图形单元目前用的较多的是2d toolkit，ex2d，smooth moves，sm2，
百度笔试题：一个已经排序好的很大的数组，现在给它划分成m段，每段长度不定，段长最长为k，然后段内打乱顺序，请设计一个算法对其进行重新排序 bylijinnan java 算法面试百度招聘
import java.util.Arrays; /** * 最早是在陈利人老师的微博看到这道题： * #面试题#An array with n elements which is K most sorted，就是每个element的初始位置和它最终的排序后的位置的距离不超过常数K * 设计一个排序算法。It should be faster than O(n*lgn)。
获取checkbox复选框的值 chiangfai checkbox
<title>CheckBox</title> <script type = "text/javascript"> doGetVal: function doGetVal() { //var fruitName = document.getElementById("apple").value;//根据
MySQLdb用户指南 chenchao051 mysqldb
原网页被墙，放这里备用。 MySQLdb User's Guide Contents Introduction Installation _mysql MySQL C API translation MySQL C API function mapping Some _mysql examples MySQLdb
HIVE 窗口及分析函数 daizj hive 窗口函数分析函数
窗口函数应用场景：（1）用于分区排序（2）动态Group By （3）Top N （4）累计计算（5）层次查询一、分析函数用于等级、百分点、n分片等。函数说明 RANK() &nbs
PHP ZipArchive 实现压缩解压Zip文件 dcj3sjt126com PHP zip
PHP ZipArchive 是PHP自带的扩展类，可以轻松实现ZIP文件的压缩和解压，使用前首先要确保PHP ZIP 扩展已经开启，具体开启方法就不说了，不同的平台开启PHP扩增的方法网上都有，如有疑问欢迎交流。这里整理一下常用的示例供参考。一、解压缩zip文件 01 02 03 04 05 06 07 08 09 10 11
精彩英语贺词 dcj3sjt126com 英语
I'm always here 我会一直在这里支持你 &nb
基于Java注解的Spring的IoC功能 e200702084 java spring bean IOC Office
java模拟post请求 geeksun java
一般API接收客户端（比如网页、APP或其他应用服务）的请求，但在测试时需要模拟来自外界的请求，经探索，使用HttpComponentshttpClient可模拟Post提交请求。此处用HttpComponents的httpclient来完成使命。 import org.apache.http.HttpEntity ; import org.apache.http.HttpRespon
Swift语法之 ---- ?和!区别 hongtoushizi ?swift !
转载自： http://blog.sina.com.cn/s/blog_71715bf80102ux3v.html Swift语言使用var定义变量，但和别的语言不同，Swift里不会自动给变量赋初始值，也就是说变量不会有默认值，所以要求使用变量之前必须要对其初始化。如果在使用变量之前不进行初始化就会报错： var stringValue : String //
centos7安装jdk1.7 jisonami jdk centos
安装JDK1.7 步骤1、解压tar包在当前目录 [root@localhost usr]#tar -xzvf jdk-7u75-linux-x64.tar.gz 步骤2：配置环境变量在etc/profile文件下添加 export JAVA_HOME=/usr/java/jdk1.7.0_75 export CLASSPATH=/usr/java/jdk1.7.0_75/lib
数据源架构模式之数据映射器 home198979 PHP 架构数据映射器 datamapper
前面分别介绍了数据源架构模式之表数据入口、数据源架构模式之行和数据入口数据源架构模式之活动记录，相较于这三种数据源架构模式，数据映射器显得更加“高大上”。一、概念数据映射器（Data Mapper）：在保持对象和数据库（以及映射器本身）彼此独立的情况下，在二者之间移动数据的一个映射器层。概念永远都是抽象的，简单的说，数据映射器就是一个负责将数据映射到对象的类数据。 &nb
在Python中使用MYSQL pda158 mysql python
缘由　　近期在折腾一个小东西须要抓取网上的页面。然后进行解析。将结果放到数据库中。　　了解到 Python在这方面有优势，便选用之。　　由于我有台 server上面安装有 mysql，自然使用之。在进行数据库的这个操作过程中遇到了不少问题，这里记录一下，大家共勉。　　 python中mysql的调用　　百度之后能够通过MySQLdb进行数据库操作。
单例模式 hxl1988_0311 java 单例设计模式单件
package com.sosop.designpattern.singleton; /* * 单件模式：保证一个类必须只有一个实例，并提供全局的访问点 * * 所以单例模式必须有私有的构造器，没有私有构造器根本不用谈单件 * * 必须考虑到并发情况下创建了多个实例对象 * */ /** * 虽然有锁，但是只在第一次创建对象的时候加锁，并发时不会存在效率
27种迹象显示你应该辞掉程序员的工作 vipshichg 工作
1、你仍然在等待老板在2010年答应的要提拔你的暗示。 2、你的上级近10年没有开发过任何代码。 3、老板假装懂你说的这些技术，但实际上他完全不知道你在说什么。 4、你干完的项目6个月后才部署到现场服务器上。 5、时不时的，老板在检查你刚刚完成的工作时，要求按新想法重新开发。 6、而最终这个软件只有12个用户。 7、时间全浪费在办公室政治中，而不是用在开发好的软件上。 8、部署前5分钟才开始测试。

理解 QEMU/KVM 和 Ceph（2）：QEMU 的 RBD 块驱动（block driver）

理解 QEMU/KVM 和 Ceph（2）：QEMU 的 RBD 块驱动（block driver）

1. QEMU 的 RBD 块驱动

1.1 QEMU 存储设备

1.2 QEMU 存储栈

1.3 QEMU 的 Ceph RBD 块设备驱动概述

1.4 QEMU 的 qemu_rbd_open 函数

2. 各种情况下的测试结果

2.1 打开 librbd log 和 admin socket

2.2 各种 QEMU 和 ceph 缓存配置的测试结果

2.2.1 测试结果

2.2.2 不使用 ceph 配置文件时的行为

3 qemu配置和rbd参数相互覆盖问题

你可能感兴趣的:(CEPH)