Mr_Greg

分布式文件系统 bluestore简介-ceph backend

bluestore : a faster backend for ceph

—–sage weil 的公开课导读

ceph创始人sage大叔前些日子在国际版的公开课里面介绍了根据ceph的特定环境定制的新的文件系统bluestore，用以作为ceph的存储后端，本文主要以sage的presentation：

“bluestore - a new faster storage backend for ceph”

为基础，简单的介绍bluestore的设计方案与性能分析，部分知识点会比较粗糙或有错误，欢迎各位指正，谢谢！。

主要内容：
1、ceph背景，目前状况；
2、POSIX简介，与ceph的问题；
3、第一版解决方案 new store；
4、新一代解决方案 bluestore；
5、性能分析；
6、总结；

一、Motivating

ceph从一开始问世到目前已经接近了十年时间，从最开始的sage 的论文中对CEPH的文件系统描述：

“a scalable, high performance distributed file system”

sage说，作为ceph存储的后端，他强调“performance, reliability, and scalability”三大核心发展方向，可靠性和拓展性相对简单，而性能便一直是最具有挑战性的课题。
如下是经典的ceph的架构逻辑，ceph向外提供了三大接口，用以提供不同的存储功能，底层都是建立在RADOS之上，具体的rados内容可以参考weil的学术论文。

从结构拓扑看，每个集群都可以看做是一棵树，主机作为数据的叶子节点，主机根据分工不同可以作为数据存储节点，也可以作为元数据存储节点，在存储节点上，最底层是磁盘，磁盘上是文件系统，目前主要的包括btrfs、xfs、ext4等POSIX标准文件系统，上层就是我们的OSD守护进程，用来维护对象的存储操作与映射等内容：

由于ceph的数据的特殊结构，在实际的生产实践中，我们在标准的文件系统之上又增加了一层模块—Filestore：

filestore在旧版本的Ceph中作为与文件系统的桥梁，用来暴露接口给上层OSD daemons来存储本地数据，他负责实际的写数据的交互逻辑。
对于FileStore的实现称之为对象存储ObjectStore，提供给ceph存储对象数据到物理磁盘的一系列接口，他的核心要素包括三部分：
a)对象object，可以映射为我们需要存储的中的文件，不论使用何种方式存储何种类型的数据，经过ceph最终都换转换成为一个object，它包含基础数据、对象属性数据attributes以及一些用来维护的omap数据，attributes是该对象的拓展属性，相当于POSIX类文件系统的元数据，受于底层文件系统的限制，这种k/v型的数据大小、个数是有上限的，一旦我们需要的该文件的描述信息无法存到其中，就需要存储到omap中，他会在fs之上存储在内存数据库中（leveldb）。
b)集合collections，简单的理解，可以类比文件系统中的目录结构，但是经过OSD daemons处理过后，向下传递的对象数据更加有序并且归置效果更高，对其分组更类似于一对对象的集合概念。对底层的POSIX文件系统而言，ceph拥有一个大的对象池，并将其分片城多个placement groups，这些pg会map到各个OSD，从而map到对应的object。
c)所有的写入都应该是事务的，否则对于一个分布式的存储解决方案而言数据的有效性将变得无法预知，所以所有的写入操作都应符合ACID特性；在ceph的架构中，从文件到OSD的映射已经处理了I的问题，ACD的维护需交由本地的存储系统来处理。
基于以上的核心观点，sage团队首先做了一个叫做EBOFS（a user-space Extended-Base Object File System）的FS，他是一个文件系统拓展，主要核心逻辑使用b-tree来实现，前期主要是做开发性质使用，未投入到生产中。后续由于btrfs的出现，并且很多功能btrfs和EBOFS有重叠，并且btrfs在社区中不断地被改进，sage团队一段时间内转战btrfs中。关于ebofs具体内容在sage的论文中有介绍。
那么问题来了，看似以上的方案无可厚非，then why POSIX failed us？
POSIX接口定义了操作系统层级的文件系统接口定义规范，但是作为早期的接口规范，他并没有考虑到大规模分布式场景的需求，在实际使用中暴露出一些问题。
首先POSIX规范中对数据更新以及元数据的根系都是懒惰的更新方式，自此他无法提供事务的数据或元数据操作接口，但是ceph为保证一致性他的数据操作都非常的精细，写入数据反馈不及时。使用上常规的写日志、写数据等操作相对简单，但是其他的操作可能会有无法判断的复杂度或资源占用。
后续在btrfs上出现了对事物的支持，btrfs提供了一种叫做事务钩子的接口（transaction hook，有兴趣的或了解的请帮忙补充），经测试后发现有场景下会造成系统宕机，在OSD进程意外夯住的情况下，事务无法在btrfs正确结束，导致资源的持续占用，最终拖垮整个os。
同时，对于POSIX的写前日志以及快照等相关的数据正确性维护措施相对繁杂，journal的维护也是全亮的，实际的磁盘存储能力会对半下降。
另外，POSIX的最初设计考虑的就是类似我们现在的PC场景，层叠的目录结构，完全无法归纳的文件类型和标识，随机的存储向不同的dir等。但在ceph中，经由OSD处理后，对象的标示转为32位的哈希数据，相对非常易于归纳，如果还继续按照POSIX的方式就会无法提供高效接口。ceph要求对数据分片时复杂度为O(1)，但POSIX无法完成（想象下在你的某个盘符下对乱七八糟的百万个文件或目录进行分片）。而且在枚举时，POSIX很慢，而且一旦基数变大，资源消耗会大幅升高，在ceph中，可以对哈希值等前缀进行排序、分片，如果常驻内存，效率则会大大增加。

二、NewStore

为规避上述问题，我们需要改变接口模块，解决如下问题：
更线性化的原子事务，高效的枚举、克隆、追加（splice）；尽量避免双份写入（journal），以及优化IO格式使对高性能存储设备存储更凸显性能（ssd nvme etc.），代码机构上最小化锁概念，最大化并行，以及数据、元数据的校验和功能（btrfs实现）、数据行内压缩等。
POSIX整体上的数据模型不适应ceph的实际要求（object≠file，collection≠directory），一个ordered k-v型数据库能够满足需求：对象经过OSD daemon处理后按照名称已经排好序，存入ordered k-v型数据库枚举以及随机查找将会更加高效；

NewStore =rocksdb + object files（持久化的对象数据）
Rocksdb用来存储文件系统的元数据（metadata），对象的数据仍将存储在POSIX中；
*问题：
A) rocksdb自身有写前journal用来维护一致性，POSIX类文件系统自身也有log file，这种journal-on-journal的结构层次似的维护的开销巨大，并且每个journal只能保证部分一致性;
B) ceph需要对object数据进行覆盖写（事务提交之前原始数据不可更改），但POSIX不支持原子的重写事务，如果变通的在新的文件中写入则会是同一个数据面临很多的版本，对此尝试使用Write-Ahead-Logging：先将重写的数据写入wal（rocksdb），提交事务，重写原始数据，这样又出现了双份日志的情况，性能很差,于是出现新的存储后台 bluestore。*

三、 BlueStore

本章节将介绍bluestore的架构、设计，以及bluestore的基础元数据类型、匹配规则等，然后从数据映射流程讲解bluestore的实现方式。

3.1 bluestore介绍

Bluestore 建立在块设备之上，采用rocksdb作为元数据存储，数据直接在块设备上写入，bluestore自己实现了委派规则（allocation code，to allocate which block-device shall be written）；关键点（key-challenge）：块设备需要与rocksdb共享,包括持久化数据、日志等需要写入块设备中，自此实现自制的rocksdb，并实现了最简化的文件系统bluefs用来做元数据的基本读写操作，并与bluestore共享块设备信息。

Bluestore= bl ock(device) + N ewStore

逻辑架构如下：

Rocksdb：基于in-memory的数据库引擎，用以存储映射关系、元数据等内容。 底层使用bluerockenv以及bluefs： Bluerockenv：rocksdb的后台，捕获所有的io操作并传递给bluefs处理 Bluefs：非常简单的文件系统： 
A)所有元数据放在内存中，并在系统或设备初始化时完成，因此无需存储块设备的free list，因为每次初始化的时候已经计算完毕的数据会实时在内存中 
B)届于ceph存储的数据为大批量的大块数据，因此，allocation code 分配的块大小为1M 
C)所有元数据都写在日志中，因此每次写日志的时候会同步更新fnode（inode） 
D)Journal在到达一定大小后会压缩 
E)Bluefs能够匹配不同的目录结构到不同的块设备中（hdd、ssd etc.） F)Bluestore 和bluefs相互通信，当bluefs的存储空间不足时，会通知bluestore分配更多空间给bluefs，如果bluestore自身空间不足，并且bluefs中尚有剩余时，bluefs会归还部分空间

实际在生产测试的时候发现Rocksdb的一些问题：Rocksdb的日志记录方式只有两种，读至文件末（需要文件大小）和读到标识符，这种方法在追加时需要修改自身元数据信息，自此文件的读写会增加IO，测试是一次3-4k的数据写入需要3-4次IO！sage将目前较为普遍的循环缓冲日志（circular buffer）中，以此减少IO；

3.2 Bluestore meta-data

所有的元数据在bluestore架构中都保存在rocksdb中，不同的元数据根据分工不同遵循分区的命名空间规则：

S* superblock  block size、configure options，整个存储的核心数据
B* block allocation： freeblock、block that used
C* collection name -> cnode_t
O*对象名存储到ONODE的映射关系
L* wal 写前日志
M*元数据信息
Etc.....

对象存储数据由以下structure之间的相互映射关系map到磁盘
Cnode：Collection metadata存储 cnode信息，格式如下：

Onode：对象元数据 object metadata
每个对象节点元数据直接以k-v形式存在，可以序列化到最多200字节，存储大小的单位为字节（逻辑开销），每个对象会生成一个唯一的对象ID；ONODE还包含对象的Inline attributes（attr data基础元数据信息），以及数据指针，用以链接数据的物理存储对象的位置（分两层i.逻辑拓展->blob区域;ii. blob->disk）：也包括Omap前缀，用以链接用户的k-v键值数据存储位置（对象的描述信息，与attr区别前面已经将过了）

数据结构设计：

Bnode（blob metadata）/ Enode（extend metadata）：拓展信息
在ONODE中对象的映射关系有从逻辑位置到blob，以及从blob中定位具体的数据位置，由于设计逻辑，相同的block中可能会被两个以及以上的object所共享（克隆、快照、拼接），将BNODE从ONODE中剥离作为拓展信息，在后续sage的presentation中将之改为ENODE；
映射格式举例如下，hash之前是enode信息：

另外，在数据的存储时无法避免会出现诸如磁盘坏道等不确定因素，需要在文件系统层级对数据进行校验，bluestore采用校验和的方式(checksum),为保证数据的准确性，我们希望每次驱虎数据时做校验，为此必需在元数据中存储校验数据，关于校验和CRC32的内容请自查，具体的校验块的大小可以自行设定或重新开发，sage在做介绍时还很模糊。
另外还有数据压缩工作（data compression），涉及内容目前尚不明确，后续对bluestore的改进中可能会逐步优化。

3.3 DATA PATH

本节主要阐明数据从OSD到实际的物理磁盘的映射过程的相关模块，在此之前先介绍如下术语：
A）sequencer：一个独立的全量有序的事务队列流，每个sequencer会map到特定的一个PG；因此在整个objectstore 层可以有成百上千个sequencer来使之并行工作，
B） transContext：每个sequencer拥有多个transaction，每个在内存中进行工作的事务都被称作一个transContext。

共有两种bluestore写数据的方式：
A) new allocation：如果写入数据大于min_alloc_size,bluestore 就会分配一个新的未使用的空间，然后再修改元数据，完成IO操作后，再提交rocksdb中的事务
B) WAL，如果写入数据小于min_alloc_size，bluestore会先写到write-ahead-log中，然后提交事务并承诺会完成磁盘写操作，然后再异步的写数据到磁盘中

*注：具体的阈值大小可能按照不同的磁盘读写习惯来更改，例如，HDD64k，SSD4k*

事务状态机如下：

缓存模块：
Bluestore实现了自己的缓存机制，定义了structure ：OnodeSpace，用来map 到内存中的ONODE；BufferSpace，用来map 块信息blob，每个blob都在bufferSpace中缓存了状态数据。二者在缓存中依照LRU的方式决定生命周期。
FreelistManager模块：
FreelistManager用来映射磁盘的使用信息，最初实现是采用k-v的方式来存储对应的磁盘块的使用情况，但是由于更新数据时需要修改映射，需要线程锁来控制修改，而且这种方式对内存消耗很大；后续修改为bitmap的映射方式，设定一个offset来以bitmap的方式map多个block使用信息，使用XOR计算来更新块的使用情况，这种方式不会出现in-memory 状态。
Allocator模块
如前所述，用来委派具体哪个实际存储块用来存储当前的object数据；同样采用bitmap的方式来实现allocator，同时采用层级索引来存储多种状态，这种方式对内存的消耗相对较小，平均1TB磁盘需要大概35M左右的ram空间。

四、性能数据
性能数据主要和之前的文件系统组件版本filestore相比较：
1、顺序写：在大文件写的时候，之前的filestore由于需要double write（journal问题）导致基本两倍域bluestore的开销。

2、随机写基本也是两倍的速度提升，右侧在32K和64K之间出现波峰的原因是64K为min_alloc_size，采用wal代替直接委派新块空间，从而提升吞吐率

3、顺序读

4、随机读，左方是IO吞吐量，右方是IO吞吐率

五、总结

到此对bluestore的介绍基本完成，本文主要是从架构和设计的方向对分布式文件系统 bluestore进行阐述，从ceph的jewel版本之后可以陆续的看到bluestore的身影，sage在presentation中强调会在kraken版本的时候基本达到生产要求。到目前ceph，大家可以从git上查看设计代码了。

后续我大概还会整理crush的代码设计、以及相关的分布式设计理念等等~~~~~
本文有任何错误、纰漏内容欢迎指正，另附一些链接，可以快速查看相关内容拓展~~~~~

原创内容，转载请注明出处~~
Appendix：
1 【顺序读和随机读】http://www.violin-memory.com/blog/understanding-io-random-vs-sequential/
2 【rados】http://ishare.iask.sina.com.cn/f/36655999.html
3 【sage的公开课】
http://mp.weixin.qq.com/s?__biz=MzA3NjkwNjM4Nw==&mid=2651868098&idx=1&sn=e27c94b4e311d229bd40e9ea27009e7a&chksm=84bec13eb3c9482811ef9adce98828ebaf8205306109a941607ffbd5ba2fe2688c97b8d86167&scene=0#rd
4 【ceph 社区文档】http://docs.ceph.org.cn/

个人微信公众号：

【从问题中去学习k8s】k8s中的常见面试题（夯实理论基础）（二十八）向往风的男子 k8s 学习 kubernetes 容器
本站以分享各种运维经验和运维所需要的技能为主《python零基础入门》：python零基础入门学习《python运维脚本》：python运维脚本实践《shell》：shell学习《terraform》持续更新中：terraform_Aws学习零基础入门到最佳实战《k8》从问题中去学习k8s《docker学习》暂未更新《ceph学习》ceph日常问题解决分享《日志收集》ELK+各种中间件《运维日常》
ceph KVM使用rbd做存储 SkTj
博客：https://blog.csdn.net/bobpen/article/details/40112939博客：http://www.aboutyun.com/thread-13195-1-1.html导言很多cepher都会使用RBD块存储功能，下面介绍qemu-kvm访问RBD的方法。操作目前Ubuntu14.04.x和CentOS7.1(如使用CentOS7建议升级到7.1，CentO
【从问题中去学习k8s】k8s中的常见面试题（夯实理论基础）（十一）向往风的男子 k8s 学习 kubernetes 容器
本站以分享各种运维经验和运维所需要的技能为主《python零基础入门》：python零基础入门学习《python运维脚本》：python运维脚本实践《shell》：shell学习《terraform》持续更新中：terraform_Aws学习零基础入门到最佳实战《k8》从问题中去学习k8s《docker学习》暂未更新《ceph学习》ceph日常问题解决分享《日志收集》ELK+各种中间件《运维日常》
【mysql】mysql之优化向往风的男子 DBA mysql 数据库
本站以分享各种运维经验和运维所需要的技能为主《python零基础入门》：python零基础入门学习《python运维脚本》：python运维脚本实践《shell》：shell学习《terraform》持续更新中：terraform_Aws学习零基础入门到最佳实战《k8》从问题中去学习k8s《docker学习》暂未更新《ceph学习》ceph日常问题解决分享《日志收集》ELK+各种中间件《运维日常》
python 物理引擎摩擦力_Python物理引擎简单的艾伦 python 物理引擎摩擦力
Python的强大源自众多领域大牛的支持，例如物理引擎方面，就有N多模块支持PyODEPyODEisasetofopen-sourcePythonbindingsforTheOpenDynamicsEngine,anopen-sourcephysicsengine.PyMunkpymunkisaeasy-to-usepythonic2dphysicslibrarythatcanbeusedwhen
k8s 存储(PV、PVC、SC、本地存储、NFS) 大江东去了吗 kubernetes java linux
存储持久化相关三个概念:PersistentVolume(PV)是对具体存储资源的描述，比如NFS、Ceph、GlusterFS等，通过PV可以访问到具体的存储资源;PersistentVolumeClaim(PVC)Pod想要使用具体的存储资源需要对接到PVC，PVC里会定义好Pod希望使用存储的属性，通过PVC再去申请合适的存储资源(PV)，匹配到合适的资源后PVC和PV会进行绑定，它们两者是
cephadm搭建ceph文件集群存储 L__liurs 服务器
一、基础配置1、配置主机名[root@ecs-cd34~]hostnamectlset-hostnamenode1[root@ecs-cd34~]execbash#主机名生效2、配置hosts解析（根据自己的服务器id修改）cat>>/etc/hosts/etc/docker/daemon.json<
存储集群消除pg数量过多的告警大大金 ceph
[root@xxxxxxxxxxxxxx~]#ceph-scluster334cfe7e-9ccc-483d-8d2c-218fde3a5fdehealthHEALTH_WARNtoomanyPGsperOSD(307>max300)nodeep-scrubflag(s)setmonmape1:3monsat{node1=100.88.28.11:6789/0,node2=100.88.28.12
linux搭建ceph集群浓黑的daidai linux ceph 服务器
linux三节点搭建ceph集群主机IP主机名称172.26.50.75node1172.26.50.112node2172.26.50.228node3ceph-mon，ceph-mgr，ceph-mds都搭建在node1上，node2和node3上搭建ceph-osd，每个机器1个osdCeph是一个分布式的存储系统，可以在统一的系统中提供唯一的对象、块和文件存储，Ceph的大致组件如下：1.
3. ceph-mimic版本部署 Martin_wjc 7 存储 ceph chrome 前端
ceph-mimic版本部署一、ceph-mimic版本部署1、环境规划2、系统基础环境准备2.1关闭防火墙、SELinux2.2确保所有主机时间同步2.3所有主机ssh免密2.4添加所有主机解析3、配置ceph软件仓库4、安装ceph-deploy工具5、ceph集群初始化6、所有ceph集群节点安装相关软件7、客户端安装ceph-common软件8、在ceph集群中创建cephmonitor组
upmap的存储池osd坏盘处理问题奋斗的松鼠 ceph
写在前面喜欢ceph的话欢迎关注奋斗的cepher微信公众号阅读更多好文！在《坏盘处理时osd为什么不要rm》文章中，松鼠哥对比了多组各种osd处理与数据的情况，有一个细节，那就是如果osd在重建前后要保持pg映射的一致性，那么存储池做均衡使用的是crush-compat模式，同时有读者老铁留言，说当存储池使用了upmap模式做存储池均衡的话，osd重建前后将不能保持相同的pg映射。因为松鼠哥对存
【从问题中去学习k8s】k8s中的常见面试题（夯实理论基础）（二十四）向往风的男子 k8s 学习 kubernetes 容器
本站以分享各种运维经验和运维所需要的技能为主《python零基础入门》：python零基础入门学习《python运维脚本》：python运维脚本实践《shell》：shell学习《terraform》持续更新中：terraform_Aws学习零基础入门到最佳实战《k8》从问题中去学习k8s《docker学习》暂未更新《ceph学习》ceph日常问题解决分享《日志收集》ELK+各种中间件《运维日常》
【从问题中去学习k8s】k8s中的常见面试题（夯实理论基础）（十九）向往风的男子 k8s 学习 kubernetes 容器
本站以分享各种运维经验和运维所需要的技能为主《python零基础入门》：python零基础入门学习《python运维脚本》：python运维脚本实践《shell》：shell学习《terraform》持续更新中：terraform_Aws学习零基础入门到最佳实战《k8》从问题中去学习k8s《docker学习》暂未更新《ceph学习》ceph日常问题解决分享《日志收集》ELK+各种中间件《运维日常》
【从问题中去学习k8s】k8s中的常见面试题（夯实理论基础）（二）向往风的男子 k8s 学习 kubernetes 容器
本站以分享各种运维经验和运维所需要的技能为主《python零基础入门》：python零基础入门学习《python运维脚本》：python运维脚本实践《shell》：shell学习《terraform》持续更新中：terraform_Aws学习零基础入门到最佳实战《k8》从问题中去学习k8s《docker学习》暂未更新《ceph学习》ceph日常问题解决分享《日志收集》ELK+各种中间件《运维日常》
【从问题中去学习k8s】k8s中的常见面试题（夯实理论基础）（二十三）向往风的男子 k8s 学习 kubernetes 容器
本站以分享各种运维经验和运维所需要的技能为主《python零基础入门》：python零基础入门学习《python运维脚本》：python运维脚本实践《shell》：shell学习《terraform》持续更新中：terraform_Aws学习零基础入门到最佳实战《k8》从问题中去学习k8s《docker学习》暂未更新《ceph学习》ceph日常问题解决分享《日志收集》ELK+各种中间件《运维日常》
ceph rgw：bucket policy实现牛牛Blog Ceph ceph rgw bucket policy实现
cephrgw：bucketpolicy实现相比于aws，rgw的bucketpolicy实现的还不是很完善，有很多细节都不支持，并且已支持的特性也在很多细节方面与s3不同，尤其是因为rgw不支持类似s3的accountuser结构，而使用tenant作为替代而导致的一些不同。并且在文档中还提及，为了修正这种不同，以及支持更多特性，在不久后会重写rgw的Authentication/Authori
ceph rgw java_ceph rgw multisite基本用法 weixin_39587113 ceph rgw java
Realm：Zonegroup：理解为数据中心，由一个或多个Zone组成，每个Realm有且仅有一个MasterZonegroup，用于处理系统变更，其他的称为SlaveZonegroup，元数据与MasterZonegroup保持一致；Zone:Zone是一个逻辑概念，包含一个或者多个RGW实例。每个Zonegroup有且仅有一个MasterZone，用于处理bucket和user等元数据变更。
一文读懂CEPH RGW基本原理 shichungang ceph 分布式大数据云计算
一文读懂CEPHRGW基本原理一、RGW简介二、RGW的组成结构三、Rgw用户信息四、BUCKET与对象索引信息五、RGW对象与RADOS对象的关系六、上传对象的处理流程七、RGW的双活机制八、RGW版本管理机制与CLS机制九、结语本文从RGW的基本原理出发，从整体上描述RGW的框架结构，突出关键结构之间的关联关系，从基础代码分析关键环节的实现细节，以达到清晰说明RGW模块“骨架”的效果。一、RG
【mysql】mysql之存储引擎学习向往风的男子 DBA mysql 学习数据库
本站以分享各种运维经验和运维所需要的技能为主《python零基础入门》：python零基础入门学习《python运维脚本》：python运维脚本实践《shell》：shell学习《terraform》持续更新中：terraform_Aws学习零基础入门到最佳实战《k8》从问题中去学习k8s《docker学习》暂未更新《ceph学习》ceph日常问题解决分享《日志收集》ELK+各种中间件《运维日常》
【ceph学习】ceph如何进行数据的读写（2）陶二先生 ceph osd
本章摘要上文说到，librados/IoctxImpl.cc中调用objecter_op和objecter的op_submit函数，进行op请求的封装、加参和提交。本文详细介绍相关函数的调用。osdc中的操作初始化Op对象，提交请求设置Op对象的时间，oid，操作类型等信息。//osdc/Objector.h//mid-levelhelpersOp*prepare_mutate_op(consto
【ceph学习】ceph如何进行数据的读写（3）陶二先生 ceph osd messenger
本章摘要上文说到，osdc中封装请求，使用message中的相关机制将请求发送出去。本文详细介绍osd服务端如何进行请求的接收。osd初始化osd启动时，定义了message变量ms_public，该变量绑定public网络，负责接收客户端的请求。ms_public会启动对应的线程进行接收，并指定接收函数。//ceph_osd.ccMessenger*ms_public=Messenger::cr
云原生应用(7)之Docker容器数据持久化存储机制技术路上的苦行僧云原生应用与架构设计云原生 docker 容器 docker容器数据持久化
一、Docker容器数据持久化存储介绍物理机或虚拟机数据持久化存储由于物理机或虚拟机本身就拥有大容量的磁盘，所以可以直接把数据存储在物理机或虚拟机本地文件系统中，亦或者也可以通过使用额外的存储系统（NFS、GlusterFS、Ceph等）来完成数据持久化存储。Docker容器数据持久化存储由于Docker容器是由容器镜像生成的，所以一般容器镜像中包含什么文件或目录，在容器启动后，我们依旧可以看到相
Openstack 与 Ceph集群搭建(下)： Openstack部署范枝洲系统运维 openstack ceph
文章目录文章参考部署节点准备1.修改Host文件与hostname名称2.安装NTP软件3.网卡配置信息4.开启Docker共享挂载5.安装python虚拟环境6.安装kolla-ansible7.加载AnsiblegalaxyrequirementsOpenstack安装前预配置1.配置密码2.配置multinode文件3.修改全局配置文件Openstack正式安装1.启动bootstrap-s
学习笔记六：ceph介绍以及初始化配置风车带走过往 K8S相关应用学习笔记 ceph
k8s对接cephceph是一种开源的分布式的存储系统，包含以下几种存储类型：块存储（rbd）文件系统cephfs对象存储分布式存储的优点：Ceph核心组件介绍安装Ceph集群初始化配置Ceph安装源安装基础软件包安装ceph集群安装ceph-deploy创建monitor节点修改ceph配置文件配置初始monitor、收集所有的密钥部署osd服务创建ceph文件系统ceph是一种开源的分布式的存
云原生存储解决方案爱技术的小伙子云原生
云原生存储解决方案使用Rook、Ceph等工具进行云原生存储管理云原生存储简介什么是云原生存储云原生存储是指设计用于云原生环境中的存储解决方案，通常在容器化平台如Kubernetes上运行。它提供了高可用性、弹性、可扩展性和自动化管理等特性，满足现代应用的存储需求。云原生存储的重要性动态环境支持：云原生存储能够适应容器化应用的动态变化，提供灵活的存储资源管理。高可用性和持久性：确保数据在容器重启或
【从问题中去学习k8s】k8s中的常见面试题（夯实理论基础）（十二）向往风的男子 k8s 学习 kubernetes 容器
本站以分享各种运维经验和运维所需要的技能为主《python零基础入门》：python零基础入门学习《python运维脚本》：python运维脚本实践《shell》：shell学习《terraform》持续更新中：terraform_Aws学习零基础入门到最佳实战《k8》从问题中去学习k8s《docker学习》暂未更新《ceph学习》ceph日常问题解决分享《日志收集》ELK+各种中间件《运维日常》
【mysql】mysql之数据操作语言（insert、delete、update）向往风的男子 DBA mysql 数据库
本站以分享各种运维经验和运维所需要的技能为主《python零基础入门》：python零基础入门学习《python运维脚本》：python运维脚本实践《shell》：shell学习《terraform》持续更新中：terraform_Aws学习零基础入门到最佳实战《k8》从问题中去学习k8s《docker学习》暂未更新《ceph学习》ceph日常问题解决分享《日志收集》ELK+各种中间件《运维日常》
【从问题中去学习k8s】k8s中的常见面试题（夯实理论基础）（十五）向往风的男子 k8s 学习 kubernetes 容器
本站以分享各种运维经验和运维所需要的技能为主《python零基础入门》：python零基础入门学习《python运维脚本》：python运维脚本实践《shell》：shell学习《terraform》持续更新中：terraform_Aws学习零基础入门到最佳实战《k8》从问题中去学习k8s《docker学习》暂未更新《ceph学习》ceph日常问题解决分享《日志收集》ELK+各种中间件《运维日常》
【从问题中去学习k8s】k8s中的常见面试题（夯实理论基础）（十）向往风的男子 k8s 学习 kubernetes 容器
本站以分享各种运维经验和运维所需要的技能为主《python零基础入门》：python零基础入门学习《python运维脚本》：python运维脚本实践《shell》：shell学习《terraform》持续更新中：terraform_Aws学习零基础入门到最佳实战《k8》从问题中去学习k8s《docker学习》暂未更新《ceph学习》ceph日常问题解决分享《日志收集》ELK+各种中间件《运维日常》
【从问题中去学习k8s】k8s中的常见面试题（夯实理论基础）（六）向往风的男子 k8s 学习 kubernetes 容器
本站以分享各种运维经验和运维所需要的技能为主《python零基础入门》：python零基础入门学习《python运维脚本》：python运维脚本实践《shell》：shell学习《terraform》持续更新中：terraform_Aws学习零基础入门到最佳实战《k8》从问题中去学习k8s《docker学习》暂未更新《ceph学习》ceph日常问题解决分享《日志收集》ELK+各种中间件《运维日常》
rust的指针作为函数返回值是直接传递，还是先销毁后创建？ wudixiaotie 返回值
这是我自己想到的问题，结果去知呼提问，还没等别人回答，我自己就想到方法实验了。。 fn main() { let mut a = 34; println!("a's addr:{:p}", &a); let p = &mut a; println!("p's addr:{:p}", &a
java编程思想 -- 数据的初始化百合不是茶 java 数据的初始化
1.使用构造器确保数据初始化 /* *在ReckInitDemo类中创建Reck的对象 */ public class ReckInitDemo { public static void main(String[] args) { //创建Reck对象 new Reck(); } }
[航天与宇宙]为什么发射和回收航天器有档期 comsci
地球的大气层中有一个时空屏蔽层,这个层次会不定时的出现,如果该时空屏蔽层出现,那么将导致外层空间进入的任何物体被摧毁,而从地面发射到太空的飞船也将被摧毁... 所以,航天发射和飞船回收都需要等待这个时空屏蔽层消失之后,再进行 &
linux下批量替换文件内容商人shang linux 替换
1、网络上现成的资料　　格式: sed -i "s/查找字段/替换字段/g" `grep 查找字段 -rl 路径` 　　linux sed 批量替换多个文件中的字符串　　sed -i "s/oldstring/newstring/g" `grep oldstring -rl yourdir` 　　例如：替换/home下所有文件中的www.admi
网页在线天气预报 oloz 天气预报
网页在线调用天气预报 <%@ page language="java" contentType="text/html; charset=utf-8" pageEncoding="utf-8"%> <!DOCTYPE html PUBLIC "-//W3C//DTD HTML 4.01 Transit
SpringMVC和Struts2比较杨白白 springMVC
1. 入口 spring mvc的入口是servlet，而struts2是filter（这里要指出，filter和servlet是不同的。以前认为filter是servlet的一种特殊），这样就导致了二者的机制不同，这里就牵涉到servlet和filter的区别了。参见：http://blog.csdn.net/zs15932616453/article/details/8832343 2
refuse copy, lazy girl! 小桔子 copy
妹妹坐船头啊啊啊啊！都打算一点点琢磨呢。文字编辑也写了基本功能了。。今天查资料，结果查到了人家写得完完整整的。我清楚的认识到： 1.那是我自己觉得写不出的高度 2.如果直接拿来用，很快就能解决问题 3.然后就是抄咩~~ 4.肿么可以这样子，都不想写了今儿个，留着作参考吧！拒绝大抄特抄，慢慢一点点写！
apache与php整合 aichenglong php apache web
一 apache web服务器 1 apeche web服务器的安装 1)下载Apache web服务器 2)配置域名(如果需要使用要在DNS上注册) 3)测试安装访问http://localhost/验证是否安装成功 2 apache管理 1)service.msc进行图形化管理 2)命令管理，配
Maven常用内置变量 AILIKES maven
Built-in properties ${basedir} represents the directory containing pom.xml ${version} equivalent to ${project.version} (deprecated: ${pom.version}) Pom/Project properties Al
java的类和对象百合不是茶 JAVA面向对象类对象
java中的类： java是面向对象的语言，解决问题的核心就是将问题看成是一个类，使用类来解决 java使用 class 类名来创建类，在Java中类名要求和构造方法，Java的文件名是一样的创建一个A类： class A{ } java中的类：将某两个事物有联系的属性包装在一个类中，再通
JS控制页面输入框为只读 bijian1013 JavaScript
在WEB应用开发当中，增、删除、改、查功能必不可少，为了减少以后维护的工作量，我们一般都只做一份页面，通过传入的参数控制其是新增、修改或者查看。而修改时需将待修改的信息从后台取到并显示出来，实际上就是查看的过程，唯一的区别是修改时，页面上所有的信息能修改，而查看页面上的信息不能修改。因此完全可以将其合并，但通过前端JS将查看页面的所有信息控制为只读，在信息量非常大时，就比较麻烦。
AngularJS与服务器交互 bijian1013 JavaScript AngularJS $http
对于AJAX应用（使用XMLHttpRequests）来说，向服务器发起请求的传统方式是：获取一个XMLHttpRequest对象的引用、发起请求、读取响应、检查状态码，最后处理服务端的响应。整个过程示例如下： var xmlhttp = new XMLHttpRequest(); xmlhttp.onreadystatechange
[Maven学习笔记八]Maven常用插件应用 bit1129 maven
常用插件及其用法位于：http://maven.apache.org/plugins/ 1. Jetty server plugin 2. Dependency copy plugin 3. Surefire Test plugin 4. Uber jar plugin 1. Jetty Pl
【Hive六】Hive用户自定义函数(UDF) bit1129 自定义函数
1. 什么是Hive UDF Hive是基于Hadoop中的MapReduce，提供HQL查询的数据仓库。Hive是一个很开放的系统，很多内容都支持用户定制，包括：文件格式：Text File，Sequence File 内存中的数据格式： Java Integer/String, Hadoop IntWritable/Text 用户提供的 map/reduce 脚本：不管什么
杀掉nginx进程后丢失nginx.pid，如何重新启动nginx ronin47 nginx 重启 pid丢失
nginx进程被意外关闭，使用nginx -s reload重启时报如下错误：nginx: [error] open() “/var/run/nginx.pid” failed (2: No such file or directory)这是因为nginx进程被杀死后pid丢失了，下一次再开启nginx -s reload时无法启动解决办法：nginx -s reload 只是用来告诉运行中的ng
UI设计中我们为什么需要设计动效 brotherlamp UI ui教程 ui视频 ui资料 ui自学
随着国际大品牌苹果和谷歌的引领，最近越来越多的国内公司开始关注动效设计了，越来越多的团队已经意识到动效在产品用户体验中的重要性了，更多的UI设计师们也开始投身动效设计领域。但是说到底，我们到底为什么需要动效设计？或者说我们到底需要什么样的动效？做动效设计也有段时间了，于是尝试用一些案例，从产品本身出发来说说我所思考的动效设计。一、加强体验舒适度嗯，就是让用户更加爽更加爽的用你的产品。
Spring中JdbcDaoSupport的DataSource注入问题 bylijinnan java spring
参考以下两篇文章： http://www.mkyong.com/spring/spring-jdbctemplate-jdbcdaosupport-examples/ http://stackoverflow.com/questions/4762229/spring-ldap-invoking-setter-methods-in-beans-configuration Sprin
数据库连接池的工作原理 chicony 数据库连接池
随着信息技术的高速发展与广泛应用，数据库技术在信息技术领域中的位置越来越重要，尤其是网络应用和电子商务的迅速发展，都需要数据库技术支持动态Web站点的运行，而传统的开发模式是：首先在主程序（如Servlet、Beans）中建立数据库连接；然后进行SQL操作，对数据库中的对象进行查询、修改和删除等操作；最后断开数据库连接。使用这种开发模式，对
java 关键字 CrazyMizzz java
关键字是事先定义的，有特别意义的标识符，有时又叫保留字。对于保留字，用户只能按照系统规定的方式使用，不能自行定义。 Java中的关键字按功能主要可以分为以下几类：（1）访问修饰符 public,private,protected p
Hive中的排序语法 daizj 排序 hive order by DISTRIBUTE BY sort by
Hive中的排序语法 2014.06.22 ORDER BY hive中的ORDER BY语句和关系数据库中的sql语法相似。他会对查询结果做全局排序，这意味着所有的数据会传送到一个Reduce任务上，这样会导致在大数量的情况下，花费大量时间。与数据库中 ORDER BY 的区别在于在hive.mapred.mode = strict模式下，必须指定 limit 否则执行会报错。
单态设计模式 dcj3sjt126com 设计模式
单例模式（Singleton）用于为一个类生成一个唯一的对象。最常用的地方是数据库连接。使用单例模式生成一个对象后，该对象可以被其它众多对象所使用。 <?phpclass Example{ // 保存类实例在此属性中 private static&
svn locked dcj3sjt126com Lock
post-commit hook failed (exit code 1) with output: svn: E155004: Working copy 'D:\xx\xxx' locked svn: E200031: sqlite: attempt to write a readonly database svn: E200031: sqlite: attempt to write a
ARM寄存器学习 e200702084 数据结构 C++c C#F#
无论是学习哪一种处理器，首先需要明确的就是这种处理器的寄存器以及工作模式。 ARM有37个寄存器，其中31个通用寄存器，6个状态寄存器。 1、不分组寄存器（R0-R7）不分组也就是说说，在所有的处理器模式下指的都时同一物理寄存器。在异常中断造成处理器模式切换时，由于不同的处理器模式使用一个名字相同的物理寄存器，就是
常用编码资料 gengzg 编码
List<UserInfo> list=GetUserS.GetUserList(11); String json=JSON.toJSONString(list); HashMap<Object,Object> hs=new HashMap<Object, Object>(); for(int i=0;i<10;i++) {
进程 vs. 线程 hongtoushizi 线程 linux 进程
我们介绍了多进程和多线程，这是实现多任务最常用的两种方式。现在，我们来讨论一下这两种方式的优缺点。首先，要实现多任务，通常我们会设计Master-Worker模式，Master负责分配任务，Worker负责执行任务，因此，多任务环境下，通常是一个Master，多个Worker。如果用多进程实现Master-Worker，主进程就是Master，其他进程就是Worker。如果用多线程实现
Linux定时Job：crontab -e 与 /etc/crontab 的区别 Josh_Persistence linux crontab
一、linux中的crotab中的指定的时间只有5个部分：* * * * * 分别表示：分钟，小时，日，月，星期，具体说来：第一段代表分钟 0—59 第二段代表小时 0—23 第三段代表日期 1—31 第四段代表月份 1—12 第五段代表星期几，0代表星期日 0—6 如： */1 * * * * 每分钟执行一次。 *
KMP算法详解 hm4123660 数据结构 C++算法字符串 KMP
字符串模式匹配我们相信大家都有遇过，然而我们也习惯用简单匹配法（即Brute-Force算法)，其基本思路就是一个个逐一对比下去，这也是我们大家熟知的方法，然而这种算法的效率并不高，但利于理解。假设主串s="ababcabcacbab",模式串为t="
枚举类型的单例模式 zhb8015 单例模式
E.编写一个包含单个元素的枚举类型[极推荐]。代码如下： public enum MaYun {himself; //定义一个枚举的元素，就代表MaYun的一个实例private String anotherField;MaYun() {//MaYun诞生要做的事情//这个方法也可以去掉。将构造时候需要做的事情放在instance赋值的时候：/** himself = MaYun() {*
Kafka+Storm+HDFS ssydxa219 storm
cd /myhome/usr/stormbin/storm nimbus &bin/storm supervisor &bin/storm ui &Kafka+Storm+HDFS整合实践kafka_2.9.2-0.8.1.1.tgzapache-storm-0.9.2-incubating.tar.gzKafka安装配置我们使用3台机器搭建Kafk
Java获取本地服务器的IP 中华好儿孙 java Web 获取服务器ip地址
System.out.println("getRequestURL:"+request.getRequestURL()); System.out.println("getLocalAddr:"+request.getLocalAddr()); System.out.println("getLocalPort:&quo