架构文摘

滴滴李航：分布式存储 Ceph 介绍及原理架构分享

导读：本文主要从架构简介使用场景，以及内部IO流程、心跳机制、通信框架、CRUSH算法、QOS等多个方面逐渐介绍分布式存储系统Ceph的特性。希望对你有所帮助。

————

▍阅读索引

1. Ceph 架构简介及使用场景介绍

1.1 Ceph 简介

1.2 Ceph 特点

1.3 Ceph 架构

1.4 Ceph 核心组件及概念介绍

1.5 三种存储类型-块存储

1.6 三种存储类型-文件存储

1.7 三种存储类型-对象存储

2. Ceph IO 流程及数据分布

2.1 正常IO 流程图

2.2 新主IO 流程图

2.3 Ceph IO 算法流程

2.4 Ceph IO 伪代码流程

2.5 Ceph RBD IO 流程

2.6 Ceph RBD IO 框架图

2.7 Ceph Pool 和 PG 分布情况

2.8 Ceph 数据扩容 PG 分布

3. Ceph 心跳机制

3.1 心跳介绍

3.2 Ceph 心跳检测

3.3 Ceph OSD 之间相互心跳检测

3.4 Ceph OSD 与 Mon 心跳检测

3.5 Ceph 心跳检测总结

4. Ceph 通信框架

4.1 Ceph 通信框架种类介绍

4.2 Ceph 通信框架设计模式

4.3 Ceph 通信框架流程图

4.4 Ceph 通信框架类图

4.5 Ceph 通信数据格式

5. Ceph CRUSH 算法

5.1 数据分布算法挑战

5.2 Ceph CRUSH 算法说明

5.3 Ceph CRUSH 算法原理

5.3.1 层级化的 Cluster Map

5.3.2 数据分布策略 Placement Rules

5.3.3 Bucket 随机算法类型

5.4 Ceph CRUSH 算法案例

6. 定制化 Ceph RBD QOS

6.1 QOS 介绍

6.2 Ceph IO 操作类型

6.3 Ceph 官方 QOS 原理

6.4 定制化 QOS 原理

6.4.1 令牌桶算法介绍

6.4.2 RBD 令牌桶算法流程

6.4.3 RBD 令牌桶算法框架图

▍1. Ceph 架构简介及使用场景介绍

▍1.1 Ceph 简介

Ceph 是一个统一的分布式存储系统，设计初衷是提供较好的性能、可靠性和可扩展性。

Ceph 项目最早起源于 Sage 就读博士期间的工作（最早的成果于2004年发表），并随后贡献给开源社区。在经过了数年的发展之后，目前已得到众多云计算厂商的支持并被广泛应用。

RedHat 及 OpenStack 都可与 Ceph 整合以支持虚拟机镜像的后端存储。

▍1.2 Ceph 特点

高性能

a. 摒弃了传统的集中式存储元数据寻址的方案，采用 CRUSH 算法，数据分布均衡，并行度高。

b. 考虑了容灾域的隔离，能够实现各类负载的副本放置规则，例如跨机房、机架感知等。

c. 能够支持上千个存储节点的规模，支持 TB 到 PB 级的数据。

高可用性

a. 副本数可以灵活控制。

b. 支持故障域分隔，数据强一致性。

c. 多种故障场景自动进行修复自愈。

d. 没有单点故障，自动管理。

高可扩展性

a. 去中心化。

b. 扩展灵活。

c. 随着节点增加而线性增长。

特性丰富

a. 支持三种存储接口：块存储、文件存储、对象存储。

b. 支持自定义接口，支持多种语言驱动。

▍1.3 Ceph 架构

支持三种接口：

Object：有原生的 API，而且也兼容 Swift 和 S3 的 API。

Block：支持精简配置、快照、克隆。

File：Posix 接口，支持快照。

▍1.4 Ceph 核心组件及概念介绍

Monitor

一个 Ceph 集群需要多个 Monitor 组成的小集群，它们通过 Paxos 同步数据，用来保存 OSD 的元数据。

OSD

OSD 全称 Object Storage Device，也就是负责响应客户端请求返回具体数据的进程。一个 Ceph 集群一般都有很多个 OSD。

MDS

MDS 全称 Ceph Metadata Server，是 CephFS 服务依赖的元数据服务。

Object

Ceph 最底层的存储单元是 Object 对象，每个 Object 包含元数据和原始数据。

PG 全称 Placement Grouops，是一个逻辑的概念，一个 PG 包含多个 OSD。引入 PG 这一层其实是为了更好的分配数据和定位数据。

RADOS

RADOS 全称 Reliable Autonomic Distributed Object Store，是 Ceph 集群的精华，用户实现数据分配、Failover 等集群操作。

Libradio

Librados 是 Rados 提供库，因为 RADOS 是协议很难直接访问，因此上层的 RBD、RGW 和 CephFS 都是通过 librados 访问的，目前提供 PHP、Ruby、Java、Python、C和C++支持。

CRUSH

CRUSH 是 Ceph 使用的数据分布算法，类似一致性哈希，让数据分配到预期的地方。

RBD

RBD 全称 RADOS block device，是 Ceph 对外提供的块设备服务。

RGW

RGW 全称 RADOS gateway，是 Ceph 对外提供的对象存储服务，接口与 S3 和 Swift 兼容。

CephFS

CephFS 全称 Ceph File System，是 Ceph 对外提供的文件系统服务。

▍1.5 三种存储类型-块存储

典型设备：

磁盘阵列，硬盘

主要是将裸磁盘空间映射给主机使用的。

优点：

a. 通过 Raid 与 LVM 等手段，对数据提供了保护。

b. 多块廉价的硬盘组合起来，提高容量。

c. 多块磁盘组合出来的逻辑盘，提升读写效率。

缺点：

a. 采用 SAN 架构组网时，光纤交换机，造价成本高。

b. 主机之间无法共享数据。

使用场景：

a. docker 容器、虚拟机磁盘存储分配。

b. 日志存储。

c. 文件存储。

d. …

▍1.6 三种存储类型-文件存储

典型设备：

FTP、NFS 服务器

为了克服块存储文件无法共享的问题，所以有了文件存储。

在服务器上架设 FTP 与 NFS 服务，就是文件存储。

优点：

a. 造价低，随便一台机器就可以了。

b. 方便文件共享。

缺点：

a. 读写速率低。

b. 传输速率慢。

使用场景：

a. 日志存储。

b. 有目录结构的文件存储。

c. …

▍1.7 三种存储类型-对象存储

典型设备：

内置大容量硬盘的分布式服务器(swift, s3)

多台服务器内置大容量硬盘，安装上对象存储管理软件，对外提供读写访问功能。

优点：

a. 具备块存储的读写高速。

b. 具备文件存储的共享等特性。

使用场景：

(适合更新变动较少的数据)

a. 图片存储。

b. 视频存储。

c. …

▍2. Ceph IO 流程

▍2.1 正常 IO 流程图

步骤：

1. client 创建 cluster handler。
2. client 读取配置文件。
3. client 连接上 monitor，获取集群 map 信息。
4. client 读写 io 根据 crshmap 算法请求对应的主 osd 数据节点。
5. 主 osd 数据节点同时写入另外两个副本节点数据。
6. 等待主节点以及另外两个副本节点写完数据状态。
7. 主节点及副本节点写入状态都成功后，返回给 client，io 写入完成。

▍2.2 新主 IO 流程图

说明：

如果新加入的 OSD1 取代了原有的 OSD4 成为 Primary OSD, 由于 OSD1 上未创建 PG , 不存在数据，那么 PG 上的 I/O 无法进行，怎样工作的呢？

步骤：

1. client 连接 monitor 获取集群 map 信息。
2. 同时新主 osd1 由于没有 pg 数据会主动上报 monitor 告知让 osd2 临时接替为主。
3. 临时主 osd2 会把数据全量同步给新主 osd1。
4. client IO 读写直接连接临时主 osd2 进行读写。
5. osd2 收到读写 io，同时写入另外两副本节点。
6. 等待 osd2 以及另外两副本写入成功。
7. osd2 三份数据都写入成功返回给 client, 此时 client io 读写完毕。
8. 如果 osd1 数据同步完毕，临时主 osd2 会交出主角色。
9. osd1 成为主节点，osd2 变成副本。

▍2.3 Ceph IO 算法流程

1. File用户需要读写的文件。File->Object 映射：

a. ino (File 的元数据，File 的唯一id)。

b. ono(File 切分产生的某个 object 的序号，默认以 4M 切分一个块大小)。

c. oid(object id: ino + ono)。

2. Object 是 RADOS 需要的对象。Ceph 指定一个静态hash函数计算 oid 的值，将 oid 映射成一个近似均匀分布的伪随机值，然后和 mask 按位相与，得到 pgid。Object->PG 映射：

a) hash(oid) & mask-> pgid 。

b) mask = PG 总数 m(m 为2的整数幂)-1 。

3. PG(Placement Group),用途是对 object 的存储进行组织和位置映射, (类似于 redis cluster 里面的 slot 的概念) 一个 PG 里面会有很多 object。采用 CRUSH 算法，将 pgid 代入其中，然后得到一组 OSD。PG->OSD 映射：

a) CRUSH(pgid)->(osd1,osd2,osd3) 。

▍2.4 Ceph IO 伪代码流程

locator = object_name	
 	
obj_hash =  hash(locator)	
 	
pg = obj_hash % num_pg	
 	
osds_for_pg = crush(pg)    # returns a list of osds	
 	
primary = osds_for_pg[0]	
 	
replicas = osds_for_pg[1:]

▍2.5 Ceph RBD IO 流程

数据组织：

步骤：

1. 客户端创建一个 pool，需要为这个 pool 指定 pg 的数量。
2. 创建 pool/image rbd 设备进行挂载。
3. 用户写入的数据进行切块，每个块的大小默认为4M，并且每个块都有一个名字，名字就是 object+序号。
4. 将每个 object 通过 pg 进行副本位置的分配。
5. pg 根据 cursh 算法会寻找3个 osd，把这个 object 分别保存在这三个 osd 上。
6. osd 上实际是把底层的 disk 进行了格式化操作，一般部署工具会将它格式化为 xfs 文件系统。
7. object 的存储就变成了存储一个文 rbd0.object1.file。

▍2.6 Ceph RBD IO 框架图

客户端写数据 osd 过程：

1. 采用的是 librbd 的形式，使用 librbd 创建一个块设备，向这个块设备中写入数据。
2. 在客户端本地同过调用 librados 接口，然后经过 pool，rbd，object、pg 进行层层映射,在 PG 这一层中，可以知道数据保存在哪3个 OSD 上，这3个 OSD 分为主从的关系。
3. 客户端与 primay OSD 建立 SOCKET 通信，将要写入的数据传给 primary OSD，由primary OSD 再将数据发送给其他 replica OSD 数据节点。

▍2.7 Ceph Pool 和 PG 分布情况

说明：

a. pool 是 ceph 存储数据时的逻辑分区，它起到 namespace 的作用。
b. 每个 pool 包含一定数量(可配置)的 PG。
c. PG 里的对象被映射到不同的 OSD 上。
d. pool 是分布到整个集群的。
e. pool 可以做故障隔离域，根据不同的用户场景不一进行隔离。

▍2.8 Ceph 数据扩容 PG 分布

场景数据迁移流程：

a. 现状3个 OSD, 4个 PG

b. 扩容到4个 OSD, 4个 PG

现状：

扩容后：

说明：

每个 OSD 上分布很多 PG, 并且每个 PG 会自动散落在不同的 OSD 上。如果扩容那么相应的 PG 会进行迁移到新的 OSD 上，保证 PG 数量的均衡。

▍3. Ceph 心跳机制

▍3.1 心跳介绍

心跳是用于节点间检测对方是否故障的，以便及时发现故障节点进入相应的故障处理流程。

问题：

a. 故障检测时间和心跳报文带来的负载之间做权衡。

b. 心跳频率太高则过多的心跳报文会影响系统性能。

c. 心跳频率过低则会延长发现故障节点的时间，从而影响系统的可用性。

故障检测策略应该能够做到：

及时：节点发生异常如宕机或网络中断时，集群可以在可接受的时间范围内感知。

适当的压力：包括对节点的压力，和对网络的压力。

容忍网络抖动：网络偶尔延迟。

扩散机制：节点存活状态改变导致的元信息变化需要通过某种机制扩散到整个集群。

▍3.2 Ceph 心跳检测

OSD 节点会监听 public、cluster、front 和 back 四个端口

· public 端口：监听来自 Monitor 和 Client 的连接。

· cluster 端口：监听来自 OSD Peer 的连接。

· front 端口：供客户端连接集群使用的网卡, 这里临时给集群内部之间进行心跳。

· back 端口：供客集群内部使用的网卡。集群内部之间进行心跳。

· hbclient：发送 ping 心跳的 messenger。

▍3.3 Ceph OSD 之间相互心跳检测

步骤：

a. 同一个 PG 内 OSD 互相心跳，他们互相发送 PING/PONG 信息。

b. 每隔6s检测一次(实际会在这个基础上加一个随机时间来避免峰值)。

c. 20s没有检测到心跳回复，加入 failure 队列。

▍3.4 Ceph OSD与Mon心跳检测

OSD 报告给 Monitor：

a. OSD 有事件发生时（比如故障、PG 变更）。
b. 自身启动5秒内。
c. OSD 周期性的上报给 Monito
d. OSD 检查 failure_queue 中的伙伴 OSD 失败信息。
e. 向 Monitor 发送失效报告，并将失败信息加入 failure_pending 队列，然后将其从 failure_queue 移除。
f. 收到来自 failure_queue 或者 failure_pending 中的 OSD 的心跳时，将其从两个队列中移除，并告知 Monitor 取消之前的失效报告。
g. 当发生与 Monitor 网络重连时，会将 failure_pending 中的错误报告加回到 failure_queue 中，并再次发送给 Monitor。
h. Monitor 统计下线 OSD
i. Monitor 收集来自 OSD 的伙伴失效报告。
j. 当错误报告指向的 OSD 失效超过一定阈值，且有足够多的 OSD 报告其失效时，将该 OSD 下线。

▍3.5 Ceph 心跳检测总结

Ceph 通过伙伴 OSD 汇报失效节点和 Monitor 统计来自 OSD 的心跳两种方式判定 OSD 节点失效。

及时：

伙伴 OSD 可以在秒级发现节点失效并汇报 Monitor，并在几分钟内由 Monitor 将失效 OSD 下线。

适当的压力：

由于有伙伴 OSD 汇报机制，Monitor 与 OSD 之间的心跳统计更像是一种保险措施，因此 OSD 向 Monitor 发送心跳的间隔可以长达600秒，Monitor 的检测阈值也可以长达900秒。Ceph 实际上是将故障检测过程中中心节点的压力分散到所有的 OSD 上，以此提高中心节点 Monitor 的可靠性，进而提高整个集群的可扩展性。

容忍网络抖动：

Monitor 收到 OSD 对其伙伴 OSD 的汇报后，并没有马上将目标 OSD 下线，而是周期性的等待几个条件：

1. 目标 OSD 的失效时间大于通过固定量 osd_heartbeat_grace 和历史网络条件动态确定的阈值。

2. 来自不同主机的汇报达到 mon_osd_min_down_reporters。

3. 满足前两个条件前失效汇报没有被源 OSD 取消。

扩散：

作为中心节点的 Monitor 并没有在更新 OSDMap 后尝试广播通知所有的 OSD 和 Client，而是惰性的等待 OSD 和 Client 来获取。以此来减少 Monitor 压力并简化交互逻辑。

▍4. Ceph 通信框架

▍4.1 Ceph 通信框架种类介绍

网络通信框架三种不同的实现方式：

Simple 线程模式

特点：每一个网络链接，都会创建两个线程，一个用于接收，一个用于发送。

缺点：大量的链接会产生大量的线程，会消耗 CPU 资源，影响性能。

Async 事件的I/O多路复用模式

特点：这种是目前网络通信中广泛采用的方式。k版默认已经使用 Asnyc 了。

XIO 方式使用了开源的网络通信库 accelio 来实现

特点：这种方式需要依赖第三方的库 accelio 稳定性，目前处于试验阶段。

▍4.2 Ceph 通信框架设计模式

设计模式(Subscribe/Publish)：

订阅发布模式又名观察者模式，它意图是“定义对象间的一种一对多的依赖关系，

当一个对象的状态发生改变时，所有依赖于它的对象都得到通知并被自动更新”。

▍4.3 Ceph 通信框架流程图

步骤：

a. Accepter 监听 peer 的请求, 调用 SimpleMessenger::add_accept_pipe() 创建新的 Pipe 到 SimpleMessenger::pipes 来处理该请求。
b. Pipe 用于消息的读取和发送。该类主要有两个组件，Pipe::Reader，Pipe::Writer 用来处理消息读取和发送。
c. Messenger 作为消息的发布者, 各个 Dispatcher 子类作为消息的订阅者, Messenger 收到消息之后，通过 Pipe 读取消息，然后转给 Dispatcher 处理。
d. Dispatcher 是订阅者的基类，具体的订阅后端继承该类,初始化的时候通过 Messenger::add_dispatcher_tail/head 注册到 Messenger::dispatchers. 收到消息。
e. DispatchQueue 该类用来缓存收到的消息, 然后唤醒 DispatchQueue::dispatch_thread 线程找到后端的 Dispatch 处理消息。

▍4.4 Ceph 通信框架类图

▍4.5 Ceph 通信数据格式

通信协议格式需要双方约定数据格式。

消息的内容主要分为三部分：

· header //消息头，类型消息的信封

· user data //需要发送的实际数据

o payload //操作保存元数据

o middle //预留字段

o data //读写数据

o footer //消息的结束标记

class Message : public RefCountedObject {	
protected:	
  ceph_msg_header  header;      // 消息头	
  ceph_msg_footer  footer;      // 消息尾	
  bufferlist       payload;  // "front" unaligned blob	
  bufferlist       middle;   // "middle" unaligned blob	
  bufferlist       data;     // data payload (page-alignment will be preserved where possible)	
 	
  /* recv_stamp is set when the Messenger starts reading the	
   * Message off the wire */	
  utime_t recv_stamp;       //开始接收数据的时间戳	
  /* dispatch_stamp is set when the Messenger starts calling dispatch() on	
   * its endpoints */	
  utime_t dispatch_stamp;   //dispatch 的时间戳	
  /* throttle_stamp is the point at which we got throttle */	
  utime_t throttle_stamp;   //获取throttle 的slot的时间戳	
  /* time at which message was fully read */	
  utime_t recv_complete_stamp;  //接收完成的时间戳	
 	
  ConnectionRef connection;     //网络连接	
 	
  uint32_t magic = 0;           //消息的魔术字	
 	
  bi::list_member_hook<> dispatch_q;  //boost::intrusive 成员字段	
};	
 	
struct ceph_msg_header {	
    __le64 seq;       // 当前session内 消息的唯一 序号	
    __le64 tid;       // 消息的全局唯一的 id	
    __le16 type;      // 消息类型	
    __le16 priority;  // 优先级	
    __le16 version;   // 版本号	
 	
    __le32 front_len; // payload 的长度	
    __le32 middle_len;// middle 的长度	
    __le32 data_len;  // data 的 长度	
    __le16 data_off;  // 对象的数据偏移量	
 	
 	
    struct ceph_entity_name src; //消息源	
 	
    /* oldest code we think can decode this.  unknown if zero. */	
    __le16 compat_version;	
    __le16 reserved;	
    __le32 crc;       /* header crc32c */	
} __attribute__ ((packed));	
 	
struct ceph_msg_footer {	
    __le32 front_crc, middle_crc, data_crc; //crc校验码	
    __le64  sig; //消息的64位signature	
    __u8 flags; //结束标志	
} __attribute__ ((packed));

▍5. Ceph CRUSH 算法

▍5.1 数据分布算法挑战

数据分布和负载均衡：

1. 数据分布均衡，使数据能均匀的分布到各个节点上。

2. 负载均衡，使数据访问读写操作的负载在各个节点和磁盘的负载均衡。

灵活应对集群伸缩：

1. 系统可以方便的增加或者删除节点设备，并且对节点失效进行处理。

2. 增加或者删除节点设备后，能自动实现数据的均衡，并且尽可能少的迁移数据。

支持大规模集群：

1. 要求数据分布算法维护的元数据相对较小，并且计算量不能太大。随着集群规模的增加，数据分布算法开销相对比较小。

▍5.2 Ceph CRUSH 算法说明

CRUSH 算法的全称为：Controlled Scalable Decentralized Placement of Replicated Data，可控的、可扩展的、分布式的副本数据放置算法。

PG到OSD 的映射的过程算法叫做 CRUSH 算法。(一个 Object 需要保存三个副本，也就是需要保存在三个 osd 上)。

CRUSH 算法是一个伪随机的过程，他可以从所有的 OSD 中，随机性选择一个 OSD 集合，但是同一个 PG 每次随机选择的结果是不变的，也就是映射的 OSD 集合是固定的。

▍5.3 Ceph CRUSH 算法原理

CRUSH 算法因子：

层次化的 Cluster Map

反映了存储系统层级的物理拓扑结构。定义了 OSD 集群具有层级关系的静态拓扑结构。OSD 层级使得 CRUSH 算法在选择 OSD 时实现了机架感知能力，也就是通过规则定义，使得副本可以分布在不同的机架、不同的机房中、提供数据的安全性。

Placement Rules

决定了一个 PG 的对象副本如何选择的规则，通过这些可以自己设定规则，用户可以自定义设置副本在集群中的分布。

● 5.3.1 层级化的 Cluster Map

CRUSH Map 是一个树形结构，OSDMap 更多记录的是 OSDMap 的属性(epoch/fsid/pool 信息以及 osd 的 ip 等等)。

叶子节点是 device（也就是 osd），其他的节点称为 bucket 节点，这些 bucket 都是虚构的节点，可以根据物理结构进行抽象，当然树形结构只有一个最终的根节点称之为 root 节点，中间虚拟的 bucket 节点可以是数据中心抽象、机房抽象、机架抽象、主机抽象等。

● 5.3.2 数据分布策略 Placement Rules

数据分布策略 Placement Rules 主要有特点：

1. 从 CRUSH Map 中的哪个节点开始查找

2. 使用那个节点作为故障隔离域

3. 定位副本的搜索模式（广度优先 or 深度优先）

rule replicated_ruleset  #规则集的命名，创建pool时可以指定rule集	
	
{	
	
    ruleset 0                #rules集的编号，顺序编即可   	
	
    type replicated          #定义pool类型为replicated(还有erasure模式)   	
	
    min_size 1                #pool中最小指定的副本数量不能小1	
	
    max_size 10               #pool中最大指定的副本数量不能大于10       	
	
    step take default         #查找bucket入口点，一般是root类型的bucket    	
	
    step chooseleaf  firstn  0  type  host #选择一个host,并递归选择叶子节点osd     	
	
    step emit        #结束	
	
}

● 5.3.3 Bucket 随机算法类型

一般的 buckets：适合所有子节点权重相同，而且很少添加删除 item。

list buckets：适用于集群扩展类型。增加 item，产生最优的数据移动，查找 item，时间复杂度 O(n)。

tree buckets：查找负责度是 O (log n), 添加删除叶子节点时，其他节点 node_id 不变。

straw buckets：允许所有项通过类似抽签的方式来与其他项公平“竞争”。定位副本时，bucket 中的每一项都对应一个随机长度的 straw，且拥有最长长度的 straw 会获得胜利（被选中），添加或者重新计算，子树之间的数据移动提供最优的解决方案。

▍5.4 Ceph CRUSH 算法案例

说明：

集群中有部分 sas 和 ssd 磁盘，现在有个业务线性能及可用性优先级高于其他业务线，能否让这个高优业务线的数据都存放在 ssd 磁盘上。

普通用户：

高优用户：

配置规则：

▍6. 定制化 Ceph RBD QOS

▍6.1 QOS 介绍

QoS （Quality of Service，服务质量）起源于网络技术，它用来解决网络延迟和阻塞等问题，能够为指定的网络通信提供更好的服务能力。

问题：

我们总的 Ceph 集群的 IO 能力是有限的，比如带宽，IOPS。如何避免用户争抢资源，如何保证集群所有用户资源的高可用性，以及如何保证高优用户资源的可用性。所以我们需要把有限的 IO 能力合理分配。

▍6.2 Ceph IO 操作类型

ClientOp：来自客户端的读写 I/O 请求。

SubOp：osd 之间的 I/O 请求。主要包括由客户端 I/O 产生的副本间数据读写请求，以及由数据同步、数据扫描、负载均衡等引起的 I/O 请求。

SnapTrim：快照数据删除。从客户端发送快照删除命令后，删除相关元数据便直接返回，之后由后台线程删除真实的快照数据。通过控制 snaptrim 的速率间接控制删除速率。

Scrub：用于发现对象的静默数据错误，扫描元数据的 Scrub 和对象整体扫描的 deep Scrub。

Recovery：数据恢复和迁移。集群扩/缩容、osd 失效/从新加入等过程。

▍6.3 Ceph 官方 QOS 原理

mClock 是一种基于时间标签的 I/O 调度算法，最先被 Vmware 提出来的用于集中式管理的存储系统。(目前官方 QOS 模块属于半成品)。

基本思想：

· reservation 预留，表示客户端获得的最低 I/O 资源。

· weight 权重，表示客户端所占共享 I/O 资源的比重。

· limit 上限，表示客户端可获得的最高 I/O 资源。

▍6.4 定制化 QOS 原理

● 6.4.1 令牌桶算法介绍

基于令牌桶算法(TokenBucket)实现了一套简单有效的 qos 功能，满足了云平台用户的核心需求。

基本思想：

按特定的速率向令牌桶投放令牌。
根据预设的匹配规则先对报文进行分类，不符合匹配规则的报文不需要经过令牌桶的处理，直接发送。
符合匹配规则的报文，则需要令牌桶进行处理。当桶中有足够的令牌则报文可以被继续发送下去，同时令牌桶中的令牌量按报文的长度做相应的减少。
当令牌桶中的令牌不足时，报文将不能被发送，只有等到桶中生成了新的令牌，报文才可以发送。这就可以限制报文的流量只能是小于等于令牌生成的速度，达到限制流量的目的。

● 6.4.2 RBD 令牌桶算法流程

步骤：

用户发起请求异步IO到达Image中。
请求到达ImageRequestWQ队列中。
在ImageRequestWQ出队列的时候加入令牌桶算法TokenBucket。
通过令牌桶算法进行限速，然后发送给ImageRequest进行处理。

● 6.4.3 RBD令牌桶算法框架图

现有框架图：

令牌图算法框架图：

李航
滴滴 | 专家工程师

多年的底层开发经验，在高性能nginx开发和分布式缓存redis cluster有着丰富的经验，目前从事分布式存储Ceph工作。先后在58同城、汽车之家、优酷土豆集团工作。目前供职于滴滴基础平台滴滴云，主要负责分布式Ceph系统。

相关阅读：史上最全的Ceph介绍、原理、架构

版权申明：内容来源网络，版权归原创者所有。除非无法确认，我们都会标明作者及出处，如有侵权烦请告知，我们会立即删除并表示歉意。谢谢。

架构文摘

ID：ArchDigest

互联网应用架构丨架构技术丨大型网站丨大数据

更多精彩文章，请点击下方：阅读原文

你可能感兴趣的:(滴滴李航：分布式存储 Ceph 介绍及原理架构分享)

TreeSize Free - windows下硬盘空间管理工具 AI+程序员在路上 QT&C++实战系列开发语言 windows
一.介绍TreeSizeFree是一款免费且广受欢迎的磁盘空间分析工具（由JAMSoftware开发），主要用于Windows系统。它的核心功能是帮助你快速、清晰地了解硬盘、文件夹或存储设备上的空间究竟被哪些文件和文件夹占用了。它以直观的树状结构、多种视图（尤其是Treemap）和强大的排序功能，帮助你快速定位磁盘空间消耗大户，是进行磁盘清理、存储管理和解决空间不足问题的必备工具之一。官网下载：h
20250718-2-Kubernetes 应用程序生命周期管理-Pod对象：基本概念(豌豆荚)_笔记 Andy杨 CKA-专栏 kubernetes 容器笔记
二、Kubernetes应用程序生命周期管理1.课程内容概述主要内容：Pod资源共享实现机制管理命令应用自修复（重启策略+健康检查）环境变量Initcontainer静态Pod2.Pod对象介绍1）Pod基本概念定义：Pod是Kubernetes创建和管理的最小单元，一个逻辑抽象概念组成：由一个或多个容器组成特点：可理解为一个应用实例容器始终部署在同一个节点上容器间共享网络和存储资源设计灵
三生三世之情深缘浅12 青丘提亲去，宠爱世无双佛铃花语
夜月一帘幽梦，春风十里柔情。———北宋秦观众人吃完茶点，凤九端了茶杯及碗碟走了出去，帝君乘着凤九不在，与大家讨论提亲事宜。“本君打算明日去青丘提亲，然后带着九儿去碧海苍灵闭关，你们有什么建议？”大家目光扫过众人。“这么快？东华，会不会太仓促？”连宋问。“不快，本君等这一天已经等很久了”。“时间上确实比较仓促，东华，你打算怎么做？”墨渊问。“聘礼显然来不及准备，本君打算明日只带一件信物过去，其余聘礼
【Linux基础知识系列】第五十一篇 - Linux文件命名规范与格式望获linux Linux基础知识系列 java 服务器 linux 开发语言前端数据库嵌入式软件
在Linux系统中，文件命名规范和格式对于文件的组织和管理至关重要。合理的文件命名不仅可以帮助用户快速识别文件的内容和用途，还能避免文件名冲突和错误。掌握Linux文件命名规范和常见格式，对于开发者和系统管理员来说是非常重要的技能。本文将详细介绍Linux系统中文件命名的规范和常见格式，包括命名约定和文件扩展名的意义，帮助读者合理管理文件。核心概念1.文件名文件名是文件的标识符，用于在文件系统中唯
无标题文章周文娟_39df
日期：2018年11月1日与会人员：陈明总监、孔健、孔德雪、沙华蓉、叶峥、邢雨佳、韩晗、杜迎、沈芳、周文娟#目标明确ART021的分工及执行标准#记录-会议要点1ART021要实现让顾客使用我们的库，实现让机构自己使用我们的后台，自己上传内容。不需要拓展客户，实现把已签约的机构导入到我们的库里面就可以；-会议要点2技术可以自己对接客户使用的不用商品管理系统，不需要机构自己上传，可直接帮机构导入资源
GPU网络运维一行代码通万物网络运维 GPU
一、GPU网络架构与核心技术GPU集群网络需适配分布式训练中“多节点数据同步”（如all-reduce、broadcast）的高频、大流量需求，主流技术方案及特点如下：网络技术核心优势适用场景运维重点InfiniBand低延迟（~1us）、高带宽（400Gb/s）、原生RDMA支持超大规模集群（≥1000节点）、千亿参数模型训练子网管理、固件兼容性、链路健康RoCE（RDMAoverConverg
python automl_自动化的机器学习(AutoML)：将AutoML部署到云中
编辑推荐:在本文中，将介绍一种AutoML设置，使用Python、Flask在云中训练和部署管道；以及两个可自动完成特征工程和模型构建的AutoML框架。本文来自于搜狐网，由火龙果软件Alice编辑、推荐。AutoML到底是什么？AutoML是一个很宽泛的术语，理论上来说，它囊括从数据探索到模型构建这一完整的数据科学循环周期。但是，我发现这个术语更多时候是指自动的特征预处理和选择、模型算法选择和超
RN 新架构到底牛在哪？一张图看懂「砍线程、省 Bridge、帧率拉满」 wayne214 架构 react native
新旧架构的核心区别“新架构把原来基于Bridge的异步JSON通信，变成了基于JSI的同步直接调用，并拆掉了启动时全量初始化、按需加载模块”。下面从6个维度把差异展开说明。维度旧架构（≤0.67）新架构（Fabric+TurboModules）通信模型Bridge：JS→JSON→原生，异步、串行、易阻塞JSI：JS直接持有C++HostObject引用，可同步调用渲染管线JS线程→Shadow线
为广大网友收集的经典小游戏合辑(VC++)，你想要的都有程序员欧阳沐
很多经典小游戏合辑(VC++)，有超级玛丽，坦克大战，黑白棋，飞机大战，还有两款不知道名字，还附有源码，学习和娱乐都有哦。源码目录结构图：部分源码展示（由于源码比较多，所以就不在此全部展示，需要的可以私信me）：如果你想学c++编程可以私信小编，发送“01”获取源码或2019年最新学习资料“从零基础到精通”。部分资料展示如下：您的关注便是小编每日不断更新分享的源动力，谢谢。学c++可抠裙：74五五
剧本杀《误入杀手镇的0和1》复盘详细解析+凶手角色剧透答案真相 VX搜_小燕子复盘
为了你获得更好的游戏体验，本文仅显示《误入杀手镇的0和1》剧本杀部分真相复盘，获取完整真相复盘只需两步①【微信关注公众号：集美复盘】②回复【误入杀手镇的0和1】即可查看获取哦﹎﹎﹎﹎﹎﹎﹎﹎﹎﹎﹎﹎﹎﹎﹎﹎﹎﹎﹎﹎﹎﹎﹎﹎﹎﹎﹎﹎﹎﹎﹎﹎﹎﹎﹎﹎﹎﹎﹎﹎1、剧本杀《误入杀手镇的0和1》角色介绍洛萝和刘嘎子作案过程中，萧贱贱先用枕头捂四了王有钱，然后扮作王有钱的模样在【王有钱大宫殿】游荡，所以洛萝扮
33、CentOS系统安装与配置全攻略 tgb34567890 Linux服务器管理实战指南 CentOS安装 CentOS配置系统更新
CentOS系统安装与配置全攻略1.安装CentOS及系统更新与增强在使用引导加载器命令时要格外小心，因为不当使用可能会导致操作系统无法启动。接下来，我们将学习如何增强CentOS7的最小安装，添加额外的管理和开发工具。1.1准备工作拥有具有root权限的CentOS7操作系统的最小安装。连接到互联网，以便下载额外的软件包。1.2操作步骤系统更新：以root用户登录，输入以下命令：yum-yupd
云原生环境中Consul的动态服务发现实践 AI云原生与云计算技术学院 AI云原生与云计算云原生 consul 服务发现 ai
云原生环境中Consul的动态服务发现实践关键词：云原生,服务发现,Consul,微服务,动态注册,健康检查,Raft算法摘要：本文深入探讨云原生环境下Consul在动态服务发现中的核心原理与实践方法。通过剖析Consul的架构设计、核心算法和关键机制，结合具体代码案例演示服务注册、发现和健康检查的全流程。详细阐述在Kubernetes、Docker等云原生技术栈中的集成方案，分析实际应用场景中的
云原生环境里Nginx的故障排查思路 AI云原生与云计算技术学院 AI云原生与云计算云原生 nginx 运维 ai
云原生环境里Nginx的故障排查思路关键词：云原生、Nginx、故障排查、容器化、Kubernetes摘要：本文聚焦于云原生环境下Nginx的故障排查思路。随着云原生技术的广泛应用，Nginx作为常用的高性能Web服务器和反向代理服务器，在容器化和编排的环境中面临着新的故障场景和挑战。文章首先介绍云原生环境及Nginx的相关背景知识，接着阐述核心概念和联系，详细讲解故障排查的核心算法原理与操作步骤
谷歌云(GCP)入门指南：从零开始搭建你的第一个云应用 AI云原生与云计算技术学院 AI云原生与云计算 perl 服务器网络 ai
谷歌云(GCP)入门指南：从零开始搭建你的第一个云应用关键词：谷歌云、GCP、云应用搭建、入门指南、云计算摘要：本文旨在为初学者提供一份全面的谷歌云（GCP）入门指南，详细介绍如何从零开始搭建第一个云应用。通过逐步分析推理，我们将涵盖背景知识、核心概念、算法原理、数学模型、项目实战、实际应用场景、工具资源推荐等多个方面，帮助读者深入理解GCP的使用方法和搭建云应用的流程，为后续的云计算实践打下坚实
Java-Script学习笔记-1 许我写余生ღ JavaScript 学习 javascript 前端
文章目录前言JavaScript基本介绍一、js的嵌入方法内嵌式外链式行内式二、js简单语法语句注释变量JavaScript保留关键字三、JavaScript作用域Javascrpt局部变量JavaScript全局变量四、运算符算术运算符比较运算符赋值运算符逻辑运算符五、JavaScript数据类型JavaScript如何判断数据类型数字类型（Number）字符串型（string）布尔类型（boo
苔 coffee漫
一滴清如澈的水珠苔清·袁枚白日不到处，青春恰自来。苔花如米小，也学牡丹开。过年那会第一次看到好多公众号上分享了《经典咏流传》中梁俊老师和他的孩子们一起唱的《苔》，于是我也去看看到底有多好。当梁老师问到你知道为啥要带你们唱《苔》吗？是希望我们可以像牡丹一样开放。当孩子们开口唱《苔》时，那纯真的声音，简单的曲调，就像是见到了许久未见的老朋友，见到了倾慕已久的心上人的感觉，激动，更多的是感动。教孩子们唱
正面的表达心语交流
我们每天都要和家人、朋友、同事、陌生人等进行大量的沟通，通过沟通表达进行协作，让他人知道自己的想法，也让自己知道他人的想法。虽然每天都在用，可真的是在用正确的方式表达吗。也许还真的没有，不然怎么会有那么多因为说话不投机，说话方式不对等原因造成的人际关系紧张及家庭关系紧张的情况。不同的场合有不同的说话表达方式和方法，我这次想分享的是如何在家庭生活中进行正确的表达，我看到过很多案例，夫妻反目，孩子叛逆
2019-07-06 振华老凤祥店长崔宁宁
大爱的李老师，智慧的教授，亲爱的跃友们：大家好！我是莱州鑫和金店李总的人～崔宁宁今天是我的日精进行动第46天，我分享一下今天的改变，我们相互勉励，每天进步一点点，离成功便不远。1、比学习：学而不思则罔，思而不学则殆2、比改变：与其埋怨世界，不如改变自己。管好自己的心，做好自己的事，比什么都强。人生无完美，曲折亦风景。3、比付出：不是所有的付出都有回报，也不是所有的付出都需要回报。只要在付出的过程中
挣扎的第一次写作冬竹i
前两天朋友推荐我看了罗振宇的跨年演讲“时间的朋友”，看过之后知道他每年的最后一天会做一场演讲，讲述过去一年的所见、所闻、所想，展望今后一年努力的方向。看到他所做所为有所触动，巧合的是，我第二天就被拉入了一个写作交流分享群，群主是三合燕子。她是一名家装销售顾问，在一次郑州学习中，讲师提到了他的得意学生三合燕子，不仅销售业绩做的好，而且每天的朋友圈文案都非常优美，为了日后能向她学习请教我就把这个名字牢
Telegram是什么？有什么优势 ZhangJiQun&MXP 教学 2021 论文 2024大模型以及算力语言模型 transformer python 人工智能自然语言处理
Telegram是什么？有什么优势是一款以安全、高效和多功能著称的即时通讯应用，以下从核心优势、聊天方法及实际案例展开说明：一、核心优势1.极致安全与隐私保护端到端加密：秘密聊天（SecretChats）使用端到端加密**，消息仅双方可见，且支持设置自毁时间（如10秒后自动删除）。**第三方账户验证：2025年新增功能允许监管机构或行业联盟对账户进行认证，验证后的账户显示专属徽标，防范诈骗。匿名性
OPC UA与PostgreSQL如何实现无缝连接？果壳里的世界 postgresql 数据库
随着工业4.0的推进，数据交换和集成在智能制造中扮演着越来越重要的角色。OPCUA能够实现设备与设备、设备与系统之间的高效数据交换。而PostgreSQL则是一种强大的开源关系型数据库管理系统，广泛应用于数据存储和管理。如何将OPCUA与PostgreSQL结合起来，为工业数据的存储和分析提供坚实的基础？本文将介绍如何通过OPCRouter的PostgreSQL插件，实现OPCUA与Postgre
React Native - 使用图片选择器react-native-image-picker拍照、选照片三好夫人 React Native react
我们程序中需要提供用户上传照片的功能。照片可以从设备相册中选择，也可以使用摄像头直接拍摄。这个功能使用react-native-image-picker库就可以很方便的实现。1，react-native-image-picker介绍react-native-image-picker是一个第三方的开源库，它提供了原生的UI界面供用户选择图片或视频。图片或视频的来源可以是系统相簿，也可以是相机直接拍摄
量化自动交易机器人合约现货策略开发实战指南 mxh5201133 机器人智能合约区块链量化自动交易合约现货交易机器人
量化交易正在重塑金融市场格局，自动交易机器人(19I零3八11陆⑦二）凭借其**无情绪干扰、高执行精度与7×24小时运作**的优势，已成为机构与个人投资者的核心工具。本文将深入解析合约现货双市场量化机器人的**策略设计、技术实现与系统架构**，并附关键模块的代码示例。---一、核心策略模块开发与实现1.**网格策略：震荡市场的收益引擎**网格策略的核心是**“仓位管理优于择时”**，通过构建价格区
《一个家庭最高级的炫富是什么》【963】丽娟的故事
大家好，我叫王丽娟，今天给大家分享的话题是《一个家庭最高级的炫富是什么》冰心说：一个美好的家庭，乃是一切幸福和力量的根源。行走于世间，家，是一个人的根基所在，是一生中所有底气的源头。人活一辈子，最大的幸福莫过于：生于一个充满欢声笑语的家，长于一个有着优良门风的家，立于一个可以随时依靠的家。四十岁以后才明白：一个情绪稳定的母亲，一个三观极正的父亲，一个知恩图报的孩子，胜过万千财富。英国作家洛瑞·李曾
人工智能服务器处理器的全新定义两大头部品牌旗舰款的王者之争！云储存cpu_云服务器处理器_企业服务器处理器
一、旗舰处理器架构解析IntelXeon6900系列代表着英特尔在服务器处理器领域的最新成果，采用增强版Intel7制程工艺打造。该系列最高配置56个物理核心，通过超线程技术支持112个逻辑线程，在处理多线程任务时展现出卓越的性能表现。内存子系统方面，支持8通道DDR5-4800内存配置，最高可扩展至4TB容量，为内存密集型应用提供了充足带宽。特别值得一提的是其集成的AMX高级矩阵扩展指令集，这项
《双语言》21.向着未来金之心
幸子朝门里窥视，然后走了进去。“我能做些什么？”她开始说。“发生了什么事？重要吗？”“重要吗？”希德·张伯伦激动得快要爆炸了。“看那个，幸子！我们阅读它！玛莎发现了如何阅读火星语！”他抓住梅尔队长挽着胳膊。“来吧，杰夫；走吧。我想给其他人打电话——”他匆忙离开房间时仍在胡言乱语。幸子看着碑文。“是真的吗？”她问，然后，玛莎还没来得及解释，就张开双臂抱紧她。“哦，真的是！你在读它！我太高兴了！”塞利
预售中期 96cd2785c65e
7月27日星期六上午学习了刘润五分钟之“统合综效”——1.尊重差异性激发多样性-不要追求投影，也就是观点、价值观的一致。相反，你应该尊重观点的差异，感激团队的多样性。2.第三，共享目标，创造性合作！从合作，到创造性合作的秘诀是：找到共享的目标。明日计划：上午：9:30开会学习中午：休息维护7-14至7-17的客户（询问）下午：要资源晚上：维护7-18至7-21的客户（分享体式）
2019-11-11晨间日记麦新
今天是什么日子起床：6:00就寝：23:00天气：晴朗心情：平静纪念日：节日快乐叫我起床的不是闹钟是梦想年度目标及关键点：国考考研本月重要成果：学习今日三只青蛙/番茄钟开营分班处置一天成功日志-记录三五件有收获的事务开营分班处置一天财务检视-12邮费人际的投入链接新朋友开卷有益-学习/读书/听书《被忽视的孩子》健康与饮食今日步数：10000+好习惯打卡早晚打卡阅读打卡听书打卡社群打卡
镇魂街：天生为王怎么玩才厉害？教你如何当托申请内部号。会飞滴鱼儿
今天我告诉大家一个可以申请内部号的平台，直接比返利号牛逼10倍不止，最近几年出现特别多的手游平台。每个平台的福利的各不相同，但是本质是一样的，就给点礼包，首充什么的。感觉毫无卵用就在上个月，经一个游戏行业的朋友介绍，了解到了一个平台“游人特权站”，特别NB。这个平台给的是内部号，什么是内部号？说白了就是托号。进服就会给300-500的充值扶持，v7-12的vlp等级扶持，另外内部号充值100能得到
474天，日精进，只为目标达成找方法！吕You
大家好，我是英丽今天是我的日精进行动第474天，和大家分享我今天的进步，我们互相勉励，携手前行。每天进步一点点，距离成功便不远。2018年经营模式升级，为您的企业打造三个统一：统一形象（广告视觉产品）统一符号（企业形象设计）统一思想（文化标准建设）1、比学习:准备互助会的过程里，学习统筹的运作的重要性，作为主管人员的安排与协调能力很有必要，全局观念让我们感受到不同的人放在不同的位置上，会更有价值，
scala的option和some 矮蛋蛋编程 scala
原文地址： http://blog.sina.com.cn/s/blog_68af3f090100qkt8.html 对于学习 Scala 的 Java™ 开发人员来说，对象是一个比较自然、简单的入口点。在本系列前几期文章中，我介绍了 Scala 中一些面向对象的编程方法，这些方法实际上与 Java 编程的区别不是很大。我还向您展示了 Scala 如何重新应用传统的面向对象概念，找到其缺点
NullPointerException Cb123456 android BaseAdapter
java.lang.NullPointerException: Attempt to invoke virtual method 'int android.view.View.getImportantForAccessibility()' on a null object reference 出现以上异常.然后就在baidu上
PHP使用文件和目录天子之骄 php文件和目录读取和写入 php验证文件 php锁定文件
PHP使用文件和目录 1.使用include()包含文件 (1)：使用include()从一个被包含文档返回一个值 (2)：在控制结构中使用include() include_once()函数需要一个包含文件的路径，此外，第一次调用它的情况和include()一样，如果在脚本执行中再次对同一个文件调用，那么这个文件不会再次包含。在php.ini文件中设置
SQL SELECT DISTINCT 语句何必如此 sql
SELECT DISTINCT 语句用于返回唯一不同的值。 SQL SELECT DISTINCT 语句在表中，一个列可能会包含多个重复值，有时您也许希望仅仅列出不同（distinct）的值。 DISTINCT 关键词用于返回唯一不同的值。 SQL SELECT DISTINCT 语法 SELECT DISTINCT column_name,column_name F
java冒泡排序 3213213333332132 java 冒泡排序
package com.algorithm; /** * @Description 冒泡 * @author FuJianyong * 2015-1-22上午09:58:39 */ public class MaoPao { public static void main(String[] args) { int[] mao = {17,50,26,18,9,10
struts2.18 +json,struts2-json-plugin-2.1.8.1.jar配置及问题！ 7454103 DAO spring Ajax json qq
struts2.18 出来有段时间了！（貌似是稳定版）闲时研究下下！貌似 sruts2 搭配 json 做 ajax 很吃香！实践了下下！不当之处请绕过！呵呵网上一大堆 struts2+json 不过大多的json 插件都是 jsonplugin.34.jar strut
struts2 数据标签说明 darkranger jsp bean struts servlet Scheme
数据标签主要用于提供各种数据访问相关的功能，包括显示一个Action里的属性，以及生成国际化输出等功能数据标签主要包括： action ：该标签用于在JSP页面中直接调用一个Action，通过指定executeResult参数，还可将该Action的处理结果包含到本页面来。 bean ：该标签用于创建一个javabean实例。如果指定了id属性，则可以将创建的javabean实例放入Sta
链表.简单的链表节点构建 aijuans 编程技巧
/*编程环境WIN-TC*/ #include "stdio.h" #include "conio.h" #define NODE(name, key_word, help) \ Node name[1]={{NULL, NULL, NULL, key_word, help}} typedef struct node { &nbs
tomcat下jndi的三种配置方式 avords tomcat
jndi(Java Naming and Directory Interface，Java命名和目录接口)是一组在Java应用中访问命名和目录服务的API。命名服务将名称和对象联系起来，使得我们可以用名称访问对象。目录服务是一种命名服务，在这种服务里，对象不但有名称，还有属性。 tomcat配置
关于敏捷的一些想法 houxinyou 敏捷
从网上看到这样一句话：“敏捷开发的最重要目标就是：满足用户多变的需求，说白了就是最大程度的让客户满意。” 感觉表达的不太清楚。感觉容易被人误解的地方主要在“用户多变的需求”上。第一种多变，实际上就是没有从根本上了解了用户的需求。用户的需求实际是稳定的，只是比较多，也比较混乱，用户一般只能了解自己的那一小部分，所以没有用户能清楚的表达出整体需求。而由于各种条件的，用户表达自己那一部分时也有
富养还是穷养，决定孩子的一生 bijian1013 教育人生
是什么决定孩子未来物质能否丰盛？为什么说寒门很难出贵子，三代才能出贵族？真的是父母必须有钱，才能大概率保证孩子未来富有吗？-----作者：@李雪爱与自由事实并非由物质决定，而是由心灵决定。一朋友富有而且修养气质很好，兄弟姐妹也都如此。她的童年时代，物质上大家都很贫乏，但妈妈总是保持生活中的美感，时不时给孩子们带回一些美好小玩意，从来不对孩子传递生活艰辛、金钱来之不易、要懂得珍惜
oracle 日期时间格式转化征客丶 oracle
oracle 系统时间有 SYSDATE 与 SYSTIMESTAMP； SYSDATE：不支持毫秒，取的是系统时间； SYSTIMESTAMP：支持毫秒，日期，时间是给时区转换的，秒和毫秒是取的系统的。日期转字符窜：一、不取毫秒： TO_CHAR(SYSDATE, 'YYYY-MM-DD HH24:MI:SS') 简要说明， YYYY 年 MM 月
【Scala六】分析Spark源代码总结的Scala语法四 bit1129 scala
1. apply语法 FileShuffleBlockManager中定义的类ShuffleFileGroup，定义： private class ShuffleFileGroup(val shuffleId: Int, val fileId: Int, val files: Array[File]) { ... def apply(bucketId
Erlang中有意思的bug bookjovi erlang
代码中常有一些很搞笑的bug，如下面的一行代码被调用两次（Erlang beam） commit f667e4a47b07b07ed035073b94d699ff5fe0ba9b Author: Jovi Zhang <[email protected]> Date: Fri Dec 2 16:19:22 2011 +0100 erts:
移位打印10进制数转16进制-2008-08-18 ljy325 java 基础
/** * Description 移位打印10进制的16进制形式 * Creation Date 15-08-2008 9:00 * @author 卢俊宇 * @version 1.0 * */ public class PrintHex { // 备选字符 static final char di
读《研磨设计模式》-代码笔记-组合模式 bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.util.ArrayList; import java.util.List; abstract class Component { public abstract void printStruct(Str
利用cmd命令将.class文件打包成jar chenyu19891124 cmd jar
cmd命令打jar是如下实现：在运行里输入cmd，利用cmd命令进入到本地的工作盘符。(如我的是D盘下的文件有此路径 D:\workspace\prpall\WEB-INF\classes) 现在是想把D:\workspace\prpall\WEB-INF\classes路径下所有的文件打包成prpall.jar。然后继续如下操作： cd D: 回车 cd workspace/prpal
[原创]JWFD v0.96 工作流系统二次开发包 for Eclipse 简要说明 comsci eclipse 设计模式算法工作 swing
JWFD v0.96 工作流系统二次开发包 for Eclipse 简要说明 &nb
SecureCRT右键粘贴的设置 daizj secureCRT 右键粘贴
一般都习惯鼠标右键自动粘贴的功能，对于SecureCRT6.7.5 ，这个功能也已经是默认配置了。老版本的SecureCRT其实也有这个功能，只是不是默认设置，很多人不知道罢了。菜单： Options->Global Options ...->Terminal 右边有个Mouse的选项块。 Copy on Select Paste on Right/Middle
Linux 软链接和硬链接 dongwei_6688 linux
1.Linux链接概念Linux链接分两种，一种被称为硬链接（Hard Link），另一种被称为符号链接（Symbolic Link）。默认情况下，ln命令产生硬链接。【硬连接】硬连接指通过索引节点来进行连接。在Linux的文件系统中，保存在磁盘分区中的文件不管是什么类型都给它分配一个编号，称为索引节点号(Inode Index)。在Linux中，多个文件名指向同一索引节点是存在的。一般这种连
DIV底部自适应 dcj3sjt126com JavaScript
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/xhtml&q
Centos6.5使用yum安装mysql——快速上手必备 dcj3sjt126com mysql
第1步、yum安装mysql [root@stonex ~]# yum -y install mysql-server 安装结果： Installed: mysql-server.x86_64 0:5.1.73-3.el6_5 &nb
如何调试JDK源码 frank1234 jdk
相信各位小伙伴们跟我一样，想通过JDK源码来学习Java，比如collections包，java.util.concurrent包。可惜的是sun提供的jdk并不能查看运行中的局部变量，需要重新编译一下rt.jar。下面是编译jdk的具体步骤： 1.把C:\java\jdk1.6.0_26\sr
Maximal Rectangle hcx2013 max
Given a 2D binary matrix filled with 0's and 1's, find the largest rectangle containing all ones and return its area. public class Solution { public int maximalRectangle(char[][] matrix)
Spring MVC测试框架详解——服务端测试 jinnianshilongnian spring mvc test
随着RESTful Web Service的流行，测试对外的Service是否满足期望也变的必要的。从Spring 3.2开始Spring了Spring Web测试框架，如果版本低于3.2，请使用spring-test-mvc项目（合并到spring3.2中了）。 Spring MVC测试框架提供了对服务器端和客户端（基于RestTemplate的客户端）提供了支持。 &nbs
Linux64位操作系统（CentOS6.6）上如何编译hadoop2.4.0 liyong0802 hadoop
一、准备编译软件 1.在官网下载jdk1.7、maven3.2.1、ant1.9.4，解压设置好环境变量就可以用。环境变量设置如下：（1）执行vim /etc/profile （2）在文件尾部加入: export JAVA_HOME=/home/spark/jdk1.7 export MAVEN_HOME=/ho
StatusBar 字体白色 pangyulei status
[[UIApplication sharedApplication] setStatusBarStyle:UIStatusBarStyleLightContent]; /*you'll also need to set UIViewControllerBasedStatusBarAppearance to NO in the plist file if you use this method
如何分析Java虚拟机死锁 sesame java thread oracle 虚拟机 jdbc
英文资料： Thread Dump and Concurrency Locks Thread dumps are very useful for diagnosing synchronization related problems such as deadlocks on object monitors. Ctrl-\ on Solaris/Linux or Ctrl-B
位运算简介及实用技巧（一）：基础篇 tw_wangzhengquan 位运算
http://www.matrix67.com/blog/archives/263 去年年底写的关于位运算的日志是这个Blog里少数大受欢迎的文章之一，很多人都希望我能不断完善那篇文章。后来我看到了不少其它的资料，学习到了更多关于位运算的知识，有了重新整理位运算技巧的想法。从今天起我就开始写这一系列位运算讲解文章，与其说是原来那篇文章的follow-up，不如说是一个r
jsearch的索引文件结构 yangshangchuan 搜索引擎 jsearch 全文检索信息检索 word分词
jsearch是一个高性能的全文检索工具包，基于倒排索引，基于java8，类似于lucene，但更轻量级。 jsearch的索引文件结构定义如下： 1、一个词的索引由=分割的三部分组成：第一部分是词第二部分是这个词在多少