Mark-Han

Tokyo Cabinet TC 源码学习笔记

1 TC数据库简介

1.1 基本数据库类型

1.2 数据库参数

1.3 常用的测试命令

2 Hash Database

2.1 文件结构

2.2 基本实现

2.2.1 缓存机制

2.2.2 共享内存

2.2.3 查询流程

2.2.4 写入流程

2.2.5 删除流程

2.2.6 free pool管理

2.2.7 事务机制

3 B+ tree database

3.1 文件结构

3.2 基本实现

3.2.1 缓存机制

3.2.2 分裂节点

3.2.3 查询流程

3.2.4 写入流程

3.2.5 隐患

TC数据库简介

基本数据库类型

TC中一共支持六种数据类型,分别以数据库文件的后缀区分：

Hash Database（.tch）、B+ Tree Database(.tcb)、Table Database（.tct）、Fixed-length Database(.tcf)、内存Hash Database(*)、内存B+ tree database(+)。

Hash Database是最基本的结构了，只提供key-value存储方式，类似于memcached，Hash Database的特点是查找速度很快，bucket越多，数据越分散，查找越快。
Hash database支持的参数有："mode", "bnum", "apow", "fpow", "opts", "rcnum", "xmsiz", 和 "dfunit".
内存Hash Database支持的参数有："bnum", "capnum", 和 "capsiz"

B+ Tree Database的特点是一个key可以有重复value，而且允许在value之间上下移动，value按插入顺序排列，可以范围查找key，也可以前缀查找key，查找的复杂度是O(log n)，所以n越大性能越低,但是在亿级以内的数据性能基本稳定。

B+ tree database支持的参数有："mode", "lmemb", "nmemb", "bnum", "apow", "fpow", "opts", "lcnum", "ncnum", "xmsiz", and "dfunit"

内存B+ Tree Database支持的参数有："capnum" and "capsiz".
Table Database的特点是支持检索，支持多列字段，支持列索引，性能不如其它结构。

Table Database提供了类似RMDB的存储功能，一个主键可以有多个字段，例如，在RMDB中user表可能会有user_id、name和password等字段，而在Table Database也提供这种支持。
Table database支持的参数有："mode", "bnum", "apow", "fpow", "opts", "rcnum", "lcnum", "ncnum", "xmsiz", "dfunit", and "idx".
Fixed-length Database的读写速度是最快的，并且存储所需的空间是最小的(因为不需要存储数据以外的结构关系，但是因为是定长的，所以会有空间浪费)，key只能是数字，而value的长度是有限的，所以必须设置一个合适的value长度，太长会浪费空间，间接影响性能(TPS)。

Fixed-length database支持的参数有："mode", "width", 和 "limsiz".

数据库参数

合理的设置数据库参数可以提高性能，格式是：数据库名[#参数名1=参数值1][ #参数名2=参数值2]… …。例如它可以指定bucket存储桶的数量 “tc.tch#bnum=1000000”。

以下是个参数的含义：

capnum ：设置记录的最大容量

capsiz ：设置内存型database的内存容量，内存不足记录将按照顺序移除

mode ：可选的选项：w (写)、r (读)、c (创建)、t (截断)、t (无锁)、f (非阻塞锁)。默认值为：wc

idx ：设置索引的列名，用:分割

opts ：可选的选项：l (64位bucket数组，database容量可以超过2G)、d (Deflate压缩)、b(BZIP2压缩)、t(TCBS压缩)

bnum ：bucket的数量

apow ：指定记录队列的大小（2的幂数）. 如果负数，设置无效

fpow ：指定free block pool最大的记录数（2的幂数）. 如果负数，设置无效

rcnum ：设置缓存记录的最大数，如果数值不是大于0则会禁用缓存，默认禁用

lcnum ：设置缓存叶节点(leaf nodes)的最大数，如果数值不是大于0则会禁用缓存，默认值4096

ncnum ：设置缓存非叶节点(non-leaf nodes)的最大数，如果数值不是大于0则会禁用缓存，默认值512

xmsiz ：设置额外内存映射容量，如果数值不是大于0则会禁用内存映射，默认值67108864

dfunit ：设置磁盘空间整理的最小单位数，如果数值不是大于0则会禁止自动的磁盘空间整理，默认值0

width ：设置记录的固定大小，如果数值不是大于0，则默认是255

limsiz ：设置数据库文件的大小，如果数值不是大于0，则默认是268435456

lmemb ：设置每个叶节点页(leaf page)的成员数，如果数值不是大于0，则默认是128

nmemb ：设置每个非叶节点页(non-leaf page)的成员数，如果数值不是大于0，则默认是256

常用的测试命令

TC提供个各种数据库的管理和测试命令，可以用命令去测试它的性能，也可以参考CAPI自己写测试工具，各数据库的测试命令形式和参数比较相似,如Hash数据库的命令：tchtest、tchmttest（多线程）、tchmgr（管理数据库），B+数据库命令是以tcb开头的tcbtest、tcbmttest、tcbmgr，而Fixed-length数据库以tcf，Table数据库以tct开头的一组命令。

Hash Database

部分实现原理是根据对TC的代码理解，还有查询各种资料总结出来的结果，重点研究了tch实现原理和各种参数（影响性能）的作用的实现

文件结构

hash数据库文件分为四个部分：数据库文件头，bucket 数组，free pool数组，最后的是真正存放record的部分

图-1 Hash数据库文件结构图

第一部分是header，固定大小是256字节，存放关于该数据库的一些基本信息，格式如下：

name	offset	length	feature
magic number	0	32	identification of the database. Begins with "ToKyO CaBiNeT"
database type	32	1	hash (0x01) / B+ tree (0x02) / fixed-length (0x03) / table (0x04)
additional flags	33	1	logical union of open (1<<0) and fatal (1<<1)
alignment power	34	1	the alignment size, by power of 2
free block pool power	35	1	the number of elements in the free block pool, by power of 2
options	36	1	logical union of large (1<<0), Deflate (1<<1), BZIP2 (1<<2), TCBS (1<<3), extra codec (1<<4)
bucket number	40	8	the number of elements of the bucket array
record number	48	8	the number of records in the database
file size	56	8	the file size of the database
first record	64	8	the offset of the first record
opaque region	128	128	users can use this region arbitrarily

其中opaque region是预留部分，可以用来做扩展用，例如B+数据库可以看做TCH的扩展，而B+数据库的一些基本信息就是存放在opaque region中。

第二部分是bucket数组，可以将bucket数组下标视为hash的一级索引，存放的数值是对应的记录在文件中的位置。

bucket 数组大小可以设置（bnum参数大小）,数组元素是int64 or int32类型。

第三部分free pool管理record部分空闲区域：

free pool数组大小可以设置（（1 << hdb->fpow） * 2 * sizeof(HDBFB))），数组元素是结构体

typedef struct { // type of structure for a free block
uint64_t off; // offset of the block
uint32_t rsiz; // size of the block
} HDBFB

重点注意的是：free pool空间大小(数组大小)是固定的且按照rsiz排序，如果管理的free block个数超出范围，则先合并free pool中相邻的block，如果仍超出范围，将丢弃数组前面的记录。

令关注dfunit参数：当对free pool的insert 操作超过dfunit个数时，会在操作数据库时触发磁盘管理。

第四部分是record zero,其中分为两类区域，一类是存放记录的区域，其存储的数据格式如下：

name	offset	length	feature
magic number	0	1	identification of record block. always 0xC8
hash value	1	1	the hash value to decide the path of the hash chain
left chain	2	4	the alignment quotient of the destination of the left chain
right chain	6	4	the alignment quotient of the destination of the right chain
padding size	10	2	the size of the padding
key size	12	vary	the size of the key
value size	vary	vary	the size of the value
key	vary	vary	the data of the key
value	vary	vary	the data of the value
padding	vary	vary	useless data

另一类是没有存储记录的区域，其存储的数据格式：

name	offset	length	Feature
magic number	0	1	identification of record block. always 0xB0
block size	1	4	size of the block

基本实现

Hash数据库的基本知识：

1) 所有的record是以二叉树的形式组织在同一个bucket上面的.
2) 这个二叉树不是平衡的二叉树
3) 为了解决问题二造成的极端不平衡问题,TC引入了二级hash,以保证这个二叉树尽可能的平衡.

缓存机制

关于cache机制：其实就是一个内存hash数据库(tcmap的8维数组，按照key索引)，每次读取数据时(get)会put数据到cache中，当cache中的记录超过最大值（rcnum）时，删除cache中older数据（128为基数）记录

共享内存

插入数据库时，落在mmap共享内存中的数据库不会实时写入到磁盘，落入mmap之外的会实时写入到磁盘中；读取数据时，会读取mmap部分和磁盘部分，如果两部分都有的则合并成结果返回。

参数：xmsiz:map内存映射的真实大小，值必须大于header+bucket部分空间大小，否则设置无效。

查询流程

几点说明：

1. bucket中存放的offset是数据库文件的中偏移量，可以根据offset读取数据，按照 record有数据时的格式解析得到该record数据记录的大小size，这样可以直接读取数据。

2. 读取时还是分为两部分，先读取mmap中的，再读取磁盘中的

查询的步骤如下图：

图-2 查询流程

写入流程

写入数据key ，value：

写入的流程如图：

图-3 写入流程

图-4 写入流程

删除流程

删除key值数据库

删除数据步骤：

按照查询步骤查询key

如果不存在key，结束；否则 3

将该记录的magic number置为0xb0，将这条被删除记录的block插入到free pool数组中的合适位置

同一个bidx是以二叉树形式组织在一起的，删除了一个数据之后会破坏二叉树的性质，所以需要在二叉树中找到合适的记录来替换删除这条记录之后剩下的位置。如下图调整节点的结构

图5 节点重组

修改数据库头文件信息

free pool管理

free pool的管理是利用一个数组，最多只能管理和数组大小相同的空间个数。该数组按照管理的空间大小排序。

free pool数组大小可以设置（（1 << hdb->fpow） * HDBFBPALWRAT * sizeof(HDBFB))），数组元素是结构体

typedef struct { // type of structure for a free block
uint64_t off; // offset of the block
uint32_t rsiz; // size of the block
} HDBFB

申请空间：

通过二分法查找适合的block, free pool数组中比申请空间大的最小值

如果申请失败，则增加文件大小（返回空间的位置是文件的尾部）

空间管理：

对于释放的空间，插入到free pool数组中

如果free pool 达到最大值，对free pool 进行排序（按照off），合并相邻的空间；对free pool 进行排序（按照rsiz），如果free pool 仍达到最大值，放弃free pool中多余部分（放弃数组前面超出范围的管理空间）。

如果free pool 没有达到最大值，按照rsiz排序规则插入数据

每次插入free pool时，会判断是否需要空间回收，相关参数是dfunit（小于 1 时无效）。

空间回收：

对于释放的空间，插入到free pool数组时

判断是否需要回收空间，如果对free pool插入的操作的次数大于dfunit，则执行磁盘回收

如图，回收前和回收后的比较

图-6 回收空间

事务机制

Hash中的事务机制比较简单，在对数据库进行修改之前，会将原纪录信息写入到事务文件中（dbname.wal），当事务出现中断时，会从事务文件中将记录信息回写到数据库中。

B+ tree database

文件结构

B+树索引建立在hash数据库上，其数据存储均在Hash数据库中，文件结构和Hash相同，参照图1 。

第一部分Header，B+将自己的数据库信息存储在Hash头文件的opaque region部分：

opaque region

128

users can use this region arbitrarily

存储的结构如下：

name	offset	length	feature
comparison function	0	1	tccmplexical (0x00), tccmpdecimal (0x01), tccmpint32 (0x02), tccmpint64 (0x03), other (0xff)
reserved region	1	7	not used
record number of leaf node	8	4	the maximum number of records in a leaf node
index number of non-leaf node	12	4	the maximum number of indices in a leaf node
root node ID	16	8	the page ID of the root node of B+ tree
first leaf ID	24	8	the page ID of the first leaf node
last leaf ID	32	8	the page ID of the last leaf node
leaf number	40	8	the number of the leaf nodes
non-leaf number	48	8	the number of the non-leaf nodes
record number	56	8	the number of records in the database

Bucket和free pool部分采用hash的实现。

Record记录的实现和Hash中的实现是一致的，不同情况在于况key和value的值是有格式的：

当record储存的是叶子节点时：

Key： nodeid（B+树种给节点的编号, 叶节点从1开始编号）

Value：

name	offset	length	feature
previous leaf	0	vary	the ID number of the previous leaf node
next leaf	vary	vary	the ID number of the next leaf node
record1
record2
。。。。。。
recordn

其中每个record的格式如下：

name	offset	length	feature
key size	0	vary	the size of the key
value size	vary	vary	the size of the value
duplication number	vary	vary	the number of values with the same key
key	vary	vary	the data of the key
value	vary	vary	the data of the value
duplicated records	vary	vary	a list of value sizes and value data

当record储存的是非叶子节点时：

Key： #(nodeid-2^48-1) （非叶子节点从2^48+1开始编号）

Value：

name	offset	length	feature
accession ID	0	vary	the ID number of the first child node
index1
index2
。。。。。。
indexn

其中每个index的结构：

name	offset	length	feature
page ID	0	vary	the ID number of the referred page
key size	vary	vary	the size of the key
key	vary	vary	the data of the key

基本实现

缓存机制

B+数据库中定义了两个cache用来缓存叶子节点（leafc）和非叶子节点（nodec），它们的大小受控于参数lcnum（leafc存储最大的叶子节点数目）和ncnum（nodec存储最大的非叶子节点数目）。

下面有几点重要的说明：

查询记录时，会将叶子节点和所有访问过的非叶子节点缓存到cache中

当发生修改操作时，只会对cache中的节点进行修改

每次向cache中的节点新增记录时，都需要申请内存，节点中保存的是指向内存的指针

当发生删除操作时，只会设置cache中节点的删除标示

只有当cache中的节点过大（leafc记录大于lcnum或者nodec大于ncnum）时，从cache中删除节点，如果这些节点已经变化（修改、新建或者删除），则将变化保存到磁盘中

分裂节点

对B+中节点的几点说明：

B+中非叶子节点中的indexList是按照key排序（可以选择自己的排序规则），不是按照nodeid排序。

节点中的记录过大时发生分裂，将原节点从中间分裂成两个节点，并调父节点的数值

分裂活动只会分裂出同级的节点，且可能父节点

介绍一下只有一个节点时的分裂过程：

数据库在启动时会新建一个节点（叶子节点）作为root节点，分配的节点号pid = 0，申请的recordList空间是lmemb+1

(lmemb：叶子节点最多可以存储的记录数)；

假设lmemb =2，则当存储到第三条记录时发生裂变

从recordList中间裂变成两个节点，其中pid=1是新生成的节点

检查原节点pid=0是否有父节点，如果没有则新生成非叶子父节点（如果有父节点，则将pid=1，key=key2加入到原父节点中）

对于非叶子节点的分裂和上述过称类似，一样从记录集合中间记录分裂成两个节点

查询流程

其中查询Hash数据库的流程参考hash部分的查询流程

查询分两部分：

根据key值查询叶子节点leaf

根据key到leaf的记录集中查找记录

下图是介绍根据key值如何查询叶子节点leaf流程：

如果查找到leaf节点，则可以直接得到leaf中的记录集，比较记录key值，查找对应的record记录

写入流程

几点说明：

申请的空间均是在内存中申请的

当节点从缓存中删除时会释放申请的内存空间

关于通过key查询leaf流程和节点分裂方法参照3.2.3和3.3.2

节

支持范围查询和模糊查询，

范围查询中得到需要查处的key范围，

隐患

对于分配节点的id：

叶子节点的分配是从pid = bdb->lnum ++ ，bdb->lnum初始 0；

而非叶子节点的分配从（bdb->nnum++）+ (1LL<<48)+1，，bdb-> nnum初始 0。

当删除记录时均没有对lnum和nnum值进行回收管理。

你可能感兴趣的:(数据库研究)

VLDB 2024 即将来袭！创邻科技将带来精彩分享创邻科技科技
8月26-30日，数据库领域最权威、影响力最大的顶级盛会之一，VLDB2024来了！VLDB（InternationalConferenceonVeryLargeDatabases）是数据管理、可扩展数据科学和数据库研究人员、厂商、应用开发者以及用户广泛参与的年度国际论坛，它与SIGMOD、ICDE被公认为数据管理与数据库领域的三大国际顶尖学术会议。2024年是VLDB举办50周年的重要年份。今年
【数据挖掘】国科大苏桂平老师数据库新技术课程作业 —— 第四次作业不牌不改【国科大】数据挖掘数据库人工智能
云数据库研究云计算与云数据库背景云计算（cloudcomputing）是IT技术发展的最新趋势，正受到业界和学术界的广泛关注。云计算是在分布式处理、并行处理和网格计算等技术的基础上发展起来的，是一种新兴的共享基础架构的方法。它可以自我维护和管理庞大的虚拟计算资源（包括计算服务器、存储服务器、宽带资源等等），从而提供各种IT服务。用户在使用云计算提供的服务时按需付费，这不仅降低了使用门槛，也极大地节
P8A005-A008系统加固明裕学长磐云P系列网络安全安全系统安全计算机网络安全威胁分析
系统账户数据库安全预备知识】数据库研究跨越于计算机应用、系统软件和理论三个领域，其中应用促进新系统的研制开发，新系统带来新的理论研究，而理论研究又对前两个领域起着指导作用。【实验步骤】网络拓扑：server2008-basicwindowsserver2008用户：administrator密码：Admin123第一步：点击启动选项，启动实验虚拟机。第二步：打开虚拟机Windowsserver20
hadoop 写入mysql_hadoop读写mysql数据库 weixin_39827315 hadoop 写入mysql
hadoop技术推出一度曾遭到关系数据库研究者的挑衅和批评，认为MapReduce不具有关系数据库中的结构化数据存储和处理能力。为此，hadoop社区和研究人员做了多的努力，在hadoop0.19版支持MapReduce访问关系数据库，如：MySQL、Mongodb、PostgreSQL、Oracle等几个数据库系统。Hadoop访问关系数据库主要通过DBInputFormat类实现的，包的位置在
宁夏计算机科学与技术产业发展新趋势,2021年CCF数据库发展战略研讨会在宁夏银川顺利召开... weixin_39704314
2021年CCF中国数据库发展战略研讨会于5月28-30日在宁夏银川顺利召开。本次会议由中国计算机学会主办，中国计算机学会数据库专业委员会和宁夏大学共同承办。来自全国各地的数据库专业委员会委员和嘉宾共计150多人参加了本次会议，一起分享数据库研究的最新进展，探讨当前研究热点和机遇，共商数据库未来发展大计。本次会议的内容安排和组织依旧强调跨领域交流，以及与企业深入合作的方针，为数据库研究人员和数据库
忆联分布式数据库存储解决方案，助力MySQL实现高性能、低时延火星资讯数据库分布式 mysql
据艾瑞咨询研究院《2022年中国数据库研究报告》显示，截止2021年，中国分布式数据库占比达到20%左右，主要以MySQL和PostgreSQL为代表的开源数据库为主。MySQL作为备受欢迎的开源数据库，当前已广泛应用于互联网、金融、交通、零售等行业，服务于云化场景下数据存储及处理等关键业务。由于MySQL数据库需要高速并行处理大规模数据，对存储IO要求极高。忆联企业级和数据中心级NVMeSSD，
什么是数据湖？数据湖的概念及发展历程白牛DATA 大数据
随着云计算、社交媒体、物联网、短视频等新一代互联网技术的快速发展，数据的数量和复杂性不断增加。许多企业和组织已经积累了大量的各种类型的数据，对于如何存储和管理这些海量数据，以及如何高效地分析和利用这些数据，是每个组织当前面临的重要挑战。对于企业来说，有效处理和分析海量数据，对于数字化转型过程中的各种决策，具有至关重要的作用。大数据的兴起给数据库研究带来了诸多挑战。大数据通常具有四个典型特征，包括数
再获认可！万里数据库参编中国信通院数据库研究报告 GreatSQL入选中国数据库产业图谱 GreatSQL社区 GreatSQL MySQL
当前，全球数字经济加速发展，数据正在成为重组全球要素资源、重塑全球经济结构、改变全球竞争格局的关键力量。数据库作为存储与处理数据的关键技术，在数字经济浪潮下，不断涌现新技术、新业态、新模式。7月4-5日，由中国通信标准化协会和中国信息通信研究院主办，大数据技术标准推进委员会承办，InfoQ联合主办的“2023可信数据库发展大会”主论坛在北京国际会议中心隆重召开。会上，中国信息通信研究院正式发布《数
容器化 | ClickHouse Operator 原理解析 RadonDB
作者：苏厚镇青云科技数据库研究工程师从事RadonDBClickHouse相关工作，热衷于研究数据库内核。通过《ClickHouseonK8s部署篇》，对比了RadonDBClickHouse集群在Kubernetes中部署的几种方案，表明使用Operator进行部署和管理是最方便快捷的。那么到底什么才是Operator，Operator又是如何与Kubernetes进行协同工作的，Operato
Clickhouse高可用分布式数据库研究与实践 Chavaz 数据库数据库
随着物联网IoT、5G时代的到来，设备感知、告警存储、业务交易等数据越来越大，大数据分析、联机分析（OLAP）成为非常重要的环节。由于市场上其他开源产品框架多样化，操作复杂等是当前面临的主要问题。Clickhouse什么是Clickhouse?ClickHouse是Yandex公司开源的一个列式数据库管理系统（DBMS）,而不是单一的数据库，在ClickHouse中，数据始终是按列存储的，主要用于
StarRocks市场渗透率跻身Top10！ StarRocks_labs 数据库
近日，国内著名的研究咨询机构艾瑞咨询发布了《2022年中国数据库研究报告》（以下简称“报告”）。报告指出，目前数据库产品的国内渗透率达到前所未有的高度，且头部效应明显。其中，StarRocks以“极速统一”的性能优势，迅速获得了国内用户的认可，市场渗透率位居前十。此外，报告还对国产开源数据库在Github的整体活跃度做了调研，StarRocks作为仅仅面世3年的产品，整体社区活跃度已经在众多开源数
StarRocks市场渗透率跻身Top10！数据库
近日，国内著名的研究咨询机构艾瑞咨询发布了《2022年中国数据库研究报告》（以下简称“报告”）。报告指出，目前数据库产品的国内渗透率达到前所未有的高度，且头部效应明显。其中，StarRocks以“极速统一”的性能优势，迅速获得了国内用户的认可，市场渗透率位居前十。此外，报告还对国产开源数据库在Github的整体活跃度做了调研，StarRocks作为仅仅面世3年的产品，整体社区活跃度已经在众多开源数
基于PythonDjango框架的电影推荐系统 biyezuopin Python Django 电影推荐系统源码毕业设计
目录摘要IAbstractII1绪论11.1选题背景及意义11.2国内外研究现状21.3推荐算法研究51.3.1协同过滤算法51.3.2基于内容的推荐算法51.3.4基于标签的推荐算法61.4本文研究目标和研究内容62相关技术介绍72.1系统实现相关技术的研究72.2Python语言研究92.3Django框架研究102.4SQLite数据库研究113系统分析133.1需求分析133.2可行性分析
北大邹磊：图数据库中的子图匹配算法 DataFunTalk DataFunTalk原创精选人工智能大数据机器学习深度学习计算广告推荐算法 NLP 数据库数据库架构
导读：本次讲座从图数据库中的核心查询算子——子图匹配入题，介绍了图数据库的基本概念、子图匹配的算法，以及在图数据库环境下的子图匹配查询优化等内容。具体包括下面三个方面：什么是图数据库子图匹配查询及其优化方法我们的工作--01什么是图数据库首先，先回顾一下什么是数据库。1.数据库数据库研究的核心就是将物理世界映射到信息世界，在数据库学习课程中会学到一个概念模型E-R图。E-R图表示实体与实体之间的关
7.07亿TPC-C背后的技术突破，OceanBase研究成果入选VLDB 数据库
近日，国际顶级数据库学术会议VLDB2022在澳大利亚悉尼开幕。OceanBase研究成果论文"OceanBase:A707MilliontpmCDistributedRelationalDatabaseSystem"被VLDB2022收录。本次会议在分布式数据库研究领域共收录5篇来自全球的顶级学术成果，OceanBase论文被评为VLDB2022分布式数据库领域唯一获得"theartifacta
Zilliz 论文入选数据库顶会 VLDB'22 数据库云原生分布式
近日，Zilliz技术团队最新数据库研究成果再获国际认可。面向向量数据管理而设计的云原生数据库系统Milvus2.0论文《Manu:ACloudNativeVectorDatabaseManagementSystem》入选数据库顶级会议VLDB'22。作为初创公司，Zilliz始终坚持引领数据库领域的研究与创新。此前，Milvus论文《Milvus:APurpose-BuiltVectorData
MySQL自传
作者：斗战胜佛，叶正盛撰写本文查阅了大量参考资料，也得到很多朋友的指点帮助，特别感谢：JimmyYang——阿里云数据库研究员，原OracleInnoDBArchitect.彭立勋——华为云数据库总工程师，MySQLACEDirector，MySQL中国用户组创始成员之一.谭宇——玖章算术首席架构师，原阿里巴巴技术总监，数据库智能运维研发负责人，OceanBase创始团队成员.「初出茅庐」我是一只
Oceanbase读写分离方案探索与优化携程DBA
##【作者】许金柱，携程资深DBA，专注于分布式数据库研究及运维。台枫，携程高级DBA，主要负责MySQL和OceanBase的运维。##【前言】读写分离，是一种将数据库的查询操作和写入操作分离的方案，目的是为了降低读写操作的相互影响并提升资源利用率。在携程，读写分离的应用场景非常普及，只读
【浪潮云说】直播间第十一期今晚开播云计算
主题：《工业级SQL优化器技术蓝图》主讲人：西电-浪潮数据库创新实验室，浪潮科学研究院分布式数据库研究所，赵衎衎博士
容器化 | ClickHouse Operator 原理解析
作者：苏厚镇青云科技数据库研究工程师从事RadonDBClickHouse相关工作，热衷于研究数据库内核。通过《ClickHouseonK8s部署篇》，对比了RadonDBClickHouse集群在Kubernetes中部署的几种方案，表明使用Operator进行部署和管理是最方便快捷的。那么到底什么才是Operator，Operator又是如何与Kubernetes进行协同工作的，Operato
国内AI领域首次！第四范式OpenMLDB优化创新论文被国际数据库顶会VLDB录用人工智能数据库算法程序员c++
第四范式OpenMLDB优化创新论文被国际数据库顶会VLDB录用，为国内AI领域首次第四范式与新加坡国立大学及英特尔的最新联合研究成果——基于持久内存优化的AI实时决策系统数据库OpenMLDB（OpenSourceMachineLearningDatabase）被国际数据库顶级会议VLDB2021录用。VLDB(VeryLargeDataBase)是数据库研究人员、厂商、应用开发者，以及用户广泛
初识数据库DataBase: 太牛啦！葡萄籽-June 总结数据库
数据库——集成大智慧数据库研究跨越于计算机应用、系统软件和理论三个领域，其中应用促进新系统的研制开发，新系统带来新的理论研究，而理论研究又对前两个领域起着指导作用。总之，数据库管理系统可以看作是计算机的一个非常典型的集各个知识与应用的成功案例吖！文章目录数据库——集成大智慧初识小感悟初识主要内容如下xmind显示吖小感悟虽然上述一些简单的总结是初识数据库，但是明显能让我感叹数据库是计算机大智慧的结
美团图数据库平台建设及业务实践
图数据结构，能够更好地表征现实世界。美团业务相对较复杂，存在比较多的图数据存储及多跳查询需求，亟需一种组件来对千亿量级图数据进行管理，海量图数据的高效存储和查询是图数据库研究的核心课题。本文介绍了美团在图数据库选型及平台建设方面的一些工作。1前言图数据结构，能够很自然地表征现实世界。比如用户、门店、骑手这些实体可以用图中的点来表示，用户到门店的消费行为、骑手给用户的送餐行为可以用图中的边来表示。使
美团图数据库平台建设及业务实践
图数据结构，能够更好地表征现实世界。美团业务相对较复杂，存在比较多的图数据存储及多跳查询需求，亟需一种组件来对千亿量级图数据进行管理，海量图数据的高效存储和查询是图数据库研究的核心课题。本文介绍了美团在图数据库选型及平台建设方面的一些工作。1前言图数据结构，能够很自然地表征现实世界。比如用户、门店、骑手这些实体可以用图中的点来表示，用户到门店的消费行为、骑手给用户的送餐行为可以用图中的边来表示。使
美团图数据库平台建设及业务实践
图数据结构，能够更好地表征现实世界。美团业务相对较复杂，存在比较多的图数据存储及多跳查询需求，亟需一种组件来对千亿量级图数据进行管理，海量图数据的高效存储和查询是图数据库研究的核心课题。本文介绍了美团在图数据库选型及平台建设方面的一些工作。1前言图数据结构，能够很自然地表征现实世界。比如用户、门店、骑手这些实体可以用图中的点来表示，用户到门店的消费行为、骑手给用户的送餐行为可以用图中的边来表示。使
美团图数据库平台建设及业务实践美团技术团队数据库大数据分布式编程语言 java
图数据结构，能够更好地表征现实世界。美团业务相对较复杂，存在比较多的图数据存储及多跳查询需求，亟需一种组件来对千亿量级图数据进行管理，海量图数据的高效存储和查询是图数据库研究的核心课题。本文介绍了美团在图数据库选型及平台建设方面的一些工作。1前言2图数据库选型3NebulaGraph架构4图数据库平台建设4.1高可用模块设计4.2每小时百亿量级数据导入模块设计4.3实时写入多集群数据同步模块设计4
VLDB 历年最佳论文汇总 AMiner科技 Topic推荐数据库 mysql
VLDB是数据管理和数据库研究人员、供应商、从业者、应用程序开发人员和用户的重要年度国际论坛。该会议探讨数据管理、数据库和信息系统研究等方面的问题。该论文集共收录23篇论文，最高引用数是1427。论文集地址：https://www.aminer.cn/topic/5f6af3db92c7f9be214127bd订阅了解更多论文信息，定制您的个人科研动态信息流：https://www.aminer.
翻译：超越分布式事务 genie2014 翻译分布式
原文转自我自己的个人公众号：https://mp.weixin.qq.com/s/iYOnSxO8XBi9LbxbDCdJcA由于我是从公众号上直接复制粘贴过来的，排版上可能有问题。推荐使用上方连接查看原文。该文是Salesforce的软件架构师PatHelland于2016年12月发表的针对其在2007年CIDR（创新数据库研究会议）上首次发表的同名文章的更新和缩写版本。2007年原文：http
sql进行Order by排序再进行分页limit取值会出现重复显示问题永恒言诺 MySQL
在实际开发中遇到一个有趣的问题，有关数据库orderby排序不唯一，导致分页出现重复数据问题。这个问题还是有点特殊的。因为数据库研究的少这个问题挺让我困惑。为了解决它找了很久的错误。首先介绍一下问题的出现情况。项目中需要对所有客服处理的会话进行时间段的排序显示并且分页显示每页取值20条。时间段按小时计算。初始数据查询：select*fromT_SEAT_MSGorderbytimedesc;操作：
DB2 备份恢复详细测试易普斯龙数据库
http://blog.csdn.net/hanxin1987216/article/details/4538661DB2备份恢复详细测试分类：数据库研究2009-09-1012:541004人阅读评论(1)收藏举报本文测试环境：WindowsXP、IBMDB2ExpressV9.5、DB2QuestCenterV9.5在这里举个应用场景以说明数据库恢复备份的思路：那么假设我们周一晚上做了一个数据
JAVA中的Enum 周凡杨 java enum 枚举
Enum是计算机编程语言中的一种数据类型---枚举类型。在实际问题中，有些变量的取值被限定在一个有限的范围内。例如，一个星期内只有七天我们通常这样实现上面的定义： public String monday; public String tuesday; public String wensday; public String thursday
赶集网mysql开发36条军规 Bill_chen mysql 业务架构设计 mysql调优 mysql性能优化
(一)核心军规 (1)不在数据库做运算 cpu计算务必移至业务层； (2)控制单表数据量 int型不超过1000w，含char则不超过500w；合理分表；限制单库表数量在300以内； (3)控制列数量字段少而精，字段数建议在20以内
Shell test命令 daizj shell 字符串 test 数字文件比较
Shell test命令 Shell中的 test 命令用于检查某个条件是否成立，它可以进行数值、字符和文件三个方面的测试。数值测试参数说明 -eq 等于则为真 -ne 不等于则为真 -gt 大于则为真 -ge 大于等于则为真 -lt 小于则为真 -le 小于等于则为真实例演示： num1=100 num2=100if test $[num1]
XFire框架实现WebService(二) 周凡杨 java webservice
有了XFire框架实现WebService(一)，就可以继续开发WebService的简单应用。 Webservice的服务端(WEB工程)：两个java bean类： Course.java package cn.com.bean; public class Course { private
重绘之画图板朱辉辉33 画图板
上次博客讲的五子棋重绘比较简单，因为只要在重写系统重绘方法paint（）时加入棋盘和棋子的绘制。这次我想说说画图板的重绘。画图板重绘难在需要重绘的类型很多，比如说里面有矩形，园，直线之类的，所以我们要想办法将里面的图形加入一个队列中，这样在重绘时就
Java的IO流西蜀石兰 java
刚学Java的IO流时，被各种inputStream流弄的很迷糊，看老罗视频时说想象成插在文件上的一根管道，当初听时觉得自己很明白，可到自己用时，有不知道怎么代码了。。。每当遇到这种问题时，我习惯性的从头开始理逻辑，会问自己一些很简单的问题，把这些简单的问题想明白了，再看代码时才不会迷糊。 IO流作用是什么？答：实现对文件的读写，这里的文件是广义的； Java如何实现程序到文件
No matching PlatformTransactionManager bean found for qualifier 'add' - neither 林鹤霄
java.lang.IllegalStateException: No matching PlatformTransactionManager bean found for qualifier 'add' - neither qualifier match nor bean name match! 网上找了好多的资料没能解决，后来发现：项目中使用的是xml配置的方式配置事务，但是
Row size too large (> 8126). Changing some columns to TEXT or BLOB aigo column
原文：http://stackoverflow.com/questions/15585602/change-limit-for-mysql-row-size-too-large 异常信息： Row size too large (> 8126). Changing some columns to TEXT or BLOB or using ROW_FORMAT=DYNAM
JS 格式化时间 alxw4616 JavaScript
/** * 格式化时间 2013/6/13 by 半仙 [email protected] * 需要 pad 函数 * 接收可用的时间值. * 返回替换时间占位符后的字符串 * * 时间占位符:年 Y 月 M 日 D 小时 h 分 m 秒 s 重复次数表示占位数 * 如 YYYY 4占4位 YY 占2位<p></p> * MM DD hh mm
队列中数据的移除问题百合不是茶队列移除
队列的移除一般都是使用的remov();都可以移除的,但是在昨天做线程移除的时候出现了点问题,没有将遍历出来的全部移除, 代码如下; // package com.Thread0715.com; import java.util.ArrayList; public class Threa
Runnable接口使用实例 bijian1013 java thread Runnable java多线程
Runnable接口 a. 该接口只有一个方法：public void run(); b. 实现该接口的类必须覆盖该run方法 c. 实现了Runnable接口的类并不具有任何天
oracle里的extend详解 bijian1013 oracle 数据库 extend
扩展已知的数组空间，例： DECLARE TYPE CourseList IS TABLE OF VARCHAR2(10); courses CourseList; BEGIN -- 初始化数组元素，大小为3 courses := CourseList('Biol 4412 ', 'Psyc 3112 ', 'Anth 3001 '); --
【httpclient】httpclient发送表单POST请求 bit1129 httpclient
浏览器Form Post请求浏览器可以通过提交表单的方式向服务器发起POST请求，这种形式的POST请求不同于一般的POST请求 1. 一般的POST请求，将请求数据放置于请求体中，服务器端以二进制流的方式读取数据，HttpServletRequest.getInputStream()。这种方式的请求可以处理任意数据形式的POST请求，比如请求数据是字符串或者是二进制数据 2. Form
【Hive十三】Hive读写Avro格式的数据 bit1129 hive
1. 原始数据 hive> select * from word; OK 1 MSN 10 QQ 100 Gtalk 1000 Skype 2. 创建avro格式的数据表 hive> CREATE TABLE avro_table(age INT, name STRING)STORE
nginx+lua+redis自动识别封解禁频繁访问IP ronin47
在站点遇到攻击且无明显攻击特征，造成站点访问慢，nginx不断返回502等错误时，可利用nginx+lua+redis实现在指定的时间段内，若单IP的请求量达到指定的数量后对该IP进行封禁，nginx返回403禁止访问。利用redis的expire命令设置封禁IP的过期时间达到在指定的封禁时间后实行自动解封的目的。一、安装环境： CentOS x64 release 6.4(Fin
java-二叉树的遍历-先序、中序、后序（递归和非递归）、层次遍历 bylijinnan java
import java.util.LinkedList; import java.util.List; import java.util.Stack; public class BinTreeTraverse { //private int[] array={ 1, 2, 3, 4, 5, 6, 7, 8, 9 }; private int[] array={ 10,6,
Spring源码学习-XML 配置方式的IoC容器启动过程分析 bylijinnan java spring IOC
以FileSystemXmlApplicationContext为例，把Spring IoC容器的初始化流程走一遍： ApplicationContext context = new FileSystemXmlApplicationContext ("C:/Users/ZARA/workspace/HelloSpring/src/Beans.xml&q
[科研与项目]民营企业请慎重参与军事科技工程 comsci 企业
军事科研工程和项目并非要用最先进，最时髦的技术，而是要做到“万无一失” 而民营科技企业在搞科技创新工程的时候，往往考虑的是技术的先进性，而对先进技术带来的风险考虑得不够，在今天提倡军民融合发展的大环境下，这种“万无一失”和“时髦性”的矛盾会日益凸显。。。。。。所以请大家在参与任何重大的军事和政府项目之前，对
spring 定时器-两种方式 cuityang spring quartz 定时器
方式一：间隔一定时间运行 <bean id="updateSessionIdTask" class="com.yang.iprms.common.UpdateSessionTask" autowire="byName" /> <bean id="updateSessionIdSchedule
简述一下关于BroadView站点的相关设计 damoqiongqiu view
终于弄上线了，累趴，戳这里http://www.broadview.com.cn 简述一下相关的技术点前端：jQuery+BootStrap3.2+HandleBars，全站Ajax（貌似对SEO的影响很大啊！怎么破？），用Grunt对全部JS做了压缩处理，对部分JS和CSS做了合并（模块间存在很多依赖，全部合并比较繁琐，待完善）。后端：U
运维 PHP问题汇总 dcj3sjt126com windows2003
1、Dede(织梦)发表文章时,内容自动添加关键字显示空白页解决方法：后台>系统>系统基本参数>核心设置>关键字替换（是/否），这里选择“是”。后台>系统>系统基本参数>其他选项>自动提取关键字，这里选择“是”。 2、解决PHP168超级管理员上传图片提示你的空间不足网站是用PHP168做的，反映使用管理员在后台无法
mac 下安装php扩展 - mcrypt dcj3sjt126com PHP
MCrypt是一个功能强大的加密算法扩展库，它包括有22种算法，phpMyAdmin依赖这个PHP扩展，具体如下：下载并解压libmcrypt-2.5.8.tar.gz。在终端执行如下命令： tar zxvf libmcrypt-2.5.8.tar.gz cd libmcrypt-2.5.8/ ./configure --disable-posix-threads --
MongoDB更新文档 [四] eksliang mongodb Mongodb更新文档
MongoDB更新文档转载请出自出处：http://eksliang.iteye.com/blog/2174104 MongoDB对文档的CURD，前面的博客简单介绍了，但是对文档更新篇幅比较大，所以这里单独拿出来。语法结构如下： db.collection.update( criteria, objNew, upsert, multi) 参数含义参数
Linux下的解压，移除，复制，查看tomcat命令 y806839048 tomcat
重复myeclipse生成webservice有问题删除以前的，干净 1、先切换到：cd usr/local/tomcat5/logs 2、tail -f catalina.out 3、这样运行时就可以实时查看运行日志了 Ctrl+c 是退出tail命令。有问题不明的先注掉 cp /opt/tomcat-6.0.44/webapps/g
Spring之使用事务缘由(3-XML实现) ihuning spring
用事务通知声明式地管理事务事务管理是一种横切关注点。为了在 Spring 2.x 中启用声明式事务管理，可以通过 tx Schema 中定义的 <tx:advice> 元素声明事务通知，为此必须事先将这个 Schema 定义添加到 <beans> 根元素中去。声明了事务通知后，就需要将它与切入点关联起来。由于事务通知是在 <aop:
GCD使用经验与技巧浅谈啸笑天 GC
前言 GCD(Grand Central Dispatch)可以说是Mac、iOS开发中的一大“利器”，本文就总结一些有关使用GCD的经验与技巧。 dispatch_once_t必须是全局或static变量这一条算是“老生常谈”了，但我认为还是有必要强调一次，毕竟非全局或非static的dispatch_once_t变量在使用时会导致非常不好排查的bug，正确的如下： 1
linux（Ubuntu）下常用命令备忘录1 macroli linux 工作 ubuntu
在使用下面的命令是可以通过--help来获取更多的信息1,查询当前目录文件列表：ls ls命令默认状态下将按首字母升序列出你当前文件夹下面的所有内容，但这样直接运行所得到的信息也是比较少的，通常它可以结合以下这些参数运行以查询更多的信息： ls / 显示/.下的所有文件和目录 ls -l 给出文件或者文件夹的详细信息 ls -a 显示所有文件，包括隐藏文
nodejs同步操作mysql qiaolevip 学习永无止境每天进步一点点 mysql nodejs
// db-util.js var mysql = require('mysql'); var pool = mysql.createPool({ connectionLimit : 10, host: 'localhost', user: 'root', password: '', database: 'test', port: 3306 });
一起学Hive系列文章 superlxw1234 hive Hive入门
[一起学Hive]系列文章目录贴，入门Hive，持续更新中。 [一起学Hive]之一—Hive概述，Hive是什么 [一起学Hive]之二—Hive函数大全-完整版 [一起学Hive]之三—Hive中的数据库(Database)和表(Table) [一起学Hive]之四-Hive的安装配置 [一起学Hive]之五-Hive的视图和分区 [一起学Hive
Spring开发利器：Spring Tool Suite 3.7.0 发布 wiselyman spring
Spring Tool Suite(简称STS)是基于Eclipse，专门针对Spring开发者提供大量的便捷功能的优秀开发工具。在3.7.0版本主要做了如下的更新：将eclipse版本更新至Eclipse Mars 4.5 GA Spring Boot(JavaEE开发的颠覆者集大成者，推荐大家学习)的配置语言YAML编辑器的支持(包含自动提示，