jacljh

MyCat使用

MyCat是基于阿里开源的Cobar产品而研发，Cobar的稳定性、可靠性、优秀的架构和性能以及众多成熟的使用案例使得MYCAT一开始就拥有一个很好的起点，站在巨人的肩膀上，我们能看到更远。业界优秀的开源项目和创新思路被广泛融入到MYCAT的基因中，使得MYCAT在很多方面都领先于目前其他一些同类的开源项目，甚至超越某些商业产品。

MYCAT背后有一支强大的技术团队，其参与者都是5年以上资深软件工程师、架构师、DBA等，优秀的技术团队保证了MYCAT的产品质量。
MYCAT并不依托于任何一个商业公司，因此不像某些开源项目，将一些重要的特性封闭在其商业产品中，使得开源项目成了一个摆设。
因此，MyCat你可以认为是从Amoeba->Cobar一路过来的最终版升级者。
由于MyCat和Corba都是Amoeba框架上发展而来的，如果一个具有Amoeba配置经验的开发者可以几乎不用看任何文档而可以直接使用MyCat来实现mySQL的读写分离更重要的是，基于myCat你可以实现数据的垂直和水平切割，它使得了mySQL据有了真正的“集群”的能力，并为去IOE做好了最终的准备。
myCAT开源项目维护很频繁，目前最新版已经到了1.5 Release(23天前刚维护过)。因此它的维护性、稳定性是得到了保证的。同时myCat的文档极其丰富，参于开发的人员又很多，所以它可以应付很多在以往的Amoeba以及Corba上未能解决的问题，它是一个可以真正被应用在生产环境上的数据库中间件。在下面的章节我们将使用myCat来实现mySQL的读写分离和垂直水平折分的具体案例。

myCat介绍

什么是MyCAT?简单的说，MyCAT就是：

一个彻底开源的，面向企业应用开发的“大数据库集群” 支持事务、ACID、可以替代Mysql的加强版数据库
一个可以视为“Mysql”集群的企业级数据库，用来替代昂贵的Oracle集群
一个融合内存缓存技术、Nosql技术、HDFS大数据的新型SQL Server
结合传统数据库和新型分布式数据仓库的新一代企业级数据库产品
一个新颖的数据库中间件产品

目标

低成本的将现有的单机数据库和应用平滑迁移到“云”端，解决数据存储和业务规模迅速增长情况下的数据瓶颈问题。
关键特性
支持 SQL 92标准支持Mysql集群，可以作为Proxy使用支持JDBC连接ORACLE、DB2、SQL Server，将其模拟为MySQL Server使用支持galera for mysql集群，percona-cluster或者mariadb cluster，提供高可用性数据分片集群，自动故障切换，高可用性，支持读写分离，支持Mysql双主多从，以及一主多从的模式，支持全局表，数据自动分片到多个节点，用于高效表关联查询，支持独有的基于E-R 关系的分片策略，实现了高效的表关联查询多平台支持，部署和实施简单。

优势

基于阿里开源的Cobar产品而研发，Cobar的稳定性、可靠性、优秀的架构和性能，以及众多成熟的使用案例使得MyCAT一开始就拥有一个很好的起点，站在巨人的肩膀上，我们能看到更远。广泛吸取业界优秀的开源项目和创新思路，将其融入到MyCAT的基因中，使得MyCAT在很多方面都领先于目前其他一些同类的开源项目，甚至超越某些商业产品。MyCAT背后有一只强大的技术团队，其参与者都是5年以上资深软件工程师、架构师、DBA等，优秀的技术团队保证了MyCAT的产品质量。 MyCAT并不依托于任何一个商业公司，因此不像某些开源项目，将一些重要的特性封闭在其商业产品中，使得开源项目成了一个摆设。

长期规划

在支持Mysql的基础上，后端增加更多的开源数据库和商业数据库的支持，包括原生支持PosteSQL、FireBird等开源数据库，以及通过JDBC等方式间接支持其他非开源的数据库如Oracle、DB2、SQL Server等实现更为智能的自我调节特性，如自动统计分析SQL，自动创建和调整索引，根据数据表的读写频率，自动优化缓存和备份策略等实现更全面的监控管理功能与HDFS集成，提供SQL命令，将数据库装入HDFS中并能够快速分析集成优秀的开源报表工具，使之具备一定的数据分析的能力。

MyCat架构

安装myCat

通过myCat的官方源码网站获得（https://github.com/MyCATApache/Mycat-download）
本教程中使用的是myCat 8月出的稳定版：Mycat-server-1.5.1-RELEASE-20160810140521。

下载后解压至一个目录如：

配置myCat

myCat的核心配置文件有如下几个：

wrapper.conf – 系统环境配置
server.xml – mycat主配置文件，用于配置mycat对外数据库表、用户名、访问权限等
schema.xml – 用于配置读写分离、水平垂直折分集群
rule.xml – 用于配置数据水平垂直折分规则
router.xml – 配合rule.xml文件使用，当数据折分不符合规则时的走向，类似switch中的default作用

myCat配置读写分离

请看下面这组读写分离，我们就用myCat来配置出这个实例吧。

先在物理上构建主从配置

先按照“Mysql主从配置”把：
192.168.0.101 配成master
192.168.0.102 为 192.168.0.101的slave1
192.168.0.103 为 192.168.0.103的slave3

配置myCat读写分离

修改server.xml文件
打开server.xml文件，你会发觉好大一陀，全部删了吧，改成下面这个配置：


   druidparser



       aaaaaa
       mycat
       false

上述配置定义了这么一件事：
定义了一个可供外部访问的myCat的虚拟数据库
它的端口为8806
schema名为mycat
客户端访问时的用户名为mk，密码为aaaaaa（六个a）

修改schema.xml文件

打开后也是很大的一陀，全删了吧，改成下面这一段：

   writeType="0" dbType="mysql" dbDriver="native" switchType="1" >
select 1

这里有三处需要注意：

balance="1"与writeType="0" ,switchType=”1”
balance 属性负载均衡类型，目前的取值有 4 种：
balance="0", 不开启读写分离机制，所有读操作都发送到当前可用的writeHost 上。
balance="1"，全部的 readHost 与 stand by writeHost 参与 select 语句的负载均衡，简单的说，当双主双从模式(M1 ->S1 ， M2->S2，并且 M1 与 M2 互为主备)，正常情况下， M2,S1,S2 都参与 select 语句的负载均衡。
balance="2"，所有读操作都随机的在 writeHost、 readhost 上分发。
balance="3"，所有读请求随机的分发到 wiriterHost 对应的 readhost 执行,writerHost 不负担读压力，注意 balance=3 只在 1.4 及其以后版本有， 1.3 没有。
writeType 属性，负载均衡类型，目前的取值有 3 种：
writeType="0", 所有写操作发送到配置的第一个 writeHost，第一个挂了切到还生存的第二个writeHost，重新启动后已切换后的为准，切换记录在配置文件中:dnindex.properties .
writeType="1"，所有写操作都随机的发送到配置的 writeHost。
writeType="2"，没实现。
switchType 属性
-1 表示不自动切换
- 1 默认值，自动切换
2 基于MySQL 主从同步的状态决定是否切换

这里是配置的我们的myCat后台连接的真实的 1主2从服务器以及它们的连接信息。

测试读写分离

1. 我们把mycat启动起来

./mycat start

看wrapper.log文件中的内容

看到mycat已经被启动了。‘

2. 于是我们打开一个mysql客户端使用如下方式连接进入mycat

3. 我们往mycat里插入4条数据

insert into user_info(user_name)values(@@hostname);
insert into user_info(user_name)values(@@hostname);
insert into user_info(user_name)values(@@hostname);
insert into user_info(user_name)values(@@hostname);
commit;

单独连上ymklinux和ymklinux2以及ymklinux3分别作

我们可以看到，由于102,103为101的slaver所以当下面这种模式：

writeHost为192.168.0.101（Master）被写入数据时，而又因为192.168.0.101与102, 103为Master-Slaver的关系因此102与103会自动同步192.168.0.101上被insert进入的数据。如下图演示那样。

考虑多Master的场景

我们回到上棕这个场景来看，为什么説需要多Master？

上述这个应用，有一个非致命的缺点：
即定义的writeHost一旦发生宕机那么其相应对的readHost全部为不可用，换而言之即整个myCat群宕机。

熊掌与鱼兼得法

按照myCat的配置我们可以配置多个writeHost并把writeType这个值设为“0”。
来看writeType=”0”的含议：
writeType="0", 所有写操作发送到配置的第一个 writeHost，第一个挂了切到还生存的第二个writeHost，重新启动后已切换后的为准，切换记录在配置文件中:dnindex.properties .

第一种配置：

于是我们来考虑下面这样的配置：

MyCat群会在Master1发生宕机时自动探寻Master2是否还存活，如果Master2存活那么把数据的读和写全部转向以Master2为代表的读写群。
但是，这也带来了一个问题。
如果此时Master1宕机了，Master2被顶了上来，那么数据全部跑入了Master2群内了。
当：
Master1再次恢复时。。。对于通过myCat客户端调用者来説这一切是秀明的，数据依然还是那些数据，可是此时，再来一次Master2宕机（刚才是Master1宕机），此时myCat会把Master1作为读写群。
于是，客户端再次通过myCat代理调用后，会发觉数据有差异了。

为什么？

因为Master2内的数据和Master1内的数据没有同步。

第二种配置：

于是：

第一步：

我们保留第一种配置即

第二步：

我们把Master1和Master2在物理上做成MySQL的主-备结构，现在来看场景推演。
Master1发生宕机，Master2顶上同时同步了Master1宕机前的数据，对于myCat用户群来説数据everything is ok。
Master1恢复，Master2宕机客户端发觉通过myCat得到的数据（来自于Master1）有异常，为什么？
因为Master2是Master1的Slaver，因此它只会“正向同步Master1的数据”，而不能逆向，因此这种配置和第一种配置完全没有区别。
那么有人説我们把Master1作成Master2的Slaver呢？那无非上第二种情况的场景推演倒一倒而己，还是不能保证任何一点宕机并且在恢复后如何保证数据的强一致性。

第三种配置：

于是，我们想到了一个办法，这个办法来源于Master和Slaver在作配置时my.cnf配置文件中的一个参数，它就是“log-slave-update”。
对于这个参数的解释，mySQL官方是如下解释的：当你的Master同时又是其它Master’的slaver 时，你需要设置此参数。
单从上述描述来看这段语句念起来有些晦涩，我们还是实际来看一个架构图吧。

这种结构被称为“双主结构”或者又称为“互为主备”结构。

Master1是Master2的Slaver；
Master2是Master1的Slaver；
同时，他们又是彼此下面如：Master1拖的S1, S2的Master

基于互为主备结构的myCat群搭建方法

第一步(一定要设log-slave-update)

把Master1作成Master2的Slaver，在Master1配置文件my.cnf中设置log-slave-update。
如果不设会发生下面这种情况
1）   通过Master2 insert数据
2）   在Master1上查看，数据被从Master2上同步过来了
3）   通过Master1下挂载的它本身的几个Slaver连入并进行查看，结果发觉没有同步Master1的数据
4）   通过Master1 insert数据
5）   在Master2上查看，数据被从Master1上同步过来了
6）   通过Master2下挂载的它本身的几个Slaver连入并进行查看，结果发觉没有同步Master2的数据

第二步

把Master2作成Master1的Slaver，在Master2配置文件my.cnf中设置log-slave-update。
对于Master1或者是Master2下再外挂的其本身的s1,s2上不需要再设log-slave-update这个开关了。
如果Master1或者是Master2本身下面还有挂Slaver，请记得此时在其本身的Slaver1上再同步一下它们与Master之间的bin-log。
因为Master一旦作成了另一个Master的Slaver，因此它的bin-log也改变了，你可以直接在其本身的Slaver上使用change master命令。

第三步

在myCat的配件文件中作如下设置：

writeType="0" dbType="mysql" dbDriver="native" switchType="2" slaveThreshold="100">
show slave status

于是，我们就有了这样的结构了

测试

1）我们连上myCat，对myCat群发送2条insert语句
2）我们单独连上m1, s1, s2, m2查看，发觉各个mysql实例中的数据一致
3）直接在m1上执行service mysqld stop
4）再次连上myCat群，对myCat群再发送2条insert语句
5）我们单独连上m2进行查看，现在m2上为4条数据
6）我们分别连上s1和s2进行查看，发现s1和s2上还是2条数据
7）我们把m1的mysql实例重新启动起来使用命令service mysqld start
8）单独连上m1进行查看，发觉m1此时数据条数据为4条
9）我们分别连上s1和s2进行查看，发现s1和s2上已经从原来的2条数据变为了4条数据

一个高可用的读写分离的集群就此搭建完毕，绝逼完美！

mySQL的垂直与水平折分

在本书系统的《mySQL集群(cluster)》中，我们详细介绍和对比了几种集群的方案，并且在该章节中我详细描述过使用mySQL的分片原则是可以取代集群方案的。并且它比起集群方案来説拥有着更多的优点：
廉价，软件免费并且可以使用廉价PC
可以大规模铺设不受License的束缚
稳定可监控
对于已有应用程序来説，它是透明的

什么是分片

一般的replication具有一个限制，即一旦数据库过于庞大，尤其是当写入过于频繁，很难由一台主机支撑的时候，我们还是会面临到扩展瓶颈。
所谓数据分片(sharding)即是通过某种特定的条件，将我们存放在同一个数据库中的数据分散存放到多个数据库（主机）上面，以达到分散单台设备负载的效果。。数据的切分同时还可以提高系统的总体可用性，因为单台设备Crash之后，只有总体数据的某部分不可用，而不是所有的数据。

数据的切分（Sharding）模式
一种是按照不同的表（或者Schema）来切分到不同的数据库（主机）之上，这种切可以称之为数据的垂直（纵向）切分；另外一种则是根据表中的数据的逻辑关系，将同一个表中的数据按照某种条件拆分到多台数据库（主机）上面，这种切分称之为数据的水平（横向）切分。

垂直切分

一个架构设计较好的应用系统，其总体功能肯定是由很多个功能模块所组成的，而每一个功能模块所需要的数据对应到数据库中就是一个或者多个表。而在架构设计中，各个功能模块相互之间的交互点越统一越少，系统的耦合度就越低，系统各个模块的维护性以及扩展性也就越好。这样的系统，实现数据的垂直切分也就越容易。
一般来说，如果是一个负载相对不是很大的系统，而且表关联又非常的频繁，那可能数据库让步，将几个相关模块合并在一起减少应用程序的工作的方案可以减少较多的工作量，这是一个可行的方案。一个垂直拆分的例子:

1.用户模块表：user,user_profile,user_group,user_photo_album
2.群组讨论表：groups,group_message,group_message_content,top_message
3.相册相关表：photo,photo_album,photo_album_relation,photo_comment
4.事件信息表：event
群组讨论模块和用户模块之间主要存在通过用户或者是群组关系来进行关联。一般关联的时候都会是通过用户的id或者nick_name以及group的id来进行关联，通过模块之间的接口实现不会带来太多麻烦；
相册模块仅仅与用户模块存在通过用户的关联。这两个模块之间的关联基本就有通过用户id关联的内容，简单清晰，接口明确；
事件模块与各个模块可能都有关联，但是都只关注其各个模块中对象的ID信息，同样可以做到很容易分拆。

垂直切分的优点
数据库的拆分简单明了，拆分规则明确；
应用程序模块清晰明确，整合容易；
数据维护方便易行，容易定位；
垂直切分的缺点

部分表关联无法在数据库级别完成，需要在程序中完成；
对于访问极其频繁且数据量超大的表仍然存在性能瓶颈，不一定能满足要求；
事务处理相对更为复杂；
切分达到一定程度之后，扩展性会遇到限制；
过度切分可能会带来系统过渡复杂而难以维护。
水平切分

将某个访问极其频繁的表再按照某个字段的某种规则来分散到多个表之中，每个表中包含一部分数据。
对于上面的例子:所有数据都是和用户关联的，那么我们就可以根据用户来进行水平拆分，将不同用户的数据切分到不同的数据库中。
现在互联网非常火爆的Web2.0类型的网站，基本上大部分数据都能够通过会员用户信息关联上，可能很多核心表都非常适合通过会员ID来进行数据的水平切分。而像论坛社区讨论系统，就更容易切分了，非常容易按照论坛编号来进行数据的水平切分。切分之后基本上不会出现各个库之间的交互。

水平切分的优点

表关联基本能够在数据库端全部完成；
不会存在某些超大型数据量和高负载的表遇到瓶颈的问题；
应用程序端整体架构改动相对较少；
事务处理相对简单；
只要切分规则能够定义好，基本上较难遇到扩展性限制；

水平切分的缺点

切分规则相对更为复杂，很难抽象出一个能够满足整个数据库的切分规则；
后期数据的维护难度有所增加，人为手工定位数据更困难；
应用系统各模块耦合度较高，可能会对后面数据的迁移拆分造成一定的困难。

两种切分结合用

一般来说，我们数据库中的所有表很难通过某一个（或少数几个）字段全部关联起来，所以很难简单的仅仅通过数据的水平切分来解决所有问题。而垂直切分也只能解决部分问题，对于那些负载非常高的系统，即使仅仅只是单个表都无法通过单台数据库主机来承担其负载。我们必须结合“垂直”和“水平”两种切分方式同时使用
每一个应用系统的负载都是一步一步增长上来的，在开始遇到性能瓶颈的时候，大多数架构师和DBA都会选择先进行数据的垂直拆分，因为这样的成本最先，最符合这个时期所追求的最大投入产出比。然而，随着业务的不断扩张，系统负载的持续增长，在系统稳定一段时期之后，经过了垂直拆分之后的数据库集群可能又再一次不堪重负，遇到了性能瓶颈。
如果我们再一次像最开始那样继续细分模块，进行数据的垂直切分，那我们可能在不久的将来，又会遇到现在所面对的同样的问题。而且随着模块的不断的细化，应用系统的架构也会越来越复杂，整个系统很可能会出现失控的局面。
这时候我们就必须要通过数据的水平切分的优势，来解决这里所遇到的问题。而且，我们完全不必要在使用数据水平切分的时候，推倒之前进行数据垂直切分的成果，而是在其基础上利用水平切分的优势来避开垂直切分的弊端，解决系统复杂性不断扩大的问题。而水平拆分的弊端（规则难以统一）也已经被之前的垂直切分解决掉了，让水平拆分可以进行的得心应手。

myCat实现数据分片

在数据切分处理中，特别是水平切分中，中间件最终要的两个处理过程就是数据的切分、数据的聚合。
选择合适的切分规则，至关重要，因为它决定了后续数据聚合的难易程度，甚至可以避免跨库的数据聚合
处理。

myCAT数据分片拆分原则：

避免或减少跨库join。
选择最合适的拆分维度。
Mycat拆分表解决方案：
MYCAT 全局表
ER关系
表拆分
--拆分维度
--主键分片vs 非主键分片

myCAT对于后端多个mySQL的数据折分和折分后的聚合，对于myCAT前端调用来説是透明的。

以实际例子来操作分片
在分片前，我们需要事先了解一个重要的知识点，也算是一个需要引起重视的问题。
A和B互为主从，我们按照userID来实施分片，userID为1，3，5的插入到一台mysql实例，userID为2，4，6的插入到另一个mysql实例中去。然后在mycat前端select时mycat会自动进行聚合，即它会从2个mysql实例中选择数据并合并成1,2,3,4,5,6…这样的数据显示给调用的客户端。

1. 先往A上插入一条数据（id:1 name: tom, gender: m），于是B上也马上会REPLI（同步）一条数据，因此你在A和B上做SELECT查询，都可以看到两边记录一样

2. 往B上插入一条数据（id:2 name: tom, gender: m），于是A上也马上会REPLI一条数据，因此你在A和B上做SELECT查询，都可以看到两边记录一样

3. 使用MYCAT读写分离，A为写，B为读，一切OK

4. 使用MYCAT做水平拆分，拆分规则为（id % 2 case 0 then Server A; case 1 then Server B;），于是，规则开始起效。

当插入id: 2的数据时，它会被insert到A上，接下去由于A和B互为主备，因此B马上会同步一条数据。
接下去再插入一条id:3的数据，由于id为3的数据根据我们预先配置后的规则会被插入到Server B上，然后A马上也会被REPLI一条数据id为3，此时，此时A和B两个MYSQL上就都有了同样的记录集，都为1,2,3，即：
Server A   Server B
1   1
2   2
3   3
所以数据分片等于没用。再来看分片读，读的规则也走上述规则，于是当你通过mycat作为mysql proxy时你会发生这样的场景：

Mysql –u root –p aaaaaa –P8066 –h 192.168.0.1

Select * from person
此时你得到的结果集为：

1
2
3
1
2
3
或者你的ReadServer始终为一台，那你会得到正确的1，2，3这样的结果集。但是，原先所需要的数据的sharding功能。。。其实没有做到。

myCAT分片前置条件（极其重要）

因此：

如果要考虑后期的水平和垂直折分，被折分的数据库不可以在其本身已经做了主从结构，而是需要把这个主从结构交由mycat来做。

实际分片演示
我们只需要修改rule.xml这个文件即可实现myCat的数据分片定义了。
但是按照前面小节的重要提示，在做分片前，我们一定要让我们参于分片规则的mySQL实例保持独立运行状态，即多个mySQL实例间不要做任何的“主备”结构。

实验前准备
我们拿192.168.0.101与192.168.0.102两台机器来做分片实验

在192.168.0.101上禁用binlog，关闭master slaver的关联，同时断开与原有192.168.0.104的master slaver关联。

别忘了把“log-slave-update”也注释掉。

重启后登录192.168.0.101，输入以下命令

stop slave;
change master to master_host=' ';

在192.168.0.104上禁用binlog，关闭master slaver的关联，同时断开与原有192.168.0.101的master slaver关联。

别忘了把“log-slave-update”也注释掉。

重启后登录192.168.0.104，输入以下命令

stop slave;
change master to master_host=' ';

配置数据分片
我们有一张T_PERSON表，结构如下：
CREATE TABLE `t_person` (
`person_id` int(11) NOT NULL,
`person_name` varchar(20) DEFAULT NULL,
PRIMARY KEY (`person_id`)
) ENGINE=MyISAM DEFAULT CHARSET=latin1;
show slave status;

数据分片按照PERSON_ID的奇偶来分。
配置mycat的rule.xml文件

           person_id
           mod-long




       2

通过配置可以看到我们按照person_id会把该表数据分在2个物理库内，分片数据包括通过mycat的mysql client端insert时自动分片以及select时自动聚合。

应用分片
rule.xml文件定义后还需要应用它里面的规则，才能够最终让数据分片在mycat中起效，为此，我们更改schema.xml文件，増加如下一段配置：

writeType="0" dbType="mysql" dbDriver="native" switchType="1" >
select 1

writeType="0" dbType="mysql" dbDriver="native" switchType="1" >
select 1

接着我们更改server.xml文件，増加如下一段配置：

       aaaaaa
       split
       false

测试分片
我们使用split/aaaaaa用户连上mycat实例

我们插入5条数据

insert into t_person(person_id,person_name)values('1','michael');
insert into t_person(person_id,person_name)values('2','tom');
insert into t_person(person_id,person_name)values('3','tonny');
insert into t_person(person_id,person_name)values('4','marry');
insert into t_person(person_id,person_name)values('5','jack');
commit;

然后我们接着做一次查询

连入192.168.0.101上进行查看，我们可以得到2条数据，person_id为偶数倍。

连入192.168.0.104上进行查看，我们可以得到3条数据，person_id为奇数倍。

分片成功！！！

myCAT的分片功能相当的强大，完全可以应付亿万级的数据，如果再结合适当的读写分离机制是完全可以让你的网站飞起来的。
myCAT的分片规则还有很多，文后的附件中会给出一个myCAT分片规则大全。

附件 myCAT分片规则大全
常用的根据主键或非主键的分片规则配置：

1. 枚举法

通过在配置文件中配置可能的枚举id，自己配置分片，使用规则：'

user_id
hash-int

partition-hash-int.txt
0
0

partition-hash-int.txt 配置：
10000=0
10010=1
DEFAULT_NODE=1

上面columns 标识将要分片的表字段，algorithm 分片函数，
其中分片函数配置中，mapFile标识配置文件名称，type默认值为0，0表示Integer，非零表示String，
所有的节点配置都是从0开始，及0代表节点1

/**
* defaultNode 默认节点:小于0表示不设置默认节点，大于等于0表示设置默认节点
*
默认节点的作用：枚举分片时，如果碰到不识别的枚举值，就让它路由到默认节点
* 如果不配置默认节点（defaultNode值小于0表示不配置默认节点），碰到
* 不识别的枚举值就会报错，
* like this：can't find datanode for sharding column:column_name val:ffffffff
*/

2. 固定分片hash算法

user_id
func1

2,1
256,512

配置说明：
上面columns 标识将要分片的表字段，algorithm 分片函数，
partitionCount 分片个数列表，partitionLength 分片范围列表
分区长度:默认为最大2^n=1024 ,即最大支持1024分区
约束 :
count,length两个数组的长度必须是一致的。
1024 = sum((count[i]*length[i])). count和length两个向量的点积恒等于1024
用法例子：
本例的分区策略：希望将数据水平分成3份，前两份各占25%，第三份占50%。（故本例非均匀分区）

// |<---------------------1024------------------------>|
// |<----256--->|<----256--->|<----------512---------->|
// | partition0 | partition1 | partition2 |
// | 共2份,故count[0]=2 | 共1份，故count[1]=1 |
int[] count = new int[] { 2, 1 };
int[] length = new int[] { 256, 512 };
PartitionUtil pu = new PartitionUtil(count, length);

// 下面代码演示分别以offerId字段或memberId字段根据上述分区策略拆分的分配结果
int DEFAULT_STR_HEAD_LEN = 8; // cobar默认会配置为此值
long offerId = 12345;
String memberId = "qiushuo";

// 若根据offerId分配，partNo1将等于0，即按照上述分区策略，offerId为12345时将会被分配到partition0中
int partNo1 = pu.partition(offerId);

// 若根据memberId分配，partNo2将等于2，即按照上述分区策略，memberId为qiushuo时将会被分到partition2中
int partNo2 = pu.partition(memberId, 0, DEFAULT_STR_HEAD_LEN);

如果需要平均分配设置：平均分为4分片，partitionCount*partitionLength=1024

4
256

3. 范围约定

user_id
rang-long

autopartition-long.txt

# range start-end ,data node index
# K=1000,M=10000.
0-500M=0
500M-1000M=1
1000M-1500M=2
或
0-10000000=0
10000001-20000000=1

配置说明：
上面columns 标识将要分片的表字段，algorithm 分片函数，
rang-long 函数中mapFile代表配置文件路径
所有的节点配置都是从0开始，及0代表节点1，此配置非常简单，即预先制定可能的id范围到某个分片

4. 求模法

user_id
mod-long

3

配置说明：
上面columns 标识将要分片的表字段，algorithm 分片函数，
此种配置非常明确即根据id进行十进制求模预算，相比方式1，此种在批量插入时需要切换数据源，id不连续

5. 日期列分区法

create_time
sharding-by-date

yyyy-MM-dd
2014-01-01
10

配置说明：
上面columns 标识将要分片的表字段，algorithm 分片函数，
配置中配置了开始日期，分区天数，即默认从开始日期算起，分隔10天一个分区

Assert.assertEquals(true, 0 == partition.calculate("2014-01-01"));
Assert.assertEquals(true, 0 == partition.calculate("2014-01-10"));
Assert.assertEquals(true, 1 == partition.calculate("2014-01-11"));
Assert.assertEquals(true, 12 == partition.calculate("2014-05-01"));

6. 通配取模

user_id
sharding-by-pattern

256
2
partition-pattern.txt

partition-pattern.txt
# id partition range start-end ,data node index
###### first host configuration
1-32=0
33-64=1
65-96=2
97-128=3
######## second host configuration
129-160=4
161-192=5
193-224=6
225-256=7
0-0=7
配置说明：
上面columns 标识将要分片的表字段，algorithm 分片函数，patternValue 即求模基数，defaoultNode 默认节点，如果配置了默认，则不会按照求模运算
mapFile 配置文件路径
配置文件中，1-32 即代表id%256后分布的范围，如果在1-32则在分区1，其他类推，如果id非数据，则会分配在defaoultNode 默认节点

String idVal = "0";
Assert.assertEquals(true, 7 == autoPartition.calculate(idVal));
idVal = "45a";
Assert.assertEquals(true, 2 == autoPartition.calculate(idVal));

7. ASCII码求模通配

user_id
sharding-by-prefixpattern

256
5
partition-pattern.txt

partition-pattern.txt

# range start-end ,data node index
# ASCII
# 48-57=0-9
# 64、65-90=@、A-Z
# 97-122=a-z
###### first host configuration
1-4=0
5-8=1
9-12=2
13-16=3
###### second host configuration
17-20=4
21-24=5
25-28=6
29-32=7
0-0=7
配置说明：
上面columns 标识将要分片的表字段，algorithm 分片函数，patternValue 即求模基数，prefixLength ASCII 截取的位数
mapFile 配置文件路径
配置文件中，1-32 即代表id%256后分布的范围，如果在1-32则在分区1，其他类推

此种方式类似方式6只不过采取的是将列种获取前prefixLength位列所有ASCII码的和进行求模sum%patternValue ,获取的值，在通配范围内的
即分片数，
/**
* ASCII编码：
* 48-57=0-9阿拉伯数字
* 64、65-90=@、A-Z
* 97-122=a-z
*
*/
如

String idVal="gf89f9a";
Assert.assertEquals(true, 0==autoPartition.calculate(idVal));

idVal="8df99a";
Assert.assertEquals(true, 4==autoPartition.calculate(idVal));

idVal="8dhdf99a";
Assert.assertEquals(true, 3==autoPartition.calculate(idVal));

8. 编程指定

user_id
sharding-by-substring

0
2
8
0

配置说明：
上面columns 标识将要分片的表字段，algorithm 分片函数
此方法为直接根据字符子串（必须是数字）计算分区号（由应用传递参数，显式指定分区号）。
例如id=05-100000002
在此配置中代表根据id中从startIndex=0，开始，截取siz=2位数字即05，05就是获取的分区，如果没传默认分配到defaultPartition

9. 字符串拆分hash解析

user_id
sharding-by-stringhash

512
2
0:2

配置说明：
上面columns 标识将要分片的表字段，algorithm 分片函数
函数中length代表字符串hash求模基数，count分区数，hashSlice hash预算位

即根据子字符串 hash运算

hashSlice ： 0 means str.length(), -1 means str.length()-1

/**
* "2" -> (0,2)

* "1:2" -> (1,2)

* "1:" -> (1,0)

* "-1:" -> (-1,0)

* ":-1" -> (0,-1)

* ":" -> (0,0)

*/

例子：

String idVal=null;
rule.setPartitionLength("512");
rule.setPartitionCount("2");
rule.init();
rule.setHashSlice("0:2");
//       idVal = "0";
//       Assert.assertEquals(true, 0 == rule.calculate(idVal));
//       idVal = "45a";
//       Assert.assertEquals(true, 1 == rule.calculate(idVal));

//last 4
rule = new PartitionByString();
rule.setPartitionLength("512");
rule.setPartitionCount("2");
rule.init();
//last 4 characters
rule.setHashSlice("-4:0");
idVal = "aaaabbb0000";
Assert.assertEquals(true, 0 == rule.calculate(idVal));
idVal = "aaaabbb2359";
Assert.assertEquals(true, 0 == rule.calculate(idVal));

10. 一致性hash

user_id
murmur

0
2
160

一致性hash预算有效解决了分布式数据的扩容问题，前1-9中id规则都多少存在数据扩容难题，而10规则解决了数据扩容难点
关于一致性hash详细：

一致性哈希算法在1997年由麻省理工学院提出的一种分布式哈希（DHT）实现算法，设计目标是为了解决因特网中的热点(Hot spot)问题，初衷和CARP十分类似。一致性哈希修正了CARP使用的简单哈希算法带来的问题，使得分布式哈希（DHT）可以在P2P环境中真正得到应用。
一致性hash算法提出了在动态变化的Cache环境中，判定哈希算法好坏的四个定义：
1、平衡性(Balance)：平衡性是指哈希的结果能够尽可能分布到所有的缓冲中去，这样可以使得所有的缓冲空间都得到利用。很多哈希算法都能够满足这一条件。
2、单调性(Monotonicity)：单调性是指如果已经有一些内容通过哈希分派到了相应的缓冲中，又有新的缓冲加入到系统中。哈希的结果应能够保证原有已分配的内容可以被映射到原有的或者新的缓冲中去，而不会被映射到旧的缓冲集合中的其他缓冲区。
3、分散性(Spread)：在分布式环境中，终端有可能看不到所有的缓冲，而是只能看到其中的一部分。当终端希望通过哈希过程将内容映射到缓冲上时，由于不同终端所见的缓冲范围有可能不同，从而导致哈希的结果不一致，最终的结果是相同的内容被不同的终端映射到不同的缓冲区中。这种情况显然是应该避免的，因为它导致相同内容被存储到不同缓冲中去，降低了系统存储的效率。分散性的定义就是上述情况发生的严重程度。好的哈希算法应能够尽量避免不一致的情况发生，也就是尽量降低分散性。
4、负载(Load)：负载问题实际上是从另一个角度看待分散性问题。既然不同的终端可能将相同的内容映射到不同的缓冲区中，那么对于一个特定的缓冲区而言，也可能被不同的用户映射为不同的内容。与分散性一样，这种情况也是应当避免的，因此好的哈希算法应能够尽量降低缓冲的负荷。
在分布式集群中，对机器的添加删除，或者机器故障后自动脱离集群这些操作是分布式集群管理最基本的功能。如果采用常用的hash(object)%N算法，那么在有机器添加或者删除后，很多原有的数据就无法找到了，这样严重的违反了单调性原则。接下来主要讲解一下一致性哈希算法是如何设计的：
环形Hash空间
按照常用的hash算法来将对应的key哈希到一个具有2^32次方个桶的空间中，即0~(2^32)-1的数字空间中。现在我们可以将这些数字头尾相连，想象成一个闭合的环形。如下图

把数据通过一定的hash算法处理后映射到环上
现在我们将object1、object2、object3、object4四个对象通过特定的Hash函数计算出对
应的key值，然后散列到Hash环上。如下图：
    Hash(object1) = key1；
    Hash(object2) = key2；
    Hash(object3) = key3；
    Hash(object4) = key4；

将机器通过hash算法映射到环上
在采用一致性哈希算法的分布式集群中将新的机器加入，其原理是通过使用与对象存储一样的Hash算法将机器也映射到环中（一般情况下对机器的hash计算是采用机器的IP或者机器唯一的别名作为输入值），然后以顺时针的方向计算，将所有对象存储到离自己最近的机器中。
假设现在有NODE1，NODE2，NODE3三台机器，通过Hash算法得到对应的KEY值，映射到环中，其示意图如下：
Hash(NODE1) = KEY1;
Hash(NODE2) = KEY2;
Hash(NODE3) = KEY3;

通过上图可以看出对象与机器处于同一哈希空间中，这样按顺时针转动object1存储到了NODE1中，object3存储到了NODE2中，object2、object4存储到了NODE3中。在这样的部署环境中，hash环是不会变更的，因此，通过算出对象的hash值就能快速的定位到对应的机器中，这样就能找到对象真正的存储位置了。

机器的删除与添加
普通hash求余算法最为不妥的地方就是在有机器的添加或者删除之后会照成大量的对象存储位置失效，这样就大大的不满足单调性了。下面来分析一下一致性哈希算法是如何处理的。
1. 节点（机器）的删除
以上面的分布为例，如果NODE2出现故障被删除了，那么按照顺时针迁移的方法，object3将会被迁移到NODE3中，这样仅仅是object3的映射位置发生了变化，其它的对象没有任何的改动。如下图：
2. 节点（机器）的添加
如果往集群中添加一个新的节点NODE4，通过对应的哈希算法得到KEY4，并映射到环中，如下图：

通过按顺时针迁移的规则，那么object2被迁移到了NODE4中，其它对象还保持这原有的存储位置。通过对节点的添加和删除的分析，一致性哈希算法在保持了单调性的同时，还是数据的迁移达到了最小，这样的算法对分布式集群来说是非常合适的，避免了大量数据迁移，减小了服务器的的压力。

平衡性
根据上面的图解分析，一致性哈希算法满足了单调性和负载均衡的特性以及一般hash算法的分散性，但这还并不能当做其被广泛应用的原由，因为还缺少了平衡性。下面将分析一致性哈希算法是如何满足平衡性的。hash算法是不保证平衡的，如上面只部署了NODE1和NODE3的情况（NODE2被删除的图），object1存储到了NODE1中，而object2、object3、object4都存储到了NODE3中，这样就照成了非常不平衡的状态。在一致性哈希算法中，为了尽可能的满足平衡性，其引入了虚拟节点。
——“虚拟节点”（ virtual node ）是实际节点（机器）在 hash 空间的复制品（ replica ），一实际个节点（机器）对应了若干个“虚拟节点”，这个对应个数也成为“复制个数”，“虚拟节点”在 hash 空间中以hash值排列。
以上面只部署了NODE1和NODE3的情况（NODE2被删除的图）为例，之前的对象在机器上的分布很不均衡，现在我们以2个副本（复制个数）为例，这样整个hash环中就存在了4个虚拟节点，最后对象映射的关系图如下：

根据上图可知对象的映射关系：object1->NODE1-1，object2->NODE1-2，object3->NODE3-2，object4->NODE3-1。通过虚拟节点的引入，对象的分布就比较均衡了。那么在实际操作中，正真的对象查询是如何工作的呢？对象从hash到虚拟节点到实际节点的转换如下图：

“虚拟节点”的hash计算可以采用对应节点的IP地址加数字后缀的方式。例如假设NODE1的IP地址为192.168.1.100。引入“虚拟节点”前，计算 cache A 的 hash 值：
Hash(“192.168.1.100”);
引入“虚拟节点”后，计算“虚拟节”点NODE1-1和NODE1-2的hash值：
Hash(“192.168.1.100#1”); // NODE1-1
Hash(“192.168.1.100#2”); // NODE1-2
以上所有规则每种都有特定使用场景，可以选择性使用!

---------------------
转载：https://blog.csdn.net/lifetragedy/article/details/52919984

你可能感兴趣的:(MyCat,数据库)

学生上机管理系统设计与实现 AR新视野
本文还有配套的精品资源，点击获取简介：《学生上机管理系统》是一款专门用于教育领域的管理软件，通过VB开发实现学生和教师的信息化管理。系统包括学生管理模块和教师管理模块，提供详细的学生信息录入、查询、修改功能，成绩统计与展示，以及课程安排、监控和上机预约等功能。此外，系统支持作业提交和批改，以及基于角色的用户权限管理，确保信息安全性。该系统利用数据库技术和人机交互界面，旨在提高教学质量和管理效率。1
Neo4j 的向量搜索（Neo4jVector）和常见的向量数据库（比如 Milvus、Qdrant）之间的区别与联系
先说联系（共同点）点内容✅都支持向量检索都可以基于embedding（向量）做相似度搜索，比如给一段文本、找出最相似的若干条记录。✅都用于语义检索你可以把它们用在RAG（检索增强生成）、ChatwithDocs、智能问答、推荐系统等应用里。✅都支持批量插入、查询都可以批量向数据库中插入文本+向量，然后用向量做top-k检索（如search(k=8)）。✅都和LangChain集成它们都可以通过la
容器基础5-Helm 与 K8s 的关系旗浩QH Android系统虚拟化 kubernetes 容器云原生
一、Helm是什么？为什么需要它？K8s是强大的容器编排平台，但部署复杂应用时（如包含Web服务、数据库、缓存等多个组件的系统），需要编写大量YAML文件，管理成本高。Helm就是为简化K8s应用部署而生的工具，它被称为“K8s的包管理器”，类似Ubuntu的apt或Mac的brew。二、Helm如何工作？核心概念解析Chart（图表）Helm的基本单位，是一组YAML文件的集合，描述了一个或多个
开源模型应用落地-让AI更懂你的每一次交互-Mem0集成Qdrant、Neo4j与Streamlit的创新实践（四）开源技术探险家开源模型-实际应用落地 neo4j 开源人工智能语言模型
一、前言在人工智能迅速发展的今天，如何让AI系统更懂“你”？答案或许藏在个性化的记忆管理之中。Mem0作为一个开源的记忆管理系统，正致力于为AI赋予长期记忆与个性化服务能力。通过结合高性能向量数据库Qdrant、图数据库Neo4j的强大关系分析能力以及Streamlit的高效可视化交互，我们可以打造出一个既能存储用户历史行为、又能实时推理并展示结果的智能记忆助手。本文将带您一步步探索这一技术组合的
【123揭秘】Elasticsearch内部数据结构大起底：行存、列存与倒排索引，你选对了吗？墨瑾轩 Java乐园 elasticsearch 数据结构 jenkins
关注墨瑾轩，带你探索编程的奥秘！超萌技术攻略，轻松晋级编程高手技术宝库已备好，就等你来挖掘订阅墨瑾轩，智趣学习不孤单即刻启航，编程之旅更有趣第一部分：理解基本概念——构建知识的基础首先，我们需要了解一些基础概念，这对于理解Elasticsearch如何处理和存储数据至关重要。1.1行存储vs列存储行存储：适用于频繁写入和读取整行数据的场景。例如，在关系型数据库中，每一行代表一条记录，所有列的数据都
PostgreSQL WHERE 子句详解 wjs2024 开发语言
PostgreSQLWHERE子句详解引言在数据库管理系统中，查询是核心操作之一。PostgreSQL作为一款功能强大的开源关系型数据库，其查询语句的编写对于数据库操作至关重要。本文将详细解析PostgreSQL中的WHERE子句，帮助您更好地理解和使用这一关键特性。什么是WHERE子句？WHERE子句是SQL查询语句中的一个重要组成部分，用于指定查询条件。在WHERE子句中，您可以定义一系列条件
如何使用单例模式保证全局唯一实例（复杂版本）
//////登录管理类（单例模式），负责用户登录、注销及用户信息管理///publicclassLoginMananger{//用于线程同步的锁对象staticobject_lockObj=newobject();//单例实例（延迟初始化）staticLoginManangerloginMananger=null;//用户数据库操作帮助类ELMeasure.Model.UserSqlHelpuse
SQLserver中的增删改查和数据类型就是有点傻 SQLserver 数据库 sql
SQLserver增删查改语句SQLServer是一种关系数据库管理系统，用于存储、管理和检索数据。以下是一些基本的SQL语句，用于在SQLServer中执行增删查改操作：插入数据（Insert）插入完整行：INSERTINTO表名(列1,列2,列3,...)VALUES(值1,值2,值3,...);插入多行：INSERTINTO表名(列1,列2,列3,...)VALUES(值1a,值2a,值3a
MySQL性能调优实战指南：从踩坑到精通，让数据库“跑”起来！码不停蹄的玄黓数据库 mysql MySQL调优
引言作为后端开发/DBA，你是否也经历过这样的崩溃时刻？业务高峰期数据库CPU飙到90%，慢查询堆成山；主从延迟严重，读操作频繁超时；批量插入数据时，应用卡成“PPT”；优化了半天索引，查询还是慢……别慌！今天这篇文章结合个人数据库调优经验，从架构设计→配置调优→索引优化→SQL诊断→硬件加持全链路拆解，带你彻底搞定MySQL性能瓶颈！一、先搞清楚：你的数据库到底“卡”在哪？优化前必须做的一步：定
JDBC连接池今惜时 JDBC 数据库 java mysql
数据库连接池什么是连接池连接池是创建和管理一个连接的缓冲池的技术，这些连接准备好被任何需要它们的线程使用。这种连接“汇集”起来的技术基于这样的一个事实：对于大多数应用程序，当它们正在处理通常需要数毫秒完成的事务时，仅需要能够访问JDBC连接的1个线程。当不处理事务时，这个连接就会闲置。相反，连接池允许闲置的连接被其它需要的线程使用。事实上，当一个线程需要用JDBC对一个GBase或其它数据库操作时
分布式ID设计方案详解：从理论到实践
一、为什么需要分布式ID？在分布式系统中，唯一ID的生成面临两大核心挑战：全局唯一性：避免跨节点、跨数据中心的ID冲突。有序性：确保ID按时间或业务规则递增，提升数据库写入性能（如InnoDB的B+树索引）。传统单机自增ID（如MySQLAUTO_INCREMENT）无法满足分库分表、高并发等场景需求，因此需引入分布式ID方案。二、主流分布式ID方案对比方案优点缺点适用场景UUID简单、无中心化依
介绍6款密码暴力破解工具网安导师小李程序员网络安全编程 web安全网络安全 tcp/ip php python java
暴力破解就是通过不断穷举可能的密码，直至密码验证成功，暴力破解分为密码爆破和密码喷洒，密码爆破就是不断的去尝试不同的密码，密码喷洒就是通过已知密码不断去尝试账号。下面介绍6款常见的暴力破解工具。01hydraHydra（九头蛇）是THC组织开发的，是一款非常流行的密码破解工具，可以对多种服务的账号和密码进行爆破，包括Web登录、数据库、SSH、FTP等服务，支持Linux、Windows、Mac平
MySQL分布式ID冲突详解：场景、原因与解决方案码不停蹄的玄黓 mysql 分布式数据库 ID冲突
引言在分布式系统开发中，你是否遇到过这样的崩溃时刻？——明明每个数据库实例的自增ID都从1开始，插入数据时却提示“Duplicateentry‘100’forkey‘PRIMARY’”；或者分库分表后，不同库里的订单ID竟然重复，业务合并时直接报错……这些问题的核心，都是分布式ID冲突。今天咱们就来扒一扒MySQL分布式ID冲突的常见场景、底层原因，以及对应的解决方案，帮你彻底避开这些坑！一、为什
如何在YashanDB中管理数据模型变更数据库
在现代企业中，数据模型的变更管理扮演着关键角色。无论是扩展现有业务，还是应对新的需求，业务模型的改变往往需要相应的数据模型更新。如何有效地管理这些变更，确保数据的完整性、一致性及应用的高可用性，成为了数据架构师和开发者必须面对的重要问题。本文将详细探讨在YashanDB中管理数据模型变更的策略和方法，旨在提升对YashanDB数据库技术的理解及应用能力。数据模型变更管理的关键要素版本控制与变更日志
如何在YashanDB数据库中使用JSON数据类型？数据库
随着海量结构化与半结构化数据的快速增长，关系型数据库面临性能瓶颈和数据一致性的挑战。JSON作为一种灵活的半结构化数据格式，在多领域数据交换和存储中广泛应用。YashanDB作为支持多种存储结构和高性能事务处理的数据库产品，提供了对JSON数据类型的支持，以满足现代复杂业务对半结构化数据处理的需求。本文旨在基于YashanDB体系架构及存储引擎特性，深入解析JSON数据类型的技术原理与实现方式，为
如何在YashanDB数据库中实现数据查询优化数据库
在现代信息技术环境中，数据量的快速增长使得数据库的性能优化成为重要课题。如何提升查询速度，降低资源消耗，成为了数据库管理人员和开发者必须面对的挑战。有效的数据查询优化不仅能提高响应时间，还能显著提升用户体验与系统效率。在YashanDB数据库中，优化数据查询需从多个技术角度进行综合考量与实际应用。利用索引技术优化查询索引是提升数据库查询性能的常用手段。在YashanDB中，主要支持BTree索引、
如何在YashanDB数据库中实现数据模型的简化数据库
在现代数据库技术领域，数据模型的复杂性经常导致性能瓶颈和维护困惑。随着数据规模的增长和业务诉求的增加，复杂的数据结构、冗余的存储和不必要的关联关系都会影响整体数据库的性能和可维护性。特别是在面对动态变化的业务需求时，灵活性和扩展性成为关键因素。YashanDB提供了一系列功能强大的工具和机制，能够有效简化数据模型，提升数据库性能，并增强数据操作的灵活性。本文章旨在为数据库开发者和架构师提供技术洞见
如何在YashanDB数据库中实现复杂事务管理数据库
在现代数据库管理系统中，事务管理是一项关键功能。复杂的事务管理可以确保多条SQL操作的原子性、一致性、隔离性和持久性（ACID特性），减少数据的不一致和错误。尤其在高并发场景中，事务管理的机制与实现至关重要。因此，构建高效的事务管理系统，对于提升数据库的性能及应用程序的可靠性具有深远影响。YashanDB的事务特性YashanDB数据库支持全面的事务管理功能，通过多版本并发控制（MVCC）、事务隔
如何在YashanDB数据库中管理用户权限数据库
在数据库管理系统中，用户权限的管理是保障数据安全和系统稳定运行的关键环节。合理的权限控制能有效防止未经授权的访问和误操作，同时满足业务需求的灵活性。对于YashanDB数据库，充分理解其权限体系与管理机制，有助于构建安全、稳定且高效的数据库应用环境。本文将深入解析YashanDB中用户权限管理的技术原理、实现功能和最佳实践。YashanDB的用户与角色机制YashanDB管理权限的核心实体为“用户
如何在YashanDB数据库中进行高效的JSON数据存储数据库
随着业务对非结构化和半结构化数据存储需求的增加，JSON数据类型逐渐成为数据库支持的关键特性。然而，JSON数据的高效存储与访问面临性能瓶颈、一致性保障及空间利用率等挑战。YashanDB作为现代企业级数据库，需提供有效的机制解决上述难题，从而满足实时查询、高并发访问及数据一致性的需求。本文针对YashanDB数据库的体系架构、存储引擎及索引机制，深入分析如何实现高效的JSON数据存储与访问，旨在
如何在YashanDB数据库中高效处理海量数据数据库
在现代数据库技术中，海量数据的管理和处理成为了一个普遍存在的挑战。随着数据规模的不断扩大，性能瓶颈、数据一致性问题以及易用性需求等问题日益凸显。这些挑战促使企业寻求更为高效的解决方案，以支撑海量数据的存储、分析与挖掘。YashanDB作为一款专为处理海量数据而设计的数据库，凭借其高可扩展性、高并发性能和高可用性，提供了一系列技术手段以应对这些挑战。本文旨在探讨如何在YashanDB中高效地管理和处
如何有效管理YashanDB的访问控制数据库
引言在当今数字化的业务环境中，数据安全性和访问控制是数据库管理的核心问题。随着数据规模的不断扩大，以及对数据隐私和合规性的要求日益增强，如何有效管理数据库的访问权限已成为企业面临的重大挑战。YashanDB作为一个高性能的数据库管理系统，具备丰富的访问控制功能，但同时也带来了复杂的管理需求。本篇文章将深入探讨YashanDB的访问控制机制，包括用户管理、角色权限、身份认证及其他相关策略，旨在为数据
如何在YashanDB数据库中保持数据一致性与完整性数据库
在现代数据库管理系统中，确保数据的一致性与完整性是面临的主要挑战之一。这一挑战在高并发、高要求的数据操作场景中尤为突出。YashanDB作为一种高性能的分布式数据库，采用了多种技术手段以保持数据的一致性与完整性。本文将深入探讨YashanDB中实现数据一致性与完整性的核心技术原理，适用于对高并发和复杂事务有一定理解的数据库管理员（DBA）和开发人员。事务管理与ACID特性事务是数据库操作的基本单元
如何实现YashanDB中的数据冗余处理数据库
数据冗余是数据库管理中的一个重要话题，直接影响到数据的可用性与可靠性。在高并发场景下，数据冗余能够有效防止数据丢失，并提升系统的容灾能力。YashanDB作为一款高性能的数据库产品，通过灵活的结构和多种部署方式，实现了数据冗余处理。本文将详细探讨YashanDB中实现数据冗余处理的技术细节，为数据库管理员和开发人员提供理论支持和实践指导。YashanDB的数据冗余机制单机部署中的数据冗余在单机部署
如何确保YashanDB数据库的性能稳定？数据库
在当今数据量激增的背景下，数据库的性能稳定性成为企业技术架构成功的关键因素之一。数据库面临的挑战包括性能瓶颈、数据一致性问题及并发访问的影响。为了应对这些问题，YashanDB作为一种新兴的数据库管理系统，提供了先进的架构和功能，旨在为高性能和高可用性提供保障。本文将详细探讨确保YashanDB数据库性能稳定性的方法，旨在为数据库管理员、系统架构师及IT技术负责人提供实用建议，实现企业数据处理的高
如何设计基于YashanDB数据库的高效查询数据库
在当今数据驱动的业务环境中，提高数据库查询性能已经成为各类企业面临的重大挑战。随着数据量的快速增长，许多机构遭遇了性能瓶颈、数据一致性问题和查询响应延迟等一系列问题。在这样的背景下，优化数据库架构、提高查询效率迫在眉睫。本文将集中在YashanDB数据库的查询设计上，提供技术分析和操作指导，以帮助开发人员设计高效的查询策略，实现优越的性能。YashanDB的体系架构YashanDB支持多种部署形态
如何实现YashanDB数据库的负载均衡数据库
在现代应用中，数据库的性能直接影响整个系统的效率和用户体验。因此，数据库的负载均衡成为了设计和部署中不可忽视的重要环节。YashanDB是一个新兴的数据库系统，其支持多种架构和配置，适合不同的业务场景。通过合理实现YashanDB的负载均衡，可以有效提升系统的并发处理能力、降低响应时间及提高可用性。YashanDB的架构概述YashanDB支持多种部署模式，包括单机（主备）部署、分布式集群部署以及
网络安全/Web安全/渗透测试入门/信息收集 &Sinnt& 网络安全 web安全网络安全
网络安全/Web安全/渗透测试入门/信息收集本篇文章主要讲解如何进行信息收集，列举了在信息收集中常见的工具和手段。原文地址：sinblog一，whois查询WHOIS查询是一种查找域名注册信息的工具或服务。WHOIS是一个协议，允许用户查询某个域名或IP地址的域名、注册信息以及其他相关互联网的详细数据。WHOIS数据库由多个注册商提供和注册机构维护，公开提供域名注册人的信息。自己购买一个域名，配置
MongoDB数据库备份及恢复策略详解魑魅丶小鬼
本文还有配套的精品资源，点击获取简介：MongoDB，作为流行的开源NoSQL数据库，提供灵活、高性能和易用性的特点。为了保证数据安全和业务连续性，进行有效的备份和恢复策略至关重要。本文将介绍MongoDB的备份工具和方法，包括mongodump和mongorestore命令行工具，以及更复杂的云备份解决方案。同时，将通过一个中等规模的数据集实例来详细说明备份流程，强调备份前停止写入、执行备份、检
Redis Geo结构详解：从原理到实战，手把手教你玩转地理位置功能码不停蹄的玄黓 redis 数据库缓存
在互联网产品中，“附近的人”“附近的店”“配送范围”这类功能越来越常见。以前做这种功能可能需要依赖MySQL的经纬度计算，或者上专业的GIS数据库（比如PostGIS），但Redis3.2版本后推出的Geo（地理信息）模块，用极简的API和高效的性能，完美解决了这类问题。今天咱们就来深入聊聊RedisGeo的底层原理、常用命令和实战场景。一、为什么需要RedisGeo？先想个场景：你要做一个“附近
java类加载顺序 3213213333332132 java
package com.demo; /** * @Description 类加载顺序 * @author FuJianyong * 2015-2-6上午11:21:37 */ public class ClassLoaderSequence { String s1 = "成员属性"; static String s2 = "
Hibernate与mybitas的比较 BlueSkator sql Hibernate 框架 ibatis orm
第一章 Hibernate与MyBatis Hibernate 是当前最流行的O/R mapping框架，它出身于sf.net，现在已经成为Jboss的一部分。 Mybatis 是另外一种优秀的O/R mapping框架。目前属于apache的一个子项目。 MyBatis 参考资料官网：http:
php多维数组排序以及实际工作中的应用 dcj3sjt126com PHP usort uasort
自定义排序函数返回false或负数意味着第一个参数应该排在第二个参数的前面, 正数或true反之, 0相等usort不保存键名uasort 键名会保存下来uksort 排序是对键名进行的 <!doctype html> <html lang="en"> <head> <meta charset="utf-8&q
DOM改变字体大小周华华前端
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/xhtml&q
c3p0的配置 g21121 c3p0
c3p0是一个开源的JDBC连接池，它实现了数据源和JNDI绑定，支持JDBC3规范和JDBC2的标准扩展。c3p0的下载地址是：http://sourceforge.net/projects/c3p0/这里可以下载到c3p0最新版本。以在spring中配置dataSource为例：  <bean name="prope
Java获取工程路径的几种方法 510888780 java
第一种： File f = new File(this.getClass().getResource("/").getPath()); System.out.println(f); 结果: C:\Documents%20and%20Settings\Administrator\workspace\projectName\bin 获取当前类的所在工程路径; 如果不加“
在类Unix系统下实现SSH免密码登录服务器 Harry642 免密 ssh
1.客户机 (1)执行ssh-keygen -t rsa -C "[email protected]"生成公钥，xxx为自定义大email地址 (2)执行scp ~/.ssh/id_rsa.pub root@xxxxxxxxx:/tmp将公钥拷贝到服务器上，xxx为服务器地址 (3)执行cat
Java新手入门的30个基本概念一 aijuans java java 入门新手
在我们学习Java的过程中,掌握其中的基本概念对我们的学习无论是J2SE,J2EE,J2ME都是很重要的,J2SE是Java的基础,所以有必要对其中的基本概念做以归纳,以便大家在以后的学习过程中更好的理解java的精髓,在此我总结了30条基本的概念。　　Java概述:　　目前Java主要应用于中间件的开发(middleware)---处理客户机于服务器之间的通信技术,早期的实践证明,Java不适合
Memcached for windows 简单介绍 antlove java Web windows cache memcached
1. 安装memcached server a. 下载memcached-1.2.6-win32-bin.zip b. 解压缩，dos 窗口切换到 memcached.exe所在目录，运行memcached.exe -d install c.启动memcached Server,直接在dos窗口键入 net start "memcached Server&quo
数据库对象的视图和索引百合不是茶索引 oeacle数据库视图
视图视图是从一个表或视图导出的表，也可以是从多个表或视图导出的表。视图是一个虚表，数据库不对视图所对应的数据进行实际存储，只存储视图的定义，对视图的数据进行操作时,只能将字段定义为视图,不能将具体的数据定义为视图为什么oracle需要视图; &
Mockito(一) --入门篇 bijian1013 持续集成 mockito 单元测试
Mockito是一个针对Java的mocking框架，它与EasyMock和jMock很相似，但是通过在执行后校验什么已经被调用，它消除了对期望行为（expectations）的需要。其它的mocking库需要你在执行前记录期望行为（expectations），而这导致了丑陋的初始化代码。 &nb
精通Oracle10编程SQL(5)SQL函数 bijian1013 oracle 数据库 plsql
/* * SQL函数 */ --数字函数 --ABS(n):返回数字n的绝对值 declare v_abs number(6,2); begin v_abs:=abs(&no); dbms_output.put_line('绝对值：'||v_abs); end; --ACOS(n):返回数字n的反余弦值，输入值的范围是-1~1，输出值的单位为弧度
【Log4j一】Log4j总体介绍 bit1129 log4j
Log4j组件：Logger、Appender、Layout Log4j核心包含三个组件：logger、appender和layout。这三个组件协作提供日志功能：日志的输出目标日志的输出格式日志的输出级别(是否抑制日志的输出) logger继承特性 A logger is said to be an ancestor of anothe
Java IO笔记白糖_ java
public static void main(String[] args) throws IOException { //输入流 InputStream in = Test.class.getResourceAsStream("/test"); InputStreamReader isr = new InputStreamReader(in); Bu
Docker 监控 ronin47 docker监控
目前项目内部署了docker，于是涉及到关于监控的事情，参考一些经典实例以及一些自己的想法，总结一下思路。 1、关于监控的内容监控宿主机本身监控宿主机本身还是比较简单的，同其他服务器监控类似，对cpu、network、io、disk等做通用的检查，这里不再细说。额外的，因为是docker的
java-顺时针打印图形 bylijinnan java
一个画图程序要求打印出： 1.int i=5; 2.1 2 3 4 5 3.16 17 18 19 6 4.15 24 25 20 7 5.14 23 22 21 8 6.13 12 11 10 9 7. 8.int i=6 9.1 2 3 4 5 6 10.20 21 22 23 24 7 11.19
关于iReport汉化版强制使用英文的配置方法 Kai_Ge iReport汉化英文版
对于那些具有强迫症的工程师来说，软件汉化固然好用，但是汉化不完整却极为头疼，本方法针对iReport汉化不完整的情况，强制使用英文版，方法如下：在 iReport 安装路径下的 etc/ireport.conf 里增加红色部分启动参数，即可变为英文版。 # ${HOME} will be replaced by user home directory accordin
[并行计算]论宇宙的可计算性 comsci 并行计算
现在我们知道,一个涡旋系统具有并行计算能力.按照自然运动理论,这个系统也同时具有存储能力,同时具备计算和存储能力的系统,在某种条件下一般都会产生意识...... 那么,这种概念让我们推论出一个结论 &nb
用OpenGL实现无限循环的coverflow dai_lm android coverflow
网上找了很久，都是用Gallery实现的，效果不是很满意，结果发现这个用OpenGL实现的，稍微修改了一下源码，实现了无限循环功能源码地址： https://github.com/jackfengji/glcoverflow public class CoverFlowOpenGL extends GLSurfaceView implements GLSurfaceV
JAVA数据计算的几个解决方案1 datamachine java Hibernate 计算
老大丢过来的软件跑了10天，摸到点门道，正好跟以前攒的私房有关联，整理存档。 -----------------------------华丽的分割线------------------------------------- 数据计算层是指介于数据存储和应用程序之间，负责计算数据存储层的数据，并将计算结果返回应用程序的层次。J &nbs
简单的用户授权系统,利用给user表添加一个字段标识管理员的方式 dcj3sjt126com yii
怎么创建一个简单的(非 RBAC)用户授权系统通过查看论坛，我发现这是一个常见的问题，所以我决定写这篇文章。本文只包括授权系统.假设你已经知道怎么创建身份验证系统(登录)。数据库首先在 user 表创建一个新的字段(integer 类型),字段名 'accessLevel',它定义了用户的访问权限扩展 CWebUser 类在配置文件(一般为 protecte
未选之路 dcj3sjt126com 诗
作者:罗伯特*费罗斯特黄色的树林里分出两条路, 可惜我不能同时去涉足, 我在那路口久久伫立, 我向着一条路极目望去, 直到它消失在丛林深处. 但我却选了另外一条路, 它荒草萋萋,十分幽寂; 显得更诱人,更美丽, 虽然在这两条小路上, 都很少留下旅人的足迹. 那天清晨落叶满地, 两条路都未见脚印痕迹. 呵,留下一条路等改日再
Java处理15位身份证变18位蕃薯耀 18位身份证变15位 15位身份证变18位身份证转换
15位身份证变18位，18位身份证变15位 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 201
SpringMVC4零配置--应用上下文配置【AppConfig】 hanqunfeng springmvc4
从spring3.0开始，Spring将JavaConfig整合到核心模块，普通的POJO只需要标注@Configuration注解，就可以成为spring配置类，并通过在方法上标注@Bean注解的方式注入bean。 Xml配置和Java类配置对比如下： applicationContext-AppConfig.xml <!-- 激活自动代理功能参看：
Android中webview跟JAVASCRIPT中的交互 jackyrong JavaScript html android 脚本
在android的应用程序中,可以直接调用webview中的javascript代码,而webview中的javascript代码,也可以去调用ANDROID应用程序(也就是JAVA部分的代码).下面举例说明之: 1 JAVASCRIPT脚本调用android程序要在webview中,调用addJavascriptInterface(OBJ,int
8个最佳Web开发资源推荐 lampcy 编程 Web 程序员
Web开发对程序员来说是一项较为复杂的工作，程序员需要快速地满足用户需求。如今很多的在线资源可以给程序员提供帮助，比如指导手册、在线课程和一些参考资料，而且这些资源基本都是免费和适合初学者的。无论你是需要选择一门新的编程语言，或是了解最新的标准，还是需要从其他地方找到一些灵感，我们这里为你整理了一些很好的Web开发资源，帮助你更成功地进行Web开发。这里列出10个最佳Web开发资源，它们都是受
架构师之面试------jdk的hashMap实现 nannan408 HashMap
1.前言。如题。 2.详述。 (1)hashMap算法就是数组链表。数组存放的元素是键值对。jdk通过移位算法（其实也就是简单的加乘算法），如下代码来生成数组下标(生成后indexFor一下就成下标了）。 static int hash(int h) { h ^= (h >>> 20) ^ (h >>>
html禁止清除input文本输入缓存 Rainbow702 html 缓存 input 输入框 change
多数浏览器默认会缓存input的值，只有使用ctl+F5强制刷新的才可以清除缓存记录。如果不想让浏览器缓存input的值，有2种方法：方法一：在不想使用缓存的input中添加 autocomplete="off"; <input type="text" autocomplete="off" n
POJO和JavaBean的区别和联系 tjmljw POJO java beans
POJO 和JavaBean是我们常见的两个关键字，一般容易混淆，POJO全称是Plain Ordinary Java Object / Pure Old Java Object，中文可以翻译成：普通Java类，具有一部分getter/setter方法的那种类就可以称作POJO，但是JavaBean则比 POJO复杂很多， Java Bean 是可复用的组件，对 Java Bean 并没有严格的规
java中单例的五种写法 liuxiaoling java 单例
/** * 单例模式的五种写法： * 1、懒汉 * 2、恶汉 * 3、静态内部类 * 4、枚举 * 5、双重校验锁 */ /** * 五、双重校验锁，在当前的内存模型中无效 */ class LockSingleton { private volatile static LockSingleton singleton; pri

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他