爱不到要偷

MySQL系列教程（五）

MyCAT

MyCat是基于阿里开源的Cobar产品而研发，Cobar的稳定性、可靠性、优秀的架构和性能以及众多成熟的使用案例使得MYCAT一开始就拥有一个很好的起点，站在巨人的肩膀上，我们能看到更远。业界优秀的开源项目和创新思路被广泛融入到MYCAT的基因中，使得MYCAT在很多方面都领先于目前其他一些同类的开源项目，甚至超越某些商业产品。

MYCAT背后有一支强大的技术团队，其参与者都是5年以上资深软件工程师、架构师、DBA等，优秀的技术团队保证了MYCAT的产品质量。
MYCAT并不依托于任何一个商业公司，因此不像某些开源项目，将一些重要的特性封闭在其商业产品中，使得开源项目成了一个摆设。
因此，MyCat你可以认为是从Amoeba->Cobar一路过来的最终版升级者。
由于MyCat和Corba都是Amoeba框架上发展而来的，如果一个具有Amoeba配置经验的开发者可以几乎不用看任何文档而可以直接使用MyCat来实现mySQL的读写分离更重要的是，基于myCat你可以实现数据的垂直和水平切割，它使得了mySQL据有了真正的“集群”的能力，并为去IOE做好了最终的准备。

myCAT开源项目维护很频繁，目前最新版已经到了1.5 Release(23天前刚维护过)。因此它的维护性、稳定性是得到了保证的。同时myCat的文档极其丰富，参于开发的人员又很多，所以它可以应付很多在以往的Amoeba以及Corba上未能解决的问题，它是一个可以真正被应用在生产环境上的数据库中间件。在下面的章节我们将使用myCat来实现mySQL的读写分离和垂直水平折分的具体案例。

myCat介绍

什么是MyCAT?简单的说，MyCAT就是：

一个彻底开源的，面向企业应用开发的“大数据库集群” 支持事务、ACID、可以替代Mysql的加强版数据库
一个可以视为“Mysql”集群的企业级数据库，用来替代昂贵的Oracle集群
一个融合内存缓存技术、Nosql技术、HDFS大数据的新型SQL Server
结合传统数据库和新型分布式数据仓库的新一代企业级数据库产品
一个新颖的数据库中间件产品

目标

低成本的将现有的单机数据库和应用平滑迁移到“云”端，解决数据存储和业务规模迅速增长情况下的数据瓶颈问题。
关键特性
支持 SQL 92标准支持Mysql集群，可以作为Proxy使用支持JDBC连接ORACLE、DB2、SQL Server，将其模拟为MySQL Server使用支持galera for mysql集群，percona-cluster或者mariadb cluster，提供高可用性数据分片集群，自动故障切换，高可用性，支持读写分离，支持Mysql双主多从，以及一主多从的模式，支持全局表，数据自动分片到多个节点，用于高效表关联查询，支持独有的基于E-R 关系的分片策略，实现了高效的表关联查询多平台支持，部署和实施简单。

优势

基于阿里开源的Cobar产品而研发，Cobar的稳定性、可靠性、优秀的架构和性能，以及众多成熟的使用案例使得MyCAT一开始就拥有一个很好的起点，站在巨人的肩膀上，我们能看到更远。广泛吸取业界优秀的开源项目和创新思路，将其融入到MyCAT的基因中，使得MyCAT在很多方面都领先于目前其他一些同类的开源项目，甚至超越某些商业产品。MyCAT背后有一只强大的技术团队，其参与者都是5年以上资深软件工程师、架构师、DBA等，优秀的技术团队保证了MyCAT的产品质量。 MyCAT并不依托于任何一个商业公司，因此不像某些开源项目，将一些重要的特性封闭在其商业产品中，使得开源项目成了一个摆设。

长期规划

在支持Mysql的基础上，后端增加更多的开源数据库和商业数据库的支持，包括原生支持PosteSQL、FireBird等开源数据库，以及通过JDBC等方式间接支持其他非开源的数据库如Oracle、DB2、SQL Server等实现更为智能的自我调节特性，如自动统计分析SQL，自动创建和调整索引，根据数据表的读写频率，自动优化缓存和备份策略等实现更全面的监控管理功能与HDFS集成，提供SQL命令，将数据库装入HDFS中并能够快速分析集成优秀的开源报表工具，使之具备一定的数据分析的能力。

MyCat架构

安装myCat

通过myCat的官方源码网站获得（https://github.com/MyCATApache/Mycat-download）
本教程中使用的是myCat 8月出的稳定版：Mycat-server-1.5.1-RELEASE-20160810140521。

下载后解压至一个目录如：

配置myCat

myCat的核心配置文件有如下几个：

wrapper.conf – 系统环境配置
server.xml – mycat主配置文件，用于配置mycat对外数据库表、用户名、访问权限等
schema.xml – 用于配置读写分离、水平垂直折分集群
rule.xml – 用于配置数据水平垂直折分规则
router.xml – 配合rule.xml文件使用，当数据折分不符合规则时的走向，类似switch中的default作用

myCat配置读写分离

请看下面这组读写分离，我们就用myCat来配置出这个实例吧。

先在物理上构建主从配置

先按照“Mysql主从配置”把：

192.168.0.101 配成master
192.168.0.102 为 192.168.0.101的slave1
192.168.0.103 为 192.168.0.103的slave3

配置myCat读写分离

修改server.xml文件
打开server.xml文件，你会发觉好大一陀，全部删了吧，改成下面这个配置：




	
	druidparser
     	
	
	
		aaaaaa
		mycat
		false

上述配置定义了这么一件事：

定义了一个可供外部访问的myCat的虚拟数据库
它的端口为8806
schema名为mycat
客户端访问时的用户名为mk，密码为aaaaaa（六个a）

修改schema.xml文件

打开后也是很大的一陀，全删了吧，改成下面这一段：







	

	
                select 1

这里有三处需要注意：

balance="1"与writeType="0" ,switchType=”1”
balance 属性负载均衡类型，目前的取值有 4 种：

balance="0", 不开启读写分离机制，所有读操作都发送到当前可用的writeHost 上。
balance="1"，全部的 readHost 与 stand by writeHost 参与 select 语句的负载均衡，简单的说，当双主双从模式(M1 ->S1 ， M2->S2，并且 M1 与 M2 互为主备)，正常情况下， M2,S1,S2 都参与 select 语句的负载均衡。
balance="2"，所有读操作都随机的在 writeHost、 readhost 上分发。
balance="3"，所有读请求随机的分发到 wiriterHost 对应的 readhost 执行,writerHost 不负担读压力，注意 balance=3 只在 1.4 及其以后版本有， 1.3 没有。

writeType 属性，负载均衡类型，目前的取值有 3 种：

writeType="0", 所有写操作发送到配置的第一个 writeHost，第一个挂了切到还生存的第二个writeHost，重新启动后已切换后的为准，切换记录在配置文件中:dnindex.properties .
writeType="1"，所有写操作都随机的发送到配置的 writeHost。
writeType="2"，没实现。

switchType 属性

-1 表示不自动切换
- 1 默认值，自动切换
2 基于MySQL 主从同步的状态决定是否切换

这里是配置的我们的myCat后台连接的真实的 1主2从服务器以及它们的连接信息。

测试读写分离

1. 我们把mycat启动起来

./mycat start

看wrapper.log文件中的内容

看到mycat已经被启动了。‘

2. 于是我们打开一个mysql客户端使用如下方式连接进入mycat

3. 我们往mycat里插入4条数据

insert into user_info(user_name)values(@@hostname);
insert into user_info(user_name)values(@@hostname);
insert into user_info(user_name)values(@@hostname);
insert into user_info(user_name)values(@@hostname);
commit;

单独连上ymklinux和ymklinux2以及ymklinux3分别作

我们可以看到，由于102,103为101的slaver所以当下面这种模式：

writeHost为192.168.0.101（Master）被写入数据时，而又因为192.168.0.101与102, 103为Master-Slaver的关系因此102与103会自动同步192.168.0.101上被insert进入的数据。如下图演示那样。

考虑多Master的场景

我们回到上棕这个场景来看，为什么説需要多Master？

上述这个应用，有一个非致命的缺点：
即定义的writeHost一旦发生宕机那么其相应对的readHost全部为不可用，换而言之即整个myCat群宕机。

熊掌与鱼兼得法

按照myCat的配置我们可以配置多个writeHost并把writeType这个值设为“0”。
来看writeType=”0”的含议：
writeType="0", 所有写操作发送到配置的第一个 writeHost，第一个挂了切到还生存的第二个writeHost，重新启动后已切换后的为准，切换记录在配置文件中:dnindex.properties .

第一种配置：

于是我们来考虑下面这样的配置：

MyCat群会在Master1发生宕机时自动探寻Master2是否还存活，如果Master2存活那么把数据的读和写全部转向以Master2为代表的读写群。
但是，这也带来了一个问题。
如果此时Master1宕机了，Master2被顶了上来，那么数据全部跑入了Master2群内了。
当：
Master1再次恢复时。。。对于通过myCat客户端调用者来説这一切是秀明的，数据依然还是那些数据，可是此时，再来一次Master2宕机（刚才是Master1宕机），此时myCat会把Master1作为读写群。
于是，客户端再次通过myCat代理调用后，会发觉数据有差异了。

为什么？

因为Master2内的数据和Master1内的数据没有同步。

第二种配置：

于是：

第一步：

我们保留第一种配置即

第二步：

我们把Master1和Master2在物理上做成MySQL的主-备结构，现在来看场景推演。
Master1发生宕机，Master2顶上同时同步了Master1宕机前的数据，对于myCat用户群来説数据everything is ok。
Master1恢复，Master2宕机客户端发觉通过myCat得到的数据（来自于Master1）有异常，为什么？
因为Master2是Master1的Slaver，因此它只会“正向同步Master1的数据”，而不能逆向，因此这种配置和第一种配置完全没有区别。
那么有人説我们把Master1作成Master2的Slaver呢？那无非上第二种情况的场景推演倒一倒而己，还是不能保证任何一点宕机并且在恢复后如何保证数据的强一致性。

第三种配置：

于是，我们想到了一个办法，这个办法来源于Master和Slaver在作配置时my.cnf配置文件中的一个参数，它就是“log-slave-update”。
对于这个参数的解释，mySQL官方是如下解释的：当你的Master同时又是其它Master’的slaver 时，你需要设置此参数。
单从上述描述来看这段语句念起来有些晦涩，我们还是实际来看一个架构图吧。

这种结构被称为“双主结构”或者又称为“互为主备”结构。

Master1是Master2的Slaver；
Master2是Master1的Slaver；
同时，他们又是彼此下面如：Master1拖的S1, S2的Master

基于互为主备结构的myCat群搭建方法

第一步(一定要设log-slave-update)

把Master1作成Master2的Slaver，在Master1配置文件my.cnf中设置log-slave-update。
如果不设会发生下面这种情况
1）通过Master2 insert数据
2）在Master1上查看，数据被从Master2上同步过来了
3）通过Master1下挂载的它本身的几个Slaver连入并进行查看，结果发觉没有同步Master1的数据
4）通过Master1 insert数据
5）在Master2上查看，数据被从Master1上同步过来了
6）通过Master2下挂载的它本身的几个Slaver连入并进行查看，结果发觉没有同步Master2的数据

第二步

把Master2作成Master1的Slaver，在Master2配置文件my.cnf中设置log-slave-update。
对于Master1或者是Master2下再外挂的其本身的s1,s2上不需要再设log-slave-update这个开关了。
如果Master1或者是Master2本身下面还有挂Slaver，请记得此时在其本身的Slaver1上再同步一下它们与Master之间的bin-log。
因为Master一旦作成了另一个Master的Slaver，因此它的bin-log也改变了，你可以直接在其本身的Slaver上使用change master命令。

第三步

在myCat的配件文件中作如下设置：


   show slave status

于是，我们就有了这样的结构了

测试

1）我们连上myCat，对myCat群发送2条insert语句
2）我们单独连上m1, s1, s2, m2查看，发觉各个mysql实例中的数据一致
3）直接在m1上执行service mysqld stop
4）再次连上myCat群，对myCat群再发送2条insert语句
5）我们单独连上m2进行查看，现在m2上为4条数据
6）我们分别连上s1和s2进行查看，发现s1和s2上还是2条数据
7）我们把m1的mysql实例重新启动起来使用命令service mysqld start
8）单独连上m1进行查看，发觉m1此时数据条数据为4条
9）我们分别连上s1和s2进行查看，发现s1和s2上已经从原来的2条数据变为了4条数据

一个高可用的读写分离的集群就此搭建完毕，绝逼完美！

mySQL的垂直与水平折分

在本书系统的《mySQL集群(cluster)》中，我们详细介绍和对比了几种集群的方案，并且在该章节中我详细描述过使用mySQL的分片原则是可以取代集群方案的。并且它比起集群方案来説拥有着更多的优点：

廉价，软件免费并且可以使用廉价PC
可以大规模铺设不受License的束缚
稳定可监控
对于已有应用程序来説，它是透明的

什么是分片

一般的replication具有一个限制，即一旦数据库过于庞大，尤其是当写入过于频繁，很难由一台主机支撑的时候，我们还是会面临到扩展瓶颈。
所谓数据分片(sharding)即是通过某种特定的条件，将我们存放在同一个数据库中的数据分散存放到多个数据库（主机）上面，以达到分散单台设备负载的效果。。数据的切分同时还可以提高系统的总体可用性，因为单台设备Crash之后，只有总体数据的某部分不可用，而不是所有的数据。

数据的切分（Sharding）模式

一种是按照不同的表（或者Schema）来切分到不同的数据库（主机）之上，这种切可以称之为数据的垂直（纵向）切分；另外一种则是根据表中的数据的逻辑关系，将同一个表中的数据按照某种条件拆分到多台数据库（主机）上面，这种切分称之为数据的水平（横向）切分。

垂直切分

一个架构设计较好的应用系统，其总体功能肯定是由很多个功能模块所组成的，而每一个功能模块所需要的数据对应到数据库中就是一个或者多个表。而在架构设计中，各个功能模块相互之间的交互点越统一越少，系统的耦合度就越低，系统各个模块的维护性以及扩展性也就越好。这样的系统，实现数据的垂直切分也就越容易。
一般来说，如果是一个负载相对不是很大的系统，而且表关联又非常的频繁，那可能数据库让步，将几个相关模块合并在一起减少应用程序的工作的方案可以减少较多的工作量，这是一个可行的方案。一个垂直拆分的例子:

1.用户模块表：user,user_profile,user_group,user_photo_album
2.群组讨论表：groups,group_message,group_message_content,top_message
3.相册相关表：photo,photo_album,photo_album_relation,photo_comment
4.事件信息表：event

群组讨论模块和用户模块之间主要存在通过用户或者是群组关系来进行关联。一般关联的时候都会是通过用户的id或者nick_name以及group的id来进行关联，通过模块之间的接口实现不会带来太多麻烦；
相册模块仅仅与用户模块存在通过用户的关联。这两个模块之间的关联基本就有通过用户id关联的内容，简单清晰，接口明确；
事件模块与各个模块可能都有关联，但是都只关注其各个模块中对象的ID信息，同样可以做到很容易分拆。

垂直切分的优点

数据库的拆分简单明了，拆分规则明确；
应用程序模块清晰明确，整合容易；
数据维护方便易行，容易定位；

垂直切分的缺点

部分表关联无法在数据库级别完成，需要在程序中完成；
对于访问极其频繁且数据量超大的表仍然存在性能瓶颈，不一定能满足要求；
事务处理相对更为复杂；
切分达到一定程度之后，扩展性会遇到限制；
过度切分可能会带来系统过渡复杂而难以维护。

水平切分

将某个访问极其频繁的表再按照某个字段的某种规则来分散到多个表之中，每个表中包含一部分数据。
对于上面的例子:所有数据都是和用户关联的，那么我们就可以根据用户来进行水平拆分，将不同用户的数据切分到不同的数据库中。
现在互联网非常火爆的Web2.0类型的网站，基本上大部分数据都能够通过会员用户信息关联上，可能很多核心表都非常适合通过会员ID来进行数据的水平切分。而像论坛社区讨论系统，就更容易切分了，非常容易按照论坛编号来进行数据的水平切分。切分之后基本上不会出现各个库之间的交互。

水平切分的优点

表关联基本能够在数据库端全部完成；
不会存在某些超大型数据量和高负载的表遇到瓶颈的问题；
应用程序端整体架构改动相对较少；
事务处理相对简单；
只要切分规则能够定义好，基本上较难遇到扩展性限制；

水平切分的缺点

切分规则相对更为复杂，很难抽象出一个能够满足整个数据库的切分规则；
后期数据的维护难度有所增加，人为手工定位数据更困难；
应用系统各模块耦合度较高，可能会对后面数据的迁移拆分造成一定的困难。

两种切分结合用

一般来说，我们数据库中的所有表很难通过某一个（或少数几个）字段全部关联起来，所以很难简单的仅仅通过数据的水平切分来解决所有问题。而垂直切分也只能解决部分问题，对于那些负载非常高的系统，即使仅仅只是单个表都无法通过单台数据库主机来承担其负载。我们必须结合“垂直”和“水平”两种切分方式同时使用
每一个应用系统的负载都是一步一步增长上来的，在开始遇到性能瓶颈的时候，大多数架构师和DBA都会选择先进行数据的垂直拆分，因为这样的成本最先，最符合这个时期所追求的最大投入产出比。然而，随着业务的不断扩张，系统负载的持续增长，在系统稳定一段时期之后，经过了垂直拆分之后的数据库集群可能又再一次不堪重负，遇到了性能瓶颈。
如果我们再一次像最开始那样继续细分模块，进行数据的垂直切分，那我们可能在不久的将来，又会遇到现在所面对的同样的问题。而且随着模块的不断的细化，应用系统的架构也会越来越复杂，整个系统很可能会出现失控的局面。
这时候我们就必须要通过数据的水平切分的优势，来解决这里所遇到的问题。而且，我们完全不必要在使用数据水平切分的时候，推倒之前进行数据垂直切分的成果，而是在其基础上利用水平切分的优势来避开垂直切分的弊端，解决系统复杂性不断扩大的问题。而水平拆分的弊端（规则难以统一）也已经被之前的垂直切分解决掉了，让水平拆分可以进行的得心应手。

myCat实现数据分片

在数据切分处理中，特别是水平切分中，中间件最终要的两个处理过程就是数据的切分、数据的聚合。
选择合适的切分规则，至关重要，因为它决定了后续数据聚合的难易程度，甚至可以避免跨库的数据聚合
处理。

myCAT数据分片拆分原则：

避免或减少跨库join。
选择最合适的拆分维度。

Mycat拆分表解决方案：

MYCAT 全局表
ER关系
表拆分

--拆分维度
--主键分片vs 非主键分片

myCAT对于后端多个mySQL的数据折分和折分后的聚合，对于myCAT前端调用来説是透明的。

以实际例子来操作分片

在分片前，我们需要事先了解一个重要的知识点，也算是一个需要引起重视的问题。
A和B互为主从，我们按照userID来实施分片，userID为1，3，5的插入到一台mysql实例，userID为2，4，6的插入到另一个mysql实例中去。然后在mycat前端select时mycat会自动进行聚合，即它会从2个mysql实例中选择数据并合并成1,2,3,4,5,6…这样的数据显示给调用的客户端。

1. 先往A上插入一条数据（id:1 name: tom, gender: m），于是B上也马上会REPLI（同步）一条数据，因此你在A和B上做SELECT查询，都可以看到两边记录一样

2. 往B上插入一条数据（id:2 name: tom, gender: m），于是A上也马上会REPLI一条数据，因此你在A和B上做SELECT查询，都可以看到两边记录一样

3. 使用MYCAT读写分离，A为写，B为读，一切OK

4. 使用MYCAT做水平拆分，拆分规则为（id % 2 case 0 then Server A; case 1 then Server B;），于是，规则开始起效。

当插入id: 2的数据时，它会被insert到A上，接下去由于A和B互为主备，因此B马上会同步一条数据。
接下去再插入一条id:3的数据，由于id为3的数据根据我们预先配置后的规则会被插入到Server B上，然后A马上也会被REPLI一条数据id为3，此时，此时A和B两个MYSQL上就都有了同样的记录集，都为1,2,3，即：

Server A	Server B
1	1
2	2
3	3

所以数据分片等于没用。再来看分片读，读的规则也走上述规则，于是当你通过mycat作为mysql proxy时你会发生这样的场景：

Mysql –u root –p aaaaaa –P8066 –h 192.168.0.1

Select * from person
此时你得到的结果集为：

1
2
3
1
2
3
或者你的ReadServer始终为一台，那你会得到正确的1，2，3这样的结果集。但是，原先所需要的数据的sharding功能。。。其实没有做到。

myCAT分片前置条件（极其重要）

因此：

如果要考虑后期的水平和垂直折分，被折分的数据库不可以在其本身已经做了主从结构，而是需要把这个主从结构交由mycat来做。

实际分片演示

我们只需要修改rule.xml这个文件即可实现myCat的数据分片定义了。
但是按照前面小节的重要提示，在做分片前，我们一定要让我们参于分片规则的mySQL实例保持独立运行状态，即多个mySQL实例间不要做任何的“主备”结构。

实验前准备

我们拿192.168.0.101与192.168.0.102两台机器来做分片实验

在192.168.0.101上禁用binlog，关闭master slaver的关联，同时断开与原有192.168.0.104的master slaver关联。

别忘了把“log-slave-update”也注释掉。

重启后登录192.168.0.101，输入以下命令

stop slave;
change master to master_host=' ';

在192.168.0.104上禁用binlog，关闭master slaver的关联，同时断开与原有192.168.0.101的master slaver关联。

别忘了把“log-slave-update”也注释掉。

重启后登录192.168.0.104，输入以下命令

stop slave;
change master to master_host=' ';

配置数据分片

我们有一张T_PERSON表，结构如下：

CREATE TABLE `t_person` (
  `person_id` int(11) NOT NULL,
  `person_name` varchar(20) DEFAULT NULL,
  PRIMARY KEY (`person_id`)
) ENGINE=MyISAM DEFAULT CHARSET=latin1;
show slave status;

数据分片按照PERSON_ID的奇偶来分。

配置mycat的rule.xml文件




	
		
			person_id
			mod-long
		
	
		
		
		2

通过配置可以看到我们按照person_id会把该表数据分在2个物理库内，分片数据包括通过mycat的mysql client端insert时自动分片以及select时自动聚合。

应用分片

rule.xml文件定义后还需要应用它里面的规则，才能够最终让数据分片在mycat中起效，为此，我们更改schema.xml文件，増加如下一段配置：


		 


    select 1
    


    select 1
    

 
   
接着我们更改server.xml文件，増加如下一段配置： 
   
 
    
   
 
    
   	
		aaaaaa
		split
		false
	
 
   
 
   
测试分片 
    
   我们使用split/aaaaaa用户连上mycat实例
 
   
 
   
 
   
 
   我们插入5条数据
 
   
 
    
   insert into t_person(person_id,person_name)values('1','michael');
insert into t_person(person_id,person_name)values('2','tom');
insert into t_person(person_id,person_name)values('3','tonny');
insert into t_person(person_id,person_name)values('4','marry');
insert into t_person(person_id,person_name)values('5','jack');
commit;
 
   
然后我们接着做一次查询 
   
 
    
   
 
   
 
   
 
   连入192.168.0.101上进行查看，我们可以得到2条数据，person_id为偶数倍。
 
   
 
   
 
   连入192.168.0.104上进行查看，我们可以得到3条数据，person_id为奇数倍。
 
   
 
   
 
   
 
   分片成功！！！
 
   
 
   myCAT的分片功能相当的强大，完全可以应付亿万级的数据，如果再结合适当的读写分离机制是完全可以让你的网站飞起来的。
myCAT的分片规则还有很多，文后的附件中会给出一个myCAT分片规则大全。
 
   
 
   附件 myCAT分片规则大全 
   常用的根据主键或非主键的分片规则配置：
 
   
 
   1. 枚举法 
   
 
   通过在配置文件中配置可能的枚举id，自己配置分片，使用规则：'
 
   
 
    
   
    
      user_id
      hash-int
    
  

    partition-hash-int.txt
    0
    0
  

partition-hash-int.txt 配置：
10000=0
10010=1
DEFAULT_NODE=1
 
   
上面columns 标识将要分片的表字段，algorithm 分片函数， 
   
其中分片函数配置中，mapFile标识配置文件名称，type默认值为0，0表示Integer，非零表示String， 
   
所有的节点配置都是从0开始，及0代表节点1 
   
 
    
   
 
    
   /**
*  defaultNode 默认节点:小于0表示不设置默认节点，大于等于0表示设置默认节点
* 
默认节点的作用：枚举分片时，如果碰到不识别的枚举值，就让它路由到默认节点
*                如果不配置默认节点（defaultNode值小于0表示不配置默认节点），碰到
*                不识别的枚举值就会报错，
*                like this：can't find datanode for sharding column:column_name val:ffffffff    
*/
 
   
 
   2. 固定分片hash算法 
    
    
   
    
      user_id
      func1
    


  
    2,1
    256,512
  
 
   
 
   
 
    
   配置说明：
上面columns 标识将要分片的表字段，algorithm 分片函数，
partitionCount 分片个数列表，partitionLength 分片范围列表
分区长度:默认为最大2^n=1024 ,即最大支持1024分区
约束 :
count,length两个数组的长度必须是一致的。
1024 = sum((count[i]*length[i])). count和length两个向量的点积恒等于1024
用法例子：
本例的分区策略：希望将数据水平分成3份，前两份各占25%，第三份占50%。（故本例非均匀分区）
 
   
 
    
           // |<---------------------1024------------------------>|
        // |<----256--->|<----256--->|<----------512---------->|
        // | partition0 | partition1 | partition2 |
        // | 共2份,故count[0]=2 | 共1份，故count[1]=1 |
        int[] count = new int[] { 2, 1 };
        int[] length = new int[] { 256, 512 };
        PartitionUtil pu = new PartitionUtil(count, length);

        // 下面代码演示分别以offerId字段或memberId字段根据上述分区策略拆分的分配结果
        int DEFAULT_STR_HEAD_LEN = 8; // cobar默认会配置为此值
        long offerId = 12345;
        String memberId = "qiushuo";

        // 若根据offerId分配，partNo1将等于0，即按照上述分区策略，offerId为12345时将会被分配到partition0中
        int partNo1 = pu.partition(offerId);

        // 若根据memberId分配，partNo2将等于2，即按照上述分区策略，memberId为qiushuo时将会被分到partition2中
        int partNo2 = pu.partition(memberId, 0, DEFAULT_STR_HEAD_LEN);
 
   
如果需要平均分配设置：平均分为4分片，partitionCount*partitionLength=1024 
   
 
    
   
 
   
 
    
   
    4
    256

 
   
 
   3. 范围约定 
    
    
   
    
      user_id
      rang-long
    
  

    autopartition-long.txt
  
# range start-end ,data node index
# K=1000,M=10000.
0-500M=0
500M-1000M=1
1000M-1500M=2
或
0-10000000=0
10000001-20000000=1
 
   
配置说明： 
   
上面columns 标识将要分片的表字段，algorithm 分片函数， 
   
rang-long 函数中mapFile代表配置文件路径 
   
所有的节点配置都是从0开始，及0代表节点1，此配置非常简单，即预先制定可能的id范围到某个分片 
   
 
    
   
 
   4. 求模法 
    
   
    
      user_id
      mod-long
    
  
  
   
    3
   
 
   
配置说明： 
   
上面columns 标识将要分片的表字段，algorithm 分片函数， 
   
此种配置非常明确即根据id进行十进制求模预算，相比方式1，此种在批量插入时需要切换数据源，id不连续 
   
 
    
   
 
   5. 日期列分区法 
   
 
    
   
      
        create_time
        sharding-by-date
      
     

    yyyy-MM-dd
    2014-01-01
    10

配置说明： 
   
上面columns 标识将要分片的表字段，algorithm 分片函数， 
   
配置中配置了开始日期，分区天数，即默认从开始日期算起，分隔10天一个分区 
   
 
   
 
   
 
   
 
   
Assert.assertEquals(true, 0 == partition.calculate("2014-01-01")); 
   
Assert.assertEquals(true, 0 == partition.calculate("2014-01-10")); 
   
Assert.assertEquals(true, 1 == partition.calculate("2014-01-11")); 
   
Assert.assertEquals(true, 12 == partition.calculate("2014-05-01")); 
    
   
 
   6. 通配取模 
   
 
   
      
        user_id
        sharding-by-pattern
      
   

    256
    2
    partition-pattern.txt


 
   
partition-pattern.txt  
   
# id partition range start-end ,data node index 
   
###### first host configuration 
   
1-32=0 
   
33-64=1 
   
65-96=2 
   
97-128=3 
   
######## second host configuration 
   
129-160=4 
   
161-192=5 
   
193-224=6 
   
225-256=7 
   
0-0=7 
   
配置说明： 
   
上面columns 标识将要分片的表字段，algorithm 分片函数，patternValue 即求模基数，defaoultNode 默认节点，如果配置了默认，则不会按照求模运算 
   
mapFile 配置文件路径 
   
配置文件中，1-32 即代表id%256后分布的范围，如果在1-32则在分区1，其他类推，如果id非数据，则会分配在defaoultNode 默认节点 
   
 
    
   
 
   String idVal = "0";
Assert.assertEquals(true, 7 == autoPartition.calculate(idVal));
idVal = "45a";
Assert.assertEquals(true, 2 == autoPartition.calculate(idVal));
 
   
 
   7.  ASCII码求模通配 
    
   
      
        user_id
        sharding-by-prefixpattern
      
   

    256
    5
    partition-pattern.txt

  

partition-pattern.txt

# range start-end ,data node index
# ASCII
# 48-57=0-9
# 64、65-90=@、A-Z
# 97-122=a-z
###### first host configuration
1-4=0
5-8=1
9-12=2
13-16=3
###### second host configuration
17-20=4
21-24=5
25-28=6
29-32=7
0-0=7
配置说明：
上面columns 标识将要分片的表字段，algorithm 分片函数，patternValue 即求模基数，prefixLength ASCII 截取的位数
mapFile 配置文件路径
配置文件中，1-32 即代表id%256后分布的范围，如果在1-32则在分区1，其他类推 

此种方式类似方式6只不过采取的是将列种获取前prefixLength位列所有ASCII码的和进行求模sum%patternValue ,获取的值，在通配范围内的
即 分片数，
/**
* ASCII编码：
* 48-57=0-9阿拉伯数字
* 64、65-90=@、A-Z
* 97-122=a-z
*
*/
如 

String idVal="gf89f9a";
Assert.assertEquals(true, 0==autoPartition.calculate(idVal));

idVal="8df99a";
Assert.assertEquals(true, 4==autoPartition.calculate(idVal));

idVal="8dhdf99a";
Assert.assertEquals(true, 3==autoPartition.calculate(idVal));
 
   
 
   8. 编程指定 
    
   
 
    
   
      
        user_id
        sharding-by-substring
      
   

    0 
    2
    8
    0
  
配置说明：
上面columns 标识将要分片的表字段，algorithm 分片函数 
此方法为直接根据字符子串（必须是数字）计算分区号（由应用传递参数，显式指定分区号）。
例如id=05-100000002
在此配置中代表根据id中从startIndex=0，开始，截取siz=2位数字即05，05就是获取的分区，如果没传默认分配到defaultPartition
 
   
 
   9. 字符串拆分hash解析 
    
    
   
      
        user_id
        sharding-by-stringhash
      
   

    512 
    2
    0:2
  
配置说明：
上面columns 标识将要分片的表字段，algorithm 分片函数 
函数中length代表字符串hash求模基数，count分区数，hashSlice hash预算位

即根据子字符串 hash运算

	

hashSlice ： 0 means str.length(), -1 means str.length()-1

/**
     * "2" -> (0,2)

     * "1:2" -> (1,2)

     * "1:" -> (1,0)

     * "-1:" -> (-1,0)

     * ":-1" -> (0,-1)

     * ":" -> (0,0)

     */
 
   
例子： 
   
 
    
   
 
    
   String idVal=null;
 rule.setPartitionLength("512");
 rule.setPartitionCount("2");
 rule.init();
 rule.setHashSlice("0:2");
//		idVal = "0";
//		Assert.assertEquals(true, 0 == rule.calculate(idVal));
//		idVal = "45a";
//		Assert.assertEquals(true, 1 == rule.calculate(idVal));

 
 
 //last 4
 rule = new PartitionByString();
 rule.setPartitionLength("512");
 rule.setPartitionCount("2");
 rule.init();
 //last 4 characters
 rule.setHashSlice("-4:0");
 idVal = "aaaabbb0000";
 Assert.assertEquals(true, 0 == rule.calculate(idVal));
 idVal = "aaaabbb2359";
 Assert.assertEquals(true, 0 == rule.calculate(idVal));
 
   
 
   10. 一致性hash 
    
   
 
    
   
      
        user_id
        murmur
      
   

      0
      2
      160
      
      
  
 
   
 
   
 
    
   一致性hash预算有效解决了分布式数据的扩容问题，前1-9中id规则都多少存在数据扩容难题，而10规则解决了数据扩容难点
关于一致性hash详细：
 
   
 
   一致性哈希算法在1997年由麻省理工学院提出的一种分布式哈希（DHT）实现算法，设计目标是为了解决因特网中的热点(Hot spot)问题，初衷和CARP十分类似。一致性哈希修正了CARP使用的简 单哈希算法带来的问题，使得分布式哈希（DHT）可以在P2P环境中真正得到应用。 
一致性hash算法提出了在动态变化的Cache环境中，判定哈希算法好坏的四个定义：
1、平衡性(Balance)：平衡性是指哈希的结果能够尽可能分布到所有的缓冲中去，这样可以使得所有的缓冲空间都得到利用。很多哈希算法都能够满足这一条件。
2、单调性(Monotonicity)：单调性是指如果已经有一些内容通过哈希分派到了相应的缓冲中，又有新的缓冲加入到系统中。哈希的结果应能够保证原有已分配的内容可以被映射到原有的或者新的缓冲中去，而不会被映射到旧的缓冲集合中的其他缓冲区。 
3、分散性(Spread)：在分布式环境中，终端有可能看不到所有的缓冲，而是只能看到其中的一部分。当终端希望通过哈希过程将内容映射到缓冲上时，由于不同终端所见的缓冲范围有可能不同，从而导致哈希的结果不一致，最终的结果是相同的内容被不同的终端映射到不同的缓冲区中。这种情况显然是应该避免的，因为它导致相同内容被存储到不同缓冲中去，降低了系统存储的效率。分散性的定义就是上述情况发生的严重程度。好的哈希算法应能够尽量避免不一致的情况发生，也就是尽量降低分散性。 
4、负载(Load)：负载问题实际上是从另一个角度看待分散性问题。既然不同的终端可能将相同的内容映射到不同的缓冲区中，那么对于一个特定的缓冲区而言，也可能被不同的用户映射为不同 的内容。与分散性一样，这种情况也是应当避免的，因此好的哈希算法应能够尽量降低缓冲的负荷。
在分布式集群中，对机器的添加删除，或者机器故障后自动脱离集群这些操作是分布式集群管理最基本的功能。如果采用常用的hash(object)%N算法，那么在有机器添加或者删除后，很多原有的数据就无法找到了，这样严重的违反了单调性原则。接下来主要讲解一下一致性哈希算法是如何设计的：
环形Hash空间
按照常用的hash算法来将对应的key哈希到一个具有2^32次方个桶的空间中，即0~(2^32)-1的数字空间中。现在我们可以将这些数字头尾相连，想象成一个闭合的环形。如下图
 
   
 
   
 
   
 
   把数据通过一定的hash算法处理后映射到环上
现在我们将object1、object2、object3、object4四个对象通过特定的Hash函数计算出对
应的key值，然后散列到Hash环上。如下图：
    Hash(object1) = key1；
    Hash(object2) = key2；
    Hash(object3) = key3；
    Hash(object4) = key4；
 
   
 
   
 
   将机器通过hash算法映射到环上
在采用一致性哈希算法的分布式集群中将新的机器加入，其原理是通过使用与对象存储一样的Hash算法将机器也映射到环中（一般情况下对机器的hash计算是采用机器的IP或者机器唯一的别名作为输入值），然后以顺时针的方向计算，将所有对象存储到离自己最近的机器中。
假设现在有NODE1，NODE2，NODE3三台机器，通过Hash算法得到对应的KEY值，映射到环中，其示意图如下：
Hash(NODE1) = KEY1;
Hash(NODE2) = KEY2;
Hash(NODE3) = KEY3;
 
   
 
   
 
   通过上图可以看出对象与机器处于同一哈希空间中，这样按顺时针转动object1存储到了NODE1中，object3存储到了NODE2中，object2、object4存储到了NODE3中。在这样的部署环境中，hash环是不会变更的，因此，通过算出对象的hash值就能快速的定位到对应的机器中，这样就能找到对象真正的存储位置了。


 
   机器的删除与添加
普通hash求余算法最为不妥的地方就是在有机器的添加或者删除之后会照成大量的对象存储位置失效，这样就大大的不满足单调性了。下面来分析一下一致性哈希算法是如何处理的。
1. 节点（机器）的删除
以上面的分布为例，如果NODE2出现故障被删除了，那么按照顺时针迁移的方法，object3将会被迁移到NODE3中，这样仅仅是object3的映射位置发生了变化，其它的对象没有任何的改动。如下图：
                                                   2. 节点（机器）的添加 
如果往集群中添加一个新的节点NODE4，通过对应的哈希算法得到KEY4，并映射到环中，如下图：
 
   
 
   
 
   
 
   通过按顺时针迁移的规则，那么object2被迁移到了NODE4中，其它对象还保持这原有的存储位置。通过对节点的添加和删除的分析，一致性哈希算法在保持了单调性的同时，还是数据的迁移达到了最小，这样的算法对分布式集群来说是非常合适的，避免了大量数据迁移，减小了服务器的的压力。


平衡性
根据上面的图解分析，一致性哈希算法满足了单调性和负载均衡的特性以及一般hash算法的分散性，但这还并不能当做其被广泛应用的原由，因为还缺少了平衡性。下面将分析一致性哈希算法是如何满足平衡性的。hash算法是不保证平衡的，如上面只部署了NODE1和NODE3的情况（NODE2被删除的图），object1存储到了NODE1中，而object2、object3、object4都存储到了NODE3中，这样就照成了非常不平衡的状态。在一致性哈希算法中，为了尽可能的满足平衡性，其引入了虚拟节点。
    ——“虚拟节点”（ virtual node ）是实际节点（机器）在 hash 空间的复制品（ replica ），一实际个节点（机器）对应了若干个“虚拟节点”，这个对应个数也成为“复制个数”，“虚拟节点”在 hash 空间中以hash值排列。
以上面只部署了NODE1和NODE3的情况（NODE2被删除的图）为例，之前的对象在机器上的分布很不均衡，现在我们以2个副本（复制个数）为例，这样整个hash环中就存在了4个虚拟节点，最后对象映射的关系图如下： 
   
 
   
 
   
 
   根据上图可知对象的映射关系：object1->NODE1-1，object2->NODE1-2，object3->NODE3-2，object4->NODE3-1。通过虚拟节点的引入，对象的分布就比较均衡了。那么在实际操作中，正真的对象查询是如何工作的呢？对象从hash到虚拟节点到实际节点的转换如下图：
 
   
 
   
 
   
 
    “虚拟节点”的hash计算可以采用对应节点的IP地址加数字后缀的方式。例如假设NODE1的IP地址为192.168.1.100。引入“虚拟节点”前，计算 cache A 的 hash 值：
Hash(“192.168.1.100”);
引入“虚拟节点”后，计算“虚拟节”点NODE1-1和NODE1-2的hash值：
Hash(“192.168.1.100#1”); // NODE1-1
Hash(“192.168.1.100#2”); // NODE1-2
以上所有规则每种都有特定使用场景，可以选择性使用!
 
   
 
   
 
   
  转载于:https://www.cnblogs.com/aiwz/p/6154581.html 
  

                            
                        
                    
                    
                    
                    
                    
                    
                
                
                    
                        
                        
                             
                        
                        
                        
                            
                        
                        
                        
                            
                        
                    
                
            
        
    
    
        你可能感兴趣的:(MySQL系列教程（五）)
        
            
                
                    Python（28）Python循环语句指南：从语法糖到CPython字节码的底层探秘
                        一个天蝎座白勺程序猿
Python爬虫入门到高阶实战python开发语言
                        目录引言一、推导式家族全解析1.1基础语法对比1.2性能对比测试二、CPython实现揭秘2.1字节码层面的秘密2.2临时变量机制三、高级特性实现3.1嵌套推导式优化3.2条件表达式处理四、性能优化指南4.1内存使用对比4.2执行时间优化技巧五、最佳实践建议六、总结Python爬虫相关文章（推荐）引言在Python编程中，循环语句是控制流程的核心工具。传统for循环虽然直观，但在处理大数据时往往面
                    
                    Python基础——变量和数据类型
                        全端工程师
python基础python开发语言
                        Python基础——变量和数据类型前言一、什么是变量1.1为什么需要变量1.2变量的基本概念1.3变量的命名规则二、数据类型2.1什么是数据类型2.2使用`type()`函数2.3使用不同的数据类型三、类型转换3.1类型转换的基本概念3.2类型转换函数(显示类型转换)3.3隐式类型转换3.4类型转换的注意事项四、变量的使用五、总结前言今天我们开始学习Python编程的基础——变量和数据类型。这些概
                    
                    mysql 内积_Python如何计算两行数据内积
                        

                        Python计算两行数据内积的方法：首先使用【mat()】方法；然后将每组数据分别放到方法里转换为矩阵；再使两矩阵相乘；最后进行转换即可。>>>a=mat([[1],[2],[3]]);>>>b=mat([[0],[2],[3]]);>>>amatrix([[1],[2],[3]])>>>bmatrix([[0],[2],[3]])>>>a.T*bmatrix([[13]])上面为两个列向量的内积
                    
                    MySQL · 特性分析 ·MySQL 5.7新特性系列
                        挑战者666888
mysqlmysqladb后端
                        文章目录1.背景2.我们先大致看下InnoDB的undo在不同的版本上的一些演进:3.MySQL5.7的版本上3.1接下来我们详细看下5.7的InnoDBundo的管理：3.1.1undo表空间创建3.1.2rollbacksegment的分配如下：3.1.3InnoDBundo的空间管理简图如下：undo空间管理1.rsegslot2.rsegheader3.undosegmentheaderu
                    
                    【MySQL基础】MVCC多版本并发控制
                        scj1022
MySQLmysql
                        文章目录MVCC-多版本并发控制一、MVCC概述1、三种并发场景2、当前读&快照读3、MVCC的作用4、结合MVCC处理并发问题二、MVCC实现原理1、隐式字段2、回滚日志UndoLog3、一致性视图ReadView1）什么时候生成？2）可见性判断3）可见性算法（属性）4）可见性算法（实现）5）可见性算法（小结）4、举例说明（版本链）三、MVCC与可重复读RR1、事务的启动时机2、事务A读取流程3
                    
                    Spring Boot多数据源实现方案深度对比：优缺点分析与实战指南
                        xiaoyu❅
java#springbootspringboot后端java
                        目录一、为什么需要多数据源？二、5大主流实现方案对比三、方案实现详解方案1：手动配置多DataSource（基础版）方案2：AbstractRoutingDataSource（动态路由）方案3：MyBatis-Plus多数据源（推荐）方案4：JPA多数据源配置方案5：ShardingSphere（企业级方案）四、事务管理解决方案1.分布式事务（XA协议）2.BASE柔性事务五、性能优化策略1.连接
                    
                    BLE HID 低功耗设计：功耗分析、影响因素与优化策略
                        34号树洞
#蓝牙专栏物联网专栏物联网BLEHID低功耗设计
                        目录一、BLEHID功耗组成二、关键功耗参数指标三、常见芯片功耗参考四、功耗优化建议1.广播阶段优化2.连接参数优化3.空闲与唤醒机制4.HID报文设计优化5.LED/指示器功耗优化五、BLEHID功耗估算案例（典型BLE键盘）六、实用工具推荐在BLEHID（BluetoothLowEnergyHumanInterfaceDevice）设备设计中，功耗是至关重要的技术指标，特别是电池供电的设备如：
                    
                    深入剖析MYSQL MVCC多版本并发控制+ReadView视图快照规避幻读问题
                        LiRuiJie
MySQLmysql数据库
                        一、剖析MVCC底层如何实现1.MVCC的目标在高并发场景下，MVCC实现：能力描述读写并发读不会阻塞写，写也不会阻塞读（大多数SELECT是非阻塞的）一致性视图每个事务看到的数据是其开始时的一致状态高性能避免频繁加锁，减少锁竞争开销2.InnoDB如何实现MVCCInnoDB使用以下两部分实现MVCC：UndoLog（撤销日志）：用于保存数据变更前的旧版本ReadView（读视图）：用于判断当前
                    
                    对称加密及AES加密算法
                        一只牛_007
安全加密解密非对称
                        目录一、对称加密 1、什么是对称加密？ 2、对称加密的工作过程 3、对称加密的优点 4、对称加密的两大不足二、AES加密算法 1、什么是AES加密算法及AES加密算法的形成过程 2、AES的加密流程（要理解AES的加密流程，会涉及到AES的五个关键词：分组密码体制、Padding、初始向量IV、密钥、四种加密模式） 3、AES的加密原理（要理解AES的加密原理，会涉及到AES的四个关键词：密钥扩展
                    
                    小程序的「双线程模型」
                        TE-茶叶蛋
小程序开发小程序
                        文章目录前言一、双线程模型结构概览二、逻辑层（AppService）示例：️三、渲染层（WebView）示例（WXML）：四、通信机制（Native层桥接）⚙️通信方式：底层实现方式：五、为什么这么设计？缺点与限制总结结构图✅实践建议扩展小程序双线程模型的**进阶架构扩展**一、支持WebWorker的多线程能力（逻辑层并发能力增强）✅使用示例：⚠️注意：二、沙箱机制强化（增强渲染安全）三、小程序
                    
                    MySQL EXPLAIN 关键字详解
                        烟沙九洲
数据库mysql数据库
                        EXPLAIN是用于分析SQL查询的执行计划。它能揭示MySQL如何执行查询（如是否使用索引、表连接顺序等），帮助我们定位性能瓶颈。基本用法EXPLAINSELECT*FROMusersWHEREage>25;输出列列名说明关键值示例id查询标识符（相同id表示同组查询，执行顺序从上到下；不同id值越大优先级越高）1（主查询）、2（子查询）select_type查询类型SIMPLE（无子查询）、P
                    
                    Linux Docker 防火墙设置 放通 MySQL(3306) Redis(6379) 端口
                        

                        LinuxDocker防火墙设置放通MySQL(3306)Redis(6379)端口，使用firewalld防火墙或iptables，因此尝试重新启动firewalld服务，添加防火墙规则，并检查防火墙状态。以下是详细步骤：1.启动firewalld服务首先启动firewalld服务：sudosystemctlstartfirewalldsudosystemctlenablefirewalld2.
                    
                    MySQL索引失效场景
                        烟沙九洲
数据库mysql数据库
                        MySQL索引优化是提升查询性能的关键手段之一，但有时使用不当会导致索引失效。今天我们一起来看看哪些情况下索引会失效。1、联合索引没有使用最左前缀失效示例：联合索引(a,b,c)SELECT*FROMtableWHEREb=1ANDc=2;--❌索引失效正确写法：WHEREa=?--✅WHEREa=?ANDb=?--✅WHEREa=?ANDb=?ANDc=?--✅--ps：MySQL对=条件的列，
                    
                    如何在Ubuntu上检查MySQL是否启动并放开3306端口
                        好奇的菜鸟
服务器数据库ubuntumysqladb
                        在使用Ubuntu系统时，MySQL数据库是许多开发人员和系统管理员的常用工具。本文将详细介绍如何在Ubuntu上检查MySQL是否启动，以及如何放开MySQL默认的3306端口，以便允许外部访问。一、检查MySQL是否启动在进行任何操作之前，首先需要确认MySQL服务是否已经启动。以下是几种检查MySQL是否启动的方法：1.使用systemctl命令systemctl是Linux系统中用于管理服
                    
                    并发编程原理与实战（七）详解并发协同利器CyclicBarrier
                        帧栈
Java并发编程java
                        并发编程原理与实战（一）精准理解线程的创建和停止并发编程原理与实战（二）Thread类关键API详解并发编程原理与实战（三）一步步剖析线程返回值并发编程原理与实战（四）经典并发协同方式synchronized与wait+notify详解并发编程原理与实战（五）经典并发协同方式伪唤醒与加锁失效原理揭秘并发编程原理与实战（六）详解并发协同利器CountDownLatch上一篇文章讲解了CountDow
                    
                    Vue2中的keep-alive：组件状态缓存与性能优化实战指南
                        编程随想▿
Vue前端javascript开发语言vue.js
                        目录一、什么是keep-alive？与普通组件切换的对比二、核心用法详解1.基础用法：动态组件缓存2.路由视图缓存3.生命周期钩子三、进阶配置与优化1.精准控制缓存组件（1）include/exclude属性（2）max属性限制缓存数量四、实战场景与案例1.表单数据保存2.标签页切换优化3.动态控制缓存五、避坑指南1.组件必须定义name属性2.避免过度缓存3.相同路由不同参数导致缓存失效六、性能
                    
                    大数据分析技术的学习路径，不是绝对的，仅供参考
                        水云桐程序员
学习大数据数据分析学习方法
                        阶段一：基础筑基（1-3个月）1.编程语言：Python：掌握基础语法、数据结构、流程控制、函数、面向对象编程、常用库（NumPy,Pandas）。SQL：精通SELECT语句（过滤、排序、分组、聚合、连接）、DDL/DML基础。理解关系型数据库概念（表、主键、外键、索引）。MySQL或PostgreSQL是很好的起点。Java/Scala：深入理解Hadoop/Spark等框架会更有优势。初学者
                    
                    webpack基础教程
                        

                        webpack基础教程一webpack五大核心二webpack处理css资源三webpack处理less、scss、sass、styl资源四webpack-module的详细配置五webpack资源模块六webpack加载本地csv与XML文件七webpack打包babel资源八webpack打包HTML资源一webpack五大核心webpack的概念：就是个打包工具，例如把vue代码打包成浏览器
                    
                    webpack基础
                        ᥬ 小月亮
服务器打包配置webpack前端
                        一、webpack的基础：官网：https://webpack.js.org/中文文档：https://www.webpackjs.com/concepts/1、定义：webpack是静态资源的打包工具2、webpack的功能：①开发模式：仅能编译JS中的ESModule语法②生产模式：编译JS中的ESModule语法，并且压缩js代码3、webpack的五大核心：①entry：（入口文件）指示w
                    
                    C语言学习——四则运算，关系运算，逻辑运算与位运算
                        许白掰
C语言学习学习c语言开发语言
                        目录前言编辑一、四则运算1.四则运算的概念2.注意事项3.小结二、关系运算1.关系运算的概念三、逻辑运算1.逻辑运算的概念2.逻辑运算中的短路法则（1）对于&&运算（2）对于||运算3.取非运算（!）四、位运算1.位运算的概念2.深度剖析位运算（1）再论数据类型（2）所以位运算时需要明确知道的事（3）类型补充知识——char字符型3.小结五、总结前言——C语言中支持下面四种类型的运算一、四则运算1
                    
                    使用Apollo Cyber RT Python API处理图像消息
                        Hi20240217
代码片段学习python开发语言apollocyberrt自动驾驶‘
                        使用ApolloCyberRTPythonAPI处理图像消息背景介绍一、提取record中的图像为什么需要提取图像？操作步骤关键点解释：执行命令：二、发布图像消息为什么需要发布消息？实现代码：核心组件：三、订阅图像消息订阅的意义：订阅者实现：关键技术点：四、实际应用场景五、调试技巧背景介绍在自动驾驶系统中，传感器数据（如图像）通常以记录文件(record)的形式保存。ApolloCyberRT作为
                    
                    Python工程师面试题集
                        木鱼时刻
软件开发python开发语言
                        文章目录一、Python基础二、关键Python库三、Web开发四、并发与性能五、系统设计答案区一、Python基础Python的可变与不可变数据类型有哪些？底层实现原理？Python2与Python3的主要区别解释GIL全局解释器锁及其对多线程的影响装饰器Decorator的作用与实现原理二、关键Python库Pandas的核心作用及数据结构常用Pandas操作与缺失值处理百万级数据优化技巧Nu
                    
                    【数据挖掘】支持向量机（SVM）
                        大雨淅淅
大数据数据挖掘支持向量机算法大数据回归
                        目录一、支持向量机（SVM）算法概述二、支持向量机（SVM）算法优缺点和改进2.1支持向量机（SVM）算法优点2.2支持向量机（SVM）算法缺点2.3支持向量机（SVM）算法改进三、支持向量机（SVM）算法实现3.1支持向量机（SVM）算法C语言实现3.2支持向量机（SVM）算法JAVA实现3.3支持向量机（SVM）算法python实现四、支持向量机（SVM）算法应用五、支持向量机（SVM）算法发
                    
                    Mysql存储引擎
                        

                        对于一张mysql的表，需要存储表结构、数据和索引，存储引擎直接影响上面内容的存储方式mysql主要存储引擎包括：MyISAM和InnoDBMyISAM引擎不支持事务和外键、索引采用非聚簇索引，优势在于访问速度块对事务没有完整性要求，以select、insert为主的应用基本可以用这个引擎创建表。MyISAM表在磁盘上存储成3个文件，其文件名和表名相同，扩展名分别是：.frm（存储表定义）.MYD
                    
                    Multicoin Capital：我们为什么投资 io.net
                        TechubNews
区块链Web3DePIN娱乐人工智能区块链web3媒体
                        撰文：ShayonSengupta，MulticoinCapital编译：JIN，TechubNews本文来源香港Web3媒体：TechubNews2024年6月6日，币安宣布Launchpool将上线io.net代币IO，用户于香港时间6月7日8时在Launchpool网站将BNB、FDUSD投入到IO挖矿池中获得IO奖励，IO共计可挖矿4天。网站预计将于此公告的大约五小时内，挖矿活动开放前更新
                    
                    免费AI配音工具大盘点：2024年不容错过的5大选择
                        AI学长带你学AI
AI人工智能与大数据应用开发AI应用开发高级指南人工智能ai
                        免费AI配音工具大盘点：2024年不容错过的5大选择关键词：AI配音工具、文本转语音（TTS）、免费开源、多语言支持、语音合成技术、自然度优化、应用场景摘要：本文深度解析2024年主流免费AI配音工具，从技术原理、功能特性、使用场景到实战案例展开分析。通过对比五大工具（GoogleText-to-Speech、MicrosoftAzureTTS、AmazonPolly、VocaloidNeo、Co
                    
                    SpringBoot+MySQL旅游资源管理系统Java源码
                        幽络源小助理
springbootvue.js后端springjava
                        概述基于SpringBoot+MySQL开发的旅游资源管理系统完整源码，该系统功能完善，包含从景点管理到路线推荐的全流程解决方案，采用主流技术栈开发，代码规范易于二次开发，是学习SpringBoot项目实战的优秀范例。主要内容前台功能展示系统前台设计简洁实用，主要包含以下核心功能模块：导航菜单：首页、在线留言、公告消息、景点资讯、景点信息、酒店信息、个人中心搜索功能：支持关键词搜索旅游景点和酒店信
                    
                    flink数据同步mysql到hive_基于Canal与Flink实现数据实时增量同步(二)
                        

                        背景在数据仓库建模中，未经任何加工处理的原始业务层数据，我们称之为ODS(OperationalDataStore)数据。在互联网企业中，常见的ODS数据有业务日志数据(Log)和业务DB数据(DB)两类。对于业务DB数据来说，从MySQL等关系型数据库的业务数据进行采集，然后导入到Hive中，是进行数据仓库生产的重要环节。如何准确、高效地把MySQL数据同步到Hive中？一般常用的解决方案是批量
                    
                    使用canal同步mysql增量数据至rocketmq
                        

                        使用canal同步mysql增量数据至rocketmq组件版本canal1.1.5rocketmq4.9.2mysql5.7zk3.5.6canal使用参考地址:https://github.com/alibaba/canal主要配置如下:canal.properties:#tcp,kafka,rocketMQ,rabbitMQcanal.serverMode=rocketMQ#数据库名称cana
                    
                    canal同步mysql到kafka_使用Canal同步MySQL数据到Kafka 得到的数据中sql字段无值-问答-阿里云开发者社区-阿里云...
                        又可乐

                        这个应该跟你的binlog记录模式有关系，binlog有3中模式，ROW(行模式),Statement(语句模式),Mixed(混合模式)三种模式的用法如下：ROW(行模式)：记录那条数据修改了，注意：记录的是这条记录的全部数据，即使只更新了一个字段，binlog里也会记录所有字段的数据优点：他不记录sql语句的上下文信息，日志内容会非常清楚的记录每条数据详细的变更细节，即使只更新了一个字段，bi
                    
                                设计模式介绍
                                    tntxia
设计模式
                                    设计模式来源于土木工程师 克里斯托弗 亚历山大（http://en.wikipedia.org/wiki/Christopher_Alexander）的早期作品。他经常发表一些作品，内容是总结他在解决设计问题方面的经验，以及这些知识与城市和建筑模式之间有何关联。有一天，亚历山大突然发现，重复使用这些模式可以让某些设计构造取得我们期望的最佳效果。 
 
亚历山大与萨拉-石川佳纯和穆雷 西乐弗斯坦合作
                                
                                android高级组件使用(一)
                                    百合不是茶
androidRatingBarSpinner
                                    1、自动完成文本框（AutoCompleteTextView） 
 
 AutoCompleteTextView从EditText派生出来，实际上也是一个文本编辑框，但它比普通编辑框多一个功能：当用户输入一个字符后，自动完成文本框会显示一个下拉菜单，供用户从中选择，当用户选择某个菜单项之后，AutoCompleteTextView按用户选择自动填写该文本框。 
 使用AutoCompleteTex
                                
                                [网络与通讯]路由器市场大有潜力可挖掘
                                    comsci
网络
                                       
       如果国内的电子厂商和计算机设备厂商觉得手机市场已经有点饱和了,那么可以考虑一下交换机和路由器市场的进入问题..... 
 
       这方面的技术和知识,目前处在一个开放型的状态,有利于各类小型电子企业进入 
 
 &nbs
                                
                                自写简单Redis内存统计shell
                                    商人shang
Linux shell统计Redis内存
                                    #!/bin/bash
address="192.168.150.128:6666,192.168.150.128:6666"  
hosts=(${address//,/ })  

sfile="staticts.log"

for hostitem in ${hosts[@]}  
do  
    ipport=(${hostitem
                                
                                单例模式(饿汉 vs懒汉)
                                    oloz
单例模式
                                    package 单例模式;
/*
 * 应用场景:保证在整个应用之中某个对象的实例只有一个
 * 单例模式种的《 懒汉模式》  
 * */
public class Singleton {
	
	//01 将构造方法私有化，外界就无法用new Singleton()的方式获得实例
	private Singleton(){};
	
	//02 申明类得唯一实例
	priva
                                
                                springMvc json支持
                                    杨白白
json springmvc
                                    1.Spring mvc处理json需要使用jackson的类库，因此需要先引入jackson包 
 
 
2在spring mvc中解析输入为json格式的数据:使用@RequestBody来设置输入 
 

@RequestMapping("helloJson")
public @ResponseBody
    JsonTest helloJson() {
   
                                
                                android播放，掃描添加本地音頻文件
                                    小桔子

                                            最近幾乎沒有什麽事情，繼續鼓搗我的小東西。想在項目中加入一個簡易的音樂播放器功能，就像華為p6桌面上那麼大小的音樂播放器。用過天天動聽或者QQ音樂播放器的人都知道，可已通過本地掃描添加歌曲。不知道他們是怎麼實現的，我覺得應該掃描設備上的所有文件，過濾出音頻文件，每個文件實例化為一個實體，記錄文件名、路徑、歌手、類型、大小等信息。具體算法思想，
                                
                                oracle常用命令
                                    aichenglong
oracledba常用命令
                                    1 创建临时表空间 
create temporary tablespace user_temp  
tempfile 'D:\oracle\oradata\Oracle9i\user_temp.dbf' 
size 50m  
autoextend on  
next 50m maxsize 20480m  
extent management local
                                
                                25个Eclipse插件
                                    AILIKES
eclipse插件
                                    提高代码质量的插件1. FindBugsFindBugs可以帮你找到Java代码中的bug，它使用Lesser GNU Public License的自由软件许可。2. CheckstyleCheckstyle插件可以集成到Eclipse IDE中去，能确保Java代码遵循标准代码样式。3. ECLemmaECLemma是一款拥有Eclipse Public License许可的免费工具，它提供了
                                
                                Spring MVC拦截器+注解方式实现防止表单重复提交
                                    baalwolf
spring mvc
                                    原理：在新建页面中Session保存token随机码，当保存时验证，通过后删除，当再次点击保存时由于服务器端的Session中已经不存在了，所有无法验证通过。      
1.新建注解： 
     
?       1   2   3   4   5   6   7   8   9   10   11   12   13   14   15   16   17   18   
                                
                                《Javascript高级程序设计(第3版)》闭包理解
                                    bijian1013
JavaScript
                                    “闭包是指有权访问另一个函数作用域中的变量的函数。”--《Javascript高级程序设计(第3版)》 
  
      看以下代码： 
<script type="text/javascript">
    function outer() {
        var i = 10;
        return f
                                
                                AngularJS Module类的方法
                                    bijian1013
JavaScriptAngularJSModule
                                            AngularJS中的Module类负责定义应用如何启动，它还可以通过声明的方式定义应用中的各个片段。我们来看看它是如何实现这些功能的。 
一.Main方法在哪里 
        如果你是从Java或者Python编程语言转过来的，那么你可能很想知道AngularJS里面的main方法在哪里？这个把所
                                
                                [Maven学习笔记七]Maven插件和目标
                                    bit1129
maven插件
                                    插件(plugin)和目标(goal) 
Maven，就其本质而言，是一个插件执行框架，Maven的每个目标的执行逻辑都是由插件来完成的，一个插件可以有1个或者几个目标，比如maven-compiler-plugin插件包含compile和testCompile，即maven-compiler-plugin提供了源代码编译和测试源代码编译的两个目标 
  
使用插件和目标使得我们可以干预
                                
                                【Hadoop八】Yarn的资源调度策略
                                    bit1129
hadoop
                                    1. Hadoop的三种调度策略 
Hadoop提供了3中作业调用的策略， 
 
 FIFO Scheduler 
 Fair Scheduler 
 Capacity Scheduler 
 
以上三种调度算法，在Hadoop MR1中就引入了，在Yarn中对它们进行了改进和完善.Fair和Capacity Scheduler用于多用户共享的资源调度 
  2. 多用户资源共享的调度 
                                
                                Nginx使用Linux内存加速静态文件访问
                                    ronin47

                                    Nginx是一个非常出色的静态资源web服务器。如果你嫌它还不够快，可以把放在磁盘中的文件，映射到内存中，减少高并发下的磁盘IO。 
先做几个假设。nginx.conf中所配置站点的路径是/home/wwwroot/res，站点所对应文件原始存储路径：/opt/web/res 
shell脚本非常简单，思路就是拷贝资源文件到内存中，然后在把网站的静态文件链接指向到内存中即可。具体如下：      
                                
                                关于Unity3D中的Shader的知识
                                    brotherlamp
unityunity资料unity教程unity视频unity自学
                                    首先先解释下Unity3D的Shader，Unity里面的Shaders是使用一种叫ShaderLab的语言编写的，它同微软的FX文件或者NVIDIA的CgFX有些类似。传统意义上的vertex shader和pixel shader还是使用标准的Cg/HLSL 编程语言编写的。因此Unity文档里面的Shader，都是指用ShaderLab编写的代码，然后我们来看下Unity3D自带的60多个S
                                
                                CopyOnWriteArrayList vs ArrayList
                                    bylijinnan
java
                                    package com.ljn.base;

import java.util.ArrayList;
import java.util.Iterator;
import java.util.List;
import java.util.concurrent.CopyOnWriteArrayList;

/**
 * 总述：
 * 1.ArrayListi不是线程安全的，CopyO
                                
                                内存中栈和堆的区别
                                    chicony
内存
                                      
1、内存分配方面： 
 
    堆：一般由程序员分配释放， 若程序员不释放，程序结束时可能由OS回收 。注意它与数据结构中的堆是两回事，分配方式是类似于链表。可能用到的关键字如下：new、malloc、delete、free等等。 
 
    栈：由编译器(Compiler)自动分配释放，存放函数的参数值，局部变量的值等。其操作方式类似于数据结构中
                                
                                回答一位网友对Scala的提问
                                    chenchao051
scalamap
                                    本来准备在私信里直接回复了，但是发现不太方便，就简要回答在这里。  问题 写道   对于scala的简洁十分佩服，但又觉得比较晦涩，例如一例，Map("a" -> List(11,111)).flatMap(_._2)，可否说下最后那个函数做了什么，真正在开发的时候也会如此简洁？谢谢  
   先回答一点，在实际使用中，Scala毫无疑问就是这么简单。
                                
                                mysql 取每组前几条记录
                                    daizj
mysql分组最大值最小值每组三条记录
                                    一、对分组的记录取前N条记录：例如：取每组的前3条最大的记录    1.用子查询：   SELECT * FROM tableName a  WHERE 3>   (SELECT COUNT(*) FROM  tableName b WHERE b.id=a.id AND b.cnt>a. cnt)   ORDER BY a.id,a.account DE
                                
                                HTTP深入浅出 http请求
                                    dcj3sjt126com
http
                                        HTTP(HyperText Transfer Protocol)是一套计算机通过网络进行通信的规则。计算机专家设计出HTTP，使HTTP客户（如Web浏览器）能够从HTTP服务器(Web服务器)请求信息和服务，HTTP目前协议的版本是1.1.HTTP是一种无状态的协议，无状态是指Web浏览器和Web服务器之间不需要建立持久的连接，这意味着当一个客户端向服务器端发出请求，然后We
                                
                                判断MySQL记录是否存在方法比较
                                    dcj3sjt126com
mysql
                                    把数据写入到数据库的时，常常会碰到先要检测要插入的记录是否存在，然后决定是否要写入。 
　　我这里总结了判断记录是否存在的常用方法： 
　　sql语句：  select   count ( * )  from  tablename;  
　　然后读取count(*)的值判断记录是否存在。对于这种方法性能上有些浪费，我们只是想判断记录记录是否存在，没有必要全部都查出来。
                                
                                对HTML XML的一点认识
                                    e200702084
htmlxml
                                    感谢http://www.w3school.com.cn提供的资料 
HTML 文档中的每个成分都是一个节点。 
节点 
根据 DOM，HTML 文档中的每个成分都是一个节点。 
 
DOM 是这样规定的： 
 
整个文档是一个文档节点 
每个 HTML 标签是一个元素节点 
包含在 HTML 元素中的文本是文本节点 
每一个 HTML 属性是一个属性节点 
注释属于注释节点 
Node 层次 

                                
                                jquery分页插件
                                    genaiwei
jqueryWeb前端分页插件
                                    //jquery页码控件// 创建一个闭包    (function($) {      // 插件的定义      $.fn.pageTool = function(options) {          var totalPa
                                
                                Mybatis与Ibatis对照入门于学习
                                    Josh_Persistence
mybatisibatis区别联系
                                    一、为什么使用IBatis/Mybatis 
        对于从事 Java EE 的开发人员来说，iBatis 是一个再熟悉不过的持久层框架了，在 Hibernate、JPA 这样的一站式对象 / 关系映射（O/R Mapping）解决方案盛行之前，iBaits 基本是持久层框架的不二选择。即使在持久层框架层出不穷的今天，iBatis 凭借着易学易用、
                                
                                C中怎样合理决定使用那种整数类型？
                                    秋风扫落叶
c数据类型
                                    如果需要大数值(大于32767或小于32767), 使用long 型。 否则, 如果空间很重要 (如有大数组或很多结构), 使用 short 型。 除此之外, 就使用 int 型。 如果严格定义的溢出特征很重要而负值无关紧要, 或者你希望在操作二进制位和字节时避免符号扩展的问题, 请使用对应的无符号类型。 但是, 要注意在表达式中混用有符号和无符号值的情况。 
  
 &nbs
                                
                                maven问题
                                    zhb8015
maven问题
                                      
问题1： 
Eclipse 中 新建maven项目 无法添加src/main/java 问题 
   eclipse创建maevn web项目，在选择maven_archetype_web原型后，默认只有src/main/resources这个Source Floder。 
    按照maven目录结构，添加src/main/ja
                                
                                (二)androidpn-server tomcat版源码解析之--push消息处理
                                    spjich
javaandrodipn推送
                                    在 (一)androidpn-server tomcat版源码解析之--项目启动这篇中，已经描述了整个推送服务器的启动过程，并且把握到了消息的入口即XmppIoHandler这个类，今天我将继续往下分析下面的核心代码，主要分为3大块，链接创建，消息的发送，链接关闭。 
先贴一段XmppIoHandler的部分代码 
/**
     * Invoked from an I/O proc
                                
                                用js中的formData类型解决ajax提交表单时文件不能被serialize方法序列化的问题
                                    中华好儿孙
JavaScriptAjaxWeb上传文件FormData
                                    
var formData = new FormData($("#inputFileForm")[0]);
$.ajax({
		type:'post',
		url:webRoot+"/electronicContractUrl/webapp/uploadfile",
		data:formData,
		async: false,
		ca
                                
                                mybatis常用jdbcType数据类型
                                    ysj5125094
mybatismapperjdbcType
                                      
MyBatis 通过包含的jdbcType
类型 
BIT         FLOAT      CHAR          
                                
                
            
        
    


    
        
            按字母分类：
            ABCDEFGHIJKLMNOPQRSTUVWXYZ其他
        
    


    
        
            首页 -
            关于我们 -
            站内搜索 -
            Sitemap -
            侵权投诉
        
        版权所有 IT知识库 CopyRight © 2000-2050 E-COM-NET.COM , All Rights Reserved.