分布式环境不同于单机系统,对ID生成有着更为严苛的需求,具体如下:
- 全局唯一,这是基本要求,不能出现重复。
- 单调递增,连续的,下一个ID要大于上一个ID,这主要是从MySQL InnoDB存储引擎的性能来考虑的。
- 长度,长度越短需要的存储空间越小,同时还能够提高查询效率,使用MySQL时尤为突出。
- 高可用,无单点隐患
- 高性能,生成速度快,延时低,扛住高并发
常用的分布式ID生成方案
UUID
优点: 开发语言本身提供实现,足够简单;全球唯一;无性能问题
缺点:长度过大,不利于存储和检索;非单调递增,对MySQL索引不利(作为数据库主键,在InnoDB引擎下,UUID的无序性可能会引起数据位置频繁变动,严重影响性能)
数据库自增主键
基于数据库的自增主角,单独使用一个数据库实例作全局ID生成器。
优点:实现简单;单调递增;数值类型,长度合适,查询速度快
缺点:强依赖数据,存在单点隐患;存在性能问题,无法抗住高并发
数据库多实例自增主键
每个数据库设置固定的step增长步长,使得每个数据库生成的主键单调递增且不重复,如:DB1生成1、4、7、10;DB2生成2、5、8、11;DB3生成3、6、9、12
优点:无单点隐患;平衡负载
缺点:需固定步长,扩容困难;单库压力依然大;应用较为复杂
类Snowflake算法
使用twitter开源的Snowflake算法,其构造如下:
优点:高性能(每秒生成百万ID);单调递增
缺点:强依赖机器时钟,存在时钟回拨问题(会导致重复的ID生成)
uid-generator
uid-generator是由百度开源的基于Snowflake算法的唯一ID生成器,使用java语言实现。uid-generator以组件形式工作在应用项目中, 支持自定义workerId位数和初始化策略, 从而适用于docker等虚拟化环境下实例自动重启、漂移等场景。 在实现上, uid-generator通过借用未来时间来解决sequence天然存在的并发限制; 采用RingBuffer来缓存已生成的UID, 并行化UID的生产和消费, 同时对CacheLine补齐,避免了由RingBuffer带来的硬件级「伪共享」问题. 最终单机QPS可达600万。
uid-generator项目详情: 请点击
uid-generator对Snowflake算法生成的ID构造做了调整,如下:
worker node id 为每个工作节点的ID(机器、应用实例),uid-generator提供接口可由用户自行实现其生成方式,默认是基于数据库生成。
uid-generator解决时间回拨问题、提升性能主要是通过如下技术手段实现:
1、动态递增worker node id : 每次启动都会往数据库WORKER_NODE表中插入一条记录,插入成功后返回的该数据对应的自增唯一主键,此主键就作为该应用实例的worker node id 。保证每个应用实例、每次启动所获取的worker node id 都不同,因此不会出现生成重复的ID。即使时钟回拨,因为workerId不同,也不会出现ID冲突
2、RingBuffer: RingBuffer本质是一个数组,uid-generator利用RingBuffer数据结构预先生成若干个ID并缓存,当需要获取ID时候,如果数组中有则优先使用缓存的ID,这样可极大提高效率与吞吐量
3、未来时间:大部分snowflake算法的实现都会使用System.currentTimeMillis()来获取时间戳,这样严重依赖服务器的时间。uid-generator使用填充完RingBuffer时的时间戳作为lastSecond(AtomicLong类型),下次填充时使用lastSecond.incrementAndGet()来获取新的时间戳,非使用System.currentTimeMillis(),规避了时钟回拨问题。
uid-generator-starter
从官网说明或者其他网上的使用教程可见,将uid-generator集成到springboot项目中,还是有点小麻烦的。uid-generator-starter对uid-generator进行了Springboot Starter风格的封装,只要一行注解便可将其集成到项目中,同时还增加一些实用的特性:
spring-boot-starter风格的开箱即用。
可为uid-generator独立设置数据源,和业务系统的主数据源分开。
支持使用ZooKeeper进行WORKER ID分配,藉由ZK的Paxos强一致性算法获取更高的可用性。
开源地址
github:uid-generator-starter
如果此工具对你有帮助,请在github中Star支持下
快速开始
1、引入uid-generator-starter
com.github
uid-generator-starter
最新的版本号
2、在数据库(mysql)中创建WORKER_NODE表
DROP TABLE IF EXISTS WORKER_NODE;
CREATE TABLE WORKER_NODE
(
ID BIGINT NOT NULL AUTO_INCREMENT COMMENT 'auto increment id',
HOST_NAME VARCHAR(64) NOT NULL COMMENT 'host name',
PORT VARCHAR(64) NOT NULL COMMENT 'port',
TYPE INT NOT NULL COMMENT 'node type: ACTUAL or CONTAINER',
LAUNCH_DATE DATE NOT NULL COMMENT 'launch date',
MODIFIED TIMESTAMP NOT NULL COMMENT 'modified time',
CREATED TIMESTAMP NOT NULL COMMENT 'created time',
PRIMARY KEY(ID)
)
COMMENT='DB WorkerID Assigner for UID Generator',ENGINE = INNODB;
3、注解启用uid-generator
@Transactional
@EnableUidGenerator //启用uid-generator
@SpringBootApplication
public class Application {
public static void main(String[] args) {
SpringApplication.run(Application.class, args);
}
}
4、使用UidGenerator
@Resource
private UidGenerator uidGenerator;
@Test
public void contextLoads() {
for(int i=0;i<100;i++) {
System.out.println("uid:"+uidGenerator.getUID());
}
}
使用独立的数据源
在数据库uid-db中创建WORKER_NODE表,使用其作为uid-generator的专用数据库
每个业务系统只需将uid-generator的数据库设置为uid-db即可
#---------------------- 业务配置 -----------------------
spring:
datasource: #业务数据源
driver-class-name: com.mysql.cj.jdbc.Driver
url: jdbc:mysql://127.0.0.1:3306/yewu1
password: admin
username: 123456
#---------------------- uid-generator -----------------------
uid-generator:
#time-bits: 28 #可选配置, 如未指定将采用默认值
#worker-bits: 22 #可选配置, 如未指定将采用默认值
#seq-bits: 13 #可选配置, 如未指定将采用默认值
#epoch-str: 2020-10-21 #可选配置, 如未指定将采用默认值(2020-10-21)
#boost-power: 3 #可选配置, 如未指定将采用默认值
#padding-factor: 50 #可选配置, 如未指定将采用默认值
#schedule-interval: #可选配置, 如未指定则不启用此功能
datasource: #使用独立的数据源,如未指定将采用应用系统的数据源
driver-class-name: com.mysql.cj.jdbc.Driver
url: jdbc:mysql://192.168.1.666:3306/uid-db
password: admin
username: 123456
使用zookeeper
作为一个专门为分布式应用提供一致性服务的软件,使用zookeeper作为workerId的配置维护工具再合适不过了,如果你的系统追求高度可用性,强烈推荐使用zookeeper集群。
#---------------------- 业务配置 -----------------------
spring:
datasource: #业务数据源
driver-class-name: com.mysql.cj.jdbc.Driver
url: jdbc:mysql://127.0.0.1:3306/yewu?
password: admin
username: 123456
#---------------------- uid-generator -----------------------
uid-generator:
#time-bits: 28 #可选配置, 如未指定将采用默认值
#worker-bits: 22 #可选配置, 如未指定将采用默认值
#seq-bits: 13 #可选配置, 如未指定将采用默认值
#epoch-str: 2016-05-20 #可选配置, 如未指定将采用默认值
#boost-power: 3 #可选配置, 如未指定将采用默认值
#padding-factor: 50 #可选配置, 如未指定将采用默认值
#schedule-interval: #可选配置, 如未指定则不启用此功能
#datasource: #使用独立的数据源,如未指定将采用应用系统的数据源
#driver-class-name: com.mysql.cj.jdbc.Driver
#url: jdbc:mysql://192.168.1.666:3306/uid-db
#password: root
#username: root
zookeeper:
#zk连接地址,集群模式则用逗号分开,如: 192.168.1.333:2181,192.168.1.555:2182,192.168.1.66:2183
addrs: 192.168.1.333:2181
#authentication: admin:123456 #digest类型的访问秘钥,如:user:password,默认为不使用秘钥