【分布式】高性能分布式发号器

关于数据库主键生成

在我们的业务中,数据库表主键是需要保证唯一的,有序的。通常在单表(不分库、分表)情况下,我们可以直接使用主键自增长来实现。但是这种模式存在几点明显的缺点:1、不能支持分库分表;2、基于数据库生成,会影响数据库性能;3、数据清洗迁移比较麻烦。针对以上的情况,我们可以通过应用服务生成UUID来实现唯一的主键,但是UUID却存在下面几点问题:1、UUID不具有有序性;2、UUID生成基于时间数据性能比较差。所以基于上面的问题,我们需要使用一款优秀的高性能支持分布式应用的发号器来生成唯一有序的编号。

Snowflake(雪花算法) 

针对以上几个问题,Twitter的Sonwflake是一个流行的开源的发号器,在互联网公司中得到了广泛的应用。Snowflake的结构如下所示:

0 - 0000000000 0000000000 0000000000 0000000000 0 - 00000 - 00000 - 000000000000

SnowFlake的结构分为四部分:

第一部分:占用1bit,值为0,占位并没有实际作用

第二部分:占41bit,值由时间构成,精确到毫秒,可以使用69年。

第三部分:占10bit,高5bit为数据中心ID(datacenter ID),低5bit为工作节点(Worker ID),这样最多可以容纳1024个节点。

第四部分:占12bit,这12bit用于在同一毫秒下累加使用,也就是一个工作节点内一毫秒最多能 生成4096个ID,那么理论上SnowFlake一毫秒最多能生成4194304(1024*4096)个ID。

注意:1、在集群环境下每一个service要使用不同的节点(数据中心ID+工作节点ID),不然有可能生成的ID重复;2、如果对服务器的时间进行的调整,向前调整时间没问题,如果向后调整时间,有可能是出现重复的ID。

源码(Java版)

/**
 * Twitter_Snowflake
* SnowFlake的结构如下(每部分用-分开):
* 0 - 0000000000 0000000000 0000000000 0000000000 0 - 00000 - 00000 - 000000000000
* 1位标识,由于long基本类型在Java中是带符号的,最高位是符号位,正数是0,负数是1,所以id一般是正数,最高位是0
* 41位时间截(毫秒级),注意,41位时间截不是存储当前时间的时间截,而是存储时间截的差值(当前时间截 - 开始时间截) * 得到的值),这里的的开始时间截,一般是我们的id生成器开始使用的时间,由我们程序来指定的(如下下面程序IdWorker类的startTime属性)。41位的时间截,可以使用69年,年T = (1L << 41) / (1000L * 60 * 60 * 24 * 365) = 69
* 10位的数据机器位,可以部署在1024个节点,包括5位datacenterId和5位workerId
* 12位序列,毫秒内的计数,12位的计数顺序号支持每个节点每毫秒(同一机器,同一时间截)产生4096个ID序号
* 加起来刚好64位,为一个Long型。
* SnowFlake的优点是,整体上按照时间自增排序,并且整个分布式系统内不会产生ID碰撞(由数据中心ID和机器ID作区分),并且效率较高,经测试,SnowFlake每秒能够产生26万ID左右。 */ public class SnowflakeIdWorker { // ==============================Fields=========================================== /** 开始时间截 (2018-06-01) */ private final long twepoch = 1527782400000L; /** 机器id所占的位数 */ private final long workerIdBits = 5L; /** 数据标识id所占的位数 */ private final long datacenterIdBits = 5L; /** 支持的最大机器id,结果是31 (这个移位算法可以很快的计算出几位二进制数所能表示的最大十进制数) */ private final long maxWorkerId = -1L ^ (-1L << workerIdBits); /** 支持的最大数据标识id,结果是31 */ private final long maxDatacenterId = -1L ^ (-1L << datacenterIdBits); /** 序列在id中占的位数 */ private final long sequenceBits = 12L; /** 机器ID向左移12位 */ private final long workerIdShift = sequenceBits; /** 数据标识id向左移17位(12+5) */ private final long datacenterIdShift = sequenceBits + workerIdBits; /** 时间截向左移22位(5+5+12) */ private final long timestampLeftShift = sequenceBits + workerIdBits + datacenterIdBits; /** 生成序列的掩码,这里为4095 (0b111111111111=0xfff=4095) */ private final long sequenceMask = -1L ^ (-1L << sequenceBits); /** 工作机器ID(0~31) */ private long workerId; /** 数据中心ID(0~31) */ private long datacenterId; /** 毫秒内序列(0~4095) */ private long sequence = 0L; /** 上次生成ID的时间截 */ private long lastTimestamp = -1L; //==============================Constructors===================================== /** * 构造函数 * @param workerId 工作ID (0~31) * @param datacenterId 数据中心ID (0~31) */ public SnowflakeIdWorker(long workerId, long datacenterId) { if (workerId > maxWorkerId || workerId < 0) { throw new IllegalArgumentException(String.format("worker Id can't be greater than %d or less than 0", maxWorkerId)); } if (datacenterId > maxDatacenterId || datacenterId < 0) { throw new IllegalArgumentException(String.format("datacenter Id can't be greater than %d or less than 0", maxDatacenterId)); } this.workerId = workerId; this.datacenterId = datacenterId; } // ==============================Methods========================================== /** * 获得下一个ID (该方法是线程安全的) * @return SnowflakeId */ public synchronized long nextId() { long timestamp = timeGen(); //如果当前时间小于上一次ID生成的时间戳,说明系统时钟回退过这个时候应当抛出异常 if (timestamp < lastTimestamp) { throw new RuntimeException( String.format("Clock moved backwards. Refusing to generate id for %d milliseconds", lastTimestamp - timestamp)); } //如果是同一时间生成的,则进行毫秒内序列 if (lastTimestamp == timestamp) { sequence = (sequence + 1) & sequenceMask; //毫秒内序列溢出 if (sequence == 0) { //阻塞到下一个毫秒,获得新的时间戳 timestamp = tilNextMillis(lastTimestamp); } } //时间戳改变,毫秒内序列重置 else { sequence = 0L; } //上次生成ID的时间截 lastTimestamp = timestamp; //移位并通过或运算拼到一起组成64位的ID return ((timestamp - twepoch) << timestampLeftShift) // | (datacenterId << datacenterIdShift) // | (workerId << workerIdShift) // | sequence; } /** * 阻塞到下一个毫秒,直到获得新的时间戳 * @param lastTimestamp 上次生成ID的时间截 * @return 当前时间戳 */ protected long tilNextMillis(long lastTimestamp) { long timestamp = timeGen(); while (timestamp <= lastTimestamp) { timestamp = timeGen(); } return timestamp; } /** * 返回以毫秒为单位的当前时间 * @return 当前时间(毫秒) */ protected long timeGen() { return System.currentTimeMillis(); } //==============================Test============================================= /** 测试 */ public static void main(String[] args) { SnowflakeIdWorker idWorker = new SnowflakeIdWorker(0, 0); ExecutorService service = Executors.newFixedThreadPool(20); for (int j = 0; j < 20; j++) { int finalJ = j; service.submit(() -> { long startTime = System.currentTimeMillis(); for (int i = 0; i < 10000; i++) { long id = idWorker.nextId(); System.out.println("线程" + finalJ + ":" + id); } long endTime = System.currentTimeMillis(); System.out.println("线程" + finalJ + "用时:" + (endTime - startTime)); }); } } }

 

你可能感兴趣的:(Java)