我的雪花算法理解

雪花算法是推特公司基于自己业务量设计的高性能全局唯一编号生成算法,下面是雪花算法的基本结构

/**
 * Twitter_Snowflake
* SnowFlake的结构如下(每部分用-分开):
* 0 - 0000000000 0000000000 0000000000 0000000000 0 - 00000 - 00000 - 000000000000
* 1位标识,由于long基本类型在Java中是带符号的,最高位是符号位,正数是0,负数是1,所以id一般是正数,最高位是0
* 41位时间戳(毫秒级),注意,41位时间戳不是存储当前时间的时间戳,而是存储时间戳的差值(当前时间戳 - 开始时间戳) * 得到的值),这里的的开始时间戳,一般是我们的id生成器开始使用的时间,由我们程序来指定的(如下下面程序IdWorker类的startTime属性)。41位的时间戳,可以使用69年,年T = (1L << 41) / (1000L * 60 * 60 * 24 * 365) = 69
* 10位的数据机器位,可以部署在1024个节点,包括5位datacenterId和5位workerId
* 12位序列,毫秒内的计数,12位的计数顺序号支持每个节点每毫秒(同一机器,同一时间戳)产生4096个ID序号
* 加起来刚好64位,为一个Long型。
* SnowFlake的优点是,整体上按照时间自增排序,并且整个分布式系统内不会产生ID碰撞(由数据中心ID和机器ID作区分),并且效率较高,经测试,SnowFlake每秒能够产生26万ID左右。 */

 

雪花算法是有一个64位的数据结构,包含1位标识位,41位时间戳,10位机器位(一般包含5位数据中心ID和5位工作机器ID),12位序列位组成。

 

41位的时间错是当前时间戳-起始时间戳后的差值对应的long类型值对应的二进制位

10位数据机器位 5位标识数据中心ID 2<<5 =32 即数据中心值最大为32 机器位最大值2<<5=32

https://www.cnblogs.com/cs99lzzs/p/9869414.html 算法详细描述见这位同学的博客,我感觉写的比较清楚明了了

 //如果是同一时间生成的,则进行毫秒内序列
        if (lastTimestamp == timestamp) {
            sequence = (sequence + 1) & sequenceMask;
            //毫秒内序列溢出
            if (sequence == 0) {
                //阻塞到下一个毫秒,获得新的时间戳
                timestamp = tilNextMillis(lastTimestamp);
            }
        }
        //时间戳改变,毫秒内序列重置
        else {
            sequence = 0L;
        }

 

生成唯一编号依赖于时间时钟,如果出现时钟回退的情况会导致生成的唯一编号重复。

生成唯一编号 是依据时间戳差值 机器位 自增队列进行一系列的位移操作,最终生成一个64位的long类型。正常情况下雪花算法生成的编号是渐进递增的。

同一毫秒内编号自增依赖后面12位的自增队列,2<<12=4096 即1毫秒最多生成4096个编号,编号超过12位2进制的数据表示范围会进入一个死循环,直到等到下一毫秒才能重新生成唯一ID.理论上1秒能产生400w编号。

你可能感兴趣的:(开发)