关于雪花算法的一些思考与工具类实现

引言

雪花算法是Twitter提出的用以解决分布式ID的一种解决办法，详细的介绍网上有很多，本文在这里就不重复了。
本文参考了两个网址进行实现：

[1] 煲煲菜理解分布式id生成算法SnowFlake 2017-09-20

[2] souyunku Twitter的分布式自增ID雪花算法snowflake (Java版) 2018-05-13

问题

这里主要有两个问题思考：
1.为什么要分为几个部分，41bit,10bit,12bit？
2.这样的算法实现在多线程情况下真的能确保ID的唯一性吗？

针对问题一
这个问题的本质其实是，该算法的创始人是如何想到该方法的，为什么要这么划分。我试着来回答一下，首先ID是要正数，所以第一位不能用。然后我们要快捷，不用数据库，所以我们只能用移位的形式实现。那我们的服务器一般是64位的，这是重点，64位！。所以我们要合理规划出来一部分数据要能表示使用的年限（41位），一部分要表现我的机房和我机房里面的机器（各5位），剩下的12位表示一毫秒里面的数据，可以保证4k左右的数据不重复。至于确切的计算过程，可以参考文献一。
另外为了保证每次只获取一个新的，所以肯定得在获取下一个ID的时候加上锁synchronized。

针对问题二

我们不妨来验证一下，思路是启动10个线程，每个线程执行1000次的获取ID，收集下每次获取的ID，看是否有重复。我们将分为两种情况：

在循环外部生成对象，即单实例下生成ID

单个对象的情况
在循环内部生成对象，即多实例下生成ID

多对象情况

根据程序运行的结果，我们可以发现用别人的代码其实存在风险。如果一个项目里面，多处地方new SnowFlake对象很多可能会导致ID不唯一！！

所以为了避免一个项目下由调用处创建SnowFlake对象导致的ID重复问题，建议在工具类中就进行对象初始化（可以使用单例模式）
本文只是简单的私有化构造函数，并利用static的特性初始化

  private static SnowFlakeUtil snowFlakeUtil = new SnowFlakeUtil(0, 0);

    private SnowFlakeUtil(long datacenterId, long machineId) {
        if (datacenterId > MAX_DATACENTER_NUM || datacenterId < 0) {
            throw new IllegalArgumentException("datacenterId can't be greater than MAX_DATACENTER_NUM or less than 0");
        }
        if (machineId > MAX_MACHINE_NUM || machineId < 0) {
            throw new IllegalArgumentException("machineId can't be greater than MAX_MACHINE_NUM or less than 0");
        }
        this.datacenterId = datacenterId;
        this.machineId = machineId;
    }

在具体使用的时候不同的项目里面配置不同的机房ID和机器ID即可。

附录

通篇代码：

public class SnowFlakeUtil {

    /**
     * 起始的时间戳
     * 2020-06-10 09:43:xx
     */
    private final long START_STMP = 1591753401773L;

    /**
     * 每一部分占用的位数
     */
    private final long SEQUENCE_BIT = 12; //序列号占用的位数
    private final long MACHINE_BIT = 5;   //机器标识占用的位数
    private final long DATACENTER_BIT = 5;//数据中心占用的位数

    /**
     * 每一部分的最大值
     */
    private final long MAX_DATACENTER_NUM = -1L ^ (-1L << DATACENTER_BIT);
    private final long MAX_MACHINE_NUM = -1L ^ (-1L << MACHINE_BIT);
    private final long MAX_SEQUENCE = -1L ^ (-1L << SEQUENCE_BIT);

    /**
     * 每一部分向左的位移
     */
    private final long MACHINE_LEFT = SEQUENCE_BIT;
    private final long DATACENTER_LEFT = SEQUENCE_BIT + MACHINE_BIT;
    private final long TIMESTMP_LEFT = DATACENTER_LEFT + DATACENTER_BIT;

    /**
     * 数据中心
     */
    private long datacenterId;
    /**
     * 机器标识
     */
    private long machineId;
    /**
     * 序列号
     */
    private long sequence = 0L;
    /**
     * 上一次时间戳
     */
    private long lastStmp = -1L;


    private static SnowFlakeUtil snowFlakeUtil = new SnowFlakeUtil(0, 0);

    private SnowFlakeUtil(long datacenterId, long machineId) {
        if (datacenterId > MAX_DATACENTER_NUM || datacenterId < 0) {
            throw new IllegalArgumentException("datacenterId can't be greater than MAX_DATACENTER_NUM or less than 0");
        }
        if (machineId > MAX_MACHINE_NUM || machineId < 0) {
            throw new IllegalArgumentException("machineId can't be greater than MAX_MACHINE_NUM or less than 0");
        }
        this.datacenterId = datacenterId;
        this.machineId = machineId;
    }

    /**
     * 产生下一个ID
     *
     * @return
     */
    private synchronized long nextId() {
        long currStmp = getNewstmp();
        if (currStmp < lastStmp) {
            throw new RuntimeException("Clock moved backwards.  Refusing to generate id");
        }

        if (currStmp == lastStmp) {
            //相同毫秒内，序列号自增
            sequence = (sequence + 1) & MAX_SEQUENCE;
            //同一毫秒的序列数已经达到最大
            if (sequence == 0L) {
                currStmp = getNextMill();
            }
        } else {
            //不同毫秒内，序列号置为0
            sequence = 0L;
        }

        lastStmp = currStmp;

        return (currStmp - START_STMP) << TIMESTMP_LEFT //时间戳部分
                | datacenterId << DATACENTER_LEFT       //数据中心部分
                | machineId << MACHINE_LEFT             //机器标识部分
                | sequence;                             //序列号部分
    }

    private long getNextMill() {
        long mill = getNewstmp();
        while (mill <= lastStmp) {
            mill = getNewstmp();
        }
        return mill;
    }

    private long getNewstmp() {
        return System.currentTimeMillis();
    }

    public static Long generateId() {
        return snowFlakeUtil.nextId();
    }


    public static void main(String[] args) {
        Set keys = new HashSet();
//        SnowFlakeUtil ss = new SnowFlakeUtil(2, 3);
        for (int i = 0; i < 10; i++) {
            new Thread(i + "S") {
                @Override
                public void run() {
//                    SnowFlakeUtil ss = new SnowFlakeUtil(2, 3);
                    for (int j = 0; j < 1000; j++) {
                        Long k = SnowFlakeUtil.generateId();
                        if (!keys.contains(k)) {
                            keys.add(k);
                        } else {
                            System.out.println("重复:" + k);
                        }
                    }
                }
            }.start();
        }
    }
}

关于雪花算法的一些思考与工具类实现

引言

问题

附录

你可能感兴趣的:(关于雪花算法的一些思考与工具类实现)