雪花算法(代码实现)

雪花算法(Snowflake Algorithm)是一种唯一 ID 生成的算法。它是 Twitter 公司研发的一种分布式 ID 生成算法,用于解决分布式系统中主键 ID 的唯一性问题。

雪花算法使用 64 位二进制数,其中第 1 个 bit 是符号位,不使用。接着的 41 个 bit 是时间戳,记录了当前时间。然后是 10 个 bit 表示机器 ID(5 位数据中心 ID 和 5 位机器 ID),用于区分不同的数据中心和机器。最后的 12 个 bit 是序列号,表示同一毫秒内产生的不同 ID。

由于时间戳占据了 41 位,所以雪花算法可以支持到未来的 69 年,每个数据中心每毫秒可生成 1024 个不重复的 ID,每个机器每毫秒也可以生成 1024 个不重复的 ID。这样,整个系统每毫秒可以生成 1024 * 1024 个不重复的 ID。

总体来说,雪花算法实现简单,效率高,且满足分布式系统中 ID 唯一性的需求。

以下是一个简单的雪花算法的实现,使用Java语言编写:

import java.util.Random;

public class SnowflakeIdGenerator {

    // 起始的时间戳
    private final static long START_STAMP = 1480166465631L;

    // 每一部分占用的位数
    private final static long SEQUENCE_BIT = 12; // 序列号占用的位数
    private final static long MACHINE_BIT = 5; // 机器标识占用的位数
    private final static long DATACENTER_BIT = 5; // 数据中心占用的位数

    // 每一部分的最大值
    private final static long MAX_DATACENTER_NUM = -1L ^ (-1L << DATACENTER_BIT);
    private final static long MAX_MACHINE_NUM = -1L ^ (-1L << MACHINE_BIT);
    private final static long MAX_SEQUENCE = -1L ^ (-1L << SEQUENCE_BIT);

    // 每一部分向左的位移
    private final static long MACHINE_LEFT = SEQUENCE_BIT;
    private final static long DATACENTER_LEFT = SEQUENCE_BIT + MACHINE_BIT;
    private final static long TIMESTAMP_LEFT = DATACENTER_LEFT + DATACENTER_BIT;

    private static long datacenterId = 1; // 数据中心标识
    private static long machineId = 1; // 机器标识
    private static long sequence = 0L; // 序列号
    private static long lastStamp = -1L; // 上一次时间戳

    public SnowflakeIdGenerator() {
        // 默认构造器
    }

    public static synchronized long nextId() {
        long currStamp = getNewStamp();
        if (currStamp < lastStamp) {
            throw new RuntimeException("Clock moved backwards.  Refusing to generate id");
        }

        if (currStamp == lastStamp) {
            sequence = (sequence + 1) & MAX_SEQUENCE;
            if (sequence == 0) {
                // 当前毫秒内的序列号已经使用完,等待下一毫秒
                currStamp = getNextMillis();
            }
        } else {
            sequence = 0L;
        }

        lastStamp = currStamp;

        return (currStamp - START_STAMP) << TIMESTAMP_LEFT
                | datacenterId << DATACENTER_LEFT
                | machineId << MACHINE_LEFT
                | sequence;
    }

    private static long getNewStamp() {
        return System.currentTimeMillis();
    }

    private static long getNextMillis() {
        long timestamp = getNewStamp();
        while (timestamp <= lastStamp) {
            timestamp = getNewStamp();
        }
        return timestamp;
    }

    public static void main(String[] args) {
        SnowflakeIdGenerator generator = new SnowflakeIdGenerator();
        for (int i = 0; i < 10; i++) {
            System.out.println(generator.nextId());
        }
    }
}

上述代码中,通过位运算将时间戳、数据中心标识、机器标识和序列号组合成一个64位的长整型数字作为ID。其中,时间戳占用了 41 位,使用当前时间戳减去一个起始时间戳(这里使用的是 2016年11月26日 21点03分45秒631毫秒)来确保生成的ID是唯一的并且是递增的。数据中心标识和机器标识分别占用了 5 位,可以使用配置文件或命令行参数来指定,可以根据需要在机器和数据中心间进行分配。序列号占用了 12 位,每生成一个ID时自增即可。

需要注意的是,如果在同一毫秒内生成的序列号超过了 4095,就需要等待下一毫秒才能继续生成ID,这意味着生成ID的效率会降低。因此,需要尽量保证生成ID的并发量不会太高,避免在同一毫秒内生成太多的ID。

你可能感兴趣的:(算法)