有时我们不依赖于数据库中自动递增的字段产生唯一ID,比如多表同一字段需要统一一个唯一ID,这时就需要用程序来生成一个唯一的全局ID。
UUID
从Java 5开始, UUID 类提供了一种生成唯一ID的简单方法。UUID是通用唯一识别码 (Universally Unique Identifier)的缩写,UUID来源于OSF(Open Software Foundation,开源软件基金会)的DCE(Distributed Computing Environment,分布式计算环境)规范。UUID 的目的,是让分布式系统中的所有元素,都能有唯一的辨识资讯,而不需要透过中央控制端来做辨识资讯的指定。如此一来,每个人都可以建立不与其它人冲突的 UUID。
UUID是一个128bit的数字,也可以表现为32个16进制的字符(每个字符0-F的字符代表4bit),中间用"-"分割。
- 时间戳+UUID版本号: 分三段占16个字符(60bit+4bit),
- Clock Sequence号与保留字段:占4个字符(13bit+3bit),
- 节点标识:占12个字符(48bit),
UUID的唯一缺陷在于生成的结果串会比较长。
public class GenerateUUID {
public static final void main(String... args) {
// generate random UUIDs
UUID idOne = UUID.randomUUID();
UUID idTwo = UUID.randomUUID();
log("UUID One: " + idOne);
log("UUID Two: " + idTwo);
}
private static void log(Object object) {
System.out.println(String.valueOf(object));
}
}
结果为
UUID One: 6b193443-b95d-4462-9902-a6455ebc56d6
UUID Two: 4ef9b375-839b-4150-8f31-1ed85fab63fd
随机数的哈希值
此方法使用SecureRandom和MessageDigest:
- 启动时,初始化SecureRandom (这可能是一个冗长的操作)
- 使用 SecureRandom生成一个随机数
- 创建一个MessageDigest,使用某种摘要算法
- 将MessageDigest返回的byte[]编码为某种可接受的文本形式
- 检查结果是否已经被使用;如果尚未使用,则适合作为唯一标识符
MessageDigest类是适合于产生任意数据的“单向散列”。
public class GenerateId {
public static void main(String... arguments) {
try {
SecureRandom prng = SecureRandom.getInstance("SHA1PRNG");
String randomNum = Integer.valueOf(prng.nextInt()).toString();
MessageDigest sha = MessageDigest.getInstance("SHA-1");
byte[] result = sha.digest(randomNum.getBytes());
System.out.println("Random number: " + randomNum);
System.out.println("Message digest: " + hexEncode(result));
} catch (NoSuchAlgorithmException ex) {
System.err.println(ex);
}
}
static private String hexEncode(byte[] input) {
StringBuilder result = new StringBuilder();
char[] digits = {'0', '1', '2', '3', '4', '5', '6', '7', '8', '9', 'a',
'b', 'c', 'd', 'e', 'f'};
for (int idx = 0; idx < input.length; ++idx) {
byte b = input[idx];
result.append(digits[(b & 0xf0) >> 4]);
result.append(digits[b & 0x0f]);
}
return result.toString();
}
}
结果为
Random number: -2017013782
Message digest: 2c3bba8d4dbd3699648c5909685d21f9c64b6a8a
Twitter的snowflake
twitter的一个全局唯一id生成器,结果是一个long型的ID。
- 正数位(1bit):一个符号位,永远是0。
- 时间戳(41bit) :自从2012年以来的毫秒数,能撑139年。
- 自增序列(12bit,最大值4096):毫秒之内的自增,过了一毫秒会重新置0。
- DataCenter ID (5 bit, 最大值32):配置值,支持多机房。
- Worker ID ( 5 bit, 最大值32),配置值,一个机房里最多32个机器。
Snowflake算法的变化
Snowflake算法生成的唯一ID为long型数值,但如果想在应用中使用int类型的自增ID的话可以做些调整。
时间戳改为分钟(25bit),自增序列(7bit)。自增序列最大值128,在一分钟内会不够使用。可以采用预支方式取下一分钟。
此方式只适用于一个单体应用,不适合分布式系统。
/**
* @ClassName: SnowflakeIdWorker3rd
* @Description:snowflake算法改进
* @author: wanghao
* @date: 2019年12月13日 下午12:50:47
* @version V1.0
*
* 将产生的Id类型更改为Integer 32bit
* 把时间戳的单位改为分钟,使用25个比特的时间戳(分钟)
* 去掉机器ID和数据中心ID
* 7个比特作为自增值,即2的7次方等于128。
*/
public class SnowflakeIdWorker3rd {
/** 开始时间戳 (2019-01-01) */
private final int twepoch = 25771200;// 1546272000000L/1000/60;
/** 序列在id中占的位数 */
private final long sequenceBits = 7L;
/** 时间截向左移7位 */
private final long timestampLeftShift = sequenceBits;
/** 生成序列的掩码,这里为127 */
private final int sequenceMask = -1 ^ (-1 << sequenceBits);
/** 分钟内序列(0~127) */
private int sequence = 0;
private int laterSequence = 0;
/** 上次生成ID的时间戳 */
private int lastTimestamp = -1;
private final MinuteCounter counter = new MinuteCounter();
/** 预支时间标志位 */
boolean isAdvance = false;
// ==============================Constructors=====================================
public SnowflakeIdWorker3rd() {
}
// ==============================Methods==========================================
/**
* 获得下一个ID (该方法是线程安全的)
*
* @return SnowflakeId
*/
public synchronized int nextId() {
int timestamp = timeGen();
// 如果当前时间小于上一次ID生成的时间戳,说明系统时钟回退过这个时候应当抛出异常
if (timestamp < lastTimestamp) {
throw new RuntimeException(String.format(
"Clock moved backwards. Refusing to generate id for %d milliseconds", lastTimestamp - timestamp));
}
if(timestamp > counter.get()) {
counter.set(timestamp);
isAdvance = false;
}
// 如果是同一时间生成的,则进行分钟内序列
if (lastTimestamp == timestamp || isAdvance) {
if(!isAdvance) {
sequence = (sequence + 1) & sequenceMask;
}
// 分钟内自增列溢出
if (sequence == 0) {
// 预支下一个分钟,获得新的时间戳
isAdvance = true;
int laterTimestamp = counter.get();
if (laterSequence == 0) {
laterTimestamp = counter.incrementAndGet();
}
int nextId = ((laterTimestamp - twepoch) << timestampLeftShift) //
| laterSequence;
laterSequence = (laterSequence + 1) & sequenceMask;
return nextId;
}
}
// 时间戳改变,分钟内序列重置
else {
sequence = 0;
laterSequence = 0;
}
// 上次生成ID的时间截
lastTimestamp = timestamp;
// 移位并通过或运算拼到一起组成32位的ID
return ((timestamp - twepoch) << timestampLeftShift) //
| sequence;
}
/**
* 返回以分钟为单位的当前时间
*
* @return 当前时间(分钟)
*/
protected int timeGen() {
String timestamp = String.valueOf(System.currentTimeMillis() / 1000 / 60);
return Integer.valueOf(timestamp);
}
// ==============================Test=============================================
/** 测试 */
public static void main(String[] args) {
SnowflakeIdWorker3rd idWorker = new SnowflakeIdWorker3rd();
for (int i = 0; i < 1000; i++) {
long id = idWorker.nextId();
System.out.println(i + ": " + id);
}
}
}
public class MinuteCounter {
private static final int MASK = 0x7FFFFFFF;
private final AtomicInteger atom;
public MinuteCounter() {
atom = new AtomicInteger(0);
}
public final int incrementAndGet() {
return atom.incrementAndGet() & MASK;
}
public int get() {
return atom.get() & MASK;
}
public void set(int newValue) {
atom.set(newValue & MASK);
}
}