#work note# consistant hashing

需要做一个 account bucket,1% ~ 10% 与 10% ~ 20% 是不同的,

实现方法就是 对 account_id hash,然后 mod 100, 取余数,即此 account_id 对应的 account_bucket

 

最开始我的实现是,sha256(account_id)  --> 转换成 string  --> 获取string的hashCode() --> mod 100

问题是,hashcode这个 method, by contract, only guarantee the same object will always return same hashcode result under same JVM, 并不保证 across several JVM 情况下 仍然返回相同值。

另外一个就是,如果将来 Java 版本变了, 对于 hashcode 的实现变了,这样你的bucket也就变了。

解决办法 : 利用 sha256 返回的 byte[] 来构造数字,Guava 的 Ints 和 Longs class 有  fromByteArray() 的 method,可以把 byte[] 转换成 Integer / Long. 利用这个数字再去 mod 100,即可保证这个 account_bucket 永远都是相同值。

另外,看源码的时候,对于为什么 Ints.fromBytes 需要对 b* & 255 不理解,本来byte就只有8bits,

原因是 Java 实现  << 或者 & 的时候,会先将 byte 转换成 Int,

https://stackoverflow.com/questions/3948220/behaviour-of-unsigned-right-shift-applied-to-byte-variable

public static int fromBytes(byte b1, byte b2, byte b3, byte b4) {
    return b1 << 24 | (b2 & 255) << 16 | (b3 & 255) << 8 | b4 & 255;
  }
public static long fromBytes(byte b1, byte b2, byte b3, byte b4, byte b5, byte b6, byte b7, byte b8) {
    return ((long)b1 & 255L) << 56 | ((long)b2 & 255L) << 48 | ((long)b3 & 255L) << 40 | ((long)b4 & 255L) << 32 | ((long)b5 & 255L) << 24 | ((long)b6 & 255L) << 16 | ((long)b7 & 255L) << 8 | (long)b8 & 255L;
  }

 

你可能感兴趣的:(笔记)