crc32 散列均衡

应用场景中,需要让一些唯一的数据,散列均匀的分布在不同的桶中,或者hash槽中,从而可以验证一些AB test 场景。

 

public static void main(String[] args) {

        List list = Lists.newArrayList();
        List list0 = Lists.newArrayList();
        List list1 = Lists.newArrayList();
        List list2 = Lists.newArrayList();
        List list3 = Lists.newArrayList();
        Random random = new Random(10000);
        for (int i = 0; i < 100000; i++) {
            Integer ri = random.nextInt(10000);
            String input = ri + "";

            CRC32 crc32 = new CRC32();
            crc32.update(input.getBytes());
            long value = crc32.getValue();

            long a = value % 4;
            if (a == 0L) {
                list0.add(value);
            } else if (a == 1L) {
                list1.add(value);
            } else if (a == 2L) {
                list2.add(value);
            } else if (a == 3L) {
                list3.add(value);
            } else {
                list.add(value);
            }

        }


        BigDecimal bd = new BigDecimal("100000");
        System.out.println(list0.size()+" : "+ new BigDecimal(list0.size() + "").divide(bd));
        System.out.println(list1.size()+" : "+ new BigDecimal(list1.size() + "").divide(bd));
        System.out.println(list2.size()+" : "+ new BigDecimal(list2.size() + "").divide(bd));
        System.out.println(list3.size()+" : "+ new BigDecimal(list3.size() + "").divide(bd));
        
    }

桶数据:桶占比

25137 : 0.25137
24822 : 0.24822
25071 : 0.25071
24970 : 0.2497

 

推荐两篇不错的分析:
[hash] -- 分布均匀的hash函数

jump Consistent hash:零内存消耗,均匀,快速,简洁,来自Google的一致性哈希算法

散列函数与分流算法

你可能感兴趣的:(数据结构与算法)