经验总结1

之前想查找用户id是否已经在我们的系统中出现,这时不想通过查数据库来判断,只能放在内存中快速判断

首先想到的是使用bloomFilter,进行hash4次,分别放入bloom的bit位,置1。由于bloomFilter是有误差在里面

所以为了降低误差率,采用1:8的桶,即10亿的用户需要10*8亿个bit位,误差率还有约2%

。。。。。。。。。。。。

改进:

有userid是数字,且不具有重复性,所以判断用户是否在系统的时候,

采用10亿的数组,uid当做下标数组,这样10亿个bit就行, 且无误差

 

 

.....................

你可能感兴趣的:(总结)