算法学习----位运算

布隆过滤器

不安全网页的黑名单包含100亿个黑名单网页,每个网页的URL最多占用64字节,现在想要实现一种网页过滤系统,可以根据网页的URL判断该网页是否在黑名单上,请设计该系统。
要求该系统允许有万分之一以下的判断失误率,并且使用的额外空间不要超过30G。

解决方法采用布隆过滤器
黑名单----存入>哈希表或者数据库
数量:100亿
单个url:64kB    那么应该需要640G的空间,不
符合要求。
生成布隆过滤器的过程:
算法学习----位运算_第1张图片
布隆过滤器的生成过程.png

你可能感兴趣的:(算法学习----位运算)