127、说一下 亿级数据过滤算法 布隆过滤器(这个干货有点干)

布隆过滤器

  • 问题
  • 一种概率数据结构的方法
  • 更多改进
  • 一点理论
    • 操作
    • 哈希函数
  • 优点和缺点
    • 优点:空间效率
    • 优点:速度
    • 优点:可伸缩性
    • 缺点:概率数据结构
    • 缺点:不支持删除元素
    • 缺点:有限的调整大小功能
  • 实现
  • 使用
  • 替代方案
  • 总结

布隆过滤器(英语:Bloom Filter)是 1970 年由布隆提出的。它实际上是一个很长的二进制向量和一系列随机映射函数。主要用于判断一个元素是否在一个集合中。

通常我们会遇到很多要判断一个元素是否在某个集合中的业务场景,一般想到的是将集合中所有元素保存起来,然后通过比较确定。链表、树、散列表(又叫哈希表,Hash table)等等数据结构都是这种思路。但是随着集合中元素的增加,我们需要的存

你可能感兴趣的:(算法,布隆过滤器,分布式框架,数据结构)