大数据量处理问题的小结

大数据量处理总体思想:分而治之

set(easy)------>hashset(比较常见的做法,hash分治 然后hash统计 最后合并)-------->bitmap(占用空间最少但是限制条件多, 若用trie树,速度很快但是空间占用多,有些问题的话可以使用后缀树进行优化)---------->bloom filter(会出错)


你可能感兴趣的:(优化,filter)