作者主页:进击的1++
专栏链接:【1++的数据结构】
上一节我们讲解了哈希表,简单的了解了哈希思想,这一节我们对哈希思想进行更深入的了解,对其应用进行学习。大家坐稳了,学习的快车又要发动了!!!
什么叫位图呢?
位图就是用每一位来存储一种状态。位是表示信息的最小单位,每一位存储一种状态,那么我们可以将每一位的状态与数据映射。那么便可以用较少的内存去处理海量的数据。通常用其判断某个数据存不存在。
接下来我们进行位图的实现:
来看代码:
template<size_t N>
class Bit_set
{
public:
Bit_set()
{
_bit_table.resize(N / 8 + 1, 0);
}
void set(const size_t& key)
{
//锁定位置
size_t i = key / 8;
size_t j = key % 8;
//将那一位置为1
_bit_table[i] |= (1 << j);
}
void reset(const size_t& key)
{
//锁定位置
size_t i = key / 8;
size_t j = key % 8;
//将那一位置为0
_bit_table[i] &= ~(1 << j);
}
bool test(const size_t& key)
{
//锁定位置
size_t i = key / 8;
size_t j = key % 8;
//检查那一位是否为1
return _bit_table[i] & (1 << j);
}
private:
vector<char> _bit_table;
};
总的思路就是开一个有N个位大小的空间(N应该比元素集合中的最大值还要大),然后将数据(整型)映射到位图中的位置:即第几个char中的第几位,然后将其进行置1,置0,或是检查那位是否为1。
void test2()
{
size_t N = 100;
Bit_set<100> s1;
int arr[] = { 1,5,3,7,0,10,9,8,3 };
for (auto& e : arr)
{
s1.set(e);
}
for (size_t i = 0; i < N; i++)
{
if (s1.test(i))
{
cout << i << endl;
}
}
}
void test3()
{
size_t N = 100;
Bit_set<100> s1;
Bit_set<100> s2;
int arr1[] = { 1,5,3,7,0,10,9,8,3 };
int arr2[] = { 1,10,3,7,11,10,2,8,4 };
for (auto& e : arr1)
{
s1.set(e);
}
for (auto& e : arr2)
{
s2.set(e);
}
for (size_t i = 0; i < N; i++)
{
if (s1.test(i) && s2.test(i))
{
cout << i << endl;
}
}
}
template<size_t N>
class two_bit
{
public:
void set(const size_t& key)
{
if (_bits1.test(key) == false && _bits2.test(key) == false)
{
_bits2.set(key);
_bits1.reset(key);
}
else if (_bits1.test(key) == false && _bits2.test(key) == true)
{
_bits1.set(key);
_bits2.reset(key);
}
else
{
_bits1.set(key);
_bits2.set(key);
}
}
bool test(const size_t& key)
{
return (_bits1.test(key) == true && _bits2.test(key) == false);
}
private:
Bit_set<N> _bits1;
Bit_set<N> _bits2;
};
void test3()
{
two_bit<100> t1;
int arr[] = { 1,4,6,2,3,7,9,10,2,6,2 };
for (auto& e : arr)
{
t1.set(e);
}
cout<<t1.test(2)<<endl;
cout << t1.test(6) << endl;
cout << t1.test(1) << endl;
}
什么是布隆过滤器?
布隆过滤器是用多个哈希函数,将一个数据元素映射到位图结构中。此方式不仅可以提升效率,也可以节省空间。
以下是布隆过滤器的实现:
template<class K,size_t N>
class BloomFilter
{
public:
void set(const K& key)
{
size_t len = N * 5;
size_t hash1 = DJBHash()(key) % len;
size_t hash2 = BKDRHash()(key) % len;
size_t hash3 = APHash()(key) % len;
_bitset.set(hash1);
_bitset.set(hash2);
_bitset.set(hash3);
}
void reset(const K& key)//普通的删除可能会影响其他值
bool test(const K& key)
{
size_t len = N * 5;
size_t hash1 = DJBHash()(key) % len;
size_t hash2 = BKDRHash()(key) % len;
size_t hash3 = APHash()(key) % len;
if (!_bitset.test(hash1))
return false;
if (!_bitset.test(hash2))
return false;
if (!_bitset.test(hash3))
return false;
return true;
}
private:
Bit_set<N* 5> _bitset;
};
布隆过滤器的优点及其缺陷:
缺点: