位图算法解析-速度之巅

位图算法-速度之巅

问题:有很多不重复的整数, 其中最大值不超过40亿, 最小值是0.要求判断某个指定的整数, 是否在这个集合中,怎样才能以最快速度做出判断。

方法:位图算法
对于时间和空间来说是很难两全的,所以利用大的空间来让时间尽可能缩短。
1个字节代表8位。
使用2个字节,表示16个数(0-15)的状态(有或者没有)
在这里插入图片描述
如果数据为【5,1,7,15,0,4,6,10】,则存储状态为:
在这里插入图片描述

把存在的数标为1。
见代码

#include 
#include 

void init(char* data, int len) {
 // 根据实际需求来实现.
 // 这里只是为了测试后面的算法效果, 假设:
 // 能够被3整数的数, 都在这个集合中.[假设的需求]
 unsigned int n = len * 8; //一共有n个数据
 
 for (unsigned int i = 0; i < n; i++) {
  // 假设: 能够被3整数的数, 都在这个集合中.[假设的需求]
  if (i % 3 == 0) {
   //计算这个位对应哪个字节
   char* p = data + i / 8;
   *p = *p | (1 << (i % 8));
  }
 }
}

// 位图算法
bool check(char* data, int len, int value) {
 // 定位到指定的字节
 char* p = data + value / 8;
 
 // 判断这个字节中指定的位是否为1
 bool ret = *p & (1 << (value % 8));
 return ret;//若为0则该位就为0;
}

int main(void) {
 // 很配一块足够的内存, 用来表示位图
 unsigned int n = 4000000000;
 int len = n / 8 + 1;
 char* data = (char*)malloc(len);
 memset(data, 0, len); //全部初始化为0
 
 // 装载数据集合(只需要装载一次)
 init(data, len);
 
 while (1) {
  printf("请输入要检测的数: [输入-1退出] ");
  int value;
  
  scanf_s("%d", &value);
  if (value == -1) {
   break;
  }
  
  if (check(data, len, value)) {
   printf("%d在数据集合中\n", value);
  }else {
   printf("%d不在数据集合中\n", value);
  }
 }
 
 system("pause");
 return 0;
}

总结:对于位图算法来说主要考察的是对于位运算的操作,利用位或(|)来对对应数进行标记(位或运算无论什么数和0位或(|)都等于原来的数和1位或都等于1),利用位与(&)来判断是否被标记过(只有两个都为1才为1)。

你可能感兴趣的:(C++编程)