c++ 速度之巅-位图算法,上亿数据的快速操作

问题: 有很多不重复的整数,其中最大值不超过40亿,最小值是0,要求判断某个指定的整数,是否在这个集合中。


最快的算法:

使用位图算法

使用2个字节(一个字节八位),表示16个数(0-15)的状态(有或者没有)

 

如果数据为【5,1,7,15,0,4,6,10】,则存储状态为:

 

 存在把对应的位数设为1,不存在设为0 ;

c++ 速度之巅-位图算法,上亿数据的快速操作_第1张图片

//位图算法
bool check(char* data, int len, int value) {
	//定位到指定字节
	char* p = data + value / 8;

	// 判断这个字节中指定的位是否为1 与
	bool ret = *p & (1 << (value % 8));

	return ret;
}

void init(char* data, int len) {
	//根据实际需求来定义实现
	//这里只是为了测试后面的算法效果 假设:
	//能够被3整除的数 都在这集合中 
	
	unsigned int n = len * 8;//一共有n个数据

	for (unsigned int i = 0; i < n; i++) {
		if (i % 3 == 0) {
			//计算这个位对应哪个字节
			char* p = data + i / 8;
			*p = *p | (1 << (i % 8));//或操作 
		}
		else {

		}
	}

}

int main(void) {
	//分配一块足够的内存,用来表示位图
	//计算多少个字节 40亿 个数 
	unsigned int n = 4000000000;
	int len = n / 8 + 1;
	char* data = (char*)malloc(len);
	memset(data, 0, len);//清0

	//装载数据 集合(只需要装载一次)
	init(data,len);

	while (1) {
		printf("请输入要检查的数:[输入-1退出]");
		int  value;
		scanf_s("%d", &value);
		if (value == -1) {
			break;
		}
		if (check(data, len, value)) {
			printf("%d在数据集合中\n", &value);

		}
		else
		{
			printf("%d不在数据集合中\n", value);
		}

	}
	
	system("pause");

	return 0;
}

 

 

你可能感兴趣的:(算法,c++,数据结构)