命由己造～

【C++】位图+哈希切割+布隆过滤器

文章目录

一、位图
- 1.1 位图概念
- 1.2 位图实现
- - 1.2.1 把x对应比特位0置1
  - 1.2.2 把x对应比特位1置0
  - 1.2.1 查看x对应比特位
- 1.3 位图源码
- 1.4 位图的应用
二、哈希切割（处理海量数据）
三、布隆过滤器
- 3.1 布隆过滤器的概念
- 3.2 布隆过滤器的应用场景
- 3.3 布隆过滤器的实现
- - 3.3.1 布隆过滤器长度的设置
  - 3.3.2 插入操作
  - 3.3.3 查找操作
  - 3.3.4 误判测试
  - 3.3.5 布隆过滤器删除
- 3.4 布隆过滤器的应用

一、位图

先看一道例题：
给40亿个不重复的无符号整数，没排过序。给一个无符号整数，如何快速判断一个数是否在这40亿个数中？

首先要知道，1G约等于10亿字节
那么40亿个整形就是160亿个字节，约等于16G。
【遍历或者排序+二分】 他们都需要存入数组中，但是内存没有空间能够创建16G大小的数组。（❌）
【红黑树和哈希】 红黑树不仅要存放数字，还得存放指针。（❌）
而哈希表也要存放指针和负载因子。（❌）

1.1 位图概念

【位图】 数据是否在给定的整形数据中，结果是在或者不在，刚好是两种状态，我只需要判断在还是不在即可。那么可以使用一个二进制比特位来代表数据是否存在的信息，如果二进制比特位为1，代表存在，为0代表不存在。（✔）

我们知道无符号整数的范围是0 ~ 2^32 - 1，所以我们开一个2^32大小的数组。也就是2^32个比特位，因为一个整形是32个比特位，所以用位图开出的空间大小为：16G/32 = 0.5G = 512M。

接下来我们就可以使用直接定址法是几就在第几个位置把该比特位置为1。

而我们开int类型和char类型都无所谓，如果是char，就是8个比特位，第一个元素就可以表示0 ~ 7，第二个元素则表示8 ~ 15。如果是int类型就是32个比特位，第一个元素就可以表示0 ~ 31，第二个元素则表示32 ~ 63。

当我们要查找一个值x的时候，我们需要知道它在第几个元素的第几个比特位上，怎么办呢？
【char】在第x/8个元素上。在该元素的第x%8个比特位上。
【int】在第x/32个元素上。在该元素的第x%32个比特位上。

1.2 位图实现

这里我们使用vector类型的位图。
那么我们首先就要初始化好：把每个比特位都置为0，那么vector开多大呢？

我们可以使用非类型模板参数，template ，那么我们就要开N / 8 + 1大小的空间。

template <size_t N>
class BitSet
{
public:
	BitSet()
	{
		_bits.resize(N / 8 + 1, 0);
	}
private:
	vector<char> _bits;
};

1.2.1 把x对应比特位0置1

我们按照上面说的/8和%8获得具体位置，加下来我们需要把这个位置置为1，其他位置不变，我们可以把1左移然后|=运算。
有人可能会如果是int类型，就跟大小端有关系，其实不管是大端还是小端。

左移是向高位移动
右移是向低位移动

void set(size_t x)
{
	size_t i = x / 8;
	size_t j = x % 8;
	_bits[i] |= (1 << j);
}

1.2.2 把x对应比特位1置0

我们只能把x对应的比特位变成0，其他位置不能变，那么我们可以先用上面的方法找到位置，然后将1左移然后先取反再&=运算

void reset(size_t x)
{
	size_t i = x / 8;
	size_t j = x % 8;
	_bits[i] &= (~(1 << j));
}

1.2.1 查看x对应比特位

还是按照上面的方法找到具体位置后，把1左移到该位置，返回两个&的结果。

bool search(int x)
{
	size_t i = x / 8;
	size_t j = x % 8;
	return _bits[i] & (1 << j);
}

1.3 位图源码

namespace yyh
{
	template <size_t N>
	class BitSet
	{
	public:
		BitSet()
		{
			_bits.resize(N / 8 + 1, 0);
		}

		void set(size_t x)
		{
			size_t i = x / 8;
			size_t j = x % 8;
			_bits[i] |= (1 << j);
		}

		void reset(size_t x)
		{
			size_t i = x / 8;
			size_t j = x % 8;
			_bits[i] &= (~(1 << j));
		}

		bool search(int x)
		{
			size_t i = x / 8;
			size_t j = x % 8;
			return _bits[i] & (1 << j);
		}
	private:
		std::vector<char> _bits;
	};
}

上面就是为了开辟42亿个比特的大小，因为-1的无符号数字就是2^32 - 1，当然也可以写成0xffffffff。
验证一下所占内存大小：

1.4 位图的应用

【第一题】
给定100亿个整数，设计算法找到只出现一次的整数？

这里的关键是注意到只出现一次，这样我们就可以列出三种状态：
1️⃣ 出现0次
2️⃣ 出现1次
3️⃣ 出现1次以上
我们只需要两个比特位就可以表示出三个状态。
上面的位图是用一个位图中的一个比特位标定一个数字出没出现，那么这里我们可以用两个位图的两个比特位标定一个数字出现次数。
假如现在是看0这个数字：

template <size_t N>
class TwoBitSet
{
public:
	void set(size_t x)
	{
		if (!_b1.search(x) && !_b2.search(x))// 00
		{
			_b2.set(x);// 01
		}
		else if (!_b1.search(x) && _b2.search(x))// 01
		{
			_b1.set(x);
			_b2.reset(x);// 10
		}
		// 10不变
	}

	void PrintOnce()
	{
		for (size_t i = 0; i < N; i++)
		{
			if (!_b1.search(i) && _b2.search(i))
				std::cout << i << std::endl;
		}
	}

private:
	BitSet<N> _b1;
	BitSet<N> _b2;
};

【第二题】
给两个文件，分别有100亿个整数，我们只有1G内存，如何找到两个文件交集？

思路一： 先把一个位图中的数据放入位图中，然后遍历另一个文件寻找，找出交集。
但是有可能会出现重复元素，要注意去重。
思路二： 两个文件的元素放进两个位图中，放进去的过程就各自去重了，然后两个&运算即可判断是否有交集。

【第三题】
1 个文件有 100 亿个 int，1G内存，设计算法找到出现次数不超过2次的所有整数

这个题跟第一题类似，可以分为四种状态：
1️⃣ 出现0次
2️⃣ 出现1次
3️⃣ 出现2次
4️⃣ 出现3次以上
所以一样可以用两个位图表示四种状态。

【第四题】
给一个超过100G大小的log file，log中存着IP地址，设计算法找到出现次数最多的IP地址

这里就不能用位图了，因为位图的作用是统计在不在，统计次数还得使用map。
我们可以把文件切分成多个小文件，这里的切分也是有讲究的，如果平均切分，在每个小文件统计的话结果不正确，因为可能一个IP有多份分在多个文件。而我们map统计完一个小文件就要清空再统计下一个文件，不然内存不够用。
所以这里我们需要使用哈希切割。

二、哈希切割（处理海量数据）

前面我们学过为了实现哈希映射，我们需要一个哈希函数，这里我们也可以使用哈希函数把IP转为整型。比方说我们分成了100份小文件，idx = HashFunc(IP) % 100，idx是几就把它放进几号文件中。

我们可以把每个小文件理解为一个哈希桶。
这样不一样的IP可能分进同一个小文件中，但是同一个IP一定会分进同一个小文件。

这里还可能出现一个情况：其中一个小文件的大小可能超过1G（假设超过1G就不够了）。
而超过了1G也有有两种情况：

1️⃣ 不重复的IP很多，map需要很多节点，统计不下。
2️⃣ 重复的IP很多，map不需要很多节点，统计的下。

针对第一种情况，我们可以换个哈希函数递归切分。
但是这种方法对情况二无效，因为相同的IP太多，照样会切分超过1G。

所以综合考虑可以这样统计：

不管是啥情况，都直接用map统计，如果是第二种情况就直接统计完成了。如果是第一种情况，会insert失败，我们可以捕获异常，此时再去换个哈希函数递归切分。

三、布隆过滤器

通过上面的讲解我们可以看出
位图的优点是节省空间和效率高
缺点是要求范围相对集中，而且只能是整型。

而如果是字符串我们想使用位图，就可以使用哈希函数转成整型。
这里就会有一种情况，不同的字符串可能转换成同一个整型。 会导致误判。

存在是不准确的，如果只有str1和str2，而str3映射的位置跟str2重了，就会导致原本不在的元素误判成在。

那我们如何降低误判率呢？答案是使用布隆过滤器。

3.1 布隆过滤器的概念

它的主要思想是让一个值映射多个位置。我们可以使用多个哈希函数，多映射几个位置，这里假设有两个哈希函数，映射两个位置。

这样我们要看str2是否存在，必须要同时指向红色和绿色才能判断为存在。

所以布隆过滤器的作用就是降低误判率。映射的位置越多，误判率越低。
但是这里映射的位置也不能太多，映射的多，占的空间也多，找的次数也多，我们使用位图这样的方式就是为了提高效率并且节省空间。映射的多了也就没那么节省空间了。

3.2 布隆过滤器的应用场景

【场景一】
当我们要写一个注册系统的时候，我们注册昵称的时候不能跟别人重复，此时我们就可以采用布隆过滤器，如果不在那么就是准确的，一定不存在。但是如果显示存在，则有可能是误判。因为布隆过滤器中如果存在可能会误判，可以到数据库中再次查询昵称号码存不存在。

有人可能问这有必要加一个布隆过滤器吗？

假设现在来了100不存在的值，大部分都会显示不存在，只有很小一部分会误判为存在，这样没有误判的大部分效率大大提高。

【场景二】
我们在访问网站的时候有时候会出现风险网站。我们可以把这些网页加入黑名单，在我们访问网站之前就先经过布隆过滤器，有风险就可以快速的判断。

3.3 布隆过滤器的实现

布隆过滤器最常见的是string类型。 这里要给一个非类型模板参数N以确定开的空间有多大，这里我们写三个哈希函数。而字符串转整型的哈希函数有很多：
各种字符串Hash函数

这里我们就取里面效率较高的三个：

struct BKDRHash
{
	size_t operator()(const std::string& s)
	{
		size_t value = 0;
		for (auto ch : s)
		{
			value *= 31;
			value += ch;
		}
		return value;
	}
};

struct APHash
{
	size_t operator()(const std::string& s)
	{
		size_t hash = 0;
		for (long i = 0; i < s.size(); i++)
		{
			if ((i & 1) == 0)
			{
				hash ^= ((hash << 7) ^ s[i] ^ (hash >> 3));
			}
			else
			{
				hash ^= (~((hash << 11) ^ s[i] ^ (hash >> 5)));
			}
		}
		return hash;
	}
};

struct DJBHash
{
	size_t operator()(const std::string& s)
	{
		size_t hash = 5381;
		for (auto ch : s)
		{
			hash += (hash << 5) + ch;
		}
		return hash;
	}
};

3.3.1 布隆过滤器长度的设置

关于长度的问题这里有专门的文章进行讲述：
详解布隆过滤器的原理
里面有一个公式：

这里n我们是知道的，假设k是3，ln2约等于0.7，最后得到m=4.2*n，所以布隆过滤器多一个数据要开大约4.2个比特位，我们直接按加入一个数据开5个比特位算。

template<size_t N,
class K = std::string,
class HashFunc1 = BKDRHash,
class HashFunc2 = APHash,
class HashFunc3 = DJBHash>
class BloomFilter
{
public:
private:
	std::bitset<N * 5> _bs;
};

3.3.2 插入操作

大致思路跟我们上面的位图一样，这里我们使用库里的函数bitset头文件：#include 而set函数库里面已经帮我们实现好了：

void set(const K& x)
{
	size_t idx1 = HashFunc1()(x) % (5 * N);
	size_t idx2 = HashFunc2()(x) % (5 * N);
	size_t idx3 = HashFunc3()(x) % (5 * N);
	_bs.set(idx1);
	_bs.set(idx2);
	_bs.set(idx3);
}

3.3.3 查找操作

这里只要有一处不在那么就返回false，全部都在才能返回true。

bool test(const K& x)
{
	size_t idx1 = HashFunc1()(x) % (5 * N);
	if (!_bs.test(idx1))
	{
		return false;
	}
	size_t idx2 = HashFunc2()(x) % (5 * N);
	if (!_bs.test(idx2))
	{
		return false;
	}
	size_t idx3 = HashFunc3()(x) % (5 * N);
	if (!_bs.test(idx3))
	{
		return false;
	}
	return true;
}

3.3.4 误判测试

std::string arr[] = { "北京", "武汉", "广州", "上海", "北京", "北京", "广州",
	"上海", "上海" };
		BloomFilter<10> bs;
		for (auto& e : arr)
		{
			bs.set(e);
		}
		for (auto& e : arr)
		{
			std::cout << bs.test(e) << std::endl;
		}
		std::cout << std::endl;

结果没有问题，接下来我们测试误判，加上：

// 测试误判
srand(time(0));
for (auto& e : arr)
{
	std::cout << bs.test(e + std::to_string(rand())) << std::endl;
}

可以看到出现了误判。

3.3.5 布隆过滤器删除

布隆过滤器一般不能支持删除，因为一个位置可能被多个值映射，删除以后可能把别人的也删掉了。

那么我们能不能强制支持删除呢？

我们可以去计数，有几个值映射计数器就是几，删除了就让当前位置的计数器--。
但是使用计数又会有问题：因为不知道计数器的范围，所以不能开的太小的比特位，导致使用过多内存。

3.4 布隆过滤器的应用

【第一题】
给两个文件，分别有100亿个query，我们只有1G内存，如何找到两个文件交集？分别给出精确算法和近似算法。（query就是sql语句，可以理解为一个字符串。，也可能是网络请求url，也就是网址）

近似算法我们直接使用布隆过滤器，将一个文件的query语句放进布隆过滤器里，然后另一个文件查找在不在就是交集。虽然有误判：不存在的也被当做交集。但是作为近似算法还是可行的。
而精确算法就得用到前面的哈希切割。同时把两个文件都切分成数个小文件，在编号相同的小文件查看交集即可，最后注意去重。

运行c程序报preLaunchTask“C/C++: gcc 生成活动文件“已终止，退出代码为 -1。如若123 c语言 c++开发语言
出现preLaunchTask“C/C++:gcc生成活动文件"已终止，退出代码为-1错误，意味着编译任务在运行时失败。为了解决这个问题，我们可以从以下几个方面检查和修复问题：1.检查tasks.json配置确保tasks.json配置正确，尤其是源文件路径、编译命令和选项。你可以参考以下完整的tasks.json示例：{"version":"2.0.0","tasks":[{"type":"cp
c++ 设置Collision 使用自定义ObjectChannel yblackd c++ue5 unreal engine
c++设置Collision使用自定义ObjectChannel1.定义自定义的ObjectChannel2.在代码中设置UStaticMeshComponent使用自定义的ObjectChannel3.在Actor或Component中使用4.注意事项5.遍历所有ObjectChannels5.1说明1.定义自定义的ObjectChannel在UnrealEngine中，自定义的ObjectCh
C++三连击（升级版）问题 D20120131 c++开发语言
题目：题解&解析：这个是一种比较简单粗暴的方法，主体思想时用循环枚举标准数，再根据比例确定三个数，并加以判断是否符合标准。首先定义变量，如上，i为标准数，j用来进行与使用数字相关的循环判断操作，num1，num2，num3为结果的三个数，x，b，c分别为A，B，C，以及标记变量flag并赋值0，最后是一个a数组，用来进行与使用数字相关的循环判断操作。输入之后，用一个循环枚举标准数，再表示出三个答案
设计模式-桥接模式 C++ 星星典典设计模式 c++桥接模式
一、简介1、什么是桥接模式桥接（Bridge）是用于把抽象化与实现化解耦，使得二者可以独立变化。这种类型的设计模式属于结构型模式，它通过提供抽象化和实现化之间的桥接结构，来实现二者的解耦。需要注意的是，这里面说的抽象化和实现化并不是指抽象基类和具体派生类的关系。即桥接模式的目的并不是把抽象基类和具体派生类进行分离。而是指把问题的具体特质分离出来，以关联的关系加入对象的实例化过程。可以结合下面的桥接
23种设计模式-桥接(Bridge)设计模式萨达大软考中级-软件设计师设计模式 java C++桥接模式结构型设计模式软考软件设计师
文章目录一.什么是桥接设计模式？二.桥接模式的特点三.桥接模式的结构四.桥接模式的优缺点五.桥接模式的C++实现六.桥接模式的Java实现七.代码解析八.总结类图：桥接设计模式类图一.什么是桥接设计模式？桥接模式（BridgePattern）是一种结构型设计模式，用于将抽象部分与实现部分分离，使它们可以独立地变化。通过桥接模式，抽象层和实现层之间的耦合度被降低，从而使系统具有更好的灵活性和可扩展
【数据结构】最有效的实现栈和队列的方式（C&C++语言版）大名顶顶数据结构数据结构 c语言 c++程序员计算机编程软件开发
在这个技术飞速发展的时代，掌握基础的数据结构知识是每个程序员必不可少的技能。本文将深入探讨栈和队列这两种线性数据结构，带你了解它们在实际编程中的应用以及如何用C/C++代码实现这些结构的核心操作。我们不仅讲解了栈的后进先出（LIFO）和队列的先进先出（FIFO）原理，还通过实例展示了如何将这两种数据结构结合起来，提升编程效率和解决实际问题的能力⚙️。不论你是编程新手还是经验丰富的开发者‍，本文都将
lua语言你一身傲骨怎能输 Lua语言 lua
Lua是一种轻量级、高效的脚本语言，广泛应用于游戏开发、嵌入式系统和其他需要灵活性和可扩展性的应用程序中。以下是关于Lua语言的一些基本信息和特点：1.特点轻量级：Lua的设计目标是简单和高效，核心库非常小，适合嵌入到其他应用程序中。高效：Lua具有高效的执行速度，适合实时应用程序，如游戏。可扩展性：Lua允许用户通过C/C++扩展其功能，能够与其他语言和库进行无缝集成。动态类型：Lua是动态类型
数据挖掘中的关联规则--面向频繁项集的A-Priori算法绒绒毛毛雨大数据挖掘算法数据挖掘 python
文章目录一、频繁项集与关联规则学习1.实体与关系2.支持度与频繁项集3.关联规则二、寻找频繁项集1.频繁项集发现的挑战三角矩阵项对计数值的三元组存储方法2.频繁项集的单调性3.面向项对的A-Priori算法4.PCY算法哈希表创建第二遍扫描5、多阶段算法6、多哈希算法7、随机化算法8、SON算法9、Toivonen算法三、频繁项集小实践：消费者购买记录模拟数据示例具体问题分析一、频繁项集与关联规则
Ｑt C++设计模式-＞桥接模式多喝热水-多读书 c++设计模式桥接模式 qt
桥接模式简介桥接模式（BridgePattern）是一种结构型设计模式，它将抽象部分与它的实现部分分离，使它们都可以独立地变化。桥接模式通过组合的方式来代替继承，使得系统可以在多个维度上独立变化。它非常适合用于需要在多个层次上扩展和变化的场景。桥接模式的应用场景假设你在开发一个跨平台的Qt应用程序，需要处理不同类型的设备（比如手机、平板、PC），并且还需要支持不同的操作系统（比如Windows、M
C++实现设计模式---建造者模式 (Builder) 计算机小混子设计模式 c++设计模式建造者模式
建造者模式(Builder)建造者模式是一种创建型设计模式，它将一个复杂对象的构建与表示分离，使得同样的构建过程可以创建不同的表示。意图将复杂对象的创建过程分步骤完成，并允许以不同方式构建其各部分。提供灵活的方式构造对象，而无需关心其内部细节。使用场景创建复杂对象：当对象的创建需要很多步骤或参数时，使用建造者模式可以简化代码。需要多个构建版本：如同一个对象可能有不同的表示形式，但它们共享相同的构建
C++设计模式——Bridge桥接模式程序员与背包客_CoderZ C/C++设计模式 c++设计模式开发语言 c语言 linux 桥接模式
一，桥接模式简介桥接模式是一种结构型设计模式，用于将抽象与实现分离，这里的"抽象"和"实现"都有可能是接口函数或者类。桥接模式让抽象与实现之间解耦合，使得开发者可以更关注于实现部分，调用者(Client)可以更关注于抽象部分。桥接模式可以将一个复杂的类进行拆分为好几个类，开发者可以修改其中任意一个类的实现，而不影响其他类的正常运行，该模式可以降低代码的维护工作量，降低代码风险。桥接模式的核心就是：
C++实现设计模式---桥接模式 (Bridge) 计算机小混子设计模式 c++设计模式桥接模式
桥接模式(Bridge)桥接模式是一种结构型设计模式，它通过将抽象部分与实现部分分离，使它们可以独立变化。桥接模式的核心思想是使用组合（而非继承）来扩展功能。意图将抽象部分与实现部分分离，使它们都可以独立地变化。解决继承层次过深的问题，避免类的爆炸式增长。使用场景系统需要在抽象和实现之间解耦：抽象和实现之间需要独立变化，使用继承会导致代码的复杂性上升。避免类的数量爆炸：系统中有多维度变化的对象（如
C、C++ 和 C# 编程语言的比较和联系 lisanndesu c语言 c++c#
导语：C、C++和C#是三种不同的编程语言，它们在语法、特性和应用领域等方面有着一些联系和区别。本文将深入探讨这三种语言之间的关系，并比较它们的特点和适用场景，以帮助开发者选择合适的编程语言。1.C、C++和C#简介C：C是一种过程化编程语言，由DennisRitchie在1972年开发。它主要用于系统级编程和性能要求较高的应用程序开发。C++：C++是在C语言基础上扩展而来的语言，由Bjarne
【C++】初学者的浪漫编程指南星霜旅人 C++c++
少年不惧岁月长，彼方尚有荣光在。前言这是我自己学习C++的第一篇博客总结。后期我会继续把C++学习笔记开源至博客上。C++的兼容性1.C++兼容绝大多数C语言的语法，因此只需要把.c后缀文件改为.cpp即可。2.VS编译器看到是.cpp就会调用C++编译器编译。#define_CRT_SECURE_NO_WARNINGS#includeintmain(){printf("helloworld\n"
信息学奥赛c++语言:求分数序列和敲代码的八戒信息学奥赛c++c++算法开发语言数据结构
题目描述有一个分数序列q1/p1，q2/p2，q3/p3，q4/p4，q5/p5，....,其中q(i+1)=qi+pi，p(i+1)=qi，p1=1，q1=2。比如这个序列前6项分别是2/1,3/2,5/3,8/5,13/8,21/13,求这个分数序列的前n项之和。输入输入有一行，包含一个正整数n(n≤30)。输出输出有一行，包含一个浮点数，表示分数序列前n项的和，精确到小数点后4位。样例输入2
C++学生学籍管理系统开发详解悦闻闻
本文还有配套的精品资源，点击获取简介：学生学籍管理系统是高校或教育机构中管理学生信息的重要工具。本项目详细介绍基于C++实现该系统的关键技术和方法。从面向对象编程、数据结构的选择，到数据库操作、运算符重载、文件I/O处理、用户界面设计、异常处理，以及单元测试等，系统地覆盖了构建高效、稳定学籍管理系统的全过程。1.面向对象编程基础面向对象编程（OOP）是现代编程范式的核心，它允许开发者通过类和对象来
C++练习(5道) c++初学者ABC C++c++C++练习
今天来练习一下C++（有错请指出）1.练50.1查分程序题目描述尼克，格莱尔等5位同学进行了一次信息学测试，试编一程序，实现查分功能。先输入成绩，然后输入学号输入相应的成绩。输入a1∼a5的成绩，并输入学号1∼5。输出输出该学号成绩样例输入复制999899100923样例输出复制99思路：输入a数组，输入x，输出a[x-1];代码：#includeusingnamespacestd;intmain
模拟法练习C++ 1 c++初学者ABC C++c++开发语言算法
有错请指出！对于模拟法，百度定义是其实，没有这么麻烦，也就是题目是什么，我们就怎么写，也可以说它是不是算法的算法，最好把代码模块化特点：1.题目简单，代码量很大2.不好找错误3.在比赛中经常考4.代码灵活下面是几道例题1.扑克游戏题目描述三张扑克牌比大小，每个人从扑克牌中抽取三张牌，然后进行比较，规则如下：点数规则：A为最小，K为最大。A记为1点，JQK分别记为11点、12点、13点。比较规则：最
素数筛法C++ c++初学者ABC C++c++算法开发语言
众所周知，素数筛法许多种，今天我来比较时间。都是1e7以内的素数。话不多说，开始比较（有错请指出）：1.暴力法：一个一个枚举#includeusingnamespacestd;boolisPrime(longlongnum){for(longlongi=2;iusingnamespacestd;boolisPrime(longlongnum){for(longlongi=2;i*i1）标记为非素数
[C++技能提升]类注册 Hunter_pcx 工程技能人工智能 c++
最近在做AI信息在各个平台流转的框架设计，想要设计一种可以灵活扩展、不改变原有代码的框架，了解到了类注册。具体需求是这样的：AI算法在客户本地电脑和云端都有部署，原先AI在这两个平台下的输出格式并不统一，且每个AI功能都有自己的输出格式，导致两个平台下的AI信息无法共享，带来了计算资源的浪费，管理起来也比较混乱，因此需要一种模式将所有AI输出规范起来。我的解决思路大概就是将所有AI信息都规范输出到
OpenGL C++视频中添加图片及文字水印播放并录制 Everbrilliant89 音视频开发 OpenGL相关 OpenGL 图片水印 OpenGL 视频图片文字水印 OpenGL 文字水印 OpenGL视频水印录制 OpenGL视频水印播放 GL视频中绘制图片文本水印视频水印录制
一.前言：GitHub地址：GitHub-wangyongyao1989/WyFFmpeg:音视频相关基础实现系列文章：1.OpenGLTextureC++预览Camera视频；2.OpenGLTextureC++CameraFilter滤镜;3.OpenGL自定义SurfaceViewTextureC++预览Camera视频;4.OpenGLTextureC++CameraFilter滤镜视频录
华为OD机试常见类型题目的C++ 代码实现（二）请向我看齐 c和指针华为od c++开发语言
最长公共子序列（LCS）#include#includeusingnamespacestd;//函数功能：计算两个序列的最长公共子序列的长度//参数seq1：第一个序列//参数seq2：第二个序列intlongestCommonSubsequence(vector&seq1,vector&seq2){intm=seq1.size();intn=seq2.size();//创建二维动态数组dp，用于
激光线扫标定和相机标定：中高级C++程序员与计算机视觉工程师的指南 m0_57781768 数码相机 c++计算机视觉
激光线扫标定和相机标定：中高级C++程序员与计算机视觉工程师的指南简介在计算机视觉和机器人领域，激光标定和相机标定是实现高精度测量和检测的关键技术。激光线扫标定和相机标定在许多应用中都是必不可少的，如自动驾驶、工业检测、三维重建等。本文将详细介绍激光线扫标定和相机标定的基本概念、实现细节以及常见问题的解决方案。目标读者为中高级C++程序员和计算机视觉工程师，文章将提供详细的技术细节和代码示例，确保
由于直接展示多种编程语言的全套游戏代码会相当冗长，我将为你概述一个简单的小游戏——猜数字游戏，并用几种流行的编程语言（Python, JavaScript, C++, Java）给出其核心逻辑的代码片 IsaacHornby 游戏 python javascript
Python版本ftinc.cnPython版本非常直观，适合初学者。pythonimportrandomdefguess_number_game():number_to_guess=random.randint(1,100)guess=Noneattempts=0print("我想了一个1到100之间的数字，你能猜到是哪个吗？")whileguess!=number_to_guess:try:g
GL C++显示相机YUV视频数据使用帧缓冲FBO后期处理，实现滤镜功能。 Everbrilliant89 OpenGL相关音视频开发音视频 OpenGL图片水印 OpenGL文字水印 OpenGL帧缓冲 OpenGL离屏渲染（OSR）OpenGL FBO OpenGL图像合成
一.前言：GitHub地址：GitHub-wangyongyao1989/WyFFmpeg:音视频相关基础实现系列文章：1.OpenGLTextureC++预览Camera视频；2.OpenGLTextureC++CameraFilter滤镜;3.OpenGL自定义SurfaceViewTextureC++预览Camera视频;4.OpenGLTextureC++CameraFilter滤镜视频录
QT 笔记繁缕怀夕 QT 笔记
本文详述了QT的基础应用，其中包括基础控件应用、多线程等工具类使用、以及显示2D、3D图像等功能，适用于C++和计算机视觉领域的开发者。1、基础控件QLineEditQComboBoxQMenuQToolBar2、基础功能2.1、多线程线程QThread2.2、多语言静态显示动态切换3、QChart4、QGraphicsView5、PCL之VTK
SQL实现md5加密方法 m0_74824002 面试学习路线阿里巴巴 sql 数据库
1.MD5加密概述MD5(MessageDigestAlgorithm5)是一种广泛使用的哈希算法，它将输入的字符串（或数据）转换为固定长度的128位（16字节）哈希值。MD5的主要特点是：不可逆性：MD5是一种单向哈希算法，这意味着你无法从MD5哈希值还原出原始数据。输出固定长度：无论输入数据的长度如何，MD5输出的哈希值始终是32个字符的十六进制数（128位）。碰撞性：虽然MD5很长时间被广泛
C++ —— 智能指针 unique_ptr （上）奶香臭豆腐 c++开发语言学习
C++——智能指针unique_ptr（上）普通指针的不足普通指针的释放智能指针智能指针unique_ptr智能指针初始化错误用法get()方法返回裸指针智能指针不支持指针的运算（+、-、++、--）普通指针的不足new和new[]的内存需要用delete和delete[]释放（堆区的内存一定要手工释放，否则会发生内存的泄露）；程序员主观上的失误，忘记或漏掉释放；不确定何时释放。普通指针的释放类内
visual studio中属性管理器常用配置通信.萌新 visual studio ide
VC++：包含目录：头文件的目录(修改了系统的include，属于全局的)库目录：lib文件的目录C/C++常规：附加包含目录：.h头文件的目录(只可以用在当前项目)链接器：常规附加库目录：lib文件的目录附加依赖项：lib库名称
gesp(C++六级)（3）洛谷：B3873：[GESP202309 六级] 小杨买饮料王老师青少年编程 GESP(C++六级)真题题解 c++开发语言 csp 算法数据结构 gesp
gesp(C++六级)（3）洛谷：B3873：[GESP202309六级]小杨买饮料题目描述小杨来到了一家商店，打算购买一些饮料。这家商店总共出售NNN种饮料，编号从000至N−1N-1N−1，其中编号为iii的饮料售价cic_ici元，容量lil_ili毫升。小杨的需求有如下几点：小杨想要尽可能尝试不同种类的饮料，因此他希望每种饮料至多购买111瓶；小杨很渴，所以他想要购买总容量不低于LLL的饮
怎么样才能成为专业的程序员？ cocos2d-x小菜编程 PHP
如何要想成为一名专业的程序员？仅仅会写代码是不够的。从团队合作去解决问题到版本控制，你还得具备其他关键技能的工具包。当我们询问相关的专业开发人员，那些必备的关键技能都是什么的时候，下面是我们了解到的情况。关于如何学习代码，各种声音很多，然后很多人就被误导为成为专业开发人员懂得一门编程语言就够了？！呵呵，就像其他工作一样，光会一个技能那是远远不够的。如果你想要成为
java web开发高并发处理 BreakingBad java Web 并发开发处理高
java处理高并发高负载类网站中数据库的设计方法（java教程,java处理大量数据，java高负载数据）一：高并发高负载类网站关注点之数据库没错,首先是数据库,这是大多数应用所面临的首个SPOF。尤其是Web2.0的应用，数据库的响应是首先要解决的。一般来说MySQL是最常用的，可能最初是一个mysql主机，当数据增加到100万以上，那么，MySQL的效能急剧下降。常用的优化措施是M-S（
mysql批量更新 ekian mysql
mysql更新优化：一版的更新的话都是采用update set的方式，但是如果需要批量更新的话，只能for循环的执行更新。或者采用executeBatch的方式，执行更新。无论哪种方式，性能都不见得多好。三千多条的更新，需要3分多钟。查询了批量更新的优化，有说replace into的方式，即： replace into tableName(id,status) values
微软BI（3） 18289753290 微软BI SSIS
1) Q：该列违反了完整性约束错误；已获得 OLE DB 记录。源:“Microsoft SQL Server Native Client 11.0” Hresult: 0x80004005 说明:“不能将值 NULL 插入列 'FZCHID'，表 'JRB_EnterpriseCredit.dbo.QYFZCH'；列不允许有 Null 值。INSERT 失败。”。 A：一般这类问题的存在是
Java中的List g21121 java
List是一个有序的 collection（也称为序列）。此接口的用户可以对列表中每个元素的插入位置进行精确地控制。用户可以根据元素的整数索引（在列表中的位置）访问元素，并搜索列表中的元素。与 set 不同，列表通常允许重复
读书笔记永夜-极光读书笔记
1. K是一家加工厂,需要采购原材料,有A,B,C,D 4家供应商,其中A给出的价格最低,性价比最高,那么假如你是这家企业的采购经理,你会如何决策? 传统决策: A:100%订单 B,C,D:0% &nbs
centos 安装 Codeblocks 随便小屋 codeblocks
1.安装gcc,需要c和c++两部分,默认安装下,CentOS不安装编译器的,在终端输入以下命令即可yum install gccyum install gcc-c++ 2.安装gtk2-devel,因为默认已经安装了正式产品需要的支持库,但是没有安装开发所需要的文档.yum install gtk2* 3. 安装wxGTK yum search w
23种设计模式的形象比喻 aijuans 设计模式
1、ABSTRACT FACTORY—追MM少不了请吃饭了，麦当劳的鸡翅和肯德基的鸡翅都是MM爱吃的东西，虽然口味有所不同，但不管你带MM去麦当劳或肯德基，只管向服务员说“来四个鸡翅”就行了。麦当劳和肯德基就是生产鸡翅的Factory 　　工厂模式：客户类和工厂类分开。消费者任何时候需要某种产品，只需向工厂请求即可。消费者无须修改就可以接纳新产品。缺点是当产品修改时，工厂类也要做相应的修改。如：
开发管理 CheckLists aoyouzi 开发管理 CheckLists
开发管理 CheckLists(23) -使项目组度过完整的生命周期开发管理 CheckLists(22) -组织项目资源开发管理 CheckLists(21) -控制项目的范围开发管理 CheckLists(20) -项目利益相关者责任开发管理 CheckLists(19) -选择合适的团队成员开发管理 CheckLists(18) -敏捷开发 Scrum Master 工作开发管理 C
js实现切换百合不是茶 JavaScript 栏目切换
js主要功能之一就是实现页面的特效,窗体的切换可以减少页面的大小,被门户网站大量应用思路: 1,先将要显示的设置为display:bisible 否则设为none 2,设置栏目的id ,js获取栏目的id,如果id为Null就设置为显示 3,判断js获取的id名字;再设置是否显示代码实现: html代码: <di
周鸿祎在360新员工入职培训上的讲话 bijian1013 感悟项目管理人生职场
这篇文章也是最近偶尔看到的，考虑到原博客发布者可能将其删除等原因，也更方便个人查找，特将原文拷贝再发布的。“学东西是为自己的，不要整天以混的姿态来跟公司博弈，就算是混，我觉得你要是能在混的时间里，收获一些别的有利于人生发展的东西，也是不错的，看你怎么把握了”，看了之后，对这句话记忆犹新。 &
前端Web开发的页面效果 Bill_chen html Web Microsoft
1.IE6下png图片的透明显示： <img src="图片地址" border="0" style="Filter.Alpha(Opacity)=数值(100),style=数值(3)"/> 或在<head></head>间加一段JS代码让透明png图片正常显示。 2.<li>标
【JVM五】老年代垃圾回收：并发标记清理GC(CMS GC) bit1129 垃圾回收
CMS概述并发标记清理垃圾回收(Concurrent Mark and Sweep GC）算法的主要目标是在GC过程中，减少暂停用户线程的次数以及在不得不暂停用户线程的请夸功能，尽可能短的暂停用户线程的时间。这对于交互式应用，比如web应用来说，是非常重要的。 CMS垃圾回收针对新生代和老年代采用不同的策略。相比同吞吐量垃圾回收，它要复杂的多。吞吐量垃圾回收在执
Struts2技术总结白糖_ struts2
必备jar文件早在struts2.0.*的时候，struts2的必备jar包需要如下几个： commons-logging-*.jar Apache旗下commons项目的log日志包 freemarker-*.jar
Jquery easyui layout应用注意事项 bozch jquery 浏览器 easyui layout
在jquery easyui中提供了easyui-layout布局，他的布局比较局限，类似java中GUI的border布局。下面对其使用注意事项作简要介绍：如果在现有的工程中前台界面均应用了jquery easyui，那么在布局的时候最好应用jquery eaysui的layout布局，否则在表单页面（编辑、查看、添加等等）在不同的浏览器会出
java-拷贝特殊链表：有一个特殊的链表，其中每个节点不但有指向下一个节点的指针pNext，还有一个指向链表中任意节点的指针pRand，如何拷贝这个特殊链表？ bylijinnan java
public class CopySpecialLinkedList { /** * 题目：有一个特殊的链表，其中每个节点不但有指向下一个节点的指针pNext，还有一个指向链表中任意节点的指针pRand，如何拷贝这个特殊链表？拷贝pNext指针非常容易，所以题目的难点是如何拷贝pRand指针。假设原来链表为A1 -> A2 ->... -> An，新拷贝
color Chen.H JavaScript html css
<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN" "http://www.w3.org/TR/html4/loose.dtd"> <HTML> <HEAD>&nbs
[信息与战争]移动通讯与网络 comsci 网络
两个坚持:手机的电池必须可以取下来光纤不能够入户,只能够到楼宇建议大家找这本书看看:<&
oracle flashback query(闪回查询) daizj oracle flashback query flashback table
在Oracle 10g中，Flash back家族分为以下成员： Flashback Database Flashback Drop Flashback Table Flashback Query(分Flashback Query,Flashback Version Query，Flashback Transaction Query) 下面介绍一下Flashback Drop 和Flas
zeus持久层DAO单元测试 deng520159 单元测试
zeus代码测试正紧张进行中,但由于工作比较忙,但速度比较慢.现在已经完成读写分离单元测试了,现在把几种情况单元测试的例子发出来,希望有人能进出意见,让它走下去. 本文是zeus的dao单元测试: 1.单元测试直接上代码 package com.dengliang.zeus.webdemo.test; import org.junit.Test; import o
C语言学习三printf函数和scanf函数学习 dcj3sjt126com c printf scanf language
printf函数 /* 2013年3月10日20:42:32 地点：北京潘家园功能：目的：测试%x %X %#x %#X的用法 */ # include <stdio.h> int main(void) { printf("哈哈！\n"); // \n表示换行 int i = 10; printf
那你为什么小时候不好好读书? dcj3sjt126com life
dady, 我今天捡到了十块钱, 不过我还给那个人了 good girl! 那个人有没有和你讲thank you啊没有啦....他拉我的耳朵我才把钱还给他的, 他哪里会和我讲thank you 爸爸, 如果地上有一张5块一张10块你拿哪一张呢.... 当然是拿十块的咯... 爸爸你很笨的, 你不会两张都拿爸爸为什么上个月那个人来跟你讨钱, 你告诉他没
iptables开放端口 Fanyucai linux iptables 端口
1，找到配置文件 vi /etc/sysconfig/iptables 2，添加端口开放，增加一行，开放18081端口 -A INPUT -m state --state NEW -m tcp -p tcp --dport 18081 -j ACCEPT 3，保存 ESC :wq! 4，重启服务 service iptables
Ehcache（05）——缓存的查询 234390216 排序 ehcache 统计 query
缓存的查询目录 1. 使Cache可查询 1.1 基于Xml配置 1.2 基于代码的配置 2 指定可搜索的属性 2.1 可查询属性类型 2.2 &
通过hashset找到数组中重复的元素 jackyrong hashset
如何在hashset中快速找到重复的元素呢?方法很多，下面是其中一个办法： int[] array = {1,1,2,3,4,5,6,7,8,8}; Set<Integer> set = new HashSet<Integer>(); for(int i = 0
使用ajax和window.history.pushState无刷新改变页面内容和地址栏URL lanrikey history
后退时关闭当前页面 <script type="text/javascript"> jQuery(document).ready(function ($) { if (window.history && window.history.pushState) {
应用程序的通信成本 netkiller.github.com 虚拟机应用服务器陈景峰 netkiller neo
应用程序的通信成本什么是通信一个程序中两个以上功能相互传递信号或数据叫做通信。什么是成本这是是指时间成本与空间成本。时间就是传递数据所花费的时间。空间是指传递过程耗费容量大小。都有哪些通信方式全局变量线程间通信共享内存共享文件管道 Socket 硬件（串口，USB）等等全局变量全局变量是成本最低通信方法，通过设置
一维数组与二维数组的声明与定义恋洁e生二维数组一维数组定义声明初始化
/** * */ package test20111005; /** * @author FlyingFire * @date:2011-11-18 上午04:33:36 * @author ：代码整理 * @introduce :一维数组与二维数组的初始化 *summary： */ public c
Spring Mybatis独立事务配置 toknowme mybatis
在项目中有很多地方会使用到独立事务，下面以获取主键为例（1）修改配置文件spring-mybatis.xml  <tx:annotation-driven transaction-manager="transactionManager" /> &n
更新Anadroid SDK Tooks之后，Eclipse提示No update were found xp9802 eclipse
使用Android SDK Manager 更新了Anadroid SDK Tooks 之后，打开eclipse提示 This Android SDK requires Android Developer Toolkit version 23.0.0 or above, 点击Check for Updates 检测一会后提示 No update were found