阿润菜菜

【C++】位图/布隆过滤器+海量数据处理

✍作者：阿润菜菜
专栏：C++

文章目录

前言
一位图
- 1.位图法介绍
- 2.位图实现的细节
二、布隆过滤器
- 1.布隆过滤器概念
- 2.布隆过滤器实现
三、海量数据处理
- 1. 位图应用
- 2. 哈希切割
- 3. 布隆过滤器

前言

题目
给40亿个不重复的无符号整数，没排过序。给一个无符号整数，如何快速判断一个数是否在这40亿个数中。

大多数人上来会想到这两种方法：1. 遍历，时间复杂度O(N)2. 排序(O(NlogN))，利用二分查找: logN
但是第一种效率太低了，需要一个一个遍历比对，第二种排序内存无法装得下40亿个整数数据啊！
可以发现问题是需要判断此无符号整数在不在集合中，我们可以用一个数对应一个比特位来标识，42亿个数据换算比特位进行存储，也就是需要0.5GB，512MB内存申请是没有压力的。

下面来学习一下位图法以及相关应用面试题和布隆过滤器知识。

一位图

1.位图法介绍

位图法是一种利用每一位来存放某种状态的数据结构，适用于大规模数据的快速查找、判重、排序等。在位图法中，一个int类型的数据占用4个字节，即32个bit位，可以表示0-31的数是否存在。

位图申请内存

在内存中我们肯定是不能按照bit位来申请内存的，这不符合内存管理的机制，最小申请的内存也是1byte（字节），即8个bit位。所以在位图里面我们就开出来一个个的char，用每个char的比特位来直接对应数字。

意思是，在位图中，我们不能单独申请一个bit位来存放一个数字的状态，而是要申请一个char类型的数据，即8个bit位，然后用这8个bit位来表示8个数字是否存在。比如，如果我们要表示数字0-7是否存在，我们就可以申请一个char类型的数据a，然后用a的每一位来对应一个数字。如果a的第0位为1，表示数字0存在；如果a的第1位为1，表示数字1存在；以此类推。

2.位图实现的细节

我们这里讲解位图的三个主要功能函数：

set():置位函数，将指定的位设置为1
reset():复位函数，将指定位设置为0
test(): 访问函数，获取指定的位的值

对于set，想要让某一比特位变为1其他位不变，则可以用1按位或对应的比特位，那就只需让1向高位移动j位，然后用位图中对应的char进行按位或等即可。

这句话的意思是，如果我们想要把一个char类型的数据a的第j位设置为1，我们可以先把1左移j位，得到一个只有第j位为1其他位为0的数b，然后把a和b进行按位或运算，得到一个新的数c，这个数c就是把a的第j位设置为1后的结果。因为按位或运算的规则是，只要有一个为1就为1，所以a的其他位不会被改变，只有第j位会被设置为1。

例如，如果我们想要把a=0010 1000的第3位设置为1，我们可以先把1左移2位，得到b=0000 0100，然后把a和b进行按位或运算，得到c=0010 1000 | 0000 0100 = 0010 1100，这个数c就是把a的第2位设置为1后的结果。

对于reset，想要让某一比特位变为0其他位不变，则可以用0按位与对应的比特位，那就只需让1向高位移动j位，然后按位取反，最后用位图中对应的char进行按位与等即可。
对于test，我们可以让对应比特位按位与1，其他比特位按位与0，这样其他比特位都是0，如果测试的比特位是1，则结果是非0，那就是true，如果测试的比特位是0，则结果是0，那就是false。

// 非类型模板参数
template <size_t N>
class bitset
{
public:
	bitset()
	{
		_bits.resize(N / 8 + 1, 0);
		//可能开的比特位恰好满足数字的个数，也可能最多浪费7个比特位
		//_bits.resize(N << 3 + 1, 0);//位运算符优先级过低，这里先进行+运算，则结果和我们预想的不一致，发生错误。
	}
	void set(size_t x)
	{
		size_t i = x / 8;
		size_t j = x % 8;
		_bits[i] |= 1 << j;
	}
	void reset(size_t x)
	{
		size_t i = x / 8;
		size_t j = x % 8;
		_bits[i] &= ~(1 << j);
	}
	bool test(size_t x)
	{
		size_t i = x / 8;
		size_t j = x % 8;
		return _bits[i] & (1 << j);//这里不是&=，因为test不改变位图，只是判断一下而已
		//有些编译器bool值是四个字节，返回时会发生整型提升，高位补符号位，但这些都不重要，只要是非0就行，判断为真
		//我的编译器bool值是一个字节
	}
private:
	vector<char> _bits;
};

位图的应用

快速查找某个数据是否在一个集合中
排序 + 去重
求两个集合的交集、并集等
操作系统中磁盘块标记

二、布隆过滤器

1.布隆过滤器概念

布隆过滤器是一种概率型数据结构，可以用于判断一个元素是否可能存在于一个集合中，其优点是空间效率高，查询速度快，缺点是有一定的误判率和删除困难。
将哈希与位图结合，即布隆过滤器
布隆过滤器的应用场景有：

解决缓存穿透问题，即避免频繁查询数据库中不存在的数据
邮件过滤，即用布隆过滤器来存储黑名单邮件地址，过滤掉垃圾邮件
网页爬虫，即用布隆过滤器来记录已经爬取过的网址，避免重复爬取
新闻推荐，即用布隆过滤器来记录用户已经浏览过的新闻，避免重复推荐

2.布隆过滤器实现

布隆过滤器的原理是：

创建一个二进制位数组（bitmap）和一组哈希函数
当要添加一个元素时，用哈希函数计算出该元素在位数组中的多个位置，并将这些位置的值设为1
当要查询一个元素时，用哈希函数计算出该元素在位数组中的多个位置，并检查这些位置的值是否都为1，如果都为1，则认为该元素可能存在；如果有任何一个位置为0，则认为该元素一定不存在
当要删除一个元素时，无法直接将位数组中的对应位置设为0，因为这样可能会影响其他元素的判断，所以需要使用一些变形的布隆过滤器来支持删除操作

布隆过滤器的删除
如果采用计数方式来实现reset，也就是布隆过滤器的删除，会存在一些问题。比如你不小心将某一个字符串多次重复删除，此时计数会进行- -，但如果是0- -呢？有可能还会发生越界访问等问题。所以计数方式也有他的缺陷，最好不要强制增加布隆过滤器的reset操作。

struct BKDRHash
{
	size_t operator()(const string& key)
	{
		size_t hash = 0;
		for (auto ch : key)
		{
			hash *= 131;
			hash += ch;
		}
		return hash;
	}
};

struct APHash
{
	size_t operator()(const string& key)
	{
		unsigned int hash = 0;
		int i = 0;

		for (auto ch : key)
		{
			if ((i & 1) == 0)
			{
				hash ^= ((hash << 7) ^ (ch) ^ (hash >> 3));
			}
			else
			{
				hash ^= (~((hash << 11) ^ (ch) ^ (hash >> 5)));
			}

			++i;
		}

		return hash;
	}
};

struct DJBHash
{
	size_t operator()(const string& key)
	{
		unsigned int hash = 5381;

		for (auto ch : key)
		{
			hash += (hash << 5) + ch;
		}

		return hash;
	}
};

struct JSHash
{
	size_t operator()(const string& s)
	{
		size_t hash = 1315423911;
		for (auto ch : s)
		{
			hash ^= ((hash << 5) + ch + (hash >> 2));
		}
		return hash;
	}
};
//布隆过滤器不仅可以存字符串，也可以存其他类型，只要最后能转换成整型完成取模映射就行，取模是比较常用的哈希函数
//平均存储一个值，开辟X个比特位
template <size_t N, size_t X = 8, class K = string,
class Hashfunc1 = BKDRHash, class Hashfunc2 = APHash, class Hashfunc3 = DJBHash, class Hashfunc4 = JSHash>
class BloomFilter
{
public:
	void set(const K& key)
	{
		size_t hash1 = Hashfunc1()(key) % (X * N);
		size_t hash2 = Hashfunc2()(key) % (X * N);
		size_t hash3 = Hashfunc3()(key) % (X * N);
		size_t hash4 = Hashfunc4()(key) % (X * N);

		_bs.set(hash1);
		_bs.set(hash2);
		_bs.set(hash3);
		_bs.set(hash4);
	}
	bool test(const K& key)
	{
		size_t hash1 = Hashfunc1()(key) % (X * N);
		if (!_bs.test(hash1))
		{
			return false;
		}
		size_t hash2 = Hashfunc2()(key) % (X * N);
		if (!_bs.test(hash2))
		{
			return false;
		}
		size_t hash3 = Hashfunc3()(key) % (X * N);
		if (!_bs.test(hash3))
		{
			return false;
		}
		size_t hash4 = Hashfunc4()(key) % (X * N);
		if (!_bs.test(hash4))
		{
			return false;
		}

		//上面判断不在的情况一定是准确的。
		return true;//这里可能会存在误判，多个哈希位置都和别的字符串冲突了
	}

private:
	std::bitset<N * X> _bs;//如果size_t类型×X过后，size_t类型存不下，也可以选择换long long类型
};

三、海量数据处理

1. 位图应用

经典面试题及解决方案：
1. 给定一个文件，包含40亿个不重复的无符号整数，给一个无符号整数，如何快速判断这个数是否在文件中？
解决方案：使用一个40亿位的位图，将文件中的每个整数映射到位图中，然后根据给定的整数在位图中查找即可。
2. 给定两个文件，分别包含100亿个整数，只有1G内存，如何找到两个文件的交集？
解决方案：使用哈希切分的方法，将两个文件分别按照哈希函数分成1000个小文件，然后对每一对小文件求交集即可。
3. 给定一个文件，包含100亿个整数，只有1G内存，设计算法找到出现次数不超过2次的所有整数？
解决方案：使用两个位图，分别记录每个整数出现的次数，如果出现0次，则两个位图都为0；如果出现1次，则第一个位图为1，第二个位图为0；如果出现2次或以上，则第一个位图为0，第二个位图为1。最后遍历两个位图，找出第一个位图为1且第二个位图为0的位置即可。

2. 哈希切割

问题
给一个超过100G大小的log file, log中存着IP地址, 设计算法找到出现次数最多的IP地址？

因为问题是100G大小的文件，肯定是无法加载到内存解决的，传统的KV模型如map来是不能解决的，我们这里采用哈希切割的思想来解决此问题。

哈希切割是一种将一个大文件利用哈希的原理，将其分割为若干个小文件的方法，相同数据分到同一个文件。

一种解决方案是：
上来先遍历子文件内容，将每个内容构造成键值对插入到map里面，如果map存不下，则在插入的过程中会出现内存不够的情况，insert会报错，那其实就是new结点失败，new失败是会抛异常的，我们只要捕获这个异常即可，此时说明这个子文件中大多是不同的IP，那么只需要递归哈希切分这个子文件即可。
如果map能够存的下，则正常统计出出现次数最多的IP即可，无须进行其他任何操作。

3. 布隆过滤器

给两个文件，分别有100亿个query，我们只有1G内存，如何找到两个文件交集？分别给出精确算法和近似算法。

精确算法：可以使用哈希切割的方法，将两个文件按照query的哈希值分割成若干个小文件，使得每个小文件的大小不超过内存限制。然后对每一对小文件，用散列表或者排序的方法找出其中的交集。最后将所有小文件的交集合并起来，就得到了两个大文件的交集。
-
近似算法：可以使用布隆过滤器的方法，先将一个文件中的所有query插入到一个布隆过滤器中，然后遍历另一个文件中的query，用布隆过滤器检查是否可能存在于第一个文件中。如果可能存在，则加入到候选集合中。最后再对候选集合进行一次精确匹配，就得到了两个大文件的近似交集。

如何扩展BloomFilter使得它支持删除元素的操作？

一种方法是使用计数型布隆过滤器，即在每个位数组位置上不再存储一个比特位，而是存储一个计数器。当插入一个元素时，将其映射到的位数组位置上的计数器加一；当删除一个元素时，将其映射到的位数组位置上的计数器减一。这样就可以实现删除操作，但是会增加空间开销和计算复杂度。
另一种方法是使用双重布隆过滤器，即维护两个布隆过滤器，一个用于存储插入的元素（A），一个用于存储删除的元素（B）。当插入一个元素时，将其加入到A中；当删除一个元素时，将其加入到B中。当查询一个元素时，先检查它是否在A中，如果不在，则认为不存在；如果在，则再检查它是否在B中，如果在，则认为已经删除；如果不在，则认为存在。这样也可以实现删除操作，但是会增加误判率和维护成本。

结束

微软正则表达式库的实现与应用江卓尔
本文还有配套的精品资源，点击获取简介：正则表达式是一种用于文本处理的强大工具，在Windows环境下微软提供了相应的支持。本项目涉及的微软正则表达式库可能是一个内部或第三方开发的框架，以C++实现。regexpr2.cpp和syntax2.cpp文件可能包含核心匹配算法和语法解析处理，而reimpl2.h、regexpr2.h和syntax2.h可能定义了实现细节、API接口和语法定义。resta
Linux上用C++和GCC开发程序实现两个不同PostgreSQL实例下单个数据库中多个Schema稳定高效的数据迁移到其它PostgreSQL实例 weixin_30777913 c++数据库开发语言 postgresql 服务器
设计一个在Linux上运行的GCCC++程序，同时连接三个不同的PostgreSQL实例，其中两个实例中分别有两个数据库中多个Schema的表结构分别与第三实例中两个数据库中多个Schema个结构完全相同，同时复制两个实例中两个数据库中多个Schema里的所有表的数据到第三个实例中两个数据库中多个Schema里，使用以下快速高效的方法，加入异常处理，支持每隔固定时间重试一定次数，每张表的复制运行状
打卡信奥刷题（877）用C++信奥P11231[普及组/提高] [CSP-S 2024] 决斗 Loge编程生活 C++c++算法开发语言青少年编程数据结构
P11231[CSP-S2024]决斗题目描述今天是小Q的生日，他得到了nnn张卡牌作为礼物。这些卡牌属于火爆的“决斗怪兽”，其中，第iii张卡代表一只攻击力为rir_iri，防御力也为rir_iri的怪兽。一场游戏分为若干回合。每回合，小Q会选择某只怪兽iii以及另一只怪兽j(i≠j)j(i\neqj)j(i=j)，并让怪兽iii向怪兽jjj发起攻击。此时，若怪兽iii的攻击力小于等于怪兽jj
C++深入学习笔记（19）—— 迭代器慎铭 C++深入学习笔记 c++容器开发语言
iterator头文件中，除了为每个容器所定义的迭代器外，标准库中还额外定义了其它的迭代器类型，如下。插入迭代器（insetiterator）：该类迭代器被绑定到一个容器上，可用来向容器中插入元素。流迭代器（streamiterator）：该类迭代器被绑定到输入或者输出流上，可以用来遍历有关联的IO流。反向迭代器（reverseiterator）：这些迭代器向后移动而不是向前移动。除了forw
14届蓝桥杯真题：飞机降落（c++实现） Davidand c++算法图论
问题描述N架飞机准备降落到某个只有一条跑道的机场。其中第i架飞机在Ti时刻到达机场上空，到达时它的剩余油料还可以继续盘旋Di个单位时间，即它最早可以于Ti时刻开始降落，最晚可以于Ti+Di时刻开始降落。降落过程需要Li个单位时间。一架飞机降落完毕时，另一架飞机可以立即在同一时刻开始降落，但是不能在前一架飞机完成降落前开始降落。请你判断N架飞机是否可以全部安全降落。输入格式输入包含多组数据。第一行包
【设计模式】工厂方法模式小王不头秃设计模式设计模式工厂方法模式 java
❓首先什么是设计模式？相信刚上大学的你和我一样，在学习这门课的时候根本不了解这些设计原则和模式有什么用处，反而不如隔壁的C++更有意思，至少还能弹出一个小黑框，给我个helloworld。✨如何你和我一样也是这么想，那接下来咱们以贴合生活实际的方式来看看设计模式到底有什么神奇的地方？更多有趣的设计模式讲解都在设计模式专栏，欢迎来看看。【设计模式】工厂方法模式前言工厂方法模式六大原则分析现实工作中的
c++ std::forward_list使用笔记 JANGHIGH C++c++list 笔记
这里写目录标题1.包含头文件2.创建和初始化3.添加元素4.遍历元素5.删除元素6.其他常用操作7.示例代码输出结果总结std::forward_list是C++标准库中的一个单向链表容器。它只支持从头部到尾部的前向遍历，因此在某些场景下比std::list更加高效。以下是一些std::forward_list的基本使用方法：1.包含头文件首先需要包含头文件：#include#include2.创
《ROS2 机器人开发从入门道实践》鱼香ROS2——第5章内容儒雅芝士机器人
目录第5章ROS常用开发工具5.1坐标变换工具介绍5.1.1通过命令行使用TF5.1.2对TF原理的简单探究5.2Python中的手眼坐标变换5.2.1通过Python发布静态TF5.2.2通过Python发布动态TF5.2.3通过Python查询TF关系5.3C++中的地图坐标系变化5.3.1通过C++发布静态TF5.3.2通过C++发布动态TF5.3.3通过C++查询TF关系5.4常用可视化工
蓝桥杯备考冲刺必刷题（C++） | 蓝桥云课 760 数的计算热爱编程的通信人蓝桥杯 c++职场和发展
本文为付费文章，相较于个人免费文章，将提供更完整的解题思路、详细的代码注释。通过付费支持，您将获得更优质的学习体验和更高效的提升路径。专栏特色1.真题解析：精选蓝桥杯青少组竞赛真题，逐题详细讲解，帮助您掌握解题技巧。2.经典算法练习：根据蓝桥杯青少组竞赛大纲，挑选经典算法题目，提供代码实现与指导，助您夯实算法基础。3.系统化学习：从基础到进阶，循序渐进，帮助您全面提升编程能力。附上汇总贴：蓝桥杯备
第十一届蓝桥杯大赛软件赛省赛C/C++ 大学 B 组子串分值和 60%解法徽京人蓝桥解析蓝桥杯 c语言 c++
题目描述对于一个字符串SS，我们定义SS的分值f(S)f(S)为SS中出现的不同的字符个数。例如f(“aba”)=2，f(“abc”)=3,f(“aaa”)=1f(“aba”)=2，f(“abc”)=3,f(“aaa”)=1。现在给定一个字符串S[0...n−1]S[0...n−1]（长度为nn），请你计算对于所有SS的非空子串S[i...j](0≤i≤jusingnamespacestd;con
Gopeed 各种类型的文件资源下载器 v1.6.7 中文版遇见属于下载软件电脑
Gopeed是一款由Go和Flutter开发的下载器。它具有简洁美观的界面以及强大的功能，支持HTTP、BitTorrent、Magnet等协议，并且可以在全平台上使用。开发语言及技术：Gopeed采用Go和Flutter进行开发。Go语言具有高效、简洁的特点，而Flutter则能实现跨平台的美观界面。这两种技术的结合使得Gopeed在性能和用户体验上都有一定的优势。支持协议丰富：支持HTTP、B
利用 C++ 类模拟自定义 “语法”：从封装到代码的优雅进化天若有情673
引言在编程的世界里，语法是我们与计算机沟通的规则。然而，你是否想过，在不改变编程语言本身语法的基础上，我们也能模拟出一种新的“语法”来让代码更加简洁、直观？今天，我们就来探讨如何利用C++中的类来实现这一有趣的想法。背景知识在C++中，类是一种强大的工具，它允许我们将数据和操作数据的函数封装在一起。通过合理地设计类的成员函数，我们可以将一系列复杂的操作封装成一个简单的接口，使得代码的使用者无需关心
C/C++跨平台SDK开发的注意事项 c++
1.C/C++跨平台开发时有哪些值得注意的事项？1.1.你知道如何选择C++标准的版本吗？1.1.1.C++版本说明1.1.2.如何选择版本1.1.3.最佳实践1.2.源代码要如何保存，跨平台和跨IDE时才不会出现中文乱码？1.2.1.中文乱码问题与原因分析1.2.2.解决策略1.3.如何优雅的隔离平台的差异？1.3.1.用宏定义隔离平台的差异1.3.2.最佳实践1.4.接口的参数和返回值可以是任
Windows和Linux下，通过C++实现获取蓝牙版本号 xingyun86 C++windows linux c++
在C++中获取蓝牙版本号，不同的操作系统有不同的实现方式，下面分别介绍在Windows和Linux系统下的实现方法。Windows系统在Windows系统中，可以使用WindowsAPI来与蓝牙设备交互，获取蓝牙版本号。以下是一个示例代码：收起cpp#include#include#include#include#include#pragmacomment(lib,"Bthprops.lib")/
C++之vector和list辨析 C嘎嘎嵌入式开发 C++c++开发语言算法
std::vector和std::list是C++标准库中两种常用的容器，它们都用于存储和管理元素集合，但在底层实现和性能特性上有显著的区别。1.底层实现std::vector:基于动态数组实现。元素在内存中是连续存储的。支持随机访问（通过下标访问元素）。当容量不足时，会重新分配更大的内存块，并将所有元素复制到新内存中。std::list:基于双向链表实现。元素在内存中是非连续存储的，每个元素包含
如何高效利用C++的for循环 C嘎嘎嵌入式开发 c++前端服务器
在C++的for循环中，for(初始化;条件;更新)的三个参数都是可选的，你可以不写其中的一个、两个，甚至全部三个参数。1.不写初始化如果循环变量已经在循环外部定义并初始化，可以省略for循环中的初始化部分。例子：inti=0;//初始化在外部完成for(;i=5){break;//手动退出循环}cout=5){break;//手动退出循环}cout<
VS code 之 c++远程开发环境搭建汝何秀 linux vscode
文章目录VScode之c/c++远程开发环境搭建1.基本环境2.远程主机的开发环境搭建3.本地vscode的配置配置ssh选项4远程开发教程VScode之c/c++远程开发环境搭建1.基本环境本地主机：VisualStudioCode远程主机：CentOS72.远程主机的开发环境搭建安装环境的压缩包：dev_env_install.tar.gz解压文件夹：repo自动安装脚本为：dev_env.s
【花雕学编程】Arduino FOC 之四连杆机构轮腿机器人的复杂路径规划驴友花雕机器人嵌入式硬件单片机 c++Arduino动手做四连杆机构轮腿机器人的复杂路径规划
Arduino是一个开放源码的电子原型平台，它可以让你用简单的硬件和软件来创建各种互动的项目。Arduino的核心是一个微控制器板，它可以通过一系列的引脚来连接各种传感器、执行器、显示器等外部设备。Arduino的编程是基于C/C++语言的，你可以使用ArduinoIDE（集成开发环境）来编写、编译和上传代码到Arduino板上。Arduino还有一个丰富的库和社区，你可以利用它们来扩展Ardui
第十三届蓝桥杯大赛软件赛决赛C/C++ 大学 B 组 Kent_J_Truman 蓝桥杯蓝桥杯
A【2022——暴力DP/优雅背包】-CSDN博客B【钟表——类日期问题】-CSDN博客C【卡牌——二分】-CSDN博客D【最大数字——DFS】-CSDN博客E【出差——Dijkstra】-CSDN博客F【费用报销——01背包】-CSDN博客G【故障——条件概率】-CSDN博客H【机房——LCA】-CSDN博客I【齿轮——优化（预处理，去重，哈希）】-CSDN博客J【搬砖——经典带贪心01背包（背
RabbitMQ复习 SJLoveIT rabbitmq 分布式
消息中间件的作用：（1）异步处理（2）应用解耦（3）流量削峰消息中间件的缺点：引入了新的东西，也就增加了新的故障点。比如消息中间件挂了，影响系统的可用性。两种框架：JMS和AMQP最大的区别是JMS是是javaapi,对跨平台的支持较差，但在纯java技术栈内首选。AMQP是跨平台的，序列化方式选json，不管你是java，php，C/C++,python,都能处理RabbitMQ实现的事AMQP
C C++最全Linux下TCP IP编程--TCP实战_linux tcp，2024最新网易C C++面试题目 2401_84973304 程序员 c语言 c++学习
网上学习资料一大堆，但如果学到的知识不成体系，遇到问题时只是浅尝辄止，不再深入研究，那么很难做到真正的技术提升。需要这份系统化的资料的朋友，可以添加戳这里获取一个人可以走的很快，但一群人才能走的更远！不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人，都欢迎加入我们的的圈子（技术交流、学习资源、职场吐槽、大厂内推、面试辅导），让我们一起学习成长！printf("====waitingforcl
【模型部署】大模型部署工具对比：SGLang, Ollama, VLLM, LLaMA.cpp如何选择？深度求索者 llama 人工智能
在选择大模型部署工具时，需要考虑多个因素，包括性能、支持的语言和模型、硬件支持、易用性以及社区支持等。以下是对比分析：性能VLLM(VirtualTensorLanguage):VLLM是一个高性能的推理库，特别适用于长序列任务。它通过虚拟张量技术优化了内存使用，并支持多GPU加速，适合需要高性能推理的场景。LLaMA.cpp:这是一个针对C++优化的LLaMA模型实现，特别适合在资源受限的环境中
灵犀互娱游戏测试开发一面面经 wezzzzzz 游戏
阿里的子公司,做的是游戏业务,所以投递的时候把简历上加上了自己的游戏经历.面试官大哥也围绕着游戏问了一些问题,面试体验很好~~1.介绍一下自己(巴拉巴拉一顿说)2.看你的简历上有写关于用友的实习,可以介绍一下那边的业务吗?还有为什么那边用的c#来写自动化脚本,很好奇.大概说了一下之前实习的组,业务是做什么的,以及c#来做为测试开发语言是因为那边的产品就是c#来写的,猜测是因为方便开发帮忙写自动化~
二维前缀和（C++)) 落溪于梦 c++开发语言
题目描述：给定一个n×m的矩阵，其中每个元素为整数。你需要回答q个查询，每个查询给出一个矩形区域的左上角(x1,y1)和右下角(x2,y2)，你需要计算这个矩形区域内的元素之和。输入格式：第一行包含三个整数n,m,q，分别表示矩阵的行数、列数和查询次数。接下来n行，每行包含m个整数，表示矩阵的元素。接下来q行，每行包含四个整数x1,y1,x2,y2，表示一个查询。输出格式：对于每个查询，输出一个整
QT——c++界面编程库孩之 qt c++开发语言
非界面编程QT编译的时候，依赖于.pro配置文件：SOURCES:所有需要参与编译的.cpp源文件HEADERS:所有需要参与编译的.h头文件QT：所有需要参与编译的QT函数库.pro文件一旦修改，注意需要键盘按ctrl+s才能加载最新的配置文件标准输出：QDebug类#includeqDebug()#include#include#include#include#includeintmain(i
C#调用C的Dll(类型对照) 未来无限 C#Winform设计 C#.dll 类型
//C++中的DLL函数原型为//extern“C”__declspec(dllexport)bool方法名一(constchar*变量名1,unsignedchar*变量名2)//extern“C”__declspec(dllexport)bool方法名二(constunsignedchar*变量名1,char*变量名2)//C#调用C++的DLL搜集整理的所有数据类型转换方式,可能会有重复或者
ROS2入门教程—创建ROS2功能包（C++版） Roar冷颜 ROS2入门教程其他
ROS2入门教程—创建ROS2功能包（C++版）1ROS2中的功能包2创建功能包3编译功能包4设置环境变量5运行功能包6功能包中的内容7修改package.xml文件功能包是ROS2中组织代码的基本容器，方便我们编译、安装、分发开发的代码，一般来讲，每个功能包都是用来完成某项具体的功能相对完整的单元。1ROS2中的功能包 ROS2中的功能包可以使用CMake或者Python两种方式来编译（本
【C++】深入理解C++虚函数与纯虚函数 TsuanS c++开发语言
本文由简悦SimpRead转码，原文地址blog.csdn.net文章目录一、虚函数（VirtualFunction）1.1定义和作用1.2实现原理1.3示例代码1.4虚函数的重写定义规则注意事项示例1.5基类和派生类的虚函数表**示例理解**二、纯虚函数（PureVirtualFunction）2.1定义和作用2.2示例代码三、总结在C++面向对象编程中，多态性是其三大特性之一（封装、继承和多态
基于QT的电子木鱼小游戏(C/C++) 今天你debug了嘛？ qt qt c语言 c++
文章目录前言今年最火爆的解压小游戏电子木鱼，现在许多软件都上架了这个小程序。我在网上看了一下基本上都是用py和Java写的，所以我用QT重新写了一下，作为小白练手项目非常适合一、界面展示二、功能模块1)木鱼缩放2)功德+1显示3)音乐4)自动5)延时6)完整代码前言今年最火爆的解压小游戏电子木鱼，现在许多软件都上架了这个小程序。我在网上看了一下基本上都是用py和Java写的，所以我用QT重新写了一
windows shell里的文件系统<用delphi写的> hemeinvyiqiluoben
PIDL-【PIDL简介】从Windows95开始，微软公司为操作系统引入了新的外壳界面，新的外壳从根本上改变了应用程序同操作系统的结合方式，遗憾的是微软公司对于发布同外壳相关的编程信息方面显得很吝啬，可以得到的资料非常少，而且质量也不高。对于Delphi开发者来说，情况就更为严重了，因为几乎所有的WindowsAPI文档都是针对C/C++程序员的，但是Nothingisimpossible，在本
矩阵求逆（JAVA）利用伴随矩阵 qiuwanchi 利用伴随矩阵求逆矩阵
package gaodai.matrix; import gaodai.determinant.DeterminantCalculation; import java.util.ArrayList; import java.util.List; import java.util.Scanner; /** * 矩阵求逆(利用伴随矩阵) * @author 邱万迟
单例（Singleton）模式 aoyouzi 单例模式 Singleton
3.1 概述如果要保证系统里一个类最多只能存在一个实例时，我们就需要单例模式。这种情况在我们应用中经常碰到，例如缓存池，数据库连接池，线程池，一些应用服务实例等。在多线程环境中，为了保证实例的唯一性其实并不简单，这章将和读者一起探讨如何实现单例模式。 3.2
[开源与自主研发]就算可以轻易获得外部技术支持,自己也必须研发 comsci 开源
现在国内有大量的信息技术产品，都是通过盗版，免费下载，开源，附送等方式从国外的开发者那里获得的。。。。。。虽然这种情况带来了国内信息产业的短暂繁荣，也促进了电子商务和互联网产业的快速发展，但是实际上，我们应该清醒的看到，这些产业的核心力量是被国外的
页面有两个frame,怎样点击一个的链接改变另一个的内容 Array_06 UI XHTML
<a src="地址" targets="这里写你要操作的Frame的名字" />搜索然后你点击连接以后你的新页面就会显示在你设置的Frame名字的框那里 targerts="",就是你要填写目标的显示页面位置 ===================== 例如： <frame src=&
Struts2实现单个/多个文件上传和下载 oloz 文件上传 struts
struts2单文件上传：步骤01:jsp页面  　　<form action="fileUplo
推荐10个在线logo设计网站 362217990 logo
在线设计Logo网站。 1、http://flickr.nosv.org（这个太简单） 2、http://www.logomaker.com/?source=1.5770.1 3、http://www.simwebsol.com/ImageTool 4、http://www.logogenerator.com/logo.php?nal=1&tpl_catlist[]=2 5、ht
jsp上传文件香水浓 jsp fileupload
1. jsp上传 Notice： 1. form表单 method 属性必须设置为 POST 方法，不能使用 GET 方法 2. form表单 enctype 属性需要设置为 multipart/form-data 3. form表单 action 属性需要设置为提交到后台处理文件上传的jsp文件地址或者servlet地址。例如 uploadFile.jsp 程序文件用来处理上传的文
我的架构经验系列文章 - 前端架构 agevs JavaScript Web 框架 UI jQuer
框架层面：近几年前端发展很快，前端之所以叫前端因为前端是已经可以独立成为一种职业了，js也不再是十年前的玩具了，以前富客户端RIA的应用可能会用flash/flex或是silverlight，现在可以使用js来完成大部分的功能，因此js作为一门前端的支撑语言也不仅仅是进行的简单的编码，越来越多框架性的东西出现了。越来越多的开发模式转变为后端只是吐json的数据源，而前端做所有UI的事情。MVCMV
android ksoap2 中把XML(DataSet) 当做参数传递 aijuans android
我的android app中需要发送webservice ，于是我使用了 ksop2 进行发送，在测试过程中不是很顺利,不能正常工作.我的web service 请求格式如下 [html] view plain copy <Envelope xmlns="http://schemas.
使用Spring进行统一日志管理 + 统一异常管理 baalwolf spring
统一日志和异常管理配置好后，SSH项目中，代码以往散落的log.info() 和 try..catch..finally 再也不见踪影！统一日志异常实现类： [java] view plain copy package com.pilelot.web.util; impor
Android SDK 国内镜像 BigBird2012 android sdk
一、镜像地址： 1、东软信息学院的 Android SDK 镜像，比配置代理下载快多了。配置地址， http://mirrors.neusoft.edu.cn/configurations.we#android 2、北京化工大学的： IPV4:ubuntu.buct.edu.cn IPV4:ubuntu.buct.cn IPV6:ubuntu.buct6.edu.cn
HTML无害化和Sanitize模块 bijian1013 JavaScript AngularJS Linky Sanitize
一.ng-bind-html、ng-bind-html-unsafe AngularJS非常注重安全方面的问题，它会尽一切可能把大多数攻击手段最小化。其中一个攻击手段是向你的web页面里注入不安全的HTML，然后利用它触发跨站攻击或者注入攻击。考虑这样一个例子，假设我们有一个变量存
[Maven学习笔记二]Maven命令 bit1129 maven
mvn compile compile编译命令将src/main/java和src/main/resources中的代码和配置文件编译到target/classes中，不会对src/test/java中的测试类进行编译 MVN编译使用 maven-resources-plugin:2.6:resources maven-compiler-plugin:2.5.1:compile &nbs
【Java命令二】jhat bit1129 Java命令
jhat用于分析使用jmap dump的文件，，可以将堆中的对象以html的形式显示出来，包括对象的数量，大小等等，并支持对象查询语言。 jhat默认开启监听端口7000的HTTP服务，jhat是Java Heap Analysis Tool的缩写 1. 用法： [hadoop@hadoop bin]$ jhat -help Usage: jhat [-stack <bool&g
JBoss 5.1.0 GA:Error installing to Instantiated: name=AttachmentStore state=Desc ronin47
进到类似目录 server/default/conf/bootstrap，打开文件 profile.xml找到： Xml代码<bean name="AttachmentStore" class="org.jboss.system.server.profileservice.repository.AbstractAtta
写给初学者的6条网页设计安全配色指南 brotherlamp UI ui自学 ui视频 ui教程 ui资料
网页设计中最基本的原则之一是，不管你花多长时间创造一个华丽的设计，其最终的角色都是这场秀中真正的明星——内容的衬托我仍然清楚地记得我最早的一次美术课，那时我还是一个小小的、对凡事都充满渴望的孩子，我摆放出一大堆漂亮的彩色颜料。我仍然记得当我第一次看到原色与另一种颜色混合变成第二种颜色时的那种兴奋，并且我想，既然两种颜色能创造出一种全新的美丽色彩，那所有颜色
有一个数组，每次从中间随机取一个，然后放回去，当所有的元素都被取过，返回总共的取的次数。写一个函数实现。复杂度是什么。 bylijinnan java 算法面试
import java.util.Random; import java.util.Set; import java.util.TreeSet; /** * http://weibo.com/1915548291/z7HtOF4sx * #面试题#有一个数组，每次从中间随机取一个，然后放回去，当所有的元素都被取过，返回总共的取的次数。 * 写一个函数实现。复杂度是什么
struts2获得request、session、application方式 chiangfai application
1、与Servlet API解耦的访问方式。 a.Struts2对HttpServletRequest、HttpSession、ServletContext进行了封装，构造了三个Map对象来替代这三种对象要获取这三个Map对象，使用ActionContext类。 -----> package pro.action; import java.util.Map; imp
改变python的默认语言设置 chenchao051 python
import sys sys.getdefaultencoding() 可以测试出默认语言，要改变的话，需要在python lib的site-packages文件夹下新建： sitecustomize.py，这个文件比较特殊，会在python启动时来加载，所以就可以在里面写上： import sys sys.setdefaultencoding('utf-8') &n
mysql导入数据load data infile用法 daizj mysql 导入数据
我们常常导入数据！mysql有一个高效导入方法，那就是load data infile 下面来看案例说明基本语法： load data [low_priority] [local] infile 'file_name txt' [replace | ignore] into table tbl_name [fields [terminated by't'] [OPTI
phpexcel导入excel表到数据库简单入门示例 dcj3sjt126com PHP Excel
跟导出相对应的，同一个数据表，也是将phpexcel类放在class目录下，将Excel表格中的内容读取出来放到数据库中 <?php error_reporting(E_ALL); set_time_limit(0); ?> <html> <head> <meta http-equiv="Content-Type"
22岁到72岁的男人对女人的要求 dcj3sjt126com
22岁男人对女人的要求是：一，美丽，二，性感，三，有份具品味的职业，四，极有耐性，善解人意，五，该聪明的时候聪明，六，作小鸟依人状时尽量自然，七，怎样穿都好看，八，懂得适当地撒娇，九，虽作惊喜反应，但看起来自然，十，上了床就是个无条件荡妇。 32岁的男人对女人的要求，略作修定，是：一，入得厨房，进得睡房，二，不必服侍皇太后，三，不介意浪漫蜡烛配盒饭，四，听多过说，五，不再傻笑，六，懂得独
Spring和HIbernate对DDM设计的支持 e200702084 DAO 设计模式 spring Hibernate 领域模型
A：数据访问对象 DAO和资源库在领域驱动设计中都很重要。DAO是关系型数据库和应用之间的契约。它封装了Web应用中的数据库CRUD操作细节。另一方面，资源库是一个独立的抽象，它与DAO进行交互，并提供到领域模型的“业务接口”。资源库使用领域的通用语言，处理所有必要的DAO，并使用领域理解的语言提供对领域模型的数据访问服务。
NoSql 数据库的特性比较 geeksun NoSQL
Redis 是一个开源的使用ANSI C语言编写、支持网络、可基于内存亦可持久化的日志型、Key-Value数据库，并提供多种语言的API。目前由VMware主持开发工作。 1. 数据模型作为Key-value型数据库，Redis也提供了键（Key）和值（Value）的映射关系。除了常规的数值或字符串，Redis的键值还可以是以下形式之一： Lists （列表） Sets
使用 Nginx Upload Module 实现上传文件功能 hongtoushizi nginx
转载自： http://www.tuicool.com/wx/aUrAzm 普通网站在实现文件上传功能的时候，一般是使用Python，Java等后端程序实现，比较麻烦。Nginx有一个Upload模块，可以非常简单的实现文件上传功能。此模块的原理是先把用户上传的文件保存到临时文件，然后在交由后台页面处理，并且把文件的原名，上传后的名称，文件类型，文件大小set到页面。下
spring-boot-web-ui及thymeleaf基本使用 jishiweili spring thymeleaf
视图控制层代码demo如下： @Controller @RequestMapping("/") public class MessageController { private final MessageRepository messageRepository; @Autowired public MessageController(Mes
数据源架构模式之活动记录 home198979 PHP 架构活动记录数据映射
hello!架构一、概念活动记录（Active Record）：一个对象，它包装数据库表或视图中某一行，封装数据库访问，并在这些数据上增加了领域逻辑。对象既有数据又有行为。活动记录使用直截了当的方法，把数据访问逻辑置于领域对象中。二、实现简单活动记录活动记录在php许多框架中都有应用，如cakephp。 <?php /** * 行数据入口类 *
Linux Shell脚本之自动修改IP pda158 linux centos Debian 脚本
作为一名 Linux SA，日常运维中很多地方都会用到脚本，而服务器的ip一般采用静态ip或者MAC绑定，当然后者比较操作起来相对繁琐，而前者我们可以设置主机名、ip信息、网关等配置。修改成特定的主机名在维护和管理方面也比较方便。如下脚本用途为：修改ip和主机名等相关信息，可以根据实际需求修改，举一反三！ #!/bin/sh #auto Change ip netmask ga
开发环境搭建独浮云 eclipse jdk tomcat
最近在开发过程中，经常出现MyEclipse内存溢出等错误，需要重启的情况，好麻烦。对于一般的JAVA+TOMCAT项目开发，其实没有必要使用重量级的MyEclipse，使用eclipse就足够了。尤其是开发机器硬件配置一般的人。 &n