Pandaconda

C++实现查找 - 顺序、二分和哈希查找

数据结构与算法专栏 —— C++实现

写在前面：
前面我们其实已经涉及到了查找算法，比如二叉排序树和平衡二叉树等。这一讲我们来补充一下其它常见的查找算法，下面我会依次讲解并实现顺序查找、二分查找和哈希查找算法。

顺序查找

大家看到顺序查找可能第一时间会想到从前往后遍历，遇到与关键值相等的就输出其下标。这里我们来优化一下，让数组从下标为 1 的地方开始存储元素，然后将下标为 0 的地方放入查找关键值作为哨兵位。

这样的好处就是不用去担心数组越界的问题，当遍历到数组为 0 的时候说明就查找失败，并且直接返回 -1 即可。

#include 
using namespace std;

//顺序查找
int searchSeq(int *a, int len, int key) {
	a[0] = key;	//将下标为0的位置设置为哨兵位
	for (int i = len; i; i--)
		if (a[i] == a[0])
			return i;
	return -1;
}

int main() {
	int a[11] = {0, 5, 12, 16, 24, 33, 45, 56, 58, 68, 79};
	int key;
	cin >> key;
	int index = searchSeq(a, 10, key);
	if (index == -1)
		cout << "没有该元素！" << endl;
	else
		cout << index << endl;
	return 0;
}

二分查找

二分查找正如其名，我们将区间分成两半进行查找：

首先初始化左边界和右边界。
每次都取当前区间的中间位置，用于判断。
1. 如果中间值等于查找的关键值，则返回当前中间位置下标。
2. 如果中间值小于查找的关键值，则说明关键值在左半区间，r = mid - 1 。
3. 如果中间值大于查找的关键值，则说明关键值在右半区间，l = mid + 1 。
如果没找到则直接返回 -1 。

我们直接上图来理解：

第一步：初始化指针，并得到 mid = left + right >> 1 ，即 mid = 4 。（这里的 >> 1 相当于除以 2 的效果）

第二步：发现 key < mid 指向的值，故将 right = mid - 1 ，再次计算 mid 位置。

第三步：发现 key > mid 指向的值，故将 left = mid +1 ，再次计算 mid 位置。此时 mid 指向的值等于 key ，故直接输出当前所指下标。

#include 
using namespace std;

//二分查找
int binarySearch(int *a, int len, int key) {
	int left = 0, right = len - 1;
	while (left <= right) {
		int mid = left + right >> 1;	//去区间中间位置
		if (key == a[mid])	//如果找到关键值就返回当前下标
			return mid;
		else if (key < a[mid])	//如果关键值小于中间值说明其在左半边区间
			right = mid - 1;
		else	//否则关键值在右半边区间
			left = mid + 1;
	}
	return -1;
}

int main() {
	int a[10] = {5, 12, 16, 24, 33, 45, 56, 58, 68, 79};
	int key;
	cin >> key;
	int index = binarySearch(a, 10, key);
	if (index == -1)
		cout << "没有该元素！" << endl;
	else
		cout << index + 1 << endl;
	return 0;
}

哈希查找

何为哈希，通俗来讲就是将关键值利用具体的哈希函数来映射到数组中的某个位置。这样我们就可以通过 O(1) 的时间复杂度来找到要查找的关键值。

那么问题来了，数组就那么大，如果出现映射位置相同的关键值该怎么办。下面我将介绍三种解决方法，分别是链地址法、线性探测再散列法和二次探测再散列法。其中重点关注前两个算法，二次探测再散列法稍微没有那么重要，但我还是会进行讲解。

链地址法

既然关键值映射时会发生冲突，我们干脆可以利用一个链表，将冲突的关键值串成一条放在对应区域。我们还是直接上图来理解：

假设我们初始数组为 { 11 , 23 , 39 , 50 , 75 , 62 } ，并且模数为 11 ，我们先进行插入的操作。

第一步：插入关键值 11 ，放入哈希函数取模 11 % 11 = 0 ，故放到下标为 0 的位置。

第二步：插入关键值 23 ，放入哈希函数取模 23 % 11 = 1 ，故放到下标为 1 的位置。

第三步：插入关键值 39 ，放入哈希函数取模 39 % 11 = 6 ，故放到下标为 6 的位置。

第四步：插入关键值 50 ，放入哈希函数取模 50 % 11 = 6 ，故放到下标为 6 的位置。但是该位置已经放有元素，所以我们直接用链表将他们串起来，这里采用头插法。

第五步：插入关键值 75 ，放入哈希函数取模 75 % 11 = 9 ，故放到下标为 9 的位置。

第六步：插入关键值 62 ，放入哈希函数取模 62 % 11 = 7 ，故放到下标为 7 的位置。但是该位置已经放有元素，同样采用头插法插入。

至于查找操作就十分简单了，我们还是举几个例子。

第七步：查找关键值 39 ，放入哈希函数取模 39 % 11 = 6 ，找到下标为 6 的位置。发现不止一个值，则进行遍历，发现该值存在，故直接返回。

第八步：查找关键值 52 ，放入哈希函数取模 52 % 11 = 8 ，找到下标为 8 的位置。发现没有元素，所以该值不存在，则进行插入操作。

这里我们代码的实现是遵循上面提到的原则，假设模数为 11 。遇到冲突的关键值采用头插法，并且如果找到关键值就返回所在下标和查找的次数，否则就插入该关键值。

#include 
using namespace std;

/*
6
11 23 39 48 75 62
6
39
52
52
63
63
52
*/

int mod = 11;	//假设模数为 11

//定义结点
struct Node {
	int data;
	Node *next;
};

//哈希插入
void hash_insert(vector<Node *> arr, int x) {
	int dis = x % mod;
	Node *node = new Node;
	node->data = x;
	node->next = arr[dis]->next;	//采用头插法插入元素
	arr[dis]->next = node;
}

//哈希查找
bool hash_find(vector<Node *> arr, int x) {
	int dis = x % mod;
	Node *temp = arr[dis]->next;
	int cnt = 0;	//记录查找的次数
	//查找该区域的所有元素
	while (temp != NULL) {
		cnt++;
		if (temp->data == x) {
			//输出元素位置以及查找的次数
			cout << dis << " " << cnt << endl;
			return true;
		}
		temp = temp->next;
	}
	cout << "error" << endl;
	return false;
}

int main() {
	int n, t;	//元素个数和查找元素的次数
	while (cin >> n) {
		vector<Node *> arr(12);
		//初始化
		for (int i = 0; i < 11; i++) {
			Node *node = new Node;
			node->data = INT_MAX;
			node->next = NULL;
			arr[i] = node;
		}
		//插入操作
		for (int i = 0; i < n; i++) {
			int x;
			cin >> x;
			hash_insert(arr, x);
		}
		//查找操作
		cin >> t;
		while (t--) {
			int x;
			cin >> x;
			bool flag = hash_find(arr, x);
			//如果找不到就插入该值
			if (flag == false)
				hash_insert(arr, x);
		}
	}
}

线性探测再散列法

这里讲的线性探测再散列法和二次探测再散列法其实都可以归于开放定址法，开放地址法包含很多方法，但是我们这里只讲最常见的两个。

我们的开放定址法都可以遵循以下公式：

H₀= H(key)，一般就是取模
H_i = ( H(key) + d_i ) mod m, i = 1, 2, …, s
这里的 d_i 取决于我们用的方法，并且其值不可以超过哈希表长 m 。另外，H_i 中加完 d_i 模的是 m 即哈希表长。

一开始看这些公式可能会比较懵，我们还是带入例子来给大家讲解。

我们先来看线性探测再散列法，当插入的关键值冲突时就需要用到上面的公式。而这种方法就是在关键值每次冲突时都加上一个数值 d_i ，这个 d_i 在遇到连续冲突时会递增。

也就是说 d_i 满足如下规则：

d_i = c∙ i（一般取 c = 1）, 1 ≤ i ≤ m - 1，如 1, 2, 3 …

同样，直接上图理解：

假设我们的初始数组为 { 22 , 19 , 21 , 8 , 9 , 30 , 33 , 4 , 15 , 14 }，模数还是 11 ，并且哈希表表长为 12 。可能会有小伙伴比较疑惑，为什么表长会比模数还要大，因为我们上面提到 H_i 函数最终模的是表长，所以和哈希函数 H₀ 中的模数没有任何关系。

我们还是先来看插入操作。

第一步：插入关键值 22 ，放入哈希函数取模 22 % 11 = 0 ，故放到下标为 0 的位置。

第二步：插入关键值 19 ，放入哈希函数取模 19 % 11 = 8 ，故放到下标为 8 的位置。

第三步：插入关键值 21 ，放入哈希函数取模 21 % 11 = 10 ，故放到下标为 10 的位置。

第四步：插入关键值 8 ，放入哈希函数取模 8 % 11 = 8 ，故放到下标为 8 的位置。但是该位置已经放有元素，所以调用上面的函数，第一次发生冲突， d_i 为 1 。8 + 1 = 9 % 12 = 9 ，故放到下标为 9 的位置。

第五步：插入关键值 9 ，放入哈希函数取模 9 % 11 = 9 ，故放到下标为 9 的位置。但是该位置已经放有元素，所以调用上面的函数，第一次发生冲突， d_i 为 1 。9 + 1 = 10 % 12 = 10 ，故放到下标为 10 的位置。

但是下标为 10 的位置也放有元素，故继续调用上面的函数，此时是第二次发生冲突，d_i 加 1 等于 2 。9 + 2 = 11 % 12 = 11 ，故放到下标为 11 的位置。注意这里并不是用上面的得到的 10 继续加，而是用原来的哈希值来加即 H₀ 。

第六步：插入关键值 30 ，放入哈希函数取模 30 % 11 = 8 ，故放到下标为 8 的位置。但是该位置已经放有元素，所以按照上述步骤，得到最终位置 2 。

第七步：插入关键值 33 ，放入哈希函数取模 33 % 11 = 0 ，故放到下标为 0 的位置。但是该位置已经放有元素，所以按照上述步骤，得到最终位置 3 。

第八步：插入关键值 4 ，放入哈希函数取模 4 % 11 = 4 ，故放到下标为 4 的位置。

第九步：插入关键值 15 ，放入哈希函数取模 15 % 11 = 4 ，故放到下标为 4 的位置。但是该位置已经放有元素，所以按照上述步骤，得到最终位置 5 。

第十步：插入关键值 14 ，放入哈希函数取模 14 % 11 = 3 ，故放到下标为 3 的位置。

#include 
using namespace std;

/*
1
12 10
22 19 21 8 9 30 33 4 15 14
4
22
56
30
17
*/

int mod = 11;	//模数
int m;	//表长

//哈希查找
bool hash_find(int *arr, int dis) {
	if (arr[dis] == 0x3f3f3f3f)
		return true;
	return false;
}

//哈希插入
int hash_search(int *arr, int x) {
	int k = 0;	//设置累加值
	int dis = x % mod;
	while (k <= m - 1) {
		k++;	//每次查找都会加1（连续冲突）
		bool flag = hash_find(arr, dis);	//判断该值是否在哈希表中
		//如果查找位置为空，则说明该位置可以插入元素
		if (flag == true)
			return dis;
		dis = (x % mod + k) % m;	//重新计算哈希值
	}
	return -1;
}

//这里另外写一个哈希查找用于专门的查找操作，因为查找和插入对于arr数组的判断条件不同
int cnt;	//计算查找次数
int search(int *arr, int x) {
	int k = 0;
	int dis = x % mod;
	//k值不能超过表长
	while (k <= m - 1) {
		k++;
		cnt++;
		//如果查找位置等于关键值则返回下标
		if (arr[dis] == x)
			return dis;
		else if (arr[dis] == 0x3f3f3f3f)
			return -1;
		dis = (x % mod + k) % m;	//重新计算哈希值
	}
	return -1;
}

int main() {
	int n, t, k;
	cin >> t ;
	while (t--) {
		cin >> m >> n;
		int *arr = new int[m];
		//初始化哈希数组，将数组值初始化为非常大的值
		for (int i = 0; i < m; i++)
			arr[i] = 0x3f3f3f3f;
		//插入操作
		for (int i = 0; i < n; i++) {
			int x;
			cin >> x;
			int dis = hash_search(arr, x);
			arr[dis] = x;
		}
		//输出散列表
		for (int i = 0; i < m; i++) {
			//如果当前位置为超大值，说明为空，还未插入元素
			if (arr[i] != 0x3f3f3f3f)
				cout << arr[i] << " ";
			else
				cout << "NULL ";
		}
		cout << endl;
		//查找操作
		cin >> k;
		while (k--) {
			int x;
			cin >> x;
			cnt = 0;
			int dis = search(arr, x);
			//如果找不到就直接输出查找次数，否则输出查找次数和在数组中第几个位置
			if (dis == -1)	//查找不成功输出0
				cout << 0 << " " << cnt << endl;
			else	//否则输出1
				cout << 1 << " " << cnt << " " << dis + 1 << endl;
		}
	}
	return 0;
}

二次探测再散列法

二次探测再散列和线性探测再散列十分相像，只是 d_i 的计算不同，其它公式都一样。

d_i = (-1)ⁱ⁺¹ ( (i+1) / 2)², 1 ≤ i ≤ m/2 ，如 1² ,-1² ,2² ,-2² …

由于代码十分相近，这里就不再进行画图讲解了，直接来看代码~

#include 
using namespace std;

/*
1
12 10
22 19 21 8 9 30 33 4 41 13
4
22
15
30
41
*/

int mod = 11;	//模数
int m;	//表长

//哈希查找
bool hash_find(int *arr, int dis) {
	if (arr[dis] == 0x3f3f3f3f)
		return true;
	return false;
}

//哈希插入
int hash_search(int *arr, int x) {
	int k = 0;
	int dis = x % mod;
	while (k <= m / 2) {
		k++;
		if (arr[dis] == x)
			return -1;
		bool flag = hash_find(arr, dis);
		if (flag == true)
			return dis;
		//重新计算哈希函数
		int temp = pow(-1, k + 1);
		dis = (x % mod + temp * ((k + 1) / 2) * ((k + 1) / 2)) % m;
		while (dis < 0)
			dis += m;
	}
	return -1;
}

//同样用两个函数一个用于插入一个用于查找
int cnt;
int search(int *arr, int x) {
	int k = 0;
	int dis = x % mod;
	while (k <= m - 1) {
		k++;
		cnt++;
		if (arr[dis] == x)
			return dis;
		else if (arr[dis] == 0x3f3f3f3f)
			return -1;
		//重新计算哈希值
		int temp = pow(-1, k + 1);
		dis = (x % mod + temp * ((k + 1) / 2) * ((k + 1) / 2)) % m;
		while (dis < 0)
			dis += m;
	}
	return -1;
}

int main() {
	int n, t, k;
	cin >> t;
	while (t--) {
		cin >> m >> n;
		int *arr = new int[m];
		for (int i = 0; i < m; i++)
			arr[i] = 0x3f3f3f3f;
		//插入操作
		for (int i = 0; i < n; i++) {
			int x;
			cin >> x;
			int dis = hash_search(arr, x);
			arr[dis] = x;
		}
		//输出散列表
		if (arr[0] != 0x3f3f3f3f)
			cout << arr[0];
		else
			cout << "NULL";
		for (int i = 1; i < m; i++) {
			if (arr[i] != 0x3f3f3f3f)
				cout << " " << arr[i];
			else
				cout << " NULL";
		}
		cout << endl;
		//查找操作
		cin >> k;
		while (k--) {
			int x;
			cin >> x;
			cnt = 0;
			int dis = search(arr, x);
			if (dis == -1)
				cout << 0 << " " << cnt << endl;
			else
				cout << 1 << " " << cnt << " " << dis + 1 << endl;
		}
	}
	return 0;
}

如果大家有什么问题的话，欢迎在下方评论区进行讨论哦~

机器学习与深度学习间关系与区别 ℒℴѵℯ心·动ꦿ໊ོ꫞ 人工智能学习深度学习 python
一、机器学习概述定义机器学习（MachineLearning,ML）是一种通过数据驱动的方法，利用统计学和计算算法来训练模型，使计算机能够从数据中学习并自动进行预测或决策。机器学习通过分析大量数据样本，识别其中的模式和规律，从而对新的数据进行判断。其核心在于通过训练过程，让模型不断优化和提升其预测准确性。主要类型1.监督学习（SupervisedLearning）监督学习是指在训练数据集中包含输入
c++ 的iostream 和 c++的stdio的区别和联系黄卷青灯77 c++算法开发语言 iostream stdio
在C++中，iostream和C语言的stdio.h都是用于处理输入输出的库，但它们在设计、用法和功能上有许多不同。以下是两者的区别和联系：区别1.编程风格iostream（C++风格）：C++标准库中的输入输出流类库，支持面向对象的输入输出操作。典型用法是cin（输入）和cout（输出），使用>操作符来处理数据。更加类型安全，支持用户自定义类型的输入输出。#includeintmain(){in
Goolge earth studio 进阶4——路径修改与平滑陟彼高冈yu Google earth studio 进阶教程旅游
如果我们希望在大约中途时获得更多的城市鸟瞰视角。可以将相机拖动到这里并创建一个新的关键帧。camera_target_clip_7EarthStudio会自动平滑我们的路径，所以当我们通过这个关键帧时，不是一个生硬的角度，而是一个平滑的曲线。camera_target_clip_8路径上有贝塞尔控制手柄，允许我们调整路径的形状。右键单击，我们可以选择“平滑路径”，这是默认的自动平滑算法，或者我们可
基于社交网络算法优化的二维最大熵图像分割智能算法研学社（Jack旭）智能优化算法应用图像分割算法 php 开发语言
智能优化算法应用：基于社交网络优化的二维最大熵图像阈值分割-附代码文章目录智能优化算法应用：基于社交网络优化的二维最大熵图像阈值分割-附代码1.前言2.二维最大熵阈值分割原理3.基于社交网络优化的多阈值分割4.算法结果：5.参考文献：6.Matlab代码摘要：本文介绍基于最大熵的图像分割，并且应用社交网络算法进行阈值寻优。1.前言阅读此文章前，请阅读《图像分割：直方图区域划分及信息统计介绍》htt
数组去重好奇的猫猫猫
整理自js中基础数据结构数组去重问题思考？如何去除数组中重复的项例如数组：[1,3,4,3,5]我们在做去重的时候，一开始想到的肯定是，逐个比较，外面一层循环，内层后一个与前一个一比较，如果是久不将当前这一项放进新的数组，挨个比较完之后返回一个新的去过重复的数组不好的实践方式上述方法效率极低，代码量还多，思考？有没有更好的方法这时候不禁一想当然有了！！！hashtable啊，通过对象的hash办法
121. 买卖股票的最佳时机薄荷糖的味道_fb40
给定一个数组，它的第i个元素是一支给定股票第i天的价格。如果你最多只允许完成一笔交易（即买入和卖出一支股票），设计一个算法来计算你所能获取的最大利润。注意你不能在买入股票前卖出股票。示例1:输入:[7,1,5,3,6,4]输出:5解释:在第2天（股票价格=1）的时候买入，在第5天（股票价格=6）的时候卖出，最大利润=6-1=5。注意利润不能是7-1=6,因为卖出价格需要大于买入价格。示例2:输入:
【JS】执行时长(100分) |思路参考+代码解析（C++） l939035548 JS 算法数据结构 c++
题目为了充分发挥GPU算力，需要尽可能多的将任务交给GPU执行，现在有一个任务数组，数组元素表示在这1秒内新增的任务个数且每秒都有新增任务。假设GPU最多一次执行n个任务，一次执行耗时1秒，在保证GPU不空闲情况下，最少需要多长时间执行完成。题目输入第一个参数为GPU一次最多执行的任务个数，取值范围[1,10000]第二个参数为任务数组长度，取值范围[1,10000]第三个参数为任务数组，数字范围
每日算法&面试题，大厂特训二十八天——第二十天（树）肥学 ⚡算法题⚡面试题每日精进 java 算法数据结构
目录标题导读算法特训二十八天面试题点击直接资料领取导读肥友们为了更好的去帮助新同学适应算法和面试题，最近我们开始进行专项突击一步一步来。上一期我们完成了动态规划二十一天现在我们进行下一项对各类算法进行二十八天的一个小总结。还在等什么快来一起肥学进行二十八天挑战吧！！特别介绍小白练手专栏，适合刚入手的新人欢迎订阅编程小白进阶python有趣练手项目里面包括了像《机器人尬聊》《恶搞程序》这样的有趣文章
回溯算法-重新安排行程 chirou_ 算法数据结构图论 c++图搜索
leetcode332.重新安排行程这题我还没自己ac过，只能现在凭着刚学完的热乎劲把我对题解的理解记下来。本题我认为对数据结构的考察比较多，用什么数据结构去存数据，去读取数据，都是很重要的。classSolution{private:unordered_map>targets;boolbacktracking(intticketNum,vector&result){//1.确定参数和返回值//2
Redis系列：Geo 类型赋能亿级地图位置计算 Ly768768 redis bootstrap 数据库
1前言我们在篇深刻理解高性能Redis的本质的时候就介绍过Redis的几种基本数据结构，它是基于不同业务场景而设计的：动态字符串(REDIS_STRING)：整数(REDIS_ENCODING_INT)、字符串(REDIS_ENCODING_RAW)双端列表(REDIS_ENCODING_LINKEDLIST)压缩列表(REDIS_ENCODING_ZIPLIST)跳跃表(REDIS_ENCODI
基于CODESYS的多轴运动控制程序框架：逻辑与运动控制分离，快速开发灵活操作 GPJnCrbBdl python 开发语言
基于codesys开发的多轴运动控制程序框架，将逻辑与运动控制分离，将单轴控制封装成功能块，对该功能块的操作包含了所有的单轴控制（归零、点动、相对定位、绝对定位、设置当前位置、伺服模式切换等等）。程序框架由主程序按照状态调用分归零模式、手动模式、自动模式、故障模式，程序状态的跳转都已完成，只需要根据不同的工艺要求完成所需的动作即可。变量的声明、地址的规划都严格按照C++的标准定义，能帮助开发者快速
C++ | Leetcode C++题解之第409题最长回文串 Ddddddd_158 经验分享 C++Leetcode 题解
题目：题解：classSolution{public:intlongestPalindrome(strings){unordered_mapcount;intans=0;for(charc:s)++count[c];for(autop:count){intv=p.second;ans+=v/2*2;if(v%2==1andans%2==0)++ans;}returnans;}};
C++菜鸟教程 - 从入门到精通第二节 DreamByte c++
一.上节课的补充(数据类型)1.前言继上节课,我们主要讲解了输入,输出和运算符,我们现在来补充一下数据类型的知识上节课遗漏了这个知识点,非常的抱歉顺便说一下,博主要上高中了,更新会慢,2-4周更新一次对了,正好赶上中秋节,小编跟大家说一句:中秋节快乐!2.int类型上节课,我们其实只用了int类型int类型,是整数类型,它们存贮的是整数,不能存小数(浮点数)定义变量的方式很简单inta;//定义一
Faiss：高效相似性搜索与聚类的利器网络·魚大数据 faiss
Faiss是一个针对大规模向量集合的相似性搜索库，由FacebookAIResearch开发。它提供了一系列高效的算法和数据结构，用于加速向量之间的相似性搜索，特别是在大规模数据集上。本文将介绍Faiss的原理、核心功能以及如何在实际项目中使用它。Faiss原理：近似最近邻搜索：Faiss的核心功能之一是近似最近邻搜索，它能够高效地在大规模数据集中找到与给定查询向量最相似的向量。这种搜索是近似的，
数据结构之哈希表 X同学的开始数据结构数据结构散列表
哈希表(散列表)出现的原因在顺序表中查找时，需要从表头开始，依次遍历比较a[i]与key的值是否相等，直到相等才返回索引i；在有序表中查找时，我们经常使用的是二分查找，通过比较key与a[i]的大小来折半查找，直到相等时才返回索引i。最终通过索引找到我们要找的元素。但是，这两种方法的效率都依赖于查找中比较的次数。我们有一种想法，能不能不经过比较，而是直接通过关键字key一次得到所要的结果呢？这时，
insert into select 主键自增_mybatis拦截器实现主键自动生成 weixin_39521651 insert into select 主键自增 mybatis delete返回值 mybatis insert返回主键 mybatis insert返回对象 mybatis plus insert返回主键 mybatis plus 插入生成id
前言前阵子和朋友聊天，他说他们项目有个需求，要实现主键自动生成，不想每次新增的时候，都手动设置主键。于是我就问他，那你们数据库表设置主键自动递增不就得了。他的回答是他们项目目前的id都是采用雪花算法来生成，因此为了项目稳定性，不会切换id的生成方式。朋友问我有没有什么实现思路，他们公司的orm框架是mybatis，我就建议他说，不然让你老大把mybatis切换成mybatis-plus。mybat
k均值聚类算法考试例题_k均值算法(k均值聚类算法计算题) 寻找你83497 k均值聚类算法考试例题
?算法：第一步：选K个初始聚类中心，z1(1),z2(1)，…，zK(1)，其中括号内的序号为寻找聚类中心的迭代运算的次序号。聚类中心的向量值可任意设定，例如可选开始的K个.k均值聚类：---------一种硬聚类算法，隶属度只有两个取值0或1，提出的基本根据是“类内误差平方和最小化”准则；模糊的c均值聚类算法：--------一种模糊聚类算法，是.K均值聚类算法是先随机选取K个对象作为初始的聚类
Python开发常用的三方模块如下：换个网名有点难 python 开发语言
Python是一门功能强大的编程语言，拥有丰富的第三方库，这些库为开发者提供了极大的便利。以下是100个常用的Python库，涵盖了多个领域：1、NumPy，用于科学计算的基础库。2、Pandas，提供数据结构和数据分析工具。3、Matplotlib，一个绘图库。4、Scikit-learn，机器学习库。5、SciPy，用于数学、科学和工程的库。6、TensorFlow，由Google开发的开源机
Python实现简单的机器学习算法 master_chenchengg python python 办公效率 python开发 IT
Python实现简单的机器学习算法开篇：初探机器学习的奇妙之旅搭建环境：一切从安装开始必备工具箱第一步：安装Anaconda和JupyterNotebook小贴士：如何配置Python环境变量算法初体验：从零开始的Python机器学习线性回归：让数据说话数据准备：从哪里找数据编码实战：Python实现线性回归模型评估：如何判断模型好坏逻辑回归：从分类开始理论入门：什么是逻辑回归代码实现：使用skl
推荐算法_隐语义-梯度下降 _feivirus_ 算法机器学习和数学推荐算法机器学习隐语义
importnumpyasnp1.模型实现"""inputrate_matrix:M行N列的评分矩阵，值为P*Q.P:初始化用户特征矩阵M*K.Q:初始化物品特征矩阵K*N.latent_feature_cnt:隐特征的向量个数max_iteration:最大迭代次数alpha:步长lamda:正则化系数output分解之后的P和Q"""defLFM_grad_desc(rate_matrix,l
K近邻算法_分类鸢尾花数据集 _feivirus_ 算法机器学习和数学分类机器学习 K近邻
importnumpyasnpimportpandasaspdfromsklearn.datasetsimportload_irisfromsklearn.model_selectionimporttrain_test_splitfromsklearn.metricsimportaccuracy_score1.数据预处理iris=load_iris()df=pd.DataFrame(data=ir
Java面试题精选：消息队列(二) 芒果不是芒 Java面试题精选 java kafka
一、Kafka的特性1.消息持久化：消息存储在磁盘，所以消息不会丢失2.高吞吐量：可以轻松实现单机百万级别的并发3.扩展性：扩展性强，还是动态扩展4.多客户端支持：支持多种语言（Java、C、C++、GO、）5.KafkaStreams（一个天生的流处理）:在双十一或者销售大屏就会用到这种流处理。使用KafkaStreams可以快速的把销售额统计出来6.安全机制：Kafka进行生产或者消费的时候会
数据结构 | 栈和队列 TT-Kun 数据结构与算法数据结构栈队列 C语言
文章目录栈和队列1.栈：后进先出（LIFO）的数据结构1.1概念与结构1.2栈的实现2.队列：先进先出（FIFO）的数据结构2.1概念与结构2.2队列的实现3.栈和队列算法题3.1有效的括号3.2用队列实现栈3.3用栈实现队列3.4设计循环队列结论栈和队列在计算机科学中，栈和队列是两种基本且重要的数据结构，它们在处理数据存储和访问顺序方面有着独特的规则和应用。本文将详细介绍栈和队列的概念、结构、实
[Python] 数据结构详解及代码 AIAdvocate 算法 python 数据结构链表
今日内容大纲介绍数据结构介绍列表链表1.数据结构和算法简介程序大白话翻译,程序=数据结构+算法数据结构指的是存储,组织数据的方式.算法指的是为了解决实际业务问题而思考思路和方法,就叫:算法.2.算法的5大特性介绍算法具有独立性算法是解决问题的思路和方式,最重要的是思维,而不是语言,其(算法)可以通过多种语言进行演绎.5大特性有输入,需要传入1或者多个参数有输出,需要返回1个或者多个结果有穷性,执行
4.C_数据结构_队列荣世蓥数据结构数据结构
概述什么是队列：队列是限定在两端进行插入操作和删除操作的线性表。具有先入先出(FIFO)的特点相关名词：队尾：写入数据的一段队头：读取数据的一段空队：队列中没有数据，队头指针=队尾指针满队：队列中存满了数据，队尾指针+1=队头指针循环队列1、基本内容循环队列是以数组形式构成的队列数据结构。循环队列的结构体如下：typedefintdata_t;//队列数据类型#defineN64//队列容量typ
Python算法L5：贪心算法小熊同学哦 Python算法算法 python 贪心算法
Python贪心算法简介目录Python贪心算法简介贪心算法的基本步骤贪心算法的适用场景经典贪心算法问题1.**零钱兑换问题**2.**区间调度问题**3.**背包问题**贪心算法的优缺点优点：缺点：结语贪心算法（GreedyAlgorithm）是一种在每一步选择中都采取当前最优或最优解的算法。它的核心思想是，在保证每一步局部最优的情况下，希望通过贪心选择达到全局最优解。虽然贪心算法并不总能得到全
C++ lambda闭包消除类成员变量 barbyQAQ c++c++java 算法
原文链接：https://blog.csdn.net/qq_51470638/article/details/142151502一、背景在面向对象编程时，常常要添加类成员变量。然而类成员一旦多了之后，也会带来干扰。拿到一个类，一看成员变量好几十个，就问你怕不怕？二、解决思路可以借助函数式编程思想，来消除一些不必要的类成员变量。三、实例举个例子：classClassA{public:...intfu
2021 CCF 非专业级别软件能力认证第一轮（CSP-J1）入门级C++语言试题（第三大题：完善程序代码） mmz1207 c++csp
最近有一段时间没更新了，在准备CSP考试，请大家见谅。（1）有n个人围成一个圈，依次标号0到n-1。从0号开始，依次0，1，0，1...交替报数，报到一的人离开，直至圈中剩最后一个人。求最后剩下的人的编号。#includeusingnamespacestd;intf[1000010];intmain(){intn;cin>>n;inti=0,cnt=0,p=0;while(cnt#includeu
《 C++ 修炼全景指南：九》打破编程瓶颈！掌握二叉搜索树的高效实现与技巧 Lenyiin C++修炼全景指南技术指南 c++算法 stl
摘要本文详细探讨了二叉搜索树（BinarySearchTree,BST）的核心概念和技术细节，包括插入、查找、删除、遍历等基本操作，并结合实际代码演示了如何实现这些功能。文章深入分析了二叉搜索树的性能优势及其时间复杂度，同时介绍了前驱、后继的查找方法等高级功能。通过自定义实现的二叉搜索树类，读者能够掌握其实际应用，此外，文章还建议进一步扩展为平衡树（如AVL树、红黑树）以优化极端情况下的性能退化。
20个新手学习c++必会的程序输出*三角形、杨辉三角等（附代码） X_StarX c++学习算法大学生开发语言数据结构
示例1:HelloWorld#includeusingnamespacestd;intmain(){coutusingnamespacestd;intmain(){inta=5;intb=10;intsum=a+b;coutusingnamespacestd;intfactorial(intn){if(nusingnamespacestd;voidprintFibonacci(intn){intt
jQuery 跨域访问的三种方式 No 'Access-Control-Allow-Origin' header is present on the reque qiaolevip 每天进步一点点学习永无止境跨域众观千象
XMLHttpRequest cannot load http://v.xxx.com. No 'Access-Control-Allow-Origin' header is present on the requested resource. Origin 'http://localhost:63342' is therefore not allowed access. test.html:1
mysql 分区查询优化 annan211 java 分区优化 mysql
分区查询优化引入分区可以给查询带来一定的优势，但同时也会引入一些bug. 分区最大的优点就是优化器可以根据分区函数来过滤掉一些分区，通过分区过滤可以让查询扫描更少的数据。所以，对于访问分区表来说，很重要的一点是要在where 条件中带入分区，让优化器过滤掉无需访问的分区。可以通过查看explain执行计划，是否携带 partitions
MYSQL存储过程中使用游标 chicony Mysql存储过程
DELIMITER $$ DROP PROCEDURE IF EXISTS getUserInfo $$ CREATE PROCEDURE getUserInfo(in date_day datetime)-- -- 实例-- 存储过程名为：getUserInfo-- 参数为：date_day日期格式:2008-03-08-- BEGINdecla
mysql 和 sqlite 区别 Array_06 sqlite
转载： http://www.cnblogs.com/ygm900/p/3460663.html mysql 和 sqlite 区别 SQLITE是单机数据库。功能简约，小型化，追求最大磁盘效率 MYSQL是完善的服务器数据库。功能全面，综合化，追求最大并发效率 MYSQL、Sybase、Oracle等这些都是试用于服务器数据量大功能多需要安装，例如网站访问量比较大的。而sq
pinyin4j使用 oloz pinyin4j
首先需要pinyin4j的jar包支持；jar包已上传至附件内方法一:把汉字转换为拼音；例如：编程转换后则为biancheng /** * 将汉字转换为全拼 * @param src 你的需要转换的汉字 * @param isUPPERCASE 是否转换为大写的拼音； true:转换为大写；fal
微博发送私信随意而生微博
在前面文章中说了如和获取登陆时候所需要的cookie，现在只要拿到最后登陆所需要的cookie，然后抓包分析一下微博私信发送界面 http://weibo.com/message/history?uid=****&name=**** 可以发现其发送提交的Post请求和其中的数据，让后用程序模拟发送POST请求中的数据，带着cookie发送到私信的接入口，就可以实现发私信的功能了。
jsp 香水浓 jsp
JSP初始化容器载入JSP文件后，它会在为请求提供任何服务前调用jspInit()方法。如果您需要执行自定义的JSP初始化任务，复写jspInit()方法就行了 JSP执行这一阶段描述了JSP生命周期中一切与请求相关的交互行为，直到被销毁。当JSP网页完成初始化后
在 Windows 上安装 SVN Subversion 服务端 AdyZhang SVN
在 Windows 上安装 SVN Subversion 服务端2009-09-16高宏伟哈尔滨市道里区通达街291号最佳阅读效果请访问原地址：http://blog.donews.com/dukejoe/archive/2009/09/16/1560917.aspx 现在的Subversion已经足够稳定，而且已经进入了它的黄金时段。我们看到大量的项目都在使
android开发中如何使用 alertDialog从listView中删除数据？ aijuans android
我现在使用listView展示了很多的配置信息，我现在想在点击其中一条的时候填出 alertDialog,点击确认后就删除该条数据，（ ArrayAdapter ，ArrayList，listView 全部删除），我知道在下面的onItemLongClick 方法中参数 arg2 是选中的序号，但是我不知道如何继续处理下去 1 2 3
jdk-6u26-linux-x64.bin 安装 baalwolf linux
1.上传安装文件(jdk-6u26-linux-x64.bin) 2.修改权限 [root@localhost ~]# ls -l /usr/local/jdk-6u26-linux-x64.bin 3.执行安装文件 [root@localhost ~]# cd /usr/local [root@localhost local]# ./jdk-6u26-linux-x64.bin&nbs
MongoDB经典面试题集锦 BigBird2012 mongodb
1.什么是NoSQL数据库？NoSQL和RDBMS有什么区别？在哪些情况下使用和不使用NoSQL数据库？ NoSQL是非关系型数据库，NoSQL = Not Only SQL。关系型数据库采用的结构化的数据，NoSQL采用的是键值对的方式存储数据。在处理非结构化/半结构化的大数据时；在水平方向上进行扩展时；随时应对动态增加的数据项时可以优先考虑使用NoSQL数据库。在考虑数据库的成熟
JavaScript异步编程Promise模式的6个特性 bijian1013 JavaScript Promise
Promise是一个非常有价值的构造器，能够帮助你避免使用镶套匿名方法，而使用更具有可读性的方式组装异步代码。这里我们将介绍6个最简单的特性。在我们开始正式介绍之前，我们想看看Javascript Promise的样子： var p = new Promise(function(r
[Zookeeper学习笔记之八]Zookeeper源代码分析之Zookeeper.ZKWatchManager bit1129 zookeeper
ClientWatchManager接口 //接口的唯一方法materialize用于确定那些Watcher需要被通知 //确定Watcher需要三方面的因素1.事件状态 2.事件类型 3.znode的path public interface ClientWatchManager { /** * Return a set of watchers that should
【Scala十五】Scala核心九：隐式转换之二 bit1129 scala
隐式转换存在的必要性，在Java Swing中，按钮点击事件的处理，转换为Scala的的写法如下： val button = new JButton button.addActionListener( new ActionListener { def actionPerformed(event: ActionEvent) {
Android JSON数据的解析与封装小Demo ronin47
转自：http://www.open-open.com/lib/view/open1420529336406.html package com.example.jsondemo; import org.json.JSONArray; import org.json.JSONException; import org.json.JSONObject; impor
[设计]字体创意设计方法谈 brotherlamp UI ui自学 ui视频 ui教程 ui资料
从古至今，文字在我们的生活中是必不可少的事物，我们不能想象没有文字的世界将会是怎样。在平面设计中，UI设计师在文字上所花的心思和功夫最多，因为文字能直观地表达UI设计师所的意念。在文字上的创造设计，直接反映出平面作品的主题。如设计一幅戴尔笔记本电脑的广告海报，假设海报上没有出现“戴尔”两个文字，即使放上所有戴尔笔记本电脑的图片都不能让人们得知这些电脑是什么品牌。只要写上“戴尔笔
单调队列-用一个长度为k的窗在整数数列上移动，求窗里面所包含的数的最大值 bylijinnan java 算法面试题
import java.util.LinkedList; /* 单调队列滑动窗口单调队列是这样的一个队列：队列里面的元素是有序的，是递增或者递减题目：给定一个长度为N的整数数列a(i),i=0,1,...,N-1和窗长度k. 要求：f(i) = max{a(i-k+1),a(i-k+2),..., a(i)},i = 0,1,...,N-1 问题的另一种描述就
struts2处理一个form多个submit chiangfai struts2
web应用中，为完成不同工作，一个jsp的form标签可能有多个submit。如下代码： <s:form action="submit" method="post" namespace="/my"> <s:textfield name="msg" label="叙述：">
shell查找上个月，陷阱及野路子 chenchao051 shell
date -d "-1 month" +%F 以上这段代码，假如在2012/10/31执行，结果并不会出现你预计的9月份，而是会出现八月份，原因是10月份有31天，9月份30天，所以-1 month在10月份看来要减去31天，所以直接到了8月31日这天，这不靠谱。野路子解决：假设当天日期大于15号
mysql导出数据中文乱码问题 daizj mysql 中文乱码导数据
解决mysql导入导出数据乱码问题方法：１、进入mysql，通过如下命令查看数据库编码方式： mysql> show variables like 'character_set_%'; +--------------------------+----------------------------------------+ | Variable_name&nbs
SAE部署Smarty出现：Uncaught exception 'SmartyException' with message 'unable to write dcj3sjt126com PHP smarty sae
对于SAE出现的问题：Uncaught exception 'SmartyException' with message 'unable to write file...。官方给出了详细的FAQ：http://sae.sina.com.cn/?m=faqs&catId=11#show_213 解决方案为： 01 $path
《教父》系列台词 dcj3sjt126com
Your love is also your weak point. 你的所爱同时也是你的弱点。 If anything in this life is certain, if history has taught us anything, it is that you can kill anyone. 不顾家的人永远不可能成为一个真正的男人。 &
mongodb安装与使用 dyy_gusi mongo
一.MongoDB安装和启动,widndows和linux基本相同 1.下载数据库, linux:mongodb-linux-x86_64-ubuntu1404-3.0.3.tgz 2.解压文件,并且放置到合适的位置 tar -vxf mongodb-linux-x86_64-ubun
Git排除目录 geeksun git
在Git的版本控制中，可能有些文件是不需要加入控制的，那我们在提交代码时就需要忽略这些文件，下面讲讲应该怎么给Git配置一些忽略规则。有三种方法可以忽略掉这些文件，这三种方法都能达到目的，只不过适用情景不一样。 1. 针对单一工程排除文件这种方式会让这个工程的所有修改者在克隆代码的同时，也能克隆到过滤规则，而不用自己再写一份，这就能保证所有修改者应用的都是同一
Ubuntu 创建开机自启动脚本的方法 hongtoushizi ubuntu
转载自： http://rongjih.blog.163.com/blog/static/33574461201111504843245/ Ubuntu 创建开机自启动脚本的步骤如下： 1) 将你的启动脚本复制到 /etc/init.d目录下以下假设你的脚本文件名为 test。 2) 设置脚本文件的权限 $ sudo chmod 755
第八章流量复制/AB测试/协程 jinnianshilongnian nginx lua coroutine
流量复制在实际开发中经常涉及到项目的升级，而该升级不能简单的上线就完事了，需要验证该升级是否兼容老的上线，因此可能需要并行运行两个项目一段时间进行数据比对和校验，待没问题后再进行上线。这其实就需要进行流量复制，把流量复制到其他服务器上，一种方式是使用如tcpcopy引流；另外我们还可以使用nginx的HttpLuaModule模块中的ngx.location.capture_multi进行并发
电商系统商品表设计 lkl
DROP TABLE IF EXISTS `category`; -- 类目表 /*!40101 SET @saved_cs_client = @@character_set_client */; /*!40101 SET character_set_client = utf8 */; CREATE TABLE `category` ( `id` int(11) NOT NUL
修改phpMyAdmin导入SQL文件的大小限制 pda158 sql mysql
　用phpMyAdmin导入mysql数据库时，我的10M的数据库不能导入，提示mysql数据库最大只能导入2M。　　 phpMyAdmin数据库导入出错：　　You probably tried to upload too large file. Please refer to documentation for ways to workaround this limit.
Tomcat性能调优方案 Sobfist apache jvm tomcat 应用服务器
一、操作系统调优对于操作系统优化来说，是尽可能的增大可使用的内存容量、提高CPU的频率，保证文件系统的读写速率等。经过压力测试验证，在并发连接很多的情况下，CPU的处理能力越强，系统运行速度越快。。【适用场景】任何项目。二、Java虚拟机调优应该选择SUN的JVM，在满足项目需要的前提下，尽量选用版本较高的JVM，一般来说高版本产品在速度和效率上比低版本会有改进。 J
SQLServer学习笔记 vipbooks 数据结构 xml
1、create database school 创建数据库school 2、drop database school 删除数据库school 3、use school 连接到school数据库，使其成为当前数据库 4、create table class(classID int primary key identity not null) 创建一个名为class的表，其有一