时空霹雳

利用Trie树求多个字符串的最小编辑距离

1.编辑距离、拼写检查与度量空间：一个有趣的数据结构

        本小节内容转自：转自http://www.matrix67.com/blog/archives/333 Matrix67原创

        除了字符串匹配、查找回文串、查找重复子串等经典问题以外，日常生活中我们还会遇到其它一些怪异的字符串问题。比如，有时我们需要知道给定的两个字符串 “有多像”，换句话说两个字符串的相似度是多少。1965年，俄国科学家Vladimir Levenshtein给字符串相似度做出了一个明确的定义叫做Levenshtein距离，我们通常叫它“编辑距离”。字符串A到B的编辑距离是指，只用插入、删除和替换三种操作，最少需要多少步可以把A变成B。例如，从FAME到GATE需要两步（两次替换），从GAME到ACM则需要三步（删除G和 E再添加C）。Levenshtein给出了编辑距离的一般求法，就是大家都非常熟悉的经典动态规划问题。
        在自然语言处理中，这个概念非常重要，例如我们可以根据这个定义开发出一套半自动的校对系统：查找出一篇文章里所有不在字典里的单词，然后对于每个单词，列出字典里与它的 Levenshtein距离小于某个数n的单词，让用户选择正确的那一个。n通常取到2或者3，或者更好地，取该单词长度的1/4等等。这个想法倒不错，但算法的效率成了新的难题：查字典好办，建一个Trie树即可；但怎样才能快速在字典里找出最相近的单词呢？这个问题难就难在，Levenshtein的定义可以是单词任意位置上的操作，似乎不遍历字典是不可能完成的。现在很多软件都有拼写检查的功能，提出更正建议的速度是很快的。它们到底是怎么做的呢？1973年，Burkhard和Keller提出的BK树有效地解决了这个问题。这个数据结构强就强在，它初步解决了一个看似不可能的问题，而其原理非常简单。

        首先，我们观察Levenshtein距离的性质。令d(x,y)表示字符串x到y的Levenshtein距离，那么显然：

        1. d(x,y) = 0 当且仅当 x=y （Levenshtein距离为0 <==> 字符串相等）
        2. d(x,y) = d(y,x)     （从x变到y的最少步数就是从y变到x的最少步数）
        3. d(x,y) + d(y,z) >= d(x,z) （从x变到z所需的步数不会超过x先变成y再变成z的步数）

        最后这一个性质叫做三角形不等式。就好像一个三角形一样，两边之和必然大于第三边。给某个集合内的元素定义一个二元的“距离函数”，如果这个距离函数同时满足上面说的三个性质，我们就称它为 “度量空间”。我们的三维空间就是一个典型的度量空间，它的距离函数就是点对的直线距离。度量空间还有很多，比如Manhattan距离，图论中的最短路，当然还有这里提到的Levenshtein距离。就好像并查集对所有等价关系都适用一样，BK树可以用于任何一个度量空间。

        建树的过程有些类似于Trie。首先我们随便找一个单词作为根（比如GAME）。以后插入一个单词时首先计算单词与根的Levenshtein距离：如果这个距离值是该节点处头一次出现，建立一个新的儿子节点；否则沿着对应的边递归下去。例如，我们插入单词FAME，它与GAME的距离为1，于是新建一个儿子，连一条标号为1的边；下一次插入GAIN，算得它与GAME的距离为2，于是放在编号为2的边下。再下次我们插入GATE，它与GAME距离为1，于是沿着那条编号为1的边下去，递归地插入到FAME所在子树；GATE与FAME的距离为2，于是把GATE放在FAME节点下，边的编号为2。

        查询操作异常方便。如果我们需要返回与错误单词距离不超过n的单词，这个错误单词与树根所对应的单词距离为d，那么接下来我们只需要递归地考虑编号在d- n 到d+n范围内的边所连接的子树。由于n通常很小，因此每次与某个节点进行比较时都可以排除很多子树。
举个例子，假如我们输入一个 GAIE，程序发现它不在字典中。现在，我们想返回字典中所有与GAIE距离为1的单词。我们首先将GAIE与树根进行比较，得到的距离d=1。由于 Levenshtein距离满足三角形不等式，因此现在所有离GAME距离超过2的单词全部可以排除了。比如，以AIM为根的子树到GAME的距离都是 3，而GAME和GAIE之间的距离是1，那么AIM及其子树到GAIE的距离至少都是2。于是，现在程序只需要沿着标号范围在1-1到1+1里的边继续走下去。我们继续计算GAIE和FAME的距离，发现它为2，于是继续沿标号在1和3之间的边前进。遍历结束后回到GAME的第二个节点，发现GAIE和 GAIN距离为1，输出GAIN并继续沿编号为1或2的边递归下去（那条编号为4的边连接的子树又被排除掉了）……
        实践表明，一次查询所遍历的节点不会超过所有节点的5%到8%，两次查询则一般不会17-25%，效率远远超过暴力枚举。适当进行缓存，减小Levenshtein距离常数n 可以使算法效率更高。

以下内容为原创：

2.Trie树的实现

        Trie树可以用多叉树实现，也可以用二叉树来实现。用多叉树实现的好处是直观易懂，思路清晰，但是弱点也很明显，就是太占用空间了。不管一棵树有多少个孩子，都要按照固定的数目为孩子分配空间。而且必须按照孩子数目的最大值来确定每个节点的分支数量。而且一旦节点的结构确定好了之后，当数据发生变化的时候，重构整棵树就会有风险——很有可能当前的数据中某个节点的最大孩子数目查过以前确定好的节点结构的容量。由于多叉树不够灵活，同时对空间存在即大的浪费，因此本文利用二叉树实现一棵Trie树。

        虽然这样做使算法变得复杂，也不容易理解，但是便于灵活的根据实际问题进行节点分配。在效率上，这样做相比多叉树有所降低，但是节约了空间，在规模比较大的问题上面不会令整棵树占用的空间急剧膨胀，还是值得的。换句话说，使用二叉树实现Trie树在时间复杂度和空间复杂度之间做了一个平衡。

        二叉树是这样的结构：节点的左孩子代表它的第一个孩子，节点的右孩子代表它的兄弟节点。

        总体的思路是：

        （1）建立10万次的词典，单词长度5-30
        （2）为这些单词建立Trie树，给定任意字符串，求所有与该字符串的编辑距离为1或者2的单词

        （3）同时用暴力匹配的方法求得符合要求的字符串，然后进行时间的比较。

3.试验结果

        用随机产生的字符串做测试，提取10组实验数据，列表如下：

序号	建树时间	Trie树搜索时间	暴力匹配搜索时间	时间比值
1	14726	56	812	6.90%
2	14999	72	810	8.89%
3	15125	79	825	9.58%
4	14642	54	809	6.67%
5	14709	72	813	8.86%
6	14734	70	831	8.42%
7	14649	39	816	4.78%
8	14694	54	817	6.61%
9	14998	75	810	9.26%
10	14644	73	810	9.01%
平均值	14792	64.4	815.3	7.90%

利用Trie树搜索比暴力匹配方式搜索快得多，一次查询的时间比值：最好为：4.78%，最坏为：9.57，平均为：7.90%

4.源代码

#include 
#include 
#include 
#include 
#include 
#include 
#include 
#include 
#include 

using namespace std;

const int X = 30;
const int Y = 30;
const int MAX = 30;


int edit_length(string &x, string &y);
//-----------------------Trie树的节点定义--------------------------
class Node{
	public:
		int length;
		string word;
		Node* left;
		Node* right;
	public:
		Node() : length(0), word(""){
			left == NULL;
			right == NULL;
		}
};

//-----------------------Trie树的操作定义--------------------------
//Trie树的操作定义
class Trie{
	private:
		Node* pRoot;
	private:
		void destory(Node* r);
		void find(Node *pRoot, string &str, int limit_num, vector &word_set);
	public:
		Trie();
		~Trie();
		void insert(string str);
		void search(string &str, int limit_num, vector &word_set);
};

Trie::Trie(){

}

Trie::~Trie(){
	destory(pRoot);
}

//销毁Trie树
void Trie::destory(Node* pRoot){
	if(pRoot == NULL){
		return;
	}
	destory(pRoot -> left);
	destory(pRoot -> right);
	delete pRoot;
	pRoot = NULL;
}

//插入单词，建立Trie树
void Trie::insert(string str){
	if(pRoot != NULL){
		//如果trie树已经存在
		Node *pPre = pRoot;
		Node *pCur = pRoot -> left;
		while(1) {
			//计算该单词与当前节点的编辑距离
			string word = pPre -> word;
			int distance = edit_length(word, str);
			//若该单词已存在
			if(distance == 0) {
				break;
			}
			//若该单词不存在
			if(pCur == NULL) {
				//若首节点不存在，则创建首节点
				pCur = new Node();
				pCur -> length = distance;
				pCur -> word = str;
				pCur -> left = NULL;
				pCur -> right = NULL;

				pPre -> left = pCur;

				break;

			} else if (pCur != NULL && pCur -> length > distance) {
				//若首节点存在，并且首节点大于目标编辑距离，重建首节点
				Node *p = new Node();
				p -> length = distance;
				p -> word = str;
				p -> left = NULL;
				p -> right = pCur;

				pPre -> left = p;
				break;

			} else {
				//首节点存在，且首节点小于等于目标编辑距离
				while(pCur != NULL && pCur -> length < distance){
					pPre = pCur;
					pCur = pCur -> right;
				}
				if(pCur != NULL && pCur -> length == distance){
					//找到了目标节点
					pPre = pCur;
					pCur = pCur -> left;
				} else {
					//创建目标节点
					Node *p = new Node();
					p -> length = distance;
					p -> word = str;
					p -> left = NULL;
					p -> right = pCur;

					pPre -> right = p;
					break;
				}
			}
		}
	} else {
		//如果Trie树还不存在，以该单词创建根节点
		pRoot = new Node();
		pRoot -> length = 0;
		pRoot -> word = str;
	}
}

//搜索与给定字符串的编辑距离小于给定值的所有字符串（内部调用）
void Trie::find(Node* pRoot, string &str, int limit_num, vector &word_set){

	if(pRoot == NULL){
		cout << "kong" << endl;
		return;
	}
	string word = pRoot -> word;
	int distance = edit_length(word, str);
	if(distance < limit_num) {
		word_set.push_back(word);
	}

	//如果当前节点有孩子的话
	Node *pCur = pRoot -> left;
	while(pCur != NULL){
		if(pCur -> length < distance + limit_num &&	
			pCur -> length > distance - limit_num &&
			pCur -> length > limit_num - distance){
			find(pCur, str, limit_num, word_set);
		}
		pCur = pCur -> right;
	}
}


//包装函数，搜索与给定字符串的编辑距离小于给定值的所有字符串（外部调用）
void Trie::search(string &str, int limit_num, vector &word_set){
	find(pRoot, str, limit_num, word_set);
}
//---------------------------工具函数------------------------------

//求两个字符串的最断编辑距离
int edit_length(string &x, string &y){
	int xlen = x.length();
	int ylen = y.length();
	int edit[3][Y+1];
	memset(edit, 0, sizeof(edit));
	
	int i = 0;
	int j = 0;
	for(j = 0; j <= ylen; j++){
		edit[0][j] = j;
	}
	for(i = 1; i <= xlen; i++){
		edit[i%3][0] = edit[(i-1)%3][0] + 1;
		for(j = 1; j <= ylen; j++){
			if (x[i-1] == y[j-1]) {
				edit[i%3][j] = min(min(edit[i%3][j-1] + 1, edit[(i-1)%3][j] + 1),
							edit[(i-1)%3][j-1]);
			} else {
				if(i >= 2 && j >= 2 && x[i-2] == y[j-1] && x[i-1] == y[j-2]){
					edit[i%3][j] = min(min(edit[i%3][j-1] + 1, edit[(i-1)%3][j] + 1),
										min(edit[(i-1)%3][j-1] + 1, edit[(i-2)%3][j-2] + 1));
				} else {
					edit[i%3][j] = min(min(edit[i%3][j-1] + 1, edit[(i-1)%3][j] + 1),
										edit[(i-1)%3][j-1] + 1);
				}
			}
		}
	}
	return edit[(i-1)%3][j-1];
}

//生成随机字符串
string rand_string(int len){
	srand(time(NULL));
	char a[MAX+1];
	for(int i = 0; i < len; i++){
		a[i] = rand()%26 + 'a';
	}
	a[len] = '\0';
	string str(a);
	return str;
}

//获取当前时间(ms)
long getCurrentTime(){
	struct timeval tv;
	gettimeofday(&tv, NULL);
	return tv.tv_sec*1000 + tv.tv_usec/1000;
}

//-----------------------------测试函数------------------------

//测试最短编辑距离函数
void Test_1(){

	string a = "abcdef";
	string b = "abcdef";
	int max_len = edit_length(a, b);
	cout << max_len << endl;

}

//验证Trie树是否完整
void Test_2(){

	//1.创建对象，打开文件
	Trie trie;
	string str;
	ifstream fin;
	fin.open("dict.txt");
	if(!fin){
		cout << "打开文件失败！" << endl;
	}
	
	//2.建立Trie树
	while(getline(fin, str, '\n')){
		trie.insert(str);
	}
	fin.close();

	//3.验证Trie树的正确性
	fin.open("dict.txt");
	if(!fin){
		cout << "打开文件失败！" << endl;
	}
	while(getline(fin, str, '\n')){
		int count = 0;
		vector word_set;
		trie.search(str, 1, word_set);
		cout << word_set.size() << "  " << str << endl;
	}
	
}


//测试对于随机字符串搜索结果的正确性
void Test_3(){

	//1.创建对象，打开文件
	Trie trie;
	string str;
	ifstream fin;
	fin.open("dict.txt");
	if(!fin){
		cout << "打开文件失败！" << endl;
	}
	
	//2.建立Trie树
	long time_1 = getCurrentTime();
	while(getline(fin, str, '\n')){
		trie.insert(str);
	}
	long time_2 = getCurrentTime();
	fin.close();
	
	//3.产生随机字符串
	string rand_str = rand_string(6);
	//rand_str = "wdeuojyucsalslpd";
	cout << "随机字符串为：" << rand_str << endl;

	//4.利用Trie树计算结果
	vector word_set_1;
	long time_3 = getCurrentTime();
	trie.search(rand_str, 3, word_set_1);
	long time_4 = getCurrentTime();

	//5.利用暴力匹配计算结果	
	vector word_set_2;
	vector word_dict;
	fin.open("dict.txt");
	if(!fin){
		cout << "打开文件失败！" << endl;
	}
	while(getline(fin, str, '\n')){
		word_dict.push_back(str);
	}
	int size = word_dict.size();
	long time_5 = getCurrentTime();
	for(int j = 0; j < size; j++){
		if(edit_length(word_dict[j], rand_str) < 3){
			word_set_2.push_back(word_dict[j]);
		}
	}
	long time_6 = getCurrentTime();
	fin.close();

	//6.结果比较
	sort(word_set_1.begin(), word_set_1.end());
	sort(word_set_2.begin(), word_set_2.end());

	cout << "word_set_1的大小：" << word_set_1.size() << endl;
	cout << "结果为：";
	for(int i = 0; i < word_set_1.size(); i++){
		cout << "  " << word_set_1[i];
	}
	cout << endl;

	cout << "word_set_2的大小：" << word_set_2.size() << endl;
	cout << "结果为：";
	for(int i = 0; i < word_set_2.size(); i++){
		cout << "  " << word_set_2[i];
	}
	cout << endl;

	if(word_set_1 == word_set_2){
		cout << "验证正确" << endl;
	} else {
		cout << "验证错误" << endl;
	}
	
	//7.时间比较
	cout << "建立Trie树用时（ms）：" << time_2 - time_1 << endl;
	cout << "Trie树搜索用时（ms）：" << time_4 - time_3 << endl;
	cout << "暴力搜索用时（ms）："   << time_6 - time_5 << endl;
	cout << "百分比：" << double(time_4 -time_3)/(time_6 - time_5) << endl;
}
int main(){
	
	//Test_1();
	//Test_2();
	Test_3();

	

}

冒泡、选择、插入排序：三大基础排序算法深度解析（C语言实现） xienda 算法排序算法数据结构
在算法学习道路上，排序算法是每位程序员必须掌握的基石。本文将深入解析冒泡排序、选择排序和插入排序这三种基础排序算法，通过C语言代码实现和对比分析，帮助读者彻底理解它们的差异与应用场景。算法原理与代码实现1.冒泡排序（BubbleSort）工作原理：通过重复比较相邻元素，将较大元素逐步"冒泡"到数组末尾。voidbubbleSort(intarr[],intn){ for(inti=0;iarr[
算法学习笔记：17.蒙特卡洛算法 ——从原理到实战，涵盖 LeetCode 与考研 408 例题
在计算机科学和数学领域，蒙特卡洛算法（MonteCarloAlgorithm）以其独特的随机抽样思想，成为解决复杂问题的有力工具。从圆周率的计算到金融风险评估，从物理模拟到人工智能，蒙特卡洛算法都发挥着不可替代的作用。本文将深入剖析蒙特卡洛算法的思想、解题思路，结合实际应用场景与Java代码实现，并融入考研408的相关考点，穿插图片辅助理解，帮助你全面掌握这一重要算法。蒙特卡洛算法的基本概念蒙特卡
算法学习笔记：15.二分查找 ——从原理到实战，涵盖 LeetCode 与考研 408 例题呆呆企鹅仔算法学习算法学习笔记考研二分查找
在计算机科学的查找算法中，二分查找以其高效性占据着重要地位。它利用数据的有序性，通过不断缩小查找范围，将原本需要线性时间的查找过程优化为对数时间，成为处理大规模有序数据查找问题的首选算法。二分查找的基本概念二分查找（BinarySearch），又称折半查找，是一种在有序数据集合中查找特定元素的高效算法。其核心原理是：通过不断将查找范围减半，快速定位目标元素。与线性查找逐个遍历元素不同，二分查找依赖
深入浅出二分法：从实际问题看“最小化最大值”问题的求解之道余厌厌厌算法数据结构 go
在算法学习中，二分法是一种高效且应用广泛的查找策略。它不仅能用于有序数组的元素查找，更在“最小化最大值”“最大化最小值”等优化问题中发挥着关键作用。本文将结合两道典型例题，从问题分析、思路推导到代码实现，带你深入理解二分法在这类问题中的应用，并总结常见错误与避坑指南。一、二分法的核心思想：利用单调性高效收缩范围二分法的本质是通过不断将搜索范围减半，快速定位目标值。在“最小化最大值”问题中，其核心逻
算法学习笔记：10.Prim 算法——从原理到实战，涵盖 LeetCode 与考研 408 例题呆呆企鹅仔算法学习算法学习笔记 Java Prim
在图论的世界里，最小生成树（MinimumSpanningTree,MST）是一个至关重要的概念，它在通信网络设计、电路布线、交通规划等领域有着广泛的应用。求解最小生成树的算法中，Prim算法以其独特的“逐步扩展”思想占据着重要地位。Prim算法的基本概念在正式介绍Prim算法之前，我们先回顾一下最小生成树的定义：对于一个具有n个顶点的带权连通图，其最小生成树是包含所有n个顶点的一棵无环子图，且该
算法学习笔记：11.冒泡排序——从原理到实战，涵盖 LeetCode 与考研 408 例题
在排序算法的大家族中，冒泡排序是最基础也最经典的算法之一。它的核心思想简单易懂，通过重复地走访待排序序列，一次比较两个相邻的元素，若它们的顺序错误就把它们交换过来，直到没有需要交换的元素为止。虽然冒泡排序的时间复杂度较高，在大规模数据排序中并不常用，但它是理解排序算法思想的绝佳入门案例，也是计算机考研408和算法学习中的基础内容。冒泡排序的基本概念冒泡排序（BubbleSort）之所以被称为“冒泡
算法学习领域的宝藏 wylee 算法学习 leetcode
labuladong的算法笔记仓库是算法学习领域的宝藏项目，它围绕LeetCode题目，以培养算法思维为核心，提供丰富学习资源与多种实用工具，助力学习者提升算法能力。项目核心内容：仓库包含60多篇原创文章，基于LeetCode题目展开，全面覆盖各种算法题型与技巧，旨在培养学习者的算法思维，避免单纯的代码堆砌。文章注重思路解释和思维框架构建，通过总结算法套路，帮助学习者少走弯路。学习资源与工具算法可
算法学习笔记：7.Dijkstra 算法——从原理到实战，涵盖 LeetCode 与考研 408 例题
在计算机科学领域，图论算法一直占据着重要地位，其中Dijkstra算法作为求解单源最短路径问题的经典算法，被广泛应用于路径规划、网络路由等多个场景。无论是算法竞赛、实际项目开发，还是计算机考研408的备考，Dijkstra算法都是必须掌握的核心内容。一、Dijkstra算法的基本概念Dijkstra算法是由荷兰计算机科学家EdsgerW.Dijkstra在1956年提出的，用于解决带权有向图或无向
算法学习day6----双指针-最长不重复子序列阴暗老鼠人学习
Givenanintegersequenceoflengthn,pleasefindthelongestcontinuousintervalwithoutduplicatenumbersandoutputitslength.Thefirstlinecontainsanintegern.Thesecondlinecontainsnintegers(allwithintherangeof0to105)
关联规则算法学习—Apriori Did然数据挖掘算法学习 python 数据挖掘
关联规则算法学习—Apriori一、实验项目：关联规则算法学习项目性质：设计型二、实验目的：理解并掌握关联规则经典算法Apriori算法，理解算法的原理，能够实现算法，并对给定的数据集进行关联规则挖掘三、实验内容：1、实现Apriori算法，验证算法的正确性，并将算法应用于给定的数据集Groceries，根据设定的支持度和置信度，挖掘出符合条件的频繁项集及关联规则。2、挑选几个有代表性的频繁项集和
【分治算法】【Python实现】Strassen矩阵乘法「已注销」 #分治算法分治算法 Python
文章目录@[toc]问题描述基础算法时间复杂性Strassen算法时间复杂性问题时间复杂性Python实现个人主页：丷从心·系列专栏：分治算法学习指南：算法学习指南问题描述设AAA和BBB是两个n×nn\timesnn×n矩阵，AAA和BBB的乘积矩阵CCC中元素cij=∑k=1naikbkjc_{ij}=\displaystyle\sum\limits_{k=1}^{n}{a_{ik}b_{kj
【数据挖掘】分类算法学习—ID3 会的全对٩(ˊᗜˋ*)و 数据挖掘数据挖掘分类学习经验分享 ID3
分类算法学习—ID3ID3（IterativeDichotomiser3）是一种经典的决策树学习算法，由RossQuinlan于1986年提出，主要用于处理离散特征的分类问题。其核心思想是通过信息增益选择最优特征进行节点分裂，递归构建决策树。要求：理解并掌握ID3算法，理解算法的原理，能够实现算法，并对给定的数据集进行分类，分析个人参股的情况代码实现：importpandasaspdimportn
视觉感知BEV算法学习路线 LQS2020 计算机视觉
学习视觉感知BEV（Bird’sEyeView）算法涉及多个方面的知识和技能。以下是一个系统化的学习路线图，可以帮助你逐步掌握BEV算法。1.基础知识学习1.1计算机视觉基础图像处理：了解图像的基本操作，如滤波、边缘检测、特征提取。推荐书籍:《DigitalImageProcessing》byRafaelC.GonzalezandRichardE.Woods特征提取和描述：学习SIFT、SURF、
算法学习day10----单链表习题阴暗老鼠人算法学习
刚把单链表的内容更新完，马不停蹄来了习题前面我们说道，单链表是一个非常结构化的开发数据类型，当我们对链表进行操作时，基于在操作开始前的链表创建、增删查改操作函数的调用，至于调用顺序、调用次数，则取决于题目要求。前排部分结构化开发没毛病，但是有几个需要注意的点，对于第k个插入与删除的数，是按照输入的时间顺序发生的：例如：操作1：H1->链表：1，nodes[1]=节点1操作2：I12->在节点1后面
算法学习day11----双链表--概念阴暗老鼠人学习
双链表实际上就是单链表增加一个往前指的指针，通过前面单链表的学习，我们知道链表的创建需要两步，一步是指针创建，一步是初始化的头部元素（头节点）创建，那我们增加一个往前的指针，自然也需要配套的尾部元素初始化（尾节点）在对链表进行操作函数定义时，不仅要像单链表那样指明从左到右的next，也要有从右到左的prior在代码的改动上只需加上一行即可，比较容易理解classLNode:def__init__(
图像基础算法学习笔记 jerry201108 视觉基础知识学习笔记计算机视觉
目录概要一、图像采集二、图像标注四、图像几何变换五、图像边缘检测Sobel算子Scharrt算子Laplacian算子Canny边缘检测六、形态学转换十三、图像去噪概要参考书籍：《机器视觉与人工智能应用开发技术》廖建尚，钟君柳出版时间：2024-02-01图像采集图像标注：绘制直线、矩阵、圆形、椭圆和多边形图像灰度转换：灰度化、二值化等图像转换方法图像几何变换：图像旋转、图像镜像、图像缩放、图像透
LeetCode第261题_以图判树 @蓝莓果粒茶算法 leetcode 算法职场和发展 c#学习 python c++
LeetCode第261题：以图判树文章摘要本文详细解析LeetCode第261题"以图判树"，这是一道图论问题。文章提供了从DFS到并查集的多种解法，包含C#、Python、C++三种语言实现，配有详细的算法步骤图解和性能分析。适合想要深入理解图论算法和树的性质的算法学习者。核心知识点：图论、DFS、BFS、并查集、树的性质难度等级：中等推荐人群：图论学习者、算法面试准备者题目描述给定从0到n-
c++算法学习3——深度优先搜索卫青~护驾！深度优先算法
一、深度优先搜索的核心概念DFS算法是一种通过递归或栈实现的"一条路走到底"的搜索策略，其核心思想是：深度优先：从起点出发，选择一个方向探索到底，直到无路可走回溯机制：遇到死路时返回最近的分叉点尝试其他路径状态标记：记录已访问位置，避免重复访问二、迷宫问题的DFS解法框架1.题目引入：给定一个n×n的迷宫矩阵，判断是否存在从左上角(0,0)到右下角(n-1,n-1)的通路。移动规则如下：移动方向：
算法学习Day01 | 数组理论基础、LeetCode 704.二分查找、LeetCode 27.移除元素不会写代码的里奇算法算法 leetcode 数据结构 c++面试 c语言笔记
一、数组理论基础定义：数组是存放在连续内存空间上的相同类型数据的集合。数组可以通过下标索引的方式获取到下标下对应的数据。特点：数组下标是从0开始的。数组内存空间的地址是连续的。数据支持随机访问，根据下标（索引）随机访问的时间复杂度为O(1)。数组的元素是不能删的，只能覆盖。数组是如何支持随机访问的数组支持随机访问的原因是因为它们在内存中是连续存储的。可以通过简单地使用数组索引来直接计算出元素在内存
算法学习day01(二分\双指针\滑动窗口\链表) 梦想成为java高手！算法学习 javascript
一、二分法首先，二分法搜索的前提是数组必须是有序的。然后在一个有序的数组里面找到目标值。while(leftnums[mid]更新左边界left=mid+1如果相等,说明找到了，returnmid;}注意的点：while循环中的条件是影响到下面更新边界操作的。借助一下开闭区间来理解(卡尔那边学到的)1.如果是leftnums[fast]*num[fast])result[size--]=nums[
CCPC比赛与算法学习的个人分享风-中算法算法学习
大赛简介中国大学生程序设计竞赛（ChinaCollegiateProgrammingContest，简称CCPC）是工业和信息化部教育与考试中心主办的“强国杯”技术技能大赛项目，自从2015年首届CCPC竞赛以来，赛事规模发展迅猛，竞赛影响力持续提升，为我国IT业的发展培养和选拔了大批人才。CCPC得到了诸多企业的支持。2021年一汽红旗为总赞助商，腾讯、快手、图森未来、华为云、轻舟智航为金牌赞助
c++算法学习5——贪心算法卫青~护驾！算法
一、贪心算法的原理贪心算法（GreedyAlgorithm）是一种在每一步选择中都采取当前最优决策的策略，通过局部最优解的累积逼近全局最优解。其核心思想是“着眼当前，忽略整体”，适用于满足最优子结构和贪心选择性质的问题。本文以阿里巴巴运宝藏问题为切入点，深入解析贪心算法的设计步骤、验证方法及经典应用。二、贪心算法的核心思想贪心算法需满足三个关键步骤：确定最优子结构问题可分解为多个子问题，且子问题的
算法学习之——二分法解题超详细与宇宙对视算法算法
【二分法】解题步骤超详细！什么是二分法二分法的通用格式寻找一个数（基本的二分搜索）什么是二分法二分法，也称为折半法，是一种在有序数组中查找特定元素的搜索算法。二分法查找的思路如下：（1）首先，从数组的中间元素开始搜索，如果该元素正好是目标元素，则搜索过程结束，否则执行下一步。（2）如果目标元素大于/小于中间元素，则在数组大于/小于中间元素的那一半区域查找，然后重复步骤（1）的操作。（3）如果某一步
打卡第十二天 wswlqsss 机器学习
超参数调整专题2三种启发式算法的示例代码：遗传算法、粒子群算法、退火算法学习优化算法的思路（避免浪费无效时间）作业：今天以自由探索的思路为主，尝试检索资料、视频、文档，用尽可能简短但是清晰的语言看是否能说清楚这三种算法每种算法的实现逻辑，帮助更深入的理解。ps：我之前写论文也用过这几种算法，也是纯借鉴对于实际实现逻辑没有了解过。遗传算法基于自然选择和遗传机制的优化算法，孟德尔随机化，模仿生物进化过
0020算法笔记动态规划最优二叉搜索树问题资源介绍傅阳轩
0020算法笔记动态规划最优二叉搜索树问题资源介绍【下载地址】0020算法笔记动态规划最优二叉搜索树问题资源介绍本项目深入探讨了动态规划在最优二叉搜索树问题中的应用，通过详细的问题分析和实例展示，帮助读者掌握动态规划的核心原理。内容涵盖问题背景、动态规划方法及其具体应用，并配有案例分析，直观呈现解题过程。适合有一定编程基础且对算法感兴趣的读者，旨在提升其解决实际问题的能力，助力算法学习与应用的进阶
python学习day12 一叶知秋秋 python学习笔记学习
超参数调整专题2三种启发式算法的示例代码：遗传算法、粒子群算法、退火算法学习优化算法的思路（避免浪费无效时间）三种算法都是优化器，用来求最佳参数的组合，使得指标达到最优，区别在于每一个算法的策略有所区别。下表是总体介绍。遗传算法策略是以适应度为评价指标（可以是一些结果方面的指标），通过选择，交叉和变异三种操作，生成子代，作为新的种群去替换旧的种群（保留适应度高的个体），循环往复，知到适应度收敛或者
目标检测领域最新突破：2025年你必须掌握的5大创新方向！附教程！学算法的程霖目标检测人工智能计算机视觉机器学习深度学习自然语言处理大模型
目标检测是计算机视觉的核心任务之一，涉及算法学习、应用场景优化和学术创新三个关键方向。以下是系统的总结和建议：一、目标检测算法学习方向1.基础理论核心任务：定位（BoundingBox）+分类（Class）。关键概念：IoU（交并比）、NMS（非极大值抑制）、Anchor机制。损失函数：分类损失（Cross-Entropy）、回归损失（SmoothL1、GIoU）。必学经典模型：Two-Stage
数据结构与算法学习笔记----Kruskal算法明月清了个风数据结构与算法笔记（基础课）算法学习笔记
数据结构与算法学习笔记----Kruskal算法@@author:明月清了个风@@firstpublishtime:2024.12.21ps⭐️这也是一个思想比较简单的算法，只写了基本思想，具体的可以看代码理解一下Kruskal算法Kruskal算法同样是一种基于贪心策略的最小生成树求解算法，另一种是上一篇中的Prim算法。基本思想将所有的边按边长从小到大排序。遍历所有边，判断每条边所连接的两个节
数据结构与算法学习笔记----字符串哈希明月清了个风数据结构与算法笔记（基础课）哈希算法学习笔记
数据结构与算法学习笔记----字符串哈希@@author:明月清了个风@@firstpublish:2024.12.4字符串哈希（stringhash）字符串哈希和上一篇的整数哈希一样，通过将字符串映射到一个数字来表示该字符串，只是对于字符串来说，这个哈希函数映射的方法会更特殊。实现原理（多项式哈希）基本的思想是通过将字符串中的每个字符映射到一个数字，通常使用ASCII码值，通过加权求和的方式计算
数据结构与算法学习笔记----Floyd算法明月清了个风数据结构与算法笔记（基础课）学习笔记算法
数据结构与算法学习笔记----Floyd算法@@author:明月清了个风@@firstpublishtime:2024.12.20Floyd算法Floyd一种基于动态规划的最短路径算法，用于求出加权有向图中的任意两点之间的最短路径问题，并且适用于图中可能存在负权边的情况，但是要求不能有负权环，它能有效的求出图中所有节点之间的最短路径，适用稠密图。基本思路Floyd通过不断考虑每个节点作为中间节点
微信开发者验证接口开发 362217990 微信开发者 token 验证
微信开发者接口验证。 Token，自己随便定义，与微信填写一致就可以了。根据微信接入指南描述 http://mp.weixin.qq.com/wiki/17/2d4265491f12608cd170a95559800f2d.html 第一步：填写服务器配置第二步：验证服务器地址的有效性第三步：依据接口文档实现业务逻辑这里主要讲第二步验证服务器有效性。建一个
一个小编程题-类似约瑟夫环问题 BrokenDreams 编程
今天群友出了一题：一个数列,把第一个元素删除,然后把第二个元素放到数列的最后,依次操作下去,直到把数列中所有的数都删除,要求依次打印出这个过程中删除的数。 &
linux复习笔记之bash shell (5) 关于减号-的作用 eksliang linux关于减号“-”的含义 linux关于减号“-”的用途 linux关于“-”的含义 linux关于减号的含义
转载请出自出处： http://eksliang.iteye.com/blog/2105677 管道命令在bash的连续处理程序中是相当重要的，尤其在使用到前一个命令的studout（标准输出）作为这次的stdin（标准输入）时，就显得太重要了，某些命令需要用到文件名，例如上篇文档的的切割命令（split）、还有
Unix(3) 18289753290 unix ksh
1)若该变量需要在其他子进程执行，则可用"$变量名称"或${变量}累加内容什么是子进程？在我目前这个shell情况下，去打开一个新的shell，新的那个shell就是子进程。一般状态下，父进程的自定义变量是无法在子进程内使用的，但通过export将变量变成环境变量后就能够在子进程里面应用了。 2)条件判断： &&代表and ||代表or&nbs
关于ListView中性能优化中图片加载问题酷的飞上天空 ListView
ListView的性能优化网上很多信息，但是涉及到异步加载图片问题就会出现问题。具体参看上篇文章http://314858770.iteye.com/admin/blogs/1217594 如果每次都重新inflate一个新的View出来肯定会造成性能损失严重，可能会出现listview滚动是很卡的情况，还会出现内存溢出。现在想出一个方法就是每次都添加一个标识，然后设置图
德国总理默多克：给国人的一堂“震撼教育”课永夜-极光教育
http://bbs.voc.com.cn/topic-2443617-1-1.html德国总理默多克：给国人的一堂“震撼教育”课　安吉拉—默克尔，一位经历过社会主义的东德人，她利用自己的博客，发表一番来华前的谈话，该说的话，都在上面说了，全世界想看想传播——去看看默克尔总理的博客吧！　　德国总理默克尔以她的低调、朴素、谦和、平易近人等品格给国人留下了深刻印象。她以实际行动为中国人上了一堂
关于Java继承的一个小问题。。。随便小屋 java
今天看Java 编程思想的时候遇见一个问题，运行的结果和自己想想的完全不一样。先把代码贴出来！ //CanFight接口 interface Canfight { void fight(); } //ActionCharacter类 class ActionCharacter { public void fight() { System.out.pr
23种基本的设计模式 aijuans 设计模式
Abstract Factory：提供一个创建一系列相关或相互依赖对象的接口，而无需指定它们具体的类。　　Adapter：将一个类的接口转换成客户希望的另外一个接口。A d a p t e r模式使得原本由于接口不兼容而不能一起工作的那些类可以一起工作。　　Bridge：将抽象部分与它的实现部分分离，使它们都可以独立地变化。　　Builder：将一个复杂对象的构建与它的表示分离，使得同
《周鸿祎自述：我的互联网方法论》读书笔记 aoyouzi 读书笔记
从用户的角度来看,能解决问题的产品才是好产品,能方便/快速地解决问题的产品,就是一流产品. 商业模式不是赚钱模式一款产品免费获得海量用户后,它的边际成本趋于0,然后再通过广告或者增值服务的方式赚钱,实际上就是创造了新的价值链. 商业模式的基础是用户,木有用户,任何商业模式都是浮云.商业模式的核心是产品,本质是通过产品为用户创造价值. 商业模式还包括寻找需求
JavaScript动态改变样式访问技术百合不是茶 JavaScript style属性 ClassName属性
一:style属性格式: HTML元素.style.样式属性="值"; 创建菜单:在html标签中创建或者在head标签中用数组创建 <html> <head> <title>style改变样式</title> </head> &l
jQuery的deferred对象详解 bijian1013 jquery deferred对象
jQuery的开发速度很快，几乎每半年一个大版本，每两个月一个小版本。每个版本都会引入一些新功能，从jQuery 1.5.0版本开始引入的一个新功能----deferred对象。 &nb
淘宝开放平台TOP Bill_chen C++c 物流 C#
淘宝网开放平台首页：http://open.taobao.com/ 淘宝开放平台是淘宝TOP团队的产品，TOP即TaoBao Open Platform，是淘宝合作伙伴开发、发布、交易其服务的平台。支撑TOP的三条主线为： 1.开放数据和业务流程 * 以API数据形式开放商品、交易、物流等业务； &
【大型网站架构一】大型网站架构概述 bit1129 网站架构
大型互联网特点面对海量用户、海量数据大型互联网架构的关键指标高并发高性能高可用高可扩展性线性伸缩性安全性大型互联网技术要点前端优化 CDN缓存反向代理 KV缓存消息系统分布式存储 NoSQL数据库搜索监控安全想到的问题： 1.对于订单系统这种事务型系统，如
eclipse插件hibernate tools安装白糖_ Hibernate
eclipse helios(3.6)版 1.启动eclipse 2.选择 Help > Install New Software...> 3.添加如下地址： http://download.jboss.org/jbosstools/updates/stable/helios/ 4.选择性安装：hibernate tools在All Jboss tool
Jquery easyui Form表单提交注意事项 bozch jquery easyui
jquery easyui对表单的提交进行了封装，提交的方式采用的是ajax的方式，在开发的时候应该注意的事项如下： 1、在定义form标签的时候，要将method属性设置成post或者get，特别是进行大字段的文本信息提交的时候，要将method设置成post方式提交，否则页面会抛出跨域访问等异常。所以这个要
Trie tree(字典树)的Java实现及其应用-统计以某字符串为前缀的单词的数量 bylijinnan java实现
import java.util.LinkedList; public class CaseInsensitiveTrie { /** 字典树的Java实现。实现了插入、查询以及深度优先遍历。 Trie tree's java implementation.(Insert,Search,DFS) Problem Description Igna
html css 鼠标形状样式汇总 chenbowen00 html css
css鼠标手型cursor中hand与pointer Example：CSS鼠标手型效果 <a href="#" style="cursor:hand">CSS鼠标手型效果</a><br/> Example：CSS鼠标手型效果 <a href="#" style=&qu
[IT与投资]IT投资的几个原则 comsci it
无论是想在电商,软件,硬件还是互联网领域投资,都需要大量资金,虽然各个国家政府在媒体上都给予大家承诺,既要让市场的流动性宽松,又要保持经济的高速增长....但是,事实上,整个市场和社会对于真正的资金投入是非常渴望的,也就是说,表面上看起来,市场很活跃,但是投入的资金并不是很充足的......
oracle with语句详解 daizj oracle with with as
oracle with语句详解转在oracle中，select 查询语句，可以使用with,就是一个子查询，oracle 会把子查询的结果放到临时表中，可以反复使用例子:注意，这是sql语句，不是pl/sql语句，可以直接放到jdbc执行的 ----------------------------------------------------------------
hbase的简单操作 deng520159 数据库 hbase
近期公司用hbase来存储日志,然后再来分析 ,把hbase开发经常要用的命令找了出来. 用ssh登陆安装hbase那台linux后用hbase shell进行hbase命令控制台! 表的管理 1）查看有哪些表 hbase(main)> list 2）创建表 # 语法：create <table>, {NAME => <family&g
C语言scanf继续学习、算术运算符学习和逻辑运算符 dcj3sjt126com c
/* 2013年3月11日20:37:32 地点：北京潘家园功能：完成用户格式化输入多个值目的：学习scanf函数的使用 */ # include <stdio.h> int main(void) { int i, j, k; printf("please input three number:\n"); //提示用
2015越来越好 dcj3sjt126com 歌曲
越来越好房子大了电话小了感觉越来越好假期多了收入高了工作越来越好商品精了价格活了心情越来越好天更蓝了水更清了环境越来越好活得有奔头人会步步高想做到你要努力去做到幸福的笑容天天挂眉梢越来越好婆媳和了家庭暖了生活越来越好孩子高了懂事多了学习越来越好朋友多了心相通了大家越来越好道路宽了心气顺了日子越来越好活的有精神人就不显
java.sql.SQLException: Value '0000-00-00' can not be represented as java.sql.Tim feiteyizu mysql
数据表中有记录的time字段（属性为timestamp）其值为：“0000-00-00 00:00:00” 程序使用select 语句从中取数据时出现以下异常： java.sql.SQLException:Value '0000-00-00' can not be represented as java.sql.Date java.sql.SQLException: Valu
Ehcache（07）——Ehcache对并发的支持 234390216 并发 ehcache 锁 ReadLock WriteLock
Ehcache对并发的支持在高并发的情况下，使用Ehcache缓存时，由于并发的读与写，我们读的数据有可能是错误的，我们写的数据也有可能意外的被覆盖。所幸的是Ehcache为我们提供了针对于缓存元素Key的Read（读）、Write（写）锁。当一个线程获取了某一Key的Read锁之后，其它线程获取针对于同
mysql中blob,text字段的合成索引 jackyrong mysql
在mysql中，原来有一个叫合成索引的，可以提高blob,text字段的效率性能，但只能用在精确查询，核心是增加一个列，然后可以用md5进行散列，用散列值查找则速度快比如： create table abc(id varchar(10),context blog,hash_value varchar(40)); insert into abc(1,rep
逻辑运算与移位运算 latty 位运算逻辑运算
源码：正数的补码与原码相同例+7 源码：00000111 补码：00000111 （用8位二进制表示一个数）负数的补码：符号位为1，其余位为该数绝对值的原码按位取反；然后整个数加1。 -7 源码： 10000111 ，其绝对值为00000111 取反加一：11111001 为-7补码已知一个数的补码，求原码的操作分两种情况：
利用XSD 验证XML文件 newerdragon java xml xsd
XSD文件（XML Schema 语言也称作 XML Schema 定义（XML Schema Definition，XSD）。具体使用方法和定义请参看： http://www.w3school.com.cn/schema/index.asp java自jdk1.5以上新增了SchemaFactory类可以实现对XSD验证的支持，使用起来也很方便。以下代码可用在J
搭建 CentOS 6 服务器(12) - Samba rensanning centos
（1）安装 # yum -y install samba Installed: samba.i686 0:3.6.9-169.el6_5 # pdbedit -a rensn new password:123456 retype new password:123456 …… （2）Home文件夹 # mkdir /etc
Learn Nodejs 01 toknowme nodejs
（1）下载nodejs https://nodejs.org/download/ 选择相应的版本进行下载（2）安装nodejs 安装的方式比较多，请baidu下我这边下载的是“node-v0.12.7-linux-x64.tar.gz”这个版本（1）上传服务器（2）解压 tar -zxvf node-v0.12.
jquery控制自动刷新的代码举例 xp9802 jquery
1、html内容部分复制代码代码示例: <div id='log_reload'> <select name="id_s" size="1"> <option value='2'>-2s-</option> <option value='3'>-3s-</option

利用Trie树求多个字符串的最小编辑距离

你可能感兴趣的:(算法学习)