广外蓝忘机

从病毒感染检测谈串的模式匹配

病毒感染检测：串的模式匹配 BF、KMP算法

在网络入侵检测、计算机病毒特征码匹配以及DNA序列匹配等应用中都需要进行串的模式匹配。针对这个问题，书上讲了两种模式匹配的算法，即BF算法和KMP算法，下面针对这两种算法的实现谈谈我的思路。

1、代码部分

BF算法

#include
using namespace std;
#include

//采用静态顺序存储结构（定长） 
typedef struct{
	char ch[1000001];	//存储串的一维数组 
	int length;		//串的长度 
}SString;
 
 SString S,T; 
 
 char s[1000001];
 char t[1000001];
 
//BF算法
//查找 模式T 在 主串S 中第pos个字符开始第一次出现的位置，并返回 
//若不存在，则返回0 （T非空，1<=pos<=S.length） 
int Index_BF(SString S,SString T,int pos)  
{				
	int i,j;
	i=pos;
	j=0;
	while(i<=S.length-1 && j<=T.length-1)
	{
		if(S.ch[i]==T.ch[j]){	//从各自的第一位开始比较，如果相同，比较下一位 
			++i;
			++j;
		}
		else {//如果不同，主串指针回到 上次开始比较时的字符 的下一个字符，
			  //模式回到第一个字符，重新开始比较 
			i=i-j+1;
			j=0;
		} 
	}
	if(j>T.length-1)		//匹配成功 
		return i-T.length+1;//主串指针位置往回退模式长度个单位，就回到了该模式在主串中第一次出现的位置 
	else			//匹配失败 
		return 0;	//返回0（顺序存储的字符串是从下标为1的数组分量开始存储的，下标为0的分量闲置不用） 
} 
 
//主函数 
int main()
{
	cin>>s>>t;
	strcpy(S.ch,s);
	strcpy(T.ch,t);
	S.length=strlen(S.ch);
	T.length=strlen(T.ch);
    cout<<Index_BF(S,T,0)<<endl;;
	return 0;
}

KMP算法

#include
using namespace std;
#include

//采用静态顺序存储结构（定长） 
typedef struct{
	char ch[1000002];	//存储串的一维数组 
	int length;		//串的长度 
}SString;
 
 SString S,T; 
 
 char s[1000002];
 char t[1000002];
 int nex[1000002];
 
//KMP算法
//查找 模式T 在 主串S 中第pos个字符开始第一次出现的位置，并返回 
//若不存在，则返回0 （T非空，1<=pos<=S.length） 
int Index_KMP(SString S,SString T,int next[])  
{				
	int i,j;
	i=j=0;
	while(i<=S.length-1 && j<=T.length-1)
	{
		if(j==-1||S.ch[i]==T.ch[j]){	//从各自的第一位开始比较，如果相同，比较下一位 
			++i;
			++j;
		}
		else {
			j=next[j];
		} 
	}
	if(j>T.length-1)		//匹配成功 
		return i-T.length+1;// 
	else			//匹配失败 
		return 0;
} 
 
 void get_next(SString T,int next[]){
 	int i=0;
 	next[0]=-1;
 	int j=-1;
 	while(i<T.length-1){
 		if(j==-1||T.ch[i]==T.ch[j]){
 			++i;//前缀开始的位置
 			++j;//后缀开始的位置
 			next[i]=j;//next[]是我的子串和主串的那一位对着的位置，现在把后缀开始的位置值赋给他。
		 }
		 else {
		 	j=next[j];
		 }
	 }
 }
//主函数 
int main()
{
	cin>>s>>t;
	strcpy(S.ch,s);
	strcpy(T.ch,t);
	S.length=strlen(S.ch);
	T.length=strlen(T.ch);
	get_next(T,nex);
    cout<<Index_KMP(S,T,nex)<<endl;
	return 0;
}

病毒感染检测

#include
#include

using namespace std;

int Index_BF(string, string, int); //匹配则返回开始下标，否则返回-1 
int Virus_detecion(string, string); //感染则返回1，否则返回0

int main()
{
	string s,t;
	cin >> s >> t;
	if(Virus_detecion(s, t)==1)	cout << "YES" << endl;
	else cout << "NO" << endl;
	return 0;	
}

int Index_BF(string s, string t, int pos)
{//返回模式t在主串s中第pos个字符开始第一次出现的位置下标。
//若不存在，则返回值为-1 
 //其中，t非空，1≤pos≤StrLength(s) 
	int i,j;
   	i = pos-1; //下标 
	j = 0; //下标 
   	while(i<s.length() && j<t.length()){ 
      	if(s[i]==t[j]){++i; ++j;}	//继续比较后继字符 
      	else{i=i-j+1; j=0;}	//指针后退重新开始匹配
   }   
   if(j==t.length()) return i-t.length(); //模式串全部读完，表示匹配，返回开始匹配位置的下标 
   else return -1;   
} 

int Virus_detecion(string s, string t)
{//求病毒DNA（环状）在人DNA中是否出现，有则返回在人DNA中第几个字符出现，无则返回0 
	int num = t.length();
	t += t; //模式串生成两次	
	string temp; 
	int res;
	for (int i=0; i<num; i++){
		temp.assign(t, i, num); 		
		//cout << temp << endl;
		res = Index_BF(s, temp, 1) ; //调用 Index_BF 检测本次的num个字符是否与s匹配 
		if(res!=-1)  return 1; // 本次匹配，说明感染病毒 
	}
	
	return 0; //所有检测都不匹配，说明没有感染病毒 
}

2、探索过程

一、BF算法

【错误代码1】

#include
#include
using namespace std;
 typedef struct{
 	char ch[1000002];
 	int length;
 }SString;


void  Index_BF(SString S, SString T, int pos){ 
    int i,j;
	i=pos;
	j=1;
    while ( i <= S.length && j <= T.length ) {
       if ( S.ch[i]==T.ch[j] ) { ++i;  ++j; }
       else { i = i-j+2;  j=1; }
     if ( j>T.length )   
	 {
	 	cout<< i-T.length<<endl;
	 }
     else{ 
	 cout<<"0"<<endl;
	} 
}
}
int main()
{
	SString S,T;
	char s[1000002]={0},t[1000002]={0};
	cin>>s>>t;
	strcpy(S.ch,s);
	strcpy(T.ch,t);
	Index_BF(S, T , 1);
	return 0;
}

分析：编译轻松通过，但是怎么都不能输入进去。参考其他同学的博客，发现我的这个问题有人也遇到过，原因在于在主函数中定义了两个长度为100W的数组，程序根本跑不动。
解决：参考博客发现有两种途径解决数组过大问题：①将数组定义为全局变量 ②动态分配数组
针对我这一题的具体情况，因为我是要用到strcpy函数来copy数组的内容的，所以第一种方式显然更适合。

【错误代码2】

#include
#include
using namespace std;
 typedef struct{
 	char ch[1000002];
 	int length;
 }SString;
	char s[1000002]={0},t[1000002]={0};
	SString S,T;
	
void  Index_BF(SString S, SString T, int pos){ 
    int i,j;
	i=pos;
	j=1;
	cout<<"smooth"<<endl;
    while ( i <= S.length && j <= T.length ) {
       if ( S.ch[i]==T.ch[j] ) { 
	   ++i; 
	   ++j; }
       else {
	    i = i-j+2;
	     j=1; }
     if ( j>T.length )   
	 {
	 	cout<< i-T.length<<endl;
	 }
     else{ 
	 cout<<"0"<<endl;
	} 
}
}
int main()
{
	cin>>s>>t;
	cout<<"good"<<endl;
	strcpy(S.ch,s);
	cout<<"OK"<<endl;
	strcpy(T.ch,t);
	cout<<"OK"<<endl;
	Index_BF(S, T , 1);
	return 0;
}

分析：这一次程序是顺利运行完了，就是没有想要的结果出来。
解决：为了查找程序在哪里断掉了，我在一些步骤之后设置了一些输出，比如cout<<“good”。此法说明我的问题出在BF算法上。经过仔仔细细的检查，发现BF算法中我打while循环的时候掉了一个括号，加上去就正常了。
接下来需要解决位置和下标的问题，我现在输出的还是下标，不是题目要求的位置。思考过后发现解决的途径有两种：改数组；改算法。这里我选择的是改算法的方法。

【正确程序1】

#include
using namespace std;
#include

//采用静态顺序存储结构（定长） 
typedef struct{
	char ch[1000001];	//存储串的一维数组 
	int length;		//串的长度 
}SString;
 
 SString S,T; 
 
 char s[1000001];
 char t[1000001];
 
//BF算法
//查找 模式T 在 主串S 中第pos个字符开始第一次出现的位置，并返回 
//若不存在，则返回0 （T非空，1<=pos<=S.length） 
int Index_BF(SString S,SString T,int pos)  
{				
	int i,j;
	i=pos;
	j=0;
	while(i<=S.length-1 && j<=T.length-1)
	{
		if(S.ch[i]==T.ch[j]){	//从各自的第一位开始比较，如果相同，比较下一位 
			++i;
			++j;
		}
		else {//如果不同，主串指针回到 上次开始比较时的字符 的下一个字符，
			  //模式回到第一个字符，重新开始比较 
			i=i-j+1;
			j=0;
		} 
	}
	if(j>T.length-1)		//匹配成功 
		return i-T.length+1;//主串指针位置往回退模式长度个单位，就回到了该模式在主串中第一次出现的位置 
	else			//匹配失败 
		return 0;	//返回0（顺序存储的字符串是从下标为1的数组分量开始存储的，下标为0的分量闲置不用） 
} 
 
//主函数 
int main()
{
	cin>>s>>t;
	strcpy(S.ch,s);
	strcpy(T.ch,t);
	S.length=strlen(S.ch);
	T.length=strlen(T.ch);
    cout<<Index_BF(S,T,0)<<endl;;
	return 0;
}

现在把程序放到PTA上面跑，得到了15分，唯一错误的一个点就是超时。但这个是BF算法无法解决的了，所以我决定一鼓作气把他改成KMP算法。

二、KMP算法的探索

在真正着手写代码前，我花了很久阅读课本，也想了很久，终于弄明白了这个算法的核心思想。以下是我的思路:

①BF究竟是哪里麻烦了？

设想一种情况：主串是abcab... 子串是abcac... 如果按照BF算法我们知道，一旦b和c不匹配了，接下来比较的就是主串的第二个字符b和子串的第一个字符a，不匹配时主串和子串都右移。直到子串的首位字符a与主串的a对齐之前，我们做的都是无用功。这就是从一个具体的例子看出来的麻烦之处。

②如果说KMP可以跳过这些“无用功”，那什么情况下可以跳？这是一个特殊情况，真的能上升到一个算法的高度吗？

为了解决我以上的疑虑，我决定用抽象的模型进行说明。

设主串Si（大家不要把它看成硅元素的元素符号啦）与模式tj失配……这句话暗含（S1S2……Si-1与t1t2……tj-1是匹配的）这里我们将主串Si固定死，让他与模式中的tk匹配（因为不知道，所以设k这个未知数，也就是说这时候模式要从j跳到k）即：

Si-k+1...Si-1 =t1...tk-1

我们由第一步的匹配就已经得到：

Si-k+1...Si-1 = tj-k+1...tj-1

把这两个式子联立，得到：

t1...tk-1 = tj-k+1...tj-1

③求k

以上我们得到了一个很重要的关系式，即t1...tk-1 = tj-k+1...tj-1，它隐含了我们想要知道的k，也就是子串该跳到哪一个地方这一信息。

观察式子，我们首先考虑一些边边角角的问题，比如k=1,j=1这些情况。

1）k=1 这时式子变成了t1...t0 = tj...tj-1 这种情况说明子串不符合要求，没有那个相等的部分。顺便也解决了我们第二问中的疑惑，其实KMP算法的优化是有条件的，要求子串与主串匹配的那部分有“相等的部分”。这时候的处理办法也只有老老实实跳到t1与Si比较。模式啊模式！你若是堕落，KMP也救不了你！

2）j=1 其实就是模式的第一位就与主串Si不匹配。那还犹豫啥？直接把模式向右移一个呗。

④怎么用算法实现？

其实整个大框架在BF算法的基础上来说不用怎么改，只需要把回溯的那块儿稍微修改一下，即改成主串i不回溯，模式跳到k位置。

但是现在说来说去我们还是只有一串关系式，还有两个边界的情况，k到底怎么表示？对解决这个问题还是一脸懵逼。

阅读课本发现他使用一个next[j]函数来表示子串下一个回溯的位置。其实想一想next[j]仅与模式有关，和主串半毛钱关系也没有。从已知的关系式t1...tk-1 = tj-k+1...tj-1入手，此时next[j] = k。我们求一求next[j+1]?这时候产生两种情况需要讨论：

1）若tk = tj 那么t1...tk = tj-k+1...tj 也就是next[j+1] = k+1 , 亦即next[j+1] = next[j] +1。

2)若tk!=tj 是不是有一种似曾相识的感觉？对了，这又是一次模式匹配，只不过此时的模式既充当了主串又充当模式。所以我们要把模式中的第next[j]个字符和主串中的第j个字符对齐进行比较。这种情况可以利用函数的递归调用，让j=next[j]。

【正确程序2】

#include
using namespace std;
#include

//采用静态顺序存储结构（定长） 
typedef struct{
	char ch[1000002];	//存储串的一维数组 
	int length;		//串的长度 
}SString;
 
 SString S,T; 
 
 char s[1000002];
 char t[1000002];
 int nex[1000002];
 
//KMP算法
//查找 模式T 在 主串S 中第pos个字符开始第一次出现的位置，并返回 
//若不存在，则返回0 （T非空，1<=pos<=S.length） 
int Index_KMP(SString S,SString T,int next[])  
{				
	int i,j;
	i=j=0;
	while(i<=S.length-1 && j<=T.length-1)
	{
		if(j==-1||S.ch[i]==T.ch[j]){	//从各自的第一位开始比较，如果相同，比较下一位 
			++i;
			++j;
		}
		else {
			j=next[j];
		} 
	}
	if(j>T.length-1)		//匹配成功 
		return i-T.length+1;// 
	else			//匹配失败 
		return 0;
} 
 
 void get_next(SString T,int next[]){
 	int i=0;
 	next[0]=-1;
 	int j=-1;
 	while(i<T.length-1){
 		if(j==-1||T.ch[i]==T.ch[j]){
 			++i;//前缀开始的位置
 			++j;//后缀开始的位置
 			next[i]=j;//next[]是我的子串和主串的那一位对着的位置，现在把后缀开始的位置值赋给他。
		 }
		 else {
		 	j=next[j];
		 }
	 }
 }
//主函数 
int main()
{
	cin>>s>>t;
	strcpy(S.ch,s);
	strcpy(T.ch,t);
	S.length=strlen(S.ch);
	T.length=strlen(T.ch);
	get_next(T,nex);
    cout<<Index_KMP(S,T,nex)<<endl;
	return 0;
}

三、病毒感染检测

这个问题要处理的操作对象就是字符串，将病毒的DNA序列看作是子串，患者的DNA序列看作是主串，检测任务的实质就是看子串是否在主串中出现过。一定要注意病毒的DNA序列是环状的。而且具体问题中往往不会在输入的窗口中将序列一个个敲上去，往往会将待检测的数据存储到一个文本文件中，输出也以一个文件的形式输出。

由于文件无法直接上传，请大家自行建立一个名为“病毒感染检测输入数据.txt”的文件，内容如下：

11
baa bbaabbba
baa aaabbbba
aabb abceaabb
aabb abaabcea
abcd cdabbbab
abcd cabbbbab
abcde bcdedbda
acc bdedbcda
cde cdcdcdec
cced cdccdcce
bcd aabccdxdxbxa

输出应该是：

baa bbaabbba YES
baa aaabbbba YES
aabb abceaabb YES
aabb abaabcea YES
abcd cdabbbab YES
abcd cabbbbab NO
abcde bcdedbda NO
acc bdedbcda NO
cde cdcdcdec YES
cced cdccdcce YES
bcd aabccdxdxbxa NO

Python----数据分析（Pandas三：一维数组Series的数据操作：数据清洗，数据转换，数据排序，数据筛选，数据拼接）蹦蹦跳跳真可爱589 数据分析 Python python 数据分析 pandas
一、数据清洗1.1、dropna()删除包含NaN值的行。series.dropna(axis=0,inplace=False)描述说明axis可选参数，用于指定按哪个轴删除缺失值。对于Series对象，因为它是一维数据结构，只有一个轴，所以此参数默认值为0，且一般不需要修改这个参数（在处理DataFrame时该参数才有更多实际意义，如除，axis=1表示按列删除）。inplace可选参数，用于指
订单管理系统，大学生数据结构期末作业/C语言实践作业陌路物是人非排序算法数据结构算法
任务：订单管理系统的设计与实现设计并实现一个订单管理系统界面分成两部分，分别是管理员和用户的界面主要功能：用户：（1）用户的登录及注册（2）用户信息修改（3）购买物品（4）充值（5）升序排序（按金额）物品管理员：（1）显示所有订单（2）插入订单信息（3）删除订单信息（4）排序订单（快排按编号）（5）统计订单信息（6）添加物品注意事项：一共需要建立4个文件（key.txt、物品清单.txt、用户信息
Python3 【项目实战】深度解析：赛跑成绩统计分析工具李智 - 重庆 Python 精讲精练 -从入门到实战 python 案例学习编程技巧时间处理项目实战
Python3【项目实战】深度解析：赛跑成绩统计分析工具一、项目概述1.开发背景：田径比赛的成绩统计需要快速准确的计算选手成绩，传统人工计时和统计效率低且易出错。本工具通过程序化处理赛跑数据，自动计算各选手成绩及整体统计指标，主要应用于：学校运动会成绩实时统计田径锦标赛的自动化成绩公示运动员训练数据分析2.技术定位：时间数据处理与统计计算的典型案例字典数据结构的实践应用面向过程编程的教学范例二、项
KNN算法性能优化技巧与实战案例可问可问春风算法性能优化
KNN算法性能优化技巧与实战案例K最近邻（KNN）在分类和回归任务中表现稳健，但其计算复杂度高、内存消耗大成为IT项目中的主要瓶颈。以下从算法优化、数据结构、工程实践三方面深入解析性能提升策略，并附典型应用案例。一、核心性能瓶颈维度挑战描述计算复杂度单次预测需计算全部训练样本距离，时间复杂度为（n=样本数，d=特征维度）内存占用需全量存储训练数据，大规模数据集难以加载高维灾难高维数据中距离计算失去
JavaScript 中 Map 数据结构的使用前端javascript
解释Map是一种js数据结构，与数组的map方法并非一种，要区分开来Map数据结构来管理数据，能提高代码的可读性Map相比较对象格式存储速度要更快Map数据结构//创建一个Map对象constformData=newMap();//添加表单元素的值到Map中formData.set('username','Tom');formData.set('password','123456');//获取表单
多线程到底重不重要？ Vic2334 JAVA java 开发语言
我们先说一下为什么要讲多线程和高并发？原因是，你想拿到一个更高的薪水，在面试的时候呈现出了两个方向的现象：第一个是上天项目经验高并发缓存大流量大数据量的架构设计第二个是入地各种基础算法，各种基础的数据结构JVMOS线程IO等内容多线程和高并发，就是入地里面的内容。基本概念我们先从线程的基本概念开始，给大家复习一下，不知道有多少同学是基础不太好，说什么是线程都不知道的，如果这样的话，花时间去补初级内
LLaMA-Factory 训练数据默认使用 instruction、input、output 三个 key 背太阳的牧羊人模型微调 llama 人工智能大模型微调
在LLaMA-Factory进行SFT（Directivesupervisionfine-tuning指令监督微调）时，训练数据的格式非常重要，因为大模型依赖标准化的数据结构来学习指令-响应模式。identity.json文件的数据采用了“instruction”、“input”、“output”这三个key，它们的作用如下：Key作用示例“instruction”代表用户给AI的指令（问题或任务
黑板架构风格 BGM不迷路架构
一、定义黑板架构（BlackboardArchitecture）是一种用于解决复杂问题的系统架构模式，其中多个独立的组件（通常称为知识源）共同工作，通过共享一个共同的“黑板”（通常是一个全局的共享数据结构）来实现解决方案的推演的架构风格。每个组件根据黑板上的信息做出贡献，修改黑板上的状态，直到最终完成任务。二、组成黑板架构由黑板（Blackboard）、知识源（KnowledgeSources）、
详解PriorityQueue 27xixi 算法数据结构 java
PriorityQueue是Java集合框架中的一个类，它实现了优先级队列的数据结构。优先级队列是一种特殊的队列，其中的元素按照优先级顺序出队，而不是按照插入顺序（FIFO）。默认情况下，PriorityQueue是一个最小堆，即优先级最小的元素最先出队。1.PriorityQueue的特点基于堆实现:PriorityQueue通常基于二叉堆（最小堆或最大堆）实现。无界队列:PriorityQue
Redis 源码分析-内部数据结构 quicklist 笨手笨脚の #Redis redis 数据结构数据库 quicklist 链表快速链表 ziplist
Redis源码分析-内部数据结构quicklistquicklist是Redis对外暴露的list数据结构的内部实现，经常被当作队列或栈使用，我们可以从常用的一些api上先思考一下它的结构最常用的就是lpush、lpop、rpush、rpop，同时它也支持lindex查询某元素在list中的索引，linsert在指定元素旁边插入新元素。从头、尾节点的push、pop来看，这就是双向链表最优秀的设计
【数据结构】线性表----栈详解 Skrrapper 数据结构算法数据结构算法 c语言
栈栈（Stack）是一种常见的数据结构，它具有**后进先出（LastIn,FirstOut,LIFO）**的特点。栈的运作类似于物理世界中的叠盘子：最新放上去的盘子最先被拿走，而最底部的盘子最后才能被取出。如果你先拿底下的盘子，那么就有可能出现整个盘子组全部倒塌碎落一地——这也就是所谓的栈出错。出栈和入栈栈有着先进后出的特点。所以它的出栈和入栈也遵循着这个特点。我们在存取元素的时候，一般是在栈顶进
数据结构-顺序栈详解（超基础的那种） FifthDesign 指针数据结构 c++栈编程语言
顺序栈的设计及运行1.顺序栈栈是在顺序表和链表的基础上学习的另一种存储形式，是只能在表的一端（栈顶）进行插入和删除的线性表，也就是遵循先进后出的原则，它与线性表一样，仍然是一对一的关系，根据存储关系不同，可以分为顺序栈和链栈，这里我来演示一下顺序栈的C语言操作。还是那句话，没有什么是操作一遍解决不了的，如果还有的话，那就再来一遍，嗯，请叫这句话为lanyan理论，哈哈嗝。2.代码部分主函数（主函数
数据结构--栈详解梓色系暑期打卡数据结构数据结构 java 开发语言
前言大家好呀，今天我们学习数据结构之栈篇，这是一种很简单的数据结构，今天我们将从概念，用法和模拟实现三个面开始学习一，概念和性质栈：一种特殊的线性表，其只允许在固定的一端进行插入和删除元素操作。进行数据插入和删除操作的一端称为栈顶，另一端称为栈底。栈中的数据元素遵守后进先出LIFO（LastInFirstOut）的原则。压栈：栈的插入操作叫做进栈/压栈/入栈，入数据在栈顶。出栈：栈的删除操作叫做出
列表推导式_Python教程曹操贪慕小乔 python基础 python numpy 算法
内容摘要Python中存在一种特殊的表达式，名为推导式，它的作用是将一种数据结构作为输入，再经过过滤计算等处理，最后输出另一种数据结构。根据数据结构的不同会被分为列表推导式、文章正文Python中存在一种特殊的表达式，名为推导式，它的作用是将一种数据结构作为输入，再经过过滤计算等处理，最后输出另一种数据结构。根据数据结构的不同会被分为列表推导式、集合推导式和字典推导式。我们先着重来介绍最常使用的列
优化 Java 数据结构选择与使用，提升程序性能与可维护性草药味儿の岁月 java 数据结构开发语言
引言在软件开发中，数据结构的选择是影响程序性能、内存使用以及代码可维护性的关键因素之一。Java作为一门广泛使用的编程语言，提供了丰富的内置数据结构，如数组、链表、栈、队列、树、图以及集合框架中的各种接口实现（如List,Set,Map等）。然而，面对不同的应用场景，如何合理地选择和优化数据结构，成为了一个值得深入探讨的话题。本文将介绍几种常见的Java数据结构，并探讨如何根据实际需求进行优化选择
算法笔记（七）——哈希表闪电麦昆️ 算法算法笔记哈希 c++
文章目录两数之和判定是否互为字符重排存在重复元素存在重复元素II字母异位词分组哈希表：一种存储数据的容器；可以快速查找某个元素，时间复杂度O(1)；当频繁查找某一个数时，我们可以使用哈希表创建一个容器（unordered_map）用数组模拟一个简易哈希表容器数据结构unordered_mapmapunorded_setset实现机理hashRBThashRBT元素格式key+valuekey+va
第一章数据结构绪论超神的你数据结构与算法笔记数据结构与算法
第一章数据结构绪论数据数据对象：性质相同的数据元素的集合，数据的子集数据元素：人数据项：眼、耳、鼻、嘴、手、脚等不可分割的项数据结构：存在特定关系（搭配和排列）的数据元素的集合逻辑结构集合结构：元素之间没有关系线性结构：元素之间一对一关系（兄弟排行）树形结构：元素之间一对多关系（父子）图形结构：元素之间多对多关系（好朋友）物理结构/存储结构：逻辑结构的存储形式顺序存储（数组）链式存储（取号）：需要
数据结构（C\C++）——算法复杂度飞鸟吟数据结构数据结构 c语言 c++
算法复杂度前言1.数据结构前言1.1数据结构1.2算法1.3如何学好数据结构和算法2.算法效率2.1复杂度的概念2.2复杂度的重要性3.时间复杂度3.1定义3.2大O的渐进表示法3.3时间复杂度计算示例3.3.1示例13.3.2示例23.3.3示例33.3.4示例43.3.5示例5冒泡排序时间复杂度3.3.6示例63.3.7示例74.空间复杂度4.1空间复杂度计算示例4.1.1示例14.1.2示例
HashMap的奇幻漂流：当一个数组决定去整容桃木山人深挖面经哈希算法算法数据结构
标准答案（面试官最爱版）HashMap实现原理：数据结构：数组+链表/红黑树（Java8+）哈希算法：(h=key.hashCode())^(h>>>16)索引计算：(n-1)&hash（n为数组长度）冲突解决：链表→红黑树（阈值=8），树→链表（阈值=6）扩容机制：2倍扩容，负载因子默认0.75用程序员黑话：“它就是个会变形的瑞士卷——平时是夹心饼干（数组+链表），吃撑了变千层蛋糕（红黑树）”一
数据结构---顺序表的基本操作代码块偷吃鱼骨的猫数据结构代码笔记数据结构
顺序表的基本操作//定义typedefstruct{ElemType*Elem;//动态数组，存储空间基地址intlength=0;//当前长度}SqList;//顺序表结构类型//初始化StatusInitList(SqList&L){//构造一个空的顺序表L.Elem=newElemType[MaxSize];//为顺序分配一个MAxSize大小的空间if(!L.Elem)//判断是否成功分配
数据结构-栈基本运算的实现及其应用 Ssaty. 数据结构算法 c++
第1关：顺序栈的实现本关任务：实现顺序栈的入栈、出栈和取栈顶功能。/*************************************************************顺序存储的栈实现文件更新于2020年4月27日**************************************************************/#include#include#
数据结构与算法——数据结构4 写代码写到手抽筋数据结构与算法数据结构
程序员没有稳定一说，目前学习数据结构，其实不难，最近在学习，系统性的总结下，便于后续复习和使用。主要是把线性表，全名为线性存储结构。使用线性表存储数据的方式可以这样理解，即“把所有数据用一根线儿串起来，再存储到物理空间中”。分为顺序表和单链表。顺序表单链表同时还要知道顺序表和链表的优缺点【待补充】还要知道链表反转，知道迭代法和递归法就可以【】还需要知道单链表相交的思路【】后边了解静态链表的原理静态
静态顺序表有梦想的电信狗《数据结构与算法》数据结构 c语言 c++链表
顺序表顺序表和链表都是线性表的一种，此处介绍顺序表数据的存储结构有分为逻辑存储结构和物理存储结构。顺序表和链表(之后的文章会详解)实际上都是线性表，是因为他们的逻辑存储关系都是线性的，只是因为在计算机内存中存储的方式(物理存储结构)不同。两种物理存储结构各有优劣，作为开发者，在不同的场景需要灵活选用相应的数据结构来存储数据，来促使我们的程序更高效的运行。静态顺序表静态顺序表，顾名思义，即为顺序表的
c++模板初阶晚安，cheems c++开发语言
1.泛型编程泛型编程是一种编程范式，它允许程序员在编写代码时定义算法和数据结构时可以处理不同类型的数据，而不必为每种数据类型编写特定的代码。泛型编程的主要目的是提高代码的复用性、灵活性和可维护性。以下是一些关于泛型编程的基本概念：泛型的优点代码复用：同一套代码可以用于不同的数据类型。类型安全：在编译时就能检查出错误，而不是在运行时。性能：由于不需要进行类型转换，可以生成更高效的代码。泛型编程的例子
【数据结构】数据结构，算法概念王_哈_哈 Jw 数据结构(考研知识点)数据结构
0.本篇问题：数据、数据元素、数据对象、数据项之间的基本关系？ADT是什么？数据结构的三要素？数据的逻辑结构有哪些？数据的存储结构有哪些？算法的五个特征？O(1)O(logn)O(n^n)O(n)O(n^2)O(n^3)O(2^n)O(n!)O(nlogn)大小关系？★错题&典型题1.可以用（）定义一个完整的数据结构A.数据元素B.数据对象C.数据关系D.抽象数据类型2.以下属于逻辑结构的是（）A
数据结构 -- 字符串 _安晓数据结构数据结构
字符串串的定义串，即字符串（String）是由零个或多个字符组成的有限序列，一般记为S=‘a1a2a3a4’（n≥0）其中，S是串名，单引号括起来的是字符序列是串的值；ai可以是字母、数字或是其他字符；串中字符的个数n称为串的长度。n=0时的串称为空串（用∅表示）。例：（不同语言可能使用的边界符不同，Java、c等使用双引号（“”）Python等使用单引号（’‘））S="HelloWorld！"T
Redis 源码分析-内部数据结构 robj 笨手笨脚の #Redis redis 数据结构数据库 redisObject 44字节 embStr raw
Redis源码分析-内部数据结构robjRedis中，一个database内的这个映射关系是用一个dict来维护的（ht[0]）。dict的key固定用一种数据结构来表达就够了，即动态字符串sds。而value则比较复杂，为了在同一个dict内能够存储不同类型的value，这就需要一个通用的数据结构，这个通用的数据结构就是robj（全名redisObject）。#defineLRU_BITS24/
redis内部数据结构(5)-quicklist Tinner丶链表数据结构算法 java redis
Redis对外暴露的list数据类型，它底层实现所依赖的内部数据结构就是`quicklist`。我们在讨论中还会涉及到两个Redis配置(在redis.conf中的ADVANCEDCONFIG部分)：12list-max-ziplist-size-2list-compress-depth0注：本文讨论的quicklist实现基于Redis源码的3.2分支。quicklist概述Redis对外暴露的
Redis内部数据结构quicklist详解码农单克 redis redis
在本文中，我们介绍一个Redis内部数据结构——quicklist。Redis对外暴露的list数据类型，它底层实现所依赖的内部数据结构就是quicklist。我们在讨论中还会涉及到两个Redis配置（在redis.conf中的ADVANCEDCONFIG部分）：list-max-ziplist-size-2list-compress-depth0我们在讨论中会详细解释这两个配置的含义。注：本文讨
redis操作zset类型的基本命令 JavaWeb学起来 redis redis 数据结构
zset是有序存储的数据结构，它和set一样，不允许重复的值，下面我们总结一些常用的命令。zaddkey排序的数值值(这里为了zset可以有序的存储，需要设定数值)127.0.0.1:6379>zaddz15java3redis1mysql2nginx4oracle(integer)5zcardkey(返回key中的成员数)127.0.0.1:6379>zcardz1(integer)5zrang
Linux的Initrd机制被触发 linux
Linux 的 initrd 技术是一个非常普遍使用的机制，linux2.6 内核的 initrd 的文件格式由原来的文件系统镜像文件转变成了 cpio 格式，变化不仅反映在文件格式上， linux 内核对这两种格式的 initrd 的处理有着截然的不同。本文首先介绍了什么是 initrd 技术，然后分别介绍了 Linux2.4 内核和 2.6 内核的 initrd 的处理流程。最后通过对 Lin
maven本地仓库路径修改 bitcarter maven
默认maven本地仓库路径：C:\Users\Administrator\.m2 修改maven本地仓库路径方法： 1.打开E:\maven\apache-maven-2.2.1\conf\settings.xml 2.找到
XSD和XML中的命名空间 darrenzhu xml xsd schema namespace 命名空间
http://www.360doc.com/content/12/0418/10/9437165_204585479.shtml http://blog.csdn.net/wanghuan203/article/details/9203621 http://blog.csdn.net/wanghuan203/article/details/9204337 http://www.cn
Java 求素数运算周凡杨 java 算法素数
网络上对求素数之解数不胜数，我在此总结归纳一下，同时对一些编码，加以改进，效率有成倍热提高。第一种：原理: 6N(+-)1法任何一个自然数，总可以表示成为如下的形式之一： 6N，6N+1，6N+2，6N+3，6N+4，6N+5 (N=0，1，2，…)
java 单例模式 g21121 java
想必单例模式大家都不会陌生，有如下两种方式来实现单例模式： class Singleton { private static Singleton instance=new Singleton(); private Singleton(){} static Singleton getInstance() { return instance; }
Linux下Mysql源码安装 510888780 mysql
1.假设已经有mysql-5.6.23-linux-glibc2.5-x86_64.tar.gz (1)创建mysql的安装目录及数据库存放目录解压缩下载的源码包，目录结构，特殊指定的目录除外：
32位和64位操作系统墙头上一根草 32位和64位操作系统
32位和64位操作系统是指：CPU一次处理数据的能力是32位还是64位。现在市场上的CPU一般都是64位的，但是这些CPU并不是真正意义上的64 位CPU，里面依然保留了大部分32位的技术，只是进行了部分64位的改进。32位和64位的区别还涉及了内存的寻址方面，32位系统的最大寻址空间是2 的32次方= 4294967296（bit）= 4（GB）左右，而64位系统的最大寻址空间的寻址空间则达到了
我的spring学习笔记10-轻量级_Spring框架 aijuans Spring 3
一、问题提问： → 请简单介绍一下什么是轻量级？轻量级（Leightweight）是相对于一些重量级的容器来说的，比如Spring的核心是一个轻量级的容器，Spring的核心包在文件容量上只有不到1M大小，使用Spring核心包所需要的资源也是很少的，您甚至可以在小型设备中使用Spring。
mongodb 环境搭建及简单CURD antlove Web Install curd NoSQL mongo
一搭建mongodb环境 1. 在mongo官网下载mongodb 2. 在本地创建目录 "D:\Program Files\mongodb-win32-i386-2.6.4\data\db" 3. 运行mongodb服务 [mongod.exe --dbpath "D:\Program Files\mongodb-win32-i386-2.6.4\data\
数据字典和动态视图百合不是茶 oracle 数据字典动态视图系统和对象权限
数据字典（data dictionary）是 Oracle 数据库的一个重要组成部分，这是一组用于记录数据库信息的只读（read-only）表。随着数据库的启动而启动,数据库关闭时数据字典也关闭数据字典中包含数据库中所有方案对象（schema object）的定义(包括表，视图，索引，簇，同义词，序列，过程，函数，包，触发器等等) 数据库为一
多线程编程一般规则 bijian1013 java thread 多线程 java多线程
如果两个工两个以上的线程都修改一个对象，那么把执行修改的方法定义为被同步的，如果对象更新影响到只读方法，那么只读方法也要定义成同步的。不要滥用同步。如果在一个对象内的不同的方法访问的不是同一个数据，就不要将方法设置为synchronized的。
将文件或目录拷贝到另一个Linux系统的命令scp bijian1013 linux unix scp
一.功能说明 scp就是security copy，用于将文件或者目录从一个Linux系统拷贝到另一个Linux系统下。scp传输数据用的是SSH协议，保证了数据传输的安全，其格式如下： scp 远程用户名@IP地址：文件的绝对路径
【持久化框架MyBatis3五】MyBatis3一对多关联查询 bit1129 Mybatis3
以教员和课程为例介绍一对多关联关系，在这里认为一个教员可以叫多门课程，而一门课程只有1个教员教，这种关系在实际中不太常见，通过教员和课程是多对多的关系。示例数据：地址表： CREATE TABLE ADDRESSES ( ADDR_ID INT(11) NOT NULL AUTO_INCREMENT, STREET VAR
cookie状态判断引发的查找问题 bitcarter form cgi
先说一下我们的业务背景： 1.前台将图片和文本通过form表单提交到后台，图片我们都做了base64的编码，并且前台图片进行了压缩 2.form中action是一个cgi服务 3.后台cgi服务同时供PC，H5，APP 4.后台cgi中调用公共的cookie状态判断方法（公共的，大家都用，几年了没有问题）问题：（折腾两天。。。。） 1.PC端cgi服务正常调用，cookie判断没
通过Nginx,Tomcat访问日志(access log)记录请求耗时 ronin47
一、Nginx通过$upstream_response_time $request_time统计请求和后台服务响应时间 nginx.conf使用配置方式： log_format main '$remote_addr - $remote_user [$time_local] "$request" ''$status $body_bytes_sent "$http_r
java-67- n个骰子的点数。把n个骰子扔在地上，所有骰子朝上一面的点数之和为S。输入n，打印出S的所有可能的值出现的概率。 bylijinnan java
public class ProbabilityOfDice { /** * Q67 n个骰子的点数 * 把n个骰子扔在地上，所有骰子朝上一面的点数之和为S。输入n，打印出S的所有可能的值出现的概率。 * 在以下求解过程中，我们把骰子看作是有序的。 * 例如当n=2时，我们认为（1，2）和（2，1）是两种不同的情况 */ private stati
看别人的博客，觉得心情很好 Cb123456 博客心情
以为写博客，就是总结，就和日记一样吧，同时也在督促自己。今天看了好长时间博客: 职业规划: http://www.iteye.com/blogs/subjects/zhiyeguihua android学习: 1.http://byandby.i
[JWFD开源工作流]尝试用原生代码引擎实现循环反馈拓扑分析 comsci 工作流
我们已经不满足于仅仅跳跃一次，通过对引擎的升级，今天我测试了一下循环反馈模式，大概跑了200圈，引擎报一个溢出错误在一个流程图的结束节点中嵌入一段方程，每次引擎运行到这个节点的时候，通过实时编译器GM模块，计算这个方程，计算结果与预设值进行比较，符合条件则跳跃到开始节点，继续新一轮拓扑分析，直到遇到
JS常用的事件及方法 cwqcwqmax9 js
事件描述 onactivate 当对象设置为活动元素时触发。 onafterupdate 当成功更新数据源对象中的关联对象后在数据绑定对象上触发。 onbeforeactivate 对象要被设置为当前元素前立即触发。 onbeforecut 当选中区从文档中删除之前在源对象触发。 onbeforedeactivate 在 activeElement 从当前对象变为父文档其它对象之前立即
正则表达式验证日期格式 dashuaifu 正则表达式 IT其它 java其它
正则表达式验证日期格式 function isDate(d){ var v = d.match(/^(\d{4})-(\d{1,2})-(\d{1,2})$/i); if(!v) { this.focus(); return false; } } <input value="2000-8-8" onblu
Yii CModel.rules() 方法、validate预定义完整列表、以及说说验证 dcj3sjt126com yii
public array rules () {return} array 要调用 validate() 时应用的有效性规则。返回属性的有效性规则。声明验证规则，应重写此方法。每个规则是数组具有以下结构：array('attribute list', 'validator name', 'on'=>'scenario name', ...validation
UITextAttributeTextColor = deprecated in iOS 7.0 dcj3sjt126com ios
In this lesson we used the key "UITextAttributeTextColor" to change the color of the UINavigationBar appearance to white. This prompts a warning "first deprecated in iOS 7.0." Ins
判断一个数是质数的几种方法 EmmaZhao Math python
质数也叫素数，是只能被1和它本身整除的正整数，最小的质数是2，目前发现的最大的质数是p=2^57885161-1【注1】。判断一个数是质数的最简单的方法如下： def isPrime1(n): for i in range(2, n): if n % i == 0: return False return True 但是在上面的方法中有一些冗余的计算，所以
SpringSecurity工作原理小解读坏我一锅粥 SpringSecurity
SecurityContextPersistenceFilter ConcurrentSessionFilter WebAsyncManagerIntegrationFilter HeaderWriterFilter CsrfFilter LogoutFilter Use
JS实现自适应宽度的Tag切换 ini JavaScript html Web css html5
效果体验：http://hovertree.com/texiao/js/3.htm 该效果使用纯JavaScript代码，实现TAB页切换效果，TAB标签根据内容自适应宽度，点击TAB标签切换内容页。 HTML文件代码： <!DOCTYPE html> <html xmlns="http://www.w3.org/1999/xhtml"
Hbase Rest API : 数据查询 kane_xie REST hbase
hbase（hadoop）是用java编写的，有些语言（例如python）能够对它提供良好的支持，但也有很多语言使用起来并不是那么方便，比如c#只能通过thrift访问。Rest就能很好的解决这个问题。Hbase的org.apache.hadoop.hbase.rest包提供了rest接口，它内嵌了jetty作为servlet容器。启动命令：./bin/hbase rest s
JQuery实现鼠标拖动元素移动位置（源码+注释）明子健 jquery js 源码拖动鼠标
欢迎讨论指正！ print.html代码： <!DOCTYPE html> <html> <head> <meta http-equiv=Content-Type content="text/html;charset=utf-8"> <title>发票打印</title> &l
Postgresql 连表更新字段语法 update qifeifei PostgreSQL
下面这段sql本来目的是想更新条件下的数据，可是这段sql却更新了整个表的数据。sql如下： UPDATE tops_visa.visa_order SET op_audit_abort_pass_date = now() FROM tops_visa.visa_order as t1 INNER JOIN tops_visa.visa_visitor as t2 ON t1.
将redis,memcache结合使用的方案? tcrct redis cache
公司架构上使用了阿里云的服务，由于阿里的kvstore收费相当高，打算自建，自建后就需要自己维护，所以就有了一个想法，针对kvstore(redis)及ocs(memcache)的特点，想自己开发一个cache层，将需要用到list，set，map等redis方法的继续使用redis来完成，将整条记录放在memcache下，即findbyid，save等时就memcache，其它就对应使用redi
开发中遇到的诡异的bug wudixiaotie bug
今天我们服务器组遇到个问题：我们的服务是从Kafka里面取出数据，然后把offset存储到ssdb中，每个topic和partition都对应ssdb中不同的key，服务启动之后，每次kafka数据更新我们这边收到消息，然后存储之后就发现ssdb的值偶尔是-2,这就奇怪了，最开始我们是在代码中打印存储的日志，发现没什么问题，后来去查看ssdb的日志，才发现里面每次set的时候都会对同一个key