最长公共子序列问题 :
1>给两个子序列A和B,求长度最大的公共子序列。例如1,5,2,6,8,7和2,3,5,6,9,8,4的最长公共子序列为5,6,8(另一个解是2,6,8)。
2>我们称序列Z = < z1, z2, ..., zk >是序列X = < x1, x2, ..., xm >的子序列当且仅当存在严格上升的序列< i1, i2, ..., ik >,使得对j = 1, 2, ... ,k, 有xij = zj。比如Z = < a, b, f, c > 是X = < a, b, c, f, b, c >的子序列。
现在给出两个序列X和Y,你的任务是找到X和Y的最大公共子序列,也就是说要找到一个最长的序列Z,使得Z既是X的子序列也是Y的子序列。
举个例子:cnblogs这个字符串中子序列有多少个呢?很显然有27个,比如其中的cb,cgs等等都是其子序列,我们可以看出
子序列不见得一定是连续的,连续的那是子串。
我想大家已经了解了子序列的概念,那现在可以延伸到两个字符串了,那么大家能够看出:cnblogs和belong的公共子序列吗?
在你找出的公共子序列中,你能找出最长的公共子序列吗?
从图中我们看到了最长公共子序列为blog,仔细想想我们可以发现其实最长公共子序列的个数不是唯一的,可能会有两个以上,
但是长度一定是唯一的,比如这里的最长公共子序列的长度为4。
思路如下面的图:
方案:既然是经典的题目肯定是有优化空间的,并且解题方式是有固定流程的,这里我们采用的是矩阵实现,也就是二维数组。
第一步:先计算最长公共子序列的长度。
第二步:根据长度,然后通过回溯求出最长公共子序列。
现有两个序列X={x1,x2,x3,...xi},Y={y1,y2,y3,....,yi},
设一个C[i,j]: 保存Xi与Yj的LCS的长度。
动态规划的一个重要性质特点就是解决“子问题重叠”的场景,可以有效的避免重复计算,根据上面的
公式其实可以发现C[i,j]一直保存着当前(Xi,Yi)的最大子序列长度。
如下代码:
#include<stdio.h> #include<string.h> #include<iostream> using namespace std; int smax(int x,int y){ return x >=y ? x : y; } int maxstr[10000][10000]; char str1[1000],str2[1000]; int main(){ int len1,len2; while(scanf("%s%s",&str1, &str2)!=EOF){ len1=strlen(str1); len2=strlen(str2); for(int i=0; i<=len1; ++i){ maxstr[i][0]=0;//初始化边界,过滤掉0的情况 } for(int i=0; i<=len2; ++i){ maxstr[0][i]=0; } //填充矩阵 for(int i=1; i<=len1; ++i){ for(int j=1; j<=len2; ++j){ if(str1[i-1]==str2[j-1])//相等的情况 maxstr[i][j]=maxstr[i-1][j-1]+1; else if(maxstr[i-1][j] >= maxstr[i][j-1]){//比较“左边”和“上边“,根据其max来填充 maxstr[i][j]=maxstr[i-1][j]; }else{ maxstr[i][j]=maxstr[i][j-1]; } } } printf("%d\n",maxstr[len1][len2]); } return 0; }
参考博客:http://www.cnblogs.com/huangxincheng/archive/2012/11/11/2764625.html
参考博客:http://blog.csdn.net/chenwenshi/article/details/6027884