最长公共子序列(LCS)动态规划的算法优化

最长公共子序列求解问题是一种典型的动态规划问题。此文章以http://nyoj.top/problem/1409   或http://acm.nyist.edu.cn/JudgeOnline/problem.php?pid=36为例说明最长子序列的动态规划算法如何优化。

最长公共子序列(LCS)动态规划的算法优化_第1张图片

关于最长公共子序列的动态规划,见https://blog.csdn.net/hrn1216/article/details/51534607

常规方法

#include
#include
#include//LCS(Longest Common Subsequence)
using namespace std;
int dp[1001][1001];
int main()
{
	ios::sync_with_stdio(false);
	cin.tie(0);
	short N;
	string s1, s2;
	unsigned n1, n2,i,j;
	cin >> N;
	while (N--)
	{
		cin >> s1 >> s2;
		n1 = s1.size();
		n2 = s2.size();
		for (i = 0; i <= n1; i++)dp[i][0] = 0;
		for (j = 0; j <=n2; j++)dp[0][j] = 0;
		for(i=1;i<=n1;i++)
			for (j = 1; j <= n2; j++)
				dp[i][j] = (s1[i-1] == s2[j-1]) ? dp[i - 1][j - 1] + 1 : max(dp[i][j - 1], dp[i - 1][j]);
			cout << dp[n1][n2] << endl;
	}
	return 0;
}

注意到,此处定义了一个nxm的二维数组,空间开销很大。实际上通过观察建立的最优值的递归式

最长公共子序列(LCS)动态规划的算法优化_第2张图片发现求解C[i,j]的值总是建立在二维数组第

i行某一列元素或者第i-1行某一列元素基础上的,如果不需要求解最长公共子序列是什么,只需要求解其长度,那么我们可以建立一个2xn的滚动数组代替nxm的数组来实现空间优化,这种方法只需要用到cur层和pre层的数据,通过cur和pre的不断交换实现mxn的数组功能。

空间优化后的代码

#include
#include
#include
using namespace std;
int main()
{
    ios::sync_with_stdio(false);
    cin.tie(0);
    int N,cur,pre;
    string s1,s2;
	int dp[2][1001];
    unsigned len1,len2,i,j;
    cin>>N;
    while(N--)
    {
        cin>>s1>>s2;
        len1=s1.size();
        len2=s2.size();
        cur=1;
        pre=0;
        for(i=0;i<=len2;i++)dp[0][i]=0;
        dp[1][0]=0;
        for(i=1;i<=len1;i++)
        {
            for(j=1;j<=len2;j++)
            {
                if(s1[i-1]==s2[j-1])
                    dp[cur][j]=dp[pre][j-1]+1;
                else
                    dp[cur][j]=max(dp[cur][j-1],dp[pre][j]);
            }
            swap(cur,pre);
        }
       cout<

此时的空间复杂度为o(n),时间复杂度还是o(nxm),此方法使用的前提是只需要求解最大公共子序列长度。

对空间继续优化

让我们在看那段代码,在横向扫描并保存数组的时候,也起到了个滑动的功能。那我们能不能只有一个纵向的数组呢?

我们在更新数组时,会发现在更新时可能需要dp[pre][j]和dp[cur][j-1] dp[pre][j-1]的值,实际上用一维数组dp[n]即可。在将要更新dp[j]前,dp[j]值即是刚才dp[pre][j]的值,dp[cur][j-1]的值对应现在dp[j-1]的值。刚才dp[pre][j-1]的值可以保存在一个临时变量old中。代码如下:

#include
#include
#include
using namespace std;
int main()
{
	ios::sync_with_stdio(false);
	cin.tie(0); 
	int N;
	string s1, s2;
	int dp[1001],tmp,old;
	unsigned len1, len2, i, j;
	cin >> N;
	while (N--)
	{
		cin >> s1 >> s2;
		len1 = s1.size();
		len2 = s2.size();
		for (i = 0; i <= len2; i++)dp[i] = 0;
		for (i = 1; i <= len1; i++)
		{
			old = dp[0];//dp[0]代表原本dp[i-1][0]
			for (j = 1; j <= len2; j++)
			{
				tmp = dp[j];//tmp代表dp[i-1][j]的值
				if (s1[i - 1] == s2[j - 1])
					dp[j] = old + 1;//代表dp[i-1][j-1]+1
				else
					dp[j] = max(dp[j - 1], dp[j]);//dp[j-1]代表dp[i][j-1]
				//更新值后dp[j]代表dp[i][j]
				old = tmp;//保留dp[i-1][j]的值留给下一步求解最优解时使用
			}
		}
		cout << dp[len2] << endl;
	}
	return 0;
}

注:这种方法虽然能够减少一半的空间开销,但是空间复杂度仍为o(n),代码较难理解,故对空间要求不高时使用第二种方法即可。此外,对于求解LCS问题,还有一种思路是转化为最大上升子序列,并采用二分搜索,这种方法可以把平均时间复杂度降到nlogn,但是存在极端情况效率比普通的动态规划方法效率更低,且转化过程中也有一定的时间空间开销,当输入的序列中各种符号混合时构造上升子序列较麻烦,我认为一般情况下没必要去使用。

 

 

你可能感兴趣的:(数据结构,算法)