史上最全最丰富的“最长公共子序列”、“最长公共子串”问题的解法与思路
https://blog.csdn.net/wangdd_199326/article/details/76464333
非连续的最长公共子序列
求两个字符串的最长公共子序列。借用算法导论上的表示方法,给定一个字符串X=
现在就想怎么把问题变为为小问题呢?怎么解决这个问题呢?
关键要找到问题的突破口,先不要管最终解决,先想一想怎么吧问题花姐的规模小一些。我先分别拿两个字符串的最后一个字符“开刀”,先拿他们比较
1)我们可以首先比较x_m和y_n如果这两个字符相同,那么x_m = y_n一定是最长公共子序列中的一个字符。那么我们的问题就是求X_(m-1) =
2)如果x_m != y_n,我们要求X和Y的最长公共最序列,就转为求两个子问题,一个是求X_m和Y_(n-1)的最长公共子序列,另一个是求X_(m-1)和Y_n的最长公共子序列。取两者中最长的那个就是问题的解。
至此,大问题就化为小问题的,具体我们可以写递推公式。
假如用c[i,j]表示X_i和Y_j序列的最大公共子序列的长度的话
c[i,j] = 0 如果i == 0或者j == 0
c[i,j] = c[i - 1][j - 1] 如果x_j == y_j
c[i,j] = max(c[i-1,j], c[i, j-1]) 如果x_i != y_j
有了递推公式,定义对应递推公式的数组,就可以求得最终的答案。
#include
#include
#include
using namespace std;
int max(const int& a, const int& b) {
return (a > b ? a : b);
}
//模板函数用来输出二维数组
template
void print_vector(const vector >& vec) {
for(size_t i = 0; i != vec.size(); i++) {
for(size_t j = 0; j != vec[i].size(); j++) {
cout << vec[i][j] << " ";
}
cout << endl;
}
}
//getLCS函数用来求两个字符串的最大公共子序列,并返回其长度
int getLCS(const string& str1, const string& str2){
if(str1.empty() || str2.empty()) {
return 0;
}
size_t len1 = str1.size();
size_t len2 = str2.size();
//lcs用来保存两字符串str1[0,...,row]和str1[0,...,col]的最长公共序列的长度
vector > lcs(len1 + 1, vector (len2 + 1, 0));
//index用来保存如何找到最长公共子序列
vector > index(len1 + 1, vector (len2 + 1, '-'));
for(size_t row = 0; row != len1 + 1; row++) {
for(size_t col = 0; col != len2 + 1; col++) {
if(row == 0 || col == 0) {
lcs[row][col] = 0;
continue;
}
if(str1[row - 1] == str2[col - 1]) {
lcs[row][col] = lcs[row - 1][col - 1] + 1;
index[row][col] = '=';
}
if(str1[row - 1] != str2[col - 1]) {
//lcs[row][col] = max(cls[row - 1][col], cls[row][col - 1]);
if(lcs[row - 1][col] > lcs[row][col - 1]) {
lcs[row][col] = lcs[row - 1][col];
index[row][col] = 'u';
}
else {
lcs[row][col] = lcs[row][col - 1];
index[row][col] = 'l';
}
}
}
}
cout << "lcs vector is " << endl;
print_vector(lcs);
cout << "index vector is " << endl;
print_vector(index);
return lcs[len1][len2];
}
int main(void)
{
string str1, str2;
cin >> str1 >> str2;
int len = 0;
len = getLCS(str1, str2);
cout << "最长公共子序列的长度是:" << len << endl;
return 0;
}
两个字符串最长连续公共序列
如下两个字符串,公共连续字符串为abcdf,求出这个abcdf,
"aaffffsfabcdfasf", "aaaadfsabcdfsdb"
假设字符串长度分别为m,n,这个题有个m*n*min(m,n)复杂度的方法,这个方法比较慢,暂时不考虑。
另一个种方法是动态规划:
设置二维数组dp[][], dp[i][j]==0表示第一个字符串的第i个字符与第二个字符串的第j个字符不相等,dp[i][j]!=0表示第一个字符串的第i个字符与第二个字符串的第j个字符串相等,并且,如果dp[i][j]==k,不仅当前字符相等,前面k-1个也相等,也就是dp的公式为dp[i][j] = dp[i-1][j-1]+1。最终二维矩阵的结果如下所示(随机写的):
00010010
01000000
00201000
01030010
11014101
代码如下:
//求两个字符串的最大公共字串
public String longestSerialSubstring(String s1,String s2){
String res = "";
int m = s1.length(),n = s2.length();
int[][] dp = new int[m][n];
int max = 0;
int index = 0;
for(int i=0;imax){
max = dp[i][j];
index = i;
}
}
}
}
res = s1.substring(index-max+1,index+1);
return res;
}