DP算法之最短编辑距离

题目描述

给定两个字符串A和B,现在要将A经过若干操作变为B,可进行的操作有:
删除–将字符串A中的某个字符删除。
插入–在字符串A的某个位置插入某个字符。
替换–将字符串A中的某个字符替换为另一个字符。
现在请你求出,将A变为B至少需要进行多少次操作。

输入格式
第一行包含整数n,表示字符串A的长度。
第二行包含一个长度为n的字符串A。
第三行包含整数m,表示字符串B的长度。
第四行包含一个长度为m的字符串B。
字符串中均只包含大写字母。

输出格式

输出一个整数,表示最少操作次数。

数据范围

1≤n,m≤1000

样例

10
AGTCTGACGC
11
AGTAAGTAGGC

输出样例:

4

算法(线性DP) O(n^3)时间复杂度100万

最短编辑距离的DP思考方式:

核心算法:考虑string a,b匹配的最后一步,分为三种操作分别考虑
(1)最后一步为删除操作,那么a的前i-1个字母和b的j个字母匹配(用j代表字符串b的所有字母)那么该情形的最小状态转移计算式f[i-1,j]+1.
(2)最后一步为增添操作,那么a的i个字母和b的j-1个字母匹配(用j代表字符串b的所有字母),那么该情形的最小状态转移计算式为f[i,j-1]+1.
(3)最后一步为替换操作,考虑俩种情形,替换当前位置的字母不同,那么a的前i-1个字母和b的前j-1个字母匹配(用j代表字符串b的所有字母)
那么该情形的最小状态转移计算式为f[i-1,j-1]+1,若当前位置的字母相同则不用替换;那么状态转移计算式为f[i-1,j-1].
(4)最后将三种操作的取min操作,即为最短编辑距离的状态转移计算式:f[i,j]=min(f[i-1][j]+1,f[i][j-1]+1,f[i-1][j-1]+1/0);

C++ 代码:

#include
using namespace std;
const int N=1010;
int n,m;
char a[N],b[N];
int f[N][N];
int main(){
    scanf("%d%s",&n,a+1); //防止状态计算式中的i-1,导致数组下标越界
    scanf("%d%s",&m,b+1);
    for(int i=0;i<=m;i++)f[0][i]=i;
    //考虑a字符串为0来匹配字符串b的前i个字母时的情形,那么a字符串执行增添操作,增添的次数取决于b字符串字母的个数
       for(int j=0;j<=n;j++)f[j][0]=j;
 //考虑a字符串的前i个字母来匹配字符串b的0个字母的情形,那么a字符串执行删除操作,删除的次数取决于a字符串字母的个数
           for(int i=1;i<=n;i++)
             for(int j=1;j<=m;j++)
             {
                 f[i][j]=min(f[i-1][j]+1,f[i][j-1]+1);
   //前俩种情形的状态转移计算式,第三种情形需要判断是否相等。
                     if(a[i]==b[j]) f[i][j]=min(f[i][j],f[i-1][j-1]);
                        else f[i][j]=min(f[i][j],f[i-1][j-1]+1);
             }
             printf("%d\n",f[n][m]);
    //表示把字符串a的前n个字母变为字符串b的前m个字母
             return 0;
}

线性DP的思考方式:

个人理解:DP问题大多都是考虑最后一步,然后利用此分类,归纳出状态转移方程进而写出代码。

你可能感兴趣的:(DP算法之最短编辑距离)