编辑距离(edit distance)

编辑距离:就是两个字符串之间,由一个转化为另一个所需的最少编辑操作次数。

许可的编辑操作包括将

(1)一个字符替换为另一个字符;

(2)插入一个字符;

(3)删除一个字符;

 

可以用动态规划解决这道题目:

设原始串是S[1,....n] ,目标串是T[1,.....m];

设d[i][j]表示子串S[1,...i] 转化为子串T[1,....j]的最短编辑距离。

那么结果就是 d[n][m];

状态转移方程为

d[i][j]=min{

                        d[i-1][j-1]+cost; //把原始串S的第i个字符替换为目标串T的第j个字符。如果S[i]==T[j],cost=0,否则为1.

                        d[i-1][j]+1        ; //把原始串S的第i个字符删除

                        d[i][j-1]+1       ; // 在原始串S的第i个字符之后插入一个跟T[j]相同的字符。

                 }

复杂度是O(n*m)

 

推荐 poj1035

下面是用动态规划实现的编辑距离代码。

#include 
#include 
#include 
#include 
#include 
#include 
using namespace std;
const int maxn = 100;
char a[maxn];
char b[maxn];
int d[maxn][maxn];
int main()
{
    while(scanf("%s %s",a+1,b+1)!=EOF)
	{
        int la=strlen(a+1);
		int lb=strlen(b+1);
		memset(d,0,sizeof(d));

		for(int i=1;i<=la;i++)
			d[i][0]=i;
		for(int i=1;i<=lb;i++)
			d[0][i]=i;
        
        for(int i=1;i<=la;i++)
		{
           for(int j=1;j<=lb;j++)
		   {
              if(a[i]==b[j])
				  d[i][j]=d[i-1][j-1];
			  else
				  d[i][j]=d[i-1][j-1]+1;
			  if(d[i-1][j]+1


 

 

 

你可能感兴趣的:(distance,算法研究)