编辑距离问题(动态规划)

问题描述:设A和B是两个字符串,要用最少的字符操作将字符串A转换为字符串B,这里所说的字符操作包括(1):删除一个字符;(2):插入一个字符;(3):修改一个字符。将A转换为B所用的最少字符操作数称为A到B的编辑距离,记为d[A][B],d[][]中的A,B指的是A和B的长度,设计一个算法对任给的A,B,计算出d[A][B]。

问题举例:假设A = "fxpimu", B = "xwrs",则d[6][4]为5。

问题分析:这个问题乍一看好像没什么突破口,这样,我们回忆一下01台阶问题,到达第i个台阶的办法只有两种办法,一个是跨一步到,一个是跨两步到,将这样的分析思路带入到这道题中,计算出d[A][B]的途径有哪几种,其实就是题目已经告诉的三种:删除,插入,修改字符,我们一一来看:删除无非就是d[i][j-1]+1(i转换为j-1的编辑距离再加一,这个一是删除的操作),同理插入可表示为d[i-1][j]+1,那修改如何表示呢?我们想象在进行字符操作后(计算d[][]的过程中),i-1和j-1已经完全相等,那么各给它们两个后再添加一个字符,那么修改就取决于添加的两个字符相不相等,如果相等d[i][j] = d[i-1][j-1],如果不相等d[i][j] = d[i-1][j-1]+1(就修改一次)。所以经过分析可以得到递推表达式:

递推公式知道后就是代码了:

#include 

/*递推公式:d[i][j] = i					j = 0
					j					i = 0 
					min( d[i-1][j] + 1		
						 d[i][j-1] + 1
						 d[i-1][j-1] + (A[i] != B[j]) )		0 < i <= lenth(A), 0 < j <=lenth(B) 	*/

int d[100][100] ;

int min(int a, int b)
{
	if(a > b){
		return b ;
	}
	else 
		return a ;
}

int lenth(char A[])
{
	int len = 0, i ;
	for(i=0; A[i]!='\0'; i++){
		len++ ;
	}
	return len ;
}

void calculate(char A[], char B[])
{
	int i, j ;

	for(i=0; i<=lenth(A); i++) d[i][0] = i ;
	for(j=0; j<=lenth(B); j++) d[0][j] = j ;

	for(i=1; i<=lenth(A); i++){
		for(j=1; j<=lenth(B); j++){
			
			if(A[i] == B[j]){
				d[i][j] = d[i-1][j-1] ;
			}
			else {
				d[i][j] = d[i-1][j-1] + 1 ;
			}
			printf("d[i-1][j]+1 = %d, d[i][j-1]+1 = %d, d[i][j] = %d\n", d[i-1][j]+1, d[i][j-1]+1, d[i][j]) ;
			d[i][j] = min( d[i][j], min( d[i-1][j]+1, d[i][j-1]+1 ) ) ;
			printf("%d\n", d[i][j]) ;
		}
	}
}

int main()
{
	char A[100], B[100] ;

	printf("请输入第一个字符串:") ;
	scanf("%s", A) ;
	printf("请输入第二个字符串:") ;
	scanf("%s", B) ;

	calculate(A, B) ;

	printf("编辑最短距离:%d\n", d[lenth(A)][lenth(B)]) ;

	return 0 ;
}

 

你可能感兴趣的:(算法设计与分析)