直接递归形式的编辑距离求解(递归过程会产生很多重复计算,所以应该采用动态规划来提高效率)
public class LevenshteinDistance
{
/**
* @param args
*/
public static void main(String[] args)
{
//1
// String str1 = "abc";
// String str2 = "adc";
//2
// String str1 = "ababababa";
// String str2 = "babababab";
//2
// String str1 = "abcd";
// String str2 = "acdb";
//3
String str1 = "kitten";
String str2 = "sitting";
int result = Distance(str1, 0, str1.length()-1, str2, 0, str2.length()-1);
System.out.println(result);
}
public static int Distance(String str1, int begin1, int end1, String str2, int begin2, int end2)
{
//如果第一个已经遍历完了
if(begin1 > end1)
{
//如果第二个也遍历完了
if(begin2 > end2)
{
return 0;
}
//如果第二个还没遍历完(剩余的第二个字符的长度依次删除就可以了)
else
{
return end2 - begin2 + 1;
}
}
//和上面同理
if(begin2 > end2)
{
if(begin1 > end1)
{
return 0;
}
else
{
return end1 - begin1 + 1;
}
}
//如果这两个字符相等,无需操作,均跳到下一个位置比较
if(str1.charAt(begin1) == str2.charAt(begin2))
{
return Distance(str1, begin1 + 1, end1, str2, begin2 + 1, end2);
}
else
{
//删除str1中begin1位置的字符,继续比较str1的begin1+1和str2的begin2(或者在str2的begin2位置前面增加一个字符使之等于str1的begin1)
int value1 = Distance(str1, begin1 + 1, end1, str2, begin2, end2) + 1;
//删除str2中begin2位置的字符,继续比较str2的begin2+1和str1的begin1(或者在str1的begin1位置前面增加一个字符使之等于str2的begin2)
int value2 = Distance(str1, begin1, end1, str2, begin2 + 1, end2) + 1;
//修改str1的begin1位置的字符或者修改str2的begin2位置的字符,使二者相等,然后比较str1的begin1+1和str2的begin2+1
int value3 = Distance(str1, begin1 + 1, end1, str2, begin2 + 1, end2) + 1;
//返回最小值
return min(value1, value2, value3);
}
}
public static int min(int a, int b, int c)
{
int min = a;
if(b<min)
{
min = b;
}
if(c<min)
{
min = c;
}
return min;
}
}
动态规划形式:
public class LDistance
{
/**
* @param args
*/
public static void main(String[] args)
{
// TODO Auto-generated method stub
String str1 = "kitten";
String str2 = "sitting";
// System.out.println(min(4,5,1));
int result = Distance(str1, str2);
System.out.println(result);
}
public static int Distance(String str1, String str2)
{
int str1Length = str1.length();
int str2Length = str2.length();
if(str1Length == 0)
{
return str2Length;
}
if(str2Length == 0)
{
return str1Length;
}
int[][] d = new int[str1Length + 1][str2Length + 1];
//填写纵向的第一列
for (int i = 0; i < str1Length + 1; i++)
{
d[i][0] = i;
}
//填写横向的第一列
for (int i = 0; i < str2Length + 1; i++)
{
d[0][i] = i;
}
for (int i = 1; i < str1Length + 1; i++)
{
for (int j = 1; j < str2Length + 1; j++)
{
int cost = 0;
if(str1.charAt(i-1) != str2.charAt(j-1))
{
cost = 1;
}
//在str1上i位置删除字符(或者在str2上j-1位置插入字符)
d[i][j] = min(d[i-1][j] + 1,
//在str1上i-1位置插入字符(或者在str2上j位置删除字符)
d[i][j-1] + 1,
// 替换操作
d[i-1][j-1] + cost);
}
}
return d[str1Length][str2Length];
}
public static int min(int a, int b, int c)
{
int min = a;
if(b<min)
{
min = b;
}
if(c<min)
{
min = c;
}
return min;
}
}