Python实现计算Levenshtein的距离相似度

Levenshtein 距离

1.定义

        Levenshtein 距离,又称编辑距离,指的是两个字符串之间,由一个转换成另一个所需的最少编辑操作次数。编辑操作包括将一个字符替换成另一个字符,插入一个字符,删除一个字符。(即:插入、删除、替换)。

 

2.代码实现

(1)首先安装python-Levenshtein库,安装完使用import Levenshtein导入该库。

(2)定义两个字符串str1, str2,然后通过Levenshtein.distance(str1, str2) 计算编辑距离distance。

import Levenshtein

str1 = 'Mike'
str2 = 'Micheal'
distance = Levenshtein.distance(str1, str2)  # distance指编辑距离
print(distance)     # 4
 

你可能感兴趣的:(网络日志分析,python,python)