0
点赞
收藏
分享

微信扫一扫

NLP之距离算法Levenshtein

1安装:pip install python-Levenshtein;(但是会报错,你自己去下载这个包)

 

2.原理解析:

“”“

就是计算两个字符串之间的改动次数:改动包括(新增,修改,删除)

(1-两个字符所有的改动次数  /  两个字符之和 )  =  近似比率

”“”

3.如何使用:

import Levenshtein
s_1 = "春夏秋冬"
s_2 = "夏秋冬春"
s_3 = "秋冬春夏"
s_4 = "冬春夏秋"
print(f"需要改变的次数为:{Levenshtein.distance(s_1,s_2)},近似比:{Levenshtein.ratio(s_1,s_2)}")
print(f"需要改变的次数为:{Levenshtein.distance(s_1,s_3)},近似比:{Levenshtein.ratio(s_1,s_3)}")
print(f"需要改变的次数为:{Levenshtein.distance(s_1,s_4)},近似比:{Levenshtein.ratio(s_1,s_4)}")
------------------------------------------------------

需要改变的次数为:2,近似比:0.75
需要改变的次数为:4,近似比:0.5
需要改变的次数为:2,近似比:0.75

-----------------------------------------------------------------------------------------------------------------------------------------

举报

相关推荐

NLP中的嵌入和距离度量

0 条评论