字符串間距離 N-Gram 原

 

N-Gram距離 = |GN(s)|+|GN(t)|−2×|GN(s)∩GN(t)|

 

|GN(s)| 是字符串 s 的 N-Gram集合,N 值一般取2或者3,假設N=2爲例對字符串Gorbachev和Gorbechyov進行分段:

 

距離:8 + 9 − 2 × 4 = 9

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章