mmseg有三種模式:maxword方法,simple方法,complex方法
三種模式的區別:
1,maxword方法:儘量分解成更多的詞(詞長最小)
比如:“我要去中國政府工作”
分解結果: 我要, 要去, 中國, 政府, 工作
2,simple方法:簡單的正向最大匹配,按照能匹配上的最長詞做切分
比如:“我要去中國政府工作”
分解結果: 我要去, 中國政府, 工作
比如:“研究生命起源”
分解結果:研究生,命,起源
3,complex方法: 在上面simple的基礎上,用消除歧義的規則進行過濾
比如:“研究生命起源”
分解結果:研究,生命,起源
消除歧義的規則介紹參照:
https://blog.csdn.net/daniel_ustc/article/details/50488040