對於Term詞典,其實規模並沒有大到當前的內存空間不能接受。英文詞彙量一共也就幾萬,中文也類似,所佔有的存儲空間並不大。dragonToolkit是用有序鏈表存儲Term詞典的。這個確實是沒有FST查詢效率高的。
Lucene爲什麼採用FST結構呢?爲了滿足模糊查詢的要求。滿足前綴查詢、模糊查詢、正則表達式查詢。
Lucene爲什麼採用FST?爲了模糊查詢
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章
Android C++系列:JNI調用時的異常處理
轻口味
2021-11-19 10:03:53
國內最大的C++軟件項目之一,WPS的“自守”之道
罗燕珊
2021-10-28 14:23:59
談 C++17 裏的 Memento 模式
hedzr
2021-10-18 14:13:51
談 C++17 裏的 State 模式之二
hedzr
2021-10-12 21:03:51
英特爾最新版C/C++編譯器採用LLVM架構,性能提升明顯
James R Reinders
2021-09-17 10:48:52
C++實用指南
Bartlomiej Filipek
2021-07-22 10:03:58
編程語言巔峯之戰,誰纔是真正的王者?| InfoQ編程語言排行榜
田晓旭
2021-07-20 11:43:51
SpaceX龍飛船性能要求嚴苛,軟件開發存挑戰
凌敏
2021-05-14 13:43:55
縱觀20年間國外碼農的薪酬變化:漲幅下降,初級編碼崗大幅消失
NICOLE KOW
2021-03-22 18:35:29
用戶案例|向量引擎在攜程酒店搜索中的應用場景和探索
加入 Zilliz AI 初創計劃 Zilliz AI 初創計劃是面向 AI 初創企業推出的一項扶持計劃,預計提供總計 1000 萬元的 Zilliz Cloud 抵扣金,致力於幫助 AI
原創
2024-03-15 15:54:11
2024 年,向量數據庫的性能捲到什麼程度了?
原創
2024-02-22 21:27:05
語言大模型的現狀與未來趨勢
原創
2024-02-22 12:33:56
快速上手Tampermonkey(篡改猴aka油猴腳本)
原創
2023-12-12 21:40:03