以下方案,是根據實踐總結的基於NEO4J的全文檢索解決方案,各有優缺點,僅供參考。以下總結全部基於neo4j-3.4.9版本,至於升級到3.5.x之後的版本索引有了大幅提升,還未做測試。
一、有大量存量數據(億級以上)(並長期有增量數據進入)
1、使用NEO4J + ELASTICSEARCH
二、無大量存量數據或者少量存量數據(或全部爲增量數據)
1、建立全文檢索之後,設置索引同步更新即可(對於大量數據的索引重建比較費時)。
2、建立全文檢索之後(使用自定義支持中文的全文索引過程),設置增量入庫數據同步更新到索引即可(索引的重建如果做不好優化將會比較費時)。
三、架構方案選擇優先級
方案選用優先級:
1、紅色(自帶功能更便捷,對於中文檢索的支持較差)
2、藍色(檢索服務更完備但是需要額外安裝維護全文檢索服務)
3、綠色(檢索結果更可控精準可自主研發,優化具有一定的難度)