【ElasticSearch】 二、IK 分詞器部署和使用

目錄

一、IK 分詞器介紹

二、IK 分詞器安裝和使用

2.1 IK 分詞器安裝

2.2 IK 分詞器測試

2.2.1 ik_smart 最粗粒度拆分

2.2.2 ik_max_word 最細粒度拆分

2.3 自定義分詞

2.4 定義敏感詞禁用


一、IK 分詞器介紹

ElasticSearch 自帶有分詞器,但在中文方面分詞效果並不理想,這時候就需要使用 IK 分詞器對中文語句進行更好的分段。

 

二、IK 分詞器安裝和使用

2.1 IK 分詞器安裝

IK分詞器下載:

https://github.com/medcl/elasticsearch-analysis-ik/releases

找到與 elasticsearch 版本對應的 ik 分詞器版本

將下載的壓縮包上傳到服務器的對應目錄下,解壓並改名爲 ik

# 解壓壓縮包
unzip elasticsearch-analysis-ik-5.6.8.zip

# 重命名
mv elasticsearch ik

將 ik 目錄拷貝到 elasticsearch 容器中的 plugins 目錄下

docker cp ./ik tom_elasticsearch:/usr/share/elasticsearch/plugins

 

2.2 IK 分詞器測試

2.2.1 ik_smart 最粗粒度拆分

http://192.168.47.142:9200/_analyze?analyzer=ik_smart&pretty=true&text=%E6%88%91%E6%98%AF%E5%A4%A7%E5%85%83%E5%AE%9D

  

 

2.2.2 ik_max_word 最細粒度拆分

http://192.168.47.142:9200/_analyze?analyzer=ik_max_word&pretty=true&text=%E6%88%91%E6%98%AF%E5%A4%A7%E5%85%83%E5%AE%9D

 

2.3 自定義分詞

# 進入 elasticsearch 容器
docker exec -it tom_elasticsearch /bin/bash

# 進入配置文件目錄
cd /usr/share/elasticsearch/plugins/ik/config

創建自定義文件

# 創建自定義文件
vim myCustom.dic

修改 IK 分詞器的配置文件

vim IKAnalyzer.cfg.xml

  

保存文件並重啓 elasticsearch 容器

docker restart tom_elasticsearch

測試:

http://192.168.47.142:9200/_analyze?analyzer=ik_smart&pretty=true&text=我是大元寶

2.4 定義敏感詞禁用

# 進入 elasticsearch 容器
docker exec -it tom_elasticsearch /bin/bash

# 進入配置文件目錄
cd /usr/share/elasticsearch/plugins/ik/config

創建自定義文件

# 創建自定義文件
vim myDisabled.dic

  

修改 IK 分詞器的配置文件

vim IKAnalyzer.cfg.xml

  

保存文件並重啓 elasticsearch 容器

docker restart tom_elasticsearch

測試:

http://192.168.47.142:9200/_analyze?analyzer=ik_smart&pretty=true&text=宇宙

 

  

 

 

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章