Postgresql中文分詞zhparser學習(一)

1.準備工作  

Postgresql安裝中文分詞庫此次使用SCWS以及zhparser,所以需要先準備好這兩個安裝包。

1.1 下載SCWS

下載地址:http://www.xunserch.com/scws/down/scws-1.2.2.tar.bz2

1.2 下載zhparser

下載地址:https://github.com/amutu/zhparser/archive/master.zip

1.3 上傳安裝包

進入postgres安裝目錄下,使用命令mkdir scws建一個和postgres的同級目錄scws;

使用ftp工具將本地下載的SCWS和zhparser的安裝包上傳到服務器的scws目錄下。

如果服務可以連通外網,可以直接使用curl和git命令,直接下載到服務器上。

2.安裝SCWS

2.1 解壓安裝

步驟:
[root@db1 soft]# tar xvf scws-1.2.2.tar.bz2
[root@db1 soft]# cd scws-1.2.2
[root@db1 scws-1.2.2]# ./configure
[root@db1 scws-1.2.2]# make install
如果安裝時報gcc的錯誤,需要先在服務器上安裝gcc, zypper install gcc

2.2 查看scws安裝是否成功

[root@db1 soft]# ls /usr/local/include/scws
charset.h crc32.h darray.h darray.h pool.h rule.h scws.h version.h xbd.h xdict.h xtree.h

3.安裝zhparser

3.1 修改環境變量

修改文件profile
系統用戶登錄服務器 su - root
編輯服務器profile文件 vim /etc/profile,進入編輯狀態後按下i或者insert
新增Postgresql的Home目錄(安裝目錄)和Bin目錄的配置:
PG_HOME=/opt/data/postgresql/9.5
PG_BIN=/opt/data/postgresql/9.5/bin
將PG_BIN加入到PATH中 :$PG_BIN
將PG_HOME和PG_BIN加入到export環境變量中 $PG_HOME $PG_BIN
保存並退出 :wq!
驗證配置變量是否生效: echo $PG_HOME

3.2 編譯和安裝zhparser

步驟(以下步驟使用root用戶執行)
解壓zhparser安裝包: unzip zhparser-master.zip
進入到解壓後的zhparser目錄: cd zhparser-master
編譯和安裝zhparser: SCWS_HOME=/usr/local make&&make install
這個時候還沒有擴展目錄extension: ll /opt/data/postgresql/9.5/share

3.3 安裝zhparser的擴展extension

3.3.1 登陸後臺數據庫
切換系統用戶: su - postgres
登陸數據庫: psql -U user -d dbname
3.3.2 創建extension
創建extension: create extension zhparser;
創建搜索規則名稱: CREATE TEXT SEARCH CONFIGURATION testzhcfg(parser=zhparser);
創建搜索分詞映射規則:CREATE TEXT SEARCH CONFIGURATION testzhcfg ADD MAPPING FOR n,v,a,i,e,l WITH simple;

這樣就安裝好了一箇中文分詞的擴展,然後就可以測試中文分詞搜索了。


發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章