中文分詞軟件SCWS

windows下安裝SCWS的中文擴展:

  1. 去官網下載php_scws.dll(PHP-5.2.x根據php版本選擇) 、XDB 詞典文件(簡體中文(UTF-8)可選gbk,也可以把兩個詞典文件都下載)、規則集文件(rules.tgz

  2. 創建c:\Program Files\scws(建議)目錄,吧XDB、和規則文件解壓後的文件都拷貝到該目錄中

  3. 把php_scws.dll文件拷貝到php安裝目錄的\ext\下

  4. 在php.ini(通常在c盤下)加入以下幾行:

[scws]

extension = php_scws.dll

scws.default.charset = utf8 scws.default.fpath = "c:/Program Files/scws"

5. 最後重啓Apache,進入phpinfo,若找到scws擴展信息說明安裝成功


測試:

<?php
    $pscws = scws_new();        //建立scws對象
        //發送要分詞的文本
    $pscws->send_text('中文文本在計算分析中一個問題是中文文本在印刷時缺少單詞的邊界');
        //獲取分詞結果,以關聯數組形式返回
    $some = $pscws->get_result();
    print_r($some);
        //獲取詞頻排在前5的詞,該數組同時包含idf
    $tops = $pscws->get_tops(5, 'n,v');
    print_r($tops);
        $scws->close();      //關閉釋放資源
?>


官網的安裝步驟有些讓人摸不着頭腦,建議別去看

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章