在使用Python強大的第三方庫nltk進行一些自然語言處理工作的時候遇到了一些困難,折騰一番總算解決。現在在這裏記錄一下,當作備忘。
網上找到挺多安裝nltk的教程,但經測試,好像都是適用於Python2的,對於Python3,就勉爲其難了。這裏的主要問題是,前輩們分享的nltk_data包是不兼容Python3的。
所以我的解決方案是:
到https://github.com/nltk/nltk_data下載gh-pages分支,裏面的Packages就是我們要的資源。(注:截至2016年3月24日時本方案仍有效)
詳細情況記錄如下:
1.安裝nltk。截至今天,安裝的是nltk3.2,在有pip這些工具的情況下,安裝這些庫變得非常簡單:
pip install nltk
另外官方的安裝說明還附帶了numpy,一個“賽Matlab的Python開源的數值計算擴展庫”,說不定以後用得上:
pip install numpy