NLTK中使用Stanford parser

原創

2020-02-26 05:28

原文鏈接：http://blog.csdn.net/qq_19670461/article/details/42681551

nltk工具包中有一個用於自然語言句法分析的文件夾parse（地址C:\Python27\Lib\site-packages\nltk\parse\stanford.py）。其中stanford.py就是我們要用的stanford parser的源文件，這裏面有parser的接口，直接使用可以進行最簡單的句法分析。

步驟
1.下載stanford最新版本,最新版本爲stanford-parser-full-2014-10-31。下載地址:http://nlp.stanford.edu/software/lex-parser.shtml#Download。
2.打開下載好的壓縮包，進入/edu/stanford/nlp/models/lexparser/,找到englishPCFG.ser.gz 並解壓到某處（比如我的地址爲E:/stanford-parser-full-2014-10-31/stanford-parser-3.5.0-models/edu/stanford/nlp/models/lexparser/englishPCFG.ser.gz）。
3.新建jars文件夾（比如我的地址爲E:/jars），將stanford文件夾中的stanford-parser.jar, stanford-parser-3.4.1-sources.jar， stanford-parser-3.4.1-javadoc.jar拷貝進來。
4.執行代碼查看結果。

import os
from nltk.parse import stanford

#添加stanford環境變量,此處需要手動修改，jar包地址爲絕對地址。
os.environ['STANFORD_PARSER'] = 'E:/jars/stanford-parser.jar'
os.environ['STANFORD_MODELS'] = 'E:/jars/stanford-parser-3.5.0-models.jar'


#爲JAVAHOME添加環境變量
java_path = "C:/Program Files (x86)/Java/jdk1.8.0_11/bin/java.exe"
os.environ['JAVAHOME'] = java_path

#句法標註
parser = stanford.StanfordParser(model_path="E:/stanford-parser-full-2014-10-31/stanford-parser-3.5.0-models/edu/stanford/nlp/models/lexparser/englishPCFG.ser.gz")
sentences = parser.parse_sents("Hello, My name is Melroy.".split(), "What is your name?".split())
print sentences

# GUI
for sentence in sentences:
    sentence.draw()

參考
http://stackoverflow.com/questions/13883277/stanford-parser-and-nltk

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

NLTK中使用Stanford parser

自學編程兩個月，現在我月入 4 萬元

Google Chrome驅動程序 124.0.6367.62（正式版本）去哪下載？

Apache本地可以顯示外網不可以

django1.7靜態文件配置（css/js/img)

github 多人協作

C++調用python：無參數，簡單helloworld示例

隨機模擬與採樣方法

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結