各種工具包的有效利用可以使研究者事半功倍。
以下是NLP版版友們提供整理的NLP研究工具包。
同時歡迎大家提供更多更好用的工具包,造福國內的NLP研究。
*NLP Toolbox
CLT http://complingone.georgetown.edu/~linguist/compling.html
GATE http://gate.ac.uk/
Natural Language Toolkit(NLTK) http://nltk.org
MALLET http://mallet.cs.umass.edu/index.php/Main_Page
OpenNLP http://opennlp.sourceforge.net/
*English Stemmer
Snowball http://snowball.tartarus.org/
*English POS Tagger
Stanford POS Tagger http://nlp.stanford.edu/software/tagger.shtml
TreeTagger http://www.ims.uni-stuttgart.de/projekte/corplex/TreeTagger/
TnT http://www.coli.uni-saarland.de/~thorsten/tnt/
*English&Chinese Parser
Stanford Parser http://nlp.stanford.edu/software/lex-parser.shtml
Berkeley Parser http://nlp.cs.berkeley.edu/Main.html#Parsing
*English Keyphrase Extractor
KEA http://www.nzdl.org/Kea/index_old.html
*English Name Entity Recognizer
Stanford NER http://nlp.stanford.edu/software/CRF-NER.shtml
*Chinese Word Segmentator
中科院ICTCLAS http://www.nlp.org.cn/project/project.php?proj_id=6
Stanford Word Segmenter http://nlp.stanford.edu/software/segmenter.shtml
*Topic Modeling Tools
Matlab http://psiexp.ss.uci.edu/research/programs_data/toolbox.htm
GibbsLDA++ http://gibbslda.sourceforge.net/
GLDA http://code.google.com/p/glda/
*Conditional Random Fields
FlexCRFs http://flexcrfs.sourceforge.net/ 含有MPI並行版本。
CRF++ http://crfpp.sourFceforge.net/
CRF Package http://crf.sourceforge.net/
CRF Matlab http://www.cs.ubc.ca/~murphyk/Software/CRFall.zip
CRFSuit http://www.chokkan.org/software/crfsuite/
SGD with CRF http://leon.bottou.org/projects/sgd
HCRF http://sourceforge.net/projects/hcrf/
*Support Vector Machine
LIBSVM http://www.csie.ntu.edu.tw/~cjlin/libsvm/
LIBLINEAR http://www.csie.ntu.edu.tw/~cjlin/liblinear/
Pegasos http://www.cs.huji.ac.il/~shais/code/index.html
*Search Engines
Lucene http://lucene.apache.org/
中科院FirteX http://www.firtex.org/
*Machine Learning and Data Mining Toolbox
Weka http://www.cs.waikato.ac.nz/ml/weka/
NLP常用工具
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章
初學者如何查閱自然語言處理(NLP)領域學術資料
summer.lei
2018-08-27 19:35:36
循環之始---我可憐的莫比烏斯之旅
scauhito
2018-08-27 18:13:14
Keras入門之一: Hello Keras on MNIST 第一個例子-手寫數字識別
菲斯奇
2018-08-27 18:13:02
DeepNLP結合CRF++的簡明實踐筆記和WordCloud詞雲使用
菲斯奇
2018-08-27 18:13:02
NLP之Seq2Seq
笨拙的石头
2018-08-27 17:48:01
word2vec模型
Kavin_Liang
2018-08-27 17:35:04
理解LSTM網絡
Kavin_Liang
2018-08-27 17:34:44
Brown Clustering算法和代碼學習
Bruce_Sun_
2018-08-27 17:16:31
自然語言處理相關學習資料
enoying
2018-08-27 13:25:24
SVD解線性方程組(非齊次)
玄霜
2018-08-27 12:58:06
中文分詞:MMSEG
玄霜
2018-08-27 12:57:52
長短期記憶網絡(Long Short-Term Memory,LSTM)及其變體雙向LSTM和GRU
陶将
2018-08-27 12:43:12