6個最高效的語言處理Python庫，你用過幾個？

原創

qq5bf014d562391

2019-02-22 20:59

最近一段時間Python已經成爲數據科學行業中大火的編程語言，今天技術學派收集了一些較爲高效的語言處理Python庫。下面分享給大家。

1.NLTK

NLTK是構建Python程序以處理人類語言數據的領先平臺。它提供了易於使用的界面，以及用於分類、標記化、詞幹化、標記、分析和語義推理的一套文本處理庫。用於工業強度NLP庫的包裝器。

在這裏還是要推薦下我自己建的Python開發學習羣:483546416，羣裏都是學Python開發的，如果你正在學習Python ，小編歡迎你加入，大家都是軟件開發黨，不定期分享乾貨（只有Python軟件開發相關的），包括我自己整理的一份2018最新的Python進階資料和高級開發教程，歡迎進階中和進想深入Python的小夥伴

2.Pattern

Pattern是Python編程語言的Web挖掘模塊。它多有用於數據挖掘、自然語言處理、機器學習網絡分析和

可視化。

3.Jieba

“結巴”中文分詞：做最好的 Python 中文分詞組件。精確模式，試圖將句子最精確地切開，適合文本分析；全模式，把句子中所有的可以成詞的詞語都掃描出來, 速度非常快，但是不能解決歧義；搜索引擎模式，在精確模式的基礎上，對長詞再次切分，提高召回率，適合用於搜索引擎分詞。

4.TextBlob

TextBlob是一個用於處理文本數據的Python庫。它提供了一個簡單的API用於常見的自然語言處理（NLP）任務，如詞性標註，名詞短語提取，情感分析，分類，翻譯等。

5.SnowNLP

SnowNLP是一個python寫的類庫，可以方便的處理中文文本內容，是受到了TextBlob的啓發而寫的，由於現在大部分的自然語言處理庫基本都是針對英文的，於是寫了一個方便處理中文的類庫，並且和TextBlob不同的是，這裏沒有用NLTK，所有的算法都是自己實現的，並且自帶了一些訓練好的字典。注意本程序都是處理的unicode編碼，所以使用時請自行decode成unicode。

6.TextGrocery

TextGrocery是一個基於LibLinear和結巴分詞的短文本分類工具，特點是高效易用，同時支持中文和英文語料。

分享 IT 技術和行業經驗，請關注微信公衆號：程序員大牛，每天分享乾貨！

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

6個最高效的語言處理Python庫，你用過幾個？

[轉帖]使用NMT和pmap解決JVM資源泄漏問題原創

Python實現大麥網搶票的四大關鍵技術點解析

Python 安裝庫指令大全

salesforce零基礎學習（一百三十八）零碎知識點小總結（十）

一款開源的.NET程序集反編譯、編輯和調試神器

關於接口協議，你必須要知道這些！

【2024-05-21】以茶會友

新思路，10分鐘帶你瞭解Python！

Python那些事——你不知道的python的“獨門暗器”！

不是你學不會Python，只說你的學習方法不對！那如何學習Python呢

史上最全的Python開發祕籍，學完這些年薪百萬不是問題

Python那些事——你不知道的python的“獨門暗器”！

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結