python 使用sklearn計算TF-IDF權重

1.通過os.listdir()函數獲取指定目錄下的文件名list

2.對文件使用jieba進行分詞並提取topK作爲關鍵詞

3.使用sklearn計算每一個文本中所有關鍵詞的權重(文本中沒有的詞權重爲0)

4.參考鏈接:

http://blog.csdn.net/zhzhl202/article/details/819710

http://www.it165.net/pro/html/201407/17648.html

發佈了32 篇原創文章 · 獲贊 55 · 訪問量 64萬+
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章