詞雲生成工具wordcloud中文顯示

wordcloud主要的使用就是下面三行代碼

from wordcloud import WordCloud
wc = WordCloud(font_path=font_path, scale=1, collocations=False, background_color='white', width=400, height=300)
wc.generate_from_frequencies(count_dict)  # 這裏傳入的是一個詞頻字典,也可以傳入分好詞的字符串
img = wc.to_image() # img是PIL的Image對象,可以通過.tobytes()生成圖片的二進制數據

WordCloud可以設置很多選項,當文本爲中文會發現生成的詞雲圖爲框框,需要通過font_path加載一個字體文件,通常windows自帶字體文件,我們也可以從 git字體庫下載,通過font_path路徑傳入即可。

關於分詞和生成詞雲圖的代碼,可以參考一下官網代碼 用中文創建wordcloud

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章