wordcloud主要的使用就是下面三行代碼
from wordcloud import WordCloud
wc = WordCloud(font_path=font_path, scale=1, collocations=False, background_color='white', width=400, height=300)
wc.generate_from_frequencies(count_dict) # 這裏傳入的是一個詞頻字典,也可以傳入分好詞的字符串
img = wc.to_image() # img是PIL的Image對象,可以通過.tobytes()生成圖片的二進制數據
WordCloud
可以設置很多選項,當文本爲中文會發現生成的詞雲圖爲框框,需要通過font_path
加載一個字體文件,通常windows自帶字體文件,我們也可以從 git字體庫下載,通過font_path
路徑傳入即可。
關於分詞和生成詞雲圖的代碼,可以參考一下官網代碼 用中文創建wordcloud