Python統計小說中出場人物詞頻

原創

2020-06-26 10:40

# 選擇喜歡的小說，統計出場人物詞頻排名
import jieba
excludes = {"人馬","都督","後主","軍馬","主公", "孔明曰","左右","東吳",\
"於是","知道","衆將","大喜","二人", "玄德曰","天下",\
"軍士","引兵","陛下","次日", "丞相","如此","商議","魏兵",\
"只見","今日","卻說","不是", "將軍","不可","不能","荊州",\
"不知","這個","如何","一人","漢中","蜀兵","不敢","大叫",}
f = open("三國演義.txt", "r")
txt = f.read()
f.close()
words = jieba.lcut(txt)
counts = {}
for word in words:
if len(word) == 1: #排除單個字符的分詞結果
continue
else:
counts[word] = counts.get(word,0) + 1
for word in excludes:
del(counts[word])
items = list(counts.items())
items.sort(key=lambda x:x[1], reverse=True)
for i in range(15):
word, count = items[i]
print ("{0:<10}{1:>5}".format(word, count))

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

python繪製一個邊長爲200的太陽花

# python繪製一個邊長爲200的太陽花 import turtle turtle.color("red","yellow") turtle.begin_fill() for i in range(36): turtle.fd

2020-06-28 22:16:05

統計不同字符的個數。用戶從鍵盤輸入一行字符，編寫一個程序，統計並輸出其中的英文字符、數字、空格和其他字符的個數。

#統計不同字符的個數。用戶從鍵盤輸入一行字符，編寫一個程序，統計並輸出其中的英文字符、數字、空格和其他字符的個數。 s=input("請輸入一行字符：\n") alpha,num,space,other=0,0,0,0 for i in

2020-06-26 10:40:47

假設有一個英文文本文件，編寫一個程序讀取其內容並將裏面的大寫字母變成小寫字母，小寫字母變成大寫字母

假設有一個英文文本文件，編寫一個程序讀取其內容並將裏面的大寫字母變成小寫字母，小寫字母變成大寫字母。 ********************************************************************

2020-06-26 10:40:45

Python求兩個整數的最大公約數和最小公倍數

#獲取兩個整數，求這兩個整數的最大公約數和最小公倍數。最大公約數計算一般使用輾轉相除法，最小公倍數計算則使用兩個數##的乘積除以最小公倍數。 s1=int(input("請輸入第一個整數：")) s2=int(input("請輸入第二個整

2020-06-26 10:40:45

You are using pip version 9.0.1, however version 19.2.3 is available. You should consider upgrading

You are using pip version 9.0.1, however version 19.2.3 is available.You should consider upgrading via the 'python -m p

2020-06-26 10:40:45

編寫一個程序，對給定字符串中出現的全部字符（含中文字符）頻率，進行分析，採用降序輸出。

Python編寫一個程序，中文字符頻率統計。編寫一個程序，對給定字符串中出現的全部字符（含中文字符）頻率 ##進行分析，採用降序輸出。 txt=input("請輸入一段文本：\n") counts={} for i in txt:

2020-06-26 10:40:45

輸入一個文件和一個字符，統計該字符在文件中出現的次數

輸入一個文件和一個字符，統計該字符在文件中出現的次數 *********************************************************************** def times(filename,c

2020-06-26 10:40:45

Python第三方庫的獲取和安裝

Python第三方庫安裝方式主要有三種：1.pip工具安裝；2.自定義安裝；3.文件安裝。 1.pip工具安裝 pip安裝需要聯網，默認從網絡上載pygame庫安裝文件並自動安裝到系統中。通過pip可以安裝超過95%以上的第三方庫。在Ma

2020-06-26 10:40:45

Python隨機密碼生成

##隨機密碼生成。編寫程序在26個字母大小寫和9個數字組成的列表中隨機生成10個8位密碼。 ****************************************************************** import

2020-06-26 10:40:44

pycharm創建Django工程

前言 python是腳本語言，不需要編譯即可直接運行，特別適合在命令行終端中使用。而在Windows這種命令行不方便的系統中使用一款優秀的IDE不僅可以格式化代碼也能夠擁有智能化的輸入提醒，從而加快開發效率。最近JetBrains官網進不

2020-06-22 07:22:21

xlwings - 報表自動換算、彙總

文章目錄需求現狀解決方案環境 & 工具主函數代碼流程圖代碼代碼打包注意事項需求 excel報表自動彙總。現狀解決方案 1.基於Python的xlwings包，完成報表數據轉換、換算、彙總。 2.使用PyInstaller

Fergus-Firechan

2020-06-14 02:08:01

詳解使用Python爬取豆瓣短評並繪製詞雲

2020-06-03 17:43:08

利用pydub和baidu語音api實現自動添加字幕

2020-06-01 12:11:10

【案例】批量處理 excel 並上載到數據庫

Fergus-Firechan

2020-05-13 22:02:30

【案例】構建動態 sql 實現查詢數據寫入 excel 模版

Fergus-Firechan

2020-05-07 09:52:50

24小時熱門文章

最新文章

最新評論文章