用pandas實現固定區間的數據頻數統計(pd.cut,pd.Series)

蒐羅了一圈,終於找到了能夠實現目的的代碼

目標:對一組序列進行頻數的統計,畫出來就像hist,不過我要的是每個bin和對應的數據而不是圖,而生成固定區間,我好進行後面的比值對比


首先具有數據分類功能的有:
groupby:分組
count :統計某個元素的頻數
unique:不重複的元素
找到最接近的就是np.histogram()
而最終找到方法學習自
這位大神的博客
受教了受教了

a=pd.cut(data_l22_times[0]['Times'],[0,2000,3000,4000,5000,10000,50000],labels=[2000,3000,4000,5000,10000,50000])#先按固定的區間分箱,我沒用qcut,用的cut不知道什麼區別,但是都能用
a=pd.Series(a, name='Times')
results=pd.Series(data_l22_times[0]['Times']).groupby(a).agg(['count']).reset_index()#groupby提取彙總統計值

結果如下:
在這裏插入圖片描述
接下來繼續愉快地進行後續的操作。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章