在進行數據分析處理的過程中,經常需要判斷數據是否符合正太分佈,正常的正太分佈檢驗費時費力,本文介紹如何通過python快速實現對正太分佈的檢驗:
前方高能!!!看如何一行代碼實現數據的正太分佈檢驗
from scipy import stats
# scipy包是一個高級的科學計算庫,它和Numpy聯繫很密切,Scipy一般都是操控Numpy數組來進行科學計算
data = [-15, 15, 9]#需要檢驗的數據
stats.kstest(data, 'norm') #正太分佈檢驗
輸出:
Out[24]: KstestResult(statistic=0.66666666666666674, pvalue=0.074074074074073959)
輸出結果分析
statistic爲KS統計量,pvalue 爲P值,當pvalue > 0.05時,服從正太分佈
函數詳解:
kstest(rvs, cdf, args=(), N=20, alternative='two-sided', mode='approx')
參數是:
rvs:待檢驗數據。
cdf:檢驗分佈,kstest分佈可以檢驗多種分佈函數,例如'norm'正太分佈,'expon'指數分佈,'rayleigh'瑞利分佈,'gamma'伽瑪分佈等分佈,設置爲'norm'時表示正態分佈。
alternative:默認爲雙側檢驗,可以設置爲'less'或'greater'作單側檢驗。
model:'approx'(默認值),表示使用檢驗統計量的精確分佈的近視值;'asymp':使用檢驗統計量的漸進分佈。