python非參數檢驗

def Wilcoxon_signes_rank_test(samp,mu0=0):
    temp=pd.DataFrame(np.asarray(samp),columns=['origin_data'])
    temp['D']=temp['origin_data']-mu0
    temp['rank']=abs(temp['D']).rank()
    posW=sum(temp[temp['D']>0]['rank'])
    negW=sum(temp[temp['D']<0]['rank'])
    n=temp[temp['D']!=0]['rank'].count()
    z=(posW-n*(n+1)/4)/np.sqrt((n*(n+1)*(2*n+1))/24)
    p = (1-stats.norm.cdf(abs(z)))*2
    return z , p

Wilcoxon_signed_rank_test(water['net'],mu0=600)

# 也可以statsmodels.stats.descriptivestats中sign_test

分佈的檢驗

K-S檢驗H0：F(X)=F0(X)

檢驗樣本數據是否服從某個分佈

stats.kstest(ks['observation'],'norm',args=(ks['observation'].mean(),ks['observation'].std()))
stat.anderson(ks['observation'],dist='norm')
stats.shapiro(ks['observation'])

遊程檢驗

H0：總體變量的取值是隨機的

連續變量需要看是否大於均值/中位數進行截斷

sm.stats.runstest_lsamp(asarray(runs['economics']),cutoff='median'/'mean')

兩樣本的非參數檢驗

獨立樣本中位數（均值）檢驗【Mann-Whitney-Wilcoxon檢驗or Wilcoxon秩和檢驗】

H0：兩個獨立樣本的中位數相等

合併樣本n1/n2之後得到秩，然後得到第一、二個樣本的秩和W1、W2，如果差異大，則拒絕原假設

stats.ranksums(sales_district[sales_district['district']==1]['sales'],
                sales_district[sales_district['district']==2]['sales'])
stats.mannwhitneyu(sales_district[sales_district['district']==1]['sales'],
                sales_district[sales_district['district']==2]['sales'],
                alternative='two-sided')

獨立樣本的分佈檢驗

檢驗樣本所來自的總體分佈是否相同

H0：F1(x)=F2(x)

stats.ks_2samp(café_scale[café_scale['city']==1]['computers'],
                café_scale[café_scale['city']==2]['computers'])

配對樣本中位數的檢驗

先變成兩者之差，然後利用wilcoxon檢驗去做

stats.wilcoxon(happiness['Year2015'],happiness['Year2016'])

兩樣本遊程檢驗

檢驗兩樣本數據是否來自於同一總體分佈

sm.stats.runstest_2samp(asarray(runs['economics'].astype('float64'),
                        asarray(runs['statistics'].astype('float64'))
sm.stats.runstest_2samp(asarray(runs['score'].astype('float64'),
                        groups=asarray(runs['group'])

多個樣本的非參數檢驗

多個樣本的分佈檢驗

檢驗各樣本數據是否來自同一主體

G=ksampledis['class'].unique()
args=[]
for I in list(G):
    args.append(array(ksampledis['class']==I]['statistics_score']))
stats.anderson_ksamp(args)

獨立樣本位置的檢驗

stats.kruskal(*args)
stats.median_test(*args)

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

python非參數檢驗

單樣本非參數檢驗

中位數（均值）檢驗【wilcoxon符號值秩檢驗】

分佈的檢驗

遊程檢驗

兩樣本的非參數檢驗

獨立樣本中位數（均值）檢驗【Mann-Whitney-Wilcoxon檢驗or Wilcoxon秩和檢驗】

獨立樣本的分佈檢驗

配對樣本中位數的檢驗

兩樣本遊程檢驗

多個樣本的非參數檢驗

多個樣本的分佈檢驗

獨立樣本位置的檢驗

釘釘打卡速度慢

Nginx R31 doc 官方文檔-01-nginx 如何安裝

Python 潮流週刊#51：用 Python 繪製美觀的圖表

Qt/C++音視頻開發74-合併標籤圖形/生成yolo運算結果圖形/文字和圖形合併成一個/水印濾鏡

挑戰程序設計競賽 2.2章習題 POJ - 3617 Best Cow Line 貪心

字節面試：MySQL什麼時候鎖表？如何防止鎖表？

.NET8連接SQL SERVER 2008 R2 報：證書鏈是由不受信任的頒發機構頒發的

golang開發環境搭建(win10)

python計算機視覺學習筆記——PIL庫的用法

Golang初學：獲取程序內存使用情況，std runtime

多個left join的疑問

異常檢測實戰

時間序列流程

python非參數檢驗

從組合中估計概率

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結