假設檢驗中的 p 值
Traumereiisun 期待你的讚賞 & 解答(本文中紅色字體)哦!@_@
(2)拒絕原假設的最小顯著性水平。
邏輯
說明與致謝
參考文獻:
假設檢驗,顯著性水平,p-value
統計學假設檢驗中 p 值的含義具體是什麼?知乎回答
基本定義: 值 + 顯著性水平 + + 勢
值 :
(1)一種概率:在原假設爲真的前提下,所得樣本的觀察結果 + 更極端情況出現的概率。
(2)拒絕原假設的最小顯著性水平。
顯著性水平 在定義中就是“拒絕原假設”,而且由於顯著性水平是犯第一類錯誤的概率,所以 的取值應該越小越好啊!爲什麼還存在最小 ???
(3)觀察到的(實例的)顯著性水平。
(4)表示對原假設的支持程度,用於確定是否應該拒絕原假設的另一種方法。
顯著性水平 (犯第1類錯誤的概率):
在原假設爲真的條件下,拒絕原假設 的概率,
(犯第2類錯誤的概率):
在原假設爲假的條件下,接受原假設 的概率,
檢驗功效 、勢、power :
在原假設爲假的條件下,拒絕原假設 的概率,
理解 值
例子一
某生產線上,葡萄糖的淨重是一個隨機變量,服從某種分佈。當機器正常工作時,均值是 0.5kg,標準差是 0.015kg。隨機抽樣9袋,淨重爲:判斷機器是否正常?
解:假設檢驗
Way One:
. 列出假設 抽樣樣本 ,均值
分析:
由於樣本均值是總體均值的無偏估計,當原假設成立時,樣本均值應該與 很接近,即 要足夠小。 換句話說,在 成立的條件下,選定一個常數 有
根據中心極限定理,樣本均值近似服從正態分佈,即 因此,(1) 式可以改寫爲
當 時,
. 選擇統計量
. 確定拒絕域
. 帶入樣本數據
因爲樣本數據落入拒絕域,所以拒絕原假設。
Way Two: P-value
分析:
根據 值的定義(1):
一種概率:在原假設爲真的前提下,所得樣本的觀察結果 + 更極端情況出現的概率。 該 值小於 值,
拒絕原假設。因爲 值這麼小的概率都發生了,所以有理由拒絕原假設。(原則:小概率事件在一次觀察中可以認爲基本上不會發生。)
. 列出假設
. 選擇統計量
. 確定拒絕域
. 帶入樣本數據,計算 值
. 比較 值與 的大小: 拒絕原假設
例子二
代碼
編寫求 值的 P_value.R 文件:
P_value<-function(cdf,x,paramet=numeric(0),side=0){
n<-length(paramet)
P<-switch(n+1,
cdf(x),
cdf(x,paramet),
cdf(x,paramet[1],paramet[2]),
cdf(x,paramet[1],paramet[2],paramet[3])
)
if (side<0) P # 左側,分佈函數形式
else if (side>0) 1-P # 右側,1-分佈函數形式
else
if (P<1/2) 2*P
else 2*(1-P)
}
編寫求正態總體的均值檢驗,mean.test1.R 文件:
# 正態總體的均值檢驗
# 雙邊檢驗,side=0
# 左側單邊檢驗,side<0,備擇假設爲mu<mu_0
# 右側單邊檢驗,side>0,備擇假設爲mu>mu_0
# 拒絕域形式與備擇假設形式相同
mean.test1<-function(x,mu=0,sigma=-1,side=0){
# mu是原假設的mu_0
source("P_value.R")
n<-length(x); xb<-mean(x)
if (sigma>0){
# sigma方差已知
z<-(xb-mu)/(sigma/sqrt(n))
# 統計量服從自由度爲n的標準正態分佈
P<-P_value(pnorm,z,side=side)
data.frame(mean=xb,df=n,Z=z,P_value=P)
}
else{
t<-(xb-mu)/(sd(x)/sqrt(n))
# 統計量服從自由度爲n-1的t分佈
P<-P_value(pt,t,paramet=n-1,side=side)
data.frame(mean=xb,df=n-1,T=t,P_value=P)
}
}
結果:
已知 16 只元件的壽命,問:是否有理由認爲元件的平均壽命大於 225 小時?
假設檢驗:該問題是右側單邊檢驗:拒絕域與 形式相同。
> source('E:/R/RStudiowork/mean.test1.R')
> X<-c(159, 280, 101, 212, 224, 379, 179, 264, 222, 362, 168, 250, 149, 260, 485, 170)
> mean.test1(X,mu=225,side=1)
mean df T P_value
1 241.5 15 0.6685177 0.2569801
P_value = 0.2569801 > 0.05,不能拒絕原假設,接受 ,元件的平均壽命不大於 225 小時。