假設檢驗中的 p 值

假設檢驗中的 p 值
Traumereiisun 期待你的讚賞 & 解答(本文中紅色字體)哦!@_@
(2)拒絕原假設的最小顯著性水平。

邏輯

  1. 基本定義:pp 值 + 顯著性水平 α\alpha + β\beta + 勢 π\pi
    (1)pp
    (2)顯著性水平 α\alpha
    (3)β\beta
    (4)π\pi
  2. 理解 pp
    (1)例子一
    (2)例子二

說明與致謝

參考文獻:
假設檢驗,顯著性水平,p-value
統計學假設檢驗中 p 值的含義具體是什麼?知乎回答

基本定義:pp 值 + 顯著性水平 α\alpha + β\beta + 勢 π\pi

pp

(1)一種概率:在原假設爲真的前提下,所得樣本的觀察結果 + 更極端情況出現的概率。
(2)拒絕原假設的最小顯著性水平。
顯著性水平 α\alpha 在定義中就是“拒絕原假設”,而且由於顯著性水平是犯第一類錯誤的概率,所以 α\alpha 的取值應該越小越好啊!爲什麼還存在最小 α\alpha???
(3)觀察到的(實例的)顯著性水平。
(4)表示對原假設的支持程度,用於確定是否應該拒絕原假設的另一種方法。

顯著性水平 α\alpha(犯第1類錯誤的概率)

在原假設爲真的條件下,拒絕原假設 的概率,α=P(H0H0).\alpha=P(拒絕H_0 | H_0爲真).

β\beta(犯第2類錯誤的概率)

在原假設爲假的條件下,接受原假設 的概率,β=P(H0H0).\beta=P(接受H_0 | H_0爲假).

檢驗功效 π\pi、勢、power

在原假設爲假的條件下,拒絕原假設 的概率,π=1β=P(H0H0). \pi=1-\beta=P(拒絕H_0 | H_0爲假).

理解 pp

例子一
某生產線上,葡萄糖的淨重是一個隨機變量,服從某種分佈。當機器正常工作時,均值是 0.5kg,標準差是 0.015kg。隨機抽樣9袋,淨重爲:0.4970.5060.5180.5240.4980.5110.5200.5150.5120.497 \quad 0.506 \quad 0.518 \quad 0.524 \quad 0.498 \quad 0.511 \quad 0.520 \quad 0.515 \quad 0.512判斷機器是否正常?

解:假設檢驗
Way One:
Step 1Step \ 1. 列出假設H0:μ=μ0=0.5H_0: \mu=\mu_0=0.5 H0:μμ0H_0: \mu \neq \mu_0抽樣樣本 X:{x1,...,xn}X: \{x_1,...,x_n\},均值 xˉ.\bar{x}.

分析:
由於樣本均值是總體均值的無偏估計,當原假設成立時,樣本均值應該與 μ0\mu_0 很接近,即 xˉμ0|\bar{x}-\mu_0| 要足夠小。 換句話說,在 H0H_0 成立的條件下,選定一個常數 k0,k \geq 0,
P{Xˉμ0k}=α,(1) P\{ |\bar{X}-\mu_0| \geq k \}=\alpha, \tag{1} 根據中心極限定理,樣本均值近似服從正態分佈,即Xˉμ0σ/nN(0,1)\frac{\bar{X}-\mu_0}{\sigma/\sqrt{n}} \sim N(0,1) 因此,(1) 式可以改寫爲
P{Xˉμ0σ/nk}=α,(2) P\{ | \frac{\bar{X}-\mu_0}{\sigma/\sqrt{n}} | \geq k \}=\alpha, \tag{2} 80NDE5NDkwOQ==,size_16,color_FFFFFF,t_70)
α=0.05\alpha = 0.05 時,k=zα/2=1.96.k=z_{\alpha/2}=1.96.

Step 2Step \ 2. 選擇統計量
Z=Xˉμ0σ/nZ= \frac{\bar{X}-\mu_0}{\sigma/\sqrt{n}}

Step 3Step \ 3. 確定拒絕域
C={Xˉμ0σ/nk}C=\{ | \frac{\bar{X}-\mu_0}{\sigma/\sqrt{n}} | \geq k \}

Step 4Step \ 4. 帶入樣本數據 xˉ.\bar{x}.
xˉμ0σ/(n)=xˉ0.50.015/9=2.2k=1.96.|\frac{\bar{x}-\mu_0}{\sigma/\sqrt(n)}|=|\frac{\bar{x}-0.5}{0.015/\sqrt9}|=2.2 \geq k=1.96.

因爲樣本數據落入拒絕域,所以拒絕原假設。

Way Two: P-value
分析:
xˉμ0σ/n=xˉ0.50.015/9=2.2k=1.96.|\frac{\bar{x}-\mu_0}{\sigma/\sqrt{n}}|=|\frac{\bar{x}-0.5}{0.015/\sqrt9}|=2.2 \geq k=1.96. 根據 pp 值的定義(1):
一種概率:在原假設爲真的前提下,所得樣本的觀察結果 + 更極端情況出現的概率。pvalue=P(Xˉμ0σ/n2.2)=1Φ(2.2) p-value =P(|\frac{\bar{X}-\mu_0}{\sigma/\sqrt{n}}| \geq 2.2)=1-\Phi(2.2) pp 值小於 α\alpha 值,P(Xˉμ0σ/n1.96)=α=0.05.\leq P(|\frac{\bar{X}-\mu_0}{\sigma/\sqrt{n}}| \geq 1.96)=\alpha=0.05.
在這裏插入圖片描述
pvalue<α,p-value < \alpha, 拒絕原假設。因爲 pp 值這麼小的概率都發生了,所以有理由拒絕原假設。(原則:小概率事件在一次觀察中可以認爲基本上不會發生。)

Step 1Step \ 1. 列出假設
Step 2Step \ 2. 選擇統計量
Step 3Step \ 3. 確定拒絕域
Step 4Step \ 4. 帶入樣本數據,計算 pp
Step 5Step \ 5. 比較 pp 值與 α\alpha 的大小:p<α,p < \alpha, 拒絕原假設

例子二
在這裏插入圖片描述

代碼

編寫求 PP 值的 P_value.R 文件:

P_value<-function(cdf,x,paramet=numeric(0),side=0){
  n<-length(paramet)
  P<-switch(n+1,
            cdf(x),
            cdf(x,paramet),
            cdf(x,paramet[1],paramet[2]),
            cdf(x,paramet[1],paramet[2],paramet[3])
            )
  if (side<0) P # 左側,分佈函數形式
  else if (side>0) 1-P # 右側,1-分佈函數形式
  else
    if (P<1/2) 2*P
    else 2*(1-P)
}

編寫求正態總體的均值檢驗,mean.test1.R 文件:

# 正態總體的均值檢驗
# 雙邊檢驗,side=0
# 左側單邊檢驗,side<0,備擇假設爲mu<mu_0
# 右側單邊檢驗,side>0,備擇假設爲mu>mu_0
# 拒絕域形式與備擇假設形式相同
mean.test1<-function(x,mu=0,sigma=-1,side=0){
  # mu是原假設的mu_0
  source("P_value.R")
  n<-length(x); xb<-mean(x)
  if (sigma>0){
    # sigma方差已知
    z<-(xb-mu)/(sigma/sqrt(n))
    # 統計量服從自由度爲n的標準正態分佈
    P<-P_value(pnorm,z,side=side)
    data.frame(mean=xb,df=n,Z=z,P_value=P)
  }
  else{
    t<-(xb-mu)/(sd(x)/sqrt(n))
    # 統計量服從自由度爲n-1的t分佈
    P<-P_value(pt,t,paramet=n-1,side=side)
    data.frame(mean=xb,df=n-1,T=t,P_value=P)
  }                       
}

結果:
已知 16 只元件的壽命,問:是否有理由認爲元件的平均壽命大於 225 小時?
假設檢驗:H0:μμ0=225,H1:μ>μ0=225.H_0: \mu \leq \mu_0=225, \qquad H_1: \mu>\mu_0=225.該問題是右側單邊檢驗:拒絕域與 H1H_1 形式相同。

> source('E:/R/RStudiowork/mean.test1.R')
> X<-c(159, 280, 101, 212, 224, 379, 179, 264, 222, 362, 168, 250, 149, 260, 485, 170)
> mean.test1(X,mu=225,side=1)
   mean df         T   P_value
1 241.5 15 0.6685177 0.2569801

P_value = 0.2569801 > 0.05,不能拒絕原假設,接受 H0H_0,元件的平均壽命不大於 225 小時。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章