數學建模——相關係數(3)——對數據進行正態分佈檢驗

引述

在上一節的最後,我們提到了皮爾遜相關係數檢驗的條件。其中,第一條提到,實驗數據通常是成對的來自於正態分佈的總體。因此,本節的重點將放在如何對數據進行正態分佈檢驗

相關的數學基本概念

偏度

偏度

峯度

峯度

相關MatLab代碼

x = normrnd(2, 3, 100, 1); % 生成100*1的隨機向量,每個元素是均值爲2,標準差爲3的正態分佈
skewness(x) % 偏度
kurtosis(s) % 峯度
% 將第一行的代碼中的100,改成更大的數,例如10000。觀察一下,偏度和峯度的大小。
% 數字越大,偏度越接近0,峯度越接近3.

雅克‐貝拉檢驗(Jarque‐Beratest) (大樣本 n>30)

1. JB簡介

對於一個隨機變量{Xi},假設其偏度爲S,峯度爲K,那麼我們可以構造JB統計量:
JB統計量
可以證明,如果{Xi}是正態分佈,那麼在大樣本情況下JB~X2(2)(自由度爲2的卡方分佈)【正態分佈的偏度爲0,峯度爲3】

2. 使用假設檢驗證明該隨機變量爲正態分佈的步驟

  1. 零假設H0:該隨機變量服從正態分佈,備擇假設H1:該隨機變量不服從正態分佈;
  2. 計算該變量的偏度峯度,代入JB統計量,得到檢驗值JB*;
  3. 計算出該檢驗值對應的p值;
  4. 若 p < 0.05,拒絕原假設,即該隨機變量不服從正態分佈;否則,不能拒絕原假設,也就是該隨機變量服從正態分佈。

3. 使用MATLAB進行JB檢驗

  1. 語法
	[h, p] = jbtest(x, alpha)
  1. 輸入參數
    alpha:顯著性水平,一般取 0.05,此時置信水平爲 1 - 0.05 = 0.95
    x:要檢驗的隨機變量,x必須爲向量
  2. 輸出結果
    h = 1,拒絕原假設
    h = 0,不能拒絕原假設
	%% 正態分佈檢驗
	% 檢驗第一列數據是否爲正態分佈
	% Test是使用的測試數據(被導入的EXCEL文件)
	[h, p] = jdtest(Test(:, 1), 0.05)
	% 用循環檢驗所有列的數據
	n_c = size(Test, 2); % number of column 數據的列數
	H = zeros(1, 6); 
	P = zeros(1, 6);
	for i = 1 : n_c
			[h, p] = jdtest(Test(:, i), 0.05);
			H(i) = h;
			P(i) = p;
	end
	disp(H)
	disp(P)

夏皮洛‐威爾克檢驗(Shapiro‐wilk)(小樣本 3≤n≤50)

1. 使用假設檢驗證明隨機變量符合正態分佈的步驟

  1. 零假設H0:該隨機變量符合正態分佈;備擇假設H1:該隨機變量不符合正態分佈;
  2. 計算出威爾克統計量後,得到相應的p值;
  3. 置信水平爲95的前提下,若 p < 0.05,拒絕原假設,否則不能拒絕。

2. SPSS操作步驟

分析 → 描述統計 → 探索 → 點擊右側 圖 → 勾選含檢驗的正態圖
SPSS創建圖

Q-Q圖(儘可能使用上述的兩種檢驗方式)

1. Q-Q圖簡介

  • 在統計學中,Q-Q圖(Q代表分位數Quantile)是一種通過比較兩個概率分佈的分位數對兩個概率分佈進行比較的概率圖方法。
  • 首先選定分位數的對應概率區間集合,在此概率區間上,點(x,y)對應於第一個分佈的一個分位數x和第二個分佈在和x相同概率區間上相同的分位數。
  • 這裏,我們選擇正態分佈和要檢驗的隨機變量,並對其做出Q-Q圖,若要檢驗的隨機變量是正態分佈,那麼Q-Q圖就是一條直線。

2.使用MATLAB繪製Q-Q圖

要利用Q-Q圖鑑別樣本數據是否近似於正態分佈,只需要看Q-Q圖上的點是否近似地在一條直線附近,但是其要求數據量十分巨大

示例代碼:

% 繪製第一列數據的Q-Q圖
qqplot(Test(:, 1))

Q-Q測試圖

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章