簡介
- 不需要對總體分佈作任何事先的假設(如正態分佈)
- 從檢驗內容上說,也不是檢驗總體分佈的某些參數,而是檢驗總體某些有關的性質,所以稱爲非參數檢驗
- 前面進行的假設檢驗和方差分析,大都是在數據服從正態 分佈或近似地服從正態分佈的條件下進行的。但是如果總體的 分佈未知,或對總體分佈知之甚少的情況下,如何利用樣本信息 對總體分佈形態做出推斷? 非參數檢驗 -指推斷過程不涉及總體 分佈中的參數
場景
- 未知分佈型,或樣本數太少(n<=6)而使得分佈狀況尚未顯示出來
- 非參數性,只能以嚴重程度、優劣等級、效果大小、名次先後以及綜合判斷等方式記錄其符號或等級
- 分佈程度偏態
- 組內個別隨機變量偏離過大。
缺點
當測量的數據能夠滿足參數統計的所有假設時,非參數檢驗方法雖然也可以使用,但效果遠不如參數檢驗方法。由於當數據滿足假設條件時,參數統計檢驗方法能夠從其中廣泛地充分地提取有關信息。非參數統計檢驗方法對數據的限制較爲寬鬆,只能從中提取一般的信息,相對參數統計檢驗方法會浪費一些信息。
卡方檢驗簡介
- 簡介
目的: 根據樣本數據推斷總體的分佈與某個已知分佈是否有顯著差異 —吻合性檢 - 場景
適用於具有明顯分類特徵的數據
基本假設
H0: 總體分佈與理論分佈無顯著差異
基本方法
數據集
隨機抽取100名公司新招聘員工的性別情況,使用卡方檢驗方法研究該公司新招聘員工男女比例是否存在顯著差異
菜單
參數設置
變量
期望全距:用於確定卡方檢驗的數據範圍
- 從數據中獲取
將使用數據中的最大值和最小值作爲檢驗範圍 - 使用指定的範圍
可以在上限和下限輸入框中輸入設定的範圍
- 從數據中獲取
期望值: 設置總體中各分類所佔的比例
- 所有類別相等
檢驗總體服從均勻分佈 - 值
可以在其後的輸入框中輸入指定組的期望概率值
注意:值輸入的順序要與檢驗統計量遞增的順序相同
- 所有類別相等
精確
- 僅漸進法
表示顯著性水平的計算基於漸近分佈假設。漸進方法要求足夠大的樣本容量,如果樣本容量偏小,該方法將會失效 - Monte Carlo
使用Monte Carlo模擬方法計算顯著性水平。一般應用於不滿足漸近分佈假設的巨量數據。需要輸入相應的置信水平和樣本數 - 精確
可以得到精確的顯著性水平,缺點是計算量過大。用戶可以設置相應的計算時間,如果超出該時間,SPSS將會自動停止計算並輸出結果
選項
分析結果
描述性統計量
頻率
檢驗統計量
漸進顯著性水平爲0.655,遠大於0.05,所以該公司新招聘員工的男女比例沒有顯著差異