方差分析與單因素方差分析

研究分類型自變量對數值型因變量的影響。檢驗統計的設定和檢驗方法與變量間的方差是否相等有關。

例如研究行業、服務等級對投訴數的影響:如表格中給出4個行業、每個行業有3個服務等級、樣本容量爲7、觀測值爲投訴數。則構成一個3維的矩陣。

在上述基礎上,提出幾個定義:

因素:行業、服務等級,他們都是分類變量。

水平:一個因素下有多少個分類。如行業這一因素有4個水平。

因變量:觀測值。

檢驗統計量:選擇t統計量,具體請自行查閱資料。

驗後多重比較:檢驗後是否有影響後,比較兩兩變量的方差。使用LSD方法,類似於雙變量檢驗。

 

方法思路

ANOVA的思路爲:

一個因素不同水平下的差距主要來自於抽樣時的隨機誤差,和不同水平固有的系統誤差。(合稱組間誤差)

同一因素下個案的差距主要來自於抽取的隨機誤差(合稱組內誤差)

故若判斷差距的主要來源爲系統固有誤差,則認定該分類變量對因變量有顯著影響。

單因素方差分析

若給定4個行業,觀測值爲投訴數,每個行業下樣本容量不唯一。

原假設:投訴數與行業有關。

檢驗統計量爲:F,設定爲與組間偏差與組內偏差有關,可自行查閱資料。

在spss打開數據文件one_waynaova1.sav  下載地址:https://download.csdn.net/download/weixin_42141390/11701140;路徑爲:.\10

在比較均值、單變量ANOVA操作:

4

結果爲:

以平均值爲基礎,方差齊性檢驗的檢驗統計量levene F的顯著水平爲0.898,大於0.05,故接受原假設,即滿足方差齊性。

從ANOVA方差分析表中可以看出,檢驗統計量F的顯著水平爲0.04,小於0.05,故拒絕原假設,即投訴數與行業有關。

PS:

組件平方和爲:4個組的中的平均投訴數,與每一組(水平)的平均投訴數值差的平方的和。

組內平方和是:20個變量於其所屬水平的平均投訴數之差的平方和

均分是平方和除以自由度。

下面爲驗後多重比較(兩兩比較。)

上表爲行業兩兩均值分析。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章