使用SAS,Stata,HLM,R,SPSS和Mplus的分層線性模型HLM

原文鏈接:http://tecdat.cn/?p=10809

簡介

本文檔用於比較六個不同統計軟件程序(SAS,Stata,HLM,R,SPSS和Mplus)的兩級分層線性模型的過程和輸出。 

下面介紹的六個模型都是兩級分層模型的變體,也稱爲多級模型,這是混合模型的特殊情況。此比較僅對完全嵌套的數據有效(不適用於交叉或其他設計的數據,可以使用混合模型進行分析)。儘管HLM軟件的網站聲明可以用於交叉設計,但這尚未得到確認。下面的SAS,Stata,R,SPSS和Mplus中使用的過程是其多層次或混合模型過程的一部分,並且可以擴展爲非嵌套數據。

但是出於比較的目的,我們將僅研究完全嵌套的數據集。除了HLM(完全由GUI運行)以外,所有程序的下面都包含用於每個模型的代碼/語法。我們提供了HLM和SPSS的屏幕截圖。此外,每個模型均以分層格式和混合格式指定。儘管模型的這兩個表達式是等效的,但一些研究領域更傾向於可視化層次結構,因爲它更容易看到層次之間的分離,而另一些研究領域則更喜歡混合格式,在其中容易區分固定效果和隨機效果。

模型注意事項將預測變量添加到本文檔討論的六個模型中時,我們選擇以均值居中爲中心,這意味着我們從每個受試者的得分中減去了該變量的總體均值。

正如Enders&Tofighi(2007)所詳細討論的那樣,以總體平均值爲中心,而不是以組平均值(每個組的平均值均以該組中受試者的得分爲準)爲中心,並不適合所有模型。 。使用哪種居中方法的選擇應由所詢問的具體研究問題決定。另一個考慮因素是這些程序使用的估計方法來產生參數估計,即最大似然(ML)或受限最大似然(REML)。每種都有自己的優點和缺點。ML更適合不平衡的數據,但是會產生偏差的結果。REML是無偏的,但是在將兩個嵌套模型與似然比檢驗進行比較時,不能使用REML。

兩種方法將產生相同的固定效應估計,但它們對隨機效應的估計卻有所不同(Albright&Marinova,2010)。正如我們將在下面討論的模型中看到的那樣,這兩種方法產生的結果非常相似,並且不會極大地影響隨機因素的p值。但是,重要的是要意識到,方法的選擇會影響隨機因素的估計,標準誤差和p值,並且可能會影響宣佈隨機因素是否重要的​​決策。SAS,HLM,R和SPSS默認使用REML,而Stata和Mplus使用ML。在本文檔中的Stata示例中,我們告訴Stata使用REML以便將輸出與其他四個程序進行比較。

類內相關係數

 

我們還報告了每種模型的類內相關係數(ICC)ρ。ICC是結果變量中方差的比例,由分層模型的分組結構解釋。它是根據組級別誤差方差與總誤差方差之比來計算的:

其中,是2級殘差的方差,是1級殘差的方差。換句話說,與總的無法解釋的方差(方差之內和之間)相比,ICC報告了模型中任何可歸因於分組變量的預測變量無法解釋的變化量。

示例數據集

流行的數據集由來自不同班級的學生組成,並且由於每個學生都屬於一個唯一的班級,因此它是一個嵌套設計。因變量是“流行”,它是一個自評的流行度,範圍爲0-10。預測指標包括學生級別的性別(二分法)和Extrav(連續的自我評價的外向得分),以及班級的Texp(多年的老師經驗, 是連續的)。

 

僅截距模型(無條件模型)

 

無條件混合模型規範類似於單因素方差分析,其總體均值和類效應。但是,我們將其視爲隨機效應(均值爲零的正態分佈變量),而不是像方差分析中那樣的固定因子效應。因此,我們將估計值解釋爲每個類別的平均數在總體平均人氣得分附近的方差。

估算值是每個班級的“大衆”平均值的平均值,而不是研究中所有學生的平均值。如果數據完全平衡(即每個班級的學生人數相同),則無條件模型的結果將與方差分析程序的結果相同。

SAS結果

 需要“ covtest”選項來報告方差分量估計的標準誤差。另外, 需要指定非結構化協方差矩陣類型,這是HLM和R默認情況下使用的類型,我們在這裏使用它進行比較。SAS的輸出等於Hox的書表2.1中的結果。我們可以得出結論,各類別之間的平均人氣得分爲5.078,並且各類別之間的差異(1.221)比不同類別之間的差異(0.702)多。當我們爲該模型計算ICC時,將對此進行進一步討論。

Stata結果

 Stata的xtmixed命令需要因變量,後跟“ ||”  指定固定變量和隨機變量之間的分隔。我們必須包括方差選項以查看輸出中方差分量的估計值,以及reml選項以使用受限的最大似然估計。還要注意,Stata不會輸出隨機分量估計的p值,但是可以通過置信區間中是否包含零來確定有效值。這些結果與SAS的結果完全匹配

 

HLM結果

HLM報告方差組件的標準偏差,而不是標準誤差。同樣,對於隨機效應,他 僅報告截距的卡方統計量和p值。這些結果與其他程序的結果相同。

 

R結果

R報告方差成分(例如HLM)的標準偏差,而lme4軟件包報告固定效應的t統計量。 

 

 SPSS結果

 屏幕截圖:

 

 

 需要在“隨機”窗口中指定非結構化協方差類型。這些結果與其他程序和本文得出的結果相同。請注意,像SAS和Mplus一樣,SPSS報告方差分量的標準誤差,而HLM和R報告標準差。我們無法得出結論,哪個更適合報告,但是差異不會影響這些參數的p值。

 因爲這是一個無條件模型,所以我們不需要指定任何WITHIN或BETWEEN變量。下面列出了在MODEL語句中列出變量的標準。在以下各節中,我們將看到前三個示例:

1.%WITHIN%– 1級固定因子(非隨機斜率)2.具有潛在斜率變量的%WITHIN%– 1級隨機因子3.%BETWEEN%– 2級固定因子4.在任一個陳述–在學生水平上測得的變量,但具有1級和2級方差估計 。

上表顯示了Mplus輸出底部的“模型結果”部分的結果。Mplus確實會報告每個估計的p值,並且所有估計都與其他程序的p值匹配,但隨機截距的方差估計相差約0.007。這種差異是由於Mplus使用ML估計這一事實造成的。儘管存在這種差異,但我們看不到任何變量的重要性發生變化。

 彙總

總體而言,這六個程序對於僅截取模型產生了非常相似的結果(唯一的差異發生在隨機效應的Mplus估計中)。唯一的區別是他們如何報告隨機方差估計的精度。此模型的ICC等於:

這告訴我們,“流行”課程總變化的大約三分之一可以由每個學生所在的班級解釋。

 

具有一個固定的Level-1因子的隨機截距(非隨機斜率)模型

 

該模型增加了一個學生級別的固定因子Extrav,即自我報告的外向得分。混合模型看起來像是基於帶有協變量Extrav的類的ANCOVA,但請記住,我們仍然認爲這是隨機效應,而不是固定效應。因此, 估算值與ANCOVA程序所得出的估算值不同。 

 在此數據的實際應用中,Extrav應該具有固定的效果而不是隨機的效果是沒有意義的,因爲學生外向性的水平應隨班級而變化。但是,出於比較這四個程序的目的,我們仍然希望調查一個具有一個學生級別固定因子的案例。

SAS結果

現在,我們對Extrav的固定效果進行了估算。學生報告的外向得分每增加一個單位,他們的受歡迎度得分就會增加0.486。這些結果等於使用REML的其他程序的結果。

 

Stata結果 

當我們向Stata中的模型添加預測變量時,我們添加了cov(un)選項,指定了非結構化協方差矩陣。我們將 Extraversion變量放在“ ||”之前 表示它是一個固定因子(具有非隨機斜率)。這些結果與其他程序的結果相同。

 HLM結果

 

R結果

 

 SPSS結果

 

Mplus結果

 

 現在,我們在VARIABLE語句的WITHIN選項中包括居中的Extrav變量。對於內部MODEL規範,我們必須使用“ ON”選項,以告知Mplus Extrav是固定的1級因子。  可以看到由於使用ML估計而不是REML,許多估計和估計的標準誤差(以及t統計量)存在細微差異。由於方差的估計值與其他程序不同,因此Mplus報告的ICC與下面報告的有所不同。

彙總

對於此模型,前五個程序的結果完全相同,而Mplus的估算值相差很小。此模型的ICC大於無條件模型的ICC(正如預期的那樣,因爲我們通過添加固定因子來控制某些學生水平的變化):

 

 使用一個學生水平的固定因子,“流行”總變化的幾乎一半可以由該學生的班級和學生水平的固定因子“外向”解釋

 

一個一級因子的隨機截距和斜率模型

 

 

 

該模型包含Extrav的隨機斜率,這意味着我們允許迴歸方程的斜率隨類而變化。該模型比以前的模型更適合於所使用的變量,因爲可以直觀地假設外向因類而異。

 

SAS結果

 

隨機Extrav斜率的估計值很重要(p值爲0.003),因此我們可以說學生的外向性得分隨班級的不同而變化。這些結果與其他程序的結果完全匹配,除了固定效果的t統計量存在一些細微差異。

 Stata結果

 HLM結果

 

 

 

SPSS結果

 

 Mplus結果

 這次我們在WITHIN語句中包括一個潛在的斜率變量,以將Extrav指定爲隨機因子,該變量告訴Mplus不要在數據集中尋找“ randoms1”,因爲沒有觀察到它。 可以將此變量的輸出解釋爲Extrav的隨機斜率分量。我們必須這樣做,因爲Mplus是爲結構方程模型設計的,其多級模型功能是其潛在潛伏分析程序的改編。

 

彙總

總體而言,前五個程序對該模型產生相同的結果,而Mplus再次由於ML估計而相差很小。此模型的ICC爲:

 通過將Extrav的影響從固定變爲隨機,由於我們正在考慮在學生級別上更多隨機變化,因此ICC會略有增加。

 

 

兩個1級因子的隨機斜率模型

 

 

 

 對於此模型,我們包括第二個學生級別的變量Sex,該變量也具有隨機斜率。這意味着我們既要考慮學生的性別,又要考慮他們的外向得分,並且允許這兩個因素的斜率隨班級而變化。

 

SAS結果

 

 在此輸出中,我們可以看到性別確實對學生自我報告的知名度有重大影響(p值<0.001)。對Sex的固定估計意味着,在Extrav不變的情況下,女學生(Sex = 1)的普遍得分比男學生(基線組,Sex = 0)高1.244。

SAS不喜歡在該模型中,Sex的估計方差非常接近零,因此沒有輸出標準誤差或p值。因爲非常接近於零,所以我們可以得出結論,性別不會因類別而顯着變化。 

Stata結果

 Stata在運行該模型時引用了一個錯誤:標準誤差計算失敗,這意味着未計算隨機效應的標準誤差。我們發現通過刪除cov(un)選項,不會出現此錯誤。但是,該輸出中的所有估計均與其他程序不同,因此我們選擇使用非結構化協方差矩陣規範報告輸出。我們不確定這是否是在Stata中運行此類模型的常見問題,但重要的是要意識到它會發生。

 

HLM結果

 

這些估計大致等於其他計劃的結果,但隨機性別影響的估計除外。由於這種影響非常接近於零,因此程序不會報告完全相同的值,但是所有結果都表明該值遠非重要。

 R結果

SPSS結果

 

 Mplus結果

 這次,我們在WITHIN語句中包括了兩個潛在的斜率變量,以將Extrav和Sex指定爲隨機因子。我們可以將“ randoms1”的輸出解釋爲Extrav的估計,將“ randoms2”的輸出解釋爲Sex的估計。

Mplus針對此模型的輸出所得出的估計值與先前模型中的其他程序相距甚遠。我們看到,由於模型必須估計更多隨機參數,因此估計程序(ML與REML)之間的差異變得更加明顯。但是,Mplus同意其他程序的觀點,即“性別”的隨機方差部分以外的所有估計值都非常重要。

 

 彙總

對於方差非常接近零的隨機效應,六個程序以不同的方式處理估計值。SAS和Stata無法報告隨機效應的標準誤差或p值,而其他變量的估計值和標準誤差均具有相當大的差異。Mplus結果也顯示出比以前的模型更大的差異。此模型的ICC爲:

 

同樣,當我們在模型中添加另一個學生級別的效果(包括隨機斜率)時,ICC略有增加。 

 

一個2級因子和兩個隨機1級因子(無交互)

 

 

 這是我們看到的第一個具有2級(班級)變量的模型:教師的多年經驗(Texp),也是以均值爲中心的。正如Enders和Tofighi(2007)指出的那樣,級別2變量的唯一居中選項是均值居中。  無法對均值中心Texp進行分組,因爲它已經在班級水平上進行了度量,這意味着“分組均值”將等於原始值。

 

在分層格式中, 可以看到它具有固定的斜率係數,並且對於每個類j都是唯一的。該模型在教師的經驗和學生水平的變量之間沒有任何相互作用。如果我們有理由相信Texp不會緩和Sex和Extrav對Popular的影響,那麼我們將使用此模型,這意味着我們的學生水平變量的斜率是相同的,無論學生是否有新教師或新教師。一位擁有多年經驗的人。

 

SAS結果


 

 現在,我們在固定效果表中看到了Texp,估計值爲0.089,p值很大。這意味着,在使學生的性別和性取向得分保持不變的情況下,每增加一年的教師經驗,該學生的熱門得分就會增加0.089。

 

同樣,我們看到SAS無法處理隨機性別效應的很小變化。因此,沒有報告標準誤差,z統計量或p值。

 

Stata結果

 與以前的模型一樣,我們收到一個錯誤,告訴我們Stata無法計算方差分量的標準誤差。但是,這些估計值與其他程序的估計值大致相同。

HLM結果

 

 

 這些估計值與其他程序的結果略有不同  。

R結果

SPSS結果 

 

 

 Mplus結果

對於Level-2因子,我們在BETWEEN語句中包括Ctexp。我們再次看到這些估計數與其他五個計劃的輸出有微小出入

 彙總

使用REML的五個程序的輸出實質上是相等的,僅相差幾千個單位。與以前的模型一樣,最大的差異出現在隨機性別效應的方差估計中,因爲它非常接近零。

請注意,此模型的ICC比以前的模型有所降低(= 0.542):

 請記住,ICC是衡量 所在的班級可以解釋多少無法解釋的變化的方法。通過添加班級級別的預測變量,我們可以解釋不同班級中較大比例的變化。因此,與沒有任何2級預測變量的模型相比,該模型的隨機截距存在較少的變異,因此ICC也較低。

 

具有相互作用的一個2級因子和兩個隨機1級因子

 

 

 這是我們在班級變量Texp與學生級變量Sex和Extrav之間進行跨級交互的唯一模型。例如,如果我們想找出具有更多經驗的教師是否比新教師對學生的外向性或性別與他們自我報告的知名度之間的關係有不同的影響,則可以使用此模型。換句話說,教師的經歷是否適度了性格外向或性別對受歡迎程度的影響?

 可以看到,在分層格式中,Texp在三個方程式的每個方程式內都有一個斜率係數。這與混合模型中的交互項有關,即通過外向的教師體驗和按性別的教師體驗。

SAS結果

 在固定效果表中,有兩個交互作用項,其中一個()遠不重要,p值> 0.5。 

在隨機方差分量表中,我們看到外向隨機斜率的估計值和性別隨機斜率的估計值與零沒有顯着差異。這意味着沒有證據表明這兩個因素實際上在該模型中因類別而異。 

 Stata結果

Stata無法自動識別變量之間的交互項,因此我們必須爲兩個跨級別的交互手動創建變量(請參見上面的代碼中的gen語句)。當我們使用帶有非結構化協方差矩陣選項的xtmixed命令運行時,Stata給出了一個錯誤,指出Hessian不是負半定性,一致性錯誤,並且沒有產生任何輸出。 

HLM結果

這些估計值大致等於其他程序的結果。

R結果 

 

SPSS結果 

 

 對於SPSS 19而言,此模型實在太多了。對於具有非結構化協方差矩陣的更復雜的模型,其他程序可能會運行更有效的算法,因此優於SPSS。

 Mplus結果

 現在,我們在BETWEEN模型部分中包含兩個ON語句,以指示與教師經驗的跨層次交互。同樣,我們發現與其他輸出之間的細微差異,但Mplus同意Texp和Sex之間的固定交互作用不顯着,而Extrav和Sex的隨機組成也並不重要。

 彙總

加上兩個跨層交互項,Stata和SPSS無法使用非結構化協方差選項運行模型。這並不是說不應該將它們用於這種類型的分析,但是在向具有非結構化協方差矩陣的模型中添加更復雜的參數時,應謹慎使用。

與以前的模型一樣,SAS,HLM和R的結果相對接近相等,而Mplus的估計略有不同。另外,ICC與模型5幾乎完全相同,這意味着交互作用項不會改變按類別說明的差異比例:

總結

進行比較的目的是調查來自六個不同統計軟件程序的嵌套兩級層次模型的過程和結果可能存在的差異。總體而言,我們發現SAS,Stata(帶有reml選項),HLM,R和SPSS產生的實際估計值之間沒有太大差異。Mplus使用另一種估算方法ML,這導致其估算值與其他估算值有所不同。另外,重要的是要注意以下幾點:

 

1.對於方差估計非常接近零的隨機效應,SAS無法產生標準誤差或p值。其他三個程序在估計這些參數方面的差異與其他效果相比更大。

2. Stata和SPSS無法處理最複雜的模型,該模型包含兩個跨級別的交互項。建議使用其他程序來分析複雜模型並指定非結構化協方差矩陣。

此外,我們研究了每種模型中類內相關係數的值。通過添加1級預測因子,ICC有所增加。但是,當我們添加2級預測變量時,ICC會大大降低,甚至比無條件模型更低。這是由於在類級別添加了預測變量時,無法解釋的Level-2變異(隨機截距項)減少了。

儘管本文檔可以用作爲嵌套數據集運行各種兩級分層模型的指南,但我們強烈建議讀者僅在適合回答您的特定研究問題時使用這些模型。在確定固定因素和隨機因素之間,以及對於中心平均值爲1的總體平均值或組平均值時,必須謹慎使用。 

參考文獻

Enders, Craig K. and Tofighi, Davood (2007). “Centering Predictor Variables in Cross-Sectional Multilevel Models: A New Look at an Old Issue.” Psychological Methods, vol. 12, pg. 121-138.

Hox, Joop J. (2010). Multilevel Analysis (2nd ed.). New York: Routledge

發佈了445 篇原創文章 · 獲贊 246 · 訪問量 97萬+
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章