SPSS教程之生存分析的Cox迴歸模型(比例風險模型)

最近有同學問師兄,“最近我要做生存分析,可是我不太會,也不太懂,師兄能不能教教我”,好吧,今天開一貼,講講這個。有同樣的問題的同學可以一起來看看,畢竟在臨牀、科研上,這方面知識還是很受用的。有什麼想跟師兄討論的,可以關注微信號公衆號:金融小圈子,就這樣吧。讓我們開始征程。

一、生存分析基本概念


1、事件(Event)

指研究中規定的生存研究的終點,在研究開始之前就已經制定好。根據研究性質的不同,事件可以是患者的死亡、疾病的復發、儀器的故障,也可以是下崗工人的再就業等等。

2、生存時間(Survival time)

指從某一起點到事件發生所經過的時間。生存是一個廣義的概念,不僅僅指醫學中的存活,也可以是機器出故障前的正常運行時間,或者下崗工人再就業前的待業時間等等。有的時候甚至不是通用意義上的時間,比如汽車在出故障前的行駛里程,也可以作爲生存時間來考慮。

3、刪失(Sensoring)

指由於所關心的事件沒有被觀測到或者無法觀測到,以至於生存時間無法記錄的情況。常由兩種情況導致:(1)失訪;(2)在研究終止時,所關心的事件還未發生。

4、生存函數(Survival distribution function)又叫累積生存率,表達式爲S(t)=P(T>t),其中T爲生存時間,該函數的意義是生存時間大於時間點t的概率。t=0時S(t)=1,隨着t的增加S(t)遞減(嚴格的說是不增),1-S(t)爲累積分佈函數,表示生存時間T不超過t的概率。

二、生存分析的方法

1、生存分析的主要目的是估計生存函數,常用的方法有Kaplan-Meier法和壽命表法。對於分組數據,在不考慮其他混雜因素的情況下,可以用這兩種方法對生存函數進行組間比較。

2、如果考慮其他影響生存時間分佈的因素,可以使用Cox迴歸模型(也叫比例風險模型),利用數學模型擬合生存分佈與影響因子之間的關係,評價影響因子對生存函數分佈的影響程度。這裏的前提是影響因素的作用不隨時間改變,如果不滿足這個條件,則應使用含有時間依存協變量的Cox迴歸模型。

下面用一個例子來說明SPSS中Cox迴歸模型的操作方法。

例題

要研究胰腺癌術中放療對患者生存時間的影響,收集了下面所示的數據:

操作步驟:

SPSS變量視圖

菜單選擇:

點擊進入Cox主對話框,如下,將time選入“時間”框,將代表刪失的censor變量選入“狀態”框,其餘分析變量選入“協變量”框。其餘默認就行。

點擊“狀態”框下方的“定義事件”,將事件發生的標誌設爲值0,即0代表事件發生。

在主對話框中點擊“分類”按鈕,進入如下的對話框,將所有分類變量選入右邊框中。

在主對話框中點擊“繪圖”按鈕,進入如下的對話框,選擇繪圖的類型,這裏只選擇“生存函數”。由於我們關心的主要變量是trt(是否放療),所以將trt選入“單線”框中,繪製生存曲線。

在主對話框中點擊“選項”按鈕,進入如下的對話框,設置如下,輸出RR的95%置信區間。回到主界面,點擊“確定”輸出結果。

結果輸出

這是案例處理摘要,有一個刪失數據。

這是分類變量的編碼方式。


這是對擬合模型的檢驗,原假設是“所有影響因素的偏回歸係數均爲0”,這裏可以看出P=0.032<0.05拒絕原假設,認爲有偏回歸係數不爲零的因素,值得進一步分析。

這是多元迴歸結果,第二列B爲偏回歸係數,最後三列爲OR值及其置信區間。由P值可以看出,在0.5的顯著水平下,只有 trt 有統計學差異,OR爲2.265。

這是協變量的平均值。

這是總體的生存函數,即累積生存率函數。

這是在控制了其他變量後,有無放療組的生存函數對比,可以看出,術中放療患者的生存情況優於不放療的患者。
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章