線性迴歸 - 多元線性迴歸案例 - 分析步驟、輸出結果詳解、與Python的結果對比 -(SPSS建模)

現在用 Python 寫線性迴歸的博客都快爛大街了,爲什麼還要用 SPSS 做線性迴歸呢?這就來說說 SPSS 存在的原因吧。

SPSS 是一個很強大的軟件,不用編程,不用調參,點巴兩下就出結果了,而且出來的大多是你想要的。這樣的特點特別適合建模初期進行算法的選擇。比如

  1. SPSS 做因子分析,輸出結果中有一項 Kaiser-Meyer-Olkin Measure of Sampling Adequacy. 它的值是在 [ 0, 1] 範圍內,這個值大於 0.5 就證明原數據中的指標適合使用因子分析算法進行建模,小於 0.5 要不重新計算指標,要不換算法。
  2. SPSS 做多元線性迴歸,輸出結果中的擬合度過低,說明指標與結果之間的相關性並不明顯,要不重新計算指標,要不換算法。
  3. ..................

下面詳細講講 SPSS做多元線性迴歸的步驟吧

準備工作:SPSS - 中文版 SPSS 22.0 軟件下載與安裝教程 - 【附產品授權許可碼,永久免費】

第一步:導入數據

路徑:【文件】--【打開】--【數據】--【更改文件類型,找到你的數據】--【打開】--【然後會蹦出下圖左中的篩選框,基本使用默認值就行,點確定】

  1. 第一行代表的是用第一行的數據做列名;
  2. 第二行代表文件中數據所在的範圍,默認是所有數據都選上,但是如果你只需要選擇前 n 行,那就把裏面的110改了就行;
  3. 第三行代表字符串寬度,這個默認值就可以,不用改;

導入數據之後就是下圖右中的樣子,老習慣,我們來說說原數據,第一列是撥打電話指數,第二列是接通電話指數,這兩個是自變量,第三類是因變量回款指數。爲了脫敏,所以用自己的辦法換算成現在這樣的數值。

                 

 

第二步:數據分析

【分析】--【迴歸】--【線性】--【通過截圖中的方式,將因變量與自變量添加到對應的地方】--【其他都使用默認值】--【確定】

        

 

第三步:輸出結果分析 

第一項輸出結果:輸入/移去的變量

輸入變量是兩個自變量Connect, Call,沒有移去任何變量。

第二項輸出結果:模型彙總

  1. R表示擬合優度(goodness of fit),用來衡量模型的擬合程度,越接近 1 越好;
  2. R方表示決定係數,用於反映模型能夠解釋的方差佔因變量方差的百分比,越接近 1 越好;
  3. 調整R方是考慮自變量之間的相互影響之後,對決定係數R方的校正,比R方更加嚴謹,越接近 1 越好;
  4. 標準估計的誤差是誤差項 ε 的方差 σ2的一個估計值,越小越好;

一般認爲,

  • 小效應:R (0.1~0.3),對應 R方(0.01~0.09);
  • 中等效應:R (0.3~0.5),對應 R方(0.09~0.25);
  • 大效應:R (0.5~1),對應 R方(0.25~1);

第三項輸出結果:Anova

Anova表示方差分析結果,主要看 F 和 Sig 值,爲方差分析的結果,F檢驗的重點在 Sig 值,具體大小不重要,其 F 值對應的 Sig 值小於 0.05 就可以認爲迴歸方程是有用的。

第四項輸出結果:係數

係數表列出了自變量的顯著性檢驗結果,

  1. 非標準化係數中的 B 表示自變量的係數與常數項(下圖代表的迴歸方式爲:Return = 0.097 * Call + 1.243 * Connect - 0.160);
  2. 標準係數給出的自變量係數與非標準化係數中的明顯不同,這是因爲考慮到不同自變量之間的量綱和取值範圍不同(比如在其他例子裏面,第一個自變量是年齡(0~120),第二個自變量是收入(0~10萬),顯然年齡18歲與收入18塊錢代表的意義是不一樣的,因此需要進行標準化),因此這裏的係數更能代表每個自變量對因變量的影響程度,(下圖代表的迴歸方式爲:Return = 0.126 * Call_標準化的值 + 0.739 * Connect_標準化的值);
  3. t 值 與 Sig 值 是自變量的顯著性檢驗結果,其 t 值對應的 Sig 值小於 0.05 代表自變量對因變量具有顯著影響,下圖中,自變量 Connect 對 因變量具有顯著影響,而自變量 Call 的影響程度就弱了很多;

綜上所有的輸出結果,說明 Call、 Connect 與 Return 的擬合效果還挺理想的。 

 

與Python的結果對比

同樣的數據,我們看看Python中的多元線性迴歸結果:

Python給出的迴歸方程: Y = -0.01 + 0.09 * Call + 1.19 * Connect;

 SPSS 給出的迴歸方程: Y = -0.16+ 0.09 * Call + 1.24 * Connect;

 

如果想要學習一下這個過程,你可能需要:

1.SPSS - 中文版 SPSS 22.0 軟件下載與安裝教程 - 【附產品授權許可碼,永久免費】

2.機器學習 - 多元線性迴歸 - 一步一步詳解 - Python代碼實現

本例中用的數據與機器學習 - 多元線性迴歸 - 一步一步詳解 - Python代碼實現中的數據是同一份,便於對比。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章