SPSS(七)非線性迴歸過程

SPSS(七)非線性迴歸過程

直線關係畢竟是較少數的情形,當因變量和自變量呈曲線關係,我們可以使用迴歸分析衍生方法----曲線擬合過程

但是使用曲線擬合過程還是存在侷限性的

  • 只能分析一個自變量
  • 變量變換的侷限

有的公式根本無法進行變換,如複雜的等式,或者無簡單解的積分方程

當變換後,變量的數值分佈狀況已經改變,此時根據最小二乘法得到的最優解可能在原變量分佈狀況下並非最優

 

非線性迴歸過程

非線性迴歸過程的優勢

  • 採用迭代方法對用戶設置的各種複雜曲線模型進行擬合迭代方法往往意味着結果較爲穩定
  • 將殘差的定義從最小二乘法向外大大擴展這意味着誤差測量手段的大大豐富,我們可以使用最小一乘法、加權最小二乘法、自迴歸模型等
  • 爲用戶提供了極爲強大的分析能力特別適用於實驗室數據的分析

 

案例:毒物通風數據

這個案例其實在曲線擬合過程已經坐做一次了,這次我們使用非線性迴歸過程解決

1	2.1250
2	1.7420
3	1.2360
4	1.1270
5	.7310
6	.4690
7	.4000
8	.3810
9	.2840
10	.2760
11	.0620
12	.0610
13	.0408
14	.0428
15	.0305

 分析--迴歸--非線性

我們假設模型爲指數分佈(也可以假設爲其他分佈),設置參數,寫模型表達式,操作如下

1:從“迭代歷史記錄”表中可以看出:迭代了30次後,迭代被終止,已經找到最優解

此方法是不斷地將“參數估計值”代入”損失函數“求解, 而損失函數採用的是”殘差平方和“最小,在迭代30次後,殘差平方和達到最小值,最小值爲(0.068)此時找到最優解,迭代終止

2:從參數估計值”表中可以看出:
a= 2.854 (標準誤爲0.101,很小,說明此估計值的置信度很高) b=-0.267(標準誤爲:0.012,非常小,說明此估計值的置信度高)

非線性模型表達式爲:Y(毒物濃度)= 2.854 *e^(-0.267*時間)

3:從“參數估計值的相關性”表中可以看出:變量間的相關性

4:從anova表中可以看出:R方 = 1- (殘差平方和)/(已更正的平方和) = 0.989, 擬合度爲0.989,說明此模型能夠解釋98%的變異,擬合度非常高

 

 

 

自定義損失函數

針對問題:迴歸過程有強離羣點,而且強離羣不好剔除有實際意義

案例:某公司生產的產品其成本主要受兩種原材料的影響,爲及時調整生產,協調庫存,現收集了一批產品產量與相應生產中兩種原材料消耗量的數據。請就此建立原材料消耗量與產量(因變量)間的迴歸方程

數據集如下

18.46	49.72	520.19
21.22	58.13	557.68
22.10	56.56	644.22
23.98	68.04	703.95
24.13	78.46	717.43
45.30	97.46	814.76
25.57	114.88	884.92
31.82	145.71	1109.10
39.66	156.59	1258.86
33.54	86.10	905.79
30.98	69.05	824.50
21.53	111.41	714.99
30.97	109.87	1126.30
19.44	114.67	596.78
25.51	81.85	858.77

我們首先觀察散點圖

我們選用對強離羣點比較耐受的損失函數,最小一乘法,一般線性迴歸模型都是使用最小二乘法

添加參數起始值 

 

定義模型表達式 

 

最小一乘法,殘差絕對值之和最小

 

 結果沒有檢驗和標準誤差的估計了,只有參數估計值,檢驗和標準誤估計是最小二乘法那一套,對最小一乘法沒有意義

 

 

 參數初始值的設定技巧

  • 如果可變爲線性,可以先擬合線性方程,將此結果作爲初始值
  • 如果方程可解,則代入若干樣本值,解出近似取值作爲初值
  • 先擬合較簡單的雛形,將結果作爲初始值

否則,多嘗試幾種初始值,觀察結果

 

 

 

 

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章