在研究Y與X之間的因果關係時,如果Y不是一個定比或定距變量時,就需要進行logistic迴歸。logistic迴歸是一種廣義線性迴歸(generalized linear model)。logistic迴歸根據Y的取值分爲三類:
1 二元 logistic迴歸
二元logistic迴歸的基本思想是對取某個類別值的概率p進行logit變換,令:
如果:
y=ax+b
則:
2 多元logistic迴歸
多元logistic迴歸的基本思想是將取y的某個類別值概率pK作爲參照物,將取其他類別值的概率與其相除後取對數,記爲yi:
然後對yi進行迴歸分析得到:
yi=𝛃0+𝛃1*x1+𝛃2*x2……
則:
3 順序logistic迴歸
當y是有n(n>2)個取值的定序數據時,分析時可以拆分爲n-1個二元logistic迴歸,分別爲(1 vs 2+…+n-1) 、(1+2 vs …+n-1)、(1+…vs n-1),均是較低級與較高級的對比。
logit(p1)=α1+𝛃1*x1+𝛃2*x2+……
logit(p1+p2)=α2+𝛃1*x1+𝛃2*x2+……
y有n個級別,則有n-1個方程。
以下以順序邏輯迴歸爲例說明在Minitab中如何進行logistic迴歸分析:
某公司積累了22個項目的歷史數據,包括:客戶滿意度、系統測試時發現的缺陷密度(缺陷個數/功能點)以及項目採用的生命週期模型(瀑布或迭代)。客戶滿意度爲定序刻度,包含 了5個等級:
5很滿意
4 滿意
3 一般
2 不太滿意
1 很不滿意
序號 |
客戶滿意度 |
累計測試的缺陷密度 |
LCM |
P1 |
1 |
1.1121 |
瀑布模型 |
P2 |
3 |
0.5385 |
迭代模型 |
P3 |
5 |
0.0000 |
迭代模型 |
P4 |
2 |
0.6656 |
瀑布模型 |
P5 |
5 |
0.2443 |
迭代模型 |
P6 |
2 |
0.6262 |
瀑布模型 |
P7 |
3 |
0.5767 |
迭代模型 |
P8 |
5 |
0.2434 |
迭代模型 |
P9 |
5 |
0.2671 |
瀑布模型 |
P10 |
3 |
0.7158 |
迭代模型 |
P11 |
4 |
0.5423 |
迭代模型 |
P12 |
2 |
1.0438 |
瀑布模型 |
P13 |
1 |
2.4690 |
瀑布模型 |
P14 |
3 |
0.7160 |
瀑布模型 |
P15 |
3 |
0.8739 |
瀑布模型 |
P16 |
2 |
1.0970 |
瀑布模型 |
P17 |
3 |
0.8531 |
迭代模型 |
P18 |
3 |
1.0130 |
迭代模型 |
P19 |
4 |
0.7168 |
迭代模型 |
P20 |
3 |
0.6926 |
瀑布模型 |
P21 |
4 |
0.7792 |
迭代模型 |
P22 |
2 |
0.9906 |
瀑布模型 |
我們擬建立客戶滿意度與累積測試的缺陷密度和生命週期模型之間的迴歸關係,因爲客戶滿意度爲定序刻度,所以採用有序logistic迴歸。在Minitab中選中順序logistic菜單項:
然後設置好模型:
Minitab對上述數據執行分析後,結果如下:
根據上述的結果,可以得到模型如下:
滿意度等級 |
瀑布模型 |
迭代模型 |
等級1的概率 |
1/(1+exp(-(-14.3302+2.78502+9.64861*累計測試缺陷密度))) |
1/(1+exp(-(-14.3302-2.78502+9.64861*累計測試缺陷密度))) |
等級1和2的概率 |
1/(1+exp(-(-10.3946+2.78502+9.64861*累計測試缺陷密度))) |
1/(1+exp(-(-10.3946-2.78502+9.64861*累計測試缺陷密度))) |
等級1,2,3的概率 |
1/(1+exp(-(-6.33092+2.78502+9.64861*累計測試缺陷密度))) |
1/(1+exp(-(-6.33092-2.78502+9.64861*累計測試缺陷密度))) |
等級1,2,3,4的概率 |
1/(1+exp(-(-4.42629+2.78502+9.64861*累計測試缺陷密度))) |
1/(1+exp(-(-4.42629-2.78502+9.64861*累計測試缺陷密度))) |
當採用了瀑布生命週期模型,累計測試缺陷密度爲1時,根據上表可以進行預測:
序號 |
滿意度等級 |
瀑布模型 |
1 |
等級1的概率 |
0.1305 |
2 |
等級1和2的概率 |
0.8848 |
3 |
等級1,2,3的概率 |
0.9978 |
4 |
等級1,2,3,4的概率 |
0.9997 |
5 |
等級2的概率=(2)-(1) |
0.7543 |
6 |
等級3的概率=(3)-(2) |
0.1129 |
7 |
等級4的概率=()-(1) |
0.0019 |
8 |
等級5的概率=1-(4) |
0.0003 |