採用Minitab進行logistic迴歸分析

       在研究Y與X之間的因果關係時,如果Y不是一個定比或定距變量時,就需要進行logistic迴歸。logistic迴歸是一種廣義線性迴歸(generalized linear model)。logistic迴歸根據Y的取值分爲三類:

 

      1 二元 logistic迴歸

       二元logistic迴歸的基本思想是對取某個類別值的概率p進行logit變換,令:

      

如果:

         y=ax+b

則:

        

 

 

       2 多元logistic迴歸

       多元logistic迴歸的基本思想是將取y的某個類別值概率pK作爲參照物,將取其他類別值的概率與其相除後取對數,記爲yi

       

然後對yi進行迴歸分析得到:

         yi=𝛃0+𝛃1*x1+𝛃2*x2……

則:

         

 

       3 順序logistic迴歸

       當y是有n(n>2)個取值的定序數據時,分析時可以拆分爲n-1個二元logistic迴歸,分別爲(1 vs 2++n-1) 、(1+2 vs +n-1)、(1+vs n-1),均是較低級與較高級的對比。

       logit(p1)1+𝛃1*x1+𝛃2*x2+……  

       logit(p1+p2)2+𝛃1*x1+𝛃2*x2+……

       yn個級別,則有n-1個方程。

 

       以下以順序邏輯迴歸爲例說明在Minitab中如何進行logistic迴歸分析:

       某公司積累了22個項目的歷史數據,包括:客戶滿意度、系統測試時發現的缺陷密度(缺陷個數/功能點)以及項目採用的生命週期模型(瀑布或迭代)。客戶滿意度爲定序刻度,包含 了5個等級:

 

     5很滿意

     4 滿意

     3 一般

     2 不太滿意

     1 很不滿意

序號

客戶滿意度

累計測試的缺陷密度

LCM

P1

1

1.1121

瀑布模型

P2

3

0.5385

迭代模型

P3

5

0.0000

迭代模型

P4

2

0.6656

瀑布模型

P5

5

0.2443

迭代模型

P6

2

0.6262

瀑布模型

P7

3

0.5767

迭代模型

P8

5

0.2434

迭代模型

P9

5

0.2671

瀑布模型

P10

3

0.7158

迭代模型

P11

4

0.5423

迭代模型

P12

2

1.0438

瀑布模型

P13

1

2.4690

瀑布模型

P14

3

0.7160

瀑布模型

P15

3

0.8739

瀑布模型

P16

2

1.0970

瀑布模型

P17

3

0.8531

迭代模型

P18

3

1.0130

迭代模型

P19

4

0.7168

迭代模型

P20

3

0.6926

瀑布模型

P21

4

0.7792

迭代模型

P22

2

0.9906

瀑布模型

 

       我們擬建立客戶滿意度與累積測試的缺陷密度和生命週期模型之間的迴歸關係,因爲客戶滿意度爲定序刻度,所以採用有序logistic迴歸。在Minitab中選中順序logistic菜單項:

       

然後設置好模型:

 

       Minitab對上述數據執行分析後,結果如下:

 

 

 

 

       根據上述的結果,可以得到模型如下:

 

滿意度等級

瀑布模型

迭代模型

等級1的概率

1/(1+exp(-(-14.3302+2.78502+9.64861*累計測試缺陷密度)))

1/(1+exp(-(-14.3302-2.78502+9.64861*累計測試缺陷密度)))

等級1和2的概率

1/(1+exp(-(-10.3946+2.78502+9.64861*累計測試缺陷密度)))

1/(1+exp(-(-10.3946-2.78502+9.64861*累計測試缺陷密度)))

等級1,2,3的概率

1/(1+exp(-(-6.33092+2.78502+9.64861*累計測試缺陷密度)))

1/(1+exp(-(-6.33092-2.78502+9.64861*累計測試缺陷密度)))

等級1,2,3,4的概率

1/(1+exp(-(-4.42629+2.78502+9.64861*累計測試缺陷密度)))

1/(1+exp(-(-4.42629-2.78502+9.64861*累計測試缺陷密度)))

當採用了瀑布生命週期模型,累計測試缺陷密度爲1時,根據上表可以進行預測:

序號

滿意度等級

瀑布模型

1

等級1的概率

0.1305

2

等級1和2的概率

0.8848

3

等級1,2,3的概率

0.9978

4

等級1,2,3,4的概率

0.9997

5

等級2的概率=(2)-(1)

0.7543

6

等級3的概率=(3)-(2)

0.1129

7

等級4的概率=()-(1)

0.0019

8

等級5的概率=1-(4)

0.0003

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章