logistic regression與R

logistic regression可以用在CTR(Click Through Rate)預估上,即通常所說的點擊率預估。點擊率預估的意義在於,在電子商務中,可以通過把點擊率高的商品放在首頁或者重點推薦給用戶,這樣用戶可以有更大的機會看見這些易受歡迎的商品,這樣就可以促進銷量,提高商家的利潤。

logistic函數也稱爲sigmoid函數是在logistic迴歸中使用的函數,其形式爲

                                     

其圖形如下:

logistic迴歸模型在二項分佈族中是最重要的模型,在某些迴歸問題中,響應變量是分類的,經常是成功或者失敗。對於這些問題,正態線性模型顯然不合適,因爲正態誤差不對應一個0-1響應。

對於響應變量Y有p個自變量,記爲在p個自變量的作用下出現成功的條件概論記爲,那麼logistic迴歸模型爲 

                                        

其中稱爲截距,稱爲logistic模型迴歸係數。

logistic迴歸模型是一個非線性迴歸模型,自變量的變化範圍爲整個實軸,經過logistic變換到[0,1]之間,正是概率P的取值空間。

R軟件中計算logistic迴歸模型的語句爲

fm <- glm(formula, family = binomial (link = logit), data = data.frame)

式中link = logit可以不寫,因爲logistic是二項分佈族連接函數,是默認狀態。


發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章