logistic regression可以用在CTR(Click Through Rate)預估上,即通常所說的點擊率預估。點擊率預估的意義在於,在電子商務中,可以通過把點擊率高的商品放在首頁或者重點推薦給用戶,這樣用戶可以有更大的機會看見這些易受歡迎的商品,這樣就可以促進銷量,提高商家的利潤。
logistic函數也稱爲sigmoid函數是在logistic迴歸中使用的函數,其形式爲
其圖形如下:
logistic迴歸模型在二項分佈族中是最重要的模型,在某些迴歸問題中,響應變量是分類的,經常是成功或者失敗。對於這些問題,正態線性模型顯然不合適,因爲正態誤差不對應一個0-1響應。
對於響應變量Y有p個自變量,記爲在p個自變量的作用下出現成功的條件概論記爲,那麼logistic迴歸模型爲
其中稱爲截距,稱爲logistic模型迴歸係數。
logistic迴歸模型是一個非線性迴歸模型,自變量的變化範圍爲整個實軸,經過logistic變換到[0,1]之間,正是概率P的取值空間。
R軟件中計算logistic迴歸模型的語句爲
fm <- glm(formula, family = binomial (link = logit), data = data.frame)
式中link = logit可以不寫,因爲logistic是二項分佈族連接函數,是默認狀態。