邏輯迴歸 Logistic Regression

文章目錄

介紹

參數估計

介紹

邏輯迴歸（Logistic Regression）是機器學習中一種應用非常廣泛的分類預測算法，而且簡單。工業中廣泛應用LR算法，例如CTR預估，推薦系統等。邏輯迴歸模型的預測函數爲：
$h_{w,b}(x) = \frac{1}{1+e^{-(w^\mathrm{T}x+b)}}$
其中 $w,b$ 爲模型參數。

Sigmoid函數

首先 $f(x)=sigmoid(x)=\frac{1}{1+e^{-x}}$ 的定義域爲 $R$ ，值域爲 $(0,1)$ ，兩端不可取。 $sigmoid(x)$ 關於點（0, $\frac{1}{2}$ ）對稱。其函數圖爲：

而且非常重要的一點， $sigmoid(x)^{\prime} = sigmoid(x)(1-sigmoid(x))$ 。

LR模型

考慮二分類任務， $y\in\{0,1\}$ ，有：
$P(y=1|x;w,b) = \frac{e^{(w^\mathrm{T}x+b)}}{1+e^{(w^\mathrm{T}x+b)}}$
$P(y=0|x;w,b) = \frac{1}{1+e^{(w^\mathrm{T}x+b)}}$
考慮到w是一個向量，我們令 $\Theta = (w_{1},w_{2},w_{3},w_{4},...,b)$ ，表示的是樣本每一個屬性 $x_{j}$ 的權重。相應的， $\mathbf x=(x_{1},x_{2},x_{3},x_{4},...,1)$ ，則模型預測函數可以改寫成：
$h_{\theta}(x) = \frac{1}{1+e^{-(\Theta ^\mathrm{T}\mathbf x)}}$
然後，我們用極大似然估計法來估計模型參數 $\Theta$ ，有：
$L(\Theta) = -\frac{1}{m}\sum_{i=1}^{m}(y^{(i)}\log(h_{\theta}(x^{(i)}))+(1-y^{(i)})\log(1-h_{\theta}(x^{(i)})))$
則我們的優化目標是找到能使目標函數最小的參數：
${\hat\Theta}=\argmin L(\Theta)$

參數估計

LR的目標函數是關於 $\Theta$ 的凸函數，並且連續可導，這裏可以採用梯度下降來求解其最優解：
$\frac{\partial L(\Theta)}{\partial \Theta_{j}}=-\frac{1}{m}\sum_{i=1}^{m}(y^{(i)}\frac{1}{h_{\theta}(x^{(i)})}-(1-y^{(i)})\frac{1}{1-h_{\theta}(x^{(i)})})\frac{\partial h_{\theta}(x^{(i)})}{\partial \Theta_{j}}=-\frac{1}{m}\sum_{i=1}^{m}(y^{(i)}-h_{\theta}(x^{(i)}))x_{j}$
則每次梯度下降更新參數：
$\Theta_{j} = \Theta_{j} +\frac{1}{m}\sum_{i=1}^{m}(y^{(i)}-h_{\theta}(x^{(i)}))x_{j}$

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

邏輯迴歸 Logistic Regression

文章目錄

介紹

Sigmoid函數

LR模型

參數估計

LeetCode技巧篇（二）Two points for Sliding Window 滑動窗口中的雙指針

機器學習算法工程師實習面經

機器學習樹模型——從決策樹開始

知識圖譜經典方法 Knowledge Graph Embedding：從TransE，TransH到TransR

論文閱讀：RippleNet：讓用戶偏好在知識圖譜中像水波紋一樣傳播

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結