SVM筆記

SVM原理

設數據集D={(x1,y1),(x2,y2),...,(xm,ym)},yi{1,+1}D=\{(\boldsymbol{x_1},y_1),(\boldsymbol{x_2},y_2),...,(\boldsymbol{x_m},y_m)\},y_i \in \{-1,+1\}。SVM的基本想法是求解一個劃分超平面wTx+b=0\boldsymbol{w^Tx}+b=0,它不僅能將樣本劃分爲正類和負類,還具有最大的幾何間隔。確定了超平面的w\boldsymbol{w}bb後,模型可以表示爲f(x)=sign(wTx+b)f(x)=sign(\boldsymbol{w^Tx}+b)

超平面(w,b)(\boldsymbol{w},b)關於樣本點(xi,yi)(\boldsymbol{x_i},y_i)的幾何間隔定義爲γi=yi{wTxi+bw}\gamma_i=y_i\left\{\frac{\boldsymbol{w^Tx_i}+b}{\Vert \boldsymbol w \Vert}\right\},它等於樣本點到超平面的帶符號的距離。

當樣本點被正確分類時,wTx+b\boldsymbol{w^Tx}+byiy_i同號,此時幾何間隔大於0,等於樣本點到超平面的距離。因此樣本點的正確分類等價於不等式約束yi(wTxi+b)ϵy_i(\boldsymbol{w^Tx_i}+b)\geq \epsilon,其中ϵ\epsilon爲某個大於0的常數。

不等式兩邊同除ϵ\epsilon可得yi(wϵTxi+bϵ)1y_i(\frac{w}{\epsilon}^Tx_i+\frac{b}{\epsilon})\geq 1。由於w\boldsymbol{w}bb同時按比例改變後超平面wTx+b=0\boldsymbol{w^Tx}+b=0不變,故該約束可以表述爲yi(wTxi+b)1y_i(\boldsymbol{w^Tx_i}+b)\geq 1

距離超平面最近的樣本點剛好使得不等式約束中的等號成立(即它們的函數間隔等於1),它們被稱爲“支持向量”,正負類的支持向量到超平面的距離之和爲γ=2w\gamma=\frac{2}{\Vert \boldsymbol w \Vert}

超平面(w,b)(\boldsymbol{w},b)關於樣本點(xi,yi)(\boldsymbol{x_i},y_i)的函數間隔定義爲XXXX,函數間隔除以。。

在該不等式約束下,我們希望最大化

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章