SVM原理
設數據集D={(x1,y1),(x2,y2),...,(xm,ym)},yi∈{−1,+1}。SVM的基本想法是求解一個劃分超平面wTx+b=0,它不僅能將樣本劃分爲正類和負類,還具有最大的幾何間隔。確定了超平面的w和b後,模型可以表示爲f(x)=sign(wTx+b)。
超平面(w,b)關於樣本點(xi,yi)的幾何間隔定義爲γi=yi{∥w∥wTxi+b},它等於樣本點到超平面的帶符號的距離。
當樣本點被正確分類時,wTx+b與yi同號,此時幾何間隔大於0,等於樣本點到超平面的距離。因此樣本點的正確分類等價於不等式約束yi(wTxi+b)≥ϵ,其中ϵ爲某個大於0的常數。
不等式兩邊同除ϵ可得yi(ϵwTxi+ϵb)≥1。由於w和b同時按比例改變後超平面wTx+b=0不變,故該約束可以表述爲yi(wTxi+b)≥1。
距離超平面最近的樣本點剛好使得不等式約束中的等號成立(即它們的函數間隔等於1),它們被稱爲“支持向量”,正負類的支持向量到超平面的距離之和爲γ=∥w∥2
超平面(w,b)關於樣本點(xi,yi)的函數間隔定義爲XXXX,函數間隔除以。。
在該不等式約束下,我們希望最大化