再學西瓜書----chapter6 支持向量機SVM

原創

2020-06-29 23:11

Page 121~Page 123
比較好的推文可以參考這篇，講的比西瓜書詳細

關於svm的推導不準備贅述了，這裏只注重結論，

超平面 w^Tx+ b = 0
對於線性可分的情況，超平面其實是我們需要求的東西
支持向量 就是離超平面最近的向量，可以是一個可以是多個
根據相關公式推導：最終要求的最優的超平面其實只要優化

凸函數： 對於一元函數f(x)，我們可以通過其二階導數f″(x) 的符號來判斷。如果函數的二階導數總是非負，即f″(x)≥0 ，則f(x)是凸函數對於多元函數f(x)，我們可以通過其Hessian矩陣（Hessian矩陣是由多元函數的二階導數組成的方陣）的正定性來判斷。如果Hessian矩陣是半正定矩陣，則是f(x)凸函數， 凸函數是強對偶函數。
SVM步驟：

構造拉格朗日函數

通過強對偶性轉化：先求最小化 w,b帶入原式中，
a:轉化
原來的最小最大問題可以轉化爲最大最小問題
b:求偏導，帶入原函數
SMO算法求解

SMO(Sequential Minimal Optimization)，序列最小優化算法，其核心思想非常簡單：每次只優化一個參數，其他參數先固定住，僅求當前這個優化參數的極值。我們來看一下 SMO 算法在 SVM 中的應用。
多次迭代求解出 $\lambda$ _i,
帶入2中解出w,b
建立超平面使用決策函數sign(.)分類