支持向量機SVM（四）

原創

2020-07-01 13:00

9 規則化和不可分情況處理（Regularization and the non-separable case）

我們之前討論的情況都是建立在樣例線性可分的假設上，當樣例線性不可分時，我們可以嘗試使用核函數來將特徵映射到高維，這樣很可能就可分了。然而，映射後我們也不能100%保證可分。那怎麼辦呢，我們需要將模型進行調整，以保證在不可分的情況下，也能夠儘可能地找出分隔超平面。

看下面兩張圖：

可以看到一個離羣點（可能是噪聲）可以造成超平面的移動，間隔縮小，可見以前的模型對噪聲非常敏感。再有甚者，如果離羣點在另外一個類中，那麼這時候就是線性不可分了。

這時候我們應該允許一些點遊離並在在模型中違背限制條件（函數間隔大於1）。我們設計得到新的模型如下（也稱軟間隔）：

引入非負參數後（稱爲鬆弛變量），就允許某些樣本點的函數間隔小於1，即在最大間隔區間裏面，或者函數間隔是負數，即樣本點在對方的區域中。而放鬆限制條件後，我們需要重新調整目標函數，以對離羣點進行處罰，目標函數後面加上的就表示離羣點越多，目標函數值越大，而我們要求的是儘可能小的目標函數值。這裏的C是離羣點的權重，C越大表明離羣點對目標函數影響越大，也就是越不希望看到離羣點。我們看到，目標函數控制了離羣點的數目和程度，使大部分樣本點仍然遵守限制條件。

模型修改後，拉格朗日公式也要修改如下：

這裏的和都是拉格朗日乘子，回想我們在拉格朗日對偶中提到的求法，先寫出拉格朗日公式（如上），然後將其看作是變量w和b的函數，分別對其求偏導，得到w和b的表達式。然後代入公式中，求帶入後公式的極大值。整個推導過程類似以前的模型，這裏只寫出最後結果如下：

此時，我們發現沒有了參數，與之前模型唯一不同在於又多了的限制條件。需要提醒的是，b的求值公式也發生了改變，改變結果在SMO算法裏面介紹。先看看KKT條件的變化：

第一個式子表明在兩條間隔線外的樣本點前面的係數爲0，離羣樣本點前面的係數爲C，而支持向量（也就是在超平面兩邊的最大間隔線上）的樣本點前面係數在(0,C)上。通過KKT條件可知，某些在最大間隔線上的樣本點也不是支持向量，相反也可能是離羣點。

10 座標上升法（Coordinate ascent）

在最後討論的求解之前，我們先看看座標上升法的基本原理。假設要求解下面的優化問題：

這裏W是向量的函數。之前我們在迴歸中提到過兩種求最優解的方法，一種是梯度下降法，另外一種是牛頓法。現在我們再講一種方法稱爲座標上升法（求解最小值問題時，稱作座標下降法，原理一樣）。

方法過程：

最裏面語句的意思是固定除之外的所有，這時W可看作只是關於的函數，那麼直接對求導優化即可。這裏我們進行最大化求導的順序i是從1到m，可以通過更改優化順序來使W能夠更快地增加並收斂。如果W在內循環中能夠很快地達到最優，那麼座標上升法會是一個很高效的求極值方法。

下面通過一張圖來展示：

橢圓代表了二次函數的各個等高線，變量數爲2，起始座標是(2,-2)。圖中的直線式迭代優化的路徑，可以看到每一步都會向最優值前進一步，而且前進路線是平行於座標軸的，因爲每一步只優化一個變量。

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

“MobaXterm X11 proxy: Unsupported authorisation protocol”解決方法

服務器無法顯示GUI圖片問題在解決這個問題的時候，可能很多人都搜到了用sudo的方法，但是在我們沒有管理權限的情況下，這個問題也是能解決的。報錯信息我的報錯信息： MobaXterm X11 proxy: Unsupport

大鲨鱼冲鸭

2020-07-05 12:15:34

支持向量機SVM（五）

11 SMO優化算法（Sequential minimal optimization） SMO算法由Microsoft Research的John C. Platt在1998年提出，併成爲最快的二次規劃優化算法，特別針對線性SVM和數

2020-07-01 13:00:54

Stanford機器學習-- 邏輯迴歸和過擬合問題的解決 logistic Regression & Regularization

什麼是邏輯迴歸？ Logistic迴歸與多重線性迴歸實際上有很多相同之處，最大的區別就在於它們的因變量不同，其他的基本都差不多。正是因爲如此，這兩種迴歸可以歸於同一個家族，即廣義線性模型（generalizedlinear model

2020-07-01 13:00:54

讀Nature文章，看AlphaGo養成

博主是圍棋小白，下棋規則都記不清楚，也沒有設計過棋類AI程序。這篇文章主要是閱讀《Nature》論文及關於AlphaGo的相關文章的學習心得。本文的主要目的是增進分享，交流學習，方便初學者瞭解AlphaGo中的算法，以及一些機器學習中的常

2020-07-01 13:00:53

七步教你精通Python機器學習

開始。這是最容易令人喪失鬥志的兩個字。邁出第一步通常最艱難。當可以選擇的方向太多時，就更讓人兩腿發軟了。從哪裏開始？本文旨

2020-07-01 13:00:53

Halcon19.11（+Deep Learning模塊）在Ubuntu 系統安裝

2019-12.06日更新目錄 1.解壓 2.sudo模式下.sh命令進行程序安裝 3.deep learning模塊解壓拷貝 4.license文件拷貝 5.環境變量設置 6.重啓電腦（or source ~/.bashrc（使環

用户名已存在1

2020-06-25 02:51:48

Ubuntu16.04安裝配置編譯運行Caffe-SSD

一、安裝caffe 官網安裝步驟：http://caffe.berkeleyvision.org/install_apt.html 1.依賴環境安裝： sudo apt-get install libprotobuf-dev liblev

用户名已存在1

2020-06-25 01:47:02

ubuntu 安裝深度學習目標檢測工具箱mmdetection

目錄 1.Anaconda 安裝 2.環境配置 3.安裝Pytorch 4.安裝mmdetection 4.1安裝mmcv 5.demo測試mmdetection error: 1 . ImportError: cannot import

用户名已存在1

2020-06-25 01:46:58

經典卷積神經網絡筆記-VGG16

VGG16論文鏈接： https://arxiv.org/abs/1409.1556 收錄於ICLR2015 網絡結構和配置：作者在這篇論文中主要探討的是使用非常小的卷積核（3*3）來增加捲積神經網絡的深度對於性能有很大的提升。如Tab

2020-06-25 00:22:09

用PyCUDA訪問GPU設備屬性信息

Python提供了一個名爲PyCUDA 的封裝，通過使用Nvidia CUDA API能夠利用GPU的並行計算能力; Python 也有一個PyOpenCL模塊能夠用於任何GPU的並行計算。而PyCUDA是主要針對NVIDIA的GPU

2020-06-19 19:16:55

Tensorflow實現卷積神經網絡識別mnist數字

很久以前寫的代碼，冒個泡 from tensorflow.examples.tutorials.mnist import input_data import tensorflow as tf mnist = input_data

西江月独酌

2020-06-17 16:00:42

Caffe 版 MobileNet-Yolo配置

項目工程鏈接：MobileNet-YOLO 環境：centos7,cuda9.0,cudnn7.5,OpenCV3.3.1 安裝依賴項 1.安裝opencv的依賴項 #首先切換到root權限下： $su $ yum install

2020-06-08 03:02:43

ResNet(V2)結構以及Tensorflow實現

Tensorflow實現ResNet_V2 引言: ResNet是由Kaiming He等4名華人提出，通過使用Residual Unit成功訓練了152層的深度神經網絡，在ILSVRC 2015比賽中獲得冠軍，取得了3.57%

大鲨鱼冲鸭

2020-06-07 02:44:43

GoogleInceptionNet(V3)簡介以及Tensorflow實現

Tensorflow實現GoogleInceptionNet_V3 引言:Google Inception Net首次出現在ILSVRC 2014的比賽中，並且有非常好的性能——top-5的錯誤率6.67%，後來又逐漸提出了In

大鲨鱼冲鸭

2020-06-07 02:44:43

[Python] numpy中運算符* @ mutiply dot的用法分析

引言: 最近同學在做機器學習作業時，代碼中遇到了* @ np.mutiply .dot這個幾個numpy的運算，發現有點暈，於是我在這裏做幾個簡單的對比，以及列舉需要注意的問題首先先給一個比較簡單的用法解釋： *：

大鲨鱼冲鸭

2020-06-07 02:44:33

24小時熱門文章

最新文章

最新評論文章