支持向量機SVM（三）

原創

2020-02-21 07:54

7 核函數（Kernels）

考慮我們最初在“線性迴歸”中提出的問題，特徵是房子的面積x，這裏的x是實數，結果y是房子的價格。假設我們從樣本點的分佈中看到x和y符合3次曲線，那麼我們希望使用x的三次多項式來逼近這些樣本點。那麼首先需要將特徵x擴展到三維，然後尋找特徵和結果之間的模型。我們將這種特徵變換稱作特徵映射（feature mapping）。映射函數稱作，在這個例子中

我們希望將得到的特徵映射後的特徵應用於SVM分類，而不是最初的特徵。這樣，我們需要將前面公式中的內積從，映射到。

至於爲什麼需要映射後的特徵而不是最初的特徵來參與計算，上面提到的（爲了更好地擬合）是其中一個原因，另外的一個重要原因是樣例可能存在線性不可分的情況，而將特徵映射到高維空間後，往往就可分了。（在《數據挖掘導論》Pang-Ning Tan等人著的《支持向量機》那一章有個很好的例子說明）

將核函數形式化定義，如果原始特徵內積是，映射後爲，那麼定義核函數（Kernel）爲

到這裏，我們可以得出結論，如果要實現該節開頭的效果，只需先計算，然後計算即可，然而這種計算方式是非常低效的。比如最初的特徵是n維的，我們將其映射到維，然後再計算，這樣需要的時間。那麼我們能不能想辦法減少計算時間呢？

先看一個例子，假設x和z都是n維的，

展開後，得

這個時候發現我們可以只計算原始特徵x和z內積的平方（時間複雜度是O(n)），就等價與計算映射後特徵的內積。也就是說我們不需要花時間了。

現在看一下映射函數（n=3時），根據上面的公式，得到

也就是說核函數只能在選擇這樣的作爲映射函數時才能夠等價於映射後特徵的內積。

再看一個核函數

對應的映射函數（n=3時）是

更一般地，核函數對應的映射後特徵維度爲。（求解方法參見http://zhidao.baidu.com/question/16706714.html）。

由於計算的是內積，我們可以想到IR中的餘弦相似度，如果x和z向量夾角越小，那麼核函數值越大，反之，越小。因此，核函數值是和的相似度。

再看另外一個核函數

這時，如果x和z很相近（），那麼核函數值爲1，如果x和z相差很大（），那麼核函數值約等於0。由於這個函數類似於高斯分佈，因此稱爲高斯核函數，也叫做徑向基函數(Radial Basis Function 簡稱RBF)。它能夠把原始特徵映射到無窮維。

既然高斯核函數能夠比較x和z的相似度，並映射到0到1，回想logistic迴歸，sigmoid函數可以，因此還有sigmoid核函數等等。

下面有張圖說明在低維線性不可分時，映射到高維後就可分了，使用高斯核函數。

來自Eric Xing的slides

注意，使用核函數後，怎麼分類新來的樣本呢？線性的時候我們使用SVM學習出w和b，新來樣本x的話，我們使用來判斷，如果值大於等於1，那麼是正類，小於等於是負類。在兩者之間，認爲無法確定。如果使用了核函數後，就變成了，是否先要找到，然後再預測？答案肯定不是了，找很麻煩，回想我們之前說過的

只需將替換成，然後值的判斷同上。

8 核函數有效性判定

問題：給定一個函數K，我們能否使用K來替代計算，也就說，是否能夠找出一個，使得對於所有的x和z，都有？

比如給出了，是否能夠認爲K是一個有效的核函數。

下面來解決這個問題，給定m個訓練樣本，每一個對應一個特徵向量。那麼，我們可以將任意兩個和帶入K中，計算得到。I可以從1到m，j可以從1到m，這樣可以計算出m*m的核函數矩陣（Kernel Matrix）。爲了方便，我們將核函數矩陣和都使用K來表示。

如果假設K是有效地核函數，那麼根據核函數定義

可見，矩陣K應該是個對稱陣。讓我們得出一個更強的結論，首先使用符號來表示映射函數的第k維屬性值。那麼對於任意向量z，得

最後一步和前面計算時類似。從這個公式我們可以看出，如果K是個有效的核函數（即和等價），那麼，在訓練集上得到的核函數矩陣K應該是半正定的（）

這樣我們得到一個核函數的必要條件：

K是有效的核函數 ==> 核函數矩陣K是對稱半正定的。

可幸的是，這個條件也是充分的，由Mercer定理來表達。

Mercer定理：

如果函數K是上的映射（也就是從兩個n維向量映射到實數域）。那麼如果K是一個有效核函數（也稱爲Mercer核函數），那麼當且僅當對於訓練樣例，其相應的核函數矩陣是對稱半正定的。

Mercer定理表明爲了證明K是有效的核函數，那麼我們不用去尋找，而只需要在訓練集上求出各個，然後判斷矩陣K是否是半正定（使用左上角主子式大於等於零等方法）即可。

許多其他的教科書在Mercer定理證明過程中使用了範數和再生希爾伯特空間等概念，但在特徵是n維的情況下，這裏給出的證明是等價的。

核函數不僅僅用在SVM上，但凡在一個模型後算法中出現了，我們都可以常使用去替換，這可能能夠很好地改善我們的算法。

發佈了13 篇原創文章 · 獲贊 17 · 訪問量 8萬+

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

“MobaXterm X11 proxy: Unsupported authorisation protocol”解決方法

服務器無法顯示GUI圖片問題在解決這個問題的時候，可能很多人都搜到了用sudo的方法，但是在我們沒有管理權限的情況下，這個問題也是能解決的。報錯信息我的報錯信息： MobaXterm X11 proxy: Unsupport

大鲨鱼冲鸭

2020-07-05 12:15:34

支持向量機SVM（五）

11 SMO優化算法（Sequential minimal optimization） SMO算法由Microsoft Research的John C. Platt在1998年提出，併成爲最快的二次規劃優化算法，特別針對線性SVM和數

2020-07-01 13:00:54

Stanford機器學習-- 邏輯迴歸和過擬合問題的解決 logistic Regression & Regularization

什麼是邏輯迴歸？ Logistic迴歸與多重線性迴歸實際上有很多相同之處，最大的區別就在於它們的因變量不同，其他的基本都差不多。正是因爲如此，這兩種迴歸可以歸於同一個家族，即廣義線性模型（generalizedlinear model

2020-07-01 13:00:54

支持向量機SVM（四）

9 規則化和不可分情況處理（Regularization and the non-separable case）我們之前討論的情況都是建立在樣例線性可分的假設上，當樣例線性不可分時，我們可以嘗試使用核函數來將特徵映射到高維，這樣很可

2020-07-01 13:00:53

讀Nature文章，看AlphaGo養成

博主是圍棋小白，下棋規則都記不清楚，也沒有設計過棋類AI程序。這篇文章主要是閱讀《Nature》論文及關於AlphaGo的相關文章的學習心得。本文的主要目的是增進分享，交流學習，方便初學者瞭解AlphaGo中的算法，以及一些機器學習中的常

2020-07-01 13:00:53

七步教你精通Python機器學習

開始。這是最容易令人喪失鬥志的兩個字。邁出第一步通常最艱難。當可以選擇的方向太多時，就更讓人兩腿發軟了。從哪裏開始？本文旨

2020-07-01 13:00:53

Halcon19.11（+Deep Learning模塊）在Ubuntu 系統安裝

2019-12.06日更新目錄 1.解壓 2.sudo模式下.sh命令進行程序安裝 3.deep learning模塊解壓拷貝 4.license文件拷貝 5.環境變量設置 6.重啓電腦（or source ~/.bashrc（使環

用户名已存在1

2020-06-25 02:51:48

Ubuntu16.04安裝配置編譯運行Caffe-SSD

一、安裝caffe 官網安裝步驟：http://caffe.berkeleyvision.org/install_apt.html 1.依賴環境安裝： sudo apt-get install libprotobuf-dev liblev

用户名已存在1

2020-06-25 01:47:02

ubuntu 安裝深度學習目標檢測工具箱mmdetection

目錄 1.Anaconda 安裝 2.環境配置 3.安裝Pytorch 4.安裝mmdetection 4.1安裝mmcv 5.demo測試mmdetection error: 1 . ImportError: cannot import

用户名已存在1

2020-06-25 01:46:58

經典卷積神經網絡筆記-VGG16

VGG16論文鏈接： https://arxiv.org/abs/1409.1556 收錄於ICLR2015 網絡結構和配置：作者在這篇論文中主要探討的是使用非常小的卷積核（3*3）來增加捲積神經網絡的深度對於性能有很大的提升。如Tab

2020-06-25 00:22:09

用PyCUDA訪問GPU設備屬性信息

Python提供了一個名爲PyCUDA 的封裝，通過使用Nvidia CUDA API能夠利用GPU的並行計算能力; Python 也有一個PyOpenCL模塊能夠用於任何GPU的並行計算。而PyCUDA是主要針對NVIDIA的GPU

2020-06-19 19:16:55

Tensorflow實現卷積神經網絡識別mnist數字

很久以前寫的代碼，冒個泡 from tensorflow.examples.tutorials.mnist import input_data import tensorflow as tf mnist = input_data

西江月独酌

2020-06-17 16:00:42

Caffe 版 MobileNet-Yolo配置

項目工程鏈接：MobileNet-YOLO 環境：centos7,cuda9.0,cudnn7.5,OpenCV3.3.1 安裝依賴項 1.安裝opencv的依賴項 #首先切換到root權限下： $su $ yum install

2020-06-08 03:02:43

ResNet(V2)結構以及Tensorflow實現

Tensorflow實現ResNet_V2 引言: ResNet是由Kaiming He等4名華人提出，通過使用Residual Unit成功訓練了152層的深度神經網絡，在ILSVRC 2015比賽中獲得冠軍，取得了3.57%

大鲨鱼冲鸭

2020-06-07 02:44:43

GoogleInceptionNet(V3)簡介以及Tensorflow實現

Tensorflow實現GoogleInceptionNet_V3 引言:Google Inception Net首次出現在ILSVRC 2014的比賽中，並且有非常好的性能——top-5的錯誤率6.67%，後來又逐漸提出了In

大鲨鱼冲鸭

2020-06-07 02:44:43

24小時熱門文章

最新文章

最新評論文章