支持向量機二：非線性支持向量機

如果您還未了解線性向量機，建議首先閱讀

一、爲什麼要用非線性支持向量機？

線性支持向量機不香嗎？爲什麼還要用非線性支持向量機？
線性支持向量機香是香，但並不適合大多數數據集啊。比如下圖這個數據，使用線性SVM就無法劃分。
非線性SVM的話便可以解決這個問題，因爲非線性SVM通過將低維的數據集變換成高位的數據集，從而使線性不可分的數據可分。上圖的數據經變換成下圖的方式，數據便可分了。

二、低維怎麼到高維的呢？— 核函數介紹

對於線性不可分數據集 $D=\{(x_1,y_1),(x_2,y_2),...,(x_n,y_n)\}$ ,其中 $x_i$ 是第 $i$ 個實例， $y_i$ 是 $x_i$ 的類標籤，並且有 $y_i∈\{-1,1\}$ 。我們需要通過變換將數據集 $D$ 轉換到較高的維度，核函數就是一個很好的方法。我們假設原數據集的空間爲 $\Chi$ ，我們的數據集一般可以度量並且可以計算內積，但我們的數據集不能存在極限，所以 $\Chi$ 屬於歐式空間。

2.1 核函數是什麼

我們來看看核函數是什麼，我們希望將輸入空間 $\Chi$ (歐式空間)映射到特徵空間 $\Eta$ (希爾伯特空間)，如果存在一個從 $\Chi$ 到 $\Eta$ 的映射 $\phi(x):\Chi\rarr\Eta$ 使得對所有 $x_i,x_j∈\Chi$ ，函數 $K(x_i,x_j)$ 滿足條件 $K(x_i,x_j)=\phi(x_i).\phi(x_j)$ 則稱 $K(x_i,x_j)$ 爲核函數， $\phi(x)$ 爲映射函數，式中 $\phi(x_i).\phi(x_j)$ 爲 $\phi(x_i)$ 與 $\phi(x_j)$ 的內積。

2.2 簡單介紹一下歐式空間與希爾伯特空間

如果你是入門者，你可能感嘆“天哪！什麼跟什麼啊！這就是核函數啦？什麼是歐式空間?什麼是希爾伯特空間？”簡單說一句，以便你理解歐式空間與希爾伯特空間。

歐式空間裏的元素是可以計算距離的，並且歐式空間中的元素之間的角度也是可以通過內積計算的。如下圖， $v_1,v_2$ 的距離是可度量的，並且通過內積可以計算其夾角。“可度量，有內積？這就夠了嗎？”不夠。考慮一下我們日常使用的數據，首先你會提出極限值，因爲極限值是無法度量的，你或許會用一個很大的值代表無限，但是這個很大的值並不是無限的度量。另外你的數據中某個實例肯定是有限維的，就比如你研究你和某人合不合適，你會分析多少個方面（維度呢），但無論多少個都不會是無限個，即使你子子孫孫無窮盡也也不會子子孫孫去分析無限個。再比如，雖然說大數據時代數據特徵特別高，但是也是有限度的，不然電腦和硬盤存不下，而且你也會對這些特徵進行特徵篩選獲取最主要的特徵。因此除了可度量，有內積，歐式空間還是不考慮極限，維度有限的。最後一點就是歐式空間屬於實數域。

希爾伯特空間又是什麼？“希爾伯特空間=歐式空間+維度無限+可定義極限”，希爾伯特空間是在歐式空間的基礎上加了完備性，也就是說希爾伯特空間除了可度量，有內積之外，其內的元素存在無極限的情況，而且允許維度無限維，並且屬於複數域。也因爲希爾伯特空間允許無限維度和極限值，所以希爾伯特空間往往是更高維的空間，甚至是無窮維的空間。目前希爾伯特空間多運用在泛函分析和量子力學中。

三、核函數如何與SVM產生聯繫

我在《支持向量機：線性支持向量機》中已經介紹了線性支持向量機最終要解決的對偶問題，即： $min_a\ \ \frac{1}{2}\sum_{i=1}^{N}\sum_{j=1}^Na_ia_jy_iy_j(x_i.x_j)-\sum_{i=1}^Na_i \ \ ... \ \ (1) \\\ s.t.\ \ \sum_{i=1}^Na_iy_i=0, \ \ \ \ \ i=1,2,.,N \ \ ...\ \ (2)\\\ 0\leq a_i\leq C,\ \ \ \ i=1,2,.,N\ \ ...\ \ (3)$ 非線性支持向量機便是使用 $K(x_i,x_j)$ 代替式(1)中的 $(x_i,x_j)$ 。不要誤會，雖然我們這裏是從式(1)開始替換，但其實從數據集 $D$ 開始將 $x_i$ 映射到 $\phi(x_i)$ 的，只不過最後得到式子與從式(1)開始替換一樣。並且從式(1)替換還有另外一個原因，就是找到一個映射 $\phi(x):\Chi\rarr\Eta$ 是很難的操作，所以研究人員往往先確定 $K(x_i,x_j)$ 再從 $K(x_i,x_j)=\phi(x_i).\phi(x_j)$ 反推得到 $\phi(x)$ 。因此我們得到了非線性支持向量機最終要解決的對偶問題，即： $min_a\ \ \frac{1}{2}\sum_{i=1}^{N}\sum_{j=1}^Na_ia_jy_iy_jK(x_i.x_j)-\sum_{i=1}^Na_i \ \ ... \ \ (4) \\\ s.t.\ \ \sum_{i=1}^Na_iy_i=0, \ \ \ \ \ i=1,2,.,N \ \ ...\ \ (5)\\\ 0\leq a_i\leq C,\ \ \ \ i=1,2,.,N\ \ ...\ \ (6)$

四、非線性SVM的分離超平面與目標決策函數

首先，我們來回顧以下線性SVM的分離超平面： $\sum_{i=1}^Na_i^*y_i(x_i·x)+b^*=0\ \ ...\ \ (7)$ 以及線性SVM分類決策函數： $f(x)=sign(\sum_{i=1}^Na_i^*y_i(x_i·x)+b^*)\ \ ... \ \ (8)$
並且在線性SVM中，我們確定參數 $b$ 的規則是 $b^*=y_j-\sum_{i=1}^Na_i^*y_i(x_i.x_j)\ \ ...\ \ (9)$ 式(7)(8)(9)的獲得已在《支持向量機：線性支持向量機》中解釋，想了解的請移步以下。

根據式(7)(8)(9)，我們來求解以下非線性SVM的分離超平面和分類決策函數。

首先，通過SMO算法我們求得式(4)(5)(6)的最優解 $a=(a_1^*,a_2^*,...,a_N^*)^T$ 其次，我們從 $a^*$ 中選擇一個分量 $a_j^*$ （要求 $0\leq a_j^*\leq C$ ，這也表明 $b^*$ 不唯一），根據式（9）有 $b^*=y_j-\sum_{i=1}^Na_i^*y_iK(x_i,x)$ 於是，我們求得分離超平面： $\sum_{i=1}^Na_i^*y_iK(x_i,x)+b^*=0$ 還有分類決策函數： $f(x)=sign(\sum_{i=1}^Na_i^*y_iK(x_i,x)+b^*)$

五、介紹幾個常用的核函數

隨便寫一個 $K(x_i,x_j)$ 就是核函數了嗎？當然不是， $K(x_I,x_j)$ 必須滿足一定的條件纔會是核函數，而這個條件就是核函數必須是正定核函數。我們對什麼是正定核不做多餘的解釋，但是我們可以介紹兩個成功的核函數。

多項式核函數 $K(x_i,x)=(x_i·x+1)^p$ 其對應的決策函數 $f(x)=sign(\sum_{i=0}^Na_i^*y_i(x_i·x+1)^p+b^*)$
高斯核函數 $K(x_i,x)=\exp(-\frac{||x_i-x||^2}{2\sigma^2})$ 其對應的決策函數 $f(x)=sign(\sum_{i=0}^Na_i^*y_i\exp(-\frac{||x_i-x||^2}{2\sigma^2}))$

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

支持向量機二：非線性支持向量機

如果您還未了解線性向量機，建議首先閱讀

一、爲什麼要用非線性支持向量機？

二、低維怎麼到高維的呢？— 核函數介紹

2.1 核函數是什麼

2.2 簡單介紹一下歐式空間與希爾伯特空間

三、核函數如何與SVM產生聯繫

四、非線性SVM的分離超平面與目標決策函數

五、介紹幾個常用的核函數

linux安裝cuda和cudnn

模擬手機設備：使用 Playwright 實現移動端自動化測試

Mellanox網卡開啓SR-IOV

全面系統的AI學習路徑，幫助普通人也能玩轉AI

HTML 00 Tutorial

uni-app實現上拉加載

vue3編譯優化之“靜態提升”

又是一個月-20240513

flask 如何保證返回json有序

linux服務器設置ssh免密

支持向量機三：序列最小最優化算法---SMO

支持向量機一：線性支持向量機介紹

支持向量機二：非線性支持向量機

SimpleITK的使用介紹

Image 常用命令整理

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結

支持向量機 二 ：非線性支持向量機

如果您還未了解 線性向量機，建議首先閱讀

一、爲什麼要用非線性支持向量機？

二、低維怎麼到高維的呢？— 核函數介紹

2.1 核函數是什麼

2.2 簡單介紹一下 歐式空間 與 希爾伯特空間

三、核函數如何與SVM產生聯繫

四、非線性SVM的 分離超平面 與 目標決策函數

五、介紹幾個常用的核函數

支持向量機二：非線性支持向量機

如果您還未了解線性向量機，建議首先閱讀

2.2 簡單介紹一下歐式空間與希爾伯特空間

四、非線性SVM的分離超平面與目標決策函數