SVM(二)——寬鬆SVM

原創

2020-02-21 02:19

錯分問題與離羣點問題

之前的SVM（http://blog.csdn.net/ice110956/article/details/23436171）推導前提條件是樣本線性可分，或者至少在高維空間中線性可分。但是許多情況下，並不是高維可分的。先考慮如下面這種情況：

由於一個小的離羣點，整個分隔平面發生了很大的改變。於是我們尋求寬鬆的限制原則來改進之前的嚴格SVM，從而也能夠處理高維不可分情況。

考慮加入正則化項，如下：

其中，也就是不是所有的樣本的函數間隔都要大於1，這個條件弱化的離羣點的影響。

當時，函數間隔爲負，也就是樣本錯分。這樣也就是允許一定的錯分。

在目標函數中加入懲罰項

其給離羣的點，錯分的點一定懲罰。

根據之前的對偶規劃，我們也能得到：

對比之前的公式，兩者唯一的不同是KKT互補條件由變爲。

之前論述過，alfa !=0的項是少數的幾個支持向量。同樣的，我們有類似結論：

SMO算法

之前的推導到以alfa爲變量的最優化爲最後形式。下面討論如何解這個問題。

座標上升法

考慮解下面的最優化問題：

其中alfa爲m維的量。

我們直觀地用逐一求解的方法，求解i時，固定其他所有的未知量，依次迭代求解，步驟如下：

稱爲座標上升法，其二維上的求解圖如下：

比較其他常見的下降法，如最速下降，牛頓法等。一般的方法以alfa向量爲單位，根據矩陣求導的方法，每次更新整個向量。

相比而言，座標上升法迭代步驟更多，但是每次求解是都把問題化簡爲一維的最優化問題。也就是雖然步驟增加，但是每次都更簡單。這是座標上升法的優勢。接下來把這種方法運用到SVM的求解中。

SMO算法

考慮我們最後得到的SVM優化公式如下：

其中的最後一個約束項，使得我們不能簡單運用座標上升法。因爲如果固定其他alfa，求解alfa(i)那麼根據最後一個約束項

Alfa(i)也是不可改變的。

於是，我們一次改變兩個變量。

每次根據一定的策略，如順序，選擇兩個變量，固定其他變量，求解兩個變量的最優化，步驟如下：

假設現在選取alfa1，alfa2兩個變量，得到：

簡化表示如下：

其約束在二維空間上表示如下：

Alfa1用alfa2表示：

帶入原問題，得到：

上述可以化爲以alfa2爲變量的一元二次方程：

求解後，再考慮得到的解是否滿足上面的alfa2定義域，如果不滿足，則做一定的裁切，使得得到的結果在定義域內：

發佈了89 篇原創文章 · 獲贊 51 · 訪問量 36萬+

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

風控指南：國內車險欺詐呈現四大趨勢

2024年4月11日，國家金融監督管理總局官網發佈國家金融監督管理總局關於《反保險欺詐工作辦法（徵求意見稿）》公開徵求意見的公告。《徵求意見》共6章、37條，明確反保險欺詐工作目標是建立“監管引領、機構爲主、行業聯防、各方協同”四位一體的

2024-05-23 12:16:45

五款擴展組件齊發 —— Volcano、Keda、Crane-scheduler 等，邀你體驗

今年 3 月，KubeSphere 啓動了首屆擴展組件開發者訓練營，吸引了 60 名開發者報名。經過一個半月的密集培訓和實戰演練，這些開發者成功打造了五款創新的擴展組件，現已全部上架至 KubeSphere Marketplace，歡迎大家

2024-05-23 11:17:40

基於 Milvus + LlamaIndex 實現高級 RAG

隨着大語言模型（LLM）技術的發展，RAG（Retrieval Augmented Generation）技術得到了廣泛探討和研究，越來越多的高級 RAG 檢索方法也隨之被人發現，相對於普通的 RAG 檢索，高級 RAG 通過更深化的技術細

2024-05-22 21:25:18

站在岸上學不會游泳 | 算法校招生的高效成長總結

在這個由數據編織、由算法驅動的時代，AI大模型正成爲推動社會進步的重要力量。我們不僅是變革的見證者，更是推動者和塑造者。感謝零售UP技術人欄目的邀請，本文藉此機會回顧一下自己的算法之路上的一些故事和思考，希望能帶給讀者一些幫助。介紹自

2024-05-22 11:56:42

全球廠商之最，華爲17篇論文入選國際數據庫頂會ICDE

本文分享自華爲雲社區《全球廠商之最，華爲GaussDB&GeminiDB，17篇論文入選國際數據庫頂會ICDE》，作者：GaussDB 數據庫。 5月13-17日，國際數據庫頂級學術會議 ICDE 2024 於荷蘭烏得勒支舉行。華爲Gau

2024-05-22 10:58:13

Gen AI 連接非結構化數據，Unstructured Data Meetup 第二場官宣杭州！

定了！6 月 15 日，備受硅谷開發者喜愛的 Unstructured Data Meetup 第二場將在杭州舉辦！衆所周知，AI 三要素包括：算力、算法和數據。數據的價值愈發凸顯，而其中非結構化數據更是備受關注。IDC 預測，到 202

2024-05-20 21:25:07

探索未知：風靡硅谷開發者的 Unstructured Data Meetup 即將登陸中國

“最硅谷”的 Unstructured Data Meetup 即將來襲！衆所周知，AI 三要素包括：算力、算法和數據。數據的價值愈發凸顯，而其中非結構化數據更是備受關注。IDC 預測，到 2025 年，全球數據總量中將有超過

2024-05-15 21:26:01

爲程序員和新手準備的 8 大 Python 工具

Python 是一種開源編程語言，用於 Web 編程、數據科學、人工智能和許多科學應用。學習 Python 使程序員能夠專注於解決問題，而不是專注於語法，其豐富的庫賦予它完成偉大任務所需的力量。 1) IDLE 安裝 Python 時

2024-05-14 01:06:43

我宣佈，這是我找到的史上AI最全論文體系！

在碎片化閱讀充斥眼球的時代，越來越少的人會去關注每篇論文背後的探索和思考。搞AI，不少人都進入一個誤區，那就是隻鑽研自己的代碼是否精進，而沒有注意提升自己的閱讀能力。實際上，一個專業的學術研究員或者AI研究員可能需要花費幾百個小

2024-05-13 21:33:50

探索未知：風靡硅谷開發者的 Unstructured Data Meetup 即將登陸中國l

“最硅谷”的 Unstructured Data Meetup 即將來襲！衆所周知，AI 三要素包括：算力、算法和數據。數據的價值愈發凸顯，而其中非結構化數據更是備受關注。IDC 預測，到 2025 年，全球數據總量中將有超過 80% 的

2024-05-13 21:25:35

攻擊者正在利用AI，對保險公司發起大規模欺詐

保險欺詐一直是保險行業面臨的重要挑戰之一，尤其隨着技術的進步，欺詐者也在不斷更新其手段，利用AI技術，包括生成式模型、機器學習和數據分析工具等欺騙保險公司，而AI技術的應用正成爲他們的新工具，使其犯罪行爲更加隱蔽和複雜，挑戰保險行業的防欺詐

2024-05-10 00:55:17

理論+實踐，帶你瞭解分佈式訓練

本文分享自華爲雲社區《大模型LLM之分佈式訓練》，作者：碼上開花_Lancer。隨着語言模型參數量和所需訓練數據量的急速增長，單個機器上有限的資源已無法滿足大語言模型訓練的要求。需要設計分佈式訓練（Distributed Trainin

2024-05-08 22:38:41

2024年DataOps趨勢預測：AI不會取代數據工程師

APM digest收集了多位行業專家對DataOps在2024的發展形勢及對IT和業務的影響的預測，這些技術最高管理者，包括Confluent技術戰略負責人Andrew Sellers的深刻洞見可能與你的感覺一致嗎？快來探討一下。數據可

2024-04-30 11:49:29

數字化轉型新篇章：企業通往智能化的新範式

早在十多年前，一些具有前瞻視野的企業以實現“數字化”爲目標啓動轉型實踐。但時至今日，可以說尚無幾家企業能夠在真正意義上實現“數字化”。在實現“數字化”的征途上，人們發現，努力愈進，彷彿終點愈遠。究其原因，還在於轉型一直落後於技術邊界的拓展

2024-04-29 21:22:20

Stable Diffusion中的embedding

Stable Diffusion中的embedding 嵌入，也稱爲文本反轉，是在 Stable Diffusion 中控制圖像樣式的另一種方法。在這篇文章中，我們將學習什麼是嵌入，在哪裏可以找到它們，以及如何使用它們。什麼是嵌入embe

2024-04-25 21:31:13

24小時熱門文章

最新文章

最新評論文章