algo_Coordinate descent

原創

2020-02-26 00:36

首先介紹一個算法：coordinate-wise minimization

問題的描述：給定一個可微的凸函數，如果在某一點x，使得f(x)在每一個座標軸上都是最小值，那麼f(x)是不是一個全局的最小值。

形式化的描述爲：是不是對於所有的d，i都有

這裏的代表第i個標準基向量。

答案爲成立。

這是因爲：

但是問題來了，如果對於凸函數f，若不可微該會怎樣呢？

答案爲不成立，上面的圖片就給出了一個反例。

那麼同樣的問題，現在，其中g是可微的凸函數，每一個hi都是凸的？

答案爲成立。

證明如下，對每一個y

座標下降(Coordinate descent)：

這就意味着，對所有的，其中g是可微的凸函數，每一個hi都是凸的，我們可以使用座標下降尋求一個最小值，我們從一個最初的猜想開始，對k進行循環：

每一次我們解決了，我們都會使用新的值。

Tseng (2001)的開創性工作證明：對這種f（f在緊集上連續，且f到達了其最小值），的極限值，k=1,2,3….是f的一個最小元(minimizer)。

在實分析領域：

隨後收斂與x*( Bolzano-Weierstrass)

收斂於f*( monotoneconvergence)

其中：

座標下降的順序是任意的，可以是從1到n的任意排列。

可以在任何地方將單個的座標替代成座標塊

關鍵在於一次一個地更新，所有的一起更新有可能會導致不收斂

我們現在討論一下座標下降的應用：

線性迴歸：

令，其中，A有p列：

最小化xi，對所有的xj，j不等於i：

解得：

座標下降重複這個更新對所有的

對比座標下降與梯度下降在線性迴歸中的表現（100個實例，n=100，p=20）

將座標下降的一圈與梯度下降的一次迭代對比是不是公平呢？是的。

其中r=y-Ax。每一次的座標更新需要O(n)個操作，其中O(n)去更新r，O(n)去計算，所以一圈就需要O(np)，跟梯度下降是一樣的。

我們用相同的例子，用梯度下降進行比較，似乎是與計算梯度下降的最優性相違背。

那麼座標下降是一個一階的方法嗎？事實上不是，它使用了比一階更多的信息。

現在我們再關注一下支持向量機：

SVM對偶中的座標下降策略：

SMO(Sequentialminimal optimization)算法是兩塊的座標下降，使用貪心法選擇下一塊，而不是用循環。

回調互補鬆弛條件(complementaryslackness conditions)：

v，d，s是原始的係數，截距和鬆弛，其中，使用任何的（1）中i使得來計算d，利用（1）（2）來計算2.

SMO重複下面兩步：

選出不滿足互補鬆弛的αi，αj

最小化 αi，αj使所有的變量滿足條件

第一步使用啓發式的方法貪心得尋找αi，αj，第二步使用等式約束。

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

智慧家庭場景的推薦系統的發展歷程和方向 | InfoQ《公開課》

直播概要：隨着計算機的蓬勃發展，互聯網進入大數據和人工智能時代，爲了解決信息過載和長尾商品，推薦系統成爲唯一選擇，而面對不同的業務場景，爲了解決業務痛點，會根據不同的場景特點尋找不同的方法和手段來解決推薦中實際遇到的問題。在智慧家庭領域，

InfoQ 中文站

2021-12-21 10:54:01

Alexa 全球排名網站將關閉，排名曾引爭議

{"type":"doc","content":[{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"typ

2021-12-14 14:53:55

Thinking Above Code：TLA+思維概述

{"type":"doc","content":[{"type":"blockquote","content":[{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null

2021-12-07 17:23:58

你的2.6朵雲裏，會有火山引擎嗎？

{"type":"doc","content":[{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"typ

2021-12-07 10:28:54

數字化轉型這麼火，你真的看懂了嗎？

{"type":"doc","content":[{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"typ

2021-12-02 21:08:57

基於圖像的機器學習技術將數十億的電子商務產品分爲數千個類別

{"type":"doc","content":[{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"typ

2021-11-29 16:28:50

如何用 PyTorch 構建 GAN？

{"type":"doc","content":[{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"typ

2021-11-23 11:18:54

繞過硬件瓶頸，成倍提升芯片算力，軟件層面深挖芯片性能可行嗎？

{"type":"doc","content":[{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"typ

2021-11-23 11:18:54

App Annie發佈預測：TikTok 將達 15 億活躍用戶，遙遙領先 Instagram

{"type":"doc","content":[{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"typ

2021-11-19 19:53:55

不是隻有數字化水平高，纔可以落地知識圖譜

{"type":"doc","content":[{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"blockq

2021-11-11 15:23:53

科大訊飛在AI源頭技術上的突破，實現系統性創新

{"type":"doc","content":[{"type":"blockquote","content":[{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null

2021-11-08 15:13:57

不滿被辭退，一程序員寫爬蟲程序侵入公司後臺刪庫泄憤，造成經濟損失10餘萬元

{"type":"doc","content":[{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"blockq

2021-11-08 14:03:51

“Trojan Source”算法漏洞幾乎影響所有代碼的安全

{"type":"doc","content":[{"type":"blockquote","content":[{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null

2021-11-05 18:33:59

谷歌前CEO發出警告：元宇宙對人類未必是好事，AI技術是“僞神”

{"type":"doc","content":[{"type":"blockquote","content":[{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null

2021-11-02 14:03:53

騰訊發佈超大預訓練系統派大星，聚焦解決BERT等超大模型訓練時的“GPU內存牆”問題

{"type":"doc","content":[{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"typ

2021-11-02 13:38:53

24小時熱門文章

最新文章

最新評論文章