SVD分解的理解

SVD分解（奇異值分解），本應是本科生就掌握的方法，然而卻經常被忽視。實際上，SVD分解不但很直觀，而且極其有用。SVD分解提供了一種方法將一個矩陣拆分成簡單的，並且有意義的幾塊。它的幾何解釋可以看做將一個空間進行旋轉，尺度拉伸，再旋轉三步過程。

首先來看一個對角矩陣，

幾何上, 我們將一個矩陣理解爲對於點 (x, y) 從一個平面到另一個平面的映射:

下圖顯示了這個映射的效果: 平面被橫向拉伸了3倍，縱向沒有變化。

對於另一個矩陣

它的效果是

這樣一個變化並不是很好描述，然而當我們將座標系旋轉45度後，我們可以看出

這時，我們發現這個新的網格上發生的變化和網格在對角陣下發生變化的效果相似。

這是一個對稱矩陣的例子，可以看出，對稱矩陣經過旋轉後，其作用就和對角陣類似了。數學上，對於一個對稱矩陣M, 我們可以找到一組正交向量 v_i 從而 Mv_i 相當於 v_i上的標量乘積; 也就是

Mv_i = λ_iv_i λ_i 是標量，也就是對應對角陣中對角線上的元素. 由於這個性質，我們稱 v_i 是 M 的特徵向量; λ_i 爲特徵值. 一個對稱矩陣不同特徵值對應的特徵向量是正交的。

對於更廣泛的情況，我們看看是否能從一個正交網格轉換到另一個正交網格. 考慮一個非對稱矩陣:

這個矩陣的效果形象的稱爲剃刀（shear）。

這個矩陣將網格在水平方向拉伸了，而垂直方向沒有變化。如果我們將網格旋轉大約58度，這兩個網格就又會都變爲正交的了。

奇異值分解：

考慮一個 2 *2 矩陣, 我們可以找到兩組網格的對應關係。用向量表示，那就是當我們選擇合適的單位正交向量 v₁ 和v₂, Mv₁ 和 Mv₂ 也是正交的.

我們使用 u₁ 和 u₂ 代表 Mv₁ 和 Mv₂的方向. Mv₁ 和 Mv₂ 的長度表示爲 σ₁ 和 σ₂，也就是網格在每個方向的拉伸.這兩個拉伸值叫做M的奇異值（sigular value）

和前面類似，我們可以有

Mv₁ = σ₁u₁

Mv₂ = σ₂u₂

我們一直討論的 v₁ 和 v₂ 是一對正交向量，對於一般的向量 x，我們有這樣的投影關係

x = (v₁

x) v₁ + (v₂

x) v₂ 也就是說

Mx = (v₁

x) Mv₁ + (v₂

x) Mv₂ Mx = (v₁

x) σ₁u₁ + (v₂

x) σ₂u

即

Mx = u₁σ₁ v₁^Tx + u₂σ₂ v₂^Tx ---> M = u₁σ₁ v₁^T + u₂σ₂ v₂^T

這個關係可以寫成矩陣形式

M = UΣV^T U 的列是 u₁ 和 u₂, Σ σ₁ 和 σ₂構成的對角陣, V 的列是 v₁ 和 v₂. 即V描述了域中的一組正交基，U描述了相關域的另一組正交基，Σ 表述了U中的向量與V中向量的拉伸關係。

尋找奇異值分解

奇異值分解可以應用於任何矩陣，對於前面的例子，如果我們加上一個圓，那它會映射成一個橢圓，橢圓的長軸和短軸定義了新的域中的正交網格，可以被表示爲Mv₁ and Mv₂。

換句話說，單位圓上的函數 |Mx| 在 v₁ 取得最大值，在 v₂取得最小值. 這將單位圓上的函數優化問題簡化了。可以證明，這個函數的極值點就出現在M^TM的特徵向量上，這個矩陣一定是對稱的，所以不同特徵值對應的特徵向量v_i是正交的.

σ_i = |Mv_i|就是奇異值, u_i 是 Mv_i方向的單位向量.

Mv_i = σ_iu_i Mv_j = σ_ju_j. Mv_i

Mv_j = v_i^TM^T Mv_j = v_i

M^TMv_j = λ_jv_i

v_j = 0. 也就是

Mv_i

Mv_j = σ_iσ_j u_i

u_j = 0 因此, u_i 和 u_j 也是正交的。所以我們就把一組正交基 v_i 變換到了另一組正交基 u_i.

另一個例子

我們來看一個奇異矩陣（秩爲1，或只有一個非零奇異值）

它的效果如下

在這個例子中，第二個奇異值爲0，所以 M = u₁σ₁ v₁^T. 也就是說，如果有奇異值爲0，那麼這個矩陣就有降維的效果。因爲0奇異值對應的維度就不會出現在右邊。這對於計算機科學中的數據壓縮極其有用。例如我們想壓縮下面的15 25 像素的黑白圖像

我們可以看出這個圖像中只有三種列，即

把圖像表示成一個15

25 的矩陣，總共有 375 個元素.

然而當我們做了奇異值分解，會發現非零奇異值僅有3個，

σ₁ = 14.72， σ₂ = 5.22， σ₃ = 3.31 因此，這個矩陣就可以被表示爲 M=u₁σ₁ v₁^T + u₂σ₂ v₂^T + u₃σ₃ v₃^T

也就是說我們用三個長度爲15的向量v_i，三個長度爲25的向量u_i，以及三個奇異值，總共123個數字表示了這個375個元素組成的矩陣。奇異值分解找到了矩陣中的冗餘信息實現了降維。

可以看出，奇異值分解捕獲了圖像中的主要信息。因此，又假設上一個例子裏引入了噪聲，

當我們用同樣的方法做奇異值分解，我們得到如下非零奇異值

σ₁ = 14.15，σ₂ = 4.67，σ₃ = 3.00，σ₄ = 0.21，σ₅ = 0.19，...，σ₁₅ = 0.05 顯然，前三個奇異值比其他的大很多，說明其中包括了絕大部分信息。如果我們只要前三個，

u₁σ₁ v₁^T + u₂σ₂ v₂^T + u₃σ₃ v₃^T

我們就實現了圖像的降噪。

Noisy image	Improved image

轉載：http://www.bfcat.com/index.php/2012/03/svd-tutorial/

SVD分解的理解

奇異值分解：

尋找奇異值分解

另一個例子

公司剛入職了一名 Java 中級開發，短短 4 行代碼居然湊齊了 3 個 bug！我哭了~~

公衆號5月C#/.NET熱文一覽

git 下載大陸鏡像地址

利用hadoop二次排序進行用戶行爲分析

使用MapReduce進行排序

Hadoop入門之HDFS與MapReduce

linux下python安裝 nose lapack atlas numpy scipy sklearn

Mapreduce-Partition分析

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結