參考資料:數值分析
- 若A爲Hermite陣,
可用-酉相似變換-將其化爲對角形式:,即得到譜分解,也就是特徵值分解;
譜分解保持矩陣的秩和特徵值不變。 - 若A非Hermite陣,
- 可用-初等變換-化爲比較簡單的對角形式,
即滿秩分解,保持矩陣的秩不變; - 可用-相似變換-將其化爲Jordan形,即Jordan分解,,保持矩陣的秩和特徵值不變。
- 可用-酉相似變換-將其化爲上三角形式,即Schur分解,保持秩和特徵值不變。
- 可用-酉變換-(不要求相似)j將其化爲對角形式,即奇異值分解,特點是不要求A是方陣。
奇異值分解定理:
對任意矩陣(可以不是方陣),存在酉矩陣U,酉矩陣V,對角元按非增次序排列的非負對角矩陣,使得:。
其中,矩陣A的規模大小 = 對角矩陣規模大小。
上述是,完全奇異值分解(FULL SVD)。
還有經濟型奇異值分解(economic svd),又稱約化奇異值分解,此時中,非負對角矩陣是方陣(被約化了,其實是矩陣分塊的運算的結果),代價是:在完全奇異值分解中較大的那個方陣不再是方陣(會更小,可能是扁的,也可能是高的)。
奇異值分解的性質:
- 矩陣A的秩 = 非零奇異值的個數;
原因:酉矩陣是可逆的,不改變矩陣的秩,即. - 矩陣A的值域 = 前個左奇異向量所張成的空間。
的非零特徵值是矩陣A的非零奇異值的平方。
注:表示對對角矩陣的每個元素取絕對值所組成的對角矩陣;
表示對角矩陣的對角元的符號,在這裏,如果非負,取1,否則取-1.
低秩逼近:
秩1矩陣,是指,因爲矩陣是列向量,所以它的秩爲1,而矩陣的乘積的秩不大於每個因子矩陣的秩,所以秩爲1.
說明:在所有-秩不超過k的-矩陣中,奇異值分解出的矩陣與矩陣A的二範數意義下最近,距離爲第k+1個奇異值。
在F範數的意義下,距離A也是最近的。
例題:
利用 的非零特徵值是矩陣奇異值的平方,先求出奇異值,得到矩陣。
與此同時,求出的特徵向量,得到V矩陣。
利用 ,求出矩陣U。
注:構造的方法有很多,比如:與、向量正交,的長度(二範數)爲1,聯立這三個方程即可求解。
閱讀博客的筆記:
https://www.cnblogs.com/pinard/p/6251584.html
這篇博客從原理、應用等方面對SVD進行了詳細介紹。
有些地方,值得做下筆記。
在PCA中,我們需要計算矩陣的特徵向量,可以考慮對矩陣進行SVD分解,那麼,也就是說右奇異矩陣正是我們所需要的:矩陣的特徵向量。