齊次線性方程組的解、SVD、最小二乘法

轉載出處:http://blog.csdn.net/ccwwff/article/details/45912671


AX=0
這是一個齊次線性方程組(一般的非齊次線性方程組AX=b其實也都可以化爲齊次方程組的形式,所以比較普遍)

先要說明在非齊次方程組中,A到底有沒有解析解,可以由增廣矩陣來判斷:
  • r(A)<r(A | b) 方程組無解;
  • r(A)=r(A | b) =n,方程組有唯一解;
  • r(A)=r(A | b) <n,方程組無窮解;
  • r(A)>r(A | b) 不可能,因爲增廣矩陣的秩大於等於係數矩陣的秩(在矩陣中加入一列,其秩只可能增大,不可能變小)。

而在齊次方程中(r(A | b) =r(A | 0)=r(A) ),根據A來分,只剩下了兩種情況:

1.r(A)=未知數個數n(約束較強)
   1.1.
A是方陣
         由克萊姆法則可知:
         如果A是n*n的方陣而且r(A)=n,那麼該方程組有唯一的零解。
   1.2.A不是方陣,A是m×n的(m>n)
         由另一個定理:齊次線性方程解空間維數 = n - r(A) 可知,該解空間維數爲0, 也就是說該解空間只含有零向量。

2.r(A)<未知數個數n(約束不夠)
這裏A是不是方陣已經無所謂了,也沒有什麼法則可以用,就只分成一種情況。
由齊次線性方程組解空間維數 = n - r(A) >0,所以該齊次線性方程組有非零解,而且不唯一(自由度爲 n - r(A))。

(多謝wereineky指出錯誤)
在我們做一些實際問題的時候,經常在 1.2(當然嚴格來說1.1也有可能啦)會卡住,這時實際上是沒有真正的非零解析解的,因爲約束太多了,沒法都滿足(零向量除外)。但是可以折中一下,每一個方程都滿足個大概,這就要求最小二乘解。求取最小二乘解的方法一般使用SVD,即奇異值分解。

解空間維數與r(A)的關係的感性認識:
r(A)可以理解爲一種約束條件的強弱的表現(約束的強弱不只是表面上的方程個數)。比如有一個方程組,每個方程都是一樣的,那麼其秩爲1,方程的個數對約束毫無貢獻。
繼續看A的秩,也就是約束的個數是怎麼影響解空間的維數的。
比如
x1 +   x2 +  x3 = 0
x1 + 2x2 + 3x3 = 0
r(A)=2,消去x1之後得到:
 x2 + 2x3 = 0
x2或者x3一旦確定,其餘的未知量就都隨之確定了,所以自由度爲1,所以解空間維數爲1。
即:
如果 r(A)=c,那麼c個方程一共最多可以消去c-1個未知數(比如滿秩方陣,最後只留一個未知數,得到唯一解),於是得到的方程由n-(c-1)個未知數組成,該方程有 n-c個自由度,也就是說解空間的維數爲 n-c。
上述過程在高斯消去法中表現:
假設消去過後的A如下:
x     x      x      x      x
0     x      x      x      x
0     0      x      x      x
0     0      0      x      x
0     0      0      0      0
那麼最後一個非全0行的x個數爲 num = n-r(A)+1,則可以看到,該行的自由度,決定了所有解的自由度(因爲一旦改行確定,其他都確定了,自由區其實可以理解爲用將多少變量固定,就能夠確定整個矩陣),而該行的自由度=num-1=n-r(A)=齊次線性方程組解空間的維數,Bingo!

SVD與最小二乘解:
SVD:奇異值分解,是在A不爲方陣時的對特徵值分解的一種拓展。奇異值和特徵值的重要意義相似,都是爲了提取出矩陣的主要特徵。
對於齊次線性方程 A*X =0;當A的秩大於列數時,就需要求解最小二乘解,在||X||=1的約束下,其最小二乘解爲矩陣A'A最小特徵值所對應的特徵向量。

假設x爲A'A的特徵向量的情況下,爲什麼是最小的特徵值對應的x能夠是目標函數最小證明(多謝hukexin0000指出錯誤,這個約束太強,只能提供一點點感性認識,具體的證明請查閱相關教科書):
齊次線性方程組的最小二乘問題可以寫成如下:
min ||Ax|| 
s.t    ||x||=1
目標函數:||Ax|| = x'A'Ax = x'lamda x=lamda||x||=lamda,其中lamda是A'A的特徵值。
於是可知,得到了A'A的最小特徵值,就得到了最優值,而其最小特徵值對應的特徵向量就是最優解.
而對M進行SVD分解(*表示共軛轉置):
M^{*} M = V \Sigma^{*} U^{*}\, U \Sigma V^{*} =V (\Sigma^{*} \Sigma) V^{*}\,
M M^{*} = U \Sigma V^{*} \, V \Sigma^{*} U^{*} =U (\Sigma \Sigma^{*}) U^{*}\,
可見M*M的特徵向量就是V的列向量。

求解:
求解方法有兩種(matlab):
1. 
[V D] =eig(A'*A);D爲A'*A的特徵值對角矩陣,V爲對應的特徵向量。找到最小特徵值對應的V中的特徵向量即爲最小二乘解。
2.
 使用SVD分解矩陣A,[U S V] = svd(A); U 由 A*A'的特徵向量組成,V 由 A'*A的特徵向量組成,因此,奇異值矩陣S中最小的奇異值對應的V中的奇異向量即爲最小二乘解。
對於超定方程(非齊次線性方程的一種)的最小二乘解的情況。A*X =b ; 當A的行數大於列數時,方程組無解,就需要求解最小二乘解。在matlab中使用一個左除命令就可以得到最小二乘意義下的解。這個解沒有模製的限制,就是實際的解。matlab:A\b

兩種方法其實是一個意思。

推薦資料:
這篇資料還是很不錯的,講述了SVD與PCA的關係,其中的推薦資料也很不錯。

機器學習中的數學(5)-強大的矩陣奇異值分解(SVD)及其應用

 
相關資源:
http://blog.csdn.net/zhangchaoyangsun/article/details/8470267  並行計算奇異值分解--Jacobi旋轉

發佈了45 篇原創文章 · 獲贊 22 · 訪問量 8萬+
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章