[機器學習-數學]什麼是協方差/協方差矩陣/矩陣特徵

1. 均值:

均值描述的是樣本集合的平均值 。
在這裏插入圖片描述

2. 標準差:

標準差描述是樣本集合的各個樣本點到均值的距離分佈,描述的是樣本集的分散程度。
以這兩個集合爲例,[0, 8, 12, 20]和[8, 9, 11, 12],兩個集合的均值都是10,但顯然兩個集合的差別是很大的,計算兩者的標準差,前者是8.3後者是1.8,顯然後者較爲集中,故其標準差小一些,標準差描述的就是這種“散佈度”。之所以除以n-1而不是n,是因爲這樣能使我們以較小的樣本集更好地逼近總體的標準差,即統計上所謂的“無偏估計”。而方差則僅僅是標準差的平方

在這裏插入圖片描述

3. 方差:

方差是用來度量單個變量 “ 自身變異”大小的總體參數,方差越大表明該變量的變異越大
在這裏插入圖片描述

4. 協方差

協方差是用來度量兩個變量之間 “協同變異”大小的總體參數,即二個變量相互影響大小的參數,協方差的絕對值越大,則二個變量相互影響越大。

標準差和方差一般是用來描述一維數據的,但現實生活中我們常常會遇到含有多維數據的數據集,最簡單的是大家上學時免不了要統計多個學科的考試成績。面對這樣的數據集,我們當然可以按照每一維獨立的計算其方差,但是通常我們還想了解更多,比如,一個男孩子的猥瑣程度跟他受女孩子的歡迎程度是否存在一些聯繫。協方差就是這樣一種用來度量兩個隨機變量關係的統計量,我們可以仿照方差的定義:
在這裏插入圖片描述
來度量各個維度偏離其均值的程度,協方差可以這樣來定義:
在這裏插入圖片描述
協方差的結果有什麼意義呢?如果結果爲正值,則說明兩者是正相關的(從協方差可以引出“相關係數”的定義),也就是說一個人越猥瑣越受女孩歡迎。如果結果爲負值, 就說明兩者是負相關,越猥瑣女孩子越討厭。如果爲0,則兩者之間沒有關係,猥瑣不猥瑣和女孩子喜不喜歡之間沒有關聯,就是統計上說的“相互獨立”

5. 協方差矩陣

前面提到的猥瑣和受歡迎的問題是典型的二維問題,而協方差也只能處理二維問題,那維數多了自然就需要計算多個協方差,比如n維的數據集就需要計算在這裏插入圖片描述個協方差,那自然而然我們會想到使用矩陣來組織這些數據。給出協方差矩陣的定義:在這裏插入圖片描述這個定義還是很容易理解的,我們可以舉一個三維的例子,假設數據集有三個維度,則協方差矩陣爲:在這裏插入圖片描述

可見,協方差矩陣是一個對稱的矩陣,而且對角線是各個維度的方差。

儘管協方差矩陣很簡單,可它卻是很多領域裏的非常有力的工具。它能導出一個變換矩陣,這個矩陣能使數據完全去相關(decorrelation)。從不同的角度來看,也就是說能夠找出一組最佳的基以緊湊的方式來表達數據。

若,則稱是A的特徵值,X是對應的特徵向量。實際上可以這樣理解:矩陣A作用在它的特徵向量X上,僅僅使得X的長度發生了變化,縮放比例就是相應的特徵值。

當A是n階可逆矩陣時,A與P-1Ap相似,相似矩陣具有相同的特徵值。特別地,當A是對稱矩陣時,A的奇異值等於A的特徵值,存在正交矩陣Q(Q-1=QT),使得:
在這裏插入圖片描述
對A進行奇異值分解就能求出所有特徵值和Q矩陣。

AQ=QD,D是由特徵值組成的對角矩陣.由特徵值和特徵向量的定義知,Q的列向量就是A的特徵向量。

6. 超參數

超參數是機器學習算法的調優參數,常應用於估計模型參數的過程中,由用戶直接指定,可 以使用啓發式方法來設置,並能依據給定的預測問題而調整
超參數與模型參數不同,模型參數是學習算法擬合訓練數據獲得的參數,即這些參數是作爲 模型本司身的參數而存在的

7. 參考資料

[1] https://blog.csdn.net/pandav5/article/details/48828151
[2] https://www.cnblogs.com/kekeoutlook/p/9088255.html

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章