[機器學習-數學]什麼是協方差/協方差矩陣/矩陣特徵

協方差/協方差矩陣/矩陣特徵介紹

1. 均值：

均值描述的是樣本集合的平均值。

2. 標準差：

標準差描述是樣本集合的各個樣本點到均值的距離分佈，描述的是樣本集的分散程度。
以這兩個集合爲例，[0, 8, 12, 20]和[8, 9, 11, 12]，兩個集合的均值都是10，但顯然兩個集合的差別是很大的，計算兩者的標準差，前者是8.3後者是1.8，顯然後者較爲集中，故其標準差小一些，標準差描述的就是這種“散佈度”。之所以除以n-1而不是n，是因爲這樣能使我們以較小的樣本集更好地逼近總體的標準差，即統計上所謂的“無偏估計”。而方差則僅僅是標準差的平方

3. 方差：

方差是用來度量單個變量 “ 自身變異”大小的總體參數，方差越大表明該變量的變異越大

4. 協方差

協方差是用來度量兩個變量之間 “協同變異”大小的總體參數，即二個變量相互影響大小的參數，協方差的絕對值越大，則二個變量相互影響越大。

標準差和方差一般是用來描述一維數據的，但現實生活中我們常常會遇到含有多維數據的數據集，最簡單的是大家上學時免不了要統計多個學科的考試成績。面對這樣的數據集，我們當然可以按照每一維獨立的計算其方差，但是通常我們還想了解更多，比如，一個男孩子的猥瑣程度跟他受女孩子的歡迎程度是否存在一些聯繫。協方差就是這樣一種用來度量兩個隨機變量關係的統計量，我們可以仿照方差的定義：

來度量各個維度偏離其均值的程度，協方差可以這樣來定義：

協方差的結果有什麼意義呢？如果結果爲正值，則說明兩者是正相關的（從協方差可以引出“相關係數”的定義），也就是說一個人越猥瑣越受女孩歡迎。如果結果爲負值，就說明兩者是負相關，越猥瑣女孩子越討厭。如果爲0，則兩者之間沒有關係，猥瑣不猥瑣和女孩子喜不喜歡之間沒有關聯，就是統計上說的“相互獨立”

5. 協方差矩陣

前面提到的猥瑣和受歡迎的問題是典型的二維問題，而協方差也只能處理二維問題，那維數多了自然就需要計算多個協方差，比如n維的數據集就需要計算個協方差，那自然而然我們會想到使用矩陣來組織這些數據。給出協方差矩陣的定義：這個定義還是很容易理解的，我們可以舉一個三維的例子，假設數據集有三個維度，則協方差矩陣爲：

可見，協方差矩陣是一個對稱的矩陣，而且對角線是各個維度的方差。

儘管協方差矩陣很簡單，可它卻是很多領域裏的非常有力的工具。它能導出一個變換矩陣，這個矩陣能使數據完全去相關(decorrelation)。從不同的角度來看，也就是說能夠找出一組最佳的基以緊湊的方式來表達數據。

若，則稱是A的特徵值，X是對應的特徵向量。實際上可以這樣理解：矩陣A作用在它的特徵向量X上，僅僅使得X的長度發生了變化，縮放比例就是相應的特徵值。

當A是n階可逆矩陣時，A與P-1Ap相似，相似矩陣具有相同的特徵值。特別地，當A是對稱矩陣時，A的奇異值等於A的特徵值，存在正交矩陣Q（Q-1=QT），使得：

對A進行奇異值分解就能求出所有特徵值和Q矩陣。

AQ=QD,D是由特徵值組成的對角矩陣.由特徵值和特徵向量的定義知，Q的列向量就是A的特徵向量。

6. 超參數

超參數是機器學習算法的調優參數，常應用於估計模型參數的過程中，由用戶直接指定，可以使用啓發式方法來設置，並能依據給定的預測問題而調整
超參數與模型參數不同，模型參數是學習算法擬合訓練數據獲得的參數，即這些參數是作爲模型本司身的參數而存在的

7. 參考資料

[1] https://blog.csdn.net/pandav5/article/details/48828151
[2] https://www.cnblogs.com/kekeoutlook/p/9088255.html

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

[機器學習-數學]什麼是協方差/協方差矩陣/矩陣特徵

協方差/協方差矩陣/矩陣特徵介紹

1. 均值：

2. 標準差：

3. 方差：

4. 協方差

5. 協方差矩陣

6. 超參數

7. 參考資料

[機器學習-邏輯迴歸]邏輯迴歸(LogisticRegression)多分類(OvR, OvO, MvM）

[深度學習NPL]word2vector總結與理解

[深度學習TF2] 梯度帶(GradientTape)

[機器學習-概念篇]徹底搞懂信息量，熵、相對熵、交叉熵

[深度學習TF2][RNN-LSTM]文本情感分析包含（數據預處理-訓練-預測）

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結