矩陣分析

原創

2019-08-13 20:58

線性代數

使用到的數學符號：

Ax=b

Ax=b的行視圖（凸優化中的超平面）：

列視圖（矩陣列的線性組合）：

行視圖和列視圖是從不同的角度去看Ax=b，它們屬於不同的空間。

線性相關與線性無關

Span、基和子空間（Subspace）

一個子空間可以由一組基表示，基的維數是固定的，但是基有無數組

四個基本的子空間

列空間：

兩個向量的所有線性組合構成一個二維平面，是三維空間的子空間，且子空間必過原點，因爲x1,x2可以爲0

零空間：

零空間是所有Ax=b的解的所有線性組合構成的子空間

行空間：

左零空間：

四個基本子空間的關係：

兩個垂直的子空間如左零空間和列空間，它們的交點只有原點這一個點。

注意零空間有可能不存在，比如在滿秩的情況下。

利用子空間重新看待線性方程組的解：

Ax=b方程的解：

只有唯一解，則 b ∈ C（A），N（A）的維數是 0
有無情多解，則 b ∈ C（A），N（A）的維數大於 0
無解，則 b ∉ C（A）
如果有解，解的形式 X = P + V P：特解 V：零空間的解

A * x = A * ( P + V ) = b + 0

特徵分解（凸優化中的重要技術）

特徵值（Eigenvalues）與特徵向量（Eigenvectors）

Ax = λx的幾何意義：

特徵分解的性質：

Ax 相當於是對 x 向量進行了伸縮，也就是 Ax 與 x 共線，這個伸縮的比例就是 A 相對於 x 的特徵值。

對稱矩陣的特徵分解

對於對稱矩陣來說，非零特徵值的個數就是矩陣的秩。

二次型（Quadratic Form）

負定矩陣：< 0

不定矩陣：對有的向量 > 0 , 的有的向量 < 0

注意，正定矩陣、負定矩陣、不定矩陣等概念都是針對 對稱矩陣 提出的。

那麼，矩陣的正定，負定、不定有什麼用呢？

二次型圖像：

正定矩陣更容易進行函數的優化，找到最優解。

PCA

這裏的Cx，可以理解爲先對數據進行去均值，使得均值爲0，正對角線可以理解爲方差，負對角線可以理解爲協方差。

問題： 假設變換矩陣爲Y = QX，並先假設Q是方陣（先不降維），則有：

如何使得Cy是一個對角矩陣？

這裏的Cy相當於協方差矩陣，這個矩陣如何轉變稱對角陣呢？

因爲協方差矩陣是對稱矩陣，可以進行對角化（實對稱矩陣一定可以對角化）：

如果有n階矩陣A，其矩陣的元素都爲實數，且矩陣A的轉置等於其本身（aij=aji）(i,j爲元素的腳標），則稱A爲實對稱矩陣

將 Q 換爲 U 的轉置就可以啦。U 是正交陣。

PCA的核心就是： 一個對稱矩陣可以被U對角化。

PCA降維舉例

這裏，我們把2行的X，降維稱1行，這裏的特徵值我們取最大值2，因爲方差越大蘊含的信息越多，也可以理解爲這個數據越重要。

圖像表示如下：

這裏降維的操作相當於把離散的點映射到了一條直線上。

SVD（Singular Value Decomposition）萬能矩陣分解

特徵分解的廣義化

這裏的 σ 表示奇異值

SVD和特徵分解的關係

SVD和子空間的關係

也就是：

SVD 提供了計算四個子空間正交基的一種快速方法

低秩矩陣近似（降維）

奇異值分解比特徵分解更加穩定，兩者的本質是一樣的。

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

2020算法面試總結（二）

這部分只要是說一些深度學習方面的面試總結。機器學習擬合問題如何判斷擬合情況通過看訓練集誤差和驗證集誤差對比欠擬合：訓練集和驗證集的誤差都較大，但相差很少適度擬合：訓練集和驗證集的誤差都很低過擬合：訓練集誤差較低，驗證集

干啥啥不行下课散会

2020-07-05 12:51:20

決策樹參數調優建議

建議一：三個最重要的參數爲:樹的數目、樹的深度和學習率。建議參數調整策略爲: – 採用默認參數配置試試 – 如果系統過擬合了,降低學習率 – 如果系統欠擬合,加大學習率建議二： – n_estimators和learning_rate

2020-06-24 01:34:51

2020面試機器學習問題總結

在這個部分中，主要總結一些機器學習部分的面試問題，我會按我的思路不斷的填充，豐富。 1.機器學習基礎先分爲有監督和無監督模型兩部分在有監督模型中，分爲生成模型、判別模型生成模型：每一類單獨學習，新樣本在哪一類上的預測概率最大

干啥啥不行下课散会

2020-06-22 06:52:45

機器學習11-神經網絡綜合運用

小結一下使用神經網絡時的步驟：網絡結構：第一件要做的事是選擇網絡結構，即決定選擇多少層以及決定每層分別有多少個單元。第一層的單元數即我們訓練集的特徵數量。最後一層的單元數是我們訓練集的結果的類的數量。如果隱藏層數大於 1，確保每

2020-06-19 10:13:02

機器學習步驟——以房價預測爲例

導入數據數據清洗數據清洗的一些梳理查看數據，對數據有一個直觀的理解，初步發現一些問題；例如：kaggle房價預測先查看每個數據的具體意義和數據類型和Exel對比。 kaggle房價預測數據集的具體描述缺失值清洗格式內

象牙塔小明

2020-06-18 06:13:50

機器學習sklearn數據預處理：歸一化-標準化/區間縮放-調整尺度/正態化

在sklean的預處理方法中主要有三種,每一種都有函數方法和類方法兩種使用方法：歸一化-標準化：normalize()函數/Normalizer()類區間縮放-調整尺度: minmax_scale函數/MinMaxScaler

象牙塔小明

2020-06-17 12:58:49

科研論文知識研討分享

(Su et al., EMNLP 2018)Discriminative Deep Dyna-Q：Robust Planning for Dialogue Policy Learning 目的區分判斷出這兩者：世界模型生成的模

2020-06-17 12:42:17

機器學習優秀博客推薦

線性迴歸（Linear Regression）決策樹（Decision Tree）聚類（Clustering）-機器學習_周志華直觀的解釋SVM和SVR 峯度與偏度（python，pandas）

象牙塔小明

2020-06-17 12:07:04

BPCLSTM

2020-05-24 04:26:04

L-BFGS算法簡介

2020-04-27 10:22:08

可變形卷積的理解極其源碼分析

2020-04-23 17:13:45

深入理解ResNet原理解析及代碼實現

2020-04-01 20:07:14

NO.1 機器學習乾貨與代碼參數詳解

2020-03-12 09:56:31

3.10機器學習複習

2020-03-12 09:56:31

梯度提2.25 升決策樹

2020-02-26 01:52:43

24小時熱門文章

lightdb hash index的性能和限制

最新文章

最新評論文章