非監督學習——(PCA主成分分析)

1、Principal Component Analysis——PCA,擅長處理座標系的移動和旋轉問題。

2、它是一套全面應用於各類數據分析的分析方法。

3、概述原理:無論收到任何形狀的數據,PCA從舊座標系統僅通過轉化和輪換獲得新座標系統,根據數據中心,將新座標中心移動到數據中心,將新的x軸移至變化的主軸,在整個數據集中尋找最大方差的位置,進一步把軸移至正交處重要性較低的方向,主成分分析找到軸,並告訴這些軸的重要性。

4、步驟:

  • 中心:數據的中心
  • 主軸:\Delta x, \Delta y
  • 第二個成分:\Delta x, \Delta y
  • 最低輸出向量唄規範爲1

5、通過PCA可得出一個重要值,軸的分佈值。如果分佈率較小,該散佈值對第一條變量軸來說傾向於一個很大的值,對於第二條變量軸來說則小很多。

6、主成分是最大方差的方向。

7、將信息損失減到最小的方向。丟失的信息等於某個特定的點與它在這條線上的新位置之間的距離。

8、總結:

  • PCA是將輸入特徵轉化爲其主要成分的系統化方法。
  • 使用主成分作爲新的特徵。
  • 當對主成分執行投影或壓縮,主成分是數據中使方差最大化的方向(信息丟失降至最低)。
  • 對主成分劃分等級,數據因特定主成分而產生的方差越大,那麼主成分的級別越高。
  • 最大方差 / 最多信息——第一主成分。第二大最大方差(與第一主成分沒有重疊)——第二主成分。
  • 主成分的數量最大值 = 數據輸入特徵數量。

9、何時使用PCA:

  • 訪問隱藏的特徵(該特徵是存在的情況下)。
  • 降維:可視化高維數據;去噪;在另一個算法之前使用PCA進行預處理(歸納或分類)。
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章