Face++人臉識別:Learning Deep Face Representation

此文由Face++團隊於2014年發表
論文鏈接:https://arxiv.org/abs/1403.2802

1.研究問題

使用深度神經網絡提取特徵,提出金字塔神經網絡。

2.此文工作

2.1 金字塔神經網絡

這裏寫圖片描述
網絡結構(論文裏沒有講清楚具體細節,只給了大概結構):
 網絡爲Siamese network
 輸入爲不同的圖像patch, 也就是不同的人臉部位
 整個網絡由很多個level 的網絡組成
 每個level 上的網絡由共享的層和不共享的層組成,共享的層由之前的level 訓練得到,此level 只訓練不共享的層
 每個level 有多個神經網絡,它們對應於不同的patch 但是它們的第一層的參數是相同的
 最後的特徵爲所有網絡輸出連接組成(訓練時),這樣的特徵爲多尺度特徵,也是過完全特徵,但是文中說明了過完全對結果有好處,而且特徵可以通過PCA 降維,降維後的特徵分類識別能力也很強(即使降到8維,正確率也能達到80%以上)
 檢測時使用的特徵是最後一個level 的輸出

採用金字塔網絡的原因:
 加快網絡訓練
 獲得多尺度人臉特徵
網絡訓練的損失函數:
這裏寫圖片描述
目標:使同一個人的距離相近,不同人的距離相遠。

網絡的訓練方法:
這裏寫圖片描述

2.2 實驗結果

準確率(LFW)97.27%
這裏寫圖片描述
訓練時間與準確率:(證明他們的方法可以加快訓練)
這裏寫圖片描述

3總結

優點:定義了一個新的神經網絡的結構:金字塔神經網絡,並且人臉識別效果相較於傳統方法有巨大提高。文章最後總結:由於人臉是高度結構化的圖片,所以可以應用金字塔神經網絡,但是普通物體具有很大的可變性,不太好應用。
缺點:沒有說清楚網絡結構和參數,也沒有講清楚訓練數據集的來源與大小。

發佈了34 篇原創文章 · 獲贊 29 · 訪問量 11萬+
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章