FaceID-1：Deep Learning Face Representation from Predicting 10,000 Classes 筆記

原創

kunyXu

2020-06-16 12:45

此文由香港中文大學湯曉鷗教授團隊於2014年發表
論文鏈接：http://mmlab.ie.cuhk.edu.hk/pdf/YiSun_CVPR14.pdf

1.研究問題

主要通過神經網絡學習圖像特徵，通過分類器驗證人臉。

2.此文工作

2.1 人臉特徵表達

2.1.1 網絡結構

 一共四個卷積層，前三個卷基層後都有Max-pooling
 在最後一個隱藏層，是由Max-pooling layer3 + Convolutional layer4 全連接而得，爲160維。這樣的連接方式既考慮到了局部的特徵，也考慮到全局特徵
 最後的soft-max訓練時使用，檢測時不用，而如果使用soft-max進行分類、識別，效果很差
 用於人臉識別和人臉驗證的特徵是最後一個隱藏層，稱爲DeepID。

2.1.2 人臉特徵

 將輸入圖片縮放爲三個比例尺大小，並且分爲彩色和灰度圖像，最後還將圖片切分爲10個patch，所以最後輸入的patch 數爲：3 2 10=60。
 對每一種patch 都訓練一個卷積網絡，一共需要訓練60個卷積網絡。
 所有patch 輸出的特徵連接起來，一共爲19200（160 2 60），再利用PCA降維到150維用於人臉驗證與區分。

2.2 人臉驗證方法

2.2.1 聯合貝葉斯

通過類內方差與類間方差之間的關係判斷兩個特徵是否爲一張臉。有一些推導，具體過程不詳述。

2.2.2 神經網絡

分成60個group，每個group對應一個patch，其中有160（單個網絡輸出）* 2（flip） * 2（對比的兩張臉）=640維。輸出爲單一特徵，表示相似性，由sigmoid生成。

2.3 實驗與討論

訓練數據：CeleFaces+，有10177人，202599張圖片；8700人訓練DeepID，1477人訓練聯合貝葉斯分類器。準確率達到97.45%

其他一些結論：
 使用multi-scale patch 的卷積網絡效果比只用一張圖片好
 訓練樣本中的身份數量越多，訓練得出的模型越優

3.總結

提出將人臉圖像分爲多個patch，對每個patch 分別訓練神經網絡，這樣的效果明顯優於純粹輸入圖片訓練。進一步提高了精度。

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

FaceID-1：Deep Learning Face Representation from Predicting 10,000 Classes 筆記

1.研究問題

2.此文工作

2.1 人臉特徵表達

2.1.1 網絡結構

2.1.2 人臉特徵

2.2 人臉驗證方法

2.2.1 聯合貝葉斯

2.2.2 神經網絡

2.3 實驗與討論

3.總結

再談23種設計模式（3）：行爲型模式（學習筆記）

Power Automate Desktop 安裝完，登錄後老是提示one driver 錯誤

微前端學習筆記(4):從微前端到微模塊之EMP與hel-micro方案探索

微前端學習筆記（1）：微前端總體架構概述，從微服務發微

985 碩士程序員，空窗 4 個月沒有 Offer！

一文搞懂 Spring 循環依賴

賽博鬥地主——使用大語言模型扮演Agent智能體玩牌類遊戲。

VScode右鍵打開(添加到右鍵)

記一次 .NET某工控視覺自動化系統卡死分析

WindowsServer--SQL Server搭建主從同步實現讀寫分離 - 事務性分發

Matlab寫入txt文件

利用matlab將自己的數據製作爲標準VOC數據集格式

ubuntu下python雜技

FaceID-1：Deep Learning Face Representation from Predicting 10,000 Classes 筆記

馬爾科夫決策過程（MDP）

Mac下配置sublime實現LaTeX

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結