人臉識別-arcface損失函數

原創

2020-06-14 15:26

人臉識別-arcface損失函數（arcLoss、insight Loss）

參考博客：
L-margin softmax loss:
https://blog.csdn.net/u014380165/article/details/76864572

A-softmax loss:
https://blog.csdn.net/u011808673/article/details/80491361

AM-softmax loss:
https://blog.csdn.net/fire_light_/article/details/79602310

arcface:
https://blog.csdn.net/Fire_Light_/article/details/79602705

softmax loss:

N是樣本的數量，i代表第i個樣本，j代表第j個類別，fyi代表着第i個樣本所屬的類別的分數

fyi是全連接層的輸出，代表着每一個類別的分數，

每一個分數即爲權重W和特徵向量X的內積

每個樣本的softmax值即爲：

L-softmax loss:

假設一個2分類問題，x屬於類別1，那麼原來的softmax肯定是希望：

也就是屬於類別1的概率大於類別2的概率，這個式子和下式是等效的：

large margin softmax就是將上面不等式替換爲：

m是正整數，cos函數在0到π範圍又是單調遞減的，所以cos(mx)要小於cos(x)。通過這種方式定義損失會逼得模型學到類間距離更大的，類內距離更小的特徵。

從幾何的角度看兩種損失的差別：

設置爲cos(mx)後，使得學習到的W參數更加的扁平，可以加大樣本的類間距離。

Large-Margin Softmax的實驗效果：

A-softmax loss

A-softmax loss簡單講就是在large margin softmax loss的基礎上添加了兩個限制條件||W||=1和b=0，使得預測僅取決於W和x之間的角度。
softmax的計算：

可以寫成

若引入兩個限制條件，

decision boundary變爲:

只取決於角度了
則損失函數變爲：

在這兩個限制條件的基礎上，作者又添加了和large margin softmax loss一樣的角度參數，使得公式變爲：

AM-softmax
在A-softmax的基礎上，修改Cos(mθ)爲一個新函數：

與ASoftmax中定的的類似，可以達到減小對應標籤項的概率，增大損失的效果，因此對同一類的聚合更有幫助
然後根據Normface，對f進行歸一化，乘上縮放係數s，最終的損失函數變爲：

這樣做的好處在於A-Softmax的倍角計算是要通過倍角公式，反向傳播時不方便求導，而只減m反向傳播時導數不用變化

Asoftmax是用m乘以θ，而AMSoftmax是用cosθ減去m，這是兩者的最大不同之處：一個是角度距離，一個是餘弦距離。

之所以選擇cosθ-m而不是cos（θ-m），這是因爲我們從網絡中得到的是W和f的內積，如果要優化cos（θ-m）那麼會涉及到arccos操作，計算量過大。

arcface

分類正確label的值爲

，cos函數在（0,1）內是單調遞減的，加上m，會使該值變得更小，從而loss會變得很大。

這樣修改的原因：角度距離比餘弦距離在對角度的影響更加直接

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

BCS2024｜Baidu Comate：以研發提效爲驅動實現“安全左移”

2024年6月5日，以“AI驅動安全”爲主題的2024全球數字經濟大會數字安全高層論壇暨北京網絡安全大會戰略峯會（簡稱“BCS大會”）在北京國家會議中心開幕。 BCS2024｜“互聯網創新發展”論壇百度研發安全負責人陳長林出席互聯網創

2024-06-08 09:41:40

低代碼：加速企業數字化轉型的利器

隨着企業數字化轉型步伐的加快，低代碼開發平臺迅速成爲市場的焦點。**憑藉其能簡化開發流程、縮短交付時間和降低成本等優勢，**低代碼已經贏得了企業和開發人員的廣泛認可，已成爲推動企業數字化轉型、提高企業創新效率、競爭力的關鍵工具。本文將詳細介

2024-06-07 21:18:49

原來Stable Diffusion是這樣工作的

stable diffusion是一種潛在擴散模型，可以從文本生成人工智能圖像。爲什麼叫做潛在擴散模型呢？這是因爲與在高維圖像空間中操作不同，它首先將圖像壓縮到潛在空間中，然後再進行操作。在這篇文章中，我們將深入瞭解它到底是如何工作的,還

2024-06-06 21:38:48

企業實施數字化轉型有哪些方面？

本人研究企業數字化轉型10餘年，爲企業軟件選型、數字化提供諮詢服務！目前重點研究低代碼數字化轉型玩法，力爭爲各行各業探索出一條最具性價比的數字化方式。關於“企業數字化轉型包括哪些方面”這個問題，咱先來看個例子哈~ 比如說某製造企業通過數

2024-06-06 21:27:46

首批！Zilliz 獲得亞馬遜雲科技生成式 AI 合作伙伴能力認證

Zilliz 正式宣佈通過亞馬遜雲科技生成式 AI 能力認證！這一認證不僅肯定了 Zilliz 在人工智能和非結構化數據領域的卓越能力，也標誌着 Zilliz 在推動 AI 技術創新和應用的道路上邁出了重要一步。亞馬遜雲科技生

2024-06-06 14:16:04

度安講 * 第二期「安全左移·業務護航」技術沙龍成功舉辦

當下，“安全左移”作爲落地DevSecOps的重要實踐之一，已在業界達成共識。DevSecOps作爲一種集開發、安全、運維於一體的軟件開發和運營模式，強調在敏捷交付下，“安全”在軟件開發生命週期的全覆蓋貫穿和核心位置。所謂“安全左移”，與

2024-06-03 21:42:25

向量數據庫引領 AI 創新——Zilliz 亮相 2024 亞馬遜雲科技中國峯會

2024年5月29日，亞馬遜雲科技中國峯會在上海召開，此次峯會聚集了來自全球各地的科技領袖、行業專家和創新企業，探討雲計算、大數據、人工智能等前沿技術的發展趨勢和應用場景。作爲領先的向量數據庫技術公司，Zilliz 在本次峯會上展示了最新的

2024-05-30 21:25:17

2024年國內最全面最前沿人工智能理論和實踐資料

引言【導讀】2024第11屆全球互聯網架構大會圓滿結束。會議邀請了100餘位行業內的領軍人物和革新者，大會通過主題演講、實踐案例分享，以及前瞻性的技術討論，探索AI技術的邊界。(最新AI-大模型獲取地址點擊領取) 近日

2024-05-29 22:52:52

AI安全志：英國AI騙保事件增加300%！

最近，英國《衛報》報道稱，一些騙子正在利用人工智能照片編輯軟件篡改照片，以進行保險欺詐活動。這一發現令保險公司震驚，因爲這可能導致汽車保險費用飆升至歷史最高水平。安聯保險公司表示，從2021年至2023年期間，利用應用程序篡

2024-05-28 00:15:50

使用 Spring Cloud Alibaba AI 構建 RAG 應用

作者：姬世文背景介紹 RAG（Retrieval Augmented Generation）檢索增強生成（RAG）是一種用於將數據與人工智能模型集成的技術。在 RAG 工作流程中，第一步將文檔數據加載到矢量數據庫（例如 Redis）中。

2024-05-27 21:13:51

面向AI的開發：從大模型（LLM）、檢索增強生成（RAG）到智能體（Agent）的應用

引言隨着人工智能技術的飛速發展，大型語言模型（LLM）、檢索增強生成（RAG）和智能體（Agent）已經成爲推動該領域進步的關鍵技術，這些技術不僅改變了我們與機器的交互方式，而且爲各種應用和服務的開發提供了前所未有的可能性。正確理解這三者

2024-05-24 23:57:39

文心大模型免費辣，動手搓點啥慶祝一下吧

5月21日下午，百度智能雲宣佈文心大模型的兩款主力模型ENIRE Speed、ENIRE Lite全面免費，即刻生效。這兩款大模型都是今年3月剛剛發佈的，均支持8K和128k上下文長度。可以說，這是百度最新的模型

2024-05-24 12:13:22

噱頭還是風口？剖析AI短劇出海的未來

導語 |去年以來，低成本、高回報的土味短劇在國內爆火，而這股風也成功地刮到海外。2024 年，越來越多的人把目光投向了擁有龐大市場的國外“藍海”，當人們還在高談闊論 Sora 是否顛覆影視行業的時候，AI 已經在出海短劇中大顯身手，那

2024-05-24 11:48:13

華爲雲受邀出席AICon2024 分享AI Agent在企業生產中的技術實踐

近日， InfoQ在北京舉辦行業技術盛會——AICon全球人工智能開發與應用大會2024，華爲雲aPaaS首席架構師陳星亮受邀出席，和技術愛好者分享AI Agent在企業生產中的技術實踐。大模型技術發展浪潮下，AI Agent成爲新一

2024-05-24 10:58:18

昔日輝煌不再，PHP老矣，尚能飯否？

導語 | 近期 TIOBE 最新指數顯示，PHP 的流行度降至了歷史最低，排在第 17 名，同時，在年度 Stack Overflow 開發者調查報告中，PHP 在開發者中的受歡迎程度已經從之前的約 30% 萎縮至現在的 18%。“P

2024-05-23 23:48:42

24小時熱門文章

最新文章

最新評論文章