《Focal loss for dense object detection》筆記

目標檢測中，類別不平衡問題很嚴重，特別是背景類和其他目標類的不平衡。一階算法在一張圖片上大概會評估 $10^4-10^5$ 個候選位置，只有一些位置含有objects。訓練樣本類別不平衡會影響訓練效果，導致分類器更傾向於預測數量非常多的背景類。針對這個問題，focal loss 把容易分類的類別的loss相對降低，其他類別的loss相對提高，從而保證網絡能夠正確學到東西。

Focal loss的公式定義如下
$\text{FL}(p_t) = -\alpha_t (1 - p_t)^{\gamma} \log (p_t)$
其中 $p_t$ 表示是否爲gt類的概率
$p_t = \begin{cases} p & \text{if } y = 1 \\ 1 - p & \text{otherwise} \end{cases}$
$\gamma$ 是調製因子，把類別的loss $\log (p_t)$ 壓低，越容易學習的類別， $p_t$ 越大， $(1-p_t)^\gamma$ 抑制loss的效果越大，loss $\log (p_t)$ 越低。對於背景類來說，它的訓練樣本很多，網絡很容易學到怎麼對背景類分類，背景類的概率 $p_t$ 值比較高。因此， $\gamma$ 可以把背景類的loss壓低。對於其他類，因爲比較難學，他們的預測概率 $p_t$ 偏低，他們的loss相對背景類來說不會降低太多。這樣做的效果平衡了背景類和其他類的loss，減少了背景類的預測對其他類預測的影響。

focal loss 對於不同的概率產生的loss的效果如下圖所示

概率越接近於1，loss越小。

$\alpha_t$ 是類別t的權重，針對類別不平衡問題。數量少的類別的 $\alpha_t$ 權重比較高，數量少的類別的 $\alpha_t$ 權重比較低，這是針對類別不平衡問題的常見做法。

論文中使用Focal loss的一階算法RetinaNet與其他算法的結果如下

可以看到，Focal loss的使用有助於提高訓練效果。

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

《Focal loss for dense object detection》筆記

「Pygors跨平臺GUI」2：安裝MinGW-w64、MSYS2還是WSL2

一鍵自動化博客發佈工具,用過的人都說好(掘金篇)

[轉帖]

python列出centos7內存使用前50的進程信息

「Pygors跨平臺GUI」1：Pygors跨平臺GUI應用研究

評估統計算法在銀行僞造鈔票檢測中的價值

Java ThreadPoolShutdown

5月21日相聚上海張江！與文心大模型一起共建大模型產業應用生態圈

通義千問 2.5 “客串” ChatGPT4，你分的清嗎？

“她”來了，陪伴賽道鉅變！爲GPT-4o加上你的一個數字分身

《Relation Networks for Object Detection》筆記

《Deformable part-based fully convolutional network for object detection》筆記

《Semi-Supervised Pedestrian Instance Synthesis and Detection with Mutual Reinforcement》筆記

《Adapting Object Detectors via Selective Cross-Domain Alignment》筆記

《Focal loss for dense object detection》筆記

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結