FG2020 | 軟門控信號優化shortcut

https://arxiv.org/pdf/2002.11098.pdf

1.優化shortcut

現有的很多優秀的人體姿態估計網絡都用到了類似Hourglass框架,該架構由多個如下圖所示的編碼器+解碼器組合而成,且該框架內部有一個約定是下圖中的跳躍連接能夠有效提升網絡性能。而本文對這種跳躍連接進行了深入分析,並利用軟門控信號的方式優化該連接,實現了精度的提升。

2.軟門控信號

如上圖所示,所謂的軟門控信號就是在每個跳躍連接的過程中,加入一個和輸入通道維度相同的向量組,該向量組中的每一個標量值代表了當前輸入通道的重要性,並且這些標量值都是可學習的,隨着迭代的進行,通過更新這些標量值可以獲取更好的跳躍連接機制。其實這和通道注意力機制非常的類似。

上圖左邊的公式對軟門控信號的運行機制進行建模。公式中的阿爾法表示了軟門控信號中的控制量。該控制量的使用,從上圖右邊的表中可以看出,對輸入中的所有通道N都進行學習的效果是最好的。爲了使得軟門控機制這種操作的有效性更加直觀,作者對中間參數特徵進行了可視化統計,用以輔助理解軟門控信號的優勢。

上述兩幅圖展示了特徵在進行門控機制前後的分佈圖。從圖中可以看出,經過門控信號後,整體的特徵根據靠近0,這說明原始的特徵中有需要不重要的信號,而這種信號若是不進行門控,任由其傳入到後續網絡中,將會對最終的性能產生影響。

上圖中藍色直方圖表示常規的跳躍連接後特徵concat後的block特徵分佈,綠色直方圖表示使用了軟門控信號後再進行concat後的block輸出特徵分佈。從特徵分佈可以看出,使用了軟門控信號後彷彿對特徵做了增強,使得特徵更加具有辨別力。

3.結果展示

從上述結果和現在的實時排名[2020.05.14],我們都可以發現這種簡單的門控信號所帶來的性能增益,其在MPII和LSP兩個數據集上都達到了當前最優的性能。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章