ITS17 ERFNet: Efficient Residual Factorized ConvNet for Real-Time Semantic Segmentation

原創

phdsky

2020-02-25 01:44

文章目錄

Block - Factorized Residual Layers

Miscellaneous

相關工作

Block - Factorized Residual Layers

結構特徵

網絡結構的關鍵點：A novel layer that uses residual connections and factorized convolutions

跳躍連接：使用ResNet網絡結構，讓網絡學習殘差函數來加速訓練

分解卷積：通過將2D卷積操作等效分解爲多個1D卷積操作，在獲得與2D相似準確率的情況下大幅減少了參數量

ERFNet網絡架構就是基於Non-bottlenect block結構的順序堆疊型網絡，不包含多級特徵圖融合或block間的長距離範圍跳躍連接。

關於跳躍連接作者分析了文章[6]中的ResNet block，包含Non-bottleneck和Bottleneck兩種；作者提到兩種版本實際上具有相似的參數量（作者是基於feature map降低4倍的情況下對比的，很明顯bottleneck大幅降低了參數量），並且準確率也差不多；但是bottleneck需要更少的計算資源，並且當網絡深度增加時計算量的增長不大。

從[6] [7] [12]作者說非bottleneck結構相對於bottlneck結構可以從深度獲得更高的準確率，意思是bottlneck結構仍然存在梯度彌散的問題。

卷積分解理論作者引用了[22]，列出了任意2D濾波器可以由若干個1D濾波器組合的數學公式；作者主要對Non-bottleneck進行了改造，ERFNet架構中使用的也是Non-bottlenect-1D block；

寬度擴展

作者說從濾波器和特徵圖的計算量可以得出Non-bottleneck-1D直接增加了網絡結構的width，後面也有篇幅提到了這個block帶來的是wider layer的效果。

這裏沒有太理解他說的本意是什麼，大概意思可能是這個block降低了計算量；如果從相同計算量角度，那麼這個block可以獲取更wider的信息？

參數分析

文中提了三種Block結構，實際上對應的應該還有一種：對Bottleneck的1D分解；這個網絡在文中有提到且分析了一下參數量，但是沒有繼續往下做實驗（這個結構在ENet中使用了，表示爲asymmetric conv）；

四種block在相應feature map下的參數量：

上表計算的參數量應該是不帶bias的數值，針對單個block參數量分析可以參考：http://cs231n.github.io/convolutional-networks/#conv，根據表中給定的 $w_0 = 64$ ，參數量數值計算如下：

Residual Block	without bias	with bias
bottleneck	1x1x256x64 + 3x3x64x64 + 1x1x64x256 = 69632	(1x1x256+1)x64 + (3x3x64+1)x64 + (1x1x64+1)x256 = 70016
non-bottleneck	3x3x64x64x2 = 73728	(3x3x64+1)x64x2 = 73856
bottleneck-1D	1x1x256x64 + 3x1x64x64x2 + 1x1x64x256 = 57344	(1x1x256+1)x64 + (3x1x64+1)x64x2 + (1x1x64+1)x256 = 57792
non-bottleneck-1D	3x1x64x64x4 = 49152	(3x1x64+1)x64x4 = 49408

平臺測試

文中所述的網絡準確率在實時分割網絡裏面基本上是最優的，原文可看到實驗結果這裏不做對比；此外文中提到的網絡前向速度和我在海思NPU平臺測試的結果有出入。

問題跟進

關於Bottleneck-1D的實驗和wider layer的解釋，看作者後續會不會有什麼跟進：
https://github.com/Eromera/erfnet_pytorch/issues/45

Miscellaneous

近來的發展趨勢是將所有分類問題統一爲語義分割任務

ITS17 ERFNet: Efficient Residual Factorized ConvNet for Real-Time Semantic Segmentation

文章目錄

Block - Factorized Residual Layers

結構特徵

寬度擴展

參數分析

平臺測試

問題跟進

Miscellaneous

相關工作

再談23種設計模式（3）：行爲型模式（學習筆記）

Power Automate Desktop 安裝完，登錄後老是提示one driver 錯誤

微前端學習筆記(4):從微前端到微模塊之EMP與hel-micro方案探索

微前端學習筆記（1）：微前端總體架構概述，從微服務發微

985 碩士程序員，空窗 4 個月沒有 Offer！

一文搞懂 Spring 循環依賴

賽博鬥地主——使用大語言模型扮演Agent智能體玩牌類遊戲。

VScode右鍵打開(添加到右鍵)

記一次 .NET某工控視覺自動化系統卡死分析

WindowsServer--SQL Server搭建主從同步實現讀寫分離 - 事務性分發

機器學習算法代碼實現

Linux踩坑爬坑總結

高通SNPE之神坑警告

語義分割相關評價指標

支持向量機模型實現

Mac下配置sublime實現LaTeX

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結