MSRN: Multi-scale Residual Network for Image Super-Resolution(多尺度殘差網絡)
網絡結構:
網絡結構分成兩個部分,一是特徵提取部分,二是重建部分。這篇文章讀的比較懂,所以可以多說一點。
(i) 特徵提取部分分成兩個部分,一是多尺度殘差塊(MSRB),二是前面的M0,M0是MSRB之前的部分。
(ii) 第一層卷積M0是用做初步的特徵提取。
(iii) 之後的M1到Mn的內部結構是一模一樣的。文中最重要的部分在這裏,就是多尺度的概念,這裏的多尺度指的是卷積核大小。
(iv) 接下來,到了特徵提取和重建中間的部分,在這裏,將之前所有多尺度殘差塊的輸出以及M0都“排隊”到這裏。
(v) 然後,用了通道壓縮的函數,將之前“排隊”得到的結果壓縮成我們想要的數量,這裏的數量和我們想要重建圖像的大小有關係。
(vi) 最後,使用pixel shuffle(ESPCN)裏的技術將圖像擴大尺寸,在經過一個卷積層,得到最後的重建圖像。
多尺度殘差塊(MSRB)
Multi-scale
這裏需要講一下卷積核的作用,卷積核也就是在圖像中的“濾波”。圖像中的濾波在做卷積運算的時候,能夠實現對圖像特徵的提取。而不同大小的卷積核能夠提取到的圖像特徵是不同的,所以在同一個網絡中使用兩種卷積核,那麼不同的特徵就能夠在一個網絡中得到,進而實現圖片更高超分辨率的要求。
MSRB
這裏我們講一下n=1的情況,這裏的輸入是經過第一層的M0,分成兩個部分,一邊是3x3的卷積核,另一邊是5x5的卷積核。通過之後,將兩部分的輸出串(concat)在一起,特徵圖的通道數是之前的兩倍。而這裏作爲後部分的輸入,和之前一樣,再做一遍。之後得到的通道數是開始的4倍,要想實現殘差的操作,必須將通道數變成和開始的輸入一樣。所以後面的1x1的卷積覈實現的是將特徵圖的通道數壓縮,最後再加上殘差的操作。輸出的是M1
重建部分
重建部分有很多種情況
這裏將重建部分設計的比較簡單,將之前的A.B.C部分進行簡化,得到最後的結果。這裏在我看來沒有什麼新意,就是將一些沒什麼用的部分剔除掉了。
實驗細節:
使用DIV2K數據集,然後再加上旋轉,翻轉之類的操作來增加訓練的數據集。然後將圖片轉成YCbCr通道,然後再將Y通道的圖片提取出來,作爲訓練的數據集。
由於實驗室的硬件條件,我這裏實現不了900張數據庫,所以就只使用291張的圖片,再做數據的增強,目前結果還沒有出,出了之後,會公佈在這裏。
另外文中也實現了圖像的去噪和去霧的實驗,展現了MSRB特徵提取能力。
如果有錯誤,希望批評指正。
我會隨時補充的。