Spatial Transformer Layer 實驗結果及分析

原創

2020-06-24 17:31

序言：

ST Layer在distorted minist數據集上表現出了很好的結果，但畢竟distorted minist是一個簡單的數據集。（手寫單個數字分類，所以共10類）

所以在本篇文章中，先會解釋一部分，STLayer的原理，然後解釋一部份minist上面的操作，最後解釋一下我在market1501上的實驗以及結果分析

解釋：

ST Layer是一個由 6個參數和原圖生成一個仿射變換後的新圖。

這六個參數決定了仿射的方式。其實ST Layer的最終目的是讓NN在看圖像時具有attention（類似NLP中的應用，問答，其實最關鍵的只有某幾個詞）

（其實我自己也嘗試用matconvnet，寫過這個公式，以及相應的bp，但沒收斂，速度上比較慢。但當時真的覺得自己可以寫成功的，最後差了一點點。

因爲matconvnet官方用cu寫了一個，速度超快，我當時就服了。哈哈。）

matconvnet官方在distort minist採用的結構如下：

主要是先用了一個local網絡預測6各參數，（圖中下面一路）

用6個參數產生一個grid，應用在圖像上，（圖中下面一路和上面一路input集合在一起）

我在market1501上採用的結構如下：(清晰度很靠譜的，我調整過，建議下載然後放大看)

實驗中：

1.在行人問題上是不是和預期的相同，學到揹包或衣服

2.使用簡單的歐氏距離，在test集上側指標

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

Spatial Transformer Layer 實驗結果 及 分析