[Thu, 9 Jul 2015 ~ Tue, 14 Jul 2015] Deep Learning in arxiv

這一期的神作論文有蠻多的,都非常有意思。

Feature Representation In ConvolutionalNeural Networks


該論文中論述了在某種CNN結構下,是否有準確率較高的off model的分類方法(這裏是指非softmax)能達到更有效的分類結果呢?

論文給出了肯定的答案。


該論文還給出了各層特徵重要性的圖表,蠻有意思的


該論文還交代了實驗中用到的開源代碼。

 

 

Towards Good Practices for Very DeepTwo-Stream ConvNets


Openmpi for multi-gpu

Code: https://github.com/yjxiong/caffe/tree/action_recog


Two-Stream Convolutional Networks forAction Recognition in Videos


 

 

其中單個stream的準確率如下:


Combine的結果如下:

 

 

 

Understanding Intra-Class Knowledge InsideCNN


該論文利用可視化技術表述了cnn是如何進行類內區分的

另外在該文中也有引用到利用可視化表述cnn如何進行類間區分的。

是很好的一篇cnn可視化理解文章

COMPRESSING DEEP CONVOLUTIONAL NETWORKSUSING VECTOR QUANTIZATION


該論文描述了手機級別的模型存儲壓縮,非常好的一篇論文。

其實模型參數的壓縮不僅會起到存儲空間壓縮(PQ)的作用,還會起到加速模型的作用例如SVD。

 

 

Unconstrained Facial Landmark Localizationwith Backbone-Branches Fully-Convolutional Networks


論文提出了Backbone-Branches Fully-Convolutional Neural Network (BB-FCN)的網絡結構,非常有趣,論文中還給出了很多商業非商業的方法做比較,是一篇很好的人臉定位切入文章。

其中的網絡結構如下:


結果對比表格:


 

 

Facial Landmark Detection by DeepMulti-task Learning


多任務學習可以提高某單一任務的精度。
發佈了367 篇原創文章 · 獲贊 48 · 訪問量 139萬+
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章