原创 Spatial Transformer Layer 實驗結果 及 分析

序言: ST Layer在distorted minist數據集上表現出了很好的結果,但畢竟distorted minist是一個簡單的數據集。(手寫單個數字分類,所以共10類) 所以在本篇文章中,先會解釋一部分,STLayer的原理,然

原创 閱讀小結:Generative Adversarial Nets

這是Ian Goodfellow大神的2014年的paper,最近很火,一直沒看,留的坑。 中文應該叫做對抗網絡 代碼是用pylearn2寫的  github地址爲:https://github.com/goodfeli/adversar

原创 matlab中在圖像上劃線 畫圈的方法

其實用plot都可以搞定。  plot(imp(:,1),imp(:,2),'ro'); %最後的‘ro’,r是代表紅色,o是代表畫圈。畫圈的話可以提供多個點的座標,我這裏用的就是向量的形式。   plot(imp(1:2,1),imp(

原创 Person Search中關於特徵Norm的討論

論文題目:Norm-Aware Embedding for Efficient Person Search 論文鏈接:http://openaccess.thecvf.com/content_CVPR_2020/papers/Chen_N

原创 圖文互搜:用CNN分100,000類圖像和文本

[Title]:Dual-Path Convolutional Image-Text Embedding [arXiv]:http://cn.arxiv.org/abs/1711.05535 [Code]:layumi/Image-Tex

原创 Pytorch GPU 顯存溢出 Out of Memory 如何處理

在不修改網絡結構的情況下, 有如下操作: 同意 @Jiaming , 儘可能使用inplace操作, 比如relu 可以使用 inplace=True 。一個簡單的使用方法,如下:   def inplace_relu(m):

原创 利用Uncertainty修正Domain Adaptation中的僞標籤

論文題目: Rectifying Pseudo Label Learning via Uncertainty Estimation for Domain Adaptive Semantic Segmentation 論文地址: https

原创 cuda 安裝方法

實驗室的服務器又掛了。。。。真的日了狗了。。 寫下來,以防自己以後還要裝。 http://docs.nvidia.com/cuda/cuda-getting-started-guide-for-linux/index.html#axzz4

原创 如何加強神經網絡訓練

筆者最近在做行人重識別問題,故下面以提升reID的準確率爲例: 1. 擴大數據集 調研CUHK01/CUHK03,要小心各個數據集中的bias(比如只有兩個攝像頭下的照片) 同時,爲了做比較,所以先只在market1501上測試。 2.

原创 閱讀小結:Improved Techniques for training GANS

github地址:https://github.com/openai/improved-gan/ What: 提出了對於GANs新的結構和訓練過程。主要focus在兩個應用:半監督學習 和  更好的圖像產生。 對於G,不要求一個和tes

原创 CMS-RCNN閱讀小結

閱讀前疑問: 1.FasterRCNN的RPN 本來就是multi-scale的,印象中有27種,這篇文章針對人臉檢測有什麼改進麼? 2.contextual是怎麼結合附近信息? 驅動: 1.小的人臉使用rcnn難以檢測 原始RCNN

原创 閱讀小結An Improved Deep Learning Architecture for Person Re-Identification

Author: Ejaz Ahmed,Michael Jones and Tim K. Marks  http://www.cv-foundation.org/openaccess/content_cvpr_2015/papers/Ahm

原创 閱讀小結Deep Metric Learning via Lifted Structured Feature Embedding

原作者的github code:https://github.com/rksltnl/Deep-Metric-Learning-CVPR16 What: 這是一篇講圖像retrieval的工作,其實也可以用運用於細力度(fineg

原创 閱讀小結:Unsupervised Representation with Deep Convolutional Generative Adversarial Networks

What CNN應用於無監督學習。將這種CNN稱爲DCGANs 1.提出和評估了DCGANs 有一些結構上的限制,讓他可以stable的去訓練。 2.利用圖像分類任務訓練的discriminator,證明了他們有無監督學習的潛力。(這是

原创 閱讀小結:Correlational Neural Networks

What: auto encoder的升級版   顯式的 最大化當投影到同一空間時views之間的聯繫 (這裏的view指的是圖像,聲音這種不同的輸入源) 比如視頻分類任務中就想把聲音結合進去。 Formally Define這個任務是