原创 OpenCV實現膨脹與腐蝕

OpenCV實現膨脹與腐蝕                形態學(morphlogy)就是基於形狀的一系列圖像處理操作,而膨脹與腐蝕是兩種最基礎的形態學操作。開運算、閉運算、形態學梯度、頂帽、黑帽都是基於膨脹與腐蝕來實現的。      

原创 雙邊濾波器

雙邊濾波器的實現         雙邊濾波器的目的就是保邊去噪。主要是在高斯濾波的基礎上增加對於像素差的考慮,如果像素差過大則利用高斯函數降低影響,只有相近的像素差纔會具有較大的權重,對於中心像素的值有較大影響 。 具體實現函數如下:

原创 OpenCV實現漫水填充(待完善)

OpenCV實現漫水填充(待完善) 定理:      用一種特定的顏色填充連通區域,通過設置可聯通像素的上下限以及連通方式來達到不同的填充效果的方法。      自動選中和種子相連的區域,接着將該區域替換成指定的顏色。也可以用來從輸入圖

原创 殘缺棋盤問題

 殘缺棋盤問題 對於1*1 2*2 4*4 8*8等 2^k*2^k的棋盤來說,都存在一個任意的位置,而在棋盤剩餘位置都可以用一個或多個由三個格子組成的L型直角版覆蓋 那麼如何覆蓋呢? 在這裏 採用分而治之的方法來考慮。 對於已知的

原创 Ubuntu 14.04 LTS環境下安裝torch 7以及相關

按照官方給定的教程開始安裝,可以安裝在Ubuntu 14  。教程網址:http://torch.ch/docs/getting-started.html#installing-torch。 首先確定系統是否安裝Python以及pytho

原创 Perceptual Losses for Real-Time Style Transfer and Super-Resolution代碼詳解

  按照文中所述的殘差網絡架構如下,只有結尾和開頭的卷積核大小爲9*9,其餘均爲3*3的卷積核,中間有5個殘差塊組成的bottleneck,最後利用tanh函數將圖片的RGB值映射到0~255(原來是-1~1之間的)。 conv1 =

原创 關於深度學習在目標跟蹤領域的學習心得

關於深度學習在目標跟蹤領域的學習心得 目標跟蹤算法可以被分爲產生式(generative model)和判別式(discriminative model)兩大類別,產生式方法運用生成模型描述目標的表觀特徵,之後通過搜索候選目標來最小化重構

原创 卷積與反捲積詳解

下面是暑期報告PPT的一個截圖展示,是對於卷積與反捲積的具體理解,標題如下: 首先先從一維的離散形式出發,可以類比於信號處理中的德爾塔函數。 這裏說明的是信號系統的線性不變形,即經過作用函數以後,線性不變,位移不變。 把線性不變性質

原创 Perceptual Losses for Real-Time Style Transfer and Super-Resolution閱讀(一)

一、文章出處 Perceptual Losses for Real-Time Style Transfer and Super-Resolution,arxiv地址:https://arxiv.org/abs/1603.08155。  

原创 torch的常用模塊學習

一、nn模塊 nn.Identity() 這個函數建立一個輸入模塊,什麼都不做,通常用在神經網絡的輸入層。用法如下: mlp = nn.Identity() print(mlp:forward(torch.ones(5, 2))) 這個

原创 Perceptual Losses for Real-Time Style Transfer and Super-Resolution翻譯

原文鏈接:https://www.jianshu.com/p/b728752a70e9。《基於感知損失函數的實時風格轉換和超分辨率重建》 Abstract 摘要:我們考慮的圖像轉換的問題,即將一個輸入圖像變換成一個輸出圖像。最近熱門的圖像

原创 Batch Normalization 與 Instance Normalization

歸一化的原因: 歸一化是爲了加快訓練網絡的收斂性,可以不進行歸一化處理  歸一化的具體作用是歸納統一樣本的統計分佈性。歸一化在0-1之間是統計的概率分佈,歸一化在-1--+1之間是統計的座標分佈。歸一化有同一、統一和合一的意思。無論是爲了

原创 對於style-transfer客觀評價標準的思考

對於客觀評價標準,目前我主要了解可以從以下幾方面入手。 1、轉換質量 轉換質量又可以用轉換程度與轉換的多樣性來衡量。 對於轉換程度評價,可以通過預訓練ResNet [1],GoogleNet等具有較高分類能力的深層網絡模型,根據目標域標籤

原创 對sytle-transfer的應用價值的思考

對於實用價值來說,除了style translation直觀的轉換意義外,還有以下幾點可以考慮: 1、將圖像上的應用遷移到視頻上 CycleGAN [7]中已有良好的結果顯示,但目前尚未實現。 2、實現跨域學習 CoGAN [8],Sta

原创 Perceptual Losses for Real-Time Style Transfer and Super-Resolution閱讀(二)

三、損失函數 雖然文章說的是perceptual losss,但是感覺上跟上一篇文章的約束並沒有什麼區別,我們可以來看看。 Feature Reconstruction Loss j表示網絡的第j層。 CjHjWj表示第j層的featu