論文筆記:SinGAN: Learning a Generative Model from a Single Natural Image

論文筆記:SinGAN: Learning a Generative Model from a Single Natural Image

簡介

這是ICCV2019 最佳論文。本文提出了一個多尺度的GAN,能夠用單張圖片進行訓練,生成一系列高質量且類似的圖片。這是博主第一次閱讀GAN相關的文章,難免在理解上會出現一些問題,望見諒。

github代碼:官方pytorch源碼

在這裏插入圖片描述

這個算法可以用於圖片生成、圖片編輯、圖像和諧化、超分辨率等多個領域。
在這裏插入圖片描述

方法

以往的GAN,要麼只能通過大量的同類別圖片來訓練生成新圖片,要麼用一張圖片只能模仿它的一些比較低級的紋理特徵(如圖所示),但是本文提出了一種新的方法,只用一張圖,同樣可以生成一系列高質量的同內容圖片。
在這裏插入圖片描述

如果直接用一張圖片來訓練一個GAN,勢必造成生成器難以學習到足夠多的細節特徵或者只能學習到紋理特徵的情況。因此,這篇文章提出了一個多尺度GAN,來解決這個問題。
SInGAN包含N個不同尺度的GAN,分別爲GN ~ G 0,尺度依次增加。第GN個生成器的輸入是一張噪聲圖像,訓練其輸出的結果儘可能接近下采樣過後的原圖XN,之後的每一個GAN,輸入都是Gn+1輸出的結果加上一張噪聲圖,從而,除了GN,剩下每一個GAN學到的,其實是補充上一個GAN輸出結果的細節信息。

在這裏插入圖片描述

在這裏插入圖片描述

訓練過程就是從第N個GAN開始訓練,每個GAN訓練完了之後不再改變這一層的參數,再訓練更高一層的GAN,直到訓練到最後一層。
訓練的loss包括兩部分:Adversarial loss和Reconstruction loss。二者加權:
在這裏插入圖片描述

其中,Ladv是爲了懲罰生成器輸出和實際圖片的分佈的距離(就是讓生成器輸出儘可能以假亂真),Lrec是爲了保證有一部分輸入可以生成和原圖一毛一樣的結果(文中採取一個固定的噪聲輸入作用在GN,剩下GAN的噪聲輸入全部取零,訓練讓這個輸入下的輸入儘可能等於原圖)。

結果

在這裏插入圖片描述

在這裏插入圖片描述

在這裏插入圖片描述

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章