論文筆記：SinGAN: Learning a Generative Model from a Single Natural Image

簡介

這是ICCV2019 最佳論文。本文提出了一個多尺度的GAN，能夠用單張圖片進行訓練，生成一系列高質量且類似的圖片。這是博主第一次閱讀GAN相關的文章，難免在理解上會出現一些問題，望見諒。

github代碼：官方pytorch源碼

這個算法可以用於圖片生成、圖片編輯、圖像和諧化、超分辨率等多個領域。

方法

以往的GAN，要麼只能通過大量的同類別圖片來訓練生成新圖片，要麼用一張圖片只能模仿它的一些比較低級的紋理特徵（如圖所示），但是本文提出了一種新的方法，只用一張圖，同樣可以生成一系列高質量的同內容圖片。

如果直接用一張圖片來訓練一個GAN，勢必造成生成器難以學習到足夠多的細節特徵或者只能學習到紋理特徵的情況。因此，這篇文章提出了一個多尺度GAN，來解決這個問題。
SInGAN包含N個不同尺度的GAN，分別爲G_N ~ G ₀，尺度依次增加。第G_N個生成器的輸入是一張噪聲圖像，訓練其輸出的結果儘可能接近下采樣過後的原圖X_N，之後的每一個GAN，輸入都是G_n+1輸出的結果加上一張噪聲圖，從而，除了G_N，剩下每一個GAN學到的，其實是補充上一個GAN輸出結果的細節信息。