我最近看的一些底層圖像算法的 paper 有很多用了各種變形的 GAN 來做。我就很好奇,GAN 到底有啥牛逼。網上關於 GAN 的介紹很多,我從 GAN 的訓練角度口頭解釋下其訓練機制。
GAN 的核心思想是納什均衡理論。因此,GAN 網絡中包含一個生成器和一個判別器,如下圖所示。生成器和判別器本質是兩個獨立的網絡,因此訓練的時候獨立訓練。
GAN 結構示意圖(來源網絡)
其訓練機理爲:生成器和判別器單獨交替訓練。步驟如下:
1. 訓練判別器:
固定生成器的參數,輸入判別器的圖像標籤爲1,隨機噪聲輸入生成器得到的假圖標籤爲0,訓練判別器到收斂。
2. 訓練生成器:
固定判別器的參數,輸入判別器的圖像標籤爲1,隨機噪聲輸入生成器得到的假圖標籤爲1,訓練生成器到收斂。
3. 交替循環步驟1和2。
具體的操作步驟我還沒有實踐過,改天有時間玩個 demo。