對抗網絡在文本生成圖片中的應用

1 簡介

利用神經網絡可以從文本生成圖片,即將文本的語義轉化爲圖片; 也可以從圖片生成文本,即生成的文本描述圖片中的內容,例如一幅圖片中有一直小鳥落在枝頭。最後由圖片生產的文本就可以能可愛的綠色小鳥落於枝頭。在計算廣告中這種文本和圖片之間互相生成的過程非常有用,如果可以在工業界有所突破,他們在廣告創意的製作中將會發揮巨大作用,例如選定一個創意標題,立刻得到了創意圖片,當製作完成了創意圖片時也立刻得到了創意標題。

2 對抗網絡(DCGAN)

2.1 原理

  • 生成過程
    輸入的是高斯分佈的數據,最終生成圖片,相等於卷積網絡的逆過程,如下圖


    這裏寫圖片描述
    圖1 生成網絡

  • 對抗學習
    將真實圖片和生成網絡產生的圖片當成正,負樣本,同時送入一個卷積網絡,訓練卷積網絡,然後再將真實圖片當成負樣本,輸入卷積網絡對抗學習,達到調節生成網絡的目的,如下圖


    這裏寫圖片描述
    圖2 對抗學習網絡

主要參考這篇文章

Unsupervised Representation Learning with Deep Convolutional Generative Adversarial Networks(DCGAN)

2.2 應用

  • 生成模型的應用
    通過一個微調輸入生成不同風格的圖像,如下圖,只要微調輸入高斯分佈數據就可以得到不同的風格,顏色的漫畫


    這裏寫圖片描述
    圖3 生成模型的應用

  • 判別模型的應用
    可以利用已經學習好的判別模型對圖片進行特徵抽取,詳見DCGAN參考文章。下圖是從判別模型抽取圖片特徵然後分類的效果對比


    這裏寫圖片描述
    圖4 判別模型抽取圖片特徵分類效果對比

3 DCGAN在Text2Image上的應用

3.1 意義

圖片與文本之間互相生成在廣告創意製作上有非常重要的意義,可以得到炫酷的效果,見下圖


這裏寫圖片描述
圖5 圖片和文本之間互相生成在廣告創意上的應用

3.2 Text2Image

文本生成圖片的網絡結構如下


這裏寫圖片描述
圖6 Text2Image網絡結構

3.3 生成過程

生成過程與原生的DCGAN複雜,如下圖


這裏寫圖片描述
圖7 Text2Image訓練過程

3.4 示例


這裏寫圖片描述
圖8 由文本生成圖片效果對比圖

這裏寫圖片描述
圖9 通過修改同一句文本里的部分詞語,生成不同的顏色圖片

參考文獻

  • Generative Adversarial Text to Image Synthesis
  • Unsupervised Representation Learning with Deep Convolutional Generative Adversarial Networks(DCGAN)
  • Generative Adversarial Networks
  • Conditional Generative Adversarial Nets
  • Emerging Topics in Learning from Noisy and Missing Data: Zero Shot Learning
發佈了137 篇原創文章 · 獲贊 91 · 訪問量 67萬+
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章