對抗網絡在文本生成圖片中的應用

原創

2020-02-20 13:32

1 簡介

利用神經網絡可以從文本生成圖片，即將文本的語義轉化爲圖片; 也可以從圖片生成文本，即生成的文本描述圖片中的內容，例如一幅圖片中有一直小鳥落在枝頭。最後由圖片生產的文本就可以能可愛的綠色小鳥落於枝頭。在計算廣告中這種文本和圖片之間互相生成的過程非常有用，如果可以在工業界有所突破，他們在廣告創意的製作中將會發揮巨大作用，例如選定一個創意標題，立刻得到了創意圖片，當製作完成了創意圖片時也立刻得到了創意標題。

2 對抗網絡(DCGAN)

２.１原理

生成過程
輸入的是高斯分佈的數據，最終生成圖片，相等於卷積網絡的逆過程，如下圖

圖1 生成網絡
對抗學習
將真實圖片和生成網絡產生的圖片當成正，負樣本，同時送入一個卷積網絡，訓練卷積網絡，然後再將真實圖片當成負樣本，輸入卷積網絡對抗學習，達到調節生成網絡的目的，如下圖

圖2 對抗學習網絡

主要參考這篇文章

Unsupervised Representation Learning with Deep Convolutional Generative Adversarial Networks(DCGAN)

2.2 應用

生成模型的應用
通過一個微調輸入生成不同風格的圖像，如下圖，只要微調輸入高斯分佈數據就可以得到不同的風格，顏色的漫畫

圖3 生成模型的應用
判別模型的應用
可以利用已經學習好的判別模型對圖片進行特徵抽取，詳見DCGAN參考文章。下圖是從判別模型抽取圖片特徵然後分類的效果對比

圖4 判別模型抽取圖片特徵分類效果對比

3 DCGAN在Text2Image上的應用

３.１意義

圖片與文本之間互相生成在廣告創意製作上有非常重要的意義，可以得到炫酷的效果，見下圖

圖5 圖片和文本之間互相生成在廣告創意上的應用

３.２ Text2Image

文本生成圖片的網絡結構如下

圖6 Text2Image網絡結構

３.3 生成過程

生成過程與原生的DCGAN複雜，如下圖

圖7 Text2Image訓練過程

3.4 示例

圖8 由文本生成圖片效果對比圖

圖9 通過修改同一句文本里的部分詞語，生成不同的顏色圖片

參考文獻

Generative Adversarial Text to Image Synthesis
Unsupervised Representation Learning with Deep Convolutional Generative Adversarial Networks(DCGAN)
Generative Adversarial Networks
Conditional Generative Adversarial Nets
Emerging Topics in Learning from Noisy and Missing Data: Zero Shot Learning

zc02051126

發佈了137 篇原創文章 · 獲贊 91 · 訪問量 67萬+

他的留言板關注

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

對抗網絡在文本生成圖片中的應用

1 簡介

2 對抗網絡(DCGAN)

２.１原理

2.2 應用

3 DCGAN在Text2Image上的應用

３.１意義

３.２ Text2Image

３.3 生成過程

3.4 示例

參考文獻

《Python進階》學習筆記

Leetcode 3161. 物塊放置查詢

leetcode 60 排列序列

一個docker容器暴露多個端口

微服務實踐之使用 Visual Studio 2022 調試Dapr 應用程序

wpf附加屬性理解 WPF附加屬性

TCP/IP詳解卷1-協議：IP

併發編程中的術語總結

機器學習基礎第三章分類算法

共享庫：理解動態加載

對抗網絡在文本生成圖片中的應用

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結

對抗網絡在文本生成圖片中的應用

1 簡介

2 對抗網絡(DCGAN)

２.１ 原理

2.2 應用

3 DCGAN在Text2Image上的應用

３.１ 意義

３.２ Text2Image

３.3 生成過程

3.4 示例

參考文獻

２.１原理

３.１意義