簡介
本文提出了一個新任務——Group Captioning,就是在一堆圖片中,對特定的幾個圖片生成caption,生成的caption要具備選定的圖片的特性,且不包含其他未選定的圖片的特性。
下載鏈接
動機
現有方法都只側重於單張圖片的captioning,而現實世界中,往往需要分組描述。
貢獻
- 提出一個新的task——group captioning。
- 提出了一種learning based的學習一組圖像特徵的方法。
- 提出了新的數據集——Stock Captions。
方法
數據集構造方法:
本文方法:
實驗
實驗結果: