2020年, VideoQA論文彙總

原創

2020-07-08 08:07

目錄

CVPR2020：CRN

CVPR2020：CRN

題目
Hierarchical Conditional Relation Networks for Video Question Answering
下載鏈接
動機
VideoQA的兩個難點：1. 提取動態視覺信息和關係信息。2. 將提取到的信息與語言概念進行關聯。現有的QA視頻建模方法是構建神經結構，其中每個子系統要麼是爲特定的定製目的設計的，要麼是爲特定的數據模態設計的。所以，這些模型結構不能適應數據模態的變化、視頻長度的變化、或問題類型的變化。
貢獻

新的視頻表示方法
可用於視頻文本交互的building block

方法
本文提出的CRN block如下圖所示：

CRN的流程爲：

本文的整體框架爲：

本文的層次化CRNs主要分爲四層：1. 編碼clip之間的幀，context: clip motion。2. 聚合linguistic信息。3. 編碼不同的clip，context: video motion。4. 聚合linguistic信息。
實驗
在TGIF-QA數據集上的實驗結果：

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

【CVPR2020】Fast Soft Color Segmentation

Fast Soft Color SegmentationSoft Color Segmentation 什麼是軟顏色分割Fast Soft Color Segmentation 快速軟色彩分割01 Introduction02 M

2020-06-22 22:52:56

2020北京智源大會圖神經網絡專題總結

目錄引言[1] 基於感知和認知系統的邏輯關係推理作者介紹分享內容system1 和 syetem2 reasoningGMNN: Graph Markov Neural Networks (ICML2019)Probabilist

2020-07-06 14:22:03

CVPR 2020 HAN:《Hypergraph Attention Networks for Multimodal Learning》論文筆記

目錄簡介動機貢獻方法實驗簡介本文提出了一種用於多模態學習的超圖注意力網絡，作者來自Kakao公司和首爾大學。 Kakao公司的主要產品是Kakao talk，類似於國內的微信，且騰訊是其第二大股東。 Kakao Brain這個

2020-07-04 09:51:10

CVPR 2020 《Transform and Tell: Entity-Aware News Image Captioning》論文筆記（數據集）

目錄簡介動機貢獻方法實驗簡介本文是新聞圖像標註，和常見的Image Captioning任務不太一樣。下載鏈接 News Image Captioning中沒有object-level的標註，難點在於，將text和image

2020-07-04 09:51:10

CVPR 2020 《Context-Aware Group Captioning via Self-Attention and Contrastive Features》論文筆記（數據集）

目錄簡介動機貢獻方法實驗簡介本文提出了一個新任務——Group Captioning，就是在一堆圖片中，對特定的幾個圖片生成caption，生成的caption要具備選定的圖片的特性，且不包含其他未選定的圖片的特性。下載鏈接

2020-07-04 09:51:10

KDD 2017 《ReasoNet: Learning to Stop Reading in Machine Comprehension》論文筆記

目錄簡介動機貢獻方法實驗簡介本文面向機器閱讀理解問題（Machine Reading Comprehension），作者來自微軟研究院。下載鏈接動機現有的方法可以分爲兩類：單步推理（Single turn）、多步推理（m

2020-07-04 09:51:10

CVPR 2020 《Local-Global Video-Text Interactions for Temporal Grounding》論文筆記

目錄簡介動機貢獻方法實驗簡介本文的作者來自浦項科技大學和首爾大學下載鏈接動機在Grounding領域，早些的方法都可以歸結爲scan-and-localize framework，主要包括兩個步驟：1. 生成propos

2020-07-04 09:51:10

2020-07-07 CVPR2020 i3DV論文討論（3）筆記

目錄[1] PIFuHD: Multi-Level Pixel-Aligned Implicit Function for High-Resolution 3D Human Digitization[2] Height and U

2020-07-08 08:07:23

2020-07-02 CVPR2020 V&L論文討論（3）筆記

目錄[1] Bi-directional Relationship Inferring Network for Referring Image Segmentation[2] A Real-Time Cross-modality

2020-07-04 10:30:59

2020-07-03 CVPR2020 i3DV論文討論（2）筆記

目錄[1] Context Prior for Scene Segmentation[2] Deep Stereo using Adaptive Thin Volume Representation with Uncertaint

2020-07-04 09:51:10

2020CVPR深度估計

論文收集方法檢索了所有帶depth的標題的論文，爭取沒有遺漏的篩選深度估計相關論文下面進行分類單純有監督深度估計 uncertainty aware cnns for depth completion: uncertain

2020-07-04 00:21:19

Pose-guided Visible Part Matching for Occluded Person ReID閱讀筆記

Paper：https://arxiv.org/abs/2004.00230 Code：https://github.com/hh23333/PVPM 前言：本人閱讀的第二篇CVPR 2020關於ReID的論文。主要解決了遮擋行人重識別的

不甘现状的咸鱼却没办法

2020-07-02 14:14:11

[CVPR2020] StarGAN v2

目錄網絡改進具體結構GeneratorDiscriminatorStyle EncoderMapping network損失函數Adversarial objectiveStyle reconstructionStyle dive

2020-07-01 22:29:46

CVPR2020 | 小樣本學習論文合輯

前言根據openaccess cvpr2020給出的文章列表，根據關鍵詞查詢文章，並且下載論文。以下是我根據few-shot 和 few這兩個作爲關鍵字查詢得到的文章列表文章列表 FSS-1000: A 1000-Class

2020-06-29 18:52:23

大合集！CVPR2020論文分方向整理: 目標檢測/圖像分割/姿態估計等，附打包下載（持續更新）

CVPR2020在2月24日公佈了所有接受論文ID，相關報道：1470篇！CVPR2020結果出爐，你中了嗎？（附部分論文鏈接/開源代碼/解讀）。自論文ID公佈以來，許多開發者都分享了自己的優秀工作。從論文ID公佈以來，極市一直

2020-06-21 18:32:19

24小時熱門文章

最新文章

最新評論文章