BATMAN：將雙邊注意力用於視頻對象分割

原創

2023-02-13 21:25

出品人：Towhee 技術團隊張晨、顧夢佳

視頻對象分割 (Video Object Segmentation，VOS) 是視頻理解的基礎。基於 Transformer 的方法已經在半監督 VOS 上顯示出顯着的性能改進。然而，現有的工作很難分割彼此靠近的相似物體。爲此，BATMAN 提出了一種用於半監督 VOS 的新型雙邊注意力Transformer。大量實驗驗證了 BATMAN 架構的有效性，它在所有四個流行的 VOS 基準測試中均優於所有現有的最先進技術：Youtube-VOS 2019 (85.0%)、Youtube-VOS 2018 (85.3%)、DAVIS 2017Val/Testdev (86.2) %/82.2%)，以及 DAVIS 2016 (92.5%)。

Overview of BATMAN architecture

BATMAN 通過一個新穎的光流校準模塊捕獲視頻中的對象運動，該模塊將分割掩碼與光流估計融合在一起，以提高對象內光流的平滑度並減少對象邊界處的噪聲。雙邊空間編碼器用於將查詢特徵和校準後的光流編碼爲雙邊空間編碼，供雙邊注意力使用。雙邊注意力 Transformer 會考慮運動和外觀來計算相鄰雙邊空間中查詢幀和參考幀之間的對應關係。

相關資料：

論文鏈接：BATMAN: Bilateral Attention Transformer in Motion-Appearance Neighboring Space for Video Object Segmentation

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

PDManer [元數建模]-v4.9.0 發佈：一款簡單好用的數據庫建模平臺

特別說明平臺公雲版及企業私雲版已經發布，增加多人團隊協作支持,點擊這裏瞭解 [PDManer元數建模-v4]，歷時五年，持續升級，工匠精神，做一款簡單好用的數據庫建模平臺。元數建模平臺，使用React+Electron+Java技

2024-05-20 11:36:32

Makefile:320: * missing: export MACOSX_DEPLOYMENT_TARGET=XX.YY. Stop. make: * [default] Error 2

export MACOSX_DEPLOYMENT_TARGET=12.0.1

2023-12-05 23:23:06

平凱星辰 TiDB 攜手廣發銀行榮膺第十四屆金融科技創新獎

2023 年 11 月 3 日，由《金融電子化》雜誌社、蘇州市金融科技協會共同主辦的“第十四屆金融科技創新獎頒獎典禮”在蘇州隆重舉行。會上，由平凱星辰（北京）科技有限公司（簡稱：平凱星辰）和廣發銀行共同申報的 “廣發銀行新一代銀行客戶信

2023-11-08 22:58:27

【漏洞通知】JeecgBoot 修復SQL注入風險，漏洞危害等級：高危

表字典存在SQL注入漏洞, 遠程攻擊者可利用該漏洞攻擊系統數據庫，獲取敏感數據或者進行數據庫違規操作。 JeecgBoot官方已修復，建議大家儘快升級源碼，新舊版本都可以參考此方案修復！一、漏洞描述表字典存在SQL注入漏洞, 遠程攻

2023-09-05 02:11:02

讓AI替你打工？GPT提升開發效率指南

👉騰小云導讀開發者日常的整個工作流中，AI 大模型能做什麼？ChatGPT 等 AI 大模型能不能通過開發者的指引，一步步完成從技術方案輸出、編碼、測試、發佈到運營維護的整套流程？使用中有什麼避坑點？本文從實際研發流程的各個環節出發，

2023-05-23 23:50:10

基於 Flink CDC 的現代數據棧實踐

摘要：本文整理自阿里雲技術專家，Apache Flink PMC Member & Committer, Flink CDC Maintainer 徐榜江和阿里雲高級研發工程師，Apache Flink Contributor & F

2023-04-20 00:25:10

Linux常用CURL|WGET請求格式備份

一、CURL 查看curl命令相關幫助文檔： curl --help (1)、PUT方法 curl --location --request PUT 'https://xxxxxxxxxxx/xxxxxx' \ -H 'Content-

2023-02-28 23:22:27

mongodb 跨庫copy

var srcUrl='mongodb://ip:port/authDb'; var db2=connect(srcUrl,'user','password') function copy(collectionName){ var nu

2023-02-24 22:27:22

關係代數和SQL語法

數據分析的語言接口 OLAP計算引擎是一架機器，而操作這架機器的是編程語言。使用者通過特定語言告訴計算引擎，需要讀取哪些數據、以及需要進行什麼樣的計算。編程語言有很多種，任何人都可以設計出一門編程語言，然後設計對應的編譯器做解析。編程語言

2023-01-31 00:01:22

敲敲雲快速入門指南—上篇

本文通過快速搭建一個《客戶管理》應用，幫您快速掌握搭建敲敲雲應用的基本思路和操作。一、敲敲雲簡介敲敲雲是一個APaaS平臺,零代碼的應用搭建平臺,無需編程簡單易學,可以幫助業務人員在不寫代碼的情況下搭建個性化的CRM、ERP、OA等

2023-01-10 00:38:46

新版本WebMVC5.0發佈

MVC5.0有哪些新變化，下面做些介紹：討論QQ羣：685072623 源碼地址：https://gitee.com/pearroom/DelphiWebMVC 1：項目整體結構進行調整，去掉了項目對Config下文件的依賴，整

2022-04-30 13:20:41

how to install db2 in docker

docker run --detach \ --name db2 \ --restart always \ --privileged=true \ -p 50000:50000 \ -e LICENSE=accept \ -e

2022-04-30 12:32:58

實時通信服務中的語音解混響算法實踐

導讀：隨着音視頻通信會議越來越普及，與會各方在不同環境中遇到了越來越明顯且差異的混響場景，譬如大會議室場景、玻璃會議室場景和小房間且隔音材料不佳場景等。爲了保證更好的聽音可懂度和舒適度，通信中的語音解混響需求愈來愈重要且緊迫。本文

2022-04-30 10:52:23

OpenCV 中的圖像處理 005_形態變換

本文主要內容來自於 OpenCV-Python 教程的 OpenCV 中的圖像處理部分，這部分的全部主要內容如下：改變色彩空間學習在不同色彩空間之間改變圖像。另外學習跟蹤視頻中的彩色對象。圖像的幾何變換學習對圖像應用不同

2022-04-30 09:19:21

DB2 mysql

DROP TABLE DB2ITFE.test1; CREATE TABLE DB2ITFE.test1 ( s_id BIGINT NOT NULL, s_name VARCHAR (

2022-04-30 09:14:37

24小時熱門文章

最新文章

最新評論文章