論文閱讀：《Flowing ConvNets for Human Pose Estimation in Videos》ICCV 2015

原創

2020-02-23 12:06

概述

本文主要用CNN網絡來進行人體姿態估計，加入了temporal 信息以提高精度。本文的四個貢獻：

1. 提出了一個更深的CNN網絡（相比於Alex-Net），不同於之前的迴歸座標，而是迴歸heatmap，這樣可以提高關節點定位的魯棒性，並且更利於在訓練過程中的可視化觀察。
2. 提出一種空間融合層，用來學習隱式空間模型，即用來提取關節點之間的內在聯繫
3. 使用光流信息，用來對準相鄰幀的heatmap 預測
4. 使用最後的參數池化層，學習將對齊的熱圖合併成一個聚集的置信圖

網絡框架

網絡pipeline：對於當前幀t，輸入它的相鄰的前後n幀。利用全卷機神經網絡（Spatial Net + Spatial Fusion Layers）對每一幀輸出一個預測的heatmap。再利用光流信息將這些heatmap扭曲到當前幀t。之後將warped的heatmap合併到另一個卷積層中，該層學習如何權衡來自附近框架的扭曲的heatmap。最後使用集合熱圖的最大值作爲人體的身體關節。

Spatial Fusion Layers的細節結構

增加該結構是爲了學習關節之間的內在聯繫，其獲取的是之前CNN中的conv3和conv7，將這兩層結合之後再經過5層卷積。關於loss一共有兩個，一個是spatial net中的loss1，用的是L2範式，計算公式是CNN中輸出的heatmap與ground truth中的目標的座標的高斯分佈的距離和。同理，spatial fusion net之後的loss2也是相同的計算方式。兩者是爲了保證學習的內容不同。

光流法增強heatmap

1. 使用密集光流將附近幀的信號與當前幀對準
2. 然後使用附加捲積層將這些置信度合併到複合置信度圖中
3. 對每一幀的最終上半身姿勢估計就是複合圖中最大置信度的位置

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

論文閱讀：《Flowing ConvNets for Human Pose Estimation in Videos》ICCV 2015

概述

網絡框架

Spatial Fusion Layers的細節結構

光流法增強heatmap

PDManer [元數建模]-v4.9.0 發佈：一款簡單好用的數據庫建模平臺

使用neovim打造go ide(支持代碼跳轉, 代碼補全, 實時語法檢查)

sql求連續值問題

cs01 CSS Syntax

sql server sp_executesql 中使用表變量進行查詢

挑戰程序設計競賽 2.3章習題 poj 3046 Ant Counting

[MASM拾遺]Offset僞指令

h30 HTML Layout Elements

瞭解顯卡

一款基於C#開發的通訊調試工具（支持Modbus RTU、MQTT調試）

論文閱讀：《Mask R-CNN》ICCV2017

深度立體匹配中的自監督學習概覽

論文閱讀：《Towards accurate multi-person pose estimation in the wild》CVPR 2017

論文閱讀：《LIP: Self-supervised Structure-sensitive Learning and A New Benchmark for Human Parsing》

計算機視覺（Computer Vision,CV）頂會論文下載地址

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結