原创 論文閱讀:《Mask R-CNN》ICCV2017

概述 Mask R-CNN是用於目標檢測分割的框架,即對一張圖片,既輸出圖片中已有的目標,還能爲每一個實例生成一個高質量的分割掩碼。一句話概括object instance segmentation = object detect

原创 深度立體匹配中的自監督學習概覽

歡迎關注知乎專欄 雙目立體匹配 深度學習的蓬勃發展得益於大規模有標註的數據驅動,有監督學習(supervised learning)推動深度模型向着性能越來越高的方向發展。但是,大量的標註數據往往需要付出巨大的人力成本,越來越

原创 論文閱讀:《Towards accurate multi-person pose estimation in the wild》CVPR 2017

網絡框架 論文采用top-down的結構,分爲兩個階段: 第一階段使用faster rcnn做detection,檢測出圖片中的多個人,並對bounding box進行image crop; 第二階段採用fully convo

原创 論文閱讀:《LIP: Self-supervised Structure-sensitive Learning and A New Benchmark for Human Parsing》

CVPR 2017 Workshop 數據集:http://hcp.sysu.edu.cn/lip 主要貢獻 提出了一個新的large-scale benchmark,以及一個測評服務器用支持進一步的人物解析研究,新

原创 計算機視覺(Computer Vision,CV)頂會論文下載地址

近五年計算機視覺頂會論文下載地址 CVPR 2016論文下載地址 CVPR 2016, Las Vegas Nevada6 CVPR 2017論文下載地址 CVPR 2017, Honolulu Hawaii ICCV 20

原创 論文閱讀:《RMPE: Regional Multi-Person Pose Estimation》ICCV 2017

概述 論文地址:https://arxiv.org/abs/1612.00137v3 項目主頁:RMPE: Regional Multi-person Pose Estimation 這篇論文是上海交大和騰訊優圖的論文,被 IC

原创 論文閱讀:《Human Parsing with Contextualized Convolutional Neural Network》ICCV 2015

論文地址: https://www.cv-foundation.org/openaccess/content_iccv_2015/papers/Liang_Human_Parsing_With_ICCV_2015_paper.

原创 論文閱讀:《Stacked Hourglass Networks for Human Pose Estimation》ECCV 2016

概述 本文仍然是使用全卷積神經網絡,對給定的單張RGB圖像,輸出人體關鍵點的精確像素位置,使用多尺度特徵,捕捉人體各關節點的空間位置信息。網絡結構形似沙漏狀,重複使用top-down到bottom-up來推斷人體的關節點位置。每一

原创 論文閱讀:《Structured Feature Learning for Pose Estimation》CVPR 2016

概述 本文仍然是使用CNN,其創新點在於如何對關節之間的依賴進行建模,解決方法是在卷積層使用幾何變換核。此外還提出了雙向的樹結構模型,這樣每個關節的特徵通道都可以接受其他關節點信息。 網絡架構/算法流程 輸入是一張RGB靜態圖

原创 論文閱讀:《DeepLab-v2: Semantic Image Segmentation 》

論文地址:https://arxiv.org/pdf/1606.00915.pdf 概述 DeepLabv2 是在DeeplabV1 的基礎上又做了改進的。Deeplabv1 主要是在FCN 的基礎上對vgg 網絡進行fine

原创 論文閱讀:《Associative Embedding:End-to-End Learning for Joint Detection and Grouping》

概述 論文提出了一種single-stage,end-to-end的關節點檢測和分組方法,這不同於以往的multi-stage的關節點檢測方法,在MPII和COCO數據集上達到新的state-of-the-art的效果,超越最近的

原创 論文閱讀:Deepcut&Deepercut:Joint Subset Partition and Labeling for Multi Person Pose Estimation

引言 本篇一起介紹兩篇相關文章—— 《DeepCut: Joint Subset Partition and Labeling for Multi Person Pose Estimation》 CVPR 2016 《Deep

原创 論文閱讀:《Flowing ConvNets for Human Pose Estimation in Videos》ICCV 2015

概述 本文主要用CNN網絡來進行人體姿態估計,加入了temporal 信息以提高精度。本文的四個貢獻: 1. 提出了一個更深的CNN網絡(相比於Alex-Net),不同於之前的迴歸座標,而是迴歸heatmap,這樣可以提高

原创 論文閱讀:《Realtime Multi-Person 2D Pose Estimation using Part Affinity Fields》CVPR 2017

概述 本文承接CMP論文的框架結構,最大的創新點在於提出了一種PAF的方法,能夠有效的針對多人進行姿態估計,同時在保證精度的情況下,可以做到實時的效果。 傳統的方法採用top-down的方法,即先檢測人,然後對每一個人進行姿態估計

原创 Python問題彙總

1. Python3 ImportError: No module named ‘ConfigParser’ 參考:http://www.aichengxu.com/diannao/68741.htm 問題:TypeError: