[計算機視覺論文速遞] 2018-05-19

原創

osc_sezkegv6

2021-02-02 21:21

導言

這篇文章有4篇論文速遞信息，涉及人臉識別（綜述）、人臉檢測、3D 目標檢測和姿態估計和目標檢測等方向（含2篇CVPR 2018）。

CVer

編輯: Amusi

校稿: Amusi

前戲

Amusi 將日常整理的論文都會同步發佈到 daily-paper-computer-vision 上。名字有點露骨，還請見諒。喜歡的童鞋，歡迎star、fork和pull。

直接點擊“閱讀全文”即可訪問daily-paper-computer-vision。
link: https://github.com/amusi/daily-paper-computer-vision

Face

《Deep Face Recognition: A Survey》

2018 arXiv

Abstract：在圖形處理單元（GPU）、大量待標註數據和更高級算法的驅動下，深度學習使得計算機視覺領域受到了極大的衝擊，並且使包括人臉識別（FR）在內的實際應用受益匪淺。Deep FR 方法利用深層網絡學習更多的不同（discriminative）表徵，顯著地改善現有技術並超越人類表現（97.53％）。在本文中，我們提供深度FR方法的全面調查，包括數據，算法和場景。首先，我們總結了常用的訓練和測試數據集。然後，數據預處理方法分爲兩類：“一對多增強”和“多對一標準化”。其次，對於算法，我們總結了現有技術方法中使用的不同網絡架構和損失函數。第三，我們回顧了深度FR中的幾個場景，比如視頻FR，3D FR和不同年齡段（Cross-Age） FR。最後，強調了當前方法的一些潛在缺陷和幾個未來方向。

arXiv：https://arxiv.org/abs/1804.06655

注：綜述性文章，實屬好評！

《SFace: An Efficient Network for Face Detection in Large Scale Variations》

2018 arXiv

Abstract：人臉檢測是許多應用程序（如人臉識別）的基礎研究主題。特別是最近卷積神經網絡的發展取得了令人印象深刻的進展。然而，廣泛存在於高分辨率圖像/視頻中的大範圍變化的問題在文獻中尚未得到很好的解決。在本文中，我們提出了一種名爲SFace的新算法，它有效地集成了基於 Anchor 的方法和無 Anchor 方法來解決尺度（scale）問題。還引入了稱爲4K-Face的新數據集來評估具有極大尺度變化的人臉檢測的性能。SFace架構在新的4K-Face基準測試中顯示出可喜的成果。此外，我們的方法可以以每秒50幀（fps）的速度運行，標準WIDER FACE數據集的準確率爲80％AP，其速度比現有算法高出近一個數量級，同時達到了比較性能。

arXiv：https://arxiv.org/abs/1804.06559

3D Object Detection and Pose Estimation

《Falling Things: A Synthetic Dataset for 3D Object Detection and Pose Estimation》

CVPR 2018 Workshop on Real World Challenges and New Benchmarks for Deep Learning in Robotic Vision

Abstarct：本文提出了一個名爲Falling Things（FAT）的新數據集，用於推進機器人技術環境下的物體檢測（Object Detectiion）和3D姿態估計的最新技術。通過對複雜構圖和高圖形質量的對象模型和背景進行綜合組合，我們能夠爲所有圖像中的所有對象生成具有精確三維姿態標註的照片真實感圖像。我們的數據集包含來自YCB數據集的21個家庭對象的60k註釋照片。對於每個圖像，我們爲所有對象提供3D姿勢，每像素類分割以及2D / 3D邊界框座標。爲了便於測試不同的輸入模式，我們提供單目和立體雙目 RGB圖像以及配準（registered）的密集深度圖像。我們詳細描述了數據的生成過程和統計分析。

arXiv：https://arxiv.org/abs/1804.06534

datasets：http://research.nvidia.com/publication/2018-06_Falling-Things

Object Detection

《Training Deep Networks with Synthetic Data: Bridging the Reality Gap by Domain Randomization》

CVPR 2018 Workshop on Autonomous Driving

Abstract：我們提出了一種用於訓練用於使用合成圖像進行物體檢測的深度神經網絡的系統。爲了解決真實世界數據的變化問題，系統依賴於域隨機化技術（domain randomization），其中模擬器（simulator）的參數（例如照明，姿態，物體紋理等）以非現實的方式隨機化，迫使神經網絡學習感興趣對象的基本特徵。我們探索這些參數的重要性，表明可以僅使用非藝術性生成的合成數據生成具有引人注目的性能的網絡。通過對實際數據進行額外的微調，網絡比單獨使用真實數據的性能更好。這個結果爲使用低成本的合成數據訓練神經網絡提供了可能性，同時避免了收集大量手工標註的真實世界數據或生成高保真度合成世界（high-fidelity synthetic worlds）的需求 - 這兩者都是許多應用的瓶頸。該方法在KITTI數據集上對汽車的邊界框檢測進行評估。

arXiv：https://arxiv.org/abs/1804.06516

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

[計算機視覺論文速遞] 2018-05-19

Nginx R31 doc 官方文檔-01-nginx 如何安裝

Qt/C++音視頻開發74-合併標籤圖形/生成yolo運算結果圖形/文字和圖形合併成一個/水印濾鏡

挑戰程序設計競賽 2.2章習題 POJ - 3617 Best Cow Line 貪心

字節面試：MySQL什麼時候鎖表？如何防止鎖表？

.NET8連接SQL SERVER 2008 R2 報：證書鏈是由不受信任的頒發機構頒發的

golang開發環境搭建(win10)

python計算機視覺學習筆記——PIL庫的用法

Golang初學：獲取程序內存使用情況，std runtime

fatal: unable to access error:0D0D90AD:asn1 encodi

[計算機視覺論文速遞] 2018-05-19

HTML <area> 標籤

NoSQL筆記——簡介

C語言保存負數

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結