原创 谷歌開源:使用MediaPipe在移動設備上進行實時3D對象檢測

  計算機視覺大部分研究都集中在二維對象預測上。雖然2D預測只提供2D邊界框,但是通過將預測擴展到3D,可以捕捉到物體在世界上的大小、位置和方向,從而在機器人、自動駕駛車輛、圖像檢索和增強現實等領域有着廣泛的應用。雖然二維目標檢測技術已經

原创 南洋理工大學最新發布開源圖神經網絡基準

  作者   介紹   最近的許多研究讓我們看到了圖形神經網絡模型(GNN)的強大潛力,許多研究團隊也在不斷改進和構建基礎模塊。但大多數研究所使用的數據集都很小,如Cora和TU,在這種情況下,即使是非圖神經網絡的性能也相當可觀。只有使

原创 Github熱門源碼:藉助TensorFlow.js讓你在視頻中瞬間消失

  最近,一個實時人物刪除(Real Time Person removation)的項目在GitHub上流行起來。它最近在GitHub趨勢排名第一,目前擁有3k+顆星星。   這個項目的神奇之處在於,你只需要在網頁瀏覽器中使用JavaS

原创 Python機器學習:數據科學,機器學習和人工智能的主要發展技術趨勢概述

    1.介紹 Python因易於學習而廣爲人知,並且它仍然是數據科學,機器學習和科學計算中使用最廣泛的語言。根據最近的一項民意的調查,該調查對1,800多名研究人員分析,數據科學和機器學習偏好的參與者進行了調查,Python在2019

原创 CVPR2020:上交大讓合成圖像更真實,提出了通過域驗證進行深度圖像協調(開源)

  作者 介紹 圖像合成是圖像處理中常用的操作。我們可以從一個圖像中剪切並粘貼前景,然後將其粘貼到另一個圖像上以獲得合成圖像。合成地圖可以用來獲取感興趣的目標圖像,也可以用於數據增強。它有着廣泛的應用。然而,用這種方法得到的合成圖存在着

原创 手把手教你如何利用樹莓派和機器學習3D打印DIY一個車牌讀取器

作者一直特斯拉迷,特斯拉的自動駕駛能力非常的酷,雖然沒錢買,近來一直想讓汽車能夠檢測和識別物體的想法,所以只能自己動手盡力一半實現該夢想。 作者記錄了項目中的每個步驟。 步驟1.確定項目範圍 首先要考慮的是系統應該有什麼。作者一直相信

原创 Pix2Pose開源:用於6D姿勢估計的對象的像素座標迴歸的算法

  作者 介紹 本文主要解決了遮擋、對稱和無紋理的問題,提出了一種新的姿態估計方法pix2pose,它可以在無紋理模型的情況下預測每個目標像素的三維座標,並設計了一個自動編碼器來估計每個像素的三維座標和期望誤差。利用像素級預測生成2D-

原创 ICCV2019:DeepFill一個用於生成圖像修復任務的開源框架

  作者 介紹 作者提出了一種生成式圖像修復系統,該系統基於從數百萬個圖像中學習的門控捲積,無需額外的標記工作。作者所提出的卷積解決了將所有輸入像素都視爲有效像素的香草卷積問題,通過爲所有通道在所有層上的每個空間位置提供可學習的動態特徵

原创 如何使用遠紅外熱成像儀估分析犯罪現場留在地面上的熱腳印

  最近新冠狀病毒把熱成像儀搞火了,價格非常昂貴,以後量大了價格估計會比較親民。   今天我們就來看一篇跟熱成像相關的文章,這篇文章是由海康、華師大、上交大以及教育部人工智能重點實驗室聯合發佈。   背景  當前科學技術的進步在解決疑難

原创 華爲、中大、谷歌合作最新研究黑白漫畫場景可批量上色

給定一個場景草圖,我們的系統將按照用戶指定的基於語言的指令爲前景對象實例和背景逐漸着色,從而自動生成彩色卡通圖像。 作者信息 介紹 基於自然的,非接觸式有趣的,基於語言的輸入已被證明有效地完成了從圖像生成到兒童掃盲教育的各種任務。本

原创 來自百度團隊的KITTI立體匹配霸榜論文詳解

導讀 受衆目標: 對立體匹配任務感興趣並有一定深度學習基礎的相關研究者。 論文信息: 名稱:“Learning Depth with Convolutional Spatial Propagation Network” 作者:來自百度團隊

原创 谷歌Hinton團隊最新力作:讓ImageNet無監督學習的指標提升了 7-10%,可媲美有監督學習的效果

  如今,ImageNet上圖像識別精度的性能提升通常一次只有零點幾個百分點,而來自谷歌研究人員的最新研究,如圖靈獎獲得者傑弗裏·辛頓(Geoffrey Hinton)已經將無監督學習的指數提高了7-10%,甚至可以與有監督學習的效果相媲

原创 NeurIPS 2019 Spotlight論文:商湯最新插幀算法讓視頻顯示更加平滑

  自從相機發明以來,人們對高質量視頻的追求從未停止過。   分辨率從480p,720p,到1080p,現在是2K,4K;幀速率從25FPS到60FPS,到240FPS,960FPS甚至更高.   如果僅依靠相機的硬件迭代來增加幀速率,則

原创 BRDNet(開源)一種使用用深度CNN和批量重新歸一化進行圖像去噪算法

最近哈工大的研究團隊於2020年在國際著名的人工智能雜誌《神經網絡》上發表了《利用深度CNN進行批量重正化的圖像去噪》。   作者信息   在論文中,作者提出了一種新的圖像去噪網絡,稱爲批重歸一化去噪網絡(BRDNet),可以解決硬件資

原创 2019年頂級機器學習文章的總結概述

  在本文中,我們將仔細研究2019年排名的一些頂級機器學習文章。   Facebook,卡內基·梅隆(Carnegie Mellon)建立了首個在6人撲克中擊敗職業玩家的AI   Pluribus是第一款能夠在六人無限注德州撲克中擊