動手實踐丨輕量級目標檢測與分割算法開發和部署(RK3568)

原創

2024-02-26 23:10

本文分享自華爲雲社區《自動駕駛(AIOT) - 輕量級目標檢測與分割算法開發和部署(RK3568)【玩轉華爲雲】》，作者：HouYanSong。

本文將在ModelArts平臺上開發輕量級目標檢測與分割算法，並使用ModelBox框架在RK3568開發板上實現模型推理和部署。

數據準備

我們收集了一份200張由Labelme標註的道路圖像分割數據集，之後使用腳本將其轉換爲VOC格式的數據集並進行數據增強：

處理好的數據集已經分享到AI Gallery上，可以使用OBS下載：

算法簡介

像素級的圖像分割不僅需要精確，有時還需要高效以便應用到real-time application比如自動駕駛汽車等。現有的方法可能精度較高但往往參數量巨大，爲了解決這個問題，我們使用LinkNet作爲主幹網絡[Fig. 1]，中間層[Fig. 2]使用LeakyRelu進行激活，最後一層使用Sigmoid做歸一化，並在Encoder Block 4後增添目標檢測分支，訓練過程中進行梯度裁剪防止梯度爆炸。

雲端訓練

算法詳情可以運行我發佈的Notebook，並下載轉換好的模型文件：

ONNXRuntime推理：

下載yolo_tf_seg.zip並解壓到本地，之後安裝opencv、numpy、onnxruntime即可一鍵運行。

端側推理

1、我們在VS Code中使用Remote-SSH遠程連接ModelBox端雲協同AI開發套件(RK3568)：

2、在SDK目錄下使用create.py腳本創建工程object_detection_seg(od_seg)：

3、創建推理功能單元yolo_tf_seg：

4、將轉換好的模型放到yolo_tf_seg目錄下，我們的模型有一個輸入和兩個輸出：

修改配置文件如下：5、創建後處理功能單元post_process：

對於後處理功能單元，我們在config中配置參數，接收2個float類型的推理結果，返回類別檢測框和圖像掩碼：

對應的邏輯代碼如下：

6、創建繪圖功能單元draw_image：

對於繪圖功能單元，我們接收解碼後的原始圖像和目標檢測框以及分割圖像，對應的配置文件如下：

接下來補充邏輯代碼生成新的圖像：

7、查看流程圖：

代碼如下：

8、配置輸入和輸出，運行應用：

9、我們可以在Chrome瀏覽器chrome://tracing/中加載性能統計文件：

通過分析耗時最久的是推理功能單元，720p視頻檢測幀率在6fps左右。

小結：

本文總體而言並沒有太多的創新點，是一個純工程化的項目，主要工作是將學術界的優秀論文落地到邊緣設備上，通過對網絡的魔改，得到一個兼顧精度、速度和體積的目標檢測和分割模型，在模型量化過程中會出現精度損失，後續會通過優化算法以及選擇不同的量化算法kl_divergence(feature分佈不均勻時可以得到較好的改善效果)繼續提高模型的檢測效果，復現本案例所需資源（代碼、模型、測試數據等）均可從object_detection_seg.zip獲取。

點擊關注，第一時間瞭解華爲雲新鮮技術~

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

Google Chrome驅動程序 124.0.6367.62（正式版本）去哪下載？

大家好，我是Python進階者。一、前言前幾天在Python白銀交流羣【Jethro Shen】問了一個Python谷歌驅動下載的問題。二、實現過程這裏【Kim】和【Crazy】給了一個指導，如上圖所示。說來奇怪，在鏈接中看了沒有

2024-04-24 09:48:52

WebDriver庫：實現對音頻文件的自動下載與保存

1. 背景介紹音頻娛樂在當今社會已經成爲了人們日常生活中不可或缺的一部分。從早晨的音樂播放到晚上的電臺節目，音頻內容貫穿了我們的整個生活。隨着互聯網的普及和技術的進步，越來越多的音頻內容通過網絡平臺進行傳播和分享。網易雲音樂作爲中國領

2024-04-22 23:25:04

百度安全多篇議題入選Blackhat Asia以硬技術發現“芯”問題

Blackhat Asia 2024於4月中旬在新加坡隆重舉行。此次大會聚集了業界最傑出的信息安全專業人士和研究者，爲參會人員提供了安全領域最新的研究成果和發展趨勢。在本次大會上，百度安全共有三篇技術議題被大會收錄，主要圍繞自動駕駛控制器安

2024-04-25 09:33:19

西安站開營！AI 編碼助手通義靈碼幫大學生“整活兒”

如何更好地與 AI 爲伴，做時代的先進開發者？4 月 17 日，阿里雲推出的 AI 編程助手通義靈碼與雲工開物“高校訓練營”走進西安多所高校開啓實操培訓，結合 AI 輔助編程的發展背景、通義靈碼的具體能力和應用實操，幫助在校大學生了解人工智

2024-04-24 21:12:06

HCDG天津站精彩回顧 | AI高效開發， ModelArts技術動手工作坊

4月20日， HCDG城市行·天津站——“極快至簡靈活部署”我想象中的AI高效開發ModelArts技術工作坊圓滿舉辦。活動特邀來自華爲雲DTSE、華爲云云享專家、以及天津軟件技術協會的夥伴企業專家們爲與會開發者帶來一場別開生面的技術交流

2024-04-25 22:33:41

輕鬆復現一張AI圖片

輕鬆復現一張AI圖片現在有一個非常漂亮的AI圖片，你是不是想知道他是怎麼生成的？今天我會交給大家三種方法，學會了，什麼圖都可以手到擒來了。需要的軟件在本教程中，我們將使用AUTOMATIC1111 stable diffusio

2024-04-22 21:30:45

最新版Spring Security 中的路徑匹配方案！

@[toc] Spring Security 是一個功能強大且可高度定製的安全框架，它提供了一套完整的解決方案，用於保護基於 Spring 的應用程序。在 Spring Security 中，路徑匹配是權限控制的核心部分，它決定了哪些請求可

2024-04-22 12:14:28

使用JavaScript日曆小部件和DHTMLX Gantt的應用場景（一）

DHTMLX Suite UI 組件庫允許您更快地構建跨平臺、跨瀏覽器 Web 和移動應用程序。它包括一組豐富的即用式 HTML5 組件，這些組件可以輕鬆組合到單個應用程序界面中。 DHTMLX Gantt是用於跨瀏覽器和跨平臺應用程序的功

2024-04-26 11:35:57

使用前端技術創建 QR 碼生成器 API

前言 QR碼（Quick Response Code）是一種二維碼，於1994年開發。它能快速存儲和識別數據，包含黑白方塊圖案，常用於掃描獲取信息。QR碼具有高容錯性和快速讀取的優點，廣泛應用於廣告、支付、物流等領域。通過掃描QR碼，用戶可

2024-04-25 22:23:53

前端面試題 - 在HTML5中DOCTYPE的作用是什麼？標準與兼容模式（混雜模式）各有什麼區別？

前端面試題 - 在HTML5中DOCTYPE的作用是什麼？標準與兼容模式（混雜模式）各有什麼區別？ DOCTYPE（文檔類型聲明）是一種在HTML文檔中使用的標記，用於告訴瀏覽器使用哪個HTML版本解析文檔。它的作用是確保瀏覽器正確地渲染和

2024-04-25 11:51:01

前端面試題 - NodeJS能用ES6模塊嗎？CommonJS 和 ES6模塊的區別是什麼？

前端面試題 - NodeJS能用ES6模塊嗎？CommonJS 和 ES6模塊的區別是什麼？ JS能寫前端web，也能寫NodeJS。 Node.js 後端應用由模塊組成，其模塊系統採用 CommonJS 規範，它並不是 JavaScri

2024-04-24 23:51:06

界面組件DevExpress Blazor UI v23.2 - 支持.NET 8、全新的項目模版

DevExpress Blazor UI組件使用了C#爲Blazor Server和Blazor WebAssembly創建高影響力的用戶體驗，這個UI自建庫提供了一套全面的原生Blazor UI組件（包括Pivot Grid、調度程序、圖

2024-04-23 11:34:47

短視頻文案提取原來如此簡單

結婚十年遊西湖過春風十里，盡薺麥青青。春天總是讓人舒坦，而今年的三月，也因爲與媳婦結婚十年，顯得格外不同。兩人奢侈的請了一天假，瞞着孩子，重遊西湖，去尋找13年前的冰棍店（給當時還是同事的她買了最貴的一個雪糕-8元），去尋

2024-04-22 23:33:29

數字化變革探索：檢驗檢測行業轉型思路揭祕

行業背景隨着科技的不斷進步和實驗室管理需求的不斷髮展，傳統實驗室管理方式面臨着許多問題，如採用紙質記錄和手工操作、數據易丟失和難以追溯、效率低下、流程複雜以及質量管理不規範等。這些問題已經成爲制約實驗室發展和提升運行效能的瓶頸。與此同時，

2024-04-22 22:23:02

前端面試題 - 賦值/淺拷貝/深拷貝的區別？如何實現一個深拷貝？

前端面試題 - 賦值/淺拷貝/深拷貝的區別？如何實現一個深拷貝？賦值是拷貝的對象指針，整個對象都是共用的。淺拷貝是拷貝一層，對象的內容仍是共用的，Object.assign()，拓展運算符都是淺拷貝。深拷貝是遞歸拷貝深層次，JSON

2024-04-24 23:51:01

24小時熱門文章

【面試準備】又一次失敗的面試經歷，題目離譜～資深軟件測試工程師

最新文章

最新評論文章