模型僅1MB,更輕量的人臉檢測模型開源,效果不弱於主流算法

AI模型越來越小,需要的算力也也來越弱,但精度依舊有保障。

最新代表,是一個剛在GitHub上開源的中文項目:一款超輕量級通用人臉檢測模型。

項目貢獻者介紹,這一模型大小文件僅1MB,320x240輸入下計算量僅90MFlops。

當然,效果也不弱於當前業界主流的開源人臉檢測算法,甚至有所超越。

超輕量、通用

這一模型的貢獻者爲linzai,他介紹稱,這是針對邊緣計算設備或低算力設備(如用ARM推理)設計的一款實時超輕量級通用人臉檢測模型:

默認FP32精度下(.pth)文件大小爲 1.1MB,推理框架int8量化後大小爲 300KB 左右。

目標就是在低算力設備中用ARM進行實時的通用場景的人臉檢測推理。同時,這也適用於移動端環境(Android & IOS)、PC環境(CPU & GPU )等等。

GitHub項目頁面介紹稱,模型已經在Ubuntu16.04、Ubuntu18.04、Windows 10;Python3.6;Pytorch1.2;CUDA10.0 + CUDNN7.6等環境進行過測試,都能夠保證正常運行。

模型設計,一共有兩個版本,分別是:1)version-slim,主幹精簡速度略快,2)version-RFB,加入了修改後的RFB模塊,精度更高。

而且還提供了320x240、640x480不同輸入分辨率下使用widerface訓練的預訓練模型,能夠更好的工作於不同的場景。

linzai介紹稱,整個項目中沒有特殊算子,支持onnx導出,從而便於移植推理。

效果不弱於當前主流開源算法

如此模型,效果/精度到底如何?

linzai也在GitHub項目頁面放出了這一模型在精度、速度、場景測試、大小方面的測試。

參賽選手有兩個,一個是Libfacedetection,OpenCV中文站站長於仕琪開源的人臉檢測算法。

另一個是Retinaface-Mobilenet-0.25 (Mxnet)——當前業界最先進的開源人臉檢測算法之一。

在Widerface數據集上的測試結果如下:

version-slim/version-RFB基本上都能夠實現最優結果。

在樹莓派4B MNN推理測試耗時上的測試結果爲:

對比之下,version-slim版本的速度也不在下風。

在地鐵站、萬達廣場、辦公室等場景進行測試,結果上version-RFB也比較有優勢。

更重要的是,新開源模型的輕量性:

傳送門

在這個項目的GitHub頁面,linzai也分享瞭如何生成VOC格式訓練數據集以及訓練流程,以及如何更好的使用這一模型的方法。

如果你有興趣,不妨看一看~

本文經AI新媒體量子位(公衆號ID:QbitAI)授權轉載,轉載請聯繫出處。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章