新一代視頻AI服務,阿里雲智能視覺重磅發佈

3月27日下午,第51期阿里雲產品發佈會-智能視覺產品隆重發布,本次產品發佈會首次面向全網用戶深入的解讀了智能視覺的前世今生。

行業背景

隨着人工智能的技術不斷成熟,AI逐漸在各行業內落地。在新零售領域,我們通過物體識別判斷貨品位置和數量;甚至在養豬場,用AI技術檢測養豬的位置及數量等等。然而除了一些非常成熟的基礎感知層AI能力如人臉識別、OCR等可以直接應用,實際上絕大部分場景都需要用業務標註數據來進行單獨訓練的,所以定製化的需求越來越多。每個定製化的模型,都是需要算法工程師通過大量的自身業務標註數據,經過不斷的演算、測試、訓練,來搭建深度神經網絡模型。而實際上傳統企業想要自建訓練模型又將面臨着專業人才十分稀缺、開發落地週期冗長等等困境。

如此一來,如何以最低的成本實現AI技術落地變成了行業急需解決的問題。

新一代視頻AI服務——智能視覺

近期,阿里雲發佈智能視覺產品,幫助零機器學習背景、零算法基礎的企業或者開發者們,實現高質量定製化模型訓練的快速落地,具備圖像分類、物體檢測、直播識別等AI能力,可有效應用於視頻監控、互聯網短視頻內容識別歸類、新零售物件統計、工業質檢等場景。

有了智能視覺,即使零算法基礎的開發者,都可以進行頁面化一鍵式訓練和預測。通過上傳少量業務數據,快速訓練定製化模型,最快10分鐘完成訓練和部署。

請輸入圖片描述

智能視覺整體的產品架構是:用戶通過對象存儲OSS導入或本地上傳圖片訓練集,對圖像及圖像內物體進行標籤管理,實現一鍵訓練(目前已經支持圖像分類和物體檢測),標註好之後一鍵生成迭代,生成業務定製專屬模型,並可以通過迭代來不斷完善模型的準召率、精準度,最終以API的形式將模型訓練能力快速輸出應用於業務之中,同時支持對圖片、視頻、直播流、監控流等多種格式的預測。

請輸入圖片描述

智能視覺技術原理

市場上大部分AI的服務是基於圖片進行處理,在面對視頻的時候,通常把視頻按照固定的時間間隔採樣出來,批量截取畫面並進行結果匯聚。這樣對視頻的處理方式普遍存在時效性差、穩定差、複雜性高、信息丟失等問題。

基於阿里雲視頻雲團隊多年音視頻編解碼、媒體處理相關技術經驗,智能視覺構建全新的面向視頻架構:把視頻作爲第一類對象(First-Class Object)來看待。把視頻解碼、時間域分析、智能匯聚、音頻處理等引入到系統裏面來,把視頻處理和AI計算有機結合,以面向視頻的方式,在視頻處理的同時完成AI計算,精簡的流程能夠大幅度縮短處理時間,從時間維度提升分析效果,並能簡化業務架構,讓用戶聚焦在覈心業務的發展上。爲用戶提供高效穩定、簡單易用、功能豐富的視頻AI服務。

請輸入圖片描述

點擊閱讀阿里雲高級技術專家周源:《面向視頻的全新AI架構 ——智能視覺技術全解》全文

智能視覺產品優勢

一、少量樣本,更高精度

在深度學習層面,在其他條件相同的情況下,數據越多訓練效果是越好的。這就產生了一個問題,更好的效果一定需要更多的數據,這需要花費大量的人力去標註。

智能視覺採用數據增廣策略,增加數據的多樣性,加強模型泛化能力,對圖像進行旋轉、斜切、仿射變換、對比度調整、色度變化、水平鏡像等變換,增加數據量,同時保持增廣數據的真實性,實現了少量數據情況下效果增強10-15%的訓練效果,同時有效降低標註數據的人力和時間成本。

二、遷移學習,訓練高效

智能視覺運用遷移學習的技術,根據自然圖像中的基礎邊緣、色塊、紋理的規律來歸納物體特徵,並且通過在淺層網絡中複用這些基礎特徵,來減少標註數據,能以更快的時間、更高的質量生成業務場景相關數據,大幅度減少數據需求,進一步減少計算量,達到縮短新模型訓練時間的效果。大概規模在100張的圖片,生成模型只需要10分鐘。

三、全面模型效果評估,快速迭代

基於阿里雲視頻雲團隊多年豐富的視頻處理經驗,針對用戶訓練的模型給出專業的、全面的效果評估,同時用戶也可以選擇自己上傳圖片、直播、監控等視頻流輸入進行校驗,如果覺得準確率不夠高的話,還可以再次上傳數據進行再一次訓練,實現快速迭代。

四、全界面化操作,降低人力和時間成本

有了智能視覺,就意味着原本需要衆多專業AI和算法工程師才能搭建好的AI模型,現在在控制檯上通過簡單的點擊和上傳圖片,甚至完全不需要代碼,就可以完成了,整個過程操作簡單,從數據、模型到接口,一站式服務,全界面化管理,可以節省大量的人力成本和時間成本,實現快速落地。

如何接入智能視覺

在發佈會中,智能視覺的產品經理袁華良爲網友演示了從零開始搭建一個訓練模型的整個過程。

第一步,在阿里雲官網智能視覺產品詳情頁快速瞭解產品信息,申請開通,審批通過後登錄控制檯,按照指引完成開通。

請輸入圖片描述

第二步,首次登陸,點擊馬上創建模型。

請輸入圖片描述

第三步,添加模型,上傳圖片,在圖片中進行標註。爲了讓訓練的數據更接近真實效果,建議一個模型至少有2個分類,每個分類的圖片不少於15張。上傳完成後,點擊一鍵訓練即可。

請輸入圖片描述

第四步,訓練結果返回後,可以看控制檯中看到準確率、召回率、mAP等數據。當訓練結果評估或者校驗結果不理想的時候,可以將新圖片加入訓練集,重新進行標註,進行再一次訓練與模型迭代。

請輸入圖片描述

目前控制檯支持本地導入數據,API接口也支持從OSS、直播流、監控流的數據導入,點擊查看具體的接入文檔詳情。

應用場景

智能視覺可應用在視頻監控領域,根據監控畫面中的內容,判斷是否爲出現違規現象,如出現車輛,打鬥等;同時可以應用在互聯網短視頻領域,基於圖像對內容識別歸類,進行精準推送,提升用戶的點擊率和觀看體驗;在新零售領域,智能視覺可以檢測實體店貨架中的貨品擺放位置及數量統計,減少巡檢工作量。同時,在工業質檢、農業養殖、醫療診斷等場景也可以有很好的應用。

請輸入圖片描述

目前智能視覺在阿里雲官網開放公測,用戶可以在線提交信息,進行免費試用的申請。我們歡迎各產業的夥伴們與阿里雲共建視頻領域的AI應用。

阿里雲視頻雲團隊具有多年音視頻編解碼、媒體處理經驗,基於人工智能、深度學習技術,通過視頻多模態內容理解、結構化分析處理,推出視頻審覈、視頻DNA、視頻智能生產、智能視覺等能力,並且與點播、直播、短視頻、CDN內容分發、邊緣計算組合形成一站式智能視頻服務。歡迎大家登陸官網視網膜瞭解視頻AI產品家族。

請輸入圖片描述

原文鏈接:https://yq.aliyun.com/articles/695507

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章