激光雷達點雲分割、精細標註,Scale AI 發佈自動駕駛數據集

By 超神經

內容概要:自動駕駛的賽道依然火熱,除了技術方面的提升,對數據的需求也不斷加大。近日,AI 標註公司 Scale AI 聯合禾賽科技,發佈了一個免費的激光雷達數據集,面向 L5 級自動駕駛的研究使用。

關鍵詞:自動駕駛  激光雷達  數據集

又一個重磅的自動駕駛數據集來了!

近日,Scale AI 發佈了激光雷達數據集 PandaSet,可用於訓練自動駕駛模型,幫助推動 L5 級無人駕駛的發展。

這是 Scale AI 和激光雷達製造商禾賽科技合作推出,結合了硬件和標註的優勢,打造的高質量數據集,目前已面向全社會免費提供。

  專業收集和標註,公開可商用

PandaSet 是從硅谷的 2 條實際路線中收集,經過後期處理而得來。其中禾賽科技負責採集數據,Scale AI 則負責完成精細標註。

Scale AI 標註數據模擬展示

採集車輛的傳感器套件主要包括 1 個機械 LiDAR(激光雷達),1 個固態 LiDAR,5 個廣角攝像頭,1 個長焦攝像頭,板載 GPS / IMU,充分捕獲了城區複雜多變的環境因素。

另一方面,Scale AI 的激光雷達點雲分割(Point Cloud Segmentation)技術,可實現複雜目標物的高精度高質量標註,甚至包括煙塵、尾氣、雨水等傳統標註工具難以準確描述的目標物。

帶車道和邊界的帶標記點雲分割示例

其中點雲分割是根據空間幾何和紋理等特徵,對點雲進行劃分,使得同一劃分內的點雲擁有相似的特徵,將掃描的畫面中具體的物體標記出來,該技術在圖像識別中已被大量使用。

Scale AI 表示,該數據集包括 48,000 多個攝像頭圖像,以及 16,000 個激光雷達掃描點雲圖像(超過 100 個 8 秒場景)。

它還包括每個場景的 28 個註釋,大多數場景的 37 個語義分割標籤。

由此得來的數據集,涵蓋了 5 級自動駕駛中最具挑戰性的駕駛條件,其中包括複雜的城市環境,密集的交通和行人,建築物、綠化等設施,涵蓋全天候照明條件,囊括多種天氣狀況。

PandaSat 數據內容展示

正因如此,Scale AI 也稱 PandaSet 是世界上最先進的激光雷達數據集。

此外,本次的數據集還有一個特色,就是 PandaSet 沒有使用限制,是首個無條件供給商業使用的開放數據集。

 數據集背後的獨角獸標註公司

面向自動駕駛高性能 AI 模型而言,PandaSet 是十分理想的訓練數據集。而這背後的標註公司 Scale AI,也在近幾年裏憑藉實力躋身硅谷 AI 獨角獸。

隨着硬件的進步,數據的採集質量越來越高,對數據進行準確的標註,成爲了促進行業進步的一項關鍵,比如 ImageNet 的出現,就帶動了深度學習的升空。

而 Scale AI 則是看準了這個時機。其創始人是僅僅 23 歲的華裔青年 Alexandr Wang。

一臉稚氣的 Wang 2019 年接受媒體採訪

父母都是物理學家的的 Wang,很早就在編程競賽中嶄露頭角,高中時就收到了科技公司的 Offer,過人的天賦也讓他提前從 MIT 畢業,選擇了去硅谷創業。

2016 年,年僅 19 歲的 Wang 與朋友 Lucy Guo 共同成立了 Scale AI,專注開發數據標註業務,打造專業的數據標註平臺。

而這個舉動在他看來,是行業裏的一項剛需,「獲取標籤數據,是構建機器學習模型中最困難的部分。」

Scale AI 完成的一項機械臂標記任務

2018 年,Scale AI 拿到了 1800 萬美元 B 輪融資;2019 年收穫了 1 億美元的 C 輪融資,公司當前估值超過 10 億美元。

而一些大的自動駕駛公司 Waymo、Uber、Lyft、Zoox 等,也正在採用 Scale 標註平臺,用以開發複雜環境和極端氣候下安全可控的自動駕駛技術。

所以這次將 PandaSet 完全開源允許商用,不知道又包含了 Scale AI 怎樣的考慮。

  數據集有了,到底該怎麼用

無論如何,本次發佈的 PandaSet 數據集,對於研究自動駕駛的朋友來說,還是一項不錯的福利,還等什麼?趕快用起來吧!

 如何下載? 

數據集官方申請下載地址:

https://scale.com/resources/download/pandaset

 如何使用? 

貼心的合作伙伴 OpenBayes,提供了一套簡單易用的方案雲服務方案,如果你想要使用算力服務,推薦你們去試用一下,當前還有專屬的福利哦!

OpenBayes 擁有大規模的超算集羣,GPU 集羣架構專針對矩陣計算設計,面向 AI 應用提供算力容器,而且上手非常簡單,開箱即用。

PandaSet 數據集已經上傳至 OpenBayes 後臺,並支持直接調用。

目前 OpenBayes 的算力容器產品已經支持 TensorFlow、PyTorch、MXNet 等 CPU 和 GPU 環境下,不同版本、類型的標準機器學習框架和各種常用依賴。

目前 OpenBayes 算力容器支持的標準庫

並提供 CPU、NVIDIA T4、NVIDIA Tesla V100 等多種算力資源,無論是海量數據的集中訓練,還是低功耗的模型常駐運行,都能輕鬆滿足用戶需求。

從 CPU 到 T4 再到 V100,豐富的算力容器配置

OpenBayes 還支持腳本上傳和 JupyterLab 編輯器在線編程然後進行模型訓練。

清晰簡潔的執行過程

完整教程:https://openbayes.com/docs/quickstart/

 註冊新用戶,即可享受 GPU 算力

訪問 openbayes.com,在官網首頁點擊立即註冊,而且內測期間週週有贈哦,再也不用擔心算力的問題啦!

該數據集可在公共資源直接使用/下載

 活動說明 

訪問 openbayes.com 

憑邀請碼 【HyperAI】 註冊新用戶

即可享受

每週 600min 的 CPU + 300min NVIDIA T4 

的免費算力~

—— 完 ——

掃描二維碼,加入討論羣

獲得更多優質數據集

瞭解人工智能落地應用

關注頂會&論文

回覆「讀者」瞭解更多

更多精彩內容(點擊圖片閱讀)

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章