PaddlePaddle 中文名「飛槳」重磅公佈,百度發佈一億元免費算力計劃

  AI 科技評論按,今日,首屆 WAVE SUMMIT 2019 深度學習開發者峯會在北京舉辦,會上,來自工業界的多家展商展示了基於 PaddlePaddle 訓練的包括瓷器質檢、遙感影像目標檢測與語義分割、軸承外觀缺陷檢測等多個系統,百度高級副總裁、深度學習技術及應用國家工程實驗室主任王海峯,百度深度學習技術平臺部總監馬豔軍均上臺發言,分別闡述了深度學習在智能時代的重要意義以及推進 PaddlePaddle 的價值、PaddlePaddle 的一系列新特性,在會上,更是重磅發佈 PaddlePaddle 中文名「飛槳」以及 AI studio 億元免費算力支持計劃。而來自學術界和工業界的嘉賓也共聚一堂,對深度學習的發展情況以及未來展開激烈探討。

  深度學習在諸多研究領域的重要性

  開場伊始,百度高級副總裁王海峯博士表示,人類經歷的三次工業革命,分別以機械技術、電氣技術和信息技術爲核心驅動力,而現在,人工智能是第四次工業革命核心驅動力量,這一技術會將人類社會帶入智能時代。

  隨後,他也從語音識別、語音合成、OCR 技術、自然語言處理以及機器翻譯諸多層面對深度學習帶來的重大價值進行了舉例。諸如機器翻譯,最早基於規則系統,依據領域知識,但是由人工撰寫規則,存在規則衝突,耗時也耗力,隨後進展到統計機器翻譯,由人工設計特徵,需要機器自動訓練,但也存在模型多、單個模型無法遷移到其他場景的問題,到現在的基於神經網絡機器,依靠深度神經網絡,利用端到端模型全自動學習,這樣大大節省了人力資源和成本。

  在這一過程中,深度學習框架的發展極具現實意義。他強調,深度學習推動人工智能進入工業大生產階段,深度學習框架是智能時代的操作系統,從最底層芯片出發,我們需要通過框架來訓練模型,隨後才能完成各種業務模型,觸及各個行業應用。

  

PaddlePaddle 中文名「飛槳」重磅公佈,百度發佈一億元免費算力計劃


  圖:PaddlePaddle 全景

  針對深度學習工具的必要性,他也爲廣大開發者重溫了 PaddlePaddle 的各種功能。PaddlePaddle 包括核心框架、工具組件和服務平臺三大部分。在覈心框架層面,可以爲開發者提供開發、訓練和預測三大能力,在此之上,百度提供包括視覺、自然語言處理等在內的豐富模型,通過模塊化的方式提供給使用者。在工具組件上,PaddlePaddle 提供包括遷移學習、強化學習、自動化網絡結構設計、訓練可視化工具、彈性深度學習計算等在內的多個工具組件,適應工業大生產的需要。而在服務平臺層面,PaddlePaddle 則提供零基礎定製化訓練和服務平臺 EasyDL 以及一站式開發平臺 AI Studio。他表示,這一整套的框架和服務,可以幫助廣大開發者和企業利用工具化、平臺化的方式,進一步降低深度學習應用門檻,加速推動產業智能化變革。

  百度 PaddlePaddle 全新升級,中文名「飛槳」

  隨後,馬豔軍上臺從開發、訓練、預測、工具、服務五個層面出發,介紹了全新升級的 PaddlePaddle。

  開發環節,主要包括 PaddleNLP 和視頻識別工具集的升級。

  馬豔軍表示,PaddlePaddle 目前已經支持 60 多個經過真實業務場景驗證的官方模型,涵蓋視覺、自然語言處理、推薦等 AI 核心技術領域。此次,PaddlePaddle 提供 NLP 和 CV 領域的更多模型,在 NLP 領域,提供語義表示模型 ERNIE、BERT、ELMo,語言模型 LSTM、GRU,語義匹配組網集 SimNet,在 CV 領域,提供諸如流行的 fast R-CNN、faster R-CNN、mask R-CNN、SSD、VGG、ResNet 等豐富的模型。

  另外,此次發佈的視頻識別工具集能共享骨架代碼,覆蓋當前 7 個經典的視頻分類模型,包括百度的 stNet、Attention LSTM 和 Attention Cluster,還可實現一鍵式的高效配置來做訓練和預測。

  訓練環節,主要是大規模分佈式訓練和工業級數據處理上的升級。

  大規模分佈式訓練主要從三方面實現升級。首先全面支持多機多卡,其次在 CPU 的應用場景方面,針對大規模稀疏特徵設計並開放了大規模稀疏參數服務器,此外,提供 K8S 生態支持。

  在數據處理方面,主要有如下四大優勢:分佈式樣本 Shuffle、分佈式文件系統 IO 支持、高性能多生產者-多消費者設計、多種語言 IO 組件的靈活嵌⼊。

  而在預測環節,PaddlePaddle 支持完整的端到端全流程部署方案,在服務端部署上,提供完備的在線服務能力,支持硬件設備的擴展,以及快速部署。此外,PaddleSlim 模型壓縮工具庫能夠在精度損失較小的情況下高效進⾏模型體積壓縮。

  在工具組件上,PaddlePaddle 不僅重磅開源 AutoDL Design、升級 PARL,並首次提出併發布預訓練一站式管理工具 PaddleHub。AutoDL Design 自動化網絡結構設計是用深度學習設計深度學習,目前已經全面超過人類專家設計的網絡效果。升級後的強化學習工具 PARL,在算法的覆蓋、高性能通訊以及並行的訓練方面做了大量支持和擴展。PaddleHub提供包括預訓練模型管理、命令行一鍵式使用和遷移學習三大功能,10 行代碼即可讓開發者完成模型遷移。

  發佈 AI studio 一億元免費算力支持計劃以及未來更新圖

  而在服務方面,百度發佈億元算力支持計劃,支持開發者免費試用工業旗艦 GPU,同時提供免費安裝的集成環境,開發者可以直接上手試用。在這裏,提供兩種模式,一是一人一張 V100 訓練卡,提供 16GB 顯存以及最高 2TB 的存儲空間,這裏可以使用邀請碼獲贈算力時長,邀請好友加入即可獲贈更多時長。二是遠程集羣模式,百度提供單卡 12GB 顯存,開發者可以多卡並行訓練,以及不限時免費試用。這裏登錄 AI studio 即可使用。

  面向高校、開發者和企業,PaddlePaddle 也有不同的方案,針對高校,提供深度學習師資培訓班,針對開發者,有免費在線課程以及算力支持,此外還舉辦不間斷的賽事,而針對企業,則設置 AI 黃埔學院、AI 快車道以及百度 AI 技術生態扶持。

  在會上,馬豔軍也公佈了 PaddlePaddle 未來一系列新計劃:

  在 2019 年 7 月,將實現如下四項功能:

  動態圖基本功能完善,新增流水線並行能力

  提供視覺檢測、生成工具集,使用文檔全面優化

  顯存佔用優化,靜態圖訓練速度全面提升

  優化高速推理引擎,支持在更多硬件的快速擴展,完善支持半精度

  2019 年 11 月,將實現如下四項功能:

  動態圖實現與靜態圖靈活轉換,支持高層 API

  動態圖訓練速度全面優化

  PaddleHub 升級到 2.0,基於最完備的預訓練模型庫進行遷移學習

  多項行業應用解決方案發布

  而在會後,雷鋒網 AI 科技評論也針對以下開發者所關注的問題對馬豔軍進行了提問,以下爲問答環節。

  雷鋒網:2016 年 9 月,百度開源 PaddlePaddle,發展至今,PaddlePaddle 與 TensorFlow 以及 PyTorch 相比,主要差異點在哪裏,對於開發者來說,使用它有哪些優勢?

  馬豔軍:PaddlePaddle 是在我們的產業實踐中持續研發和完善起來的,我們的 slogan 也是「源自產業實踐的開源深度學習平臺」。因此 PaddlePaddle 貼合實際應用場景,真正滿足工業場景的應用需求。PaddlePaddle 也開放了深度學習產業應用中的最佳實踐。如官方支持面向真實場景應用、達到工業級應用效果的模型,針對大規模數據場景的分佈式訓練能力、支持多種異構硬件的高速推理引擎,訓練所支持的數據規模、訓練速度、推理支持的硬件全面性、推理速度更優。

  第二,PaddlePaddle 不僅僅包含深度學習框架,而是提供一整套緊密關聯、靈活組合的完整工具組件和服務平臺,更加有利於深度學習技術的應用落地。目前 PaddlePaddle 完整具備了端到端的平臺能力。去年我們就將 PaddlePaddle 定位爲深度學習平臺,我們佈局也是很早的。所以,我們出的各種相應的配套工作都做得非常完善,開發者能在實打實的應用裏體驗到,在這個方面 PaddlePaddle 和其他框架相比形成了自己的特色。

  雷鋒網:在 TensorFlow 以及 PyTorch 發展非常成熟的今天,推動 PaddlePaddle 在中國的進展非常有難度,你們是如何應對的?

  馬豔軍:確實有一定的先發優勢在那兒,不過開發者的眼睛和手都是很快的,只要什麼地方出了什麼好用的東西他們很快就能看得到並用起來。所以,我們一直還是覺得真正把這個東西做好用了,開發者自然而然就會用。這是其一。

  其二,我們確實有自己的技術優勢,真正能讓開發者用起來的,不管是產業實踐特色還是自己就有很多結合場景做出原創模型和系統的能力,以及百度 AI 生態的影響力,我們還是有很強的勢能,能夠真正把這個東西做起來。 大連人流醫院××× http://yyk.39.net/hospital/f9a8f_doctors.html

  雷鋒網:前幾年大家一直關注 AI 框架,但是近年來框架同質化嚴重,而且發展很成熟了。有種說法是,作爲 AI 工程師,我們應該跳出框架的桎梏,往更廣泛的領域尋找價值。您如何看待這一觀點?

  馬豔軍:首先,深度學習技術有比較好的通用性,能比較好地解決人工智能領域的很多問題。而深度學習框架是智能時代的操作系統,能夠讓深度學習更容易使用起來,從而讓 AI 進入廣泛應用。因此深度學習框架在 AI 時代處在一個十分關鍵的位置。其次,我們自己的業務場景也需要對深度學習和深度學習框架做更加深入的技術研發,而且我們自己在這些領域也處在非常領先的位置,會持續在這個領域引領技術的發展。

  時至今日,PaddlePaddle 與 PyTorch、TensorFlow 等各種框架的發展,正如手機操作系統中的 IOS 與 Android 一樣。在如今框架發展日益成熟的今天,你在使用什麼框架?歡迎留言討論。

  Ps:一枚PaddlePaddle小餅乾,送給大家。

  

PaddlePaddle 中文名「飛槳」重磅公佈,百度發佈一億元免費算力計劃


發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章