騰訊對AI芯片的投資:燧原科技發佈邃思DTU,性能比肩英偉達V100,用於雲端訓練

12月11日,AI芯片創企燧原科技在上海舉辦首場發佈會。此次發佈會上,燧原科技推出了首款雲端AI訓練芯片邃思DTU,以及搭載該芯片的AI加速卡雲燧T10。據燧原科技表示,雲燧T10已經可以實現量產,並預計2020年第一季度上市。至此,這家由騰訊投資,且成立至今不到兩年的“年輕”公司,邁進了AI芯片市場的競爭賽道。

邃思DTU集成有141億晶體管

邃思DTU是本次燧原科技發佈會的主角,將主要應用於雲端人工智能訓練,支持CNN、RNN、LSTM、BERT等網絡模型以及FP32、FP16、BF16、Int8、Int16、Int32等數據類型。

邃思DTU基於通用AI處理器的設計,具備一定的可編程性,其計算核心擁有32個通用獨立自主設計的可擴展神經元處理器(SIP),每8個SIP可以組合成1個可擴展智能計算羣(SIC)。

據燧原科技介紹,邃思DTU由12nm FinFET工藝打造,集成了141億個晶體管,採用2.5D封裝,具有16Gbps的PCIe 4.0接口和25Gbps的ESL高速互聯。

雲燧T10性能超英偉達V100

雲燧T10和雲燧T11是此次發佈會的另一亮點,而且燧原科技表示,雲燧T10已經可以實現量產,預計2020年第一季度上市。

據瞭解,雲燧T10是一款面向雲端數據中心的AI訓練加速卡,雙槽位標卡,支持PCIe 4.0。單卡單精度(FP32)算力可達20TFLOPS,支持單精度FP32和半精度BF16的混合精度計算,最大功耗225W,這與英偉達最新Tesla V100S單精度算力 16.4TFLOPS,最大功耗250W~300w相比,具有性能上的優越性。

生態開放:馭算平臺支持主流深度學習框架

在發佈會上,燧思科技同時推出了編程平臺“馭算”,它在支持主流深度學習框架如TensorFlow、PyTorch等框架的同時,還針對邃思芯片做了特定優化。馭算可以提供完整的編譯、調試、調優工具鏈,並且在硬件層開放了SDK,爲深度開發者提供細粒度算力編程接口,降低了開發門檻。

據瞭解,馭算可以針對複雜模型集羣訓練,如BERT等,提供分佈式調度系統,並在1024節點集羣規模下,訓練線性度加速比達到86%。

BAT對雲端AI芯片的押注

燧原科技CEO趙立東,在此次發佈會上表示,“目前我們已經與騰訊針對通用人工智能應用場景的項目開展密切的合作,未來也將會擴展到更多AI應用場景。”

從這裏或許就不難看出,BAT三巨頭,對於雲端AI芯片的押注開始初露端倪。

騰訊對燧原科技的投資,得到了燧思DTU的加成,百度崑崙和阿里含光800在前些日子也是出了不小的風頭,尤其是這些AI芯片的應用場景同爲雲端加速,不得不讓人去聯想,BAT是否開始選擇了同一條路:通過對AI芯片的押注,重點推動自家的雲計算戰略。

隨着5G時代的到來,雲端也變得更加重要,當傳輸足夠快速,無論是訓練和推理,或許都可以放在雲端進行,而AI芯片的存在,無疑是爲雲端應用提供了強大助力,至少除了BAT三大巨頭之外,華爲(昇騰系列芯片)、谷歌(TPU)、AWS(第二代自研雲端芯片)、微軟(​Graphcore IPU 商業化)等也早已開始行動。

公司介紹:

燧原科技,2018年3月成立於上海,由趙立東和張亞林聯合創立,成立距今不足兩年。據瞭解,燧原科技研發團隊的主要成員擁有着15年以上的芯片及相關軟件生態系統的開發及量產經驗,其中燧原科技CEO趙立東曾在AMD、紫光任職,燧原科技COO張亞林也有在AMD近十年的工作經歷。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章