性價比高出英特爾45%,亞馬遜的雲服務器芯片如何做到?

到目前爲止,亞馬遜和其他大型雲運營商幾乎全部使用英特爾的 Xeon 芯片。雖然在服務器芯片市場,英特爾市場佔有率非常高,但亞馬遜正使用折扣策略來贏得客戶。亞馬遜表示,基於 Graviton 的雲服務比英特爾處理器上運行的現有產品「成本低得多」,具體在某些處理任務上,能夠減少 45% 的成本。

智能網卡與服務器處理器有何區別?如果你指的是亞馬遜雲服務(Amazon Web Services),兩者大概相差三年。

在西雅圖總部,公有云市場大佬亞馬遜 re:Invent 2018 大會現場,亞馬遜推出了基於 ARM 架構的 Graviton 服務器處理器。除去已經在 AWS 運行的 Intel Xeon 和 AMD Epyc 處理器,Annapurna Labs 表示 Graviton 還支持 EC2 虛擬計算服務。

2015 年,亞馬遜以 3.5 億美元收購 Annapurna Labs。早些時候,亞馬遜從 Calxeda 挖來了幾名員工,Calxeda 是一家致力於開發基於 ARM 架構服務器系統的初創公司。

過去一年的 ARM 服務器市場波譎雲詭:先是高通宣佈放棄 Centriq 2400;Ampere(獲得私募基金 The Carlyle Group 投資)搶先收購 X-Gene,讓 Applied Micro 終於獲得喘息之機。亞馬遜雲服務器

如此看來,AWS 創造了自己的服務器​芯片,放棄使用目前 ARM 架構服務器市場最領先的 Marvell(前身爲 Cavium)ThunderX2 芯片,就顯得尤爲重要。然而,這並不代表 Marvell 或者 Ampere──如果未來實現了超強浮點並行處理,擁有 A64FX 處理器(48 核且具備可伸縮矢量擴展)的富士通也將縱橫 ARM 市場──ARM 芯片未來在 AWS 公有云市場一定毫無作爲。

我們認爲 AWS 已經在 Annapurna Labs 中研發「Alpine」系列雙核及四核 ARM 芯片,爲自己的服務器集羣創造 SmartNIC。SmartNIC 是服務器集羣不可或缺的。除了 EC2 上的 Xeon、 Epyc 和現在的 Graviton 處理器的操作系統和應用之外,服務器集幾乎能卸載所有功能,使得公有云計算核心可以極大程度上運行應用。

雖然之前說過,但我們還是想再次強調:大部分 Hyperscaler 和雲構建仍依賴 SmartNIC 的發展。由於 InfiniBand 網絡具備搭配智能網卡 GeniusNIC(Mellanox Technology 的命名雖然有些玩笑意味,但能看得出企圖心)的卸載模型,HPC 中心能夠進一步提升價值。最終,Mellanox Technology 的落後也是由於相同的原因:Hyperscaler 和 HPC 中心經常採用卸載計算。核心計算十分昂貴,相對而言,卸載計算就不一樣了。

2016 年 1 月,亞馬遜與 Annapurna Labs 發佈了 32 位 Armv7 與 64 位 Armv8 設計,兩者已達到「企業級性能與特徵」,如支持 DDR4 內存、2MB 二級緩存。自那以後,再沒有透露好更多關於「Alpine」系列芯片的消息。

Arm Holdings 生產的基於 Cortex-A15 核心的雙核及四核 32 位元件,其主頻分別達到 1.4 GHz 與 1.7 GHz;基於 Cortex-A57 設計的四核元件,主頻達到 1.7 GHz。上述 Arm Cortex 核心支持超標量通道及亂序執行,但並不具備超線程。

這些設備的進給量與速度並沒有任何特別之處,由於 Amazon 並未公佈任何細節,我們不展開討論具體架構。但我們推測有兩點非常不可思議:亞馬遜如何生產這些廉價設備;亞馬遜如何運用服務器卸載計算以使得服務器、網絡及存儲更加高效。

主流廠商的策略確定無疑:Mellanox 主推 Bluefield 多核 ARM 處理器,微軟在 Azure 公有云的服務器上使用 FPGA 作爲網絡加速及計算引擎,Netronome 主推 Agilio 網絡適配器。

AWS 全球基礎設施及客戶支持業務副總裁 Peter DeSantis 在 re:Invent 2018 大會介紹了 Graviton Arm 服務器的工藝。

雖然我們不清楚 Graviton 芯片,Graviton 看起來是一個更加實用的處理器,其與 Intel Skylake Xeon-D-2100 v2 類似,搭配 8 到 18 個核心,主頻在 1.6 GHz 與 2.3 GHz 之間(通常核心數越多,時鐘頻率越低)。如果打開 AWS 網站,大家會發現一句申明「Gravitons 基於 64 位 Neoverse 核心」,這幾乎能斷定 Cosmos 核心是定製的。

Cosmos 包含 ARM Cortex-A72 與 Cortex-A75 設計的微調版本,意圖達到 16 納米芯片工藝水平,其代工廠很可能是臺灣半導體制造公司(Taiwan Semiconductor Manufacturing Corp)。大家回想下,Arm 發佈的 Neoverse 正是 10 月曾發佈的數據中心 Arm 芯片的翻版,其每年性能提高幅度達到 30%,並將在 2021 年前完成 7 納米到 5 納米制造工藝的升級。

所有 AWS 的公開信息表示,通過 EC2 A1 讓業界熟悉的 Graviton 處理器,最多支持 16 個虛擬 CPU、32GB 主內存,服務器適配器的網絡帶寬達到 10 Gb/秒,彈性塊存儲(EBS)帶寬達到 3.5 Gb/秒。當我們想了解更多技術細節時,AWS 並未確認目前使用哪個 Cosmos 核心,亦未確認 Graviton 具備 16 個核心且無法通過同步多線程(SMT)爲各個核心提供虛擬多線程。

(SMT 支持通常由 ARM 許可證持有用戶添加,尚未成爲 ARM 基本內核許可證部分。隨着 2019 年「Ares」內核到期,情況可能會改變。)AWS 向 The Next Platform 確認,EC2 A1 具備 Graviton 芯片,主頻達 2.3 GHz。單就整數計算而言,Graviton 已能與 Xeon-D 抗衡,或許達到了 Xeon SP 的下限水平。亞馬遜雲服務器

不同 A1 的進給量和速度如下:

我們推斷內存及內存帶寬不多,可能只有一個內存控制器和兩個內存通道,最高容量 512 GB,搭配十分昂貴的 128 GB 記憶棒,即便使用便宜的 8 GB 記憶棒也可輕鬆達到 32GB。Annapurna Labs 可能在芯片上放置了大量內存你控制器,我們認爲其並不支持 SMT,推斷芯片上具備 16 個內核。一個內存控制器搭配八個核心是很好的平衡選擇,但如果大家想讓計算能力和內存帶寬恢復平衡,四個內存控制器的效果甚至會更好。(考慮到 AWS 並未大肆炫耀,該項可能仍未實現。)

A1 採用 Amazon Linux 2 系統(紅帽 Linux 與亞馬遜 CentOS 克隆版結合的自研升級系統),亦支持 RHEL 和 Ubuntu 服務器系統,未來將支持其他操作系統──如果以後 AWS Arm 服務器芯片支持 Windows Server,應該十分有趣。

基於 Arm 的 A1 EC2 目前在美國東部、西部及歐洲(愛爾蘭)等區域可用,訂購類型一般涵蓋 On-Demand、 Reserved、Spot、Dedicated 及 Dedicated Host。AWS 特別提醒,上述 A1 實際應用於內存帶寬不做特別限制的橫向擴展工作負載,如 Web 服務器、開發環境、緩存服務器或容器化微服務等輕量化及無狀態服務。AWS 表示與 EC2 上同等性能的 32 位服務相比,這些服務成本能降低到 45%。不過,AWS 並未說明具體的比較對象。

劃重點了。

我們來看看 Arm 服務器之於基礎設備的野心有多大。毫無疑問,A1 會有無數的衍生版本。對於支持極有可能成爲下一代智能網卡處理器的發展來說,這是件好事。算上基於 Arm 的 A1,AWS 還在 EC2 主題上研發了一些其它基礎設施變體。新一代 C5 服務在這些變體之間的以太網速率達到每秒 100Gb,適用於那些帶寬依賴的 HPC 仿真建模、機器學習訓練及密集數據分析工作。

如同 C5 和 C5d,C5n 基於雙插槽服務器節點,搭配定製 Skylake Xeon SP 8000 Platinum 系列處理器,各芯片可能具備 18 個內核且主頻達到 3 GHz。

除了額外帶寬之外,C5n 的數據隊列是 C5 和 C5d 的數倍至多──32 比 8 的彈性網絡接口(Elastic Network Interface,應用於 Annapurna 處理器,佈置在網卡附近,使其更加智能──幫助網絡適配器中數據更快的在內核中流轉。無論是單個可用範圍或區域內跨越多個可用範圍,帶寬在同一區域內都可用)。

C5n 可用於 EC2 及其他服務器集羣,與 S3 對象存儲或 Elastic MapReduce、Relational Database Service 及 ElastiCache 等服務連接。C5n 與 A1 的可用區域一致,業務範圍還附加美國政府私有云 GovCloud。

最後,去年 10 月 AWS 推出的 P3 GPU 加速服務使得以太網達到每秒 100 Gb,服務器鏈路上限達到每秒 25 Gb。具有更快網絡的 P3dn 將於下週推出,其配備 32 GB HBM2 內存的 Volta Tesla V100 GPU 加速器,而初代 P3 配備 16 GB HBM2 內存的初代 Volta 加速器。上述服務基於一對定製 24 核 Xeon SP 處理器,機箱中最多配備 8 個 GPU。

作爲最大雲計算提供商的 AWS 提供了 ARM,這對 ARM 來說是一次勝利。

在過去五年裏,Calxeda、Applied Micro、英偉達、三星、博通、、Cavium、Marvell、AMD 和高通等多家先驅投身到 Arm 服務器芯片的研發。但發展到今日,這些想去幾乎全軍覆沒。Moor Insight & Strategy 的行業分析師帕特里克·莫爾海德(Patrick Moorhead)上週五在給 CNBC 的郵件中寫道:「AWS 接受 ARM 爲 ARM 帶來了可信度,將 ARM 的業務擴展到更多的雲參與者和工作負載。」

儘管亞馬遜的大部分營收仍來自商品銷售,但 AWS 已成爲該公司財務健康的關鍵。第三季度,亞馬遜超過一半的營業利潤來自 AWS。亞馬遜在線商店的收入本季度同比增長 10%,而 AWS 服務的營收增長了 46%。AWS 現在有超過 125 種服務可供客戶使用,包括核心的 EC2 計算服務。亞馬遜雲服務器

在接下來的幾年裏,AWS 可以發佈基於更強大 ARM 芯片的新實例。現有實例使用 ARM 於 2015 年推出的 Cortex-A72 系統。但更重要的是,其他雲計算提供商將可能同樣開始使用 ARM 技術發佈實例。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章