如何結合實際業務進行 ECS 規格選型與容量驗證

隨着雲原生技術的蓬勃發展以及雲產品價格愈發低廉,越來越多 Geek 開發者、技術愛好者選擇 OSS 對象存儲、ECS 雲服務器等基礎產品構建自己的網站、網盤等應用。但對於企業而言,面對種類與規格的豐富的 ECS 雲服務器,如何瞭解實例規格的關鍵特點,在庫存不足、產品下線、使用搶佔式實例等場景中,保障業務的穩定運行成爲關鍵。

那麼接下來,我們一起了解 ECS 雲服務器如何選型並通過 PTS 進行容量規劃,接下來我們將介紹三種不同的 ECS 選型方式。

01 結合實例規格參數進行選型

啓動 ECS 實例前,我們會結合性能、價格、工作負載等因素進行配置選擇。根據不同配置參數,ECS 提供包含多種不同實例規格的實例規格族。在實際使用過程中,我們可通過以下兩種方式找到參數最合適的實例規格。

  • 實例規格族[1]:查閱文檔瞭解實例規格族的產品詳情。
  • DescribeInstanceTypes[2]:調用 ECS API 接口,獲取最新的性能規格參數。

針對這種方式,我們需要了解實例規格的命名方式,以便我們能夠快速瞭解並找到所需的實例規格。實例規格族名稱格式爲 ecs.<規格族>,實例規格名稱爲 ecs.<規格族>.<nx>large。具體命名規則說明如下所示:

  • ecs:雲服務器 ECS 產品代號。
  • <規格族>:由規格族主體+規格族後綴組成。
  • x86 計算規格族和 ARM 計算規格族

  • 異構計算規格族、彈性裸金屬服務器、超級計算集羣(SCC)實例規格族異構計算規格族、彈性裸金屬服務器和超級計算集羣(SCC)實例規格族一般採用自主命名方式,由小寫字母和數字混合組成。

  • <nx>large:large 表示 vCPU 核數,<nx> 中的 n 越大,表示 vCPU 核數越多。其中,xlarge 代表 4 核,2xlarge 代表 8 核,3xlarge 代表 12 核等等,以此類推。

02 根據自建服務與應用進行選型

當企業選擇服務上雲的過程中,在採買各種雲產品的同時,也會進行各種服務或應用自建,以便滿足實際的業務需求。爲了方便選型,我們總結羅列了常見自建服務與應用對應的 ECS 實例規格,可以根據企業所使用的應用,並參考選型原則,選擇對應的實例規格族。

03 根據應用場景進行選型

除了根據直接參數以及自建應用與服務兩種方式之外。在實際生產過程中,我們會發現很多業務場景不只是單一個服務或者應用就能滿足的。同時,相關業務場景的附加要求也會相對複雜。

通用應用、遊戲服務、視頻直播場景

在通用場景中,性能需求表現爲 CPU 計算密集型,需要相對均衡的處理器與內存資源配比,通常選用 CPU 與內存配比 1 : 2、系統盤選用高效雲盤、數據盤選用 SSD 雲盤或者 ESSD 雲盤。如果業務需要更強的網絡性能,如視頻彈幕等,可選用同系列中更高規格的實例規格,提高網絡收發包能力(PPS)。

Hadoop、Spark、Kafka 大數據場景

在 Hadoop、Spark、Kafka 大數據等場景中,由於涉及不同節點,性能需求表現較爲複雜,需要均衡各個節點的性能表現,包括計算、存儲吞吐、網絡性能等。其中,管理節點、計算節點可當作通用場景處理。根據集羣規模不同,需要選擇不同實例規格。如 100 個節點以下可選用 ecs.g6e.4xlage,100 個節點以上可選用ecs.g6e.8xlage。同時,數據節點需要高存儲吞吐、高網絡吞吐、均衡的處理器與內存配比,可使用大數據型d系列規格族。如 MapReduce/Hive 可選擇 ecs.d2s.5xlarge,Spark/Mlib 可選擇 ecs.d2s.10xlarge。

數據庫、緩存、搜索場景

在該類場景中,實例規格的處理器與內存配比一般要求高於 1 : 4,部分軟件對存儲 I/O 讀寫能力及時延性能較爲敏感,可選用單位內存性價比較高的規格族。

以數據庫爲例,在傳統方式中業務系統直接對接 OLTP 數據庫,數據冗餘大多通過 RAID 磁盤陣列實現。選擇雲服務器 ECS,輕載、重載數據庫都能實現靈活部署。

  • 輕載數據庫:採用企業級實例規格搭配雲盤使用,性價比更高。
  • 重載數據庫:需要高存儲 IOPS 和低讀寫延時,推薦使用本地 SSD 型 i 系列實例規格族(搭配了高 I/O 型本地 NVMeSSD 本地盤),滿足大型重載數據庫要求。

深度學習、圖像處理場景

在深度學習、圖像處理等場景中,應用需要高性能 GPU 加速器,在 GPU 和 CPU 配比方面有如下建議。

  • 深度學習訓練:GPU 與 CPU 比例推薦爲 1 : 8 到 1 : 12 之間。
  • 通用深度學習:GPU 與CP U比例推薦爲 1 : 4 到 1 : 48 之間。
  • 圖像識別推理:GPU 與 CPU 比例推薦爲 1 : 4 到 1 : 12 之間。
  • 語音識別與合成推理:GPU 與 CPU 比例推薦爲 1 : 16 到 1 : 48 之間。

在以上場景之外,我們針對異構計算、通用計算總結了常見場景以及對應的規格實例,以便大家選擇。

04 規格驗證與容量規劃

當完成選型並開始使用 ECS 雲服務器實例後,對於實際業務而言這僅僅是開始。在實際業務中,在資源未成爲瓶頸時,併發量、TPS、CPU 趨勢呈線性關係,當資源利用飽和時,隨業務併發量增長,TPS 趨勢保持平穩狀態, CPU 開始飆升。當資源利用飽和且併發量突破極限容量點時,TPS 趨勢及 CPU 都出現波動,甚至容量開始雪崩,此時服務開始出現不可用現象。

因此,在選擇合適的規格之後,服務穩定性、資源利用率、業務吞吐量成爲新的考量與關注重點。不同團隊角色關注重點不盡相同:

  • 業務團隊應關注:重要業務活動期間,容量是否可以平穩支撐業務量;
  • 研發團隊應關注:手動擴容、自動擴容、發佈/回滾不被資源限制;
  • 運維團隊應關注:資源使用率、部門資源水位、資源用量及成本。

但傳統基於人工經驗的資源規格配置模式存在侷限性,爲了保障線上業務的穩定性,通常會預留相當數量的資源與量來應對負載波動,造成大量資源浪費。

因此,需要藉助壓測工具性能測試 PTS[3]驗證 ECS 雲服務器的規格選擇是否正確,根據實際業務需求,通過容量分析、全鏈路追蹤等方式探測雲上系統的最佳安全容量點、極限容量點和破壞容量點並進行限流降級保護,達到系統容量和雲上資源成本的最佳平衡點。

常見業務場景壓測策略

在模擬類生產環境或引流生產環境運行的業務壓力和應用場景組合的過程中,我們會選擇如突變、併發、負載、穩定性、極限等不同的壓測策略,去評估系統各項指標是否滿足業務量、可用性、穩定性等要求。這裏,我們總結了常見的業務場景、與之對應的壓測策略以及策略優點。

最佳實踐:基於性能測試 PTS 創建一個壓測任務

在演示最佳實踐的同時,我們提供了基於阿里雲免費試用的 ECS + PTS 的場景體驗,我們在閱讀的同時進行體驗。

URL: https://developer.aliyun.com/adc/scenario/f37fb4d355684e189b7d87c9b6c8d10b

(一)實驗開始前準備

  • 如果您的阿里雲主賬號符合開通免費試用的資格,建議您開通免費試用性能測試 PTS、ECS 雲服務器,性能測試 PTS 提供首月 5000VUM 免費壓測資源,超出部分將按後付費專家版計費,具體計費詳情,請參見性能測試 PTS 計費規則[4]
  • 如果您的阿里雲賬號只能領取部分免費試用產品,請您領取符合免費試用資格的產品,然後進入實驗,不滿足免費試用資格的產品將會使用個人賬戶資源進行創建,並會產生一定的費用,請您及時關注賬戶扣費。爲了避免資源浪費並造成賬號扣費的情況,請嚴格按照本文提供的參數進行配置。在實驗完成之後,請您及時刪除或禁用壓測任務。

1. 在實驗開始前,請您選擇開通免費試用

2. 開通性能測試 PTS 免費試用:在實驗室頁面下方,選擇性能測試 PTS,單擊立即試用。在性能測試 PTS 面板,選中服務協議,然後單擊立即試用。此時系統會跳轉至提交成功頁面,表示試用申請成功,即可免費試用性能測試 PTS 服務。

說明:性能測試 PTS 專家版開通過程不會產生任何費用,在實際過程中性能測試(按量付費)提供 5000VUM+免費壓測額度,超出部分將按後付費專家版計費,具體計費詳情,請參見性能測試 PTS 計費規則。

3. 開通雲服務器 ECS 免費試用:在實驗室頁面下方,選擇雲服務器 ECS,單擊立即試用。在雲服務器 ECS 面板,根據如下說明完成參數配置,選中協議,單擊立即試用,如彈出新的頁面,您可先忽略。本試用教程以下列的配置信息爲例,實際操作時,建議根據您的實際業務體量和需求選擇。

4. 前往 ECS 控制檯[5],在左側導航欄,選擇實例與鏡像 > 實例。在頂部菜單欄左上角處,選擇和試用實例相同的地域(本教程示例華東 1(杭州))。設置該實例登錄密碼。找到您創建的試用實例,在其右側操作列單擊實例屬性 > 重置實例密碼,按照界面提示設置 ECS 實例的登錄密碼。單擊試用實例的 ID,選擇安全組頁籤,單擊安全組操作列的配置規則,在入方向添加需要放行的端口。本教程中,在安全組入方向放行 80、443、22、3389、8080 端口。

說明:實例創建完成大約 3~5 分鐘後,才支持重置實例密碼,如不可重置請耐心等待後重試。

(二)一鍵配置並部署 ECS 應用

準備好資源後,可以通過一鍵配置快速完成資源配置或應用搭建。一鍵配置基於阿里雲資源編排服務 ROS 實現,旨在幫助開發者通過 IaC 方式體驗資源的自動化配置。模板完成的內容包括:

  • 爲 ECS 實例創建安全組。
  • 部署 LAMP 環境。
  • 基於 LAMP 環境使用 PbootCMS 源碼搭建網站。

1. 打開一鍵配置模板鏈接[6]前往 ROS 控制檯,系統自動打開使用新資源創建資源棧的面板,並在模板內容區域展示 YAML 文件的詳細信息。

2. 在選擇模板頁面,ROS 控制檯默認處於您上一次訪問控制檯時的地域,在本實驗中地域應該處於華北 2(北京),保持頁面所有選項不變,單擊下一步進入配置模板參數頁面。

3. 在配置模板參數頁面,修改資源棧名稱,選擇您申請免費試用時創建的 ECS 實例,並通過設置 MySQL 數據庫密碼來修改數據庫 root 用戶的默認密碼。填寫完所有必選信息並確認後單擊創建開始一鍵配置。

說明:
1.安裝 Apache、MySQL 和 PHP 需要通過互聯網下載應用,配置時間可能由於網絡穩定性等原因而不同。等待期間,您可以通過刷新資源棧信息頁面來查看配置是否完成或通過單擊事件頁籤查看配置詳細進展。
2.如果在同一臺 ECS 實例上重複執行本教程的一鍵配置模板,請確保 MySQL 數據庫密碼和第一次執行模板時設置的密碼完全一致。否則一鍵配置結果不可用。

4. 在資源棧信息頁面,請您耐心等待大概 8~10 分鐘,狀態顯示爲創建成功時表示一鍵配置完成。

5. 在資源棧信息頁面,單擊輸出

6. 在輸出頁籤,單擊的 WebUrl 的值(http://<ECS公網IP地址>/admin.php).

7. 出現 PbootCMS 登錄頁面表示一鍵配置成功。您可以在 PbootCMS 中根據公司的需求自定義網站的內容,包括全局配置、基礎內容、文章內容、擴展內容、會員中心等。本步驟的後續控制檯操作爲可選操作,可跳過。

(三) 開通性能測試 PTS 並創建場景進行壓測及查看報告

1. 前往性能測試 PTS 控制檯[7]

2. 在左側導航欄中,選擇性能測試>創建場景

3. 在創建場景頁面,單擊 PTS 壓測

4. 在創建 PTS 場景頁面,設置場景名,然後在場景配置頁籤,輸入壓測 API 名稱,例如 demo,單擊右側圖標。在壓測URL區域中輸入 http://<ECS公網ip地址>:80。

說明 :ECS 公網 IP 地址可在雲服務器管理控制檯 [8]的實例頁面查看。

5. 在施壓配置頁籤,配置相關壓測參數,遞增模式選擇自動遞增最大併發輸入 50,遞增百分比輸入 10,單量級持續時長輸入 1,壓測總時長輸入 5。確認參數後,單擊保存去壓測

說明:請嚴格按照指引配置參數進行配置,避免因超出免費試用額度而造成意外出費。

6. 在溫馨提示對話框中,確認任務預估的預估消耗,未超過免費額度。確認後單擊確定啓動壓測

7. 請您耐心等待大約 3 分鐘,您即可在壓測中頁面查看當前應用實時的壓測數據。在壓測中頁面,您可以看到成功率、RT 和 TPS 等概覽數據。

8. 在壓測完成之後,會自動跳轉到編輯場景頁面,然後單擊壓測報告

9. 在壓測報告頁籤,找到您的壓測報告,單擊右側操作列下的查看。在壓測報告瞭解詳細的壓測報告內容。

容量規劃與性能瓶頸分析

在拿到測試結果數據之後需要對系統中存在的瓶頸點進行分析爲調優做準備,系統的性能瓶頸點主要分佈在安全防護、負載均衡、後端應用、中間件、數據庫、操作系統、硬件規格等方面,具體瓶頸點和調優細節,敬請期待《容量規劃與調優》系列文章。

相關鏈接:

[1] 實例規格族

https://help.aliyun.com/document_detail/25378.htm#concept-sx4-lxv-tdb

[2] DescribeInstanceTypes

https://help.aliyun.com/document_detail/25620.htm#doc-api-Ecs-DescribeInstanceTypes

[3] 性能測試 PTS

https://www.aliyun.com/product/pts

[4] 性能測試 PTS 計費規則

https://help.aliyun.com/document_detail/433167.html?spm=a2c4g.29269.0.0.67fa7f32p02i2O

[5] ECS 控制檯

https://account.aliyun.com/login/login.htm?oauth_callback=https%3A%2F%2Fecs.console.aliyun.com%2F

[6] 一鍵配置模板鏈接

https://account.aliyun.com/login/login.htm?oauth_callback=https%3A%2F%2Fros.console.aliyun.com%2Fregion%2Fstacks%2Fcreate%3Fspm%3Da2c4g.611918.0.0.3aec628amGQK9n%26templateUrl%3Dhttps%3A%2F%2Fstatic-aliyun-doc.oss-cn-hangzhou.aliyuncs.com%2Ffile-manage-files%2Fzh-CN%2F20230320%2Fonyv%2F%25E5%25BF%25AB%25E9%2580%259F%25E6%2590%25AD%25E5%25BB%25BA%25E7%25BD%2591%25E7%25AB%2599.yml&lang=zh

[7] 性能測試 PTS 控制檯

https://account.aliyun.com/login/login.htm?oauth_callback=https%3A%2F%2Fpts.console.aliyun.com%2F&lang=zh

[8] 雲服務器管理控制檯

https://account.aliyun.com/login/login.htm?oauth_callback=https%3A%2F%2Fecs.console.aliyun.com%2Fserver%2Fregion%2Fcn-beijing

作者:趙佳佳

點擊立即免費試用雲產品 開啓雲上實踐之旅!

原文鏈接

本文爲阿里雲原創內容,未經允許不得轉載。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章