做好數據中心能耗大管家

Intel DCM案例分享:


中國石油化工股份有限公司石油物探技術研究院(以下簡稱“物探院”)是中國石化石油物探高新技術和核心技術研發中心,其主要職責和任務是承擔國家及中國石化石油地球物理勘探方面的基礎性、前瞻性和重大項目攻關與核心技術研發,爲中國石化可持續發展提供資源保證。物探院數據中心的能耗管理變得日益急迫,能耗成本成爲數據中心IT部門的核心成本來源,同時也是最令IT部門擔憂的問題。因此物探院希望找到能夠幫助數據中心降低能耗的有效辦法。


基於物探院的業務需求,Intel爲客戶部署了英特爾數據中心管理平臺。英特爾數據中心管理平臺(Intel Data Center Manager,IntelDCM)是一款對數據中心服務器功耗和溫度進行監控、管理和優化的軟件技術產品。通過部署英特爾數據中心管理平臺,可以幫助物探院對其數據中心服務器的能耗情況進行有效管理。


在部署了英特爾數據中心管理平臺後,在不影響業務性能的情況下有效降低了數據中心能耗,十分出色的解決了物探院的數據中心所面臨的問題。英特爾數據中心管理平臺在物探院的成功部署,在如何建設環保節能型數據中心方面進行了有益的嘗試,通過部署英特爾數據中心管理平臺,物探院的能耗降低了近10%,同時管理效率得到有效提升。物探院信息中心副主任王永波表示:“通過利用英特爾數據中心管理平臺,我們物探院數據中心的能耗有大幅降低,同時又保證了工作效率和安全性。這既符合了我們建設綠色機房的需求,也降低了我們的日常成本。”


Intel數據中心管理解決方案是如何幫助物探院有效管理數據中心的呢?


雖然現代數據中心通過嚴格的溫控措施,安全措施來保證服務器的安全有序運行,同時也令各種節能環保措施的集中應用變得可能。然而,如何兼顧低能耗和服務器的高效率、高安全性工作是值得數據中心運維人員予以平衡的問題,同時這也會直接關係到一個數據中心的總體擁有成本(TCO)。物探院找了一個解決方案來以降低其數據中心的TCO,它們選擇了英特爾數據中心管理解決方案並最終部署在它們的數據中心。英特爾數據中心管理平臺可以在不影響服務器系統運行的情況下,以帶外方式對服務器的整體功耗進行實時監測與管理,並通過對歷史數據進行分析,針對實際環境和服務器運行


Intel數據中心管理解決方案是如何實現數據中心節省能耗的呢?


數據中心雖然部署着成千上萬的服務器,但並非每一臺服務器都在全負荷地工作。高級能源分析師埃裏克伍茲(Eric Woods)曾經這樣表示:“服務器雖然使用了60%的功率,而處於事實上的無所事事中(Servers use 60 percent of their maximum power,while doing nothing at all)”。在物探院的數據中心,同樣有着相同的問題,物探院信息中心副主任王永波表示,當數據中心的工作量在較低時,該服務器的約40%至50%沒有任何工作負荷,可以被暫時關閉。


針對這一情況,英特爾數據中心管理平臺提出了簡單卻高明的策略:英特爾數據中心管理平臺可以自動監測到物探院數據中心內每一臺服務器的實時功耗和進風口溫度,並對這些數據進行記錄並存入數據庫,持續得到一段時間(如一個月)的數據後,英特爾數據中心管理平臺就可以針對這些功耗數據進行分析,並執行相關策略。例如:當運行英特爾數據中心管理平臺一個月後,通過功耗數據分析發現,物探院一部分機器在夜晚都處於空閒狀態,其中40%至50%的服務器沒有有效的應用負載運行。那麼管理員可以通過英特爾數據中心管理平臺定相應的策略,將可以休眠的服務器執行休眠或關機,並在第二天早晨實際應用上來以前重新喚醒或開機。另外,與任務調度系統將結合,利用英特爾數據中心管理平臺智能策略開關機功能,在有高性能計算業務運行前將因閒置而關機的服務器開機,而在計算業務結束後將處於空閒狀態的服務器休眠關機,可以在不影響業務的情況下,大大節省數據中心能耗,以1千臺服務器節點爲例,如果平均20%的服務器處於空閒或低負載狀態,空閒功耗90W,假定PUE爲1.8,電費爲0.9元/度,則利用英特爾數據中心管理平臺行策略開關機管理,1千臺服務器1年可節省的電力費用爲26萬元人民幣。

 wKioL1c1jvegLkhaAAFktcDsXbY365.png

英特爾數據中心管理平臺工作界面

衆所周知,空調溫控設施在保持數據中心適宜工作溫度的同時也帶來巨大的通風製冷消耗。一般而言,服務器的適宜工作溫度爲18至27攝氏度,而物探院數據中心之前的機房溫度一般爲20攝氏度,這提供了一個可能,提高數據中心的運行溫度來減少能源消耗。當然,這也不是一件簡單地工作,需要謹慎處理,以避免引發熱點,導致數據中心設備和服務的停機和損害。物探院用英特爾數據中心管理平臺來採集溫度數據,可以實時獲取每一臺服務器的進風口環境溫度,這相當於在每一臺服務器上都增加了一個天然的智能溫度計。這些溫度信息彙總到管理界面,數據中心的管理員就可以合理的設置空調製冷系統,避免了過度製冷所造成的資源浪費,同時防止了製冷不足而可能出現的熱點。利用英特爾數據中心管理平臺,物探院發現數據中心服務器進風口之間有5℃的溫差。溫差較大會導致數據中心產生熱點並降低操作的可靠性。通過在冷空氣出口增加空氣溫度來減少進風口溫差可以幫助消除熱點,同時,其還有助於提高數據中心的冷卻效率。研究分析及數據統計表明:物探院數據中心的空調出風口溫度每提升4攝氏度,預計可以節省32%的製冷機功耗。 

wKiom1c1jmrAEhPKAAD-6mf68aE378.png

機房服務器溫度分佈及分析

除了能耗方面的管理,英特爾數據中心管理平臺還具備一系列緊急情況的處理機制來保障數據中心的安全運行。例如,在發生暴雨等突發情況時,數據中心正常電力可能會中斷,只能啓用UPS緊急供電模式,或者機房製冷系統故障等突發狀況,數據中心管理人員不得不進行備份、關機等操作,業務運行也很大可能會中斷。通過啓用英特爾數據中心管理平臺緊急策略,可以將低優先級的服務器節點自動關機,中優先級的服務器節點自動啓用最小功耗策略,而高優先級的服務器維持正常運行,並維持較長時間。在未來,英特爾還將與物探院繼續合作,採用更多的新技術,使其數據中心的管理水平獲得更大的提高。


結論:英特爾數據中心管理平臺(DCM)是一款在數據中心能效管理及降低總擁有成本方面卓有成效的管理工具。


在南京物探院的部署中, DCM通過對數據中心服務器進行監控,對數據中心機房溫度進行自動調節,並構建了一個統一的管理平臺,有效的對服務器能耗進行了管理。南京物探院可以跨平臺通過帶外方式對數據中心服務器進行遠程管理。

  • 利用DCM進行策略開關機管理,物探院每1千臺服務器1年可節省的電力費用可達26萬元人民幣。

  • 利用DCM對數據中心機房進行溫度調節,物探院預計可以節省32%的製冷機功耗。


更多數據中心管理產品信息敬請登錄:

http://www.intel.cn/content/www/cn/zh/software/data-center-overview.html    

或者發送郵件至[email protected]與我們聯繫。


發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章