破除虛擬化運維困境---假如時間能倒回

在日常虛擬化運維中,運維人員時不時會遇到突發的故障,而故障是怎麼發生的、在什麼時間點、因何而發生的,往往是困擾運維人員的難題。假如時間能倒回,回到故障發生的時間點,看清是什麼導致的故障,那運維人員排查故障時將會輕鬆很多。西南某省某醫療雲數據中心就遇到過類似的問題
西南某省某醫療雲數據中心,承載着省內各大醫院雲端的業務系統。一日,運維團隊收到某醫院反饋:業務系統當天上午忽然中斷,又在十幾分鍾後自動恢復。雖然十幾分鐘的中斷時間不長,但正值門診高峯,嚴重影響了醫院系統的正常運行。數據中心的運維團隊緊急排查,必須找出業務中斷的原因。
但業務中斷後又自動恢復,這種故障如何排查?還好有明辰智航雲安的時間回溯功能。
1. 突發故障,業務中斷又恢復
醫院反饋,業務是在當天上午忽然中斷,而又在十幾分鍾後自動恢復,時間不長,卻嚴重影響了醫院系統的正常運行。
2.將時間回溯到業務中斷的時間
運維人員通過明辰智航雲安時間回溯功能將時間調整到業務中斷的時間段內,雲安界面完整呈現出那十幾分鐘的系統狀態,
3.通過雲安界面查找業務中斷根本原因
界面顯示存儲版塊紅色示警,點擊鼠標,進一步查看原因,是存儲讀寫延遲嚴重超標,最終導致的業務中斷。而又是什麼導致在那十幾分鍾內存儲讀寫延遲呢?原來,在那個時間,某業務系統廠家運維工程師做了刪除虛機快照的操作,而同時VMware會在刪除快照後自動進行虛擬磁盤合併,導致大量讀寫發生,進而虛機發生了遷移並重啓。
業務中斷的原因找到了!誰也沒想到一次不經意的操作會引發醫院系統的業務中斷,但如果沒有明辰智航雲安的時間回溯,那可能真會成爲一個不解的謎團。
破除虛擬化運維困境---假如時間能倒回
明辰智航雲安的時間回溯功能,可將系統時間調至前一個小時、前一天、前一週等特定時間,運維人員可輕鬆查看任意時間段的系統狀態和數據,系統運行時好時壞的故障再也不怕找不到原因。
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章