【雲快訊】《“雲計算”也要防雷,20%數據中心故障和雷擊有關》


2015-08-24 張曉東 東方雲洞察

點擊上面的鏈接文字,可以快速關注“東方雲洞察”公衆號



上週四,比利時布魯塞爾西南郊的St.Ghislaina小鎮遭遇了雷電天氣。結果,Google位於該鎮的數據中心所存儲的數據,遭到了“嚴重”的損失。大約百分之0.000001的數據受到了影響。


640?wx_fmt=jpeg&tp=webp&wxfrom=5&wx_lazy


看起來這麼小比例的數據量丟失媒體有點小題大做,不過誰讓谷歌是全球互聯網界的寵兒呢,也是雲計算領域的先驅。 因爲,雷電等原因導致數據中心的數據丟失,對於谷歌號稱永不丟失的數據而言實在是一個教訓。


Google的數據中心架構工作人員正在着手解決這個問題。目前,大部分的服務器已經使用更換了具備更好抗災性的存儲硬件。另外,Google也重申,Google雲服務的彈性計算架構遍佈全球各地,用戶可以設定在災難發生時自動切換到備用的彈性架構上。目前,Google Compute Engine在全球共有三個雲計算數據中心,分別位於比利時、臺灣的彰化和美國的愛荷華州。


閃電擊中了數據中心所用的電網,導致主要電力系統供電中斷。數據中心隨即切換到了兩種備用系統:備用供電線路和服務器內置電池。一般來說,兩種災備方案對於數據中心肯定是夠了,但誰曾想到,內置的電池這次出現了問題。


根據Google透露的情況,在從上週四到昨天的時間裏,由於部分數據中心服務器的電池耗盡時間太長(extended or repeated battery drain),這些涉事服務器存儲的I/O出現了零星的存取失敗情況:大約百分之0.000001的數據受到了影響。


這些服務器位於Google Compute Engine的北歐區域的europe-west1-b,受影響的服務器在該數據中心比例約爲5%。雖然看起來數據損失比例極小,但對於擁有海量數據的Google來說,本次數據損失並不是一件小事……行業人士估計,Google擁有10-15 exabyte(EB)的數據,每exabyte等於100萬TB,而每TB等於1000GB。如果把這個數字帶入到計算裏,百分之0.000001大約等於100多GB的數據。當然,Google雖然沒有公佈比利時數據中心的數據存儲量具體有多少,但我們可以估計,至少有數GB到數十GB的數據,在本次雷暴中丟失。



這一事件之後,谷歌的工程師們對該公司的數據中心技術進行了“廣泛的審查”,包括電氣分佈等發現了一些需要改進的領域。它們包括升級硬件以提高,在斷電瞬間高速緩存數據保存能力,”以及“改善系統工程師的響應程序和能力”。


谷歌並不是獨自面對這個問題。在2011年亞馬遜在愛爾蘭數據中心也早到了終端。


谷歌稱其可靠性和準備是不可想象的,包括地震、甚至公共健康危機,“假設人和服務不可用長達30天。”(這是一個流行的做法。)


經此一事,說明谷歌還需要在數據中心方案方面有更多的改進,以保證將來做得更好。



640?tp=webp&wxfrom=5&wx_lazy=1掃描二維碼關注【東方雲洞察】公衆號

實時瞭解深度的公有云市場分析和洞察結果!點擊右上角,在彈出的菜單中發送給朋友、分享到朋友圈。請在公衆號搜索並關注:DongCloudInsight 或 東方雲洞察。需要點對點交流請加微信:jackyzhang523


幫助您瞭解公有云相關的深度洞察結果。帶來極具深度和最新鮮的:雲市場分析、雲機會洞察分析、雲重大事件快評、雲雜談、雲論壇資訊,以及公有云領域最高端的CEO面對面深度研討。

--- 最專注、專業的“公有云洞察”分享;關注全球,聚焦中國。


發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章