業務連續性與災難恢復
8.1 業務連續性和災難恢復
災難恢復計劃(DRP)是在緊急模式下實施的計劃
業務連續性規劃(BCP)採取一個更廣泛的解決問題的方法
業務連續性管理(BCM)是整體的管理過程,整合恢復能力和有效應對能力,包括DRP和BCP。
8.1.1 標準和最佳實踐
美國國家標準和技術協會NIST
BS25999
ISO/IEC27031:2011
ISO22301
業務連續性協會的優秀實踐指南GPG
DRI國際協會的業務連續性規劃人員專業實踐
重點都是在災難發生後保持公司業務的正常運轉
根據組織的需要,選擇合適的標準。如美國政府組織需要使用NIST,想要得到ISO認證的組織使用ISO/IEC 27031和ISO/22301.
8.1.2 使BCM成爲企業安全計劃的一部分
BCM團隊的任務是負責將業務重新恢復
8.2 BCP項目的組成
BCP委員會代表人員需涉及:業務部門、高級管理人員、IT部門、安全部門、通信部門、法律部門
8.2.1 項目範圍
8.2.2 BCP策略
主要內容包括:範圍、任務說明、原則、指南和標準
8.2.3 項目管理
通過SWOT分析,可以確保在範圍內定義的目標是可以實現的,以及能夠及時發現那些可能會妨礙到項目整體成功和影響效率的問題。
SWOT即優勢/ 弱勢/機會/威脅
8.2.4 業務連續性規劃要求
業務連續性規劃最重要的是獲得管理層的支持,是自上而下的。
8.2.5 業務影響分析(BIA)
BIA被認爲是一種功能性的分析
風險=威脅x影響x概率
公司可以容忍的中斷時間指可承受的最長停機時間(MTD)或最長中斷時間(MPTD)
8.2.6 相互依存性
8.3 預防性措施
BIA期間, BCP確定了關鍵資源的MPTD,我們需要採取預防性措施降低影響
8.4 恢復戰略
恢復時間目標RTO指從災難恢復所花費的時間,Recovery Time Objective
恢復點數據RPO指最大可容忍的數據丟失量,用時間表示,Recovery Ponint Objective
工作恢復時間WRT指恢復數據、測試流程等完成可以進行生產的時間,Work Recovery Time
MTD=RTO+WRT
8.4.1 業務流程恢復
業務流程是一組相互關聯的步驟,通過特定的決策活動完成具體任務。
8.4.2 設施恢復
平均故障間隔時間MTBF
平均修復時間MTTR
3種異地租用設施:
完備場所(hot site):貴,幾個小時即可投入運行,硬件和軟件選擇有限,可進行年度檢查,用於短期解決方案
基本完備場所(warm site):相對便宜,不能立即投入使用,不能立即獲得所需資源,常用於需要使用所有權硬件和軟件的場景
基礎場所(cold site):最便宜,只提供基本環境,不提供設備和服務
第三站點:對備份的備份
互惠協議reciprocal agreement:便宜,A公司同意在B公司遭到災難襲擊時使用自己的設施
冗餘場所redundant site:安全可用,可即可投入使用且受到組織控制
滾動完備場所rolling hot site,移動完備場所,預製的建築,多處理中心multiple processing center
8.4.3 供給和技術恢復
BCP團隊需要保證恢復團隊具有重建網絡環境的知識和技能。
- 硬件備份
確定依靠供應商的SLA還是準備一個熱交換的冗餘系統 - 軟件備份
BCP團隊應當保證至少爲公司的操作系統和關鍵應用系統準備兩個備份,分別放在現場和異地。
軟件託管software escrow:由第三方機構保存原代碼、編譯代碼備份、手冊以及其他支持材料。
8.4.4 選擇軟件備份設施
8.4.5 終端用戶環境
管理人員結構應呈樹狀,發生災難時一層層傳遞通知下去。
發生災難後,第一階段由一組骨幹員工返回工作崗位恢復最關鍵部門的運作。
BCP還需確定必要時應如何手動執行當前的自動化任務。
8.4.6 數據備份選擇方案
BCP爲保護數據提供解決方案,並確定在災難發生後恢復數據的方法。
完全備份full backup:全量備份,歸檔位設爲0
差量過程differential process:對完全備份之後發生變化的文件進行備份,不改變歸檔位,還原數據=完全備份+差量備份
增量過程incremental process:對完全備份或增量備份後發生變化的文件進行備份,歸檔位設爲0,還原數據=完全備份+每一個增量備份
8.4.7 電子備份解決方案
自動備份的方案:
磁盤映像disk shadowing:確保數據可用,通過複製硬件和維護幾份信息副本來提供容錯解決方案
自動磁帶傳送tape vaulting:數據通過一條串行路線傳送到異地設施的備份磁帶系統
電子傳送electronic vaulting:當文件發生改變時進行備份,並定期批量傳送到異地備份站點
遠程日誌處理remote journaling:實時發生,只傳送文件修改
異步複製、同步複製
8.4.8 高可用性HA
服務水平協議SLA:服務商向客戶承諾提供正常運行時間和當網絡無法連接時能夠使該服務正常運轉的週轉時間
通過冗餘、容錯和故障轉移的技術實現高可用性。
數據可以通過備份磁帶、電子傳送、同步或異步複製或RAUD來進行恢復。
處理能力可以通過集羣、負載均衡、鏡像、冗餘、容錯技術來恢復。
8.5 保險
業務中斷保險business interruption insurance
網絡保險cyber insurance:爲由ddos、惡意軟件破壞、黑客、電子盜竊、與隱私相關的法律訴訟等提供保險
8.6 恢復與還原
8.7 測試和審查計劃
測試和災難恢復演練應當至少每年進行一次。
8.7.1 覈查性測試
也稱桌面檢驗測試,BCP的副本被分發至不同的團隊和職能區域接受審查。
8.7.2 結構化的排練性測試
各部門或職能區域的代表聚集在一起對計劃進行審查,從頭到尾將計劃的不同場景演練一次。
8.7.3 模擬測試
所有操作和支持職能部門的員工或他們的代表集中起來,根據一個特定的場景練習執行災難恢復計劃。
8.7.4 並行測試
將備份設施的處理結果與原來設施的處理結果進行對比,以確保特定系統在備用異地設備中能充分發揮功能。
8.7.5 全中斷測試
關閉原始站點,並將業務處理轉移到備用站點。
恢復團隊需爲備用站點準備好系統和環境,所有處理都將在備用異地設施的設備上進行。
8.7.6 其他類型的培訓
急救、心肺復甦、如何正確使用滅火器等