|
數(shù)據(jù)中心服務持續(xù)性管理,是負責預防災難、增強IT基礎架構(gòu)的彈性(Resilience)和容錯容量(Fault Tolerance)的過程,它需要確保組織在發(fā)生災難后有足夠的技術、財務和管理資源,來確保IT服務的連續(xù)性運作。 數(shù)據(jù)中心服務持續(xù)性管理的目標,是確保業(yè)務運作所需的IT基礎架構(gòu)和和IT服務在災難發(fā)生后的限定時間內(nèi)能夠得到恢復,從而對組織的總體業(yè)務連續(xù)性管理(BCM)提供支持。數(shù)據(jù)中心服務連續(xù)性是BCM的一部分。 國家針對業(yè)務連續(xù)性先后出臺了多項有關災難備份的保障措施。已出臺的有關文件如下: (1)2004年9月份下發(fā)了《關于加強國家重要信息系統(tǒng)災難備份工作的意見》(信安通〔2004〕11號)。文件強調(diào)了“統(tǒng)籌規(guī)劃、資源共享、平戰(zhàn)結(jié)合”的災備工作原則;國家為此圈定了銀行、保險、證券、稅務、海關、民航、鐵路、電力等必須建立災難備份的八個重點行業(yè),同時提出,災難備份建設要從實際出發(fā),提倡資源共享,可以采用自建、共建和利用社會化服務等模式,鼓勵社會力量參與災難備份設施建設,提倡使用社會化災難備份服務,走專業(yè)化服務道路。 (2)2007年11月1日,國家正式下發(fā)了GB/T 20988-2007《信息安全技術信息系統(tǒng)災難恢復規(guī)范》。該規(guī)范作為我國目前頒布的第一部關于信息系統(tǒng)災難恢復工作的行動指南和標準;明確定義了災備行業(yè)的規(guī)范用語;規(guī)范了整個災難恢復的工作流程;作為資料性附錄,提供災難恢復預案的模板;引入了災難恢復的分級機制(目前確立為六個級別)。規(guī)范指出要加快實施八個重點行業(yè)(銀行、電力、鐵路、民航、證券、保險、海關、稅務)的災難恢復工作。 對于第三方數(shù)據(jù)中心服務提供商,數(shù)據(jù)中心服務連續(xù)性主要是指業(yè)務應急預案體系最大限度減少災難性事件出現(xiàn)時對于SLA達成的影響;對于甲方數(shù)據(jù)中心,通常需要通過建設災備中心來解決IT服務連續(xù)性的問題。 數(shù)據(jù)中心服務持續(xù)性管理的關鍵點包括: (1)數(shù)據(jù)中心預防和應急預案體系。對于數(shù)據(jù)中心運營管理來說,應急預案的完整性和充分性是數(shù)據(jù)中心業(yè)務連續(xù)性的重要部分。但對于數(shù)據(jù)中心災難性事件的預防機制的重要程度和投入,要更大于應急預案體系的建設。數(shù)據(jù)中心應急預案常見的分類如下:
數(shù)據(jù)中心應急預案制定的關鍵點如下: (1)應急小組成員和聯(lián)系方式明確和準確; (2)應急響應流程明確,每個階段的響應責任到人; (3)應急過程中的安全注意事項; (4)應急預案場景化; (5)應急預案容易獲??; (6)應急預案簡練; (7)應急預案的定期演練; (8)演練后的持續(xù)改進。 (2)數(shù)據(jù)中心災備中心建設。數(shù)據(jù)中心級災備模式一般有三種分類,兩地三中心模式、同城模式和異地模式,其中異地模式要考慮災備點的物理距離,常見的要求是災備點距離≧800公里。對于這部分內(nèi)容,國家相關文件有許多明確的要求,尤其是對于金融機構(gòu)。具體可以參考相關文件。
(本文節(jié)選自《中國數(shù)據(jù)中心運維管理指針》,如需購買或轉(zhuǎn)載請留下您的聯(lián)系電話及郵箱發(fā)送留言至本公眾號,將有工作人員與您聯(lián)系) |
|
|