災(zāi)害與風(fēng)險具有不可預(yù)測性,企業(yè)也難以每次準(zhǔn)確捕捉到即將面臨的威脅。但通過以下七大步驟,你可以大幅提高商業(yè)持續(xù)性與容災(zāi)恢復(fù)計劃的效率,增加自身的抵抗力。

  步驟1:認(rèn)識威脅的存在

  商業(yè)持續(xù)性與容災(zāi)恢復(fù)(BCDR)計劃的第一步首先是要認(rèn)識到企業(yè)面臨著有形的威脅,并且會對公司資產(chǎn)構(gòu)成損害。只有公司管理層意識到這一問題,以下的步驟才能順利展開。

  步驟2:列出并分類企業(yè)可能面臨的威脅

  商業(yè)、物理及社會環(huán)境都會影響到企業(yè)所面對的威脅種類。在列出威脅之后,應(yīng)當(dāng)根據(jù)它們對系統(tǒng)可能的影響予以分類。容災(zāi)響應(yīng)的成本應(yīng)當(dāng)視企業(yè)對系統(tǒng)恢復(fù)時間的要求而定?;謴?fù)時間越快,響應(yīng)成本就越高。有些關(guān)鍵系統(tǒng)必須在若干分鐘內(nèi)恢復(fù)運行,而有些可以當(dāng)機幾個小時到幾天不等,也不會產(chǎn)生太大的影響。

  步驟3:規(guī)劃企業(yè)BCDR技術(shù)基礎(chǔ)架構(gòu)

  BCDR基礎(chǔ)架構(gòu)主要是由一座主數(shù)據(jù)中心、一個用來復(fù)制資源的遠(yuǎn)程站點,和一條高速網(wǎng)絡(luò)連接所組成。最佳的BCDR戰(zhàn)略應(yīng)當(dāng)自始至終地貫穿“冗余”這個概念。大型機和服務(wù)器應(yīng)當(dāng)配備數(shù)據(jù)備份工具,這樣當(dāng)任何組件遇到問題時,就能立即切換到本地備份作為第一道防線。在BCDR戰(zhàn)略中,供電穩(wěn)定性是一大關(guān)鍵。根據(jù)行業(yè)分析,供電中斷是最常見,也是最容易預(yù)防的威脅。

  此外,網(wǎng)絡(luò)部署如果缺乏審慎的規(guī)劃,也會變成一種負(fù)擔(dān)。因此網(wǎng)絡(luò)連接不僅要留有足夠的冗余,而且必須根據(jù)廣域網(wǎng)(WAN)拓?fù)渲械牟煌窂絹矸乐鼓骋煌{造成商業(yè)運營的中斷。

  步驟4:盤點企業(yè)IT資產(chǎn)

  在企業(yè)規(guī)劃完BCDR基礎(chǔ)架構(gòu)拓?fù)浜?,下一步就要?zhǔn)確盤點其IT資產(chǎn)。這能讓企業(yè)了解自己有哪些資源與商業(yè)流程需要被保護(hù)。

  市面上有一系列的企業(yè)管理工具可以幫助公司制定并維護(hù)IT資源。這些工具廠商提供了軟件與模塊來掃描IT基礎(chǔ)架構(gòu),儲存硬件與軟件資產(chǎn)的詳細(xì)信息,以及它們在配置管理數(shù)據(jù)庫(CMDB)中的配置參數(shù)。

  步驟5:設(shè)置服務(wù)等級預(yù)期,定義恢復(fù)策略

  CMDB不僅儲存了企業(yè)硬件與軟件資產(chǎn)的詳細(xì)信息,同時也收集了服務(wù)等級協(xié)議信息,定義出這些IT資產(chǎn)的運行時間和恢復(fù)參數(shù)。如步驟二中所提到的,企業(yè)管理層對服務(wù)等級預(yù)期的認(rèn)可至關(guān)重要,它決定了某項IT資產(chǎn)需要在多少時間范圍內(nèi)進(jìn)行恢復(fù),同時也直接影響了BCDR的預(yù)算開支。

  只有在明確的資產(chǎn)、配置和服務(wù)等級協(xié)議知識的基礎(chǔ)上,企業(yè)才可定義出突發(fā)情況恢復(fù)策略。這一策略必須得到管理層的支持,并將IT資產(chǎn)績效直接與商業(yè)要求關(guān)聯(lián)起來。要做到這一點,企業(yè)將需要執(zhí)行一套商業(yè)影響分析,獲取系統(tǒng)要求、流程和系統(tǒng)內(nèi)部關(guān)聯(lián)性的詳細(xì)信息。而管理人員也需要了解系統(tǒng)中斷所帶來的后果,以便對突發(fā)情況恢復(fù)策略提供充分的支持。

  步驟6:制定BCDR恢復(fù)計劃

  突發(fā)情況恢復(fù)計劃詳細(xì)定義了部門與個人在保持技術(shù)系統(tǒng)可用性方面的角色與責(zé)任,以及在發(fā)生緊急情況后恢復(fù)IT系統(tǒng)的流程。一份有效的計劃應(yīng)當(dāng)包括資源要求、培訓(xùn)要求、培訓(xùn)與測試的頻率、維護(hù)計劃,以及數(shù)據(jù)備份計劃等要素,并覆蓋從緊急情況發(fā)生時的通知,到處理團(tuán)隊到位后的恢復(fù)措施,到最終恢復(fù)正常運行的所有流程。

  步驟7:測試BCDR恢復(fù)計劃

  專家認(rèn)為,容災(zāi)恢復(fù)計劃中最重要,但卻經(jīng)常被忽略的一個方面就是在制定了正式的策略和流程之后,沒有定期去測試它?;謴?fù)計劃必須接受持續(xù)的測試,以檢驗其效率與完善度,并根據(jù)IT基礎(chǔ)架構(gòu)和商業(yè)流程的變化做出相應(yīng)的調(diào)整。

  現(xiàn)實環(huán)境的復(fù)雜性或許無法讓企業(yè)規(guī)避每一次威脅,但是通過適當(dāng)?shù)募夹g(shù)、明確的服務(wù)等級預(yù)期、務(wù)實的恢復(fù)策略、完善的恢復(fù)計劃,以及嚴(yán)格的測試機制,企業(yè)完全可以將災(zāi)害所帶來的商業(yè)影響減少到最低。

責(zé)任編輯:admin