在企業、政府,甚至個人生活高度仰賴資訊系統的現代社會,不論何種原因造成的電力或電訊網路中斷,都將為企業營運帶來龐大影響,輕則帶來立即但短期的營收減損,重則帶來多種層面的負面影響,損失難以估計。
去年在日本東北地區的超級強震及所引發的強大海嘯與後續核能危機,至今也將近一年了,這起事件仍令許多人記憶猶新。
許多日本企業就算不位於重災區,卻因核能電廠運作失靈造成的缺電危機,陷入因限電而惟恐營運停擺的夢靨中。
在企業、政府,甚至個人生活高度仰賴資訊系統的現代社會,不論何種原因造成的電力或電訊網路中斷,都將為企業營運帶來龐大影響,輕則帶來立即但短期的營收減損,待電力恢復即可回復正常步調;但對某些產業,以晶圓代工為例,一旦停機每分鐘都是巨額的損失,得須額外花費更多時間才能恢復產能意外停機導致多種層面的負面影響更是難以估計。
從建立備援機制到落實營運持續管理
日本大地震引發的後續效應,特別敦促全球大型企業與政府組織檢討,本身的災難因應與備援能力是否存在過去未曾注意的漏洞。
一旦特殊狀況發生,在用戶最需服務的時刻,企業組織能否如常提供相同或相近水準的服務,對企業的營運品質、聲譽及實質的業務收入等,都會產生很大的影響。
備援機制的建立,對許多高度仰賴資訊系統的企業來說,絕對不是陌生的概念;事實上,絕大多數的企業早已擁有某種程度的「備援計畫」。
但當被問及備援回復作業的具體目標時,對於自身落實能力胸有成竹的企業組織,就可能付之闕如。
關鍵在於,許多企業可能基於成本考量,或未曾確實評估企業在突發事件中,對業務中止所能承受的最大風險,而選擇減少或不願投資合理的備援與營運持續管理機制。
因此,一旦災害發生,除了業務難以快速恢復正常,延遲恢復營運反而還可能對企業造成商譽貶損,且原先不足的備援投資也無法發揮功效而被視為浪費的二度傷害。
備援機制的建立與企業本身整體風險管理策略息息相關,企業須先綜合思考,一旦意外事件造成企業停機的損失,在不同的恢復時間下,可能達到的規模。
舉例來說,一間平均每小時可完成新台幣100萬元交易額的電子商務網站,倘若只做了每日資料備份,且回置資料尚須人工作業數小時才能完成,停機一天的損失便可能達新台幣數千萬元。
若在同樣規模的天災衝擊下,面對競爭廠商1小時內即可完成復原重新上線,自身因商譽貶損而致長期銷售額下滑,也得列入考量範圍。
換句話說,企業一定得多方考量本身的風險耐受度以及可投資的預算,將長期維護成本納入考量,建立最符合本身需求的風險管理指標,並在系統建置時依據相關指標與方法論落實。
儘管天災人禍難以避免,但至少能達到「減害」目的,讓風險可能帶來的損失與預防風險須投入的成本取得平衡。
營運持續管理必須多方合作
談到風險管理,不論天災人禍,對企業的影響絕對不可能僅侷限於特定部門。
換句話說,儘管企業應用系統與機房運作是由資訊部門負責,但一旦出現問題,影響範圍遍及整個組織,要確保營運不受突發事件影響而中斷,不同部門需攜手面對,不能只依賴IT部署解決。
表1清楚比較災難備援計畫、營運持續計畫與營運持續管理三種因應突發事件對策的異同之處。
|
▲表1 傳統災難備援(DRP)與營運持續管理(BCM)的差異。 |
關鍵差異,便是把因應突發事件的策略,由僅從資訊部門出發的單一面向,提升到企業整體規模,但又能兼顧部門間或業務類型對風險的不同因應方式。
更重要的是,確保復原策略目標與企業本身營運目標維持一致,避免不必要的投資與資源錯置。
舉例來說,當企業設計資訊系統的備援架構時,會考慮資料的備份頻率,以及備份資料的方式。
例如,僅做到資料備份,但沒有隨時待命的備援系統;或有了備援系統,但在配置空間與距離有所差異;要雙系統同時開啟以便隨時承接另一系統的負載,或讓主系統負責運算,必要時才移轉到備用系統?甚至考慮更高階的兩地三中心高可用性配置等。