異地備援機房在部署之前也需要有諸多考量,如何在最精省的成本投資、選擇最合宜的備援方案,達到最符合企業需求的效益,是企業以及IT主管們事前需備妥的功課。
根據2012年的媒體報導,機房備援機制是CIO們優先希望改善的項目之一。然而,近期的225麗源火警事件,因機房失火遭到消防隊斷電,以致於眾多企業營運服務受到影響,卻也顯現出企業長期以來對機房備援的輕忽。
作為營運服務的強力後盾,企業對於資訊機房的重視程度非同等閒,但也由於資訊機房打造所費不貲,基於成本與人力考量,異地備援機房(或稱為第二機房)也就成為許多企業不想面對的議題。
事實上,隨著業務競爭以及服務型態的改變,營運持續服務日益重要,對機房本身存在的風險性也應有所評估,特別是在人禍之外,無預警的天災所帶來的災損與影響也不容小覷。
套一句華爾街投資名言,投資的基本建立在詳細的風險計算與投資報酬率的掌握之上,異地備援機房在部署之前也需要有諸多考量,如何以最精省的成本投資、選擇最合宜的備援方案,達到最符合企業需求的效益,是決策高層以及IT主管們事前需備妥的功課。
落實企業需求 三步驟輕鬆選
Emerson應用工程經理陳仲倉認為,在下決策之前應該先從企業需求開始設想,「不同公司對營運服務的要求有所不同,有些可能連一分鐘服務中斷都不能承受,但也有些就算中斷服務一整天也不會有太大影響。再細部來看,即使是同屬內部提供的資訊服務,對於系統中斷運作的承受度也有所差異,必須確定這些需求之後,才能進入投資報酬率(Return on Investment,ROI)的評估。」
他解釋,確立需求同時也涉及到企業可以投入多少成本,需要建置多大規模的異地備援機房,在用途與規模被定義完成後,再來思考地點、機房等級以及部署方式,才是較好的作法。
備援機房可靠度攸關成本
根據80/20理論(帕雷托法則Pareto Principle),投入資源與效率產出本來就存在無法解釋的不平衡,而這樣的觀點也存在備援機房的建置通則上。
依據TIA-942對機房可靠度的規範,機電設施的配置可分為四個等級。Tier 1全然沒有備援機制,可靠度只有99.67%。Tier 2僅設施具有備援機制,例如UPS採用並聯式,萬一其中一組UPS壞掉,還會有另一組可以接手。強調N+1備援規劃,但是管路則沒有備援機制,可靠度比Tier 1略好,可到99.75%。
至於Tier 3開始,所有的機電設施均可維修,同時又不會造成系統中斷,例如空調系統有兩套獨立的管路。當其中一條管理在維修或測試時,系統可切換到另一條管路中繼續運用,可靠度達99.98% 。Tier 4的設計就更完善,UPS採用2N或2N+1的機制,發電機也是一對,在遇到非計畫性的故障或事件發生時,機電設施仍可以提供足夠的電力與空調來維持系統運作,具有99.99%的可靠度。
當然,愈高規格的機房需要付出的成本代價也愈高昂,建置Tier 3等級機房所需支付的成本約莫是Tier 2的2.5倍。台達電子關鍵基礎架構事業部資料中心產品經理林士基指出,如果企業評估未來備援機房使用的機率不高,平時都是備而不用,即使有需求,也僅有資料庫較為關鍵時,這時備援機房的可靠度就可以不用要求到Tier 3或Tier 4等級,Tier 1或Tier 2便已足夠。
原因便在於,為了將可靠度從99.67%提升到99.99%,光是這0.3%的升級,企業至少要多付好幾倍的預算成本,「如果投入高昂的資源,最後依然只有相同的成效時,不如把這些預算留下來做更好的配置。風險管理將更有保障。」
備援不是口號 心態別草率
IT技術與機電設施是兩項迥然不同的專業,對於IT人員而言,要跟得上最新技術的腳步,才能在嚴苛的競爭挑戰中取得先機,但是作為IT基礎架構後盾的機房,周遭的機電設施卻是要愈穩定愈好,從管理的層面來看就有不同。
|
▲宏碁電子化服務事業群副總經理吳乙南表示,為了面對嚴苛的挑戰,IT必須追求先進技術,但同樣的理念拿來管理資訊機房,換來的卻可能是維護不同或管理不善的結局。 |
宏碁電子化服務事業群副總經理吳乙南表示,並不是隨便一位員工就有辦法管理好資訊機房,機電設施管理在管理概念上完全與IT不同,為了面對嚴苛的挑戰,IT必須追求先進技術,但同樣的理念拿來管理資訊機房,換來的卻可能是維護不周或管理不善的結局。
吳乙南以製造業為例提到,台灣不少製造業均具有多個廠房,而廠房與廠房之間的資訊機房設計為互相備援機制,就架構面來看,這是一項很好的作法,但是仔細觀察,這樣的配置依然有很高的潛在風險,因為管理人員並不熟悉機電設施。」他解釋,製造業一般的作法是將資訊機房與廠房交由同一位廠務人員管理,資訊機房與廠房之間完全沒有區隔,空調、管路全都混在一起,根本就無法妥善管理,像這樣的環境,就算有備援機制,其實也很難獲得足夠的保障,「備援機房不是有做就好,重點還要能真正穩定且最佳化運轉才行。」
業務衝擊分析優先 從源頭評估方案
為資訊機房建立備援機制,最終目的還是希望能夠確保基礎架構運行不中斷,企業營運服務得以永續提供。IBM全球資訊科技專業服務部協理高脩哲指出,基於這項目的,企業需要優先評估業務衝擊分析(Business Impact Analysis,BIA)。
「提到永續維運規劃,機房備援機制只是企業眾多考量因素之一。從許多真實案例來看,備援的真正決勝點在於Operation,如何持續運轉才是最重要的關鍵。當災害發生時,有DR Site固然很好,但是能否真的起到作用,則是企業必須審慎考量的。」他提到,一般來說,災害發生時,系統中斷到重新啟用,這中間過程有不小的時間差,如何彌補這中間資料的落差,以確保資料的一致性與正確性,反而是企業應該思考的最源頭。
高脩哲認為,與其花費時間考量備援機房的形式與架構,不如回過頭從資料端評估,當災害發生時,如何確保客戶資料、營業資料等不會因為突發事件而受到損傷。「一項有意義的投資是如何讓企業重要的元件都有其備援方案,而不是針對單一元件投資高昂的金錢,像是選擇最貴或最好的資料中心,如此才能確保業務持續運作。」