隨著企業營運轉型為服務導向,持續營運也就日益重要,因為一旦系統中斷,服務立即停止,企業承受的不只是財務損失、可貴的資料損毀,還有信譽的損害。
隨著資訊化日漸普及,IT的角色不再只是後勤單位,而是主動地提供更多的創新應用,無論生產製造、設計研發、行銷業務、顧客服務、行政後勤的不同角色,都必須仰賴各種專業應用系統、流程自動化、溝通協同、資料處理等機能來完成日常工作,企業營運愈來愈依賴資訊系統。
而這也是為什麼近年來IT不斷強調持續營運的重要性,因為一旦系統中斷,資訊服務立即停止,企業遭受的不只是財務損失、可貴資料的損毀,還有信譽的損害。
尤其,台灣位處環太平洋地震帶,加上天候異常帶來的豪雨以及人為操作疏失所潛藏的風險,企業IT營運隨時都可能產生危機,根據美國「國家檔案保存及紀錄管理局」(National Archives and Records Administration)的統計顯示,資料中心因發生災難而超過九天仍無法恢復正常運作的企業,有高達93%會在一年面臨破產倒閉。
傳統備援問題多
因此,IT業界很早便推動災難備援(Disaster Recovery)的概念,透過另一處備用的IT架構,在緊急時刻就能接手企業營運。然而,受限於早期IT技術發展,傳統災難備援方案仍有許多不足之處。
一對一建置成本高昂
|
▲台灣網威高級工程師宋坤培解釋,直接在異地端準備一套與本地一模一樣的架構,對於企業來說是不小的成本壓力,特別是當企業希冀保護的系統愈多,需要成本支出也愈高昂。 |
「首先是成本問題。過去企業對於系統災難復原方案所採取的方法不外乎就是以實體主機做為系統備援,透過叢集技術加上硬體架構相互搭配而成,而所耗費的成本會依需要保護的系統數量而提高。」台灣網威高級工程師宋坤培解釋,直接在異地端準備一套與本地一模一樣的架構,對於企業來說是不小的成本壓力,包括伺服器、儲存設備、網路頻寬等等都需要購置兩套,特別是當企業希冀保護的系統愈多,需要成本支出也愈高昂。
人為疏失是風險
另一個長期存在的潛在風險則是人為的疏失,飛康國際技術顧問經理李予銓表示,傳統災備的還原方式相當耗時費力,簡要說明時也許只有短短幾行字:「企業在遇到突發事件後,由IT管理人員以手動的方式來進行伺服器重建、設定應用系統與網路組態,並且將資料回復後重啟系統運作。」他提到,但是如果仔細檢視中間過程需要耗費多少手動還原順序時,就不難明白人為操作的潛在風險有多高。
一般來說,當系統遇到突發狀況,首先要試著修復硬體或者準備一台備用硬體,然後重新安裝作業系統、更新系統相關修正程式、進行系統設定、安裝應用程式及資料庫軟體並進行相關設定、還原資料、檢視還原結果是否成功、檢查還原資料的可用性、回補損失的資料,然後才能恢復對外服務。
他提到,通常一個系統手動還原到正常運作需要耗費半天到一天的時間,這還不包括企業可能有上百個甚至上千個系統,「想要在短時間恢復,絕對有其難度。」
|
▲ 傳統還原方式耗時費力且流程複雜。(資料來源:飛康) |
SLA提高 30分鐘的挑戰
|
▲賽門鐵克技術顧問協理孫秀婷指出,不少企業已經要求營運系統必須在三十鐘內就完成啟動,舊有的方案勢必無法協助IT人員完成這個使命,企業必須透過更自動化的方式來克服挑戰。 |
隨著企業營運轉型為服務導向,企業對系統要求的復原時間也開始有了不一樣的想法,賽門鐵克技術顧問協理孫秀婷就坦承,「在我接觸的客戶中,許多企業早就要求把關鍵系統的復原時間限定到三十分鐘以內,問題是現在的IT架構並不像過往那麼簡單,資料庫、應用服務以及Web伺服器等不同系統之間有著複雜的關連性,按照以前的手動復原方法,光是資料庫重新啟用就可能耗費三個小時,若再加上應用服務以及Web伺服器的重啟時間,至少也要耗上半天的時間,過去企業或許還能接受,但在服務掛帥的今日,要求也與以往不一樣了。」
她提到,不少企業已經要求營運系統必須在三十鐘內就完成啟動,舊有的方案勢必無法協助IT人員完成這個使命,企業必須透過更自動化的方式來克服挑戰。
IT環境日益複雜
另一個迫使企業必須重新審視災備方案的因素便在於虛擬化技術的推展。雖然虛擬化技術對於資源的重新利用與分配有其好處,但相對的也使得企業IT環境更加複雜。多數的企業目前尚未走到全虛擬化環境,受限於許多早期撰寫的應用程式仍必須在實體主機運作,而且企業對於關鍵系統在虛擬環境運作的疑慮仍未完全消除,因此選擇實體與虛擬架構並存更是常見的作法。
Acronis台灣分公司資深技術經理簡碩文提到,純粹只有實體環境的災難備援,在作法上相對單純,因為擔心換了其他設備而無法運作,因此企業只要在遠地建構一模一樣的系統,災難備援方案就算完成。「但是虛擬化卻把架構複雜化,一方面是虛擬化的技術門檻較高,而且部分虛擬化平台在授權方案以及儲存設備方面也需要有相對應的配合,再加上企業可能因為成本考量而導入各式不同的解決方案,這些都可能造成災備方案難以完善的原因。」
災難備援走入自動化
受到技術、總體環境以及服務層級要求不同的影響,災難備援相關解決方案也陸續有了許多不同的選項,並且紛紛將自動化機制納入在功能介面中,例如VMware的災難備援管理工具vCenter Site Recovery Manager 5、Novell PlateSpin Forge、FalconStor連續資料保護方案內含的標準功能RecoverTrack、賽門鐵克Veritas災備方案與Acronis的vmProtect 7與Acronis Backup & Recovery 11中,都可以透過事前詳細的計畫與設定來做到自動化的系統切換,並且只要一個按鍵就能做到。