建立虛擬化平台時,若能一併建置RAID磁碟陣列監控機制,就能夠即時掌握磁碟陣列與相關元件的健康狀態,而且還可以設定自動告警機制來隨時因應突發的故障事件,以下示範如何在ESXi內安裝免費的RAID監控軟體。
當然,若開啟MSM管理工具,也會發現在〔Dashboard〕頁籤中先前狀態良好的Optimal已經變成「Needs attention」。
切換到〔Physical〕頁籤,則會顯示損壞的硬碟「Slot 3消失」僅剩七顆硬碟。再切換到〔Logical〕頁籤,同樣也看到Slot 3消失,並且狀態也從Optimal變成「Degraded」,如圖18所示。
|
▲圖18 損壞的硬碟Slot 3消失僅剩七顆硬碟,RAID狀態從Optimal變成Degraded。 |
災難演練—RAID重建
將良好的硬碟重新插入Slot 3之後,當實體伺服器硬體「感應器(Sensor)」偵測到有新的硬碟加入,便會自動進行「RAID重建(RAID Rebuild)」的動作。
此時,再回到MSM管理工具中,將會出現在〔Physical〕或〔Logical〕頁籤內,「Slot 3硬碟出現」並且狀態為「重建(Rebuild)」,如圖19所示。
|
▲圖19 感應器偵測到新的硬碟加入後,自動進行RAID重建動作。 |
RAID重建(RAID Rebuild)的動作要花費多少時間?端視磁碟陣列卡效能以及儲存空間而定,但是在MSM管理工具介面中切換至〔Dashboard〕頁籤,然後在Background Operations區塊內按下「More details」連結,便會彈出視窗,顯示目前的RAID重建進度百分比、已花費時間(Elapsed time)、預估剩餘時間(Estimated time left),如圖20所示。
|
▲圖20 顯示RAID重建進度百分比、已花費時間和預估剩餘時間。 |
當RAID重建作業完畢,回到〔Dashboard〕頁籤狀態,將由先前的Needs attention變回「Optimal」,而切換到〔Physical〕或〔Logical〕頁籤中,除了Slot 3由先前RAID重建時的Rebuild變回「Online」狀態之外,RAID狀態也由先前的Degraded變回「Optimal」,如圖21所示。
|
▲圖21 RAID重建作業完畢。 |
結語
希望透過本文的說明及實作,能夠幫助讀者在建立虛擬化平台時輕鬆建立無需額外成本的RAID磁碟陣列監控機制,除了可以隨時線上掌握磁碟陣列及相關元件的健康狀態之外,若進一步設定自動告警機制,當硬碟損壞、BBU電池壽命不足等等故障事件發生時,就可以在第一時間內進行災難因應的動作。
<本文作者:王偉任,VMware vExpert及Microsoft MVP,網路暱稱Weithenn。由於工作關係經常碰觸不同的作業系統、網路架構、硬體設備、虛擬化技術等,因此希望能將一些技術心得分享給大家,擁有CCNA、NSPA、MCITP、RHCE、VCP等證照,個人網站:http://www.weithenn.org>