上集文章 (https://pse.is/3cfcy8)完整說明了vCenter HA準備工作、vCenter HA網路配置、vCenter HA功能啟用、變更vCenter HA運行狀態,以及如何解決vCenter HA叢集主機部署問題,那麼接下來就繼續說明落實鐵三角計畫的其他相關操作。
vCenter HA容錯移轉
在初步完成vCenter HA的部署,並且確認三個節點角色都在「已啟動」並且沒有出現已降級的狀態下,便可以進行容錯移轉測試,以確認它們之間的連線運作是沒有問題的。在vCenter Server節點的「設定」→「vCenter HA」頁面中,按下〔起始容錯移轉〕按鈕來開啟如圖1所示的頁面。然後,直接按下〔起始容錯移轉〕按鈕。
由於系統需要花費幾分鐘的時間來進行vCenter Server角色的切換,因此整個容錯移轉過程將會讓vSphere Client暫時無法連線。此外,若系統發現目前尚有未完成的資料同步任務,則會在等待完成同步後,才自動接著進行故障移轉任務。如果不想等待它們之間的同步任務,也可以在「起始vCenter HA容錯移轉」頁面中勾選「強制容錯移轉以立即啟動」選項。
當再一次回到vCenter Server節點的「設定」→「vCenter HA」頁面中,如圖2所示便會發現主動節點與被動節點的vCenter HA網路IP已經不同,原來的被動節點(10.10.10.2)已經變成了主動(作用中)節點,這表示這兩個節點的角色完成了交換。至於角色交換與恢復上線的速度,則取決於虛擬機器的運行效能。
通過了基本的故障移轉測試後,建議可以安排離峰的時間進行實際的熱備援操演,也就是直接對於目前擔任主動節點的vCenter Server虛擬機器強制關機,並觀察是否能夠同樣完成故障移轉任務,以及計算復原過程所需花費的時間。至於執行的結果,應該會呈現如圖3所示的範例一樣,也就是無論是主動節點還是被動節點無法進行連線時皆會顯示三個錯誤訊息,分別是「vCenter HA叢集已遺失節點」、「PostgreSQL複寫不在進行中」、「應用裝置configuration處於not replicating」。在上述的狀態下,將無法進行自動和手動的容錯移轉。
關於vCenter HA降級狀態問題
在vCenter HA叢集正常運行的狀態下,主動、被動以及見證節點的網路連線與相關服務的執行都沒有問題。但是,一旦呈現已降級狀態,就表示可能其中一個節點已發生失敗、資料庫複寫失敗或是組態檔案複寫問題。以如圖4所示的範例來說,系統已提示其vCenter Server內建的PostgreSQL資料庫複寫不在進行中,但這時仍然可以手動進行容錯移轉,而可能的原因是被動節點目前無法經由vCenter HA網路來連接,此時必須檢查被動節點的虛擬機器是否在啟動狀態下,以及它與主動節點的網路連線是否正常,包括網路回應的延遲時間必須未超過10毫秒(ms)。一旦主動節點與被動節點恢復同步,vCenter HA叢集便會回到健全狀態。以下說明不同節點發生失敗時所造成的降級狀態:
‧當主動節點失敗:此時系統會自動與被動節點進行容錯移轉,讓被動節點成為主動節點來繼續運行。在修復好的節點恢復上線後,將會自動成為被動節點。
‧當被動節點失敗:雖然主動節點會繼續運行,但已無法進行容錯移轉,只要被動節點再度恢復上線狀態,將會自動連接主動節點並恢復同步狀態。
‧當見證節點失敗:此節點的失敗僅會讓系統無法自動進行容錯移轉,但是主動節點和被動節點之間的複寫任務還會繼續執行。
如何手動設定vCenter HA
前面介紹了透過啟用「自動建立被動和見證節點的複製品」選項來部署vCenter HA的做法,肯定是最簡易的操作方式。然而,如果想取消此選項的設定,而改用自行手動的建立方式是否可行呢?答案是可以的,但在此之前必須先建立好「虛擬機器自訂規格」,以便讓後續被動節點與見證節點的手動複製任務能夠進行套用。
可以從vSphere Client首頁的「原則和設定檔」來開啟「虛擬機器自訂規格」管理頁面。如圖5所示,點選「新增」圖示來設定新規格名稱、連接的vCenter Server位址,以及選擇採用Linux為客體作業系統,然後按下〔NEXT〕按鈕。在「電腦名稱」頁面中,輸入原vCenter Server的主機名稱即可,再按下〔NEXT〕按鈕。而在「時區」頁面中,則設定與原vCenter Server一樣的時區設定。
接著連續按下〔NEXT〕按鈕至「網路」頁面中,分別設定以提示使用者的選項來做為NIC1與NIC2的IPv4配置,然後按下〔NEXT〕按鈕。在「DNS設定」頁面中,則設定所連接的DNS伺服器位址以及DNS搜尋路徑,即可完成規格的新增。
準備好虛擬機器自訂規格後,來到「vCenter HA」頁面中,設定主動節點的vCenter HA網路,然後將「自動建立被動和見證節點的複製品」選項設定取消,如圖6所示。再按下〔下一步〕按鈕,分別設定好主動、被動以及見證三大節點的vCenter HA網路位址,就可以開始執行主動節點虛擬機器的複製功能。
在連續執行兩次的過程中,除了必須分別設定被動節點以及見證節點的目標主機與資料存放區外,最重要的就是要在「複製選項」頁面中選取「自訂作業系統」和「建立後開啟虛擬機器電源」設定,然後再到下一個步驟中選擇套用預先建立好的虛擬機器自訂規格,接著設定好管理用的網路介面(NIC1)和vCenter HA網路介面(NIC2)的位址。
必須注意的是,在見證節點的虛擬機器完成複製任務後,便可以將NIC1的網卡連線予以關閉,因為它僅須使用到vCenter HA網路連線。待兩個節點的虛擬機器都完成複製後,就可以回到「vCenter HA設定」頁面中,按下〔完成〕按鈕以完成最後的設定。
備份vCenter Server
在過去舊版的經驗分享中,曾提及針對vCenter Server的冷備份管理,最佳的做法是透過第三方相關的備份軟體來定期備份整個虛擬機器,並且至少保留一週以上的備份檔案。
如此一來,便可以在vCenter Server發生系統層面的錯誤時,迅速復原選定時間點的備份。
在最新的vSphere 7.0架構中其實也是一樣的,如果不採用第三方工具,也可以直接使用vCenter Server內建的備份計畫功能,而且只要預先準備好用來存放備份檔案的網路儲存區即可開始進行。它目前已支援的通訊協定分別有FTP、FTPS、SFTP、HTTP、HTTPS、NFS、SMB。在接下來的實戰講解中將以SMB為例,也就是直接使用內網中的UNC共用存放位置。
準備好可供vCenter Server Appliance連接存取的UNC共用存放位置後,就可以開始設定其內建的備份計畫功能。首先,以網頁瀏覽器登入vCenter Server Appliance的網址,例如「https://vcsa01.lab02.com:5480」,其中5480是它預設的連接埠。登入後,如圖7所示,點選至「備份」頁面,再點選「設定」超連結。如圖8所示,在「建立備份排程」頁面中,先於「備份位置」欄位中輸入UNC共用存放位置,例如「SMB://192.168.7.239/Backup」。接著,在「備份伺服器認證」欄位中,輸入可以讀寫此共用存放位置的帳號和密碼,然後設定執行此備份任務的排程週期與時間。
接著是「加密備份(選擇性)」部分,可設定用以保護此備份檔案的密碼,其密碼的輸入必須至少8個字元但不超過20個字元,並且至少有1個大寫字母、1個小寫字母、1個數字以及一個特殊字元才可以。而「資料庫健全狀況檢查」功能部分,自行決定是否要停用,因為此功能將會增加完成備份的時間。最後是「要保留的備份數目」部分,可以決定要保留所有備份,還是僅保留最新的幾個備份。至於是否要備份資料庫中的統計資料、事件和工作,可以自行決定。決定好了之後,按下〔建立〕按鈕。
對於已建立好的備份排程,後續仍能夠隨時做修改、停用或是刪除。而在所設定的執行時間尚未到來之前,也可以如圖9所示隨時按下〔立即備份〕按鈕,來手動執行備份任務。
如圖10所示,便可以看見一個手動執行備份任務的相關資訊,包括備份位置、狀態、類型、已傳輸的資料大小、持續時間、結束時間等等。在備份任務完成後,可以從備份位置來查看備份相關檔案。開啟之後,可以發現系統會自動依照vCenter Server主機完整名稱(FQDN)進行資料夾分類,如此一來,當多部vCenter Server皆有執行備份任務並存放相同的備份位置時,也不怕備份的檔案會混雜在一起。至於所產生的這一些備份檔案,要如何在vCenter Server發生故障時執行復原任務呢?請繼續往下看吧!
還原vCenter Server
在vCenter Server Appliance網站的備份管理頁面中,為何只看到備份功能,而找不到復原的功能選項。其實原因很簡單,當vCenter Server因故障而無法正常運行時,可能會連此網站都無法登入,因此復原的功能肯定不能夠設計在此網站介面中。那麼該如何進行備份檔案的復原呢?
首先,在與vSphere相同的網路中,開啟任一相容的Windows桌面,並掛載vCenter Server Appliance 7.0映像,然後執行位於映像「vcas-ui-installer\win32」路徑下的installer.exe,來開啟如圖11所示的「vCenter Server 7.0 Installer」安裝頁面,接著點選「Restore」圖示。
來到「Enter backup details」頁面後,必須分別輸入備份位置、使用者名稱以及密碼。其中備份位置的完整路徑,可以從vCenter Server Appliance網站的「備份」頁面中取得。必須注意的是,來源的備份檔案與復原目標的vCenter Server版本必須一致,否則會出現錯誤而無法繼續。設定完畢,按下〔NEXT〕按鈕。
依序完成應用裝置目標、應用裝置目標虛擬機器、部署大小、儲存區選擇、網路配置等設定,便可以進入到階段二的設定來繼續完成復原任務。至於復原所需要花費的時間,取決於網路速度與主機的效能,在正常的情況下皆可以在1小時之內完成。
更新vCenter Server
在系統預設狀態下,只要VMware官方有發行新的vCenter Server版本,管理員在登入vSphere Client後,便可以看到「有新的vCenter Server更新可用」提示訊息,一旦按下〔檢視更新〕按鈕,便會進一步開啟vCenter Server的「更新」頁面。在此將可以檢視最新版本的發行日期、版本編號、組件編號、類型、嚴重性、是否需要重新開機,以及版本說超連結等欄位。
當點選了「版本說明」欄位的「連結」時,將開啟官網的版本線上說明文件。若是點選「產生報告」下的「互通性」檢查功能,則可以得知目前所有已部署的VMware相關解決方案的相容性清單,例如針對現行的vSphere Replication、ESXi相容性狀態,以作為升級或更新vCenter Server版本的考量。
在上一個步驟中若點選位於「產生報告」下的「更新前檢查」功能,將可以得知是否有潛在的問題會導致系統更新失敗,如果執行結果出現「找不到任何問題,已通過更新前檢查」訊息,即表示可以按下〔開啟應用裝置管理〕按鈕,來自動登入「vCenter Server管理」網站。在此,可以進一步點選「暫存和安裝」超連結,執行最新版本的下載與更新任務。
執行之後將會開啟「暫存和安裝更新」設定頁面,首先會看到升級過程所估計的停機時間,接著只要在此分別接受使用者授權合約,以及在「備份vCenter Server」頁面中勾選「我已備份vCenter Server及其相關聯的資料庫」選項,便可按下〔完成〕按鈕開始進行更新任務。
關於vCenter Server的更新,不一定非得透過vCenter Server管理網站的操作來完成,其實也可以透過SSH遠端連線的方式,以命令參數的執行方式來完成更新任務。
在開始之前,先登入vCenter Server虛擬機器所在ESXi主機,在vCenter Server虛擬機器的「動作」選單中執行【編輯設定】,然後完成vCenter Server更新映像的掛載,而在此之前先完成此映像的上傳。
在成功以SSH工具連線登入vCenter Server後,便可以在Command命令提示下執行「software-packages stage --iso」命令,來掛載最新vCenter Server Appliance 7.0的更新映像。掛載後若要檢視其內容,則執行「software-packages list --staged」命令來查看其Bug修正的說明網址、升級支援的版本清單、更新檔案的大小、下載網址、重要等級、發布日期等資訊。確認要進行更新後,執行「software-packages install--staged」命令即可。成功完成更新任務後,便可以在命令執行結果中看到「Installation process completed successfully」提示訊息。
結語
vCenter Server從自身HA功能的部署到備份、更新,其操作方法都非常簡單,遠遠優於其他虛擬化平台的複雜管理方式。其實這背後的根本原因就是它完全在vSphere的掌控之內,因此無論想要對它做什麼事,可以說都輕而易舉。換句話說,當部署於虛擬機器中的應用程式與服務,因維運而需要被監視與管理時,對於vSphere而言就如同探囊取物一樣輕鬆。
<本文作者:顧武雄,Microsoft MVP 2004-2016、MCITP與MCTS認證專家、台灣微軟Technet、TechDays、Webcast、MVA特約資深顧問講師、VMware vExpert 2016-217、IBM Unified Communications/Notes/Domino/Connections Certified。>