本篇文章將分為上下兩篇說明企業為何需要建置高可用性資料庫(HA),內容將會提到為何要防止SPOF(單點失敗)、Multipath觀念以及Fibre SAN的基礎觀念。上篇主要為Clutser的前置作業,而下篇則對Cluster 的設定及災難演練說明。
為了提供高穩定性及反應快速的服務,企業的IT部門開始著手建置叢集(Cluster)機制。一般來說,叢集又可劃分為High Availability(高可用性)、Load Balancing(負載平衡)、Grid Computing(網格運算)三種類型。
High Availability就是經常聽到的HA機制,如Ac tive/Standby、Ac tive/Ac tive。此類型的叢集目的通常在於維持服務,使得服務隨時處於高穩定的狀況中,例如企業營運環境中經常將資料庫伺服器導入此運作機制,將兩台資料庫伺服器設定為High Availability Cluster,只要其中一台伺服器因為不可抗拒或其他因素損壞時,另外一台伺服器即可在很短時間內將服務接手過來,使用者完全感覺不到曾發生過任何事情。
而Load Balancing類型的叢集目的,通常在於能夠同時服務為數眾多的服務請求,譬如在企業營運環境中AP伺服器常常扮演這樣的角色,也就是前端部署多台AP伺服器,用來同時服務為數眾多的客戶端所送出的大量請求,並將使用者的服務請求進行處理後,再寫入後端的資料庫伺服器內。
Grid Computing類型的叢集則較少使用在企業營運環境上,通常運用於科學研究上,例如將結合多台電腦的強大運算能力串連起來後同時運算以找出人類基因的密碼,或是對抗癌症的方法、分析外星人訊息等等。
談到了高可用性,就必須談到5個9。這指的就是服務運作高可用性99.999%。這樣的數字代表的是,當系統的高可用性達到99.999%的水準時,代表此系統在一年的運作時間中停止服務的時間不到6分鐘。
要達成這樣的高可用性目標,並不僅僅將伺服器建置叢集機制就可以達成,因為所謂的服務並不單單只是伺服器硬體及應用程式而已,還包括網路設備、儲存設備、電力供應等等,也就是整個服務顧客流程中會經過的企業節點設備都必須建置備援機制,亦即經常聽到的預防單點故障(Single Point Of Failure,SPOF)。
例如,公司為伺服器群建立叢集機制,但儲存設備卻沒有建置的情況下,一旦儲存設備故障損壞,仍然會造成企業服務停擺。又或者網路交換器只有建置一台的情況下,也會因為其損壞而造成網路連線中斷,進而影響到企業服務停擺。從下圖中可以看出預防單點故障最好的方法,就是硬體設備最好都建置兩套來達成互相備援的機制。
|
(圖片來源:維基百科) |
安裝Red Hat Enterprise Linux作業系統
接著,安裝Red Hat Enterprise Linux Advanced Platform 5.4(64bit),然後設定網路卡備援機制。
安裝Red Hat Enterprise Linux Advanced Platform 5.4(64bit)
若要建置Red Hat Enterprise Linux的叢集機制,必須購買Red Hat Enterprise Linux Advanced Platform(RHEL AP)授權版本,才能安裝相關的叢集套件,並建置叢集系統。
安裝過程中唯一要注意的是,必須正確輸入所購買的RHEL AP授權註冊序號,才能安裝Cluster相關套件。若未輸入RHEL AP的註冊序號而是選擇略過,則安裝過程中勾選安裝套件時將不會顯示Cluster相關套件,也就無法勾選及安裝。
設定網路卡備援機制
在網路卡方面,為了要避免單點故障(SPOF)的風險,例如網路卡損壞、網路線被扯開掉落、網路卡所連接的交換器損壞等等,因此在RHEL作業系統上將兩張實體網路卡透過內建的Bonding模組綁定成在邏輯上視為一塊網路卡的虛擬網路卡,並且將虛擬網路卡設定為Ac tive-Backup模式的網卡容錯(Fault Tolerance)機制,並且將實體網路線分別連接至不同的網路交換器上,如此一來,便可防止單點故障的情況發生。
此次實作中將兩片實體網路卡eth0、eth1設定為一片虛擬網卡bond0。先在eth0、eth1網卡設定檔中加上MASTER=bond0及SLAVE=yes內容,之後在虛擬網卡bond0中填入IP位址資訊。若設定主機為Node 1,則設定IP Address為「192.168.1.11」,而Node 2主機的IP Address設定為「192.168.1.12」。以下是Node 1主機設定資訊。
完成網路卡設定內容後,修改RHEL模組設定檔內容,設定載入虛擬網卡Bonding模組及指定網路卡容錯機制(mode=1),將兩片網路卡之間互相偵測存活時間設定為100毫秒(miimon=100),也就是當系統上Ac tive網卡發生問題超過100毫秒後仍無回應時,Backup網卡就馬上接手網路連線作業,因此不會感覺到有任何網路斷線的情況發生。
設定完成後,重新啟動網路卡服務,即可查看Bonding模組來確定剛才的變更設定是否生效。(更多精彩文章詳見網管人第59期﹚