資料增長的因素,很可能來自於不同面向,甚至是多種因素的組合,例如因為企業推出更多營運服務,造成資料增長,或是前端存取資料的使用者從數千人增加到上萬人,也讓存取的需求不斷激增,當各種條件因素同時促使資料增長時,企業對於儲存設備的要求不僅在於空間成長的彈性,同時還需要在處理效能、流量以及管理等方向強化。
資料急劇增長,而且多數都是以檔案形式存在的非結構化資料,如何針對這些資料進行妥善的儲存與保護,也就成為企業必須面對與改善的問題。若單純只以存放資料的需求角度來看,任何一款儲存設備都可能是特定環境下適合存放資料的最佳媒介,但選錯解決方案也可能為企業帶來更複雜的挑戰,因此適性適宜往往也是企業在採購之前的必要考量。
尤其企業內部的資料進入到巨量等級之後,所帶來的挑戰更甚以往,「在Scale-Up NAS環境下,最常遇見的瓶頸便是來自於空間與效能,但為了提升這兩個層面而被迫中斷營運,卻也是企業最不樂見的結果。」NetApp系統技術暨專業服務事業部技術顧問歐力彰表示,Scale-Up NAS已經是企業端常見的儲存設備,而且也有低、中、高階的產品選項,儘管如此,在資料升級的過程中仍需要中斷停機,但隨著資料增長以及雲端環境的需求,企業需要的是Nonstop(不停機)的解決方案,以創造更大的好處,並且提升競爭力。
Scale-Out NAS之所以能夠勝任,正是由於設備本身不僅能在容量提供彈性擴充,更能同步擴展系統效能與可用性,面對資料增長以及效能需求,甚至可做到幾近於零中斷的設備升級,對許多正在面臨巨量資料環境的企業而言,反而更能符合現今與未來增長的需求。而這種以叢集節點形態的擴充方式,只要增加控制器節點與磁碟裝置數量,便可以橫向擴充效能與容量,讓儲存系統更加靈活,目前相關的解決方案已經有多家業者推出,而且其架構、技術以及功能展現也各有異同。
IBM SONAS
IBM在Scale-Out NAS領域所推出的產品稱之為SONAS(意即Scale Out Network Attached Storage)。這項產品是以IBM自身研發GPFS(General Parallel File System)檔案系統為核心,在單一檔案系統中可支援數十億個檔案,並且可支援多達256個檔案系統。
從硬體架構來看,SONAS具有三種不同的元件,包括管理節點(Management Node)、介面節點(Interface Node)以及儲存節點(Storage Node),不管介面節點是由幾台設備所串接,都會優先提供兩台設備作為管理節點之用。而在儲存節點後端連接的磁碟陣列又可稱為Storage Pod,目前可與多款IBM的儲存設備進行介接,例如IBM Storwize V7000磁碟系統。而前端使用者與SONAS之間以IP網路來連繫,為了強化節點與節點之間的溝通,IBM也在Interface Node與Storage Node之間加入了10Gb乙太網路或Infiniband的專用網路。
|
▲SONAS系統架構示意圖。(資料來源:IBM) |
顧名思義,管理節點主司負責中央管控與設定,介面節點則包含了SONAS所有功能,包括General Parallel File System(GPFS)、Active Cloud Engine以及Global Namespace等等,介面節點採用active-active的叢集機制.當其中一個節點出現問題,任何一個節點都可以進行接手,而不用特別指派。儲存節點則可管理Metadata,搭配介面節點以達到更高的共享存取性能、巨量的儲存空間以及線性的擴展能力。
至於在採購的彈性上,介面節點與儲存節點可各別採購,亦即若想增加運算能力,那麼可以獨立增添介面節點即可,若想增加儲存空間,則可以擴充Storage Pod,而無須一次同時採購兩者。唯需提醒的是,基於不中斷運作的需求,在初期部署時,最低限度至少要購置兩台管理節點、介面節點以及儲存節點,以確保有足夠的冗餘機制可以因應。
技術與功能
為了提供更靈活以及節省成本的解決方案,SONAS採用的是分散式儲存作法,亦即SONAS會以最快速且最符合成本效益的方式將檔案、影像切割成小單位的檔案分散儲存在各地的磁碟中,當介面節點愈多,也就表示一個I/O請求有愈多的幫手可以更快速地找到資料。
SONAS具有幾項獨特的功能,包括Global Namespace(全域命名空間)、Active Cloud Engine以及Metadata的設計。Global Namespace在前文已有介紹,這項技術可以讓所有使用者都能以單一且具有邏輯特性的路徑來存取檔案,而不用在意檔案文件的實體儲存位置,如此一來,即使資料搬遷,使用者也不會受到影響。
|
▲透過Active Cloud Engine可以將分散在各地的檔案文件被集中、共享且有效地管理。(資料來源:IBM) |
而Active Cloud Engine則可以將各個分據點的文件檔案也納入管理,並且還能善用分據點間的儲存空間,進行統一的管理配置。至於Metadata則是記錄資料的屬性、政策的設定、由誰可以存取等訊息,這些資訊將存放在Storage Pod中,當使用者提出存取請求時,介面節點會與儲存節點溝通取得Metadata的訊息再回應。
台灣IBM系統暨科技事業處資深資訊工程師林利民提到,企業已經進入全球化營運,跨國普設據點已經司空見慣,如何將各個分據點的文件檔案與儲存空間一併管控也至關重要。「Active Cloud Engine是SONAS針對雲端環境提供的文件管理功能,除了可以跨不同的地域與分據點、遠端整合文件就像在本地端一樣之外,各分據點之間的資料還可以根據需求與政策移動。」
他舉例,假設在台北與高雄兩地的某百貨公司均採用了SONAS解決方案,且決定將兩地的檔案與儲存空間統一納管,而這兩地同時都有一家品牌專櫃,裡面記錄了專櫃每天的銷售業績與明細,當銷售主管要調閱該品牌專櫃的資料時,SONAS如何確認是該調閱台北的專櫃資料還是高雄的專櫃資料?一種作法是直接指名台北的資料,另一種則是加入屬性設定,例如台北與高雄的資料一併提供,當然前提是使用者必須有存取許可的權限。
另一項在SONAS也相當重要的功能則是由General Parallel File System(GPFS)檔案系統所提供,主要在確保沒有單點故障的疑慮。當使用者提出一個資料存取請求時,後端的介面節點就會有對應的IP位置,當介面節點愈多,可對應的IP位置也愈多,但不管對應的IP位置有幾個,使用者將只會看到同一個位置。如此一來,不管使用者是從那一個介面節點存取,當這個介面節點出現問題時,其他的節點就
會接手存取的要求,直接回應給使用者而不會受影響。