資料增長的因素,很可能來自於不同面向,甚至是多種因素的組合,例如因為企業推出更多營運服務,造成資料增長,或是前端存取資料的使用者從數千人增加到上萬人,也讓存取的需求不斷激增,當各種條件因素同時促使資料增長時,企業對於儲存設備的要求不僅在於空間成長的彈性,同時還需要在處理效能、流量以及管理等方向強化。
EMC Isilon
EMC在Scale-Out NAS領域所推出的產品稱之為Isilon,原本是併購取得的產品線。Isilon作業系統名為OneFS,它結合了傳統儲存架構的三個層面,包括檔案系統、Volume管理以及資料保護。
其主要的工作是將這些資源,以跨節點的方式把所有的資源整合成單一的檔案系統,並且加快流程以及工作速度。在架構上,不同於IBM是將控制器與儲存櫃分開的作法,EMC Isilon反而是將所有的硬體元件整合在單一機櫃之中,其上再整合作業系統以及相關的資料保護與管理軟體。
所謂的硬體平台指的是EMC針對Scale-Out NAS所提供的產品,主要包含S、X以及NL三個系列家族,S系列是以高性能為主的解決方案,專門針對IOPS密集型的應用程式需求而設計,適用在系統模型的驗證與分析或是數位媒體的廣播與後製等工作上。X系列則是以高傳輸量為主要訴求,適用在Hadoop、醫療保健的PACS顯像、基因定序等環境中。NL家族主要是以經濟效益、提供高容量的儲存空間為訴求,適合運用在文件歸檔、災難復原以及備份等需求。
|
▲EMC Isilon架構示意圖。(資料來源:EMC) |
這些硬體平台均能橫向擴展,來達到效能與空間的提升,為了讓節點與節點之間的溝通更為順暢,EMC也提供了Infiniband作為專用網路。而除了硬體平台之外,Isilon另外兩個要角就是OneFS作業系統以及資料保護與管理軟體了。這兩者會互相配合協助Isilon落實自動分層、分散儲存、視覺化性能檢測與管理以及災難復原等資料保護工作。
資料保護與管理軟體層提供許多功能,包含可以自動分層儲存來優化性能與成本的SmartPools、跨儲存節點可讓企業落實負載平衡以及動態NFS故障切換的SmartConnect、可以將大型關鍵資料複製並且將其副本分發到多個分據點中的共享儲存系統內,並且實現災難復原的SyncIQ以及可以針對系統管理與性能檢測的InsightIQ等等,這些工具對於Isilon本身實現不中斷的儲存來說佔有重要的地位。
舉例來說,透過Smart Pools與OneFS的相互配合,企業便可以在同一個管理架構下管理不同類型的硬體平台,而這些資源都可以在一個統一命名空間、統一檔案系統下,自動地搬遷資料,達到分散儲存與系統的工作負載平衡,應用系統將不用理會資料的路徑如何變動,Isilon會提供一個虛擬的IP位置,在系統上執行的應用程式只需透過虛擬IP的路徑位置來存取資料,而OneFS就會自己去對應到資料的實際存放位置,來完成任務。
|
▲SmartPools可以自動分層儲存來優化性能與成本。(資料來源:EMC) |
支援HDFS/Hadoop
Isilon在功能面的另一項特色是提供了原生支援Hadoop/HDFS的能力。EMC台灣分公司業務拓展總監李百飛表示,雲端服務業者的成功典範也促使許多業者想要學習效法透過匯集大量資料,進而找出新興服務的作法,也因此,Hadoop與Mapreduce的運用也在企業端受到大量的討論。
「但是企業直接移植Hadoop到既有的IT環境中卻會面臨許多挑戰。」李百飛指出,一般的NAS設備因為沒有支援HDFS,因此必須做抽取、轉換與加載的動作(Extract, Transform, and Load,簡稱ETL)而導致同一份資料必須存放三次,假設企業原本的資料量為1PB,為了複製到HDFS的環境分析,不僅需要3PB的儲存容量,而且頻寬的要求也會劇增,而光是要複製取出這些大量資料,所付出的時間也相當可觀,往往無法達到即時分析的需求。
他提到,Isilon因為具備支援Hadoop/HDFS的能力,除了可以消除傳統開放原始碼Apache Hadoop在單點故障方面的缺陷之外,資料也僅僅只需複製一份,便能進行分析,相較之下更具成本效益。
採購成本及運轉成本
由於Scale-Out NAS的架構是以叢集的概念組成,因此在產品設計上往往與Scale-Up NAS有所不同。Scale-Up NAS是一次就決定可承載的最高上限,但是Scale-Out NAS卻是由小慢慢建構到大,因此,單一節點的容量與效能,往往會低於Scale-Up NAS。也因此,在同樣的容量空間下,Scale-Out NAS的初期建構成本往往會高於Scale-Up NAS。
「但是企業不應該只評估初期採購成本,事實上連同運轉成本也應該被估算進去,而運轉成本包括了資料中心的樓地板面積、冷卻空調費用、設備維護期限終止(End of Service Life,EOSL)以及因為中斷停機所帶來的營收損失與風險。」李百飛解釋,假設企業需要1PB的容量空間,而且完全統一採用2TB的SATA硬碟,同樣都決定採用EMC的解決方案,那麼A方案的選擇是採購一座具有兩個控制器、可承載到500顆硬碟的Scale-Up NAS,但需有多個檔案系統來構成1PB的容量。而B方案就是採購由14個控制節點串接起來,也是500顆硬碟的Scale-Out NAS方案,但只需要1個檔案系統就可構成1PB的空間。
|
▲一般的NAS設備因為沒有支援HDFS,因此必須做抽取、轉換與加載的動作(Extract, Transform, and Load,簡稱ETL)而導致同一份資料必須存放三次。(資料來源:EMC) |
這兩個方案最大的差別是在控制器的數量,同時也是初期採購成本最大的不同之處,「但是別忘了,Scale-Out NAS提供了階層式儲存,而這將使得企業在採購初期可以彈性地配置SSD、SAS以及SATA等儲存媒體來降低硬碟數量,而這也會在資料中心的坪效與冷卻空調中展現,另一方面,因為沒有設備維護期限終止(End of Service Life,EOSL)以及因為中斷停機所帶來的營收損失與風險,相對節省很多。」他提到,如果再把前文提到Hadoop/HDFS分析需求的條件加入,光是資料複製三份與複製一份的差距就足以讓Scale-Out NAS更勝一籌。
Dell流動資料架構
不同於IBM與EMC分別在現有的儲存產品線中獨立出Scale-Out NAS產品線,Dell的作法是結合旗下現有統一儲存(Unified Storage)設備,包括PowerVault、EqualLogic以及Compellent等三大產品線以及Dell在2010年收購Exanet所取得其叢集技術可擴展的檔案系統(Dell Scalable File System,DSFS),使其成為一個完整的Scale-Out NAS解決方案。
這其中,PowerVault、EqualLogic以及Compellent的角色主要是在後端提供各種不同規格的儲存設備,而依照設備效能與空間的不同,可擴充的節點數量、效能以及空間容量也會有所差異。目前在Dell的產品定位中,PowerVault算是最低階的選項,而最高階則為Compellent。