capture analyze manage store 巨量資料 伺服器 模組化 捕捉 儲存 管理 分析

專屬伺服器鎖定巨量應用 強調空間與效能彈性

2013-03-04
近年來,不少企業開始在現行架構上部署、運用巨量資料軟體及其伴隨而來的功能,由於過往企業所採用的架構並非是專門針對巨量資料應用程式環境所設計,若是仰賴傳統的基礎架構,將可能愈趨複雜且缺乏效率。
受到行動裝置、App應用程式以及社群網路普及運用的推動,大量資料快速累積使得企業面臨許多新的挑戰,如何擷取(Capture)、儲存(Store)、管理(Manage)、分析(Analyze),以便讓這些新興且非結構化的資料轉化成營運新契機,是當今許多企業重視的關鍵。

近年來,不少企業開始在現行架構上部署、運用巨量資料軟體及其伴隨而來的功能,例如耳熟能詳的Hadoop、MapReduce、OpenStack等免費、可彈性擴展的開放原始碼技術,都是企業嘗試的目標。

改進架構提高效率

這些強調分散式運算的套件與模組,一旦被企業直接移植到企業內部現有的架構,設備面首當其衝的就是儲存力的挑戰。由於過往企業所採用的架構並非是專門針對巨量資料應用程式環境所設計,因此在面對數目龐大且不同數量的快速流通資料需要迅速儲存及存取,以及終端用戶的不同需求時,傳統的基礎架構設計,將可能顯得複雜且缺乏效率。

HP企業伺服器暨儲存網路設備事業群產品經理郭裕昇舉例說明,「傳統在儲存設備上只要存放ITB的空間,轉換成Hadoop環境之後,所需的空間就會變成三倍,而且直接在伺服器後端接上儲存設備的作法也不保險,Hadoop之所以會備份三次正是為了預防資料的毀損與突發的事故,一旦這三份資料同時存放在同一台儲存設備上時,萬一這台儲存設備出現故障,企業的資料也付之一炬。而且為了因應三倍資料量的需求,企業得支付高昂的採購成本才能因應。」

針對應用優化硬體

也因此,針對企業轉換巨量資料應用程式環境需求,目前已有伺服器業者推出專門的伺服器機種,這類伺服器多半採以模組化的架構,不管是在運算力以及儲存容量上,都可以讓企業彈性地擴充與配置,以協助企業優化特定應用程式之基礎架構,避免為支援基礎架構而須整合不同硬體,徒增管理負擔。

不過,Dell台灣分公司伺服器解決方案經理李俊邦也提醒,像Hadoop這類巨量資料應用程式在設計之初便考量了硬體架構毀損的可能性,因此作法上除了採用叢集架構,Scale-out運算能力且平衡負載之外,也善用了伺服器本體的儲存空間,採行多次備份以確保應用程式的順暢進行。當然,依照企業運用的情況不同,對於儲存空間的要求也不盡相同,例如企業部署Hadoop是作為一個廉價且超大規模的檔案平台,還是用於SQL這類大量資料的環境,都可能影響巨量資料伺服器的選擇,因此在確定運用巨量資料軟體的同時,事前完善的需求調查也是不可缺少的工作。

開發專用伺服器

根據瞭解,在伺服器業者之中,HP與Dell已分別推出專為巨量資料環境而設計的伺服器機種。HP 是以ProLiant SL4500伺服器系列,提供企業所需的基礎架構與優化組件。Dell則是藉由PowerEdge C8000來實踐最佳化的空間與效能。

HP ProLiant SL4500

HP ProLiant SL4500系列是以Gen8伺服器為基礎,總高4.3U的空間中,提供三種組態選項。方案一是一台伺服器搭配60顆3.5吋硬碟,若以3TB的SATA硬碟來計算,可達180TB的儲存空間。這款方案主要訴求大容量空間,可以作為Object Storage(物件儲存)的應用。方案二則是二台伺服器,每台伺服器可以掛載25顆3.5吋硬碟,可適用於巨量資料的分析需求,方案三是三台伺服器,每一台伺服器可以掛載15顆3.5吋的硬碟,總硬碟數為45顆,適合平行運算處理。


▲HP ProLiant SL4500系列提供三種組態選項。(資料來源:HP)

郭裕昇指出,HP ProLiant SL4500系列伺服器是HP專為巨量資料環境所打造的解決方案,這款架構具有高效率設計,能減少高達50%的空間、61%的能源消耗及31%成本,同時減少63%的電線使用,目前也同時支援多家Apache Hadoop供應商包括Cloudera和Hortonworks,以及額外軟體包括OpenStack雲端軟體與MongoDB。

「企業現有伺服器往往無法因應巨量資料增長迅速的儲存和伺服器數量,以至於被迫添置額外的昂貴資料中心空間。但是HP ProLiant SL4500伺服器系列可以有效協助企業解決這個問題,在標準的42U機櫃中,最高可以堆疊到九台,不管在節省成本、提升效能與效率上均有明顯助益。」他說。

Dell PowerEdge C8000

針對巨量資料需求,Dell主要是以PowerEdge C8000機箱中C8220X以及C8000XD混合搭配來滿足企業需求。

C8220X是一款寬版雙插槽的運算模組(sled),搭配Intel處理器、16個DIMM插槽以及最高12台2.5吋或4台3.5吋SAS/SATA/SSD。而C8000XD則是一款寬版專門提供儲存的硬碟櫃模組,於單一儲存節點提供最高12台2.5吋或3.5吋SAS/SATA或24台2.5吋SSD。


▲PowerEdge C8000可以針對不同工作負載環境進行配置,企業可以針對巨量資料環境,自由搭配C8220X與C8000XD,以滿足運算力與儲存力的需求。(資料來源:Dell)

李俊邦說明,在一個4U高度的C8000的機箱中,C8220X主要用來提供運算能力,而C8000XD則是提供儲存空間。因此,在C8000XD內並沒有提供處理器與記憶體的配置,而這兩者可以互相串接,例如二台C8220X搭配二台C8000XD,如果企業對於空間需求較高,那麼就可以彈性擴充C8000XD。反之, 若對運算能力需求較大,那麼就可以部署較多台的C8220X。在一個4U高度機櫃中,最多可接四台C8220X或是四台C8000XD。

「當然,C8000也可以多台堆疊。」他強調,Dell在設計上使用了具備優異效率及彈性的備援共用基礎設施機箱,以協助減輕空間與預算問題,而不會影響效能或限制擴充能力。因此,在C8000機箱共用風扇及電源,協助控制能源成本,盡可能減少停機時間。


追蹤我們Featrue us

本站使用cookie及相關技術分析來改善使用者體驗。瞭解更多

我知道了!