BigData 巨量資料 雲端服務 EMC

EMC橫向擴充式NAS 打通Hadoop與關鍵系統

2012-07-27
企業希望透過巨量資料取得有用的資訊、擬定新興策略,因而讓受到各雲端服務業者青睞的Hadoop也漸漸獲得企業重視。但是,企業直接移植Hadoop到既有的IT環境中卻會面臨許多挑戰,包括缺乏彈性的儲存基礎架構,以及單點故障的高風險架構。
面對多元且日益劇增的資料,企業不只需要有效的儲存方案,在資料中找出關鍵策略,以提高競爭優勢,也成為企業提升營運績效的必要手段。

EMC業務拓展總監李百飛指出,巨量資料(Big Data)所探討的議題正是如何從龐大的資料中找出有用的訊息加以分析,進而挖掘出寶貴的資訊,以降低企業風險、促進營收並且提高競爭力。他舉例,一般銀行在放貸款之前,會調查貸款者的收入、就業表現以及信用狀況以決定是否貸款給對方,但透過這些作法所收集到的資訊仍可能讓企業曝露於高風險之中,透過巨量資料的收集,銀行可以匯集到當地房價的趨勢、人口增長的情況、當地的就業機會、專業人員在社群媒體中所發布的看法等等,來綜合評估放貸風險,當資料收集得越多元且詳細,銀行就越能降低貸款風險,減少呆帳損失的機率。


▲EMC在Isilon橫向擴充NAS中加上原生的HDFS支援能力,以便讓Hadoop使用者獲得內建的管道,存取共用儲存基礎架構。

顯然地,企業希望透過巨量資料取得有用的資訊、擬定新興策略,然而想在短時間內挖掘出有用資訊,企業需要最佳的運算平台,這其中,受到各雲端服務業者青睞的Hadoop也漸漸受到企業重視。但是,企業直接移植Hadoop到既有的IT環境中卻會面臨許多挑戰,首先Hadoop並非依賴專屬的儲存基礎架構,大部分都是以直接連接儲存(Direct-Attached Storage,DAS )的架構在運行,其次在整個架構中只有一台NameNode,萬一發生單點故障,整個架構也跟著不能運行。

「除此之外,Hadoop並沒有快照、複製、備份等保護措施,雖然每一份資料都會重複寫入三次,以預防臨時的故障而影響到存取,但從儲存的角度來看,這種作法卻相當沒有效率。」李百飛指出,試想,原本就龐大的資料,再覆寫三次的資料量是多麼可觀,而且為了保護存放在Hadoop上的資料,還必須考量備份問題,這些種種的限制將成為企業導入Hadoop的挑戰。

為了協助企業消除Hadoop與關鍵任務的企業IT分析系統之間的隔閡,EMC在Isilon橫向擴充NAS中加上原生的HDFS支援能力,以便讓Hadoop使用者獲得內建的管道,存取共用儲存基礎架構。他提到,HDFS是Hadoop特有的檔案格式,Isilon整合HDFS之後,便能消除傳統開放原始碼Apache Hadoop在單一故障點方面的缺陷,而且企業可以善用Isilon為Hadoop巨量資料進行快照 、複製與備份,以便進行端對端的資料保護機制。


追蹤我們Featrue us

本站使用cookie及相關技術分析來改善使用者體驗。瞭解更多

我知道了!