全球知名的資料分析平台、應用和服務供應商Teradata天睿公司發布Teradata Portfolio for Hadoop 2解決方案,助力降低Hadoop部署管理的風險、成本及複雜度。借助Teradata全方位產品組合,企業在應用Apache Hadoop儲存的資料時,將能夠輕鬆應對多重技術與業務挑戰。Teradata的新解決方案集增值軟體、專用平台、諮詢服務、培訓及客戶支援於一體,協助客戶充分實現「資料湖」的商業價值。
目前,企業從現有資料來源及大資料中獲得業務資訊時遭遇不同困局:缺乏完善的資料策略;各種技術孤島並存;專業人才缺乏而人力成本居高不下;或大資料及分析專業技能不足。沒有可靠的顧問帶領,企業不得不付出高成本,面臨高風險,且虛耗時間和精力,才能從大資料中獲得業務洞察。
Teradata天睿公司實驗室總裁Scott Gnau表示:「Teradata Portfolio for Hadoop 2利用資料湖的『全部存儲法』(Store-everything approach),為企業提供創造商業價值的捷徑。Teradata去除了技術部署的複雜度與風險,助力企業專注於高價值業務活動。」
Teradata Portfolio for Hadoop是一套靈活的綜合解決方案,包括四大組件:
Teradata Open Distribution for Hadoop(TDH)2.1—TDH 2.1是基於Hortonworks Data Platform 2.1的增強型軟體平台,提供一整套Teradata核心軟體元件,確保Hadoop技術實現企業就緒(Enterprise-ready),其增強版特性如下:
‧高可用性和災難恢復
‧高性能和高可擴展性
‧資料轉換和整合
‧資料安全性
‧安裝和部署
‧監控與可管理性
這些組件可提升Hadoop可靠性、可管理性、連線性及易用性,大幅優化Hadoop操作,並幫助企業快速獲得商業價值。TDH優化了Hortonworks推出的Apache Hadoop 2的核心組件,包括下一代Hadoop資料處理架構Apache Hadoop YARN。
Teradata Appliance for Hadoop—增強版Teradata Appliance for Hadoop配備Teradata Open Distribution for Hadoop,是業界最早在HDP 2.1上運行的平台。Teradata Appliance for Hadoop平台旨在隨時交付並優化企業級的資料儲存和管理。該平台的資料存儲能力從144TB擴展到超過98PB,以滿足客戶的增長需求。借助新一代Intel技術實現高性能,並結合InfiniBand 光纖硬體以及具有擴展和故障恢復能力的Teradata BYNETV5軟體。
Teradata諮詢服務—增強的Teradata諮詢服務為企業提供加強安全性和隱私保護的專業能力,還提供從各種資料來源中整合資料的最有效方法。Teradata諮詢服務通過提供「識別和建議」、「架構和實施」,協助客戶全方位處理大資料。此外,它們還為正在運行的業務提供管理服務,以及針對部署和管理的嚴格、詳細培訓。
Teradata客戶服務—Teradata在業內獨樹一幟,將Teradata客戶服務不斷擴展至支援和維護Hadoop環境。Teradata借助Teradata統一資料架構(Teradata Unified Data Architecture),協助使用者瞭解大資料分析的眾多優點。Teradata致力於開發和支援大規模生產環境部署,支援Hortonworks,並為客戶提供針對所有硬體和軟體系統的單一連絡人。Teradata客戶服務部門還支援Hadoop在通用伺服器群集上的部署,並支援採用純軟體形式運行Hortonworks 資料平台。
Hortonworks首席執行官Rob Bearden表示:「隨著新資料類型爆炸性出現,企業開始用Apache Hadoop創建分析應用,從之前無法獲取的資料中提取可行的洞察力。通過支援HDP 2.1,Teradata將引領下一代企業級架構,能夠在單一平台內整合包括YARN和Tez在內的Apache Hadoop最新創新技術,並高效管理多結構化資料。」
美國某一大型多元保險公司想要改變其商業模式,便開始分析所有在其公司投保司機的駕駛行為。這樣,這家保險公司就能夠確定對於高危司機的合理保險費。借助Teradata Portfolio for Hadoop解決方案,該保險公司通過監測客戶駕駛行為的感測器,獲取多結構化的遠端資料。通過Apache Hadoop資料湖能夠即時提取海量資料,由於底層Hadoop分散式檔案系統具有足夠的靈活性,來自不同資料來源的資料能夠被高速提取出來。隨後,這些資料將被提煉、轉換為標準格式,再與GPS資料結合,最後分段建立行程記錄和風險度。這一分析過程要經過多級運算和匯總,由MapReduce、Hive查詢和使用者自訂函數配合完成。由於Hadoop平台的可擴展性,使用者不需要捨棄對未來資訊查詢分析有用的資料。
各個行業的企業都能從Teradata技術中受益。Cardinal Health資訊管理和分析副總裁Neeraj Kumar表示:「Cardinal Health將致力於通過分析創新不斷提高病人護理水準。Teradata幫助我們通過分析獲取洞察力,因此,我們改善了供應鏈,提高了病人護理水準,並實現了顯著的商業價值。」
業內一些創新軟體供應商提供更多生產力和自動化工具,以支援Hadoop資料湖環境下的資料集成、管理和安全。Teradata將繼續拓展與他們的合作夥伴關係:
‧Informatica的資料整合解決方案使用靈活的資料管理架構和敏捷開發方法,並運用現有的技術優化資料整合過程,幫助提高開發人員生產力。特別是,Informatica PowerCenter大資料版本讓開發者可以通過Informatica的旗艦產品PowerCenter充分發揮自身優勢,將開發人員生產率提高5倍。
‧Protegrity的大資料保護器(Big Data Protector)提供全方位的資料保護,確保用戶從隱私到PCI的檔和敏感資訊的欄位級資料安全。
‧Revelytix Loom提供動態資料集管理,為所有的轉型自動進行資料沿襲(data lineage)計算。Revelytix Loom還提供Activescan實體解析,自動進行監測、解析並描述任何HDFS檔。
Teradata Portfolio for Hadoop 2解決方案將於2014年第三季度正式出貨,並獲得合作夥伴支持。