在台灣,雖然已有大型企業開始注意Big Data,但精誠資訊雲中心負責人蔣居裕認為,其實最難的部份是為什麼要做處理。「雖然我們說Big Data有三道修練題,首先是要知道Big Data能為你做甚麼,知道方向後才會去思考該怎麼做才能在一定時間內處理完成一定的量,最後也是最難的部分,就是要問Big Data什麼問題,不過這估計至少要二到三年時間才會遇到。」蔣居裕說。
主要是因為Big Data中包含許多分析的動作,所產生的商業智慧(Business Intelligence,BI)呈現方式,會跟傳統經過資料倉儲、資料庫系統所產生的BI不同,因為Big Data的維度太多,的確是可以事先定義好某一種呈現方式,但不代表Big Data只能呈現這些資料,所以必須仰賴專業資料分析師,去持續不斷地反覆詢問各種可能的問項,直到逐漸逼近某一方向或概念。
而現在的解決方案,很難提供一個執行步驟讓企業對照,在看到問題且尚未獲得答案前,可能就已經投入大量資源來執行。蔣居裕表示,其實有點類似幾年前BI工具發展的狀況,只是資料來源管道更多、型態也更複雜,分析維度較以往不同,所以會讓習慣處理關聯式資料庫的人不知所措。
|
▲精誠資訊雲中心負責人蔣居裕觀察所接觸的企業端現況,就算Big Data的技術平台與解決方案皆已備齊,多數客戶仍不知道該如何應用。因此在初期階段,會較偏重在顧問方面的協助。 |
因此Big Data的核心價值不會是減少IT支出,而是讓營運管理者獲得競爭優勢,或提高客戶滿意度。「但這絕對不僅是採用IT技術即可創造,」雖然精誠資訊提供Big Data解決方案─Etu,並有提供商業顧問服務,但蔣居裕不諱言,畢竟初期還無法深入各個不同產業,因此一開始會針對特定需求切入。
「一開始導入Big Data處理機制時,若尚未有充足的人力來執行資料分析與處理,可以先進行介接到既有的BI環境,讓非結構化的資料透過Etu協助處理,再導向現有的結構化環境,運用現有的資料處理機制來呈現。」蔣居裕建議。
而Etu團隊,是為了服務本土企業而成立,強調Big Data的價值是在商業方面,而非IT的價值,所以遇到客戶不清楚Big Data可帶來什麼商業利益,會先由顧問人員輔導協助找出利基點,並透過POC(Proof of Concept)來驗證。
Etu Appliance設計架構較特殊之處,蔣居裕認為是在作業系統以及大量部署機制。由於Etu是基於Linux所開發的專屬作業系統,既然已經能掌控硬體規格,即可深入微調系統核心資源以達到最佳化,且由於產品設計是專供建置Hadoop,便將作業系統所有不必要的功能全數移除,以避免影響整體運作效能。