Business Intelligence Hadoop for Windows Data Warehouse SQL Server Microsoft MapReduce key/value Velocity Big Data Volume Variety Oracle Hadoop Value NoSQL 巨量資料 海量資料 精誠資訊 OLTP 商業智慧 SQL ETL IBM Etu BI HP Re

微軟支援Big Data建置降低實作門檻

2012-09-25
常見Big Data實作架構中所採用的NoSQL,由於門檻較高,憑現有技術能力即可深入處理Big Data的人並不多。微軟營運暨行銷事業群產品行銷經理周慕義認為,微軟提供針對Big Data處理的方案之後,Windows平台開始提供支援建置,會讓整個架構變得較為簡單,更何況該怎麼撰寫商業智慧(Business Intelligence,BI)程式到檔案存放的地點去做分析處理,這才是關鍵。
周慕義舉例,即使是Wal-Mart這類國際性企業,為此成立一個團隊去做Facebook資料的Mapping,也只能做到關鍵字的篩選,因為再深入下去,每個資料來源處不同,資料結構格式就會更複雜,而難以再進一步挖掘,除非能了解所有來源資料的格式,且想要得到的資訊也很確定,不然採用關鍵字篩選是最快得以處理Big Data的模式。而這些經過處理過後的資料,最後可再彙整存入現有的資料庫中。

▲微軟營運暨行銷事業群產品行銷經理周慕義認為,建置Big Data的BI,切忌不切實際的資源投入。除了理論架構外,需慎選符合企業期待的解決方案,才能讓Big Data真正達到協助企業營運的目的。
關聯式資料庫與NoSQL兩者的功能性不同,就目前來看,是可相互輔助的模式。因為NoSQL並不具備BI功能,而Big Data的處理重點在於BI,最終還是要能夠呈現。周慕義舉例,從社群網站中篩選出關鍵字,只是想要了解電子商務網站提供的產品,與受歡迎程度或被討論程度之間的關聯性。像是篩選出某個關鍵字在Facebook網站中已經過百萬人討論,但實際上銷售成績卻未達到這個數字,或許可能需要改變商品組合才能讓銷貨量跟得上受關注程度。而這類需要多維度分析的部分,就得仰賴關聯式資料庫。

而目前實現NoSQL技術的方式大致類似,大都是透過Hadoop來實作,同樣的,微軟也不例外,這也是微軟較特別之處,把Hadoop架構在Windows平台之上(Hadoop for Windows),短時間內就可建置與部署完成。

而透過NoSQL架構分析搜尋的結果,則可轉存至關聯式資料庫,結合既有關聯式資料庫中的資料,像是可連結到進銷存系統等方式,最後利用BI工具做呈現,是最容易實現的部份,對企業營運也較有意義;周慕義說明,若關聯式資料庫是採用微軟SQL Server,最簡易的方式還可運用資料庫本身就具備的Reporting Service來產出不同的分析報表,讓Big Data不致因為BI工具太難上手,而失去原該有的成效。

「微軟在Big Data的優勢就是可提供完整性的方案,供企業在單一標準下實現。」周慕義說,所謂的標準,其實就是可建構在既有Windows的環境中,因此不致為了要做Big Data而需要再增添管理工具,同樣可用System Center來管理分散式的運算平台架構。


追蹤我們Featrue us

本站使用cookie及相關技術分析來改善使用者體驗。瞭解更多

我知道了!