資料的解讀需要擁有各個Domain專長的人聚集在一起,才能更快速作為決策,也因而有了IT人員可以著力的地方。在巨量資料時代,IT人員的前途無可限量。但是前提是,IT人員必須改變心態,同時強化Domain Knowledge。
隨著雲端運算與巨量資料發展,資料的價值也跟著水漲船高。正由於龐大的資料量可能潛藏無限商機,企業無不希望能夠將這些看似無用的資訊轉化成為可以作為營運決策的有用訊息,也因此,企業對於資料分析人才需求若渴。這也使得資料科學家(Data Scientist)的工作職缺急速攀升。SAS便曾指出,為了能夠快速從龐大且複雜的資料中挖掘出有效的訊息並預測未來趨勢,做出即時的反應與決策,估計全球企業至少需要170萬名資料科學家來協助達成這項使命。
|
▲資策會分別針對資料處理與分析以及商業分析與應用推出多套課程。(圖片來源:資策會官網) |
中華資料採礦協會榮譽理事長謝邦昌也認為,未來企業對資料科學家的人力需求將愈來愈高,「許多人以為只有大型企業才需要資料分析演算,但事實不然,即使是中小企業,同樣存在解析Data的需求。目前在兩岸企業對資料科學家興趣都相當高昂,預估台灣需求的人力,大約會是在一萬名以上。」
|
▲資料科學研究院現正推出一系列培訓課程。(圖片來源:微軟官網) |
以團隊合作解讀資料
資料科學家所揹負的使命是在解析龐大且複雜資料,從中抽絲剝繭,再化為可提升營運效率的決策,也因此,資料的解讀往往並非只靠一位資料科學家,而是群體通力合作的結果。事實上,多位業界專家也認為,若是一個人要扛下整個「資料科學家」的工作,其須具備的能力,無論是統計、程式設計等基礎學理,一些應用工具能力,更重要的是能夠宏觀未來趨勢及決策判斷,著實不易。往往也會建議採分工合作的團隊制來達到成效。
淘寶雙11購物節便是一個典型的範例。雙11購物節的銷售額從去年的191億人民幣成長到今年350億人民幣,年年創下驚人的銷售成績,其中贏的關鍵,就是運用巨量資料分析。淘寶長期追蹤未結婚、18歲以上具有消費力的族群而來,這樣的族群在中國大陸就有2.5億人口。為了達成這樣的效益,淘寶動用了2000300名資料科學家,透過對複雜的資料解析,進而找出關聯、制定決策。
正因為資料的解讀需要擁有各個Domain專長的人聚集在一起,才能更快速作為決策,也因而有了IT人員可以著力的地方。謝邦昌直指,在巨量資料時代,IT人員的前途更是無可限量。「但前提是,IT人員必須改變心態,同時強化Domain Knowledge。」
靠攏Data 更上一層樓
雲端運算與巨量資料為IT帶來變革,同樣也對IT人員的工作內容帶來質變。傳統只單純維護軟體或硬體的工作內容,未來將受到雲端而產生影響,當所有資源都可以從雲端取得時,維護軟體或硬體的工作自然有限。
|
▲中華資料採礦協會榮譽理事長謝邦昌認為,未來企業對資料科學家的人力需求將愈來愈高。 |
謝邦昌認為,「現在這個時機是IT的天下,但是IT人員經常存在一個盲點,認為傳統只要管好軟體、硬體的更新與維護就可以,但在巨量資料時代,重要的是Data,將來的世界是『玩』Data的時代,不要存著統計分析很頭痛的想法,市場上已經有愈來愈多元的工具可以讓演算分析更方便。」他提到,另一方面,IT人員還要加強Domain Knowledge,不管是醫療、保險還是其他領域,只要能夠在Domain加強,未來都是炙手可熱的人才。
謝邦昌強調,結合人才與技術才能找出完美的解決方案,由於各個產業依照Domain Knowledge的不同,最終需要的解決方案也不同,「並不是採購一套軟體就足以解決巨量資料的問題,Domain Knowledge如何結合軟體、硬體與平台才是重要關鍵,如此才能找到最合宜的解決方案,進而做出對的決策。」
多方課程培訓奠基
為了協助更多人員成為資料科學家,目前已經有不少業者或是教育訓練機構,提供相關培訓課程。例如資策會針對資料處理與分析就推出Hadoop的實務與進階班、企業資料倉儲(DW)導入實務班以及整合資料倉儲於Big Data之分析與應用;而商業分析與應用方面,先以R軟體的教授為主,包括R軟體實作、R軟體與資料探勘、R軟體與資料視覺化,接著是導入商業智慧(BI)提升企業營運績效、CBAP國際商業分析師認證以及結合Big Data於創新行銷等等。
而SAS則開啟校園資料科學家育才計劃,以產學合作方式,加強大專學生團隊合作、資料採礦專業技能及未來實務應用的能力。微軟的資料科學研究院,則包括資料科學基礎、企業資訊整合-資料模型與處理流程最佳實踐課程、資料探索與關鍵變數發掘。實際應用介紹包括SQL Server地理資訊分析、預測型資料探索技術、描述型資料分析技術、Analysis Service從購物籃至儀表板,而後分領域案例說明,像是銀行業、電信業與零售業的數據挖掘應用以及數據挖掘實務案例整合操作。
謝邦昌表示,微軟會與中華資料採礦協會攜手合作,結合產業和學界的師資與資源,共同成立微軟資料科學研究院,目的就是培育跨領域及跨專業的資料科學家,也因此,整體課程會先從方法論開始,什麼是分析、預測,什麼又叫導入,進而再提供實作案例分享。
他同時也提到,雖然企業主對資料科學家聘雇的意願很高,但因為沒有任何憑斷的依據,經常也害怕受騙,為此,微軟資料科學研究院未來也會推出認證,先從兩岸認證做起,再推往全世界,成為一個國際認證。