對未來的數位化企業而言,隨時蒐集資料、運行資料分析可說是基本必備的能力,除了藉此輔助提升日常工作的執行效率,更吸引企業的是可藉此持續創新商業模式。
成立至今已超過40年的SAS,來台灣設立分公司也已屆滿30年,可說是統計與巨量資料分析領域重要的工具。隨著傳統應用逐步轉型為微服務架構並運行在容器環境,SAS於2017年發布了Viya,讓資料科學家、業務分析師、應用開發者得以藉由統一操作介面執行各自的任務,日前更進一步增添了自動化機器學習建模、SAS Open Model Manager,以滿足現代工作者應用所需。
雲端原生發展SAS Viya平台
針對資料分析科技發展趨勢,SAS台灣業務顧問部副總經理陳新銓引述Gartner調查報告提及,預計在2020年之後,40%以上的資料科學任務會被自動化,進而產生價值;2022年後,50%以上的營運系統會整合即時情境資料,以改善決策,也就是說,過去資料分析的建模方式,較偏向於批次執行,現在的趨勢是增添互動性,必須即時反應前端的變化,例如,消費者購物以信用卡支付,有時會考量可能出現額度不足的問題,因此選用另一張信用卡支付。如果銀行可以即時發現信用額度剩下不到一成的消費者,並且主動進行調整,即可留住該名用戶。
至於各產業相當仰賴的人工智慧,現階段應用模式較偏重採用開源陣營發展的技術來實踐,發展到2022年,有75%會採用商用平台。陳新銓實際接觸企業發現,儘管現階段的應用模式主要是採用開源陣營技術,未來勢必會回歸到商業版本,主要因素在於解決管理成本過高的問題。根據國際調查報告,一個資料科學家待在一家公司的平均時間是11個月,畢竟全球人才市場需求相當大,不到一年時間就可能會被挖角,必須累積這些人才的知識,以及承接控管工作,才可避免影響整體維運。「此時若採用的是SAS商業版軟體,萬一遇到承辦人員異動,即便客戶端內部IT人員無力承接,還可交由SAS原廠協助;若是開源陣營的工具,只能在社群尋找解決方法,屆時對企業而言風險相對較大。」
人工智慧演算分析的落實,勢必會涉及到容器化議題。陳新銓指出,根據IDC於2018年發布的統計數據,進階分析或稱為人工智慧市場,平均年複合增長率為9.4%,其中最大的動能來自公有雲服務,成長29.6%,由此可發現,隨著新型態數位化應用需求,對於公有雲的態度已逐漸開放,雲端平台將成為新世代的應用運行模式,這也是近兩年本土企業開始部署容器環境的主因。
資料分析往往需要多種技術所建構的環境,IT人員的維運極為複雜。例如SAS便提供許多實作框架、演算法,讓資料科學家選用,因此資料分析工具轉而運行在容器環境,將有助於IT人員降低整體建置、維護的負擔。
雲端原生發展的SAS Viya平台,提供整體的微服務架構,把原本軟體工具的功能項目改以服務方式提供,例如登入、驗證、分析引擎等,皆為獨立的微服務,可依據企業應用需求,透過RESTful API整合運行。陳新銓強調,「現代化的軟體工具並非僅停留在前幾年提倡的Cloud Ready,必須基於虛擬主機封裝成為Image檔案,而是已經邁向雲端原生。SAS的策略是兩種都支援,畢竟現階段的企業環境多數為並行,隨著汰換年限期滿逐漸轉移。」
基於自動化機器學習建模降低門檻
各行各業皆面臨數位轉型,但並非應用系統演進到微服務架構、部署到雲端平台即可稱為數位化,更關鍵的是整體組織皆得以基於資料分析數據來執行任務,並且隨時蒐集資料、即時分析,獲得最精準的解答。SAS可協助建構一個平台,讓不同技能的開發者藉此執行資料建模、大數據分析,即便非SAS程式語法仍舊可以呼叫執行,達成輔助決策的目的。
資料分析模型建置完成後,必須連結到前端的業務決策,才可發揮價值,此時即可透過API呼叫整合運行。例如客戶產生刷卡訊息進入到智慧中台,可自主判斷信用額度的調整範圍,並且即時通知前端系統,以免影響客戶刷卡體驗。
IT管理者思考的方向,大多是依據未來分析需求來決定架構,陳新銓則認為,現階段更重要的是提供便利建模方法,降低資料分析門檻,甚至是達到平民化,讓第一線工作者都可以建置模型。「當然,這就必須要有一個平台來支援,讓人工智慧建模、分析,甚至是部署,都可透過自動化方式執行,此即為SAS發展自動化機器學習建模的理念,如此一來才可更有效率地實作各式人工智慧應用。」
對於自動化建模的實踐,SAS是基於ModelOps方法論實作模型生命週期,建立可自動被執行的循環機制,包含模型的部署、執行、重新訓練等操作。陳新銓進一步說明,採用ModelOps建構資料模型與執行分析任務,涵蓋模型開發、模型部署、業務營運,從資料準備與處理、建模、部署、上線運行、監控業務營運效益的回饋、再重新訓練,這是一個持續循環改善的過程,旨在協助組織進行決策並且產生商業價值。
此外,為了確保建構完成的資料模型正確地對應到營運業務決策,交付給IT部門實際上線的過程中可能必須重新撰寫程式、驗證資料。SAS可發揮之處,即是讓ModelOps得以無縫接軌,在模型開發完成後,不同業務屬性採用的模型可做出有效決策,讓業務行動產生效益。最終結果再回饋到該模型,藉此重新訓練。
SAS本業就是資料分析,自然擅長建模。陳新銓說明,模型生命週期並非新的框架,只是在人工智慧應用尚未起飛之前,多數企業感受不深,直到近幾年才開始受重視,體認到模型生命週期管理的重要性。管理的目的也並非只有程式碼版本控管,更重要的是有效度衰退之前,必須執行重新檢視與微調的時間點。SAS提出的是運用自動化機制來實作,來達到ModelOps。
當企業導入部署完成解決方案後,下一步則是由台灣SAS顧問協助,依照應用需求給予建議執行的步驟。「針對欠缺資料分析專家的企業,需要的是立即可用模型,例如購買行為、詐欺偵測等,SAS亦提供RaaS(Results as a Service)模式,由SAS顧問團隊採用自家軟體幫企業完成運算與分析結果,同時兼顧成本與經濟效益。」