SAS ModelOps SAS Viya VDMML DSML AutoML

雲端原生架構逐步擴展 落實ModelOps分析生命週期管理

AutoML快速部署維運 推動資料科學平民化

2021-06-24
為了協助企業讓機器學習演算模型加速部署到營運環境,SAS參考DevOps方法論提出ModelOps,讓分析生命週期的驗證、測試、部署階段得以提升效率,並且持續監控與重新訓練確保達到效益。基於雲端原生架構的SAS Viya平台,設計SAS Visual Data Mining and Machine Learning(VDMML),讓資料科學家建立AutoML,來管理分析知識資產,進而部署到SAS智慧決策(SAS Intelligent Decisioning)輔助前端營運系統。

 

其中亦包含業務規則,例如授信、理賠等,制式規則較明確的業務項目,搭配預測模型即可提供建議決策。

SAS(賽仕電腦)台灣業務顧問副總經理陳新銓指出,人工智慧(AI)主要用意是透過學習與自動化訓練系統模擬人類工作的科學,SAS提供企業部署AI應用,以自動化流程管理已開發的機器學習模型,不論是Python、R或SAS所開發的機器學習模型皆能夠在SAS Viya平台上執行部署與維運管理。

肇因分析數據背後意涵

過去企業營運分析主要借助是商業智慧(BI)分析,製作數位儀表板,輔助高階管理者進行決策。SAS除了發展商業智慧,較特別的是擅長統計分析技術,在AI尚未普及之前,SAS研發的商用軟體就已經納入統計技術,實際上本就是AI的關鍵要素。

陳新銓觀察,商業分析的需求始終不變,只是過去的輔助工具大多為自行撰寫程式碼,欠缺易於上手的操作介面可供不熟悉統計分析的技術人員運用,使得資料分析門檻相當高,無法達到普及的程度。隨著軟體技術逐漸精進,硬體運算效率倍增,幾年前開始採用Apache Hadoop或Spark建構大數據平台,搭配高速運算的主機,軟體也發展出可彈性使用的操作模式,促使企業對於資料分析的應用需求增長。

舉例來說,SAS在全球擴展據點,主要客群包括為金融業導入SAS商用軟體輔助風險管理,常見的應用即為貸款業務,須進行信用評等,採用統計運算風險值。近幾年開源工具當道,更加促使資料科學成為顯學。企業觀察到IT技術發展趨勢,也開始著手蒐集數據,借助現代工具運行分析,較傳統制式的報表凸顯出更多商業價值,讓不同行業得以根據更加精準的數值輔助決策。

資料科學的目的是為了快速產生預測,看到現象即可推論背後的原因,以前是得透過多種類型報表才可得知。以商業智慧分析為例,主要是提出告警,並未包含判別背後的因素,例如零售業者統計分析發現本季度有特定品項銷售數量下滑,在商業智慧報表中可完整呈現,卻無法進一步推論導致的因素,須不斷地分析比對其他來源資料由人工來判定。現在運用AI的目的是加快回應市場的速度,一旦偵測到特殊現象,可直接運行肇因分析,讓高階管理層立即進行決策。

提升效率兼顧累積成為資產

為了培育出更多資料科學家人才,SAS近幾年持續不斷地投入資源舉辦校園競賽。陳新銓以實際參與的經驗來看,十多年前學校並未注重資料分析,甚至學生也無法想像統計學的應用領域,直到近兩年的校園競賽,發現得獎的學生表現相當優秀,得歸功於學術界已發現市場上對於大數據分析、資料科學人才需求,未來畢業生將可逐漸填補缺口。

產業紛紛啟動朝向智慧化發展,驅動校園人才養成資料科學家,再加上技術平台持續演進,輔助資料科學家提高工作效率,陳新銓認為,接下來可能面臨的挑戰反而是在管理層面,也就是人才的「選用育留」。以全球人才市場來看,資料科學家待在相同公司最多三年,很容易被挖角。另一方面,執行數據分析,產出的結果得快速上線,提供企業營運系統改善的建議。今年(2021)年初Gartner新提出DSML(Data Science And Machine Learning)平台,SAS的VDMML即位居領導者象限。

他進一步說明,企業主逐漸發現,並非工具變得強大,驅動資料科學蓬勃發展,而是產業需求所驅動,懂得運用開源工具的開發者,或許可達到商業版軟體的效果,但是資產無法被留下,此外,開源技術撰寫程式碼,通常有不同版本與套件,無法共用。資料科學家就像是「黑盒子」,依據自己習慣的方法執行任務,但是無法達到橫向溝通。以行銷的應用為例,主打的行銷活動須撈取可發送推薦郵件的名單,最終成交率可能即為資料科學家的績效指標。至於究竟如何執行撈取名單、參考的依據等分析機制,須採用不同統計方法論輔助,VDMML解決方案不僅可輔助提升效率,同時可將資料科學家的知識轉換為企業資產,如此長期累積才有助於成為商業營運的智慧。

普及平民化資料科學家

在AI應用的趨勢浪潮下,企業必須提升管理資料科學家與分析報告資產的能力,或者是更普及化地讓各部門員工都可執行分析工作,尤其是業務單位,可自行操作分析,如此一來,工具勢必得朝向無須撰寫程式碼的方向發展,方可能實現。

SAS核心技術是統計學與演算法,近年來開始積極推動平民化資料科學家,讓不具備技術背景的員工,運用易於上手的工具,自主性地操作執行分析找到問題解答,回應市場的效率將更進一步提升,畢竟第一線工作者的市場敏感度較高,或許較技術精湛的資料科學家更能解讀數據的意涵。陳新銓說明,SAS提出平民化資料科學家,目的是讓前線的業務分析人員可以運用,至於專業的數據分析部門,也可以藉此建立資料模型,無須撰寫程式也可達到相同目的。

SAS(賽仕電腦)台灣業務顧問副總經理陳新銓強調,在AI應用的趨勢浪潮下,企業必須提升管理資料科學家與分析報告資產的能力,或是讓員工都可執行分析工作,尤其是業務單位,可自行操作分析找到解答。

近來許多新創公司為特定應用場景提供AutoML服務,亦可降低AI應用的門檻,問題在於無法探究內部運算邏輯,或許在零售業可允許部署,對於需高度監理的金融保險業而言,勢必不允許部署無法解釋運算邏輯的模型。

「從SAS觀點來看,AutoML基本須具備可快速建立模型、可解釋運算邏輯、可快速地部署。」陳新銓說。基於VDMML提供的AutoML建立模型,開發環境與線上環境皆具備相同執行引擎,可直接部署到前端系統,不需要再經過驗證即可整合運行。後續維運則可透過API方式呼叫執行引擎,持續不斷地更新分析方法即可。如此才可讓營運分析的開發、部署上線、維運,依據應用決策的回饋調整,持續不斷地自主循環。

 


追蹤我們Featrue us

本站使用cookie及相關技術分析來改善使用者體驗。瞭解更多

我知道了!