正視維運與系統整合 逐層解決AI導入課題

2020-11-04
AI早已落地到生活中的諸多環節,同時帶領著企業創新任何業務的可能。但企業在導入AI專案的過程中,也普遍面臨著制定明確的目標、資料管理、資料的挑選、人才議題以及系統整合等挑戰。

 

從投入OCR領域,利用光學字元辨識提供郵件分揀方案到專注於臉部、虹膜、指紋、掌紋、指靜脈、語音與耳道聲波辨識指紋,NEC在生物辨識領域已投注了三、四十年的心力。尤其是電腦視覺(Computer Vision)應用,隨著新型冠狀病毒(COVID-19)肆虐全球,戴口罩已逐漸成為新常態下的基本防疫措施,NEC強化人臉辨識技術,在近期推出新的臉部辨識引擎,即便人群中交雜著戴口罩與未戴口罩的人臉,也能有99.9%以上的準確率。

而這只是NEC技術演進的其中一個環節。今年4月,日本NEC發表一項利用人工智慧(AI)追蹤姿勢的技術,讓身障者也能根據人體的姿勢和視線來演奏樂器; 8月,精釀啤酒公司COEDO宣布與NEC合作成果,運用AI技術分析雜誌圖像與文章,再轉化成數值,釀出名為「人生釀造」的系列啤酒。在台灣,NEC也協助知名便利商店的「未來商店」,利用人臉辨識技術,刷臉識別會員並且在結帳時透過臉部生物驗證付費;另外,金融銀行也結合NEC人臉辨識技術設置「刷臉提款櫃員機(ATM)」,且已開放一般顧客使用。

從這些案例並不難發現,AI早已落地到生活中的諸多環節,同時帶領著企業創新任何業務的可能。台灣NEC專業解決方案事業群協理何彥明從他多年協助企業導入AI專案的經驗,發現企業普遍面臨著制定明確的目標、資料管理、資料的挑選、人才議題以及系統整合等挑戰。

AI專案挑戰重重

他指出,AI與資料倉儲(DW)不同之處就在於,企業必須先想清楚希望利用AI來解決什麼問題,然後再針對問題來設計解方。但關鍵是,想解決的問題不能太發散,舉例來說,「希望運用AI讓明年業績翻倍」就是一個很抽象的目標,需要提供好幾層的資料才能知道行為以及有沒有可能做到。而且極有可能涉及許多外在因素,例如突然爆發的疫情。「一般而言,會建議企業先從痛點著手,以工廠為例,可以從稼動率或是妥善率的改善做起,諸如此類的問題也會比較明確。」

面對資料四處分散的情況,企業可以透過資料管理的手法將資料整理到企業內部,例如建置資料湖來加速資料整理。不過,他認為,真正的苦工其實是初期的資料清洗與貼標籤(Tagging),才是花費最多時間的地方。至於人才部份,由於業界與學校都不斷訓練與培育,目前已慢慢補足,但企業較常遇到的情況是「資料不對」。雖然企業已經把可能相關的資料都集中起來,但資料科學家並不會知道這些資料是否對AI模型訓練有效,通常必須經過驗證才會知道資料如何收斂。」也因為如此,第一批資料訓練出來的結果可能不如預期,這時就必須增加資料或是改變資料模式,藉此不斷地修正。

但這對IT人員而言,卻是一項維運負擔。儘管新資料的加入能夠不斷地提升AI模型的精準度,但是每一次模型訓練的準確度並非是線性結果,而是上上下下的曲線,當準確度往下掉,IT人員必須要能有所因應,除了回報給資料工程師之外,由於產線仍在進行中,因此也必須提出一套對應的做法。

何彥明認為,以現今企業電子化與資訊化的程度,再加上系統整合商或顧問的協助,將AI模型訓練整合在現行架構中並不困難。不過,有些AI專案並不是由IT人員主導,而是由使用單位主導,而且在專案過程中很可能還會涉及到別單位的資料,在這種情況下會面臨較高的挑戰。「問題並不在於如何取得資料,即使不同部門,多數的資料還是歸IT管轄,例如ERP本來就串接很多部門,資料會非常集中。但企業在發展過程中,許多系統都是孤島式開發,當資料『各說各話』時,想要變成共通語言,具有一致的標準資料格式,就是一個難事。換言之,IT部門的挑戰會在如何整合各個不同的系統。」

雲端方案更適資料收集

除了原廠供應商的角色,台灣NEC同時還兼具系統整合商的身份,可以協助企業將AI應用落地,包含搭配企業屬意的設備品牌,不管是相容性還是容量,都會協助做好規劃。而除了自建的AI基礎架構的選項之外,雲端服務供應商提供的AIaaS平台也可以加以善用。

他提到,目前三大公有雲包含AWS、Azure以及GCP提供的AI服務平台大概有幾種類型,一種是認知型的API,提供人臉辨識、語音辨識的工具讓企業串接,雲端業者會訓練好模型並且提供API服務,企業則是寫程式呼叫然後取得結果。另外一種是提供ML的架構,其內包含了數十種的演算法,由企業自行訓練。還有一種全代管模式,不過台灣少見提供這類型服務。「依個人經驗來看,雲端方案更適用於滾動式的資料收集,而選擇在地端訓練模型或是在雲端上訓練模型的差別只在於企業願不願意支持IT部門採用相關設備而已。一般來說,自建在初期的投資通常耗費較大,有些企業會選擇採用雲端資源,擴充性也會比較好。」

台灣NEC專業解決方案事業群協理何彥明認為,企業在發展過程中,許多系統都是孤島式開發,當資料各說各話時,想要變成共通語言,具有一致的標準資料格式,就是一個難事。

值得一提的是,不少企業認為AI訓練模型後的準確率應該可達100%,但AI談的其實是可能性,在這個領域中,通常不會設定在100%,並非不能做到,而是需要許多條件與但書,且企業也須投入非常多的資源與成本。比較平衡的作法是人機協作,以現今的技術依據資料的狀況做到盡量趨近,如此一來,企業無須等比級數地擴大投資,也能從中看到實質的效益。

專案目標須明確

何彥明強調,人工智慧其實是針對問題來解問題的方案,並不是一個通用型的方案或是共通的平台就可以解決問題,過往資料倉儲是先射箭再畫靶,但AI卻是要先問清楚問題才射箭。雖然資料倉儲與人工智慧,都免不了與資料息息相關,但是卻是兩種不同解決問題的手法。資料倉儲是從維度的角度將資料集中起來,而人工智慧卻是針對問題來找資料,企業必須先行設計找出具有特徵值的資料,才有辦法畫出範圍,把資料納進來。

以NEC為例,NEC最擅長的是電腦視覺,一般企業多半不會有相關的資料,反而商業流的資料較多。換言之,企業必須額外收集不同種族的人臉資料,還要把特徵值找出來,例如眼睛的距離、五官的間距,如果要針對黃種人進行訓練,資料取得後還必須經過清洗,像是只能有正臉不能有側臉,才能確保資料品質。簡單地說,因為屬性不同,所需要的資料就會不同,「這也是為何我們一再強調,AI專案一開始目標就要明確的原因。」他說。

 


追蹤我們Featrue us

本站使用cookie及相關技術分析來改善使用者體驗。瞭解更多

我知道了!