企業選擇部署於內部或是採用公有雲端服務,評估準則與是否採用雲端服務的考量極為相似,不外乎幾個重點,包含預算是否足夠、有無法規限制或資料機敏性的考量、建置時間是否很急迫、是否為臨時使用,以及有無足夠人力來進行管理維護等等。
人工智慧(AI)與機器學習(ML)正主導著科技領域的發展,這門在全球已然成新顯學的技術,不只企業關注,科技巨頭更投注了大量資源與心力,包含Google、AWS、Azure都在其雲平台上提供預先訓練好的深度神經網路以及豐富的AI開發工具,從影像、語音到文字與翻譯,企業能夠很簡單地在平台上構建AI,探索資料所帶來的價值。
而台灣本地的電信業者也早就加入AI服務行列,以中華電信為例,旗下AI相關產品及服務便包含了IaaS、PaaS以及應用服務等三個層面,涵蓋面非常完整。在基礎架構與運算資源方面,除了提供台灣唯一自主研發的公有雲Hicloud之外,近期也推出以秒計費的GPU雲伺服器服務,提供多種模式隨租即用。而有別於以往企業需要一層層自行打造AI運算平台,GPU雲伺服器已做好供裝,企業只要輕鬆點選即可租用,可大幅簡化過去複雜以及繁瑣的工作。
此外,中華電信在AI以及大數據也提供PaaS平台解決方案。「AI PaaS深度學習開發平台」不僅提供深度學習所需要的環境,每個Instance包含的運算資源以及深度學習的軟體框架(例如TensorFlow、PyTorch、Caffe2等等),還提供了版本控管機制。另外,也提供模型自動API化上線推論機制,讓企業順利地以RESTful API的形式串接串接應用服務與推論模型,同時方便日後的管理與更新。中華電信研究院巨量資料研究所所長汪世昌解釋,AI PaaS深度學習開發平台已經過中華電信數十個專案及上百位深度學習開發者的驗證,將其商業化後,現今也用來提供企業加速AI深度學習模型開發與訓練。
至於在AI應用方面,包含以人臉辨識技術為基礎的智慧差勤與門禁、以STT、NLP、TTS為基礎的中華電信智慧客服、i寶貝智慧聲控平台等等,都已經上線提供服務。其他在智慧維運、智慧家庭、智慧安全以及智慧交通等也都有所著墨。
需求規模是自建挑戰
對於從業多年的IT人員來說,人工智慧是一門相對陌生的學科,許多AI硬體與軟體框架的調整維護也相對複雜,雲端服務所帶來的優勢則在於能夠提供靈活的基礎架構,藉由GPU的搭配來加速訓練過程或是用於推論的處理。企業不需要考量複雜的硬體配置,以及軟體開發框架,能夠很輕鬆地構建AI環境,而且簡單易用。
汪世昌認為,企業選擇部署於內部或是採用公有雲端服務,評估準則與是否採用雲端服務的考量極為相似,不外乎幾個重點,包含預算是否足夠、有無法規限制或資料機敏性的考量、建置時間是否很急迫、是否為臨時使用,以及有無足夠人力來進行管理維護等等。
「不管是自建AI基礎架構或是訂閱雲端服務,並沒有應用上的差別,但網路會有公開還是封閉的差異。」但他也提醒企業,在人工智慧的年代,若是沒有到達一定的需求規模,自行建置的成本反而會更高,這是因為高階繪圖加速器要價不菲,總體設計下來,動輒數百上千萬的成本,企業自然會考量更多。當然,雲端服務也不是沒有缺點,因為規格已經制定下來,不見得能百分之百符合企業當時的需求,「最終還是需要從各個環節全盤考量,但如果希望先期小型成本投資,只要不涉及資料機敏性,雲端不失為一個好的解決方案。」
資料與運算力驅動AI應用
隨著人工智慧愈益成熟,AI已經成為企業改變遊戲規則的重要戰術,根據IDC調查,企業對於人工智慧的投資也在增長,預估到了2022年全球將有770億美元的支出投資在AI上。汪世昌觀察,資料是驅動人工智慧應用落地非常重要的元素,不少走在AI前端的產業,前提都是具有大數據,舉例來說,政府機關、電信、金融與保險業較為著重在智慧客服的應用,而警政安防單位則較常應用在智慧安防與科技執法等層面上,像是車輛追蹤、車牌辨識、人形識別與追蹤等等。另外,醫療產業也正投入在大舉投入在AI導入,藉以提升醫療品質,而製造業由於有很多製造數據與影像,常見用於良率提升,無形中便能節省許多費用。
其他在智慧農業也有很多的想像,番茄方舟(ARK Tomato)就是典型運用了物聯網與AI技術的案例,藉由感測器收集的數據來加以調節空氣與水量,判斷何時應該施肥以及降低病害的發生。
但是除了資料之外,基礎架構也是相當重要的一環,尤其當資料量愈龐大、訓練模型愈複雜,基礎架構規格的要求也愈高。他提到,並不是所有人工智慧應用都需要非常強大的基礎架構,對於資料量不大的環境,採用等級好一點的CPU來運算就有不錯的表現。但是由AlphaGo帶起的深度學習,由於深度學習需要處理大量非數據類型的資料,例如影像、語音等等,因此需要較大的運算資源,這也是傳統基礎架構很難支撐的原因,這時就必須運用NVIDIA Tesla P100或是Tesla V100高階繪圖加速器來加以協助,有些甚至要一次用到8張或更多的高階GPU卡,更甚者連儲存設備以及網路規格都必須同步跟進,才有辦法滿足模型訓練的運算需求。
先解決痛點再擴大創新
「基礎架構的選擇,最終還是要看應用的需求,如果深度神經網路高達數十層至數百層,10GbE的網路當然也會不夠用,例如國網中心建置的AI平台,就是採用Mellanox InfiniBand EDR(100GB)的網路,依據不同旳AI應用與訓練來配置,才是比較好的作法。」汪世昌也強調,在資料為王的時代下,人工智慧一定要先有「工人智慧」,資料標註的好壞來源以及多寡,會是決定模型訓練準確與否的關鍵,但是在此之前,企業並不是盲目的跟風,而是要找到人工智慧的用途,靜下來思考,企業想要藉由人工智慧來解決哪些過往無法克服的問題,這才是正確的態度與思維。