新興科技正在引領企業發展數位化營運業務,IDC(國際數據資訊)日前最新發布2018年台灣市場的預測報告中指出,預計到2021年,台灣將有超過55%的GDP貢獻來自數位服務產品與技術,其中以人工智慧(AI)、機器人、物聯網在亞太市場的應用占比最高。
IBM Watson IoT首席資料科學家Romeo Kienzler近期來台時接受專訪指出,人工智慧在台灣最具潛力的應用領域,當屬製造業的工業物聯網(IIoT)。他舉例,透過增加生產線感測器的數量與類型取得資料,可藉此提升預測性的維護品質,在機械運作時的不同位置蒐集振動、聲音與溫度資訊,搭配人工智慧演算法實作異常偵測,運用長短期記憶(LSTM)實作,可進行分類與時間序列預測,基於LSTM自動編碼神經網路改善訊號品質。
|
▲IBM Watson IoT首席資料科學家Romeo Kienzler建議,對於剛入門深度學習領域,可運用TensorFlow與Keras框架,基於較為熟悉的Python語言學習與實作。 |
「在IBM Watson IoT部門,我負責的是時間序列分析,就經驗上來看,對於任何涉及時間序列資料集(Dataset),例如自然語言、聲音訊號、音頻信號或DNA,皆是採以遞歸神經網路(Recurrent Neural Network,RNN)為主,LSTM即為RNN的一種。」Kienzler說。
近來各界的研究範疇大多集中於自然語言與圖像辨識,因此他特意採用神經網路來進行時間序列分析預測、去除雜訊、分類方法研究,重新實作了異常偵測演算法,可更精準地發現問題並予以優化。他舉例,廠區內的小變異(噪音)產生波動,很快回復正常後往往不會被發現,若運用LSTM即可明顯呈現出差異,讓管理者及早發現產線異常狀態,以便盡快改善。
IBM Watson認知運算平台包含深度學習、高等機器學習、數位訊號處理等多種新技術,可協助解決特定的商業問題。以資料分析的角度看物聯網應用領域,並非為協助處理感測器的部署、通訊、安全性、電力等問題,或許訊號雜訊比(Signal-to-Noise Ratio)才可能是資料科學家須處理的範疇。
全球開放陣營技術社群正快速地發展深度神經網路架構,以實作建立資料運算模型。Kienzler說明,知名的TensorFlow與Apache SystemML屬於低階框架,可被實作在任何的神經網路;基於Java程式語言發展的DeepLearning4J開源專案則為高階框架,可較為直觀、快速地實作。但是對於初學者而言,他則建議採以Keras高階框架,可運用Python語言撰寫,具有模組化、易於擴展等特性,底層再搭配TensorFlow,更適合入門學習。
至於SystemML主要是運行於Spark與MapReduce環境,最初由IBM研究院研發,在2015年貢獻予Apache基金會。Kienzler指出,SystemML目前是提供匯入Caffe模型實作,也正在積極發展支援Keras,因此現階段常見的應用模式,是採用Keras與TensorFlow設計資料原型,再透過匯出與匯入DeepLearning4J或SystemML的方式,在Spark環境中運行靈活擴展。由於Spark的核心並非為線性代數(Linear Algebra)執行引擎,而是以成本為基礎的優化器(Cost-Based Optimizer),搭配SystemML可讓處理資料的運行效能更好。