預測 人工智慧 AI 維運 雲端

基礎架構的雲端守護者

2020-02-07
隨著企業快速推出創新服務,IT維運也愈加挑戰。專業人員往往需要花上許多時間,甚至犧牲夜間和周末來處理可能干擾應用服務運行的問題,其過程總是充滿著挫敗感、令人頭痛的問題和大量人力的投入。

一直以來,IT藉由各式監控工具來進行日常管理,在異常發生時需要花費大量時間收集與分析日誌檔並進行各式圖表的解讀,以找出原因進而將故障排除。而且若是需要供應商的協助時,則有多層級支援團隊的介入,其過程通常需要反覆地溝通、資料收集、參數調整以及驗證等作業。隨著IT對於業務的運行越來越重要,這種模式在問題的快速查找與人員效率上已無法滿足數位企業所需。

現代企業已不再能接受於異常發生後再花費時間與人力去尋找原因,而是需要一種可以在問題發生之前即進行預測並提供改善建議的新型解決方案。傳統監控工具之所以效率不彰,主要是因為受到下列因素的侷限:

‧無法向他人學習:僅針對本地設備進行監控與分析,無法借重來自全球類似設備的運行經驗,因而不能在異常尚未形成前,藉由他人過往的經驗進行預防措施,甚至無法在全球類似設備發生事件後及時得到預警,以避免故障發生。

‧僅限於單一設備:異常的原因可能來自基礎架構中的任何位置。僅針對單一設備的狀態進行分析,只能說明事件的一部分。惟有包括應用程式、伺服器、虛擬層、資料庫、網路和儲存設備等多層次設備的監控與關聯分析,才能完整說明整個事件。

‧缺少專業知識持續累積:異常狀況的查找,除需要掌握設備運行狀況的各項資料外,更需要輔以豐富的經驗,才能了解各相關設備的運作關聯以找出因果關係,並針對核心問題進行異常排除。

這些年,隨著人工智慧的技術成熟,新世代監控系統開始具備智慧化與自動化功能,並可透過雲端架構進行預測分析。以雲端架構為基礎的預測分析,具備了三個關鍵要素,分別是資料共享、廣泛的資料收集,以及使用人工智慧/機器學習來驅動自主式操作。

在資料共享方面,藉由雲端架構收集和保留資料,讓資料更容易共享,其中包括供應商內部的工程和產品相關資訊、支援流程與進度,以及與其他客戶共享藉由去識別化的資料所建立的預測模型。另外,企業也能利用大量可取得的資料及功能更強大的運算技術進行資料相關性分析,從而建立準確的預測模型,以提高自主式操作程度進而改善客戶體驗。而在資料收集部分,機器學習的準確度來自於運算能量、演算法與資料量,必須能夠在更細粒度與長時間的基礎上進行採樣,並廣泛地從架構內各相關設備和資源中收集資料。

預測分析功能不是功能表中的一個單純選項,不要讓那些包裝過的「遠端監控」魚目混珠。預測分析功能的願景,在於設備不再需要花費人力持續關注、手動調整和被動式的故障排除,進而達到一個可以自我管理、自我修復和自我優化的目標——而這一切的關鍵就是人工智慧。

<本文作者:范欽輝現為HPE慧與科技技術規劃處副總經理>


追蹤我們Featrue us

本站使用cookie及相關技術分析來改善使用者體驗。瞭解更多

我知道了!