Micro Focus IT營運管理架構師尹德行指出,市場上APM的銷售對象大多為應用開發團隊,用於檢查程式碼運行狀態,實際上發生應用效能不彰事件發生時,原因可能涵蓋的範疇相當廣泛,包含底層基礎架構、網路傳輸、終端作業系統環境等,因此通常需要不同領域的技術整合才得以有效地提供協助。
IT運行狀態轉換為商業指標
針對APM解決方案中較受到業務單位關注的數位體驗監看(DEM),主要目的即是為了比用戶更早一步掌握異常事件,同時得以藉此理解用戶的喜好,把實際數據回饋給業務單位,作為發展方向參考依據,在用戶體驗持續改善後提升回訪率與黏著度。OpsBridge可追蹤用戶存取首頁、登入帳號,操作過程中網頁程式運行的回應速度記錄、系統耗用的資源、網路傳輸狀態等數值,同時也可掌握瀏覽網頁的操作模式,藉此理解用戶喜好,來強化用戶體驗。
「現在Gartner定義的DEM,過去我們稱為EUM(End-User Management),監看的目的皆是為了提升用戶體驗,不僅用以協助系統架構的故障排除,更可得知用戶的操作行為,藉此持續改善功能性以貼近用戶需求,不僅打破以往IT部門老是扮演救火隊的工作型態,也可促進營運業務的績效。」尹德行說。
APM設計的用意是在用戶發現問題前就可先行掌握,基本必須了解現階段的存取活動,回應速度是否正常,萬一發現運行不順暢,得以從蒐集取得的數據釐清效能瓶頸所在,或許是終端環境運算資源負載過大、網路壅塞、DNS回應速度變慢等因素,當然也有可能是程式碼撰寫語法所導致,因此必須透過工具才有能力細部區隔。
廣泛蒐集資料單一儀表板呈現
前述提到,欲改善用戶體驗,可透過存取行為過程中所蒐集取得的資料,回饋給業務單位,藉此得知受歡迎的功能性,主要實作方式為程式碼解析。就Micro Focus設計研發的應用程式品質與維運管理方案來看,尹德行說明,大致上區分為上線前的源碼檢測,主要是開發團隊關注的功能測試、壓力測試、安全檢測;至於上線後的維運,即為OpsBridge主要負責的範疇,尤其是針對網頁式操作介面,OpsBridge可還原用戶端畫面,以便在發生錯誤時精準地找到問題癥結。
「現階段企業端環境已有許多過去建置用以提升工作效率的管理工具,操作介面各自獨立,OpsBridge有能力加以整合,可在單一儀表板上查看應用系統的效能指標,包含程式碼與基礎架構的數據。至於程式碼的支援度,主要可解析Java、.Net、Python語言,當然前端網頁還有許多採用PHP語法所撰寫,未來也可能考慮納入支援。」尹德行說。
至於近年來應用系統逐漸遷移到公有雲平台的容器環境,事實上,APM不容易透過部署代理程式來蒐集資料,大多會仰賴容器技術或是公有雲服務供應商所提供的工具來執行資料搜集,再統一彙整到APM的大數據平台,運行機器學習演算分析,藉此輔助判斷已知的問題,同時也可達到預警的效果。
AIOps平台彙整大數據 運行演算分析
現代化應用系統已朝向微服務架構演進,不論是內部自建或採用公有雲服務實作,尹德行觀察,本土企業多數仍在驗證測試階段,畢竟微服務架構開發採用的DevOps方式,必須從企業文化改造著手轉型,目前發展的腳步較國際企業速度來得慢。
實際上因應DevOps團隊所需的商業版軟體,即是Micro Focus研發著眼之處。儘管目前開源軟體的聲勢較強,開發團隊可望有能力整合運用相關技術,然而關鍵畢竟是後續的維運,必須要把IT基礎架構轉換成程式碼,才得以實踐DevOps。
問題在於,具備跨領域技能的人才培養不易,現階段企業可選擇穩定的PaaS商業版平台,內建Hypervisor與容器環境,甚至包含版本控管、快速部署工具,將能補強團隊技能上的落差。
對於開始採用公有雲的企業,不同平台皆有各自的管理模式,因此APM首先必須具備整合公有雲工具的能力,以便於經由分析與數據的呈現,來掌握端到端的運行狀態。其次是建立遠端模擬監控應用程式機制,確保提早發現異常以保障服務水準。
「就傳統銀行業來看,仍舊是以J2EE為大宗,其他企業則是.Net為主,仍舊得仰賴APM來協助,未來應用系統若大量朝向微服務化,屆時APM則可採以介接的方式整合來自容器環境的資料,而非直接安裝在應用系統中蒐集。」尹德行說。
Micro Focus實作方法是透過AIOps平台,整合更多第三方廠商所產生的資料,依據Micro Focus長期以來累積的知識來執行監看。他以AWS為例說明,平台服務項目中可選用CloudWatch協助監看Amazon EC2執行個體,問題是缺乏底層實體資源的效能狀態數據,OpsBridge即可協助補強。此外,針對自建的Docker環境,例如Red Hat OpenShift,OpsBridge則可支援部署於系統之上,自動化地進行掃描取得組態管理資料庫(CMDB)資訊、告警事件、效能與資源狀態,監看Docker Engine上啟用的容器,以及程式運行時佔用的資源數值。
「依據Gartner對於APM的定義,主要區分為三大主軸,DEM主要結合APM與NPM解決方案,應用程式主動發現與追蹤以診斷問題則是APM與CMDB整合提供,人工智慧輔助維運(AIOps)則涉及更多非IT領域,透過機器學習與自動化機器人輔助。」尹德行說。
他進一步提到,由於OpsBridge特性是運用類似功能測試與壓力測試機制,模擬使用者的操作行為,以此為基礎建立主動監看與追蹤,有助於提升診斷問題的精準度。如今納入整合AIOps,用意在於強化分析能力,實現預測與預警。OpsBridge的作法是整合自家Vertica大數據平台技術實作資料湖,運用機器學習演算模型解析,在監看發現問題時可自動化釐清。