叡揚資訊系統事業處處長何玉雯觀察,近幾年來數位轉型受到各行各業的關注,企業所提供的營運業務,藉由數位化來提供的比例勢必增長,因此在APM解決方案中具備的數位體驗監看(DEM)相當受到關注。問題是,現階段IT建置環境複雜度較以往更高,除了監看機制外,還必須在發現用戶體驗變差的當下,具有專家知識與自動執行調整,這方面可說是Dynatrace的強項。
縮短問題排除時間降低影響用戶體驗
早期在大型主機當道的時代,叡揚資訊就已開始代理許多國際知名的管理工具。何玉雯指出,當時應用系統逐漸走向主從式(Client-Server)架構,主機數量變多、資料庫系統增加、程式碼也相當龐大,若非仰賴監看與診斷工具協助,根本難以維持應用服務正常運行。因此叡揚資訊早期先代理了Compuware Vantage,也就是現在的Dynatrace,合作多年後發現,原廠的產品研發方向相當精準,且不吝於投入資源,以及提供代理商技術支援,因此叡揚資訊也開始培養內部技術團隊。
「在本土深耕十多年來,已累積許多客群,且回購機率相當高,顯現客戶對於Dynatrace經過理解大數據、演算分析後產生的結論,經過實際驗證後確實有助於提升維運效率,保障服務品質與用戶體驗。」何玉雯說。
以前IT人員要監看伺服器運行狀態,必須透過安裝代理程式來蒐集資料,可能網路傳輸封包與系統執行程序分屬不同技術供應商所提供,就得安裝多個代理程式執行蒐集。叡揚資訊系統事業處經理蘇義傑說明,Dynatrace所設計的自動化機制,主要目的在於簡化管理複雜度,首先是從代理程式的整合著手,只要安裝OneAgent單一代理程式,即可掌握終端所有跟效能有關的數據,其中也包含數位體驗的監看能力。
應用系統演進到微服務架構,複雜度相當高,已超出人力可控管的範疇,勢必得仰賴工具來輔助,Dynatrace即是瞄準這類型需求。針對成千上萬的應用系統,當運行回應速度變慢、效能出現瓶頸時,可立即掌握主要發生問題的節點。由於當前應用架構複雜程度過高,根本難以由人力逐一查看來診斷,因此開始納入機器學習演算模型分析大數據來輔助,提升問題排除的效率。
建立DevOps團隊協同工作平台
APM於容器環境的部署方式,是藉由作業系統上安裝OneAgent掌握啟用與運行狀態。蘇義傑指出,過去企業核心系統很多採用Java語言開發,在Windows作業系統中,執行環境會同時存在多個JVM(Java Virtual Machine),欲啟用APM監看,必須為每個JVM設定程式碼才得以執行。持續發展至今,為了要以簡單的方式達到自動化,安裝完成代理程式後毋須再額外配置,OneAgent會主動發現系統環境中運行的JVM數量,並且在交易行為產生時,自動追蹤工作流程,並且指出發生問題的節點。
「自動辨識的能力不僅只有程式碼本身,同時也包括開發框架的邏輯結構。以前必須由IT人員手動指定程式碼屬性,近兩年Dynatrace增添的自動化機制,不須像傳統依照事前定義來判斷與運行追蹤,才可大幅降低維運工作負擔,相當適用於DevOps團隊處理日常協同與維運工作。」蘇義傑說。
當應用服務上線後,實際發生用戶體驗變差時,首先接受到壓力的是客服人員,之後開立檢修派工單請維運團隊處理,若排除為基礎架構異常所導致的影響因素,勢必得協同開發團隊檢查程式碼運行狀態,以追查根本原因。
「因此我們現在推廣時也會強調建立跨技術領域的共通平台,讓IT維運與開發者透過相同的介面查找資訊,幫助雙方溝通協調處理問題。以前兩組團隊各自為政,彼此推卸責任,如今可藉由Dynatrace提供的特性,讓團隊之間基於相同的科學化數字進行溝通,有效避免紛爭、促進合作。」何玉雯說。
基於領域知識建立資料演算模型
就解決方案架構來看,Dynatrace大致區分為兩個部分,SaaS是架構在Dynatrace建置的雲端平台之上,若企業不希望自家資料上雲,亦可採用自建的版本。蘇義傑進一步說明,其實Dynatrace還有細分不同模組以共同完成整個監控工作。例如自動化監控,主要是藉由全球佈建的機器人,定期存取網站應用程式,依據不同地區發起的連線存取需求,來查看回應速度與互動體驗,確認不同區域皆可得到一致的服務水準。對於業務範圍遍及全球的大型企業而言,此機制重要程度較高。
當交易行為開始執行,從終端連接到應用伺服器,中間可能會通過許多電信運營商部署的網路節點,萬一是因為網路延遲導致回應速度變慢,同樣必須有能力查找,因此Dynatrace亦有設計提供網路模組的監控,計算網路品質狀態。當存取需求觸發資料中心的應用系統執行時,則可辨識程式碼運行狀態,讓維運與開發人員得以透過相同的介面與統計數據共同解決效能瓶頸。
Dynatrace的知識主要是建構在雲端平台之上,資料演算模型會定期更新到企業內部自建的系統。以往尚未採用機器學習演算分析時,通常必須由IT人員自行翻查日誌記錄,追蹤可疑的癥結點後判斷問題之所在,不僅效率低落,且容易出錯,即便是經驗相當豐富的專家也難以立即做出判斷,因此如今的機器學習演算分析可說扮演相當重要的角色,可快速地關聯分析產生結果,以釐清問題的方向。
蘇義傑不諱言,其實現階段的客戶端,仍有許多技術專家習慣自行查看日誌記錄,或是手動調整參數設定,來解決應用效能不彰的情況。當然資料模型的建立往往得經過一段學習時間,IT人員只要確保資料持續不斷地蒐集,判斷即可變得更加精準。畢竟Dynatrace設計理念在於降低人力介入的程度,唯有善用現代化工具,才得以讓技術專家有時間為公司創造更多商業價值,而非耗費在無效率的重複性工作上。