數位體驗已成Bank 4.0時代下金融產業的重要發展指標,然而想要實現服務不中斷,IT的角色更是任重道遠。近幾年,兆豐銀行積極推動數位轉型,儘管金融服務已能整合各種新興的網路、行動科技、雲端、人工智慧(AI)、大數據等等技術,但雲地混合的複雜架構以及容器、微服務的應用,也讓兆豐銀行面臨到IT維運管理挑戰。
兆豐銀行面臨的挑戰主要來自於兩個層面,一是在雲地整合環境下,應用效能如何有效管理,另一則是微服務趨勢下的IT治理挑戰,如何快速回應業務單位需求。為了達到更智慧且快速有效地監控,兆豐銀行決定導入Dynatrace,藉由OneAgent完整自動化功能,自動探索並迅速掌握IT環境的正常效能狀況,以縮短問題查找以及服務中斷時間。
混合環境抽絲剝繭不易
叡揚資訊系統事業處系統服務二部經理蘇義傑指出,兆豐銀行遭遇的維運挑戰其實也是許多企業正在或即將面臨的難題,受到COVID-19影響,採用混合雲或混合多雲架構的企業愈來愈多,雖然核心架構與服務可能依然運行在內部部署(On-Premises)環境,只有新開發或部分較不敏感的服務會選擇上雲,但是企業應用雲端的比例正在逐漸攀升,而且一家企業極有可能同時使用2~3個雲端服務供應商所提供的服務,在此情況下,企業面臨的維運挑戰也會隨之加劇。
首當其衝便是人力資源不足,由於每家雲端服務供應商都有其生態圈與技術發展,想找到能同時熟悉各個雲服務廠商的產品與技術的資訊人員並不容易,即便自行培訓要兼顧各家技術也有難度。其次因為不同雲端環境的複雜性不同,一旦企業的單筆交易橫跨多個雲端與企業內部環境,想要追查效能與故障排除也會變得困難許多,對於企業來說,混合環境讓IT架構的範圍變大,實踐DevOps也會愈來愈不易。「雖然目前在容器與微服務架構應用上,企業多半會小規模地以指標性系統或是試行的應用先行嘗試,但是微服務環境其實也會提升維運的難度,原因在於微服務內的交易(Transaction)串流錯綜複雜,更難以抽絲剝繭查找問題。」他說。
核心技術打造全方位平台
自2005年成立至今,Dynatrace最早是以應用效能監控(APM)服務起家,隨著技術的演進,除了應用效能管理之外,還擴展至IT基礎架構監控、微服務、數位體驗、應用程式安全、商業分析以及雲自動化(Cloud Automation)等層面,打造出全方位的AIOps平台。去年,除了在《The Forrester Wave:AIOps》2022年第四季報告中被評選為領導者外,在Gartner最新發布的關鍵能力報告中,也被評選為2022年應用程序效能監控(APM)和可觀察性魔力象限的領導者。
蘇義傑認為,多年來Dynatrace被諸多調研機構評選為領導者,其內建的獨特核心技術其實功不可沒。藉由OneAgent、PurePath、Smartscape以及AI引擎Davis,Dynatrace不僅能夠協助企業輕鬆收集各項資料,並透過人工智慧分析找出根源外,還會在問題發生前便告知相關人員出現異常、提出建議,甚至自動化地修復。
Davis是Dynatrace的核心AI引擎,其能夠持續分析數十億個依賴關係,提供精準的問題根源判定結果,可協助消除警報風暴,避免各種孤立工具泛濫,並將資源集中到影響力最大的主動防範措施上。而OneAgent則是包含多個模組功能的代理程式,藉由OneAgent,企業便可以實現跨平台提供連續監控,並且自動找出橫向與縱向的關聯,「Dynatrace從部署開始便已經做到自動化,只需要幾個簡單的點選即可完成OneAgent安裝,還能橫跨各個不同平台。關鍵是OneAgent非常輕量,在測試環境中,幾乎感覺不到它的存在,也是Dynatrace引以為豪之處。」他說。
另一項專利技術則是PurePath,此技術可記錄到非常細節的層面,甚至深入到程式碼分析。舉例而言,企業若是想針對應用程式效能調校,PurePath可以深入到Code-level查看效能表現,追蹤每個交易端到端程式碼執行路徑,並且判斷效能瓶頸點在於何處,因此AP同仁在故障排除時便能有更明確的改善方向。
Smartscape則用以協助畫出交易的拓撲圖,而且是自動構建,完全不需要任何手動配置、額外的檢測或腳本,蘇義傑進一步說明,好處是,企業可以很容易地知道影響的範圍,而且藉由人工智慧協助,也能輕鬆地得知出現異常的原因是來自於系統資源而非程式本身所造成,如此一來,問題的釐清也更容易。
log4shell突顯資安重要性
繼2021年爆發log4shell事件後,2022年再度發生Java Spring Framework的漏洞事件(CVE-2022-22965),在在都顯示出應用程式安全的重要性。對此,Dynatrace也推出Application Security功能,透過與第三方業者Snyk合作,可在Runtime環境中偵測漏洞,發出告警,協助企業用最短時間定位漏洞所在,並採取進一步行動。
「log4shell事件爆發後,不少企業開始著手盤點,然而人工盤點至少就花費一週以上的時間,而且即使完成盤點,也沒有十足的把握完全正確,」蘇義傑指出,對Dynatrace而言,因為平常就已經收集這些資料,只需要與強而有力的漏洞資料庫比對即可,由於Dynatrace早已與Snyk合作,當時Snyk在半小時內便已更新他們的漏洞資料庫,而Dynatrace最快的一個客戶在20分鐘內就開始進行掃描的工作,「換言之,從國際組織公布漏洞到第一位企業客戶套用更新,其實不到一小時的時間。」
變革催化需求
根據Reportlinker發布的AIOps全球市場報告,2022年全球AIOps市場達58.1億美元,預估2026年將增長到151億美元。報告內容指出,隨著人工智慧(AI)在各個領域的應用愈來愈廣,將持續推動AIOps的需求。
叡揚資訊系統事業處處長何玉雲觀察,新冠疫情改變了企業工作模式,也讓企業意識到不能把特定能力只放在特定的人員身上,再加上為了維持正常的營運,企業將部分的資訊環境改放到雲端,這些變革都是催化AIOps的因素。
「其實每家企業都需要AIOps的協助。只是以往IT設備部署在企業內部環境,也管理得很好,企業雖然覺得AIOps不錯,但好像也沒有那麼急迫性。」她指出,改變企業思維的關鍵點是企業開始大幅採用雲端服務以及容器與微服務技術出現,IT環境的複雜度以及其所產生的大量資料,在在都讓使用單位不得不關注AIOps,「這兩年在推動AIOps的過程中,企業的反應也都也往年要正面許多。雖然明年整個大環境並沒有那麼看好,但雲端會是一個很大的催化劑,而且應用程式安全模組也會有所加值,總體而言,還是樂觀看待企業需求。」