Oracle Autonomous Data Warehouse Cloud Amazon Redshift Data Warehouse Concurrency Autonomous Oracle OLTP

機器學習具自動維運能力 資料庫管理邁向新時代

2018-06-14
近期甲骨文發布新世代資料庫的發展方向,主要圍繞在雲端平台所提供的自動化(Autonomous)服務,運用機器學習技術讓資料庫具備自主判斷與執行能力,藉此減少專業人力介入管理的需求。
甲骨文大中華區台灣技術諮詢部總監黃久安指出,日前已上線開始提供服務的是自動化資料倉儲雲端服務(Oracle Autonomous Data Warehouse Cloud),運行在Exadata架構平台,採用的資料庫為最新的Oracle 18c版,預計今年(2018)稍晚將推出OLTP(線上交易處理)雲端服務版。

既有Oracle資料庫的用戶,不論是否建置在Exadata主機環境,可透過自攜授權(BYOL)模式調整遷移的配置。黃久安舉例,若擁有10顆處理器授權,可選擇於地端保留8顆處理器授權,其他授權則轉移到雲端平台啟用。

現階段評估把資料庫遷移到公有雲平台的考量,各產業大多相同,除了是企業整體策略發展的問題以外,萬一資料庫檔案過大,透過網路傳輸往往須耗費相當長時間。對此,甲骨文提供的服務項目之一,可協助初始啟用雲端服務的用戶,把地端資料庫的檔案複製到硬碟或儲存設備,再寄送到甲骨文資料中心執行匯入雲端資料庫系統,之後增添的資料再透過網路傳輸即可;也可選用甲骨文已提供的FastConnect方案,概念上等同於地端透過專線連接到資料中心。

運用自動化技術突破無效率工作模式

在新興的資訊科技技術發展下,有愈來愈多產業積極投入建立自動化,用以突破傳統無效率的工作模式,資料庫系統也不例外,同樣須進化邁向新世代。黃久安指出,甲骨文提出的自動化機制,主要包含自動管理(Self-Driving)、自動安全(Self-Securing)、自動修復(Self-Repairing)等三大特性。

在自動管理方面,可協助資料庫管理者(DBA)降低執行調校、備份、監看運行狀態等工作上的負擔,並依據應用系統需求彈性擴展或縮減實體資源。較特別的是自動化執行安裝修補更新程式,也就是自動安全的特性之一,主要是藉由定義控管政策,以機器學習演算偵測解析日誌資料來觸發執行,並且在不停機的狀態下完成。至於自動修復能力方面,透過已建置的高可用性架構,來防範資料庫系統故障,可靠度能達到99.995%,包含計畫性停機時間一年不到半小時。

「如此一來,具備自動化特性的雲端平台即可有效降低管理成本支出,減少大約八成的工作無需專業人力介入,也不用採購額外的顧問服務。同時也降低大約七成的停機成本,對於必須持續不中斷的營運系統而言相當有幫助。」黃久安說。

隨著自動化資料倉儲雲端服務正式上線,對於需要建置資料倉儲系統的企業用戶而言,不僅可省去採購大型實體主機,以及軟硬整合資料的規畫,如今利用雲端平台的特性,在數秒時間內開通後,資料載入即可啟用運行,企業用戶亦可藉由資料庫提供的機器學習演算法來分析數據。

機器學習解讀日誌判斷與安裝修補更新

傳統資料倉儲系統載入資料後,為了提升整體運行速度,必須得由DBA或專業顧問人員協助建立索引,選用自動化資料倉儲雲端服務建置,則可由系統自行判斷與執行。其實在12c的版本時就已經具備可輔助DBA調校的機制,只是需要人力介入,例如甲骨文提供的Tuning Pack,會根據資料庫運行狀態提出建議的實作方法包含建立索引,但須由DBA決定是否執行與評估成效。如今透過自動化機制來判斷,把基本技術定義為控管政策,藉由機器學習演算分析即可執行判斷是否應該建立索引,能大幅降低DBA的負擔。

對於內部應用系統較多的IT環境,常見的狀況是存在多種資料庫軟體,可透過甲骨文提供的遷移工具來執行,黃久安強調,「包含Amazon Redshift資料倉儲雲端服務,亦可藉由工具進行搬遷。畢竟Oracle資料庫技術發展已經相當成熟,不管是資料倉儲或交易式應用,資料庫系統並行控制(Concurrency)功能,皆可在不影響運行效能的狀況下,提供多個用戶與Workload同時存取。」


▲甲骨文自動化資料倉儲雲端服務正式上線,運行在Exadata架構平台,採用的資料庫為最新的Oracle 18c版,預計今年將再推出OLTP雲端服務。(資料來源:Oracle)

實際上,資料庫或作業系統安裝修補更新的動作,對於DBA與IT管理者而言,為了避免發生相容性衝突等問題而影響應用服務正常運行,通常必須先在測試環境中確認後才會實際安裝;抑或是當資料庫系統出現告警通知時,必須由經驗深厚的技術人員,才得以釐清究竟是程式碼撰寫邏輯的漏洞,還是資料庫系統本身所造成。若問題根源在資料庫系統,技術人員必須透過全球知識庫中找尋相似的告警資訊,輔助解讀告警描述內容,進而找到可解決問題的修補程式編號。萬一是發生記憶體洩漏(Memory Leak)等告警事件,主因來自於Java程式撰寫不良,就並非為安裝修補程式可解決。諸如此類維持服務不中斷的維運工作,其實相當耗費技術人力與時間。

「新世代的作法應該是利用機器學習演算技術來執行,先蒐集所有相關的日誌,經過訓練完成的資料模型解析,發現特定的關鍵字後,進一步查看資料庫修補程式編號。就如同經驗豐富的工程師,統整資料庫日常運行資訊,以便安裝合適的修補更新。」

其實現代資料庫系統的架構設計,在資料庫引擎、執行程序之間交互作用、使用者資料運作等方面,已經建立更精密的切割,因此特定修補程式發布時已可在背景自動安裝完成。

「多數客戶會猶豫安裝更新修補後,連帶影響其他系統運行,因此不敢輕易安裝,或是必須遵守標準工作流程中制定的規範,安裝程式或調整參數設定皆須經過測試驗證。這方面的疑慮若在十年前,我可以認同,當時安裝修補程式後出現不知名的錯誤確實是常見的狀況。但是隨著Oracle資料庫的演進,成熟度逐年提升,安裝程式或調整參數設定的動作,已不至於影響線上應用系統,足以信任機器學習演算來建立更多自動化機制。」黃久安強調。


追蹤我們Featrue us

本站使用cookie及相關技術分析來改善使用者體驗。瞭解更多

我知道了!