當關鍵應用系統開始演進到微服務架構,部署到容器環境運行,既有的商業軟體勢必會受到影響,也必須轉型跟進,後端資料庫系統尤其如此。近期國際調研機構Forrester針對傳統資料庫系統市場提出新看法,認為交易分析資料庫(Translytical Database)將會顛覆既有模式,為現代化應用架構提供即時、高效能、可擴充、高度整合的資料庫平台,並且支援地端與雲端部署,運行機器學習、串流分析(Streaming Analytics),處理多種管道來源所餵入的資料或分析報表。
甲骨文台灣區技術諮詢處技術總監黃久安指出,Translytical資料平台是Forrester調研機構提出的新市場,就字義上解讀可發現應是來自於Transaction與Analytical的整合運行,也就是資料庫最重要的線上交易處理(Online Transaction Processing,OLTP)與線上分析處理(Online Analytical Processing,OLAP)系統。
OLTP與OLAP整合加速資料分析
以定義上來看,黃久安引述Forrester提出的觀點說明Translytical資料平台應具備的能力,首先是可同時滿足線上交易與大數據分析的應用模式;其次是自動化機制輔助執行前述兩種實作;第三點要能夠支撐大規模資料量,尤其是OLAP應用環境,同時必須軟硬體都能夠支援實體持續性記憶體(Persistent Memory)技術;第四點是部署模式可依據需求建構在地端或雲端平台。
年初時甲骨文在全球大會中發布融合(Converged)資料庫,內建的引擎可支援JSON、圖形(Graph)、空間(Spatial)等各式檔案類型,讓物聯網、區塊鏈、機器學習等多種現代常見的工作負載,以及時下主流的微服務架構的應用開發,皆得以藉由融合資料庫平台統一提供。甲骨文設計融合資料庫的著眼點,即等同於Forrester對於新世代Translytical資料庫平台的定義。
「隨著數位化商業模式的興起,應用系統著手逐步轉型到微服務架構,若資料庫仍無法打破過去慣例,讓OLTP與OLAP整合運行,此後發展勢必會受限。倘若僅持續地端方案的研發,不具備部署於雲端原生平台的能力,即使是老牌資料庫最終也可能難以在市場上立足。」黃久安說。主要因素是數位化應用對於資料分析的即時性愈來愈看重。
即時分析能力的特性是資料會不間斷地被餵入,採以批次處理模式根本無法因應,這正是各家企業正在積極改善的方向,過去壁壘分明的OLTP與OLAP系統整合運行才得以達成。例如銀行、證券業,交易系統都是OLTP,資料倉儲則是另外一套系統,現階段正積極地進行改造整合。
自主資料庫大幅減少人力介入維運
除了強調OLTP與OLAP整合,甲骨文對於自動化機制的發展,早在2年前(2018)推出的自主資料庫(Autonomous Database)就已經具備。黃久安進一步提到,自主資料庫有區分為ADW(Autonomous Data Warehouse)、ATP(Autonomous Transaction Processing),兩種都是部署在雲端平台上的資料庫。本質上皆具備自主驅動、自主保護與自我修復的特性,藉此消弭複雜性、人為錯誤和手動管理等問題,並以最低的成本達成更高可靠度與安全性。
其具備的自動化程度可讓管理者完全看不到作業系統,登入後即可直接餵入資料執行查詢等操作,省去調校、安裝修補更新程式等維運工作。對於多數本土企業而言,欲發展人工智慧相關應用,資料庫部署在雲端平台可說是大勢所趨,及早扭轉心態上認為安全方面有疑慮的障礙,適應有別於地端的操作習慣,才有能力解決應用系統各自擁有獨立資料庫必須經過彙整到大數據平台來運行機器學習演算分析,這種難以貼近即時的分析問題。
前述提到的持續性記憶體技術,甲骨文是攜手Intel建立合作夥伴關係,會持續跟進新發布的晶片,藉由整合運行進一步提升效能。例如Oracle Exadata最新提出的第8代,為了跟進Intel最新處理器技術,又推出Oracle Exadata X8M新款一體機,可支援持續性記憶體。
至於部署模式,甲骨文資料庫更是早在2013年推出12c版本時,就已經提供地端、雲端,以及可被部署在企業端的雲端平台(Cloud at Customer)等多種方式可搭配現代應用場景。
內建區塊鏈資料表防制詐欺
雲端原生的應用層演進到微服務架構,可提高隨需遷移、重複利用率,進而驅動容器環境部署模式,因而大受歡迎。黃久安說明,微服務部署在Kubernetes叢集環境,其中包含Datastore容器,執行圖像、財務、文字等應用處理。現在的公有雲平台服務供應商,可提供的資料庫環境並不具備Translytical的能力,而是針對不同資料,運用不同技術執行處理。
他解釋,「在容器環境中配置各自Datastore的應用模式,對於具備一定規模的IT環境而言,勢必得考量擴充性與合規性,較難符合需求。Translytical作法是把各種不同應用場景的Datastore整合在單一平台,以多租戶的方式提供運用,更能滿足現代化的需要。」 甲骨文設計的資料庫即是基於多租戶方式讓容器環境得以整合應用,意味著即使容器環境部署在相同的執行個體,資料庫皆為實體隔離。此機制在Oracle 12c時就已經具備,同時可支援JSON資料型態。早期就已運用機器學習執行資料探勘,持續發展至今累積更多演算法,基於資料庫的預存程序(Stored Procedure)整合運行。這些技術延續至今已是19版,今年將推出第20版,可進一步提升融合資料庫相關技術的成熟度。
例如非專家等級的管理者也可以利用OML4Py AutoML機器學習,自動化特徵選擇(Feature Selection)並調整超參數,進而大幅提升資料模型準確性;內建原生區塊鏈資料表,可利用區塊鏈技術來識別和防範詐欺。其類似於標準資料表,允許SQL指令插入值,且所插入的列(Row)都將以加密方式連結。使用者可以選擇對每列資料簽名認證,來杜絕身份詐欺。
「區塊鏈的精神在於交易資料寫入後不得竄改,且須加密存放,實際上資料庫系統本身已經具備相關機制,只要經過設定即可應用,為了讓客戶更加簡單好上手,特別增加區塊鏈資料表,已經先行設定好必要的不可竄改、加密等特性,開發人員只要直接新增資料表即可。」黃久安說。