企業與整體市場日趨數位化,對於數據的掌握與分析將會成為每間企業不可或缺的基石,而資料庫在未來仍將是企業進行數據分析、從中獲取資訊,邁向成功的關鍵,對此本文將闡述四種可協助企業於疫情後搶得先機的資料庫趨勢。
新冠肺炎疫情期間,企業數位轉型需求崛起,且極有可能在未來持續成長。儘管疫情對於未來全球經濟所帶來的實質影響尚未明朗,不過全球科技諮詢與研究調查公司IDC預測未來數位轉型將持續幫助全球經濟對抗疫情的影響。此外,IDC也預測,亞太區於2020至2023年之間投入於數位轉型的花費將高達1.2兆美元。
隨著企業與整體市場日趨數位化,對於數據的掌握與分析將會成為每間企業不可或缺的基石,而資料庫在未來仍將是企業進行數據分析、從中獲取資訊,邁向成功的關鍵。
以下是四種可協助企業於疫情後搶得先機的資料庫趨勢:
混合事務分析處理(HTAP):大數據與資料庫
過去十年間,資料庫與大數據分析之間,彼此在功能中存在顯著的差異。前者主要負責線上的工作承載,後者則是強調處理大量的數據資料。然而,從應用層面來看,一套能夠解決數據生成、運行處理、儲存以及消費的系統,能為消費者創造出更優化的零售網站瀏覽及服務體驗。
對於零售電商企業而言,每天需要同步上百萬筆交易,每一筆交易都包含了來自數個不同屬性的資料庫數據,以優化推薦商品的能力,提升消費者的使用體驗。這看似是項大工程,然而若能做到線上批次運算工作負載整合或融入使用混合事務分析處理時,將能輕易地解決這些問題。這將會是未來十年持續成長的資料庫趨勢,也正因如此,研究顧問公司Gartner才將OPDBMS(操作型資料庫管理系統,Operational Database Management Systems)與DMSA(分析型數據管理解決方案,Data Management Solutions for Analytics)兩個本身分開領域合二爲一,HTAP正是這兩種領域之間整合的關鍵原因。
雲端原生與分散式處理技術
眾所皆知,越來越多機構單位採用雲端基礎設施,這些企業不只將公司的一般運作應用移轉到雲端上,同時也包含許多企業內部的關鍵技術應用與數據資料。
根據Gartner近期的產業研究調查指出,2022年前全球將會有75%的資料庫移轉到雲端。此現象意味著這些公司、企業將需要能支援雲原生架構的雲端服務與解決方案。
事實上,許多企業早已開始提前布局,主動研發或採購適當的雲原生服務應用,讓企業業務流程能更加彈性與動態。 一旦與分散式處理技術結合,無須架設繁瑣的基礎設施,使用者即可輕鬆、便捷地享受雲原生資料庫所帶來的高彈性、高可用性優點。
人工智慧與自主驅動的資料庫
雲端運算已改變了我們生活中的一切,因為它推動了數據領域的成長,然而我們距離真正的人工智慧還有一大段距離。當今使用的網路為深度神經網路,這套系統會需要大量的數據作為判定、運算的基底,方可作為有效的應用。
現今的人工智慧如同一個不斷收集資料的黑盒子,不過,目前也亦有一些將人工智慧用於開創性、啟發性技術的成功案例,例如阿里巴巴達摩院近期即發布了中文社群最大規模的預訓練語言模型PLUG(Pre-training for Language Understanding and Generation),希望透過超大模型的能力,幫助作家及撰稿員等真人提升文案創作能力。
如今,人工智慧在資料庫的領域中再創突破。為了達成自主驅動型資料庫的目標,必須讓資料庫能夠全自動化。不過,讓資料庫全自動化的挑戰在於每一位使用者之間的需求、用途存在著極大的差異,因此較難將整體的資料處理流程做到全自動化。 然而,依然能在許多日常的場景中應用人工智慧。舉例來說,我們能夠協助不同工作型態需求,包括電子商務或其他傳統企業系統,依照工作負載量調整其系統參數來優化系統,使其減少延遲並提升可擴展性。同時,也透過機器學習演算法來確保資料庫的運行以及安全無虞。
多模型資料庫
關聯型資料庫已成為當今主流,不過,仍然有許多不同型態的資料庫,例如文件導向的資料庫、圖資料庫、時間序列、三元組資料庫等。在當今快速數位化的時代,企業面臨到最大的挑戰仍然是如何從高度異質化的資料中提取有效的洞悉,以充分利用人工智慧、物聯網等最新科技。
未來的資料庫將會使用雲原生設計來解耦儲存空間及運算,並與各種開源標準接口兼容。同時也將支援開源系統之間的切換,並且與多個電腦運算和分析引擎無縫連接。
這一類型的多模型資料庫將會支援寬欄位資料表和時間序列,以及結構化、半結構化與未結構化的資料儲存和分析。這些系統性支援,特別是多模型的資料儲存、運算與分析裝置元資料、裝置操作數據(時間序列資料)、設備日誌等,將為物聯網的性能帶來極大的改善。
<本文作者:李飛飛現為阿里巴巴集團副總裁、阿里雲智能數據庫產品事業部總裁。>