生成式AI 資料架構 儲存 非結構化資料

資料架構助攻生成式AI

2024-06-28
企業領導者在運用AI和生成式AI技術前,須確認自身的儲存解決方案是否足以勝任。未來,具有擴充性、安全且符合經濟效益的資料架構將使企業在AI競爭中脫穎而出。

人工智慧(AI)與生成式AI在2023年成為炙手可熱的技術之一,近期一項調查顯示,76% IT決策者認為生成式AI將對其企業產生變革性影響。麥肯錫預估生成式AI每年可為全球經濟增加2.6到4.4兆美元。

然而,企業在建立大量資料和訓練生成式AI模型的同時,卻也將產生大量的資料負擔。企業領導者在運用AI和生成式AI技術前,須確認自身的儲存解決方案是否足以勝任。未來,具有擴充性、安全且符合經濟效益的資料架構將使企業在AI競爭中脫穎而出。

顯然,企業必須調整至最佳狀態,以有效面對生成式AI的龐大資料管理需求並成功部署,避免因儲存空間不足或設計不當而導致作業流程變慢的情況。傳統的儲存系統難以跟上資料爆炸的步伐,隨著生成式AI系統的發展和用於處理新式更複雜任務的需求增加,對儲存系統的要求只會不斷提升。

根據調查,每年非結構化資料佔據資料總量的九成以上,由於其價值和龐大的數量,因此非結構化資料特別易受威脅,企業須採用新方法,以符合成本效益的方式儲存大規模且複雜的資料,同時避免網路罪犯入侵。

許多企業改採雲端優先策略,將資料存在多個公有雲環境中,以提高資料移動、存取、可擴充性和保護的效能。雖然在短期內能解決問題,但長遠來看,不斷攀升的成本、安全問題和資料最佳化等挑戰也隨之而來。為了讓生成式AI真正發揮作用,簡便地存取資料是關鍵,而雲端優先策略往往難以實現。各企業應尋求Multicloud by Design方法,此舉將有助於企業在短期和長期內釋放多雲環境的潛力,也不會受專有工具和服務的孤立生態系統制約,並且能以一致方式管理多雲環境的資料儲存、保護和安全作業。

企業需要新穎方法來滿足生成式AI的特定要求和龐大、多樣化的資料集,而善用分散式儲存、資料壓縮和資料索引將有助於提升執行效能、效率且節省成本。其中,分散式儲存能強化生成式AI系統的可擴充和可靠性,例如當需求增加時企業可在多個節點上快速擴充儲存需求,還能複製關鍵資料,將其存放在單獨位置,在發生網路攻擊時能輕鬆檢索;而資料壓縮可以解決部分的成本問題,提高分析資料效率和刪除不必要的資訊,以減少企業所需的儲存量,進而節省成本;此外,善用資料索引來提升檢索能力,也能將資料整理到特定位置,提高搜尋能力、訓練速度和效率。

AI與生成式AI是競爭優勢的重要推手,也是顛覆市場的利器,但必須正確部署。未來將擁有極大機會,而透過尖端技術來實現此一目標的企業將更具競爭力。

<本文作者:廖仁祥現為台灣戴爾科技集團總經理>


追蹤我們Featrue us

本站使用cookie及相關技術分析來改善使用者體驗。瞭解更多

我知道了!