資料架構助攻生成式AI

2024-06-28

廖仁祥

企業領導者在運用AI和生成式AI技術前，須確認自身的儲存解決方案是否足以勝任。未來，具有擴充性、安全且符合經濟效益的資料架構將使企業在AI競爭中脫穎而出。

人工智慧（AI）與生成式AI在2023年成為炙手可熱的技術之一，近期一項調查顯示，76% IT決策者認為生成式AI將對其企業產生變革性影響。麥肯錫預估生成式AI每年可為全球經濟增加2.6到4.4兆美元。

然而，企業在建立大量資料和訓練生成式AI模型的同時，卻也將產生大量的資料負擔。企業領導者在運用AI和生成式AI技術前，須確認自身的儲存解決方案是否足以勝任。未來，具有擴充性、安全且符合經濟效益的資料架構將使企業在AI競爭中脫穎而出。

顯然，企業必須調整至最佳狀態，以有效面對生成式AI的龐大資料管理需求並成功部署，避免因儲存空間不足或設計不當而導致作業流程變慢的情況。傳統的儲存系統難以跟上資料爆炸的步伐，隨著生成式AI系統的發展和用於處理新式更複雜任務的需求增加，對儲存系統的要求只會不斷提升。

根據調查，每年非結構化資料佔據資料總量的九成以上，由於其價值和龐大的數量，因此非結構化資料特別易受威脅，企業須採用新方法，以符合成本效益的方式儲存大規模且複雜的資料，同時避免網路罪犯入侵。

許多企業改採雲端優先策略，將資料存在多個公有雲環境中，以提高資料移動、存取、可擴充性和保護的效能。雖然在短期內能解決問題，但長遠來看，不斷攀升的成本、安全問題和資料最佳化等挑戰也隨之而來。為了讓生成式AI真正發揮作用，簡便地存取資料是關鍵，而雲端優先策略往往難以實現。各企業應尋求Multicloud by Design方法，此舉將有助於企業在短期和長期內釋放多雲環境的潛力，也不會受專有工具和服務的孤立生態系統制約，並且能以一致方式管理多雲環境的資料儲存、保護和安全作業。

企業需要新穎方法來滿足生成式AI的特定要求和龐大、多樣化的資料集，而善用分散式儲存、資料壓縮和資料索引將有助於提升執行效能、效率且節省成本。其中，分散式儲存能強化生成式AI系統的可擴充和可靠性，例如當需求增加時企業可在多個節點上快速擴充儲存需求，還能複製關鍵資料，將其存放在單獨位置，在發生網路攻擊時能輕鬆檢索；而資料壓縮可以解決部分的成本問題，提高分析資料效率和刪除不必要的資訊，以減少企業所需的儲存量，進而節省成本；此外，善用資料索引來提升檢索能力，也能將資料整理到特定位置，提高搜尋能力、訓練速度和效率。

AI與生成式AI是競爭優勢的重要推手，也是顛覆市場的利器，但必須正確部署。未來將擁有極大機會，而透過尖端技術來實現此一目標的企業將更具競爭力。

＜本文作者：廖仁祥現為台灣戴爾科技集團總經理＞