隨著數位化轉型的推動,企業面對資料與分析(D&A)策略逐漸偏重於高價資料的洞察,對企業的競爭力也產生重大影響。隨著人工智慧應用的推動,企業需要利用情境豐富的資料進行智慧決策,這突顯了質性資料分析與非結構化資料的價值。
傳統的企業架構往往專注於特定的業務應用程式和關聯式資料技術,這導致資料在不同的系統和應用程式之間被孤立和分散化。結果,資料無法有效整合和共享,導致難以獲得全面性的業務洞察。低品質、管理不善將導致資料不完整、重複錯誤等問題,降低了業務敏捷性並增加營運成本。相比之下,資料中心的運作將資料視為一種資產,每個獨立業務環境轉化成資料共享機制,能更靈活地獲取企業知識。
當企業尋求創新技術以實現業務價值,必須將資料基礎架構與企業的業務決策和計畫緊密結合。然而,企業在實現資料策略所帶來的業務價值時,必須克服三大主要障礙,第一是企業架構是否與企業長期目標脫節,大多數企業以DIY IT專案方式考量,忽視了資料治理和管理;其次資料操作的人和資料價值,企業內部與管理使用資料最頻繁的業務或特定領域部門,他們的參與是資料治理過程中的關鍵;第三是資料存取的挑戰,包括新的資料察覺交付機制和新技術,如檢索、商業智慧(BI)、分析以及中小企業如何應用資料科學做出明智決策,符合客戶需求。
要實現最佳的資料運作,建議面對不同技術和平台時,有效地整合和利用資料資源,避免分散化,以及善用完整資料集,或其子集進行操作。例如使用資料湖作為集中的儲存空間,資料集線器用於多源資料整合,湖倉(Lake House)用於分析與報告生成。但企業面對實際運作時,由於各個技術平台具有特定的專業能力,實現統一的資訊空間是一個目標,也會是一項重大挑戰。保持資料實體的完整性非常重要,這樣才能確保各種應用程式和報告能夠依賴準確和一致的資料集進行操作和分析。
為了應對這些障礙,現代資料架構是未來資料管理的願景實現,如Data Fabric、Data Hub、Data Mesh、RAG和知識圖等,企業的現有團隊和技能就能利用這些架構在複雜且分散的環境中管理資料。Data Fabric旨在簡化跨多個孤立和系統的資料管理和檢索,提供統一且無縫的資料存取、共享和治理。Data Hub則作為中心化的資料管理平台,透過機器學習等技術來進行資料整合和管理。
此外,Data Mesh採用分散化的方法,強調領域導向的資料所有權和自助存取,提供更具擴展性和靈活性的基礎設施。知識圖則利用語義技術建構知識關係,促進機器和人類可讀的格式,支援更智慧化的應用和AI模型的發展。這些架構結合了元資料和語義層的概念,有助於企業建立更完整、高效且具備彈性的資料治理和管理機制。
<本文作者:John Yang現為Progress 亞太區銷售副總裁>