根據PwC近期發布的調查指出,有五分之三的高階主管計畫在未來的一年至一年半內投資新技術,而生成式AI是近一半的高階主管首要的業務優先事項。雖然企業對採用生成式AI很感興趣,但是在新技術投資中如何找尋可衡量的價值,幾乎是所有高階主管都會面臨的挑戰。
為了協助企業做好生成式AI的準備工作,Dell在近期也定義了一個框架,涵蓋AI就緒程度的六個面向,包含策略與治理(Strategy and Governance)、資料管理(Data Management)、人工智慧模型(AI Models)、平台技術與營運(Platform Technology and Operations)、人員技能和組織(People, Skills and Organization)以及採用和適應(Adoption and Adaptation)。
達成共識是第一步
Dell認為達成共識是企業組織在轉型策略中非常重要的一環,因此建議企業從一系列有針對性的策略研討會開始,確保每個人對組織的未來以及如何實現這一目標都有一致的想法與願景。而了解使用案例也很重要,有時候企業難以決定優先順序,參考潛在的使用案例可以讓生成式AI擴展到企業各個角落。
提供即時且良好的資料也是GenAI的成功關鍵,可擴展的資料管理將是推動生成式AI的關鍵因素,且企業應該確保資料在使用前是乾淨的,從而減少錯誤、偏見以及防範資料外洩;另外,AI模型選擇應該兼顧使用者體驗、營運、公平、隱私及安全,但模型的選擇只是一個開始,具有高就緒程度的企業會建立評估所選模型效能的流程,並且定期調整模型參數以優化有效性。
一旦企業選擇了應用場景以及模型,就需要值得信賴的基礎架構平台來執行,這其中AI資料與多種來源的無縫整合也很重要。當然,提升技能與組織能力也很重要,擁有AI技能的人會更容易擁抱生成式AI。最後,雖然最初的策略會議有助於建構早期視野,但是業務與IT團隊還是必須繼續合作,將GenAI整合到新計畫中。
Project Helix提供完整解決方案
在此框架下,Dell也宣布與NVIDIA合作Project Helix計畫,此計畫將提供一系列完整的解決方案,這些解決方案具備技術專業知識以及基於Dell和NVIDIA基礎架構和軟體的預建工具,以協助企業使用其專有資料,更易於負責任和準確地部署生成式AI。其中,Dell與NVIDIA合作的Validated Design為經過預先測試及實證的配置,企業可選擇Dell PowerEdge XE9680或PowerEdge R760xa等設備來支援生成式AI應用,並且搭配以NVIDIA Tensor Core GPU、NVIDIA AI Enterprise軟體、NVIDIA NeMo端到端框架及Dell軟體作為核心。在儲存設備方面也有彈性且可擴展的非結構化資料儲存,如Dell PowerScale和Dell ECS等選擇。
除了IT基礎架構之外,Dell也提供特別的顧問服務,以協助企業找到適合的應用場景,並且協助進行概念驗證(POC)。戴爾科技集團技術副總經理梁匯華指出,雖然技術與基礎架構的複雜度對企業而言是一項挑戰,但一直以來,生成式AI最難的部分其實是如何把它應用在企業環境中,Dell深知企業難處,因此希望透過工作坊(Workshop)來與企業互動,並且把教育及認知帶到企業環境中。「企業在執行專案的過程,會由不同的部門與人員來共同參與,問題在於並非每位同仁都知道為何要導入生成式AI,工作坊可以協助所有人取得共識,並且推進專案的進行。」
他提到,工作坊最主要的目標是收集企業內的想法、意見以及遇到的問題,再把可能的機會收攏,並且帶領企業一步步地找到方法,因為主持工作坊的人員都是Dell內部極具經驗的資料科學家,藉由分享企業成功案例,不僅可激發企業產生新的創新的想法,同時建立起彼此的信任度。「Dell的初衷就是協助企業去發想可能的應用,如果企業想像不了,自然就不會有使用案例,更不會有動力再往下挖掘究竟LLM在企業環境中可能提供哪些助益。我們已經有一個標準的框架,可以協助企業收斂想法,找到具有意義且可行性較高的試驗場景。」
目前工作坊共分為兩個階段,探索(Discover)工作坊主要是協助企業找尋目標,一旦找到目標,AI加速(Acceleration)工作坊可以建構概念驗證,讓企業對生成式AI有感,並且往下進行。而且過程中完全不收取費用,在為期4至6周的POC結束後,便會交由企業繼續完成或是部署。透過這個方法,企業將能知道可行性如何以及能否實現。
預驗證簡化企業建置複雜度
生成式AI潛藏著巨大潛力,不僅能運用在客戶服務、內容創作、銷售行銷、產品設計,也能用於教育創建學習體驗以及偵測並防止金融交易或其他環境的詐欺。典型的客服運用例如位於美國德州的Amarillo市政府,便計畫運用生成式AI來打造一款線上數位助理,為居民提供有關政府和城市服務的詳細資訊。未來訪客也可以用多種語言對數位助理詢問,立即獲得相關資訊。
儘管生成式AI可望對許多產業帶來變革,但是技術與基礎架構所帶來的複雜性,卻往往也成為企業亟需克服的問題。舉例而言,到底該不該把資料全部上傳到雲端進行訓練,除了資料安全考量外,若企業所有的基礎架構以及應用都在地端,在雲端訓練完後,模型的推論還是得在地端上執行。又或者是,雖然企業嘗試運用開源平台在地端搭建,畢竟架構極為龐大,過程中又遭遇許多沒有辦法解決的問題,最終往往因為人力技能問題而遭遇失敗。「Validated Design的意義是希望根據企業不同需求,搭建屬於該企業的平台,而且由於已經通過驗證,可以大幅簡化企業建置難度。」梁匯華說。
不過,他也坦承,以台灣企業目前的現況,真正從模型訓練開始做起的企業其實極為少數,大多數的企業主要是利用預訓練(Pre-training)模型回到企業內部再進行微調(Fine Tuning),甚至有些企業連微調都不需要,只有推論的需求。另外,部分企業只希望能夠做到類ChatGPT模式,在提問時可以有一個很快的方法,能從幾百萬或幾千萬個文件中找到該文件或定位出哪一句、哪一行,並且協助做摘要即可,並不需要理解完所有的資料再回答,這時透過RAG技術來優化,就能找到所有相關的資料。
梁匯華最後強調,在微調之前,並不是提供文本就好,仍須完成資料清洗的功能,這些Data Pipeline的準備還是必須的,如此才能重新進行訓練。「在生成式AI議題中,有許多人把焦點都放在GPU,其實關鍵還是在於要用什麼樣的資料來訓練AI,企業必須用資料去建構AI的基礎。」