熱門活動精彩回顧都在這

混合引擎速度成本更有利　正確認知挑對場景模型

2024-11-13

余采霏

「CaiGunn開講」不僅可以提供使用者與大型語言模型互動對話，還能將其嵌入到各種應用情境，例如應用在客服或是用來打造知識管理系統，甚至還可以整合APMIC自身研發的CRM客戶管理系統，打造出聊天機器人。

致力於為企業打造自身專屬的AI數位大腦，且讓人人都可以輕鬆使用，APMIC自創立以來即投入在語言模型領域，累積了七年自然語言理解（NLU）核心技術能量。隨著生成式AI崛起，APMIC也投入大型語言模型研發，是台灣極少數投入在地化大型語言模型研發的生成式AI獨立軟體供應商。其所研發的「CaiGunn開講」（源自台語的「聊天」），不僅可以提供使用者與大型語言模型互動對話，還能將其嵌入到各種應用情境，例如應用在客服或是用來打造知識管理系統，甚至還可以整合APMIC自身研發的CRM客戶管理系統，打造出聊天機器人。不只如此，企業也能將此聊天機器人嵌入到網頁，或結合原本就已經有串接好的LINE、Messenger第三方的訊息平台，讓大型語言模型可以根據不同管道與使用者互動。

順勢語言模型發展　混合引擎更快更省成本

APMIC創辦人暨執行長吳柏翰指出，APMIC的願景是協助企業打造出最聰明且接地氣的企業AI大腦，只要將現有的文章、網站或是文件資料上傳，不需要任何程式編寫或數據處理知識，只需要透過直覺或對話式使用方式就能輕鬆應用。

他提到，語言模型發展其實是一連串的歷程，從最基礎的自然語言處理（NLP），到自然語言理解（NLU），而後才走到自然語言生成（NLG），因此CaiGunn框架也包含了NLP及NLU，目前在這個框架底下有六項核心工具，包含資料Input、資料預處理、微調、Responsible GenAI、CaiGunn檢索增強生成（C-RAG），以及基於人類回饋的強化學習（Reinforcement Learning from Human Feedback，RLHF）。

在此框架下，CaiGunn採取混合引擎作法，傳統以NLP技術打造的聊天機器人可依關鍵字或規則（Rule-based）來判斷回答，而CaiGunn還會再加上大型語言模型來進行回覆，並透過意圖識別引擎分配，只要是一般標準問答就採規則式回覆，而較複雜的問題就由生成式AI來回答。

「對於企業而言，混合引擎對成本精簡也極有助益。」吳柏翰解釋，不少大型語言模型是以Tokens為單位計費，100萬的Tokens可能要價幾美元，互動累積下來，就會是一項不小的花費。而混合引擎是結合傳統與新型方法來回覆，只把需要較複雜思考的問題交給大型語言模型，如此一來，企業成本就可以降低50%以上，而且回覆的速度也會變快，「一般來說，生成式AI回覆問題的速度會比傳統採取NLP技術的作法要來得慢，混合運用的好處將有助於縮短回覆時間。」

應用場景多元金融、製造與政府已有落地案例

CaiGunn目前已經獲得包含Google、台北市政府、恩益禧（NEC）、台塑生醫、中國信託銀行及亞太電信等800多家橫跨健康、製造、金融、航空、零售等產業採用，可為企業提升服務效率超過30%。

台北市建成地政事務於今年所推出的登記教主（繼承登記法服諮詢）也是應用CaiGunn平台框架建立繼承登記法令的聊天機器人，這個案例中也採用混合引擎的作法，在接收到使用者的問題後就會判斷是由既定腳本回覆，還是由生成式AI來回答。

「其實，金融、製造以及政府單位都已有不少應用場景。」他舉例，製造業較常應用在程式碼轉換跟知識管理場景，例如從C++轉換成Java程式碼的應用案例就有不少；知識管理則是將大量RD文件匯入後，由AI閱讀這些文件，並且答覆可以解決現今遇到的哪些研發問題。

而政府單位則用於審查文件或者是文本分析比較多，例如合約審查、計劃書審查，或是讓AI來閱讀判決書，由於判決書上面有人、事、時、地、物，以及犯罪的方式與流程等等，藉由文本分析，便能找出罪犯的相關犯罪流程。至於金融則應用在導購與加速核保流程等場景中。例如透過生成式AI逐一拆解、分析每個人的行為，並建立導購計劃；保險業則透過自動化核保的機制來加速核保流程。

看重地端部署需求　攜手合作夥伴快速部署

根據調研機構P&S Intelligence調查，2024年全球自然語言理解市場規模為189億美元，到了2030年預估可達803億美元，年複合增長率為27.2%。而除了看好美國對AI技術，尤其是以自然語言理解為核心的龐大技術需求外，APMIC也看好企業將大型語言模型導入地端的市場，認為讓AI模型透過系統整合真正落地的方案是這個時代所需。因此，APMIC也與Dell、HPE等合作夥伴攜手，將其AI伺服器與「CaiGunn開講」軟硬整合，再加上NVIDIA提供的算力，達到地端應用的黃金三角，持續協助客戶更加便利且深入地使用AI。

目前APMIC有兩大類型的企業用戶。其中，中小型企業因受限於預算，多半會採用雲端模型，例如選擇OpenAI模型到企業的服務場景去使用。而大型企業則基於資料的機密與隱私性考量，往往會傾向自行採購伺服器，把大型語言模型落地，並加以微調或進行推論。另外也有一些企業採用混合架構，先把在雲端完成模型的微調，再把該模型部署到地端進行推論，而針對有混合架構或地端部署需求的企業，APMIC也與HPE、Dell合作，透過軟硬整合以協助企業快速部署。

「未來三年，企業地端部署需求一定會增加。」吳柏翰認為，隨著企業對ChatGPT越來越熟練，熟悉程度越來越高，使用線上免費版本已無法滿足企業需求，事實上，早在2023年就有企業編列大量預算，以作為2024年OpenAI的服務費用。但是這些先行企業在試行過程中也發現資料隱私的問題，因此下一階段，企業就會開始規劃於地端部署。

以大模型微調湧現效果更好

另一個驅動因素則來自於地端語言模型做得越來越好，不只是大型語言模型，SLM模型也是如此，隨著企業對於地端模型越來越有信心，市場自然而然就會切割成純粹用雲端的模型跟地端自建模型，而地端應用會再切割成純粹用SLM小模型，與採用較大的大語言模型。

「APMIC鎖定的是較高階的大型語言模型市場，70B以上的參數量，而這也會反映在硬體架構中，最小配置需求至少要搭載1張H100 GPU。」吳柏翰指出，這並不是隨便制定的策略，而是許多成功的案例，其實都是從大模型進行微調，例如OpenAI o1-mini、Gemma 2 9B參數版本，在在都證明了從最大的模型蒸餾成小模型的成功準確率，會比從最小模型微調上去的效果更好，「這很關鍵。如果沒有一個最聰明的模型微調成小模型，而硬是要從8B的模型調校到9B的模型，因為打從一開始理解能力就不好，所以效果自然會有所折扣。瓶頸其實就在於Model Size。」而這也是為何APMIC一開始就採取30B以上的參數模型，原因即在於22B以上的模型在微調後湧現效果會很好，舉一反三。

他強調，生成式AI的關鍵並不在於AI技術而是資料，如果等到三年後最棒的大型語言模型出現才決定導入，其實就已經喪失了競爭力，由於在這三年中企業沒有收集資料，自然而然不知道客群的長相，也不會知道如何讓模型表現更好，自然也無法訓練出專屬於企業的模型，導致競爭力不斷下降。「現在開放的大型語言模型都是通用型，而非適用於垂直領域，而同業訓練好的模型肯定也不會開源出來，如果企業沒有投入私有模型的建立，就無法瞭解垂直領域模型，如此一來，企業營運也會面臨到很大的挑戰。」吳柏翰認為，每家企業都必須要有生成式AI模型，才能去掌握客戶導向，並且讓精煉的客戶屬性成為協助企業發展的關鍵技術。

錯誤認知導致效果不如預期

根據BCG年初公布的調查，幾乎所有高階主管都將人工智慧和GenAI列為2024年的三大技術優先事項，但66%的領導者對於人工智慧和GenAI方面的進展感到矛盾或不滿意，而且只有6%的領導者已經開始以有意義的方式提升技能。

「其實多數企業對於生成式AI的可應用場景，目前還沒有很清楚的認知，」吳柏翰說明，AI可分為預測型AI與生成式AI，預測型AI主要是透過將結構化資料予以分析而進行的預測，不管是廻歸或分類都可以做得很好。而生成式AI則是透過非結構化的資料進行分析與處理，因此企業首要須思考的是，企業導入AI究竟是想解決什麼問題，否則很容易發生導入生成式AI卻沒有產生預期效果的情況。

其次，生成式AI本身的特性是有條件式的，必須知道這個生成式AI本身具備什麼能力，提供正確的資料，才能產出預期的內容。他舉例，近期，國際頂尖科學學術期刊Nature發布一篇研究文章，內容提到了越大的語言模型，對於簡單的問題更容易出錯。這也意謂著簡單的問題，使用小模型的效果反而比大型語言模型要來好，當一個8B參數模型就可以解決的分類問題硬是要使用175B模型來解決時，出錯率反而更高。因此，企業對於應用場景適合的模型大小也須有所認知。

再者，有太多人都認為生成式AI的準確率應該要百分之百，然而這並不是正確的觀念，實務上並不會有百分百的準確率，也不會有99.9999的表現，以RAG為例，準確率大概會落到83.9%，若是採用100B以上的模型就可以實現90%左右的準確率，如果要再往上提高到95%，就要透過微調，但目前並沒有太多的成功案例，因為成本代價過於高昂。因此，「期待值管理」也是企業亟需面對的課題，現今企業想要實現的場景，有八、九成大概都介於大概80%到90%之間的準確率，如果企業挑選的模型較小或是題目難度較高，準確率還會再降低一些，可能只有70%。而不同的準確率會有不同的硬體需求。

除此之外，資料不足也是一項挑戰。生成式AI的關鍵不是結構化資料，而在於非結構化資料，但有不少台灣企業主在數位轉型的過程中忽略了非結構化資料，因而無法達成想要的效果。「另一項挑戰來自於模型的建立門檻，而這也與企業內部人才有關。如果企業找來的團隊根本不熟悉較大型的模型，那麼遇到較困難的題目，非得100B參數模型才能實現時，最後專案會失敗，甚至失去信心，原因就在於企業挑錯方法、挑錯模型，或是沒有把情境鎖定。」當然，台灣具有語言模型專業人才並不多也是潛在問題，因為不瞭解過去語言模型的發展，也就很難完善的處理企業的問題。最後則是算力問題，「目前來看，算力還是不便宜，但隨著算力成本降低且語言模型成本也越來越低的時候，應用就會大幅展開。」他說。