AI Agent Agentic AI 生成式AI 人工智慧 大型語言模型 LLM IBM

落地自建小語言模型為最佳解 LLM智慧賦能任務拆解

思維鏈技法強化推理 超出規則也能自主判斷

2025-04-10
AI代理人真正面臨的挑戰並不是來自於技術層面,困難點在於,企業不太能接受AI代理人出現錯誤,而這也導致了雖然企業對AI代理人很感興趣,但目前都還在小型的試驗階段,還沒有大規模地部署到對外的應用中。

為推進企業AI發展,IBM近年積極發展AI代理人(AI Agent)技術,使其能夠自我引導、檢討修正、在動態變化的業務環境中執行複雜任務。例如去年10月發布的Granite 3.0 8B模型第一版本便支援包含高階的推理、用來建置調用工具的工作流程所需要的高度結構化聊天模板和指令形式等等主要的AI代理人功能。

不只如此,IBM也率先對內部員工所使用的「AskHR」AI聊天機器人進行AI能力的升級,其結合了AI助理(AI Assistant)與AI代理人,除了可以回答常見的HR問題之外,當員工想要請假時,HR助理也會自動串連到請假系統完成請假申請,同時發信告知所屬主管,而且所有流程都會自動完成。

細說數位分身三類型

「AI助理、AI代理人以及代理式AI(Agentic AI)有不小的差異,」台灣IBM AI技術顧問許芮萍指出,AI助理是專門為一個特定任務而設計的AI系統,由於不少企業會為AI助理事先寫好規則,無法回覆超出規則以外的內容,因此,AI助理能解決的問題往往也會較偏向日常任務。

AI Agent具流程概念

而AI代理人的特色即在於具備拆解任務的能力,以及能理解使用者詢問的問題並依據這些問題去調用合適的工具。當使用者詢問一個廣泛性問題時,AI代理人會自行思考,將問題變得更清晰後再回過頭反問使用者是不是想要這樣的內容,又或者是將問題拆解思考後再調用合適的外部工具來加以解決。

台灣IBM AI技術顧問許芮萍指出,考量運算資源與資料隱私風險,落地自建小型語言模型會是企業最佳解方。

「將AI代理人想像成是AI助理加上機器人流程自動化(RPA)的能力,或許會更容易理解,這是因為AI代理人也包含了流程的概念。」她提到,差別是,RPA是透過已經寫好的既定流程來解決任務,而AI代理人則是因為結合了大型語言模型的能力,因而在語意理解上更加地聰明具有智慧,與此同時,LLM也賦予了AI代理人思考與任務拆解的能力。此外,不同於RPA遇到例外就無法處理,AI代理人在遇到例外時,反而會自行判斷,並且調用企業提供的各式各樣工具,如外部搜尋引擎工具、ERP系統的API、內部知識庫等等來解決問題。

Agentic AI兼具專案經理角色

「至於代理式AI,經常會與AI代理人混為一談,而且各方說辭都不太一樣。」許芮萍認為,代理式AI其實是更大的Agent,其可以協助了解並指派AI代理人來處理特定的任務。這也意謂著,代理式AI同樣具有智慧的AI大腦,可以邏輯地判斷找出合適的AI代理人來處理問題,且更有自我管理以及下決策的能力,能更自動地調整行為,甚至優化整個流程的決策。「代理式AI會有專案經理的概念在其中,讓不同的AI代理人執行不同的任務,最後又可以串連在一起,進而產生結果。」

可調用AI助理 思維鏈強化推理

值得留意的是,AI代理人與代理式AI的調用工具能力,指的是Function Calling(函數調用)。事實上,在AI代理人眼中,AI助理也是其中一種可被調用的工具,舉例而言,當AI代理人理解到生成程式碼需要調用GitHub Copilot時,就會呼叫GitHub Copilot來協助。

「不過,AI代理人在調用工具後並不會急著把答案回饋給使用者,而是會思考是否已經將使用者可能提出的問題與方向都收集完全且回答了,之後才會給出答案,這種技法稱之為思維鏈(Chain of Thought)。」她提到,思維鏈主要是透過一系列連貫的邏輯推理促進系統性的問題解決。近期,IBM發表Granite模型家族新成員Granite 3.2,也加入了思維鏈的推理機制,來強化推理能力。

擔心出錯成企業導入阻礙

IBM AI平台解決方案副總裁魯伊斯(Ruiz)在近期的演講中提到,AI Agent將成為未來工作(Future of Work)的關鍵組成。他認為,AI真正的落地在於AI Agents,它們不僅能處理指令,還能自主行動。「我們正邁向一個任務會由多Agent協作完成的世界。」 這也意謂著,未來在企業內部將會有多個AI代理人同時存在,例如資訊部門的AI代理人、人資部門的AI代理人,甚至也可以創建出教育訓練的AI代理人出來。

許芮萍認為,AI代理人真正面臨的挑戰並不是來自於技術層面,以現今的技術已可以實作出能理解問題並且調用工具的AI代理人,困難點在於,企業不太能接受AI代理人出現錯誤,如果回覆出來的內容有錯或者是有害的時候,對於企業造成的風險反而更大。「而這也導致了雖然企業對AI代理人很感興趣,但目前都還在小型的試驗階段,還沒有大規模地部署到對外的應用中。」

而另一個挑戰則是資料隱私與運算資源的考量。AI代理人的大腦應該要自建在地端還是調用雲端模型?選擇在企業內部環境自建大型語言模型,固然可以減少機敏資料外洩的疑慮,但從運算需求來看,即使企業採用的是開源模型,依然需要不小的運算資源,初期的投資成本是一大考量。然而,採用雲端模型,一旦AI代理人調用到員工資訊或是應用在金融場景中調用到客戶的機敏資料,資料隱私的風險就會是一項課題。

「這也是為何IBM一直認為,落地自建小型語言模型會是企業最佳解方的原因。想在企業環境中落地AI Agent且實際運行,並且兼顧資料隱私與成本,小型語言模型會是較好的選擇。」


追蹤我們Featrue us

本站使用cookie及相關技術分析來改善使用者體驗。瞭解更多

我知道了!