iKala 繁中驗證集「TMMLU+」獲 AI 學術會議肯定

2024-08-14

王智仁

隨著AI持續蓬勃發展，台灣市場對於繁體中文模型的技術需求也在日益增長。iKala推出的繁體中文驗證集「TMMLU+」，正式被AI語言模型學術會議COLM（Conference on Language Modeling）接受。COLM由來自DeepMind、Meta和Microsoft及常春藤等AI領域的知名學者共同創立，為極具公信力的AI組織。iKala所開發的繁體中文驗證集TMMLU+在眾多論文審查過程中，獲得前10%的高分，展現出iKala在AI技術上的強大實力。

iKala推出TMMLU+驗證集，提升繁體中文大語言模型的精確度與本地化

自生成式AI技術崛起，各國都致力於發展與自身語言相關的大語言模型（LLM），台灣亦有不少企業正著手發展繁體中文模型。有鑒於各國語言的差異性，台灣特有的文化和用字習慣，例如「8+9」、「北車」或台語等，使繁體中文大語言模型在建構的過程中，也需要專屬驗證集進行調校，才能獲得更精準的AI應用成果。

iKala內部AI團隊基於聯發科所推出的框架TMMLU，透過社群媒體資料進行更深入的擴展，涵蓋更多台灣本地用語和人文背景，讓新開發出的繁體中文驗證集TMMLU+能更貼近繁體中文的詞語情境和表達方式，加上形式開源，可協助國內眾多企業在開發繁體中文大語言模型時，使用繁體中文驗證集TMMLU+作為模型驗證的工具，更貼近本地需求。

iKala繁體中文驗證集TMMLU+於2023年10月著手開發，經數月的緊鑼密鼓的工作後在2024年春天送審。在COLM評審的過程中，iKala的AI團隊特別針對繁體中文的字形及用法等特色進行詳細說明，闡述其價值所在。此舉大大加深評審委員的印象，有效提升繁體中文驗證集TMMLU+的論文評分，使其在來自全球激烈的競爭中脫穎而出。

目前繁體中文驗證集TMMLU+已被多家台廠採用以進行大語言模型評測，為台灣科技業提供可靠且統一的驗證標準。這不僅是業界對iKala多年來深耕AI技術的肯定，也有助於提升iKala在業界的話語權和影響力。

iKala共同創辦人暨執行長程世嘉表示，iKala作為來自台灣的跨國AI公司，致力於解決困難但充滿意義的AI難題，並以實際商業價值和應用場景作為最終目標。非常感謝AI團隊成員們的努力，讓iKala有機會被國際看見，也感謝聯發科引領台灣AI開源技術。