隨著AI持續蓬勃發展,台灣市場對於繁體中文模型的技術需求也在日益增長。iKala推出的繁體中文驗證集「TMMLU+」,正式被AI語言模型學術會議COLM(Conference on Language Modeling)接受。COLM由來自DeepMind、Meta和Microsoft及常春藤等AI領域的知名學者共同創立,為極具公信力的AI組織。iKala所開發的繁體中文驗證集TMMLU+在眾多論文審查過程中,獲得前10%的高分,展現出iKala在AI技術上的強大實力。
自生成式AI技術崛起,各國都致力於發展與自身語言相關的大語言模型(LLM),台灣亦有不少企業正著手發展繁體中文模型。有鑒於各國語言的差異性,台灣特有的文化和用字習慣,例如「8+9」、「北車」或台語等,使繁體中文大語言模型在建構的過程中,也需要專屬驗證集進行調校,才能獲得更精準的AI應用成果。
iKala內部AI團隊基於聯發科所推出的框架TMMLU,透過社群媒體資料進行更深入的擴展,涵蓋更多台灣本地用語和人文背景,讓新開發出的繁體中文驗證集TMMLU+能更貼近繁體中文的詞語情境和表達方式,加上形式開源,可協助國內眾多企業在開發繁體中文大語言模型時,使用繁體中文驗證集TMMLU+作為模型驗證的工具,更貼近本地需求。
iKala繁體中文驗證集TMMLU+於2023年10月著手開發,經數月的緊鑼密鼓的工作後在2024年春天送審。在COLM評審的過程中,iKala的AI團隊特別針對繁體中文的字形及用法等特色進行詳細說明,闡述其價值所在。此舉大大加深評審委員的印象,有效提升繁體中文驗證集TMMLU+的論文評分,使其在來自全球激烈的競爭中脫穎而出。
目前繁體中文驗證集TMMLU+已被多家台廠採用以進行大語言模型評測,為台灣科技業提供可靠且統一的驗證標準。這不僅是業界對iKala多年來深耕AI技術的肯定,也有助於提升iKala在業界的話語權和影響力。
iKala共同創辦人暨執行長程世嘉表示,iKala作為來自台灣的跨國AI公司,致力於解決困難但充滿意義的AI難題,並以實際商業價值和應用場景作為最終目標。非常感謝AI團隊成員們的努力,讓iKala有機會被國際看見,也感謝聯發科引領台灣AI開源技術。