Kneron耐能發表新一代AI系列晶片,並由全新旗艦產品KL1140打頭陣,全面構建從終端到雲端的完整AI基礎設施版圖。此次發表會中,耐能創辦人暨執行長劉峻誠博士亦同步揭示未來三年的高中低階多款新晶片規劃,標誌耐能正式完成全算力佈局,從AI晶片供應商進化為AI基礎建設公司(AI Infrastructure Company)的關鍵里程碑。
全球第一顆可於終端設備完整運行Mamba神經網路的邊緣AI晶片。在能效上達到現有雲端方案倍效能、成本下降10倍,使大型語言模型(LLM)真正走入智慧設備,突破必須倚賴雲端GPU的限制。
透過四顆KL1140並聯,可支援運行高達1200億參數的模型,功耗僅為傳統GPU的三分之一。根據美國加州大學柏克萊分校測試結果,KL1140能效大幅領先現有邊緣處理器,是目前效能突破性的NPU解決方案。
劉峻誠博士在會中也首次完整介紹耐能未來三年的晶片產品藍圖,包括:
- 低功耗安防專用:KL640、KL650主打Always-on 能力,滿足影像安防與低耗能場景。
- 高性價比通用視覺:KL540、KL515用於IPCam、視覺運算、機器視覺等大眾化終端設備。
- 新世代Gen AI專用晶片:KL840、KL1150面向高階智慧設備、車載、企業邊緣伺服器,具備更高TOPS與串接能力。
這些產品共同構成從低、中到高的完整算力梯度,搭配KL1140的問世,耐能已正式完成全階端側AI產品線量產佈局,並進一步提升相較傳統GPU的能效與可規模化能力。
隨著企業加速導入AI,全球資料中心投資規模已達數兆美元,能源需求同步飆升。預估至2035年,全球資料中心耗能將突破175GW,雲端運算成本高、延遲大、耗能重且存在資料外洩風險的問題日益浮現。
劉峻誠博士進一步表示,高成本與高能耗表明現行AI運算模式難以長期維持。KL1140以及我們的新一代系列晶片,就是對此提出的解方。透過在邊緣直接運行大型模型,我們讓LLM的強大能力真正走入終端,落實The Future Lives at the Edge。