DeepSeek

DeepSeek啟示錄

2025-03-28
長久以來,世界對AI有幾個共同的認知:訓練尖端模型至少需要十億美元與數千個先進的晶片;AI必須閉源開發;只有少數公司擁有打造AI模型的人才,因此嚴守技術機密是最重要的事。

DeepSeek顛覆了這個傳統認知:報載它僅用兩千片NVIDIA的晶片、大約六百萬美元遠低於預期的成本就訓練出最新模型。此外,DeepSeek也證明IBM先前提出論點的正確性:無需仰賴封閉、龐大的系統,也能打造出精簡高效的模型。

這項技術創新還引發了另一個深遠的議題:AI的未來由誰主導?除了封鎖或禁用,IBM建議應該讓AI「民主化」,放棄掌控它的念頭,允許價值觀或優先級各自不同的人參與AI創新,讓AI在各行各業與社會各角落自由流動,讓創新與進步「遍地開花」。另一個解決之道是組成一個由企業、大學、研發實驗室以及政府共同參與的開發生態系;開放與協作才能確保AI的未來繼續光明燦爛。

DeepSeek在2025年開春問世,代表AI技術「獨佔」時代的結束;IBM樂觀地預測,2026年將從單純地使用AI,快進到發展「為我所用」的AI能力。實現上述未來的關鍵在於採用小型開源模型。數十年來,AI被視為「規模化」的競賽—模型規模越大,效果越好。然而,除了規模,效率指標對於評定AI的突破與成就同等重要。根據IBM自身的AI應用經驗發現,使用針對特定用途(Fit-for-Purpose)的AI模型例如IBM Granite基礎模型,可以降低訓練AI模型與AI推理所需成本達30倍,有效地提升訓練模型的效率與可用性。

對於「通用型AI(Artificial General Intelligence)已經來臨」或「AI的未來由資料中心的規模決定」等這一類的論述,IBM認為那只是刺激了更多錯誤的選擇。目前沒有任何物理法則判定AI必須是昂貴的,訓練AI模型與AI推理的成本也並非固定不變。無論是科技大廠或是新創公司,如今都有能力降低應用AI的成本,讓AI更加實用與普及。

這對世界的進步與發展將是一個利好消息。無論哪一種科技,唯有它經濟實惠且唾手可得,才能產生變革性的影響力。

<本文作者:李正屹現為台灣IBM公司總經理>


追蹤我們Featrue us

本站使用cookie及相關技術分析來改善使用者體驗。瞭解更多

我知道了!