採用機器學習典範轉移協助業務發展已經存在了幾十年。隨著足夠的可擴充運算力的到位、海量資料的爆炸,以及機器學習技術的快速進步,各行各業的客戶開始對業務進行重塑。最近,像ChatGPT這樣的生成式AI應用引起了廣泛的關注,引發了諸多想像。我們正處在一個機器學習被大規模採用的令人興奮的轉捩點上,我們也相信生成式AI將會重塑大量客戶體驗和應用程式。
二十多年來,人工智慧和機器學習一直是亞馬遜關注的焦點。亞馬遜提供客戶的許多功能都是由機器學習驅動的,例如AWS的電商推薦引擎、營運中心撿貨機器人的路徑選擇,以及供應鏈、預測和產能規劃。Prime Air(亞馬遜無人機)和Amazon Go(亞馬遜實體無人零售實體店,消費者可以自選商品後直接離開,無需現場排隊結帳付款)中的電腦視覺技術都使用了深度學習。
Alexa每週回應客戶數十億次關於管理智慧家居、購物、資訊取得和娛樂的請求,這也得益於來自30多種不同的機器學習系統的支援。亞馬遜有數千名工程師專注於機器學習研究,這既是寶貴資產,也是現在最關注的理念,和面向未來的實力之所在。
在AWS,已經幫助超過十萬家來自各行各業的不同規模的客戶使用機器學習進行創新。AWS在人工智慧和機器學習堆疊的三個層級都擁有至深至廣的產品組合。長期以來,不斷投入、持續創新,為機器學習提供高效能、可擴充的基礎設施,和極具性價比的機器學習訓練和推論;研發了Amazon SageMaker,所有開發人員能更便利地建構、訓練和部署模型;還推出了大量服務,使客戶透過簡單的API調用就可添加AI功能到應用程式中,如圖像識別、預測和智慧搜尋。得益於此,Intuit、湯森路透、AZ(AstraZeneca)、法拉利、德甲聯賽、3M和BMW等客戶,以及全球數千家新創企業和政府機構正在透過機器學習進行數位轉型,帶動產業升級,重新定義機器學習的使命。
生成式AI是人工智慧的一種,能夠創造新內容和想法,包括對話、故事、圖像、影片和音樂。與所有人工智慧技術一樣,生成式AI的能力由機器學習模型提供。這些模型是基於大量資料進行預先訓練的大模型,通常被稱為基礎模型(Foundation Models)。機器學習的最新進展(特別是基於transformer的神經網路架構的發明)直接帶來這一種模型的爆發式增長,這種模型通常包含數十億個參數或變數。
2019年最大的預訓練模型是3.3億個參數。現在,最大的模型包含的參數超過5千億個,相當於幾年間增加了1600倍。如今的基礎模型,例如大型語言模型GPT3.5或BLOOM,以及由Stability AI開發的文生圖模型Stable Diffusion,可以執行跨多個領域的多種任務,例如撰寫部落格文章、生成圖像、解決數學問題、對話聊天、基於文檔回答問題等。基礎模型的規模和通用場景的性質使其不同於傳統的機器學習模型,後者通常僅執行特定的任務,例如分析文本觀點、分類圖像和預測趨勢等。
基礎模型包含大量參數,能夠學習複雜的概念,因此可以執行更多任務。透過基於互聯網規模的、各種形式和模式的海量資料進行預先訓練,基礎模型學會在各種語境中應用所習得的知識。儘管預訓練基礎模型所帶來的功能和可能性已足夠令人驚歎,而真正讓客戶為此興奮不已的是,這些通用模型也可以被客製化加工,執行專屬於其業務領域的特定功能,幫助業務建立差異化競爭優勢,與從零開始訓練模型相比,僅需使用一小部分資料和運算資源。