英特爾(Intel)於近期宣布推出第4代Intel Xeon可擴充處理器,代號為Sapphire Rapids。此系列處理器可在單一封裝中結合最高4個採用Intel 7打造的晶片塊,透過英特爾EMIB(嵌入式多晶片互連橋接)封裝技術進行連接,並提供新功能,包含提升記憶體頻寬的DDR5、提升I/O頻寬的PCIe 5.0和Compute Express Link(CXL)1.1互連。
除了技術規格創新外,第四代Intel Xeon可擴充處理器也運用了特製、以工作負載為優先的加速器,及針對特定工作負載達成高度最佳化的軟體,來協助企業應對ESG(環境、社會、治理)與節能減碳課題。與前幾代產品相比,預期在使用內建加速器時,目標工作負載的每瓦效能平均提升2.9倍,在Optimized Power Mode、效能損失最少的情況下,每個處理器可節省最高70瓦的耗電量,並將TCO降低52%〜66%。
英特爾台灣發言人鄭智成指出,近幾年,ESG永續議題已成為全球關注的重點,不少企業反饋,兩年前處理器功耗最高不過200多瓦,但是現在動輒都要上看350瓦、400瓦,而這樣的發展卻與必須滿足的ESG永續要求背道而馳,「過去幾年企業伺服器使用的處理器熱設計功耗(TDP)約莫都在150瓦左右,若是一台二路伺服器(單一主機板可搭載兩顆處理器),兩顆處理器再加上周邊裝置如記憶體與SSD固態硬碟,熱設計功耗至少就要上看到400瓦以上。如果搭載的是400瓦的處理器,可以想見一台伺服器就要上看到1,000瓦,甚至有可能因此而必須更改資料中心的設計。」
也因如此,英特爾在第四代Intel Xeon可擴充處理器中運用加速器引擎、高頻寬記憶體(HBM)以及軟體優化來實現更高的效能與能源效率,並且透過提高處理器的利用率來節省成本。他提到,Intel希望提供一個選項,能在適當的功耗下,提供確切的效能,進而實現最佳的整體總擁有成本,並且應用到人工智慧(AI)、分析、網路、安全、儲存和高效能運算(HPC)等領域場景中。
四大加速器功能說分明
Sapphire Rapids目前可支援多款加速器,包含Intel Advanced Matrix Extensions(AMX)、Intel QuickAssist Technology(QAT)、Intel Data Streaming Accelerator(DSA)以及Intel Dynamic Load Balancer(DLB)等等。其中Intel AMX可提高深度學習的訓練與推論的能力,與前一世代相比,第四代Xeon處理器可達成最高10倍的PyTorch即時推論和訓練效能,在自然語言處理能力上,大型語言模型的運算速度也有最高20倍的提升。
「AMX大概是處理器近年最重要的創新,把矩陣運算放到處理器裡面。這十年來談的AI都是指神經網路,而最能發揮神經網路效能的架構就是矩陣運算,第四代Intel Xeon可擴充處理器也是第一個把AMX實作到處理器的產品。」鄭智成進一步說明,以推論為例,AMX與AVX-512指令集的差別是,AVX-512指令集在進行推論時,每個指令週期可以運行256次,而AMX則可以運行2,048次,換言之,在推論上就有8倍效能的表現。
Intel DLB主要是進行動態負載平衡,其可以在多個處理器核心/線程(Threads)之間高效地分配網路處理,並且動態地分配網路資料。他提到,以往還沒有支援加速器之前,當然也有軟體解決方案,但是需要耗用處理器的核心,當這項功能放到加速器後,可節省96%的處理器時間。亦即處理器可以更專心地運作,處理其他的工作負載。
Intel DSA則會內建到每一款處理器產品中,DSA主要負責的是資料移動的任務,不管資料是在記憶體、快取或是儲存上,只要有任何資料需要抄寫或是轉換,DSA都可以減輕轉換的負擔,並且優化移動效率。鄭智成指出,反映到實際數據就是IOPS表現,在Large Packet連續讀取(Sequential Read)的環境中可以提升1.7倍。「這在記憶體抄寫上是一個很大的進展,假設原先複製一個很大的檔案要花上170秒,如今便只需要100秒。這是一個很顯著的改進,單單只在處理器加入了這個加速器,就可以協助NVMe SSD或是記憶體加速抄寫。」
此外,Intel QAT則可以為各種應用程式加速資料加密與壓縮,透過卸載加密、解密與壓縮,還有助於釋放處理器核心,以便讓系統能夠服務更多的Client或是使用更少的功率。「QAT最早是以板卡的形式出現,當時主要作為加解密或是壓縮、解壓縮的加速卡之用,而後因為有許多使用者需要這項功能,因此第二代Intel Xeon可擴充處理器就把QAT功能放到南橋晶片內,到了第三代處理器就把這項功能放到CPU中。」他提到,不同於第三代Xeon Scalable處理器只內建一個QAT,第四代Xeon Scalable處理器可以依需求最多擴增到四個QAT,適合需要大量執行許多壓縮、解壓縮或頻繁加解密的伺服器環境中。
兩種模式採購更彈性
除此之外,Intel在第四代Intel Xeon可擴充處理器也引進了一項彈性採購方案,稱為On Demand Activation Model。這項方案有兩種模式可以選擇,啟動模式(Activation Model)可以一次啟動選定的加速器及安全功能,例如啟用Intel QAT。而消費模式(Consumption Model)則是一種由合作夥伴提供的即服務(As-a-service)模式,未來企業將有機會透過系統廠商或是雲端服務供應商的協助來開啟更多的功能,假設企業一開始選擇的處理器型號只有一個加速器,而後希望使用更多加速器的話,就能透過這個選項增加更多的加速器。
鄭智成最後強調,Sapphire Rapids是Intel有始以來最具永續性的處理器,一方面因為支援了多個加速器,因此會有更好的效率表現,另一方面在電力控制與遙測(Telemetry)方面,優化的電源模式也可以協助節省高達20%的電力,此外透過先進的遙測技術,可以監控電力消耗與碳排放。而在空氣和液體冷卻方面的創新也能夠進一步減少資料中心整體能源消耗量,並且這些處理器的製造都是在擁有最先進水資源回收設施的英特爾工廠,採用90%以上的可再生電力進行生產。
「事實上,Intel也提供了Data Center Manager,最新版本已可協助企業測量和控制資料中心的碳足跡,根據企業使用的處理器,甚至會協助計算在實際使用期間用了多少電力,節省了多少碳排量。而且還可預測碳排放量以及未來的電力與空間需求。」他提到,這套軟體可以與OEM及ODM合作廠商互相搭配,但企業用戶也可以直接採購這項軟體來管控整個資料中心內的碳足跡。