Enterprise & Datacenter Storage Form Factors Rack Scale Architecture Open Compute Project Form Factor EDSFF HGX-2 IDC NF1

客戶及晶片商爭下指導棋　伺服器規格設計費思量

2018-07-31

郭思偉

眾所皆知的台灣為規模型x86系統代工重鎮，無論是x86個人電腦、x86工控應用系統，乃至x86伺服器、儲存設備等均在世界佔有份量。而在每年的主場貿易展COMPUTEX上，台灣伺服器、儲存設備製造商更是積極展現其技術能力，期望贏得潛在客戶，如品牌業者、重量級雲端服務業者的未來訂單。

而筆者透過對今年展示的觀察，得出一個簡單結論，即伺服器的構型指導棋更多了，這些新指導棋成為伺服器代工製造者日後的新努力目標。所謂構型（Form Factor）其實是較為學名的稱法，簡言之是指硬體的尺寸外型外觀；而所謂的指導棋（Guidance）則是筆者的譬喻說法，明確而言是指新的伺服器規格規範標準。

構型標準難以統一強勢需求者自定義

在過去很長一段時間，機房機櫃用的伺服器僅有機架標準，並以U為機箱高度（厚度）的標準增減單位，1U即1.75吋高。但隨著用戶日益講究機櫃密度、機房坪效，伺服器開始出現比1U更小的模組化單板電腦設計，稱之為刀鋒伺服器。

刀鋒伺服器的外型尺寸各業者自行定義，過去曾試圖推行產業標準，但始終未獲得普遍共識。到了近年來，產業俗稱的多節點（Multi-Node）伺服器則求取傳統標準機架與模組刀鋒兩者間的設計平衡，業界不成文的構型默契為2U4N（2U高度內放置4台伺服器，1台伺服器稱為1個節點Node），但也同樣未有跨業者間的通行適用標準。

而隨著虛擬化技術、私有雲運用的普及，英特爾（Intel）提出RSA（Rack Scale Architecture）的規範，此規範同時包含軟硬體層面的定義，但硬體層面試圖建立一種可彈性增減調節硬體資源的新電路架構設計，台灣有多家伺服器代工業者支持此一標準，如雲達（QCT）、緯穎（Wiwynn）等。另也有華為（Huawei）、戴爾（Dell）、易利信（Ericsson）、浪潮（Inspure）、Super Micro。RSA標準之後更名成RSD（Design），理由是RSA有商標衝突爭議。

另一個新影響來自公有雲及超規模資料中心業者，如臉書（Facebook）提出開放運算計畫OCP（Open Compute Project），此計畫的起源是Facebook機房有太多伺服器，為了追求更佳的機房效益與管理因而提出OCP標準規範。OCP不僅尺寸外型不同於前述，也要求須提供12V直流供電以提升機房能源效益。伺服器製造商若想把伺服器賣給Facebook，須依循OCP規格來設計製造伺服器。

OCP標準之後也不斷擴充，谷歌（Google）也加入支持OCP，並提出48V供電需求；微軟（Microsoft）也將自有機房的自訂伺服器標準奧林帕斯計畫（Olympus Project）提交給OCP，要求伺服器機櫃後面直接提供電源連接設計，並將I/O連接移至機櫃前方。這些新追加的規範要求台灣伺服器製造商也必須遵循，否則不易取得Google、Microsoft的伺服器訂單。

EDSFF、NF1標準業界發展仍待觀察

RSD、OCP均已推行數年，且在發表後陸續有版本增訂修訂，製造商的設計必須跟上最新規範。而今年又迎來三項新規範，一是Intel提出的EDSFF（Enterprise & Datacenter Storage Form Factors），二是三星（Samsung）的NF1，三是英偉達（NVIDIA）的HGX-2。

EDSFF標準在去（2017）年八月便提出，但當時已過COMPUTEX，今年正式在COMPUTEX上有亮相。由於伺服器使用快閃記憶體、固態硬碟機會日增，為了在有限的伺服器空間內放置更多的固態硬碟，Intel特別提出EDSFF標準，這成為伺服器製造商一個新規範的遵循課題。 Intel的處理器在x86伺服器領域有壓倒性市佔（全球台數佔比長期在90%以上），因而有權制訂伺服器的組件尺寸外觀。不過Samsung在快閃記憶體領域也是一方之霸（全球營收佔比長期逼近40%，市佔率第一），自然不願依循Intel的定義，而是自訂伺服器用的固態硬碟標準NF1，此也成為伺服器製造商必須依循的新標準。

▲硬體尺寸外型的設計演進。

然而兩種標準未來必然面臨競爭消長，製造商選擇支持哪一陣營？或者要配置多少資源支持哪一家的標準？或者兩種標準均屬過渡，未來可能有更一致共識的標準？這些就考驗製造商的技術管理、技術策略評估能力。

HGX-2架構結合AI應用與高效能運算

進一步地，由於人工智慧（AI）風起雲湧，為了能加速人工智慧運算，目前有愈來愈多伺服器開始配置通用繪圖處理器（GPGPU），而近期國網中心（財團法人國家實驗研究院國家高速網路與計算中心，NCHC）建置的新超級電腦，也多配置大量的GPGPU於其中，顯見高效能運算領域也日益倚重GPGPU。

有鑑於此，NVIDIA在今年五月的GTC（GPU Technology Conference）年度技術盛會上提出HGX-2架構（此前已有HGX-1，並獲得Microsoft、Facebook、AWS採用），此架構將人工智慧需求、高效能運算需求兩者合一，並讓GPGPU提供多種精度的浮點運算力，若為人工智慧的模型訓練、推測運算則使用半精度浮點運算，對於高效能運算領域則可提供單精度、雙精度浮點運算。

HGX-2目前已獲得聯想（Lenovo）、QCT、Super Micro、Wiwynn的支持，言下之意伺服器製造商又多一個新的外型設計標準規範，在尚無此規範前，各伺服器製造商有各自不同的GPGPU設計配置手法。

除上述外，伺服器製造商為了強化技術競爭力，也努力使伺服器內的供電器縮小、風扇縮小、主機板縮小，好挪騰出更多空間，以便放置更多節點伺服器（Multi-Node或Blade）、更多機械式硬碟、更多固態硬碟、更多GPGPU板卡等，這並無業界共同遵循的規範，但看製造商各家的板卡設計本事。

最後，新構型標準的提出頻率會走緩嗎？筆者認為不容易，在處理器晶片朝多核路線發展後，為避免效能瓶頸，板卡間、機箱間的連接（Interconnect）技術日益重要，這也將改變伺服器在網通組件方面的構型配置及規範定義。

其他如運算持續多元化，包含FPGA、AI專用晶片、區塊鏈專屬晶片等的運用日多；資料庫朝全部放入記憶體內以利即時商務營運、商務分析（In-Memory Computing），加上5G、IoT Edge議題等。這些目前仍由製造商自由進行組件配置、外觀設計，但這些趨勢若持續高速發展，未來也高度可能需定義及規範，這些均可能是新課題、新挑戰。

＜本文作者：郭思偉，現為IDC台灣區企業應用研究部資深市場分析師。＞