隨著數位化程度持續上升,企業IT基礎架構也面臨前所未有的挑戰。除了面對不足或不均的資源配置、有限的預算與人力資源、雲端體系的複雜度以及無可預期的資料量增長,IT還得在新興技術和市場日新月異的變化下,肩負起為業務創造價值的重責大任。顯然,基礎架構現代化已成企業刻不容緩的議題。
戴爾科技集團資深技術顧問黃敏俊認為,企業可從四個策略面向著手來取得更大的價值,包含藉由自動化的部署與資源遞送來優化營運,讓營運更有效率;打造混合雲架構,透過雲端來快速運用新技術;使用現代化基礎架構來優化工作負載以加速業務創新;以及將人工智慧(AI)運用在邊緣(Edge)環境,就近在資料產生的地方進行運算或推論,藉此找出企業的新價值。「在這些諸多的行動策略中,追根究柢,關鍵還是在於運算力的現代化,唯有伺服器先擁抱創新,才能以此為基礎構建數位大未來。」
三大特點成就創新引擎
Dell PowerEdge系列伺服器擁有最新的先進技術、全面的基礎架構自動化,更著重系統與軟體安全,除了提供持續進化的運算力,還包含自駕式運算基礎架構以及主動式智能防禦。他提到,PowerEdge系列伺服器不只是資料中心的基石,更是企業創新引擎,搭載第三代Intel Xeon Scalable處理器,提供更高的資料處理能力,以勝任更密集的工作負載,包含異構運算如CPU協同GPU運算,或是大量GPU運算的環境都能應付自如。
此外,Dell設計團隊也精心打造多重向量散熱技術,先進的溫控設計可簡化伺服器內部散熱氣流通道,引導機箱內部所需的適量氣流進入機體。特定型號機種還可提供直接式水冷的方案,將水冷配備延伸至伺服器,利用冷卻液的流動來帶走熱量,並且搭配滲漏預警偵測,在滲漏發生之前即發送警示或關閉伺服器。
為了減少企業在技術管理與維運所耗費的時間,Dell也提出全面自動化的戰略願景,如同自動駕駛的發展過程,伺服器自動化也可分為五種等級,從輔助操作者、部分自動化、有條件自動化、高度自動化,最後實現完全自動化。
「不少企業現今還處於輔助操作者的階段,但同時已有越來越多的企業邁入部份自動化,往有條件的自動化前進。」黃敏俊指出,運用人工智慧來輔助維運已是IT發展的一項趨勢,想要達成完全自動化,就必須不斷地從伺服器收集資料,以便讓判斷能夠越來越精準。iDRAC提供了遙測串流(Telemetry Streaming)機制,可廣泛地蒐集工作負載使用狀態、各種能耗數據等資料,若是結合OpenManage,還能減少85%手動作業。在較大規模的環境下,OpenManage也能Plug-in到各式各樣的管理平台,如VMware vCenter、Windows Admin Center、RedHat Ansible Modules等等,簡化維運作業。
而隨著供應鏈安全漸受重視,主動式的智能防禦也從設計、來源、製造一路涵蓋到運送,提供完整端對端供應鏈保障。舉例而言,Dell早在多年前在伺服器的設計階段即納入矽晶片信任根(Silicon Root of Trust),以便對BIOS的真實性進行全面驗證。又如在製造端,Dell會進行系統功能測試、第三方安全性稽核、Dell簽發的PPID標章、TAPA工廠規範以及廠區個人安全,在運送端則於包裝上有防竄改保護、容器的密封與追蹤,同時只經由認證可信任的物流夥伴。
四大獨有技術 伺服器高效穩定
過去十多年來,IT從實體架構一路演進到虛擬化、雲端化,如今容器化緊接而來,並且進一步助長混合雲/多雲的發展;而另一方面,在技術創新的推動下,過往只有單純交易式工作負載、應用服務,現在則具備了更多的人工智慧(AI)應用,從伺服器的設計、研發角度而言,關鍵在於必須能夠適應各種工作負載、無縫接軌未來技術演進,同時能夠因應邊緣嚴苛的環境需求。
對此,Dell也針對企業工作負載,重新打造伺服器,例如專為高效能運算、機器學習/深度學習訓練與推理、資料庫分析以及VDI等工作負載設計的R750xa;能以最小空間和運算,為邊際與電信提供完整功能、管理性、部署和安全的XR12、XR11;適用於標準化硬體以處理多種不同工作負載的R750、R650;具備最佳化擴充性的R750xs以及R650xs;以及針對特殊目的,如高效能運算的C6520。
除了搭載第三代Intel Xeon Scalable處理器,更高速的記憶體如Intel Optane持續性記憶體(200系列),更大的IO與頻寬如PCIe Gen 4、OCP NIC 3.0標準網卡外,第15代Dell PowerEdge系列伺服器在效能、安全以及散熱方面也具備獨有的創新設計,包含用於開機的BOSS-S2(Boot Optimized Storage Solution-S2)控制卡、兼具效能與保護的NVMe HW RAID、適用於InfiniBand的SNAP I/O以及系統散熱等等,讓伺服器能更有效率、穩定地運作。
黃敏俊進一步解釋,相較於以往NVMeSAS SSD、SATA SSD必須以軟體定義SSD的方式來達到類似建立RAID的保護機制,現在則是多了可採用HW RAID來滿足企兼顧業效能、與保護與維運便利性的多雙重要求。PERC 11控制器可支援NVMe HW RAID,讓效能大幅提升,根據Dell內部測試,PowerEdge R650在採用NVMe HW RAID後,與前一代伺服器相比IOPS提高了15.7倍、硬碟頻寬提升15.5倍,同時降低了93%延遲。
BOSS-S2控制卡也是PowerEdge伺服器的一大亮點,「早期若想讓伺服器的作業系統開機,多半會設計開機硬碟,作法上通常是採用兩顆開機硬碟,並且設定Mirror作為保護機制,但如此一來也少掉兩顆硬碟的使用空間,因此在多年前Dell便研究,SD卡作為Boot裝置,後來又慢慢演變成BOSS,亦即將2張M.2 SATA SSD放在一張小型的RAID卡上,」他指出,這種作法深受企業喜愛,不過,由於BOSS是安裝在主機板中,若要進行維護,還得打開機箱外蓋,甚至可能為此停機。因此,Dell也進一步改良成BOSS-S2,熱插拔就能直接更換,無須停機直接進行維護。
SNAP I/O的全稱為系統NUMA感知分區I/O(System NUMA Aware Partitioned I/O),其主要是運用Mellanox專屬的Socket Direct技術,以解決網路卡與CPU之間可能造成的存取瓶頸。由於不平衡的解決方案可能會導致NUMA損失,為了達成平衡,SNAP I/O將兩個網路埠分別連結到不同的處理器,如此一來,CPU與CPU之間的UPI溝通便會大幅降低,根據Dell內部Benchmark測試結果,採用SNAP I/O,不管是在25GbE或是100GbE的環境下,作業系統相比前一代都能減少40%以上的延遲時間,而在Docker環境下,不管是25GbE或是100GbE,同樣能減少40%以上的延遲。
最後在系統散熱方面,多向量冷卻技術能夠確保所有的元件都有足夠的風流,甚至可以更精準的調配,例如讓處理器有更多的風流可以帶走熱,而不需要那麼多風流的地方則可以減少,其判斷的關鍵即在於伺服器周遭的感測器,除了判斷伺服器溫度外,也能自動化地調整,甚至定義溫度以及風流需求。
現代化改造實現綠色永續
綠色永續已成全球課題,而向來是企業用電熱區的資料中心也無法置身事外,黃敏俊認為,在可預見的未來,IT部門勢必會面臨綠色資料中心的挑戰,除了利用太陽能和風能等可再生能源來供電之外,對基礎架構進行現代化改造以實現每瓦最高效能對於綠色資料中心也至關重要。
他提到,散熱設計便是其中一項關鍵。高效能風扇、平衡氣流設計以及多向量冷卻技術、直接式水冷的方案都能有助於優化能源使用效率,而資料減量技術也因為降低了總儲存量,讓企業更能節省能源,進而減少碳排放,另外,透過APEX即服務方案,所有退役設備透過再利用和回收避免變成一般垃圾處理,也使企業實現其可持續發展目標。
「事實上,Dell伺服器在美國電子產品環境影響評估工具(EPEAT)中已取得400個EPEAT認證,這也足以說明Dell在環保上的努力。像是內部元件如閂鎖、氣罩和外殼使用回收塑膠、油漆的使用量減少或不再使用,都能降低污染,為環保作出貢獻。」黃敏俊強調,從2013年至今,PowerEdge的能源指標(Energy Intensity)已降低了83%,「未來資料中心勢必會開始朝向水冷發展,除了極大化處理效能外,也能顯著降低資料中心總能耗,同時實現100%的機架與空間利用率。」