NVIDIA 攜手 Google Cloud 為企業帶來代理型 AI 推理功能

2025-04-18

王智仁

Google的Gemini模型即將可於地端部署，透過搭載 NVIDIA Blackwell 基礎架構之 NVIDIA 機密運算技術的 Google 分散式雲端平台運行。

NVIDIA與Google Cloud合作，運用Blackwell HGXandDGX平台及NVIDIA機密運算（NVIDIA Confidential Computing）技術保護資料安全，並將代理型AI（agentic AI）帶給尋求在地端使用 GoogleGemini系列人工智慧（AI）模型的企業。

透過搭載NVIDIA Blackwell平台的Google分散式雲端（Google Distributed Cloud，GDC），企業的地端資料中心可以鎖定存取病患紀錄、金融交易和政府機密資訊等機敏資訊的權限，以符合法規要求和資料主權法令。NVIDIA機密運算技術還能保護Gemini模型中的敏感程式碼，避免未經授權的存取與資料外洩。

Google Cloud基礎設施與解決方案部門副總裁暨總經理Sachin Gupta表示，藉由將Gemini模型與NVIDIA Blackwell的突破性效能及機密運算能力相結合，讓企業能夠充分發揮代理型AI的潛力。這項合作有助於確保客戶能夠在不影響效能或操作便利性的情況下，安全地進行創新。

NVIDIA Blackwell的機密運算技術能為企業提供技術保障，包括Gemini模型應用程式介面的使用者提示及用於微調的資料，都能保持安全，無法被檢視或修改。

與此同時，模型所有者可以防止未經授權的存取或竄改，提供雙重保護，讓企業能夠在維護資料隱私的同時，利用Gemini模型進行創新。

AI代理驅動全新企業應用

隨著代理型AI重塑企業技術格局，帶來更強大解決問題的能力，這項全新解決方案應運而生。有別於根據學習到的知識來感知或生成內容的AI模型，代理型AI系統可以在動態環境中進行推理、適應與決策。例如在企業IT支援方面，以知識為基礎的 AI 模型可以檢索與提供故障排除指南，而代理型AI系統則能夠自主診斷問題、執行修復，以及將複雜的問題呈報到更高層級進行處理。

同樣地，在金融領域，傳統的AI模型可以根據既有模式標示潛在的詐欺交易活動，代理型AI系統則能更進一步調查異常情況，並主動採取行動，例如在交易發生前即進行封鎖，或是即時調整詐欺偵測規則。

在地端進行部署的兩難困境

雖然許多企業已經可以使用多模態推理的模型，整合文字、影像、程式碼和其他資料類型來解決複雜的問題，並建立雲端代理型AI應用，不過那些對安全或資料主權有著嚴格要求的企業卻還無法實現。

隨著這項消息的發表，Google Cloud將成為首批提供機密運算功能的雲端服務供應商之一，以保護無論是在雲端或混合環境中的代理型AI工作負載。

這項解決方案由搭載Blackwell GPU與NVIDIA機密運算技術的NVIDIA HGX B200平台驅動，讓企業能夠保護AI模型與資料安全。這樣可讓使用者在不影響資料安全性或模型完整性的情況下，達到突破性的效能與能源效率。

代理型AI的AI可觀察性及安全性

在生產環境中擴展代理型AI需要強大的可觀察性與安全性，以確保有穩定的效能表現及符合法令要求。

Google Cloud宣布推出全新的GKE Inference Gateway，藉由先進的路由和擴充性來最佳化部署AI推論工作負載的部署。透過與NVIDIA Triton推論伺服器及NVIDIA NeMo Guardrails整合，GKE Inference Gateway可提供智慧型負載平衡，以提升效能與降低服務成本，同時實現模型安全與治理活動的集中化控管。

展望未來，Google Cloud正致力於整合專為跨AI工廠服務與擴充推理AI模型而打造的開源函式庫NVIDIA Dynamo，以提高代理型AI工作負載的可觀察性。