NVIDIA Google Google Cloud Gemini 人工智慧代理 AI代理 AI Agent

NVIDIA 攜手 Google Cloud 為企業帶來代理型 AI 推理功能

2025-04-18
Google的Gemini模型即將可於地端部署,透過搭載 NVIDIA Blackwell 基礎架構之 NVIDIA 機密運算技術的 Google 分散式雲端平台運行。

NVIDIA與Google Cloud合作,運用Blackwell HGXandDGX平台及NVIDIA機密運算(NVIDIA Confidential Computing)技術保護資料安全,並將代理型AI(agentic AI)帶給尋求在地端使用 GoogleGemini系列人工智慧(AI)模型的企業。

透過搭載NVIDIA Blackwell平台的Google分散式雲端(Google Distributed Cloud,GDC),企業的地端資料中心可以鎖定存取病患紀錄、金融交易和政府機密資訊等機敏資訊的權限,以符合法規要求和資料主權法令。NVIDIA機密運算技術還能保護Gemini模型中的敏感程式碼,避免未經授權的存取與資料外洩。

Google Cloud基礎設施與解決方案部門副總裁暨總經理Sachin Gupta表示,藉由將Gemini模型與NVIDIA Blackwell的突破性效能及機密運算能力相結合,讓企業能夠充分發揮代理型AI的潛力。這項合作有助於確保客戶能夠在不影響效能或操作便利性的情況下,安全地進行創新。

NVIDIA Blackwell的機密運算技術能為企業提供技術保障,包括Gemini模型應用程式介面的使用者提示及用於微調的資料,都能保持安全,無法被檢視或修改。

與此同時,模型所有者可以防止未經授權的存取或竄改,提供雙重保護,讓企業能夠在維護資料隱私的同時,利用Gemini模型進行創新。

AI代理驅動全新企業應用

隨著代理型AI重塑企業技術格局,帶來更強大解決問題的能力,這項全新解決方案應運而生。有別於根據學習到的知識來感知或生成內容的AI模型,代理型AI系統可以在動態環境中進行推理、適應與決策。例如在企業IT支援方面,以知識為基礎的 AI 模型可以檢索與提供故障排除指南,而代理型AI系統則能夠自主診斷問題、執行修復,以及將複雜的問題呈報到更高層級進行處理。

同樣地,在金融領域,傳統的AI模型可以根據既有模式標示潛在的詐欺交易活動,代理型AI系統則能更進一步調查異常情況,並主動採取行動,例如在交易發生前即進行封鎖,或是即時調整詐欺偵測規則。

在地端進行部署的兩難困境

雖然許多企業已經可以使用多模態推理的模型,整合文字、影像、程式碼和其他資料類型來解決複雜的問題,並建立雲端代理型AI應用,不過那些對安全或資料主權有著嚴格要求的企業卻還無法實現。

隨著這項消息的發表,Google Cloud將成為首批提供機密運算功能的雲端服務供應商之一,以保護無論是在雲端或混合環境中的代理型AI工作負載。

這項解決方案由搭載Blackwell GPU與NVIDIA機密運算技術的NVIDIA HGX B200平台驅動,讓企業能夠保護AI模型與資料安全。這樣可讓使用者在不影響資料安全性或模型完整性的情況下,達到突破性的效能與能源效率。

代理型AI的AI可觀察性及安全性

在生產環境中擴展代理型AI需要強大的可觀察性與安全性,以確保有穩定的效能表現及符合法令要求。

Google Cloud宣布推出全新的GKE Inference Gateway,藉由先進的路由和擴充性來最佳化部署AI推論工作負載的部署。透過與NVIDIA Triton推論伺服器及NVIDIA NeMo Guardrails整合,GKE Inference Gateway可提供智慧型負載平衡,以提升效能與降低服務成本,同時實現模型安全與治理活動的集中化控管。

展望未來,Google Cloud正致力於整合專為跨AI工廠服務與擴充推理AI模型而打造的開源函式庫NVIDIA Dynamo,以提高代理型AI工作負載的可觀察性。


追蹤我們Featrue us

本站使用cookie及相關技術分析來改善使用者體驗。瞭解更多

我知道了!