NVIDIA 人工智慧代理 AI代理 AI Agent 視覺化

利用全新的NVIDIA AI Blueprint開發視覺AI代理,以提高生產效率、最佳化流程及創造更安全的空間

將 AI 視覺化:任何產業現在都能搜尋並摘要大量的視覺資料

2024-11-18
全球各地的企業與公部門組織都在開發人工智慧代理(AI agent),以提升工作團隊的能力,這些工作團隊依賴來自攝影機、物聯網感測器與車輛等越來越多裝置所產生的視覺資訊。

適用於視訊搜尋與摘要的全新NVIDIA AI Blueprint將可讓幾乎所有產業的開發人員建立可分析視訊與影像內容的視覺AI代理,以支援他們進行各項工作。這些代理可以回答使用者的問題、產生摘要,並針對特定情境啟用警示功能。

該藍圖(blueprint)為NVIDIA Metropolis這套供開發人員用於建置視覺AI應用工具的一部分,是一個結合NVIDIA電腦視覺與生成式AI技術的客製化工作流程。

包括埃森哲(Accenture)、戴爾科技集團(Dell Technologies)與聯想集團(Lenovo)在內的全球系統整合商與技術解決方案供應商,將用於視覺搜尋與摘要的NVIDIA AI Blueprint帶給全球企業與城市使用,掀起下一波AI應用的浪潮,這些應用可部署於工廠、倉庫、商店、機場、交通路口等,以提升生產效率與安全性。

於智慧城市世界大會(Smart City Expo World Congress)開展前發表的NVIDIA AI Blueprint為視覺運算開發人員提供一整套最佳化軟體,用於建置與部署生成式AI驅動的代理,這些代理可擷取與理解大量即時視訊串流或資料檔案。

使用者可以用自然語言提示,而非死板的軟體程式碼,來客製化這些視覺AI代理,降低在各產業和智慧城市應用部署虛擬助理的門檻。

NVIDIA AI Blueprints利用視覺語言模型

視覺AI代理由視覺語言模型(VLM)驅動,VLM是一種結合電腦視覺與語言理解的生成式AI模型,可解釋實體世界與執行推理任務。

適用於視訊搜尋與摘要的NVIDIA AI Blueprint可搭配NVIDIA NIM微服務來配置如NVIDIA VILA的VLM、如Meta 的 Llama 3.1 405B的大型語言模型(LLM),以及適用於GPU加速問題解答與語境感知檢索增強生成的AI模型。開發人員可以輕鬆交換其他VLM、LLM與圖形資料庫,並且使用NVIDIA NeMo平台針對其獨特環境與使用個案進行微調。

採用NVIDIA AI Blueprint可以為開發人員省去數個月的時間來研究與最佳化智慧城市應用的AI模型。透過在邊緣、地端或雲端環境部署NVIDIA GPU,可以大幅加快梳理視訊檔案以識別重要時刻的過程。


追蹤我們Featrue us

本站使用cookie及相關技術分析來改善使用者體驗。瞭解更多

我知道了!