利用NVIDIA推理模型构建AI智能体-电子发烧友网

开放式推理模型能够更快、更广泛地进行思考，为客户服务、网络安全、制造、物流和机器人等领域的 AI 智能体生成更明智的结果。

Capgemini 数据表明，截至 2028 年，AI 智能体将通过推动收入增长与节省成本创造高达 4,500 亿美元的价值。构建这些智能体的开发者正转向更高性能的推理模型，以改进 AI 智能体平台和物理 AI 系统。

NVIDIA 在 SIGGRAPH 大会上宣布扩展两个支持推理功能的系列模型：NVIDIA Nemotron和NVIDIA Cosmos，各行业的领导者都在使用这些模型，通过 AI 智能体和人形机器人编队来提高生产力。

CrowdStrike、Uber、Magna、NetApp 和 Zoom 等一些企业都在使用这些系列模型。

全新 NVIDIA Nemotron Nano 2 和 Llama Nemotron Super 1.5 模型在同等规模模型中的科学推理、数学、编码、工具调用、指令遵循和对话方面展现出优异的精度表现。借助这些新模型，AI 智能体能够提高思考深度和工作效率，从而探索更广泛的选项、加速研究并在设定时限内提供更明智的结果。

模型能被视为 AI 智能体的“大脑”，它提供了核心智能。但要使这类“大脑”在企业中发挥作用，必须将其嵌入到能理解特定工作流以及行业和业务术语，并能够安全运行的智能体中。NVIDIA 可通过领先的库和 AI 蓝图帮助企业大规模部署、定制和管理 AI 智能体，从而弥合这一差距。

Cosmos Reason是用于物理 AI 应用的新型推理视觉语言模型 (VLM)，擅长了解现实世界的运作机制，使用结构化推理来理解物理学、客体永久性和时空对齐等概念。

Cosmos Reason 经过量身定制，可作为机器人视觉语言动作 (VLA) 模型的推理主干，或为机器人和智能汽车训练数据评论和注释提供支持，并赋予运行时视觉 AI 智能体在工厂或城市等环境中对时空理解和物理操作的推理能力。

Nemotron：更大限度地提高

代理式企业级 AI 的精度和效率

随着企业开发 AI 智能体来处理复杂的多步骤任务，能够通过高效生成 token 来提供超高推理准确性的模型将可实现大规模智能且自主的决策制定。

NVIDIA Nemotron 包含一系列先进的开放式推理模型，可使用领先的模型、NVIDIA 精选的开放数据集和先进 AI 技术，帮助 AI 智能体提高准确性和效率。

最新 Nemotron 模型在以下三个方面实现了出色的效率：全新混合模型架构、紧凑型量化模型以及可配置的思考预算，可帮助开发者控制 token 生成，从而将推理成本降低 60%。这种组合便于模型更深入地进行推理并更快响应，无需投入更多时间或算力。这意味着能够以更低成本取得更好的结果。

与其他同等规模的领先模型相比，Nemotron Nano 2 将 token 生成提速 6 倍。

Llama Nemotron Super 1.5 在同类产品中实现了领先性能和极高的推理准确性，有助于 AI 智能体更高效地进行推理，做出更明智决策并独立处理复杂任务。它现以 NVFP4（即 4 位浮点）格式提供，与 NVIDIA H100 GPU 相比，在 NVIDIA B200 GPU 上可将吞吐量提高 6 倍。

上图显示，在同一时段内且计算预算相同的情况下，Nemotron 模型的推理实现了极高的准确性，并实现了单位成本下的极佳准确率。

在发布这两个全新 Nemotron 模型的同时，NVIDIA 还宣布推出首个开放 VLM 训练数据集 Llama Nemotron VLM 数据集 v1，该数据集包含 300 万个光学字符识别、视觉 QA 和字幕数据样本，可支持之前发布的 Llama 3.1 Nemotron Nano VL 8B 模型。

除推理模型精度以外，智能体还依赖检索增强生成 (RAG) 技术，跨不同来源从联网数据中获取最新、最相关的信息，以便做出明智决策。最近发布的 Llama 3.2 NeMo Retriever 嵌入模型在三个视觉文档检索排行榜 (ViDoRe V1、ViDoRe V2 和 MTEB VisualDocumentRetrieval) 中均排名前列，可帮助提高智能体系统的准确性。

借助这些推理和信息检索模型，使用AI-Q NVIDIA Blueprint构建的深度研究智能体目前在 DeepResearch Bench 上的开放可移植式智能体排行榜中排名首位。

NVIDIA NeMo和NVIDIA NIM可从开发、部署到智能体系统的监管和优化，支持整个 AI 智能体生命周期。

Cosmos Reason：物理 AI 领域的突破

VLM 标志着计算机视觉和机器人领域的突破，可助力机器识别物体和模式。但是，非推理的 VLM 缺乏理解现实世界并与之交互的能力，意味着它们既无法处理不确定性或新奇的情景，也无法执行复杂的多步骤任务。

NVIDIA Cosmos Reason是一种专为物理 AI 和机器人而打造的全新开放式可定制 70 亿参数推理 VLM。借助 Cosmos Reason，机器人和视觉 AI 智能体能够像人类一样进行推理，利用先验知识、物理理解和常识来了解物理世界并采取行动。

Cosmos Reason 可为机器人和物理 AI 应用提供高级功能，例如训练数据评论和字幕支持、机器人决策制定和视频分析 AI 智能体。

它可以帮助自动处理并标注大型多样化的训练数据集，加速高精度 AI 模型的开发。它也可以充当用于机器人规划的精密推理引擎，从而将复杂指令解析为即使在新环境也可供 VLA 模型执行的步骤。

它还可为NVIDIA Metropolis平台上基于视频搜索和总结 (VSS) NVIDIA Blueprint 构建的视频分析 AI 智能体提供支持，从大量存储或实时的视频数据中获取宝贵见解。这些视觉感知和交互式 AI 智能体可以通过查明异常，来帮助工厂、仓库、零售商店、机场、交叉路口等场所简化操作。

NVIDIA 的机器人研究团队将 Cosmos Reason 用于数据筛选和整理，并将其用作 VLA 模型（例如后续版本的NVIDIA Isaac GR00T NX）背后的 "System 2" 推理 VLM。

现已推出：适用于 AI 智能体和机器人的NVIDIA 推理模型无处不在

多元化企业和咨询行业领导者都在采用 NVIDIA 的最新推理模型。从网络安全到电信，各行业的领导者都开始使用 Nemotron 来构建企业级 AI 智能体。

Zoom计划将 Nemotron 推理模型与 Zoom AI Companion 相结合，帮助做出决策并管理多步骤任务，以便 Zoom Meetings、Zoom Chat 和 Zoom 文档用户执行操作。

CrowdStrike正在测试 Nemotron 模型，以便其 Charlotte AI 智能体在 CrowdStrike Falcon 平台上写入请求。

Amdocs正在其 amAIz 套件中使用 NVIDIA Nemotron 模型，以支持 AI 智能体处理护理、销售、网络和客户支持等领域的复杂、多步骤自动化操作。

鉴于 Nemotron Nano 2 的高吞吐量，安永正采用该模型来支持大型企业组织中的代理式 AI，用于处理税务、风险管理和金融用例。

NetApp正在测试 Nemotron 推理模型，以便 AI 智能体能够搜索和分析业务数据。

DataRobot正在与 Nemotron 模型合作，用于其 Agent Workforce Platform，以实现端到端的智能体生命周期管理。

Tabnine正使用 Nemotron 模型，为开发者提供编码任务建议和实现自动化编码任务。

Automation Anywhere、CrewAI和Dataiku等代理式 AI软件开发商都在其平台中集成了 Nemotron 模型。

交通运输、安全和 AI 智能领域的领先企业正使用 Cosmos Reason 来加强辅助驾驶、视频分析、道路和工作场所的安全。

Uber正在探索如何使用 Cosmos Reason 来分析智能汽车的行为。此外，Uber 还在对 Cosmos Reason 进行后训练，以总结视觉数据并分析行人穿行高速公路等场景，进而执行质量分析并指导辅助驾驶行为。

Cosmos Reason 也可以作为智能汽车的“大脑”。它让机器人能够解读环境，在接收到复杂指令时将其分解为任务，并使用常识去执行任务，即便在陌生环境中也是如此。

Centific正在测试 Cosmos Reason，以增强其 AI 赋能的视频智能平台。运用 VLM，该平台能够将复杂的视频数据处理为可供行动参考的见解，帮助减少误报并提高决策制定的效率。

VAST正采用 NVIDIA Cosmos Reason 及其 AI 操作系统来大规模处理海量视频流，推动实时城市智能发展。借助 VSS Blueprint，VAST 可构建能够识别突发事件并触发响应的智能体，将视频流和元数据转化为可操作的主动式公共安全工具。

Ambient.ai正使用 Cosmos Reason 的时间物理感知推理，自动检测丢失的个人防护设备并监测危险状况，帮助改善建筑、制造、物流和其他工业环境中的环境健康与安全。

Magna正在将 Cosmos Reason 集成至其 City Delivery Platform（一个高度自主、低成本即时配送解决方案），帮助车辆更快地适应新城市。该模型为车辆的长期轨迹规划增添了对世界的理解能力。

这些模型预计将以 NVIDIA NIM 的形式提供，以便安全可靠地部署到任意 NVIDIA 加速基础设施上，更大限度地提高隐私性和控制力。这些模型计划不久后通过 Amazon Bedrock 和 Amazon SageMaker AI (用于 Nemotron 模型)，以及 Azure AI Foundry、Oracle Data Science Platform 和 Google Vertex AI 发布。

您可在 NVIDIA 官网上试用 Cosmos Reason，或通过 Hugging Face 和 GitHub 下载。

Nemotron Nano 2 和 Llama Nemotron Super 1.5 (NVFP4) 将在不久后开放下载。

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉