0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

利用NVIDIA推理模型构建AI智能体

NVIDIA英伟达企业解决方案 ? 来源:NVIDIA英伟达企业解决方案 ? 2025-08-13 14:32 ? 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

开放式推理模型能够更快、更广泛地进行思考,为客户服务、网络安全、制造、物流和机器人等领域的 AI 智能体生成更明智的结果。

Capgemini 数据表明,截至 2028 年,AI 智能体将通过推动收入增长与节省成本创造高达 4,500 亿美元的价值。构建这些智能体的开发者正转向更高性能的推理模型,以改进 AI 智能体平台和物理 AI 系统。

NVIDIA 在 SIGGRAPH 大会上宣布扩展两个支持推理功能的系列模型:NVIDIA Nemotron和NVIDIA Cosmos,各行业的领导者都在使用这些模型,通过 AI 智能体和人形机器人编队来提高生产力。

CrowdStrike、Uber、Magna、NetApp 和 Zoom 等一些企业都在使用这些系列模型。

全新 NVIDIA Nemotron Nano 2 和 Llama Nemotron Super 1.5 模型在同等规模模型中的科学推理、数学、编码、工具调用、指令遵循和对话方面展现出优异的精度表现。借助这些新模型,AI 智能体能够提高思考深度和工作效率,从而探索更广泛的选项、加速研究并在设定时限内提供更明智的结果。

模型能被视为 AI 智能体的“大脑”,它提供了核心智能。但要使这类“大脑”在企业中发挥作用,必须将其嵌入到能理解特定工作流以及行业和业务术语,并能够安全运行的智能体中。NVIDIA 可通过领先的库和 AI 蓝图帮助企业大规模部署、定制和管理 AI 智能体,从而弥合这一差距。

Cosmos Reason是用于物理 AI 应用的新型推理视觉语言模型 (VLM),擅长了解现实世界的运作机制,使用结构化推理来理解物理学、客体永久性和时空对齐等概念。

Cosmos Reason 经过量身定制,可作为机器人视觉语言动作 (VLA) 模型的推理主干,或为机器人和智能汽车训练数据评论和注释提供支持,并赋予运行时视觉 AI 智能体在工厂或城市等环境中对时空理解和物理操作的推理能力。

Nemotron:更大限度地提高

代理式企业级 AI 的精度和效率

随着企业开发 AI 智能体来处理复杂的多步骤任务,能够通过高效生成 token 来提供超高推理准确性的模型将可实现大规模智能且自主的决策制定。

NVIDIA Nemotron 包含一系列先进的开放式推理模型,可使用领先的模型、NVIDIA 精选的开放数据集和先进 AI 技术,帮助 AI 智能体提高准确性和效率。

最新 Nemotron 模型在以下三个方面实现了出色的效率:全新混合模型架构、紧凑型量化模型以及可配置的思考预算,可帮助开发者控制 token 生成,从而将推理成本降低 60%。这种组合便于模型更深入地进行推理并更快响应,无需投入更多时间或算力。这意味着能够以更低成本取得更好的结果。

与其他同等规模的领先模型相比,Nemotron Nano 2 将 token 生成提速 6 倍。

Llama Nemotron Super 1.5 在同类产品中实现了领先性能和极高的推理准确性,有助于 AI 智能体更高效地进行推理,做出更明智决策并独立处理复杂任务。它现以 NVFP4(即 4 位浮点)格式提供,与 NVIDIA H100 GPU 相比,在 NVIDIA B200 GPU 上可将吞吐量提高 6 倍。

aaa7a49e-7751-11f0-a18e-92fbcf53809c.png

上图显示,在同一时段内且计算预算相同的情况下,Nemotron 模型的推理实现了极高的准确性,并实现了单位成本下的极佳准确率。

在发布这两个全新 Nemotron 模型的同时,NVIDIA 还宣布推出首个开放 VLM 训练数据集 Llama Nemotron VLM 数据集 v1,该数据集包含 300 万个光学字符识别、视觉 QA 和字幕数据样本,可支持之前发布的 Llama 3.1 Nemotron Nano VL 8B 模型。

除推理模型精度以外,智能体还依赖检索增强生成 (RAG) 技术,跨不同来源从联网数据中获取最新、最相关的信息,以便做出明智决策。最近发布的 Llama 3.2 NeMo Retriever 嵌入模型在三个视觉文档检索排行榜 (ViDoRe V1、ViDoRe V2 和 MTEB VisualDocumentRetrieval) 中均排名前列,可帮助提高智能体系统的准确性。

借助这些推理和信息检索模型,使用AI-Q NVIDIA Blueprint构建的深度研究智能体目前在 DeepResearch Bench 上的开放可移植式智能体排行榜中排名首位。

NVIDIA NeMo和NVIDIA NIM可从开发、部署到智能体系统的监管和优化,支持整个 AI 智能体生命周期。

Cosmos Reason:物理 AI 领域的突破

VLM 标志着计算机视觉和机器人领域的突破,可助力机器识别物体和模式。但是,非推理的 VLM 缺乏理解现实世界并与之交互的能力,意味着它们既无法处理不确定性或新奇的情景,也无法执行复杂的多步骤任务。

NVIDIA Cosmos Reason是一种专为物理 AI 和机器人而打造的全新开放式可定制 70 亿参数推理 VLM。借助 Cosmos Reason,机器人和视觉 AI 智能体能够像人类一样进行推理,利用先验知识、物理理解和常识来了解物理世界并采取行动。

Cosmos Reason 可为机器人和物理 AI 应用提供高级功能,例如训练数据评论和字幕支持、机器人决策制定和视频分析 AI 智能体。

它可以帮助自动处理并标注大型多样化的训练数据集,加速高精度 AI 模型的开发。它也可以充当用于机器人规划的精密推理引擎,从而将复杂指令解析为即使在新环境也可供 VLA 模型执行的步骤。

它还可为NVIDIA Metropolis平台上基于视频搜索和总结 (VSS) NVIDIA Blueprint 构建的视频分析 AI 智能体提供支持,从大量存储或实时的视频数据中获取宝贵见解。这些视觉感知和交互式 AI 智能体可以通过查明异常,来帮助工厂、仓库、零售商店、机场、交叉路口等场所简化操作。

NVIDIA 的机器人研究团队将 Cosmos Reason 用于数据筛选和整理,并将其用作 VLA 模型(例如后续版本的NVIDIA Isaac GR00T NX)背后的 "System 2" 推理 VLM。

现已推出:适用于 AI 智能体和机器人的NVIDIA 推理模型无处不在

多元化企业和咨询行业领导者都在采用 NVIDIA 的最新推理模型。从网络安全到电信,各行业的领导者都开始使用 Nemotron 来构建企业级 AI 智能体。

Zoom计划将 Nemotron 推理模型与 Zoom AI Companion 相结合,帮助做出决策并管理多步骤任务,以便 Zoom Meetings、Zoom Chat 和 Zoom 文档用户执行操作。

CrowdStrike正在测试 Nemotron 模型,以便其 Charlotte AI 智能体在 CrowdStrike Falcon 平台上写入请求。

Amdocs正在其 amAIz 套件中使用 NVIDIA Nemotron 模型,以支持 AI 智能体处理护理、销售、网络和客户支持等领域的复杂、多步骤自动化操作。

鉴于 Nemotron Nano 2 的高吞吐量,安永正采用该模型来支持大型企业组织中的代理式 AI,用于处理税务、风险管理和金融用例。

NetApp正在测试 Nemotron 推理模型,以便 AI 智能体能够搜索和分析业务数据。

DataRobot正在与 Nemotron 模型合作,用于其 Agent Workforce Platform,以实现端到端的智能体生命周期管理。

Tabnine正使用 Nemotron 模型,为开发者提供编码任务建议和实现自动化编码任务。

Automation Anywhere、CrewAI和Dataiku等代理式 AI软件开发商都在其平台中集成了 Nemotron 模型。

交通运输、安全和 AI 智能领域的领先企业正使用 Cosmos Reason 来加强辅助驾驶、视频分析、道路和工作场所的安全。

Uber正在探索如何使用 Cosmos Reason 来分析智能汽车的行为。此外,Uber 还在对 Cosmos Reason 进行后训练,以总结视觉数据并分析行人穿行高速公路等场景,进而执行质量分析并指导辅助驾驶行为。

Cosmos Reason 也可以作为智能汽车的“大脑”。它让机器人能够解读环境,在接收到复杂指令时将其分解为任务,并使用常识去执行任务,即便在陌生环境中也是如此。

Centific正在测试 Cosmos Reason,以增强其 AI 赋能的视频智能平台。运用 VLM,该平台能够将复杂的视频数据处理为可供行动参考的见解,帮助减少误报并提高决策制定的效率。

VAST正采用 NVIDIA Cosmos Reason 及其 AI 操作系统来大规模处理海量视频流,推动实时城市智能发展。借助 VSS Blueprint,VAST 可构建能够识别突发事件并触发响应的智能体,将视频流和元数据转化为可操作的主动式公共安全工具。

Ambient.ai正使用 Cosmos Reason 的时间物理感知推理,自动检测丢失的个人防护设备并监测危险状况,帮助改善建筑、制造、物流和其他工业环境中的环境健康与安全。

Magna正在将 Cosmos Reason 集成至其 City Delivery Platform(一个高度自主、低成本即时配送解决方案),帮助车辆更快地适应新城市。该模型为车辆的长期轨迹规划增添了对世界的理解能力。

这些模型预计将以 NVIDIA NIM 的形式提供,以便安全可靠地部署到任意 NVIDIA 加速基础设施上,更大限度地提高隐私性和控制力。这些模型计划不久后通过 Amazon Bedrock 和 Amazon SageMaker AI (用于 Nemotron 模型),以及 Azure AI Foundry、Oracle Data Science Platform 和 Google Vertex AI 发布。

您可在 NVIDIA 官网上试用 Cosmos Reason,或通过 Hugging Face 和 GitHub 下载。

Nemotron Nano 2 和 Llama Nemotron Super 1.5 (NVFP4) 将在不久后开放下载。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • NVIDIA
    +关注

    关注

    14

    文章

    5348

    浏览量

    106844
  • AI
    AI
    +关注

    关注

    88

    文章

    35757

    浏览量

    282423
  • 模型
    +关注

    关注

    1

    文章

    3547

    浏览量

    50729

原文标题:SIGGRAPH 2025 | 全球行业先驱利用NVIDIA Nemotron和Cosmos推理模型,为企业构建AI智能体

文章出处:【微信号:NVIDIA-Enterprise,微信公众号:NVIDIA英伟达企业解决方案】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    澎峰科技完成OpenAI最新开源推理模型适配

    澎峰科技现已完成 OpenAI 最新开源推理模型 gpt-oss-20b 在 DeepFusion 大模型机上的原生适配与优化,用户可一键启用这颗“小而强悍”的新引擎,在本地享受企业级 A
    的头像 发表于 08-14 11:34 ?351次阅读

    基于NVIDIA Llama Nemotron Super v1.5模型构建AI智能

    AI 智能体现在已经能够解决多步骤问题、编写生产级代码并在多个领域担任通用助手。但要充分发挥其潜力,还需要在控制成本的前提下加入先进的逻辑推理模型
    的头像 发表于 08-05 16:17 ?440次阅读
    基于<b class='flag-5'>NVIDIA</b> Llama Nemotron Super v1.5<b class='flag-5'>模型</b><b class='flag-5'>构建</b><b class='flag-5'>AI</b><b class='flag-5'>智能</b><b class='flag-5'>体</b>

    信而泰×DeepSeek:AI推理引擎驱动网络智能诊断迈向 “自愈”时代

    模态的技术特性,DeepSeek正加速推动AI在金融、政务、科研及网络智能化等关键领域的深度应用。 信而泰:AI推理引擎赋能网络智能诊断新范
    发表于 07-16 15:29

    企业使用NVIDIA NeMo微服务构建AI智能平台

    已发布的 NeMo 微服务可与合作伙伴平台集成,作为创建 AI 智能构建模块,使用商业智能与强大的逻辑
    的头像 发表于 04-27 15:05 ?648次阅读

    首创开源架构,天玑AI开发套件让端侧AI模型接入得心应手

    科正将AI能力体系化并赋能终端生态。 大会上,联发科定义了“智能化用户体验”的五大特征:主动及时、知你懂你、互动协作、学习进化和专属隐私信息守护。这五大特征需要跨越从芯片、模型、应
    发表于 04-13 19:52

    详解 LLM 推理模型的现状

    领域的最新研究进展,特别是自DeepSeekR1发布后兴起的推理时间计算扩展相关内容。在LLM中实施和改进推理简单来说,基于LLM的推理模型是一种旨在通过生成中间
    的头像 发表于 04-03 12:09 ?638次阅读
    详解 LLM <b class='flag-5'>推理模型</b>的现状

    英伟达GTC2025亮点 NVIDIA推出Cosmos世界基础模型和物理AI数据工具的重大更新

    推理模型,让开发者以前所未有的方式控制世界生成。 NVIDIA 还推出了两款由 NVIDIA Omniverse 和 Cosmos 平台提供支持的新蓝图,为开发者提供用于机
    的头像 发表于 03-20 19:01 ?956次阅读

    英伟达GTC25亮点:NVIDIA Dynamo开源库加速并扩展AI推理模型

    DeepSeek-R1 上的吞吐量提高了 30 倍 NVIDIA 发布了开源推理软件 NVIDIA Dynamo,旨在以高效率、低成本加速并扩展 AI 工厂中的
    的头像 发表于 03-20 15:03 ?731次阅读

    NVIDIA 与行业领先的存储企业共同推出面向 AI 时代的新型企业基础设施

    存储提供商构建搭载 AI 查询智能的基础设施,利用 NVIDIA 计算、网络和软件,针对复杂查
    发表于 03-19 10:11 ?281次阅读
    <b class='flag-5'>NVIDIA</b> 与行业领先的存储企业共同推出面向 <b class='flag-5'>AI</b> 时代的新型企业基础设施

    NVIDIA 推出开放推理 AI 模型系列,助力开发者和企业构建代理式 AI 平台

    月 18 日 —— ?NVIDIA 今日发布具有推理功能的开源 Llama Nemotron 模型系列,旨在为开发者和企业提供业务就绪型基础,助力构建能够独立工作或以团队形式完成复杂
    发表于 03-19 09:31 ?258次阅读
    <b class='flag-5'>NVIDIA</b> 推出开放<b class='flag-5'>推理</b> <b class='flag-5'>AI</b> <b class='flag-5'>模型</b>系列,助力开发者和企业<b class='flag-5'>构建</b>代理式 <b class='flag-5'>AI</b> 平台

    AI模型在汽车应用中的推理、降本与可解释性研究

    佐思汽研发布《2024-2025年AI模型及其在汽车领域的应用研究报告》。 推理能力成为大模型性能提升的驱动引擎 2024下半年以来,国内外大模型
    的头像 发表于 02-18 15:02 ?1405次阅读
    <b class='flag-5'>AI</b>大<b class='flag-5'>模型</b>在汽车应用中的<b class='flag-5'>推理</b>、降本与可解释性研究

    科大讯飞发布星火深度推理模型X1

    今天,科大讯飞正式发布星火深度推理模型X1,星火4.0 Turbo底座全面升级,首发星火语音同传大模型
    的头像 发表于 01-15 15:54 ?810次阅读

    科大讯飞即将发布讯飞星火深度推理模型X1

    ,标志着科大讯飞在AI技术领域的又一次重大突破。讯飞星火深度推理模型X1将为科大讯飞的智能产品注入更为强大的AI能力,使其在处理复杂任务和
    的头像 发表于 01-08 10:30 ?816次阅读

    智谱推出深度推理模型GLM-Zero预览版

    近日,智谱公司正式发布了其深度推理模型GLM-Zero的预览版——GLM-Zero-Preview。这款模型标志着智谱在扩展强化学习技术训练推理模型方面的重大突破,成为其首个专注于增强AI
    的头像 发表于 01-03 10:42 ?583次阅读

    智谱GLM-Zero深度推理模型预览版正式上线

    近日,智谱公司宣布其深度推理模型GLM-Zero的初代版本——GLM-Zero-Preview已正式上线。这款模型是智谱首个基于扩展强化学习技术训练的推理模型,标志着智谱在AI
    的头像 发表于 01-02 10:55 ?594次阅读