0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

基于NVIDIA Llama Nemotron Super v1.5模型构建AI智能体

NVIDIA英伟达企业解决方案 ? 来源:NVIDIA英伟达企业解决方案 ? 2025-08-05 16:17 ? 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

AI 智能体现在已经能够解决多步骤问题、编写生产级代码并在多个领域担任通用助手。但要充分发挥其潜力,还需要在控制成本的前提下加入先进的逻辑推理模型。

NVIDIA Nemotron系列在生态系统中强大的开放模型基础上,通过使用 NVIDIA 开源合成数据集、先进的技术以及工具,进一步提升了模型的准确性、效率和透明度。使得创建实用、适配、高性能的 AI 智能体成为了可能。

该系列最新发布的 Llama Nemotron Super 48B v1.5 版本在保持高吞吐量和计算效率的情况下,显著提升了在数学、科学、编码、函数调用、指令跟随、对话等核心逻辑推理与代理任务中的性能。

该模型现已位居 Artificial Analysis Intelligence Index 排行榜榜首。

本文将详细介绍这一最新 NVIDIA Nemotron 模型的准确性与推理性能、训练方法、数据透明度、架构优化及部署选项。

Llama Nemotron Super v1.5

领跑 Artificial Analysis 排行榜

新模型采用与原 Llama Nemotron Ultra v1 相同的方法构建而成,但使用了更多高质量的逻辑推理数据来进一步进行优化和训练后微调。

该模型凭借在多项逻辑推理和代理任务中展现出的领先性能,问鼎 Artificial Analysis Intelligence Index 排行榜。排行榜汇集 MMLU-Pro、GPQA Diamond、Humanity’s Last Exam、LiveCodeBench、SciCode、AIME 和 MATH-500 等基准测试的准确率数据。

70ec6732-7119-11f0-a18e-92fbcf53809c.jpg

图 1. Artificial Analysis Intelligence Index 排行榜

根据第三方在一系列行业标准逻辑推理及指令和函数调用任务基准测试中的评估,Llama Nemotron Super v1.5 在高等数学、编码、逻辑推理和对话指标上的表现优于其他开放模型,使其稳居 700 亿参数级模型榜首。

70f82a0e-7119-11f0-a18e-92fbcf53809c.jpg

图 2. Llama Nemotron Super v1.5 为逻辑推理和代理任务提供更高的准确性

除了在逻辑推理和代理能力上领先外,该模型还使用能够提高吞吐量性能 (Neural Architecture Search, 神经架构搜索) 的后训练方法,大幅提升了吞吐量。

710e9ba4-7119-11f0-a18e-92fbcf53809c.jpg

图 3. Llama Nemotron Super v1.5 为代理任务提供更高的准确性和吞吐量,降低了推理成本

最终得到了一个适合在单个 NVIDIA Hopper 架构 GPU 上运行的高性能模型,使开发者能够开发出更加有效和高效的代理系统。

专为逻辑推理和代理工作负载开发

Llama Nemotron Super v1.5 使用多项 NVIDIA 核心技术开发而成:

Llama Nemotron 后训练开源数据集

该数据集完全通过合成数据生成技术创建而成,其使用了 Qwen3 235B 和 DeepSeek R1 671B 0528 等先进的逻辑推理模型。它使团队能够生成超过 2,600 万行高质量的函数调用、指令跟随、逻辑推理、对话、数学和代码数据。

发布该数据集使我们能公开透明地展示模型训练的具体内容,让开发者和企业更加放心地选择 Llama Nemotron Super v1.5 作为其代理系统的引擎。

除了公开透明外,发布该数据集还使开发者在自行开发模型时无需投入大量的时间和精力去生成高质量数据集,降低了开发新型高性能模型的门槛。

该数据集即将在 Hugging Face 上发布,可通过数据集卡片获得更详细的信息。

后训练流程

如此前文章所述,后训练流程如下:

711c93ee-7119-11f0-a18e-92fbcf53809c.jpg

图 4. Llama Nemotron Super v1.5 后训练流程

团队利用强化学习将该模型性能提高到极限,以此实现了上述逻辑推理能力。该模型经过了多道后训练流程,所有流程均针对需要提升的能力定制,包括监督式微调 (SFT) 以及:

奖励感知偏好优化 (RPO):使用 NVIDIA 先进的奖励模型提升对话能力

直接偏好优化 (DPO):用于提升工具调用的能力

可验证奖励强化学习 (RLVR):用于提升指令执行、数学、科学等能力

这套全面的后训练流程确保模型的每项能力都得到了训练,将逻辑推理准确性推向了新高度。

团队还使用了NeMo Skills评估和验证模型检查点,加快了迭代速度和研究周期,并实现可复现性。

以 NIM 形式提供Llama Nemotron Super v1.5

Llama Nemotron Super v1.5 很快将作为NVIDIA NIM提供,以便快速、可靠地将其部署到首选的 NVIDIA 加速基础设施上。用户只需使用几行简单命令就能完成部署,并且能够直接集成兼容 OpenAI API 的私有端点,以提升 AI 智能体和逻辑推理应用的性能。此外,Llama Nemotron Super 的强大推理性能可根据需求自动扩展。

开始使用

Llama Nemotron Super v1.5

Llama Nemotron Super v1.5 模型在保持计算效率的同时,还提供强大的逻辑推理能力。它能够驱动从个人开发者到大型企业的各类代理应用。

现可先在 NVIDIA 官网上试用模型。如要对模型进行测试,可通过 Hugging Face 下载检查点,或按照模型卡片通过所提供的指令运行模型。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • NVIDIA
    +关注

    关注

    14

    文章

    5346

    浏览量

    106818
  • AI
    AI
    +关注

    关注

    88

    文章

    35718

    浏览量

    282253
  • 模型
    +关注

    关注

    1

    文章

    3546

    浏览量

    50711

原文标题:使用全新 NVIDIA Llama Nemotron Super v1.5 构建更加准确、高效的 AI 智能体

文章出处:【微信号:NVIDIA-Enterprise,微信公众号:NVIDIA英伟达企业解决方案】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    NVIDIA AI Foundry 为全球企业打造自定义 Llama 3.1 生成式 AI 模型

    借助 NVIDIA AI Foundry,企业和各国现在能够使用自有数据与 Llama 3.1 405B 和 NVIDIA Nemotron
    发表于 07-24 09:39 ?949次阅读
    <b class='flag-5'>NVIDIA</b> <b class='flag-5'>AI</b> Foundry 为全球企业打造自定义 <b class='flag-5'>Llama</b> 3.1 生成式 <b class='flag-5'>AI</b> <b class='flag-5'>模型</b>

    NuTiny-EVB-NUC_QFN88 V1.4,网站上提供的资料是v1.5的请问v1.4与v1.5的区别在哪里?

    手上有一块 NuTiny-EVB-NUC_QFN88 V1.4,网站上提供的资料是v1.5的请问v1.4与v1.5的区别在哪里? Sample Code 能否通用?有没有
    发表于 06-16 08:12

    LPC2378 Erratasheet V1.5资料

    LPC2378 Erratasheet V1.5资料,感兴趣的小伙伴们可以看看。
    发表于 11-08 18:13 ?0次下载

    YX5200-24SS原理图V1.5

    语音芯片YX5200-24SS原理图V1.5
    发表于 11-28 14:16 ?85次下载

    单片机小精灵v1.5资源下载

    单片机小精灵v1.5资源下载
    发表于 03-29 15:38 ?108次下载

    ATK 3.5 TFTLCD V1.5图下载

    ATK 3.5 TFTLCD V1.5图下载
    发表于 09-28 14:35 ?0次下载

    NVIDIA Nemotron-4 340B模型帮助开发者生成合成训练数据

    Nemotron-4 340B 是针对 NVIDIA NeMo 和 NVIDIA TensorRT-LLM 优化的模型系列,该系列包含最先进的指导和奖励
    的头像 发表于 09-06 14:59 ?786次阅读
    <b class='flag-5'>NVIDIA</b> <b class='flag-5'>Nemotron</b>-4 340B<b class='flag-5'>模型</b>帮助开发者生成合成训练数据

    英伟达发布AI模型 Llama-3.1-Nemotron-51B AI模型

    英伟达公司宣布推出 Llama-3.1-Nemotron-51B AI 模型,这个AI模型是源自 Meta 公司的
    的头像 发表于 09-26 17:30 ?995次阅读

    使用NVIDIA TensorRT提升Llama 3.2性能

    Llama 3.2 模型集扩展了 Meta Llama 开源模型集的模型阵容,包含视觉语言模型
    的头像 发表于 11-20 09:59 ?883次阅读

    NVIDIA推出开放式Llama Nemotron系列模型

    作为 NVIDIA NIM 微服务,开放式 Llama Nemotron 大语言模型和 Cosmos Nemotron 视觉语言
    的头像 发表于 01-09 11:11 ?843次阅读

    NVIDIA 推出开放推理 AI 模型系列,助力开发者和企业构建代理式 AI 平台

    月 18 日 —— ?NVIDIA 今日发布具有推理功能的开源 Llama Nemotron 模型系列,旨在为开发者和企业提供业务就绪型基础,助力
    发表于 03-19 09:31 ?258次阅读
    <b class='flag-5'>NVIDIA</b> 推出开放推理 <b class='flag-5'>AI</b> <b class='flag-5'>模型</b>系列,助力开发者和企业<b class='flag-5'>构建</b>代理式 <b class='flag-5'>AI</b> 平台

    企业使用NVIDIA NeMo微服务构建AI智能平台

    已发布的 NeMo 微服务可与合作伙伴平台集成,作为创建 AI 智能构建模块,使用商业智能与强大的逻辑推理
    的头像 发表于 04-27 15:05 ?645次阅读

    ServiceNow携手NVIDIA构建150亿参数超级助手

    Apriel Nemotron 15B 开源大语言模型 (LLM) 使用 NVIDIA NeMo、NVIDIA Llama
    的头像 发表于 05-12 15:37 ?448次阅读

    欧洲借助NVIDIA Nemotron优化主权大语言模型

    NVIDIA 正携手欧洲和中东的模型构建商与云提供商,共同优化主权大语言模型 (LLM),加速该地区各行业采用企业级 AI
    的头像 发表于 06-12 15:42 ?534次阅读

    利用NVIDIA推理模型构建AI智能

    开放式推理模型能够更快、更广泛地进行思考,为客户服务、网络安全、制造、物流和机器人等领域的 AI 智能生成更明智的结果。
    的头像 发表于 08-13 14:32 ?321次阅读
    利用<b class='flag-5'>NVIDIA</b>推理<b class='flag-5'>模型</b><b class='flag-5'>构建</b><b class='flag-5'>AI</b><b class='flag-5'>智能</b><b class='flag-5'>体</b>