0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

在阿里云PAI上快速部署NVIDIA Cosmos Reason-1模型

NVIDIA英伟达企业解决方案 ? 来源:NVIDIA英伟达企业解决方案 ? 2025-06-04 13:43 ? 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

NVIDIA 近期发布了Cosmos Reason-1的 7B 和 56B 两款多模态大语言模型 (MLLM),它们经过了“物理 AI 监督微调”和“物理 AI 强化学习”两个阶段的训练。其中,Cosmos Reason-1-7B 已经开源,其基于 Qwen2.5-VL 使用物理常识和具身推理数据进行了后训练。

阿里云 PAI-Model Gallery 现已集成 Cosmos Reason-1-7B 模型并提供企业级部署方案,本文介绍如何在阿里云人工智能平台 PAI (Platform of AI) 上快速部署和使用该模型。

NVIDIA Cosmos 平台

NVIDIA Cosmos是一个世界基础模型 (WFM) 的开发平台,整合了先进的分词器、护栏以及用于加速数据处理和管理的工作流,它为世界模型的训练提供支持,并加速智能驾驶汽车 (AV) 和机器人的物理 AI 开发。

Cosmos 提供了一系列预训练多模态模型,开发者可以开箱即用,包括用于世界生成和后训练的 Cosmos Predict、生成大规模可控且高保真合成数据的 Cosmos Transfer、物理 AI 推理的 Cosmos Reason 以及过滤不安全输入并确保输出一致性和安全性的 Cosmos Guardrail 等。

其中,NVIDIA Cosmos Reason-1 是一款可完全定制的多模态 AI 推理模型,它专门为理解运动、物体交互以及时空关系而构建。基于思维链 (Chain-of-thought, CoT) 推理,Cosmos Reason-1 模型可以解读视觉输入、根据给定的提示词预测结果、并基于推理给出优化分析和决策。

该模型基于真实世界的物理规律实现推理,从而生成清晰且能够感知上下文环境的自然语言回复。Cosmos Reason-1 既可以作为其他物理 AI 模型的数据清洗和质量过滤工具,也可以作为规划模型用于推理具身智能体下一步的行为。

阿里云 PAI-Model Gallery 集成的Cosmos Reason-1-7B

PAI-Model Gallery 是阿里云人工智能平台 PAI 产品组件,集成了众多 AI 开源社区中优质的预训练模型,并且基于开源模型支持零代码实现模型训练(微调)、压缩、评测、部署和推理的全部过程,提供更快、更高效、更便捷的 AI 应用体验。此外,它还提供开箱即用的 API,并且支持企业级数据安全。

Cosmos Reason-1-7B 集成到阿里云 PAI-Model Gallery,标志着用户能够在“AI + 云”的范式下,通过预训练模型的即用性与模块化设计,显著降低多模态技术栈选型的复杂度及模型适配成本。

企业和开发者现在可以基于领先的云原生平台,实现从原始视觉数据输入到物理约束驱动的高级推理输出的端到端开发,从而加速物理 AI 从原型到生产级部署的全生命周期。

在阿里云 PAI 上一键部署Cosmos Reason-1-7B

本节介绍 Cosmos Reason-1-7B 模型在阿里云人工智能平台 PAI 上进行一键部署,以及模型验证的实践。

1. 在 PAI-Model Gallery 模型广场找到 Cosmos Reason-1-7B 模型。以阿里云新加坡和中国大陆的节点为例。

2. 在模型详情页右上角点击「部署」,在选择计算资源后,即可一键完成模型的云上部署。

3. 部署成功后,在服务页面可以点击“查看调用信息”获取调用的 Endpoint 和 Token,想了解服务调用方式可以点击“预训练模型”链接,返回模型介绍页查看调用方式说明。

4. 使用推理服务:您可以使用 API 调用模型服务,也可以使用 PAI 提供的 WebUI 界面与模型交互。

模型实测

实测使用NVIDIA Research官网上的视频案例作为模型输入。视频中一个人正在往杯子中倒牛奶,我们给模型的问题是:“视频中的人将牛奶倒入杯子以后,下一步最合理的动作是什么?”模型的回答展示出模型考虑到了人物下一步动作的各种可能性,甚至考虑到了倒完牛奶放好奶瓶后,用勺子搅拌牛奶和咖啡,最后模型在进行了一番深入思考后得出了结论,下一步是“将奶瓶放回到台面上”。

从这个例子可以看出,模型准确地“理解”了视频中人的动作并给出了正确的预测,这种对运动、物体交互以及时空关系的理解及预测能力一般难以做到,而且模型输出了完整的思维链,让我们能清楚地知道模型的整个思考过程。

下面附上完整的视频、输入问题、模型输出结果,供大家参考。

Question:The overall goal is "The agent pours milk into the cup". The agent in the video is currently performing one subtask out of many to complete this instruction. For the agent in the video, what is the most plausible next immediate subtask?

Model outputs:The agent is currently pouring milk into the cup. The next immediate subtask after pouring would logically be to stop pouring once the desired amount is achieved. Then, the agent would need to place the milk bottle back on the countertop. After that, they might close the bottle's cap to prevent spills. Finally, they could stir the mixture with the spoon to mix the milk and coffee thoroughly. However, since the current action is pouring, the very next step after pouring would be to stop pouring and set the bottle down. But the question asks for the most plausible next immediate subtask. Since the pouring is ongoing, the next step after completing the pour would be to place the milk bottle back on the countertop. Alternatively, if the pouring is still in progress, maybe adjusting the angle to ensure all milk is poured. But given the context, the agent is actively pouring, so once that's done, placing the bottle down makes sense. However, the answer might be to stop pouring and set the bottle aside. But the exact next step after pouring would be to place the bottle back. Alternatively, maybe the agent needs to check if the cup is full enough. But the most logical next step after pouring is to stop and place the bottle down. So the answer is likely "Place the milk bottle back on the countertop."

即将到来:基于 NVIDIA Cosmos Reason-1 tools的模型后训练最佳实践

NVIDIA 也开源了 Cosmos Reason-1 tools,它是用于在 Cosmos Reason-1 基准测试上训练和评估模型的脚本。它提供的模型后训练脚本 (SFT + RL) 将加速企业和开发者基于自有数据定制 Cosmos Reason-1 模型,从而创建专属的 physical AI 模型。

阿里云 PAI 团队测试的 Cosmos Reason-1 tools 的性能表现如下:在 Qwen2.5-32B-Instruct 模型和 gsm8k 数据集 (Batch size = 2,048) 组合上进行后训练测试,相比其他开源框架,Cosmos Reason-1 tools 在小规模集群上实测有 1-2 倍的性能加速。PAI 将在近期集成 Cosmos Reason-1 tools 的模型后训练能力。

通过阿里云 PAI 上手实践NVIDIA Cosmos Reason-1-7B 模型

您可以根据所在区域,在阿里云国际站的新加坡或中国大陆节点,通过阿里云 PAI 使用 Cosmos Reason-1-7B 模型。

作者

黄博远

黄博远是阿里云大数据及人工智能平台的产品总监。他于 2014 年加入阿里巴巴集团,负责阿里妈妈(在线广告)和商业搜索团队的工程工作。自 2018 年起,他担任阿里云人工智能平台 PAI、DataWorks 和搜索平台的产品负责人。加入阿里巴巴之前,自 2007 年起,他曾在微软搜索技术中心担任搜索广告与展示广告团队的资深开发负责人。

高慧怡

高慧怡是 NVIDIA 深度学习解决方案架构师,2020 年加入 NVIDIA 解决方案架构团队,从事深度学习应用在异构系统的加速工作,目前主要支持国内 CSP 客户在大语言模型的训练加速工作。

金国强

金国强是 NVIDIA 资深解决方案架构师,主要负责深度学习生成式 AI 领域模型训练、推理优化以及大模型开发与应用云端落地等技术方向合作。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • NVIDIA
    +关注

    关注

    14

    文章

    5324

    浏览量

    106638
  • 模型
    +关注

    关注

    1

    文章

    3531

    浏览量

    50571
  • 阿里云
    +关注

    关注

    3

    文章

    1014

    浏览量

    44293

原文标题:在阿里云 PAI 上一键部署和使用 NVIDIA Cosmos Reason-1 模型

文章出处:【微信号:NVIDIA-Enterprise,微信公众号:NVIDIA英伟达企业解决方案】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    英伟达Cosmos-Reason1 模型深度解读

    英伟达近期发布的 Cosmos-Reason1 模型物理常识推理领域引发广泛关注。作为专为物理世界交互设计的多模态大语言模型,它通过融合视觉感知与复杂逻辑推理,重新定义了AI对物理世
    的头像 发表于 03-29 23:29 ?2042次阅读

    阿里设备的物模型数据里面始终没有值是为什么?

    如上图,不知道讲清楚没有。 IG502自定义TOPIC 发到阿里没问题。采用阿里模型
    发表于 07-24 07:49

    AI开发者福音!阿里推出国内首个基于英伟达NGC的GPU优化容器

    摘要: 3月28日,2018云栖大会·深圳峰会上,阿里宣布与英伟达GPU 合作 (NGC),开发者可以
    发表于 04-04 14:39

    阿里Kubernetes容器服务打造TensorFlow实验室

    的定义和训练的收敛趋势。总结我们可以利用阿里Kubernetes容器服务,轻松的搭建在云端搭建TensorFlow的环境,运行深度学习的实验室,并且利用TensorBoard追踪训练效果。欢迎大家使用阿里
    发表于 05-10 10:24

    阿里免费使用及手册

    .................................................... 6三、阿里优惠及免费(建立实名认证的基础) .............
    发表于 05-10 21:17

    阿里企业IPv6部署方案

    方便的阿里部署IPv6公网入口,同时将实例后端关联到线下IDC或其他平台的服务器。
    发表于 07-09 16:18

    阿里巴巴大数据产品最新特性介绍--机器学习PAI

    ,用户可以方便的进行构建实验,并将模型进行在线部署,最后应用到实际业务当中。3. PAI-DSWPAI之后的发展过程中,出现了新的需求,即
    发表于 09-18 14:57

    阿里展示“到端”整体方案

    MDM9206 中预集成阿里 Link 物联网套件,模组厂商和物联网开发者可以利用 LTE IoT 连接以及运行在 LTE 系统级芯片的客户端软件,实现解决方案的快速开发和
    发表于 07-27 06:30

    Ubuntu使用Nvidia GPU训练模型

    问题最近在Ubuntu使用Nvidia GPU训练模型的时候,没有问题,过一会再训练出现非常卡顿,使用nvidia-smi查看发现,显示GPU的风扇和电源报错:解决方案自动风扇控制
    发表于 01-03 08:24

    云端机器学习平台PAI最新的创新实践

    今年 3 月的 GTC 2022 大会上,阿里带来了推理优化/部署、深度学习编译器、大模型部署
    的头像 发表于 06-09 09:52 ?1311次阅读

    GTC23 | 阿里机器学习平台 PAI 精选演讲推荐

    本次 GTC 大会,来自阿里机器学习平台 PAI 的技术专家,将分享 开源产品 DeepRec 的高性能 GPU 训练推理优化 ,以及 机器学习模型中访存密集型计算 STITCH 融
    的头像 发表于 03-19 22:45 ?2323次阅读

    NVIDIA Cosmos世界基础模型平台发布

    NVIDIA 宣布推出NVIDIA Cosmos,该平台由先进的生成式世界基础模型、高级 tokenizer、护栏和加速视频处理管线组成,将推动自动驾驶汽车(AV)和机器人等物理 AI
    的头像 发表于 01-08 10:39 ?597次阅读

    NVIDIA发布Cosmos?平台,助力物理AI系统发展

    NVIDIA近日宣布推出全新的NVIDIA Cosmos?平台,该平台专为自动驾驶汽车(AV)和机器人等物理AI系统而设计,旨在推动这些领域的快速发展。
    的头像 发表于 01-08 15:36 ?648次阅读

    百度阿里上线DeepSeek模型部署服务

    近日,百度智能云和阿里相继宣布上线DeepSeek-R1和DeepSeek-V3模型部署服务,为开发者和企业用户提供了更加高效便捷的AI
    的头像 发表于 02-05 15:40 ?904次阅读

    如何本地部署NVIDIA Cosmos Reason-1-7B模型

    近日,NVIDIA 开源其物理 AI 平台 NVIDIA Cosmos 中的关键模型——NVIDIA C
    的头像 发表于 07-09 10:17 ?214次阅读