0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

NVIDIA发布全新AI和仿真工具以及工作流

NVIDIA英伟达企业解决方案 ? 来源:NVIDIA英伟达企业解决方案 ? 2024-11-09 11:52 ? 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

新的 Project GR00T 工作流和 AI world model开发技术将提高机器人的灵巧性、控制性、操纵性和移动性。

NVIDIA 在本周于德国慕尼黑举行的机器人学习大会(CoRL)上发布了全新 AI 和仿真工具以及工作流。机器人开发者可以使用这些工具和工作流,大大加快 AI 机器人(包括人形机器人)的开发工作。

此次发布的系列产品包括:NVIDIA Isaac Lab 机器人学习框架正式版;Project GR00T(一个为加速人形机器人发展的项目)的六个全新人形机器人学习工作流;以及用于视频数据管理和处理的全新世界模型开发工具,包括用于视频处理的NVIDIA Cosmos tokenizer和NVIDIA NeMo Curator。

开源 Cosmos tokenizer可将图像和视频分解为具有极高压缩率的高质量 token,为机器人开发者提供卓越的视觉标记化功能。Cosmos tokenizer的运行速度最高可达到当前标记器的 12 倍,NeMo Curator 的视频处理整理速度则最高可达到未优化管线的 7 倍。

NVIDIA 在 CoRL 上还发布了 23 篇与机器人学习相关的论文,并举办了 9 场研讨会,同时发布了面向开发者的培训和工作流指南。此外,Hugging Face 和 NVIDIA 还宣布,将共同使用 LeRobot、NVIDIA Isaac Lab和NVIDIA Jetson来加速开发者社区的开源机器人研究。

使用 Isaac Lab 加速机器人开发

NVIDIA Isaac Lab 是一个建立在NVIDIA Omniverse平台上的开源机器人学习框架。NVIDIA Omniverse 是一个用于开发适用于工业数字化和物理 AI 仿真的 OpenUSD 应用的平台。

开发者可以使用 Isaac Lab 来大规模训练机器人策略。这个开源的统一机器人学习框架适用于从人形机器人到四足机器人和协作机器人等各种具身,能够处理日益复杂的动作和交互。

全球领先的商用机器人制造商、机器人应用开发商和机器人研究机构都在使用 Isaac Lab,包括 1X、Agility Robotics、波士顿动力人工智能研究所、Berkeley Humanoid、波士顿动力公司、Field AI、傅利叶、银河通用、Mentee Robotics、Skild AI、Swiss-Mile、宇树科技和小鹏机器人。

Project GR00T:

通用人形机器人的基础

制造先进的人形机器人非常困难,需要多层技术和跨学科方法,才能使机器人有效地感知、移动和学习技能,进而实现人与机器人以及机器人与环境的交互。

Project GR00T旨在通过开发加速库、基础模型和数据管线,加速全球人形机器人开发者生态的发展。

这六个全新 Project GR00T 工作流为人形机器人开发者提供了实现最具挑战性的人形机器人功能的蓝图:

GR00T-Gen用于构建基于 OpenUSD 的生成式 AI 3D 环境

GR00T-Mimic用于生成机器人运动和轨迹

GR00T-Dexterity用于机器人灵巧操作

GR00T-Control用于全身控制

GR00T-Mobility用于机器人运动和导航

GR00T-Perception用于多模态感知

NVIDIA 具身 AI 高级研究经理 Jim Fan 表示:“人形机器人是具身 AI 的下一轮浪潮。NVIDIA 的研究和工程团队正在与整个公司内部和我们的开发者生态合作构建 Project GR00T,以帮助推动全球人形机器人开发者的进步和发展。”

世界模型构建者的新开发工具

如今,机器人开发者正在构建世界模型。这种用 AI 呈现世界的方式可以预测物体和环境对机器人行动的反应。构建这些世界模型需要大量计算和数据,这些模型需要数千小时的经过整理的真实世界图像或视频数据。

NVIDIA Cosmos tokenizer 提供高效、优质的编码和解码能力,能够简化这些世界模型的开发。它们树立了最小失真和时间不稳定性的新标准,实现了高质量的视频和图像重建。

Cosmos tokenizer 提供了高质量压缩和最高达 12 倍的视觉重构速度,为在广泛的视觉域开发可扩展、强大且高效的生成应用创造了条件。

人形机器人公司 1X 已更新了 1X 世界模型挑战赛数据集,以便使用 Cosmos tokenizer。

1X Technologies AI 副总裁 Eric Jang 表示:“NVIDIA Cosmos tokenizer 在保持视觉保真度的同时,实现了对我们数据的高度时空压缩。这让我们能够以更高效的计算方式,来使用长视距视频生成技术去训练世界模型。”

包括小鹏机器人和 Hillbot 在内的其他人形机器人和通用机器人开发商正在其开发过程中使用 NVIDIA Cosmos tokenizer,以管理高分辨率图像和视频。

NeMo Curator 现在加入了一个视频处理管线,这使机器人开发者能够通过处理大规模文本、图像和视频数据,来提高其世界模型的准确性。

由于视频数据的规模庞大,需要可扩展的管线和跨 GPU 负载平衡的高效编排,这给视频数据管理带来了挑战。此外,还需要对过滤、字幕生成和嵌入模型进行优化,才能最大程度地提高吞吐量。

NeMo Curator 通过自动管线编排来简化数据整理工作,显著缩短了处理时间,从而克服了这些挑战。NeMo Curator 支持跨多节点、多 GPU 系统的线性扩展,可高效处理 100 PB 以上的数据,这简化了 AI 开发,降低了成本,加快了产品的上市时间。

在 CoRL 上

推进机器人学习社区的发展

NVIDIA 机器人团队与 CoRL 共同发布的近二十篇研究论文涵盖了以下领域的突破性成果:集成 VLM 来优化环境理解和任务执行、机器人时间导航、为复杂的多步骤任务制定长视距规划策略,以及利用人类演示来习得技能。

有关人形机器人控制和合成数据生成的突破性论文包括:SkillGen(一个基于合成数据生成的系统,用于在人工演示极少的情况下训练机器人)和 HOVER(一个用于控制人形机器人运动和操作的机器人基础模型)。

NVIDIA 研究人员还参加了本届大会的九场研讨会。进一步了解有关活动的完整日程安排:

供货情况

NVIDIA Isaac Lab 1.2 现已在 GitHub 上开源可用。NVIDIA Cosmos tokenizer现已在 GitHub 和 Hugging Face 上开源。用于视频处理的 NeMo Curator 将于本月底发布。

新的 NVIDIA Project GR00T 工作流即将推出,以帮助机器人公司更加轻松地构建人形机器人功能。

学习使用 Isaac Lab 的研究人员和开发者现可以访问开发者指南和教程,包括 Isaac Gym 到 Isaac Lab 的迁移指南。

在即将于 11 月 13 日举行的关于机器人仿真和学习的 OpenUSD 内部直播中了解机器人学习和仿真的最新进展.。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 机器人
    +关注

    关注

    213

    文章

    29829

    浏览量

    213596
  • NVIDIA
    +关注

    关注

    14

    文章

    5324

    浏览量

    106638
  • 仿真
    +关注

    关注

    52

    文章

    4300

    浏览量

    136070

原文标题:NVIDIA 利用 AI 和仿真工具推动机器人学习和人形机器人开发

文章出处:【微信号:NVIDIA-Enterprise,微信公众号:NVIDIA英伟达企业解决方案】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    NVIDIA RTX AI PC为AnythingLLM加速本地AI工作流

    大语言模型(LLM)基于包含数十亿个 Token 的数据集训练而来,能够生成高质量的内容。它们是众多最热门 AI 应用的核心支撑技术,包括聊天机器人、智能助手、代码生成工具等。
    的头像 发表于 07-04 15:05 ?410次阅读

    洞悉Omniverse:如何实现工业设施数字孪生中的机器人机群仿真

    Omniverse Blueprint 帮助实现工业设施数字孪生中的机器人机群仿真。 工业 AI 和物理 AI 能够简化工作流,企业纷纷开始探寻这两项技术最有效的使用方式。 企业在工
    的头像 发表于 05-11 16:46 ?742次阅读
    洞悉Omniverse:如何实现工业设施数字孪生中的机器人机群<b class='flag-5'>仿真</b>

    非技术人员如何用n8n + DeepSeek打造AI自动化工作流

    作者:算力魔方创始人/英特尔创新大使刘力 本文从零开始介绍使用n8n和DeepSeek快速实现一个AI Agent,全自动实现一个Python代码的生成和执行工作流。 一,什么是n8n? n8n
    的头像 发表于 04-09 14:28 ?2168次阅读
    非技术人员如何用n8n + DeepSeek打造<b class='flag-5'>AI</b>自动化<b class='flag-5'>工作流</b>?

    NVIDIA Blackwell RTX PRO 提供工作站和服务器两种规格,助力设计师、开发者、数据科学家和创作人员构建代理式

    、技术、创意、工程和设计专业人士的工作流。 ? 从代理式 AI仿真、扩展现实、3D 设计和复杂视觉效果,到开发驱
    发表于 03-19 09:50 ?355次阅读
    <b class='flag-5'>NVIDIA</b> Blackwell RTX PRO 提供<b class='flag-5'>工作</b>站和服务器两种规格,助力设计师、开发者、数据科学家和创作人员构建代理式

    NVIDIA发布全新NIM AI Guardrail微服务

    NVIDIA近期推出了一项旨在保障代理式AI应用安全性的重要技术——NIM AI Guardrail微服务。这一全新微服务是NVIDIA N
    的头像 发表于 01-18 11:48 ?826次阅读

    NVIDIA 发布保障代理式 AI 应用安全的 NIM 微服务

    的“知识机器人”,提升全球数十亿知识工作者的生产力。为了开发 AI 智能体,企业需要解决信任、物理安全、网络安全以及合规性等关键问题。 全新 NVI
    发表于 01-17 16:29 ?176次阅读

    NVIDIA推出AI零售购物助手蓝图

    NVIDIA 于近日发布了用于零售购物助手的 NVIDIA AI Blueprint,这个生成式 AI 参考
    的头像 发表于 01-14 11:17 ?657次阅读

    NVIDIA在CES 2025带来多项发布

    NVIDIA 创始人兼首席执行官黄仁勋在北京时间 1 月 7 日发表了 CES 开幕主题演讲,介绍了加速计算技术在 AI、机器人、游戏和自动驾驶领域取得的突破性进展。主题演讲展示了 NVIDIA 如何通过新产品、世界模型、
    的头像 发表于 01-13 11:30 ?886次阅读

    AI工作流自动化是做什么的

    AI工作流自动化是指利用人工智能技术,对工作流程中的重复性、规则明确的任务进行自动化处理的过程。那么,AI工作流自动化是做什么的呢?接下来,
    的头像 发表于 01-06 17:57 ?788次阅读

    NVIDIA亮相微软Ignite技术大会

    Grace Blackwell 现已登陆 Azure,新的工业 AI 工作流以及适用于 RTX AI PC 的工具和功能共同加速
    的头像 发表于 11-25 15:07 ?790次阅读

    数据科学工作流原理

    数据科学工作流包括数据收集、数据预处理、数据探索与可视化、特征选择与工程、模型选择与训练、模型评估与优化、结果解释与报告、部署与监控等环节。
    的头像 发表于 11-20 10:36 ?589次阅读

    使用全新NVIDIA AI Blueprint开发视觉AI智能体

    为提高生产力、优化流程和创造更加安全的空间,埃森哲、戴尔科技和联想等公司正在使用全新 NVIDIA AI Blueprint 开发视觉 AI 智能体。
    的头像 发表于 11-06 13:58 ?1107次阅读

    全新NVIDIA AI工作流可检测信用卡欺诈交易

    工作流由 AWS 上 的 NVIDIA AI 平台驱动,可帮助金融服务机构节省资金并降低风险。
    的头像 发表于 10-30 11:41 ?873次阅读

    借助NVIDIA Metropolis微服务构建视觉AI应用

    伴随着视觉 AI 复杂性的增加,精简的部署解决方案已成为优化空间和流程的关键。NVIDIA 能够加快企业的开发速度,借助 NVIDIA Metropolis AI
    的头像 发表于 09-09 09:46 ?835次阅读
    借助<b class='flag-5'>NVIDIA</b> Metropolis微服务构建视觉<b class='flag-5'>AI</b>应用

    NVIDIA 携手全球合作伙伴推出 NIM Agent Blueprints,助力企业打造属于自己的 AI

    可定制工作流目录加快核心生成式 AI 用例的部署速度。首批用例包括客户服务、药物研发和 PDF 数据提取,未来将加入更多用例 企业可以使用 NIM Agent Blueprints 以及
    发表于 08-28 10:10 ?404次阅读
    <b class='flag-5'>NVIDIA</b> 携手全球合作伙伴推出 NIM Agent Blueprints,助力企业打造属于自己的 <b class='flag-5'>AI</b>