0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

地平线H-RDT模型斩获CVPR 2025大赛冠军

地平线HorizonRobotics ? 来源:地平线HorizonRobotics ? 2025-08-21 10:02 ? 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

近日,在计算机视觉与模式识别领域顶级会议CVPR 2025举办的RoboTwin双臂机器人竞赛中,地平线机器人实验室与清华大学计算机系朱军团队联合提出的H-RDT凭强大性能和领先成功率,一举斩获真机赛冠军(一等奖第一名),并在仿真赛中荣获亚军(一等奖第二名),为全球机器人学习领域提供了高效解法。

作为全球人工智能领域最具影响力的顶级会议之一,CVPR每年汇聚学术界与工业界的最新研究成果,引领计算机视觉发展前沿。2025年CVPR中的第二届MEIS研讨会以“生成式人工智能时代的多智能体具身系统”为焦点,发起并举办了RoboTwin双臂协作挑战赛,成为全球首个专注于“建图-感知-操作”全链条能力的权威机器人竞赛,吸引了全球众多科研团队参与。

比赛聚焦于双臂机器人的复杂操作能力,要求参赛模型在仿真与真实环境中完成一系列高难度任务,包括但不限于柔性物体操作、空间推理、双手协作等,全面评估机器人的智能水平与操作精度。在真机赛环节,机器人需在真实世界中完成指定任务,如叠毛巾、精准放置物品等,对模型的泛化能力、环境适应性和操作稳定性提出了极高要求。仿真赛则侧重于模型在虚拟环境中的多任务处理能力。

面对通用机器人操作数据的规模与泛化问题,地平线机器人实验室联合清华大学计算机系朱军教授团队提出了从海量人类操作数据中学习的VLA模型H-RDT (Human to Robotics Diffusion Transformer),能够利用带有3D手部位姿标注的人类操作视频增强机器人操作能力,为通用机器人操作技能的规模化学习提供了新范式。

技术和架构创新,实现跨本体迁移与高效动作生成

不同机器人本体和动作空间的差异导致统一训练困难,现有数据集规模有限且质量参差不齐。这些问题从根本上制约了通用机器人操作数据的规模与泛化能力。

H-RDT模型采用独特的两阶段训练范式用于实现跨本体部署。首先在大规模第一人称人类操作数据上进行预训练,构建共享动作表征空间;随后通过模块化动作编解码器在机器人数据上进行微调,实现跨本体迁移。这一设计有效解决了不同机器人本体和动作空间差异导致的统一训练难题,显著提升了模型的泛化能力。

dc930150-7cf2-11f0-a18e-92fbcf53809c.png

在架构方面,H-RDT基于一个具有20亿参数的扩散Transformer架构,配备专门的动作编码器和解码器,利用流匹配方法建模复杂的动作分布,实现了更优的训练稳定性与推理效率。为解决人类与机器人之间的差异,团队采用了精细的3D手部姿态表示方法,将动作编码为紧凑的48维向量,以捕捉关键的双手灵巧操作信息,为机器人操作提供了丰富的“上层动作空间”指导,显著提升了策略的泛化能力,有效缓解了不同机器人之间的差异问题。

在真机实验中,H-RDT模型在Aloha-Agilex-2.0、双臂ARX5、UR5+UMI三种真机设置上展现了领先的性能和出色的跨本体迁移能力。下面4个表格给出了详细的测试指标。

dca89146-7cf2-11f0-a18e-92fbcf53809c.png

表1 H-RDT在Agilex2.0真机叠毛巾任务中的表现

dcb67e82-7cf2-11f0-a18e-92fbcf53809c.png

表2 H-RDT在Agilex2.0真机挂杯子任务中的表现

dcc6523a-7cf2-11f0-a18e-92fbcf53809c.png

表3 H-RDT在ARX5真机少样本实验中表现出优越的样本利用效率

dcd8bf42-7cf2-11f0-a18e-92fbcf53809c.png

表4 H-RDT在双UR5+UMI真机实验中在每个子任务上都表现出优越的性能

在仿真实验中,H-RDT在RoboTwin 2.0基准测试的45项任务上取得了87.2%的平均成功率,显著优于RDT、π0等基线方法,证明了其在多任务处理中的领先优势。

dce94b5a-7cf2-11f0-a18e-92fbcf53809c.png

优异的实验结果充分验证了H-RDT模型的技术先进性和实用性,为其在实际应用中的推广奠定了坚实基础。

前景广阔,H-RDT模型赋能多领域智能化升级

H-RDT模型的成功,为机器人学习领域提供了新的研究思路与技术路径。通过利用海量人类操作数据预训练,H-RDT模型能有效缓解大规模高质量机器人演示数据稀缺的问题,为通用机器人操作数据的规模与泛化能力提升开辟了新途径。这一创新方法不仅在学术上取得了突破,更在具身智能技术的实际应用中展现了巨大潜力。

H-RDT模型的跨本体迁移能力与少样本学习效率,为机器人在不同场景下的快速适应与高效操作提供了可能,有望推动智能家居、工业制造、医疗护理等多领域的智能化应用升级。

作为机器人产业界的重要推动者之一,地平线在人工智能学习领域积累了深厚的技术底蕴,展现出强大的创新能力。早在2023年,由地平线学者作为一作公开发表的业界首个端到端自动驾驶大模型UniAD,便荣获CVPR 2023最佳论文奖,现已成为行业端到端技术的Benchmark。而此次H-RDT模型在CVPR 2025 RoboTwin双臂机器人竞赛中的出色表现,更是地平线在人工智能领域持续深耕、不断突破的又一有力见证。

地平线认为:“真正的智能是说每一辆车、每一个电器都具有环境感知、人机交互和决策控制的能力”。随着技术成熟与应用深化,以H-RDT模型为代表的创新技术将助力具身智能技术拓展更广泛的发展与应用。未来,地平线将继续秉承创新驱动发展的理念,坚持“赋能智能汽车和机器人,让人类生活更安全、更美好”的愿景,加大在机器人和智能汽车领域的技术研发投入,不断探索新技术、新应用,为推动全球智能化技术普惠贡献更多力量,真正实现“让机器的归机器,人的归人”。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 机器人
    +关注

    关注

    213

    文章

    29985

    浏览量

    214730
  • 计算机
    +关注

    关注

    19

    文章

    7696

    浏览量

    91267
  • 地平线
    +关注

    关注

    0

    文章

    402

    浏览量

    15640

原文标题:地平线具身智能算法H-RDT斩获CVPR 2025 RoboTwin真机赛冠军

文章出处:【微信号:horizonrobotics,微信公众号:地平线HorizonRobotics】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    地平线旭日X3派试用体验】开箱+快速上手体验

    首先很高兴能够成为地平线旭日X3派的新品体验官,前不久开发板到了,目前玩了有一个星期左右了,先来简单发一个开箱帖子。【开箱】收到开发板的那一瞬间感觉外盒挺有趣的。盒子里面配了一块散热片、USB转
    发表于 07-17 22:31

    地平线与禾科技达成战略合作推动高级别自动驾驶

    瑞士工业集团ABB CEO史毕福意外离任,地平线与禾科技达成战略合作推动高级别自动驾驶
    的头像 发表于 04-25 17:33 ?3423次阅读

    地平线与德西威正式签署战略合作协议

    地平线是汽车智能芯片的引领者,也是汽车产业数字化变革的重要推动力量。在未来交通出行变革中,德西威积极与产业链上下游合作伙伴深度协同,助力整车企业打造创新可靠的智能汽车。未来,德西威将与地平
    的头像 发表于 04-22 11:17 ?2650次阅读

    地平线与全球领先的激光雷达制造商禾科技达成战略合作

    地平线要闻: 2021年8月5日,地平线与全球领先的激光雷达制造商禾科技达成战略合作。双方将就打造面向高等级自动驾驶前装量产的激光雷达感知方案展开深入合作。地平线基于面向全场景整车智
    的头像 发表于 08-12 14:33 ?8887次阅读

    比亚迪与地平线正式宣布达成定点合作

    比亚迪与地平线正式宣布达成定点合作,比亚迪将在其部分车型上搭载地平线高性能、大算力自动驾驶芯片征程5,打造更具竞争力的行泊一体方案,实现高等级自动驾驶功能。按照计划,搭载地平线征程5的比亚迪车型最早
    的头像 发表于 05-07 17:16 ?3161次阅读

    国产汽车零部件“奥斯卡”出炉,地平线征程5斩获量产双奖项

    第七届铃轩奖盛典上,地平线斩获“量产集成电路类·金奖”及量产类别唯一“全场大奖”。自2019年起,地平线已连续4年荣获铃轩奖,与该奖项共同见证了国产智能汽车的量产成长之路。
    的头像 发表于 12-27 10:08 ?1287次阅读

    地平线GitLab使用指导

    地平线开发者社区致力于连接地平线和开发者,为大家提供前沿技术内容和丰富的技术活动,打造更好的开发者文化和氛围,共建开源生态
    的头像 发表于 11-04 14:18 ?1187次阅读
    <b class='flag-5'>地平线</b>GitLab使用指导

    旭日,从地平线升起——地平线旭日X3派开箱试用

    地平线旭日X3派,开启你的嵌入式开发之旅
    的头像 发表于 11-08 15:22 ?2282次阅读
    旭日,从<b class='flag-5'>地平线</b>升起——<b class='flag-5'>地平线</b>旭日X3派开箱试用

    地平线Journey 3的电源设计

    电子发烧友网站提供《地平线Journey 3的电源设计.pdf》资料免费下载
    发表于 09-04 10:48 ?0次下载
    <b class='flag-5'>地平线</b>Journey 3的电源设计

    地平线SuperDrive首发三大黑科技

    近日,“Beyond the Horizon 地平线智驾科技畅想日”在上海举办,回顾地平线以软硬结合技术实力取得的量产创新成果,展望2025高阶智驾爆发之年。同时,“SuperDrive智驾百人团体验活动”在上海静安区繁华路段开
    的头像 发表于 01-14 13:56 ?627次阅读

    地平线SuperDrive相关问答

    近日,地平线SuperDrive智驾百人团体验活动圆满落幕,现场130余家媒体对地平线SuperDrive表现出浓厚的兴趣并提出了诸多问题。对此,地平线特意整理了大家提出的典型问题并进行解答,希望能帮助大家更全面地了解这套拟人的
    的头像 发表于 01-21 10:15 ?589次阅读

    地平线高阶智驾系统HSD斩获2025年iF设计大奖

    自出道以来,地平线高阶智驾系统HSD就凭借极致的设计理念和标杆创新体验, 吸引了大批粉丝。
    的头像 发表于 03-11 14:31 ?807次阅读

    地平线与上汽集团深化战略合作

    近日,上汽集团举办“懂车更懂你·2025上汽之夜”活动,地平线创始人兼CEO余凯博士受邀发表主旨演讲。作为地平线第一大机构股东,上汽集团在发布会上表示将继续拓展与地平线等头部企业的合作
    的头像 发表于 04-12 09:07 ?653次阅读

    地平线推出L2城区辅助驾驶系统HSD

    近日,以“征程所向,远超想象”为主题的2025地平线年度产品发布会在上海滴水湖举行。地平线重磅推出L2城区辅助驾驶系统——地平线HSD,构建体验“类人”、用户“信任”的城区辅助驾驶新解
    的头像 发表于 04-19 09:14 ?577次阅读

    地平线城区辅助驾驶系统HSD解读

    近日,在2025地平线年度产品发布会上,地平线城区辅助驾驶系统HSD正式发布。作为国内首个软硬结合全栈开发的城区辅助驾驶系统,地平线HSD搭载当前最高性能的国产智驾计算方案征程6P,采
    的头像 发表于 04-22 14:44 ?832次阅读