0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

动量感知规划的端到端自动驾驶框架MomAD解析

地平线HorizonRobotics ? 来源:地平线HorizonRobotics ? 2025-03-18 09:31 ? 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

端到端自动驾驶框架实现了感知与规划的无缝集成,但通常依赖于一次性轨迹预测,这可能导致控制不稳定,并且对单顿感知中的遮挡问题较为敏感。为解决这一问题,我们提出了动量感知驾驶框架Momentum-Aware Driving(MomAD),该框架引I入了轨迹动量和感知动量,以稳定和优化轨迹预测。

MomAD包含两个核心组件:一是拓扑轨迹匹配(TTM),采用豪斯多夫距离选择与先前路径一致的最优规划查询,以确保连贯性;二是动量规划交互器(MPI),通过交叉注意力机制将选定的规划查询与历史查询相结合,扩展静态和动态感知文件。这种丰富的查询反过来有助于重新生成长时间跨度的轨迹,并降低碰撞风险。为了减轻动态环境和检测误差带来的噪声,我们在训练过程中引入了鲁棒的实例去噪,使规划模型能够专注于关键信号并提高其鲁棒性。我们还提出了一种新的轨迹预测一致性(TPC)指标,用于定量评估规划的稳定性。

在nuScenes数据集上的实验表明,MomAD在长期一致性(>3s)方面优于现有的最先进方法。此外,在精心设计的Turning-nuScenes数据集上的评估显示,MomAD在6秒预测时间范围内将碰撞率降低了26%,并将TPC提高了0.97米(33.45%),而在Bench2Drive上的闭环测试中,成功率提高了16.3%。

? 论文链接:

https://arxiv.org/abs/2503.03125

?论文代码:

https://github.com/adept-thu/MomAD

研究背景

自动驾驶技术经历了从模块化到更集成化的端到端范式的转变。传统方法将检测、跟踪、地图构建、运动预测和规划等任务分开处理,而端到端框架则强调这些任务的无缝集成。通过优先考虑规划,端到端框架能够战略性地引导来自上游感知模块的信息,从而增强动态驾驶环境中的鲁棒性和可靠性。高质量的规划依赖于准确预测自车未来的轨迹,这需要对静态和动态环境因素(如地图元素和与周围交通参与者的交互)有长远的理解。

然而,由于其他道路使用者意图的不确定性、道路条件的变化以及人类驾驶行为引入的模糊性,轨迹预测本质上是随机的,这使得确定性预测变得次优甚至具有风险。现有的多模态轨迹规划方法虽然能够考虑多种可能的交通参与者行为,但它们通常是基于当前感知帧的一次性预测,容易受到遮挡或关键视觉线索丢失的影响,导致轨迹质量下降。此外,缺乏时间一致性可能导致连续轨迹缺乏连贯性,引发不稳定的车辆控制。为了解决这些问题,本文提出了动量感知驾驶框架 (MomAD) ,通过引入轨迹动量和感知动量来稳定和优化轨迹预测,从而在动态驾驶环境中实现更平滑和一致的规划结果。

81471886-fff7-11ef-9310-92fbcf53809c.png

根据上图对比我们可以看到,(a) 确定性规划的方案,缺乏动作多样性,存在安全风险;(b)多模态轨迹规划方案,通过选择最高分轨迹,但存在最大分数偏移问题导致稳定性不足;(c)我们提出的MomAD巧妙利用“惯性”的思想,通过动量规划,利用历史和感知动量提升时序一致性,解决端到端自动驾驶中不稳定行驶的问题。

研究方法

Topological Trajectory Matching

该模块通过Hausdorff距离选择与历史路径最匹配的多模态轨迹提案,以确保时序一致性和轨迹的连续性。具体来说,TTM模块通过最小化不同时间步之间的规划差异,防止轨迹偏离历史轨迹。

Momentum Planning Interactor

该模块通过长时查询混合器将当前最佳规划查询与历史规划查询进行交叉注意力处理,扩展静态和动态感知文件,从而丰富当前查询的上下文信息。MPI模块通过结合历史查询和当前查询,生成改进的轨迹预测,增强了对周围环境的感知能力。

Robust Instance Denoising via

Perturbation

在训练过程中引入受控噪声扰动,使模型能够区分关键和无关特征,提高对感知噪声的鲁棒性。通过这种方式,模型在测试时能够更好地应对实例特征的波动,生成更稳定和平滑的轨迹。

81517bfa-fff7-11ef-9310-92fbcf53809c.png

结果与分析

816282c4-fff7-11ef-9310-92fbcf53809c.png

如表所示,MomAD在L2误差、碰撞率和TPC(轨迹预测一致性)上分别达到了0.60米、0.09%和0.54米。与UniAD、VAD和SparseDrive等最先进方法相比,我们的方法在规划结果上表现出色。值得注意的是,我们在TPC指标上取得了显著改进,在nuScenes数据集上1秒、2秒和3秒的TPC分别提升了0.30米、0.53米和0.78米,直接证明了我们在时间一致性方面的有效性。

总体而言,MomAD有效利用了动量的平滑优势,在提升时间一致性方面效果显著。

816f19c6-fff7-11ef-9310-92fbcf53809c.png

准确的长轨迹预测对于提升自动驾驶的稳定性至关重要,同时也有助于评估模型解决多模态轨迹规划中时间一致性问题的能力。如表所示,我们在nuScenes和Turning-nuScenes数据集上对比了SparseDrive和MomAD在4-6秒长轨迹预测中的表现,结果显示MomAD在性能上有显著提升。

具体而言,在nuScenes数据集中,与SparseDrive相比,MomAD在4秒、5秒和6秒的L2误差分别降低了0.09米(5.14%)、0.34米(14.66%)和0.50米(16.95%),碰撞率分别降低了0.04%、0.11%和0.20%,TPC(轨迹预测一致性)分别降低了0.14米(10.53%)、0.21米(12.65%)和0.38米(19.10%)。

此外,在Turning-nuScenes数据集中,与SparseDrive相比,MomAD在4秒、5秒和6秒的L2误差分别降低了0.27米(13.04%)、0.64米(23.62%)和0.85米(25.30%),碰撞率分别降低了0.06%、0.14%和0.26%,TPC分别降低了0.17米(11.04%)、0.73米(31.60%)和0.97米(32.45%)。

可以观察到,MomAD在更远距离的轨迹预测上表现显著提升,尤其是在6秒时的改进幅度最大。总体而言,MomAD提升了长轨迹预测的性能,进一步证明了其能够有效缓解时间一致性问题。

817ee928-fff7-11ef-9310-92fbcf53809c.png

我们已在Bench2Drive数据集上进行了具有挑战性的闭环评估,结果如表所示。该数据集涵盖44个交互场景,例如切入、超车、绕行,以及220条路线,覆盖多种天气条件和地点。我们的MomAD框架在成功率上分别比VAD多模态变体和SparseDrive分别提高了16.3%和8.4%,并在舒适度评分(轨迹平滑度)上分别提升了7.2%和5.3%,证明了其有效性。

结论

MomAD框架通过引入轨迹动量和感知动量,显著提高了端到端自动驾驶系统在轨迹规划中的稳定性和鲁棒性。未来工作将探索扩散模型和推测解码方法,以进一步提高轨迹多样性和效率。

.

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 模型
    +关注

    关注

    1

    文章

    3531

    浏览量

    50572
  • 数据集
    +关注

    关注

    4

    文章

    1224

    浏览量

    25540
  • 自动驾驶
    +关注

    关注

    790

    文章

    14364

    浏览量

    171126

原文标题:CVPR 2025|MomAD:动量感知规划的端到端自动驾驶

文章出处:【微信号:horizonrobotics,微信公众号:地平线HorizonRobotics】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    自动驾驶中基于规则的决策和大模型有何区别?

    自动驾驶架构的选择上,也经历了从感知、决策控制、执行的三段式架构到现在火热的大模型,尤其是在2024年特斯拉推出FSD V12后,各
    的头像 发表于 04-13 09:38 ?2967次阅读
    <b class='flag-5'>自动驾驶</b>中基于规则的决策和<b class='flag-5'>端</b><b class='flag-5'>到</b><b class='flag-5'>端</b>大模型有何区别?

    未来已来,多传感器融合感知自动驾驶破局的关键

    巨大的进展;自动驾驶开始摒弃手动编码规则和机器学习模型的方法,转向全面采用的神经网络AI系统,它能模仿学习人类司机的驾驶,遇到场景直接
    发表于 04-11 10:26

    即插即用的自动驾驶LiDAR感知算法盒子 RS-Box

    ,即可快速、无缝地将激光雷达感知模块嵌入自己的无人驾驶方案中,真正实现“一键获得自动驾驶激光雷达环境感知能力”。RS-BoxLiDAR
    发表于 12-15 14:20

    自动驾驶技术的实现

    的带宽有了更高的要求。从而使用以太网技术及中央域控制(Domain)和区域控制(Zonal)架构是下一代车载网络的发展方向。然而对于自动驾驶技术的实现,涉及感知规划、执行三个层面。
    发表于 09-03 08:31

    如何基于深度神经网络设计一个自动驾驶模型?

    如何基于深度神经网络设计一个自动驾驶模型?如何设计一个基于增强学习的自动驾驶决策系统?
    的头像 发表于 04-29 16:44 ?5349次阅读
    如何基于深度神经网络设计一个<b class='flag-5'>端</b><b class='flag-5'>到</b><b class='flag-5'>端</b>的<b class='flag-5'>自动驾驶</b>模型?

    自动驾驶到底是什么?

    UniAD 统一自动驾驶关键任务,但是的训练难度极大,对数据的要求和工程能力的要求比常规的技术栈要高,但是由此带来的全局一致性让整个系统变得更加简洁,也能够防止某个模块进入局部最
    发表于 06-28 14:47 ?4356次阅读
    <b class='flag-5'>端</b><b class='flag-5'>到</b><b class='flag-5'>端</b><b class='flag-5'>自动驾驶</b>到底是什么?

    基于矢量化场景表征的自动驾驶算法框架

    在ICCV 2023上,地平线和华中科技大学提出基于矢量化场景表征的自动驾驶算法——VAD。VAD摈弃了栅格化表征,对整个驾驶场景进行
    发表于 08-31 09:28 ?1736次阅读
    基于矢量化场景表征的<b class='flag-5'>端</b><b class='flag-5'>到</b><b class='flag-5'>端</b><b class='flag-5'>自动驾驶</b>算法<b class='flag-5'>框架</b>

    理想汽车自动驾驶模型实现

    理想汽车在感知、跟踪、预测、决策和规划等方面都进行了模型化,最终实现了的模型。这种模型不仅完全模型化,还能够虚拟化,即在模拟环境中进行
    发表于 04-12 12:17 ?730次阅读
    理想汽车<b class='flag-5'>自动驾驶</b><b class='flag-5'>端</b><b class='flag-5'>到</b><b class='flag-5'>端</b>模型实现

    实现自动驾驶,唯有

    ,去年行业主流方案还是轻高精地图城区智驾,今年大家的目标都瞄到了(End-to-End, E2E)。
    的头像 发表于 08-12 09:14 ?1568次阅读
    实现<b class='flag-5'>自动驾驶</b>,唯有<b class='flag-5'>端</b><b class='flag-5'>到</b><b class='flag-5'>端</b>?

    Mobileye自动驾驶解决方案的深度解析

    强大的技术优势。 Mobileye的解决方案概述 1.1 什么是
    的头像 发表于 10-17 09:35 ?872次阅读
    Mobileye<b class='flag-5'>端</b><b class='flag-5'>到</b><b class='flag-5'>端</b><b class='flag-5'>自动驾驶</b>解决方案的深度<b class='flag-5'>解析</b>

    连接视觉语言大模型与自动驾驶

    自动驾驶在大规模驾驶数据上训练,展现出很强的决策规划能力,但是面对复杂罕见的
    的头像 发表于 11-07 15:15 ?753次阅读
    连接视觉语言大模型与<b class='flag-5'>端</b><b class='flag-5'>到</b><b class='flag-5'>端</b><b class='flag-5'>自动驾驶</b>

    自动驾驶技术研究与分析

    编者语:「智驾最前沿」微信公众号后台回复:C-0450,获取本文参考报告:《自动驾驶行业研究报告》pdf下载方式。 自动驾驶进入202
    的头像 发表于 12-19 13:07 ?946次阅读

    一文带你厘清自动驾驶架构差异

    [首发于智驾最前沿微信公众号]随着自动驾驶技术飞速发展,智能驾驶系统的设计思路也经历了从传统模块化架构
    的头像 发表于 05-08 09:07 ?349次阅读
    一文带你厘清<b class='flag-5'>自动驾驶</b><b class='flag-5'>端</b><b class='flag-5'>到</b><b class='flag-5'>端</b>架构差异

    为什么自动驾驶大模型有黑盒特性?

    [首发于智驾最前沿微信公众号]随着自动驾驶技术落地,(End-to-End)大模型也成为行业研究与应用的热门方向。相较于传统自动驾驶
    的头像 发表于 07-04 16:50 ?267次阅读
    为什么<b class='flag-5'>自动驾驶</b><b class='flag-5'>端</b><b class='flag-5'>到</b><b class='flag-5'>端</b>大模型有黑盒特性?

    Nullmax自动驾驶最新研究成果入选ICCV 2025

    近日,国际计算机视觉大会 ICCV 2025 正式公布论文录用结果,Nullmax 感知团队在自动驾驶方向的最新研究成果《HiP-AD
    的头像 发表于 07-05 15:40 ?537次阅读
    Nullmax<b class='flag-5'>端</b><b class='flag-5'>到</b><b class='flag-5'>端</b><b class='flag-5'>自动驾驶</b>最新研究成果入选ICCV 2025