0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

浪潮信息获CVPR2024自动驾驶挑战赛"Occupancy& Flow"冠军

全球TMT ? 来源:全球TMT ? 作者:全球TMT ? 2024-06-25 20:29 ? 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

北京2024年6月25日 /美通社/ -- 近日,在全球权威的CVPR 2024自动驾驶国际挑战赛(Autonomous Grand Challenge)中,浪潮信息AI团队所提交的"F-OCC"算法模型以48.9%的出色成绩斩获占据栅格和运动估计(Occupancy & Flow)赛道第一名。继22、23年在纯视觉和多模态等自动驾驶感知方向,多次登顶nuSences 3D目标检测榜单后,该AI团队面向Occupancy技术再一次实现突破,实现了对高度动态及不规则的驾驶场景更精准的3D感知及运动预测。

wKgZomZ6uBiAEXvPAACAQ3r7J5A389.jpg

图1-浪潮信息AI团队斩获占据栅格和运动估计赛道第一名

CVPR 2024自动驾驶国际挑战赛是国际计算机视觉与模式识别会议(IEEE/CVF Conference on Computer Vision and Pattern Recognition)的一个重要组成部分,专注于自动驾驶领域的技术创新和应用研究。2024年CVPR自动驾驶国际挑战赛,包含感知、预测、规划三大方向七个赛道,旨在深入探索自动驾驶领域的前沿课题。

三维感知和预测是自动驾驶领域的新兴任务,要求对车辆行驶场景进行细粒度建模,对于提升自动驾驶的环境感知能力有着重要意义。此次浪潮信息AI团队所登顶的占据栅格和运动估计(Occupancy & Flow)赛道,是CVPR 2024自动驾驶国际挑战赛最受关注的赛道,聚焦感知任务,吸引了全球17个国家和地区,90余支顶尖AI团队参与挑战。比赛提供了基于 nuScenes 数据集的大规模占用栅格数据与评测标准,要求参赛队伍利用相机图像信息对栅格化三维空间的占据情况(Occupancy)和运动(Flow)进行预测,以此来评估感知系统对高度动态及不规则驾驶场景的表示能力。

占据栅格 Occupancy:挑战更精细的环境感知与预测

道路布局的复杂性、交通工具的多样性以及行人流量的密集性,是当前城市道路交通的现状,也是自动驾驶领域面临的现实挑战。为了应对这一挑战,有效的障碍物识别和避障策略,以及对三维环境的感知和理解就变得至关重要。传统的三维物体检测方法通常使用边界框来表示物体的位置和大小,但对于几何形状复杂的物体,这种方法往往无法准确描述其形状特征,同时也会忽略对背景元素的感知。因此,基于三维边界框的传统感知方法已经无法满足复杂道路环境下的精准感知和预测需求。

wKgaomZ6uBmAT7bVAAB4VWLu5iI565.jpg

图2 - 针对挖车中的力臂,3D目标检测算法只能给出挖车整体的轮廓框(左),但占据栅格网络却可以更精准地描述挖车具体的几何形状这类细节信息(右)

Occupancy Networks(占据栅格网络) 作为一种全新的自动驾驶感知算法,通过获取立体的栅格占据信息,使系统能够在三维空间中确定物体的位置和形状,进而有效识别和处理那些未被明确标注或形状复杂的障碍物,如异形车、路上的石头、散落的纸箱等。这种占据栅格网络使得自动驾驶系统能够更准确地理解周围的环境,不仅能识别物体,还能区分静态和动态物体。并以较高的分辨率和精度表示三维环境,对提升自动驾驶系统在复杂场景下的安全性、精度和可靠性至关重要。

全面提升!48.9%的绝佳性能表现,创本赛道最高成绩

在占据栅格和运动估计(Occupancy & Flow)赛道中,该AI团队所提交的"F-OCC"算法模型,凭借先进的模型结构设计、数据处理能力和算子优化能力,实现了该赛道最强模型性能,在RayIoU(基于投射光线的方式评估栅格的占用情况)及mAVE(平均速度误差)两个评测指标中均获得最高成绩。

■ 更简洁高效的模型架构,实现运算效率与检测性能双突破

首先,模型整体选择基于前向投影的感知架构,并采用高效且性能良好的FlashInternImage模型。同时,通过对整体流程进行超参调优、算子加速等优化,在占据栅格(Occupancy)和运动估计(Flow)均获得最高分的同时,提升了模型的运算效率,加快了模型迭代与推理速度。在实际应用场景中,这种改进使得模型能够更快速、高效地处理大规模3D体素数据,使得自动驾驶车辆能更好地理解环境,进而提升决策的准确度和实时性。

wKgZomZ6uBqAIiFgAACDhktWtS8619.jpg

图3 - F-OCC算法模型架构图

■ 更强大完善的数据处理,全面提升模型检测能力

在数据处理方面,比赛提供的体素(Voxel)标签包含了大量在图像中无法观测到的点,例如被物体遮挡的体素和物体内部不可见的体素,这些标签在训练过程中会对基于图像数据的预测网络训练产生干扰。在训练数据中,该AI团队通过模拟LiDAR光束的方法,生成可视化掩码,提升了模型的预测精度;另一方面,通过引入感知范围边缘的体素点参与训练,有效解决出现在感知边缘区域的误检问题,将模型的整体检测性能提升11%。

■ 更精细的3D体素编码,模型占据预测能力提升超5%

在3D体素特征编码模块中,该算法团队将具有较大感知范围和编码能力的可形变卷积操作应用于3D体素数据,以提升3D特征的表示能力。通过使用CUDA对可形变3D卷积(DCN3D)进行实现与优化,大幅提升了模型的运算速度,并有效降低了显存消耗。通过DCN3D替代传统3D卷积,模型整体占据预测能力提升超5%。

基于OCC 3D空间感知算法的创新, "F-OCC"算法模型成功登顶占据栅格和运动估计任务(Occupancy & Flow)榜单,以48.9%的出色成绩创造了本赛道的最高成绩,为探索更高级别的自动驾驶技术提供了有力的支撑与经验。未来,浪潮信息AI团队将践行多角度切入,发挥算法、算力融合的AI全栈优化能力,推动自动驾驶领域的技术创新发展。

* 备注:文内所涉术语解释如下

Occupancy:在自动驾驶领域,通常称为“占据栅格”或“占用栅格”,其是一种3D语义占用感知方法,通过生成车辆周围环境的三维占用网格,为自动驾驶车辆提供障碍物检测、路径规划和车辆控制等关键功能;

RayIoU:是指通过光线投射的方式评估占据网格的占用情况(Ray-based Intersection over Union),RayIoU可以用来衡量预测的占据网格与实际占据网格之间的重叠程度。RayIoU越高意味着预测准确度越高,模型性能越好;

mAVE: 是指平均速度误差(Mean Absolute Velocity Error),其用于评估预测速度与真实速度之间的平均误差。mAVE值越低意味着预测结果与真值越接近;

体素(Voxel):体积元素(Volume Pixel)的简称体积元素(Volume Pixel)的简称,其类似于二维图像中的像素,是构成三维图像的基本单元。

审核编辑 黄宇

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 浪潮
    +关注

    关注

    1

    文章

    475

    浏览量

    24860
  • AI
    AI
    +关注

    关注

    88

    文章

    35760

    浏览量

    282554
  • 自动驾驶
    +关注

    关注

    790

    文章

    14396

    浏览量

    171469
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    自动驾驶 HIL 测试:构建 "以假乱真" 的实时数据注入系统

    自动驾驶路测难满足算法迭代需求,硬件在环仿真成关键!但高像素相机数据的无损低延迟注入仍是难题? 本文介绍相关高保真实时注入系统架构、核心技术、I2C 作用及实践挑战,一份来自仿真测试主管的5000+字经验总结!
    的头像 发表于 08-13 09:29 ?1467次阅读
    <b class='flag-5'>自动驾驶</b> HIL 测试:构建 &<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;以假乱真&<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>; 的实时数据注入系统

    精密设备的&amp;amp;quot;电力保镖&amp;amp;quot;:优比施UPS如何守护数据与硬件安全?

    一、用户痛点:精密设备的&quot;断电恐惧症&quot;在数据中心、医疗实验室、工业控制等场景中,精密电子设备对电源的依赖已达到&quot;零容忍&quot;级别:数据安全危机:服务
    的头像 发表于 07-25 09:00 ?163次阅读
    精密设备的&<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;电力保镖&<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;:优比施UPS如何守护数据与硬件安全?

    地热发电环网柜局放监测设备:清洁能源电网的&amp;amp;quot;安全卫士&amp;amp;quot;

    文章由山东华科信息技术有限公司提供在&quot;双碳&quot;目标驱动下,地热发电作为稳定基荷电源,其电网接入设备的可靠性至关重要。环网柜作为地热电站与主网连接的关键节点,其内部绝缘缺陷可能引发
    的头像 发表于 07-16 10:15 ?176次阅读
    地热发电环网柜局放监测设备:清洁能源电网的&<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;安全卫士&<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;

    为什么GNSS/INS组合被誉为导航界的&amp;amp;quot;黄金搭档&amp;amp;quot;?

    在导航技术领域,GNSS(全球导航卫星系统)和INS(惯性导航系统)的结合,一直被业界誉为&quot;黄金搭档&quot;。它们优势互补,克服了单一系统的局限性,为高精度、高可靠性的导航提供了完美
    的头像 发表于 07-09 17:12 ?292次阅读
    为什么GNSS/INS组合被誉为导航界的&<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;黄金搭档&<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;?

    人形机器人为什么要定制? ——揭秘工业场景的&amp;quot;千面需求&amp;quot;

    核心洞察:标准化机器人难以破解工业场景的&quot;需求碎片化&quot;困局。富唯智能通过?&quot;五大模块柔性架构+零代码中枢&quot;?,为?人形机器人为什么要定制?提供了
    的头像 发表于 06-10 17:19 ?424次阅读
    人形机器人为什么要定制? ——揭秘工业场景的&<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;千面需求&<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;

    仓储界的&amp;quot;速效救心丸&amp;quot;,Ethercat转PROFINET网关实战案例

    实战案例,Ethercat转PROFINET网关,仓储界的&quot;速效救心丸&quot;
    的头像 发表于 05-11 10:32 ?361次阅读
    仓储界的&<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;速效救心丸&<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;,Ethercat转PROFINET网关实战案例

    电缆局部放电在线监测:守护电网安全的&amp;amp;quot;黑科技&amp;amp;quot;

    文章由山东华科信息技术有限公司提供在万家灯火的背后,有一张覆盖全国的&quot;能源神经网络&quot;昼夜不息地运转。电缆作为电力输送的&quot;主动脉&
    的头像 发表于 04-14 18:12 ?409次阅读
    电缆局部放电在线监测:守护电网安全的&<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;黑科技&<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;

    炼油厂开闭所局放监测:为能源枢纽装上&amp;amp;quot;智能安全阀&amp;amp;quot;

    文章由山东华科信息技术有限公司提供在炼油厂的能源枢纽——开闭所中,高压设备如同&quot;电力心脏&quot;昼夜不息地运转。这个布满油气管道的复杂环境里,局部放电现象如同潜伏的&quot
    的头像 发表于 04-09 16:41 ?386次阅读
    炼油厂开闭所局放监测:为能源枢纽装上&<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;智能安全阀&<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;

    隧道管廊变压器局放在线监测:为地下&amp;amp;quot;电力心脏&amp;amp;quot;装上智能听诊器

    文章由山东华科信息技术有限公司提供在城市的地下脉络中,隧道管廊承载着电网的&quot;主动脉&quot;,而变压器堪称其中的&quot;动力心脏&q
    的头像 发表于 04-09 16:37 ?411次阅读
    隧道管廊变压器局放在线监测:为地下&<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;电力心脏&<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;装上智能听诊器

    【硬核测评】凌华DAQE双雄争霸:工业数据采集界的&amp;amp;quot;速度与激情&amp;amp;quot;实战解析

    在汽车碰撞测试的惊险瞬间,半导体晶圆的微观世界,甚至是狂风呼啸的风力发电场,一场关于数据采集的&quot;军备竞赛&quot;正在上演。凌华科技推出的DAQE-2010与DAQE-2010(G)这对&quot;黄金搭档&
    的头像 发表于 03-26 15:07 ?468次阅读
    【硬核测评】凌华DAQE双雄争霸:工业数据采集界的&<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;速度与激情&<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;实战解析

    传统产线VS智能工控:华颉科技如何用模块化设计撕掉&amp;amp;quot;电老虎&amp;amp;quot;标签?

    全球制造业正迎来&quot;双碳&quot;战略下的技术迭代浪潮,新一代多插槽工控机凭借模块化设计实现节能突破。本文以行业创新案例为切入点,解析智能工控系统如何在硬件架构与能源管理领域实现双重进化。
    的头像 发表于 03-20 17:53 ?533次阅读
    传统产线VS智能工控:华颉科技如何用模块化设计撕掉&<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;电老虎&<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;标签?

    浪潮信息发布&amp;quot;源&amp;quot;Yuan-EB,刷新RAG检索最高成绩

    近日,浪潮信息在AI领域取得了重大突破,成功发布了其嵌入模型"源"Yuan-EB(Yuan-embedding-1.0)。在备受瞩目的C-MTEB榜单中,"源"Yuan-EB凭借卓越的性能,一举夺得
    的头像 发表于 12-25 15:54 ?601次阅读

    2024年ICPC与华为挑战赛冠军杯圆满落幕

    近日,2024年ICPC&amp;华为挑战赛冠军杯在深圳圆满落幕。该活动由华为和ICPC联合举办,汇聚全球顶尖的编程人才,共同探讨和解决具有挑战
    的头像 发表于 10-27 16:00 ?1454次阅读

    北美运营商AT&amp;amp;amp;T认证的费用受哪些因素影响

    申请北美运营商AT&amp;T认证的价格因多种因素而异,包括产品类型、认证范围、测试难度等。一般来说,申请AT&amp;T认证的费用可能相对较高,因为AT&amp;T作为北美地区的主要电信运营商,其
    的头像 发表于 10-16 17:10 ?753次阅读
    北美运营商AT&<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;T认证的费用受哪些因素影响

    onsemi LV/MV MOSFET 产品介绍 &amp;amp;amp; 行业应用

    01直播介绍直播时间2024/10/281430直播内容1.onsemiLV/MVMOSFET产品优势&amp;市场地位。2.onsemiLV/MVMOSFETRoadmap。3.onsemiT10
    的头像 发表于 10-13 08:06 ?995次阅读
    onsemi LV/MV MOSFET 产品介绍 &<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>; 行业应用