0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

解决由激光雷达线数差异导致的三维目标检测域适应问题

倩倩 ? 来源:CVer ? 作者:韦祎 ? 2022-08-31 14:21 ? 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

本文是对我们ECCV 2022被接收的文章LiDAR Distillation: Bridging the Beam-Induced Domain Gap for 3D Object Detection的介绍。在这个工作中,我们通过构建伪低线数点云,利用知识蒸馏方法,来减小由激光雷达线数域差异导致的模型性能下降问题。很荣幸地,我们的文章被ECCV 2022收录,目前项目代码已开源,欢迎大家试用。

e8de29a2-28eb-11ed-ba43-dac502259ad0.jpg

arXiv:https://arxiv.org/abs/2203.14956

Code(已开源):

https://github.com/weiyithu/LiDAR-Distillation

概述

近年来随着人工智能的发展,自动驾驶技术开始逐步落地,广泛应用在无人机,清洁机器人,无人配送小车等无人系统中。而三维目标检测是自动驾驶技术中的重要一环,是三维环境感知的基础,其目的是检测出三维空间中每个物体的三维紧致框。相较于基于图像的纯视觉算法,基于点云三维目标检测方法精度更高,可以提供更加准确的三维位置,是现阶段高阶自动驾驶使用的方案。

激光雷达虽然可以提供准确的三维信息,但价格也是昂贵的,尤其是高线数激光雷达。因此在一些较低成本的产品中,例如清洁机器人和无人配送车,无法部署高线数雷达。然而现有公开数据集大部分都是用高线数雷达采集的,这中间存在着线数导致的域差异问题会使得我们无法很好地利用这些大型的公开数据集。除此之外,与RGB相机不同,激光雷达产品更新迭代较快,不同类型的激光雷达线数也会是不同的。对于每一代产品都去重新采集数据集是非常费时费力,不切合实际的。因此如何更好地利用之前采集的高线数数据集是个值得探究的问题。

同时,我们发现之前的一些算法大部分都是为了通用域适应问题设计的(例如ST3D),但面对训练集是高线数点云,测试集是低线数点云的场景,这些算法不能很好地处理。为了解决这个问题,我们提出了LiDAR Distillation。我们方法的核心是对源域高线数数据进行下采样得到伪低线数点云,与目标域线数对齐。以在高线数点云数据集上训练得到的三维目标检测器作为教师网络,在伪低线数点云数据集上训练得到的三维目标检测器作为学生网络,进行离线知识蒸馏算法,提升学生网络精度。由于下采样过程是逐步进行的,整个框架是迭代框架。在Waymo->nuScenes上的实验结果表明,我们的方法超过了当前最好方法的性能,并且我们的方法可以很好地与其它通用域适应方法进行结合,在推理过程中不增加任何计算量。

方法

e8fc6a20-28eb-11ed-ba43-dac502259ad0.jpg

1)生成低线数伪点云数据

为了对齐源域和目标域的点云线数(假设源域和目标域线数分别为Bs和Bt),我们首先需要对源域的高线数数据进行下采样。与一般的点云下采样方法不同,我们不能对点云进行均匀的采样,而是需要按照每条线进行采样。因此,我们首先需要将一个场景的点云中的每个点归类到每条线中。虽然有一些公开数据集中的数据有线束的标注,但很多激光雷达点云数据(例如KITTI)并没有这个信息,我们需要自己设计算法分离出每条线上的点。我们将每个点的笛卡尔坐标转换成球坐标:

e926aa88-28eb-11ed-ba43-dac502259ad0.png

e9349a12-28eb-11ed-ba43-dac502259ad0.png

2)利用高线数点云数据进行知识蒸馏

知识蒸馏框架中包含两个模型:教师网络和学生网络。一般而言,教师网络拥有更多的参数量和更强的表示能力,可以达到更好的性能;而学生网络模型更小,推理速度更快,能更好地用在存算资源受限的设备中。学生网络通过模仿教师网络的特征来提升自身的性能。与传统知识蒸馏方法不同的是,在我们的方法中,教师网络和学生网络的结构相同,唯一区别在于教师网络是在高线数数据上训练得到的,而学生网络是在低线数数据上训练所得。因此我们利用知识蒸馏的目的是将高线数点云中的丰富信息量传递给学生网络。

我们注意到大部分三维目标检测框架都会将三维特征投影到二维鸟瞰图(BEV)上,得到BEV特征。因此我们将BEV特征作为模仿目标。之前工作相关研究结果表明,由于特征图维度非常高,直接回归高维向量容易导致网络不收敛。除此之外,特征图存在很多低响应区域,这部分的特征往往是不重要的。为了解决这个问题,我们提取BEV特征图中的感兴趣区域(ROI)并在这些区域上执行模仿操作。整体目标函数如下:

e95b4982-28eb-11ed-ba43-dac502259ad0.png

3)渐进式知识蒸馏

我们发现当高线数数据和低线数数据之间的线数差异过大时(例如64线和16线),学生网络无法很好地向教师网络进行学习。我们提出渐进式知识蒸馏框架,逐步进行蒸馏学习。以64线数据到16线数据为例,我们首先生成伪32线数据,并在上面训练得到学生模型。紧接着,我们生成伪16线数据,并以上一步得到的学生模型作为教师网络。在伪16线数据上得到的学生网络作为最终结果在目标域的16线数据上进行推理。

实验结果

1) Waymo->nuScenes实验

e97ef40e-28eb-11ed-ba43-dac502259ad0.jpg

需要注意的是虽然Waymo数据集是64线数据,nuScenes是32线数据,但由于nuScene垂直视场角是Waymo的一半,因此其等效线数为16线。尽管我们的方法仅仅是为了由线数不同导致的域差异问题而设计的,没有考虑其它域差异因素,我们的方法仍然达到了SOTA的性能。并且,由于我们的方法没有用到目标域的训练数据,我们的方法很容易与其它方法进行互补结合(例如ST3D),达到更好的效果。

2)KITTI实验

e99b95e6-28eb-11ed-ba43-dac502259ad0.jpg

为了排除源域和目标域其它域差异因素的干扰,我们在KITTI上进行了实验。在这个实验中,点云线数不同是源域和目标域唯一的差别,其实这个设置更贴合真正的业界应用。换句话说,虽然产品更新导致了激光雷达线数变化,但使用场景并没有改变。但很可惜的是,学界并没有在同一场景用不同线数雷达采集的数据集。因此我们只能将64线KITTI数据分别下采样到多种低线数作为目标域。

3)预训练实验

e9c127fc-28eb-11ed-ba43-dac502259ad0.jpg

对于公司而言,他们愿意标一些源域的数据。因此我们也做了用我们方法在源域上进行预训练,然后在目标域上进行微调的实验。我们发现仅使用5%的目标域有标签数据,我们方法得到的模型性能就可以超过没有预训练直接用100%目标域数据进行训练得到模型的性能。

方法不足与未来展望

我们的方法是在BEV特征上进行知识蒸馏的,但很显然这不是最优解,尤其是对于不是很依赖BEV特征的网络而言,最近也出了不少三维目标检测知识蒸馏的文章,这些方法值得借鉴。另一方面,现在的公开数据集基本上用的都是用机械式激光雷达采集的。而由于成本原因,现在越来越多的厂家选用固态或者混合固态的激光雷达,这些雷达中的线数概念与机械式的不同,因此如何在这些雷达中缓解域差异问题是一个不错的未来方向。

审核编辑 :李倩

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 人工智能
    +关注

    关注

    1809

    文章

    49151

    浏览量

    250638
  • 激光雷达
    +关注

    关注

    971

    文章

    4244

    浏览量

    193120
  • 点云
    +关注

    关注

    0

    文章

    58

    浏览量

    3973

原文标题:ECCV 2022 | LiDAR Distillation: 解决由激光雷达线数差异导致的三维目标检测域适应问题

文章出处:【微信号:CVer,微信公众号:CVer】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    CES 2025激光雷达观察:“千线激光雷达亮相,头部厂商布局具身智能

    厂商也展示了最新的方案,包括集成在座舱内的激光雷达方案,FMCW激光雷达等。 ? 下面我们就来看下这届CES上激光雷达行业有哪些新的发展动态。 ? 车载激光雷达迈向千
    的头像 发表于 01-12 09:08 ?2461次阅读
    CES 2025<b class='flag-5'>激光雷达</b>观察:“千<b class='flag-5'>线</b>”<b class='flag-5'>激光雷达</b>亮相,头部厂商布局具身智能

    全固态激光雷达为什么迟迟未来?其技术难点是什么?

    [首发于智驾最前沿微信公众号]激光雷达(LiDAR)作为自动驾驶车辆环境感知的“第只眼”,能够发射激光脉冲并接收反射光,实时构建周围物体的三维点云,从而为车辆决策提供精准的距离和形状
    的头像 发表于 07-11 09:02 ?255次阅读

    超酷的树莓派激光雷达扫描仪!

    摘要这款DIY的PiLiDAR扫描仪项目利用树莓派进行激光雷达测绘。激光雷达通过发射激光来扫描周围环境,从而创建三维模型。该项目需要树莓派4、摄像头、电机以及
    的头像 发表于 06-01 08:33 ?382次阅读
    超酷的树莓派<b class='flag-5'>激光雷达</b>扫描仪!

    爱普生高精度车规晶振助力激光雷达自动驾驶

    实现毫米级感知的关键支撑,为智能驾驶提供稳定可靠的“心跳”节拍。激光雷达通过发射激光脉冲并计算反射时间生成三维点云数据,其核心要求是时序同步精度与环境适应性。微小的
    的头像 发表于 04-07 17:38 ?350次阅读
    爱普生高精度车规晶振助力<b class='flag-5'>激光雷达</b>自动驾驶

    激光雷达技术:自动驾驶的应用与发展趋势

    激光雷达是一种通过发射激光束并接收反射光束来测量物体距离和速度的传感器。它能够生成周围环境的精确三维地图,为自动驾驶车辆提供关键的感知信息。激光雷达的主要组成部分包括
    的头像 发表于 03-10 10:16 ?991次阅读
    <b class='flag-5'>激光雷达</b>技术:自动驾驶的应用与发展趋势

    基于空谱特征优化选择的高光谱激光雷达地物分类

    其可快速高效获取地物目标三维空间信息的优势特点,在地物分类、森林管理、资源调查、城市三维建模等诸多领域发挥着越来越重要的作用。随着遥感探测领域的不断拓展与深化,如何实现激光雷达在复杂场
    的头像 发表于 01-08 10:29 ?505次阅读
    基于空谱特征优化选择的高光谱<b class='flag-5'>激光雷达</b>地物分类

    激光雷达的工作原理和分类

    激光雷达是一种以发射激光束来探测目标位置、速度等特征量的雷达系统。 这个系统也可以通过扫描发射和接收装置来获取目标物体的
    的头像 发表于 11-07 09:28 ?3274次阅读
    <b class='flag-5'>激光雷达</b>的工作原理和分类

    什么是三维点云分割

    点云是世界的一种非结构化三维数据表示,通常激光雷达传感器、立体相机或深度传感器采集。它一系列单个点组成,每个点 x、y 和 z 坐标定
    的头像 发表于 10-29 09:21 ?706次阅读

    激光雷达的维护与故障排查技巧

    激光雷达(LiDAR,Light Detection and Ranging)是一种利用激光进行距离测量和目标识别的技术。它广泛应用于无人驾驶汽车、地理信息系统(GIS)、环境监测、航空航天等领域
    的头像 发表于 10-27 11:04 ?3981次阅读

    激光雷达技术的基于深度学习的进步

    一、激光雷达技术概述 激光雷达技术是一种基于激光的遥感技术,通过发射激光脉冲并接收反射回来的光来测量物体的距离和速度。与传统的雷达技术相比,
    的头像 发表于 10-27 10:57 ?1111次阅读

    激光雷达在农业中的创新应用

    生长的详细三维信息,这对于作物监测和管理至关重要。通过分析作物的冠层结构,农民可以评估作物的健康状况、生长速度和产量潜力。例如,激光雷达可以检测到作物密度的变化,这可能表明病虫害或营养缺乏的问题。 2. 土地测绘与规划 在农业
    的头像 发表于 10-27 10:54 ?1734次阅读

    激光雷达在地形测绘中的作用

    遥感技术,它通过向目标发射激光脉冲并接收其反射回来的光来测量距离。这种技术可以提供高分辨率的三维空间数据,包括地形、建筑物、植被和其他地表特征。激光雷达系统通常安装在飞机、无人机或卫星
    的头像 发表于 10-27 10:46 ?1526次阅读

    LIDAR激光雷达逆向建模能用到revit当中吗

    LIDAR激光雷达逆向建模是一种利用激光雷达技术获取物体表面数据,然后通过计算机软件进行建模的方法。在建筑行业中,这种方法可以用于建筑物的三维建模、结构分析、施工模拟等。Revit是一款专业的建筑
    的头像 发表于 08-29 17:23 ?997次阅读

    光学雷达激光雷达的区别是什么

    光学雷达激光雷达是两种不同的遥感技术,它们在原理、应用、优缺点等方面都存在一定的差异。以下是对光学雷达激光雷达的比较: 定义和原理 光学
    的头像 发表于 08-29 17:20 ?3397次阅读

    激光雷达点云数据包含哪些信息

    )、环境监测、城市规划等领域。激光雷达点云数据是激光雷达系统收集到的一系列三维空间坐标点,包含了丰富的空间信息。本文将介绍激光雷达点云数据包含的信息。 空间坐标信息
    的头像 发表于 08-29 17:18 ?1916次阅读