0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

一篇关于CVPR‘21使用RL做点云图像配准

新机器视觉 ? 来源:强化学习技术前沿 ? 作者:东林钟声 ? 2021-07-02 08:57 ? 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

深度强化学习(Deep RL)可以通过序列决策式的方式,在很多方面得到应用。这里我们主要介绍一篇CVPR‘21使用RL做点云图像配准的文章:ReAgent: Point Cloud Registration using Imitation and Reinforcement Learninghttps://arxiv.org/abs/2103.15231

总体上而言,ReAgent是通过训练了一个Policy网络,状态是Source点云和Target点云,输出一系列动作(旋转、平移Source点云),使得Source点云最终和Target点云在相同的地方重合。那么我们现在深入其中的细节,其实针对RL的应用文章,最需要关注的点是以下4个方面:

状态(State)设计

动作(Action)设计

奖励(Reward)设计

算法实现

一般来说RL的应用文章在算法上无非使用的是较为广泛使用的算法模型,如DQN、PPO、SAC等。

State

这里的State是将Source和Targe点云通过一个PointNet类似的结构,从高维点云信息Embedding到一个特征空间后,两者Concatenate得到State的表征信息。这里从上图中可以比较好的理解。

Action

这里Action的选择就比较直观,我们需要通过一些操作来旋转、平移Source点云。那么Action就直接设置为旋转、平移相关的动作。这篇文章在实现上,使用离散的动作集,比如x方向的平移为[0.0033,0.01,0.03,0.09,0.27],当然是有正有负。

Reward

Reward的设计就更为直观,就是在执行动作后,看是否Source和Target之间更加接近了。这里使用的是Chamfer Distance(CD)来衡量,下面给出Reward的设计:

4982f126-dacc-11eb-9e57-12bb97331649.png

这里的Reward也很直观,就是加入执行动作之后,是否变得更好?如果变好了就给一个正的奖励,如果变差了就给一个负的奖励。

算法实现

文章采用了PPO。那么ReAgent的总体框架就如下图:

49a7c88e-dacc-11eb-9e57-12bb97331649.png

如果理解了这个问题中的State、Action的设计,还是相当直观的框架。同时笔者也跑通了ReAgent的代码,实际看下其效果如何,主要是观察其序列动作过程

可以看到ReAgent的动作还是相当“丝滑“”且准确的。也希望更多的读者能够探索RL的各种应用,做到像人一样“丝滑”~

—版权声明—

来源:强化学习技术前沿

仅用于学术分享,版权属于原作者。

若有侵权,请联系微信号: 删除或修改!

编辑:jq

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 代码
    +关注

    关注

    30

    文章

    4908

    浏览量

    71271
  • 深度强化学习

    关注

    0

    文章

    14

    浏览量

    2411

原文标题:深度强化学习点云配准——ReAgent技术详解

文章出处:【微信号:vision263com,微信公众号:新机器视觉】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    TLKS-PMG-PV550 图像监拍装置:网安全的智能守护者

    图像监拍装置是集先进技术于身的智能监测设备,以公网无线 4G 为数据传输通道,搭配前端高清摄像机,实现对配电线路及周边环境的实时在线监测。它摆脱了传统监测对人力的高度依赖,24 小时不间断守护
    的头像 发表于 07-18 11:00 ?180次阅读

    传音多媒体团队揽获CVPR NTIRE 2025两项挑战赛冠亚军

    近日,在计算机视觉领域最具影响力的国际竞赛 CVPR NTIRE 2025中,传音多媒体团队与上海交通大学图像所MediaLab联合团队分别斩获 高效超分辨率挑战赛(NTIRE 2025
    的头像 发表于 06-24 16:08 ?1193次阅读
    传音多媒体团队揽获<b class='flag-5'>CVPR</b> NTIRE 2025两项挑战赛冠亚军

    带你搞定!Air8101:物联网设备AirKiss网方案

    AirKiss通过免交互网方案降低了用户操作门槛,同时兼容微信生态实现快速商业化部署 ——已渗透至智能家居、工业控制、医疗健康等多元化场景,成为物联网设备网的核心技术方案。 ?
    的头像 发表于 05-27 11:09 ?282次阅读
    <b class='flag-5'>一</b><b class='flag-5'>篇</b>带你搞定!Air8101:物联网设备AirKiss<b class='flag-5'>配</b>网方案

    综合线柜是干什么的

    综合线柜(也称为综合布线柜或综合布线系统配线柜)是种在多个领域中发挥关键作用的设备。以下是关于综合线柜的详细介绍: 、主要作用 集中
    的头像 发表于 03-11 11:08 ?592次阅读

    怎么用DLP4500投影图像

    请问怎么用DLP4500投影图像吗。英文的指导手册看了,但是不太懂,自己尝试做,不出来 能给些详细一点的教程指导吗
    发表于 02-27 07:13

    电钟:关于GPS北斗卫星授时服务部署方案

    电钟:关于GPS北斗卫星授时服务部署方案
    的头像 发表于 02-25 09:54 ?464次阅读
    京<b class='flag-5'>准</b>电钟:<b class='flag-5'>关于</b>GPS北斗卫星授时服务部署方案

    电钟:关于北斗授时服务器技术应用方案

    电钟:关于北斗授时服务器技术应用方案
    的头像 发表于 02-17 16:26 ?425次阅读

    FRED应用: LED混合直透镜模拟

    ,我们看个混合直透镜的示例。 FRED模型 LED在整个半球上发光,但是大多数照明应用中要求对输出的光的方向进行控制。个简单的正透镜不足以将大角度光折射成准直光束。为了重新定向所有发射光,可以
    发表于 01-15 09:37

    ADS1298的RL导联脱落检测测试,发现结果呈现规律性变化,为什么?

    最近对ADS1298的RL导联脱落检测测试,元旦前还很好的,元旦回来后,测试发现结果呈现规律性变化。 之间测试的结果接近100%正确。 LOFF=0x13 请问是不是板子坏啦。
    发表于 01-07 07:54

    使用adc12dj3200设计,该上电顺序是必须要守的吗?

    最近在使用adc12dj3200设计,该芯片使用两种电压:1.9V与1.1V。手册上推荐1.9V先于1.1V上电。该上电顺序是必须要守的吗?如果没有按照推荐的上电顺序设计,此芯片能否正常工作?谢谢
    发表于 12-11 08:38

    输电线路网可视化图像监拍装置 图像监测装置 智能抓拍

    TLKS-PMG-100B网可视化图像监拍装置配备高精度前置摄像头,全天候监控输电线路的廊道。且用户可根据实际需要配置监控参数,例如设定报警阈值,以实现对外力破坏或设备异常的即时预警。当检测到异常情况时,系统会迅速捕捉相关图像
    的头像 发表于 11-05 11:08 ?918次阅读
    输电线路<b class='flag-5'>配</b>网可视化<b class='flag-5'>图像</b>监拍装置 <b class='flag-5'>图像</b>监测装置 智能抓拍

    使用语义线索增强局部特征匹配

    视觉匹配是关键计算机视觉任务中的关键步骤,包括摄像机定位、图像和运动结构。目前最有效的匹配关键的技术包括使用经过学习的稀疏或密集匹配器,这需要成对的
    的头像 发表于 10-28 09:57 ?965次阅读
    使用语义线索增强局部特征匹配

    TAS5630B使用的PBTL模式,等效负载电阻RL在哪里连接?

    我使用的PBTL模式,看到表中有个等效负载电阻RL=3欧姆或4欧姆,这个RL没看到在哪里连接,是需要我们在输出信号线3Ω或者4Ω的阻抗匹配吗,还是不需要做处理?
    发表于 10-16 07:25

    为什么在水文计算中广泛采用线法

    在水文计算中广泛采用线法(或称适线法),主要基于以下几个方面的原因: 、理论依据坚实 线法以经验频率据为基础,通过求解与经验据拟合
    的头像 发表于 09-19 16:10 ?985次阅读

    基于VDMA的远程图像采集系统参考设计

    本文参考设计基于 AMD ZYNQ 7000 Device, 使用 VDMA 原始图像采集系统,在 Petalinux 下服务器,通过 Socket 发送图像至 Windows 或
    的头像 发表于 09-18 10:11 ?1134次阅读
    基于VDMA的远程<b class='flag-5'>图像</b>采集系统参考设计