0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

科普|视觉SLAM是什么——三种视觉SLAM方案

双目立体视觉 ? 来源:INDEMIND ? 2020-04-17 09:21 ? 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

如今科技发展日新月异,诸如机器人、AR/VR等前沿科技产品已走入了大众生活当中。但是想在这些领域让用户有更好的体验,就需要很多底层技术的支持,SLAM就是其中之一。如果说机器人离开了SLAM,就相当于人类失去了双眼一样。

一、什么是视觉SLAM?

SLAM的英文全称是Simultaneous Localization and Mapping,中文称作「即时定位与地图创建」,而视觉SLAM就是用摄像头来完成环境的感知工作。

举个例子,当你第一天去上大学的时候,为了迅速熟悉校园环境并且找到宿舍时,你会做以下的事情:

1.用眼睛一直观察周围的教学楼、篮球场、喷泉等标志性建筑物,并且记住它们的特征。(特征提取)

2.根据你刚才眼睛观察到的信息,在脑海里把这些有特征的标志性建筑物建立成一个地图。(建图)

3.在继续行走时,又看到了一些如咖啡店、健身房等新的标志性建筑物,再把它们加到脑海中的地图里面校对一下。(状态更新)

4.根据你前一段时间行走获得的标志性建筑物,确定自己的位置。(路径规划)

5.当无意中走了很长一段路的时候,和脑海中的以往标志性建筑物进行匹配,看一看是否走回了原路。(回环检测)

其实上面你做的这些事情,就是视觉SLAM里面的几个部分。

二、视觉SLAM的分类

视觉SLAM研究主要分为三大类:单目、双目(或多目)、RGBD。

单目仅用一支摄像头就能完成SLAM。最大的优点是传感器简单且成本低廉,但同时也有个大问题,就是不能确切的得到深度,存在尺寸不确定的现象,比如丢失深度信息的相片中,我们能见到“手捏太阳”“借位拍照”这样的现象。

一方面是由于绝对深度未知,单目SLAM不能得到机器人运动轨迹及地图的真实大小,如果把轨迹和房间同时放大两倍,单目看到的像是一样的,因此,单目SLAM只能估计一个相对深度。另一方面,单目相机无法依靠一张图像获得图像中物体离自己的相对距离。为了估计这个相对深度,单目SLAM要靠运动中的三角测量,来求解相机运动并估计像素的空间位置。即是说,它的轨迹和地图,只有在相机运动之后才能收敛,如果相机不进行运动时,就无法得知像素的位置。同时,相机运动还不能是纯粹的旋转,这就给单目SLAM的应用带来了一些麻烦。

双目(多目)顾名思义是由两个或多个摄像头来完成SLAM,其普遍为双目视觉方案。双目视觉既可以在运动时估计深度,亦可在静止时估计,双目视觉融合两个摄像头获得的图像并观察它们之间的差别,获得明显的深度感,建立特征间的对应关系,将同一空间物理点在不同图像中的映像点对应起来。并且可以精准感知周围的物体和自身移动的轨迹,从而对周围环境形成三维立体的认识,解决了上面提到的问题。不过通过双目图像计算像素距离,计算量大,而且在特征少的白墙或暗光环境易丢失目标。

目前双目的应用程度明显较高,针对双目方案拓展应用场景上,大多融和了IMU或者IR等传感器,比如国内立体视觉方案公司indemind推出的双目视觉惯性模组,采用了“双目摄像头+IMU”多传感器融合架构与微秒级时间同步机制,可提供精准稳定数据源;并且内置了自研高精度Vi-SLAM算法,以满足SLAM研究、智能机器人、无人机避障、室内外导航定位等使用需求。

RGBD相机是2010年左右开始兴起的一种相机,它最大的特点是可以通过红外结构光或Time-of-Flight原理,直接测出图像中各像素离相机的距离。因此,它比传统相机能够提供更丰富的信息,也不必像单目或双目那样费时费力地计算深度。

目前常用的RGBD相机有Kinect/Kinect V2等等。不过,现在多数RGBD相机还存在测量范围窄、噪声大、视野小、受阳光,墙面反光等诸多问题。出于量程的限制,主要用于室内SLAM。

目前,视觉SLAM主要被运用于无人机、无人驾驶、机器人、AR、智能家居等领域,单目需要靠运动估计深度导致避障效率不高,RGBD存在量程的限制,主要用于室内SLAM。因此,目前在视觉SLAM中,双目的应用程度和落地前景都是最高的。

不管是哪种视觉SLAM方案,都是作为人工智能的眼睛,获取地图数据,并构建地图,规避路程中遇到的障碍物,实现路径的规划。

随着城市物联网和智能系统的完善,视觉SLAM必是大势所趋。虽然目前视觉SLAM技术方面还存在着一些问题,但这些都会随着消费刺激和产业链的发展逐步解决、趋于完善。
lw

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 人工智能
    +关注

    关注

    1809

    文章

    49152

    浏览量

    250663
  • SLAM
    +关注

    关注

    24

    文章

    444

    浏览量

    32549
  • 无人驾驶
    +关注

    关注

    99

    文章

    4182

    浏览量

    123908
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    基于深度学习的增强版ORB-SLAM3详解

    ORB-SLAM3虽是当前最先进的SLAM之一,但由于使用传统的ORB(定向FAST和旋转BRIEF)特征,在尺度、旋转和光照发生显著变化时可能会表现出局限性。
    的头像 发表于 07-14 17:21 ?302次阅读
    基于深度学习的增强版ORB-<b class='flag-5'>SLAM</b>3详解

    适用于动态环境的实时RGB-D SLAM系统

    近期用于视觉SLAM的3D高斯泼溅(3DGS)技术在跟踪和高保真建图方面取得了显著进展。然而,其顺序优化框架以及对动态物体的敏感性限制了其在现实场景中的实时性能和鲁棒性。为此,我们提出
    的头像 发表于 07-04 15:14 ?275次阅读
    一<b class='flag-5'>种</b>适用于动态环境的实时RGB-D <b class='flag-5'>SLAM</b>系统

    维高斯泼溅大规模视觉SLAM系统解析

    仍未得到探索。本文提出一基于立体相机的维高斯泼溅大规模视觉SLAM系统LSG-SLAM。通过在EuRoC数据集上的广泛评估,LSG-
    的头像 发表于 05-27 14:13 ?422次阅读
    <b class='flag-5'>三</b>维高斯泼溅大规模<b class='flag-5'>视觉</b><b class='flag-5'>SLAM</b>系统解析

    【「# ROS 2智能机器人开发实践」阅读体验】视觉实现的基础算法的应用

    SLAM在结构化环境中更稳定,而视觉SLAM(如ORB-SLAM3)更适合动态场景。 SLAM Toolbox的实践应用
    发表于 05-03 19:41

    【「# ROS 2智能机器人开发实践」阅读体验】+ROS2应用案例

    地图构建,包括算法原理介绍、安装与配置方法、仿真环境中的SLAM以及真实机器人上的SLAM。 这一过程不仅涉及到计算机视觉和机器人学的知识,还需要对ROS 2的节点管理和数据处理有一定的了解。通过实践
    发表于 04-27 11:42

    基于点、线和消失点特征的单目SLAM系统设计

    本文提出了一稳健的单目视觉SLAM系统,该系统同时利用点、线和消失点特征来进行精确的相机位姿估计和地图构建,有效解决了传统基于点特征的SLAM的局限性。
    的头像 发表于 03-21 17:07 ?506次阅读
    一<b class='flag-5'>种</b>基于点、线和消失点特征的单目<b class='flag-5'>SLAM</b>系统设计

    基于MASt3R的实时稠密SLAM系统

    本文提出了一即插即用的单目SLAM系统,能够在15FPS的帧率下生成全局一致的位姿和稠密几何图形。 01 ? 本文核心内容 视觉SLAM乃是当今机器人技术与增强现实产品的基础性构建模
    的头像 发表于 12-27 15:25 ?1536次阅读

    用于任意排列多相机的通用视觉里程计系统

    如何让多相机视觉SLAM系统更易于部署且对环境更具鲁棒性?本文提出了一适用于任意排列多相机的通用视觉里程计系统。在KITTI-360和MultiCamData数据集上验证了该方法对于
    的头像 发表于 12-13 11:22 ?813次阅读
    用于任意排列多相机的通用<b class='flag-5'>视觉</b>里程计系统

    利用VLM和MLLMs实现SLAM语义增强

    语义同步定位与建图(SLAM)系统在对邻近的语义相似物体进行建图时面临困境,特别是在复杂的室内环境中。本文提出了一面向对象SLAM的语义增强(SEO-SLAM)的新型
    的头像 发表于 12-05 10:00 ?1497次阅读
    利用VLM和MLLMs实现<b class='flag-5'>SLAM</b>语义增强

    最新图优化框架,全面提升SLAM定位精度

    的类别进行分类,如视觉SLAM、激光SLAM、惯性SLAM等。 解决SLAM问题的经典方法可以分为基于滤波的方法和基于图的方法。在19
    的头像 发表于 11-12 11:26 ?1286次阅读
    最新图优化框架,全面提升<b class='flag-5'>SLAM</b>定位精度

    激光雷达在SLAM算法中的应用综述

    一、文章概述 1.1 摘 要 即时定位与地图构建(simultaneous localization and mapping,SLAM)是自主移动机器人和自动驾驶的关键 技术之一,而激光雷达则是支撑
    的头像 发表于 11-12 10:30 ?2656次阅读
    激光雷达在<b class='flag-5'>SLAM</b>算法中的应用综述

    MG-SLAM:融合结构化线特征优化高斯SLAM算法

    同步定位与地图构建 (SLAM) 是计算机视觉中的一个基本问题,旨在在同时跟踪相机姿势的同时对环境进行地图构建。基于学习的密集 SLAM 方法,尤其是神经辐射场 (NeRF) 方法,在捕获密集光度
    的头像 发表于 11-11 16:17 ?917次阅读
    MG-<b class='flag-5'>SLAM</b>:融合结构化线特征优化高斯<b class='flag-5'>SLAM</b>算法

    从算法角度看 SLAM(第 2 部分)

    作者: Aswin S Babu 正如我们在[第 1 部分]中所讨论的,SLAM 是指在无地图区域中估计机器人车辆的位置,同时逐步绘制该区域地图的过程。根据使用的主要技术,SLAM 算法可分为三种
    的头像 发表于 10-02 16:39 ?841次阅读
    从算法角度看 <b class='flag-5'>SLAM</b>(第 2 部分)

    适用于动态环境的实时视觉SLAM系统

    既能保证效率和精度,又无需GPU,行业第一个达到此目标的视觉动态SLAM系统。
    的头像 发表于 09-30 14:35 ?1397次阅读
    一<b class='flag-5'>种</b>适用于动态环境的实时<b class='flag-5'>视觉</b><b class='flag-5'>SLAM</b>系统