0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

克服机器人视觉处理挑战的四阶段战略

jt_rfid5 ? 来源:机器视觉沙龙 ? 作者:机器视觉沙龙 ? 2022-10-31 17:40 ? 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

第一代机器人,如第一批消费级机器人吸尘器,相对来说比较简单,自我导航和执行任务的能力有限。这些机器人通过红外发射器等探测障碍物,使用震动传感器检测碰撞。但是,这些都已成为历史。

随着人工智能AI)、机器学习(ML)和计算机视觉(CV)等融合技术的进步,现在,机器人可以看到周围的环境,分析动态场景或变化的条件,并做出决定。而硬件创新进一步推动了这些功能的完善,比如越来越强大的移动平台、更复杂的传感器和高分辨率图像捕获。

有了这些资源,开发者可以专注于开发更少依赖外部硬件(如GPS)的更自主的智能机器人,机器人的工作环境也得到大大的拓展(如,在室内、在弱光下等),并且可以处理不断变化的环境和移动物体。为零售、汽车、农业、工业物联网IoT)、健康和企业等领域的新型机器人应用铺平了道路。

为实现上述目标,机器人开发者应努力克服机器人视觉三大挑战:

? 确定对象的方向:不仅要识别周围环境中的对象,还必须确定它们在3D空间中的方向,以便机器人与这些对象交互和/或回避这些对象。

? 处理移动对象:给定环境中的对象可能不是静态的。机器人需要在空间和时间上检测、识别和跟踪对象。

? 导航:要使机器人具有自主性,还需要相应的算法,允许其在变化的环境中进行移动。

四阶段战略

开发者可以根据要求,通过采用四阶段策略来克服这些挑战:

1. 预处理:从现实世界(如,传感器和相机)收集数据并转换,使数据更加方便使用。

2. 特征检测:从预处理数据中提取诸如角落、边缘等特征。

3. 对象检测和分类:从特征检测对象,并且可以根据已知的特征图对对象进行分类。

4. 对象跟踪和导航:跟踪已识别对象,包括对象和在机器人导航时改变环境的视点。

然后,这些阶段生成的数据可用于控制伺服、制定决策以及执行其他高级机器人任务。

听起来好像工作量很大,事实上也可能如此,但幸运的是,现在有相应的框架和硬件,帮助您解决这个问题。Qualcomm Technologies, Inc.最近发布了 Qualcomm机器人RB3平台(RB3)(基于QualcommSDA845 SoC(SDA845))及相关的Qualcomm RoboticsRB3开发套件。该套件为开发者提供了移动硬件功能和丰富的工具支持,助力您解决上述挑战。

本系列文章共两篇,在第一篇中,我们将介绍该策略的前两个阶段:预处理和特征检测,以及如何使用功能丰富的开发工具包(如Qualcomm Robotics RB3开发套件。

预处理

机器人使用一个或多个摄像头和/或其他传感器从现实世界收集数据。但是,这些原始数据可能不适合于满足既定目标所需的准确计算和预测。此时,可以使用数字信号处理(DSP)等方法,“清理”数据,使其方便使用。比如,可以采用多种方式清理图像数据,包括调整大小、伽马校正和对比度增强;而传感器数据,如来自Qualcomm Robotics RB3开发套件上的惯性测量单元(IMU)、加速度计、气压计和/或麦克风的传感器数据,可以进行融合、内推和/或过滤。

在处理图像数据时,必须规划好收集数量和速度。Qualcomm Robotics RB3开发套件支持两个(立体)图像,这意味着系统必须同时处理两个平面。此外,还可以支持16-32万像素的分辨率和30-60 fps的帧速率。同样,可以使用Qualcomm SDA845上的高速和低速连接器以及您采用的传感器类型,以各种频率和比特率收集传感器数据。

为减少处理这些数据的开销,一般希望使用最低采样率和分辨率,满足应用程序所需的数据量即可。此外,还应尽可能将处理流程卸载到合适的处理器。Qualcomm SDA845与专用硬件兼容,包括Qualcomm Hexagon 685 DSP和Qualcomm Spectra 280 ISP,以及更通用的Qualcomm Kryo385 CPU和面向图形的Qualcomm Adreno 630 GPU

在API方面,开发者可以使用Qualcomm计算机视觉库,该库包含许多用于图像预处理的硬件加速API。也可以使用Qualcomm神经处理引擎SDK,其中包含图像预处理API,用于处理神经网络中的图像。另外,还可以选择使用Qualcomm骁龙异构计算SDK,进一步控制计算操作的执行方式。

特征检测

通过提供干净的数据,可以提取功能。对于可视化数据,计算机视觉开发者希望的四种常用特性包括:

? 角落:具有局部2D结构的点状特征

? 边缘:两个区域之间的一组点

? Blob:感兴趣的区域

? 脊:具有脊点的曲线

这篇维基百科文章提供了有关这些特性的更多信息,并列出了许多特性检测器算法以及以检测的特性类型。下图显示了从可视数据中检测到的特性:

特征检测算法需要大量处理能力,但通常逐个像素运行,因此,很适合在Qualcomm SDA845不同处理器上并行执行。开发者可以使用计算机视觉库中的特性检测API,其中包括Harris角检测器、FAST、Hough Transform和其他检测器,以及基于最大稳定极值区(MSER)的对象检测API。

结论

前两个阶段为机器人视觉处理打下了坚实的基础。预处理将数据转换为可用形式,而特征检测则是了解数据的过程。在以后的文章中,我们将继续探讨最后两个阶段:对象检测和分类、对象跟踪和导航,为机器人提供导航和与周围环境交互所需的数据。

审核编辑:郭婷

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 传感器
    +关注

    关注

    2567

    文章

    53158

    浏览量

    769031
  • 机器人
    +关注

    关注

    213

    文章

    29835

    浏览量

    213735
  • IOT
    IOT
    +关注

    关注

    188

    文章

    4310

    浏览量

    202591

原文标题:【光电制造】机器人视觉处理四阶段策略

文章出处:【微信号:今日光电,微信公众号:今日光电】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    工业机器人的特点

    机器人是关键。工业互联网是通过端上的数据传输,经过大数据分析和云计算处理,再进行智能化决策的一整个过程,其中端的数据传输是基础。工业互联网的端包括机器人、传感器等一切线下连接端口。因此发展工业
    发表于 07-26 11:22

    盘点#机器人开发平台

    地瓜机器人RDK X5开发套件地瓜机器人RDK X5开发套件产品介绍 旭日5芯片10TOPs算力-电子发烧友网机器人开发套件 Kria KR260机器人开发套件 Kria KR260-
    发表于 05-13 15:02

    【「# ROS 2智能机器人开发实践」阅读体验】视觉实现的基础算法的应用

    的本质是解决“鸡与蛋”问题:机器人需要地图来定位,又需要准确定位来构建地图。书中从前端(传感器数据处理)和后端(位姿优化)两个层面解析了SLAM的算法逻辑。 激光雷达和视觉SLAM各有优劣,例如激光
    发表于 05-03 19:41

    【「# ROS 2智能机器人开发实践」阅读体验】+内容初识

    、Gazebo仿真(含RGBD相机/激光雷达仿真)、实物机器人运动控制,实现\"仿真→实物\"的无缝衔接 高阶应用篇(7-9章) 聚焦视觉SLAM、自主导航等前沿场景,提供完整项目链路(如
    发表于 04-27 11:24

    海康机器人布局关节机器人业务

    关节机器人领域迎来一位实力选手。继布局移动机器人机器视觉业务后,海康机器人正在拓展新的产品线。
    的头像 发表于 03-20 10:47 ?786次阅读

    【「具身智能机器人系统」阅读体验】2.具身智能机器人的基础模块

    具身智能机器人的基础模块,这个是本书的第二部分内容,主要分为个部分:机器人计算系统,自主机器人的感知系统,自主机器人的定位系统,自主
    发表于 01-04 19:22

    《具身智能机器人系统》第10-13章阅读心得之具身智能机器人计算挑战

    阅读《具身智能机器人系统》第10-13章,我对具身智能机器人的工程实践有了全新认识。第10章从实时性角度剖析了机器人计算加速问题。机器人定位中的SLAM算法需要
    发表于 01-04 01:15

    【「具身智能机器人系统」阅读体验】+两本互为支持的书

    最近在阅读《具身智能机器人系统》这本书的同时,还读了 《计算机视觉之PyTorch数字图像处理》一书,这两本书完全可以视为是互为依托的姊妹篇。《计算机视觉之PyTorch数字图像
    发表于 01-01 15:50

    【「具身智能机器人系统」阅读体验】2.具身智能机器人大模型

    。 多模态融合的创新与突破 机器人控制技术的另一个重要突破在于多模态大模型的应用。相比于仅通过文字进行人机交互的传统方法,现代机器人能够融合视觉、声音、定位等多模态输入信息,为任务执行提供更加全面的感知
    发表于 12-29 23:04

    【「具身智能机器人系统」阅读体验】1.初步理解具身智能

    影响与发展,提供了全球及国内行业趋势的见解。书中详细讨论了这一新兴领域面临的诸多挑战,从应用的不确定性、昂贵的成本到伦理问题,为读者呈现了当前形势的现实视角。 接下来,书中深入探讨了具身智能机器人的历史
    发表于 12-28 21:12

    【「具身智能机器人系统」阅读体验】1.全书概览与第一章学习

    讲解如何构造具身智能基础模型的方法和步骤,包括数据采集、预处理、模型训练和评估等。 在第部分,介绍了具身智能机器人的计算挑战,包括计算加速、算法安全性和系统可靠性等内容。 最后,在第
    发表于 12-27 14:50

    《具身智能机器人系统》第7-9章阅读心得之具身智能机器人与大模型

    医疗领域,手术辅助机器人需要毫米级的精确控制,书中有介绍基于视觉伺服的实时控制算法,以及如何利用大模型优化手术路径规划。工业场景中,协作机器人面临的主要挑战是快速适应新工艺流程。具身智
    发表于 12-24 15:03

    【「具身智能机器人系统」阅读体验】+数据在具身人工智能中的价值

    的数据集。例如,自主导航机器人需要处理大量环境数据,以增强其路径规划和避障能力。此外,数据的精度直接影响机器人的性能;从事高精度任务的工业机器人需要极其精确的数据,其中微小的误差可能会
    发表于 12-24 00:33

    【「具身智能机器人系统」阅读体验】+初品的体验

    解决许多技术的和非技术的挑战,如提高智能体的自主性、处理复杂环境互动的能力及确保行为的伦理和安全性。 未来的研究需要将视觉、语音和其他传感技术与机器人技术相结合,以探索更加先进的知识表
    发表于 12-20 19:17

    解锁机器人视觉与人工智能的潜力,从“盲人机器”改造成有视觉能力的机器人(上)

    正如人类依赖眼睛和大脑来解读世界,机器人也需要自己的视觉系统来有效运作。没有视觉机器人就如同蒙上双眼的人类,仅能执行预编程的命令,容易碰撞障碍物,并犯下代价高昂的错误。这正是
    的头像 发表于 10-12 09:56 ?832次阅读
    解锁<b class='flag-5'>机器人</b><b class='flag-5'>视觉</b>与人工智能的潜力,从“盲人<b class='flag-5'>机器</b>”改造成有<b class='flag-5'>视觉</b>能力的<b class='flag-5'>机器人</b>(上)