0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

让小机器具备视觉和听觉功能,面临哪些挑战?

jf_pJlTbmA9 ? 来源:jf_pJlTbmA9 ? 作者:jf_pJlTbmA9 ? 2023-07-13 15:46 ? 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

飞行汽车、机器人管家……在一些未来畅想中,今天的人们已经拥有了各式“智慧”产品。如果运气不好的话,高智能机器人大行其道,开始起来反抗人类,再现《机械公敌》剧情。虽然这些想象并未成真,但在当下,人工智能(AI)技术已经走进了人们的世界。比如,每当给Alexa智能音箱指令时,机器学习技术都会努力弄清话语内容,并试图做出最佳判断。每次Netflix或亚马逊推荐了“下一部电影”或“下一次购货商品”时,均是基于复杂机器学习算法而定向推荐,让这些推荐远比之前的促销看上去诱人。尽管自动驾驶汽车尚未普及,但人们纷纷意识到自主导航的潜力和趋势。

人工智能技术大有前途——它让机器可以根据周围的世界做出决策,像人一样处理信息,甚至处理方式还会优于人类。但是,如果细想上述事例,便会发现目前的很多人工智能,只能通过“大型机器”来实现——这些机器发热量高、拥有线路功耗、体积巨大,而且昂贵。像Alexa和Netflix依靠云端的大型、高耗电服务器来分析用户的意图。而自动驾驶汽车则要依赖电池供电,考虑到电池必须能够驱动车轮和转向,因此需要提供很高的容量,与非常昂贵的人工智能决策相比,同样也要消耗大量能源。

目前,人工智能技术稳步发展,但是人工智能的“小型化,边缘化”却明显滞后。那些由小型电池供电或存在成本和尺寸限制的设备无法实现机器的视觉和听觉分析功能。目前,这些小型机器只能利用简单的人工智能技术:也许只是听一个关键词,或者分析低维信号,比如用光容积描记术(PPG)来测量心率。

如果小型机器有视觉和听觉功能会怎么样?

事实上,小型设备一旦能够看到和听到,是否有实用价值呢?思考一下,像门铃摄像头这样的小产品需要使用自动驾驶或自然语言处理等高阶人工智能技术吗?似乎也没有必要。因此可以考虑采用不太复杂、处理强度不大的小型化的、边缘的人工智能计算,比如词汇识别、语音识别和图像分析。

普通的门铃摄像头和消费类安保摄像头经常会被一些无关紧要的事件触发,比如刮风引起的植物摆动、云彩引起的剧烈光线变化、甚至是狗或猫在摄像头前跑动。这些事件可能会导致误触发,从而需要房主去操作忽视并清除此类触发事件。尤其糟糕的是,如果房主正好在世界其它地方旅行,而家里的摄像头却对日出、云彩、日落造成的光线变化发出了误警报会影响他们睡眠和旅行。但一个智能摄像头却能够基于更具体的事件进行触发,例如在所监控的画面中出现了一个人。

门锁或其它出入口可使用面部识别,甚至是语音识别来授予人员访问权限,在某些情况下不需要钥匙或胸卡。

很多摄像头都希望在发生某些特定事件时才触发:例如,跟踪摄像头可能希望在画面中出现鹿时被触发,安保摄像头可能希望在画面中有人或出现开门或脚步声等噪音时被触发,而个人摄像头可能希望通过语音命令来触发。

虽然有很多“Hey Alexa”这样的简单解决方案,但多词汇量命令在很多应用中都非常有用。如果具备识别20个或更多单词的词汇表,就可以在工业设备、家居自动化、烹饪设备和大量其它设备中应用,以简化人机交互。

尽管这些例子只触及表层:让小型机器看到、听到和解决过去需要人为干预的问题,但实际上这是一种颠覆性思路,因为人们每天都不断发现可智能化创造的新场景。

让小机器具备视觉和听觉功能,面临哪些挑战?

既然人工智能对小型机器具有如此实用价值,为何没有被大量开发呢?答案是受限于算力。人工智能推理是神经网络模型计算的结果。可以把神经网络模型看作是大脑处理图像或声音的粗略近似形态,将其分解为非常小的片段,然后在这些小碎片组合在一起时识别出模型。现代化视觉问题的主要模型是卷积神经网络(CNN)。这类模型在图像分析方面非常出色,在音频分析方面也非常有用。问题在于,这些模型需要数百万或数十亿次的数学计算。对于传统硬件设计,这些应用在实施时却会面临一些困难抉择:

使用低成本、低功耗的微控制器解决方案。虽然平均功耗可能很低,但卷积神经网络可能需要几秒钟时间来计算,这意味着人工智能推理不是实时的,并会消耗大量的电池电量。

购置一个昂贵的高性能处理器,能在规定延迟内完成这些数学运算。不过,这些处理器通常很大,需要很多外部组件,包括散热器或类似的冷却组件。好处是,它们执行人工智能推理的速度非常快。

低功耗微控制器解决方案的速度太慢,无法发挥作用,而高性能处理器方法会超出成本、尺寸和电源预算,可以说上述两种方案都不够理想,难以实施。

由此可见,人们需要的是一种全新的嵌入式人工智能解决方案,尽可能减少卷积神经网络计算所需的能耗。人工智能推理需要以比传统微控制器或处理器解决方案更少的能量来执行,并且无需借助能耗高、尺寸大、成本大的外部组件(如存储器)。如果人工智能推理解决方案实际上能够消除机器视觉的能量损失,那么即便是最小的设备也能看到并识别周围世界发生的事情。

幸运的是,人们现在已经处于这场“小型机器”革命的开端。目前,ADI已经在市场上推出了相关产品,能够消除人工智能推理的能源成本,并实现电池供电的机器视觉功能。了解更多有关构建能够执行人工智能推理但能耗却只有微焦耳的微控制器的信息。

责任编辑:彭菁

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 人工智能
    +关注

    关注

    1809

    文章

    49160

    浏览量

    250690
  • 机器学习
    +关注

    关注

    66

    文章

    8510

    浏览量

    134884
  • 边缘计算
    +关注

    关注

    22

    文章

    3345

    浏览量

    51081
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    FOPLP工艺面临挑战

    FOPLP 技术目前仍面临诸多挑战,包括:芯片偏移、面板翘曲、RDL工艺能力、配套设备和材料、市场应用等方面。
    的头像 发表于 07-21 10:19 ?639次阅读
    FOPLP工艺<b class='flag-5'>面临</b>的<b class='flag-5'>挑战</b>

    一文带你了解什么是机器视觉网卡

    机器视觉网卡通常指的是在机器视觉系统中用于连接工业相机到计算机的以太网卡。它的核心作用是实现高速、稳定、低延迟的图像数据传输。以下是关于机器
    的头像 发表于 07-09 16:18 ?189次阅读
    一文带你了解什么是<b class='flag-5'>机器</b><b class='flag-5'>视觉</b>网卡

    智能软件+硬件解决方案克服实时立体视觉中的挑战

    现出色,特别适用于工业机器人应用。从料箱捡取到自主导航,立体视觉使得各种机器人应用成为可能。然而,在实时应用场景中部署立体视觉系统时,常常面临
    的头像 发表于 05-16 17:04 ?243次阅读
    智能软件+硬件解决方案克服实时立体<b class='flag-5'>视觉</b>中的<b class='flag-5'>挑战</b>

    【「# ROS 2智能机器人开发实践」阅读体验】视觉实现的基础算法的应用

    结合IMU(惯性测量单元)进行多传感器融合。 三、总结与展望 技术融合趋势 机器视觉与SLAM的结合(如视觉惯性里程计VIO)是当前研究热点,未来可能进一步结合语义SLAM,
    发表于 05-03 19:41

    智慧路灯的推广面临哪些挑战

    引言 在智慧城市建设的宏伟蓝图中,叁仟智慧路灯的推广面临哪些挑战?叁仟智慧路灯作为重要的基础设施,承载着提升城市照明智能化水平、实现多功能集成服务的使命。然而,尽管叁仟智慧路灯前景广阔,在推广过程中
    的头像 发表于 03-27 17:02 ?319次阅读

    德晟达高性能服务器助力工业机器视觉落地

    当前工业机器视觉技术正经历深度变革,其应用场景已从传统质量检测、自动化生产逐步延伸至机器人导航、医疗影像分析等高端领域。随着技术迭代升级,行业面临三大核心
    的头像 发表于 03-11 17:22 ?729次阅读

    DLP160CP DMD是否可以应用于机器视觉应用?

    关于DLP160CPDMD芯片有一个疑问, 请问该芯片是否可以应用在机器3D视觉(结构光)场景应用呢?我在TI TLP机器视觉,“3D扫描视觉
    发表于 02-20 07:39

    【「具身智能机器人系统」阅读体验】2.具身智能机器人的基础模块

    智能计算系统的软件栈和硬件平台,以及目前面临的问题,还提到了为什么相比于自能驾驶,具身智能为什么发展比较慢,因为具身智能更加复杂,需要大算力,高实时性,高并发还需要低功耗,目前还面临诸多的挑战。相信借助
    发表于 01-04 19:22

    【「具身智能机器人系统」阅读体验】+初品的体验

    动态互动的。 该理论强调智能行为源于智能体的物理存在和行为能力,智能体必须具备感知环境并在其中执行任务的能力。具身智能的实现涵盖了机器学习、人工智能、机器人学、计算机视觉、自然语言处理
    发表于 12-20 19:17

    广和通机器视觉听觉解决方案荣膺AIoT新维奖杰出案例榜

    举办。作为AIoT产业盛会,大会评选了“AIoT新维奖”系列榜单,广和通机器视觉听觉解决方案荣登杰出案例榜。
    的头像 发表于 11-27 12:28 ?544次阅读
    广和通<b class='flag-5'>机器</b><b class='flag-5'>视觉</b>与<b class='flag-5'>听觉</b>解决方案荣膺AIoT新维奖杰出案例榜

    适用于机器视觉应用的智能机器视觉控制平台

    工控机在机器视觉系统设计中是不可或缺的核心组件,在机器视觉中发挥着至关重要的作用,其强大的计算能力、高度的稳定性和可靠性、实时性以及图像处理和识别能力,为
    的头像 发表于 11-23 01:08 ?592次阅读
    适用于<b class='flag-5'>机器</b><b class='flag-5'>视觉</b>应用的智能<b class='flag-5'>机器</b><b class='flag-5'>视觉</b>控制平台

    机器视觉面临挑战及其解决方法

    机器视觉是指使用计算机和图像处理技术从图像中提取信息,并将其转换为机器可理解的格式。这种方法已经被广泛应用于自动化生产、质量控制、测量和检测等领域。然而,机器
    的头像 发表于 11-11 01:03 ?1055次阅读

    工业 4.0 时代:连接器不容忽视的挑战与高效应对方案

    景。连接器市场面临挑战1.产品迭代带来的灵活性挑战在下游产业中,产品和技术更新换代的速度快。以汽车领域为例,新车型不断涌现,这就要求连接器具备高度的灵活性,能满足多
    的头像 发表于 10-30 08:08 ?805次阅读
    工业 4.0 时代:连接器不容忽视的<b class='flag-5'>挑战</b>与高效应对方案

    《DNK210使用指南 -CanMV版 V1.0》第二章 Kendryte K210简介

    包含的用于加速计算卷积人工神经网络的KPU和用于处理麦克风阵列输入的APU是其机器视觉机器听觉这两大核心功能的基础。同时KendryteK
    发表于 08-30 17:34

    视觉检测是什么意思?机器视觉检测的适用行业及场景有哪些?

    检测的定义与原理 机器视觉检测,是利用光学成像、数字信号处理和计算机技术,模拟人类视觉功能,对目标物体进行自动检测和分析的技术。它包括图像采集、预处理、特征提取、分类识别等多个环节,
    的头像 发表于 08-30 11:20 ?950次阅读