0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

浅谈计算机视觉的下一个方向

要长高 ? 来源:eetimes ? 作者:Sally Ward-Foxton ? 2022-06-22 11:53 ? 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

计算机视觉是否会再次自我改造?

匹兹堡大学眼科教授、CMU 机器人研究所兼职教授 Ryad Benosman 认为确实如此。作为基于事件的视觉技术的创始人之一,Benosman 预计神经形态视觉——基于事件的相机的计算机视觉——是计算机视觉的下一个方向。

“计算机视觉已经被改造了很多很多次,”他说。“我已经看到它至少重新发明了两次,从零开始,从零开始。”

Benosman 引用了 1990 年代从带有一点摄影测量的图像处理到基于几何的方法的转变,然后是今天机器学习的快速变化。尽管发生了这些变化,现代计算机视觉技术仍然主要基于图像传感器——产生类似于人眼所见图像的相机。

根据 Benosman 的说法,在图像传感范式不再有用之前,它会阻碍替代技术的创新。这种影响因 GPU 等高性能处理器的发展而延长,延迟了寻找替代解决方案的需要。

“我们为什么将图像用于计算机视觉?这是一个价值百万美元的问题,”他说。“我们没有理由使用图像,这只是因为历史的动力。甚至在没有相机之前,图像就有动力。”

图像相机

自从公元前五世纪针孔相机出现以来,图像相机就一直存在到 1500 年代,艺术家们建造了房间大小的设备,用于在画布上追踪房间外的人或风景的图像。多年来,这些画被替换为胶片来记录图像。数码摄影等创新最终使图像相机很容易成为现代计算机视觉技术的基础。

然而,Benosman 认为,基于图像相机的计算机视觉技术效率极低。他的类比是中世纪城堡的防御系统:位于城墙周围的守卫向各个方向寻找接近的敌人。鼓手稳定地敲打,每一个鼓点,每个守卫都会大声喊出他们所看到的。在所有的呼喊声中,听到一个守卫在遥远的森林边缘发现敌人是多么容易?

21世纪的鼓声硬件等价物是电子时钟信号,而守卫是像素——创建了大量数据,并且必须在每个时钟周期进行检查,这意味着存在大量冗余信息和大量信息。需要不必要的计算。

“人们正在燃烧如此多的能量,它占用了城堡的整个计算能力来保护自己,”贝诺斯曼说。如果发现一个有趣的事件,在这个类比中以敌人为代表,“你必须四处走走收集无用的信息,到处都是人在尖叫,所以带宽很大……现在想象你有一座复杂的城堡。 所有这些人都必须被听到。”

进入神经形态视觉。基本思想受到生物系统工作方式的启发,即检测场景动态的变化,而不是连续分析整个场景。在我们的城堡类比中,这意味着让守卫保持安静,直到他们看到感兴趣的东西,然后喊出他们的位置以发出警报。在电子版中,这意味着让单个像素决定他们是否看到相关的东西。

“像素可以自行决定他们应该发送什么信息,而不是获取系统信息,他们可以寻找有意义的信息——特征,”他说。“这就是与众不同的地方。”

与固定频率的系统采集相比,这种基于事件的方法可以节省大量电力并减少延迟。

“你想要一些更具适应性的东西,这就是[基于事件的视觉]的相对变化给你的东西,一个适应性的采集频率,”他说。“当你观察幅度变化时,如果某些东西移动得非常快,我们就会得到很多样本。如果某些东西没有改变,你会得到几乎为零,所以你正在根据场景的动态调整你的采集频率。这就是它带来的东西。这就是为什么它是一个好的设计。”

Benosman 于 2000 年进入神经形态视觉领域,他坚信先进的计算机视觉永远无法发挥作用,因为图像不是正确的方法。

“最大的转变是说我们可以在没有灰度和没有图像的情况下进行视觉,这在 2000 年底是异端——完全是异端,”他说。

Benosman 提出的技术——今天基于事件的传感的基础——是如此不同,以至于提交给当时最重要的 IEEE 计算机视觉期刊的论文未经审查就被拒绝了。事实上,直到 2008 年动态视觉传感器 (DVS) 的开发,该技术才开始获得动力。

神经科学灵感

神经形态技术是受生物系统启发的技术,包括终极计算机、大脑及其计算元素神经元。问题是没有人完全理解神经元是如何工作的。虽然我们知道神经元对传入的称为尖峰的电信号起作用,但直到最近,研究人员仍将神经元描述为相当草率,认为只有尖峰的数量很重要。这个假设持续了几十年。最近的研究证明,这些尖峰的时间是绝对关键的,并且大脑的结构正在这些尖峰中产生延迟以编码信息。

今天的尖峰神经网络模拟大脑中看到的尖峰信号,是真实事物的简化版本——通常是尖峰的二进制表示。“我收到一个 1,我醒来,我计算,我睡觉,”Benosman 解释说。现实要复杂得多。当尖峰到来时,神经元开始随着时间的推移对尖峰的值进行积分;神经元也有泄漏,这意味着结果是动态的。还有大约 50 种不同类型的神经元具有 50 种不同的集成配置文件。今天的电子版本缺少集成的动态路径、神经元之间的连接以及不同的权重和延迟。

“问题是要制造一个有效的产品,你不能[模仿]所有的复杂性,因为我们不理解它,”他说。“如果我们有好的大脑理论,我们会解决它——问题是我们只是不知道[足够]。”

今天,Bensoman 经营着一个独特的实验室,致力于了解皮层计算背后的数学,旨在创建新的数学模型并将其复制为硅设备。这包括直接监测来自真实视网膜的尖峰。

目前,贝诺斯曼反对忠实地复制生物神经元,称这种方法过时。

“在硅中复制神经元的想法的产生是因为人们观察了晶体管并看到了一个看起来像真正神经元的机制,所以一开始它背后有一些想法,”他说。“我们没有细胞;我们有硅。你需要适应你的计算基板,而不是相反……如果我知道我在计算什么并且我有芯片,我可以优化这个方程式并以最低的成本、最低的功耗、最低的延迟运行它。”

处理能力

意识到没有必要精确复制神经元,再加上 DVS 相机的发展,是当今神经形态视觉系统背后的驱动力。虽然今天的系统已经上市,但在我们拥有完全类似于人类的视觉可用于商业用途之前,还有很长的路要走。

最初的 DVS 相机具有“大而粗的像素”,因为光电二极管本身周围的组件大大降低了填充因子。虽然对开发这些摄像机的投资加速了这项技术,但 Benosman 明确表示,今天的事件摄像机只是对早在 2000 年开发的原始研究设备的改进。来自索尼的最先进的 DVS 摄像机,三星和 Omnivision 拥有微小的像素,融合了 3D 堆叠等先进技术并降低了噪点。Benosman 担心的是今天使用的传感器类型能否成功扩大规模。

“问题是,一旦你增加像素数量,你就会得到大量数据,因为你的速度仍然非常快,”他说。“你可能仍然可以实时处理它,但是你会从太多的像素中得到太多的相对变化。这现在正在杀死所有人,因为他们看到了潜力,但他们没有合适的处理器来支持它。”

通用神经形态处理器落后于 DVS 相机对应物。一些业内最大的参与者(IBM Truenorth、英特尔 Loihi)的努力仍在进行中。Benosman 表示,正确的处理器和正确的传感器将是无与伦比的组合。

“[今天的 DVS] 传感器速度极快,带宽超低,动态范围大,因此您可以在室内和室外看到,”Benosman 说。“这是未来。它会起飞吗?绝对地!”

“谁能把处理器放在那里并提供完整的堆栈,谁就赢了,因为它将是无与伦比的,”他补充道。

— Ryad Benosman 教授在5 月 17 日在加利福尼亚州圣克拉拉举行的嵌入式视觉峰会上发表主题演讲。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 传感器
    +关注

    关注

    2568

    文章

    53295

    浏览量

    770268
  • 神经网络
    +关注

    关注

    42

    文章

    4814

    浏览量

    104506
  • 计算机视觉
    +关注

    关注

    9

    文章

    1711

    浏览量

    46958
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    易控智驾荣获计算机视觉顶会CVPR 2025认可

    近日,2025年国际计算机视觉与模式识别顶级会议(IEEE/CVF Conference on Computer Vision and Pattern Recognition,CVPR 2025)在美国田纳西州纳什维尔召开。
    的头像 发表于 07-29 16:54 ?679次阅读

    文带你了解工业计算机尺寸

    项艰巨的任务。本博客将指导您了解关键的工业计算机尺寸、使用案例。关键工业计算机外形要素及其使用案例、工业微型PC尺寸范围:宽度:100毫米-180毫米深度:10
    的头像 发表于 04-24 13:35 ?427次阅读
    <b class='flag-5'>一</b>文带你了解工业<b class='flag-5'>计算机</b>尺寸

    Arm KleidiCV与OpenCV集成助力移动端计算机视觉性能优化

    生成式及多模态人工智能 (AI) 工作负载的广泛增长,推动了对计算机视觉 (CV) 技术日益高涨的需求。此类技术能够解释并分析源自现实世界的视觉信息,并可应用于人脸识别、照片分类、滤镜处理及增强现实
    的头像 发表于 02-24 10:15 ?649次阅读

    AR和VR中的计算机视觉

    ):计算机视觉引领混合现实体验增强现实(AR)和虚拟现实(VR)正在彻底改变我们与外部世界的互动方式。即便是在引人入胜的沉浸式
    的头像 发表于 02-08 14:29 ?1675次阅读
    AR和VR中的<b class='flag-5'>计算机</b><b class='flag-5'>视觉</b>

    日英联手开发下一代量子计算机

    近日,据报道,日本国立产业技术综合研究所(AIST)与全球芯片巨头英特尔公司正携手合作,致力于开发下一代量子计算机。这举措预示着量子计算领域将迎来新的突破。 据了解,此次合作将充分利
    的头像 发表于 02-07 14:26 ?516次阅读

    云端超级计算机使用教程

    云端超级计算机种基于云计算的高性能计算服务,它将大量计算资源和存储资源集中在起,通过网络向
    的头像 发表于 12-17 10:19 ?617次阅读

    工业中使用哪种计算机

    在工业环境中,工控机被广泛使用。这些计算机的设计可承受极端温度、灰尘和振动等恶劣条件。它们比标准消费类计算机更耐用、更可靠。工业计算机可控制机器、监控流程并实时收集数据。其坚固的结构和专业功能
    的头像 发表于 11-29 14:07 ?783次阅读
    工业中使用哪种<b class='flag-5'>计算机</b>?

    量子计算机与普通计算机工作原理的区别

    ? 本文介绍了量子计算机与普通计算机工作原理的区别。 量子计算新兴的研究领域,科学家们利用量子力学,制造出具有革命性能力的
    的头像 发表于 11-24 11:00 ?1700次阅读
    量子<b class='flag-5'>计算机</b>与普通<b class='flag-5'>计算机</b>工作原理的区别

    ROM对计算机性能的影响

    只读存储器(ROM)是计算机硬件中的重要组成部分,它负责存储计算机启动时必需的固件和基本输入输出系统(BIOS)。ROM的性能和质量对计算机
    的头像 发表于 11-04 10:31 ?1389次阅读

    【小白入门必看】文读懂深度学习计算机视觉技术及学习路线

    、什么是计算机视觉计算机视觉,其实就是教机器怎么像我们人样,用摄像头看看周围的世界,然后理
    的头像 发表于 10-31 17:00 ?1340次阅读
    【小白入门必看】<b class='flag-5'>一</b>文读懂深度学习<b class='flag-5'>计算机</b><b class='flag-5'>视觉</b>技术及学习路线

    计算机接口位于什么之间

    地传输。计算机接口可以分为内部接口和外部接口两大类。 内部接口位于计算机内部各个部件之间,如CPU、内存、主板、硬盘、显卡等。外部接口则位于计算机与外部设备之间,如键盘、鼠标、显示器、打印机等。
    的头像 发表于 10-14 14:02 ?1453次阅读

    计算机存储系统的构成

    计算机存储系统是计算机中用于存放程序和数据的设备或部件的集合,它构成了计算机信息处理的基础。完整的
    的头像 发表于 09-26 15:25 ?2704次阅读

    简述计算机总线的分类

    计算机总线作为计算机系统中连接各个功能部件的公共通信干线,其结构和分类对于理解计算机硬件系统的工作原理至关重要。以下是对计算机总线结构和分类的详细阐述,内容将涵盖总线的基本概念、内部结
    的头像 发表于 08-26 16:23 ?5412次阅读

    晶体管计算机和电子管计算机有什么区别

    晶体管计算机和电子管计算机作为计算机发展史上的两重要阶段,它们在多个方面存在显著的区别。以下是对这两类计算机在硬件、性能、应用以及技术发展
    的头像 发表于 08-23 15:28 ?3844次阅读

    晶体管计算机的诞生和特点

    晶体管计算机的诞生标志着计算机技术的重要里程碑,它不仅推动了计算机硬件的革新,还促进了计算机
    的头像 发表于 08-23 15:06 ?4419次阅读