0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

比CNN表现更好,CV领域全新卷积操作OctConv厉害在哪里?

电子工程师 ? 来源:YXQ ? 2019-04-24 11:35 ? 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

CNN卷积神经网络问世以来,在计算机视觉领域备受青睐,与传统的神经网络相比,其参数共享性和平移不变性,使得对于图像的处理十分友好,然而,近日由Facebook AI、新家坡国立大学、360人工智能研究院的研究人员提出的一种新的卷积操作OctConv使得在图像处理性能方面得到了重大突破与提升,OctConv和CNN中的卷积有什么不同呢?

论文下载地址:

https://arxiv.org/pdf/1904.05049.pdf

CNN网络中的卷积层主要用来提取图像特征,如下图所示,利用卷积核(也称滤波器)对输入图像的每个像素进行卷积操作得到特征图,由于图像中相邻像素的特征相似性,卷积核横扫每个位置,独立的存储自己的特征描述符,忽略空间上的一致性,使得特征图在空间维度上存在大量的冗余。

图1 普通卷积操作示意图

OctConv主要基于于处理多空间频率的特征映射并减少空间冗余的问题提出的。

原文地址:

https://export.arxiv.org/pdf/1904.05049

下面文摘菌将从论文的四个部分展开对OctConv原理的阐述。

Why?—OctConv之诞生

文章摘要(Abstract)部分指出,在自然图像中,信息以不同的频率传输,其中高频率通常以细节进行编码,而较低频率通常以总体结构进行编码,同理卷积层的输出可以看做不同频率的信息混合,在论文中,研究者提出通过频率对特征融合图进行分解,并设计出了一种新的Octave卷积(OctConv)操作,旨在存储和处理在空间上变化缓慢的较低分辨率的特征图,从而降低内存和计算成本。与现存的多尺度方法不同,OctConv是一种单一、通用、即插即用的卷积单元,可以直接代替普通卷积,而无需调整网络结构。

OctConv与那些用于构建更优拓扑或者减少分组或深度卷积中信道冗余的方法是正交和互补的。

实验表明,通过使用OctConv替代普通卷积,能很好的提高语音和图像识别任务中的精度,同时降低内存和计算成本,一个配备有OctConv的ResNet-152能够以仅仅22.2 GFLOP在ImageNet数据集上达到82.5%的top-1分类准确率。

What?—初探OctConv

论文Introduction(介绍)部分基于CNN现存的空间维度冗余问题引出了下图:

图2 论文思路阐述图

(a)动机:研究表明,自然图像可以分解为低空间频率和高空间频率两部分;

(b)卷积层的输出图也可以根据空间频率进行分解和分组;

(c)所提出的多频特征表示将平滑变化的低频映射存储字低分辨率张量中,以减少空间冗余;

(d)所提出的OctConv直接作用于这个表示。它会更新每个组的信息,并进一步支持组之间的信息交换。

具体解释为:如图 2(a) 所示,自然图像可以分解为描述平稳变化结构的低空间频率分量和描述快速变化的精细细节的高空间频率分量。类似地,我们认为卷积层的输出特征映射也可以分解为不同空间频率的特征,并提出了一种新的多频特征表示方法,将高频和低频特征映射存储到不同的组中,如图 2(b) 所示。因此,通过相邻位置间的信息共享,可以安全地降低低频组的空间分辨率,减少空间冗余,如图 2(c) 所示。

How?—再探OctConv

论文Method(方法)部分:octave feature 减少了空间冗余,比原始表示更加紧凑。然而,由于输入特征的空间分辨率不同,传统卷积不能直接对这种表示进行操作。避免这个问题的一种简单方法是将低频部分上采样到原始的空间分辨率,将它与连接起来,然后进行卷积,这将导致额外的计算和内存开销。为了充分利用紧凑的多频特征表示,我们提出 Octave Convolution,它可以直接在分解张量X={XH,XL}上运行,而不需要任何额外的计算或内存开销。

Octave Convolution的设计目标是有效地处理相应张量中的低频和高频分量,同时使得Octave特征表示的高频分量和低频分量之间能够有效通信。设X,Y为分解输入和输出张量,那么输出的高频和低频信号将由下式给出:

其中H→H,L→L表示自身的更新,L→H,H→L表示高频与低频分量之间的通信,如图3所示绿色箭头表示信息更新,红色箭头表示两个频率之间的信息交换。

图3 Octave Convolution示意图

同理,我们将卷积核分解为高频和低频W={WH,WL},WH=WH→H+WL→H;WL=WL→L+WH→L,如图4所示:

图3 Octave Convolution kernel示意图

对于低频特征所使用的低频所占比例a的不同,当a=0时(即没有低频成分),OctConv就会退化为普通卷积。经过实验评估k×k Octave 卷积核与普通卷积核等价,即二者具有完全相同的参数量。

To do—Just do it

论文的实验部分:研究人员验证了提出的Octave卷积对于2D和3D网络的效能和效率,首先展示了ImageNet图像分类的控制变量研究,然后将其与当前最优的方法进行了比较。之后研究人员使用Kinetics-400和Kinetics-600数据集,展示了提出的OctConv也适用于3D CNN。

图4 ImageNet上的控制变量结果图

上表为论文中的表8,视频中的动作识别、控制变量研究结果统计。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 计算机视觉
    +关注

    关注

    9

    文章

    1710

    浏览量

    46883
  • cnn
    cnn
    +关注

    关注

    3

    文章

    354

    浏览量

    22781

原文标题:比CNN表现更好,CV领域全新卷积操作OctConv厉害在哪里?

文章出处:【微信号:BigDataDigest,微信公众号:大数据文摘】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    请问USB2CAN驱动程序在哪里

    USB2CAN驱动程序在哪里?它没有像说明书中所说的那样附带 SSCB 演示 GUI。CH341SER.exe 在哪里?我在您令人沮丧的支持网站上找不到它。我无法连接到我的 REF_SSCB_AC_DC_1PH_SiC
    发表于 07-24 07:09

    自动驾驶感知系统中卷积神经网络原理的疑点分析

    背景 卷积神经网络(Convolutional Neural Networks, CNN)的核心技术主要包括以下几个方面:局部连接、权值共享、多卷积核以及池化。这些技术共同作用,使得CNN
    的头像 发表于 04-07 09:15 ?393次阅读
    自动驾驶感知系统中<b class='flag-5'>卷积</b>神经网络原理的疑点分析

    STMHAL库的USB每次插拔时识别位置在哪里

    STMHAL库的USB每次插拔时识别位置在哪里
    发表于 03-07 14:00

    如何使用MATLAB实现一维时间卷积网络

    本文对一维卷积操作进行介绍,包括一维扩展卷积和一维因果卷积,以及 MATLAB 对一维卷积的支持情况。在最后通过一个实例演示如何在 MATL
    的头像 发表于 03-07 09:15 ?1155次阅读
    如何使用MATLAB实现一维时间<b class='flag-5'>卷积</b>网络

    人工智能的下一站在哪里

    DeepSeek的爆发进一步推动了AI行业的发展速度,这让人们不得不想象AI的下一站在哪里?维智科技所深耕的时空大模型与AI发展的逻辑轨迹又是如何联系的?
    的头像 发表于 02-14 10:27 ?507次阅读

    BP神经网络与卷积神经网络的比较

    多层。 每一层都由若干个神经元构成,神经元之间通过权重连接。信号在神经网络中是前向传播的,而误差是反向传播的。 卷积神经网络(CNN) : CNN主要由卷积层、池化层和全连接层组成。
    的头像 发表于 02-12 15:53 ?728次阅读

    AI模型部署边缘设备的奇妙之旅:目标检测模型

    通道数时表现更好。 2.3 神经网络的相关知识点 2.3.1 卷积的基本概念 卷积是一种数学运算,在计算机视觉中被广泛应用于特征提取。它通过一个小型矩阵(称为
    发表于 12-19 14:33

    卷积神经网络的参数调整方法

    卷积神经网络因其在处理具有空间层次结构的数据时的卓越性能而受到青睐。然而,CNN的成功很大程度上依赖于其参数的合理设置。参数调整是一个复杂的过程,涉及到多个超参数的选择和优化。 网络架构参数 卷积
    的头像 发表于 11-15 15:10 ?1269次阅读

    卷积神经网络的基本原理与算法

    卷积神经网络(Convolutional Neural Networks,CNN)是一类包含卷积计算且具有深度结构的前馈神经网络(Feedforward Neural Networks,FNN
    的头像 发表于 11-15 14:47 ?1846次阅读

    智慧灯杆到底“智慧”在哪里?条形智能为您专业解读 AI灯杆屏

    智慧灯杆到底“智慧”在哪里?条形智能为您专业解读 AI灯杆屏
    的头像 发表于 11-14 13:51 ?683次阅读
    智慧灯杆到底“智慧”<b class='flag-5'>在哪里</b>?条形智能为您专业解读 AI灯杆屏

    关于卷积神经网络,这些概念你厘清了么~

    许多种类型,但本文将只关注卷积神经网络(CNN),其主要应用领域是对输入数据的模式识别和对象分类。CNN是一种用于深度学习的 人工神经网络 。这种网络由输入层、若干
    发表于 10-24 13:56

    高斯滤波的卷积核怎么确定

    N为一个奇数,如3、5、7等。奇数大小的卷积核有助于确定一个中心像素点,便于计算。 大小选择 :卷积核的大小决定了滤波器的范围。较大的卷积核可以覆盖更多的像素点,从而更好地平滑图像,但
    的头像 发表于 09-29 09:29 ?1778次阅读

    贴片电容与贴片电阻的本质差异在哪里

    贴片电容与贴片电阻的本质差异在哪里
    的头像 发表于 08-27 15:51 ?833次阅读
    贴片电容与贴片电阻的本质差异<b class='flag-5'>在哪里</b>?

    服务器可以用在哪领域

    服务器可以用在哪领域呢?
    的头像 发表于 08-26 11:09 ?994次阅读

    凯茉锐电子SONY FCB-CV7520机芯在无人机航拍方面的应用表现

    的性能参数,在多个维度上重新定义了航拍体验,为安防监控、智能交通、乃至无人驾驶飞行设备等领域带来了革命性的变化。以下是对FCB-CV7520在无人机航拍方面应用表现的深入探讨。
    的头像 发表于 08-08 10:25 ?614次阅读