搜索历史

清空

搜索热词

0

聊天消息
系统消息
评论与回复

查看更多

查看更多

查看更多

VIP于到期续费

登录后你可以

下载海量资料
学习在线课程
观看技术视频
写文章/发帖/加入社区

会员中心

创作中心

发布

创作活动

完善资料让更多小伙伴认识你，还能领取20积分哦，立即完善>

3天内不再提示

卷积神经网络的发展及各模型的优缺点

前言

在CV领域，我们需要熟练掌握最基本的知识就是各种卷积神经网络CNN的模型架构，不管我们在图像分类或者分割，目标检测，NLP等，我们都会用到基本的CNN网络架构。

CNN从最初的2012年AlexNet横空出世到2014年VGG席卷世界以及2015年ResNet奠定了该领域的霸主地位，网络模型变得越变越深，而且也得到证明，越深的网络拟合效果越好，但网络相应的参数量计算量都极速增加，不利于技术的推广和应用。

因此，一些轻量级的网络结构也慢慢随之出现，比如MobileNet系列，ShuffleNet系列，以及ResNext、DenseNet、EfficenceNet等模型，他们都互相吸取彼此的优点，不但降低了参数量或者计算量，同时分类精度更高，因而受到了更多的关注。接下来我们就对CNN的各种网络结构以及他们的优缺点进行一次详细的解读！

AlexNet(2012)

1、增加了relu非线性激活函数，增强了模型的非线性表达能力。成为以后卷积层的标配。

2、dropout层防止过拟合，成为以后fc层的标配。

3、通过数据增强，来减少过拟合。

4、引入标准化层（Local Response Normalization）:通过放大那些对分类贡献较大的神经元，抑制那些对分类贡献较小的神经元，通过局部归一的手段，来达到作用。

VGG(2014)

论文的主要创新点在于：

1、用3x3小卷积核代替了5x5或者7x7的卷积核 2、基于ALexnet加深了网络深度,证明了更深的网络，能更好的提取特征。

GoogleNet(2014)

在设计网络结构时，不仅仅考虑网络的深度，也会考虑网络的宽度，并将这种结构定义为Inception结构。

1、引入1x1卷积的主要目的是为了减少维度，还用于修正线性激活（ReLU）

2、网络最后采用了average pooling（平均池化）来代替全连接层

后面的Inception v2/v3都是基于v1的这种方法在扩展，主要目标有：

1、参数量降低，计算量减少。

2、网络变深，网络非线性表达能力更强

ResNet(2015)

问题：

1、增加深度带来的首个问题就是梯度爆炸/消散的问题，这是由于随着层数的增多，在网络中反向传播的梯度会随着连乘变得不稳定，变得特别大或者特别小。这其中经常出现的是梯度消散的问题。

2、为了克服梯度消散也想出了许多的解决办法，如使用BatchNorm，将激活函数换为ReLu，使用Xaiver初始化等，可以说梯度消散已经得到了很好的解决

已知有网络degradation的情况下，不求加深度能提高准确性，能不能至少让深度网络实现和浅层网络一样的性能，即让深度网络后面的层至少实现恒等映射的作用，根据这个想法，作者提出了residual模块来帮助网络实现恒等映射。

ResNet的设计特点：

1、核心单元模块化，可进行简单堆叠。 2、Shortcut方式解决网络梯度消失问题。 3、Average Pooling层代替fc层。 4、引入BN层加快网络训练速度和收敛时的稳定性。 5、加大网络深度，提高模型的特征抽取能力。

MobileNet v1

谷歌在2017年提出专注于移动端或者嵌入式设备中的轻量级CNN网络：MobileNet。最大的创新点是深度可分离卷积。

通过将标准卷积分解为深度卷积核逐点卷积，能够显著的降低参数量和计算量。引入Relu6激活函数。

参数量计算量的计算:

网络结构如下：

MobileNet v2

改进点主要有以下几个方面：

1、引入残差结构，先升维再降维，增强梯度的传播，显著减少推理期间所需的内存占用

Inverted Residuals：

残差模块：输入首先经过1x1的卷积进行压缩，然后使用3x3的卷积进行特征提取，最后在用1x1的卷积把通道数变换回去。整个过程是“压缩-卷积-扩张”。这样做的目的是减少3x3模块的计算量，提高残差模块的计算效率。

倒残差模块：输入首先经过1x1的卷积进行通道扩张，然后使用3x3的depthwise卷积，最后使用1x1的pointwise卷积将通道数压缩回去。整个过程是“扩张-卷积-压缩”。

对低维度做ReLU运算，很容易造成信息的丢失。而在高维度进行ReLU运算的话，信息的丢失则会很少。

Linear Bottleneck:

这个模块是为了解决一开始提出的那个低维-高维-低维的问题，即将最后一层的ReLU6替换成线性激活函数，而其他层的激活函数依然是ReLU6。

MobileNet v3

V3结合了V1的深度可分离卷积，V2的Inverted Residuals 和 Linear Bottleneck，以及加入SE模块、利用NAS（神经结构的搜索）来搜索网络参数。

互补搜索技术 —— NAS & NetAdapt

h-swish激活函数

out = F.relu6(x + 3., self.inplace) / 6. return out * x

改进一：下图是MobileNet-v2的整理模型架构，可以看到，网络的最后部分首先通过1x1卷积映射到高维，然后通过GAP收集特征，最后使用1x1卷积划分到K类。所以其中起抽取特征作用的是在7x7分辨率上做1x1卷积的那一层。

而V3是先进行池化然后再进行1x1卷积提取特征，V2是先1X1卷积提取特征再池化。

ShuffleNet

组卷积

Group convolution是将输入层的不同特征图进行分组，然后采用不同的卷积核再对各个组进行卷积，这样会降低卷积的计算量。

因为一般的卷积都是在所有的输入特征图上做卷积，可以说是全通道卷积，这是一种通道密集连接方式（channel dense connection），而group convolution相比则是一种通道稀疏连接方式（channel sparse connection）。

depthwise convolution，这是一种比较特殊的group convolution，此时分组数恰好等于通道数，意味着每个组只有一个特征图。

分组卷积的会带来一个矛盾就是特征通信。group convolution层另一个问题是不同组之间的特征图需要通信。所以MobileNet等网络采用密集的1x1 pointwise convolution，因为要保证group convolution之后不同组的特征图之间的信息交流。

为达到特征通信目的，我们不采用dense pointwise convolution，考虑其他的思路：channel shuffle

ShuffleNet的核心是采用了两种操作：pointwise group convolution和channel shuffle，这在保持精度的同时大大降低了模型的计算量。其基本单元则是在一个残差单元的基础上改进而成。

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

cnn

cnn

+关注

关注
3

文章
354

浏览量
22783
卷积神经网络

卷积神经网络

+关注

关注
4

文章
369

浏览量
12343
resnet

resnet

+关注

关注
0

文章
13

浏览量
3328

原文标题：卷积神经网络的发展及各模型的优缺点

文章出处：【微信号：vision263com，微信公众号：新机器视觉】欢迎添加关注！文章转载请注明出处。

评论

新机器视觉
专栏

0 文章 0 阅读 0 粉丝 0 点赞

关注个人主页

Hot 国内外传感器知名制造商 Top 100
Hot 世界上第一台工业机器人的前世今生

New 激光雷达SLAM:全面掌握同步定位与地图构建指南
New YOLOv10自定义目标检测之理论+实践

精选推荐
更多

文章

资料

帖子

基于DE1-SOC开发板的太空射击游戏

友晶FPGA
44分钟前

101 阅读

电源噪声的来源与应对策略

巨霖
46分钟前

111 阅读

RT-Thread 遇上 Rust：安全内核 RusT-Thread 的诞生

RT-Thread官方账号
2天前

108 阅读

一文详解高速模数转换器的奈奎斯特规则

德州仪器
1小时前

189 阅读

基于英飞凌产品的空调外机变频控制解决方案

骏龙电子
1小时前

189 阅读

Nokia N95手机使用说明书

大彭
3980

10积分

203下载

Ghostery浏览器隐私跟踪插件

jefljel
3.86 MB

2积分

2下载

real-edit多用户协作编辑平台

糖栗子
31.49 MB

免费

0下载

SimH历史计算机模拟器

李林
30.85 MB

2积分

1下载

多功能Arduino机器人

学电超人
0.02 MB

免费

0下载

【RA4L1-SENSOR】SLCD测电压+串口显示

jf_92172866
11小时前

75 阅读

NVMe高速传输之摆脱XDMA设计之12：PCIe请求模块设计（上）

xianuser2012
1天前

141 阅读

【VisionFive 2单板计算机试用体验】二维码检测与解码

yinwuqing
5天前

221 阅读

【创龙TL3562-MiniEVM开发板试用体验】6、mosquitto实现MQTT

jf_01200635
1天前

114 阅读

电源电路焊接上单片机后电压异常，看看这是什么问题？

jf_56940081
3天前

2117 阅读

推荐专栏
更多

企业产品

资料

方案
更多

abg欧博（原“华强聚丰”）：

电子发烧友

abg欧博开发

abg欧博电路(原"华强PCB")

abg欧博商城(原"华强芯城")

abg欧博智造

My ElecFans

APP
网站地图

设计技术

可编程逻辑

电源/新能源

MEMS/传感技术

测量仪表

嵌入式技术

制造/封装

模拟技术

RF/无线

接口/总线/驱动

处理器/DSP

EDA/IC设计

存储技术

光电显示

EMC/EMI设计

连接器

行业应用

LEDs

汽车电子

音视频及家电

通信网络

医疗电子

人工智能

虚拟现实

可穿戴设备

机器人

安全设备/系统

军用/航空电子

移动通信

工业控制

便携设备

触控感测

物联网

智能电网

区块链

新科技

特色内容

专栏推荐

学院

设计资源

设计技术

电子百科

电子视频

元器件知识

工具箱

VIP会员

最新技术文章

产品地图

品牌地图

社区

小组

论坛

问答

评测试用

企业服务

产品

资料

文章

方案

企业

供应链服务

硬件开发

abg欧博电路

abg欧博商城

abg欧博智造

nextPCB

BOM配单

媒体服务

网站广告

在线研讨会

活动策划

新闻发布

新品发布

小测验

设计大赛

abg欧博

关于我们

投资关系

新闻动态

加入我们

联系我们

举报投诉

社交网络

微博

移动端

发烧友APP

硬声APP

WAP

联系我们

广告合作

王婉珠：wangwanzhu@elecfans.com

内容合作

黄晶晶：huangjingjing@elecfans.com

内容合作（海外）

张迎辉：mikezhang@elecfans.com

供应链服务 PCB/IC/PCBA

江良华：lanhu@huaqiu.com

投资合作

曾海银：zenghaiyin@huaqiu.com

社区合作

刘勇：liuyong@huaqiu.com

关注我们的微信

下载发烧友APP

电子发烧友观察

电子工程师社区

1-32层PCB打样·中小批量

元器件现货·全球代购·SmartBOM

SMT贴片·PCBA加工

PCB Manufacturer

abg欧博简介

企业动态

联系我们

企业文化

企业宣传片

加入我们

版权所有 ? 湖南abg欧博数字科技有限公司

长沙市望城经济技术开发区航空路6号手机智能终端产业园2号厂房3层（0731-88081133）
电子发烧友 （电路图） 湘公网安备43011202000918 工商网监湘ICP备2023018690号-1