资料介绍
在过去几年里,许多计算机视觉相关的深度学习的发展,都可以归结于少数几个神经网络架构。抛开所有关于数学、代码和实现的细节,来探索一个简单的问题:这些模型如何工作以及为什么工作?
在撰写这篇文章时,Keras 库(http://suo.im/4aLGEd)中已经涵盖了6种预训练模型,分别是:
VGG16
VGG19
ResNet50
Inception v3
Xception
MobileNet
▍VGG
VGG网络和从2012年早期的 AlexNet 网络一样,遵循着现有卷积网络的典型布局:在最终的全连接分类层(fully-connected classification layers)之前,由一系列的卷积层(convolutional layers),最大池化层(max-pooling layers)和激活层(activation layers)构成。
MobileNet 本质上是 Xception 架构,针对移动应用而优化的线性版本。剩下的三种架构则真正重新定义了我们看待深度网络的方式。
这篇文章接下来的部分将侧重于ResNet,Inception和Xception三种架构的直观理解,以及为什么它们成为计算机视觉中许多后续工作的基石。
▍ResNet
为什么深度网络在不断增加层的时候,表现反而变的更差?
直观来想, 更深层次的网络,应该不比较浅的网络表现的差,至少在训练的时候应该这样(这时没有过拟合over-fitting的风险)。
让我们作一个思维实验,假设我们已经建立了一个n层的网络,达到了一定的准确性。 如果仅通过复制相同的前n个层并对最后一层执行单位映射,则n + 1层的网络至少应该能够获得完全相同的精度。
类似地,n + 2,n + 3和n + 4层的网络都可以继续执行单位映射并获得相同的准确性。 然而,实际上,这些更深层的网络在性能上几乎都会有所下降。
ResNet的作者将这些问题归结为一个假设:直接映射难以学习。
他们提出了一个解决办法:用学习 x到 H(x) 两者之间的差异,或者“残差”的方式,替代尝试学习从x到 H(x) 的底层映射。这样,我们就可以可以通过输入残差来计算 H(x) 。
假设我们用 F(x)=H(x)-x 来表示残差。 ResNet 网络现在不是试图直接学习 H(x) , 而是学习 F(x)+x。
这引出了你可能知道的著名的ResNet(或“残差网络”)模块:
ResNet中的每个“模块”都由一系列层和一个“捷径”连接,捷径连接将模块的输入值直接添加到其输出值。 “添加”操作以元素对应方式执行,如果输入和输出的大小不同,可以使用补零法(zero-padding)或投影(通过1x1卷积)匹配尺寸。
回到我们的思维实验,捷径连接大大简化了我们对单位层的构建。 直观的看,学习将 F(x) 推到0并将输出值保留为x比从头开始学习单位交换(identity transformation)要容易得多。 一般情况下,ResNet为层提供了一个“参考”点—x—来开始学习。
这个想法在实践中效果惊人。在此之前,深度神经网络经常遇到梯度消失(vanishing gradients)的问题,来自误差函数的梯度信号随着它们向较早层反向传播而呈指数下降。
从本质上说,当误差信号一直传到到早期层时,它们已经小到网络无法进行学习了。然而,由于ResNet中的梯度信号可以通过捷径连接直接返回到早期层,突然间我们就可以建立 50层,101层,152层,甚至(想当然)1000+层的网络,而它们仍然表现良好。用22层的网络赢得了2014年ILSVRC挑战,这在当时是一个巨大的技术飞跃。
- 网络架构的时钟系统——设计与验证
- 改进的多尺度深度网络手势识别模型 8次下载
- 基于深度级联孪生网络的通信信号调制识别算法 33次下载
- 采用自监督CNN进行单图像深度估计的方法 13次下载
- 深度:嵌入式系统的软件架构设计!资料下载
- 基于预训练模型和长短期记忆网络的深度学习模型 19次下载
- 3小时学习神经网络与深度学习课件下载 0次下载
- 结合注意力机制的改进深度学习光流网络 4次下载
- 基于深度神经网络的图像语义分割方法 11次下载
- 基于深度信念网络的实体识别算法 16次下载
- 综述深度神经网络的解释方法及发展趋势 19次下载
- 一种基于多视图架构的深度卷积神经网络模型 5次下载
- 一种多层级特征融合就的深度卷积网络 7次下载
- 基于深度神经网络的文本分类分析 37次下载
- deepid3:非常深的神经网络的人脸识别深度算法的网络架构 25次下载
- 残差网络是深度神经网络吗 1150次阅读
- 深度神经网络(DNN)架构解析与优化策略 2064次阅读
- 神经网络架构有哪些 809次阅读
- 详解深度学习、神经网络与卷积神经网络的应用 2239次阅读
- 深度ReLU网络的对应浅层网络 582次阅读
- 神经网络的DBN与GAN及RNN等形象的详细资料讲解 5068次阅读
- 深度神经网络的实现机理与决策逻辑难以理解 2992次阅读
- 数据集,网络架构和剪枝方法 5948次阅读
- 浅析深度学习的原理及其架构 6517次阅读
- 如何理解深度学习?深度学习的理论探索分析 3706次阅读
- 基于Unrolling的深度方法及应用 5147次阅读
- 采用的网络架构,实现了基于图像强度的变分深度自编码器 6256次阅读
- 百度发布Visual DL 使得深度学习任务变得生动形象,实现可视分析 4897次阅读
- 斯坦福探索深度神经网络可解释性 决策树是关键 4401次阅读
- 详细剖析神经网络和深度神经网络的区别 3.2w次阅读
下载排行
本周
- 1常用电子元器件集锦
- 1.72 MB | 24485次下载 | 免费
- 2ssd1306单片 CMOS OLED/PLED 驱动芯片中文手册
- 1.66 MB | 4次下载 | 1 积分
- 3低压降肖特基整流管SR340L数据手册
- 0.78 MB | 2次下载 | 免费
- 4高压MOS管MDD12N65F/MDD12N65P数据手册
- 2.36 MB | 2次下载 | 免费
- 5FP6195 60V、800mA、480KHz异步降压转换器规格书
- 0.88 MB | 2次下载 | 免费
- 6CPCI6310型复合视频采集板资料
- 0.04 MB | 1次下载 | 免费
- 7STM32F10xxx参考手册
- 13.64 MB | 1次下载 | 1 积分
- 8PC2456高压浪涌抑制器控制器数据手册
- 3.03 MB | 1次下载 | 免费
本月
- 1常用电子元器件集锦
- 1.72 MB | 24485次下载 | 免费
- 2三相逆变主电路的原理图和PCB资料合集免费下载
- 27.35 MB | 111次下载 | 1 积分
- 3运算放大器基本电路中文资料
- 1.30 MB | 16次下载 | 免费
- 4苹果iphone 11电路原理图
- 4.98 MB | 12次下载 | 5 积分
- 5常用电子元器件介绍
- 3.21 MB | 10次下载 | 免费
- 6EMC电路设计工程师必备的EMC基础
- 0.42 MB | 6次下载 | 2 积分
- 7相关协议信号总结
- 0.94 MB | 4次下载 | 免费
- 8ssd1306单片 CMOS OLED/PLED 驱动芯片中文手册
- 1.66 MB | 4次下载 | 1 积分
总榜
- 1matlab软件下载入口
- 未知 | 935130次下载 | 10 积分
- 2开源硬件-PMP21529.1-4 开关降压/升压双向直流/直流转换器 PCB layout 设计
- 1.48MB | 420064次下载 | 10 积分
- 3Altium DXP2002下载入口
- 未知 | 233089次下载 | 10 积分
- 4电路仿真软件multisim 10.0免费下载
- 340992 | 191390次下载 | 10 积分
- 5十天学会AVR单片机与C语言视频教程 下载
- 158M | 183345次下载 | 10 积分
- 6labview8.5下载
- 未知 | 81591次下载 | 10 积分
- 7Keil工具MDK-Arm免费下载
- 0.02 MB | 73816次下载 | 10 积分
- 8LabVIEW 8.6下载
- 未知 | 65989次下载 | 10 积分
评论