0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

图文详解:神经网络的激活函数

如意 ? 来源: 人工智能遇见磐创 ? 作者: 人工智能遇见磐创 ? 2020-07-05 11:21 ? 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

什么是神经网络激活函数?

激活函数有助于决定我们是否需要激活神经元。如果我们需要发射一个神经元那么信号的强度是多少。

激活函数是神经元通过神经网络处理和传递信息的机制

为什么在神经网络中需要一个激活函数?

图文详解:神经网络的激活函数

在神经网络中,z是输入节点与节点权值加上偏差的乘积。z的方程与线性方程非常相似,取值范围从+∞到-∞

图文详解:神经网络的激活函数

如果神经元的值可以从负无穷到正无穷变化,那么我们就无法决定是否需要激活神经元。这就是激活函数帮助我们解决问题的地方。

如果z是线性的,那么我们就不能解决复杂的问题。这是我们使用激活函数的另一个原因。

有以下不同类型的激活函数

阀值函数或阶梯激活函数

Sigmoid

Softmax

Tanh或双曲正切

ReLU

Leaky ReLU

为什么我们需要这么多不同的激活函数,我怎么决定用哪一个呢?

让我们回顾一下每一个激活函数,并了解它们的最佳使用位置和原因。这将帮助我们决定在不同的场景中使用哪个激活函数。

阀值函数或阶梯激活函数

图文详解:神经网络的激活函数

这是最简单的函数

如果z值高于阈值,则激活设置为1或yes,神经元将被激活。

如果z值低于阈值,则激活设置为0或no,神经元不会被激活。

它们对二分类很有用。】

Sigmoid激活函数

图文详解:神经网络的激活函数

Sigmoid函数是一种光滑的非线性函数,无扭结,形状类似于S形。

它预测输出的概率,因此被用于神经网络和逻辑回归的输出层。

由于概率范围在0到1之间,所以sigmoid函数值存在于0到1之间。

但是如果我们想分类更多的是或不是呢?如果我想预测多个类,比如预测晴天、雨天或阴天,该怎么办?

Softmax激活有助于多类分类

Softmax激活函数

Sigmoid激活函数用于两类或二类分类,而softmax用于多类分类,是对Sigmoid函数的一种推广。

在softmax中,我们得到了每个类的概率,它们的和应该等于1。当一个类的概率增大时,其他类的概率减小,因此概率最大的类是输出类。

例如:在预测天气时,我们可以得到输出概率,晴天为0.68,阴天为0.22,雨天为0.20。在这种情况下,我们以最大概率的输出作为最终的输出。在这种情况下我们预测明天将是晴天。

Softmax计算每个目标类的概率除以所有可能的目标类的概率。

图文详解:神经网络的激活函数

双曲正切或Tanh激活函数

图文详解:神经网络的激活函数

对于双曲tanh函数,输出以0为中心,输出范围在-1和+1之间。

看起来很像Sigmoid。实际上双曲tanh是缩放的s形函数。与Sigmoid相比,tanh的梯度下降作用更强,因此比Sigmoid更受欢迎。

tanh的优点是,负输入将被映射为强负,零输入将被映射为接近零,这在sigmoid中是不会发生的,因为sigmoid的范围在0到1之间

ReLU

图文详解:神经网络的激活函数

ReLU本质上是非线性的,这意味着它的斜率不是常数。Relu在0附近是非线性的,但斜率不是0就是1,因此具有有限的非线性。

范围是从0到∞

当z为正时,ReLU的输出与输入相同。当z为0或小于0时,输出为0。因此,当输入为0或低于0时,ReLU会关闭神经元。

所有的深度学习模型都使用Relu,但由于Relu的稀疏性,只能用于隐含层。稀疏性指的是空值或“NA”值的数量。

当隐层暴露于一定范围的输入值时,RELU函数将导致更多的零,从而导致更少的神经元被激活,这将意味着更少的神经网络交互作用。

ReLU比sigmoid或tanh更积极地打开或关闭神经元

Relu的挑战在于,负值变为零降低了模型正确训练数据的能力。为了解决这个问题,我们有Leaky ReLU

Leaky ReLU

图文详解:神经网络的激活函数

a的值通常是0.01

在Leaky ReLU中,我们引入了一个小的负斜率,所以它的斜率不是0。这有助于加快训练。

Leaky ReLU的范围从-∞到+∞

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 神经网络
    +关注

    关注

    42

    文章

    4815

    浏览量

    104617
  • 函数
    +关注

    关注

    3

    文章

    4388

    浏览量

    65404
  • 神经元
    +关注

    关注

    1

    文章

    368

    浏览量

    18927
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    BP神经网络与卷积神经网络的比较

    BP神经网络与卷积神经网络在多个方面存在显著差异,以下是对两者的比较: 一、结构特点 BP神经网络 : BP神经网络是一种多层的前馈神经网络
    的头像 发表于 02-12 15:53 ?866次阅读

    BP神经网络的实现步骤详解

    BP神经网络的实现步骤主要包括以下几个阶段:网络初始化、前向传播、误差计算、反向传播和权重更新。以下是对这些步骤的详细解释: 一、网络初始化 确定网络结构 : 根据输入和输出数据的特性
    的头像 发表于 02-12 15:50 ?789次阅读

    BP神经网络的优缺点分析

    BP神经网络(Back Propagation Neural Network)作为一种常用的机器学习模型,具有显著的优点,同时也存在一些不容忽视的缺点。以下是对BP神经网络优缺点的分析: 优点
    的头像 发表于 02-12 15:36 ?1102次阅读

    什么是BP神经网络的反向传播算法

    BP神经网络的反向传播算法(Backpropagation Algorithm)是一种用于训练神经网络的有效方法。以下是关于BP神经网络的反向传播算法的介绍: 一、基本概念 反向传播算法是BP
    的头像 发表于 02-12 15:18 ?923次阅读

    BP神经网络与深度学习的关系

    BP神经网络与深度学习之间存在着密切的关系,以下是对它们之间关系的介绍: 一、BP神经网络的基本概念 BP神经网络,即反向传播神经网络(Backpropagation Neural N
    的头像 发表于 02-12 15:15 ?1026次阅读

    BP神经网络的基本原理

    输入层、隐藏层和输出层组成。其中,输入层负责接收外部输入数据,这些数据随后被传递到隐藏层。隐藏层是BP神经网络的核心部分,它可以通过一层或多层神经元对输入数据进行加权求和,并通过非线性激活函数
    的头像 发表于 02-12 15:13 ?1084次阅读

    如何训练BP神经网络模型

    BP(Back Propagation)神经网络是一种经典的人工神经网络模型,其训练过程主要分为两个阶段:前向传播和反向传播。以下是训练BP神经网络模型的步骤: 一、前向传播 前向传播是信号在
    的头像 发表于 02-12 15:10 ?1065次阅读

    深度学习入门:简单神经网络的构建与实现

    神经网络。 首先,导入必要的库: 收起 python ? import numpy as np ? 定义激活函数 Sigmoid: 收起 python ? def sigmoid(x): return 1
    的头像 发表于 01-23 13:52 ?617次阅读

    人工神经网络的原理和多种神经网络架构方法

    在上一篇文章中,我们介绍了传统机器学习的基础知识和多种算法。在本文中,我们会介绍人工神经网络的原理和多种神经网络架构方法,供各位老师选择。 01 人工神经网络 ? 人工神经网络模型之所
    的头像 发表于 01-09 10:24 ?1472次阅读
    人工<b class='flag-5'>神经网络</b>的原理和多种<b class='flag-5'>神经网络</b>架构方法

    一文详解物理信息神经网络

    物理信息神经网络 (PINN) 是一种神经网络,它将微分方程描述的物理定律纳入其损失函数中,以引导学习过程得出更符合基本物理定律的解。
    的头像 发表于 12-05 16:50 ?9216次阅读
    一文<b class='flag-5'>详解</b>物理信息<b class='flag-5'>神经网络</b>

    卷积神经网络与传统神经网络的比较

    在深度学习领域,神经网络模型被广泛应用于各种任务,如图像识别、自然语言处理和游戏智能等。其中,卷积神经网络(CNNs)和传统神经网络是两种常见的模型。 1. 结构差异 1.1 传统神经网络
    的头像 发表于 11-15 14:53 ?2083次阅读

    RNN模型与传统神经网络的区别

    神经网络是机器学习领域中的一种强大工具,它们能够模拟人脑处理信息的方式。随着技术的发展,神经网络的类型也在不断增加,其中循环神经网络(RNN)和传统神经网络(如前馈
    的头像 发表于 11-15 09:42 ?1340次阅读

    LSTM神经网络的结构与工作机制

    LSTM(Long Short-Term Memory,长短期记忆)神经网络是一种特殊的循环神经网络(RNN),设计用于解决长期依赖问题,特别是在处理时间序列数据时表现出色。以下是LSTM神经网络
    的头像 发表于 11-13 10:05 ?1788次阅读

    关于卷积神经网络,这些概念你厘清了么~

    神经元都是输入的线性变换——将输入乘以数字(权重w)并加上一个常数(偏置b),然后通过一个固定的非线性函数产生输出,该函数也被称为激活函数
    发表于 10-24 13:56

    matlab 神经网络 数学建模数值分析

    matlab神经网络 数学建模数值分析 精通的可以讨论下
    发表于 09-18 15:14