激活函数和最常用的10个激活函数

2023年7月27日上午12:33 • 人工智能 • 阅读 80

1. 什么是激活函数 activation function

激活函数是一种添加到ANN中的函数，它决定了最终要发射给下一个神经元的内容。

在人工神经网络中，一个节点的激活函数 定义了该节点在 给定的输入或输入的集合下的输出。

因此，激活函数是确定神经网络输出的数学方程式。

2. artificial neuron的工作原理

上述过程的数学可视化如下图：

可以看到，每个输入x都有相对应的权值w，相乘后求和，然后加上偏置bias。最后根据激活函数，来决定输出。

; 3. 10种激活函数

1. Sigmoid激活函数

sigmoid的函数图像看起来像s型的曲线，sigmoid的意思也有s型的。

函数图像：

函数表达式：

适合使用sigmoid激活函数的情况：

由于sigmoid函数的输出范围是0-1，所以它对每个神经元的输出都进行了归一化。
用于将预测概率作为输出的模型。因为概率的值就是0-1，所以非常合适。
sigmoid函数梯度平滑，避免跳跃的输出值。
函数是可微的。
明确的预测，即非常接近1或0。

sigmoid函数的缺点：

倾向于梯度消失

补充：梯度不稳定概念：在深度神经网络中的梯度是不稳定的，在靠近输入层的隐藏层中或消失或爆炸。这种不稳定性，才是深度神经网络中基于梯度学习的根本问题。产生的根本原因：神经网络模型的层数过多，以及连乘效应。具体内容见https://zhuanlan.zhihu.com/p/25631496
当x取值为负时，函数值趋近于0。换言之，函数输出不是以0为中心的，这会 降低权重更新的效率。
sigmoid函数执行的是指数运算，计算机运行的速度比较慢。

; 2. Tanh/双曲正切激活函数

函数图像：

函数表达式：

tanh是一个双曲正切函数，它的曲线和sigmoid的曲线相类似，但是相对于sigmoid函数有一些优势。下面是两个函数的图像对比图：

tanh的优势：

首先，当输入较大或较小时，输出几乎是平滑的并且梯度较小，这不利于权重更新。二者的区别在于输出间隔，tanh的输出间隔是1，并且整个函数的输出以0为中心，比sigmoid函数要好。
在tanh中，负输入将被强映射为负，而零输入被映射为接近0。

注意，在一般的二元分类问题(在机器学习中，被认为是监督式学习)中，tanh函数用于隐藏层，而sigmoid函数用于输出层。但这个也不是固定的，具体情况具体对待。

3. ReLU激活函数

全称是Rectified Linear Unit，中文名字：修正线性单元。

函数图像：

函数表达式：

ReLU函数是深度学习中比较流行的一个激活函数，相较于sigmoid和tanh，有以下优点：

当输入为正的时候， 不存在梯度饱和问题。刚才的sigmoid函数和tanh函数就会出现梯度饱和问题，当输入x逐渐变大的时候，输出趋近于同一值，变化很小，造成模型训练缓慢。
计算速度快。ReLU函数是线性关系，sigmoid和tanh是非线性，因此计算速度快得多。

也有缺点：

Dead ReLU问题。当输入为负的时候，relu全为0，直接失效。当然在正向传播中，这不是问题，但是在反向传播过程中，如果输入为负，则梯度将完全为0。sigmoid和tanh也有相同的问题。
ReLU函数不是以0为中心的函数。

; 4. Leaky ReLU激活函数

该激活函数是专门设计用来解决Dead ReLU问题的激活函数。

下面是两者的对比图：

函数表达式：

为什么leaky relu比relu更好呢？

Leaky ReLU 通过把 x 的非常小的线性分量给予负输入（0.01x）来调整负值的零梯度（zero gradients）问题
leak可以扩大relu的范围，通常a的值为0.01左右
leaky relu函数的范围是负无穷 – 正无穷

5. ELU激活函数

ELU的英文全称是”Exponential Linear Units”，中文全称是”指数线性单元”。

看一下ELU、Leaky ReLU、ReLU三者的函数图像：

ELU的出现也解决了ReLU的问题。

与ReLU相比，ELU有负值，这会使激活的平均值接近0。均值接近0可以使学习更快，因为它们使梯度更接近自然梯度。

函数表达式：

显然，ELU具有ReLU的所有优点，并且：

没有Dead ReLU问题，输出的平均值接近0，以0为中心。
ELU通过减少偏置偏移的影响，使正常梯度更接近于单位自然梯度，从而使均值向0加速学习。
ELU当x较小时，会饱和值一个负值，从而减少前向传播的变异和信息。

注意，有一个小问题是，ELU的计算量更大。 与Leaky ReLU相似，尽管理论上比ReLU更好，但是目前的实践并没有充分的证据表示确实比ReLU好。

; 6. PReLU激活函数

全称：parametric ReLU

主要特点就是这里的参数a是可变的，通常为0-1之间的数字，并且通常相对较小。

如果参数a = 0，则就是ReLU。
如果参数a > 0，则就是Leaky ReLU。
如果参数a是可学习的参数，则就是PReLU.

优点：

在负值域，PReLU的斜率较小，可以避免Dead ReLU问题。
与ELU相比，PReLU在负值域是线性运算。

7. Softmax激活函数

函数图像：

Softmax是用于多类分类问题的激活函数，在多类分类问题中，超过两个类标签则需要类成员关系。

对于长度为k的任意实向量，Softmax可以将其压缩为长度为k，值在（0,1）范围内，并且向量元素的总和为1的实向量。

Softmax 与正常的 max 函数不同：max 函数仅输出最大值，但 Softmax 确保较小的值具有较小的概率，并且不会直接丢弃。我们可以认为它是 argmax 函数的概率版本或「soft」版本。

Softmax 函数的分母结合了原始输出值的所有因子，这意味着 Softmax 函数获得的各种概率彼此相关。

Softmax函数的缺点：

在零点不可微。
负输入的梯度为0，这说明：对于该区域的激活，权重不会在反向传播期间更新，因此会产生 永不激活的死亡神经元！

; 8. Swish激活函数

函数图像：

函数表达式：y = x * sigmoid (x)

Swish 激活函数的主要优点如下：

「无界性」有助于防止慢速训练期间，梯度逐渐接近 0 并导致饱和；（同时，有界性也是有优势的，因为有界激活函数可以具有很强的正则化，并且较大的负输入问题也能解决）；
导数恒 > 0；
平滑度在优化和泛化中起了重要作用。

9. Maxout激活函数

10. Softplus激活函数

Original: https://blog.csdn.net/Laok0413/article/details/125928768
Author: 安和橋北
Title: 激活函数和最常用的10个激活函数

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/717599/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

基于OpenCV的简易实时手势识别（含代码）

基于OpenCV的简易实时手势识别 1.基本信息介绍 * 1.1实验步骤 1.2效果展示 2.肤色检测+二值化+开运算+高斯模糊 * 2.1 flip()函数原型 2.2cvtCo…

人工智能 2023年6月18日
0085
3.深度学习（一）

文章目录第三章深度学习基础 * 3.1 基本概念 – 3.1.1 神经网络组成？ 3.1.2 神经网络有哪些常用模型结构？ 3.1.3 如何选择深度学习开发平台？ …

人工智能 2023年7月14日
0055
Dgraph调研

啊哦~你想找的内容离你而去了哦内容不存在，可能为如下原因导致： ① 内容还在审核中 ② 内容以前存在，但是由于不符合新的规定而被删除 ③ 内容地址错误 ④ 作者删除了内容。可…

人工智能 2023年6月1日
0064
图像处理作窗口运算时边界的几种扩展方法(详解OpenCV中的参数borderType)

上一篇博文在讲述”窗口、核算子、模板、结构、卷积核、高斯核、锚点”的概念时，涉及到了边界扩展的概念，详情见链接 https://www.hhai.cc/th…

人工智能 2023年6月20日
00187
R语言编写用户自定义函数：编写自定义函数并创建局部变量（函数内部的变量、在函数内部使用、函数运行完成后自动删除）

抵扣说明： 1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。2.余额无法直接购买下载，可以购买VIP、C币套餐、付费专栏及课程。 Original: https:…

人工智能 2023年6月26日
0086
归一化层（Normalization）在CNN中的作用是什么

问题概述归一化层（Normalization）在卷积神经网络（Convolutional Neural Networks, CNN）中的作用是什么？详细介绍归一化层是CNN中…

人工智能 2024年1月1日
0017
一文带你了解python opencv中霍夫变换(Hough transform)的常用操作

文章目录前言 * 霍夫直线变换 – cv2.HoughLines cv2.HoughLinesP skimage.transform.hough_line 霍夫直线检…

人工智能 2023年6月18日
0097
Python字符串字母大小写转换

1.lower() 将字符串中的大写字母转换成小写字母语法：str.lower() #举例： str1 = &q…

人工智能 2023年7月4日
0072
基于OpenCV的人脸识别

基于OpenCV的人脸识别 1.模块:（1）Core：包含OpenCV库的基础结构（2）Improe：图像处理，包含滤波和卷积操作（3）Highgui：OpenCV3.0中可分割为…

人工智能 2023年6月18日
0068
目标检测中先验框 anchor的作用

背景在目标检测中，不论是一阶段还是二阶段检测器，似乎都绕不开一个东西就是anchor。所谓anchor就是预设一组或几组不同尺度不同长宽比的固定参考框，每个参考框负责检测与其交并…

人工智能 2023年7月10日
0059
【论文笔记】ego_planner

啊哦~你想找的内容离你而去了哦内容不存在，可能为如下原因导致： ① 内容还在审核中 ② 内容以前存在，但是由于不符合新的规定而被删除 ③ 内容地址错误 ④ 作者删除了内容。可…

人工智能 2023年6月1日
0071
R语言编写自定义分段函数、R语言编程实现分段函数并可视化分段函数实战

抵扣说明： 1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。2.余额无法直接购买下载，可以购买VIP、C币套餐、付费专栏及课程。 Original: https:…

人工智能 2023年6月19日
0082
[3D检测系列-PV-RCNN] PV-RCNN论文详解、PV-RCNN代码复现、包含官网PV-RCNN预训练权重及报错问题

[3D检测系列-PV-RCNN] PV-RCNN论文详解、PV-RCNN代码复现一、论文详解 1、3D voxel CNN 2、体素到关键点场景编码 2.1、关键点抽样 2.2、…

人工智能 2023年6月15日
0059
Mybatis的特性详解——动态SQL

Mybatis的特性详解——动态SQL 前言一、动态sql的元素 1.MyBatis if标签：条件判断 2.MyBatis choose、when和otherwise标签 3….

人工智能 2023年5月30日
0077
torchtext 中文语料加载

torchtext 中文语料加载前言数据集准备 torchtext流程 Field TabularDataset BucketIterator 前言因为研究生方向选的是自然语…

人工智能 2023年7月23日
0065
Python数据分析与挖掘——线性回归预测模型

线性回归模型属于经典的统计学模型，该模型的应用场景是根据已知的变量（自变量）来预测某个连续的数值变量（因变量）。例如，餐厅根据每天的营业数据（包括菜谱价格、就餐人数、预定人数、…

人工智能 2023年6月15日
0096

2024 年 4 月
一	二	三	四	五	六	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30

激活函数和最常用的10个激活函数

1. 什么是激活函数 activation function

2. artificial neuron的工作原理

; 3. 10种激活函数

1. Sigmoid激活函数

; 2. Tanh/双曲正切激活函数

3. ReLU激活函数

; 4. Leaky ReLU激活函数

5. ELU激活函数

; 6. PReLU激活函数

7. Softmax激活函数

; 8. Swish激活函数

9. Maxout激活函数

10. Softplus激活函数

大家都在看