机器学习中的数学——激活函数（八）：Swish函数

2023年7月13日下午4:55 • 人工智能 • 阅读 110

Swish 的设计受到了 LSTM 和高速网络中gating的sigmoid函数使用的启发。我们使用相同的gating值来简化gating机制，这称为self-gating。
Swish ( x ) = x ∗ S i g m o i d ( x ) \text{Swish}(x)=x*Sigmoid(x)Swish (x )=x ∗S i g m o i d (x )

self-gating的优点在于它只需要简单的标量输入，而普通的gating则需要多个标量输入。这使得诸如Swish之类的self-gated激活函数能够轻松替换以单个标量为输入的激活函数（如：ReLU），而无需更改隐藏容量或参数数量。

Swish函数的特点

有助于防止慢速训练期间，梯度逐渐接近0并导致饱和
导数恒大于0。
平滑度在优化和泛化中起了重要作用。

Swish函数的图像：

Original: https://blog.csdn.net/hy592070616/article/details/120618747
Author: von Neumann
Title: 机器学习中的数学——激活函数（八）：Swish函数

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/690240/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

《Neo4J 权威指南》知识点总结

目录 * – Neo4j – Neo4j 权威指南 – 知识点梳理 Neo4j Neo4j 是目前图数据库领域最流行的数据库，在知识图谱等应用上…

人工智能 2023年6月1日
0058
详解Inception结构：从Inception v1到Xception

文章目录 * – 概述 – NiN对Inception的启发 – Inception v1 – Inception v2 &#821…

人工智能 2023年5月26日
0089
【手拉手带你准备电赛】单色块识别（基于openmv）

文章背景 openmv介绍 openmv色块识别原理 openmv色块识别代码最终结果疑惑细解：关于阈值的设置：关于自动增益和白平衡文章背景我们都听说过什么图像识别、色…

人工智能 2023年5月28日
00114
自然语言处理中的小样本学习

目录什么是小样本学习，4/8/16为什么小样本学习重要：跟人类比一样模型本身的能力体现、降低数据标注成本（一条标注1元，找5个众包要5元）降本增效发展历程分类预训练时代标准微调标准…

人工智能 2023年5月28日
0071
Supervisor 开始

Supervisor 是 Linux/Unix 操作系统上的进程管理工具。本文介绍了于 Ubuntu 18 上如何使用 Supervisor 开机启动、保活守护自己的服务进程。建…

人工智能 2023年6月4日
0094
这篇文章用三分钟告诉你怎么把录音转文字

随着智能手机的普及，我们现在经常使用手机来记录东西，特别是没有纸笔的情况下，手机可以帮助我们及时记录，在某些情况下，比如听一些重要的讲座，使用手写输入可能会让我们错过一些信息。 […

人工智能 2023年5月25日
0073
CVPR 2022 57 篇论文分方向整理 + 打包下载｜涵盖目标检测、语义分割、人群计数、异常检测等方向

2D 目标检测(2D Object Detection) 【1】Unknown-Aware Object Detection: Learning What You Don&#821…

人工智能 2023年7月10日
0068
tensorflow卷积报错Failed to get convolution algorithm. This is probably because cuDNN failed t

tensorflow卷积报错Failed to get convolution algorithm. This is probably because cuDNN failed t…

人工智能 2023年5月25日
0066
tensor中数据类型的相互转换

Pytorch中的Tensor常用的类型转换函数 tensor数据类型转换例如： a = tensor(282, device=’cuda:0′) b =…

人工智能 2023年7月5日
00103
真全！阿里最新Redis全栈小册涵盖了所有操作

Redis是由意大利人Salvatore Sanfilippo（网名：antirez）开发的一款内存高速缓存数据库。Redis全称为：Remote Dictionary Serve…

人工智能 2023年6月28日
0089
中文事件抽取研究综述

中文事件抽取研究综述中文事件抽取研究综述 * 摘要 2 事件抽取任务定义 – 2.1 公开评测事件抽取 + 评估 2.2 框架表示事件抽取 2.3 实例表示事件抽取 …

人工智能 2023年6月10日
0078
python使用seaborn绘图：直方图displot、密度图、散点图

目录一、直方图distplot() 二、密度图 * 2.1 单个样本数据分布密度图转自：https://www.cnblogs.com/Forever77/p/11399523…

人工智能 2023年7月7日
0075
#Paper Reading#Contrastive Learning for Representation Degeneration Problem in Sequential Recommenda

论文题目：Contrastive Learning for Representation Degeneration Problem in Sequential Recommenda…

人工智能 2023年7月17日
0057
pytorch 图像处理常见问题

1、Image 2 Tensor（三维到三维）： transforms.ToTensor：可以将PIL和numpy格式的数据从[0,255]范围转换到[0,1] ，具体做法其实就是…

人工智能 2023年6月20日
0094
3GPP R17覆盖增强

R17覆盖增强包含五个方面，(1) Enhancements on PUSCH repetition Type A：最大重复次数增加到32；(2) TB processing ov…

人工智能 2023年6月28日
0085
本周总结—-ResNet 模型

一、Resnet论文解读以resnet34为例介绍* 图一：res34层整体结构图二： resnet的尺寸通道数表 1、残差结构主通道上输入x进入一个卷积层后做BN，做re…

人工智能 2023年7月14日
0053

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

机器学习中的数学——激活函数（八）：Swish函数

大家都在看