动手学习深度学习——softmax函数与sigmoid函数区别

2023年6月15日下午9:30 • 人工智能 • 阅读 89

本篇文章属于总结性文章，看之前你需要对softmax与sigmoid都有一个大概的认识。全文没有代码纯理论，手写+公式的方式简单总结了两种激活函数在多方面的不同，看完对你有帮助的话可以点个收藏并小赞一下😊。

解决的实际问题不同

在动手学深度学习——softmax回归之OneHot、softmax与交叉熵一文中，我们以softmax函数和交叉熵实现了一个”单层神经网络”—— softmax回归分类器；同样的，我们也可以用sigmoid函数作为激活函数实现 sigmoid回归分类器。二者分别用于解决多分类问题与多标签问题：

多标签问题：一部电影即是剧情片又是爱情片，各类别之间不互斥——sigmoid；
多分类问题：一个动物图谱只能是一类动物，各类别之间互斥——softmax；
各类别间关系不同

当然我们这里不着重介绍两种分类器的实现和用途，主要介绍两种激活函数间的区别：

在softmax中，我们计算得到的各类别概率之和为1，也就是说我们加大某一类别的概率必然导致其他类别减小——各类别之间相互关联，是互斥的。
在sigmoid中，我们计算的各类别概率之和则不一定为1，各个输出值依次独立的经过激活函数的映射，某一个类别概率增大可能也伴随另一个类别概率增大——各类别之间相互独立，不互斥。
正向传播对应的交叉熵损失函数不同

因此，两种激活函数在计算损失时，分别对应 不同的交叉熵函数，推导如下：

; 4. 反向传播中计算梯度的方式不同

不仅如此，由于两种激活函数计算输出值的方法不一样：

sigmoid函数是 标量变元的实值标量函数f ( x ) f(x)f (x )；
softmax函数是 向量变元的实值标量函数f ( x ) \pmb f(\pmb x)f f f (x x x )。

所以二者在 多样本(矩阵) 的情况下反向传播计算： 损失函数对激活函数输出的梯度：∂ L ∂ y i ^ \frac{\partial L}{\partial \hat{y_i}}∂y i ^∂L ，以及 激活函数对自身输入的梯度：∂ y i ^ ∂ a i \frac{\partial \hat{y_i}}{\partial a_i}∂a i ∂y i ^ 也有不同，推导如下：

补充
sigmoid的公式及求导：

softmax公式及求导：详见知乎博客：反向传播之一：softmax函数

Original: https://blog.csdn.net/qq_50571974/article/details/123967880
Author: 时生丶
Title: 动手学习深度学习——softmax函数与sigmoid函数区别

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/617635/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

华为开源自研AI框架昇思MindSpore入门体验：手写数字识别

目录一、环境安装 * 1.进入MindSpore官网 2.选择安装版本 3.确保为Windows系统 4.安装MindSpore 5.验证安装 6.安装依赖二、模型训练 * 1…

人工智能 2023年6月23日
00179
【知识图谱系列】解耦Transformation和Propagation的深度图神经网络

作者：CHEONG公众号：AI机器学习与知识图谱研究方向：自然语言处理与知识图谱本文介绍一篇解耦合Transformation和Propagation操作的自适应深度图神经网络模…

人工智能 2023年6月10日
0094
RNA-seq数据分析

一、数据收集 1.NCBI GEO数据库收集相关RNA-seq数据样本信息以及引用文献可以点击对应链接查看 2.SRA Run Selector 查看数据单双端类型（SINGLE …

人工智能 2023年7月16日
00106
《统计学》第八版贾俊平第九章分类数据分析知识点总结及课后习题答案

目录一、知识框架二、课后习题一、知识框架二、课后习题 1市场研究人员欲研究不同收入群体对某种特定商品是否有相同的购买习惯，他们调查了四个不同收入组的消费者共527人，购买习…

人工智能 2023年6月30日
00228
图像增强学习笔记（一）| 灰度变换与直方图修正

图像增强的目的是改善图像的视觉效果，针对给定图像的应用场合，有目的地强调图像的整体或局部特性，扩大图像中不同物体特征之间的差别，为图像的信息提取及图像分析奠定基础。图像增强的方法…

人工智能 2023年6月20日
0077
prompt learning 提示学习初步心得及示例代码

先看下简单的情感分类示例：基于prompt learning的情感分类示例代码_znsoft的博客-CSDN博客 NLP 目前为止经历了四个阶段：完全监督机器学习完全监督深…

人工智能 2023年7月13日
0043
浅谈CNN中的激活函数

引言通常情况下，激活函数往往返回0到1的数值。在神经元中，输入的input经过一系列加权求和后作用于另一个函数，这个函数就是这里的激活函数。激活函数通常由各种各样的种类，但是他们…

人工智能 2023年7月13日
0059
深度学习 Day13——利用卷神经网络实现猴痘病的识别

深度学习 Day13——利用卷神经网络实现猴痘病的识别文章目录深度学习 Day13——利用卷神经网络实现猴痘病的识别 * 一、前言二、我的环境三、前期工作 – …

人工智能 2023年7月12日
0062
OpenCV（25）轮廓检测（轮廓提取、属性、近似轮廓、外接矩形和外接圆）

目录一、轮廓检测基础理论 1、轮廓概述 2、API介绍 1、cv.findContours函数（查找轮廓） 2、cv.drawContours函数（画出轮廓）检测轮廓并画出：（…

人工智能 2023年6月26日
0061
【宝藏级】全网最全的Seaborn详细教程-数据分析必备手册（2万字总结）

数据分析必备手册-Seaborn详细教程 seaborn库 * 安装：官方文档：关系绘图 * relplot – 1. 基本使用： 2. 添加hue参数： 3. 添…

人工智能 2023年7月18日
0050
硫酸软骨素-聚乙二醇-卵清蛋白，Chondroitin sulfate-PEG-OVA/Ovalbumin

中文名称：硫酸软骨素-聚乙二醇-卵清蛋白英文名称：Chondroitin sulfate-PEG-OVA 纯度：95%+ 存储条件：-20°C，避光，避湿外观:固体或粘性液体，…

人工智能 2023年6月27日
0058
行业洞察 | 如何更好的实现与虚拟人的互动体验？

2020以来，新冠疫情让很多明星”营业”困难，AI技术却让虚拟人走红出圈。近期最为火爆的虚拟人当属百度的度晓晓，作为一位可甜可咸的小美女。与同为百度出品的虚…

人工智能 2023年6月1日
0099
【图像分割】基于模糊聚类算法FCM实现图像分割matlab代码

1 简介图像分割是数字图象处理中关键技术之一,是重要的研究领域,也是计算机视觉中的一个经典问题。聚类分析是图像分割领域的重要分支之一,也是数据挖掘中进行数据处理的重要分析工具和方…

人工智能 2023年5月31日
0082
数学建模—-聚类分析

聚类分析概念聚类分析是根据给出数据中发现描述对象及关系的信息，对数据对象进行分组的过程。聚类是一种寻找数据之间内在结构的技术，聚类把全体数据实例组织成一些相似组，这些相似组被称…

人工智能 2023年5月31日
0094
数据分析之滚动窗口pandas.DataFrame.rolling方法

本文使用pandas 1.3.5 , python 3, numpy 1.22.0库文章目录前言一、rolling使用公式二、python实现前言 pandas.Dat…

人工智能 2023年7月15日
0052
手把手教你用Yolov5 (v6.2) 训练分类模型基于《Kaggle猫狗大战》案例

文章目录 * – 0 前言 – 1 v6.2 项目结构改动 – 2 快速上手🌟 – + 2.1 train + 2.2 val + …

人工智能 2023年7月3日
00115

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

动手学习深度学习——softmax函数与sigmoid函数区别

大家都在看