Softmax分类器及交叉熵损失（通俗易懂）

2023年6月15日下午8:45 • 人工智能 • 阅读 101

在说分类器前我们先了解一下 线性分类

线性函数y = kx + b ，在对于多种类别、多个特征时可将W看做一个矩阵，纵向表示类别，横向表示特征值，现在有3个类别，每个类别只有2个特征

线性分类函数可定义为：

我们的目标就是通过训练集数据学习参数W，b。一旦学习完成就可以丢弃训练集，只保留学习到的参数。

1. 损失函数

损失函数是用来告诉我们当前分类器性能好坏的评价函数，是用于指导分类器权重调整的指导性函数，通过该函数可以知道该如何改进权重系数。通俗都来说一组参数（W,b）对应一个损失L，一般的损失越小模型越好，我们目标是通过各种优化，使损失达到最优值（不一定最小是最优的）。

常见的损失函数：

对数似然损失

百页损失

现在通过百叶损失对前面线性分类求损失：

2. Softmax分类器与交叉熵损失（cross-entropy）

*Softmax

函数定义

简单的说,softmax函数会将输出结果缩小到0到1的一个值，并且所有值相加为1

使用softmax函数对前面线性分类求得分

类别1 ：

类别2 ：

类别3 ：

*交叉熵损失（cross-entropy）

交叉熵损失衡量分类模型的性能，其输出是介于 0 和 1 之间的概率值。交叉熵损失随着预测概率与实际标签的偏离而增加。因此，当实际观察标签为 1 时预测 0.012 的概率模型不好，并导致高损失值。完美模型的对数损失为 0。cross-entropy一般再softmax函数求得结果后再用，

函数定义：

是真实值，

是softmax函数求得的结果。

因为真实值只有属于这个类别或者不属于这个类别，1代表是这个类别，如图所示表示改输入是类别3，

cross-entropy计算

为什么要加负号？

log函数图像：

因为softmax求出结果再（0,1）之间，所以cross-entropy结果为负值，加负号使得损失为正。

假如现在通过优化使得softmax 后结果为0.10、0.08、0.82，再计算cross-entropy结果对比一下

0.28小于之前的损失0.71，暗示模型正在学习。优化过程（调整权重以使输出接近真实值）一直持续到训练结束。

参考 https://towardsdatascience.com/cross-entropy-loss-function-f38c4ec8643e

Original: https://blog.csdn.net/Peyzhang/article/details/125418625
Author: Peyzhang
Title: Softmax分类器及交叉熵损失（通俗易懂）

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/617368/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

KNN算法Matlab实现

KNN算法Matlab实现简介： KNN全称K-Nearest Neighbors,源于20世纪70年代。属于有监督学习的传统机器学习算法，既可以解决回归问题也可解决分类问题。本…

人工智能 2023年6月15日
0078
全网最全的文本关键词抽取包括有监督和无监督方法

写在前面：这是数据挖掘老师布置的一个作业，我本来打算网上找别人现成的改一下，结果发现基本上都基于无监督的方法，例如TF-IDF。而我想用基于有监督的方法，毕竟老师给了数据集不拿来训…

人工智能 2023年5月31日
0080
【信号识别】基于matlab深度学习CNN信号调制分类【含Matlab源码 2066期】

⛄一、深度学习CNN信号调制分类概述 1 背景介绍在通信信号处理领域, 特别是在非协作通信信号盲解调研究领域, 每时隙突发信号的调制方式不同, 必须进行信号的调制方式自动识别。信号…

人工智能 2023年7月3日
00119
ValueError: The device should not be ‘gpu‘, since PaddlePaddle is not compiled with CUDA问题解决（Paddle）

一、问题描述两个问题一并解决： Traceback (most recent call last):File “run_trainer_ernie_gen.py&#8…

人工智能 2023年7月26日
0074
Pytorch搭建CNN进行图像分类

PyTorch是一个开源的Python机器学习库，2017年1月，由Facebook人工智能研究院（FAIR）基于Torch推出。最近抽出时间来亲身实践一下用PyTorch搭建一个…

人工智能 2023年7月21日
0099
Linux服务器安装pytorch更换conda清华镜像源

1、添加清华镜像源依次输入以下命令： conda config –add channels https://mirros.tuna.tsinghua.edu.cn/a…

人工智能 2023年7月22日
0046
LQR控制算法及其仿真实现

文章目录 1 离散有限时间系统 * 1.1 LQR问题描述 1.2 最小二乘法求解 1.3 最小二乘法编程实现 1.4 动态规划算法 1.5 动态规划算法实现 2 拉格朗日乘子法求…

人工智能 2023年6月2日
0085
音频特征于音频信号提取总结

这里写目录标题 1 语音的产生简介 2 声音特性 3. 声音的种类计算机听觉的应用 4. 什么是音频特征 5 音频特征的类别 * 5.1 可以从以下几个角度区分 5.2. 常见…

人工智能 2023年5月25日
00161
【OpenCV】红绿灯识别轮廓识别 C++ OpenCV 案例实现

目录前言一、轮廓识别相关原理什么是轮廓检测？轮廓提取函数 findContours 二、案例实现 Step1：初始化配置 Step2：进行帧处理 Step3：膨胀腐蚀处理 …

人工智能 2023年7月26日
0055
【h5文件读取】h5文件读取——深度学习数据集常用

数据集的常用格式：h5 深度学习搞了很长时间，其中开源的代码中经常用到大型数据集，里面的数据类型是h5格式，这个格式困扰我挺长时间，因为隔离还拿不到实验室的程序，只好硬着头皮再琢磨…

人工智能 2023年7月26日
0081
Graph Embedding

Graph Embedding 基本概念 Graph Embedding 技术是一种将图的拓扑结构进行向量表示的方法，从而获取到网络关系信息，可应用于推荐等多种场景。计算节点在图中…

人工智能 2023年6月4日
00115
NNDL 实验四线性分类基于Logistic回归的二分类任务、基于Softmax回归的多分类任务和基于Softmax回归完成鸢尾花分类任务

pytorch实现第3章线性分类 3.1 基于Logistic回归的二分类任务使用到的第三方库 import matplotlib.pyplot as plt from …

人工智能 2023年6月30日
0065
opencv入门（一）—-opencv（4.5.5）编译

曾几何时也研究过opencv，不过主要还是在python在使用，最近有c++项目需要，可能用到opencv，所以先来编译一个。在c++的世界中，最常用的编译器估计也就是三个，gc…

人工智能 2023年7月19日
0047
python 皮尔森相关系数（Pearson）

文章目录一、概述二、定义 * 2.1 总体样本定义 2.2 估算样本定义 2.3 两种计算方式 2.4 皮尔森距离三、python 实现 * 3.1 生成随机数据集 3.2 …

人工智能 2023年6月13日
00148
单目相机测距

提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档单目相机测距一、理论 * 1.像素坐标系 1.相机坐标系 1.转换到大地坐标系二、代码实现 * 1.使用mat…

人工智能 2023年6月19日
0074
GBDT算法原理以及实例理解（含Python代码简单实现版）

一、算法简介： GBDT 的全称是 Gradient Boosting Decision Tree，梯度提升树，在传统机器学习算法中，GBDT算的上是TOP前三的算法。想要理解G…

人工智能 2023年6月13日
0053

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

Softmax分类器及交叉熵损失（通俗易懂）

1. 损失函数

2. Softmax分类器与交叉熵损失（cross-entropy）

大家都在看