【Pytorch基础】torch.nn.CrossEntropyLoss损失函数介绍

2023年6月16日下午11:33 • 人工智能 • 阅读 78

交叉熵主要是用来判定实际的输出与期望的输出的接近程度，为什么这么说呢，举个例子：在做分类的训练的时候，如果一个样本属于第K类，那么这个类别所对应的输出节点的输出值应该为1，而其他节点的输出都为0，即[0,0,1,0,….0,0]，这个数组也就是样本的Label，是神经网络最期望的输出结果。也就是说用它来衡量网络的输出与标签的差异，利用这种差异经过反向传播去更新网络参数。 参考文献【1】

3.1 举个栗子

交叉熵损失，是分类任务中最常用的一个损失函数。在Pytorch中是基于下面的公式实现的。
Loss ⁡ ( x ^ , x ) = − ∑ i = 1 n x log ⁡ ( x ^ ) \operatorname{Loss}(\hat{x}, x)=-\sum_{i=1}^{n} x \log (\hat{x})Loss (x ^,x )=−i =1 ∑n x lo g (x ^)
其中x x x是真实标签, x ^ \hat{x}x ^ 是预测的类分布（通常是使用softmax将模型输出转换为概率分布)。
取单个样本举例，假设x 1 = [ 0 , 1 , 0 ] x_1=[0, 1, 0]x 1 =[0 ,1 ,0 ], 模型预测样本x 1 x_1 x 1 的概率为x 1 ^ = [ 0.1 , 0.5 , 0.4 ] \hat{x_1}=[0.1, 0.5, 0.4]x 1 ^=0.1 ,0.5 ,0.4 。则样本的损失计算如下所示：

Loss ⁡ ( x 1 ^ , x 1 ) = − 0 × log ⁡ ( 0.1 ) − 1 × log ⁡ ( 0.5 ) − 0 × log ⁡ ( 0.4 ) = log ⁡ ( 0.5 ) \operatorname{Loss}(\hat{x_1}, x_1)=-0 \times \log (0.1)-1 \times \log (0.5)-0 \times \log (0.4)=\log (0.5)Loss (x 1 ^,x 1 )=−0 ×lo g (0.1 )−1 ×lo g (0.5 )−0 ×lo g (0.4 )=lo g (0.5 )

更详细的多分类交叉熵损失函数的例子可以参考文献【4】

3.2 Pytorch实现

实际使用中需要注意几点:

输入的形式大概如下所示：

import torch
target = [1, 3, 2]

input_ = [[0.13, -0.18, 0.87],
         [0.25, -0.04, 0.32],
         [0.24, -0.54, 0.53]]

loss_item = torch.nn.CrossEntropyLoss()
loss = loss_item(input, target)

CrossEntropyLoss函数里面的实现，如下所示：

def forward(self, input, target):
    return F.cross_entropy(input, target, weight=self.weight,
                           ignore_index=self.ignore_index, reduction=self.reduction)

是调用的torch.nn.functional（俗称F）中的cross_entropy()函数。

此处需要区分一下：torch.nn.Module 和 torch.nn.functional(俗称F)中损失函数的区别。Module的损失函数例如CrossEntropyLoss、NLLLoss等是封装之后的损失函数类，是一个类，因此其中的变量可以自动维护。经常是对F中的函数的封装。而F中的损失函数只是单纯的函数。
下面看一下F.cross_entropy函数

3.3 F.cross_entropy

input：预测值，（batch，dim），这里dim就是要分类的总类别数
target：真实值，（batch），这里为啥是1维的？因为真实值并不是用one-hot形式表示，而是直接传类别id。
weight：指定权重，（dim），可选参数，可以给每个类指定一个权重。通常在训练数据中不同类别的样本数量差别较大时，可以使用权重来平衡。
ignore_index：指定忽略一个真实值，（int），也就是手动忽略一个真实值。
reduction：在[none, mean, sum]中选，string型。none表示不降维，返回和target相同形状；mean表示对一个batch的损失求均值；sum表示对一个batch的损失求和。

其中参数weight、ignore_index、reduction要在实例化CrossEntropyLoss对象时指定，例如：

loss = torch.nn.CrossEntropyLoss(reduction='none')

F中的cross_entropy的实现

return nll_loss(log_softmax(input, dim=1), target, weight, None, ignore_index, None, reduction)

可以看到就是先调用log_softmax,再调用nll_loss。log_softmax就是先softmax再取log。

Original: https://blog.csdn.net/zfhsfdhdfajhsr/article/details/124689632
Author: 一穷二白到年薪百万
Title: 【Pytorch基础】torch.nn.CrossEntropyLoss损失函数介绍

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/627307/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

【知识图谱】实践篇——基于医疗知识图谱的问答系统实践（Part2）：图谱数据准备与导入

前序文章：前文已经介绍了该系统的环境准备。下面介绍图谱数据获取，数据主要从：http://jib.xywy.com/ 爬取。环境准备按照原来的计划是将数据爬取相关的代码也过一…

人工智能 2023年6月1日
0093
遥感领域旋转目标检测OBB记录

首先，请允许我说明一下，笔者也是一名目标检测的小白（研一的小萌新）。前些日子，我敬爱的导师让我根据自己理解总结一下目前自己对于遥感领域目标检测相关的知识，于是便有了以下内容。如果你…

人工智能 2023年7月9日
0079
oh-my-zsh（更强大的命令行工具）

点击上方” 罗晓胜“，马上关注，您的支持对我帮助很大 / 前言 / oh-my-zsh更强大的命令行工具，解放双手，比系统自带bash更加酷炫、高效，可以实…

人工智能 2023年6月28日
00105
Anchor机制小结：Yolov1~Yolov5

1. Anchor定义就是一个多尺度的滑动窗口，在特征图上的每个cell上生成不同尺寸、不同高宽比的Anchor，也叫先验框为什么要引入多种比例的Anchor？物体检测：一些候选…

人工智能 2023年7月9日
0097
解决 nvcc: command not found

1.nvcc nvcc 是The main wrapper for the NVIDIA CUDA Compiler suite. Used to compile and link…

人工智能 2023年7月26日
0071
人脸识别太常见？好用才行，利尔达推出一体化人脸识别解决方案

人脸识别技术对输入的人脸图像或者视频流进行处理，是一种通过提取每张人脸中的特征信息进行身份鉴别的前沿识别技术。伴随着智能化时代的悄然到来，人脸识别技术日益普及并被大规模地应用于日…

人工智能 2023年7月12日
0051
IBM SPSS Statistics描述性统计分析使用教学

本文主要将从描述性统计的定义、描述性统计的应用场景、怎么进行描述性统计三个方面来介绍描述性统计。首先描述性统计是用来计算变量之间的差异，一般用平均值、方差、标准差这些数学公式来计…

人工智能 2023年7月9日
0098
python行转列 pandas_pandas.DataFrame的pivot()和unstack()实现行转列

df=pd.DataFrame(np.random.randn(20).reshape(4,5),index=[[‘a’,’a’,&…

人工智能 2023年7月9日
0073
OpenCV每日函数对象追踪模块使用增强相关系数 (ECC) 最大化的图像配准

一、 OpenCV 中的运动模型在典型的图像对齐问题中，我们有两个场景图像，它们通过运动模型相关联。不同的图像对齐算法旨在使用不同的技巧和假设来估计这些运动模型的参数。一旦知道了…

人工智能 2023年7月19日
0070
ChatGPT能否取代Google、Baidu，成为下一代搜索引擎？一文了解最近火出圈的ChatGPT

前言 OpenAI这家公司又放大招了，继发布GPT、GPT2和GPT3模型后，本月初发布了ChatGPT模型【也被称为GPT3.5】，结合大家的测试效果来看，该模型效果确实很震撼…

人工智能 2023年7月31日
0068
机器学习课后练习题（期末复习题目附答案）

此为第五章支持向量机一. 单选题1. ‍对于在原空间中线性不可分问题,支持向量机()。A. 无法处理B. 在原空间中寻找线性函数划分数据C. 将数据映射到核空间中D. 在原空间中…

人工智能 2023年6月16日
00286
opencv源码编译及配置完整版教程（win10+vs2019+opencv-4.4.0+opencv_contrib-4.4.0）

opencv源码编译及配置完整版教程（win10+vs2019+opencv-4.4.0+opencv_contrib-4.4.0）一、下载vs2019 官网下载：https:/…

人工智能 2023年6月18日
0091
数据分析的统计基础（下）

4.1 假设检验从对总体的假设出发用样本数据进行检验，实现对总体指标分析的过程。即，对总体指标是否等于某一个数值，某一随机变量是否服从某种概率分布而做出相应的假设。分析样本指标…

人工智能 2023年6月11日
00115
Python—线性回归

目录 1.简单线性回归模型 2.多元线性回归模型 * 2.1 应用F检验法完成模型的显著性检验 2.2应用t检验法完成回归系数的显著性检验 3.基于回归模型识别异常点 4.含有离散…

人工智能 2023年6月18日
0075
cv2.VideoWriter 保存图像为视频的几个问题

用opencv库的cv2.VideoWriter函数保存图像为视频一、先确定要保存的视频的编码方式 cv2.VideoWriter_fourcc(‘I’,…

人工智能 2023年7月20日
0076
Pythonpytorchtensorflow可视化工具Visdom使用教程–堪比TensorboardX

学习深度学习、机器学习、数据分析与科学计算的小伙伴们对数据可视化的需求是比较重视的。所以Python的第三方库种有很多Python可视化工具，比如常用的TensorboardX，而…

人工智能 2023年7月24日
0061

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

【Pytorch基础】torch.nn.CrossEntropyLoss损失函数介绍

3.1 举个栗子

3.2 Pytorch实现

3.3 F.cross_entropy

大家都在看