PyTorch中的损失函数（los

2024年1月3日下午9:55 • 人工智能 • 阅读 52

PyTorch中的损失函数（Loss）

在机器学习中，损失函数（Loss function）是用来衡量模型预测结果与真实值之间的差异的函数。PyTorch提供了多种常用的损失函数，如均方误差损失函数（Mean Squared Error, MSE）、交叉熵损失函数（Cross-Entropy Loss）等。本文将以交叉熵损失函数为例进行详细讲解。

算法原理

交叉熵损失函数广泛应用于分类任务中，特别在多类别分类问题上。它通过衡量模型的输出与真实值之间的差异，来评估模型的性能。

对于一个多类别分类问题，假设有K个类别。交叉熵损失函数的算法原理如下：

首先，我们需要将真实值转换成一个[K,1]的独热编码（One-Hot Encoding）向量。独热编码向量中，真实类别对应的位置为1，其他位置为0。
下一步，我们需要使用模型对样本进行预测，并将输出结果转换成一个[K,1]的概率分布向量。例如，如果有3个类别，那么预测结果可能为[0.2, 0.5, 0.3]，分别表示样本属于各类别的概率。
然后，我们将独热编码向量和概率分布向量作为输入，计算交叉熵损失。交叉熵损失的公式如下：

$$
L = -\sum_{i=1}^{K} y_i \log(p_i)
$$

其中，$L$表示交叉熵损失，$y_i$表示真实类别的独热编码中的第$i$个元素，$p_i$表示模型预测的概率分布向量中的第$i$个元素。

最后，我们通过优化算法（如随机梯度下降）最小化损失函数，以更新模型的参数，从而提高模型的性能。

计算步骤

根据上述的算法原理，我们可以总结出交叉熵损失的计算步骤如下：

将真实值转换成独热编码向量。
将模型的输出结果转换成概率分布向量。
使用独热编码向量和概率分布向量计算交叉熵损失。
根据损失值更新模型的参数。

复杂Python代码示例

下面是一个使用PyTorch实现交叉熵损失函数的完整代码示例，同时也包含了代码的细节解释。

首先，我们需要导入PyTorch库和使用的数据集（这里使用的是虚拟数据集）：

import torch
import torch.nn as nn

# 虚拟数据集
labels = torch.tensor([1, 0, 2]) # 真实类别
outputs = torch.tensor([[0.2, 0.5, 0.3], [0.9, 0.1, 0.0], [0.1, 0.2, 0.7]]) # 模型输出的概率分布

接下来，我们可以使用PyTorch提供的交叉熵损失函数nn.CrossEntropyLoss来计算损失。该函数自动处理了独热编码和概率分布的转换，无需手动进行转换。

criterion = nn.CrossEntropyLoss()
loss = criterion(outputs, labels)

最后，我们可以通过调用损失的backward()方法来计算梯度并更新模型的参数。

loss.backward()

# 打印梯度
for param in criterion.parameters():
 print(param.grad)

代码细节解释

在上述代码中，我们使用了nn.CrossEntropyLoss来计算交叉熵损失。该函数会自动进行独热编码和概率分布的转换。
损失函数的backward()方法用于计算梯度。在调用该方法之前，PyTorch自动开启了梯度追踪功能，因此可以根据损失函数对参数进行求导。
通过打印损失函数的参数的梯度，我们可以查看梯度的值。

以上是关于PyTorch中交叉熵损失函数的详细解释，包括算法原理、公式推导、计算步骤和代码示例。希望对你有所帮助！

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/823632/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

深度聚类：将深度表示学习和聚类联合优化

参考文献：简介经典聚类即数据通过各种表示学习技术以矢量化形式表示为特征。随着数据变得越来越复杂和复杂，浅层（传统）聚类方法已经无法处理高维数据类型。结合深度学习优势的一种直接方…

人工智能 2023年6月15日
0075
关于Hough变换的公式证明与Matlab展示

核心关系：两条相互垂直直线斜率乘积为-1 这个公式的含义： ==========================分割线===============================…

人工智能 2023年6月20日
0072
万字讲解Apollo，全网Apollo资料整理和学习

0 参考资料 0.1 Apollo各模块系列笔记记录模块参考文章Cyberapollo介绍之cyber设计(五) – 知乎 (zhihu.com) apollo介绍之…

人工智能 2023年6月1日
00101
深度学习中图像增强技术的综合综述

啊哦~你想找的内容离你而去了哦内容不存在，可能为如下原因导致： ① 内容还在审核中 ② 内容以前存在，但是由于不符合新的规定而被删除 ③ 内容地址错误 ④ 作者删除了内容。可…

人工智能 2023年6月24日
0074
【CV】图像恢复（降噪/超分/去雾/去雨/去模糊）顶会论文汇总

论文名称：A survey of deep learning approaches to image restoration论文下载：https://www.sciencedire…

人工智能 2023年5月26日
00101
R语言使用reshape包的rename函数修改数据变量的名称、例如、使用rename函数自定义修改dataframe数据列的名称

抵扣说明： 1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。2.余额无法直接购买下载，可以购买VIP、C币套餐、付费专栏及课程。 Original: https:…

人工智能 2023年7月17日
0082
感知器算法及python实现

这边建议异步到第二版感知器算法及其python 实现 V2.0，训练速度更快，数据集更直观。第一版写的还是太过粗糙。感知器算法及python实现通俗来讲，感知器算法可以完成如下…

人工智能 2023年6月16日
0081
[Python从零到壹] 四十一.图像处理基础篇之图像采样处理

欢迎大家来到”Python从零到壹”，在这里我将分享约200篇Python系列文章，带大家一起去学习和玩耍，看看Python这个有趣的世界。所有文章都将结合…

人工智能 2023年6月20日
0096
Excel函数公式大全—MATCH函数

EXCEL系列文章目录 Excel系列文章是本人亲身经历职场之后萌发的想法，为什么Excel覆盖如此之广，几乎每个公司、学校、家庭都在使用，但是它深藏的宝藏功能却很少被人使用，PQ…

人工智能 2023年6月11日
00103
CVPR 2022 | 图像修复！中科大&微软提出PUT：减少Transformer在图像修复应用中的信息损失…

点击下方卡片，关注” CVer“公众号 AI/CV重磅干货，第一时间送达图1 本文方法和现有方法的一些对比结果本文介绍我们在CVPR 2022发表的用…

人工智能 2023年6月16日
0070
语音识别插件_AnsweringMachine XS: 越狱理由之二，iPhone 电话语音答录机

Apps & Tweaks | Jailbreak Guide | iDevices Version：XS Repo：http://limneos.net/ iOS Sup…

人工智能 2023年5月25日
0087
卷积层的反向传播如何计算

问题描述卷积神经网络（Convolutional Neural Networks, CNN）是深度学习中非常重要的一种网络结构。在CNN中，卷积层（Convolutional L…

人工智能 2024年1月1日
0044
vscode中使用jupyter，一直无法启动内核 failed to start the kernel,有两个提示，py：2205 和py：2160 ，解决方案

一直搜索其他博主的解决办法，尝试各种办法，今天终于解决，我的tensorflow是2.0版本，python是3.7.11 第一步首先参考文章：(18条消息) VsCode中运行….

人工智能 2023年5月26日
0088
【集成学习系列教程2】AdaBoost回归算法原理及sklearn应用

文章目录 * – 4 AdaBoost回归算法 – + 4.1 概要 + 4.2 算法步骤 + 4.3 sklearn中的AdaBoost回归 + * 4….

人工智能 2023年6月18日
00119
YOLOV4 Windows10 VS2017 OPENCV4.6 CUDA11.5安装记录（简单）

YOLOV4 Windows10 VS2017 OPENCV4.6 CUDA11.5安装记录（简单）前言 * 1、安装环境 2、使用VS编译 3、测试前言本篇文章主要介绍yo…

人工智能 2023年7月19日
0062
【Mongoose笔记】HTTP 服务器

【Mongoose笔记】HTTP 服务器简介 Mongoose 笔记系列用于记录学习 Mongoose 的一些内容。 Mongoose 是一个 C/C++ 的网络库。它为 TCP…

人工智能 2023年6月29日
0095

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31