实例解释NLLLoss损失函数与CrossEntropyLoss损失函数的关系

2023年7月11日下午5:39 • 技术杂谈 • 阅读 73

在分类问题中常用到交叉熵损失函数 CrossEntropyLoss，有时候还能看到NLLLoss损失，两个损失是有关联的。

1、首先，随机生成一个3 * 3的 tensor，假设 该张量 test_n是我们的神经网络的输出，一行相当于一个样本的预测结果，如下：

2、使用Softmax处理生成的tensor， 这里要对每行元素进行操作，dim=1是对每行的元素进行操作（也就是沿着列增加的方向），dim=0是对每列的元素进行操作（也就是沿着行增加的方向），

3、接着对处理得到的tensor求对数，Softmax处理后的数值都在0～1之间，所以取 ln对数之后值域（-∞，0）

假设我们的目标是 target = torch.tensor([2, 0, 1])，我们希望 target 的label所对应的概率越大越好（在对数图像中越接近X轴的1），

那么对数值的绝对值就要越小（在对数图像中越接近Y轴的0），2是第一行中要取数值的索引，0是第二行要取数值的索引，1是第三行要取数值的索引，

对取出来的数值取绝对值后，再求平均值，该平均值就是要优化的损失，越小越好。

使用NLLLoss来验证下，和上述解释相符，

而CrossEntropyLoss损失函数是Softmax + Log + NLLLoss这些操作合并起来的，CrossEntropyLoss内部使用了nn.LogSoftmax。直接将神经网络的输出test_n和target作为输入进行计算。

Enjoy it!

Original: https://www.cnblogs.com/booturbo/p/16491565.html
Author: BooTurbo
Title: 实例解释NLLLoss损失函数与CrossEntropyLoss损失函数的关系

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/685911/

转载文章受原作者版权保护。转载请注明原作者出处！

技术杂谈

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

一个简单的http server实现

Original: https://www.cnblogs.com/kex1n/p/12199329.htmlAuthor: 小楼一夜听春雨Title: 一个简单的ht…

技术杂谈 2023年5月31日
0087
关于Chrome跨域The request client is not a secure xxx相关提示的解决

近期Chrome浏览器不知哪个版本升级后原来跨域功能好用突然报been blocked by CORS policy: The request client is not a …

技术杂谈 2023年5月31日
0088
Postgres14.4（Docker安装）

Postgres14.4（Docker安装）一，Docker拉取镜像 docker pull postgres:14.4 #检查镜像是否拉取成功 docker images | …

技术杂谈 2023年7月11日
0067
最简单方式解决AppImage程序无法运行[sandbox问题]

升级deepin20之后运行以往AppImage软件没反应（安利一款本人正在用的仅一个AppImage格式软件《Motrix》）。控制台管理员模式运行，提示信息说可以尝试添加参数 …

技术杂谈 2023年5月31日
0086
tryenablingthebreakwritelocksoptionforthecleanup

如图：一般是在中断：提交/更新的时候产生的。一般两种解决方式（可以参考其他的）： 1，重启ide（我的就是这么神奇，重启idea后好了）； 2，在cleanup时勾选 brea…

技术杂谈 2023年7月24日
0075
5分钟搞定关系型数据库到Flink数据同步

简述实时数据处理领域中，使用 Flink 方式，除了从日志服务订阅埋点数据外，总离不开从关系型数据库订阅并处理相关业务数据，这时就需要监测并捕获数据库增量数据，将变更按发生的顺序…

技术杂谈 2023年7月24日
0095
Creating Apps With Material Design —— Creating Lists and Cards

转载请注明http://blog.csdn.net/eclipsexys翻译自Developer Android。时间仓促，有翻译问题请留言指出，谢谢创建Lisst和Cards …

技术杂谈 2023年5月30日
0091
百度效率云

http://xiaolvyun.baidu.com/docs/knowledge-base/user-story-mapping Original: https://www.cn…

技术杂谈 2023年5月31日
0086
GCC常见命令

rwx 对于目录和文件的区别文件目录 r 文件的内容可以被查看。支持cat、more、head…vim 目录的内容可以被查看。ls、tree w 文件的内容可以被添…

技术杂谈 2023年6月21日
00115
性能测试案例全过程方案二———购物流程（重要！！！）

性能测试案例全过程方案二———购物流程压测需求：对某购物网站进行压测，看是否能并发200个用户，主要是模拟用户登录购物下单。分析：被测的…

技术杂谈 2023年5月31日
00147
57.如果有一天我变得很有钱

dsfds posted @2022-09-28 08:32 随遇而安== 阅读(8 ) 评论() 编辑 Original: https://www.cnblogs.com/55z…

技术杂谈 2023年6月21日
0070
MySQL数据库-数据表（一）

数据表的基本操作. MySQL 数据库支持多种数据类型，大致可以分为 3 类：数值类型、日期和时间类型、字符串（字符）类型。（1）数值类型数值类型用于存储数字型数据，这些类型包…

技术杂谈 2023年6月21日
00103
Delphi自写组件：可设置颜色的按钮

unit ColorButton; interface uses Windows, Messages, SysUtils, Classes, Graphics, Controls,…

技术杂谈 2023年5月31日
0067
邱盛昌：OPPO商业化数据体系建设实战

导读：本文是OPPO商业数据研发负责人&技术专家邱盛昌老师带来的”OPPO商业化数据体系建设实践”的分享。整体内容围绕着下图中垂直划分的六个部分展开…

技术杂谈 2023年7月25日
0075
HIT软构博客7-学习UML类图

UML的各种线和箭头到底是什么意思 1 泛化泛化表示⼀个更泛化的元素和⼀个更具体的元素之间的关系。即继承extends ⽤实线空⼼三角形箭头表⽰。箭头方向从子类到父类。 2实现实…

技术杂谈 2023年7月11日
0055
百度云服务器环境搭建——安装JDK环境、TomCat服务器、MySQL数据库

百度云服务器环境搭建——安装JDK环境、TomCat服务器、MySQL数据库 1.JDK安装以JDK1.8为例首先查看是否安装过jdk ，通过VS code连接云服务器 jav…

技术杂谈 2023年6月21日
0096

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

实例解释NLLLoss损失函数与CrossEntropyLoss损失函数的关系

大家都在看