torch.nn.CrossEntropyLoss用法(原理, nlp, cv例子)

2023年5月27日下午7:56 • 人工智能 • 阅读 50

早上想花一个小时参照网上其他教程，修改模型结构，写一个手写识别数字的出来，结果卡在了这个上面，loss一直降不下来，然后我就去查看了一下CrossEntropyLoss的用法，毕竟分类问题一般都用这个。

原理层面

引入一个库:

import torch

假如是一个四分类任务，batch为2(只是为了显示简单，举个例子罢了)

logists = torch.randn(2, 4, requires_grad=True)
print(logists)

事实上，根据这个模型，第一个样本预测的类别是1，第二个样本预测的类别是2。

[En]

In fact, according to this model, the category predicted by the first sample is 1 and the category predicted by the second sample is 2.

这里我们假设模型足够好，都预测对了，那么其实target就是ground_truth。

target = logists.argmax(dim=-1)

定义损失函数:

crition = torch.nn.CrossEntropyLoss()

先来看个target_1d版的loss:

crition(logists, target)

再来看个target one-hot版的:
注意: 该版本在我的macbook python3.7.8, torch1.10.2的版本上没有问题, 但是在我的windows python3.7.6 torch1.9.1就出问题了!!! 因此稳妥起见还是直接用target比较好
先把target转为one

t_onehot = torch.nn.functional.one_hot(target, num_classes=4)

如何是one_hot，要求target也是浮点类型的，所以t_onehot再调用float()转为浮点类型。

crition(logists, t_onehot.float())

最后发现两种方法其实算出来的loss都是0.5601

另外插一嘴，crossEntropyLoss也可以通过nll_loss实现（如果你去看torch.nn.crossEntropyLoss的源码就会发现官方就是使用torch.nn.functional.nll_loss实现的，只不过模型输出的logists值要先经过log_softmax

nlp

这里来个序列标注的例子。模型输出是 (batch_size, seq_len, hidden_dim)。
在这里，我将向您展示两种方法，这两种方法会更简洁，但不如方法2那么易读，具体取决于您的个人喜好。

[En]

Here I will show you two methods, which will be more concise, but not as readable as method 2, depending on your personal preference.


import torch

cel = torch.nn.CrossEntropyLoss()

batch_size, seq_len, hidden_dim = 4, 28, 128

x = torch.randn(batch_size, seq_len, hidden_dim)

gt = torch.ones(batch_size, seq_len).long()

print('method 1:')
print(cel(x.permute(0, 2, 1), gt))
print()

print('method 2:')
print(cel(x.view(-1, hidden_dim), gt.view(-1)))

可以看到两种方法一样。

图像分割例子，模型输出是 (batch_size, channel, height, width), 有多少个类别就有多少个channel，通常医疗上的语义分割是2分类，因此输出channel为2。
在这里，我将向您展示两种方法，这两种方法会更简洁，但不如方法2那么易读，具体取决于您的个人喜好。

[En]

Here I will show you two methods, which will be more concise, but not as readable as method 2, depending on your personal preference.


import torch

cel = torch.nn.CrossEntropyLoss()

b, ic, oc, h, w = 4, 3, 2, 28, 28

x = torch.randn(b, oc, h, w)

gt = torch.ones(b, 1, h, w).long()

print('method 1:')
print(cel(x.view(b, oc, -1), gt.squeeze().view(b, -1)))
print()

print('method 2:')
print(cel(x.permute(0, 2, 3, 1).reshape(-1, oc), gt.squeeze().reshape(-1)))

Original: https://blog.csdn.net/weixin_43850253/article/details/122510794
Author: Andy Dennis
Title: torch.nn.CrossEntropyLoss用法(原理, nlp, cv例子)

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/527495/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

加强数据模型建设助力企业数字化转型 — 前篇

工信部将我国数字化转型分为信息化（Information Digitization，1956-2003年）、业务数字化（Business Digitization，2003&#8…

人工智能 2023年6月19日
0078
Xavier中使用TensorRT的Python API对Pytorch模型进行FP16精度和INT8精度转换

Xavier中使用TensorRT的Python API对Pytorch模型进行FP16精度和INT8精度转换 0.Xavier环境 JetPack 4.6python 3.6.9…

人工智能 2023年7月22日
0061
Python – 基础语法|逻辑语句|函数定义|列表|元组|字符串|切片|集合|字典

① 注释 print(1) """ print("1212") print("hello,world") &q…

人工智能 2023年6月29日
0050
RASP Runtime Application Self-protection 运行时应用自我保护介绍及优缺点

RASP 介绍 Runtime Application Self-protection 运行时应用自我保护[图源：绿盟科技] 概念 Gartner (著名信息技术研究和分析厂商) …

人工智能 2023年6月6日
0083
Mockito搭配junit单元测试

单元测试简述开发人员在完成功能模块后，如何证明自己通过了自测，测试方法是怎样的。单元测试跟覆盖率则是一个很好的答案。其实开发过程中，大多数时间在做测试以调整代码，单元测试相比较p…

人工智能 2023年6月28日
0075
知识图谱补全（KGC）论文阅读笔记

文章目录 1. WHY 为什么需要KGC技术 2. HOW 怎样进行KGC 3. 概念层次知识补全 * 3.1 基于描述逻辑的规则推理机制 3.2 基于机器学习类型推理机制 3.3…

人工智能 2023年7月28日
0058
深度学习-详细讲解Transformer

图解Transformer 1.关于Transformer 2.宏观视角分析 3.将张量带入图片 4.开始”编码” 5.宏观角度的Self-Attentio…

人工智能 2023年5月30日
0071
Jetson Xavier NX基于YOLOv5+CSI摄像头实现目标检测

Jetson Xavier NX基于YOLOv5+CSI摄像头实现目标检测文章目录 * Jetson Xavier NX基础环境搭建 – 基础环境搭建踩坑指南 + 1…

人工智能 2023年5月26日
0088
Opencv霍夫变换圆检测实战之检测硬币（C++）

HoughCircles 函数可以利用霍夫变换算法检测出灰度图中的圆。不需要源图像是二值的，只用将原图转化为灰度图即可。 void HoughCircles(InputArray …

人工智能 2023年7月19日
0072
使用tensorflow Dockerhub 构建image出现的问题

Bug 使用tensorflow 官网images构造个人image，此处本人使用的是：tensorflow/tensorflow:1.11.0-devel-gpu。运行cont…

人工智能 2023年5月25日
00110
论文阅读 Exploring Temporal Information for Dynamic Network Embedding

10 Exploring Temporal Information for Dynamic Network Embedding 5 link:https://scholar.goo…

人工智能 2023年6月4日
0083
调试代码错误1:legacy-install-failure、subprocess-exited-with-error

问题：要克隆GitHub上的torchsparse包。 python3.9安装matplotlib3.2.2版本失败解决_信安科研人的博客-CSDN博客错误一安装过程中遇到：ERR…

人工智能 2023年7月5日
0068
【语音信号处理】噪声抑制NS（一）噪声估计——MCRA方法

计算语音存在概率：思路：在一个短时窗内，计算局部能量（local energy，通常用 S ( k , l ) S(k,l)S (k ,l ) 表示）与最小能量 S m i n…

人工智能 2023年5月25日
0092
网安知识图谱和框架推荐

安全技术(@CopyRoght: CSDN)目录: 文章目录初阶 * 安全产品基础知识 Web安全二进制安全密码学渗透测试代码审计软件的安全生命周期相关学习资源中阶…

人工智能 2023年6月1日
0048
opencv C++ SVM模型训练与分类实现

最近想学习一下分类算法的内容，恰好opencv有SVM的函数，故先从这个下手。找了许多资料，发现要么是opencv2、3的，要么就没有具体实现代码，学习还是把代码与原理一起结合来看…

人工智能 2023年6月17日
0054
Matlab 实现两种读取文件夹内所有图像的方法

使用matlab进行文件夹内所有图片的顺序读取文件夹：RBG25 在此，使用两种不同的方法来进行文件的读取，以及验证读取的顺序。（方法1符合大多数人的需求） ; 方法1：使用[路…

人工智能 2023年6月17日
0047

2024 年 4 月
一	二	三	四	五	六	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30

torch.nn.CrossEntropyLoss用法(原理, nlp, cv例子)

原理层面

nlp

大家都在看