pytorch_lesson10 二分类交叉熵损失函数及调用+多分类交叉熵损失函数及调用

2023年6月17日上午12:20 • 人工智能 • 阅读 80

注：仅仅是学习记录笔记，搬运了学习课程的ppt内容，本意不是抄袭！望大家不要误解！纯属学习记录笔记！！！！！！

文章目录

一、机器学习中的优化思想
二、回归：误差平方和SSE
三、二分类交叉熵损失函数
*
1 极大似然估计求解二分类交叉熵损失
2 用tensor实现二分类交叉熵损失
3 用PyTorch中的类实现二分类交叉熵损失
四、多分类交叉熵损失函数
*
1 由二分类推广到多分类
2 用PyTorch实现多分类交叉熵损失
–
- 调用logsoftmax和NLLLoss实现
- 直接调用CrossEntropyLoss（）

一、机器学习中的优化思想

模型训练的目标：求解一组最适合的权重向量，令神经网络的输出结果与真实值尽量接近。

关键概念：损失函数是可以衡量真实值与预测结果的差异，评价模型学习过程中产生的损失的函数。

如果损失函数的值很小，则说明模型预测与真实值很接近，模型在数据集上表现优异，权重优秀；如果顺势函数的值很大，则说明模型预测值与真实值差异很大，模型在数据集上表现很差，权重糟糕。

二、回归：误差平方和SSE

pytorch_lesson10 二分类交叉熵损失函数及调用+多分类交叉熵损失函数及调用

from torch.nn import MSELoss
import torch

torch.random.manual_seed(420)
yhat = torch.randn(size=(50, 1), dtype=torch.float32)
y = torch.randn(size=(50, 1), dtype=torch.float32)

criterion = MSELoss()
loss = criterion(yhat, y)

print(loss)

对于MESloss来说，有一个重要的参数是reduction，reduction默认是mean，求得是平均损失，reduction设置为sum时，求的是全部样本的损失值之和。

criterion_1 = MSELoss(reduction='sum')
loss_1 = criterion_1(yhat, y)
print(loss_1)

criterion_2 = MSELoss(reduction='mean')
loss_2 = criterion_2(yhat, y)
print(loss_2)

三、二分类交叉熵损失函数

; 1 极大似然估计求解二分类交叉熵损失

我们将极大似然概率公式表示为：

第i个样本预测为1的概率为p1，被预测为0的概率为p0，yi代表第i个样本的真实标签，这个标签为1的时候，p1就保留下来了，如果真实标签为0的话，p0就保留下来了。然后我们使得这个预测概率达到最大即可。

2 用tensor实现二分类交叉熵损失

N = 3 * pow(10, 3)
torch.random.manual_seed(420)
x = torch.rand((N, 4), dtype=torch.float32)
w = torch.rand((4, 1), dtype=torch.float32)
y = torch.randint(low=0, high=2, size=(N, 1), dtype=torch.float32)

zhat = torch.mm(x, w)
sigma = torch.sigmoid(zhat)

loss = (-1/N) * torch.sum(y * torch.log(sigma) + (1 - y) * torch.log(1 - sigma))
print(loss)

注意，在深度学习pytorch框架下，尽量使用torch中的函数，这样的话，计算速度较快

案例比较

N = 3 * pow(10, 6)
torch.random.manual_seed(420)
x = torch.rand((N, 4), dtype=torch.float32)
w = torch.rand((4, 1), dtype=torch.float32)
y = torch.randint(low=0, high=2, size=(N, 1), dtype=torch.float32)

zhat = torch.mm(x, w)
sigma = torch.sigmoid(zhat)

starttime = time.time()
loss_1 = (-1/N) * torch.sum(y * torch.log(sigma) + (1 - y) * torch.log(1 - sigma))
endtime = time.time()
print(endtime - starttime)

starttime = time.time()
loss_2 = (-1/N) * sum(y * torch.log(sigma) + (1 - y) * torch.log(1 - sigma))
endtime = time.time()
print(endtime - starttime)

通过这两个例子可以看出，使用torch.sum()的计算速度远远比python自带的sum()要快得多

3 用PyTorch中的类实现二分类交叉熵损失

BCEWithLogitsLoss以及BCELoss
其中BCEWithLogitsLoss自带sigmoid函数，只需要输入预测值zhat即可
对于BCELoss来说，需要输入激活函数激活后的sigma

在N = 3 * pow(10, 6)
torch.random.manual_seed(420)
x = torch.rand((N, 4), dtype=torch.float32)
w = torch.rand((4, 1), dtype=torch.float32)
y = torch.randint(low=0, high=2, size=(N, 1), dtype=torch.float32)
zhat = torch.mm(x, w)
sigma = torch.sigmoid(zhat)

criterion = nn.BCELoss()
LOSS = criterion(sigma, y)
print(LOSS)

criterion2 = nn.BCEWithLogitsLoss()
loss2 = criterion2(zhat, y)
print(loss2)

四、多分类交叉熵损失函数

1 由二分类推广到多分类

假设样本的真实标签为1，我们就希望p1最大，同理，如果样本的真实标签为其他值，我们就希望其他的值对应的概率最大。

但是在二分类问题中，我们将y和1-y作为概率p的指数，这是因为真实标签只有0和1两种状况，但是在多分类中，我们的真实标签可能是任意整数，无法使用y的1-y这样的机构来构建似然函数，所以我们认为，如果多分类的标签也可以用0和1来表示就好了，这样我们就可以继续使用真实标签作为指数的方式。

因此我们对标签进行了one-hot编码，如下所示：

在矩阵中，
每一行依旧对应样本，但却由三分类衍生出了三个新的列，分别代表：真实标签是否等于1、等于2以及等于3。把标签整合为标签矩阵后，我们就可以将单个样本在总共k个分类情况整合为以下的似然函数：

j为样本i所对应的真实标签的编号
虽有所有训练集的样本来说，我们可以定义如下等式来表达所有样本在特征张量X和权重向量w组成的预测函数中，预测出所有可能的预测值yhat的概率p为：

与二分类问题一致，似然函数解出来以后，我们对似然函数求对数得到：

这个函数就是交叉熵损失函数，不难看出，二分类交叉熵函数是多分类的一种特殊情况

在pytorch里面直通通过nn.logsoftmax类调用这个功能，我们把对数之外的：乘以标签、加和、取负等等过程打包起来，称之为负对数似然函数（Negative Log Likelihood function），也就是说，在计算损失函数时，我们就不再需要单独的softmax函数了。

; 2 用PyTorch实现多分类交叉熵损失

在pytorch中实现交叉熵函数的时候，有两种方法：

调用logsoftmax和NLLLoss实现

N = 3*pow(10, 2)
torch.random.manual_seed(420)
X = torch.rand((N, 4), dtype=torch.float32)
w = torch.rand((4, 3), dtype=torch.float32, requires_grad=True)
y = torch.randint(low=0, high=3, size=(N,), dtype=torch.float32)

zhat = torch.mm(X, w)

logsm = nn.LogSoftmax(dim=1)
logsigma = logsm(zhat)
criterion = nn.NLLLoss()

criterion(logsigma, y.long())

直接调用CrossEntropyLoss（）

N = 3*pow(10, 2)
torch.random.manual_seed(420)
X = torch.rand((N, 4), dtype=torch.float32)
w = torch.rand((4, 3), dtype=torch.float32, requires_grad=True)
y = torch.randint(low=0, high=3, size=(N,), dtype=torch.float32)

zhat = torch.mm(X, w)
criterion = torch.nn.CrossEntropyLoss()
loss = criterion(zhat, y.long())
print(loss)

Original: https://blog.csdn.net/weixin_51589123/article/details/124756178
Author: 斯外戈的小白
Title: pytorch_lesson10 二分类交叉熵损失函数及调用+多分类交叉熵损失函数及调用

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/627529/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

结构型设计模式（上）

适配器模式：类适配器：对象适配器： 1、定义：将一个接口转换成客户希望的另一个接口，适配器模式使接口不兼容的那些类可以一起工作 2、模型结构： (1)目标抽象类(Target…

人工智能 2023年6月6日
0043
YOLO学习笔记5——YOLOV3详解

一、网络解析输入：416x416x3输出：3个feature map：13x13x255、26x26x255、52x52x255（255 = 3×85 =3 x(4+1…

人工智能 2023年7月9日
0066
主成分回归之后预测_基于主成分聚类和PLS回归分析的穿心莲质量等级评价研究…

摘要：目的结合性状指标和内在质量指标对穿心莲进行质量等级评价，建立等级评价模型，为穿心莲及其他中药材等级标准的制定提供参考。方法采收不同批次的穿心莲药材样品，测量和描述穿心莲…

人工智能 2023年6月18日
0073
9大时序异常检测方法汇总

异常检测（Anomaly detection）是目前时序数据分析最成熟的应用之一，定义是从正常的时间序列中识别不正常的事件或行为的过程。有效的异常检测被广泛用于现实世界的很多领域…

人工智能 2023年6月15日
0074
算法的超参数调优是AI算法中常见的细节问题之一。超参数包括学习率、正则化参数等，对算法的性能有着重要影响，需要仔细调整以获得最佳结果

问题背景在AI算法中，超参数调优是一个常见的细节问题。超参数是指优化算法本身时需要手动设置的参数，例如学习率、正则化参数等。这些超参数对算法的性能产生重要影响，因此需要仔细调整以…

人工智能 2024年1月6日
0036
DDPM代码详细解读(2)：Unet结构、正向和逆向过程、IS和FID测试、EMA优化

以下是将 Unet_和门 _结构_结合的 _PyTorch 代码： import torch import torch.nn as nn import torch.nn.funct…

人工智能 2023年6月24日
00240
深度学习：标签平滑（Label Smoothing Regularization）

1.标签平滑的作用—防止过拟合在进行多分类时，很多时候采用one-hot标签进行计算交叉熵损失，而单纯的交叉熵损失时，只考虑到了正确标签的位置的损失，而忽略了错误标签位置的损失。…

人工智能 2023年6月17日
0079
sgd 参数详解_论文笔记（三）：TransH的详解与实现

附言：最近由于主要将经历花在对于KGE与SPARQL的结合上，导致TransH的文章解读一再拖延，近期已大致完成这方面工作，后期会专门出一个介绍一下KGE与SPARQL结合的文章。…

人工智能 2023年6月10日
0082
R语言关于心脏病相关问题的预测和分析

心脏病由心脏结构受损或功能异常引起包括先天性心脏病和后天性心脏病，不同类型的心脏病表现不同，轻重不一。本报告是基于R语言对心脏研究的机器学习/数据科学调查分析。更具体地说，我们的…

人工智能 2023年7月27日
0058
SSM框架速成4：图书馆管理系统（SSM实战）

学完了三个框架，现在来整合一下SSM，并且实现一个图书馆增删改查的简单项目。这个整合就是实现简单的CRUD，整合的过程中多复习有关于之前的一些知识和思想，本身并不难，只是可能再配置…

人工智能 2023年6月26日
0066
CPU、GPU、NPU的区别

CPU、GPU、NPU的区别 CPU CPU（CentralProcessing Unit）中央处理器，是一块超大规模的集成电路，主要逻辑架构包括控制单元Control，运算单元A…

人工智能 2023年7月12日
00141
区域合并方法

区域合并区域合并方法将合并具有相似性的相邻区域。步骤如下：（1）图像初始区域分割：在极端情况下，可以认为每个像素为一个小区域。（2）确定相似性准则：可以基于相邻区域的灰度、颜…

人工智能 2023年6月20日
0098
动手学OCR笔记-介绍与实践

参考：https://gitee.com/paddlepaddle/PaddleOCR/tree/release/2.5/notebook/notebook_ch OCR技术挑战 …

人工智能 2023年7月9日
0088
al00华为手机_注意！你的手机可以免费升级了

作为一个道路新手和超级道路书呆子。 [En] As a road novice and a super road nerd. 有没有遇到过这种情况…. 紧张地看着导航找…

人工智能 2023年5月27日
00137
超实用的7种 pytorch 网络可视化方法，进来收藏一波

引导 * – 前言 – 1. torchsummary – 2. graphviz + torchviz – 3. Jupyter …

人工智能 2023年7月27日
0049
Win10安装opencv+clion配置史上最详细的保姆级教程

*安装环境 MinGW pyton2.7.x(2.7任意版本，我使用2.7.13) 下载链接：https://www.python.org/downloads/windows/ *…

人工智能 2023年7月20日
0062

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31