Pytorch之KLDivLoss

2023年6月15日下午11:24 • 人工智能 • 阅读 85

理论基础

KL散度：衡量两个概率分布之间的相似性，其值越小，概率分布越接近。公式表达如下。

D K L ( P ∥ Q ) = ∑ i = 1 N [ p ( x i ) log ⁡ p ( x i ) − p ( x i ) log ⁡ q ( x i ) ] = ∑ i = 1 N [ p ( x i ) log ⁡ p ( x i ) log ⁡ q ( x i ) ] \begin{aligned} D_{K L}(P \| Q) & =\sum_{i=1}^{N}\left[p\left(x_{i}\right) \log p\left(x_{i}\right)-p\left(x_{i}\right) \log q\left(x_{i}\right)\right] \ & = \sum_{i=1}^{N}\left[p\left(x_{i}\right) \frac{\log p\left(x_{i}\right)}{\log q\left(x_{i}\right)} \right] \end{aligned}D K L (P ∥Q )=i =1 ∑N [p (x i )lo g p (x i )−p (x i )lo g q (x i )]=i =1 ∑N [p (x i )lo g q (x i )lo g p (x i )]

注：对于两个概率分布 P P P 、Q Q Q，P P P 为真实事件的概率分布，Q Q Q 为随机事件拟合出来的该事件的概率分布，即 D K L ( P ∥ Q ) D_{K L}(P \| Q)D K L (P ∥Q ) 表示使用 P P P 来拟合 Q Q Q，或者说使用 Q Q Q 来指导 P P P。

实现

import torch
import torch.nn as nn
import torch.nn.functional as F

input = torch.tensor([0.7, .1, .2], requires_grad=True)

target = torch.tensor([.2, .5, .3])

kl_loss = nn.KLDivLoss(reduction="batchmean")
output = kl_loss(F.log_softmax(input, dim=0), F.softmax(target, dim=0))
print(output)

print(F.kl_div(F.log_softmax(input, dim=0), F.softmax(target, dim=0), reduction="batchmean"))

my_kl_loss = F.softmax(target, dim=0) * (torch.log(F.softmax(target, dim=0)) - F.log_softmax(input, dim=0))
my_kl_loss = my_kl_loss.mean()
print(my_kl_loss)

my_kl_loss2 = F.softmax(target, dim=0) * (F.log_softmax(target, dim=0) - F.log_softmax(input, dim=0))
my_kl_loss2 = my_kl_loss2.mean()
print(my_kl_loss2)

几个要点：

KL散度的原理
KL实现为什么要做log和softmax
上溢出和下溢出的情况
在pytorch的log函数中，默认是以e e e 为底数的

参考：

Original: https://blog.csdn.net/king_project/article/details/125782232
Author: 逸彬
Title: Pytorch之KLDivLoss

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/618173/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

NER系列之《如何在pytorch搭建的模型中引入CRF(条件随机场)》（pytorch-crf库）

🦄crf可谓是NER任务小能手了，所以搞NER就得玩玩crf。 ⭐torch官方tutorials部分提供的crf链接：点击进入，该链接里是结合了bi-lstm和crf的代码教程（…

人工智能 2023年7月23日
0073
使用 Pandas GUI 进行数据探索

数据预处理是数据科学管道的重要组成部分，需要找出数据中的各种不规则性，操作您的特征等。 Pandas 是我们经常使用的一种工具，用于处理数据，还有 seaborn 和 matplo…

人工智能 2023年7月16日
0047
mlp多层感知机预测（python）

可以对比我之前发布的文章1.BP神经网络预测（python）2.lstm时间序列预测+GRU（python）3. 数据集点击此处即可进行下载这篇文章用的数据和我之前发布的BP神经网…

人工智能 2023年7月5日
0078
3. 梯度提升决策树（GBDT）详解

一、提升树以决策树为基函数的提升方法称为提升树。其中，分类问题采用二叉分类树，回归问题采用二叉回归树。sklearn中的提升树采用的是CART树。模型可以表示为决策树的加法模型：…

人工智能 2023年6月16日
0051
ImportError: cannot import name ‘get_config‘ from ‘tensorflow.python.eager.context‘

使用以下项目时出错 [En] An error occurred while using the following item 报错完整信息： Traceback (most re…

人工智能 2023年5月23日
0065
MATLAB–二维图像和三维图像的绘制

目录一、基本绘图命令 1、plot绘图命令 ①plot命令的几种不同格式 ②基本线形、标记和颜色 2、fplot绘图命令 3、ezplot绘图命令 4、subplot绘图命令 5…

人工智能 2023年6月29日
0062
Pandas

1.Pandas的数据结构分析 Pandas中的两个主要数据结构：Series和DataFrame Series:一维的数据结构 DataFrame:二维的，表格型的数据结构 (1…

人工智能 2023年7月8日
0091
机器学习笔记 Classification 分类

Classification 分类分类问题的应用能否用Regression去解决Classification？理想的分类模型取球例子宝可梦的分类分类function进一…

人工智能 2023年7月1日
0058
如何判断一个模型是否出现了过拟合

如何判断一个模型是否出现了过拟合的问题过拟合是指机器学习模型在训练集上表现良好，但在测试集或新数据上表现较差的现象。为了判断一个模型是否出现了过拟合，通常可以通过以下步骤来进行评…

人工智能 2023年12月30日
0041
3. 梯度提升决策树（GBDT）详解

一、提升树以决策树为基函数的提升方法称为提升树。其中，分类问题采用二叉分类树，回归问题采用二叉回归树。sklearn中的提升树采用的是CART树。模型可以表示为决策树的加法模型：…

人工智能 2023年6月30日
0086
开箱即用，涵盖主流模型的图像分类|主干网络学习/对比/魔改项目

文章目录前言测试环境支持模型（点击跳转到训练自己数据集教程页）训练评估类别激活图可视化 ; 前言项目地址：https://github.com/Fafa-DL/Awe…

人工智能 2023年7月3日
0074
大学生HTML个人网页作业作品：基于html css实现围棋网页（带报告4800字）

🎉精彩专栏推荐 💭文末获取联系✍️ 作者简介: 一个热爱把逻辑思维转变为代码的技术博主💂 作者主页: 【主页——🚀获取更多优质源码】🎓 web前端期末大作业：【📚毕设项目精品实战…

人工智能 2023年6月29日
0090
CentOS7和CentOS8 FreeSWITCH 1.10.7 简单图形化界面4-IVR自动话务台

CentOS7和CentOS8 FreeSWITCH 1.10.7 简单图形化界面4-IVR自动话务台 1、添加自动话务台 2、更新数据图形界面安装，请参考https://blo…

人工智能 2023年5月25日
0067
Anaconda安装Tensorflow-GPU

1.0 安装前的准备第一步：查看显卡支持的CUDA版本如图所示，我的显卡支持的最高版本是11.6。 [En] As shown in the picture, the maxi…

人工智能 2023年5月23日
0072
文本意图识别方案整理

意图识别本质上是文本分类问题，从目前的对话数据来看，用户说的话一般是短文本，长度大多在几十个字内，其中关键词和短语对分类显著的作用。目前主流的本文分类模型可以分为CNN、RNN和…

人工智能 2023年6月25日
00109
neo4j社区版下载

目录认识neo4j Neo4j的安装 JDK下载打开neo4j 认识neo4j Neo4j是一个高性能的,NOSQL图形数据库，它将结构化数据存储在网络上而不是表中。它是一个嵌…

人工智能 2023年6月1日
0079

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

Pytorch之KLDivLoss

大家都在看