推荐系统笔记（十）：InfoNCE Loss 损失函数

2023年7月25日下午6:02 • 人工智能 • 阅读 64

背景

对比学习损失函数有多种，其中比较常用的一种是InfoNCE loss。最近学习实现了SGL推荐系统算法，对InfoNCE Loss做一个总结。

InfoNCE Loss损失函数是基于对比度的一个损失函数，是由NCE Loss损失函数演变而来。那为什么要使用InfoNCE Loss呢？将在下文介绍到。

原理

介绍InfoNCE Loss需要先介绍NCE Loss损失函数。

NCE Loss

NCE是基于采样的方法，将多分类问题转为二分类问题。以语言模型为例，利用NCE可将从词表中预测某个词的多分类问题，转为从噪音词中区分出目标词的二分类问题，一个类是数据类别 data sample，另一个类是噪声类别 noisy sample，通过学习数据样本和噪声样本之间的区别，将数据样本去和噪声样本做对比，也就是”噪声对比（noise contrastive）”，从而发现数据中的一些特性。。

详细请参考：求通俗易懂解释下nce loss？ – 知乎

论文链接：https://arxiv.org/pdf/1410.8251.pdf

NCE Loss的一般表示形式为：

但是，如果把整个数据集剩下的数据都当作负样本（即噪声样本），虽然解决了类别多的问题，计算复杂度还是没有降下来，解决办法就是做负样本采样来计算loss，这就是estimation的含义，也就是说它只是估计和近似。

InfoNCE Loss

Info NCE loss是NCE的一个简单变体，它认为如果你只把问题看作是一个二分类，只有数据样本和噪声样本的话，可能对模型学习不友好，因为很多噪声样本可能本就不是一个类，因此还是把它看成一个多分类问题比较合理，公式如下：

其中的q和k可以表示为其他的形式，比如相似度度量，余弦相似度等。分子部分表示正例之间的相似度，分母表示正例与负例之间的相似度，因此，相同类别相似度越大，不同类别相似度越小，损失就会越小。

我们注意到有一个温度系数，这个温度系数有什么作用呢？

温度系数

是设定的超参数，它的作用是控制模型对负样本的区分度。温度系数设的越大，q*k的分布变得越平滑，那么对比损失会对所有的负样本一视同仁，导致模型学习没有轻重。如果温度系数设的过小，则模型会越关注特别困难的负样本，但其实那些负样本很可能是潜在的正样本，这样会导致模型很难收敛或者泛化能力差。因此温度系数的设定是不可或缺的。

为什么不能使用交叉熵损失函数呢？

交叉熵损失函数的形式如图所示：

但是在之前的实现中我们发现推荐系统中LightGCN的实现的

是一个one-hot向量，因此交叉熵损失函数表示为：

这和InfoNCE Loss的损失函数的形式十分相似，不同在于，上式中的k在有监督学习里指的是这个数据集一共有多少类别，比如CV的ImageNet数据集有1000类，k就是1000。而在InfoNCE loss中类别只有两类或者几类，而交叉熵损失函数每一个用户或者商品自成一类，softmax操作在如此多类别上进行计算是非常耗时的，再加上有指数运算的操作，这导致计算复杂度相当高且不能实现。因此在对比学习中使用InfoNCE Loss而不是交叉熵损失和NCE Loss。

总结

InfoNCE Loss是为了将N个样本分到K个类中，K<

Original: https://blog.csdn.net/qq_46006468/article/details/126076039
Author: 甘霖那
Title: 推荐系统笔记（十）：InfoNCE Loss 损失函数

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/715551/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

机器学习-卷积神经网络之深度残差网络（三）

背景介绍：MNIST数据集识别黑白的手写数字图片，不适合彩色模型的RGB三通道图片。用深度残差网络学习多通道图片。简单介绍一下深度残差网络：普通的深度网络随着网络深度的加深，拟合…

人工智能 2023年5月26日
0097
目标追踪—deepsort代码讲解

目录一、目标追踪整体代码二、主要功能 2.1 Configs文件目录下： 2.2 deep_sort/deep_sort/deep目录下： 2.3 deep_sort/deep…

人工智能 2023年7月22日
0067
echarts做企业关系图谱_知识图谱平台化助力知识图谱行业大发展

知识图谱平台是知识图谱成功的保障作者：漆桂林 2019年5月份的CSDN CTA核心技术及应用峰会，我做了一个知识图谱技术分析和平台化路线的主题演讲，回顾这一年来知识图谱的发展，…

人工智能 2023年6月10日
0083
零基础学python（5/7）|pandas|DataFrame/Series

数据序列 ⭕创建序列：pd.Series() ⭕序列转换为numpy：series.to_numpy() ⭕序列转换为list：series.values.tolist() ⭕创建…

人工智能 2023年7月9日
0084
Pytorch模型加密的方法

*加密过程 *解密过程 pip install cryptography from cryptography.fernet import Fernet key = Fernet.g…

人工智能 2023年6月17日
0060
git branch 分支管理

在多人协作的情况下,master通常是稳定的分支.可以再建一些”develop”,”testing”等名称的分支.主管master的…

人工智能 2023年6月4日
0066
手把手医学知识图谱搭建案例

手把手医学知识图谱搭建案例注：大家觉得博客好的话，别忘了点赞收藏呀，本人每周都会更新关于人工智能和大数据相关的内容，内容多为原创，Python Java Scala SQL 代码…

人工智能 2023年5月28日
0092
《机器学习》学习笔记8：无监督学习 – 聚类与降维

Week8 无监督学习：聚类与降维基于吴恩达《机器学习》课程参考黄海广的笔记[TencentCloudSDKException] code:FailedOperation.Serv…

人工智能 2023年6月2日
0095
知识图谱从入门到应用——知识图谱推理：基础知识

分类目录：《知识图谱从入门到应用》总目录推理能力（Reasoning）是人类心智区别于普通物种的重要特征之一。人类通过推理，从已知的事实中获取和习得新的知识，包含了认知、理解、抽…

人工智能 2023年6月1日
0069
AI模型精準度TP、FN、FP、TN的計算方法

定義：真實預測正例反例正例TPFN反例FPTN 真實分類：A，B，C。每類20個樣本。按照下面格式統計下數值，根據定義，可以填充A，B，C的tp、fn、fp、tn值。準確率對…

人工智能 2023年6月21日
0070
什么是人工智能？人工智能如何系统的学习

一、什么是人工智能什么是人工智能？人工智能是计算机科学的一个分支，它企图了解智能的实质，并生产出一种新的能以人类智能相似的方式做出反应的智能机器，该领域的研究包括机器人、语言识别…

人工智能 2023年5月30日
0081
STM32移植神经网络（5）– STM32部分（模型移植）

1 简介上次写到将OV56640采集的JPEG数据存入SD可存储，后续就需要使用STM32的硬件JPEG解码将图片从SD取出，并将其转换为RGB888格式。具体的可以参考正点的硬…

人工智能 2023年7月13日
00111
MySQL(9)-聚合函数、分类汇总、多表查询

GROUP BY 列名1[,…n] GROUP BY 列名1[,…n]; WHERE 条件 GROUP BY 列名1，列名2，…; HAVING…

人工智能 2023年7月3日
0055
python数据分析之民航业客户建模分析实战

目录 1背景与挖掘目标 * 1.1 航空信息属性表（一部分列） 1.2 分析方法和过程 2 数据预处理 3 描述性分析 * 3.1 数据标准化方法，这里用 z-score 3.2 …

人工智能 2023年7月18日
0085
python实现多人脸识别

本篇文章是使用python通过调用电脑摄像头实时检测摄像头画面识别画面中的人脸这里的python版本是3.9，各个版本思路上相似我的大体思路是：采集人脸数据—-&g…

人工智能 2023年7月18日
0059
初学者好 |如何从头开始创建一个图像识别的AI应用[ctrl:c+v，你就完成了]

🔔 博客主页：https://blog.csdn.net/weixin_41556756 📣 欢迎🎉点赞👍收藏🌟评论📝如有错误请指正! 💻 前端&Python领域博主 😁 …

人工智能 2023年5月25日
0060

2024 年 4 月
一	二	三	四	五	六	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30

推荐系统笔记（十）：InfoNCE Loss 损失函数

背景

原理

总结

大家都在看