对比学习文本摘要论文阅读笔记

2023年5月31日上午4:22 • 人工智能 • 阅读 116

前言

近两年来，对比学习在图像领域大火，在NLP领域也出现了一些利用对比学习的工作。对比学习的一般思想是构造正样例(与原样例语义相似的样例）和负样例（与原样例语义不相似的样例），通过设计对比损失函数，缩小语义相似样例在表示空间中的距离，增大语义不相似的样例在表示空间中的距离，起到类似聚类的效果。关于对比学习，可以参考下面两篇文章。
哈工大SCIR-对比学习
 对白-对比学习在CV与NLP领域的进展
这篇博客记录了几篇将对比学习应用于文本摘要任务的论文，是个人的阅读笔记，仅供个人学习使用。

CONTRASTIVE LEARNING WITH ADVERSARIAL PER-TURBATIONS FOR CONDITIONAL TEXT GENERATION

Link:

https://arxiv.org/pdf/2012.07280.pdf

Motivation

seq2seq模型被广泛的应用在文本生成任务中，seq2seq模型在训练时往往采用teacher-focing的方法。这样就造成训练和测试阶段的不一致，训练时每个时间步输入的是真实label,而测试时看不到真实的token,每个时间步输入的是模型之前生成的token，这样容易导致错误，并且错误会一直积累下去，从而严重影响文本生成的质量，这个问题称为exposure-bias问题。针对这个问题，可以采用对比学习的方法，构造正例和负例，模型在训练时，不仅可以看到真实的标签，还可以看到错误的生成的tokens，从而有效缓解exposure-bias的问题。最简单的对比学习方法就是直接随机的选取非目标的序列作为负样本，但是这种做法并不好，因为随机选取的负样例非常容易被区分，特别是对于大规模的预训练模型来说。这篇文章利用对抗扰动(adversarial perturbations)的方法构造正负样例，使得负样例与目标序列在embedding空间上相似，但是在语义上非常不同，正样例与目标序列在embedding空间上非常不同，但是在语义上很相似，从而增加了正负样例区分的难度，使得模型学习的更加充分。这篇文章在机器翻译，摘要，问答三个任务上测试，发现设计的模型取得很好的效果。

Method

其中f代表encoder,d代表decoder，M是源序列编码后的向量表示。
传统的seq2seq文本生成存在exposure-bias问题，因此文章引入对比学习方法，文章同时构造了正样例和负样例
对于负样例，构造方法如下图所示
对比学习文本摘要论文阅读笔记

首先为目标序列的隐向量表示H施加一个微小的扰动δ \delta δ,得到一个新的向量表示，使得对应的条件似然(conditional likelihood)最小,从而使得构造负样例在embedding上与目标序列相似，但是在语义上与目标序列非常不同。构造公式如下面的公式3所示。这个式子本身不可解，可以利用（ Goodfellow，2015）中的方法线性近似，如公式4所示

这个目标函数的分子代表拉近源序列和目标序列在表示空间中的距离，分母代表推远源序列和构造的负样例在表示空间中的距离。
对于正样例，构造方法如下图：
对比学习文本摘要论文阅读笔记

首先为目标序列的隐向量表示增加一个大的扰动，使得构造的样例在embedding空间中与目标序列距离很远，同时通过最小化构造后样例的条件概率分布与原来条件概率分布的KL距离，来最大化构造的正样例的似然，使得构造的正样例在embedding上与源序列很远，但是在语义上与源序列相似。
具体的构造公式如下。这里做了两步近似。首先通过添加一个扰动，使得对比目标函数最小，这一步的目标是增大构造样例与源序列在表示空间中的距离。第二步在这个又添加了一个扰动，使得对应的KL距离最小。

最后构造正样例的目标函数，计算公式如下，分子使得构造的正样例与源序列的距离尽量近，分母使得构造的负样例与源序列的距离尽量远。

最后总的目标函数如下：
对比学习文本摘要论文阅读笔记

; Code:

https://github.com/seanie12/CLAPS

SimCLS: A Simple Framework for Contrastive Learning of Abstractive Summarization

Link

https://aclanthology.org/2021.acl-short.135/

Motivation

生成式文本摘要往往采用seq2seq模型的方法，这种方法存在两个问题，一方面学习的目标函数和最终的评价指标不一致，目标函数使用最大似然函数，是字符级别的，而评价指标是ROUGE等，都是句子级别的。另一方面，由于训练时使用teacher-forcing，存在上篇文章说的exposure-bias问题。在这篇文章中。作者提出了SimCLS模型,与上一篇文章不同，这篇文章将摘要生成和对比学习分离开，分为两个阶段，首先训练seq2seq模型，利用最大似然估计生成候选摘要，然后利用对比学习训练模型，对候选摘要进行reference-free的评价，选出最佳的摘要。

Method

上图给出了模型的总体架构，首先通过预训练的seq2seq模型（BART等）生成摘要，这里利用beam-search生成多个候选摘要，然后再用对比学习的方法训练RoBERTa模型，用训练好的模型对候选摘要进行reference-free的evaluation，为每个候选摘要计算一个与源文档的相关性得分，选出得分最高的摘要。

用对比学习方法训练rank模型，这里没有像一般的对比学习方法那样构造正例，负例，这里的对比反映在不同的候选摘要S i S_i S i 与D D D的相关性得分上，对比损失如下：

这里的S ^ \hat{S}S ^代表参考摘要，S ~ 1 , ⋯ , S ~ n \tilde{S}{1}, \cdots, \tilde{S}{n}S ~1 ,⋯,S ~n 代表生成的候选摘要，按照ROUGE得分降序排序。

; Code:

https://github.com/yixinL7/SimCLS

Enhanced Seq2Seq Autoencoder via Contrastive Learning for Abstractive Text Summarization

Link

https://arxiv.org/abs/2108.11992

Motivation

seq2seq模型对于噪声(data corruption,distribution shift)等不够robust,这篇文章通过结合多种形式的句子级别的数据增强和对比学习，设计了一个seq2seq的文本摘要模型，提高了模型的去噪能力。

Method

上图给出了模型的总体架构。首先对于给定的文档d，通过句子级别的数据增强得到一对增强后的文档，保留大部分的语义的同时引入噪声。这里的增强方法共有四种：Random Insertion (RI)、Random Swap (RS)、Random Deletion (RD)、Document Rotation(DR)。
对于一个包含k个文档的batch b = d 1 , d 2 , . . . d k b=d_1,d_2,…d_k b =d 1 ,d 2 ,…d k ，每个文档通过增强得到两个文档，一共得到2k个文档，由同一文档增强得到的两个文档构成一对正例，有不同文档增强得到的文档构成负例。将增强后的文档通过编码器编码得到隐向量表示h，同时通过一个非线性映射层g将h投影到另一个隐空间z = g ( h ) z=g(h)z =g (h )，用来计算对比损失函数，计算公式如下：

最后利用解码器分别为增强后的文档生成摘要，与原始文档的摘要对比，通过交叉熵函数计算损失L generate \mathcal{L}_{\text {generate }}L generate
最终的损失函数为

; Code

https://github.com/chz816/esacl

Original: https://blog.csdn.net/sdauguanweihong/article/details/120038239
Author: neu-gwh
Title: 对比学习文本摘要论文阅读笔记

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/548638/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

day1-机器学习-回归问题

1、机器学习，通过算法使得机器能从大量的数据中学习规律，并利用规律对未知数据进行预测。 2、回归，是对一个或多个自变量和因变量之间的关系进行建模，求解的一种统计方法。（注：预测的…

人工智能 2023年6月18日
0068
优化算法+神经网络：神经网络自动参数优化

当智能群优化算法遇上神经网络 * – 优化算法进行神经网络的参数寻优，解放深度调参 – + 1.已经实现的Genetic Algorithm优化Neural…

人工智能 2023年7月28日
0060
iNeuOS工业互联网操作系统，面向4个领域颁发第一批技术认证资质

为了更好的紧密合作、利益多赢和共建生态。iNeuOS工业互联网操作系统面向：仪器仪表、双碳环保、核能科学与工程和钢铁冶金领域颁发第一批技术认证资质，一共 21 名同志在项目实施过…

人工智能 2023年6月4日
0080
【免费通配符 SSL证书 (支持 IP) 申请教程】

分享几个具备免费通配符的网站OHTTPS：https://ohttps.com/Let’s Encrypt：https://letsencrypt.org/zh-cn/…

人工智能 2023年6月29日
0078
机器学习强基计划4-2：通俗理解极大似然估计和极大后验估计+实例分析

目录 0 写在前面 1 从一个例子出发 2 极大似然估计 3 极大后验估计 4 Python实现 ; 0 写在前面机器学习强基计划聚焦深度和广度，加深对机器学习模型的理解与应用。…

人工智能 2023年7月25日
0059
Meta-GNN：On Few-shot Node Classification in Graph 阅读笔记

文章目录 1、Abstract 2、Introduction 3、Contributions 4、Methods * – 4.1 Meta-GNN 4.2 Task S…

人工智能 2023年6月1日
0061
相机标定篇——相机标定

认为相机标定是三维重建的核心，研究生期间主要方向为结构光三维重建必要的数学知识线性方程求解Gauss消元法；LU分解；Cholesky分解最小二乘问题-线性方法特征值分解；奇异…

人工智能 2023年6月18日
0089
python –opencv图像处理Canny算子边缘检测(Roberts算子、Prewitt算子、Sobel算子、Laplacian算子、Scharr 算子、 LOG 算子)

边缘检测边缘检测是基于灰度突变来分割图像的常用方法，其实质是提取图像中不连续部分的特征。目前常见边缘检测算子有差分算子、 Roberts 算子、 Sobel 算子、 Prewit…

人工智能 2023年6月19日
0080
ubuntu18.04安装pytorch

文章目录一、Anaconda的下载安装二、查看自己的Python版本三、安装pytorch * 1.查看对应版本的pythorch并安装 2.测试默认CUDA已经安装，并查…

人工智能 2023年7月21日
0044
视频目标检测入门介绍

视频目标检测前言一、视频目标检测是什么？二、视频目标检测方法分类前言由于工作原因，要对视频目标检测做一些调研，最后想以文章的方式做一个总结，如果有说的不好的地方也请指出。…

人工智能 2023年7月12日
0068
递推最小二乘遗忘因子法(Recursive Forgetting Factor, RFF)

在普通的递推最小二乘算法中，随着数据的不断到来，显然矩阵X T X X^TX X T X中的元素会变得越来越大，而矩阵P k P_k P k 作为X T X X^TX X T X…

人工智能 2023年7月27日
0068
多标签文本分类研究进展概述

多标签文本分类研究进展概述 1.多标签文本分类的研究还有很大的提升空间. 2.多标签文本分类的基本流程，包括数据集获取、文本预处理、模型训练和预测结果； 3.多标签文本分类的方法：…

人工智能 2023年5月30日
00164
【目标检测】目标检测界的扛把子YOLOv5（原理详解+修炼指南）

文章目录 1.YOLO输入端 * 1.1 Mosaic数据增强 1.2 自适应锚框计算 1.3 自适应图片缩放 2.YOLO总体架构图 * 2.1 BackBone –…

人工智能 2023年7月26日
0060
复旦nlp实验室 nlp-beginner 任务二：基于深度学习的文本分类

任务二：基于深度学习的文本分类熟悉Pytorch，用Pytorch重写《任务一》，实现CNN、RNN的文本分类；参考 https://pytorch.org/ Convolut…

人工智能 2023年5月30日
0069
PyTorch到底好用在哪里?

一、全面性随着PyTorch逐渐成熟，我预计这部分的差距会趋近于零。但目前，TensorFlow还是有一些PyTorch不支持的功能。它们是：沿维翻转张量（np.flip, n…

人工智能 2023年5月25日
0078
【附源码】Python计算机毕业设计球迷信息交流论坛

项目运行环境配置：Pychram社区版+ python3.7.7 + Mysql5.7 + HBuilderX+list pip+Navicat11+Django+nodejs。 …

人工智能 2023年6月27日
0065

2024 年 4 月
一	二	三	四	五	六	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30

对比学习文本摘要论文阅读笔记

Link:

Motivation

Method

; Code:

Link

; Code:

Link

Motivation

Method

; Code

大家都在看