SSMix：用于文本分类的基于显著性的广度Mixup

2023年7月17日上午12:38 • 人工智能 • 阅读 84

论文链接：https://arxiv.org/pdf/2106.08062.pdf SSMix：用于文本分类的基于显著性的广度Mixup http://SSMix: Saliency-Based Span Mixup for Text Classification ;论文代码：

https://github.com/clovaai/ssmix SSMix：用于文本分类的基于显著性的广度Mixup https://github.com/clovaai/ssmix ;

7、Paired sentence tasks

1、Abstract

在计算机视觉任务中，mixup数据增强已被证明是有效的。但文本是由长度可变的离散标记组成，将mixup应用于NLP任务仍然存在一定障碍。

这一篇文章提出一种新的混合方法（ SSMix），通过在 输入文本上进行操作，而 不是在隐藏向量上操作。SSMix通过基于广度的mixup保持两个原始文本的局部性，并根据显著性信息保留更多与预测相关的标记。

实验验证在文本分类基准上优于隐藏层混合方法，包括文本蕴涵、情感分类和问题类型分类。

图 1.SSMix示意图

和

分别标记为 negative和 positive。其中颜色越深表示对相应单词的贡献越大。从

中选出贡献值最小的单词，并用

中贡献值最大的单词替换它。输出结果为

=mixup(

)。同时设置了一个mixup比例

，图1中

设置为0.2，因为序列的总长度为10，替换了两个单词，2/10=0.2。

SSMix方法具体流程：

（1）首先，将连续标记的范围替换为另一个文本中的范围来进行合成，以保留混合文本中两个源文本的位置；

（2）根据显著性信息选择要替换的范围和要替换的范围，以使混合文本包含与输出预测更相关的标记，这在语义上可能很重要。

2 、SSMix

基于显著性信息将一个文本中的部分段替换为另一个文本中的部分段从而合成一个新的文本。具体示意图如图1所示。

3、Saliency

显著性度量数据的每个部分（本文为token）如何影响最终的预测，一般是采用基于梯度的方法计算显著性；本文通过 计算分类损失相对于输入嵌入的梯度，并使用其大小s作为显著性：

然后使用 L2-norm获得梯度向量的大小，然后将梯度向量作为每个token的显著性；

4、Mixing text

文本数据

和

是离散的序列，采用显著性得分，

中长度为

的最不显著性区域表示为

，对于

中长度为

的最显著性区域表示为

。其中

表示之前的mixup比（混合比）；

最终的输出为

，其中

和

是原始文本

中分别位于

的左侧和右侧的token；

5、same span length

将原始跨度

和替换跨度

的长度设置为相同大小，主要是考虑到不同的跨度长度将导致冗余和不明确的混合变化，并且计算不同跨度之间的混合比过于复杂。在跨度长度相同的情况下，本文的方法使得显著性的效果最好；由于SSMix不限制token的位置，可以选择最显著的跨度，并在其他文本上用最不显著的跨度替换它；

6、Mixing label

将标签的混合比

设置为

，这个混合比与之前的

不同。

的标签设置为

，

算法1显示了如何利用原始样本计算增强样本的mixup损失；根据每个样本的原始目标标签计算增强输出Logits的交叉损失，并通过加权和将其组合；

应用SSMix与分类数据集的标签总数无关，在任何数据集上，输出标签比例都是通过两个标签的线性组合来计算的。

Mixup损失计算

7、Paired sentence tasks

对于需要一对文本作为输入的任务，如文本隐含推理和相似性分类。SSMix以成对的方式进行混合，通过聚合每个mixup结果中的标记计数来计算mixup比例。对于给定样本：

合成的新样本为：

其中mixup的混合比为：

其中ps和qs为每个mixup操作中的替换片段。

具体过程如下图所示：

在这个例子中：

为 “Fun for only children.”
为 “Fun for adults and children.”
为 “Problems in data synthesis.”
为 “Issues in data synthesis.”
=(1+1)/(5+6)=2/110.18。

剩下都是实验结果部分，本文就不再赘述，重点关注方法部分。感兴趣的可以看原论文。

Original: https://blog.csdn.net/weixin_43687366/article/details/122624974
Author: Chukai123
Title: SSMix：用于文本分类的基于显著性的广度Mixup

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/697546/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

DBNet训练过程笔记（超详细)

DBNet训练过程笔记论文是Real-time Scene Text Detection with Differentiable Binarization，关于论文讲解有很多。代…

人工智能 2023年5月28日
0084
python读取csv时keyerror_python – Pandas KeyError：CSV文件数据帧的年份 – 堆栈内存溢出…

我有一个类似他的数据框： BirthYear Sex Area Count 2015 W Dhaka 6 2015 M Dhaka 3 2015 W Khulna 1 2015 M…

人工智能 2023年7月8日
0058
一文详细介绍情绪识别常用的数据集

一文详细介绍情绪识别常用的数据集 SEED * 采集情况文件介绍 SEED-IV * 采集情况文件介绍 CIAIC多模态情感识别数据 * 采集情况文件介绍 DEAP * 采集…

人工智能 2023年7月1日
0063
【自然语言处理（NLP）】基于GRU实现情感分类

; 【自然语言处理（NLP）】基于GRU实现情感分类作者简介：在校大学生一枚，华为云享专家，阿里云星级博主，腾云先锋（TDP）成员，云曦智划项目总负责人，全国高等学校计算机教学与…

人工智能 2023年7月3日
0083
windows下深度学习框架搭建：tensorfow-gpu1.14.0+cuda10.0+cudnn7.4+python3.6

一、安装anaconda Python3.6环境。若非python3.6环境，可以在anaconda navigator->environments->create创建…

人工智能 2023年5月25日
0053
安装好cuda和cudnn后，安装tensorflow的一些问题

安装cuda和cudnn 1.下载 2018-12-Windows-x86_64.exe 安装anaconda并以管理员身份启动anaconda prompt: 升级 pipcur…

人工智能 2023年5月25日
0059
机器学习实战4（Logistic回归篇）

目录 1、Logistic回归 2、Logistic回归代码 3、Logistic回归算法实例1–从疝气病预测病马的死亡率 4、小结 1、Logistic回归本篇首先…

人工智能 2023年6月18日
0081
图像处理图像识别模式识别分类检测

文章目录图像处理 * 图像识别模式识别图像识别的过程图像识别的应用分类与检测图像处理图像识别 • 图像识别技术是信息时代的一门重要的技术，其产生目的是为了让计算机代替…

人工智能 2023年6月18日
0089
mac arm 架构安装PHP redis 扩展

抵扣说明： 1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。2.余额无法直接购买下载，可以购买VIP、C币套餐、付费专栏及课程。 Original: https:…

人工智能 2023年6月27日
0069
Google Earth Engine（GEE）——Sentinel-1 和 2 数据的融合，水稻范围识别和水稻种植季节区分地图绘制—马来西亚为例

最近发现了一个巨牛的人工智能学习网站，点击跳转到网站：前言 – 床长人工智能教程这次给大家推荐一篇文章，关于水稻识别：使用 GEE 平台中的无监督分类整合 Sentinel-1 …

人工智能 2023年5月31日
0087
【TGRS】Ship Detection in Large-Scale SAR Images Via Spatial Shuffle-Group Enhance Attention译读笔记

论文信息 Ship Detection in Large-Scale SAR Images Via Spatial Shuffle-Group Enhance Attention …

人工智能 2023年7月12日
0044
Aspect-based Sentiment Analysis with Type-aware Graph Convolutional Networks and Layer Ensemble 阅读笔记

1.Introducton 本文是2021年会议NAACL上的一篇文章。在这篇文章中，作者提出了一种具有多层结构的类型感知图卷积神经网络模型（T-GCN）。 2.Model 2.1…

人工智能 2023年5月28日
0059
用cplex 做分类 python

除了运筹优化的问题，也可以用精确求解方式尝试分类问题。让我们试试鸢尾花数据集。 from sklearn import datasetsiris = datasets.load_…

人工智能 2023年7月1日
0052
AI：Python与人工智能相关的库/框架(机器学习&深度学习&数据科学/计算机视觉/自然语言处理)的简介、案例应用之详细攻略

AI之DS/CV/NLP：Python与人工智能相关的库/框架(数据可视化常用库、机器学习常用库、数据科学常用库、深度学习常用库、计算机视觉常用库、自然语言处理常用库)的简介、案例…

人工智能 2023年6月25日
0059
怎么用cmd命令行窗口运行python文件

考虑到有些小伙伴，安装了 python 3环境，但没有安装 PyCharm开发工具。那么在安装了 python 3的环境下，如何使用 Window 系统自带的 cmd命令行工具来…

人工智能 2023年7月5日
0073
2022最新SLAM面试题汇总（持续更新中）

目前机器人SLAM问题是一个非常值得研究的方向，在未知环境中，首先要通过SLAM技术获得环境的地图，然后才能进行导航。这个方向是近几年比较新的研究方向，相关的机器人公司以及研究机器…

人工智能 2023年7月27日
0054

2024 年 4 月
一	二	三	四	五	六	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30

SSMix：用于文本分类的基于显著性的广度Mixup

大家都在看