Zero-Shot跨语态抽取式文摘

2023年5月28日上午2:06 • 人工智能 • 阅读 106

前言

抽取式摘要可谓是一项很常见的NLP任务，但是由于缺乏训练语料使得这项任务比较难进行train，可是我们知道英文的相关数据集其实很多，于是可以通过跨语态的技术来辅助目标语言的抽取摘要学习。即利用英语的数据集作为监督信息来对齐学习目标语言，进而达到目标语言的监督学习。

今天来介绍的这篇就是解决这个问题的，一起来看下吧~

论文链接：https://arxiv.org/pdf/2204.13512v1.pdf

方法

既然想利用跨语态，那其实首先要解决的就是怎么对齐语种。作者这里借助了两个常见的方法：

Word Replacement (WR)：单词替换即从英文句子中随机选取一些word，然后通过词典用目标语言单词替换。

Machine Translation (MT) ：这个就很好理解了，直接借助翻译工具进行整句翻译。

接下来说说标签的事，既然要进行监督学习就得有label，具体到抽取式摘要这个任务，其实就是一个分类任务，假设有一个待抽取摘要的英文doc D，其对应的摘要是S，就是说D中的每个句子其实是一个二分类，在S中的label就是1不在的就是0，作者结合跨语态一共设计了4,种label如下：

图中EN代表英文，FR代表目标语言，可以看到一共有a,b,c,d四种label。

首先看a就是很简单的英文原始监督语料，b是利用MT分别将D和S翻译成目标语言，c是利用MT将D翻译成目标语言然后利用WR(100%替换)将S替换成目标语言，d是保持D不变对于S先利用MT翻译然后再利用WR回译为英文。

除了上面的，作者还增加了一个Neural Label如下

这里公式和符号有点多，我们从上到下一点点来看，第一个公式也即(4)其实就是过了transformer结构得到的表征，U是上述abcd四种情况的集合，对于在U的就是过了模型结构后的概率，不在的直接就是0，第二个公式就是pooling了一下，第三个公式就是得到Neural Label的关键，第四个公式就是归一化了一下，因为对于抽取式摘要结果就是预测一个概率大于0.5的就认为是摘要保留，所以这个加了一个0.5。

有了上述的准备后，下面就可以进行监督学习了，具体的Loss如下

CE是交叉熵，第一个的label句子的非0即1，第二个的l如前面所讲，后面两个句子分别是非pooling和pooling方式，其label也很简单就是在abcd就是1不在就是0。

实验效果

更多详细的结果可以看paper

总结

不仅是摘要抽取，其他很多NLP任务其实都存在Zero-Shot问题，而诸如英文等语料非常多，所以可以考虑使用跨语态的方法来辅助增强学习，但是说实话确实有难度，具体是不是有效还是以实验结果为准吧。不论怎样跨语态是一个可以实验的思路吧，而本篇paper的idea大家可以借鉴一下。

关注

欢迎关注，下期再见啦~

欢迎关注笔者微信公众号：

github:

Mryangkaitong · GitHubhttps://github.com/Mryangkaitong

知乎：

小小梦想 – 知乎

Original: https://blog.csdn.net/weixin_42001089/article/details/124562579
Author: weixin_42001089
Title: Zero-Shot跨语态抽取式文摘

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/528706/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

工业通讯总线RS485和RS232

工业通讯总线RS485和RS232 1.RS232 RS-232 标准接口（又称 EIA RS-232）是常用的串行通信接口标准之一，它是由美国电子工业协会(Electroni…

人工智能 2023年6月27日
0085
python的pandas的stack和unstack函数的使用及区别

版权声明：转载请注明作者（独孤尚良dugushangliang）出处：https://blog.csdn.net/dugushangliang/article/details/11…

人工智能 2023年7月8日
00113
机器学习 – 主成分分析法 (PCA)

文章目录 * – 1. 主成分分析问题 – 2. 主成分分析算法 – 3. 重建的压缩表示 – 4. 选择主成分的数量 1. 主成分…

人工智能 2023年6月16日
00133
（附源码）python音乐电台推荐系统的设计与实现毕业设计 301210

经历了几个月的毕业设计之旅，遭遇了无数难题与挑战，几经波折后，近乎要摧毁我当初选择这个题目的信心。好在我的导师一直坚持对我悉心支持，并对此套系统提出了诸多改善意见，解决了我所遇到的…

人工智能 2023年7月5日
00117
腾讯：专注于通用领域的知识图谱—Topbase 学习笔记

https://zhuanlan.zhihu.com/p/145112755来源为万字详解：腾讯如何自研大规模知识图谱 Topbase 一、简介知识图谱（ Knowledge G…

人工智能 2023年6月1日
0088
RNN与LSTM简单案例实现

使用梯度下降算法，更新转换矩阵W的参数，更新公式为：W = W – 0.01 * (1 – L), 写出更新后的参数W 【RNN版】 from math i…

人工智能 2023年5月28日
0093
利用python进行数据分析笔记

一、第一章：准备工作 1、引入惯例 Python社区已经广泛采取了一些常用模块的命名惯例： import numpy as np import matplotlib.pyplot …

人工智能 2023年7月16日
0075
用自编码器实现信用卡数据集的异常检测(详细)，Pytorch版本

1.自动编码器(Auto encoder) 自动编码器(au toencoder) 是神经网络的一种，该网络可以看作由两部分组成：一个编码器和一个生成重构的解码器)。传统上，自动编…

人工智能 2023年7月13日
0085
python 3.10上安装pyqt5

python 3.10上安装pyqt5 前言首先，看一下自己电脑上的python的版本，网上有太多乱七八糟的教程，啥也不说就硬教，跟着做的话就会出现稀里糊涂的报错，很耽误时间。我…

人工智能 2023年7月5日
00305
TTS生成wav格式音频添加报头信息

由于使用百度语音或是科大讯飞语音TTS合成的音频文件，内部没有写入音频的关键信息，如采样率，码率，通道数，位数等信息。在linux下，使用 aplay命令无法播放此类不包含报头信息…

人工智能 2023年5月25日
0088
用python从日期中获取年、月、日、星期等30种信息

大家好, 本博客将持续更新python数据分析技巧, 一次解决一类（个）问题，欢迎关注订阅! 这次介绍日期数据处理。用python中的方法对日期数据进行处理, 我们可以获取很多有用…

人工智能 2023年7月14日
0062
Java API – Math类-System类-BigDecimal类的常用API

Math类介绍包含执行基本数字运算的方法，Math类没有提供公开的构造器。因为Math类是一个工具类, 不需要创建对象; Math类的成员都是静态的，通过类名就可以直接调用 Ma…

人工智能 2023年7月30日
0070
基本的图像操作和处理（计算机视觉）

文章目录一、图像的灰度变换 * 原理介绍：代码示例：结果展示：二、图像轮廓和直方图 * 1.图像轮廓 2.直方图处理 – 原理介绍直方图的性质 3.代码示例 …

人工智能 2023年6月22日
00112
AttributeError: module ‘cv2.cv2‘ has no attribute ‘face‘

AttributeError: module ‘cv2.cv2’ has no attribute ‘face’解决方案今天运行一…

人工智能 2023年7月5日
0086
[总结] 半监督学习方法: 一致性正则化(Consistency Regularization)

许多机器学习方法中, 尤其是深度学习中的神经网络, 都存在几个问题: 模型容易过拟合. 模型在受到微小扰动(噪声)后, 预测结果会受相当程度的影响. 为了减少过拟合现象, 典型的监…

人工智能 2023年6月13日
00105
PyTorch 10大常用损失函数Loss Function详解

目录前言一、损失函数二、详解 1.回归损失 2.分类损失三. 总结前言损失函数在深度学习中占据着非常重要的作用，选取的正确与否直接关系到模型的好坏。本文就常用的损失函…

人工智能 2023年6月16日
0093

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

Zero-Shot跨语态抽取式文摘

大家都在看