【论文解读】NER任务中的MRC（机器阅读理解）

2023年6月10日上午1:58 • 人工智能 • 阅读 133

论文：https://arxiv.org/pdf/1910.11476v6.pdf

前沿：

在之前的NER任务中常常分为两种：nested NER和 ﬂat NER。从直观的角度来看，nested NER考虑到了实体嵌套问题。

发展：

flat NER的任务通常形式化为序列标记任务：序列标记模型，但是这种序列标记的模型无法考虑到实体嵌入关系问题。如中国移动是一个公司实体，而中国是一个国家实体，在flat NER中可能只能提取出中国移动整体却忽视了中国这个部分。
考虑到这个问题后，提出了pipelined systems用来实现nested NER，但是pipelined systems具有错误传播，运行时间长以及开发手工特征的强度大等缺点。
而MRC对于NER任务的处理便由之而来，在论文中作者表明了MRC对于flat NER和nested NER任务都有了提升。

什么是MRC

简单来说MRC是一种以问答方式解决NER任务的模型结构，通过给出相关实体的描述（问题），然后在文本中找出相对应的答案，这个方式就像做阅读理解一样。

例子：中国移动发布了一个新方案

flat NER：按照标记，标记每一个token，然后找出实体。而属于中国移动公司实体的一部分的中国国家实体无法获得。缺点：无法获取的嵌入实体的信息。

nested NER：将中国，中国移动保存起来（通过栈，队列等等方式），使用递归迭代等方式判断，缺点：时间复杂度过高，一个错误后面全错。常用方法：多层CRF网络，超图，分类器等等。

MRC：构建实体描述信息（问题）：公司：一个以营利为目的的社团法人，国家：一个具有民族意义的社会团体。然后在文本中提取具有此信息的实体。不仅时间复杂度下降了很多，而且由于开始时便给出了语义先验信息使得在少量训练集的情况下也能得出较好的效果。

MRC实现步骤

数据集构建：

需要将NER数据集转换为一组（QUESTION，ANSWER，CONTEXT）三元组。

QUESTION：描述每个实体（q1,q2,….,qn）,每个q代表一个实体的描述语句，长度为实体的个数。

ANSWER：Xstart，Xend = {Xstart ，Xstart+1，……，Xend}，代表实体对应在文本中的开始和结尾索引。

CONTEXT：代表整个文本。

每个数据的相关表现形式为：(qy, Xstart,Xend, X)。

问题的生成

问题生成过程很重要，因为查询会编码有关标签的先验知识，并对最终结果产生重大影响。

在论文中作者给出了他们生成问题的注释：

模型详细

模型结构

在论文中作者表示了模型的基本结构使用了bert作为预训练模型，{[CLS], q1, q2, …, qm, [SEP], x1, x2, …, xn}作为bert的输入，（bert：Simple to Bert | Ripshun Blog），最后通过bert我们可以得到一颗answay。

Span Selection

MRC中有两种Span Selection策略：

第一种策略是让两个n类分类器分别预测开始索引和结束索引，其中n表示上下文的长度。由于softmax函数放在上下文中的所有token上，因此该策略的缺点是，给定查询只能输出单个范围；

另一种策略是具有两个二进制分类器，一个用于预测每个标记是否为起始索引，另一个用于预测每个标记是否为结束索引。该策略允许为给定上下文和特定查询输出多个开始索引和多个结束索引，因此有可能根据qy提取所有相关实体。

训练流程

首先token通过bert预训练得到字向量。
通过liner和softmax将维度降为二维概率分布（表示是否为start或end）

通过argmax将是start或end的转成1
end与start同理，这样可以训练出2个只含1和0的向量分别代表start和end。
输出其中为1的（即是start或end）位置

最后通过sigmoid将输出可能为实体的词的概率。

损失值计算

在论文中损失值主要计算了3个部分，采用了交叉迭代的方法：

编号为strat的损失值
编号为end的损失值
实体概率的损失值

将三者综合得到整体的损失值：

总结

MRC（机器阅读理解）在给了NER任务一个全新的解决方式，这种方法个人觉得比传统方法更加易于实际，且在训练集较少的情况下也能达到很好的效果（由于其先验知识）。

MRC模型结果

论文中指出mrc模型在nested和flatNER任务上都取得了提升

Original: https://blog.csdn.net/chengshunhang/article/details/110392014
Author: shun-ripking
Title: 【论文解读】NER任务中的MRC（机器阅读理解）

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/594947/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

SparkSQL篇(一) DataFrame创建

DataFrame对象构成层面对象说明结构StructType描述整个DataFrame的表结构StructField描述一个列的信息数据Column记录一列数据并包含列的信息…

人工智能 2023年7月9日
0095
Opencv开发与应用—维纳滤波的算法实现及对比

在许多实际情况下，由于配准传感器的物理限制，由信息处理系统记录的图像数据含有不精确性。在加性高斯噪声的情况下，这种图像退化通常可以用线性模糊来描述。为了能够分辨不同滤波器以及各个滤…

人工智能 2023年7月20日
0078
【PyTorch深度学习项目实战100例】—— 使用pytorch实现LSTM自动AI作诗（藏头诗和首句续写）| 第6例

; 前言大家好，我是阿光。本专栏整理了《PyTorch深度学习项目实战100例》，内包含了各种不同的深度学习项目，包含项目原理以及源码，每一个项目实例都附带有完整的代码+数据集…

人工智能 2023年6月16日
0086
SSD（pytorch）自建数据集训练及测试

一、数据集准备 SSD代码：GitHub – amdegroot/ssd.pytorch: A PyTorch Implementation of Single Sho…

人工智能 2023年7月23日
00100
[nlp] 自回归语言模型AR 自编码语言模型AE的区别: XLNET和Bert ：Permutation Language Model

自回归语言模型 VS 自编码语言模型 – 知乎关于transformer-xl和xlnet以及tensorflow的知识简要小结_weix…

人工智能 2023年6月18日
0078
Transformer 自注意力机制及完整代码实现

词嵌入（Word Embedding ）将输入单词用 One-Hot 形式编码成序列向量，向量长度就是预定义的词汇表中拥有的单词量。One-Hot 形式编码看似简洁，但缺点是稀疏…

人工智能 2023年5月27日
0081
TensorFlow 1.x 2.x教程大集合

抵扣说明： 1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。2.余额无法直接购买下载，可以购买VIP、C币套餐、付费专栏及课程。 Original: https:…

人工智能 2023年5月25日
0084
图之图片格式

什么是图计算机能以位图和矢量图格式显示图像。常见的图像文件格式有：BMP、JPG(JPE,JPEG)、GIF等。打开WINGDI.h文件，搜索”BITMAPFIL…

人工智能 2023年6月22日
0084
NLP基础学习-文本情感分析

一、准备数据集 Dataset 其使用需要自定义一个类继承Dataset—》class ImdbDataset(Dataset): 其主要作用是从文件中获取数据，主要有三个方法： …

人工智能 2023年5月28日
0087
Openpcdet 安装过程

Openpcdet 安装过程硬件配置3060+5800h 需要安装的工具 Anaconda3cuda_11.1.1_455.32.00_linux.run (安装cuda)cud…

人工智能 2023年6月16日
00133
数据分析入门task5

本记录为本人参加datawhale数据分析（泰坦尼克号任务项目）学习笔记，不足之处多多指教。经过前面的两章的知识点的学习，我可以对数数据的本身进行处理，比如数据本身的增删查补，还…

人工智能 2023年7月18日
0051
目标检测重要评价指标——mAP的含义及计算

目标检测常见评价指标 1. 公开数据集评价标准：pascal voc, coco,目前基本都在使用coco数据集。 2.评价指标 mAP: mean Average Precis…

人工智能 2023年6月17日
00103
数仓：浅谈银行业的数仓构建实践

文章目录 * – 简介 – 一、银行数仓画像 – 二、银行业数仓建设 – + 2.1 数据总线 + 2.2 数据仓库 ODM 层 +…

人工智能 2023年6月19日
0062
从零开始运行YOLOV5

💂 个人主页: 风间琉璃 🤟 版权: 本文由【风间琉璃】原创、在CSDN首发、需要转载请联系博主 💬 如果文章对你有帮助、 *欢迎关注、点赞、收藏(一键三连) 和订阅专栏哦目录…

人工智能 2023年6月29日
00126
【自动驾驶决策规划】PRM算法

1 基于采样的路径规划方法路径搜索常用方式之一是基于网格的的方法（grid-based method），如A*算法，但基于网格的方法复杂度较高，与求解空间的维度相关，且得到的路径…

人工智能 2023年6月10日
00266
[阅读记录]《数据分析师求职面试指南》-2

又是写在前面的一些碎碎念，大家都去读这本书！！(●’◡’●) 第三章基础知识考察统计及数据分析知识假设检验贝叶斯统计概览模型及数据挖掘知识第四章…

人工智能 2023年6月11日
00177

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31