Unified Named Entity Recognition as Word-Word Relation Classification

2023年5月27日下午10:50 • 人工智能 • 阅读 95

论文链接：Unified Named Entity Recognition as Word-Word Relation Classification

code链接： https://github.com/ljynlp/W2NER.git

NER任务根据实体的情况可以分为扁平实体(flat ner)、嵌套实体(nested ner)、不连续实体(discontinuous ner)。如果实际的实体抽取场景中同时包含了上述三种实体，那么就需要一种统一的NER框架来处理。

NER抽取的方法大致可以分为四种:
1.序列标注方法，比如常用的BIEOS， BIO；
2.超图的方法；
3.span的方法，指针网络或token 对的形式；
4.生成的方法。

序列标注方法可以很好解决扁平实体的问题，对于嵌套实体通过修改标注可以勉强解决，但是会增加模型复杂度；而面对不连续实体序列标注方法无法解决。所以在只存在扁平实体的情况下，可以选择序列标注的方法，这边推荐一下复旦邱锡鹏老师团队的tener方法，使用transofrmer改进结构的模型。

同样基于超图的方法则有结构歧义的问题。

span的方法仅仅聚焦于实体边界的识别，同时在实体长度太长也会有模型复杂度的问题。

生成的方法能很好的统一三种ner的任务，邱锡鹏老师团队同样有相关的研究。但是生成的方式存在exposure bias和解码效率的问题。

对于扁平型实体任务的关键在于边界的识别，但是统一的ner模型更加依赖于实体词之间关系(尤其是不连续实体的识别)。
本文采用一种新颖的词关系结构W2NER，同时对实体边界和实体词关系进行建模，充分考虑了实体边界和内部词的关系。使用多粒度的2维卷积重新定义词对表示，能有效捕捉近距离词对和远距离词对之间的交互作用。
这是本文主要的两个创新点。

Unified Named Entity Recognition as Word-Word Relation Classification

W2NER把实体的标签分类以词之间的关系标注在一个词对的网格中。如图，词对网格以对角线被分成两部分，右上的网格中表示当前词与后续词的连接关系，标有NNW的网格表示横向词与纵向词是同一实体，（aching，in）、（in，legs）、（in，shoulders）在同一实体中；右下角网格表示实体尾部和头部的连接关系，标有THW-S的网格表示横向词、纵向词分别为同一实体的结尾和开头，（shoulders，aching）、（legs，aching）分别为两个实体的结尾开头。网格中其他的值为None，表示无连接关系。所以根据图中可知，aching in legs 和 aching in shoulders 为句子中的两个实体。

统一ner框架

编码层
编码层由bert和bilstm组成，生成单词表示。
卷积层
Conditional Layer Normalization
编码层的输出维度是ND，但是根据最后的标注看词对之间的关系是有方向的。所以通过该层将输入的表示维度变成NN*D，具体的方法如下：

BERT-Style Grid Representation Build-Up
从名字可以看出是借鉴了bert的思想，bert的输入分别了词向量、位置向量和段向量三部分。本文类似地生成三种词对网格分别表示词信息、相对位置信息和网格中的区域信息。最后将三种信息进行concat后输入MLP中。输出特征大小为NNDc。
Multi-Granularity Dilated Convolution
最后使用空洞卷积来获取不同距离词之间的交互信息。最后的输出特征表示大小为NN3Dc。

联合预测层
该层由MLP和Biaffine分类器共同组合而成。biaffine预测器的输入是encoder层的输出，所以可以看成是残差连接层。MLP的输入则是上一层卷积层的输出。最后两侧输出相加进行softmax层。
解码层
解码层就是通过最后词对关系找到一个词到另一词的特定路径，每条路径就是一个实体。图中就是几种解码的情况；

实验结果

在中英文数据集上都达到了SOTA，具体结果见论文。

消融实验
没有区域和距离向量，效果有轻微的下降，但是去除了所有的卷积层，效果下降明显，验证了多粒度空洞卷积的有效性。去除空洞卷积后的效果也有下降，尤其是空洞为2的卷积；
所以词之间的交互信息影响最后的抽取效果，尤其是较大距离的词。
在预测层，MLP则发挥了更大的作用。

结论
本文使用词对网络的标注方法（W2NER）同一了ner框架，并且使用多种卷积的结构抽取网格表示，并在多个中英文数据集上达到SOTA。

Original: https://blog.csdn.net/choose_c/article/details/123388633
Author: choose_c
Title: Unified Named Entity Recognition as Word-Word Relation Classification

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/527969/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

Windows系统下使用Mingw编译并运行opencv教程

文章目录 1. 下载 2. 安装 3. 编译 4. 测试编译环境：系统：Windows7企业版cmake版本：3.22.1Mingw版本：x86_64-5.4.0-release…

人工智能 2023年7月20日
0051
DeepLabv3+

一.摘要本文在进行语义分割任务时将空间金字塔池化（SPP）模块或encoder-decoder结构引入到深度神经网络中。以前的网络通过对输入的feature map使用多种尺度的…

人工智能 2023年5月26日
0088
Python学习：如何使用pandas分析excel数据

1.问题在python中，读写excel数据方法很多，比如 xlrd、xlwt和openpyxl，实际上限制比较多，不是很方便。比如 …

人工智能 2023年7月7日
0075
维度和指标（metrics and dimensions）

维度和指标是什么？维度和指标大家或多或少都有接触过。属于数据分析领域的基础知识，在分析报告或者分析工具中时有出现，因此大家对此要有所了解。维度和指标的英文分别是metrics …

人工智能 2023年7月17日
0091
1104报表的内容

1104报表是监管部门向非监管机构收取的完整、系统的报表。从本质上讲非现场监管报表体系就是一种工具和手段，通过这种手段可以帮助监管人员更加准确地识别银行机构的风险和抵御风险的能力…

人工智能 2023年6月19日
00203
Linux系统下detectron2安装（cuda11为例）

Linux系统下detectron2安装（cuda11为例） detectron2官方Requirements 1.Linux or macOS with Python ≥ 3.6…

人工智能 2023年7月23日
0068
BBAVectors旋转目标检测算法安装部署使用笔记

BBAVectors旋转目标检测算法安装部署使用笔记安装 * step1 step2 数据集准备训练测试验证测试AP 安装整体步骤从参考官方github：https:/…

人工智能 2023年7月12日
0092
向量与矩阵（2）

1、将三个向量组成一个矩阵 X=[ 2, 2,2];Y=[1,1,1]Z=[1,2,1] A=[X;Y;Z]A =2 2 21 1 11 2 1 2、矩阵的秩 rank（A）若矩…

人工智能 2023年6月28日
0067
文字转语音引擎未就绪_5个文字转语音网站，其中最强堪比真人发音

以下是一些常用的文本到语音转换网站。如果你感兴趣，你可以自己试一试。在文章的末尾，我发出了一个很好的声音。 [En] Here are some commonly used tex…

人工智能 2023年5月27日
00102
pytorch稀疏矩阵处理（torch.sparse）

pytorch稀疏矩阵（torch.sparse） Pytorch稀疏矩阵处理 * 稀疏矩阵存储方式 – 1. COO 2. CSR/CSC 3. LIL 稀疏矩阵的处…

人工智能 2023年7月21日
0055
图解pandas的轴旋转函数：stack和unstack

公众号：尤而小屋作者：Peter编辑：Peter 大家好，我是Peter~今天带来的文章是图解Pandas中的两个重要的函数：stack和unstack。 stack和unstac…

人工智能 2023年7月8日
0077
基于遗传算法求解TSP问题（旅游路径规划，Python实现，超详细，可视化，结果分析）

ps：作者是很用心写的，如果觉得不错，请给作者一点鼓励噢！（点赞收藏评论噢）基于遗传算法求解TSP问题摘要巡回旅行商问题（TSP）是组合优化中的经典问题。常见的TSP问题求解…

人工智能 2023年7月28日
0099
opencv （三十五）连通域分析

提取二值化后的图像为8位图CV_8UC1,首先对进行标记，然后针对32位CV_32S图像进行提取具体如下： //标记 img_bw == 二值图像 Mat mask; co…

人工智能 2023年5月26日
0055
6000字详解｜数据分析需求处理

作者：JanieLiu公众号《溜溜笔记说》接上文《数据分析之落地sop流程》，这篇文章中有一张sop图大家可以参考下。本文主要详细讲解下数据分析的需求处理阶段。需求处理是数据分…

人工智能 2023年7月17日
0071
pandas多重索引补全子索引缺失的方法

当数据中的dataframe(df)是一个二重索引且某一层索引的第二层索引值并不是全部索引值时，我们应该如何在该层索引插入第二层索引没有的值呢？本文记录自己的学习遇到的情况~ 如以…

人工智能 2023年7月8日
0079
CUDA和cudnn的安装

CUDA和cudnn的安装一、CUDA的安装 * 1.1 查看显卡驱动版本 1.2 下载CUDA 1.3 安装CUDA 1.4 设置环境变量 1.5 测试CUDA是否装好二、c…

人工智能 2023年6月17日
0089

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

Unified Named Entity Recognition as Word-Word Relation Classification

统一ner框架

大家都在看