TPLinker实体关系抽取新范式TPLinker：单阶段联合抽取，并解决暴漏偏差～

2023年6月1日上午9:16 • 人工智能 • 阅读 67

https://zhuanlan.zhihu.com/p/342300800(https://zhuanlan.zhihu.com/p/342300800)
https://zhuanlan.zhihu.com/p/346897151(https://zhuanlan.zhihu.com/p/342300800)

Pipeline方式

联合抽取主要分为2种范式：

多任务学习：即实体和关系任务共享同一个编码器，但通常会依赖先后的抽取顺序：关系判别通常需要依赖实体抽取结果。这种方式会存在暴漏偏差，会导致误差积累。
结构化预测：即统一为全局优化问题进行联合解码，只需要一个阶段解码，解决暴漏偏差。

TPLinker实体关系抽取新范式TPLinker：单阶段联合抽取，并解决暴漏偏差～

暴漏偏差：指在训练阶段是gold实体输入进行关系预测，而在推断阶段是上一步的预测实体输入进行关系判断；导致训练和推断存在不一致。

; 每个关系都是单独的两个矩阵

上图给出了一个完整的标注和编码示意图，标记有”0、1、2″三种。

编码部分实际上是将原始的Span矩阵会展开为一个[公式]序列进行编码，也就是将token pair的每一个token编码拼接在一起。

TPLinker的解码过程为：

1、解码EH-to-ET可以得到句子中所有的实体，用实体头token idx作为key，实体作为value，存入字典D中；
2、对每种关系r，解码ST-to-OT得到token对存入集合E中，解码SH-to-OH得到token对并在D中关联其token idx的实体value；
3、对上一步中得到的SH-to-OH token对的所有实体value对，在集合E中依次查询是否其尾token对在E中，进而可以得到三元组信息。
结合上图的具体case,我们具体描述一下解码过程：

解码EH-to-ET中得到3个实体：{New York,New York City,De Blasio}; 字典D为：{New:(New York,New York City),De:(De Blasio)}

以关系”mayor”为例,

1、解码ST-to-OT得到集合E：{(City,Blasio)};解码SH-to-OH得到{(New,De)}，其在字典D中可关联的subject实体集合为{New York,New York City};object集合{De Blasio};
2、遍历上述subject集合和object集合，并在集合E中查询尾token，发现只有一个实体三元组{New York City,mayor,De Blasio}
以关系”born in”为例,

1、解码ST-to-OT得到集合E：{(Blasio,York),(Blasio,City)};解码SH-to-OH得到{(De,New)}，其在字典D中可关联的subject实体集合为{De Blasio};object集合为{New York,New York City};
2、遍历上述subject集合和object集合，并在集合E中查询尾token，可得到2个实体三元组：{De Blasio,born in,New York}和{De Blasio,born in,New York City}
由于关系live in与born in一样，所以我们最终可得到5个三元组：

(New York City, mayor, De Blasio), (De Blasio, born in, New York), (De Blasio, born in, New York City), (De Blasio, live in, New York), (De Blasio, live in, New York City)

其实，只要TPLinker的解码过程，对这篇论文就会有深刻的理解了！大家一定要多看哦～

Original: https://blog.csdn.net/qq_15821487/article/details/122316715
Author: 愚昧之山绝望之谷开悟之坡
Title: TPLinker实体关系抽取新范式TPLinker：单阶段联合抽取，并解决暴漏偏差～

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/556029/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

ROS保存RBGD的深度图像、RGB图像

前言想要采集一些深度图和RGB图像，且两者是一一对应的，即一张深度图对应一张RGB图像，于是就有了以下的程序。相关准备我用的深度摄像头是奥比中光的摄像头，Ubuntu16的好…

人工智能 2023年5月28日
0063
使用线性SVM实现对垃圾邮件分类

训练模型：载入数据集之后, 用变量 y = 1 y=1 y =1 表示垃圾邮件, 而 y = 0 y=0 y =0 表示非垃圾邮件可就可以训练SVM算法了。这里我们使用skl…

人工智能 2023年7月3日
0056
多旅行商问题——公式和求解过程概述

英文：The multiple traveling salesman problem an overview of formulations and solution proced…

人工智能 2023年6月15日
0077
六、基于深度学习关键点的指针式表计识别

基于深度学习关键点的指针式表计识别 提示：网上有…

人工智能 2023年6月17日
00103
使用Java + MapRedcue实现 K-means 聚类算法和基于散点图的可视化

使用Java + MapRedcue实现 K-means 聚类算法和基于散点图的可视化使用Java + MapRedcue实现 K-means 聚类算法，使用python实现基于…

人工智能 2023年6月2日
00101
pytorchF.grid_sample用法

torch.nn.functional.grid_sample(input, grid, mode=’bilinear’, padding_mode=&#8…

人工智能 2023年7月24日
0067
神经网络实现手写数字识别

神经网络是由以下基本函数组成：传播函数（包括前向传播，反向传播），激活函数，损失函数这几个函数的作用：前向传播：向前预测结果（由已知的参数预测）激活函数：加入非线性因素，实…

人工智能 2023年7月13日
0094
C++ OpenCV 使用 resize() 调整图像大小

调整图像大小意味着改变它的尺寸，无论是宽度、高度还是两者都改变。此外，原始图像的纵横比可以保留在调整大小的图像中。为了调整图像大小，OpenCV 提供了 resize() 函数…

人工智能 2023年5月26日
00111
卷积神经网络（CNN）的整体框架及细节（详细简单）

一：引言我们传统的神经网络和卷积神经网络有什么区别？下图所示，左图就是我们传统的神经网络（NN） (想了解NN的小伙伴可以先划到最后的参考文章部分)，右图就是卷积神经网络（Con…

人工智能 2023年7月30日
0061
基于PaddleDetection-YOLOV3做一个完整的图形目标检测项目

文章目录一、环境部署二、数据准备三、训练四、训练过程可视化五、模型预测一、环境部署 1.1安装PaddlePaddle安装地址如下： https://www.paddl…

人工智能 2023年7月10日
00111
时序分析 40 – 时序预测从ARIMA到SARIMAX(九)超参调优与最佳模型

时序分析 40 从ARIMA到SARIMAX(九)超参调优与最佳模型接上… 超参调优我们是否有方法使模型表现得更好呢？可以使用网格搜索来进行超参数调优，下面我们将针…

人工智能 2023年7月8日
0083
再看SimCSE

抵扣说明： 1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。2.余额无法直接购买下载，可以购买VIP、C币套餐、付费专栏及课程。 Original: https:…

人工智能 2023年6月2日
0074
MLCV（第二期）学习笔记

抵扣说明： 1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。2.余额无法直接购买下载，可以购买VIP、C币套餐、付费专栏及课程。 Original: https:…

人工智能 2023年6月22日
0071
javascript中Uint8/16/32Array 传入负数问题

javascript中Uint8Array/Uint16Array/Uint32Array 传入负数问题在如果给Uint8Array/Uint16Array/Uint32Arra…

人工智能 2023年6月28日
00125
【YOLOv7】结合GradCAM热力图可视化

文章目录前言实现效果实现细节 * 1、在YOLOv7源码的基础上进行修改和添加操作 2、hook函数 3、GradCAM基本实现思路修改部分 * 1、Detect类中的fo…

人工智能 2023年6月16日
00103
Python ark-nlp文本分类，命名实体识别，关系抽取，文本匹配，预训练模型，机器学习，深度学习，ERNIE，NEZHA

本文参考了大佬的文档https://github.com/xiangking/ark-nlp#ark-nlp 一、ark-nlp简介 ark-nlp集成了机器学习和深度学习的多个模…

人工智能 2023年7月14日
0054

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

TPLinker实体关系抽取新范式TPLinker：单阶段联合抽取，并解决暴漏偏差～

大家都在看