（论文阅读）Document-level Relation Extraction as Semantic Segmentation

2023年5月28日上午10:23 • 人工智能 • 阅读 91

题目：Document-level Relation Extraction as Semantic Segmentation
来源：2021 IJCAI
原文链接：https://arxiv.org/abs/2106.03618
代码链接：https://github.com/zjunlp/

一、介绍

文档级关系提取是指从文档中提取多个实体对之间的关系。先前提出的graph-based或transformer-based的模型独立地利用实体，而不考虑关系三元组之间的全局信息。本文通过预测 实体级关系矩阵来捕获局部和全局信息，与计算机视觉中的语义分割任务类似。具体来说，我们利用编码器模块来捕获实体的上下文信息，利用图像风格特征映射上的U-shape分割模块来捕获三元组之间的全局依赖性。实验结果表明，我们的方法可以在三个基准数据集DocRED、CDR和GDA上获得最先进的性能。
下图为论文中举的具体的例子：

（论文阅读）Document-level Relation Extraction as Semantic Segmentation

; 二、主要创新点

1.encoder，捕获实体的上下文信息；

2.U-net捕获句子间三元组的全局依赖考虑了句子间实体对的全局交互；

&#x7C7B;&#x4F3C;&#x901A;&#x8FC7;&#x5377;&#x79EF;&#x7F51;&#x7EDC;&#x5C06;&#x56FE;&#x50CF;&#x7684;&#x6BCF;&#x4E2A;&#x50CF;&#x7D20;&#x6807;&#x8BB0;&#x4E3A;&#x5BF9;&#x5E94;&#x7684;&#x8868;&#x793A;&#x7C7B;&#xFF0C;&#x8FD9;&#x91CC;&#x5C06;&#x5B9E;&#x4F53;&#x5BF9;&#x95F4;&#x76F8;&#x5173;&#x7279;&#x5F81;&#x4F5C;&#x4E3A;&#x201C;&#x56FE;&#x50CF;&#x201D;&#xFF0C;&#x6BCF;&#x4E00;&#x4E2A;&#x5B9E;&#x4F53;&#x5BF9;&#x95F4;&#x76F8;&#x5173;&#x5173;&#x7CFB;&#x7C7B;&#x578B;&#x4F5C;&#x4E3A;&#x4E00;&#x4E2A;&#x201C;&#x50CF;&#x7D20;&#x70B9;&#x201D;&#x3002;&#x5982;&#x4E0B;&#x56FE;.

3.存在很多对实体间没有特定关系，使用balanced softmax method。

三、方法

1. 符号定义

抽取从e s e_s e s 到e o e_o e o 之间的关系，需要定义一个N × N N×N N ×N大小的矩阵Y Y Y，使用Y s , o Y_{s,o}Y s ,o 表示从e s e_s e s 到e o e_o e o 的关系类型。接着，我们获得输出矩阵Y Y Y，用于语义分割任务。在Y Y Y中的实体顺序由它们第一次出现在文档中的顺序决定。特征图的获取是通过计算entity-to-entity相关性评估，并且将特征图看做一个图像。

2. Encoder 模块

在开头和结尾处插入特殊符号,来标记实体位置。

x i x_i x i 是构成文档d d d的token，h i h_i h i 是对应的embedding。
注意到一些文档长度超过512，因此使用dynamic window（动态窗口）编码整个文档，对不同窗口的重叠标记的嵌入进行平均以获得最终表示。

我们利用max pooling的平滑版本，即logsumexp pooling 每个实体e i e_i e i ，得到实体嵌入∗ ∗ e ∗ ∗ i e_i ∗∗e ∗∗i

接着，我们基于entity-entity相似度计算实体级的关系矩阵，对于在矩阵中的每个实体e i e_i e i ，他们相似度通过一个D维的特征向量F ( e s , e o ) F(e_s,e_o)F (e s ,e o )计算，这里使用两种策略计算：

similarity-based method
context-based method
对于similarity-based method，为基础的方法。将e s e_s e s 与e o e_o e o 的逐元相似度、余弦相似度和双线性相似度的运算结果拼接起来，得到基于相似度的方法为:

对于context-based method，我们利用实体感知的注意和仿射变换，得到如下特征向量:

a代表attention权重，H是document embedding。

; 3. U-shape 分割模块

U-Net在CV领域是知名的语义分割模型。结构图如下：

将实体级关系矩阵F F F为R N × N × D R^{N×N×D}R N ×N ×D作为Dchannel图像，我们在F F F中将文档级关系预测作为像素级掩码，其中N是从所有数据集样本中计算出的最大的实体数量。具体来说，N是实体的最大数量，从所有数据集样本中统计。为此，我们利用了U-Net [Ronneberger et al.， 2015]，这是计算机视觉中一个著名的语义分割模型。如图3所示，模块形成u形分割结构，其中包含两个下采样块和两个具有跳跃连接的上采样块。一方面，每个下采样块有两个后续的max pooling和独立的卷积模块。在每个下采样块中，通道数量增加一倍。如图2所示，实体级关系矩阵中的分割区域为实体对之间的关系共现。u形分割结构可以促进接受域类比中实体对之间的信息交换向隐式推理转变。具体来说，CNN和下采样块可以扩大当前实体对嵌入F ( e s , e o ) F(e_s, e_o)F (e s ,e o )的接受域，从而为表示学习提供丰富的全局信息。另一方面，该模型有两个上采样块和一个后续的反卷积神经网络和两个独立的卷积模块。与下采样不同，每个上采样块的信道数减半，可以将聚合的信息分布到每个像素上。
最后，我们结合编码模块和U-shaped分割模块来捕获局部和全局信息Y Y Y，如下所示:

Y Y Y属于R N × N × D ” R^{N×N×D^”}R N ×N ×D “是实体级关系矩阵，U U U为U-shape分割模块。

4. 分类模块

使用实体级关系矩阵Y Y Y表示e s e_s e s 和e o e_o e o ，使用前馈神经网络映射称为隐藏表示z z z。之后，使用双线性函数得到关系成立的概率：

Y s , o Y_{s,o}Y s ,o 是实体对( s , o ) (s,o)(s ,o )在矩阵Y Y Y的表示。

; 5. balanced softmax method for training

由于之前的工作[Wang et al.， 2019]观察到RE（关系抽取）存在不平衡的关系分布(许多实体对具有NA关系)，我们引入了一种平衡的softmax训练方法，该方法受到了计算机视觉中的circle loss[Sur et al.， 2020]的启发。具体来说，我们引入了一个额外的类别0，希望目标类别的分数都大于s o s_o s o ，而非目标类别的分数都小于s o s_o s o 。在形式上,我们有:

在这里，选取阈值为0，有下面的公式：

四、实验

数据集：

实验结果1：

一个例子：

结论：使用U-net能提取更多的隐含关系。
更多试验结果参照论文。
谢谢阅读！磕盐人，加油吧！

Original: https://blog.csdn.net/qq_38667212/article/details/122367650
Author: 外星人喵宁
Title: （论文阅读）Document-level Relation Extraction as Semantic Segmentation

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/530981/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

NLP实战学习（2）：基于Bertopic的新闻主题建模

代码参考：【文本分析实操干货】短文本主题建模利器 – BERTopic 开箱即用的工具：bertopic • https://github.com/MaartenGr/…

人工智能 2023年6月15日
00105
java-php-python-ssm-校园网上跳蚤书市系统-计算机毕业设计

本源码技术栈：项目架构：B/S架构开发语言：Java语言开发软件：idea eclipse 前端技术：Layui、HTML、CSS、JS、JQuery等技术后端技术：JAV…

人工智能 2023年6月26日
0087
动手学数据分析之 2数据清洗及特征处理

首先大致了解数据清洗。通常情况下我们拿到的数据是会存在缺少值或者有一些异常点等，需要经过一定的处理才能继续后边的分析或建模。所以拿到数据的第一步是进行数据清洗，将数据清洗成可以分析…

人工智能 2023年7月18日
0057
多通道并行卷积神经网络实现

一、网络结构多通道并行卷积神经网络主要由多个卷积池化层和全连接层组合而成，其网络结构图如下所示： ; 二、基于pytorch的实现如下（双通道）： 1.网络模型 class C_…

人工智能 2023年7月21日
00111
xlsx读取并循环对比并保存结果

“””Created on Fri Apr 8 10:28:04 2022 @author: koer“””…

人工智能 2023年7月7日
0089
图神经网络–pytorch_geometric基本使用

GCN论文地址:https://arxiv.org/abs/1609.02907 1.pytorch_geometric的安装不建议直接使用pip install直接进行安装，参…

人工智能 2023年6月29日
0083
MMSegmentation跑自己的数据进行二分类

官方文档：https://mmsegmentation.readthedocs.io/我的数据是RGB影像为.tif，标签影像为单通道（0-255）的.png影像，背景像素值为0…

人工智能 2023年6月30日
0093
opencv-gpu 编译 python使用 win

踩坑血泪史主要参考：https://thinkinfi.com/install-opencv-gpu-with-cuda-for-windows-10/ 注意事项： 1、需要使用…

人工智能 2023年7月20日
0058
LabVIEW AI视觉工具包（非NI Vision）下载与安装教程

文章目录前言一、安装VIPM 二、机器视觉工具包的安装 * 1.CPU用户 2.GPU用户前言上一篇博客LabVIEW图形化的AI视觉开发平台（非NI Vision），大幅…

人工智能 2023年7月28日
0087
李宏毅机器学习2022-hw2

系列文章目录李宏毅ML-2021hw1 文章目录系列文章目录问题概述实验部分 * Simple Baseline (acc>0.45797) Medium Basel…

人工智能 2023年6月15日
0099
相机标定，内参数与外参数

相机标定简介所谓的相机标定就是将外界世界的坐标信息转化为计算机（自带相机/摄像头）可以理解的”距离”，将世界坐标系转换到相机坐标系。我们可以理解为从一个…

人工智能 2023年5月26日
0075
解决pytorch 二分类数据集全部预测到了同一类

文章目录 * – 问题描述 – + 训练集和验证集训练分布 + 训练方法 + 训练结果 – 解决办法 – + 1. 修改学习率 + …

人工智能 2023年7月21日
0061
数据分析入门（kaggle实战—泰坦尼克）

载入数据任务一：导入numpy和pandas import numpy as np import pandas as pd 任务二：载入数据 (1) 使用相对路径载入数据(2) …

人工智能 2023年7月18日
0062
机器学习理论《统计学习方法》学习笔记：第十章隐马尔可夫模型（HMM）

第十章隐马尔可夫模型（HMM）摘要隐马尔可夫模型的基本概念 * 前言生成模型和判别模型马尔可夫过程马尔可夫链马尔可夫模型隐马尔可夫模型隐马尔可夫模型的三个问题 *…

人工智能 2023年5月27日
00113
pandas基础：Series、DataFrame的生成属性和方法

pandas基础：Series、DataFrame的生成属性和方法一、Series生成、属性、方法 * （一）Series生成（二）Series属性（三）Series方法二…

人工智能 2023年7月7日
0089
Pandas（数据分析处理库）—讲解

本内容来自《跟&#…

人工智能 2023年6月19日
0079

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31