关系抽取模型—-SpERT模型

2023年5月30日下午12:17 • 人工智能 • 阅读 115

关系抽取模型—-SpERT模型

SpERT模型是联合式抽取模型，同时抽取实体和关系。SpERT模型采用分类的思想实现联合抽取，实体抽取和关系抽取模型均为分类模型。SpERT模型是Span-based Joint Entity and Relation Extraction with Transformer Pre-training(2020)提出的，代码地址，SpERT模型
(1) 实体抽取和关系抽取均采用分类的思想
(2) 采用穷近的思想预测给定文本中所有可能的文本片段所属的实体类型
(3) 关系抽取依赖于出抽取出的实体，预测抽取实体的所有组合的关系类型
(4) 进行关系抽取会可考虑实体间的文本特征信息

模型结构

SpERT的模型采用bert 作为embedding，预测实体类型，选取实体类型为非None的实体进行关系分类，结构如下图：

(1)实体分类，这里对实体进行分类，是一个softmax，但是考虑了实体的头尾，实体分类模型得到的是实体的类别和实体span，也就是文本中的那些字段是实体，模型的输入文本tokenizer，实体span，实体mask，实体size等
(2)对实体进行过滤span filter，对实体模型的结果进行过滤，保留有实体，根据保留的实体构建关系负样本，
(3)关系分类，输入是实体，实体间连续文本特征max-pooling，实体宽度矩阵，经过一个线性层，得到关系分类的结果
注意：实体分类采用的是softmax，关系分类采用的是sigmoid

; span classification

span’s BERT embeddings
BERT/width embeddings

其中c是是bert embedding中CLS向量，即这个句子的句向量。
entity classification

span filtering

过滤实体类型为None的实体

Relation classification

-特征表示

-关系分类

其中𝑒(𝑠_1 ),𝑒(𝑠_2)表示BERT/width embeddings，𝑐为实体间max-pooling的BERT embeddings

; Loss计算

关系分类的loss和实体分类的loss和为整个模型的loss

其中ℒ^𝑠为cross entropy ，ℒ^𝑟为binary cross entropy。

模型数据构建说明

span classification数据说明

实体分类模型中加入了负样本，提高模型的鲁棒性。

数据candidate span 实体构建方式
（1）正例：数据中的实体数据
（2）反例：在句子中选取所有长度小于实体最大span长度的文本片段作为实体反例，实体类型为None。
例如：古往今来，能饰演古龙小说人物”楚留香”的，无一不是娱乐圈公认的美男子，2011年，36岁的张智尧在《楚留香新传》里饰演楚留香，依旧帅得让人无法自拔。假设实体最大span长度为5，
实体正例为（张智尧，人物，45，47），（楚留香新传，影视作品，50，54），（楚留香，人物，15，17）
实例反例为：（古，None，0，0），（今，None，1，1）…

（古往，None，0，1）（往今，None，1，2）（今来，None，2，3）…

…

(古往今来，None，0，4) （往今来，能，None，1，5）…

随机选取实体的反例数量为100
注意：反例实体数据中不包含真正的实体数据
* relation classification数据说明
（1）正例数据集：正例数据为训练集中的实体关系数据
（2）反例数据：采用正例中的关系subject和关系object两两配对构建关系类型为None的数据。
例如：古往今来，能饰演古龙小说人物”楚留香”的，无一不是娱乐圈公认的美男子，2011年，36岁的张智尧在《楚留香新传》里饰演楚留香，依旧帅得让人无法自拔。
正例数据关系三元组：(楚留香新传，主演，张智尧)，(张智尧，饰演，楚留香)
反例数据关系三元组：(楚留香新传，None，楚留香)
注意：关系反例中的subject和object不能相同，且关系三元组中的subject和object与正例不能相同，关系反例的数量为100

实验结果

在百度2020关系抽取数据集上，SpERT的模型的结果如下：

precision = 57.09, recall = 80.67, f1_score = 66.86

测试集上的举例结果如下：

{
    "text": "《吸血鬼偶像》是李根旭指导的一部情景喜剧，集结了洪宗玄、金宇彬等众多年轻偶像，并由搞笑明星申东烨和实力演员金秀美参演配角，讲述了一个吸血鬼星球傻乎乎的王子和他的护卫们来到地球上，为了成为明星而孤军奋斗的故事",
    "entity": [
      {
        "type": "影视作品",
        "start_index": 1,
        "name": "吸血鬼偶像"
      },
      {
        "type": "人物",
        "start_index": 8,
        "name": "李根旭"
      },
      {
        "type": "人物",
        "start_index": 24,
        "name": "洪宗玄"
      },
      {
        "type": "人物",
        "start_index": 28,
        "name": "金宇彬"
      },
      {
        "type": "人物",
        "start_index": 45,
        "name": "申东烨"
      },
      {
        "type": "人物",
        "start_index": 53,
        "name": "金秀美"
      }
    ],
    "relation": [
      {
        "subject": "吸血鬼偶像",
        "predicate": "导演",
        "object": "李根旭"
      },
      {
        "subject": "吸血鬼偶像",
        "predicate": "主演",
        "object": "洪宗玄"
      },
      {
        "subject": "吸血鬼偶像",
        "predicate": "主演",
        "object": "金宇彬"
      },
      {
        "subject": "吸血鬼偶像",
        "predicate": "主演",
        "object": "申东烨"
      },
      {
        "subject": "吸血鬼偶像",
        "predicate": "主演",
        "object": "金秀美"
      }
    ]
  },
  {
    "text": "蒋明杭州杭氧股份有限公司董事长他一直主张杭氧要走自主创新的道路，把核心技术、关键技术牢牢掌握在自己手中",
    "entity": [
      {
        "type": "人物",
        "start_index": 0,
        "name": "蒋明"
      },
      {
        "type": "企业",
        "start_index": 2,
        "name": "杭州杭氧股份有限公司"
      }
    ],
    "relation": [
      {
        "subject": "杭州杭氧股份有限公司",
        "predicate": "董事长",
        "object": "蒋明"
      }
    ]
  }

总结

SpERT模型采用分类思想实现实体和关系抽取，其中使用了max-pooling特征，SpERT模型可以抽取出span 长度内所有可能的实体和关系。

Original: https://blog.csdn.net/weixin_42223207/article/details/119714087
Author: xuanningmeng
Title: 关系抽取模型—-SpERT模型

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/542672/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

数据挖掘分析概述

目录什么是数据挖掘分析数据挖掘能够干什么描述评估预测分类聚类关联数据挖掘的一般流程业务理解阶段数据理解阶段数据准备阶段建模阶段评估阶段部署阶段什么是…

人工智能 2023年7月16日
0075
神经网络 Embedding层理解； Embedding层中使用预训练词向量

1、Embedding层理解高维稀疏特征向量到低维稠密特征向量的转换；嵌入层将正整数（下标）转换为具有固定大小的向量；把一个one hot向量变为一个稠密向量参考：https:…

人工智能 2023年7月13日
0084
微软提出基于知识图谱的深度神经网络DKN用于新闻推荐

DKN: Deep Knowledge-Aware Network for News Recommendation Hongwei Wang, Fuzheng Zhang, Xin…

人工智能 2023年6月10日
0069
pytorch中的数据导入之DataLoader和Dataset的使用介绍

在使用Pytorch构建和训练模型的过程中，经常需要把原始数据（图片、文本等）转换为张量的格式。对于小数据集，我们可以手动导入，但是在深度学习中，数据集往往是比较大的，这时pyto…

人工智能 2023年7月21日
0074
通过Tensorflow-DirectML 快速启用 AMD及NVIDIA GPU 加速

系列文章目录第一章 Tensorflow 机器学习入门之环境搭建及图片训练与识别文章目录目录前言一、本文目的是什么？二、使用步骤 1.安装微软 Tensorflow-D…

人工智能 2023年6月25日
00109
BILSTM-CRF代码讲解

BILSTM-CRF代码代码来源于命名实体识别（NER）：BiLSTM-CRF原理介绍+Pytorch_Tutorial代码解析第一部分:导包1.torch.nn包中主要包含了用…

人工智能 2023年5月28日
0062
实体对齐算法_融合语义和结构信息的知识图谱实体对齐

融合语义和结构信息的知识图谱实体对齐苏佳林 1,2, 王元卓 1*, 靳小龙李曼玲程学旗实体对齐能够发现不同知识图谱实体间的对齐关系是多源知识融合的基础。现有的基于知识…

人工智能 2023年6月10日
0085
热词挖掘、热度值计算方法及python实现

🤗 之前做过一个项目，是在特定社交平台上发现每天的热帖，做热帖推送，所以笔者自然而然想到利用热词来代表热帖进行热帖发掘，所以在参考了许多资料后，采用了本文所用方法，简单有效，所以在…

人工智能 2023年5月31日
0077
多层堆叠LSTM的理论与TensorFlow的实现

引言原始LSTM模型由单个LSTM层和随后的输出层组成。堆叠LSTM（Stacked LSTM）是此模型的扩展，具有多个LSTM层。关于LSTM相关知识请看这片文章：LSTM（…

人工智能 2023年5月26日
0098
torch.nn.interpolate—torch上采样和下采样操作

前言：最近博主搭建网络需要用到一些直接对于GPU上的tensor的上采样和下采样操作，如果使用opencv那么就需要先将数据从GPU上面copy到CPU，操作完后在转移到GPU。…

人工智能 2023年6月17日
0084
深度学习100例 | 第42天：音乐的识别与分类

抵扣说明： 1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。2.余额无法直接购买下载，可以购买VIP、C币套餐、付费专栏及课程。 Original: https:…

人工智能 2023年5月25日
00106
深度剖析问题：Could not run ‘torchvision::nms‘ with arguments from the ‘CUDA‘ backend.

问题：使用YOLOv5进行测试的时候，报错：Could not run ‘torchvision::nms’ with arguments from th…

人工智能 2023年7月28日
0067
语义分割-CyCADA: Cycle-Consistent Adversarial Domain Adaptation.循环一致对抗领域自适应

CyCADA: Cycle-Consistent Adversarial Domain Adaptation. 0.摘要 1.概述 2.相关工作 3.循环一致性对抗领域自适应 4….

人工智能 2023年7月14日
0067
vs2022重新编译opencv-python cuda加速时报错

今天重新编译了一下Windows的opencv-python的cuda加速在生成INSTALL的时候报错 严重性…

人工智能 2023年5月28日
0086
【论文阅读】ShuffleNet——ShuffleNet: An Extremely Efficient Convolutional Neural Network for Mobile Devices

文章目录 * – + 论文阅读 + 代码实现 + * model * train * predict + 实验结果论文阅读感谢P导ShuffleNet: An Ex…

人工智能 2023年7月14日
0059
OCR文字识别技术总结（三）

独立打包，保证可解压，内含大量源码，网上搜集而来。 Visual.C++编程技巧精选500例源代码内含各种例子（vc下各种控件的使用方法、标题栏与菜单栏、工具栏与状态栏、图标与光…

人工智能 2023年5月26日
0071

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

关系抽取模型—-SpERT模型

关系抽取模型—-SpERT模型

模型结构

; span classification

span filtering

Relation classification

; Loss计算

模型数据构建说明

span classification数据说明

实验结果

总结

大家都在看