[论文阅读笔记66]R-BERT

2023年5月28日上午8:17 • 人工智能 • 阅读 76

1. 基本信息

题目论文作者与单位来源年份Enriching Pre-trained Language Model with Entity Information for Relation ClassificationShanchan Wu Yifan He Alibaba Group (U.S.) IncCIKM2019

R-BERT
128 Citations, 32 References

论文链接：https://arxiv.org/pdf/1905.08284.pdf

论文代码：https://github.com/monologg/R-BERT [非官方]

2. 要点

研究主题问题背景核心方法流程亮点数据集结论论文类型关键字关系抽取基于bert出关系抽取；序列重组合，然后分断，最后再组合。模型把实体级信息加入到预训练中来完成任务。

在第一个实体周围加入’$’，在第二个实体周围加入’#’，用这两个符号标识实体位置；

使用了'[CLS]’中的句子信息；SemEval-2010 Task 8方法简单具有效，在工程的使用是不错的。

取得SemEval-2010 task 8上的state-of-the-art.bert, Relation classifification

3. 模型(核心内容)

3.1 模型

对于序列s, 在句子前面加入'[CLS]’, 在第一个实体加入’$’, 在第二个实体加入’#’.
对于两实体进行平均计算（H1，H2）：

对于'[CLS]’，加入了一个激活与全连接操作：

W0,W1,W2有相同的维度(d*d,d为Bert隐含层状态大小).

把三类信息concat起来，再输入一个全连接网络：

W3的大小为L*3d. 其中L表示关系类型数。p为概率输出。

采用交叉熵作为损失函数，在每个全连接层前加入dropout.

; 4. 实验与分析

4.1 数据集

SemEval-2010 Task 8;
包括10类： Cause-Effect, *Component-Whole, Content-Container, Entity Destination, Entity-Origin, Instrument-Agency, Member-Collection, Message-Topic ，Product Producer， Other
10,717 sentences；
关系有方向性的；

4.2 训练参数

; 4.2 结果

对比实验：

消融分析：

BERT-NO-SEP-NO-ENT：不加特殊分隔符（”$”,”#”），也不加入'[CLS]’信息； F1==- 8.16==；

BERT-NO-SEP: 不加特殊分隔符（”$”,”#”）;

BERT-NO-ENT: 不加入'[CLS]’信息;

5. 代码

无

6. 总结

6.1 优

简单有效的方法。

6.4 不足

其它种类的消融是否可以考虑一下。

7. 知识整理（知识点，要读的文献，摘取原文）

无

8. 参考文献

【1】bert关系抽取之R-BERT：Enriching Pre-trained Language Model with Entity Information，https://blog.csdn.net/xiaowopiaoling/article/details/105679350

made by happyprince

Original: https://blog.csdn.net/ld326/article/details/123631480
Author: happyprince
Title: [论文阅读笔记66]R-BERT

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/530534/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

传奇开服很难吗？教你怎么给Hero传奇引擎添加NPC

一般人们用官方里面的NPC形象代码但是找不到这个代码因为我们发现用这个wil查看器查看到的第一个npc的数据除以六十得不到我们想要的npc 比如说铁匠是一号他占的位置是0…

人工智能 2023年6月28日
0065
关于使用pytorch机器学习中出现expected scalar type Float but found Byte问题的解决

本人才疏学浅，在使用pytorch尝试解决图像处理问题时，弹出了如下得报错。经过报错地址得提示，最后将问题锁定在 def forward(self,x): 这一函数上，其中值x作…

人工智能 2023年7月23日
0081
深度神经网络主要模型,深度神经网络预测模型

目前深度学习的模型有哪几种适用于哪些问题？。核心有几个卷积神经网络CNN，用来做图像处理的循环神经网络RNN，用来处理带顺序关系的数据对抗生成网络GAN，是一种概率生成模型tr…

人工智能 2023年6月16日
0058
pytest自动化测试框架，真正做到从0到1由浅入深详细讲解【万字级】

目录嗨咯铁汁们，很久不见，我还是你们的老朋友凡叔，这里也感谢各位小伙伴的点赞和关注，你们的三连是我最大的动力哈，我也不会辜负各位的期盼，这里呢给大家出了一个pytest自动化测试…

人工智能 2023年7月4日
0053
Anaconda超详细安装教程（Windows环境下）

每个人电脑不同，特别是配置环境变量，不要直接复制粘贴。（本人技术小白一个，如有错误，欢迎各位大神指正。）说明：其实要是装Anaconda的话，就不用再单独装Python了。但是…

人工智能 2023年7月3日
0072
sklearn分类指标函数sklearn.metrics.classification_repor的用法详解（含源码）

sklearn.metrics.classification_report * – 调整方法及参数： – 参数说明 – + parameters…

人工智能 2023年7月17日
0049
回溯法求解数独问题（最简单，通俗易懂，附C++代码）

问题描述：数独是一种运用纸、笔进行演算的逻辑游戏。玩家需要根据9×9盘面上的已知数字，推理出所有剩余空格的数字，并满足每一行、每一列、每一个九宫格内的数字均含1-9，不重复要求：…

人工智能 2023年6月16日
0071
【BP回归预测】基于matlab Tent混沌映射改进的麻雀算法优化BP神经网络回归预测【含Matlab源码 1707期】

⛄一、sine混沌映射改进的麻雀搜索算法优化BP神经网络简介 ISSA优化BP神经网络算法建模过程如图1所示，具体流程如下： (1) 确定BP神经网络的拓扑结构，输入层节点数为5,…

人工智能 2023年6月17日
0068
【深度学习】Tensorflow学习（1）张量与常用函数

关于张量张量可以表示0阶到N阶的数组在TensorFlow中，张量(Tensor)表示某种相同数据类型的多维数据因此，张量有两个重要特征： [En] Therefore, th…

人工智能 2023年5月24日
0071
图像分类：AlexNet网络、五分类 flower 数据集、pytorch

文章目录 * – 一、代码结构 – 二、数据集的处理 – + 2.1 数据集的下载和切分：split_data.py + 2.2 数据集的加载：…

人工智能 2023年7月1日
0079
训练集、验证集以及测试集的区别

1、数据集的划分：训练集：含有参考答案的数据，用来训练模型的已标注数据，用来建立模型，发现规律验证集：模型训练过程中单独留出的样本集，用于调整模型的超参数和用于对模型的能力进行初…

人工智能 2023年6月16日
00115
Python使用Numpy实现Kmeans算法

目录 Kmeans聚类算法介绍： 1.聚类概念： 2.Kmeans算法：定义：大概步骤： Kmeans距离测定方式： 3.如何确定最佳的k值(类别数)：手肘法： python…

人工智能 2023年6月2日
0064
pytorch图像识别之手写字识别

链接：https://pan.baidu.com/s/1Ndns0iLO73OjZcwfB2pdqw提取码：wpj9 torch.tensor([[1., -1.], [1., -…

人工智能 2023年7月14日
0071
ACL2021_Lexicon Enhanced Chinese Sequence Labelling Using BERT Adapter

基于BERT适配器的词典增强型中文序列标注摘要介绍相关工作 * 基于词典预训练模型混合模型 BERT适配器方法 * Char-Words Pair Sequence(字…

人工智能 2023年5月31日
0075
【论文泛读】JSCN: Joint Spectral Convolutional Network for Cross Domain Recommendation

JSCN: Joint Spectral Convolutional Network for Cross Domain Recommendation – 2019 IE…

人工智能 2023年7月14日
0085
迈向更高效通用的加速之路：谷歌提出视觉和多任务MoE方法

【专栏：前沿进展】近日，MoE家族又添两个新成员：V-MoE和Task MoE，由谷歌提出，能够显著提升计算机视觉和多任务学习模型的计算效率，进一步扩大模型的规模。 MoE是近年来…

人工智能 2023年7月14日
0051

2024 年 4 月
一	二	三	四	五	六	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30