Raki的读paper小记：Leveraging Type Descriptions for Zero-shot Named Entity Recognition and Classification

2023年5月31日上午2:51 • 人工智能 • 阅读 104

Abstract & Introduction & Related Work

研究任务
命名实体识别和分类
已有方法和相关工作
面临挑战
创新思路
提出了第一种用于zero-shot的NERC的方法
引入一个新的架构，利用许多实体类别的文本描述自然发生的事实
实验结论

在训练过程中被观察到的非实体的词有可能属于其中一个测试类别，基于这种观察我们提出几种不同的架构，基于交叉注意力在语句和类型描述之间用transformer，结合预训练模型

我们通过以下方式探索对负类的建模

使用对负类的描述
直接建立负类的模型
使用为对应于类型的类所产生的表征来建立负类的模型

; Zero-shot NERC

对于每一个类型d，交叉注意力编码器生成一个向量表示v，对于每一个在语句s中的单词w

Raki的读paper小记：Leveraging Type Descriptions for Zero-shot Named Entity Recognition and Classification

进行一个线性变换，o表示单词t有多大可能属于实体类c

为了能不仅仅是分类实体，并且识别它们，每一个token的得分跟属于负类的得分拼接起来，对应于不属于所考虑的任何类型：

选出一个得分最高的类

Cross-attention Encoder

用bert

; Modelling the negative class

正如第1节所讨论的，非实体类创建了一个具有挑战性的设置。在训练期间观察到的非实体单词可能属于其中一个测试类。

Description-based encoding

然而，这种方法要求描述的东西不是而不是是。这使得在实践中很难就最合适的描述做出明智的决定。另外，非实体的标记很可能在训练和测试中有所不同，因此固定的描述不太可能表现良好

; Independent encoding

负面类可以直接建模，因为它是在训练数据中观察到的。因此，在不考虑任何描述的情况下，每个标记在句子的上下文中被表示为否定类，而不是探索交叉注意力

Class-aware encoding

基于描述的编码和独立编码没有对以下事实进行建模，即在zero-shot的NERC中，并非每一个在训练期间被标记为非实体的实体在测试期间都是非实体。相反，我们建议通过结合交叉注意力编码器生成的其他类别的表征来为负类建模：v t , c 0 , . . . , v t , c k v_{t,c_0}, …, v_{t,c_k}v t ,c 0 ,…,v t ,c k 。然后，每个向量被线性转换，使用 w n e g − c l w_{neg-cl}w n e g −c l ，然后串联到一个特征图m

; Training

为了防止注意力编码器在少量类别描述上过拟合，我们使用一个实体屏蔽形式的正则器，这种正则化避免了词汇记忆，并鼓励模型学习实体上下文与类别描述的亲缘关系，同时仍然学习纳入实体本身的各个方面（例如大写字母、形状、形态），并将它们与类型描述联系起来

因为负类标签不平衡，使用

Evaluation setup

; Experiments

Conclusions & Future work

本文探讨了带有实体类型描述的零点拍摄NERC的任务，将知识从观察到的类转移到未见的类。我们通过提出一个多类架构来解决零点拍摄NERC的具体挑战，该架构使用类意识编码来为负面类建模，从而使非实体类的定义不明确。这些模型基于OntoNotes和MedMentions数据集的零次改编进行了评估。结果显示，所提出的模型优于强大的基线，并进一步表明高质量的实体描述（即注释指南）是将知识从观察到未见的类转移的有效途径。未来的工作将旨在纳入预测的标签之间的依赖关系

Remark

这篇文章是真的搞，NER就NER，非要说个NERC，注意力就注意力，非要说个交叉注意力，显得自己很novel是吗？好无语

Original: https://blog.csdn.net/Raki_J/article/details/122953941
Author: 爱睡觉的Raki
Title: Raki的读paper小记：Leveraging Type Descriptions for Zero-shot Named Entity Recognition and Classification

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/548069/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

【WY】数据分析 — Matplotlib 阶段一：基础语法三 —— 创建子图

版权声明：本文为博主原创文章，未经博主允许不得转载。文章目录一、创建子图 * 1.1 绘图对象：plt.figure() 二、创建方式 * 2.1 方式一：fig.add_su…

人工智能 2023年7月18日
0067
初入深度学习4——如何修改一个深度学习库

初入深度学习4——如何修改一个深度学习库学习前言深度学习库的组成修改目标定位举例 * 一、任务介绍二、目标定位三、变量分析四、修改代码总结学习前言在学习过一个深…

人工智能 2023年6月24日
00125
miniconda+tensorflow-gpu+pycharm的安装及配置（详解版）

啊哦~你想找的内容离你而去了哦内容不存在，可能为如下原因导致： ① 内容还在审核中 ② 内容以前存在，但是由于不符合新的规定而被删除 ③ 内容地址错误 ④ 作者删除了内容。可…

人工智能 2023年5月26日
0080
半监督学习的性能如何评估

问题描述半监督学习是一种机器学习方法，利用有标签的数据和无标签的数据进行训练。与监督学习相比，半监督学习可以更充分地利用无标签数据来提高模型的性能。在这个问题中，我们将探讨如何评…

人工智能 2024年1月1日
0062
PytorchBert+BiLstm文本分类

文章目录前言一、运行环境二、数据三、模型结构四、训练五、测试及预测前言昨天按照该文章（自然语言处理（NLP）Bert与Lstm结合）跑bert+bilstm分类的时…

人工智能 2023年7月24日
00108
前沿综述 | 机器学习在医学中的应用

此前，小编为大家整理过一篇BT与IT融合的综述文章👉 深度学习在生物科学领域的应用，这次姐妹篇来咯！《 Computers in Biology and Medicine 》在今年…

人工智能 2023年6月16日
0096
近几年CVPR图像压缩总结

把近几年有关图像压缩的CVPR论文进行一个简单的总结，个人总结，大佬绕道 ; 1、CVPR2022 1.1 ELIC:Efficient learned image compres…

人工智能 2023年7月27日
0067
YOLOV7训练自己的数据集

代码移植 GitHub – WongKinYiu/yolov7: Implementation of paper – YOLOv7: Trainable b…

人工智能 2023年6月25日
00106
4-03-1 Pandas – 折线图、柱状图、直方图、箱型图

4.3 Pandas 内置可视化方法 Pandas 本身也提供几个简单的数据可视化图形，可以完成简单的变化－折线图、等级－柱状图、分布－直方图、箱型图、相互关系－散点图、分群－安德…

人工智能 2023年7月7日
0088
Flutter 状态管理框架 | 本地与全局状态管理方案

啊哦~你想找的内容离你而去了哦内容不存在，可能为如下原因导致： ① 内容还在审核中 ② 内容以前存在，但是由于不符合新的规定而被删除 ③ 内容地址错误 ④ 作者删除了内容。可…

人工智能 2023年6月29日
0088
使用Pytorch快速搭建神经网络模型（附详细注释和讲解）

文章目录 0 前言 1 数据读入 2 模型搭建 3 模型训练 4 模型测试 5 模型保存 6 参考博客 0 前言代码参考了知乎上”10分钟快速入门PyTorch&#8…

人工智能 2023年6月16日
00110
opencv控制鼠标事件

1.基础知识和API OpenCV允许我们对窗口上的鼠标动作做出响应.回调函数，就是执行以后会执行这个函数 *cv2.setMouseCallback(winname, callb…

人工智能 2023年7月19日
0063
独热(One-Hot)编码简述

目录 1.前言 2.什么是 one-hot 编码？ 3.Python 代码 1.前言今天看Colab上的代码的时候突然看到了这个概念，抱着好奇的心态学习了一下，挺基础也很重要的一…

人工智能 2023年6月13日
00122
【CTA系列】复合中短周期双均线策略

所有策略的出场规则都摒弃了原本传统的信号反转出场，调整为盈亏比率达到固定比率的止盈止损出场，止盈：止损固定为 4：1。 2.SMA策略分析双均线策略已在第一部分有所介绍，具体进…

人工智能 2023年6月27日
0077
Windows下安装及配置CUDA过程详解

安装及配置过程一、下载安装CUDA Toolkit * 1.查看当前系统所支持CUDA版本 2.官网下载安装合适的CUDA 3.配置环境变量 4.测试CUDA安装是否成功二、下…

人工智能 2023年7月27日
0098
【UAV】陀螺仪数据分析，以维特智能 JY901B 为例

文章目录简介 1 加速度 Acceleration 2 陀螺仪 Gyroscope 3 欧拉角 Euler angles 4 磁场 Magnetic 5 四元数 Quaterni…

人工智能 2023年7月16日
0085

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31