信息抽取（五）实体命名识别之嵌套实体识别哪家强，我做了一个简单的对比实验

2023年5月31日上午2:40 • 人工智能 • 阅读 82

实体矩阵构建框架

GlobalPointer

class GlobalPointer(Module):
    """全局指针模块
    将序列的每个(start, end)作为整体来进行判断
"""
    def __init__(self, heads, head_size,hidden_size,RoPE=True):
        super(GlobalPointer, self).__init__()
        self.heads = heads
        self.head_size = head_size
        self.RoPE = RoPE
        self.dense = nn.Linear(hidden_size,self.head_size * self.heads * 2)

    def forward(self, inputs, mask=None):
        inputs = self.dense(inputs)
        inputs = torch.split(inputs, self.head_size * 2 , dim=-1)
        inputs = torch.stack(inputs, dim=-2)
        qw, kw = inputs[..., :self.head_size], inputs[..., self.head_size:]

        if self.RoPE:
            pos = SinusoidalPositionEmbedding(self.head_size, 'zero')(inputs)
            cos_pos = pos[..., None, 1::2].repeat(1,1,1,2)
            sin_pos = pos[..., None, ::2].repeat(1,1,1,2)
            qw2 = torch.stack([-qw[..., 1::2], qw[..., ::2]], 4)
            qw2 = torch.reshape(qw2, qw.shape)
            qw = qw * cos_pos + qw2 * sin_pos
            kw2 = torch.stack([-kw[..., 1::2], kw[..., ::2]], 4)
            kw2 = torch.reshape(kw2, kw.shape)
            kw = kw * cos_pos + kw2 * sin_pos

        logits = torch.einsum('bmhd , bnhd -> bhmn', qw, kw)

        logits = add_mask_tril(logits,mask)
        return logits / self.head_size ** 0.5

TPLinker

class MutiHeadSelection(Module):

    def __init__(self,hidden_size,c_size,abPosition = False,rePosition=False, maxlen=None,max_relative=None):
        super(MutiHeadSelection, self).__init__()
        self.hidden_size = hidden_size
        self.c_size = c_size
        self.abPosition = abPosition
        self.rePosition = rePosition
        self.Wh = nn.Linear(hidden_size * 2,self.hidden_size)
        self.Wo = nn.Linear(self.hidden_size,self.c_size)
        if self.rePosition:
            self.relative_positions_encoding = relative_position_encoding(max_length=maxlen,
                                    depth= 2 * hidden_size,max_relative_position=max_relative)

    def forward(self, inputs, mask=None):
        input_length = inputs.shape[1]
        batch_size = inputs.shape[0]
        if self.abPosition:

            inputs = SinusoidalPositionEmbedding(self.hidden_size, 'add')(inputs)
        x1 = torch.unsqueeze(inputs, 1)
        x2 = torch.unsqueeze(inputs, 2)
        x1 = x1.repeat(1, input_length, 1, 1)
        x2 = x2.repeat(1, 1, input_length, 1)
        concat_x = torch.cat([x2, x1], dim=-1)

        if self.rePosition:

            relations_keys = self.relative_positions_encoding[:input_length, :input_length, :].to(inputs.device)
            concat_x += relations_keys
        hij = torch.tanh(self.Wh(concat_x))
        logits = self.Wo(hij)
        logits = logits.permute(0,3,1,2)
        logits = add_mask_tril(logits, mask)
        return logits

Tencent Muti-head

class TxMutihead(Module):

    def __init__(self,hidden_size,c_size,abPosition = False,rePosition=False, maxlen=None,max_relative=None):
        super(TxMutihead, self).__init__()
        self.hidden_size = hidden_size
        self.c_size = c_size
        self.abPosition = abPosition
        self.rePosition = rePosition
        self.Wh = nn.Linear(hidden_size * 4, self.hidden_size)
        self.Wo = nn.Linear(self.hidden_size,self.c_size)
        if self.rePosition:
            self.relative_positions_encoding = relative_position_encoding(max_length=maxlen,
                                    depth= 4 * hidden_size,max_relative_position=max_relative)

    def forward(self, inputs, mask=None):
        input_length = inputs.shape[1]
        batch_size = inputs.shape[0]
        if self.abPosition:

            inputs = SinusoidalPositionEmbedding(self.hidden_size, 'add')(inputs)
        x1 = torch.unsqueeze(inputs, 1)
        x2 = torch.unsqueeze(inputs, 2)
        x1 = x1.repeat(1, input_length, 1, 1)
        x2 = x2.repeat(1, 1, input_length, 1)
        concat_x = torch.cat([x2, x1,x2-x1,x2.mul(x1)], dim=-1)
        if self.rePosition:
            relations_keys = self.relative_positions_encoding[:input_length, :input_length, :].to(inputs.device)
            concat_x += relations_keys
        hij = torch.tanh(self.Wh(concat_x))
        logits = self.Wo(hij)
        logits = logits.permute(0,3,1,2)
        logits = add_mask_tril(logits, mask)
        return logits

Deep Biaffine

class Biaffine(Module):

    def __init__(self, in_size, out_size, Position = False):
        super(Biaffine, self).__init__()
        self.out_size = out_size
        self.weight1 = Parameter(torch.Tensor(in_size, out_size, in_size))
        self.weight2 = Parameter(torch.Tensor(2 * in_size + 1, out_size))
        self.Position = Position
        self.reset_parameters()

    def reset_parameters(self):
        torch.nn.init.kaiming_uniform_(self.weight1,a=math.sqrt(5))
        torch.nn.init.kaiming_uniform_(self.weight2,a=math.sqrt(5))

    def forward(self, inputs, mask = None):
        input_length = inputs.shape[1]
        hidden_size = inputs.shape[-1]
        if self.Position:

            inputs = SinusoidalPositionEmbedding(hidden_size, 'add')(inputs)
        x1 = torch.unsqueeze(inputs, 1)
        x2 = torch.unsqueeze(inputs, 2)
        x1 = x1.repeat(1, input_length, 1, 1)
        x2 = x2.repeat(1, 1, input_length, 1)
        concat_x = torch.cat([x2, x1], dim=-1)
        concat_x = torch.cat([concat_x, torch.ones_like(concat_x[..., :1])],dim=-1)

        logits_1 = torch.einsum('bxi,ioj,byj -> bxyo', inputs, self.weight1, inputs)
        logits_2 = torch.einsum('bijy,yo -> bijo', concat_x, self.weight2)
        logits = logits_1 + logits_2
        logits = logits.permute(0,3,1,2)
        logits = add_mask_tril(logits, mask)
        return logits

代码开源，各种实体矩阵构建方法都写成了类，方便大家复现或直接调用 https://github.com/zhengyanzhao1997/NLP-model/tree/main/model/model/Torch_model/ExtractionEntities

MethodPositionBatch_sizelearning_rateCMeEE

/F1%CMeEE

/F1%

RoPE162e-573.23

TPLinker\81e-580.5762.69TPLinkerPos

81e-583.2163.10

81e-576.63

Tencent Muti-head\41e-583.5063.74Tencent Muti-headPos

41e-576.3264.18

41e-577.37

2e-568.81

Deep Biaffine\81e-578.2762.85Deep BiaffinePos

81e-577.5262.66

Original: https://blog.csdn.net/weixin_45839693/article/details/116425297
Author: 是算法不是法术
Title: 信息抽取（五）实体命名识别之嵌套实体识别哪家强，我做了一个简单的对比实验

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/548009/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

openvino+linux(Ubuntu)+python+YOLOv5+pytorch

openvino在linux上配合yolov5的使用 python版本 pytorch 目录 openvino在linux上配合yolov5的使用 python版本 1、流程： 2…

人工智能 2023年7月22日
0057
MindSpore 环境搭建操作手册

目录 1.准备工作 2.服务器的购买（华为云） 3.ssh远程连接服务器 4.关于cuda的安装及配置 5.关于cudnn的安装及配置 6.关于anaconda的配置 7.关…

人工智能 2023年6月20日
0090
Gazebo手册：【1】gazebo基本操作案例

目录一、前言二、何为Gazebo？ 1）Gazebo 的典型用途包括： 2）Gazebo 的一些主要功能包括：三、Gazebo的运行环境四、如何实现编辑 4.1 进入基本界…

人工智能 2023年6月1日
0096
MySQL数据库常用命令大全（完整）（表格形式）

易语言5.1 相对于易语言5.0更新说明：支持静态链接其它编程语言（如C/C++、汇编等）编译生成的静态库（.LIB或.OBJ），但仅限于COFF格式，支持cdecl和stdca…

人工智能 2023年7月30日
0061
go入门项目：(3) Bookstore-REST-API

CRUD API 添加书籍示例 [ { "id": "4", "title": "Rust权威指南"…

人工智能 2023年6月4日
0064
YOLOv5的Tricks | 【Trick5】遗传算法实现超参数进化（Hyperparameter Evolution）

如有错误，恳请指出。文章目录 1. 遗传算法介绍 2. 遗传算法进化超参数 * 2.1 实现思路 2.2 实现代码 3. Hyperparameter Evolution使用 H…

人工智能 2023年5月31日
0091
【AAAI2021】NLP所有方向论文列表（情感分析、句法、NER、对话/问答、关系抽取、KD等）…

点击上方，选择星标或置顶，每天给你送干货！最近整理了下AAAI2021 NLP论文各个细方向的接收列表！应该还有几篇漏网之鱼，之后发现了补上~ AAAI2021接收论文PDF…

人工智能 2023年6月1日
0075
图像生成——总结

评价指标 Inception Score（IS）计算这个 score 需要用到 Inception Net-V3，评价一个生成模型，需要考虑两个方面的性能：是否清晰。是否多样…

人工智能 2023年6月15日
0085
【web前端开发】前端生日礼物–注册页面篇

文章目录总计划注册界面 * 页面背景设置 – 注意字体选择 – 不明原因：在父相子绝下字体不对齐父类登录浮窗 – 制作透明盒子给盒子设…

人工智能 2023年6月2日
0068
基于pyskl的poseC3D训练自己的数据集

最近在研究视频动作识别，看了不少的相关算法，主要有基于MMDetection框架下的一些列的研究，有直接对视频进行识别，获取人为动作，比如slowfast等等，但是往往也有一定的局…

人工智能 2023年6月16日
0088
SNN学习笔记(一): LIF模型

核心思想 LIF模型的提出旨在模拟生物神经元模型的工作过程（生物神经元结构如下图所示）。回顾生物知识可知，生物神经元只有在获得外界刺激并且超过一定阈值时才会向与其相连的其他神经元传…

人工智能 2023年6月25日
00100
TensorFlow 2.0 API

数值类型的张量是 TensorFlow 的主要数据载体，根据维度数来区分，可分为:(1)标量(Scalar)。单个的实数，如 1.2, 3.4 等，维度(Dimension)…

人工智能 2023年5月26日
0050
CV::Mat数据拷贝 memcpy 踩坑

cv::Mat img1(h, w, CV_8UC3);cv::Mat img1(h, w, CV_8UC3, data); 一般cv::mat 初始化后数据内存 data 段都…

人工智能 2023年7月19日
00108
2022年人工智能5大发展趋势

近几年随着各行业对于自动化需求的提高，为人工智能带了了一次巨大的提升机会。随着深度学习的开放，人工智能在几年中快速发展，由尖端技术慢慢向着开始普及在各行业和家庭生活中。以下是国外一…

人工智能 2023年5月28日
00248
Spring整合mybatis和junit

1.注解开发和xml配置对比图 ; 2.Spring整合mybatis 在进行企业级开发的时候，除了将自己写的类让Spring管理之外，还有一部分重要的工作就是使用第三方的技术。下…

人工智能 2023年6月27日
0066
机器学习分类器——案例（opencv sklearn svm ann）

机器学习分类器——案例（opencv sklearn svm ann python） ps：最近师姐给我们留了一个任务，记录一下从一开始的什么都不懂到现在把任务做出来，并从中学习到…

人工智能 2023年7月18日
0050

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31