NLP基础任务—序列标注任务

2023年5月31日上午2:15 • 人工智能 • 阅读 67

资源下载地址：https://download.csdn.net/download/sheziqiong/86178744
资源下载地址：https://download.csdn.net/download/sheziqiong/86178744

一、思路

本次要完成 nlp 四大基础任务之一的序列标注任务，也叫做命名实体识别。即是在给定文本中能够对词性、人名地名等特定信息进行标注。

实验主要采用循环神经网络进行搭建，每一条样本输入是一条句子（对应的嵌入向量表示），该样本的标签也是一个等长的句子标签，其中每一个元素对应句子中每一个字的标签。如样本为’我爱北京’，则该样本的标签为’O O B-LOC I-LOC’。然后通过循环神经网络再结合交叉熵损失函数进行训练。但根据课上所学知识，我们知道直接用 LSTM 虽然可以完成该任务，但是往往会预测出现一些不可能真实存在的结果，如连续两个 B-LOC 标签。因此我们可以增加条件随机场 CRF 模型在 LSTM 层之后，使用梯度下降自动去学习 CRF 模型的参数，这样可以获得比只使用 LSTM 好的结果。

二、模型概况

Input（）Embedding（input_dim=5000, output_dim=50）BiLSTM(units=100)BiLSTM(units=150)CRF(units=7)

三、编程实现

为了实现上述模型我们首先需要对输入进行处理。首先使用 Tokenizer 库进行分词，词典大小设置为 5000，之后对训练样本进行padding（这里选择 maxlength进行padding），之后对标签也要做相应的 padding（这里 padding 的内容直接选用 O 标签）。

使用 keras 库进行模型的搭建，堆叠型模型声明如下

优化器选用 Adam，损失函数使用稀疏交叉熵，batchsize 设为 128，训练 20 轮。之后用训练好的模型，在测试集上测试即可。 www.biyezuopin.vip

; 四、实验结果

1.两层双向 LSTM 结果：

OB-LOCI-LOCB-PERI-PERB-ORGI-ORGPrecision0.99400.90800.92260.90630.90260.81310.8626Recall0.99780.84710.79270.81350.88520.75510.7894F10.99590.87650.85270.85740.89380.78300.8244 With ‘O’Without ‘O’Macro-precision0.90130.8859Macro-recall0.84010.8138Macro-f10.86910.8480

2.三层双向 LSTM 结果，效果提升不明显

With ‘O’Without ‘O’Macro-precision0.88630.8682Macro-recall0.86100.8383Macro-f10.87260.8520

资源下载地址：https://download.csdn.net/download/sheziqiong/86178744
资源下载地址：https://download.csdn.net/download/sheziqiong/86178744

Original: https://blog.csdn.net/newlw/article/details/124728067
Author: biyezuopinvip
Title: NLP基础任务—序列标注任务

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/547889/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

【OpenCV】学习笔记（一）：OpenCV4.5.5文件介绍

文章目录摘要一、简介 * 1.计算机视觉 2.OpenCV 3.OpenCV文件夹二、build文件夹 * 1.bin 2.etc 3.include 4.x64 5.其他 …

人工智能 2023年6月19日
0065
【数据结构初阶】堆&&堆的实现&&堆排序&&TOP-K

大家好我是沐曦希💕 文章目录 1.前言 2.堆的概念及结构 * 2.1 堆的选择题 3.堆的实现 * 3.1 堆向下调整算法 3.2 堆向上调整算法 3.3 堆的创建 &#8211…

人工智能 2023年5月30日
00111
假设检验到底是什么？

假设检验是什么？百度百科-定义：假设检验 (hypothesis testing)又称统计假设检验，是用来判断样本与样本、样本与总体的差异是由抽样误差引起还是本质差别造…

人工智能 2023年6月11日
00103
垃圾邮件分类任务中多种机器学习（贝叶斯、支持向量机和随机森林）和深度学习（GloVe和LSTM）方法的应用和对比

随着时代的发展，信息以指数形式增长，为了能够从海量信息中迅速找到所需要的信息，就需要对信息进行分类，因此自动文本分类技术应运而生。文本分类其任务是将自然语言文本根据其内容分为预先定…

人工智能 2023年7月1日
0063
知识图谱-现代知识表示理论

目录一、语义网表示法 1.1 语义网概述 1.2 资源描述框架RDF 1.3 本体语言OWL 1.4 规则与推理二、知识图谱中的知识表示 2.1 DBpedia知识表示 2.2…

人工智能 2023年6月1日
0066
MXNet是否支持自动学习超参数调优（AutoML）

问题介绍本文将详细介绍MXNet是否支持自动学习超参数调优（AutoML）的功能。我们将讨论算法原理、公式推导、计算步骤、复杂Python代码示例以及代码细节解释等方面。算法原…

人工智能 2024年1月1日
0047
GraspNet 通用物品抓取数据集

GraspNet 通用物品抓取数据集 GraspNet 是一个通用物品抓取的开源项目，现包含 GraspNet-1Biliion：使用平行爪进行抓取 SuctionNet-1Bil…

人工智能 2023年5月28日
00101
【Redis深度专题】「源码分析系列」从本质分析你写入Redis中的数据为什么不见了？（1）

Redis作为一个成熟的数据存储中间件，它提供了完善的数据管理功能，比如之前我们提到过的数据过期和今天我们要讲的数据淘汰(evict)策略。贯穿计算机学科的原理局部性原理，这里可…

人工智能 2023年7月29日
0043
Keras中如何设置学习率和优化器以及两者之间的关系

在集成式机器学习类库Keras中，对优化器和学习率做了很好的封装，以至于很多人搞不清楚怎么设置学习率，怎么使用优化器，两者到底有什么区别。不同的学习率对模型训练过程中的损失值lo…

人工智能 2023年6月15日
0083
Python中numpy数据分析库知识点总结

Python中numpy数据分析库知识点总结 * – 一、numpy读取数据 – 二、对已读取数据的处理 – + 2.1 转置 + * ①第一种…

人工智能 2023年7月18日
0045
fm调制与解调的simulink仿真_频率调制(FM)

调频（英语：Frequency Modulation，缩写：FM）是一种以载波的瞬时频率变化来表示信息的方式。（与此相对应的调幅方式是透过载波幅度的变化来表示信息，而其频率却保持不…

人工智能 2023年5月27日
00113
十亿网民，九亿都在刷视频，花一分钟来了解一下视频技术，了解手机里的短视频不得不说的故事

我们每天都在刷的各种短视频（抖音、快手）、长视频（优酷、爱奇艺、腾讯视频、Bilibili等等）、直播平台（斗鱼、虎牙），却根本没人真正了解过这些音视频技术，今天就让博主用一篇文章…

人工智能 2023年5月25日
0065
深度学习中神经网络模型压缩的解决办法（ flask API、onnx、ncnn在嵌入式、流媒体端口应用）

神经网络模型压缩方法（ flask API、onnx、ncnn在嵌入式、流媒体端口应用） 1 开发环境的创建 1.1 Conda简介 1.2 miniconda 1.3 conda…

人工智能 2023年6月17日
0062
[3D数学基础：图形与游戏开发]读书笔记第8章（矩阵和线性变换、旋转、缩放、投影、镜像、切变、变换组合、变换分类）

本人资源全部免费，更多资源请查看我的上传资源 ====================================================== 书名： 3D 数学基…

人工智能 2023年7月2日
0062
利用python进行数据分析——DataFrame基本操作

本篇介绍操作Series和DataFrame的基本手段。 1. 对DataFrame的列进行赋值将列表、数组、元组赋值为DataFrame的列，长度匹配即可将Series赋值给…

人工智能 2023年6月11日
0073
【目标检测】29、Focal-EIoU：Focal and Efficient IOU Loss for Accurate Bounding Box Regression

文章目录 * – 一、背景 – 二、方法 – + 2.1 EIoU Loss + 2.2 Focal EIoU Loss – 三、效…

人工智能 2023年7月11日
0047

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

NLP基础任务—序列标注任务

大家都在看