关于使用PaddleNLP加载训练好的模型进行NER时的弯路

2023年5月31日上午4:26 • 人工智能 • 阅读 82

我想要做的事情是：利用PaddleNLP在AI Studio上训练好一个基于BERT的实体识别模型，然后将模型导出来放在另一个环境下断网运行。

训练完成后，我将 bert-base-multilingual-uncased对应的基础模型以及训练结束后生成的参数下载到本地。在默认情况下， bert-base-multilingual-uncased对应的基础模型会保存在 ~/.paddlenlp/models路径下，配套的有两个文件，分别是 bert-base-multilingual-uncased.pdparams和 bert-base-multilingual-uncased-vacab.txt；训练生成的参数文件会保存在训练脚本所在目录下的 tmp/msra_ner目录下，名称为 model_4218.pdparams，后面的数字表示一共训练的步数。

在下载的时候遇到了一个问题，由于基础模型默认保存的路径在一个隐藏的目录下，因此，只能将该隐藏目录重命名后才能在CodeLab左侧的文件浏览器中展示并通过右键菜单下载。

成功导出后，我想要通过预训练模型的 from_pretrained()方法来加载上述导出模型。在这个场景下，用到 from_pretrained()的一共有两处方法，下面我分开来说明：

这里是加载分词器，从这个 from_pretrained()方法的注释中可以看到，第一个形参可以传入一个指向分词器需要数据的本地目录。从代码逻辑可以看出，这个目录下需要有两个文件，一是vocab.txt，一个是tokenizer_config.json，且文件名称必须是这样。追溯源码可以发现，词表名称必须为vocab.txt的约束在 paddlenlp/transformers/bert/tokenizer.py/BertTokenizer类中；配置文件名称必须为tokenizer_config.json的约束在 paddlenlp/transformers/tokenizer_utils.py/PretrainedTokenizer中。

项目示例给出的 predict.py之所以没有这个问题，是因为该示例并没有从本地目录加载模型，而是直接输入的模型名称，只不过在由于在训练前已经下载了基础模型以及词表，因此，在预测时使用的是已下载好的文件。

这里加载的基础模型。同样，可以指定一个本地目录进行加载。该目录下也需要有两个名称固定的文件，一个是model_config.json，一个是model_state.pdparams。通过追溯源码，同样可以找到名称被规定成这样的限定所在。

类似地，项目示例给出的 predict.py也是直接加载的模型名称，在下载前检验到已经有下载好的模型从而没有重复下载。

综合上述两点，我目前认为问题主要有两个：一是示例预测代码由于没有使用离线加载模型的方式，因此tokenizer_config.json和model_config.json的信息实际上是从代码中获取的，而且训练是保存的文件中并没有这两个文件，需要阅读源码推理出它们的格式。二是在训练时下载的基础模型以及词表的名称并不能直接满足离线使用时的需要，仍需要阅读源码推理出它们的名称。

以上两点，或许应该有所改进。例如可以改成与加载checkpoint参数相同的方式，即直接定位到文件本身，而非文件所在路径。

Original: https://blog.csdn.net/SunJW_2017/article/details/120709991
Author: 芳樽里的歌
Title: 关于使用PaddleNLP加载训练好的模型进行NER时的弯路

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/548662/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

Android音频框架之三用户录音启动流程源码走读 startRecord

此篇是对《Android音频框架之一详解audioPolicy流程及HAL驱动加载》和《Android音频框架之二用户录音启动流程源码走读》的延续，此系列博文是记录在Andr…

人工智能 2023年5月23日
0085
用Python来表白，把情书写进她的照片里

前言这不已经十一月了，22年马上就过完了，各位兄弟有对象了吗，现在就是缺钱还缺对象退一步来说，有心仪的人吗啊，如果有的话，看看这篇程序员的表白小妙招吧 ; 实现步骤想要实现…

人工智能 2023年6月16日
0095
随笔记录——pandas(数据联合与合并)

包含在pandas对象的数据可以通过多种方式联合在一起： pandas.merge根据一个或多个键将行进行连接。对于SQL或其他关系型数据库的用户来说，这种方式比较熟悉，它实现的是…

人工智能 2023年7月17日
0060
蛋白质功能预测中PSSM矩阵的生成

一、蛋白质功能预测近年来高通量实验方法快速发展，随之产生大量新型蛋白质，发现的蛋白质数量与其功能注释之间的差距越来越大，蛋白质功能预测成为分子生物学研究领域的核心问题。传统的蛋白…

人工智能 2023年7月6日
00154
基于opencv用卡尔曼滤波做落点预测

From sztu 自动化专业的小菜鸡。本篇将介绍计算机视觉的落点预测，基于python的opencv。实战阶段，运用卡尔曼滤波的相关知识去做落点预测。 1.卡尔曼滤波卡尔曼…

人工智能 2023年7月20日
0071
Spring基础之IoC

创建Maven工程，导入spring依赖 <dependency> <groupid>org.springframework</groupid>…

人工智能 2023年6月30日
0092
MXNet安装方法与常见问题解决

提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录前言一、什么是MXNet？二、MXNet的安装 * 2.1 在CPU上安装 – 2.1….

人工智能 2023年6月16日
00109
深入剖析多层双向LSTM的输入输出

目录一、前言二、符号约定三、LSTM的参数四、LSTM的输入五、LSTM的输出最后一、前言本文将结合官方文档并以seq2seq模型为例全面展示在多层（ num_l…

人工智能 2023年6月17日
00100
论文阅读：（TransE）Translating Embeddings for Modeling Multi-relational Data多关系数据转换嵌入建模

一、摘要和引言我们现在考虑的问题是把多关系数据的实体和关系嵌入到低维向量空间中。希望通过构建一个易于训练，有限参数，并且适用于大型数据库的稳定模型。为此，我们提出了TranE， …

人工智能 2023年6月4日
00127
Ubuntu安装Pytorch（详细）

最近发现了一个挺厉害的人工智能学习网站，内容通俗易懂，风趣幽默，感兴趣的可以点击此链接进行查看：床长人工智能教程废话不多说，请看正文！一、安装 NVIDIA GPU显卡驱动 1…

人工智能 2023年7月20日
0089
Pandas的DataFrame & Series【详解】

Pandas数据结构 1.Series2.DataFrame3.从DataFrame中查询出Series DataFrame: 二维数据、整个表格、多行多列 Series:一维数据…

人工智能 2023年7月6日
0097
python将str写入csv_python – Pandas将数据帧写入CSV fi

如果您遇到编码为’utf-8’的问题，并且想要逐个单元格地进行，您可以尝试以下其他方法。 Python 2 (其中”df”是您的Da…

人工智能 2023年7月8日
00100
PyQt5(一) PyQt5安装及配置，从文件夹读取图片并显示，模拟生成素描图像

目录一、环境配置 1.1 安装PyQt5 1.2 安装Qt工具包 1.3 配置环境变量 1.4 测试PyQt5 1.5 配置PyCharm 二、QtDesigner 窗口简单介绍…

人工智能 2023年7月5日
0088
【深度学习】之激活函数篇[Sigmoid、tanh、ReLU、Leaky ReLU、Mish、Hardswish、SiLU]附绘图Python代码。

激活函数的作用为卷积神经网络提供非线性 1、Sigmoid激活函数 Sigmoid激活函数是常用的连续、平滑的”s”型激活函数，其数学定义比较简单，如公式…

人工智能 2023年7月5日
00121
什么是注意力机制及其应用（self attention）？

一、引言注意力机制是自深度学习快速发展后广泛应用于自然语言处理、统计学习、图像检测、语音识别等领域的核心技术，例如将注意力机制与RNN结合进行图像分类，将注意力机制运用在自然语言…

人工智能 2023年6月17日
0091
机器学习笔记：训练集、验证集与测试集

在学习《深度学习原理与pythorch实战》这本书的4.3.4划分数据集这一小节（即76页划分数据集）的过程中，提到了训练集、测试集与验证集这几个概念，以及为何相对于通用的训练集、…

人工智能 2023年6月23日
0074

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

关于使用PaddleNLP加载训练好的模型进行NER时的弯路

大家都在看