bert中文分类模型训练+推理+部署

2023年7月1日下午1:18 • 人工智能 • 阅读 106

文章预览：

*
– 0. bert简介
– 1. bert结构
– 1. bert中文分类模型训练
–
+ 1 下载bert项目代码
+
* 代码结构
+ 2 下载中文预训练模型
+ 3 制作中文训练数据集
– 2. bert模型推理
–
+ 1.tensorflow推理
– 2. onnxruntime推理
–
+ 1. checkpoint格式转换为saveModel格式
+ 2. saveModel格式转换为onnx格式
+ 3. 使用onnxruntime推理onnx格式模型

0. bert简介

BERT（Bidirectional Encoder Representation from Transformers）是google-research在2018年10月提出的一种预训练模型，在11种不同NLP测试中创出SOTA表现，成为NLP发展史上里程碑式的模型成就。
本篇文章从实践入手，带领大家进行Bert的中文文本分类模型的训练和推理的使用教程。

1. bert结构

1. bert中文分类模型训练

bert训练主要分为两个阶段：预训练阶段和 Fine-tuning 阶段。

什么是预训练？
BERT是一个预训练的模型，那么什么是预训练呢？举例子进行简单的介绍
假设已有A训练集，先用A对网络进行预训练，在A任务上学会网络参数，然后保存以备后用，当来一个新的任务B，采取相同的网络结构，网络参数初始化的时候可以加载A学习好的参数，其他的高层参数随机初始化，之后用B任务的训练数据来训练网络，当加载的参数保持不变时，称为”frozen”，当加载的参数随着B任务的训练进行不断的改变，称为”fine-tuning”，即更好地把参数进行调整使得更适合当前的B任务
优点：当任务B的训练数据较少时，很难很好的训练网络，但是获得了A训练的参数，会比仅仅使用B训练的参数更优

预训练
预训练阶段与 Word2Vec，ELMo 等类似，是在大型数据集上根据一些预训练任务训练得到。预训练需要巨大的运算资源，google官方预训练一个语言模型，需要在 4 到 16 个 Cloud TPU 训练四天的时间，幸运的是，google官方开源了许多预训练模型，包括中文预训练模型。大多数 NLP 研究人员永远不需要从头开始预训练他们自己的模型。

微调
Fine-tuning 阶段是后续用于一些下游任务的时候，在预训练模型基础之上进行微调，例如文本分类，词性标注，问答系统等，BERT 无需调整结构就可以在不同的任务上进行微调。

1 下载bert项目代码

https://github.com/google-research/bert

代码结构

预训练
在开源的代码中，预训练的入口是在run_pretraining.py。
微调
而微调的入口针对不同的任务分别在run_classifier.py和run_squad.py。
其中run_classifier.py用于文本分类任务的训练。
而run_squad.py用于阅读理解任务的训练。

; 2 下载中文预训练模型

对于中文而言，google公布了一个参数较小的BERT预训练模型。

模型下载地址

https://github.com/google-research/bert/blob/master/multilingual.md

进入下载页面，选择： BERT-Base, Chinese进行下载。

下载完成后，解压至与run_classifier.py同一级目录。
模型文件说明

bert_model.ckpt：存储得模型变量
vocab.txt：中文文本采用的字典，
bert_config.json：是bert在训练时，可选调整的一些配置参数。

3 制作中文训练数据集

对中文文本数据进行分类模型的训练，需要编写程序对训练数据进行处理，使其按照要求传入bert模型进行训练，而BERT代码中processor类就是负责对模型的输入数据进行处理。

们以分类任务为例，介绍如何修改processor类来运行自己数据集上的fine-tune。在run_classsifier.py文件中我们可以看到，google对于一些公开数据集已经写了一些processor，如XnliProcessor,MnliProcessor,MrpcProcessor和ColaProcessor。这给我们提供了一个很好的示例，指导我们如何针对自己的数据集来写processor。

class kedataProcessor(DataProcessor):
  """Processor for the XNLI data set."""

  def get_train_examples(self, data_dir):
      return self._create_examples(

          self._read_tsv(os.path.join(data_dir, "train.tsv")), "train")

  def get_dev_examples(self, data_dir):
      return self._create_examples(
          self._read_tsv(os.path.join(data_dir, "dev.tsv")), "dev")

  def get_test_examples(self, data_dir):
      return self._create_examples(
          self._read_tsv(os.path.join(data_dir, "test.tsv")), "test")

  def get_labels(self):
      # &#x8FD9;&#x91CC;&#x8FD4;&#x56DE;&#x7684;&#x4E3A;&#x5177;&#x4F53;&#x7684;&#x4F60;&#x7684;&#x5206;&#x7C7B;&#x7684;&#x7C7B;&#x522B;
      labelf = open(FLAGS.data_dir+'\label.csv', 'r', newline='', encoding = 'gb2312')
      labeldata = csv.reader(labelf, delimiter="\t")
      labelList=[]
      for line in labeldata:
          label=line[1]
          labelList.append(label)

      return labelList

  def _create_examples(self, lines, set_type):
      """Creates examples for the training and dev sets."""
      examples = []
      for (i, line) in enumerate(lines):
          guid = "%s-%s" % (set_type, i)
          text_a = tokenization.convert_to_unicode(line[1])
          label = tokenization.convert_to_unicode(line[0])
          # print('guid:',guid," text:",text_a,' label:',label)
          examples.append(
              InputExample(guid=guid, text_a=text_a, text_b=None, label=label))

      return examples

自定义的processor里需要继承DataProcessor，并重载获取label的get_labels和获取单个输入的get_train_examples,get_dev_examples和get_test_examples函数。其分别会在main函数的FLAGS.do_train、FLAGS.do_eval和FLAGS.do_predict阶段被调用。
这三个函数的内容是相差无几的，区别只在于需要指定各自读入文件的地址。

以get_train_examples为例，函数需要返回一个由InputExample类组成的list。InputExample类是一个很简单的类，只有初始化函数，需要传入的参数中guid是用来区分每个example的，可以按照train-%d’%(i)的方式进行定义。text_a是一串字符串，text_b则是另一串字符串。在进行后续输入处理后(BERT代码中已包含，不需要自己完成) text_a和text_b将组合成[CLS] text_a [SEP] text_b [SEP]的形式传入模型。最后一个参数label也是字符串的形式，label的内容需要保证出现在get_labels函数返回的list里。

举一个例子，假设我们想要处理一个能够判断句子相似度的模型，现在在data_dir的路径下有一个名为train.csv的输入文件，如果我们现在输入文件的格式如下csv形式：

&#x80AF;&#x5B9A;    &#x55EF;&#xFF0C;&#x5BF9;&#xFF0C;&#x662F;&#x3002;
&#x6C42;&#x804C;&#x72B6;&#x6001;_&#x5DF2;&#x627E;&#x5230;&#x5DE5;&#x4F5C;   &#x5443;&#xFF0C;&#x6211;&#x6709;&#x5DE5;&#x4F5C;&#x4E86;&#x8C22;&#x8C22;&#x3002;
&#x4E2D;&#x6027;    &#x54E6;&#xFF0C;&#x4F60;&#x60A8;&#x8BF4;&#x5427;&#x3002;
&#x8BE2;&#x95EE;&#x5C97;&#x4F4D;&#x5730;&#x5740;    &#x55EF;&#x90A3;&#xFF0C;&#x90A3;&#x4F60;&#x4EEC;&#x5C31;&#x662F;&#x4E0A;&#x73ED;&#x7684;&#x8BDD;&#xFF0C;&#x662F;&#x5C31;&#x8FD1;&#x5B89;&#x6392;&#x5417;&#xFF0C;&#x6211;&#x770B;&#x6709;&#x5F88;&#x591A;&#x4F60;&#x4EEC;&#x90A3;&#x4E2A;
&#x80AF;&#x5B9A;    &#x5728;&#x542C;&#x5F97;&#x89C1;&#x6211;&#x8BF4;&#x8BDD;&#x5417;&#x3002;
&#x4E2D;&#x6027;    &#x554A;&#xFF0C;&#x4F60;&#x8BF4;&#x4F60;&#x8BF4;&#x3002;
&#x667A;&#x80FD;&#x52A9;&#x7406;    &#x7684;&#x7528;&#x6237;&#x6682;&#x65F6;&#x65E0;&#x6CD5;&#x63A5;&#x542C;&#x4F60;&#x7684;&#x7535;&#x8BDD;&#xFF0C;&#x77ED;&#x4FE1;&#x901A;&#x77E5;&#x8BF7;&#x6302;&#x673A;&#x8BED;&#x97F3;&#x7559;&#x8A00;&#xFF0C;&#x8BF7;&#x6309;&#x4E00;&#x5982;&#x9700;&#x4EBA;&#x5DE5;&#x5E2E;&#x52A9;&#xFF0C;&#x8BF7;&#x6309;&#x96F6;
&#x6CA1;&#x542C;&#x6E05;&#x4EC0;&#x4E48;&#x4E8B;    &#x5E72;&#x5565;&#x5440;&#x4EC0;&#x4E48;&#x4E8B;&#x60C5;&#xFF1F;
&#x5728;&#x5FD9;    &#x54E6;&#xFF0C;&#x7B49;&#x4F1A;&#x6211;&#x73B0;&#x5728;&#x5728;&#x53BB;&#x9762;&#x8BD5;&#x7684;&#x8DEF;&#x4E0A;&#x3002;
&#x5426;&#x5B9A;    &#x55EF;&#xFF0C;&#x73B0;&#x5728;&#x6CA1;&#x6709;&#x4E86;&#xFF0C;&#x4E0D;&#x597D;&#x610F;&#x601D;&#x554A;&#x3002;

label.csv

0   &#x6253;&#x9519;&#x4E86;    226
1   &#x6253;&#x8FC7;&#x7535;&#x8BDD;    127
2   &#x62D2;&#x7EDD;&#x6765;&#x7535;    177
3   &#x7535;&#x8BDD;&#x53F7;&#x7801;&#x83B7;&#x53D6;    19
4   &#x53CD;&#x95EE;&#x542C;&#x89C1;&#x4E0E;&#x5426;    55
5   &#x975E;&#x673A;&#x4E3B;    285
6   &#x5426;&#x5B9A;    4477
7   &#x798F;&#x5229;_&#x5176;&#x4ED6;   15
8   &#x798F;&#x5229;_&#x98DF;&#x5BBF;   47
9   &#x798F;&#x5229;_&#x4E94;&#x9669;&#x4E00;&#x91D1;   83
10  &#x5C97;&#x4F4D;_&#x5E74;&#x9F84;&#x8981;&#x6C42;   58

修改processor字典
修改完成processor后，需要在在原本main函数的processor字典里，加入修改后的processor类，即可在运行参数里指定调用该processor。

processors = {
      "cola": ColaProcessor,
      "mnli": MnliProcessor,
      "mrpc": MrpcProcessor,
      "xnli": XnliProcessor,
      "kedata": kedataProcessor,
  }

运行run_classifier.py
之后就可以直接运行run_classsifier.py进行模型的训练。在运行时需要制定一些参数，一个较为完整的运行参数如下所示：

BERT_BASE_DIR=/path/to/bert/chinese_L-12_H-768_A-12 #&#x5168;&#x5C40;&#x53D8;&#x91CF; &#x4E0B;&#x8F7D;&#x7684;&#x9884;&#x8BAD;&#x7EC3;bert&#x5730;&#x5740;
MY_DATASET=/path/to/kedata #&#x5168;&#x5C40;&#x53D8;&#x91CF; &#x6570;&#x636E;&#x96C6;&#x6240;&#x5728;&#x5730;&#x5740;

python run_classifier.py \
  --task_name=kedata \ #&#x81EA;&#x5DF1;&#x6DFB;&#x52A0;processor&#x5728;processors&#x5B57;&#x5178;&#x91CC;&#x7684;key&#x540D;
  --do_train=true \
  --do_eval=true \
  --dopredict=true \
  --data_dir=$MY_DATASET \
  --vocab_file=$BERT_BASE_DIR/vocab.txt \
  --bert_config_file=$BERT_BASE_DIR/bert_config.json \
  --init_checkpoint=$BERT_BASE_DIR/bert_model.ckpt \
  --max_seq_length=128 \ #&#x6A21;&#x578B;&#x53C2;&#x6570;
  --train_batch_size=32 \
  --learning_rate=5e-5 \
  --num_train_epochs=2.0 \
  --output_dir=/tmp/selfsim_output/ #&#x6A21;&#x578B;&#x8F93;&#x51FA;&#x8DEF;&#x5F84;

2. bert模型推理

1.tensorflow推理

问题：
用Estimater.predict总是把模型重新load一遍，这样工程业务根本没法用。
解决方案：
使用python的生成器，让程序”误以为”有很多序列需要预测，这里构造yield形式即可；
利用tf.data.Dataset.from_generator，加载生成器，声明好数据结构和类型；
利用class类的实例变量self的全局性，通过self.inputs把数据”喂给到”生成器内部，这样就保证了数据的”源源不断”；
程序需要close的机制，用于保证停掉生成器的工作。

from tokenization import FullTokenizer, validate_case_matches_checkpoint
from modeling import BertConfig
from run_classifier import model_fn_builder
import tensorflow as tf
from tensorflow.python.estimator.estimator import Estimator
from tensorflow.python.estimator.run_config import RunConfig
from run_classifier import FLAGS,InputExample,convert_single_example
import csv
import os
import numpy as np

class model(object):
    def __init__(self, labelfile,vocabfile,bert_config_file,init_checkpoint,ckptdir,max_seq_length):
        self.label = self.loadLabel(labelfile)
        self.closed = False
        self.first_run = True
        self.bert_config_file=bert_config_file
        self.ckptdir=ckptdir

        self.tokenizer = FullTokenizer(
            vocab_file=vocabfile,
            do_lower_case=True)
        self.init_checkpoint = init_checkpoint
        self.seq_length = max_seq_length
        self.text = None
        self.num_examples = None
        self.predictions = None
        self.estimator = self.get_estimator()

    def loadLabel(sel, labelfile):
        labelf = open(labelfile, 'r', newline='', encoding='gbk')
        labeldata = csv.reader(labelf, delimiter="\t")
        labelList = []
        for line in labeldata:
            label = line[1]
            labelList.append(label)
        return labelList

    def get_estimator(self):
        validate_case_matches_checkpoint(True, self.init_checkpoint)
        bert_config = BertConfig.from_json_file(self.bert_config_file)  # &#x8F7D;&#x5165;bert&#x81EA;&#x5B9A;&#x4E49;&#x914D;&#x7F6E;
        if FLAGS.max_seq_length > bert_config.max_position_embeddings:  # &#x9A8C;&#x8BC1;&#x914D;&#x7F6E;&#x4FE1;&#x606F;&#x51C6;&#x786E;&#x6027;
            raise ValueError(
                "Cannot use sequence length %d because the BERT pre_model "
                "was only trained up to sequence length %d" %
                (self.seq_length, bert_config.max_position_embeddings))
        run_config = RunConfig(
            model_dir=self.ckptdir,
            save_checkpoints_steps=FLAGS.save_checkpoints_steps,
            session_config=None
        )

        model_fn = model_fn_builder(  # &#x4F30;&#x8BA1;&#x5668;&#x51FD;&#x6570;&#xFF0C;&#x63D0;&#x4F9B;Estimator&#x4F7F;&#x7528;&#x7684;model_fn&#xFF0C;&#x5185;&#x90E8;&#x4F7F;&#x7528;EstimatorSpec&#x6784;&#x5EFA;&#x7684;
            bert_config=bert_config,
            num_labels=len(self.label),
            init_checkpoint=self.init_checkpoint,
            learning_rate=FLAGS.learning_rate,
            num_train_steps=0,
            num_warmup_steps=0,
            use_tpu=FLAGS.use_tpu,
            use_one_hot_embeddings=FLAGS.use_tpu)
        estimator = Estimator(  # &#x5B9E;&#x4F8B;&#x5316;&#x4F30;&#x8BA1;&#x5668;
            model_fn=model_fn,
            config=run_config,
            warm_start_from=self.init_checkpoint  # &#x65B0;&#x589E;&#x9884;&#x70ED;
        )
        return estimator

    def get_feature(self, index, text):
        example = InputExample(f"text_{index}", text, None, self.label[0])
        feature = convert_single_example(index, example, self.label, self.seq_length, self.tokenizer)
        return feature.input_ids, feature.input_mask, feature.segment_ids, feature.label_id

    def create_generator(self):
        """&#x6784;&#x5EFA;&#x751F;&#x6210;&#x5668;"""
        while not self.closed:
            self.num_examples = len(self.text)
            features = (self.get_feature(*f) for f in enumerate(self.text))

            yield dict(zip(("input_ids", "input_mask", "segment_ids", "label_ids"), zip(*features)))

    def input_fn_builder(self):
        """&#x7528;&#x4E8E;&#x9884;&#x6D4B;&#x5355;&#x72EC;&#x5BF9;&#x9884;&#x6D4B;&#x6570;&#x636E;&#x8FDB;&#x884C;&#x521B;&#x5EFA;&#xFF0C;&#x4E0D;&#x57FA;&#x4E8E;&#x6587;&#x4EF6;&#x6570;&#x636E;"""
        dataset = tf.data.Dataset.from_generator(
            self.create_generator,
            output_types={'input_ids': tf.int32,
                          'input_mask': tf.int32,
                          'segment_ids': tf.int32,
                          'label_ids': tf.int32},
            output_shapes={
                'label_ids': (None),
                'input_ids': (None, None),
                'input_mask': (None, None),
                'segment_ids': (None, None)}
        )
        return dataset

    def predict(self, text):
        self.text = text
        if self.first_run:
            self.predictions = self.estimator.predict(
                input_fn=self.input_fn_builder, yield_single_examples=True)
            self.first_run = False

        probabilities = next(self.predictions)
        # &#x83B7;&#x53D6;&#x6700;&#x5927;&#x503C;&#x7D22;&#x5F15;
        index = np.argmax(probabilities["probabilities"])
        label = self.label[index]
        # return [self.label[i] for i in probabilities["probabilities"].argmax(axis=1)]

        return label

    def close(self):
        self.closed = True
pythonfile=os.path.realpath(os.path.realpath(__file__))
pardir=os.path.abspath(os.path.join(pythonfile,os.path.pardir))
labelfile=os.path.join(pardir,'ckpt/label.csv')
init_checkpoint=os.path.join(pardir,'chinese_L-12_H-768_A-12/bert_model.ckpt')
vocabfile=os.path.join(pardir,'chinese_L-12_H-768_A-12/vocab.txt')
bert_config_file=os.path.join(pardir,'chinese_L-12_H-768_A-12/bert_config.json')
ckptdir=os.path.join(pardir,'ckpt/')
max_seq_length=128
def getModel():
    bert = model(labelfile,vocabfile,bert_config_file,init_checkpoint,ckptdir,max_seq_length)
    bert.predict([""])
    return bert

if __name__=="__main__":
    bert=getModel()
    for i in range(1000):
        label=bert.predict(["&#x6253;&#x9519;&#x4E86;"])

2. onnxruntime推理

ONNX Runtime是一个高性能的机器学习模型推理引擎。它与PyTorch、TensorFlow以及许多其他支持ONNX标准的框架和工具兼容。ONNX Runtime设计了一个开放和可扩展的体系结构，通过利用内置的图形优化和跨CPU、GPU和边缘设备的各种硬件加速功能，可以轻松地优化和加速推理。ONNX Runtime可以很容易地插入到你的技术堆栈中，因为它可以在Linux、Windows、Mac和Android上工作，并且为Python、c#、c++、C和Java提供了方便的api。

为加快bert的推理时间，部署到服务器上，可食用onnxruntime进行推理加速。

1. checkpoint格式转换为saveModel格式

from tokenization import FullTokenizer, validate_case_matches_checkpoint
from modeling import BertConfig
from run_classifier import model_fn_builder
import tensorflow as tf
from tensorflow.python.estimator.estimator import Estimator
from tensorflow.python.estimator.run_config import RunConfig
from run_classifier import FLAGS
import csv

class Fast(object):
    def __init__(self, labelfile,vocabfile,bert_config_file,init_checkpoint,ckptdir):
        self.label = self.loadLabel(labelfile)
        self.closed = False
        self.first_run = True
        self.bert_config_file=bert_config_file
        self.ckptdir=ckptdir

        self.tokenizer = FullTokenizer(
            vocab_file=vocabfile,
            do_lower_case=True)
        self.init_checkpoint = init_checkpoint
        # self.seq_length = FLAGS.max_seq_length
        self.seq_length = 128
        self.text = None
        self.num_examples = None
        self.predictions = None
        self.estimator = self.get_estimator()

    def loadLabel(sel, labelfile):
        labelf = open(labelfile, 'r', newline='', encoding='gbk')
        labeldata = csv.reader(labelf, delimiter="\t")
        labelList = []
        # for i in range(60):
        #    labelList.append(i)
        for line in labeldata:
            label = line[1]
            labelList.append(label)
        return labelList

    def get_estimator(self):
        validate_case_matches_checkpoint(True, self.init_checkpoint)
        print("FLAGS.bert_config_file:",FLAGS.bert_config_file)
        bert_config = BertConfig.from_json_file(self.bert_config_file)  # &#x8F7D;&#x5165;bert&#x81EA;&#x5B9A;&#x4E49;&#x914D;&#x7F6E;
        if FLAGS.max_seq_length > bert_config.max_position_embeddings:  # &#x9A8C;&#x8BC1;&#x914D;&#x7F6E;&#x4FE1;&#x606F;&#x51C6;&#x786E;&#x6027;
            raise ValueError(
                "Cannot use sequence length %d because the BERT pre_model "
                "was only trained up to sequence length %d" %
                (self.seq_length, bert_config.max_position_embeddings))
        print("FLAGS.save_checkpoints_steps:",FLAGS.save_checkpoints_steps)
        run_config = RunConfig(
            model_dir=self.ckptdir,
            save_checkpoints_steps=FLAGS.save_checkpoints_steps,
            session_config=None
        )

        model_fn = model_fn_builder(  # &#x4F30;&#x8BA1;&#x5668;&#x51FD;&#x6570;&#xFF0C;&#x63D0;&#x4F9B;Estimator&#x4F7F;&#x7528;&#x7684;model_fn&#xFF0C;&#x5185;&#x90E8;&#x4F7F;&#x7528;EstimatorSpec&#x6784;&#x5EFA;&#x7684;
            bert_config=bert_config,
            num_labels=len(self.label),
            init_checkpoint=self.init_checkpoint,
            learning_rate=FLAGS.learning_rate,
            num_train_steps=0,
            num_warmup_steps=0,
            use_tpu=FLAGS.use_tpu,
            use_one_hot_embeddings=FLAGS.use_tpu)
        print("model_fn:",model_fn)
        estimator = Estimator(  # &#x5B9E;&#x4F8B;&#x5316;&#x4F30;&#x8BA1;&#x5668;
            model_fn=model_fn,
            config=run_config,
            warm_start_from=self.init_checkpoint  # &#x65B0;&#x589E;&#x9884;&#x70ED;
        )
        print("estimator.params:",estimator.params)
        print("estimator:",estimator)
        return estimator

    def serving_input_fn(self):
        receiver_tensors = {
            'input_ids': tf.compat.v1.placeholder(dtype=tf.int64, shape=[None, self.seq_length], name='input_ids'),
            'input_mask': tf.compat.v1.placeholder(dtype=tf.int64, shape=[None, self.seq_length], name='input_mask'),
            'segment_ids': tf.compat.v1.placeholder(dtype=tf.int64, shape=[None, self.seq_length], name='segment_ids'),
            'label_ids': tf.compat.v1.placeholder(dtype=tf.int64, shape=[None], name="label_ids")
        }

        return tf.estimator.export.ServingInputReceiver(features= receiver_tensors ,receiver_tensors=receiver_tensors)
    def transModel(self):

        self.estimator.export_saved_model('./savemodel',self.serving_input_fn)

labelfile='./ckpt/label.csv'
init_checkpoint='./chinese_L-12_H-768_A-12/bert_model.ckpt'
vocabfile='./chinese_L-12_H-768_A-12/vocab.txt'
bert_config_file='./chinese_L-12_H-768_A-12/bert_config.json'
ckptdir='./ckpt/'
model = Fast(labelfile,vocabfile,bert_config_file,init_checkpoint,ckptdir)
model.transModel()

2. saveModel格式转换为onnx格式

import os

pbdir="1631247382"
onnxname="model.onnx"
cmdstr="python -m tf2onnx.convert --saved-model ./savemodel/{pbdir} --output ./onnx/{onnxname}".format(pbdir=pbdir,onnxname=onnxname)

os.system(cmdstr)

3. 使用onnxruntime推理onnx格式模型

import onnxruntime as ort
from tokenization import FullTokenizer
from run_classifier import convert_single_example
from run_classifier import InputExample
import time
import numpy as np
import csv

import os

class model(object):
    def __init__(self, vocab_file,labelfile,modelfile,max_seq_length):
        self.closed = False
        self.first_run = True
        self.tokenizer = FullTokenizer(
            vocab_file=vocab_file,
            do_lower_case=True)
        self.seq_length = max_seq_length
        self.label = self.loadLabel(labelfile)

        so = ort.SessionOptions()

        #so.execution_mode = ort.ExecutionMode.ORT_SEQUENTIAL
        # so.execution_mode = ort.ExecutionMode.ORT_PARALLEL

        so.graph_optimization_level = ort.GraphOptimizationLevel.ORT_ENABLE_ALL

        #self.model = ort.InferenceSession(modelfile,sess_options=so,providers=['CPUExecutionProvider'])
        self.model = ort.InferenceSession(modelfile,sess_options=so,providers=['CUDAExecutionProvider'])
        #self.model.set_providers(['CUDAExecutionProvider'], [{'device_id': device_id,"gpu_mem_limit" :  3  *  1024  *  1024  *  1024}])
        # self.model.set_providers(['CUDAExecutionProvider'], [{'device_id': device_id }])

    def loadLabel(sel,labelfile):
        labelf = open(labelfile, 'r', newline='',encoding='gbk')
        labeldata = csv.reader(labelf, delimiter="\t")
        labelList = []
        #for i in range(60):
        #    labelList.append(i)
        for line in labeldata:
           label = line[1]
           labelList.append(label)
        return labelList

    def get_feature(self, index, text):
        example = InputExample(f"text_{index}", text, None, self.label[0])
        feature = convert_single_example(index, example, self.label, self.seq_length, self.tokenizer)
        return feature.input_ids, feature.input_mask, feature.segment_ids, feature.label_id

    def predict(self, text):
        dataList=[]
        input_ids_L=[]
        input_mask_L=[]
        segment_ids_L=[]
        label_ids_L=[]
        for i in range(len(text)):
            input_ids,input_mask,segment_ids,label_ids=self.get_feature(i,text[i])
            input_ids_L.append(input_ids)
            input_mask_L.append(input_mask)
            segment_ids_L.append(segment_ids)
            label_ids_L.append(label_ids)

        data = {
            "input_ids:0": np.array(input_ids_L, dtype=np.int64),
            "input_mask:0": np.array(input_mask_L, dtype=np.int64),
            "label_ids:0": np.array(label_ids_L, dtype=np.int64),
            "segment_ids:0": np.array(segment_ids_L, dtype=np.int64)
        }
        dataList.append(data)
        result = self.model.run(output_names=["loss/Softmax:0"], input_feed=data)
        label_l=[]
        for i in range(len(text)):
            # &#x83B7;&#x53D6;&#x6700;&#x5927;&#x503C;&#x7D22;&#x5F15;
            maxProbabilities=max(result[0][i])

            index=np.argmax(result[0][i])

            label=self.label[index]
            item={"label":label,"score":maxProbabilities}
            label_l.append(label)

        return label_l

pythonfile=os.path.realpath(os.path.realpath(__file__))
pardir=os.path.abspath(os.path.join(pythonfile,os.path.pardir))
datadir=os.path.join(pardir,'zhaopin')

labelfile=os.path.join(datadir,'label.csv')
modelfile=os.path.join(datadir,'model.onnx')
vocabfile=os.path.join(pardir,'vocab.txt')
max_seq_length=128

def getModel():
    bert = model(vocabfile,labelfile,modelfile ,max_seq_length)
    return bert

if __name__=="__main__":
    bert=getModel()
    for i in range(1000):
        time1=time.time()
        bert.predict(["&#x5DF2;&#x7ECF;&#x6253;&#x8FC7;&#x7535;&#x8BDD;&#x4E86;"])

Original: https://blog.csdn.net/weixin_43590290/article/details/120208429
Author: 菜菜菜菜菜菜菜
Title: bert中文分类模型训练+推理+部署

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/663423/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

pandas 基本数据结构：Series 和 DataFrame

pandas主要有两个数据结构： Series 和 DataFrame 维数名称描述1Seriescentered 带标签的一维同构数组2DataFrame带标签的，大小可变的，二…

人工智能 2023年7月8日
00107
多线激光雷达+imu的gazebo仿真

多线激光雷达+imu的gazebo仿真前言：在做2D/3D slam的课题研究时，往往我们手里头没有昂贵的多线激光雷达和惯性传感器，ros提供了相应的传感器插件，通过插件可以在物…

人工智能 2023年6月2日
0082
欠拟合的原因以及解决办法（深度学习）

之前这篇文章，我分析了一下深度学习中，模型过拟合的主要原因以及解决办法：过拟合的原因以及解决办法（深度学习）_大黄的博客-CSDN博客这篇文章中写一下深度学习中，模型欠拟合的原…

人工智能 2023年6月23日
00109
【毕业设计】python+深度学习+opencv实现植物识别算法系统

文章目录 0 前言 2 相关技术 * 2.1 VGG-Net模型 2.2 VGG-Net在植物识别的优势 – (1) 卷积核，池化核大小固定 (2) 特征提取更全面 (…

人工智能 2023年7月19日
0067
二、用于数据分析的Tableau技巧

以下为自己关于Tableau的学习总结跟B站up：戴戴戴师兄 https://www.bilibili.com/video/BV1ZM4y1u7uF?p=2 1. 数据连接（1…

人工智能 2023年7月16日
0082
【python OpenCV3.3 图像处理教程：直线检测、圆检测、对象测量、腐蚀、膨胀等形态学操作、数字验证码识别、人脸检测

1. 直线检测 Hough Line Transform：前提：边缘检测已经完成，基于霍夫变换 1.1 原理可以通过（theta，r）唯一表示一个点。把过三个点的全部直线以某一角…

人工智能 2023年7月19日
0067
【笔记】辐射场

前置知识量化光的测量对于一些光子： Radiant energy: 碰撞总数 Radiant flux: 每秒碰撞数 Irradiance: 每秒每单位面积碰撞数不同的光子碰…

人工智能 2023年6月4日
0099
NLP之文本分类(五)—多标签分类实践

1. 数据源 item相关信息， tag 相关信息， item与tag历史打标数据 2. 数据分析 3k标签占90%的样本选择标签数量样本大于100的标签作为模型的输出，可支持标…

人工智能 2023年7月1日
0091
学习Tensorflow 2.0 下载cifar10 cifar100数据集遇到的坑

学习编程,采坑无数,得到过别人的帮助,也希望自己采坑的经历帮助到别人代码如下（示例）： from tensorflow.keras import datasets 利用Tenso…

人工智能 2023年5月25日
00127
关于汽车领域的知识图谱实战入门

根据https://www.bilibili.com/video/BV1iv411k7qG整理 01实体识别基于nlp的g3语言去抽取实体对象和基于关系抽取的情境下，用到命名实体…

人工智能 2023年6月1日
0084
torchsummary和torchstat使用方法和结果分析

1 torchstat：查看模型的大小和浮动运算量安装工具 pip install torchstat 使用例子 import torch import torch.nn as …

人工智能 2023年7月21日
0070
PCL实现对点云指定区域的分割

PCL实现对点云指定区域的分割通常我们从激光雷达或者深度相机中拿到的数据中包含有大量的背景区域，而我们想要的数据有时候时候可能只是其中的一小部分。对于目标区域的提取通常采用算法的…

人工智能 2023年7月18日
0085
.pth.tar文件

torch保存的模型有很多形式，前几天下载别人预训练好的模型后发现是 .pth.tar 后缀的文件，开始以为是压缩文件，使用tar -xvf 命令解压，结果报错。后经过搜索资料，发…

人工智能 2023年7月22日
0089
刘知远团队大模型公开课

课程来源：https://www.bilibili.com/video/BV1UG411p7zv?p=2&vd_source=7a1bf40d519bd5238c79a30…

人工智能 2023年6月4日
0093
训练模型+tmux+自动选择gpu ID的一种方案

使用场景：我建立了一系列的tmux会话，他们的名字是gpu0，gpu1，gpu2等等。我调参的时候，每个程序占用一个gpu，我需要在程序里面写明白使用gpu 0， os.envi…

人工智能 2023年5月25日
00113
Collaborativ

问题介绍 Collaborative Filtering（协同过滤）是一种常用的推荐系统算法，通过分析用户的历史行为和对物品的评价来预测用户对其他物品的兴趣。本文将详细介绍Coll…

人工智能 2024年1月2日
0023

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31