Pytorch Bert+BiLstm文本分类

2023年5月30日下午5:42 • 人工智能 • 阅读 87

文章目录

前言
一、运行环境
二、数据
三、模型结构
四、训练
五、测试及预测

前言

昨天按照该文章（自然语言处理（NLP）Bert与Lstm结合）跑bert+bilstm分类的时候，没成功跑起来，于是自己修改了一下，成功运行后，记录在这篇博客中。

一、运行环境

python==3.7
pandas==1.3.0
numpy==1.20.3
scikit-learn==0.24.2
torch==1.9.0
transformers==4.8.2

二、数据

1、Bert下载地址bert-base-chinese
注意：

只需要下载三个文件：
pytorch_model.bin
vocab.txt
config.json
如果下载下来的pytorch_model.bin是一串乱七八糟的字母，将其文件名改为pytorch_model.bin即可

2、完整代码与数据集链接

Pytorch Bert+BiLstm二分类

3、目录结构

; 三、模型结构

代码如下：

class bert_lstm(nn.Module):
    def __init__(self, bertpath, hidden_dim, output_size,n_layers,bidirectional=True, drop_prob=0.5):
        super(bert_lstm, self).__init__()

        self.output_size = output_size
        self.n_layers = n_layers
        self.hidden_dim = hidden_dim
        self.bidirectional = bidirectional

        self.bert=BertModel.from_pretrained(bertpath)
        for param in self.bert.parameters():
            param.requires_grad = True

        self.lstm = nn.LSTM(768, hidden_dim, n_layers, batch_first=True,bidirectional=bidirectional)

        self.dropout = nn.Dropout(drop_prob)

        if bidirectional:
            self.fc = nn.Linear(hidden_dim*2, output_size)
        else:
            self.fc = nn.Linear(hidden_dim, output_size)

    def forward(self, x, hidden):
        batch_size = x.size(0)

        x=self.bert(x)[0]

        lstm_out, (hidden_last,cn_last) = self.lstm(x, hidden)

        if self.bidirectional:

            hidden_last_L=hidden_last[-2]

            hidden_last_R=hidden_last[-1]

            hidden_last_out=torch.cat([hidden_last_L,hidden_last_R],dim=-1)

        else:
            hidden_last_out=hidden_last[-1]

        out = self.dropout(hidden_last_out)

        out = self.fc(out)

        return out

    def init_hidden(self, batch_size):
        weight = next(self.parameters()).data

        number = 1
        if self.bidirectional:
            number = 2

        if (USE_CUDA):
            hidden = (weight.new(self.n_layers*number, batch_size, self.hidden_dim).zero_().float().cuda(),
                      weight.new(self.n_layers*number, batch_size, self.hidden_dim).zero_().float().cuda()
                     )
        else:
            hidden = (weight.new(self.n_layers*number, batch_size, self.hidden_dim).zero_().float(),
                      weight.new(self.n_layers*number, batch_size, self.hidden_dim).zero_().float()
                     )

        return hidden

1、其实就是将embedding层换成了bert，所以Lstm的input_size 为bert的输出size，所以Lstm的第一个参数是768
2、由于是使用BiLstm，所以需要将最后时刻的正向最后一层与反向最后一层拼接起来，相应的Linear层的输入维度应是拼接后的维度
3、由于是2分类，所以output_size为2

四、训练

代码如下：

def train_model(config, data_train):
    net = bert_lstm(config.bert_path,
                    config.hidden_dim,
                    config.output_size,
                    config.n_layers,
                    config.bidirectional)
    criterion = nn.CrossEntropyLoss()
    optimizer = torch.optim.Adam(net.parameters(), lr=config.lr)
    if(config.use_cuda):
        net.cuda()
    net.train()
    for e in range(config.epochs):

        h = net.init_hidden(config.batch_size)
        counter = 0

        for inputs, labels in data_train:
            counter += 1

            if(config.use_cuda):
                inputs, labels = inputs.cuda(), labels.cuda()
            h = tuple([each.data for each in h])
            net.zero_grad()
            output= net(inputs, h)
            loss = criterion(output.squeeze(), labels.long())
            loss.backward()
            optimizer.step()

            if counter % config.print_every == 0:
                net.eval()
                with torch.no_grad():
                    val_h = net.init_hidden(config.batch_size)
                    val_losses = []
                    for inputs, labels in valid_loader:
                        val_h = tuple([each.data for each in val_h])

                        if(config.use_cuda):
                            inputs, labels = inputs.cuda(), labels.cuda()

                        output = net(inputs, val_h)
                        val_loss = criterion(output.squeeze(), labels.long())

                        val_losses.append(val_loss.item())
                net.train()
                print("Epoch: {}/{}, ".format(e+1, config.epochs),
                    "Step: {}, ".format(counter),
                    "Loss: {:.6f}, ".format(loss.item()),
                    "Val Loss: {:.6f}".format(np.mean(val_losses)))
    torch.save(net.state_dict(), config.save_path)

Epoch: 1/10,  Step: 10,  Loss: 0.684742,  Val Loss: 0.688432
Epoch: 1/10,  Step: 20,  Loss: 0.664885,  Val Loss: 0.671069
Epoch: 1/10,  Step: 30,  Loss: 0.613591,  Val Loss: 0.622387
Epoch: 1/10,  Step: 40,  Loss: 0.571192,  Val Loss: 0.562263
Epoch: 2/10,  Step: 10,  Loss: 0.283182,  Val Loss: 0.421199
Epoch: 2/10,  Step: 20,  Loss: 0.385077,  Val Loss: 0.361812
Epoch: 2/10,  Step: 30,  Loss: 0.348373,  Val Loss: 0.318632
Epoch: 2/10,  Step: 40,  Loss: 0.597140,  Val Loss: 0.314847
Epoch: 3/10,  Step: 10,  Loss: 0.194882,  Val Loss: 0.273278
Epoch: 3/10,  Step: 20,  Loss: 0.123732,  Val Loss: 0.343172
Epoch: 3/10,  Step: 30,  Loss: 0.115506,  Val Loss: 0.313013
Epoch: 3/10,  Step: 40,  Loss: 0.170411,  Val Loss: 0.282829
Epoch: 4/10,  Step: 10,  Loss: 0.150081,  Val Loss: 0.263128
Epoch: 4/10,  Step: 20,  Loss: 0.353257,  Val Loss: 0.326907
Epoch: 4/10,  Step: 30,  Loss: 0.037445,  Val Loss: 0.342072
Epoch: 4/10,  Step: 40,  Loss: 0.096485,  Val Loss: 0.331090
Epoch: 5/10,  Step: 10,  Loss: 0.062844,  Val Loss: 0.321690
Epoch: 5/10,  Step: 20,  Loss: 0.031070,  Val Loss: 0.316013
Epoch: 5/10,  Step: 30,  Loss: 0.058623,  Val Loss: 0.318129
Epoch: 5/10,  Step: 40,  Loss: 0.046849,  Val Loss: 0.335890
Epoch: 6/10,  Step: 10,  Loss: 0.147990,  Val Loss: 0.446133
Epoch: 6/10,  Step: 20,  Loss: 0.324785,  Val Loss: 0.448294
Epoch: 6/10,  Step: 30,  Loss: 0.034576,  Val Loss: 0.390784
Epoch: 6/10,  Step: 40,  Loss: 0.018516,  Val Loss: 0.446345
Epoch: 7/10,  Step: 10,  Loss: 0.041855,  Val Loss: 0.340792
Epoch: 7/10,  Step: 20,  Loss: 0.140505,  Val Loss: 0.433969
Epoch: 7/10,  Step: 30,  Loss: 0.015936,  Val Loss: 0.537444
Epoch: 7/10,  Step: 40,  Loss: 0.061285,  Val Loss: 0.688956
Epoch: 8/10,  Step: 10,  Loss: 0.027597,  Val Loss: 0.383043
Epoch: 8/10,  Step: 20,  Loss: 0.020746,  Val Loss: 0.344770
Epoch: 8/10,  Step: 30,  Loss: 0.066156,  Val Loss: 0.418557
Epoch: 8/10,  Step: 40,  Loss: 0.011359,  Val Loss: 0.434401
Epoch: 9/10,  Step: 10,  Loss: 0.014871,  Val Loss: 0.450156
Epoch: 9/10,  Step: 20,  Loss: 0.011917,  Val Loss: 0.455503
Epoch: 9/10,  Step: 30,  Loss: 0.139435,  Val Loss: 0.496916
Epoch: 9/10,  Step: 40,  Loss: 0.015576,  Val Loss: 0.499172
Epoch: 10/10,  Step: 10,  Loss: 0.006573,  Val Loss: 0.585796
Epoch: 10/10,  Step: 20,  Loss: 0.144999,  Val Loss: 0.514712
Epoch: 10/10,  Step: 30,  Loss: 0.037525,  Val Loss: 0.445692
Epoch: 10/10,  Step: 40,  Loss: 0.010959,  Val Loss: 0.382745

我的GPU为Quadro RTX 6000，没几分钟就训练完成了，还是比较快的。

五、测试及预测

def test_model(config, data_test):
    net = bert_lstm(config.bert_path,
                config.hidden_dim,
                config.output_size,
                config.n_layers,
                config.bidirectional)
    net.load_state_dict(torch.load(config.save_path))
    net.cuda()
    criterion = nn.CrossEntropyLoss()
    test_losses = []
    num_correct = 0

    h = net.init_hidden(config.batch_size)

    net.eval()

    for inputs, labels in data_test:
        h = tuple([each.data for each in h])
        if(USE_CUDA):
            inputs, labels = inputs.cuda(), labels.cuda()
        output = net(inputs, h)
        test_loss = criterion(output.squeeze(), labels.long())
        test_losses.append(test_loss.item())

        output=torch.nn.Softmax(dim=1)(output)
        pred=torch.max(output, 1)[1]

        correct_tensor = pred.eq(labels.long().view_as(pred))
        correct = np.squeeze(correct_tensor.numpy()) if not USE_CUDA else np.squeeze(correct_tensor.cpu().numpy())
        num_correct += np.sum(correct)
    print("Test loss: {:.3f}".format(np.mean(test_losses)))

    test_acc = num_correct/len(data_test.dataset)
    print("Test accuracy: {:.3f}".format(test_acc))

def predict(test_comment_list, config):
    net = bert_lstm(config.bert_path,
                config.hidden_dim,
                config.output_size,
                config.n_layers,
                config.bidirectional)
    net.load_state_dict(torch.load(config.save_path))
    net.cuda()
    result_comments=pretreatment(test_comment_list)

    tokenizer = BertTokenizer.from_pretrained(config.bert_path)
    result_comments_id = tokenizer(result_comments,
                                    padding=True,
                                    truncation=True,
                                    max_length=120,
                                    return_tensors='pt')
    tokenizer_id = result_comments_id['input_ids']

    inputs = tokenizer_id
    batch_size = inputs.size(0)

    h = net.init_hidden(batch_size)

    if(USE_CUDA):
        inputs = inputs.cuda()

    net.eval()
    with torch.no_grad():

        output= net(inputs, h)
        output=torch.nn.Softmax(dim=1)(output)
        pred=torch.max(output, 1)[1]

        print('预测概率为: {:.6f}'.format(torch.max(output, 1)[0].item()))
        if(pred.item()==1):
            print("预测结果为:正向")
        else:
            print("预测结果为:负向")

Test loss: 0.390
Test accuracy: 0.837

predict :

test_comments =  ['&#x8FD9;&#x4E2A;&#x83DC;&#x771F;&#x4E0D;&#x9519;']
&#x9884;&#x6D4B;&#x6982;&#x7387;&#x4E3A;: 0.981275
&#x9884;&#x6D4B;&#x7ED3;&#x679C;&#x4E3A;:&#x6B63;&#x5411;

完整代码与数据集链接：Pytorch Bert+BiLstm二分类

Original: https://blog.csdn.net/qq_44193969/article/details/118876757
Author: PeasantWorker
Title: Pytorch Bert+BiLstm文本分类

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/544355/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

dataframe怎么按行求和_pandas.DataFrame对行和列求和及添加新行和列

pandas.DataFrame对行和列求和及添加新行和列导入模块： from pandas import DataFrame import pandas as pd impor…

人工智能 2023年7月7日
0044
240个Python练习案例附源码(百看不如一练)

今天给大家整理了 247 个经典实用有趣的 Python 实例，185 页代码齐全可复制 pdf，几乎涵盖了 Python 各个方面的知识点，即可以帮助小白快速全面的学习 Pyth…

人工智能 2023年6月11日
0067
Cellcall:细胞间通讯分析工具（单细胞数据生信实操）

近日，做单细胞细胞间通讯分析，发现又有新的方法出现—cellcall，文章发表在Nucleic Acids Research杂志。看了一下，这个方法相比于Cellch…

人工智能 2023年7月14日
0084
python保存数据方式（npy, pkl, h5, pt, npz）

利用python保存数据方式 1 numpy中npy文件保存和读取利用numpy库重要保存array数据， import numpy as np data = np.zeros(…

人工智能 2023年7月12日
0087
3.3 Fashion-MNIST softmax分类、tensorflow2实现——python实战

抵扣说明： 1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。2.余额无法直接购买下载，可以购买VIP、C币套餐、付费专栏及课程。 Original: https:…

人工智能 2023年7月1日
0083
pandas 写入字典_Python数据分析：pandas玩转Excel （一）

1 pandas简介 1.Pandas是什么？ Pandas是一个强大的分析结构化数据的工具集；它的使用基础是Numpy（提供高性能的矩阵运算）；用于数据挖掘和数据分析，同时也…

人工智能 2023年7月7日
0078
爬取boss直聘“数据分析”工作

爬取boss直聘数据分析【1、获取数据】 1、背景：面临工作，需要数据支持，看到各大数据源（天池、和鲸社区…），萌生一种自己爬取数据分析工作的信息，将数分融入进找工作…

人工智能 2023年6月19日
00115
Python数据可视化第三节

第三章；图表辅助元素的定制 3.1 认识图表常用的辅助元素图表的辅助元素是指除根据数据绘制的图形之外的元素，常用的辅助元素包括坐标轴、标题、图例、网格、参考线、注释文本和表格，他…

人工智能 2023年7月16日
0053
seed在模型中的应用及用法

SEEDseed在深度学习代码中叫随机种子，设置seed的目的是由于深度学习网络模型中初始的权值参数通常都是初始化成随机数。而使用梯度下降法最终得到的局部最优解对于初始位置点的选择…

人工智能 2023年7月12日
00104
极智AI | 目标检测实现分享四：详解 YOLOv4 算法实现

欢迎关注我的公&#…

人工智能 2023年7月12日
0071
Redis数据库安全之旅

Redis相信大家都或多或少都听说过吧,作为内存数据库的代表, 但是近些年 Redis 被攻击的典范也是越来越多,我们将如何防护 Redis 安全呢? 跟着我们的脚本,来看看这篇文…

人工智能 2023年6月28日
0052
动手学习深度学习09—-Softmax 回归 + 损失函数 + 图片分类数据集

图片分类数据集课程中使用的数据集是 FashionMNIST首先看如何下载使用这个数据集： import torch import torchvision from torch….

人工智能 2023年6月17日
0060
Linux安装Anaconda教程

1. 首先上Linux官网下载最新对应版本的Anaconda安装包链接: Anaconda官网下载 2. 因为我们是在Linux系统下安装Anaconda，所以选择Linux…

人工智能 2023年7月4日
0098
【DKN】（四）train.py

内容 try: Model = getattr(importlib.import_module(f"model.{model_name}"), model_na…

人工智能 2023年6月10日
00103
python randn(5)_Python 数据处理（五）

DataFrame(续) 索引和选择索引的基础语法如下选择列 df[col] Series 用标签选择行 df.loc[label] Series 用整数位置选择行 df.il…

人工智能 2023年7月7日
0048
SIFT算法详解(附有完整代码)

说明：本文旨在给出 SIFT 算法的具体实现，而在 SIFT 详解上只是做出简单介绍，在这里可以给大家推荐一篇好文：https://blog.csdn.net/zddblog/ar…

人工智能 2023年6月18日
0059

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

Pytorch Bert+BiLstm文本分类

文章目录

大家都在看