NLP进阶，Bert+BiLSTM情感分析实战

2023年5月27日下午8:02 • 人工智能 • 阅读 63

Bert+BiLSTM做情感分析

情感分析

诸如商品评价正反分析、敏感内容分析、用户兴趣内容分析，甚至安全领域的异常访问日志分析等情感分析，其实都可以通过文本分类的方式来完成。情感分析的本质是一个二分类或多分类问题。

[En]

Tasks such as emotional analysis, such as positive and negative analysis of commodity evaluation, sensitive content analysis, content analysis of user interest, and even abnormal access log analysis in the security field, can actually be done in the way of text classification. the essence of emotion analysis is a two-classification or multi-classification problem.

什么是Bert？

BERT的全称为Bidirectional Encoder Representation from Transformers，是一个预训练的语言表征模型。它强调了不再像以往一样采用传统的单向语言模型或者把两个单向语言模型进行浅层拼接的方法进行预训练，而是采用新的 masked language model（MLM），以致能生成 深度的双向语言表征。

该模型有以下主要优点：

1）采用MLM对双向的Transformers进行预训练，以生成深层的双向语言表征。

2）预训练后，只需要添加一个额外的输出层进行fine-tune，就可以在各种各样的下游任务中取得state-of-the-art的表现。在这过程中并不需要对BERT进行任务特定的结构修改。

今天我们使用Bert+BiLSTM实现对菜品正负评价的情感分析预测！

数据集

数据集是我们搜集了一些菜品的正负评价，正面的评价标记为1，负面评价标记为0，将其保存为csv文件。

将数据集放在项目的根目录中

[En]

Put the dataset in the root directory of the project

; 下载预训练模型

下载地址：https://huggingface.co/bert-base-chinese/tree/main。

我们的数据集是中文的，所以选择中文的预训练模型，需要注意的是，如果你选择其他的模型，可能会出现不收敛的情况。加载带有下图中红色框的文件。

[En]

Our data set is in Chinese, so choose a Chinese pre-training model, which should be noted that there may be non-convergence if you choose other ones. Load the file with the red box in the following image.

在工程的根目录，新建文件夹”bert_base_chinese”，将下载的模型放进去，如下图：

模型

思路：将bert做为嵌入层提取特征，然后传入BiLSTM，最后使用全连接层输出分类。创建bert_lstm模型，代码如下：

class bert_lstm(nn.Module):
    def __init__(self, bertpath, hidden_dim, output_size,n_layers,bidirectional=True, drop_prob=0.5):
        super(bert_lstm, self).__init__()

        self.output_size = output_size
        self.n_layers = n_layers
        self.hidden_dim = hidden_dim
        self.bidirectional = bidirectional

        self.bert=BertModel.from_pretrained(bertpath)
        for param in self.bert.parameters():
            param.requires_grad = True

        self.lstm = nn.LSTM(768, hidden_dim, n_layers, batch_first=True,bidirectional=bidirectional)

        self.dropout = nn.Dropout(drop_prob)

        if bidirectional:
            self.fc = nn.Linear(hidden_dim*2, output_size)
        else:
            self.fc = nn.Linear(hidden_dim, output_size)

    def forward(self, x, hidden):
        batch_size = x.size(0)

        x=self.bert(x)[0]

        lstm_out, (hidden_last,cn_last) = self.lstm(x, hidden)

        if self.bidirectional:

            hidden_last_L=hidden_last[-2]

            hidden_last_R=hidden_last[-1]

            hidden_last_out=torch.cat([hidden_last_L,hidden_last_R],dim=-1)

        else:
            hidden_last_out=hidden_last[-1]

        out = self.dropout(hidden_last_out)

        out = self.fc(out)

        return out

    def init_hidden(self, batch_size):
        weight = next(self.parameters()).data

        number = 1
        if self.bidirectional:
            number = 2

        if (USE_CUDA):
            hidden = (weight.new(self.n_layers*number, batch_size, self.hidden_dim).zero_().float().cuda(),
                      weight.new(self.n_layers*number, batch_size, self.hidden_dim).zero_().float().cuda()
                     )
        else:
            hidden = (weight.new(self.n_layers*number, batch_size, self.hidden_dim).zero_().float(),
                      weight.new(self.n_layers*number, batch_size, self.hidden_dim).zero_().float()
                     )

        return hidden

bert_lstm需要的参数功6个，参数说明如下：

–bertpath：bert预训练模型的路径

–hidden_dim：隐藏层的数量。

–output_size：分类的个数。

–n_layers：lstm的层数

–bidirectional：是否是双向lstm

–drop_prob：dropout的参数

定义bert的参数，如下：

class ModelConfig:
    batch_size = 2
    output_size = 2
    hidden_dim = 384
    n_layers = 2
    lr = 2e-5
    bidirectional = True

    epochs = 10

    print_every = 10
    clip=5
    use_cuda = USE_CUDA
    bert_path = 'bert-base-chinese'
    save_path = 'bert_bilstm.pth'

batch_size：batchsize的大小，根据显存设置。

output_size：输出的类别个数，本例是2.

hidden_dim：隐藏层的数量。

n_layers：lstm的层数。

bidirectional：是否双向

print_every：输出的间隔。

use_cuda：是否使用cuda，默认使用，不用cuda太慢了。

bert_path：预训练模型存放的文件夹。

save_path：模型保存的路径。

配置环境

需要下载transformers和sentencepiece，执行命令：

conda install sentencepiece
conda install transformers

数据集切分

数据集按照7:3，切分为训练集和测试集，然后又将测试集按照1：1切分为验证集和测试集。

代码如下：

model_config = ModelConfig()
    data=pd.read_csv('caipindianping.csv',encoding='utf-8')
    result_comments = pretreatment(list(data['comment'].values))
    tokenizer = BertTokenizer.from_pretrained(model_config.bert_path)

    result_comments_id = tokenizer(result_comments,
                                    padding=True,
                                    truncation=True,
                                    max_length=200,
                                    return_tensors='pt')
    X = result_comments_id['input_ids']
    y = torch.from_numpy(data['sentiment'].values).float()

    X_train,X_test, y_train, y_test = train_test_split( X,
                                                        y,
                                                        test_size=0.3,
                                                        shuffle=True,
                                                        stratify=y,
                                                        random_state=0)
    X_valid,X_test,y_valid,y_test = train_test_split(X_test,
                                                     y_test,
                                                     test_size=0.5,
                                                     shuffle=True,
                                                     stratify=y_test,
                                                     random_state=0)

训练、验证和预测

训练详见train_model函数，验证详见test_model，单次预测详见predict函数。

代码和模型链接：
https://download.csdn.net/download/hhhhhhhhhhwwwwwwwwww/36305682

Original: https://blog.csdn.net/hhhhhhhhhhwwwwwwwwww/article/details/121289547
Author: AI浩
Title: NLP进阶，Bert+BiLSTM情感分析实战

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/527518/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

Pytorch加载模型并进行图像分类预测

1. 整体流程 1）实例化模型 2）加载模型 3）输入图像 4）输出分类结果 5）完整代码 2. 处理图像 1) How can i convert an RGB image in…

人工智能 2023年7月22日
0040
PyTorch学习笔记之多层感知机

PyTorch学习笔记之多层感知机多层感知机也叫人工神经网络，除了输入输出层，它中间可以有多个隐含层。为实现多层感知机，先从梯度的知识开始了解。什么是梯度导数、偏微分均为标量…

人工智能 2023年7月14日
0078
【论文笔记】知识图谱综述2021

; KRL – Knowledge Representation Learning 在知识表示学习里，我们希望把实体和关系映射到低维空间上，这样便于我们提取实体与关系的…

人工智能 2023年6月1日
0083
关于GAN训练过程中的报错：one of the variables needed for gradient computation has been modified by an inplace

首先说明，按照我目前的查询，这可能是全网唯一公开的正确解决方法，所以一定要看下去在github和百度上搜索gan示例代码的时候，通常会得到下面这种代码：先更新辨别器，再更新生成器…

人工智能 2023年7月22日
0044
torchtext安装教程

诸神缄默不语-个人CSDN博文目录 torchtext包隶属于PyTorch项目，PyTorch是学习深度学习时常用的Python神经网络框架。torchtext包涵盖了一些用于自…

人工智能 2023年7月21日
00117
基于人类视觉系统建模的仿生低层次图像处理

丘山积卑而为高，江河合水而为大。——《庄子·则阳》好久没有写博客了，主要是最近几个月做的东西确实没什么可以拿来写博客的。我也是很着急呀！最近这一两周看有关图像增强的论文多一些，…

人工智能 2023年7月12日
0076
基于Matlab的随机森林算法实现（附算法介绍及代码详解）

本算例完整代码领取方式在文末展示~ 一、内容提要在地学领域中，岩性的准确识别对于储层评价来说至关重要。因此，今天笔者想要分享的是随机森林算法在岩性识别中的应用与代码实现。科普中…

人工智能 2023年6月12日
0064
YOLOV7:OSError: [WinError 1455] 页面文件太小，无法完成操作的最终解决方案

目录 1.问题描述： 2.现有的解决方案（1）重启电脑（试过了，但是没用）（2）重启pycharm(成本很低，可以试一下，但是依然没用) （3）最火热的一种说法是设置num_w…

人工智能 2023年7月21日
0079
阿里的“扫地僧”，2年“抄”了20万页古籍

金磊贾浩楠发自凹非寺量子位报道 | 公众号 QbitAI 阿里达摩院，一个正儿八经搞AI的地方。但偏偏 “扫地僧”们干起了文绉绉的工作：研究…

人工智能 2023年6月16日
0098
阿尔兹海默病智能诊断

摘要阿尔茨海默病（Alzheimer′s Disease，AD）是一种以认知和智力损害、行为能力下降为特点的神经退行性疾病，目前其确切病因不明，并缺少有效的治疗方案。阿尔茨海默…

人工智能 2023年7月26日
0068
前向传播网络实现（类与函数）——TensorFlow2.4

最近开始着手语义分割方面的内容，由于刚开始入门深度学习，看了一下deeplab的源码，里面所有网络结构基本上都是由类进行定义的（目的是为了方便复用），而大部分博主的复现代码基本上都…

人工智能 2023年5月25日
0049
python批量读取文件名及后缀

数据分析时，经常会批量读取文件，主要有一下方法： ① 批量读取文件名（包含后缀）引用语法：os.listdir(path) 函数用途：输出路径下所有文件的文件名，包含后缀，该路径…

人工智能 2023年7月8日
0045
Pytorch基本操作（10）——完整的模型训练、验证套路

前言在学习李沐在B站发布的《动手学深度学习》PyTorch版本教学视频中发现在操作使用PyTorch方面有许多地方看不懂，往往只是”动手”了，没有动脑。所…

人工智能 2023年7月23日
0063
最全面的Spring教程（四）——Controller 与 RestFul

前言本文为【SpringMVC教程】Controller 与 RestFul 相关内容介绍，具体将对 控制器C…

人工智能 2023年7月29日
0054
ZYNQ图像处理(6)——均值滤波和中值滤波

一、均值和中值滤波基本原理首先要做的是最简单的均值滤波算法。均值滤波是典型的线性滤波算法，它是指在图像上对目标像素给一个模板，该模板包括了其周围的临近像素（以目标象素为中心的周围…

人工智能 2023年6月18日
00118
近期关于Sort和DeepSort改进的工作

本文总结近期三篇对Sort和DeepSort改进的工作，Sort和DeepSort以及JDE的推理流程可以参考之前的文章：Sort和Deepsort原理解析及在JDE和Fairmo…

人工智能 2023年7月27日
00142

2024 年 4 月
一	二	三	四	五	六	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30

NLP进阶，Bert+BiLSTM情感分析实战

大家都在看