【中文论文1】基于BERT-BIGRU的短文本多分类情感分析

2023年7月3日上午1:31 • 人工智能 • 阅读 82

BERT刚出来的时候发这篇论文还行，现在的话就毫无创新了。

因为有了代码的经验，再看之前的那些论文似乎就觉得很容易了，今天这篇是很简单的一篇《基于 BERT-BiLSTM 的短文本情感分析杨奎河，刘智鹏》，没有什么创新的，不过他在论文中写的内容倒是可以帮助我理解代码。

仿照这篇，我也能写出一篇BERT-BIGRU的论文，还是多情感分类的。

模型结构：

文本向量化表示层：常用的 Word2vec是以词为处理单元的文本向量表示方法，过程繁琐，需经历文本预处理、特征提取、特征向量表示、向量拼接，最后才能生成文本的向量表示形式，其中在文本预处理阶段分词的精度问题直接影响后续过程和结果。本文又是在处理短文本任务，考虑到短文本的特点。因此采用的是以字为处理单位的 BERT 模型，将文本中每个字映射成 k 维的字向量形式，并输入给其他深度学习模型。
简单一句话：用BERT预训练的字向量将文本向量化

bilstm层：增加该层的目的是，让模型在结合上下文语义的情况下，能够更充分的提取到文本的情感特征，为下一步实现情感预测打下良好的基础。
简单一句话，用bilstm获得相关字的语义表示。提取字之前的关系。
但是由于RNN系列的模型都会有长依赖的问题（读了后面的前面就会遗忘），还有不能并行化的问题所以transformers横空出世。GRU比起LSTM来说参数更少，效果也不差。

情感倾向判别层：该模型的判别层是由全连接层和softmax函数组合而成，通过 将 BiLSTM 隐层得到的代表整个文本的特征向量 h （最后两个h拼接而成得到正向和反向的特征向量）输入到全连接层，并结合函数，计算当前文本在各个类别中所占的比例。n分类的任务输出就是n*1维的向量，在这个向量中，输出最大的那个值的下标就是预测的分类

模型的训练：损失函数是交叉熵，训练时梯度下降

总结：文本向量化层是将所有的文本向量化，才能输入到模型中去。BILSTM之类的模型在训练的过程中通过将loss反向传播不断优化参数以此来提取特征，最后将特征向量输入全连接层得到结果。结果好不好就要看特征提取得好不好

代码：https://github.com/xiexinran/pytorch-sentiment-analysis

Original: https://blog.csdn.net/xxr233/article/details/115541044
Author: xxr233
Title: 【中文论文1】基于BERT-BIGRU的短文本多分类情感分析

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/666603/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

Cy3 PEG N-羟基琥珀酰亚胺，花菁染料CY3标记N-羟基琥珀酰亚胺，CY3-N-Hydroxy succinimide

产品名称：Cy3 PEG N-羟基琥珀酰亚胺，花菁染料CY3标记N-羟基琥珀酰亚胺英文名称：CY3-N-Hydroxy succinimide N-羟基丁二酰亚胺，白色至类白色结…

人工智能 2023年6月28日
0064
MOLAP——Kylin总结

Kylin总结 * – 1. OLAP分类 – + 1.1 MOLAP + 1.2 ROLAP + 1.3 HOLA – 2. 概述 &#821…

人工智能 2023年6月11日
0073
天池比赛-02-用Apriori算法进行商品关联分析

这篇文章是对天池比赛里面的商品关联分析案例的介绍，采用 Apriori 算法发现频繁项集，确定关联关系。 1、基本概念 1.1 关联分析相关概念频繁项集和关联规则是关联分析中的两…

人工智能 2023年7月17日
0063
1.1.4. Multi-task Lasso（多任务 Lasso）（多任务学习）

1.1.4. Multi-task Lasso 说实话，在最开始，我只把多任务 Lasso当作Lasso的一种应用于多输出回归的一种方式而已；甚至想把它和弹性网络那几章混在一起讲。…

人工智能 2023年6月17日
0093
YOLOv7（目标检测）入门教程详解—检测，推理，训练

目录一.前言二.yolov7源码下载三.detect（检测）四.Train（训练）数据准备： labellmg: 配置训练的相关文件配置数据集文件正式训练：推理： …

人工智能 2023年6月25日
0062
[机器学习]Kmeans聚类算法和性能指标

文章目录一、Kmeans算法及其优缺点 * 1.简单介绍 2.K-means的优点与缺点二、性能指标 * 1.选择K值手肘法轮廓系数 CH指标 sklearn提供的方法 2…

人工智能 2023年5月31日
0076
【论文阅读-句向量】Evaluation of BERT and ALBERT Sentence Embedding Performance on Downstream NLP Tasks

昨天说到sentence embedding，今天就补了一篇BERT里面[CLS]的论文。BERT 以及ALBERT（A Lite BERT）类的预训练模型可以通过[CLS]来生成…

人工智能 2023年5月28日
0078
OpenCV-Python实战（14）——人脸检测详解（仅需6行代码学会4种人脸检测方法）

OpenCV-Python实战（14）——人脸检测详解（仅需6行代码学会4种人脸检测方法） * – 0. 前言 – 1. 人脸处理简介 – 2….

人工智能 2023年7月26日
0055
卡尔曼滤波(一)——预备知识

卡尔曼滤波将观测数据看成是某个用状态变量方法描述的系统的输出，通过引入新息过程的概念，采用迭代方法直接利用观测数据进行运算，可得到原系统状态向量的估计。下面先介绍几个概念新息过…

人工智能 2023年6月18日
0097
CHOLAN：一种模块化实体链接方法

CHOLAN: A Modular Approach for Neural Entity Linking on Wikipedia and Wikidata 论文链接：https:…

人工智能 2023年6月1日
00113
数据分析之爬虫实例-获取天气AQI数据-附python代码

数据分析与数据挖掘的步骤流程： 1、明确目标。首先要熟悉业务背景，了解业务背景后，才能明确目标。如去分析电商业务流量与转化率的关系，广告业务如何确定单次点击竞价增加点击率和…

人工智能 2023年6月19日
0092
python中subprocess模块subprocess.run，subprocess.getoutput，subprocess.Popen、subprocess.call的使用

subprocess可以帮我们执行命令，获取执行结果及返回内容。 1、subprocess.run() 此方法为python3.5版本后的推荐方法，可以获取执行结果、返回内容等一些…

人工智能 2023年7月6日
0092
通俗理解隐马尔可夫模型（HMM）

HMM（隐马尔可夫模型）对于一个观测序列，我们认为这个观测序列是由另一个状态序列输出的，而这个状态序列我们称之为隐马尔可夫链隐马尔可夫链每次可以输出一个观测值，但是一个观测值一…

人工智能 2023年5月25日
0078
vscode中配置jupyter（彻底解决Failed to start the Kernel问题）

文章目录 * – 1 插件安装 – 2 相关python库安装 – + 2.1 python版本问题 + 2.2 开始安装库包 + 2.3 解决…

人工智能 2023年7月3日
0066
神经网络——Python实现BP神经网络算法（理论+例子+程序）

采用BP算法的多层感知器是至今为止应用最广泛的神经网络，在多层感知器的应用中，以图3-15所示的单隐层网络的应用最为普遍。一般习惯将单隐层前馈网称为三层感知器，所谓三层包括了输入层…

人工智能 2023年6月15日
0098
神经网络ANN算法——鸢尾花案例python实现

个人对神经网络的理解神经网络算法，是一个黑匣子，当你传入一些数据，并告诉它最终要达到的目标，整个神经网络就开始学习。但是，我们很难知道里面究竟发生了什么，也没有数学来严格推导和证…

人工智能 2023年7月14日
0079

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

【中文论文1】基于BERT-BIGRU的短文本多分类情感分析

大家都在看